第一个请求
本指南将带你发送一个最简单的聊天补全请求,查看响应字段,并指向最实用的后续步骤。前提是你已经拥有 API Key——如果没有,请先看 鉴权。
发送请求
端点是 POST /v1/chat/completions。请求体是 JSON,必须携带鉴权头,遵循 OpenAI 兼容协议——任何面向 api.openai.com 的 SDK 或教程都可以直接复用。
curl https://api.getinfinityblue.com/v1/chat/completions \
-H "Authorization: Bearer YOUR_API_KEY" -H "Content-Type: application/json" \
-d '{"model":"gpt-5.4","messages":[{"role":"system","content":"你是一个简洁的助手。"},{"role":"user","content":"用一句话打个招呼。"}]}'
成功响应类似:
{
"id": "chatcmpl-9f3a8b2e1c0d",
"object": "chat.completion",
"created": 1717430000,
"model": "gpt-5.4",
"choices": [
{
"index": 0,
"message": {
"role": "assistant",
"content": "你好!有什么可以帮你的吗?"
},
"finish_reason": "stop"
}
],
"usage": {
"prompt_tokens": 24,
"completion_tokens": 9,
"total_tokens": 33
}
}
响应字段解读
id
本次补全的唯一标识。可用于日志关联、客服工单和幂等性跟踪。
model
实际处理请求的上游模型。如果网关路由到更新的版本,会与你传入的别名不同。
choices
一个或多个补全结果的数组。n=1(默认)时只有一个元素。每个元素包含 message 字段和 finish_reason(stop、length、tool_calls 等)。
usage
提示词与补全的 token 数量。用于估算成本和在应用中设置单次请求的预算。
用 SDK 调用
在 Python 或 JavaScript 中同样简单:
from openai import OpenAI
client = OpenAI(
api_key="YOUR_API_KEY",
base_url="https://api.getinfinityblue.com/v1",
)
reply = client.chat.completions.create(
model="gpt-5.4",
messages=[{"role": "user", "content": "用一句话打个招呼。"}],
)
print(reply.choices[0].message.content)
import OpenAI from "openai";
const client = new OpenAI({
apiKey: "YOUR_API_KEY",
baseURL: "https://api.getinfinityblue.com/v1",
});
const reply = await client.chat.completions.create({
model: "gpt-5.4",
messages: [{ role: "user", content: "用一句话打个招呼。" }],
});
console.log(reply.choices[0].message.content);
你可以继续使用 OpenAI SDK、LangChain、LlamaIndex 等任何面向 OpenAI HTTP API 的库,只需把 base URL 指向 https://api.getinfinityblue.com/v1。
下一步推荐
- 阅读 错误处理 了解网关如何报告失败、如何安全重试。
- 试试 流式响应,让前端在 token 产出时立即渲染。
- 通过 模型选择 找到最适合你场景的模型。