跳转到主要内容

第一个请求

本指南将带你发送一个最简单的聊天补全请求,查看响应字段,并指向最实用的后续步骤。前提是你已经拥有 API Key——如果没有,请先看 鉴权

发送请求

端点是 POST /v1/chat/completions。请求体是 JSON,必须携带鉴权头,遵循 OpenAI 兼容协议——任何面向 api.openai.com 的 SDK 或教程都可以直接复用。
curl https://api.getinfinityblue.com/v1/chat/completions \
  -H "Authorization: Bearer YOUR_API_KEY" -H "Content-Type: application/json" \
  -d '{"model":"gpt-5.4","messages":[{"role":"system","content":"你是一个简洁的助手。"},{"role":"user","content":"用一句话打个招呼。"}]}'
成功响应类似:
{
  "id": "chatcmpl-9f3a8b2e1c0d",
  "object": "chat.completion",
  "created": 1717430000,
  "model": "gpt-5.4",
  "choices": [
    {
      "index": 0,
      "message": {
        "role": "assistant",
        "content": "你好!有什么可以帮你的吗?"
      },
      "finish_reason": "stop"
    }
  ],
  "usage": {
    "prompt_tokens": 24,
    "completion_tokens": 9,
    "total_tokens": 33
  }
}

响应字段解读

id

本次补全的唯一标识。可用于日志关联、客服工单和幂等性跟踪。

model

实际处理请求的上游模型。如果网关路由到更新的版本,会与你传入的别名不同。

choices

一个或多个补全结果的数组。n=1(默认)时只有一个元素。每个元素包含 message 字段和 finish_reasonstoplengthtool_calls 等)。

usage

提示词与补全的 token 数量。用于估算成本和在应用中设置单次请求的预算。

用 SDK 调用

在 Python 或 JavaScript 中同样简单:
from openai import OpenAI

client = OpenAI(
    api_key="YOUR_API_KEY",
    base_url="https://api.getinfinityblue.com/v1",
)

reply = client.chat.completions.create(
    model="gpt-5.4",
    messages=[{"role": "user", "content": "用一句话打个招呼。"}],
)
print(reply.choices[0].message.content)
import OpenAI from "openai";

const client = new OpenAI({
  apiKey: "YOUR_API_KEY",
  baseURL: "https://api.getinfinityblue.com/v1",
});

const reply = await client.chat.completions.create({
  model: "gpt-5.4",
  messages: [{ role: "user", content: "用一句话打个招呼。" }],
});
console.log(reply.choices[0].message.content);
你可以继续使用 OpenAI SDK、LangChain、LlamaIndex 等任何面向 OpenAI HTTP API 的库,只需把 base URL 指向 https://api.getinfinityblue.com/v1

下一步推荐

  • 阅读 错误处理 了解网关如何报告失败、如何安全重试。
  • 试试 流式响应,让前端在 token 产出时立即渲染。
  • 通过 模型选择 找到最适合你场景的模型。