Skip to content

技术文档

快速开始

CallStack AI Gateway 完全兼容 OpenAI API 规范。集成仅需更改 Base URL,无需修改任何代码。

端点配置

每个模型服务商拥有独立的网关端点:

Anthropic Claude
claude.callaiapi.com
OpenAI
openai.callaiapi.com
Google Gemini
gemini.callaiapi.com
DeepSeek
deepseek.callaiapi.com

认证

所有请求需在 Authorization 请求头中携带 API Key:

Authorization: Bearer csk-your-api-key

API Key 可通过管理后台或管理 API 进行管理。

兼容性

网关接受标准 OpenAI API 格式的请求。任何支持 OpenAI 的 SDK、框架或工具均可直接使用:

框架配置方式
OpenAI Python SDK设置 base_url 参数
OpenAI Node.js SDK设置 baseURL 选项
LangChainChatOpenAI 上设置 base_url
Vercel AI SDKcreateOpenAI 上设置 baseURL
LlamaIndex在 OpenAI LLM 上设置 api_base
cURL / HTTP替换请求 URL

可用模型

模型标识符端点
Claude Opus 4claude-opus-4-20250514claude.callaiapi.com
Claude Sonnet 4claude-sonnet-4-20250514claude.callaiapi.com
GPT-4ogpt-4oopenai.callaiapi.com
GPT-4o Minigpt-4o-miniopenai.callaiapi.com
o3o3openai.callaiapi.com
Gemini 2.5 Progemini-2.5-progemini.callaiapi.com
DeepSeek V3deepseek-chatdeepseek.callaiapi.com
DeepSeek R1deepseek-reasonerdeepseek.callaiapi.com

完整模型列表请参阅支持模型

API 参考

Chat Completions

POST /v1/chat/completions

标准 OpenAI Chat Completions 格式。支持流式输出、函数调用和多模态输入(取决于模型)。

Models

GET /v1/models

返回指定网关端点上可用的模型列表。

Embeddings

POST /v1/embeddings

使用支持的嵌入模型生成向量表示。

速率限制

方案请求/分钟Token/分钟
入门版60100,000
专业版300500,000
企业版定制定制

错误码

状态码说明处理方式
401认证失败检查 API Key
403权限不足检查 Key 权限范围与模型访问权限
429超出速率限制降低请求频率或升级方案
500内部服务器错误重试或联系技术支持
503上游服务不可用上游模型暂时不可用

技术支持

如需技术支持,请联系我们的工程团队:

  • 邮箱:support@callaiapi.com
  • 企业版:专属 Slack 频道