文本模型支持矩阵

文本系列的复杂点不在于“模型多”,而在于“协议也多”。当前系统同时支持 OpenAI Chat Completions、OpenAI Responses、Claude Messages、Gemini 原生格式、Legacy Completions 与 Realtime。如果没有一张矩阵,外部用户很容易只看到接口名,却不知道应该从哪条协议接入。
这一页按“协议风格 + 能力类型”整理,不按单个模型逐个枚举。单个 API Key 实际可用哪些模型,还是以 模型列表 返回结果为准。

协议总表

协议/能力推荐入口典型模型家族流式工具调用多模态适用场景
OpenAI Chat Completions/v1/chat/completionsGPT、Claude 映射模型、Gemini 映射模型、DeepSeek、Qwen 等支持支持支持聊天、Agent、传统 OpenAI SDK 兼容
OpenAI Responses/v1/responsesGPT、支持 Responses 语义的兼容模型支持支持支持结构化输出、工具编排、上下文续接
Claude Messages/v1/messagesClaude Sonnet / Opus / Haiku 等支持支持支持已有 Anthropic SDK 或 Claude 原生提示结构
Gemini 原生/v1beta/models/{model}:{action}Gemini Flash / Pro / 图像预览模型支持支持支持已有 Gemini SDK、要保留 contents/parts 结构
Legacy Completions/v1/completions兼容旧 Completion 风格的文本模型通常非首选有限历史系统兼容
Realtime/v1/realtime实时对话模型实时流依模型多模态视模型WebSocket 实时交互

常见模型名称示例

下面这些不是“完整可用模型列表”,而是当前系统里常见、对外最容易遇到的一批文本模型名称示例。实际是否可用仍取决于你的渠道配置和 GET /v1/models 返回。

OpenAI / GPT 风格

常见模型名说明
gpt-4o通用多模态模型
gpt-4o-mini轻量版通用模型
gpt-4.1通用文本/工具调用模型
gpt-4.1-mini轻量版 4.1
gpt-4.1-nano更小规格 4.1
o1推理模型
o3推理模型
o4推理模型

Claude

常见模型名说明
claude-sonnet-4-20250514Claude Sonnet 系列常见版本
claude-sonnet-4-5-20250929Sonnet 后续版本
claude-sonnet-4-6Sonnet 4.6
claude-opus-4-20250514Claude Opus 系列
claude-opus-4-1-20250805Opus 后续版本
claude-opus-4-6Opus 4.6
claude-opus-4-7Opus 4.7
claude-haiku-4-5-20251001Haiku 轻量模型

Gemini

常见模型名说明
gemini-2.0-flashGemini 通用快速模型
gemini-2.5-flashGemini 2.5 Flash
gemini-2.5-proGemini 2.5 Pro
gemini-3.1-pro-previewGemini 预览版 Pro
gemini-3-pro-image-previewGemini 图像预览模型
gemini-3.1-flash-image-previewGemini 图像预览快速模型

DeepSeek

常见模型名说明
deepseek-chat通用对话模型
deepseek-reasoner推理模型
deepseek-v4-flash新一代快速模型
deepseek-v4-pro新一代高阶模型
deepseek-r1推理系列
deepseek-r1-distill-qwen-32b蒸馏推理模型

Qwen

常见模型名说明
qwen-maxQwen 高规格模型
qwen3-maxQwen 3 系列高规格模型
qwen3-omni-flashQwen 多模态快速模型
qwq / qwq-*Qwen 推理系列常见命名

按协议选入口

1. OpenAI Chat Completions

项目说明
入口POST /v1/chat/completions
典型字段modelmessagesstreamtoolsresponse_format
多模态输入messages[].content 支持 textimage_urlinput_audiofilevideo_url
适合人群已经在用 OpenAI SDK、希望最低迁移成本接入
典型模型家族GPT、Claude 映射模型、Gemini 映射模型、DeepSeek、Qwen
常见模型名示例gpt-4ogpt-4.1gpt-4o-minideepseek-chatdeepseek-reasonerqwen-max

2. OpenAI Responses

项目说明
入口POST /v1/responses
典型字段modelinputinstructionstoolsprevious_response_idtext
优势更适合结构化输出、工具调用和复杂任务编排
流式支持 SSE
典型模型家族GPT 风格模型及兼容 Responses 语义的上游
常见模型名示例gpt-4ogpt-4.1o1o3

3. Claude Messages

项目说明
入口POST /v1/messages
典型字段modelmessagessystemmax_tokenstoolsthinking
认证兼容Authorization: Bearerx-api-key + anthropic-version
适合人群已经有 Claude 原生格式调用代码
常见模型名示例claude-sonnet-4-20250514claude-sonnet-4-6claude-opus-4-6claude-opus-4-7

4. Gemini 原生

项目说明
入口POST /v1beta/models/{model}:generateContent
典型字段contentsgenerationConfigtoolssafetySettings
认证兼容Authorization: Bearerx-goog-api-key
适合人群需要完整保留 Gemini contents/parts 结构、图像 part、Google 工具风格
常见模型名示例gemini-2.0-flashgemini-2.5-flashgemini-2.5-progemini-3.1-pro-preview

按能力选接口

对话生成

需求推荐接口说明
通用聊天/v1/chat/completions最通用、最兼容
工具编排/v1/responses更适合结构化工作流
Claude 原生/v1/messages保持 Anthropic 请求结构
Gemini 原生/v1beta/models/{model}:generateContent保持 Gemini 请求结构

实时与模型查询

需求推荐接口说明
实时连接/v1/realtimeWebSocket 实时会话
查询当前 key 可用模型/v1/models默认 OpenAI 风格返回
查询 Gemini 原生模型/v1beta/models保留 Gemini 原生模型格式

常见模型家族映射思路

家族常见接法说明
GPT / OpenAI 风格模型/v1/chat/completions/v1/responses默认优先看 OpenAI 兼容协议
Claude/v1/messages/v1/chat/completions新接入更推荐 messages;兼容层也可走 chat
Gemini/v1beta/models/{model}:{action}/v1/chat/completions要原生能力就走 v1beta,要统一 SDK 兼容就走 chat
DeepSeek / Qwen 等 OpenAI 风格上游/v1/chat/completions通常最省事

选型建议

  1. 如果你已经是 OpenAI SDK 客户端,先从 通用对话接口(默认流式) 开始。
  2. 如果你要做工具调用、上下文续接、结构化输出,优先用 OpenAI 多模态响应接口
  3. 如果你已有 Anthropic SDK,直接接 Claude 消息接口
  4. 如果你已有 Gemini SDK 或要保留 contents/parts 结构,直接接 Gemini 原生格式
  5. 如果你需要低延迟双向语音或实时会话,优先看 Realtime 接口
  6. 如果你不确定当前 key 能用哪些模型,先查 模型列表