图像模型支持矩阵
当前对外图像能力并不只有单一的 gpt-image-* 模型。从现有脚本和网关适配逻辑看,图像侧实际覆盖了 Gemini、即梦图像、豆包 Seedream、Grok Image、GPT Image 与 OpenAI Images 兼容模型等多条模型线,但它们对入口、参考图、尺寸和返回格式的要求并不完全一致。
如果你只想找“该用哪个接口”,优先看“推荐入口”这一列;如果你只想找“这个模型能不能图生图”,优先看“参考图输入”这一列。
模型总表
| 模型家族 | 代表模型 | 推荐入口 | 参考图输入 | 典型返回 |
|---|
| Gemini 图像模型 | gemini-3-pro-image-preview、gemini-2.5-flash-image-preview、gemini-3.1-flash-image-preview | /v1beta/models/{model}:generateContent | inlineData 多 part | inlineData 或 URL |
| gpt-image-2 | gpt-image-2 | /v1/images/generations | JSON image,支持多张 Base64 | url 或 b64_json |
| gpt-image-2-pro | gpt-image-2-pro | /v1/images/generations | JSON image,支持多张 Base64 | url 或 b64_json |
| 即梦图像 | jimeng-4.0、jimeng-4.5 | /v1/images/generations、/v1/images/edits、/jm | JSON image 数组或文件上传 | url 或 b64_json |
| 豆包 Seedream | doubao-seedream-4-0-250828、doubao-seedream-4-5-251128、doubao-seedream-5-0-260128 | /v1/images/generations | JSON image,通常为 Base64 数组 | url 或 b64_json |
| Grok Image | grok-4-2-image | /v1/images/generations | JSON image,通常为 Base64 数组 | 主要是 url |
| OpenAI Images 兼容 | gpt-image-1、dall-e-3、dall-e-2 | /v1/images/generations、/v1/images/edits | image / mask | url 或 b64_json |
分家族说明
Gemini 图像模型
| 项目 | 说明 |
|---|
| 推荐接口 | POST /v1beta/models/{model}:generateContent |
| 模型示例 | gemini-3-pro-image-preview、gemini-2.5-flash-image-preview、gemini-3.1-flash-image-preview |
| 请求风格 | Gemini 原生 contents[].parts[] |
| 参考图 | 通过 inlineData 传图片二进制内容 |
| 比例参数 | generationConfig.imageConfig.aspectRatio |
| 尺寸参数 | generationConfig.imageConfig.imageSize |
| 尺寸特点 | gemini-3-pro-image-preview 支持 1K / 2K;gemini-2.5-flash-image-preview 与 gemini-3.1-flash-image-preview 会回落为 1K |
| 详细页面 | Gemini 图像生成 API |
gpt-image-2
| 项目 | 说明 |
|---|
| 推荐接口 | POST /v1/images/generations |
| 模型示例 | gpt-image-2 |
| 请求风格 | OpenAI Images 兼容 JSON |
| 参考图 | image: ["<base64>", ...] |
| 返回格式 | response_format = url 或 b64_json |
| 尺寸特点 | 以内置基础比例和尺寸档位为主 |
| 详细页面 | gpt-image-2 生成图像 API |
gpt-image-2-pro
| 项目 | 说明 |
|---|
| 推荐接口 | POST /v1/images/generations |
| 模型示例 | gpt-image-2-pro |
| 请求风格 | OpenAI Images 兼容 JSON |
| 参考图 | image: ["<base64>", ...] |
| 返回格式 | response_format = url 或 b64_json |
| 尺寸特点 | 在基础档位上额外开放 2K、4K 高分档位 |
| 详细页面 | gpt-image-2-pro 生成图像 API |
即梦图像
| 项目 | 说明 |
|---|
| 推荐接口 | POST /v1/images/generations(OpenAI 兼容)、POST /v1/images/edits(编辑)、POST /jm(官方格式) |
| 模型示例 | jimeng-4.0、jimeng-4.5 |
| 请求风格 | OpenAI Images 兼容 JSON / multipart/form-data / 官方格式 JSON |
| 参考图 | 生成:image: ["<url>", ...];编辑:image 文件上传;官方格式:image_urls 数组 |
| 比例到尺寸映射 | size 字段设置分辨率,例如 1024*1024;或使用 ratio 设置比例 |
| 分辨率 | resolution 字段:1k、2k、4k |
| 返回格式 | url 或 b64_json |
| 官方格式 | 需携带 Action=CVSync2AsyncSubmitTask 和 Version=2022-08-31 查询参数 |
| 详细页面 | 即梦图像概览 |
豆包 Seedream
| 项目 | 说明 |
|---|
| 推荐接口 | POST /v1/images/generations |
| 模型示例 | doubao-seedream-4-0-250828、doubao-seedream-4-5-251128、doubao-seedream-5-0-260128 |
| 请求风格 | OpenAI Images 兼容 JSON |
| 参考图 | image: ["<base64>", ...] |
| 比例到尺寸映射 | 16:9 -> 2560x1440、9:16 -> 1440x2560、1:1 -> 2048x2048 等 |
| 返回格式 | 优先 b64_json,也可能只给 url |
| 详细页面 | Doubao Seedream 生成图像 API |
Grok Image
| 项目 | 说明 |
|---|
| 推荐接口 | POST /v1/images/generations |
| 模型示例 | grok-4-2-image |
| 请求风格 | OpenAI Images 兼容 JSON |
| 参考图 | image: ["<base64>", ...] |
| 比例到尺寸映射 | 16:9 -> 2560x1440、9:16 -> 1440x2560、1:1 -> 2048x2048 等 |
| 返回格式 | 主要返回 url,不应依赖 b64_json |
OpenAI Images 兼容
| 项目 | 说明 |
|---|
| 推荐接口 | POST /v1/images/generations、POST /v1/images/edits |
| 模型示例 | gpt-image-1、dall-e-3、dall-e-2 |
| 请求风格 | OpenAI Images 原生字段 |
| 参考图 | image、mask |
| 返回格式 | url 或 b64_json |
| 注意事项 | 这组模型的公共语义见 OpenAI Images 兼容概览,适合做兼容接入 |
比例与尺寸
常见比例
| 比例 | 常见家族 |
|---|
1:1 | Gemini、gpt-image-2、gpt-image-2-pro、即梦、Seedream、Grok |
16:9 | Gemini、gpt-image-2、gpt-image-2-pro、即梦、Seedream、Grok |
9:16 | Gemini、gpt-image-2、gpt-image-2-pro、即梦、Seedream、Grok |
4:3 / 3:4 | gpt-image-2、gpt-image-2-pro、即梦、Seedream、Grok |
3:2 / 2:3 | gpt-image-2、gpt-image-2-pro、即梦、Seedream、Grok |
21:9 | 即梦、Seedream、Grok |
gpt-image-2 基础比例与尺寸档位
gpt-image-2 的基础档位如下:
| 预设 | 实际目标尺寸 | 备注 |
|---|
1:1 | 1024x1024 | 基础档位 |
4:3 | 1536x1152 | 基础档位 |
3:2 | 1536x1024 | 基础档位 |
2:3 | 1024x1536 | 基础档位 |
16:9 | 1920x1080 | 基础档位 |
9:16 | 1080x1920 | 基础档位 |
gpt-image-2-pro 扩展高分档位
gpt-image-2-pro 在基础档位之上,还额外开放了下面这些高分选项:
| 预设 | 实际目标尺寸 | 备注 |
|---|
1:1(2K) | 2048x2048 | gpt-image-2-pro 扩展档位 |
4:3(2K) | 2048x1536 | gpt-image-2-pro 扩展档位 |
3:2(2K) | 2560x1712 | gpt-image-2-pro 扩展档位 |
2:3(2K) | 1712x2560 | gpt-image-2-pro 扩展档位 |
16:9(2K) | 2048x1152 | gpt-image-2-pro 扩展档位 |
9:16(2K) | 1152x2048 | gpt-image-2-pro 扩展档位 |
1:1(4K) | 2880x2880 | gpt-image-2-pro 扩展档位 |
4:3(4K) | 3840x2880 | gpt-image-2-pro 扩展档位 |
3:2(4K) | 3840x2560 | gpt-image-2-pro 扩展档位 |
2:3(4K) | 2560x3840 | gpt-image-2-pro 扩展档位 |
16:9(4K) | 3840x2160 | gpt-image-2-pro 扩展档位 |
9:16(4K) | 2160x3840 | gpt-image-2-pro 扩展档位 |
但要注意,这不代表所有上游都原生接受这些尺寸。脚本会在必要时自动回退到更接近的官方尺寸,并把目标比例写进 prompt。
推荐阅读
- 图像系列概览
- Gemini 图像生成 API
- gpt-image-2 生成图像 API
- gpt-image-2-pro 生成图像 API
- 即梦图像概览
- Doubao Seedream 生成图像 API
- OpenAI Images 兼容概览
- OpenAI Images 兼容图像编辑