视频模型支持矩阵
这张表汇总当前视频模型系列的主入口、常见模式和参考图传递方式。模型总表
| 模型家族 | 代表模型 | 文档页面 | 推荐入口 | 常用模式 | 参考图传法 |
|---|---|---|---|---|---|
| Sora | sora-2 | 概览 | /v1/videos | 文生视频、首帧生视频 | JSON input_reference |
| Veo | veo_3_1、veo_3_1-fast | 概览 | /v1/videos | 文生视频、首尾帧、参考生视频 | JSON input_reference |
| Grok Video | grok-video-3、grok-video-3-pro、grok-video-3-max | 概览 | /v1/videos | 文生视频、首帧生视频、首尾帧、参考生视频 | multipart input_reference |
| 国产视频模型(AIGC) | Vidu-*、Kling-*、jimeng-video-*、GV-*、OS-*、Hunyuan-*、Mingmou-*、Hailuo-*、SV-*、JV-* | 概览 | /v1/videos | 文生、图生、参考图、参考视频、首尾帧、动作控制、数字人、对口型、模板特效 | JSON image / images / input_reference / metadata |
| Seedance-2 | doubao-seedance-2-0-260128、doubao-seedance-2-0-fast-260128 | 概览 | /v1/video/generations、素材 /v1/seedance/asset/* | 文生视频、首尾帧、多模态参考、素材库 asset:// | JSON content + metadata |
分家族说明
Sora
| 项目 | 说明 |
|---|---|
| 模型示例 | sora-2 |
| 推荐入口 | POST /v1/videos |
| 文档页面 | Sora 视频概览 |
| 常见字段 | prompt、size、seconds、input_reference、metadata |
| 参考图 | JSON input_reference,网关仍兼容 multipart |
| 宽高比 | 常见 16:9、9:16 |
| 时长 | 通过 seconds 提交;具体可用值以当前上游和渠道配置为准 |
Veo
| 项目 | 说明 |
|---|---|
| 模型示例 | veo_3_1、veo_3_1-fast |
| 推荐入口 | POST /v1/videos |
| 文档页面 | Veo 视频概览 |
| 常见模式 | 文生视频、首尾帧、参考生视频 |
| 参考图 | JSON input_reference,由服务端转换为 Veo 请求结构 |
| 注意事项 | 参考生视频模式下,会优先约束为横屏思路,避免上游不兼容 |
国产视频模型(AIGC)
| 项目 | 说明 |
|---|---|
| 模型示例 | Vidu-*、Kling-*、jimeng-video-*、GV-*、OS-*、Hunyuan-*、Mingmou-*、Hailuo-*、SV-*、JV-* |
| 推荐入口 | POST /v1/videos |
| 文档页面 | 国产视频模型概览 |
| 常见字段 | model、prompt、seconds、duration、size、image、images、metadata |
| 参考图 | 支持 image、images、input_reference,高级场景也可通过 metadata.file_infos 传入 |
| 典型场景 | 文生视频、图生视频、参考图、参考视频、首尾帧、动作控制、数字人、对口型、模板特效 |
Grok Video
| 项目 | 说明 |
|---|---|
| 模型示例 | grok-video-3、grok-video-3-pro、grok-video-3-max |
| 推荐入口 | POST /v1/videos |
| 文档页面 | Grok 视频概览 |
| 常见字段 | prompt、seconds、aspect_ratio、size |
| 参考图 | 走 multipart input_reference,支持多张 |
| 时长规则 | grok-video-3-pro 固定 10s,grok-video-3-max 固定 15s |
| 特殊模式 | 额外支持“首帧生视频 + 参考图”的组合模式 |
Seedance-2
| 项目 | 说明 |
|---|---|
| 模型示例 | doubao-seedance-2-0-260128、doubao-seedance-2-0-fast-260128 |
| 推荐入口 | POST /v1/video/generations;素材 POST /v1/seedance/asset/* |
| 文档页面 | Seedance-2 概览 |
| 常见字段 | content[](text / image_url / video_url / audio_url + role)、metadata.duration、metadata.ratio、metadata.resolution |
| 素材引用 | 上传后使用 asset://{assetId} |
| 查询 | GET /v1/video/generations/{task_id} |
豆包 Seedance
| 项目 | 说明 |
|---|---|
| 模型示例 | doubao-seedance-1-5-pro_480p、doubao-seedance-1-5-pro_720p、doubao-seedance-1-5-pro_1080p |
| 推荐入口 | POST /v1/videos |
| 文档页面 | 国产视频模型概览 |
| 常见字段 | prompt、seconds、size |
| 参考图 | multipart first_frame_image、last_frame_image |
| 时长规则 | 当前时长限制在 4 到 11 秒之间 |
| 注意事项 | 不适合“参考生视频”模式 |
阿里 wan2.6
| 项目 | 说明 |
|---|---|
| 模型示例 | wan2.6-t2v:1280*720、wan2.6-t2v:1920*1080、wan2.6-i2v:1280*720、wan2.6-i2v:1920*1080 |
| 推荐入口 | POST /v1/videos |
| 文档页面 | 国产视频模型概览 |
| 常见模式 | t2v 文生视频、i2v 图生视频 |
| 分辨率 | 模型名里已经带固定分辨率档位 |
| 参考图 | i2v 常见是单图输入 |
Vidu
| 项目 | 说明 |
|---|---|
| 模型示例 | Vidu-q3-pro、Vidu-q3-turbo |
| 推荐入口 | POST /v1/videos |
| 文档页面 | 国产视频模型概览 |
| 请求风格 | JSON |
| 首帧图 | image |
| 首尾帧 | image + metadata.last_frame_url |
| 参考生视频 | images 最多常见 3 张 |
Kling
| 项目 | 说明 |
|---|---|
| 模型示例 | Kling-3.0、Kling-3.0-Omni |
| 推荐入口 | POST /v1/videos 或官方兼容路由 /kling/v1/videos/* |
| 文档页面 | 国产视频模型概览 |
| 请求风格 | JSON |
| 常见字段 | prompt、seconds、metadata.output_config |
| 参考图 | image |
| 音频 | 可通过 metadata.output_config.audio_generation 控制 |
即梦视频
| 项目 | 说明 |
|---|---|
| 模型示例 | jimeng-video-3.0、jimeng-video-2.0 |
| 推荐入口 | POST /v1/videos(OpenAI 格式)、POST /v1/video/create(统一视频) |
| 文档页面 | 国产视频模型概览、即梦视频概览 |
| 请求风格 | JSON / multipart/form-data |
| 常见字段 | model、prompt、seconds、size、input_reference(OpenAI 格式);images、aspect_ratio、size(统一视频) |
| 参考图 | OpenAI 格式:input_reference 文件上传;统一视频:images 数组 |
| 接入方式 | OpenAI 格式、统一视频、豆包渠道三种 |
| 典型场景 | 文生视频、图生视频、首尾帧生视频 |
Hailuo
| 项目 | 说明 |
|---|---|
| 模型示例 | Hailuo-2.3、Hailuo-2.3-fast |
| 推荐入口 | POST /v1/videos |
| 文档页面 | 国产视频模型概览 |
| 请求风格 | JSON |
| 常见字段 | prompt、seconds、metadata.output_config.resolution |
| 参考图 | image |
| 注意事项 | 不应依赖 aspect_ratio;当前更适合文生视频和首帧生视频 |
生成模式支持
| 模型家族 | 文生视频 | 首帧生视频 | 首尾帧 | 参考生视频 | 音频开关 |
|---|---|---|---|---|---|
| Sora | 支持 | 支持 | 部分场景依赖上游 | 部分场景通过多图参考实现 | 支持 |
| Veo | 支持 | 可通过参考图实现 | 支持 | 支持 | 依赖上游 |
| Grok Video | 支持 | 支持 | 支持 | 支持 | 依赖上游 |
| 豆包 Seedance | 支持 | 支持 | 支持 | 不推荐 | 依赖上游 |
| 阿里 wan2.6 | 支持 | i2v 支持 | 依赖上游 | 依赖上游 | 依赖上游 |
| 即梦视频 | 支持 | 支持 | 支持 | 支持 | 依赖上游 |
| Vidu | 支持 | 支持 | 支持 | 支持 | 依赖上游 |
| Kling | 支持 | 支持 | 当前不建议作为标准能力承诺 | 不建议 | 支持 |
| Hailuo | 支持 | 支持 | 不建议 | 不建议 | 依赖上游 |