视频模型支持矩阵

这张表汇总当前视频模型系列的主入口、常见模式和参考图传递方式。

模型总表

模型家族代表模型文档页面推荐入口常用模式参考图传法
Sorasora-2概览/v1/videos文生视频、首帧生视频JSON input_reference
Veoveo_3_1veo_3_1-fast概览/v1/videos文生视频、首尾帧、参考生视频JSON input_reference
Grok Videogrok-video-3grok-video-3-progrok-video-3-max概览/v1/videos文生视频、首帧生视频、首尾帧、参考生视频multipart input_reference
国产视频模型(AIGC)Vidu-*Kling-*jimeng-video-*GV-*OS-*Hunyuan-*Mingmou-*Hailuo-*SV-*JV-*概览/v1/videos文生、图生、参考图、参考视频、首尾帧、动作控制、数字人、对口型、模板特效JSON image / images / input_reference / metadata
Seedance-2doubao-seedance-2-0-260128doubao-seedance-2-0-fast-260128概览/v1/video/generations、素材 /v1/seedance/asset/*文生视频、首尾帧、多模态参考、素材库 asset://JSON content + metadata

分家族说明

Sora

项目说明
模型示例sora-2
推荐入口POST /v1/videos
文档页面Sora 视频概览
常见字段promptsizesecondsinput_referencemetadata
参考图JSON input_reference,网关仍兼容 multipart
宽高比常见 16:99:16
时长通过 seconds 提交;具体可用值以当前上游和渠道配置为准

Veo

项目说明
模型示例veo_3_1veo_3_1-fast
推荐入口POST /v1/videos
文档页面Veo 视频概览
常见模式文生视频、首尾帧、参考生视频
参考图JSON input_reference,由服务端转换为 Veo 请求结构
注意事项参考生视频模式下,会优先约束为横屏思路,避免上游不兼容

国产视频模型(AIGC)

项目说明
模型示例Vidu-*Kling-*jimeng-video-*GV-*OS-*Hunyuan-*Mingmou-*Hailuo-*SV-*JV-*
推荐入口POST /v1/videos
文档页面国产视频模型概览
常见字段modelpromptsecondsdurationsizeimageimagesmetadata
参考图支持 imageimagesinput_reference,高级场景也可通过 metadata.file_infos 传入
典型场景文生视频、图生视频、参考图、参考视频、首尾帧、动作控制、数字人、对口型、模板特效

Grok Video

项目说明
模型示例grok-video-3grok-video-3-progrok-video-3-max
推荐入口POST /v1/videos
文档页面Grok 视频概览
常见字段promptsecondsaspect_ratiosize
参考图走 multipart input_reference,支持多张
时长规则grok-video-3-pro 固定 10sgrok-video-3-max 固定 15s
特殊模式额外支持“首帧生视频 + 参考图”的组合模式

Seedance-2

项目说明
模型示例doubao-seedance-2-0-260128doubao-seedance-2-0-fast-260128
推荐入口POST /v1/video/generations;素材 POST /v1/seedance/asset/*
文档页面Seedance-2 概览
常见字段content[]text / image_url / video_url / audio_url + role)、metadata.durationmetadata.ratiometadata.resolution
素材引用上传后使用 asset://{assetId}
查询GET /v1/video/generations/{task_id}

豆包 Seedance

项目说明
模型示例doubao-seedance-1-5-pro_480pdoubao-seedance-1-5-pro_720pdoubao-seedance-1-5-pro_1080p
推荐入口POST /v1/videos
文档页面国产视频模型概览
常见字段promptsecondssize
参考图multipart first_frame_imagelast_frame_image
时长规则当前时长限制在 411 秒之间
注意事项不适合“参考生视频”模式

阿里 wan2.6

项目说明
模型示例wan2.6-t2v:1280*720wan2.6-t2v:1920*1080wan2.6-i2v:1280*720wan2.6-i2v:1920*1080
推荐入口POST /v1/videos
文档页面国产视频模型概览
常见模式t2v 文生视频、i2v 图生视频
分辨率模型名里已经带固定分辨率档位
参考图i2v 常见是单图输入

Vidu

项目说明
模型示例Vidu-q3-proVidu-q3-turbo
推荐入口POST /v1/videos
文档页面国产视频模型概览
请求风格JSON
首帧图image
首尾帧image + metadata.last_frame_url
参考生视频images 最多常见 3 张

Kling

项目说明
模型示例Kling-3.0Kling-3.0-Omni
推荐入口POST /v1/videos 或官方兼容路由 /kling/v1/videos/*
文档页面国产视频模型概览
请求风格JSON
常见字段promptsecondsmetadata.output_config
参考图image
音频可通过 metadata.output_config.audio_generation 控制

即梦视频

项目说明
模型示例jimeng-video-3.0jimeng-video-2.0
推荐入口POST /v1/videos(OpenAI 格式)、POST /v1/video/create(统一视频)
文档页面国产视频模型概览即梦视频概览
请求风格JSON / multipart/form-data
常见字段modelpromptsecondssizeinput_reference(OpenAI 格式);imagesaspect_ratiosize(统一视频)
参考图OpenAI 格式:input_reference 文件上传;统一视频:images 数组
接入方式OpenAI 格式、统一视频、豆包渠道三种
典型场景文生视频、图生视频、首尾帧生视频

Hailuo

项目说明
模型示例Hailuo-2.3Hailuo-2.3-fast
推荐入口POST /v1/videos
文档页面国产视频模型概览
请求风格JSON
常见字段promptsecondsmetadata.output_config.resolution
参考图image
注意事项不应依赖 aspect_ratio;当前更适合文生视频和首帧生视频

生成模式支持

模型家族文生视频首帧生视频首尾帧参考生视频音频开关
Sora支持支持部分场景依赖上游部分场景通过多图参考实现支持
Veo支持可通过参考图实现支持支持依赖上游
Grok Video支持支持支持支持依赖上游
豆包 Seedance支持支持支持不推荐依赖上游
阿里 wan2.6支持i2v 支持依赖上游依赖上游依赖上游
即梦视频支持支持支持支持依赖上游
Vidu支持支持支持支持依赖上游
Kling支持支持当前不建议作为标准能力承诺不建议支持
Hailuo支持支持不建议不建议依赖上游

推荐阅读

  1. Grok 视频概览
  2. Sora 视频概览
  3. Veo 视频概览
  4. 如果你要做图生视频,先确认目标模型需要的是 imageimagesinput_reference 还是 first_frame_image / last_frame_image
  5. 如果你明确是 Kling 官方格式接入,再看 /kling/v1/videos/* 这一组路由。