xAI的Grok Imagine Video 1.5是Arena排行榜#1的图生视频模型,较1.0版本提升52 Elo。将任意静态图片动画化为电影级视频,配备原生同步音频——逼真的运动、物理精确的交互、自动生成的声音,一次完成。
SeedDance平台可用

Grok Imagine Video 1.5是xAI最新的图生视频生成模型,于2026年5月31日正式发布。它在Arena.ai图生视频排行榜上以较前版本+52 Elo的巨大优势占据#1位置,超越了Seedance 2.0、HappyHorse 1.0和Google Veo。基于Aurora引擎构建,它将静态图片动画化为带同步音频的短视频——视觉生成与音频合成一次完成。
Grok Imagine Video 1.5 Preview (720p)在Arena.ai图生视频排行榜上正式排名#1,以较前版本+52 Elo的显著优势超越了字节跳动的Seedance 2.0、阿里巴巴ATH的HappyHorse和Google Veo。
音频与视频同步生成,一次完成。背景音乐、音效、环境音甚至简短对话都与画面动作完美同步——无需单独的音频编辑。1.5版本引入了重大音频改进,声音更自然、更沉浸。
Grok Imagine Video 1.5是专门的图生视频模型,专为动画化静态图片而优化。这种专注设计意味着每个参数和能力都针对最佳图生动画效果调优——从保留视觉特征到生成上下文合适的运动。
盲测显示人脸精度较1.0版本有显著提升。Grok Imagine Video 1.5能生成更逼真的人脸——包括名人肖像——同时在视频序列中保持强大的角色一致性,非常适合肖像动画和角色驱动内容。
Grok Imagine Video 1.5结合xAI的Aurora引擎与音频质量、真实感、时间连贯性和提示词遵循方面的重大升级——提供当今最高质量的图生视频生成。

xAI最先进的图生视频模型——Aurora引擎物理、原生同步音频、Arena排行榜#1。
上传任意静态图片——肖像、产品照、插画或概念艺术——Grok Imagine Video 1.5将其动画化为逼真运动和上下文合适的动作。设置为auto时,输出宽高比默认匹配输入图片的原始宽高比。
音频与视频同步生成。背景音乐、环境音、音效和对话都与画面动作同步。通过在提示词中提及声音或使用AUDIO:部分来影响音频生成。
选择480p以获得更快的生成速度和更低成本,或选择720p以获得标清质量。分辨率参数让你控制输出质量和生成速度以匹配项目需求。
生成1到15秒的视频。较短的片段(5-8秒)更稳定、无伪影,而长达15秒的片段适合叙事序列。选择适合你平台和创意愿景的时长。
支持auto(匹配输入图片)、16:9、9:16、1:1、4:3、3:4、3:2和2:3宽高比。适配任何平台——YouTube宽屏、TikTok竖屏、Instagram方形或电影格式。
基于xAI专有的Aurora引擎构建,Grok Imagine Video 1.5模拟真实世界物理——重力、动量、碰撞、流体动力学和布料行为——产生视觉上令人信服且物理上合理的动画结果。
在提示词中直接指定镜头运动:摇摄、俯仰、变焦、推拉、跟踪、环绕、航拍、手持和缓慢推进。模型理解标准电影镜头语言并精确解读导演指令。
Grok Imagine Video 1.5很好地处理多节拍序列。按顺序在提示词中列出动作——运动员蹲下,然后猛冲向前,然后观众欢呼——模型会生成时间连贯的多动作序列。
关于Grok Imagine Video 1.5及其在SeedDance上使用的一切信息。
在SeedDance上体验#1图生视频AI模型。上传任意图片,观看它在同步音频、逼真运动和Aurora引擎物理的加持下栩栩如生——几秒内完成。