2026 年 4 月 7 日,Artificial Analysis Video Arena 上出现了一个 没有署名、没有 Logo、没有公司背景 的 AI 视频模型。三天之内,它同时拿下 文生视频 与 图生视频 两个榜单的第一名,Elo 分数超越字节 Seedance 2.0 与快手 Kling 3.0。
4 月 10 日,阿里巴巴通过新注册的 X 账号正式认领:这就是 HappyHorse 1.0。
这场「匿名发布 → 盲测登顶 → 身份揭晓」的剧本,已成为中国 AI 行业熟悉的造势方式;但对创作者而言,更重要的是 HappyHorse 1.0 本身的能力——原生 1080p、多镜头叙事、流畅运动合成、文生视频与图生视频双模式,以及团队承诺的 开源路线。它让阿里巴巴在 AI 视频赛道第一次以「榜单第一」的姿态进入全球视野。
HappyHorse 1.0 是什么?
HappyHorse 1.0 是阿里巴巴 ATH(Alibaba Token Hub)创新单元 旗下 Future Life Lab(淘天集团)研发的 AI 视频生成模型。模型采用约 150 亿参数的统一单流 Transformer 架构——文本、视频与音频 token 在同一 Transformer 栈中联合处理,单次推理 即可输出带同步音频的视频片段。
技术团队背景同样引人注目:项目负责人 张迪 曾任快手副总裁、Kling AI 技术负责人。HappyHorse 可以看作阿里在 AI 视频领域对快手 Kling、字节 Seedance 的正面回应。
2026 年 4 月 28 日,阿里巴巴宣布 HappyHorse 1.0 进入 限量 beta,面向短剧、电商广告、品牌营销与游戏 CG 等场景开放。团队曾表示将 开源完整权重与推理代码(含商业许可),GitHub 与 Hugging Face 仓库已建立,完整 artifact 发布进度以官方为准。
目前你可在 happyhorse.com、阿里云 Model Studio 以及 SeedDance 上直接使用 HappyHorse 1.0 进行创作。
为什么 HappyHorse 1.0 引发轰动?
Artificial Analysis 双榜第一
Artificial Analysis Video Arena 采用 真实用户盲测 pairwise 对比,而非厂商自评。HappyHorse 1.0 在 2026 年 4 月的表现大致如下(各来源统计口径略有差异):
| 榜单 | Elo 分数(约) | 对比 |
|---|---|---|
| 文生视频(无音频) | ~1,357–1,389 | 领先 Seedance 2.0 约 60–115 分 |
| 图生视频(无音频) | ~1,392–1,416 | 创阿里视频模型新高 |
| 含音频类别 | 与 Seedance 2.0 接近并列 | 音画联合生成能力获认可 |
Elo 领先 60 分在竞技排行榜中通常需要数月才能追赶——HappyHorse 用不到一周完成。阿里巴巴 ADR 在身份揭晓当周一度 上涨 4%–8%,Jefferies 等机构将发布称为成功。
匿名发布的行业意义
HappyHorse 1.0 并非孤例。2026 年初,小米 MiMo-V2 曾以「Hunter Alpha」匿名上榜后再揭晓身份。这类策略的目的很明确:用独立 benchmark 建立可信度,再绑定品牌叙事。
对 Enterprise 采购方与创作者来说,盲测第一意味着「用户真实偏好」而非营销话术——这也是 HappyHorse 1.0 迅速获得关注的核心原因。
四大核心能力
1. 原生 1080p 高清画质
HappyHorse 1.0 以 真正的 1080p 分辨率生成视频——不是 720p 放大,而是生成阶段即按全高清规格渲染。画面具备电影级光照、色彩分级与细节层次,适合营销成片、产品展示与艺术短片,无需后期超分 即可接近广播级交付。
SeedDance 同时提供 720p 档位,生成更快、积分更低,适合草稿与快速迭代。
2. 多镜头叙事(Multi-Shot Storytelling)
这是 HappyHorse 1.0 最具辨识度的能力之一。模型可在 单次生成 中产出多个镜头切换的连贯视频,并在场景转换中保持 角色身份、服装、视觉风格与氛围 一致——解决 AI 视频「一切镜头、人物就换脸」的老问题。
你可以在提示词中逐镜头描述,例如:
镜头1 [0–3秒] 广角:黄昏帆船;镜头2 [3–6秒] 中景:水手望向灯塔;镜头3 [6–9秒] 特写:面部表情
这种 时间轴 + 景别 的写法,让 HappyHorse 1.0 更接近导演分镜语言,而非简单「一句话生成一条 clip」。
3. 文生视频 + 图生视频
| 模式 | 输入 | 特点 |
|---|---|---|
| 文生视频(T2V) | 文本提示词 | 支持复杂场景、多角色交互、逐镜头叙事 |
| 图生视频(I2V) | 1 张参考图 + 可选文本 | 提示词可省略,模型从首帧自由演绎运动;也可加文字引导方向 |
图生视频模式下,输出画幅通常 跟随输入图像比例;文生视频支持 16:9、9:16、1:1、4:3、3:4 五种画幅。
4. 流畅自然的运动合成
从微表情、手势到全身动作与多角色互动,HappyHorse 1.0 强调 物理合理性与电影级流畅度。在 Artificial Analysis 的「运动质量」维度上,它正是凭此超越众多成熟模型——也是 1.1 版本进一步强化的基础。
技术规格
| 参数 | HappyHorse 1.0 支持范围 |
|---|---|
| 视频时长 | 3–15 秒(默认 5 秒,按秒计费) |
| 分辨率 | 720p / 1080p |
| 画幅(T2V) | 16:9、9:16、1:1、4:3、3:4 |
| 生成模式 | 文生视频、图生视频 |
| 参考输入 | I2V:1 张图片 |
| 架构 | ~15B 参数,统一单流 Transformer,音画联合生成 |
| 风格 | 写实、动漫、赛博朋克、水彩、水墨、黏土动画等 |
与 1.1 的差异:HappyHorse 1.0 不支持参考生视频(R2V) 与 9 图参考;若你需要多图锁定产品/角色,请升级至 HappyHorse 1.1。
适合谁?适合做什么?
自 2026 年 4 月 beta 以来,HappyHorse 1.0 已广泛应用于:
- 短剧与微短剧:多镜头叙事、角色跨场景一致
- 电商与产品宣传:静帧产品图动画化、15 秒内卖点展示
- 社交媒体:抖音、Reels、YouTube Shorts 竖屏/横屏短片
- 品牌营销与概念预告:快速可视化 campaign 创意
- 游戏 CG 与概念片:动作预演、角色展示
- 教育与艺术探索:多风格视觉实验
HappyHorse 1.0 特别擅长 需要叙事结构而非单镜头特效 的项目。若你的需求是 9 张参考图锁定 SKU、或更复杂的 R2V 工作流,建议直接使用 1.1。
HappyHorse 1.0 vs 竞品
| 能力 | HappyHorse 1.0 | Seedance 2.0 | Kling 3.0 |
|---|---|---|---|
| 开发方 | 阿里巴巴 ATH | 字节跳动 | 快手 |
| 盲测排名(2026.4) | T2V / I2V 双榜第一 | 被超越 | 紧随其后 |
| 最长时长 | 15 秒 | 15 秒 | 视版本 |
| 最高分辨率 | 1080p | 1080p / 4K | 1080p+ |
| 多镜头叙事 | 核心卖点 | 支持 | 部分支持 |
| 参考生视频 | 无(1.1 支持) | 多模态 @ 引用 | 视模式 |
| 开源承诺 | 权重待完整发布 | 闭源 | 闭源 |
HappyHorse 1.0 的差异化在于 盲测验证的质量 + 多镜头叙事 + 1080p 原生 + 相对亲民的积分价;Seedance 在多模态参考与 4K 长片方面更强;Kling 在写实运动与广告场景有深厚积累。许多团队会根据 brief 混用多个模型,而非押注单一工具。
在 SeedDance 上如何使用
HappyHorse 1.0 已在 SeedDance 全面可用:
- 打开 AI 视频生成器
- 选择 HappyHorse 1.0(文生视频或图生视频 Tab)
- 输入提示词或上传 1 张参考图,设置时长、画质与画幅
- 点击生成
也可访问 HappyHorse 1.0 专题页 了解完整功能与 FAQ。
积分参考(按秒线性计费,5 秒基准):
| 场景 | 720p / 5s | 1080p / 5s |
|---|---|---|
| 文生视频 | 50 积分 | 100 积分 |
| 图生视频 | 60 积分 | 120 积分 |
10 秒 720p 文生视频约 100 积分。时长加倍,积分近似加倍——规划 batch 产出时建议先用 720p + 5s 验证创意,再升 1080p 定稿。
提示词技巧
- 多镜头:用「镜头1 [0–Xs] …;镜头2 [X–Ys] …」标注时间与景别
- 图生视频:可只上传图片、不写 prompt,让模型自由演绎;需要控制时用简短动作描述
- 风格:在 prompt 中明确美学,如「赛博朋克霓虹」「水墨国画」「黏土定格动画」
- 平台适配:竖屏选 9:16,YouTube 选 16:9,信息流广告可试 1:1
常见问题
HappyHorse 1.0 是谁开发的? 阿里巴巴 ATH 创新单元 / Future Life Lab(淘天集团),非字节跳动或快手产品。
HappyHorse 1.0 开源吗? 团队承诺开源 15B 权重、蒸馏版、超分模块与推理代码(含商业许可)。完整 artifact 发布进度请查阅官方 GitHub / Hugging Face;API 与 SeedDance 集成已可正常使用。
1.0 和 1.1 该选哪个? 新项目优先 1.1(动作更强、支持 9 图 R2V)。1.0 仍适合 多镜头叙事 T2V/I2V 且不需要多图参考的场景,积分价相同。
最长能生成多长? 单次 3–15 秒。不支持超过 15 秒的原生连续生成。
图生视频必须写提示词吗? 不必。省略 prompt 时模型会根据首帧图像自动生成合理运动;添加 prompt 可引导具体动作。
可以商用吗? 你须确保内容与参考素材不侵犯版权、商标、肖像权等权利,并遵守当地法规与平台条款。
总结
HappyHorse 1.0 的故事,是中国 AI 视频从「追赶」到 盲测领跑 的缩影:匿名上榜、双榜第一、阿里认领、限量 beta、开源承诺——每一步都在建立信任。
对创作者而言,它交付的是可感知的价值:1080p 原生画质、多镜头叙事、流畅运动、双模式工作流,以及在 SeedDance 上 50 积分起 的亲民定价。若你尚未体验,现在正是上手时机;若你需要更强的动作表现与多图参考,可继续阅读 HappyHorse 1.1 完全指南。
立即在 SeedDance 体验 HappyHorse 1.0,用多镜头叙事跑通你的下一个 AI 视频创意。
