AI 音频生成器

AI 音频生成器
Seed Audio 1.0

描述场景、角色、情绪、音乐与音效需求。

0 / 1500

最多上传 3 段音频(每段最长 30 秒),在提示词中使用 @Audio1

上传一张图片引导氛围(不可与参考音频同时使用)

图片参考与音频参考互斥,只能选其一。

生成音频

描述音频场景并点击生成,即可创建全场景 AI 音频

强大的 AI 音频生成能力

Seed Audio 1.0 超越文本转语音,生成完整声音场景

全场景音频

同时生成对白、背景音乐与环境音效,而非单一旁白轨。

多角色对话

一次生成多位说话人,带独立音色、情绪与自然节奏。

参考音频输入

上传最多 3 段参考音频,在提示词中用 @Audio1/@Audio2/@Audio3 引用。

音乐与音效分层

背景音乐与拟音类环境音效随脚本同步生成。

最长约 2 分钟

适合播客、广告与短剧场景的较长音频输出。

字节跳动 Seed 生态

基于 Seed Speech 与 Seed Music 研究,与 Seedance 视频模型同源。

常见问题