シーン、キャラクター、雰囲気、音楽、効果音の要件を記述してください。
0 / 1500
最大 3 クリップ(各 30 秒まで)をアップロード。プロンプトで @Audio1 を使用
雰囲気を誘導する画像を 1 枚アップロード(参照オーディオと併用不可)
画像参照とオーディオ参照は排他的です。どちらか一方のみ。
音声シーンを記述して生成をクリックすると、フルシーン AI 音声を作成できます
Seed Audio 1.0 は TTS を超え、完全なサウンドシーンを生成
単一ナレーションではなく、対話・BGM・環境音をまとめて生成。
複数の話者に独立した声色、感情、自然なテンポを一度に付与。
最大 3 つの参照クリップをアップロードし、@Audio1/@Audio2/@Audio3 で引用。
脚本に合わせた BGM とフォーリー風環境音を同期生成。
ポッドキャスト、広告、短編ドラマ向けの長めの音声出力。
Seed Speech と Seed Music の研究に基づき、Seedance 動画モデルと同源。