Google DeepMindの最先端マルチモーダルモデルで、テキスト、画像、音声、既存の動画などあらゆる入力から何でも生成。Gemini Omni Flashはファミリーの最初のモデルで、次世代の動画生成とインタラクティブ編集をスケールで提供。
SeedDanceに近日公開

Google I/O 2026で発表されたGemini Omniは、AIモデルがコンテンツを理解・生成する方法における根本的なシフトを表しています。単一モーダルジェネレーターとは異なり、Gemini Omniは真のワールドモデルであり、テキスト、画像、音声、スケッチ、既存の動画を同時に取り込み、深いコンテキスト理解で豊かなマルチモーダル出力を生成します。
Gemini Omniはテキスト、画像、オーディオクリップ、スケッチ、既存の動画の任意の組み合わせを入力として受け付け — クリエイターに無制限の柔軟性を提供。
Omniはステートフルなマルチラウンド編集をサポート。クリエイターは出力を反復的に洗練 — 背景の変更、照明の調整、ショットの安定化 — ゼロから生成し直すことなく。
Gemini Omniは世界について推論 — 歴史的コンテキスト、リアルワールド物理、シーンセマンティクスを理解し、視覚的に一貫するだけでなく事実的にも正確な動画を生成。
Gemini Omniで生成されたすべての動画はGoogleの不可視SynthIDウォーターマークを持ち、AI生成コンテンツの透明な識別と責任あるクリエイティブワークフローをサポート。
Gemini Omniは単なる動画ジェネレーターではなく、マルチモーダルコンテキストを理解し、これまでAIでは不可能だったインタラクティブな会話型クリエイティブワークフローを可能にするユニバーサルクリエイティブエンジンです。

Google DeepMindの最先端ワールドモデルアーキテクチャ上に構築された、動画生成、編集、分析の包括的なマルチモーダルクリエイティブプラットフォーム。
自然言語でシーンを説明し、Gemini Omniが動画に変換。
参照画像をアップロードし、Gemini Omniが動画シーケンスにアニメーション化。
音声説明、効果音、音楽クリップをクリエイティブな方向付けとして提供。
既存の動画クリップを参照として提供し、スタイル、環境、オブジェクト、カメラパースペクティブの変換をOmniに依頼。
自然な会話を通じて生成された動画を反復的に洗練。
シーンの一貫性を維持しながら特定のビジュアルエレメントを置き換え。
Gemini Omniは歴史的、文化的、物理的コンテキストについて推論。
すべての出力にGoogleの不可視SynthIDウォーターマーク。
Gemini OmniとAI動画生成について知っておくべきすべて。
Gemini Omniの可能性を探りながら、SeedDanceでSeedance、Veo、Klingなどの最先端モデルを使って高品質なAI動画を生成 — すべて一つのプラットフォームで。