Google DeepMind의 가장 진보된 멀티모달 모델로, 텍스트, 이미지, 오디오 또는 기존 영상 등 모든 입력에서 무엇이든 생성할 수 있습니다. Gemini Omni Flash는 제품군의 첫 번째 모델로, 차세대 AI 영상 생성 및 대화형 편집을 대규모로 제공합니다.
SeedDance에 출시 예정

Google I/O 2026에서 공개된 Gemini Omni는 AI 모델이 콘텐츠를 이해하고 생성하는 방식의 근본적인 변화를 나타냅니다. 단일 모달리티 생성기와 달리 Gemini Omni는 진정한 세계 모델입니다 — 텍스트, 이미지, 오디오, 드로잉 및 기존 영상을 동시에 수용한 후 깊은 문맥 이해로 풍부한 멀티모달 출력을 생성합니다.
Gemini Omni는 텍스트, 이미지, 오디오 클립, 드로잉 및 기존 영상의 모든 조합을 입력으로 받아들입니다 — 크리에이터가 프롬프트를 처음부터 다시 작성할 필요 없이 무제한 유연성으로 창작 의도를 표현할 수 있습니다.
Omni는 상태 저장 다중 턴 편집을 지원합니다. 크리에이터는 대화적으로 출력을 개선할 수 있습니다 — 배경 변경, 조명 조정, 샷 안정화 — 모두 처음부터 생성을 다시 시작하지 않고도 가능합니다.
Gemini Omni는 세계에 대해 추론합니다 — 역사적 문맥, 실제 물리학 및 장면 의미론을 이해하여 시각적으로 일관될 뿐만 아니라 사실적으로 근거 있는 영상을 생성합니다.
Gemini Omni로 생성된 모든 영상에는 Google의 보이지 않는 SynthID 워터마크가 포함되어 있어 AI 생성 콘텐츠의 투명한 식별과 책임 있는 크리에이티브 워크플로우를 지원합니다.
Gemini Omni는 단순한 영상 생성기가 아닙니다 — 멀티모달 문맥을 이해하고 이전에는 AI로 불가능했던 반복적이고 대화적인 크리에이션 워크플로우를 가능하게 하는 범용 크리에이티브 엔진입니다.

Google DeepMind의 가장 진보된 세계 모델 아키텍처에 구축된 영상 생성, 편집 및 분석을 위한 포괄적인 멀티모달 크리에이티브 플랫폼입니다.
자연어로 장면을 설명하면 Gemini Omni가 영상으로 렌더링합니다. 모델의 세계 수준 이해는 정확한 물리학, 자연스러운 조명 및 일관된 시간 흐름을 갖춘 출력을 생성합니다.
참조 이미지를 업로드하면 Gemini Omni가 영상 시퀀스로 애니메이션화합니다.
음성 설명, 효과음 또는 음악 클립을 크리에이티브 방향으로 제공하세요.
기존 영상 클립을 참조로 입력하고 Omni에게 스타일, 환경, 객체 또는 카메라 관점을 변환하도록 지시하세요.
자연스러운 대화를 통해 생성된 영상을 개선하세요.
영상 내의 특정 시각적 요소를 장면 일관성을 유지하면서 교체하세요.
Gemini Omni는 역사적, 문화적 및 물리적 문맥에 대해 추론합니다.
모든 출력에는 Google의 보이지 않는 SynthID 워터마크가 포함되어 있습니다.
Gemini Omni와 AI 영상 생성의 관계에 대해 알아야 할 모든 것.
Gemini Omni의 기능을 탐색하는 동안 SeedDance에서 Seedance, Veo, KLING 등 다양한 최고 모델으로 고품질 AI 영상을 생성해 보세요 — 모두 하나의 플랫폼에서.