Gemini API의 동영상 생성

Gemini API는 동영상 생성에 사용할 수 있는 두 가지 모델인 Gemini Omni FlashVeo를 제공합니다. 각 모델은 서로 다른 워크플로를 위해 설계되었습니다.

동영상 생성의 기본 모델로 Gemini Omni Flash를 사용하세요. 이 모델은 우수한 동영상 일관성, 다중 입력 추론 (텍스트, 이미지, 오디오, 동영상 입력을 동시에 지원), 캐릭터 일관성, 사실 정확성, 멀티턴 대화 기반 수정 (예: 요소 대체 또는 관점 변경)을 제공합니다. 장면 확장, 마지막 프레임 제어 또는 기존 파이프라인과의 통합과 같은 특정 기능이 필요한 경우 Veo 3.1을 사용하세요.

Gemini Omni Flash

Gemini Omni Flash는 동영상 생성 및 대화 기반 동영상 수정을 위한 빠른 멀티모달 모델입니다. 이 모델은 텍스트 프롬프트와 이미지를 짧은 동영상으로 빠르게 변환하는 데 탁월하며 Interactions API를 사용하여 여러 턴에 걸쳐 결과를 세부적으로 조정할 수 있습니다.

Gemini Omni Flash 시작하기 →

Veo 3.1

Veo 3.1은 기본 오디오로 동영상을 생성하는 모델입니다. generateContent API를 통해 동영상 확장, 프레임별 생성, 이미지 기반 방향과 같은 기능을 지원합니다.

Veo 3.1 시작하기 →

동영상 이해

새 동영상을 생성하는 대신 기존 동영상 콘텐츠를 수집하고 분석해야 하는 경우 동영상 이해 가이드를 참고하세요.