이제 Interactions API가 정식 버전으로 출시되었습니다. 이 API를 사용하여 모든 최신 기능과 모델에 액세스하는 것이 좋습니다.

Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Gemini API의 동영상 생성

Gemini API는 동영상 생성에 사용할 수 있는 두 가지 모델인 Gemini Omni Flash와 Veo를 제공합니다. 각 모델은 서로 다른 워크플로를 위해 설계되었습니다.

동영상 생성의 기본 모델로 Gemini Omni Flash를 사용하세요. 이 모델은 우수한 동영상 일관성, 다중 입력 추론 (텍스트, 이미지, 오디오, 동영상 입력을 동시에 지원), 캐릭터 일관성, 사실 정확성, 멀티턴 대화 기반 수정 (예: 요소 대체 또는 관점 변경)을 제공합니다. 장면 확장, 마지막 프레임 제어 또는 기존 파이프라인과의 통합과 같은 특정 기능이 필요한 경우 Veo 3.1을 사용하세요.

Gemini Omni Flash

Gemini Omni Flash는 동영상 생성 및 대화 기반 동영상 수정을 위한 빠른 멀티모달 모델입니다. 이 모델은 텍스트 프롬프트와 이미지를 짧은 동영상으로 빠르게 변환하는 데 탁월하며 Interactions API를 사용하여 여러 턴에 걸쳐 결과를 세부적으로 조정할 수 있습니다.

Gemini Omni Flash 시작하기 →

Veo 3.1

Veo 3.1은 기본 오디오로 동영상을 생성하는 모델입니다. generateContent API를 통해 동영상 확장, 프레임별 생성, 이미지 기반 방향과 같은 기능을 지원합니다.

Veo 3.1 시작하기 →

동영상 이해

새 동영상을 생성하는 대신 기존 동영상 콘텐츠를 수집하고 분석해야 하는 경우 동영상 이해 가이드를 참고하세요.