API Gemini предлагает две модели для генерации видео: Gemini Omni Flash и Veo . Каждая из них разработана для разных рабочих процессов.
Используйте Gemini Omni Flash в качестве модели по умолчанию для генерации видео. Она обеспечивает превосходную согласованность видео, многовходовую обработку (поддерживая одновременный ввод текста, изображений, аудио и видео), согласованность символов, фактическую точность и многоэтапное редактирование диалогов (например, замена элементов или изменение перспективы). Используйте Veo 3.1 для реализации определенных возможностей, таких как расширение сцены, управление последним кадром или интеграция с устаревшими конвейерами обработки.
Gemini Omni Flash
Gemini Omni Flash — это быстрая многомодальная модель для создания видео и редактирования видео в формате диалога. Она отлично справляется с быстрым преобразованием текстовых подсказок и изображений в короткие видеоролики и позволяет корректировать результаты на нескольких этапах с помощью API Interactions.
Начните работу с Gemini Omni Flash →
Veo 3.1
Veo 3.1 — это модель для генерации видео с собственным звуком. Она поддерживает такие функции, как расширение видео, генерация для каждого кадра и управление на основе изображений через API generateContent .
Понимание видео
Если вам необходимо импортировать и анализировать существующий видеоконтент, а не создавать новый, обратитесь к руководству по анализу видео .