API для взаимодействия теперь общедоступн. Мы рекомендуем использовать этот API для доступа ко всем новейшим функциям и моделям.

Эта страница переведена с помощью Cloud Translation API.

Генерация видео в API Gemini

API Gemini предлагает две модели для генерации видео: Gemini Omni Flash и Veo . Каждая из них разработана для разных рабочих процессов.

Используйте Gemini Omni Flash в качестве модели по умолчанию для генерации видео. Она обеспечивает превосходную согласованность видео, многовходовую обработку (поддерживая одновременный ввод текста, изображений, аудио и видео), согласованность символов, фактическую точность и многоэтапное редактирование диалогов (например, замена элементов или изменение перспективы). Используйте Veo 3.1 для реализации определенных возможностей, таких как расширение сцены, управление последним кадром или интеграция с устаревшими конвейерами обработки.

Gemini Omni Flash

Gemini Omni Flash — это быстрая многомодальная модель для создания видео и редактирования видео в формате диалога. Она отлично справляется с быстрым преобразованием текстовых подсказок и изображений в короткие видеоролики и позволяет корректировать результаты на нескольких этапах с помощью API Interactions.

Начните работу с Gemini Omni Flash →

Veo 3.1

Veo 3.1 — это модель для генерации видео с собственным звуком. Она поддерживает такие функции, как расширение видео, генерация для каждого кадра и управление на основе изображений через API generateContent .

Начните работу с Veo 3.1 →

Понимание видео

Если вам необходимо импортировать и анализировать существующий видеоконтент, а не создавать новый, обратитесь к руководству по анализу видео .