Interfejs Interactions API jest już ogólnie dostępny. Zalecamy korzystanie z tego interfejsu API, aby mieć dostęp do wszystkich najnowszych funkcji i modeli.

Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Generowanie filmów w interfejsie Gemini API

Interfejs Gemini API oferuje 2 modele do generowania filmów, Gemini Omni Flash i Veo. Każdy z nich jest przeznaczony do innych procesów.

Używaj Gemini Omni Flash jako domyślnego modelu do generowania filmów. Zapewnia on lepszą spójność filmów, rozumowanie wieloźródłowe (obsługuje jednocześnie tekst, obrazy, dźwięk i wideo), spójność postaci, dokładność faktów oraz wieloetapowe edytowanie w trybie konwersacyjnym (np. zastępowanie elementów lub zmiany perspektywy). Używaj Veo 3.1, jeśli potrzebujesz konkretnych funkcji, takich jak rozszerzanie scen, sterowanie ostatnią klatką lub integracja z starszymi potokami.

Gemini Omni Flash

Gemini Omni Flash to szybki, multimodalny model do generowania filmów i konwersacyjnej edycji filmów. Doskonale radzi sobie z szybkim przekształcaniem podpowiedzi tekstowych i obrazów w krótkie filmy oraz umożliwia dopracowywanie wyników w wielu etapach za pomocą interfejsu Interactions API.

Pierwsze kroki z Gemini Omni Flash →

Veo 3.1

Veo 3.1 to model do generowania filmów z natywnym dźwiękiem. Obsługuje funkcje takie jak rozszerzanie filmów, generowanie klatek i kierowanie na podstawie obrazów za pomocą interfejsu generateContent API.

Pierwsze kroki z Veo 3.1 →

Rozpoznawanie filmów

Jeśli musisz wczytać i przeanalizować istniejące treści wideo, a nie generować nowych filmów, zapoznaj się z przewodnikiem Rozpoznawanie filmów.