L'API Interactions è ora disponibile a livello generale. Ti consigliamo di utilizzare questa API per accedere a tutti i modelli e a tutte le funzionalità più recenti.

Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Generazione di video nell'API Gemini

L'API Gemini offre due modelli per la generazione di video: Gemini Omni Flash e Veo. Ognuno è progettato per flussi di lavoro diversi.

Utilizza Gemini Omni Flash come modello predefinito per la generazione di video. Fornisce una coerenza video superiore, ragionamento multi-input (supporta contemporaneamente input di testo, immagini, audio e video), coerenza dei personaggi, accuratezza fattuale ed editing conversazionale multi-turno (ad es. sostituzione di elementi o modifiche della prospettiva). Utilizza Veo 3.1 se sono richieste funzionalità specifiche come l'estensione della scena, il controllo dell'ultimo frame o l'integrazione con pipeline legacy.

Gemini Omni Flash

Gemini Omni Flash è un modello multimodale veloce per la generazione di video e l'editing video conversazionale. È ideale per trasformare rapidamente prompt di testo e immagini in brevi video e ti consente di perfezionare i risultati in più turni utilizzando l'API Interactions.

Inizia a utilizzare Gemini Omni Flash →

Veo 3.1

Veo 3.1 è un modello per la generazione di video con audio nativo. Supporta funzionalità come l'estensione video, la generazione specifica per frame e la direzione basata su immagini tramite l'API generateContent.

Inizia a utilizzare Veo 3.1 →

Comprensione dei video

Se devi importare e analizzare contenuti video esistenti anziché generare nuovi video, consulta la guida Comprensione dei video.