Gemini 3.1 Flash Live Preview ist unser Audio-zu-Audio-Modell mit niedriger Latenz, das für Echtzeitdialoge und sprachgesteuerte KI-Anwendungen optimiert ist. Es bietet eine Erkennung akustischer Nuancen, numerische Präzision und multimodale Wahrnehmung.
Dokumentation
Im Live API-Leitfaden finden Sie eine vollständige Beschreibung der Funktionen und Möglichkeiten.
gemini-3.1-flash-live-preview
| Attribut | Beschreibung |
|---|---|
| Modellcode |
gemini-3.1-flash-live-preview
|
| Unterstützte Datentypen |
Eingaben Text, Bilder, Audio, Video Ausgabe Text und Audio |
| Token-Limits[*] |
Eingabetokenlimit 131.072 Tokenausgabelimit 65.536 |
| Funktionen |
Unterstützt Nicht unterstützt Nicht unterstützt Nicht unterstützt Unterstützt Nicht unterstützt Nicht unterstützt Unterstützt Unterstützt Nicht unterstützt Unterstützt Nicht unterstützt |
| Nutzungsoptionen |
Nicht unterstützt |
| -Versionen |
|
| Letzte Aktualisierung | März 2026 |
| Wissensstichtag | Januar 2025 |
Migration von Gemini 2.5 Flash Live
Gemini 3.1 Flash Live Preview ist für Echtzeitdialoge mit niedriger Latenz optimiert.
Bei der Migration von gemini-2.5-flash-native-audio-preview-12-2025 ist Folgendes zu beachten:
- Modellstring: Aktualisieren Sie Ihren Modellstring von
gemini-2.5-flash-native-audio-preview-12-2025aufgemini-3.1-flash-live-preview. - Konfiguration von „Thinking“: Gemini 3.1 verwendet
thinkingLevel(mit Einstellungen wieminimal,low,mediumundhigh) anstelle vonthinkingBudget. Die Standardeinstellung istminimal, um die Latenz zu minimieren. Weitere Informationen zu Denkebenen und Budgets - Serverereignisse: Ein einzelnes
BidiGenerateContentServerContent-Ereignis kann jetzt mehrere Inhaltsteile gleichzeitig enthalten, z. B. Audio-Chunks und Transkript. Aktualisieren Sie Ihren Code so, dass alle Teile in jedem Ereignis verarbeitet werden, um fehlende Inhalte zu vermeiden. - Clientinhalte:
send_client_contentwird nur für das Seeding des anfänglichen Kontexthistorie unterstützt. Dazu mussinitial_history_in_client_contentinhistory_configfestgelegt werden. Verwenden Siesend_realtime_input, um während der Unterhaltung Textaktualisierungen zu senden. Weitere Informationen finden Sie unter Inkrementelle Aktualisierungen von Inhalten. - Turn coverage (Abdeckung für Abbiegungen): Standardmäßig wird
TURN_INCLUDES_AUDIO_ACTIVITY_AND_ALL_VIDEOanstelle vonTURN_INCLUDES_ONLY_ACTIVITYverwendet. Der Zug des Modells umfasst jetzt erkannte Audioaktivitäten und alle Videoframes. Wenn Ihre Anwendung derzeit einen konstanten Stream von Videoframes sendet, sollten Sie sie so aktualisieren, dass Videoframes nur gesendet werden, wenn Audioaktivität vorhanden ist, um zusätzliche Kosten zu vermeiden. - Asynchrone Funktionsaufrufe: Werden noch nicht unterstützt. Funktionsaufrufe sind nur synchron. Das Modell beginnt erst mit der Antwort, wenn Sie die Tool-Antwort gesendet haben. Weitere Informationen
- Proaktive Audioausgabe und affektiver Dialog: Diese Funktionen werden in Gemini 3.1 Flash Live noch nicht unterstützt. Entfernen Sie alle Konfigurationen für diese Funktionen aus Ihrem Code. Weitere Informationen finden Sie unter Proaktive Audioeingabe und Affektiver Dialog.
Einen detaillierten Vergleich der Funktionen finden Sie in der Tabelle Modellvergleich im Leitfaden zu den Funktionen.