Gemini 2.5 Flash-Sprachausgabe

Unsere schnellste Engine für die hochwertige Sprachsynthese mit geringer Latenz und kostengünstiger Audiogenerierung. Gemini 2.5 Flash TTS eignet sich am besten für Echtzeit-Assistenten, umfangreiche Sprachausgabe und Konversationsanwendungsfälle, die eine detaillierte Steuerung von Sprachstil und Geschwindigkeit erfordern.

Dokumentation

Im Leitfaden zu „Text zu Sprache“ finden Sie eine vollständige Übersicht der Funktionen.

gemini-2.5-flash-preview-tts

Attribut Beschreibung
Modellcode gemini-2.5-flash-preview-tts
Unterstützte Datentypen

Eingaben

Text

Ausgabe

Audio

Token limits[*]

Tokenlimit für Eingaben

8.192

Tokenlimit für Ausgaben

16.384

Funktionen

Audiogenerierung

Unterstützt

Caching

Nicht unterstützt

Code-Ausführung

Nicht unterstützt

Dateisuche

Nicht unterstützt

Funktionsaufrufe

Nicht unterstützt

Fundierung mit Google Maps

Nicht unterstützt

Bildgenerierung

Nicht unterstützt

Live-API

Nicht unterstützt

Suchfundierung

Nicht unterstützt

Strukturierte Ausgaben

Nicht unterstützt

Überlegung

Nicht unterstützt

URL-Kontext

Nicht unterstützt

Verbrauchsoptionen

Batch API

Unterstützt

Flex-Inferenz

Nicht unterstützt

Prioritätsinferenz

Nicht unterstützt

Versionen
Weitere Informationen finden Sie unter Muster für Modellversionen.
  • gemini-2.5-flash-preview-tts
Letztes Update Dezember 2025