Gemini 3
Gemini 3.1. Pro
Fortschrittliche Intelligenz, Fähigkeiten zur Lösung komplexer Probleme und leistungsstarke Funktionen für die Programmierung von Agenten und Vibe.
Vorschau
Gemini 3 Flash
Leistung auf Frontier-Niveau, die mit größeren Modellen mithalten kann, zu einem Bruchteil der Kosten.
Vorschau
Gemini 3.1 Flash Lite
Leistung auf Frontier-Niveau, die mit größeren Modellen mithalten kann, zu einem Bruchteil der Kosten.
Vorschau
Nano Banana 2
Leistungsstarke, hocheffiziente Bildgenerierung und ‑bearbeitung, optimiert für Geschwindigkeit und Anwendungsfälle mit hohem Volumen.
Vorschau
Nano Banana Pro
Hochmoderne Modelle für die Bildgenerierung und ‑bearbeitung für die kontextbezogene Erstellung nativer Bilder.
Vorschau
Gemini 3.1 Flash Live
Hochwertiges Live-API-Modell mit geringer Latenz für Echtzeitdialoge und sprachgesteuerte KI-Anwendungen.
Neu: Vorschau
Gemini 3.1 Flash TTS
Leistungsstarke Sprachgenerierung mit geringer Latenz.
Neu: Vorschau
Gemini 2.5 Flash
Gemini 2.5 Flash
Unser bestes Preis-Leistungs-Modell für latenzarme Aufgaben mit hohem Volumen, die Reasoning erfordern.
Nano Banana
Hochmoderne native Bildgenerierung und ‑bearbeitung für schnelle, kreative Workflows.
Gemini 2.5 Flash Live Vorschau
Optimiert für Konversationsagenten in Echtzeit mit nativem Audio-Streaming in weniger als einer Sekunde.
Gemini 2.5 Flash TTS Vorschau
Steuerbare Audio-Generierung mit Sprachausgabe mit präziser Steuerung von Stil und Tempo.
Gemini 2.5 Flash-Lite
Gemini 2.5 Flash Lite
Das schnellste und kostengünstigste multimodale Modell der 2.5-Familie.
Gemini 2.5 Pro
Gemini 2.5 Pro
Unser fortschrittlichstes Modell für komplexe Aufgaben mit tiefgehendem logischen Denken und Programmierfunktionen.
Gemini 2.5 Pro TTS Vorschau
Sprachsynthese mit hoher Wiedergabetreue, die für Qualität in strukturierten Workflows wie Podcasts und Hörbüchern optimiert ist.
Audiomodelle
Dieser Abschnitt enthält alle Audiomodelle, auch solche, die möglicherweise bereits in anderen Abschnitten aufgeführt sind.
Gemini 3.1 Flash Live Vorabversion
Unser hochwertiges Audio-zu-Audio-Modell (A2A) mit geringer Latenz wurde für Echtzeitdialoge und Voice-First-KI-Anwendungen entwickelt.
Gemini 3.1 Flash TTS Vorschau
Leistungsstarke Sprachgenerierung mit geringer Latenz, natürlichen Ausgaben, steuerbaren Prompts und neuen ausdrucksstarken Audio-Tags für eine präzise Steuerung der Sprachausgabe.
Gemini 2.5 Flash Live Vorschau
Unser Flaggschiffmodell für die Live API für latenzarme, bidirektionale Sprach- und Video-Agents mit nativer Audioanalyse.
Gemini 2.5 Flash TTS Vorschau
Schnelle und steuerbare Sprachsynthese für kostengünstige Anwendungen mit geringer Latenz und Echtzeit-Assistenten.
Gemini 2.5 Pro TTS Vorschau
Sprachsynthese mit hoher Wiedergabetreue, die für Qualität in strukturierten Workflows wie Podcasts und Hörbüchern optimiert ist.
Generative Medienmodelle
Dieser Abschnitt enthält alle generativen Media-Modelle, auch solche, die möglicherweise bereits in anderen Abschnitten aufgeführt sind.
Nano Banana 2 Vorschau
Hocheffiziente visuelle Inhalte im Produktionsmaßstab erstellen, indem die Intelligenz der Gemini 3-Serie mit blitzschnellen Generierungsgeschwindigkeiten kombiniert wird.
Veo 3.1 Vorschau
Hochmoderne Videogenerierung in Kinoqualität mit erweiterten kreativen Steuerelementen und nativ synchronisiertem Audio.
Nano Banana Pro Vorschau
Eine professionelle Design-Engine mit einem Reasoning-Kern für 4K-Visuals in Studioqualität, komplexe Layouts und präzise Textwiedergabe.
Veo 3.1 Lite Vorschau
Hocheffiziente, kostengünstige Videogenerierung und ‑bearbeitung sowie filmreife Steuerung aus der Veo 3.1-Familie, die speziell für Entwickler entwickelt wurde.
Nano Banana
Hochmoderne native Bildgenerierung und ‑bearbeitung für schnelle, kreative Workflows.
Imagen 4
Text-zu-Bild-Modell, das sich durch schnelle und ultraschnelle Generierung und außergewöhnliche Klarheit bei einer Auflösung von bis zu 2K auszeichnet.
Modelle zur Musikgenerierung
Dieser Abschnitt enthält alle Modelle zur Musikgenerierung, auch solche, die möglicherweise bereits in anderen Abschnitten aufgeführt sind.
Lyria 3 Pro Vorschau
Unser Flagship-Modell für die Musikgenerierung, optimiert für Songs in voller Länge mit komplexer struktureller Kohärenz.
Lyria 3 Clip Vorschau
Optimiert für die Erstellung kurzer Musikclips, Loops und Vorschauen von bis zu 30 Sekunden.
Lyria RealTime Experimentell
Modell zur Musikgenerierung mit hoher Wiedergabetreue, das eine detaillierte kreative Kontrolle und Echtzeit-Streaming-Funktionen bietet.
Tool- und Agent-Modelle
Computer Use Preview
Ein spezialisiertes Modell, das einen digitalen Bildschirm „sehen“ und Benutzeroberflächenaktionen wie Klicken, Tippen und Navigieren ausführen kann, um komplexe Browseraufgaben zu automatisieren.
Gemini Deep Research Preview
Ein agentisches Modell, das selbstständig mehrstufige Recherchen in Hunderten von Quellen plant und ausführt, um zitierte, interaktive Berichte zu erstellen.
Spezialisierte Aufgabenmodelle
Gemini Embedding 2 Vorschau
Unser erstes multimodales Einbettungsmodell, das Text, Bilder, Videos, Audio und PDFs in einen einheitlichen Einbettungsbereich für erweiterte semantische Such- und RAG-Systeme (Retrieval-Augmented Generation) umwandelt.
Gemini Embedding
Hochdimensionale Vektordarstellungen für erweiterte semantische Suche, Textklassifizierung und RAG-Systeme.
Gemini Robotics-ER 1.6Vorschau
Ein fortschrittliches Modell für verkörperte Schlussfolgerungen, das physische Räume versteht und mehrstufige Aufgaben für Roboter-Agents plant. Es bietet neue Funktionen wie das Ablesen von Instrumenten sowie verbesserte räumliche und physische Schlussfolgerungen.
Gemini Robotics-ER 1.5Vorschau
Ein fortschrittliches Modell für verkörperte Schlussfolgerungen, das physische Räume versteht und mehrstufige Aufgaben für Roboter plant.
Vorherige Modelle
Gemini 2.0 Flash eingestellt
Unser Modell der zweiten Generation für den täglichen Einsatz mit Funktionen der nächsten Generation und verbesserter Leistung, darunter eine höhere Geschwindigkeit, die native Nutzung von Tools und ein Kontextfenster von 1 Million Tokens.
Gemini 2.0 Flash Lite Eingestellt
Unser schnellstes Modell der zweiten Generation, optimiert für Kosteneffizienz und niedrige Latenz.
Gemini 3 Pro (Vorabversion) wird eingestellt
Unser fortschrittlichstes Logikmodell mit erweitertem multimodalen Verständnis.
Namensmuster für Modellversionen
Gemini-Modelle sind in den Versionen stabil, Vorschau, aktuell oder experimentell verfügbar.
Stabil
Verweist auf ein bestimmtes stabiles Modell. Stabile Modelle ändern sich in der Regel nicht. Die meisten Produktions-Apps sollten ein bestimmtes stabiles Modell verwenden.
Beispiel: gemini-2.5-flash.
Vorschau
Verweist auf ein Vorschaumodell, das für die Produktion verwendet werden kann. Bei Vorschauversionen von Modellen ist die Abrechnung in der Regel aktiviert. Sie haben möglicherweise restriktivere Ratenlimits und werden mit einer Vorlaufzeit von mindestens zwei Wochen eingestellt.
Beispiel: gemini-2.5-flash-preview-09-2025.
Neueste
Verweist auf den neuesten Release für eine bestimmte Modellvariante. Das kann ein stabiles Release, ein Preview-Release oder ein experimentelles Release sein. Dieser Alias wird bei jeder neuen Version einer bestimmten Modellvariante ausgetauscht. Zwei Wochen vor der Änderung der Version, die nicht mehr die aktuelle ist, werden Sie per E-Mail benachrichtigt.
Beispiel: gemini-flash-latest.
Experimentell
Verweist auf ein experimentelles Modell, das in der Regel nicht für die Produktion geeignet ist und restriktivere Ratenlimits hat. Wir veröffentlichen experimentelle Modelle, um Feedback zu sammeln und Entwicklern unsere neuesten Updates schnell zur Verfügung zu stellen.
Experimentelle Modelle sind nicht stabil und die Verfügbarkeit von Modellendpunkten kann sich ändern.
Einstellung von Modellen
Informationen zur Einstellung von Modellen finden Sie auf der Seite Einstellung von Gemini-Modellen.