Gemini 3
Gemini 3.1 Pro
Fortschrittliche Intelligenz, komplexe Problemlösungsfähigkeiten und leistungsstarke agentische und Vibe Coding-Funktionen.
Vorschau
Gemini 3 Flash
Leistung der Frontier-Klasse, die mit größeren Modellen mithalten kann, zu einem Bruchteil der Kosten.
Vorschau
Gemini 3.1 Flash Lite
Leistung der Frontier-Klasse, die mit größeren Modellen mithalten kann, zu einem Bruchteil der Kosten.
Stabil
Gemini 3.1 Flash Lite
Leistung der Frontier-Klasse, die mit größeren Modellen mithalten kann, zu einem Bruchteil der Kosten.
Vorschau
Nano Banana 2
Leistungsstarke und hocheffiziente Bildgenerierung und ‑bearbeitung, optimiert für Geschwindigkeit und Anwendungsfälle mit hohem Volumen.
Vorschau
Nano Banana Pro
Hochmoderne Modelle für die Bildgenerierung und ‑bearbeitung für die kontextbezogene native Bildgenerierung.
Vorschau
Gemini 3.1 Flash Live
Hochwertiges, latenzarmes Live API-Modell für Echtzeitdialoge und sprachgesteuerte KI-Anwendungen.
Neue Vorschau
Gemini 3.1 Flash TTS
Leistungsstarke Sprachgenerierung mit geringer Latenz.
Neue Vorschau
Gemini 2.5 Flash
Gemini 2.5 Flash
Unser bestes Modell in Bezug auf Preis-Leistungs-Verhältnis für latenzarme Aufgaben mit hohem Volumen, die logisches Denken erfordern.
Nano Banana
Hochmoderne native Bildgenerierung und ‑bearbeitung für schnelle, kreative Workflows.
Gemini 2.5 Flash Live Live (Vorschau)
Optimiert für konversationelle Echtzeit-Agenten mit nativem Audiostreaming im Subsekundenbereich.
Gemini 2.5 Flash TTS Vorschau
Steuerbare Text-to-Speech-Audiogenerierung mit detaillierter Kontrolle über Stil und Tempo.
Gemini 2.5 Flash Lite
Gemini 2.5 Flash Lite
Das schnellste und kostengünstigste multimodale Modell der 2.5-Familie.
Gemini 2.5 Pro
Gemini 2.5 Pro
Unser fortschrittlichstes Modell für komplexe Aufgaben mit umfassenden Fähigkeiten für logisches Denken und Programmierung.
Gemini 2.5 Pro TTS (Vorschau)
Hochwertige Sprachsynthese, optimiert für Qualität in strukturierten Workflows wie Podcasts und Hörbüchern.
Audiomodelle
Dieser Abschnitt enthält alle Audiomodelle, einschließlich der Modelle, die möglicherweise bereits in anderen Abschnitten aufgeführt sind.
Gemini 3.1 Flash Live Vorschau
Unser hochwertiges, latenzarmes Audio-to-Audio-Modell (A2A) für Echtzeitdialoge und sprachgesteuerte KI-Anwendungen.
Gemini 3.1 Flash TTS Vorschau
Leistungsstarke Sprachgenerierung mit geringer Latenz, natürlichen Ausgaben, steuerbaren Prompts und neuen ausdrucksstarken Audio-Tags für eine präzise Steuerung der Sprachausgabe.
Gemini 2.5 Flash Live Live (Vorschau)
Unser Flaggschiffmodell für die Live API für latenzarme, bidirektionale Sprach- und Videoagenten mit nativem logischem Denken für Audio.
Gemini 2.5 Flash TTS Vorschau
Schnelle und steuerbare Text-to-Speech-Funktion für latenzarme, kostengünstige Anwendungen und Echtzeit-Assistenten.
Gemini 2.5 Pro TTS (Vorschau)
Hochwertige Sprachsynthese, optimiert für Qualität in strukturierten Workflows wie Podcasts und Hörbüchern.
Generative Medienmodelle
Dieser Abschnitt enthält alle generativen Medienmodelle, einschließlich der Modelle, die möglicherweise bereits in anderen Abschnitten aufgeführt sind.
Nano Banana 2 (Vorschau)
Hocheffiziente visuelle Erstellung im Produktionsmaßstab, die die Intelligenz der Gemini 3-Serie mit blitzschnellen Generierungsgeschwindigkeiten kombiniert.
Veo 3.1 (Vorschau)
Hochmoderne filmische Videogenerierung mit erweiterten kreativen Steuerelementen und nativ synchronisiertem Audio.
Nano Banana Pro (Vorschau)
Eine professionelle Design-Engine mit einem Kern für logisches Denken für 4K-Grafiken in Studioqualität, komplexe Layouts und präzise Textwiedergabe.
Veo 3.1 Lite (Vorschau)
Hocheffiziente, kostengünstige Videogenerierung, ‑bearbeitung und filmische Steuerung für Entwickler aus der Veo 3.1-Familie.
Nano Banana
Hochmoderne native Bildgenerierung und ‑bearbeitung für schnelle, kreative Workflows.
Imagen 4
Das bisher beste Text-zu-Bild-Modell mit schneller und ultraschneller Generierung und außergewöhnlicher Klarheit bei einer Auflösung von bis zu 2K.
Modelle für die Musikgenerierung
Dieser Abschnitt enthält alle Modelle für die Musikgenerierung, einschließlich der Modelle, die möglicherweise bereits in anderen Abschnitten aufgeführt sind.
Lyria 3 Pro (Vorschau)
Unser Flaggschiffmodell für die Musikgenerierung, optimiert für Songs in voller Länge mit komplexer struktureller Kohärenz.
Lyria 3 Clip Vorschau
Optimiert für die Generierung kurzer Musikclips, Loops und Vorschauen von bis zu 30 Sekunden.
Lyria RealTime (experimentell)
Hochwertiges Modell für die Musikgenerierung mit detaillierter kreativer Steuerung und Echtzeit-Streamingfunktionen.
Tool- und Agent-Modelle
Computer Use Preview
Ein spezialisiertes Modell, das einen digitalen Bildschirm „sehen“ und UI-Aktionen wie Klicken, Eingeben und Navigieren ausführen kann, um komplexe Browseraufgaben zu automatisieren.
Gemini Deep Research Vorschau
Ein agentisches Modell, das mehrstufige Recherchen aus Hunderten von Quellen autonom plant und ausführt, um zitierte, interaktive Berichte zu erstellen.
Gemini Deep Research Max (Vorschau)
Maximale Vollständigkeit für die automatisierte Kontexterfassung und ‑synthese aus Hunderten von Quellen.
Spezialisierte Aufgabenmodelle
Gemini Embedding 2
Unser erstes multimodales Einbettungsmodell, das Text, Bilder, Videos, Audio und PDFs in einen einheitlichen Einbettungsbereich für erweiterte semantische Such- und RAG-Systeme einordnet.
Gemini Embedding
Hochdimensionale Vektordarstellungen für erweiterte semantische Such-, Textklassifizierungs- und RAG-Systeme.
Gemini Robotics-ER 1.6(Vorschau)
Erweitertes Modell für logisches Denken, das physische Räume versteht und mehrstufige Aufgaben für Roboteragenten plant. Es bietet neue Funktionen wie das Lesen von Instrumenten und verbesserte räumliche und physikalische Schlussfolgerungen.
Vorherige Modelle
Gemini 2.0 Flash (eingestellt)
Unser Modell der zweiten Generation mit Funktionen der nächsten Generation und verbesserten Fähigkeiten, darunter eine höhere Geschwindigkeit, native Toolnutzung und ein Kontextfenster von 1 Million Tokens.
Gemini 2.0 Flash Lite (eingestellt)
Unser schnellstes Modell der zweiten Generation, optimiert für Kosteneffizienz und niedrige Latenz.
Gemini 3 Pro (Vorschau) – Herunterfahren
Unser hochmodernes Modell für logisches Denken mit erweitertem multimodalen Verständnis.
Namensmuster für Modellversionen
Gemini-Modelle sind in den Versionen stabil, Vorschau, neueste oder experimentell verfügbar.
Stabil
Verweist auf ein bestimmtes stabiles Modell. Stabile Modelle ändern sich in der Regel nicht. Die meisten Produktions-Apps sollten ein bestimmtes stabiles Modell verwenden.
Beispiel: gemini-2.5-flash.
Vorschau
Verweist auf ein Vorschau-Modell, das für die Produktion verwendet werden kann. Für Vorschau-Modelle ist in der Regel die Abrechnung aktiviert. Sie haben möglicherweise restriktivere Ratenlimits und werden mindestens zwei Wochen im Voraus eingestellt.
Beispiel: gemini-2.5-flash-preview-09-2025.
Neueste
Verweist auf die neueste Version für eine bestimmte Modellvariante. Dies kann eine stabile, Vorschau- oder experimentelle Version sein. Dieser Alias wird mit jeder Neuveröffentlichung einer bestimmten Modellvariante ausgetauscht. Sie werden zwei Wochen im Voraus per E-Mail benachrichtigt, bevor die Version hinter „Neueste“ geändert wird.
Beispiel: gemini-flash-latest.
Experimentell
Verweist auf ein experimentelles Modell, das in der Regel nicht für die Produktion geeignet ist und restriktivere Ratenlimits hat. Wir veröffentlichen experimentelle Modelle, um Feedback zu erhalten und Entwicklern schnell die neuesten Updates zur Verfügung zu stellen.
Experimentelle Modelle sind nicht stabil und die Verfügbarkeit von Modellendpunkten kann sich ändern.
Einstellung von Modellen
Informationen zur Einstellung von Modellen finden Sie auf der Seite zur Einstellung von Gemini.