Modelle


Gemini 3

Stabil

Vorschau


Gemini 2.5 Flash

Gemini 2.5 Flash

Unser bestes Preis-Leistungs-Modell für latenzarme Aufgaben mit hohem Volumen, die Reasoning erfordern.

Nano Banana

Hochmoderne native Bildgenerierung und ‑bearbeitung für schnelle, kreative Workflows.

Gemini 2.5 Flash Live Vorschau

Optimiert für Konversationsagenten in Echtzeit mit nativem Audio-Streaming in weniger als einer Sekunde.

Gemini 2.5 Flash TTS Vorschau

Steuerbare Text-zu-Sprache-Audio-Generierung mit präziser Steuerung von Stil und Tempo.


Gemini 2.5 Flash-Lite

Gemini 2.5 Flash-Lite

Das schnellste und kostengünstigste multimodale Modell der 2.5-Familie.


Gemini 2.5 Pro

Gemini 2.5 Pro

Unser fortschrittlichstes Modell für komplexe Aufgaben mit tiefgehendem logischen Denken und Programmierfunktionen.

Gemini 2.5 Pro TTS Vorschau

Sprachsynthese mit hoher Wiedergabetreue, die für Qualität in strukturierten Workflows wie Podcasts und Hörbüchern optimiert ist.


Audiomodelle

Dieser Abschnitt enthält alle Audiomodelle, auch solche, die möglicherweise bereits in anderen Abschnitten aufgeführt sind.

Gemini 3.1 Flash Live Vorabversion

Unser hochwertiges Audio-zu-Audio-Modell (A2A) mit geringer Latenz wurde für Echtzeitdialoge und KI-Anwendungen mit Sprachsteuerung entwickelt.

Gemini 3.1 Flash TTS Vorabversion

Leistungsstarke Sprachgenerierung mit geringer Latenz, natürlichen Ausgaben, steuerbaren Prompts und neuen ausdrucksstarken Audio-Tags für eine präzise Steuerung der Sprachausgabe.

Gemini 2.5 Flash Live Vorschau

Unser Flaggschiff-Live API-Modell für bidirektionale Sprach- und Videoagenten mit niedriger Latenz und nativer Audioanalyse.

Gemini 2.5 Flash TTS Vorschau

Schnelle und steuerbare Sprachsynthese für kostengünstige Anwendungen mit geringer Latenz und Echtzeit-Assistenten.

Gemini 2.5 Pro TTS Vorschau

Sprachsynthese mit hoher Wiedergabetreue, die für Qualität in strukturierten Workflows wie Podcasts und Hörbüchern optimiert ist.


Generative Medienmodelle

Dieser Abschnitt enthält alle generativen Media-Modelle, auch solche, die möglicherweise bereits in anderen Abschnitten aufgeführt sind.

Nano Banana 2

Hocheffiziente visuelle Inhalte im Produktionsmaßstab erstellen, indem die Intelligenz der Gemini 3-Serie mit blitzschnellen Generierungsgeschwindigkeiten kombiniert wird.

Nano Banana Lite

Dieses Modell wurde als Effizienzspezialist der Bildgenerierungsfamilie entwickelt und bietet eine extrem niedrige Latenz sowie eine kostengünstige Bildgenerierung und ‑bearbeitung.

Veo 3.1 Vorschau

Hochmoderne filmische Videogenerierung mit erweiterten kreativen Steuerungselementen und nativ synchronisiertem Audio.

Nano Banana Pro

Eine professionelle Design-Engine mit einem Reasoning-Kern für 4K-Visuals in Studioqualität, komplexe Layouts und präzises Rendern von Text.

Veo 3.1 Lite Vorschau

Hocheffiziente, kostengünstige Videogenerierung, ‑bearbeitung und filmreife Steuerung für Entwickler aus der Veo 3.1-Familie.

Gemini Omni Flash Vorabversion

Schnelles, konversationelles Generieren und Bearbeiten von Videos. Sie können Text und Bilder in Videos umwandeln und die Ergebnisse mithilfe natürlicher Sprache optimieren.

Nano Banana

Hochmoderne native Bildgenerierung und ‑bearbeitung für schnelle, kreative Workflows.

Imagen 4 Nicht mehr verfügbar

Text-zu-Bild-Modell, das sich durch schnelle und ultraschnelle Generierung und außergewöhnliche Klarheit bei einer Auflösung von bis zu 2K auszeichnet.


Modelle zur Musikgenerierung

Dieser Abschnitt enthält alle Modelle zur Musikgenerierung, auch solche, die möglicherweise bereits in anderen Abschnitten aufgeführt sind.

Lyria 3 Pro Vorschau

Unser Flagship-Modell für die Musikgenerierung, optimiert für Songs in voller Länge mit komplexer struktureller Kohärenz.

Lyria 3 Clip Vorschau

Optimiert für die Erstellung kurzer Musikclips, Loops und Vorschauen von bis zu 30 Sekunden.

Lyria RealTime Experimentell

Modell zur Musikgenerierung mit hoher Qualität, das eine detaillierte kreative Kontrolle und Echtzeit-Streaming ermöglicht.


Tool- und Agent-Modelle

Computer Use Preview

Ein spezialisiertes Modell, das einen digitalen Bildschirm „sehen“ und Benutzeroberflächenaktionen wie Klicken, Tippen und Navigieren ausführen kann, um komplexe Browseraufgaben zu automatisieren.

Gemini Deep Research (Vorabversion)

Ein agentisches Modell, das autonom mehrstufige Recherchen in Hunderten von Quellen plant und ausführt, um zitierte, interaktive Berichte zu erstellen.

Gemini Deep Research Max Vorschau

Maximale Vollständigkeit für die automatische Kontextbeschaffung und ‑synthese aus Hunderten von Quellen.

Antigravity-Agent Vorschau

Ein Agent für allgemeine Zwecke, der autonom plant, Schlussfolgerungen zieht, Code ausführt, Dateien verwaltet und das Web in einer sicheren, isolierten Linux-Sandbox durchsucht.


Spezialisierte Aufgabenmodelle

Gemini Embedding 2

Unser erstes multimodales Einbettungsmodell, das Text, Bilder, Videos, Audio und PDFs in einen einheitlichen Einbettungsbereich für erweiterte semantische Such- und RAG-Systeme (Retrieval-Augmented Generation) umwandelt.

Gemini Embedding

Hochdimensionale Vektordarstellungen für erweiterte semantische Suche, Textklassifizierung und RAG-Systeme.

Gemini Robotics-ER 1.6Vorschau

Ein fortschrittliches Modell für die verkörperte Problemlösung, das physische Räume versteht und mehrstufige Aufgaben für Roboter-Agents plant. Es bietet neue Funktionen wie das Ablesen von Instrumenten sowie eine verbesserte räumliche und physische Problemlösung.


Vorherige Modelle

Gemini 2.0 Flash wird eingestellt

Unser Modell der zweiten Generation für den täglichen Einsatz mit Funktionen der nächsten Generation und verbesserten Möglichkeiten, darunter eine höhere Geschwindigkeit, die native Nutzung von Tools und ein Kontextfenster von 1 Million Tokens.

Gemini 2.0 Flash-Lite wird heruntergefahren

Unser schnellstes Modell der zweiten Generation, optimiert für Kosteneffizienz und niedrige Latenz.

Gemini 3.1 Flash-Lite (Vorabversion) Herunterfahren

Unser kostengünstigstes multimodales Modell, das die schnellste Leistung für hochfrequente, einfache Aufgaben bietet.

Gemini 3 Pro (Vorabversion) Herunterfahren

Unser fortschrittlichstes Logikmodell mit erweitertem multimodalen Verständnis.


Namensmuster für Modellversionen

Gemini-Modelle sind in den Versionen stabil, Vorschau, aktuell oder experimentell verfügbar.

Stabil

Verweist auf ein bestimmtes stabiles Modell. Stabile Modelle ändern sich in der Regel nicht. Die meisten Produktions-Apps sollten ein bestimmtes stabiles Modell verwenden.

Beispiel: gemini-3.5-flash.

Vorschau

Verweist auf ein Vorschaumodell, das für die Produktion verwendet werden kann. Bei Vorschau-Modellen ist die Abrechnung in der Regel aktiviert. Sie haben möglicherweise restriktivere Ratenlimits und werden mit einer Vorlaufzeit von mindestens zwei Wochen eingestellt.

Beispiel: gemini-2.5-flash-preview-09-2025.

Neueste

Verweist auf den neuesten Release für eine bestimmte Modellvariante. Das kann ein stabiles Release, ein Preview-Release oder ein experimentelles Release sein. Dieser Alias wird bei jeder neuen Version einer bestimmten Modellvariante ausgetauscht. Zwei Wochen vor der Änderung der Version, die nicht mehr die aktuelle ist, werden Sie per E-Mail benachrichtigt.

Beispiel: gemini-flash-latest.

Experimentell

Verweist auf ein experimentelles Modell, das in der Regel nicht für die Produktion geeignet ist und restriktivere Ratenlimits hat. Wir veröffentlichen experimentelle Modelle, um Feedback zu sammeln und Entwicklern unsere neuesten Updates schnell zur Verfügung zu stellen.

Experimentelle Modelle sind nicht stabil und die Verfügbarkeit von Modellendpunkten kann sich ändern.

Einstellung von Modellen

Informationen zur Einstellung von Modellen finden Sie auf der Seite Einstellung von Gemini-Modellen.