Die Interactions API ist jetzt allgemein verfügbar. Wir empfehlen, diese API zu verwenden, um auf alle aktuellen Funktionen und Modelle zuzugreifen.

Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Modelle

Gemini 3

Stabil

Gemini 3.5 Flash

Das intelligenteste Modell für nachhaltige Hochleistungs-KI bei Agent- und Coding-Aufgaben.

Stabil

Gemini 3.1 Flash Lite

Leistung auf Frontier-Niveau, die mit größeren Modellen mithalten kann, zu einem Bruchteil der Kosten.

Stabil

Nano Banana 2

Leistungsstarke, hocheffiziente Bildgenerierung und ‑bearbeitung, optimiert für Geschwindigkeit und Anwendungsfälle mit hohem Volumen.

Stabil

Nano Banana Lite

Extrem niedrige Latenz und kostengünstige Bildgenerierung und ‑bearbeitung, die für interaktive Anwendungsfälle mit hohem Volumen entwickelt wurden.

Stabil

Nano Banana Pro

Hochmoderne Modelle für die Bildgenerierung und ‑bearbeitung, mit denen kontextbezogene native Bilder erstellt werden können.

Stabil

Vorschau

Gemini 3.1. Pro

Fortschrittliche Intelligenz, Fähigkeiten zur Lösung komplexer Probleme und leistungsstarke Funktionen für die Programmierung von Agenten und Vibe Coding.

Vorschau

Gemini 3 Flash

Leistung auf Frontier-Niveau, die mit größeren Modellen mithalten kann, zu einem Bruchteil der Kosten.

Vorschau

Gemini 3.5 Live-Übersetzung

Modell für die Echtzeit-Sprachübersetzung mit geringer Latenz, das über 70 Sprachen unterstützt.

Neu: Vorschau

Gemini 3.1 Flash Live

Hochwertiges Live API-Modell mit niedriger Latenz für Echtzeitdialoge und KI-Anwendungen, die auf Sprache basieren.

Neu: Vorschau

Gemini 3.1 Flash TTS

Leistungsstarke Sprachgenerierung mit geringer Latenz.

Neu: Vorschau

Gemini Omni Flash

Schnelles, konversationelles Generieren und Bearbeiten von Videos. Sie können Text und Bilder in Videos umwandeln und die Ergebnisse mithilfe natürlicher Sprache optimieren.

Neu: Vorschau

Gemini 2.5 Flash

Unser bestes Preis-Leistungs-Modell für latenzarme Aufgaben mit hohem Volumen, die Reasoning erfordern.

Nano Banana

Hochmoderne native Bildgenerierung und ‑bearbeitung für schnelle, kreative Workflows.

Gemini 2.5 Flash Live Vorschau

Optimiert für Konversationsagenten in Echtzeit mit nativem Audio-Streaming in weniger als einer Sekunde.

Gemini 2.5 Flash TTS Vorschau

Steuerbare Text-zu-Sprache-Audio-Generierung mit präziser Steuerung von Stil und Tempo.

Gemini 2.5 Flash-Lite

Das schnellste und kostengünstigste multimodale Modell der 2.5-Familie.

Gemini 2.5 Pro

Unser fortschrittlichstes Modell für komplexe Aufgaben mit tiefgehendem logischen Denken und Programmierfunktionen.

Gemini 2.5 Pro TTS Vorschau

Sprachsynthese mit hoher Wiedergabetreue, die für Qualität in strukturierten Workflows wie Podcasts und Hörbüchern optimiert ist.

Audiomodelle

Dieser Abschnitt enthält alle Audiomodelle, auch solche, die möglicherweise bereits in anderen Abschnitten aufgeführt sind.

Gemini 3.1 Flash Live Vorabversion

Unser hochwertiges Audio-zu-Audio-Modell (A2A) mit geringer Latenz wurde für Echtzeitdialoge und KI-Anwendungen mit Sprachsteuerung entwickelt.

Gemini 3.1 Flash TTS Vorabversion

Leistungsstarke Sprachgenerierung mit geringer Latenz, natürlichen Ausgaben, steuerbaren Prompts und neuen ausdrucksstarken Audio-Tags für eine präzise Steuerung der Sprachausgabe.

Gemini 2.5 Flash Live Vorschau

Unser Flaggschiff-Live API-Modell für bidirektionale Sprach- und Videoagenten mit niedriger Latenz und nativer Audioanalyse.

Gemini 2.5 Flash TTS Vorschau

Schnelle und steuerbare Sprachsynthese für kostengünstige Anwendungen mit geringer Latenz und Echtzeit-Assistenten.

Gemini 2.5 Pro TTS Vorschau

Sprachsynthese mit hoher Wiedergabetreue, die für Qualität in strukturierten Workflows wie Podcasts und Hörbüchern optimiert ist.

Generative Medienmodelle

Dieser Abschnitt enthält alle generativen Media-Modelle, auch solche, die möglicherweise bereits in anderen Abschnitten aufgeführt sind.

Nano Banana 2

Hocheffiziente visuelle Inhalte im Produktionsmaßstab erstellen, indem die Intelligenz der Gemini 3-Serie mit blitzschnellen Generierungsgeschwindigkeiten kombiniert wird.

Nano Banana Lite

Dieses Modell wurde als Effizienzspezialist der Bildgenerierungsfamilie entwickelt und bietet eine extrem niedrige Latenz sowie eine kostengünstige Bildgenerierung und ‑bearbeitung.

Veo 3.1 Vorschau

Hochmoderne filmische Videogenerierung mit erweiterten kreativen Steuerungselementen und nativ synchronisiertem Audio.

Nano Banana Pro

Eine professionelle Design-Engine mit einem Reasoning-Kern für 4K-Visuals in Studioqualität, komplexe Layouts und präzises Rendern von Text.

Veo 3.1 Lite Vorschau

Hocheffiziente, kostengünstige Videogenerierung, ‑bearbeitung und filmreife Steuerung für Entwickler aus der Veo 3.1-Familie.

Gemini Omni Flash Vorabversion

Schnelles, konversationelles Generieren und Bearbeiten von Videos. Sie können Text und Bilder in Videos umwandeln und die Ergebnisse mithilfe natürlicher Sprache optimieren.

Nano Banana

Hochmoderne native Bildgenerierung und ‑bearbeitung für schnelle, kreative Workflows.

Imagen 4 Nicht mehr verfügbar

Text-zu-Bild-Modell, das sich durch schnelle und ultraschnelle Generierung und außergewöhnliche Klarheit bei einer Auflösung von bis zu 2K auszeichnet.

Modelle zur Musikgenerierung

Dieser Abschnitt enthält alle Modelle zur Musikgenerierung, auch solche, die möglicherweise bereits in anderen Abschnitten aufgeführt sind.

Lyria 3 Pro Vorschau

Unser Flagship-Modell für die Musikgenerierung, optimiert für Songs in voller Länge mit komplexer struktureller Kohärenz.

Lyria 3 Clip Vorschau

Optimiert für die Erstellung kurzer Musikclips, Loops und Vorschauen von bis zu 30 Sekunden.

Lyria RealTime Experimentell

Modell zur Musikgenerierung mit hoher Qualität, das eine detaillierte kreative Kontrolle und Echtzeit-Streaming ermöglicht.

Tool- und Agent-Modelle

Computer Use Preview

Ein spezialisiertes Modell, das einen digitalen Bildschirm „sehen“ und Benutzeroberflächenaktionen wie Klicken, Tippen und Navigieren ausführen kann, um komplexe Browseraufgaben zu automatisieren.

Gemini Deep Research (Vorabversion)

Ein agentisches Modell, das autonom mehrstufige Recherchen in Hunderten von Quellen plant und ausführt, um zitierte, interaktive Berichte zu erstellen.

Gemini Deep Research Max Vorschau

Maximale Vollständigkeit für die automatische Kontextbeschaffung und ‑synthese aus Hunderten von Quellen.

Antigravity-Agent Vorschau

Ein Agent für allgemeine Zwecke, der autonom plant, Schlussfolgerungen zieht, Code ausführt, Dateien verwaltet und das Web in einer sicheren, isolierten Linux-Sandbox durchsucht.

Spezialisierte Aufgabenmodelle

Unser erstes multimodales Einbettungsmodell, das Text, Bilder, Videos, Audio und PDFs in einen einheitlichen Einbettungsbereich für erweiterte semantische Such- und RAG-Systeme (Retrieval-Augmented Generation) umwandelt.

Gemini Embedding

Hochdimensionale Vektordarstellungen für erweiterte semantische Suche, Textklassifizierung und RAG-Systeme.

Gemini Robotics-ER 1.6Vorschau

Ein fortschrittliches Modell für die verkörperte Problemlösung, das physische Räume versteht und mehrstufige Aufgaben für Roboter-Agents plant. Es bietet neue Funktionen wie das Ablesen von Instrumenten sowie eine verbesserte räumliche und physische Problemlösung.

Vorherige Modelle

Gemini 2.0 Flash wird eingestellt

Unser Modell der zweiten Generation für den täglichen Einsatz mit Funktionen der nächsten Generation und verbesserten Möglichkeiten, darunter eine höhere Geschwindigkeit, die native Nutzung von Tools und ein Kontextfenster von 1 Million Tokens.

Gemini 2.0 Flash-Lite wird heruntergefahren

Unser schnellstes Modell der zweiten Generation, optimiert für Kosteneffizienz und niedrige Latenz.

Gemini 3.1 Flash-Lite (Vorabversion) Herunterfahren

Unser kostengünstigstes multimodales Modell, das die schnellste Leistung für hochfrequente, einfache Aufgaben bietet.

Gemini 3 Pro (Vorabversion) Herunterfahren

Unser fortschrittlichstes Logikmodell mit erweitertem multimodalen Verständnis.

Namensmuster für Modellversionen

Gemini-Modelle sind in den Versionen stabil, Vorschau, aktuell oder experimentell verfügbar.

Stabil

Verweist auf ein bestimmtes stabiles Modell. Stabile Modelle ändern sich in der Regel nicht. Die meisten Produktions-Apps sollten ein bestimmtes stabiles Modell verwenden.

Beispiel: gemini-3.5-flash.

Vorschau

Verweist auf ein Vorschaumodell, das für die Produktion verwendet werden kann. Bei Vorschau-Modellen ist die Abrechnung in der Regel aktiviert. Sie haben möglicherweise restriktivere Ratenlimits und werden mit einer Vorlaufzeit von mindestens zwei Wochen eingestellt.

Beispiel: gemini-2.5-flash-preview-09-2025.

Neueste

Verweist auf den neuesten Release für eine bestimmte Modellvariante. Das kann ein stabiles Release, ein Preview-Release oder ein experimentelles Release sein. Dieser Alias wird bei jeder neuen Version einer bestimmten Modellvariante ausgetauscht. Zwei Wochen vor der Änderung der Version, die nicht mehr die aktuelle ist, werden Sie per E-Mail benachrichtigt.

Beispiel: gemini-flash-latest.

Experimentell

Verweist auf ein experimentelles Modell, das in der Regel nicht für die Produktion geeignet ist und restriktivere Ratenlimits hat. Wir veröffentlichen experimentelle Modelle, um Feedback zu sammeln und Entwicklern unsere neuesten Updates schnell zur Verfügung zu stellen.

Experimentelle Modelle sind nicht stabil und die Verfügbarkeit von Modellendpunkten kann sich ändern.

Einstellung von Modellen

Informationen zur Einstellung von Modellen finden Sie auf der Seite Einstellung von Gemini-Modellen.