Gemini-Modelle

Modellvarianten

Die Gemini API bietet verschiedene Modelle, die für bestimmte Anwendungsfälle optimiert sind. Hier eine kurze Übersicht über die verfügbaren Gemini-Varianten:

Modellvariante Eingaben Ausgabe Optimiert für
Gemini 2.5 Flash Preview 04-17
gemini-2.5-flash-preview-04-17
Audio, Bilder, Videos und Text Text Adaptives Denken, Kosteneffizienz
Gemini 2.5 Pro (Vorabversion)
gemini-2.5-pro-preview-03-25
Audio, Bilder, Videos und Text Text Verbessertes Denken und Schlussfolgern, multimodales Verständnis, erweitertes Programmieren und mehr
Gemini 2.0 Flash
gemini-2.0-flash
Audio, Bilder, Videos und Text Text, Bilder (experimentell) und Audio (demnächst) Funktionen, Geschwindigkeit, Denken, Echtzeitstreaming und multimodale Generation der nächsten Generation
Gemini 2.0 Flash-Lite
gemini-2.0-flash-lite
Audio, Bilder, Videos und Text Text Kosteneffizienz und geringe Latenz
Gemini 1.5 Flash
gemini-1.5-flash
Audio, Bilder, Videos und Text Text Schnelle und vielseitige Leistung für eine Vielzahl von Aufgaben
Gemini 1.5 Flash-8B
gemini-1.5-flash-8b
Audio, Bilder, Videos und Text Text Aufgaben mit hohem Volumen und geringer Intelligenz
Gemini 1.5 Pro
gemini-1.5-pro
Audio, Bilder, Videos und Text Text Komplexe Denkaufgaben, die mehr Intelligenz erfordern
Gemini-Einbettung
gemini-embedding-exp
Text Texteinbettungen Verwandtschaft von Textstrings messen
Imagen 3
imagen-3.0-generate-002
Text Bilder Unser bisher fortschrittlichstes Modell zur Bildgenerierung
Veo 2
veo-2.0-generate-001
Text, Bilder Video Videogenerierung in hoher Qualität
Gemini 2.0 Flash Live
gemini-2.0-flash-live-001
Audio, Video und Text Text, Audio Bidirektionale Sprach- und Videointeraktionen mit geringer Latenz

Die Ratenlimits für jedes Modell finden Sie auf der Seite mit den Ratenlimits.

Gemini 2.5 Flash Preview 04-17

Unser bestes Modell in Bezug auf Preis-Leistungs-Verhältnis mit umfassenden Funktionen. Die Ratenbegrenzungen für Gemini 2.5 Flash sind strenger, da es sich um ein experimentelles Modell handelt.

In Google AI Studio ausprobieren

Modelldetails

Attribut Beschreibung
: Modellcode models/gemini-2.5-flash-preview-04-17
 – unterstützte Datentypen

Eingaben

Text, Bilder, Video, Audio

Ausgabe

Text

Token limits[*]

Eingabetoken-Limit

1.048.576

Tokenausgabelimit

65.536

-Funktionen

Audiogenerierung

Nicht unterstützt

Caching

Nicht unterstützt

Codeausführung

Unterstützt

Funktionsaufrufe

Unterstützt

Bildgenerierung

Nicht unterstützt

Suche

Unterstützt

Strukturierte Ausgaben

Unterstützt

Denken

Unterstützt

Abstimmung

Nicht unterstützt

-Versionen
Weitere Informationen finden Sie in den Mustern für Modellversionen.
  • Vorschau für: gemini-2.5-flash-preview-04-17
Letzte Aktualisierung April 2025
: Wissensstichtag Januar 2025

Gemini 2.5 Pro (Vorabversion)

Gemini 2.5 Pro ist unser innovatives Thinking Model, das komplexe Probleme in den Bereichen Code, Mathematik und STEM lösen und große Datensätze, Codebasen und Dokumente mithilfe von Langformaten analysieren kann. Die Ratenbegrenzungen für Gemini 2.5 Pro sind strenger, da es sich um ein experimentelles Modell handelt.

In Google AI Studio ausprobieren

Modelldetails

Attribut Beschreibung
: Modellcode Kostenpflichtig: gemini-2.5-pro-preview-03-25, Experimentell: gemini-2.5-pro-exp-03-25
 – unterstützte Datentypen

Eingaben

Audio, Bilder, Video und Text

Ausgabe

Text

Token limits[*]

Eingabetoken-Limit

1.048.576

Tokenausgabelimit

65.536

-Funktionen

Strukturierte Ausgaben

Unterstützt

Caching

Unterstützt

Abstimmung

Nicht unterstützt

Funktionsaufrufe

Unterstützt

Codeausführung

Unterstützt

Erdung der Suche

Unterstützt

Bildgenerierung

Nicht unterstützt

Audiogenerierung

Nicht unterstützt

Live API

Nicht unterstützt

Denken

Unterstützt

-Versionen
Weitere Informationen finden Sie in den Mustern für Modellversionen.
  • Vorschau für: gemini-2.5-pro-preview-03-25
  • Experimentell: gemini-2.5-pro-exp-03-25
Letzte Aktualisierung März 2025
: Wissensstichtag Januar 2025

Gemini 2.0 Flash

Gemini 2.0 Flash bietet Funktionen der nächsten Generation und verbesserte Funktionen, darunter eine höhere Geschwindigkeit, die Nutzung nativer Tools, die multimodale Generierung und ein Kontextfenster von 1 Million Tokens.

In Google AI Studio ausprobieren

Modelldetails

Attribut Beschreibung
: Modellcode models/gemini-2.0-flash
 – unterstützte Datentypen

Eingaben

Audio, Bilder, Video und Text

Ausgabe

Text, Bilder (experimentell) und Audio(demnächst)

Token limits[*]

Eingabetoken-Limit

1.048.576

Tokenausgabelimit

8.192

-Funktionen

Strukturierte Ausgaben

Unterstützt

Caching

Unterstützt

Abstimmung

Nicht unterstützt

Funktionsaufrufe

Unterstützt

Codeausführung

Unterstützt

Suche

Unterstützt

Bildgenerierung

Experimentell

Audiogenerierung

Demnächst verfügbar

Live API

Unterstützt

Denken

Experimentell

-Versionen
Weitere Informationen finden Sie in den Mustern für Modellversionen.
  • Neueste: gemini-2.0-flash
  • Stabil: gemini-2.0-flash-001
  • Experimentell: gemini-2.0-flash-exp* und gemini-2.0-flash-exp-image-generation* verweisen auf dasselbe zugrunde liegende Modell
  • „gemini-2.0-flash-exp-image-generation“ wird derzeit in einigen Ländern in Europa, dem Nahen Osten und Afrika nicht unterstützt.

Letzte Aktualisierung Februar 2025
: Wissensstichtag August 2024

Gemini 2.0 Flash-Lite

Ein Gemini 2.0 Flash-Modell, das für Kosteneffizienz und niedrige Latenz optimiert ist.

In Google AI Studio ausprobieren

Modelldetails

Attribut Beschreibung
: Modellcode models/gemini-2.0-flash-lite
 – unterstützte Datentypen

Eingaben

Audio, Bilder, Video und Text

Ausgabe

Text

Token limits[*]

Eingabetoken-Limit

1.048.576

Tokenausgabelimit

8.192

-Funktionen

Strukturierte Ausgaben

Unterstützt

Caching

Unterstützt

Abstimmung

Nicht unterstützt

Funktionsaufrufe

Unterstützt

Codeausführung

Nicht unterstützt

Suche

Nicht unterstützt

Bildgenerierung

Nicht unterstützt

Audiogenerierung

Nicht unterstützt

Live API

Nicht unterstützt

-Versionen
Weitere Informationen finden Sie in den Mustern für Modellversionen.
  • Neueste: gemini-2.0-flash-lite
  • Stabil: gemini-2.0-flash-lite-001
Letzte Aktualisierung Februar 2025
: Wissensstichtag August 2024

Gemini 1.5 Flash

Gemini 1.5 Flash ist ein schnelles und vielseitiges multimodales Modell, das für eine Vielzahl von Aufgaben skaliert werden kann.

In Google AI Studio ausprobieren

Modelldetails

Attribut Beschreibung
: Modellcode models/gemini-1.5-flash
 – unterstützte Datentypen

Eingaben

Audio, Bilder, Video und Text

Ausgabe

Text

Token limits[*]

Eingabetoken-Limit

1.048.576

Tokenausgabelimit

8.192

Audio-/visuelle Spezifikationen

Maximale Anzahl von Bildern pro Prompt

3.600

Maximale Videolänge

1 Stunde

Maximale Audiolänge

Ungefähr 9,5 Stunden

-Funktionen

Systemanweisungen

Unterstützt

JSON-Modus

Unterstützt

JSON-Schema

Unterstützt

Anpassbare Sicherheitseinstellungen

Unterstützt

Caching

Unterstützt

Abstimmung

Unterstützt

Funktionsaufrufe

Unterstützt

Codeausführung

Unterstützt

Live API

Nicht unterstützt

-Versionen
Weitere Informationen finden Sie in den Mustern für Modellversionen.
  • Neueste: gemini-1.5-flash-latest
  • Neueste stabile Version: gemini-1.5-flash
  • Stabil:
    • gemini-1.5-flash-001
    • gemini-1.5-flash-002
Letzte Aktualisierung September 2024

Gemini 1.5 Flash-8B

Gemini 1.5 Flash-8B ist ein kleines Modell, das für Aufgaben mit geringerer Intelligenz entwickelt wurde.

In Google AI Studio ausprobieren

Modelldetails

Attribut Beschreibung
: Modellcode models/gemini-1.5-flash-8b
 – unterstützte Datentypen

Eingaben

Audio, Bilder, Video und Text

Ausgabe

Text

Token limits[*]

Eingabetoken-Limit

1.048.576

Tokenausgabelimit

8.192

Audio-/visuelle Spezifikationen

Maximale Anzahl von Bildern pro Prompt

3.600

Maximale Videolänge

1 Stunde

Maximale Audiolänge

Ungefähr 9,5 Stunden

-Funktionen

Systemanweisungen

Unterstützt

JSON-Modus

Unterstützt

JSON-Schema

Unterstützt

Anpassbare Sicherheitseinstellungen

Unterstützt

Caching

Unterstützt

Abstimmung

Unterstützt

Funktionsaufrufe

Unterstützt

Codeausführung

Unterstützt

Live API

Nicht unterstützt

-Versionen
Weitere Informationen finden Sie in den Mustern für Modellversionen.
  • Neueste: gemini-1.5-flash-8b-latest
  • Neueste stabile Version: gemini-1.5-flash-8b
  • Stabil:
    • gemini-1.5-flash-8b-001
Letzte Aktualisierung Oktober 2024

Gemini 1.5 Pro,

Testen Sie die Gemini 2.5 Pro-Vorabversion, unser bisher fortschrittlichstes Gemini-Modell.

Gemini 1.5 Pro ist ein mittelgroßes multimodales Modell, das für eine Vielzahl von Aufgaben zum Schlussfolgern optimiert ist. 1.5 Pro kann große Datenmengen gleichzeitig verarbeiten, darunter 2 Stunden Video, 19 Stunden Audio, Codebases mit 60.000 Codezeilen oder 2.000 Textseiten.

In Google AI Studio ausprobieren

Modelldetails

Attribut Beschreibung
: Modellcode models/gemini-1.5-pro
 – unterstützte Datentypen

Eingaben

Audio, Bilder, Video und Text

Ausgabe

Text

Token limits[*]

Eingabetoken-Limit

2.097.152

Tokenausgabelimit

8.192

Audio-/visuelle Spezifikationen

Maximale Anzahl von Bildern pro Prompt

7.200

Maximale Videolänge

2 Stunden

Maximale Audiolänge

Etwa 19 Stunden

-Funktionen

Systemanweisungen

Unterstützt

JSON-Modus

Unterstützt

JSON-Schema

Unterstützt

Anpassbare Sicherheitseinstellungen

Unterstützt

Caching

Unterstützt

Abstimmung

Nicht unterstützt

Funktionsaufrufe

Unterstützt

Codeausführung

Unterstützt

Live API

Nicht unterstützt

-Versionen
Weitere Informationen finden Sie in den Mustern für Modellversionen.
  • Neueste: gemini-1.5-pro-latest
  • Neueste stabile Version: gemini-1.5-pro
  • Stabil:
    • gemini-1.5-pro-001
    • gemini-1.5-pro-002
Letzte Aktualisierung September 2024

Imagen 3

Imagen 3 ist unser bisher bestes Text-zu-Bild-Modell. Es kann Bilder mit noch mehr Details, besserer Belichtung und weniger ablenkenden Artefakten als unsere bisherigen Modelle generieren.

Modelldetails
Attribut Beschreibung
: Modellcode

Gemini API

imagen-3.0-generate-002

 – unterstützte Datentypen

Eingabe

Text

Ausgabe

Bilder

Token limits[*]

Eingabetoken-Limit

Ausgabebilder

Bis zu 4

Letzte Aktualisierung Februar 2025

Veo 2

Veo 2 ist unser hochwertiges Text- und Bild-zu-Video-Modell, mit dem detaillierte Videos erstellt werden können, die die künstlerischen Nuancen Ihrer Prompts einfangen.

Modelldetails
Attribut Beschreibung
: Modellcode

Gemini API

veo-2.0-generate-001

 – unterstützte Datentypen

Eingabe

Text, Bild

Ausgabe

Video

 – Einschränkungen

Texteingabe

Bildeingabe

Beliebige Bildauflösung und beliebiges Seitenverhältnis, Dateigröße bis zu 20 MB

Videoausgabe

Bis zu 2

Letzte Aktualisierung April 2025

Gemini 2.0 Flash Live

Das Gemini 2.0 Flash Live-Modell funktioniert mit der Live API und ermöglicht bidirektionale Sprach- und Videointeraktionen mit Gemini bei niedriger Latenz. Das Modell kann Text-, Audio- und Videoeingaben verarbeiten und Text- und Audioausgaben liefern.

In Google AI Studio ausprobieren

Modelldetails

Attribut Beschreibung
: Modellcode models/gemini-2.0-flash-live-001
 – unterstützte Datentypen

Eingaben

Audio, Video und Text

Ausgabe

Text und Audio

Token limits[*]

Eingabetoken-Limit

1.048.576

Tokenausgabelimit

8.192

-Funktionen

Strukturierte Ausgaben

Unterstützt

Abstimmung

Nicht unterstützt

Funktionsaufrufe

Unterstützt

Codeausführung

Unterstützt

Suche

Unterstützt

Bildgenerierung

Nicht unterstützt

Audiogenerierung

Unterstützt

Denken

Nicht unterstützt

-Versionen
Weitere Informationen finden Sie in den Mustern für Modellversionen.
  • Vorschau für: gemini-2.0-flash-live-001
Letzte Aktualisierung April 2025
: Wissensstichtag August 2024

Gemini-Embedding (experimentell)

Gemini embedding erreicht eine State-of-the-Art-Leistung in vielen wichtigen Dimensionen, darunter Code, Mehrsprachigkeit und Abruf. Die Ratenlimits für Gemini-Embeddings sind strenger, da es sich um ein experimentelles Modell handelt.

Modelldetails
Attribut Beschreibung
: Modellcode

Gemini API

gemini-embedding-exp-03-07

 – unterstützte Datentypen

Eingabe

Text

Ausgabe

Texteinbettungen

Token limits[*]

Eingabetoken-Limit

8.192

Größe der Ausgabedimension

Elastisch, unterstützt: 3072, 1536 oder 768

Letzte Aktualisierung März 2025

Text- und Einbettung

Texteinbettung

Testen Sie unser neues experimentelles Gemini-Embedding-Modell, das eine Spitzenleistung erzielt.

Text-Embeddings werden verwendet, um die Ähnlichkeit von Strings zu messen. Sie werden in vielen KI-Anwendungen eingesetzt.

text-embedding-004 erzielt bei den standardmäßigen MTEB-Embedding-Benchmarks eine höhere Abrufleistung und übertrifft bestehende Modelle mit vergleichbaren Dimensionen.

Modelldetails
Attribut Beschreibung
: Modellcode

Gemini API

models/text-embedding-004

 – unterstützte Datentypen

Eingabe

Text

Ausgabe

Texteinbettungen

Token limits[*]

Eingabetoken-Limit

2.048

Größe der Ausgabedimension

768

 – Geschwindigkeitslimits[**] 1.500 Anfragen pro Minute
anpassbare Sicherheitseinstellungen Nicht unterstützt
Letzte Aktualisierung April 2024

Einbettung

Mit dem Einbettungsmodell können Sie Texteinbettungen für Eingabetext generieren.

Das Einbettungsmodell ist für die Erstellung von Einbettungen mit 768 Dimensionen für Texte mit bis zu 2.048 Tokens optimiert.

Details zum Einbettungsmodell
Attribut Beschreibung
: Modellcode models/embedding-001
 – unterstützte Datentypen

Eingabe

Text

Ausgabe

Texteinbettungen

Token limits[*]

Eingabetoken-Limit

2.048

Größe der Ausgabedimension

768

 – Geschwindigkeitslimits[**] 1.500 Anfragen pro Minute
anpassbare Sicherheitseinstellungen Nicht unterstützt
Letzte Aktualisierung Dezember 2023

AQA

Sie können das AQA-Modell verwenden, um Aufgaben im Zusammenhang mit der Attributionsbasierten Fragebeantwortung (Attributed Question-Answering, AQA) für ein Dokument, einen Korpus oder eine Reihe von Textpassagen auszuführen. Das AQA-Modell gibt Antworten auf Fragen zurück, die auf den bereitgestellten Quellen basieren, sowie eine Schätzung der Wahrscheinlichkeit, dass eine Antwort gefunden werden kann.

Modelldetails

Attribut Beschreibung
: Modellcode models/aqa
 – unterstützte Datentypen

Eingabe

Text

Ausgabe

Text

Unterstützte Sprache Englisch
Token limits[*]

Eingabetoken-Limit

7.168

Tokenausgabelimit

1.024

 – Geschwindigkeitslimits[**] 1.500 Anfragen pro Minute
anpassbare Sicherheitseinstellungen Unterstützt
Letzte Aktualisierung Dezember 2023

In den Beispielen erfahren Sie mehr über die Möglichkeiten dieser Modellvarianten.

[*] Ein Token entspricht etwa 4 Zeichen bei Gemini-Modellen. 100 Tokens entsprechen etwa 60–80 englischen Wörtern.

Muster für Modellversionsnamen

Gemini-Modelle sind als Vorabversion, stabile Version oder experimentelle Version verfügbar. In Ihrem Code können Sie eines der folgenden Formate für Modellnamen verwenden, um anzugeben, welches Modell und welche Version Sie verwenden möchten.

  • Latest stable (Neueste stabile Version): Verweist auf die neueste stabile Version, die für die angegebene Modellgeneration und ‑variante veröffentlicht wurde.

    Verwenden Sie das folgende Muster, um die neueste stabile Version anzugeben: <model>-<generation>-<variation>. Beispiel: gemini-2.0-flash.

  • Stabil:Verweist auf ein bestimmtes stabiles Modell. Stabile Modelle ändern sich in der Regel nicht. Die meisten Produktions-Apps sollten ein bestimmtes stabiles Modell verwenden.

    Verwenden Sie das folgende Muster, um eine stabile Version anzugeben: <model>-<generation>-<variation>-<version>. Beispiel: gemini-2.0-flash-001

  • Vorabversion:Verweist auf ein Vorabversionsmodell, das möglicherweise nicht für die Produktionsnutzung geeignet ist. Es hat strengere Preislimits, die Abrechnung ist aber möglicherweise aktiviert.

    Verwenden Sie für eine Vorabversion das folgende Muster: <model>-<generation>-<variation>-<version>. Beispiel: gemini-2.5-pro-preview-03-25

  • Experimentell:Hiermit wird auf ein experimentelles Modell verwiesen, das möglicherweise nicht für die Produktionsnutzung geeignet ist und strengere Ratenlimits aufweist. Wir veröffentlichen experimentelle Modelle, um Feedback zu erhalten und unsere neuesten Updates schnell an Entwickler weiterzugeben.

    Verwenden Sie das folgende Muster, um eine experimentelle Version anzugeben: <model>-<generation>-<variation>-<version>. Beispiel: gemini-2.0-pro-exp-02-05

Experimentelle Modelle

Neben stabilen Modellen bietet die Gemini API experimentelle Modelle, die möglicherweise nicht für die Produktionsnutzung geeignet sind und strengere Ratenbegrenzungen haben.

Wir veröffentlichen experimentelle Modelle, um Feedback zu erhalten, Entwicklern schnell unsere neuesten Updates zur Verfügung zu stellen und das Tempo der Innovationen bei Google zu verdeutlichen. Die Erkenntnisse aus unseren experimentellen Releases fließen in die Art und Weise ein, wie wir Modelle für weitere Nutzersegmente veröffentlichen. Ein experimentelles Modell kann ohne vorherige Ankündigung durch ein anderes ersetzt werden. Wir können nicht garantieren, dass ein experimentelles Modell in Zukunft ein stabiles Modell wird.

Vorherige experimentelle Modelle

Sobald neue Versionen oder stabile Releases verfügbar sind, entfernen und ersetzen wir experimentelle Modelle. Die vorherigen experimentellen Modelle, die wir veröffentlicht haben, finden Sie im folgenden Abschnitt zusammen mit der Ersatzversion:

Modellcode Basismodell Ersatzversion
gemini-2.0-flash-thinking-exp-01-21 Gemini 2.5 Flash gemini-2.5-flash-preview-04-17
gemini-2.0-pro-exp-02-05 Gemini 2.0 Pro Experimental gemini-2.5-pro-preview-03-25
gemini-2.0-flash-exp Gemini 2.0 Flash gemini-2.0-flash
gemini-exp-1206 Gemini 2.0 Pro gemini-2.0-pro-exp-02-05
gemini-2.0-flash-thinking-exp-1219 Gemini 2.0 Flash Thinking gemini-2.0-flash-thinking-exp-01-21
gemini-exp-1121 Gemini gemini-exp-1206
gemini-exp-1114 Gemini gemini-exp-1206
gemini-1.5-pro-exp-0827 Gemini 1.5 Pro, gemini-exp-1206
gemini-1.5-pro-exp-0801 Gemini 1.5 Pro, gemini-exp-1206
gemini-1.5-flash-8b-exp-0924 Gemini 1.5 Flash-8B gemini-1.5-flash-8b
gemini-1.5-flash-8b-exp-0827 Gemini 1.5 Flash-8B gemini-1.5-flash-8b

Unterstützte Sprachen

Gemini-Modelle sind für die folgenden Sprachen trainiert:

  • Arabisch (ar)
  • Bengalisch (bn)
  • Bulgarisch (bg)
  • Chinesisch, vereinfacht und traditionell (zh)
  • Kroatisch (hr)
  • Tschechisch (cs)
  • Dänisch (da)
  • Niederländisch (nl)
  • Englisch (en)
  • Estnisch (et)
  • Finnisch (fi)
  • Französisch (fr)
  • Deutsch (de)
  • Griechisch (el)
  • Hebräisch (iw)
  • Hindi (hi)
  • Ungarisch (hu)
  • Indonesisch (id)
  • Italienisch (it)
  • Japanisch (ja)
  • Koreanisch (ko)
  • Lettisch (lv)
  • Litauisch (lt)
  • Norwegisch (no)
  • Polnisch (pl)
  • Portugiesisch (pt)
  • Rumänisch (ro)
  • Russisch (ru)
  • Serbisch (sr)
  • Slowakisch (sk)
  • Slowenisch (sl)
  • Spanisch (es)
  • Swahili (sw)
  • Schwedisch (sv)
  • Thailändisch (th)
  • Türkisch (tr)
  • Ukrainisch (uk)
  • Vietnamesisch (vi)