Gemini-Modelle

Modellvarianten

Die Gemini API bietet verschiedene Modelle, die für bestimmte Anwendungsfälle optimiert sind. Hier eine kurze Übersicht über die verfügbaren Gemini-Varianten:

Modellvariante Eingaben Ausgabe Optimiert für
Gemini 2.0 Flash
gemini-2.0-flash
Audio, Bilder, Videos und Text Text, Bilder (experimentell) und Audio (demnächst) Funktionen, Geschwindigkeit, Denken, Echtzeitstreaming und multimodale Generation der nächsten Generation
Gemini 2.0 Flash-Lite
gemini-2.0-flash-lite
Audio, Bilder, Videos und Text Text Ein Gemini 2.0 Flash-Modell, das für Kosteneffizienz und niedrige Latenz optimiert ist
Gemini 2.0 Pro Experimental
gemini-2.0-pro-exp-02-05
Audio, Bilder, Videos und Text Text Unser leistungsstärkstes Gemini 2.0-Modell
Gemini 1.5 Flash
gemini-1.5-flash
Audio, Bilder, Videos und Text Text Schnelle und vielseitige Leistung für eine Vielzahl von Aufgaben
Gemini 1.5 Flash-8B
gemini-1.5-flash-8b
Audio, Bilder, Videos und Text Text Aufgaben mit hohem Volumen und geringer Intelligenz
Gemini 1.5 Pro
gemini-1.5-pro
Audio, Bilder, Videos und Text Text Komplexe Denkaufgaben, die mehr Intelligenz erfordern
Gemini-Einbettung
gemini-embedding-exp
Text Texteinbettungen Verwandtschaft von Textstrings messen
Imagen 3
imagen-3.0-generate-002
Text Bilder Unser bisher fortschrittlichstes Modell zur Bildgenerierung

Die Ratenlimits für jedes Modell finden Sie auf der Seite mit den Ratenlimits.

Gemini 2.0 Flash bietet Funktionen der nächsten Generation und verbesserte Funktionen, darunter eine höhere Geschwindigkeit, die Nutzung nativer Tools, die multimodale Generierung und ein Kontextfenster von 1 Million Tokens.

In Google AI Studio ausprobieren

Modelldetails

Attribut Beschreibung
: Modellcode models/gemini-2.0-flash
 – unterstützte Datentypen

Eingaben

Audio, Bilder, Video und Text

Ausgabe

Text, Bilder (experimentell) und Audio(demnächst)

Token limits[*]

Eingabetoken-Limit

1.048.576

Tokenausgabelimit

8.192

-Funktionen

Strukturierte Ausgaben

Unterstützt

Caching

Demnächst verfügbar

Abstimmung

Nicht unterstützt

Funktionsaufrufe

Unterstützt

Codeausführung

Unterstützt

Suche

Unterstützt

Bildgenerierung

Experimentell

Nutzung nativer Tools

Unterstützt

Audiogenerierung

Demnächst verfügbar

Multimodal Live API

Experimentell

Denken

Experimentell

-Versionen
Weitere Informationen finden Sie in den Mustern für Modellversionen.
  • Neueste: gemini-2.0-flash
  • Stabil: gemini-2.0-flash-001
  • Experimentell: gemini-2.0-flash-exp
  • Experimentell: gemini-2.0-flash-thinking-exp-01-21
Letzte Aktualisierung Februar 2025
 – Wissensgrenzwert August 2024

Gemini 2.0 Pro ist unser leistungsstärkstes Gemini-Modell der zweiten Generation. Es bietet eine leistungsstarke Argumentation, die native Nutzung von Tools und ein Kontextfenster von 2 Millionen Tokens.

In Google AI Studio ausprobieren

Modelldetails

Attribut Beschreibung
: Modellcode gemini-2.0-pro-exp-02-05
 – unterstützte Datentypen

Eingaben

Audio, Bilder, Video und Text

Ausgabe

Text

Token limits[*]

Eingabetoken-Limit

2.048.576

Tokenausgabelimit

8.192

-Funktionen

Strukturierte Ausgaben

Unterstützt

Caching

Nicht unterstützt

Abstimmung

Nicht unterstützt

Funktionsaufrufe

Unterstützt

Codeausführung

Unterstützt

Suche

Unterstützt

Bildgenerierung

Nicht unterstützt

Nutzung nativer Tools

Unterstützt

Audiogenerierung

Nicht unterstützt

Multimodal Live API

Nicht unterstützt

-Versionen
Weitere Informationen finden Sie in den Mustern für Modellversionen.
  • Experimentell: gemini-2.0-pro-exp-02-05
  • Experimentell: gemini-2.0-pro-exp
Letzte Aktualisierung Februar 2025
 – Wissensgrenzwert August 2024

Ein Gemini 2.0 Flash-Modell, das für Kosteneffizienz und niedrige Latenz optimiert ist.

In Google AI Studio ausprobieren

Modelldetails

Attribut Beschreibung
: Modellcode models/gemini-2.0-flash-lite
 – unterstützte Datentypen

Eingaben

Audio, Bilder, Video und Text

Ausgabe

Text

Token limits[*]

Eingabetoken-Limit

1.048.576

Tokenausgabelimit

8.192

-Funktionen

Strukturierte Ausgaben

Unterstützt

Caching

Nicht unterstützt

Abstimmung

Nicht unterstützt

Funktionsaufrufe

Nicht unterstützt

Codeausführung

Nicht unterstützt

Suche

Nicht unterstützt

Bildgenerierung

Nicht unterstützt

Nutzung nativer Tools

Nicht unterstützt

Audiogenerierung

Nicht unterstützt

Multimodal Live API

Nicht unterstützt

-Versionen
Weitere Informationen finden Sie in den Mustern für Modellversionen.
  • Neueste: gemini-2.0-flash-lite
  • Stabil: gemini-2.0-flash-lite-001
Letzte Aktualisierung Februar 2025
 – Wissensgrenzwert August 2024

Gemini 1.5 Flash ist ein schnelles und vielseitiges multimodales Modell, das für eine Vielzahl von Aufgaben skaliert werden kann.

In Google AI Studio ausprobieren

Modelldetails

Attribut Beschreibung
: Modellcode models/gemini-1.5-flash
 – unterstützte Datentypen

Eingaben

Audio, Bilder, Video und Text

Ausgabe

Text

Token limits[*]

Eingabetoken-Limit

1.048.576

Tokenausgabelimit

8.192

Audio-/visuelle Spezifikationen

Maximale Anzahl von Bildern pro Prompt

3.600

Maximale Videolänge

1 Stunde

Maximale Audiolänge

Ungefähr 9,5 Stunden

-Funktionen

Systemanweisungen

Unterstützt

JSON-Modus

Unterstützt

JSON-Schema

Unterstützt

Anpassbare Sicherheitseinstellungen

Unterstützt

Caching

Unterstützt

Abstimmung

Unterstützt

Funktionsaufrufe

Unterstützt

Codeausführung

Unterstützt

Bidirektionales Streaming

Nicht unterstützt

-Versionen
Weitere Informationen finden Sie in den Mustern für Modellversionen.
  • Neueste: gemini-1.5-flash-latest
  • Neueste stabile Version: gemini-1.5-flash
  • Stabil:
    • gemini-1.5-flash-001
    • gemini-1.5-flash-002
Letzte Aktualisierung September 2024

Gemini 1.5 Flash-8B ist ein kleines Modell, das für Aufgaben mit geringerer Intelligenz entwickelt wurde.

In Google AI Studio ausprobieren

Modelldetails

Attribut Beschreibung
: Modellcode models/gemini-1.5-flash-8b
 – unterstützte Datentypen

Eingaben

Audio, Bilder, Video und Text

Ausgabe

Text

Token limits[*]

Eingabetoken-Limit

1.048.576

Tokenausgabelimit

8.192

Audio-/visuelle Spezifikationen

Maximale Anzahl von Bildern pro Prompt

3.600

Maximale Videolänge

1 Stunde

Maximale Audiolänge

Ungefähr 9,5 Stunden

-Funktionen

Systemanweisungen

Unterstützt

JSON-Modus

Unterstützt

JSON-Schema

Unterstützt

Anpassbare Sicherheitseinstellungen

Unterstützt

Caching

Unterstützt

Abstimmung

Unterstützt

Funktionsaufrufe

Unterstützt

Codeausführung

Unterstützt

Bidirektionales Streaming

Nicht unterstützt

-Versionen
Weitere Informationen finden Sie in den Mustern für Modellversionen.
  • Neueste: gemini-1.5-flash-8b-latest
  • Neueste stabile Version: gemini-1.5-flash-8b
  • Stabil:
    • gemini-1.5-flash-8b-001
Letzte Aktualisierung Oktober 2024

Testen Sie Gemini 2.0 Pro Experimental, unser bisher fortschrittlichstes Gemini-Modell.

Gemini 1.5 Pro ist ein mittelgroßes multimodales Modell, das für eine Vielzahl von Inferenzaufgaben optimiert ist. 1.5 Pro kann große Datenmengen gleichzeitig verarbeiten, darunter 2 Stunden Video, 19 Stunden Audio, Codebasen mit 60.000 Codezeilen oder 2.000 Textseiten.

In Google AI Studio ausprobieren

Modelldetails

Attribut Beschreibung
: Modellcode models/gemini-1.5-pro
 – unterstützte Datentypen

Eingaben

Audio, Bilder, Video und Text

Ausgabe

Text

Token limits[*]

Eingabetoken-Limit

2.097.152

Tokenausgabelimit

8.192

Audio-/visuelle Spezifikationen

Maximale Anzahl von Bildern pro Prompt

7.200

Maximale Videolänge

2 Stunden

Maximale Audiolänge

Etwa 19 Stunden

-Funktionen

Systemanweisungen

Unterstützt

JSON-Modus

Unterstützt

JSON-Schema

Unterstützt

Anpassbare Sicherheitseinstellungen

Unterstützt

Caching

Unterstützt

Abstimmung

Nicht unterstützt

Funktionsaufrufe

Unterstützt

Codeausführung

Unterstützt

Bidirektionales Streaming

Nicht unterstützt

-Versionen
Weitere Informationen finden Sie in den Mustern für Modellversionen.
  • Neueste: gemini-1.5-pro-latest
  • Neueste stabile Version: gemini-1.5-pro
  • Stabil:
    • gemini-1.5-pro-001
    • gemini-1.5-pro-002
Letzte Aktualisierung September 2024

Imagen 3 ist unser bisher bestes Text-zu-Bild-Modell. Es kann Bilder mit noch mehr Details, besserer Belichtung und weniger ablenkenden Artefakten als unsere bisherigen Modelle generieren.

Modelldetails
Attribut Beschreibung
: Modellcode

Gemini API

imagen-3.0-generate-002

 – unterstützte Datentypen

Eingabe

Text

Ausgabe

Bilder

Token limits[*]

Eingabetoken-Limit

Bilder ausgeben

Bis zu 4

Letzte Aktualisierung Februar 2025

Gemini embedding erreicht eine State-of-the-Art-Leistung in vielen wichtigen Dimensionen, darunter Code, Mehrsprachigkeit und Abruf.

Modelldetails
Attribut Beschreibung
: Modellcode

Gemini API

gemini-embedding-exp-03-07

 – unterstützte Datentypen

Eingabe

Text

Ausgabe

Texteinbettungen

Token limits[*]

Eingabetoken-Limit

8.192

Größe der Ausgabedimension

Elastisch, unterstützt: 3072, 1536 oder 768

Letzte Aktualisierung März 2025

Texteinbettung

Testen Sie unser neues experimentelles Gemini-Embedding-Modell, das eine Spitzenleistung erzielt.

Text-Embeddings werden verwendet, um die Ähnlichkeit von Strings zu messen. Sie werden in vielen KI-Anwendungen eingesetzt.

text-embedding-004 erzielt bei den standardmäßigen MTEB-Embedding-Benchmarks eine höhere Abrufleistung und übertrifft bestehende Modelle mit vergleichbaren Dimensionen.

Modelldetails
Attribut Beschreibung
: Modellcode

Gemini API

models/text-embedding-004

 – unterstützte Datentypen

Eingabe

Text

Ausgabe

Texteinbettungen

Token limits[*]

Eingabetoken-Limit

2.048

Größe der Ausgabedimension

768

-Taktrate[**] 1.500 Anfragen pro Minute
anpassbare Sicherheitseinstellungen Nicht unterstützt
Letzte Aktualisierung April 2024

Einbettung

Mit dem Einbettungsmodell können Sie Texteinbettungen für Eingabetext generieren.

Das Einbettungsmodell ist für die Erstellung von Einbettungen mit 768 Dimensionen für Texte mit bis zu 2.048 Tokens optimiert.

Details zum Einbettungsmodell
Attribut Beschreibung
: Modellcode models/embedding-001
 – unterstützte Datentypen

Eingabe

Text

Ausgabe

Texteinbettungen

Token limits[*]

Eingabetoken-Limit

2.048

Größe der Ausgabedimension

768

-Taktrate[**] 1.500 Anfragen pro Minute
anpassbare Sicherheitseinstellungen Nicht unterstützt
Letzte Aktualisierung Dezember 2023

Sie können das AQA-Modell verwenden, um Aufgaben im Zusammenhang mit der Attributionsbasierten Fragebeantwortung (Attributed Question-Answering, AQA) für ein Dokument, einen Korpus oder eine Reihe von Textpassagen auszuführen. Das AQA-Modell gibt Antworten auf Fragen zurück, die auf den bereitgestellten Quellen basieren, und schätzt die Wahrscheinlichkeit, dass eine Frage beantwortet werden kann.

Modelldetails

Attribut Beschreibung
: Modellcode models/aqa
 – unterstützte Datentypen

Eingabe

Text

Ausgabe

Text

Unterstützte Sprache Englisch
Token limits[*]

Eingabetoken-Limit

7.168

Tokenausgabelimit

1.024

-Taktrate[**] 1.500 Anfragen pro Minute
anpassbare Sicherheitseinstellungen Unterstützt
Letzte Aktualisierung Dezember 2023

In den Beispielen erfahren Sie mehr über die Möglichkeiten dieser Modellvarianten.

[*] Ein Token entspricht etwa 4 Zeichen bei Gemini-Modellen. 100 Tokens entsprechen etwa 60–80 englischen Wörtern.

Muster für Modellversionsnamen

Gemini-Modelle sind entweder als Vorabversion oder als stabile Version verfügbar. In Ihrem Code können Sie eines der folgenden Formate für Modellnamen verwenden, um anzugeben, welches Modell und welche Version Sie verwenden möchten.

  • Latest (Aktuell): Verweist auf die neueste Version des Modells für eine bestimmte Generation und Variante. Das zugrunde liegende Modell wird regelmäßig aktualisiert und kann eine Vorabversion sein. Dieser Alias sollte nur für explorative Tests von Apps und Prototypen verwendet werden.

    Verwenden Sie das folgende Muster, um die neueste Version anzugeben: <model>-<generation>-<variation>-latest. Beispiel: gemini-1.0-pro-latest

  • Latest stable (Neueste stabile Version): Verweist auf die neueste stabile Version, die für die angegebene Modellgeneration und ‑variante veröffentlicht wurde.

    Verwenden Sie das folgende Muster, um die neueste stabile Version anzugeben: <model>-<generation>-<variation>. Beispiel: gemini-1.0-pro.

  • Stabil:Verweist auf ein bestimmtes stabiles Modell. Stabile Modelle ändern sich in der Regel nicht. Die meisten Produktions-Apps sollten ein bestimmtes stabiles Modell verwenden.

    Verwenden Sie das folgende Muster, um eine stabile Version anzugeben: <model>-<generation>-<variation>-<version>. Beispiel: gemini-1.0-pro-001

  • Experimentell:Verweist auf ein experimentelles Modell, das nicht für die Produktion verwendet werden darf. Wir veröffentlichen experimentelle Modelle, um Feedback zu erhalten, unsere neuesten Updates schnell an Entwickler weiterzugeben und das Tempo der Innovationen bei Google zu verdeutlichen.

    Verwenden Sie das folgende Muster, um eine experimentelle Version anzugeben: <model>-<generation>-<variation>-<version>. Beispiel: gemini-2.0-pro-exp-02-05

Experimentelle Modelle

Neben den für die Produktion geeigneten Modellen bietet die Gemini API experimentelle Modelle, die gemäß unseren Nutzungsbedingungen nicht für die Produktion verwendet werden dürfen.

Wir veröffentlichen experimentelle Modelle, um Feedback zu erhalten, Entwicklern schnell unsere neuesten Updates zur Verfügung zu stellen und das Tempo der Innovationen bei Google zu verdeutlichen. Die Erkenntnisse aus unseren experimentellen Releases fließen in die Art und Weise ein, wie wir Modelle für weitere Nutzersegmente veröffentlichen. Ein experimentelles Modell kann ohne vorherige Ankündigung durch ein anderes ersetzt werden. Wir können nicht garantieren, dass ein experimentelles Modell in Zukunft ein stabiles Modell wird.

Vorherige experimentelle Modelle

Sobald neue Versionen oder stabile Releases verfügbar sind, entfernen und ersetzen wir die experimentellen Modelle. Die vorherigen experimentellen Modelle, die wir veröffentlicht haben, finden Sie im folgenden Abschnitt zusammen mit der Ersatzversion:

Modellcode Basismodell Ersatzversion
gemini-2.0-flash-exp Gemini 2.0 Flash gemini-2.0-flash
gemini-exp-1206 Gemini 2.0 Pro gemini-2.0-pro-exp-02-05
gemini-2.0-flash-thinking-exp-1219 Gemini 2.0 Flash Thinking gemini-2.0-flash-thinking-exp-01-21
gemini-exp-1121 Gemini gemini-exp-1206
gemini-exp-1114 Gemini gemini-exp-1206
gemini-1.5-pro-exp-0827 Gemini 1.5 Pro, gemini-exp-1206
gemini-1.5-pro-exp-0801 Gemini 1.5 Pro, gemini-exp-1206
gemini-1.5-flash-8b-exp-0924 Gemini 1.5 Flash-8B gemini-1.5-flash-8b
gemini-1.5-flash-8b-exp-0827 Gemini 1.5 Flash-8B gemini-1.5-flash-8b

Unterstützte Sprachen

Gemini-Modelle sind für die folgenden Sprachen trainiert:

  • Arabisch (ar)
  • Bengalisch (bn)
  • Bulgarisch (bg)
  • Chinesisch, vereinfacht und traditionell (zh)
  • Kroatisch (hr)
  • Tschechisch (cs)
  • Dänisch (da)
  • Niederländisch (nl)
  • Englisch (en)
  • Estnisch (et)
  • Finnisch (fi)
  • Französisch (fr)
  • Deutsch (de)
  • Griechisch (el)
  • Hebräisch (iw)
  • Hindi (hi)
  • Ungarisch (hu)
  • Indonesisch (id)
  • Italienisch (it)
  • Japanisch (ja)
  • Koreanisch (ko)
  • Lettisch (lv)
  • Litauisch (lt)
  • Norwegisch (no)
  • Polnisch (pl)
  • Portugiesisch (pt)
  • Rumänisch (ro)
  • Russisch (ru)
  • Serbisch (sr)
  • Slowakisch (sk)
  • Slowenisch (sl)
  • Spanisch (es)
  • Swahili (sw)
  • Schwedisch (sv)
  • Thailändisch (th)
  • Türkisch (tr)
  • Ukrainisch (uk)
  • Vietnamesisch (vi)