Modellvarianten
Die Gemini API bietet verschiedene Modelle, die für bestimmte Anwendungsfälle optimiert sind Cases. Hier finden Sie einen kurzen Überblick über die verfügbaren Gemini-Varianten:
Modellvariante | Eingabe(n) | Ausgabe | Optimiert für |
---|---|---|---|
Gemini 1.5 Flash
gemini-1.5-flash |
Audio, Bilder, Videos und Text | Text | Schnelle und vielseitige Leistung bei einer Vielzahl von Aufgaben |
Gemini 1.5 Pro
gemini-1.5-pro |
Audio, Bilder, Videos und Text | Text | Komplexe Logikaufgaben wie Code- und Textgenerierung, Textbearbeitung, Problemlösung, Datenextraktion und -generierung |
Gemini 1.0 Pro
gemini-1.0-pro |
Text | Text | Aufgaben in natürlicher Sprache, mehrstufiger Text- und Codechat sowie Code Generation |
Texteinbettung
text-embedding-004 |
Text | Texteinbettungen | Die Verbundenheit von Textzeichenfolgen messen |
AQA
aqa |
Text | Text | Quellengestützte Antworten auf Fragen geben |
In der folgenden Tabelle werden die Attribute der Gemini-Modelle beschrieben, die: Modellvarianten gleich:
Attribut | Beschreibung |
---|---|
Trainingsdaten | Der Knowledge Grenzwert von Gemini findet im November 2023 statt. Das Wissen über Ereignisse nach diesem Zeitraum ist begrenzt. |
Unterstützte Sprachen | Verfügbare Sprachen |
Konfigurierbare Modellparameter |
|
Modellparameter ansehen Abschnitt des Leitfaden zu generativen Modellen finden Sie Informationen zu den einzelnen Parametern.
Gemini 1.5 Flash
Gemini 1.5 Flash ist ein schnelles und vielseitiges multimodales Modell für die Aufgaben zu organisieren.
Modelldetails
Attribut | Beschreibung |
---|---|
Modellcode | models/gemini-1.5-flash |
Unterstützte Datentypen |
Eingaben Audio, Bilder, Video und Text Ausgabe Text |
[*] | Token limits
Limit für Eingabetoken 1.048.576 Tokenausgabelimit 8.192 |
Audio/visuelle Spezifikationen |
Maximale Anzahl von Bildern pro Prompt 3.600 Maximale Videolänge 1 Stunde Maximale Audiolänge Etwa 9,5 Stunden |
[**] | Ratenbegrenzungen
<ph type="x-smartling-placeholder">
|
Capabilities |
Systemanweisungen Unterstützt JSON-Modus Unterstützt JSON-Schema Unterstützt Anpassbare Sicherheitseinstellungen Unterstützt Caching Unterstützt Feinabstimmung Unterstützt Funktionsaufrufe Unterstützt Konfiguration des Funktionsaufrufs Unterstützt Codeausführung Unterstützt |
Versionen |
|
Letzte Aktualisierung | Mai 2024 |
Gemini 1.5 Pro,
Gemini 1.5 Pro ist ein mittelgroßes multimodales Modell, das für eine breite Palette von Aufgaben des Schlussfolgerungen zu lösen. 1.5 Pro kann große Datenmengen verarbeiten einschließlich 2 Stunden Video, 19 Stunden Audio, Codebasen mit 60.000 Codezeilen oder 2.000 Seiten Text.
Modelldetails
Attribut | Beschreibung |
---|---|
Modellcode | models/gemini-1.5-pro |
Unterstützte Datentypen |
Eingaben Audio, Bilder, Video und Text Ausgabe Text |
[*] | Token limits
Limit für Eingabetoken 2.097.152 Tokenausgabelimit 8.192 |
Audio/visuelle Spezifikationen |
Maximale Anzahl von Bildern pro Prompt 7.200 Maximale Videolänge 2 Stunden Maximale Audiolänge Ca. 19 Stunden |
[**] | Ratenbegrenzungen
<ph type="x-smartling-placeholder">
|
Capabilities |
Systemanweisungen Unterstützt JSON-Modus Unterstützt JSON-Schema Unterstützt Anpassbare Sicherheitseinstellungen Unterstützt Caching Unterstützt Feinabstimmung Nicht unterstützt Funktionsaufrufe Unterstützt Konfiguration des Funktionsaufrufs Unterstützt Codeausführung Unterstützt |
Versionen |
|
Letzte Aktualisierung | Mai 2024 |
Gemini 1.0 Pro
Gemini 1.0 Pro ist ein NLP-Modell, das Aufgaben wie mehrsprachigen Text und und Codegenerierung.
Modelldetails
Attribut | Beschreibung |
---|---|
Modellcode | models/gemini-1.0-pro |
Unterstützte Datentypen |
Eingabe Text Ausgabe Text |
[**] | Ratenbegrenzungen
<ph type="x-smartling-placeholder">
|
Capabilities |
Systemanweisungen Nicht unterstützt JSON-Modus Nicht unterstützt JSON-Schema Nicht unterstützt Anpassbare Sicherheitseinstellungen Unterstützt Caching Nicht unterstützt Feinabstimmung Unterstützt Funktionsaufrufe Unterstützt Konfiguration des Funktionsaufrufs Nicht unterstützt Codeausführung Nicht unterstützt |
Versionen |
|
Letzte Aktualisierung | Februar 2024 |
Texteinbettungen
Texteinbettung
Texteinbettungen werden verwendet, um die Verbundenheit von Strings zu messen, und sind weit verbreitet in viele KI-Anwendungen nutzen.
text-embedding-004
erzielt eine bessere Abrufleistung und übertrifft vorhandene Modelle
mit vergleichbaren Dimensionen in den
Standard-Benchmarks für MTEB-Einbettungen.
Modelldetails
Attribut | Beschreibung |
---|---|
Modellcode |
Gemini API
|
Unterstützte Datentypen |
Eingabe Text Ausgabe Texteinbettungen |
[*] | Token limits
Limit für Eingabetoken 2.048 Größe der Ausgabeabmessungen 768 |
[**] | Ratenbegrenzungen1.500 Anfragen pro Minute |
Anpassbare Sicherheitseinstellungen | Nicht unterstützt |
Letzte Aktualisierung | April 2024 |
Einbettung
<ph type="x-smartling-placeholder">Mit dem Einbettungsmodell können Sie Texteinbettungen für Text ein.
Das Einbettungsmodell ist für das Erstellen von Einbettungen mit 768 Dimensionen optimiert für Text mit bis zu 2.048 Tokens.
Details zum Einbettungsmodell
Attribut | Beschreibung |
---|---|
Modellcode |
models/embedding-001
|
Unterstützte Datentypen |
Eingabe Text Ausgabe Texteinbettungen |
[*] | Token limits
Limit für Eingabetoken 2.048 Größe der Ausgabeabmessungen 768 |
[**] | Ratenbegrenzungen1.500 Anfragen pro Minute |
Anpassbare Sicherheitseinstellungen | Nicht unterstützt |
Letzte Aktualisierung | Dezember 2023 |
AQA
Mit dem AQA-Modell können Sie Zugeordnete Fragenbeantwortung Aufgaben im Zusammenhang mit einem Dokument, Korpus oder einer Reihe von Passagen. Die AQA gibt das Modell Antworten auf Fragen zurück, die auf bereitgestellten Quellen basieren. sowie die Schätzung der beantwortbaren Wahrscheinlichkeit.
Modelldetails
Attribut | Beschreibung |
---|---|
Modellcode | models/aqa |
Unterstützte Datentypen |
Eingabe Text Ausgabe Text |
Unterstützte Sprache | Englisch |
[*] | Token limits
Limit für Eingabetoken 7.168 Tokenausgabelimit 1.024 |
[**] | Ratenbegrenzungen1.500 Anfragen pro Minute |
Anpassbare Sicherheitseinstellungen | Unterstützt |
Letzte Aktualisierung | Dezember 2023 |
Beispiele zu den Funktionen dieses Modells verschiedene Varianten.
[*] Ein Token entspricht bei Gemini-Modellen etwa 4 Zeichen. 100 Tokens etwa 60 bis 80 englische Wörter.
[**] RPM: Anfragen pro Minute
TPM: Tokens pro Minute
RPD: Anfragen pro Tag
TPD: Tokens pro Tag
Aufgrund von Kapazitätsbeschränkungen sind angegebene maximale Ratenbegrenzungen nicht
garantiert.
Muster für Modellversionsnamen
Gemini-Modelle sind als Vorabversion oder als stabile Version verfügbar. In der Code eingeben, können Sie eines der folgenden Formate für Modellnamen verwenden, um anzugeben, welches Modell und die gewünschte Version.
Neueste: Verweist auf die neueste Version des Modells für eine angegebene und Variation darstellen. Das zugrunde liegende Modell wird regelmäßig aktualisiert als Vorschauversion. Nur explorative Test-Apps und -Prototypen sollten verwenden Sie diesen Alias.
Verwenden Sie das folgende Muster, um die neueste Version anzugeben:
<model>-<generation>-<variation>-latest
Beispiel:gemini-1.0-pro-latest
Neueste stabile Version:Verweist auf die neueste stabile Version, die für den Modellgenerierung und -variante festgelegt.
Verwenden Sie das folgende Muster, um die neueste stabile Version anzugeben:
<model>-<generation>-<variation>
Beispiel:gemini-1.0-pro
.Stable (Stabil): Verweist auf ein bestimmtes stabiles Modell. Stabile Modelle ändern sich nicht. Die meisten Produktions-Apps sollten ein bestimmtes stabiles Modell verwenden.
Verwenden Sie das folgende Muster, um eine stabile Version anzugeben:
<model>-<generation>-<variation>-<version>
Beispiel:gemini-1.0-pro-001
Experimentell: Verweist auf ein experimentelles Modell, das in der Vorschau verfügbar ist. wie in den Nutzungsbedingungen definiert, d. h., es ist nicht für die Produktion bestimmt. Wir veröffentlichen experimentelle Modelle Feedback einholen, Entwickler über unsere neuesten Updates informieren und auf das Innovationstempo bei Google hinweisen. Was? wie wir aus experimentellen Markteinführungen lernen, wie wir Modelle häufiger veröffentlichen, weit verbreitet sind. Ein experimentelles Modell kann ohne vorheriges . Wir können nicht garantieren, dass ein experimentelles Modell zu einem verfügbar sein wird.
Verwenden Sie das folgende Muster, um eine experimentelle Version anzugeben:
<model>-<generation>-<variation>-<version>
Beispiel:gemini-1.5-pro-exp-0801
Verfügbare Sprachen
Gemini-Modelle sind darauf trainiert, mit den folgenden Sprachen zu arbeiten:
- Arabisch (
ar
) - Bengalisch (
bn
) - Bulgarisch (
bg
) - Chinesisch, vereinfacht und traditionell (
zh
) - Kroatisch (
hr
) - Tschechisch (
cs
) - Dänisch (
da
) - Niederländisch (
nl
) - Englisch (
en
) - Estnisch (
et
) - Finnisch (
fi
) - Französisch (
fr
) - Deutsch (
de
) - Griechisch (
el
) - Hebräisch (
iw
) - Hindi (
hi
) - Ungarisch (
hu
) - Indonesisch (
id
) - Italienisch (
it
) - Japanisch (
ja
) - Koreanisch (
ko
) - Lettisch (
lv
) - Litauisch (
lt
) - Norwegisch (
no
) - Polnisch (
pl
) - Portugiesisch (
pt
) - Rumänisch (
ro
) - Russisch (
ru
) - Serbisch (
sr
) - Slowakisch (
sk
) - Slowenisch (
sl
) - Spanisch (
es
) - Swahili (
sw
) - Schwedisch (
sv
) - Thailändisch (
th
) - Türkisch (
tr
) - Ukrainisch (
uk
) - Vietnamesisch (
vi
)