2.5 Pro
Nasz najmocniejszy model myślenia, który zapewnia maksymalną dokładność odpowiedzi i najnowocześniejszą wydajność
- Wprowadzać dźwięk, obrazy, wideo i tekst oraz otrzymywać odpowiedzi tekstowe
- Rozwiązywanie trudnych problemów, analizowanie dużych baz danych i wiele więcej
- Najlepszy do skomplikowanego kodowania, wnioskowania i rozpoznawania multimodalnego
2.5 Flash
Nasz najlepszy model pod względem stosunku ceny do wydajności, który oferuje wszechstronne możliwości.
- przesyłać dźwięk, obrazy, filmy i tekst oraz otrzymywać odpowiedzi tekstowe;
- Model myśli w miarę potrzeby lub możesz skonfigurować budżet na myślenie.
- Najlepiej sprawdza się w przypadku zadań o niewielkim opóźnieniu i dużej liczbie, które wymagają myślenia.
2.0 Flash
Nasz najnowszy model multimodalny z funkcjami nowej generacji i ulepszonymi możliwościami
- Wprowadzać dźwięk, obrazy, wideo i tekst oraz otrzymywać odpowiedzi tekstowe
- generować kod i obrazy, wyodrębniać dane, analizować pliki, generować wykresy itp.
- Niski poziom opóźnień, ulepszona wydajność, większa efektywność
Warianty modelu
Gemini API udostępnia różne modele zoptymalizowane pod kątem konkretnych zastosowań. Oto krótkie omówienie dostępnych wariantów Gemini:
Wariant modelu | Dane wejściowe | Wyniki | Zoptymalizowany dla |
---|---|---|---|
Gemini 2.5 Flash Preview 04-17
gemini-2.5-flash-preview-04-17 |
Dźwięk, obrazy, filmy i tekst | Tekst | Elastyczne myślenie, opłacalność |
Podgląd Gemini 2.5 Pro
gemini-2.5-pro-preview-03-25 |
Dźwięk, obrazy, filmy i tekst | Tekst | Ulepszone myślenie i rozumowanie, zrozumienie multimodalne, zaawansowane kodowanie i inne funkcje |
Gemini 2.0 Flash
gemini-2.0-flash |
Dźwięk, obrazy, filmy i tekst | tekst, obrazy (w wersji eksperymentalnej) i dźwięk (wkrótce). | Funkcje nowej generacji, szybkość, myślenie, strumieniowanie w czasie rzeczywistym i generowanie multimodalne |
Gemini 2.0 Flash-Lite
gemini-2.0-flash-lite |
Dźwięk, obrazy, filmy i tekst | Tekst | Opłacalność i niskie opóźnienie |
Gemini 1.5 Flash
gemini-1.5-flash |
Dźwięk, obrazy, filmy i tekst | Tekst | szybkie i wszechstronne działanie w różnych zastosowaniach; |
Gemini 1.5 Flash-8B
gemini-1.5-flash-8b |
Dźwięk, obrazy, filmy i tekst | Tekst | Zadania o dużej liczbie i mniejszym zaawansowaniu |
Gemini 1.5 Pro
gemini-1.5-pro |
Dźwięk, obrazy, filmy i tekst | Tekst | złożone zadania wymagające większej inteligencji; |
Umieszczanie Gemini
gemini-embedding-exp |
Tekst | wektory tekstowe, | Pomiar podobieństwa ciągów tekstowych |
Obraz 3
imagen-3.0-generate-002 |
Tekst | Obrazy | Nasz najbardziej zaawansowany model do generowania obrazów |
Veo 2
veo-2.0-generate-001 |
Tekst, obrazy | Wideo | generowanie filmów o wysokiej jakości; |
Gemini 2.0 Flash Live
gemini-2.0-flash-live-001 |
Dźwięk, obraz i tekst | Tekst, dźwięk | Dwukierunkowe interakcje z użyciem głosu i wideo z niewielkimi opóźnieniami |
Limity stawek dla poszczególnych modeli możesz sprawdzić na stronie z limitami stawek.
Gemini 2.5 Flash Preview 04-17
Nasz najlepszy model pod względem stosunku ceny do wydajności, który oferuje wszechstronne możliwości. Limity szybkości Gemini 2.5 Flash są bardziej restrykcyjne, ponieważ jest to model eksperymentalny / w wersji testowej.
Szczegóły modelu
Właściwość | Opis |
---|---|
Kod modelu | models/gemini-2.5-flash-preview-04-17 |
Obsługiwane typy danych |
Wejścia tekst, obrazy, filmy, pliki dźwiękowe Dane wyjściowe Tekst |
[*] | Limity tokenów
Limit tokenów wejściowych 1 048 576 Limit tokenów wyjściowych 65 536 |
Generowanie dźwięku Nieobsługiwane Zapisywanie w pamięci podręcznej Nieobsługiwane Wykonanie kodu Obsługiwane Wywoływanie funkcji Obsługiwane Generowanie obrazów Nieobsługiwane Grounding w wyszukiwarce Obsługiwane Wyjścia uporządkowane Obsługiwane Myślę Obsługiwane Dostrajanie Nieobsługiwane |
|
wersje |
|
Ostatnia aktualizacja | Kwiecień 2025 r. |
Granica wiedzy | Styczeń 2025 r. |
Gemini 2.5 Pro w wersji testowej
Gemini 2.5 Pro to nasz najnowocześniejszy model myślenia, który potrafi rozwiązywać złożone problemy związane z kodem, matematyką i naukami ścisłymi, a także analizować duże zbiory danych, bazy kodu i dokumenty, korzystając z długiego kontekstu. Limity szybkości Gemini 2.5 Pro są bardziej restrykcyjne, ponieważ jest to model eksperymentalny / wstępny.
Szczegóły modelu
Właściwość | Opis |
---|---|
Kod modelu | Płatna: gemini-2.5-pro-preview-03-25 , eksperymentalna: gemini-2.5-pro-exp-03-25 |
Obsługiwane typy danych |
Wejścia Dźwięk, obrazy, filmy i tekst Dane wyjściowe Tekst |
[*] | Limity tokenów
Limit tokenów wejściowych 1 048 576 Limit tokenów wyjściowych 65 536 |
Wyjścia uporządkowane Obsługiwane Pamięć podręczna Obsługiwane Dostrajanie Nieobsługiwane Wywoływanie funkcji Obsługiwane Wykonanie kodu Obsługiwane Grounding w wyszukiwarce Obsługiwane Generowanie obrazów Nieobsługiwane Generowanie dźwięku Nieobsługiwane Live API Nieobsługiwane Myślę Obsługiwane |
|
wersje |
|
Ostatnia aktualizacja | Marzec 2025 r. |
Granica wiedzy | Styczeń 2025 r. |
Gemini 2.0 Flash
Gemini 2.0 Flash oferuje funkcje nowej generacji i ulepszone możliwości, w tym większą szybkość, natywne narzędzia, generowanie multimodalne i okno kontekstu z milionem tokenów.
Szczegóły modelu
Właściwość | Opis |
---|---|
Kod modelu | models/gemini-2.0-flash |
Obsługiwane typy danych |
Wejścia Dźwięk, obrazy, filmy i tekst Dane wyjściowe tekst, obrazy (w wersji eksperymentalnej) i dźwięk(wkrótce). |
[*] | Limity tokenów
Limit tokenów wejściowych 1 048 576 Limit tokenów wyjściowych 8192 |
Wyjścia uporządkowane Obsługiwane Pamięć podręczna Obsługiwane Dostrajanie Nieobsługiwane Wywoływanie funkcji Obsługiwane Wykonanie kodu Obsługiwane Wyszukiwarka Obsługiwane Generowanie obrazów eksperymentalna, Generowanie dźwięku Wkrótce Live API Obsługiwane Myślę eksperymentalna, |
|
Wersje |
|
Ostatnia aktualizacja | Luty 2025 r. |
Granica wiedzy | Sierpień 2024 r. |
Gemini 2.0 Flash-Lite
Model Gemini 2.0 Flash zoptymalizowany pod kątem niskich kosztów i małej latencji.
Szczegóły modelu
Właściwość | Opis |
---|---|
Kod modelu | models/gemini-2.0-flash-lite |
Obsługiwane typy danych |
Wejścia Dźwięk, obrazy, filmy i tekst Dane wyjściowe Tekst |
[*] | Limity tokenów
Limit tokenów wejściowych 1 048 576 Limit tokenów wyjściowych 8192 |
Wyjścia uporządkowane Obsługiwane Pamięć podręczna Obsługiwane Dostrajanie Nieobsługiwane Wywoływanie funkcji Obsługiwane Wykonanie kodu Nieobsługiwane Wyszukiwarka Nieobsługiwane Generowanie obrazów Nieobsługiwane Generowanie dźwięku Nieobsługiwane Live API Nieobsługiwane |
|
wersje |
|
Ostatnia aktualizacja | Luty 2025 r. |
Granica wiedzy | Sierpień 2024 r. |
Gemini 1.5 Flash
Gemini 1.5 Flash to szybki i wszechstronny model multimodalny do skalowania w różnych zadaniach.
Szczegóły modelu
Właściwość | Opis |
---|---|
Kod modelu | models/gemini-1.5-flash |
Obsługiwane typy danych |
Wejścia Dźwięk, obrazy, filmy i tekst Dane wyjściowe Tekst |
[*] | Limity tokenów
Limit tokenów wejściowych 1 048 576 Limit tokenów wyjściowych 8192 |
Specyfikacja audiowizualna |
Maksymalna liczba obrazów na prompt 3,600 Maksymalna długość filmu 1 godzina Maksymalna długość dźwięku Około 9,5 godziny |
Instrukcje dotyczące systemu Obsługiwane Tryb JSON Obsługiwane Schemat JSON Obsługiwane Dostosowywanie ustawień bezpieczeństwa Obsługiwane Pamięć podręczna Obsługiwane Dostrajanie Obsługiwane Wywoływanie funkcji Obsługiwane Wykonanie kodu Obsługiwane Live API Nieobsługiwane |
|
wersje |
|
Ostatnia aktualizacja | Wrzesień 2024 r. |
Gemini 1.5 Flash-8B
Gemini 1.5 Flash-8B to mały model przeznaczony do wykonywania zadań wymagających mniejszej inteligencji.
Szczegóły modelu
Właściwość | Opis |
---|---|
Kod modelu | models/gemini-1.5-flash-8b |
Obsługiwane typy danych |
Wejścia Dźwięk, obrazy, filmy i tekst Dane wyjściowe Tekst |
[*] | Limity tokenów
Limit tokenów wejściowych 1 048 576 Limit tokenów wyjściowych 8192 |
Specyfikacja audiowizualna |
Maksymalna liczba obrazów na prompt 3,600 Maksymalna długość filmu 1 godzina Maksymalna długość dźwięku Około 9,5 godziny |
Instrukcje dotyczące systemu Obsługiwane Tryb JSON Obsługiwane Schemat JSON Obsługiwane Dostosowywanie ustawień bezpieczeństwa Obsługiwane Pamięć podręczna Obsługiwane Dostrajanie Obsługiwane Wywoływanie funkcji Obsługiwane Wykonanie kodu Obsługiwane Live API Nieobsługiwane |
|
wersje |
|
Ostatnia aktualizacja | Październik 2024 r. |
Gemini 1.5 Pro
Wypróbuj przedpremierową wersję Gemini 2.5 Pro, nasz najbardziej zaawansowany model Gemini do tej pory.
Gemini 1.5 Pro to średniej wielkości multimodalny model zoptymalizowany do wykonywania wielu zadań związanych z wyciąganiem wniosków. Wersja 1.5 Pro może przetwarzać duże ilości danych jednocześnie, w tym 2 godziny filmu, 19 godzin dźwięku, bazy kodu zawierające 60 tys. linii kodu lub 2000 stron tekstu.
Szczegóły modelu
Właściwość | Opis |
---|---|
Kod modelu | models/gemini-1.5-pro |
Obsługiwane typy danych |
Wejścia Dźwięk, obrazy, filmy i tekst Dane wyjściowe Tekst |
[*] | Limity tokenów
Limit tokenów wejściowych 2 097 152 Limit tokenów wyjściowych 8192 |
Specyfikacja audiowizualna |
Maksymalna liczba obrazów na prompt 7200 Maksymalna długość filmu 2 godziny Maksymalna długość dźwięku Około 19 godzin |
Instrukcje dotyczące systemu Obsługiwane Tryb JSON Obsługiwane Schemat JSON Obsługiwane Dostosowywanie ustawień bezpieczeństwa Obsługiwane Pamięć podręczna Obsługiwane Dostrajanie Nieobsługiwane Wywoływanie funkcji Obsługiwane Wykonanie kodu Obsługiwane Live API Nieobsługiwane |
|
wersje |
|
Ostatnia aktualizacja | Wrzesień 2024 r. |
Imagen 3
Imagen 3 to nasz model do zamiany tekstu na grafikę najwyższej jakości, który potrafi generować obrazy o jeszcze lepszych szczegółach, bogatszym oświetleniu i mniejszej liczbie rozpraszających artefaktów niż nasze poprzednie modele.
Szczegóły modelu
Właściwość | Opis |
---|---|
Kod modelu |
Gemini API
|
Obsługiwane typy danych |
Wejście Tekst Dane wyjściowe Obrazy |
[*] | Limity tokenów
Limit tokenów wejściowych Nie dotyczy Wyjście – obrazy Maksymalnie 4 |
Ostatnia aktualizacja | Luty 2025 r. |
Veo 2
Veo 2 to nasz model do tworzenia filmów na podstawie tekstu i obrazów, który umożliwia tworzenie szczegółowych filmów, zachowując przy tym artystyczne niuanse promptów.
Szczegóły modelu
Właściwość | Opis |
---|---|
Kod modelu |
Gemini API
|
Obsługiwane typy danych |
Wejście Tekst, obraz Dane wyjściowe Wideo |
Ograniczenia |
Tekst Nie dotyczy Wejście obrazowe dowolna rozdzielczość i współczynnik proporcji, rozmiar pliku do 20 MB Film wyjściowy Do 2 |
Ostatnia aktualizacja | Kwiecień 2025 r. |
Gemini 2.0 Flash Live
Model Gemini 2.0 Flash Live współpracuje z interfejsem Live API, aby umożliwić dwukierunkowe interakcje z użyciem głosu i wideo z niewielkimi opóźnieniami dzięki Gemini. Model może przetwarzać dane wejściowe w postaci tekstu, dźwięku i obrazu oraz generować dane wyjściowe w postaci tekstu i dźwięku.
Szczegóły modelu
Właściwość | Opis |
---|---|
Kod modelu | models/gemini-2.0-flash-live-001 |
Obsługiwane typy danych |
Wejścia Dźwięk, obraz i tekst Dane wyjściowe tekst i dźwięk; |
[*] | Limity tokenów
Limit tokenów wejściowych 1 048 576 Limit tokenów wyjściowych 8192 |
Wyjścia uporządkowane Obsługiwane Dostrajanie Nieobsługiwane Wywoływanie funkcji Obsługiwane Wykonanie kodu Obsługiwane Wyszukiwarka Obsługiwane Generowanie obrazów Nieobsługiwane Generowanie dźwięku Obsługiwane Myślę Nieobsługiwane |
|
wersje |
|
Ostatnia aktualizacja | Kwiecień 2025 r. |
Granica wiedzy | Sierpień 2024 r. |
Gemini Embedding Experimental
Gemini embedding
osiąga najwyższą skuteczność w wielu kluczowych wymiarach, w tym w przypadku kodu, wielojęzyczności i wyszukiwania.
Limity szybkości umieszczania treści w Gemini są bardziej restrykcyjne, ponieważ jest to model eksperymentalny.
Szczegóły modelu
Właściwość | Opis |
---|---|
Kod modelu |
Gemini API
|
Obsługiwane typy danych |
Wejście Tekst Dane wyjściowe wektory tekstowe, |
[*] | Limity tokenów
Limit tokenów wejściowych 8192 Rozmiar wymiaru wyjściowego Elastyczne, obsługuje: 3072, 1536 lub 768 |
Ostatnia aktualizacja | Marzec 2025 r. |
Wektory dystrybucyjne tekstu
Wstawianie tekstu
Wypróbuj nasz nowy eksperymentalny model osadzania Gemini, który osiąga najnowocześniejszą wydajność.
Wkłady tekstowe służą do pomiaru podobieństwa ciągów znaków i są powszechnie stosowane w wielu zastosowaniach AI.
text-embedding-004
osiąga lepszą skuteczność wyszukiwania i przewyższa wyniki dotychczasowych modeli
przy porównywalnych wymiarach w ramach standardowych testów porównawczych MTEB.
Szczegóły modelu
Właściwość | Opis |
---|---|
Kod modelu |
Gemini API
|
Obsługiwane typy danych |
Wejście Tekst Dane wyjściowe wektory tekstowe, |
[*] | Limity tokenów
Limit tokenów wejściowych 2048 Rozmiar wymiaru wyjściowego 768 |
[**] | Limity oceny1500 żądań na minutę |
ustawienia bezpieczeństwa | Nieobsługiwane |
Ostatnia aktualizacja | Kwiecień 2024 r. |
Umieszczanie
Możesz użyć modelu embeddingu, aby wygenerować embeddingi tekstu dla tekstu wejściowego.
Model wektorów dystrybucyjnych jest zoptymalizowany pod kątem tworzenia wektorów z 768 wymiarami w przypadku tekstu zawierającego do 2048 tokenów.
Szczegóły modelu wektora dystrybucyjnego
Właściwość | Opis |
---|---|
Kod modelu |
models/embedding-001
|
Obsługiwane typy danych |
Wejście Tekst Dane wyjściowe wektory tekstowe, |
[*] | Limity tokenów
Limit tokenów wejściowych 2048 Rozmiar wymiaru wyjściowego 768 |
[**] | Limity oceny1500 żądań na minutę |
ustawienia bezpieczeństwa | Nieobsługiwane |
Ostatnia aktualizacja | Grudzień 2023 r. |
AQA
Model AQA możesz wykorzystać do wykonywania zadań związanych z przypisywaniem odpowiedzi na pytania (AQA) na podstawie dokumentu, korpusie lub zbioru fragmentów. Model AQA zwraca odpowiedzi na pytania oparte na podanych źródłach, a także szacuje prawdopodobieństwo udzielenia odpowiedzi.
Szczegóły modelu
Właściwość | Opis |
---|---|
Kod modelu | models/aqa |
Obsługiwane typy danych |
Wejście Tekst Dane wyjściowe Tekst |
Obsługiwany język | angielski |
[*] | Limity tokenów
Limit tokenów wejściowych 7168 Limit tokenów wyjściowych 1024 |
[**] | Limity oceny1500 żądań na minutę |
ustawienia bezpieczeństwa | Obsługiwane |
Ostatnia aktualizacja | Grudzień 2023 r. |
Aby poznać możliwości tych wariantów modeli, zapoznaj się z przykładami.
[*], token ma około 4 znaków w przypadku modeli Gemini. 100 tokenów to około 60–80 słów po angielsku.
Wzorce nazw wersji modelu
Modele Gemini są dostępne w wersjach stabilnej, testowej i eksperymentalnej. W kodzie możesz użyć jednego z tych formatów nazwy modelu, aby określić, którego modelu i której wersji chcesz użyć.
Najnowsza stabilna
Wskazuje najnowszą stabilną wersję opublikowaną dla określonego modelu, generacji i wariantu.
Aby określić najnowszą stabilną wersję, użyj tego wzorca:
<model>-<generation>-<variation>
. Na przykład: gemini-2.0-flash
.
Stabilny
Wskazuje konkretny stabilny model. Stabilne modele zwykle się nie zmieniają. Większość aplikacji produkcyjnych powinna używać konkretnego stabilnego modelu.
Aby określić wersję stabilną, użyj tego wzoru:
<model>-<generation>-<variation>-<version>
. Na przykład:
gemini-2.0-flash-001
.
Podgląd
Wskazuje model w wersji wstępnej, który może nie nadawać się do użytku produkcyjnego, może mieć bardziej restrykcyjne limity stawek, ale może mieć włączone płatności.
Aby określić wersję podglądu, użyj tego wzoru:<model>-<generation>-<variation>-<version>
. Na przykład:
gemini-2.5-pro-preview-03-25
.
Eksperymentalna
Wskazuje na model eksperymentalny, który może nie być odpowiedni do użytku produkcyjnego i być objęty bardziej restrykcyjnymi limitami stawek. Udostępniamy modele eksperymentalne, aby zbierać opinie i szybko przekazywać najnowsze aktualizacje deweloperom.
Aby określić wersję eksperymentalną, użyj tego wzoru:<model>-<generation>-<variation>-<version>
. Na przykład:
gemini-2.0-pro-exp-02-05
.
Modele eksperymentalne
Oprócz stabilnych modeli interfejs Gemini API oferuje modele eksperymentalne, które mogą nie nadawać się do użytku produkcyjnego i być objęte bardziej restrykcyjnymi limitami szybkości.
Stale udostępniamy modele eksperymentalne, aby zbierać opinie, szybko przekazywać deweloperom najnowsze aktualizacje i pokazywać tempo wprowadzania innowacji w Google. Dzięki opiniom użytkowników możemy wprowadzać kolejne ulepszenia, a udostępniając wcześniej modele eksperymentalne, możemy lepiej przygotować się na ich szersze wdrożenie. Model eksperymentalny może zostać zastąpiony innym bez wcześniejszego powiadomienia. Nie możemy zagwarantować, że model eksperymentalny stanie się w przyszłości modelem stabilnym.
Wcześniejsze modele eksperymentalne
Gdy pojawiają się nowe wersje lub stabilne wydania, usuwamy eksperymentalne modele i zastępujemy je nowymi. W sekcji poniżej znajdziesz poprzednie eksperymentalne modele wraz z wersją zastępczą:
Kod modelu | Model podstawowy | Wersja zastępcza |
---|---|---|
gemini-2.0-flash-thinking-exp-01-21 |
Gemini 2.5 Flash | gemini-2.5-flash-preview-04-17 |
gemini-2.0-pro-exp-02-05 |
Gemini 2.0 Pro Experimental | gemini-2.5-pro-preview-03-25 |
gemini-2.0-flash-exp |
Gemini 2.0 Flash | gemini-2.0-flash |
gemini-exp-1206 |
Gemini 2.0 Pro | gemini-2.0-pro-exp-02-05 |
gemini-2.0-flash-thinking-exp-1219 |
Gemini 2.0 Flash Thinking | gemini-2.0-flash-thinking-exp-01-21 |
gemini-exp-1121 |
Gemini | gemini-exp-1206 |
gemini-exp-1114 |
Gemini | gemini-exp-1206 |
gemini-1.5-pro-exp-0827 |
Gemini 1.5 Pro | gemini-exp-1206 |
gemini-1.5-pro-exp-0801 |
Gemini 1.5 Pro | gemini-exp-1206 |
gemini-1.5-flash-8b-exp-0924 |
Gemini 1.5 Flash-8B | gemini-1.5-flash-8b |
gemini-1.5-flash-8b-exp-0827 |
Gemini 1.5 Flash-8B | gemini-1.5-flash-8b |
Obsługiwane języki
Modele Gemini są trenowane pod kątem tych języków:
- arabski (
ar
), - bengali (
bn
) - bułgarski (
bg
), - chiński uproszczony i tradycyjny (
zh
), - Chorwacki (
hr
) - czeski (
cs
) - duński (
da
), - Holenderski (
nl
) - Angielski (
en
) - estoński (
et
), - fiński (
fi
), - Francuski (
fr
) - Niemiecki (
de
) - grecki (
el
), - hebrajski (
iw
), - hindi (
hi
), - węgierski (
hu
), - indonezyjski (
id
), - włoski (
it
), - japoński (
ja
) - koreański (
ko
), - łotewski (
lv
), - litewski (
lt
), - norweski (
no
), - Polski (
pl
) - portugalski (
pt
), - rumuński (
ro
) - rosyjski (
ru
), - serbski (
sr
) - słowacki (
sk
) - słoweński (
sl
), - hiszpański (
es
), - suahili (
sw
), - szwedzki (
sv
) - tajski (
th
), - turecki (
tr
), - ukraiński (
uk
) - wietnamski (
vi
),