Natywna generacja obrazów za pomocą Gemini 2.0 Flash Experimental jest już dostępna. Więcej informacji

Ta strona została przetłumaczona przez Cloud Translation API.

Modele Gemini

2.0 Flash

Nasz najnowszy model multimodalny z funkcjami nowej generacji i ulepszonymi możliwościami

Wprowadzanie dźwięku, obrazów, filmów i tekstu oraz uzyskiwanie odpowiedzi tekstowych
generować kod i obrazy, wyodrębniać dane, analizować pliki, generować wykresy itp.
Niski poziom opóźnień, ulepszona wydajność, obsługa funkcji agenta

2.0 Flash-Lite

Model Gemini 2.0 Flash zoptymalizowany pod kątem niskich kosztów i niskiej latencji

Wprowadzanie dźwięku, obrazów, filmów i tekstu oraz uzyskiwanie odpowiedzi tekstowych
Wyższa wydajność niż w przypadku modelu 1.5 Flash w przypadku większości testów porównawczych
Okno kontekstu o wielkości 1 mln tokenów i dane multimodalne, np. Flash 2.0

1.5 Flash

Nasz najbardziej zrównoważony model multimodalny o wysokiej wydajności w przypadku większości zadań

Wprowadzanie dźwięku, obrazów, filmów i tekstu oraz uzyskiwanie odpowiedzi tekstowych
generować kod, wyodrębniać dane, edytować tekst i wykonywać inne czynności.
Najlepiej sprawdza się w przypadku zadań, w których równoważone są wydajność i koszt.

Warianty modelu

Gemini API udostępnia różne modele zoptymalizowane pod kątem konkretnych zastosowań. Oto krótkie omówienie dostępnych wariantów Gemini:

Wariant modelu	Dane wejściowe	Wyniki	Zoptymalizowany dla
Gemini 2.0 Flash `gemini-2.0-flash`	Dźwięk, obrazy, filmy i tekst	tekst, obrazy (w wersji eksperymentalnej) i dźwięk (wkrótce).	Funkcje nowej generacji, szybkość, myślenie, strumieniowanie w czasie rzeczywistym i generowanie multimodalne
Gemini 2.0 Flash-Lite `gemini-2.0-flash-lite`	Dźwięk, obrazy, filmy i tekst	Tekst	Model Gemini 2.0 Flash zoptymalizowany pod kątem niskich kosztów i niskiej latencji
Gemini 2.0 Pro Experimental `gemini-2.0-pro-exp-02-05`	Dźwięk, obrazy, filmy i tekst	Tekst	Najbardziej zaawansowany model Gemini 2.0
Gemini 1.5 Flash `gemini-1.5-flash`	Dźwięk, obrazy, filmy i tekst	Tekst	szybkie i wszechstronne działanie podczas wykonywania różnych zadań;
Gemini 1.5 Flash-8B `gemini-1.5-flash-8b`	Dźwięk, obrazy, filmy i tekst	Tekst	Zadania o dużej liczbie i mniejszym zaawansowaniu
Gemini 1.5 Pro `gemini-1.5-pro`	Dźwięk, obrazy, filmy i tekst	Tekst	złożone zadania wymagające większej inteligencji;
Umieszczanie Gemini `gemini-embedding-exp`	Tekst	wektory tekstowe,	Pomiar podobieństwa ciągów tekstowych
Obraz 3 `imagen-3.0-generate-002`	Tekst	Obrazy	Nasz najbardziej zaawansowany model do generowania obrazów

Limity stawek dla poszczególnych modeli możesz sprawdzić na stronie z limitami stawek.

Gemini 2.0 Flash

Gemini 2.0 Flash oferuje funkcje nowej generacji i ulepszone możliwości, w tym większą szybkość, korzystanie z natywnego narzędzia, generowanie multimodalne i okno kontekstu z milionem tokenów.

Wypróbuj w Google AI Studio

Szczegóły modelu

Właściwość	Opis
Kod modelu	`models/gemini-2.0-flash`
Obsługiwane typy danych	Wejścia Dźwięk, obrazy, filmy i tekst Dane wyjściowe tekst, obrazy (w wersji eksperymentalnej) i dźwięk(wkrótce).
Limity tokenów^[*]	Limit tokenów wejściowych 1 048 576 Limit tokenów wyjściowych 8192
	Wyjścia uporządkowane Obsługiwane Zapisywanie w pamięci podręcznej Wkrótce Dostrajanie Nieobsługiwane Wywoływanie funkcji Obsługiwane Wykonywanie kodu Obsługiwane Wyszukiwarka Obsługiwane Generowanie obrazów eksperymentalna, Korzystanie z narzędzi natywnych Obsługiwane Generowanie dźwięku Wkrótce Interfejs API multimodalnego na żywo eksperymentalna, Myślący Experimental
Wersje	Aby dowiedzieć się więcej, zapoznaj się z wzorami wersji modelu. Najnowszy: `gemini-2.0-flash` Stabilny: `gemini-2.0-flash-001` Experimental: `gemini-2.0-flash-exp` Experimental: `gemini-2.0-flash-thinking-exp-01-21`
Ostatnia aktualizacja	Luty 2025 r.
Wartość granicznej wiedzy	Sierpień 2024 r.

Gemini 2.0 Pro Experimental

Gemini 2.0 Pro to nasz najmocniejszy model Gemini drugiej generacji, który zapewnia zaawansowane rozumowanie, obsługę natywnych narzędzi i okno kontekstu z 2 mln tokenów.

Wypróbuj w Google AI Studio

Szczegóły modelu

Właściwość	Opis
Kod modelu	`gemini-2.0-pro-exp-02-05`
Obsługiwane typy danych	Wejścia Dźwięk, obrazy, filmy i tekst Dane wyjściowe Tekst
Limity tokenów^[*]	Limit tokenów wejściowych 2048 576 Limit tokenów wyjściowych 8192
	Wyjścia uporządkowane Obsługiwane Zapisywanie w pamięci podręcznej Nieobsługiwane Dostrajanie Nieobsługiwane Wywoływanie funkcji Obsługiwane Wykonywanie kodu Obsługiwane Wyszukiwarka Obsługiwane Generowanie obrazów Nieobsługiwane Korzystanie z narzędzi natywnych Obsługiwane Generowanie dźwięku Nieobsługiwane Interfejs API multimodalnego na żywo Nieobsługiwane
Wersje	Aby dowiedzieć się więcej, zapoznaj się z wzorami wersji modelu. Experimental: `gemini-2.0-pro-exp-02-05` Experimental: `gemini-2.0-pro-exp`
Ostatnia aktualizacja	Luty 2025 r.
Wartość granicznej wiedzy	Sierpień 2024 r.

Gemini 2.0 Flash-Lite

Model Gemini 2.0 Flash zoptymalizowany pod kątem niskich kosztów i małej latencji.

Wypróbuj w Google AI Studio

Szczegóły modelu

Właściwość	Opis
Kod modelu	`models/gemini-2.0-flash-lite`
Obsługiwane typy danych	Wejścia Dźwięk, obrazy, filmy i tekst Dane wyjściowe Tekst
Limity tokenów^[*]	Limit tokenów wejściowych 1 048 576 Limit tokenów wyjściowych 8192
	Wyjścia uporządkowane Obsługiwane Zapisywanie w pamięci podręcznej Nieobsługiwane Dostrajanie Nieobsługiwane Wywoływanie funkcji Nieobsługiwane Wykonywanie kodu Nieobsługiwane Wyszukiwarka Nieobsługiwane Generowanie obrazów Nieobsługiwane Korzystanie z narzędzi natywnych Nieobsługiwane Generowanie dźwięku Nieobsługiwane Interfejs API multimodalnego na żywo Nieobsługiwane
Wersje	Aby dowiedzieć się więcej, zapoznaj się z wzorami wersji modelu. Najnowszy: `gemini-2.0-flash-lite` Stabilny: `gemini-2.0-flash-lite-001`
Ostatnia aktualizacja	Luty 2025 r.
Wartość granicznej wiedzy	Sierpień 2024 r.

Gemini 1.5 Flash

Gemini 1.5 Flash to szybki i wszechstronny model multimodalny do skalowania na potrzeby różnych zadań.

Wypróbuj w Google AI Studio

Szczegóły modelu

Właściwość	Opis
Kod modelu	`models/gemini-1.5-flash`
Obsługiwane typy danych	Wejścia Dźwięk, obrazy, filmy i tekst Dane wyjściowe Tekst
Limity tokenów^[*]	Limit tokenów wejściowych 1 048 576 Limit tokenów wyjściowych 8192
Specyfikacja audiowizualna	Maksymalna liczba obrazów na prompt 3,600 Maksymalna długość filmu 1 godzina Maksymalna długość dźwięku Około 9,5 godziny
	Instrukcje dotyczące systemu Obsługiwane Tryb JSON Obsługiwane Schemat JSON Obsługiwane Ustawienia bezpieczeństwa Obsługiwane Zapisywanie w pamięci podręcznej Obsługiwane Dostrajanie Obsługiwane Wywoływanie funkcji Obsługiwane Wykonywanie kodu Obsługiwane Transmisja dwukierunkowa Nieobsługiwane
Wersje	Aby dowiedzieć się więcej, zapoznaj się z wzorami wersji modelu. Najnowszy: `gemini-1.5-flash-latest` Najnowsza stabilna wersja: `gemini-1.5-flash` Stabilny: `gemini-1.5-flash-001` `gemini-1.5-flash-002`
Ostatnia aktualizacja	Wrzesień 2024 r.

Gemini 1.5 Flash-8B

Gemini 1.5 Flash-8B to mały model przeznaczony do zadań wymagających mniejszej inteligencji.

Wypróbuj w Google AI Studio

Szczegóły modelu

Właściwość	Opis
Kod modelu	`models/gemini-1.5-flash-8b`
Obsługiwane typy danych	Wejścia Dźwięk, obrazy, filmy i tekst Dane wyjściowe Tekst
Limity tokenów^[*]	Limit tokenów wejściowych 1 048 576 Limit tokenów wyjściowych 8192
Specyfikacja audiowizualna	Maksymalna liczba obrazów na prompt 3,600 Maksymalna długość filmu 1 godzina Maksymalna długość dźwięku Około 9,5 godziny
	Instrukcje dotyczące systemu Obsługiwane Tryb JSON Obsługiwane Schemat JSON Obsługiwane Ustawienia bezpieczeństwa Obsługiwane Zapisywanie w pamięci podręcznej Obsługiwane Dostrajanie Obsługiwane Wywoływanie funkcji Obsługiwane Wykonywanie kodu Obsługiwane Transmisja dwukierunkowa Nieobsługiwane
Wersje	Aby dowiedzieć się więcej, zapoznaj się z wzorami wersji modelu. Najnowszy: `gemini-1.5-flash-8b-latest` Najnowsza stabilna wersja: `gemini-1.5-flash-8b` Stabilny: `gemini-1.5-flash-8b-001`
Ostatnia aktualizacja	Październik 2024 r.

Gemini 1.5 Pro

Wypróbuj Gemini 2.0 Pro Experimental, nasz najbardziej zaawansowany model Gemini do tej pory.

Gemini 1.5 Pro to średniej wielkości multimodalny model zoptymalizowany pod kątem szerokiego zakresu zadań związanych z wyciąganiem wniosków. Wersja 1.5 Pro może przetwarzać duże ilości danych jednocześnie, w tym 2 godziny filmu, 19 godzin dźwięku, bazy kodów zawierające 60 tys. wierszy kodu lub 2000 stron tekstu.

Wypróbuj w Google AI Studio

Szczegóły modelu

Właściwość	Opis
Kod modelu	`models/gemini-1.5-pro`
Obsługiwane typy danych	Wejścia Dźwięk, obrazy, filmy i tekst Dane wyjściowe Tekst
Limity tokenów^[*]	Limit tokenów wejściowych 2 097 152 Limit tokenów wyjściowych 8192
Specyfikacja audiowizualna	Maksymalna liczba obrazów na prompt 7200 Maksymalna długość filmu 2 godziny Maksymalna długość dźwięku Około 19 godzin
	Instrukcje dotyczące systemu Obsługiwane Tryb JSON Obsługiwane Schemat JSON Obsługiwane Ustawienia bezpieczeństwa Obsługiwane Zapisywanie w pamięci podręcznej Obsługiwane Dostrajanie Nieobsługiwane Wywoływanie funkcji Obsługiwane Wykonywanie kodu Obsługiwane Transmisja dwukierunkowa Nieobsługiwane
Wersje	Aby dowiedzieć się więcej, zapoznaj się z wzorami wersji modelu. Najnowszy: `gemini-1.5-pro-latest` Najnowsza stabilna wersja: `gemini-1.5-pro` Stabilny: `gemini-1.5-pro-001` `gemini-1.5-pro-002`
Ostatnia aktualizacja	Wrzesień 2024 r.

Imagen 3

Imagen 3 to nasz model do zamiany tekstu na obraz o najwyższej jakości, który potrafi generować obrazy o jeszcze lepszych szczegółach, bogatszym oświetleniu i mniejszej liczbie rozpraszających artefaktów niż nasze poprzednie modele.

Szczegóły modelu

Właściwość	Opis
Kod modelu	Gemini API `imagen-3.0-generate-002`
Obsługiwane typy danych	Wejście Tekst Dane wyjściowe Obrazy
Limity tokenów^[*]	Limit tokenów wejściowych Nie dotyczy Wyjście – obrazy Do 4
Ostatnia aktualizacja	Luty 2025 r.

Wstawianie Gemini (wersja eksperymentalna)

Gemini embedding osiąga najwyższą skuteczność w wielu kluczowych wymiarach, w tym w przypadku kodu, wielojęzyczności i wyszukiwania.

Szczegóły modelu

Właściwość	Opis
Kod modelu	Gemini API `gemini-embedding-exp-03-07`
Obsługiwane typy danych	Wejście Tekst Dane wyjściowe wektory tekstowe,
Limity tokenów^[*]	Limit tokenów wejściowych 8192 Rozmiar wymiaru wyjściowego Elastyczne, obsługuje: 3072, 1536 lub 768
Ostatnia aktualizacja	Marzec 2025 r.

Wektory dystrybucyjne tekstu

Wstawianie tekstu

Wypróbuj nasz nowy eksperymentalny model osadzania Gemini, który osiąga najlepszą wydajność.

Wkłady tekstowe służą do pomiaru podobieństwa ciągów znaków i są powszechnie stosowane w wielu zastosowaniach AI.

text-embedding-004 osiąga lepszą skuteczność wyszukiwania i przewyższa wyniki dotychczasowych modeli z porównywalnymi wymiarami w standardowych testach porównawczych MTEB.

Szczegóły modelu

Właściwość	Opis
Kod modelu	Gemini API `models/text-embedding-004`
Obsługiwane typy danych	Wejście Tekst Dane wyjściowe wektory tekstowe,
Limity tokenów^[*]	Limit tokenów wejściowych 2048 Rozmiar wymiaru wyjściowego 768
Limity oceny^[**]	1500 żądań na minutę
dostosowane ustawienia bezpieczeństwa	Nieobsługiwane
Ostatnia aktualizacja	Kwiecień 2024 r.

Umieszczanie

Możesz użyć modelu embeddingu, aby wygenerować embeddingi tekstu dla tekstu wejściowego.

Model embeddingu jest zoptymalizowany pod kątem tworzenia embeddingów o 768 wymiarach w przypadku tekstu zawierającego do 2048 tokenów.

Szczegóły modelu wektora dystrybucyjnego

Właściwość	Opis
Kod modelu	`models/embedding-001`
Obsługiwane typy danych	Wejście Tekst Dane wyjściowe wektory tekstowe,
Limity tokenów^[*]	Limit tokenów wejściowych 2048 Rozmiar wymiaru wyjściowego 768
Limity oceny^[**]	1500 żądań na minutę
dostosowane ustawienia bezpieczeństwa	Nieobsługiwane
Ostatnia aktualizacja	Grudzień 2023 r.

AQA

Model AQA możesz wykorzystać do wykonywania zadań związanych z przypisywaniem odpowiedzi na pytania (AQA) na podstawie dokumentu, korpusie lub zbioru fragmentów. Model AQA zwraca odpowiedzi na pytania oparte na podanych źródłach wraz z oszacowaniem prawdopodobieństwa odpowiedzi.

Szczegóły modelu

Właściwość	Opis
Kod modelu	`models/aqa`
Obsługiwane typy danych	Wejście Tekst Dane wyjściowe Tekst
Obsługiwany język	angielski
Limity tokenów^[*]	Limit tokenów wejściowych 7168 Limit tokenów wyjściowych 1024
Limity oceny^[**]	1500 żądań na minutę
dostosowane ustawienia bezpieczeństwa	Obsługiwane
Ostatnia aktualizacja	Grudzień 2023 r.

Aby poznać możliwości tych wariantów modeli, zapoznaj się z przykładami.

[*], token to około 4 znaków w przypadku modeli Gemini. 100 tokenów to około 60–80 słów po angielsku.

Wzorce nazw wersji modelu

Modele Gemini są dostępne w wersjach testowych lub stabilnych. W kodzie możesz użyć jednego z tych formatów nazwy modelu, aby określić, którego modelu i której wersji chcesz użyć.

Najnowsza:wskazuje najnowszą wersję modelu dla określonej generacji i wariantu. Model bazowy jest regularnie aktualizowany i może być wersją podglądową. Tego aliasu powinny używać tylko aplikacje do testów eksploracyjnych i prototypy.

Aby określić najnowszą wersję, użyj tego wzorca: <model>-<generation>-<variation>-latest. Na przykład: gemini-1.0-pro-latest.
Najnowsza stabilna wersja: wskazuje najnowszą stabilną wersję opublikowaną dla określonego pokolenia i wariantu modelu.

Aby określić najnowszą stabilną wersję, użyj tego wzoru: <model>-<generation>-<variation>. Na przykład: gemini-1.0-pro.
Stabilny: wskazuje konkretny stabilny model. Stabilne modele zwykle się nie zmieniają. Większość produkcyjnych aplikacji powinna używać konkretnego stabilnego modelu.

Aby określić wersję stabilną, użyj tego wzoru: <model>-<generation>-<variation>-<version>. Na przykład: gemini-1.0-pro-001.
Eksperymentalny: wskazuje na model eksperymentalny (nie przeznaczony do użytku produkcyjnego). Wprowadzamy modele eksperymentalne, aby zbierać opinie, szybko udostępniać deweloperom najnowsze aktualizacje i pokazywać tempo wprowadzania innowacji w Google.

Aby określić wersję eksperymentalną, użyj tego wzoru:<model>-<generation>-<variation>-<version>. Na przykład: gemini-2.0-pro-exp-02-05.

Modele eksperymentalne

Oprócz modeli gotowych do użytku produkcyjnego Gemini API oferuje modele eksperymentalne (nie przeznaczone do użytku produkcyjnego, zgodnie z definicją w naszych Warunkach).

Stale udostępniamy modele eksperymentalne, aby zbierać opinie, szybko przekazywać deweloperom najnowsze aktualizacje i pokazywać tempo wprowadzania innowacji w Google. Dzięki opiniom użytkowników możemy wprowadzać kolejne ulepszenia, a udostępniając wcześniej modele eksperymentalne, możemy lepiej przygotować się na ich szersze wdrożenie. Model eksperymentalny może zostać zastąpiony innym bez wcześniejszego powiadomienia. Nie możemy zagwarantować, że model eksperymentalny stanie się w przyszłości modelem stabilnym.

Wcześniejsze modele eksperymentalne

Gdy pojawiają się nowe wersje lub stabilne wydania, usuwamy eksperymentalne modele i zastępujemy je nowymi. W sekcji poniżej znajdziesz poprzednie eksperymentalne modele wraz z wersją zastępczą:

Kod modelu	Model podstawowy	Wersja zastępcza
`gemini-2.0-flash-exp`	Gemini 2.0 Flash	`gemini-2.0-flash`
`gemini-exp-1206`	Gemini 2.0 Pro	`gemini-2.0-pro-exp-02-05`
`gemini-2.0-flash-thinking-exp-1219`	Gemini 2.0 Flash Thinking	`gemini-2.0-flash-thinking-exp-01-21`
`gemini-exp-1121`	Gemini	`gemini-exp-1206`
`gemini-exp-1114`	Gemini	`gemini-exp-1206`
`gemini-1.5-pro-exp-0827`	Gemini 1.5 Pro	`gemini-exp-1206`
`gemini-1.5-pro-exp-0801`	Gemini 1.5 Pro	`gemini-exp-1206`
`gemini-1.5-flash-8b-exp-0924`	Gemini 1.5 Flash-8B	`gemini-1.5-flash-8b`
`gemini-1.5-flash-8b-exp-0827`	Gemini 1.5 Flash-8B	`gemini-1.5-flash-8b`

Obsługiwane języki

Modele Gemini są trenowane pod kątem tych języków:

arabski (ar),
bengali (bn)
bułgarski (bg),
chiński uproszczony i tradycyjny (zh),
Chorwacki (hr)
czeski (cs)
duński (da),
Holenderski (nl)
Angielski (en)
estoński (et),
fiński (fi),
Francuski (fr)
Niemiecki (de)
grecki (el)
hebrajski (iw),
hindi (hi),
węgierski (hu),
indonezyjski (id),
włoski (it),
japoński (ja)
koreański (ko),
łotewski (lv),
litewski (lt),
norweski (no),
Polski (pl)
Język portugalski (pt)
rumuński (ro)
rosyjski (ru),
serbski (sr)
słowacki (sk)
słoweński (sl),
hiszpański (es),
suahili (sw),
szwedzki (sv)
tajski (th),
turecki (tr),
ukraiński (uk)
wietnamski (vi),