Modele Gemini

Warianty modelu

Gemini API udostępnia różne modele zoptymalizowane pod kątem konkretnych zastosowań. Oto krótki przegląd dostępnych wariantów Gemini:

Wariant modelu Dane wejściowe Wyniki Zoptymalizowany dla
Gemini 2.5 Flash Preview 04-17
gemini-2.5-flash-preview-04-17
Dźwięk, obrazy, filmy i tekst Tekst Elastyczne myślenie, opłacalność
Podgląd Gemini 2.5 Pro
gemini-2.5-pro-preview-03-25
Dźwięk, obrazy, filmy i tekst Tekst Ulepszone myślenie i rozumowanie, zrozumienie multimodalne, zaawansowane kodowanie i inne funkcje
Gemini 2.0 Flash
gemini-2.0-flash
Dźwięk, obrazy, filmy i tekst tekst, obrazy (w wersji eksperymentalnej) i dźwięk (wkrótce). Funkcje nowej generacji, szybkość, myślenie, strumieniowanie w czasie rzeczywistym i generowanie multimodalne
Gemini 2.0 Flash-Lite
gemini-2.0-flash-lite
Dźwięk, obrazy, filmy i tekst Tekst Opłacalność i niskie opóźnienie
Gemini 1.5 Flash
gemini-1.5-flash
Dźwięk, obrazy, filmy i tekst Tekst szybkie i wszechstronne działanie w różnych zastosowaniach;
Gemini 1.5 Flash-8B
gemini-1.5-flash-8b
Dźwięk, obrazy, filmy i tekst Tekst Zadania o dużej liczbie i mniejszym zaawansowaniu
Gemini 1.5 Pro
gemini-1.5-pro
Dźwięk, obrazy, filmy i tekst Tekst złożone zadania wymagające większej inteligencji;
Umieszczanie Gemini
gemini-embedding-exp
Tekst wektory tekstowe, Pomiar podobieństwa ciągów tekstowych
Obraz 3
imagen-3.0-generate-002
Tekst Obrazy Nasz najbardziej zaawansowany model do generowania obrazów
Veo 2
veo-2.0-generate-001
Tekst, obrazy Wideo generowanie filmów o wysokiej jakości;
Gemini 2.0 Flash Live
gemini-2.0-flash-live-001
Dźwięk, obraz i tekst Tekst, dźwięk Dwukierunkowe interakcje z użyciem głosu i wideo z niewielkimi opóźnieniami

Limity stawek dla poszczególnych modeli możesz sprawdzić na stronie z limitami stawek.

Gemini 2.5 Flash Preview 04-17

Nasz najlepszy model pod względem stosunku ceny do wydajności, który oferuje wszechstronne możliwości. Limity szybkości Gemini 2.5 Flash są bardziej restrykcyjne, ponieważ jest to model eksperymentalny / w wersji wstępnej.

Wypróbuj w Google AI Studio

Szczegóły modelu

Właściwość Opis
Kod modelu models/gemini-2.5-flash-preview-04-17
Obsługiwane typy danych

Wejścia

tekst, obrazy, filmy, dźwięk;

Dane wyjściowe

Tekst

Limity tokenów[*]

Limit tokenów wejściowych

1 048 576

Limit tokenów wyjściowych

65 536

Generowanie dźwięku

Nieobsługiwane

Pamięć podręczna

Nieobsługiwane

Wykonywanie kodu

Obsługiwane

Wywoływanie funkcji

Obsługiwane

Generowanie obrazów

Nieobsługiwane

Wyszukiwarka

Obsługiwane

Wyjścia uporządkowane

Obsługiwane

Myślący

Obsługiwane

Dostrajanie

Nieobsługiwane

Wersje
Aby dowiedzieć się więcej, zapoznaj się z wzorami wersji modelu.
  • Podgląd: gemini-2.5-flash-preview-04-17
Ostatnia aktualizacja Kwiecień 2025 r.
Granica wiedzy Styczeń 2025 r.

Gemini 2.5 Pro w wersji testowej

Gemini 2.5 Pro to nasz najnowocześniejszy model myślenia, który potrafi rozwiązywać złożone problemy związane z kodowaniem, matematyką i naukami ścisłymi, a także analizować duże zbiory danych, bazy kodu i dokumenty, korzystając z długiego kontekstu. Limity szybkości Gemini 2.5 Pro są bardziej restrykcyjne, ponieważ jest to model eksperymentalny lub wczesnej wersji.

Wypróbuj w Google AI Studio

Szczegóły modelu

Właściwość Opis
Kod modelu Płatna: gemini-2.5-pro-preview-03-25, eksperymentalna: gemini-2.5-pro-exp-03-25
Obsługiwane typy danych

Wejścia

Dźwięk, obraz, film i tekst

Dane wyjściowe

Tekst

Limity tokenów[*]

Limit tokenów wejściowych

1 048 576

Limit tokenów wyjściowych

65 536

Wyjścia uporządkowane

Obsługiwane

Pamięć podręczna

Obsługiwane

Dostrajanie

Nieobsługiwane

Wywoływanie funkcji

Obsługiwane

Wykonywanie kodu

Obsługiwane

Grounding w wyszukiwarce

Obsługiwane

Generowanie obrazów

Nieobsługiwane

Generowanie dźwięku

Nieobsługiwane

Live API

Nieobsługiwane

Myślący

Obsługiwane

Wersje
Aby dowiedzieć się więcej, zapoznaj się z wzorami wersji modelu.
  • Podgląd: gemini-2.5-pro-preview-03-25
  • Experimental: gemini-2.5-pro-exp-03-25
Ostatnia aktualizacja Marzec 2025 r.
Granica wiedzy Styczeń 2025 r.

Gemini 2.0 Flash

Gemini 2.0 Flash oferuje funkcje nowej generacji i ulepszone możliwości, w tym większą szybkość, natywne narzędzia, generowanie multimodalne i okno kontekstu z milionem tokenów.

Wypróbuj w Google AI Studio

Szczegóły modelu

Właściwość Opis
Kod modelu models/gemini-2.0-flash
Obsługiwane typy danych

Wejścia

Dźwięk, obraz, film i tekst

Dane wyjściowe

tekst, obrazy (w wersji eksperymentalnej) i dźwięk(wkrótce).

Limity tokenów[*]

Limit tokenów wejściowych

1 048 576

Limit tokenów wyjściowych

8192

Wyjścia uporządkowane

Obsługiwane

Pamięć podręczna

Obsługiwane

Dostrajanie

Nieobsługiwane

Wywoływanie funkcji

Obsługiwane

Wykonywanie kodu

Obsługiwane

Wyszukiwarka

Obsługiwane

Generowanie obrazów

eksperymentalna,

Generowanie dźwięku

Wkrótce

Live API

Obsługiwane

Myślący

eksperymentalna,

Wersje
Aby dowiedzieć się więcej, zapoznaj się z wzorami wersji modelu.
  • Najnowsze: gemini-2.0-flash
  • Stabilny: gemini-2.0-flash-001
  • Eksperymentalnie: gemini-2.0-flash-exp*gemini-2.0-flash-exp-image-generation* wskazują na ten sam model podstawowy
  • gemini-2.0-flash-exp-image-generation nie jest obecnie obsługiwane w pewnych krajach Europy, Bliskiego Wschodu i Afryki

Ostatnia aktualizacja Luty 2025 r.
Granica wiedzy Sierpień 2024 r.

Gemini 2.0 Flash-Lite

Model Gemini 2.0 Flash zoptymalizowany pod kątem niskich kosztów i małej latencji.

Wypróbuj w Google AI Studio

Szczegóły modelu

Właściwość Opis
Kod modelu models/gemini-2.0-flash-lite
Obsługiwane typy danych

Wejścia

Dźwięk, obraz, film i tekst

Dane wyjściowe

Tekst

Limity tokenów[*]

Limit tokenów wejściowych

1 048 576

Limit tokenów wyjściowych

8192

Wyjścia uporządkowane

Obsługiwane

Pamięć podręczna

Obsługiwane

Dostrajanie

Nieobsługiwane

Wywoływanie funkcji

Obsługiwane

Wykonywanie kodu

Nieobsługiwane

Wyszukiwarka

Nieobsługiwane

Generowanie obrazów

Nieobsługiwane

Generowanie dźwięku

Nieobsługiwane

Live API

Nieobsługiwane

Wersje
Aby dowiedzieć się więcej, zapoznaj się z wzorami wersji modelu.
  • Najnowsze: gemini-2.0-flash-lite
  • Stabilny: gemini-2.0-flash-lite-001
Ostatnia aktualizacja Luty 2025 r.
Granica wiedzy Sierpień 2024 r.

Gemini 1.5 Flash

Gemini 1.5 Flash to szybki i wszechstronny model multimodalny do skalowania w różnych zadaniach.

Wypróbuj w Google AI Studio

Szczegóły modelu

Właściwość Opis
Kod modelu models/gemini-1.5-flash
Obsługiwane typy danych

Wejścia

Dźwięk, obraz, film i tekst

Dane wyjściowe

Tekst

Limity tokenów[*]

Limit tokenów wejściowych

1 048 576

Limit tokenów wyjściowych

8192

Specyfikacja audiowizualna

Maksymalna liczba obrazów na prompt

3,600

Maksymalna długość filmu

1 godzina

Maksymalna długość dźwięku

Około 9,5 godziny

Instrukcje dotyczące systemu

Obsługiwane

Tryb JSON

Obsługiwane

Schemat JSON

Obsługiwane

Dostosowywanie ustawień bezpieczeństwa

Obsługiwane

Pamięć podręczna

Obsługiwane

Dostrajanie

Obsługiwane

Wywoływanie funkcji

Obsługiwane

Wykonywanie kodu

Obsługiwane

Live API

Nieobsługiwane

Wersje
Aby dowiedzieć się więcej, zapoznaj się z wzorami wersji modelu.
  • Najnowsze: gemini-1.5-flash-latest
  • Najnowsza stabilna wersja: gemini-1.5-flash
  • Stabilny:
    • gemini-1.5-flash-001
    • gemini-1.5-flash-002
Ostatnia aktualizacja Wrzesień 2024 r.

Gemini 1.5 Flash-8B

Gemini 1.5 Flash-8B to mały model przeznaczony do wykonywania zadań wymagających mniejszej inteligencji.

Wypróbuj w Google AI Studio

Szczegóły modelu

Właściwość Opis
Kod modelu models/gemini-1.5-flash-8b
Obsługiwane typy danych

Wejścia

Dźwięk, obraz, film i tekst

Dane wyjściowe

Tekst

Limity tokenów[*]

Limit tokenów wejściowych

1 048 576

Limit tokenów wyjściowych

8192

Specyfikacja audiowizualna

Maksymalna liczba obrazów na prompt

3,600

Maksymalna długość filmu

1 godzina

Maksymalna długość dźwięku

Około 9,5 godziny

Instrukcje dotyczące systemu

Obsługiwane

Tryb JSON

Obsługiwane

Schemat JSON

Obsługiwane

Dostosowywanie ustawień bezpieczeństwa

Obsługiwane

Pamięć podręczna

Obsługiwane

Dostrajanie

Obsługiwane

Wywoływanie funkcji

Obsługiwane

Wykonywanie kodu

Obsługiwane

Live API

Nieobsługiwane

Wersje
Aby dowiedzieć się więcej, zapoznaj się z wzorami wersji modelu.
  • Najnowsze: gemini-1.5-flash-8b-latest
  • Najnowsza stabilna wersja: gemini-1.5-flash-8b
  • Stabilny:
    • gemini-1.5-flash-8b-001
Ostatnia aktualizacja Październik 2024 r.

Gemini 1.5 Pro

Wypróbuj przedpremierową wersję Gemini 2.5 Pro, nasz najbardziej zaawansowany model Gemini do tej pory.

Gemini 1.5 Pro to średniej wielkości multimodalny model zoptymalizowany do wykonywania wielu zadań wymagających wnioskowania. Wersja 1.5 Pro może przetwarzać duże ilości danych jednocześnie, w tym 2 godziny filmu, 19 godzin dźwięku, bazy kodów zawierające 60 tys. linii kodu lub 2000 stron tekstu.

Wypróbuj w Google AI Studio

Szczegóły modelu

Właściwość Opis
Kod modelu models/gemini-1.5-pro
Obsługiwane typy danych

Wejścia

Dźwięk, obraz, film i tekst

Dane wyjściowe

Tekst

Limity tokenów[*]

Limit tokenów wejściowych

2 097 152

Limit tokenów wyjściowych

8192

Specyfikacja audiowizualna

Maksymalna liczba obrazów na prompt

7200

Maksymalna długość filmu

2 godziny

Maksymalna długość dźwięku

Około 19 godzin

Instrukcje dotyczące systemu

Obsługiwane

Tryb JSON

Obsługiwane

Schemat JSON

Obsługiwane

Dostosowywanie ustawień bezpieczeństwa

Obsługiwane

Pamięć podręczna

Obsługiwane

Dostrajanie

Nieobsługiwane

Wywoływanie funkcji

Obsługiwane

Wykonywanie kodu

Obsługiwane

Live API

Nieobsługiwane

Wersje
Aby dowiedzieć się więcej, zapoznaj się z wzorami wersji modelu.
  • Najnowsze: gemini-1.5-pro-latest
  • Najnowsza stabilna wersja: gemini-1.5-pro
  • Stabilny:
    • gemini-1.5-pro-001
    • gemini-1.5-pro-002
Ostatnia aktualizacja Wrzesień 2024 r.

Imagen 3

Imagen 3 to nasz model do zamiany tekstu na grafikę najwyższej jakości, który potrafi generować obrazy o jeszcze lepszych szczegółach, bogatszym oświetleniu i mniejszej liczbie rozpraszających artefaktów niż nasze poprzednie modele.

Szczegóły modelu
Właściwość Opis
Kod modelu

Gemini API

imagen-3.0-generate-002

Obsługiwane typy danych

Wejście

Tekst

Dane wyjściowe

Obrazy

Limity tokenów[*]

Limit tokenów wejściowych

Nie dotyczy

Wyjście – obrazy

Do 4

Ostatnia aktualizacja Luty 2025 r.

Veo 2

Veo 2 to nasz model do generowania filmów na podstawie tekstu i obrazów, który potrafi tworzyć szczegółowe filmy, zachowując artystyczne niuanse promptów.

Szczegóły modelu
Właściwość Opis
Kod modelu

Gemini API

veo-2.0-generate-001

Obsługiwane typy danych

Wejście

Tekst, obraz

Dane wyjściowe

Wideo

Ograniczenia

Tekst

Nie dotyczy

Wejście obrazowe

dowolna rozdzielczość i współczynnik proporcji, rozmiar pliku do 20 MB;

Film wyjściowy

Do 2

Ostatnia aktualizacja Kwiecień 2025 r.

Gemini 2.0 Flash Live

Model Gemini 2.0 Flash Live współpracuje z interfejsem Live API, aby umożliwić dwukierunkowe interakcje z użyciem głosu i wideo z niewielkimi opóźnieniami dzięki Gemini. Model może przetwarzać dane wejściowe w postaci tekstu, dźwięku i obrazu oraz generować dane wyjściowe w postaci tekstu i dźwięku.

Wypróbuj w Google AI Studio

Szczegóły modelu

Właściwość Opis
Kod modelu models/gemini-2.0-flash-live-001
Obsługiwane typy danych

Wejścia

Dźwięk, obraz i tekst

Dane wyjściowe

tekst i dźwięk;

Limity tokenów[*]

Limit tokenów wejściowych

1 048 576

Limit tokenów wyjściowych

8192

Wyjścia uporządkowane

Obsługiwane

Dostrajanie

Nieobsługiwane

Wywoływanie funkcji

Obsługiwane

Wykonywanie kodu

Obsługiwane

Wyszukiwarka

Obsługiwane

Generowanie obrazów

Nieobsługiwane

Generowanie dźwięku

Obsługiwane

Myślący

Nieobsługiwane

Wersje
Aby dowiedzieć się więcej, zapoznaj się z wzorami wersji modelu.
  • Podgląd: gemini-2.0-flash-live-001
Ostatnia aktualizacja Kwiecień 2025 r.
Granica wiedzy Sierpień 2024 r.

Gemini Embedding Experimental

Gemini embedding osiąga najwyższą skuteczność w wielu kluczowych wymiarach, w tym w przypadku kodu, wielojęzyczności i wyszukiwania. Limity szybkości umieszczania treści w Gemini są bardziej restrykcyjne, ponieważ jest to model eksperymentalny.

Szczegóły modelu
Właściwość Opis
Kod modelu

Gemini API

gemini-embedding-exp-03-07

Obsługiwane typy danych

Wejście

Tekst

Dane wyjściowe

wektory tekstowe,

Limity tokenów[*]

Limit tokenów wejściowych

8192

Rozmiar wymiaru wyjściowego

Elastyczne, obsługuje: 3072, 1536 lub 768

Ostatnia aktualizacja Marzec 2025 r.

Wektory dystrybucyjne tekstu

Wstawianie tekstu

Wypróbuj nasz nowy eksperymentalny model osadzania Gemini, który osiąga najnowocześniejsze wyniki.

Wkłady tekstowe służą do pomiaru podobieństwa ciągów znaków i są powszechnie stosowane w wielu zastosowaniach AI.

text-embedding-004 osiąga lepszą skuteczność wyszukiwania i przewyższa wyniki dotychczasowych modeli przy porównywalnych wymiarach w ramach standardowych testów porównawczych MTEB.

Szczegóły modelu
Właściwość Opis
Kod modelu

Gemini API

models/text-embedding-004

Obsługiwane typy danych

Wejście

Tekst

Dane wyjściowe

wektory tekstowe,

Limity tokenów[*]

Limit tokenów wejściowych

2048

Rozmiar wymiaru wyjściowego

768

Limity oceny[**] 1500 żądań na minutę
dostosowane ustawienia bezpieczeństwa Nieobsługiwane
Ostatnia aktualizacja Kwiecień 2024 r.

Umieszczanie

Możesz użyć modelu embeddingu, aby wygenerować embeddingi tekstu dla tekstu wejściowego.

Model embeddingu jest zoptymalizowany pod kątem tworzenia embeddingów o 768 wymiarach w przypadku tekstu zawierającego do 2048 tokenów.

Szczegóły modelu wektora dystrybucyjnego
Właściwość Opis
Kod modelu models/embedding-001
Obsługiwane typy danych

Wejście

Tekst

Dane wyjściowe

wektory tekstowe,

Limity tokenów[*]

Limit tokenów wejściowych

2048

Rozmiar wymiaru wyjściowego

768

Limity oceny[**] 1500 żądań na minutę
dostosowane ustawienia bezpieczeństwa Nieobsługiwane
Ostatnia aktualizacja Grudzień 2023 r.

AQA

Model AQA możesz wykorzystać do wykonywania zadań związanych z przypisywaniem odpowiedzi na pytania (AQA) na podstawie dokumentu, korpusie lub zbioru fragmentów. Model AQA zwraca odpowiedzi na pytania oparte na podanych źródłach wraz z oszacowaniem prawdopodobieństwa odpowiedzi.

Szczegóły modelu

Właściwość Opis
Kod modelu models/aqa
Obsługiwane typy danych

Wejście

Tekst

Dane wyjściowe

Tekst

Obsługiwany język angielski
Limity tokenów[*]

Limit tokenów wejściowych

7168

Limit tokenów wyjściowych

1024

Limity oceny[**] 1500 żądań na minutę
dostosowane ustawienia bezpieczeństwa Obsługiwane
Ostatnia aktualizacja Grudzień 2023 r.

Aby poznać możliwości tych wariantów modeli, zapoznaj się z przykładami.

[*] Token ma około 4 znaków w przypadku modeli Gemini. 100 tokenów to około 60–80 słów po angielsku.

Wzorce nazw wersji modelu

Modele Gemini są dostępne w wersjach testowej, stabilnej i eksperymentalnej. Aby określić, którego modelu i której wersji chcesz użyć, możesz użyć w kodzie jednego z tych formatów nazwy modelu.

  • Najnowsza stabilna wersja: wskazuje najnowszą stabilną wersję opublikowaną dla określonego pokolenia i wariantu modelu.

    Aby określić najnowszą stabilną wersję, użyj tego wzoru: <model>-<generation>-<variation>. Na przykład: gemini-2.0-flash.

  • Stabilny: wskazuje konkretny stabilny model. Stabilne modele zwykle się nie zmieniają. Większość produkcyjnych aplikacji powinna używać konkretnego stabilnego modelu.

    Aby określić wersję stabilną, użyj tego wzoru: <model>-<generation>-<variation>-<version>. Na przykład: gemini-2.0-flash-001.

  • Podgląd: wskazuje model podglądu, który może nie być odpowiedni do użytku produkcyjnego, może mieć bardziej restrykcyjne limity stawek, ale może mieć włączone rozliczenia.

    Aby określić wersję podglądu, użyj tego wzoru:<model>-<generation>-<variation>-<version>. Na przykład: gemini-2.5-pro-preview-03-25.

  • Eksperymentalny: wskazuje na model eksperymentalny, który może nie nadawać się do użytku produkcyjnego i być objęty bardziej restrykcyjnymi limitami stawek. Publikujemy modele eksperymentalne, aby zbierać opinie i szybko udostępniać najnowsze aktualizacje deweloperom.

    Aby określić wersję eksperymentalną, użyj tego wzoru:<model>-<generation>-<variation>-<version>. Na przykład: gemini-2.0-pro-exp-02-05.

Modele eksperymentalne

Oprócz stabilnych modeli interfejs Gemini API oferuje modele eksperymentalne, które mogą nie nadawać się do użytku produkcyjnego i mieć bardziej restrykcyjne limity szybkości.

Stale udostępniamy modele eksperymentalne, aby zbierać opinie, szybko przekazywać deweloperom najnowsze aktualizacje i pokazywać tempo wprowadzania innowacji w Google. Dzięki opiniom użytkowników możemy wprowadzać kolejne ulepszenia, a udostępniając wcześniej modele eksperymentalne, możemy lepiej przygotować się na ich szersze wdrożenie. Model eksperymentalny może zostać zastąpiony innym bez wcześniejszego powiadomienia. Nie możemy zagwarantować, że model eksperymentalny stanie się w przyszłości modelem stabilnym.

Wcześniejsze modele eksperymentalne

Gdy pojawiają się nowe wersje lub stabilne wydania, usuwamy eksperymentalne modele i zastępujemy je nowymi. W sekcji poniżej znajdziesz poprzednie eksperymentalne modele wraz z wersją zastępczą:

Kod modelu Model podstawowy Wersja zastępcza
gemini-2.0-flash-thinking-exp-01-21 Gemini 2.5 Flash gemini-2.5-flash-preview-04-17
gemini-2.0-pro-exp-02-05 Gemini 2.0 Pro Experimental gemini-2.5-pro-preview-03-25
gemini-2.0-flash-exp Gemini 2.0 Flash gemini-2.0-flash
gemini-exp-1206 Gemini 2.0 Pro gemini-2.0-pro-exp-02-05
gemini-2.0-flash-thinking-exp-1219 Gemini 2.0 Flash Thinking gemini-2.0-flash-thinking-exp-01-21
gemini-exp-1121 Gemini gemini-exp-1206
gemini-exp-1114 Gemini gemini-exp-1206
gemini-1.5-pro-exp-0827 Gemini 1.5 Pro gemini-exp-1206
gemini-1.5-pro-exp-0801 Gemini 1.5 Pro gemini-exp-1206
gemini-1.5-flash-8b-exp-0924 Gemini 1.5 Flash-8B gemini-1.5-flash-8b
gemini-1.5-flash-8b-exp-0827 Gemini 1.5 Flash-8B gemini-1.5-flash-8b

Obsługiwane języki

Modele Gemini są trenowane pod kątem tych języków:

  • arabski (ar),
  • bengali (bn)
  • bułgarski (bg),
  • chiński uproszczony i tradycyjny (zh),
  • Chorwacki (hr)
  • czeski (cs)
  • duński (da),
  • Holenderski (nl)
  • Angielski (en)
  • estoński (et),
  • fiński (fi),
  • Francuski (fr)
  • Niemiecki (de)
  • grecki (el)
  • hebrajski (iw),
  • hindi (hi),
  • węgierski (hu),
  • indonezyjski (id),
  • włoski (it),
  • japoński (ja)
  • koreański (ko)
  • łotewski (lv),
  • litewski (lt),
  • norweski (no),
  • Polski (pl)
  • portugalski (pt),
  • rumuński (ro)
  • rosyjski (ru),
  • serbski (sr)
  • słowacki (sk)
  • słoweński (sl),
  • hiszpański (es),
  • suahili (sw),
  • szwedzki (sv)
  • tajski (th),
  • turecki (tr),
  • ukraiński (uk)
  • wietnamski (vi),