Funkcja groundingu przy użyciu wyszukiwarki Google jest już dostępna. Więcej informacji

Ta strona została przetłumaczona przez Cloud Translation API.

Modele Gemini

1.5 Flash

Nasz najbardziej zrównoważony model multimodalny o wysokiej wydajności w przypadku większości zadań

Wprowadzanie dźwięku, obrazów, filmów i tekstu oraz uzyskiwanie odpowiedzi tekstowych
generować kod, wyodrębniać dane, edytować tekst i wykonywać inne czynności.
Najlepiej sprawdza się w przypadku zadań, w których równoważone są wydajność i koszt.

1.5 Flash-8B

Nasz najszybszy i najbardziej opłacalny model multimodalny o wysokiej wydajności do zadań o wysokiej częstotliwości

Wprowadzanie dźwięku, obrazów, filmów i tekstu oraz uzyskiwanie odpowiedzi tekstowych
generować kod, wyodrębniać dane, edytować tekst i wykonywać inne czynności.
Najlepiej sprawdza się w przypadku zadań o niskiej częstotliwości i wymagających mniejszej inteligencji.

1.5 Pro

Nasz najlepszy model multimodalny z funkcjami do wykonywania różnych zadań związanych z wyciąganiem wniosków

Wprowadzanie dźwięku, obrazów, filmów i tekstu oraz uzyskiwanie odpowiedzi tekstowych
generować kod, wyodrębniać dane, edytować tekst i wykonywać inne czynności.
Gdy potrzebujesz zwiększenia wydajności

Warianty modelu

Gemini API udostępnia różne modele zoptymalizowane pod kątem konkretnych zastosowań. Oto krótki przegląd dostępnych wariantów Gemini:

Wariant modelu	Dane wejściowe	Wyniki	Zoptymalizowany dla
Gemini 1.5 Flash `gemini-1.5-flash`	Dźwięk, obrazy, filmy i tekst	Tekst	szybkie i wszechstronne działanie podczas wykonywania różnych zadań;
Gemini 1.5 Flash-8B `gemini-1.5-flash-8b`	Dźwięk, obrazy, filmy i tekst	Tekst	Zadania o dużej liczbie i mniejszym zaawansowaniu
Gemini 1.5 Pro `gemini-1.5-pro`	Dźwięk, obrazy, filmy i tekst	Tekst	złożone zadania wymagające większej inteligencji;
Gemini 1.0 Pro (wycofane 15.02.2025) `gemini-1.0-pro`	Tekst	Tekst	zadania związane z językiem naturalnym, czat wieloetapowy z tekstem i kodem oraz generowanie kodu;
Wstawianie tekstu `text-embedding-004`	Tekst	wektory tekstowe,	Pomiar podobieństwa ciągów tekstowych
AQA `aqa`	Tekst	Tekst	udzielać odpowiedzi na pytania oparte na źródłach;

Gemini 1.5 Flash

Gemini 1.5 Flash to szybki i wszechstronny model multimodalny do skalowania w różnych zadaniach.

Wypróbuj w AI Studio

Szczegóły modelu

Właściwość	Opis
Kod modelu	`models/gemini-1.5-flash`
Obsługiwane typy danych	Wejścia Dźwięk, obraz, film i tekst Dane wyjściowe Tekst
Limity tokenów^[*]	Limit tokenów wejściowych 1 048 576 Limit tokenów wyjściowych 8192
Specyfikacja audiowizualna	Maksymalna liczba obrazów na prompt 3,600 Maksymalna długość filmu 1 godzina Maksymalna długość dźwięku Około 9,5 godziny
Limity szybkości^[**]	Bezpłatnie: 15 obr./min 1 mln TPM 1500 RSD Pay-as-you-go: 2000 obr./min 4 mln TPM
	Instrukcje dotyczące systemu Obsługiwane Tryb JSON Obsługiwane Schemat JSON Obsługiwane Ustawienia bezpieczeństwa można dostosować Obsługiwane Pamięć podręczna Obsługiwane Dostrajanie Obsługiwane Wywoływanie funkcji Obsługiwane Wykonywanie kodu Obsługiwane
wersje	Aby dowiedzieć się więcej, zapoznaj się z wzorami wersji modelu. Najnowszy: `gemini-1.5-flash-latest` Najnowsza stabilna wersja: `gemini-1.5-flash` Stabilny: `gemini-1.5-flash-001` `gemini-1.5-flash-002` Eksperymentalnie: `gemini-1.5-flash-8b-exp-0924` `gemini-1.5-flash-8b-exp-0827` `gemini-1.5-flash-exp-0827`
Ostatnia aktualizacja	Wrzesień 2024 r.

Gemini 1.5 Flash-8B

Gemini 1.5 Flash-8B to mały model przeznaczony do zadań wymagających mniejszej inteligencji.

Wypróbuj w AI Studio

Szczegóły modelu

Właściwość	Opis
Kod modelu	`models/gemini-1.5-flash-8b`
Obsługiwane typy danych	Wejścia Dźwięk, obraz, film i tekst Dane wyjściowe Tekst
Limity tokenów^[*]	Limit tokenów wejściowych 1 048 576 Limit tokenów wyjściowych 8192
Specyfikacja audiowizualna	Maksymalna liczba obrazów na prompt 3,600 Maksymalna długość filmu 1 godzina Maksymalna długość dźwięku Około 9,5 godziny
Limity szybkości^[**]	Bezpłatnie: 15 obr./min 1 mln TPM 1500 RSD Pay-as-you-go: 4000 obr./min 4 mln TPM
	Instrukcje dotyczące systemu Obsługiwane Tryb JSON Obsługiwane Schemat JSON Obsługiwane Ustawienia bezpieczeństwa można dostosować Obsługiwane Pamięć podręczna Obsługiwane Dostrajanie Obsługiwane Wywoływanie funkcji Obsługiwane Wykonywanie kodu Obsługiwane
wersje	Aby dowiedzieć się więcej, zapoznaj się z wzorami wersji modelu. Najnowszy: `gemini-1.5-flash-8b-latest` Najnowsza stabilna wersja: `gemini-1.5-flash-8b` Stabilny: `gemini-1.5-flash-8b-001`
Ostatnia aktualizacja	Październik 2024 r.

Gemini 1.5 Pro

Gemini 1.5 Pro to średniej wielkości multimodalny model zoptymalizowany pod kątem szerokiego zakresu zadań związanych z wyciąganiem wniosków. Wersja 1.5 Pro może przetwarzać duże ilości danych jednocześnie, w tym 2 godziny filmu, 19 godzin dźwięku, bazy kodów zawierające 60 tys. wierszy kodu lub 2000 stron tekstu.

Wypróbuj w AI Studio

Szczegóły modelu

Właściwość	Opis
Kod modelu	`models/gemini-1.5-pro`
Obsługiwane typy danych	Wejścia Dźwięk, obraz, film i tekst Dane wyjściowe Tekst
Limity tokenów^[*]	Limit tokenów wejściowych 2 097 152 Limit tokenów wyjściowych 8192
Specyfikacja audiowizualna	Maksymalna liczba obrazów na prompt 7200 Maksymalna długość filmu 2 godziny Maksymalna długość dźwięku Około 19 godzin
Limity szybkości^[**]	Bezpłatnie: 2 RPM 32 000 TPM 50 RPD Pay-as-you-go: 1000 obr./min 4 mln TPM
	Instrukcje dotyczące systemu Obsługiwane Tryb JSON Obsługiwane Schemat JSON Obsługiwane Ustawienia bezpieczeństwa można dostosować Obsługiwane Pamięć podręczna Obsługiwane Dostrajanie Nieobsługiwane Wywoływanie funkcji Obsługiwane Wykonywanie kodu Obsługiwane
wersje	Aby dowiedzieć się więcej, zapoznaj się z wzorami wersji modelu. Najnowszy: `gemini-1.5-pro-latest` Najnowsza stabilna wersja: `gemini-1.5-pro` Stabilny: `gemini-1.5-pro-001` `gemini-1.5-pro-002` Eksperymentalnie: `gemini-1.5-pro-exp-0827`
Ostatnia aktualizacja	Wrzesień 2024 r.

Gemini 1.0 Pro (wycofane)

Gemini 1.0 Pro to model NLP, który obsługuje zadania takie jak konwersacje tekstowe i z kodem oraz generowanie kodu.

Wypróbuj w AI Studio

Szczegóły modelu

Właściwość	Opis
Kod modelu	`models/gemini-1.0-pro`
Obsługiwane typy danych	Wejście Tekst Dane wyjściowe Tekst
Limity szybkości^[**]	Bezpłatnie: 15 obr./min 32 000 TPM 1500 RSD Pay-as-you-go: 360 RPM 120 000 TPM 30 000 RSD
	Instrukcje dotyczące systemu Nieobsługiwane Tryb JSON Nieobsługiwane Schemat JSON Nieobsługiwane Ustawienia bezpieczeństwa można dostosować Obsługiwane Pamięć podręczna Nieobsługiwane Dostrajanie Obsługiwane Wywoływanie funkcji Obsługiwane Konfiguracja wywoływania funkcji Nieobsługiwane Wykonywanie kodu Nieobsługiwane
wersje	Najnowszy: `gemini-1.0-pro-latest` Najnowsza stabilna wersja: `gemini-1.0-pro` Stabilny: `gemini-1.0-pro-001`
Ostatnia aktualizacja	Luty 2024 r.

Uwaga: gemini-pro to alias dla gemini-1.0-pro.

Wektory dystrybucyjne tekstu

Wstawianie tekstu

Wkłady tekstowe służą do pomiaru podobieństwa ciągów znaków i są powszechnie stosowane w wielu zastosowaniach AI.

text-embedding-004 osiąga lepszą skuteczność wyszukiwania i przewyższa wyniki dotychczasowych modeli przy porównywalnych wymiarach w standardowych testach porównawczych z wykorzystaniem wbudowanych modeli MTEB.

Szczegóły modelu

Właściwość	Opis
Kod modelu	Gemini API `models/text-embedding-004`
Obsługiwane typy danych	Wejście Tekst Dane wyjściowe wektory tekstowe,
Limity tokenów^[*]	Limit tokenów wejściowych 2048 Rozmiar wymiaru wyjściowego 768
Limity szybkości^[**]	1500 żądań na minutę
ustawienia bezpieczeństwa	Nieobsługiwane
Ostatnia aktualizacja	Kwiecień 2024 r.

Umieszczanie

Możesz użyć modelu embeddingu, aby wygenerować embeddingi tekstu dla tekstu wejściowego.

Model embeddingu jest zoptymalizowany pod kątem tworzenia embeddingów o 768 wymiarach w przypadku tekstu zawierającego do 2048 tokenów.

Szczegóły modelu wektora dystrybucyjnego

Właściwość	Opis
Kod modelu	`models/embedding-001`
Obsługiwane typy danych	Wejście Tekst Dane wyjściowe wektory tekstowe,
Limity tokenów^[*]	Limit tokenów wejściowych 2048 Rozmiar wymiaru wyjściowego 768
Limity szybkości^[**]	1500 żądań na minutę
ustawienia bezpieczeństwa	Nieobsługiwane
Ostatnia aktualizacja	Grudzień 2023 r.

AQA

Model AQA możesz wykorzystać do wykonywania zadań związanych z przypisanym odpowiadaniem na pytania (AQA) na podstawie dokumentu, korpusie lub zbioru fragmentów. Model AQA zwraca odpowiedzi na pytania oparte na podanych źródłach wraz z oszacowaniem prawdopodobieństwa odpowiedzi.

Szczegóły modelu

Właściwość	Opis
Kod modelu	`models/aqa`
Obsługiwane typy danych	Wejście Tekst Dane wyjściowe Tekst
Obsługiwany język	angielski
Limity tokenów^[*]	Limit tokenów wejściowych 7168 Limit tokenów wyjściowych 1024
Limity szybkości^[**]	1500 żądań na minutę
ustawienia bezpieczeństwa	Obsługiwane
Ostatnia aktualizacja	Grudzień 2023 r.

Aby poznać możliwości tych wariantów modelu, zapoznaj się z przykładami.

[*], token to około 4 znaków w przypadku modeli Gemini. 100 tokenów to około 60–80 słów po angielsku.

[**] RPM: żądania na minutę
TPM: tokeny na minutę
RPD: żądania na dzień
TPD: tokeny na dzień

Ze względu na ograniczenia pojemności nie gwarantujemy podanych maksymalnych limitów szybkości.

Wzorce nazw wersji modelu

Modele Gemini są dostępne w wersjach testowej lub stabilnej. W kodzie możesz użyć jednego z tych formatów nazwy modelu, aby określić, którego modelu i której wersji chcesz użyć.

Najnowsza:wskazuje najnowszą wersję modelu dla określonej generacji i wariantu. Model podstawowy jest regularnie aktualizowany i może być wersją podglądową. Tego aliasu powinny używać tylko aplikacje do testów eksploracyjnych i prototypy.

Aby określić najnowszą wersję, użyj tego wzorca: <model>-<generation>-<variation>-latest. Na przykład: gemini-1.0-pro-latest.
Najnowsza stabilna wersja: wskazuje najnowszą stabilną wersję opublikowaną dla określonego pokolenia i wariantu modelu.

Aby określić najnowszą stabilną wersję, użyj tego wzoru: <model>-<generation>-<variation>. Na przykład: gemini-1.0-pro.
Stabilny: wskazuje konkretny stabilny model. Stabilne modele się nie zmieniają. Większość produkcyjnych aplikacji powinna używać konkretnego stabilnego modelu.

Aby określić wersję stabilną, użyj tego wzoru: <model>-<generation>-<variation>-<version>. Na przykład: gemini-1.0-pro-001.
Eksperymentalny: wskazuje model eksperymentalny dostępny w trybie podglądu zgodnie z definicją w Warunkach, co oznacza, że nie jest przeznaczony do użytku w środowisku produkcyjnym. Publikujemy eksperymentalne modele, aby zbierać opinie, szybko udostępniać deweloperom najnowsze aktualizacje i pokazywać tempo wprowadzania innowacji w Google. Informacje, które zdobywamy podczas eksperymentalnego wdrażania, pomagają nam w określaniu sposobu szerszego udostępniania modeli. Model eksperymentalny można zastąpić innym bez wcześniejszego powiadomienia. Nie możemy zagwarantować, że model eksperymentalny stanie się w przyszłości modelem stabilnym.

Aby określić wersję eksperymentalną, użyj tego wzorca:<model>-<generation>-<variation>-<version>. Na przykład: gemini-1.5-pro-exp-0827.

Dostępne języki

Modele Gemini są trenowane pod kątem tych języków:

arabski (ar),
bengali (bn)
bułgarski (bg),
chiński uproszczony i tradycyjny (zh),
Chorwacki (hr)
czeski (cs)
duński (da),
Holenderski (nl)
Angielski (en)
estoński (et),
fiński (fi),
Francuski (fr)
Niemiecki (de)
grecki (el),
hebrajski (iw),
hindi (hi),
węgierski (hu),
indonezyjski (id),
włoski (it),
japoński (ja)
koreański (ko)
łotewski (lv),
litewski (lt),
norweski (no),
Polski (pl)
Portugalski (pt)
rumuński (ro)
rosyjski (ru),
serbski (sr)
słowacki (sk)
słoweński (sl),
hiszpański (es),
suahili (sw),
szwedzki (sv)
tajski (th),
turecki (tr),
ukraiński (uk)
wietnamski (vi)