Gemini to rodzina modeli generatywnej AI, która umożliwia deweloperom generowanie treści i rozwiązywanie problemów. Modele te są projektowane i trenowane pod kątem obsłużenia tekstu i obrazów jako danych wejściowych. W tym przewodniku znajdziesz informacje o każdym z wariantów modelu, które pomogą Ci wybrać, który najlepiej pasuje do Twojego przypadku użycia.
Oto krótkie podsumowanie dostępnych modeli i ich możliwości:
Modele | Dane wejściowe | Wyniki |
---|---|---|
Bliskie | ||
|
Tekst i obrazy | Tekst |
|
Tekst | Tekst |
|
Tekst i obrazy | Tekst |
Umieszczanie | ||
|
Tekst | Wektory dystrybucyjne tekstu |
Pobieranie | ||
|
Tekst | Tekst |
Bezpieczeństwo i przeznaczenie
Modele generatywnej sztucznej inteligencji to zaawansowane narzędzia, ale nie są bez ograniczeń. Ich uniwersalność i stosowanie może czasem prowadzić do nieoczekiwanych rezultatów, na przykład niedokładnych, stronniczych lub obraźliwych. Przetwarzanie końcowe i rygorystyczna ocena ręczna mają kluczowe znaczenie w ograniczaniu ryzyka pogorszenia wyników takich produktów. Dodatkowe sugestie dotyczące bezpiecznego użytkowania znajdziesz w wytycznych dotyczących bezpieczeństwa.
Modele udostępniane przez interfejs Gemini API mogą być używane w wielu różnych aplikacjach generatywnej AI i przetwarzania języka naturalnego (NLP). Z tych funkcji można korzystać tylko przez interfejs Gemini API lub aplikację internetową Google AI Studio. Korzystanie z interfejsu Gemini API podlega też Zasadom dotyczącym niedozwolonych zastosowań generatywnej AI oraz Warunkom korzystania z interfejsu API Gemini.
Rozmiary modelu
W tabeli poniżej znajdziesz dostępne rozmiary i ich znaczenie w porównaniu z pozostałymi.
Rozmiar modelu | Opis | Usługi |
---|---|---|
Gemini 1.0 Pro | Rozmiar modelu zapewniający równowagę między możliwościami i wydajnością. |
|
Wersje modelu
Modele Gemini są dostępne w wersjach podglądowych i stabilnych. W kodzie możesz użyć jednego z poniższych formatów nazwy modelu, aby określić, którego modelu i wersji chcesz używać.
Najnowsze: wskazuje najnowocześniejszą wersję modelu na potrzeby określonej generacji i określonej odmiany. Bazowy model jest regularnie aktualizowany i może być wersją przedpremierową. Tego aliasu należy używać tylko w aplikacjach i prototypach do celów testowych.
Aby określić najnowszą wersję, użyj tego wzorca:
<model>-<generation>-<variation>-latest
. Przykład:gemini-1.0-pro-latest
.Najnowsza stabilna: wskazuje najnowszą wersję stabilną opublikowaną na potrzeby określonej generacji modelu i jej odmiany.
Aby określić najnowszą stabilną wersję, użyj tego wzorca:
<model>-<generation>-<variation>
. Na przykład:gemini-1.0-pro
.Stabilna: wskazuje konkretny model stabilny. Modele stabilne nie zmieniają się. Większość aplikacji produkcyjnych powinna używać określonego stabilnego modelu.
Aby określić stabilną wersję, użyj tego wzorca:
<model>-<generation>-<variation>-<version>
. Przykład:gemini-1.0-pro-001
.
Informacje o modelach, które mają wersję stabilną, znajdziesz w wierszu „Nazwy modeli” w sekcji Odmiany modeli.
Odmiany modelu
Interfejs Gemini API udostępnia różne modele zoptymalizowane pod kątem konkretnych przypadków użycia. W tabeli poniżej opisujemy atrybuty każdego z nich.
Różnorodność | Atrybut | Opis |
---|---|---|
Gemini 1.5 Pro (tylko wersja przedpremierowa) | Ostatnia aktualizacja modelu | Kwiecień 2024 r. |
Kod modelu | models/gemini-1.5-pro-latest |
|
Możliwości modelu |
|
|
Obsługiwane metody generowania | generateContent |
|
Limit tokenów wejściowych | 1048576 | |
Limit tokenów wyjściowych | 8192 | |
Bezpieczeństwo modelu | Automatycznie stosowane ustawienia bezpieczeństwa, które deweloperzy mogą zmienić. Więcej informacji znajdziesz w temacie dotyczącym ustawień bezpieczeństwa. | |
Limit żądań | 2 zapytania na minutę, 1000 zapytań dziennie[1] | |
Gemini Pro, | Ostatnia aktualizacja modelu | Luty 2024 r. |
Kod modelu | models/gemini-pro |
|
Możliwości modelu |
|
|
Obsługiwane metody generowania | generateContent |
|
Limit tokenów wejściowych | 30720 | |
Limit tokenów wyjściowych | 2048 | |
Bezpieczeństwo modelu | Automatycznie stosowane ustawienia bezpieczeństwa, które deweloperzy mogą zmienić. Więcej informacji znajdziesz w temacie dotyczącym ustawień bezpieczeństwa. | |
Limit żądań | 60 żądań na minutę [1] | |
Nazwy modeli |
|
|
Gemini 1.0 Pro Vision | Ostatnia aktualizacja modelu | Grudzień 2023 r. |
Kod modelu | models/gemini-pro-vision |
|
Możliwości modelu |
|
|
Obsługiwane metody generowania | generateContent |
|
Limit tokenów wejściowych | 12288 | |
Limit tokenów wyjściowych | 4096 | |
Bezpieczeństwo modelu | Automatycznie stosowane ustawienia bezpieczeństwa, które deweloperzy mogą zmienić. Więcej informacji znajdziesz w temacie dotyczącym ustawień bezpieczeństwa. | |
Limit żądań | 60 żądań na minutę [1] | |
Umieszczanie | Ostatnia aktualizacja modelu | Grudzień 2023 r. |
Kod modelu | models/embedding-001 |
|
Możliwości modelu |
|
|
Obsługiwane metody generowania | embedContent |
|
Bezpieczeństwo modelu | Brak możliwości dostosowania ustawień bezpieczeństwa. | |
Limit żądań | 1500 żądań na minutę [1] | |
Umieszczanie tekstu | Ostatnia aktualizacja modelu | Kwiecień 2024 r. |
Kod modelu | models/text-embedding-004 (text-embedding-preview-0409 w Vertex AI)
|
|
Możliwości modelu |
|
|
Obsługiwane metody generowania | embedContent |
|
Bezpieczeństwo modelu | Brak możliwości dostosowania ustawień bezpieczeństwa. | |
Limit żądań | 1500 żądań na minutę [1] | |
reakcja akustyczna | Ostatnia aktualizacja modelu | Grudzień 2023 r. |
Kod modelu | models/aqa |
|
Możliwości modelu |
|
|
Obsługiwane metody generowania | generateAnswer |
|
Obsługiwane języki | angielski | |
Limit tokenów wejściowych | 7168 | |
Limit tokenów wyjściowych | 1024 | |
Bezpieczeństwo modelu | Automatycznie stosowane ustawienia bezpieczeństwa, które deweloperzy mogą zmienić. Więcej informacji znajdziesz w temacie dotyczącym ustawień bezpieczeństwa. | |
Limit żądań | 60 żądań na minutę [1] |
Możliwości tych wariantów modelu znajdziesz na przykładach.
Metadane modelu
Za pomocą interfejsu API ModelService
możesz uzyskać dodatkowe metadane dotyczące najnowszych modeli, takie jak limity tokenów danych wejściowych i wyjściowych. Tabela poniżej zawiera metadane wariantu modelu Gemini Pro.
Atrybut | Wartość |
---|---|
Wyświetlana nazwa | Gemini 1.0 Pro |
Kod modelu | models/gemini-1.0-pro |
Opis | Model docelowy na potrzeby generowania tekstu |
Obsługiwane metody generowania | generateContent |
Temperatura | 0,9 |
top_p | 1 |
top_k | 1 |
Atrybuty modelu
W tabeli poniżej opisujemy atrybuty modeli Gemini, które są wspólne dla wszystkich odmian.
Atrybut | Opis |
---|---|
Dane treningowe | Termin zbierania wiedzy dla Gemini to początek 2023 roku. Informacje o wydarzeniach po tym czasie są ograniczone. |
Obsługiwane języki | Zobacz dostępne języki |
Konfigurowalne parametry modelu |
|
[1] Ze względu na ograniczenia pojemności podane limity maksymalnej stawki nie są gwarantowane.
Więcej informacji o każdym z tych parametrów znajdziesz w sekcji Parametry modelu we przewodniku Wprowadzenie do modeli LLM.
Dalsze kroki
- Jeśli nie znasz się na tym, jak zacząć, zapoznaj się z krótkim wprowadzeniem do Google AI Studio.
- Aby zacząć korzystać z tego interfejsu API, zapoznaj się z krótkim wprowadzeniem do Pythona.