Gemma 4 została udostępniona z możliwością wprowadzania tekstu, dźwięku i obrazów oraz długim oknem kontekstu (do 256 tys. tokenów). Więcej informacji

Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Pierwsze kroki z modelami Gemma

Rodzina otwartych modeli Gemma obejmuje różne rozmiary, możliwości i warianty wyspecjalizowane w określonych zadaniach, co ułatwia tworzenie niestandardowych rozwiązań generatywnych. Oto główne ścieżki, które możesz obrać podczas korzystania z modeli Gemma w aplikacji:

Wybierz model i wdroż go w aplikacji w niezmienionej postaci.
Wybierz model, dostosuj go do konkretnego zadania, a następnie wdróż go w aplikacji lub udostępnij społeczności.

Z tego przewodnika dowiesz się, jak wybrać model, przetestować jego możliwości i opcjonalnie dostosować wybrany model do swojej aplikacji.

Pobierz w Kaggle Pobierz w Hugging Face

Wybierz model

Ta sekcja pomoże Ci poznać oficjalne warianty modeli z rodziny Gemma i wybrać model do swojej aplikacji. Warianty modelu zapewniają ogólne możliwości lub są wyspecjalizowane w wykonywaniu konkretnych zadań. Są one dostępne w różnych rozmiarach parametrów, dzięki czemu możesz wybrać model, który ma preferowane przez Ciebie możliwości i spełnia Twoje wymagania dotyczące mocy obliczeniowej.

W tabeli poniżej znajdziesz główne warianty rodziny modeli Gemma i platformy, na których są przeznaczone do wdrażania:

Gemma 4 Family

Najnowsza generacja z wejściami multimodalnymi (tekst, obraz, dźwięk).

Rozmiar	Wariant	Dane wejściowe ➔ dane wyjściowe	Platforma docelowa
E2B	Gemma 4 (podstawowa)	Tekst, obrazy, dźwięk ➔ tekst	Urządzenia mobilne
E4B	Gemma 4 (podstawowa)	Tekst, obrazy, dźwięk ➔ tekst	Urządzenia mobilne i laptopy
A4B	Gemma 4 (podstawowa)	Tekst, obrazy ➔ Tekst	Komputery stacjonarne i małe serwery
31B	Gemma 4 (podstawowa)	Tekst, obrazy ➔ Tekst	Duże serwery lub klastry serwerów

Gemma 3 i 3n

Modele podstawowe do skalowalnego przetwarzania tekstu i obrazów oraz warianty „3n” do obsługi rozszerzonych danych wejściowych multimodalnych.

Rozmiar	Wariant	Dane wejściowe ➔ dane wyjściowe	Platforma docelowa
270 M	Gemma 3 (rdzeń)	Tekst ➔ Tekst	Urządzenia mobilne i komputery jednopłytkowe
1B	Gemma 3 (rdzeń)	Tekst ➔ Tekst	Urządzenia mobilne i komputery jednopłytkowe
E2B	Gemma 3n	Tekst, obrazy, dźwięk ➔ tekst	Urządzenia mobilne
4B	Gemma 3 (rdzeń)	Tekst, obrazy ➔ Tekst	Komputery stacjonarne i małe serwery
E4B	Gemma 3n	Tekst, obrazy, dźwięk ➔ tekst	Urządzenia mobilne i laptopy
12 mld	Gemma 3 (rdzeń)	Tekst, obrazy ➔ Tekst	Komputery stacjonarne i serwery z wyższej półki
27B	Gemma 3 (rdzeń)	Tekst, obrazy ➔ Tekst	Duże serwery lub klastry serwerów

Gemma 2 Family

Obejmuje standardowe modele tekstowe i warianty multimodalnego modelu wizualno-językowego PaliGemma 2.

Rozmiar	Wariant	Dane wejściowe ➔ dane wyjściowe	Platforma docelowa
2B	Gemma 2 (rdzeń)	Tekst ➔ Tekst	Urządzenia mobilne i laptopy
3B	PaliGemma 2	Tekst, obrazy ➔ Tekst	Komputery stacjonarne i małe serwery
9B	Gemma 2 (rdzeń)	Tekst ➔ Tekst	Komputery stacjonarne i serwery z wyższej półki
10B	PaliGemma 2	Tekst, obrazy ➔ Tekst	Komputery stacjonarne i serwery z wyższej półki
27B	Gemma 2 (rdzeń)	Tekst ➔ Tekst	Duże serwery lub klastry serwerów
28 mld	PaliGemma 2	Tekst, obrazy ➔ Tekst	Duże serwery lub klastry serwerów

Gemma 1 Family

Oryginalna generacja, w tym warianty przeznaczone do kodowania.

Rozmiar	Wariant	Dane wejściowe ➔ dane wyjściowe	Platforma docelowa
2B	Gemma (podstawowa) CodeGemma	Tekst ➔ Tekst	Urządzenia mobilne i laptopy
7B	Gemma (podstawowa) CodeGemma	Tekst ➔ Tekst	Komputery stacjonarne i małe serwery

Rodzina modeli Gemma obejmuje też modele specjalnego przeznaczenia i modele badawcze, w tym ShieldGemma, DataGemma, Gemma Scope i Gemma-APS.

Modele testowe

Modele Gemma możesz przetestować, konfigurując środowisko programistyczne z pobranym modelem i odpowiednim oprogramowaniem. Następnie możesz przekazać modelowi prompta i ocenić jego odpowiedzi. Aby skonfigurować środowisko testowe i utworzyć prompta dla modelu Gemma, użyj jednego z tych notatników Pythona z wybranym frameworkiem uczenia maszynowego:

Dostrajanie modeli

Działanie modeli Gemma możesz zmienić, dostrajając je. Dostrajanie modelu wymaga zbioru danych wejściowych i oczekiwanych odpowiedzi o odpowiedniej wielkości i różnorodności, aby kierować zachowaniem modelu. W porównaniu z uruchamianiem modelu Gemma do generowania tekstu, uruchomienie dostrajania wymaga znacznie większych zasobów obliczeniowych i pamięci. Aby skonfigurować środowisko programistyczne do dostrajania i dostroić model Gemma, użyj jednego z tych notatników w Pythonie:

Następne kroki

Zapoznaj się z tymi przewodnikami, aby tworzyć więcej rozwiązań z użyciem Gemy: