Rodzina otwartych modeli Gemma obejmuje różne rozmiary, możliwości i warianty wyspecjalizowane w określonych zadaniach, co ułatwia tworzenie niestandardowych rozwiązań generatywnych. Oto główne ścieżki, które możesz obrać podczas korzystania z modeli Gemma w aplikacji:
- Wybierz model i wdroż go w aplikacji w niezmienionej postaci.
- Wybierz model, dostosuj go do konkretnego zadania, a następnie wdróż go w aplikacji lub udostępnij społeczności.
Z tego przewodnika dowiesz się, jak wybrać model, przetestować jego możliwości i opcjonalnie dostosować wybrany model do swojej aplikacji.
Pobierz w Kaggle Pobierz w Hugging Face
Wybierz model
Ta sekcja pomoże Ci poznać oficjalne warianty modeli z rodziny Gemma i wybrać model do swojej aplikacji. Warianty modelu zapewniają ogólne możliwości lub są wyspecjalizowane w wykonywaniu konkretnych zadań. Są one dostępne w różnych rozmiarach parametrów, dzięki czemu możesz wybrać model, który ma preferowane przez Ciebie możliwości i spełnia Twoje wymagania dotyczące mocy obliczeniowej.
W tabeli poniżej znajdziesz główne warianty rodziny modeli Gemma i platformy, na których są przeznaczone do wdrażania:
Gemma 4 Family
Najnowsza generacja z wejściami multimodalnymi (tekst, obraz, dźwięk).
| Rozmiar | Wariant | Dane wejściowe ➔ dane wyjściowe | Platforma docelowa |
|---|---|---|---|
| E2B | Gemma 4 (podstawowa) | Tekst, obrazy, dźwięk ➔ tekst | Urządzenia mobilne |
| E4B | Gemma 4 (podstawowa) | Tekst, obrazy, dźwięk ➔ tekst | Urządzenia mobilne i laptopy |
| A4B | Gemma 4 (podstawowa) | Tekst, obrazy ➔ Tekst | Komputery stacjonarne i małe serwery |
| 31B | Gemma 4 (podstawowa) | Tekst, obrazy ➔ Tekst | Duże serwery lub klastry serwerów |
Gemma 3 i 3n
Modele podstawowe do skalowalnego przetwarzania tekstu i obrazów oraz warianty „3n” do obsługi rozszerzonych danych wejściowych multimodalnych.
| Rozmiar | Wariant | Dane wejściowe ➔ dane wyjściowe | Platforma docelowa |
|---|---|---|---|
| 270 M | Gemma 3 (rdzeń) | Tekst ➔ Tekst | Urządzenia mobilne i komputery jednopłytkowe |
| 1B | Gemma 3 (rdzeń) | Tekst ➔ Tekst | Urządzenia mobilne i komputery jednopłytkowe |
| E2B | Gemma 3n | Tekst, obrazy, dźwięk ➔ tekst | Urządzenia mobilne |
| 4B | Gemma 3 (rdzeń) | Tekst, obrazy ➔ Tekst | Komputery stacjonarne i małe serwery |
| E4B | Gemma 3n | Tekst, obrazy, dźwięk ➔ tekst | Urządzenia mobilne i laptopy |
| 12 mld | Gemma 3 (rdzeń) | Tekst, obrazy ➔ Tekst | Komputery stacjonarne i serwery z wyższej półki |
| 27B | Gemma 3 (rdzeń) | Tekst, obrazy ➔ Tekst | Duże serwery lub klastry serwerów |
Gemma 2 Family
Obejmuje standardowe modele tekstowe i warianty multimodalnego modelu wizualno-językowego PaliGemma 2.
| Rozmiar | Wariant | Dane wejściowe ➔ dane wyjściowe | Platforma docelowa |
|---|---|---|---|
| 2B | Gemma 2 (rdzeń) | Tekst ➔ Tekst | Urządzenia mobilne i laptopy |
| 3B | PaliGemma 2 | Tekst, obrazy ➔ Tekst | Komputery stacjonarne i małe serwery |
| 9B | Gemma 2 (rdzeń) | Tekst ➔ Tekst | Komputery stacjonarne i serwery z wyższej półki |
| 10B | PaliGemma 2 | Tekst, obrazy ➔ Tekst | Komputery stacjonarne i serwery z wyższej półki |
| 27B | Gemma 2 (rdzeń) | Tekst ➔ Tekst | Duże serwery lub klastry serwerów |
| 28 mld | PaliGemma 2 | Tekst, obrazy ➔ Tekst | Duże serwery lub klastry serwerów |
Gemma 1 Family
Oryginalna generacja, w tym warianty przeznaczone do kodowania.
| Rozmiar | Wariant | Dane wejściowe ➔ dane wyjściowe | Platforma docelowa |
|---|---|---|---|
| 2B | Gemma (podstawowa) CodeGemma |
Tekst ➔ Tekst | Urządzenia mobilne i laptopy |
| 7B | Gemma (podstawowa) CodeGemma |
Tekst ➔ Tekst | Komputery stacjonarne i małe serwery |
Rodzina modeli Gemma obejmuje też modele specjalnego przeznaczenia i modele badawcze, w tym ShieldGemma, DataGemma, Gemma Scope i Gemma-APS.
Modele testowe
Modele Gemma możesz przetestować, konfigurując środowisko programistyczne z pobranym modelem i odpowiednim oprogramowaniem. Następnie możesz przekazać modelowi prompta i ocenić jego odpowiedzi. Aby skonfigurować środowisko testowe i utworzyć prompta dla modelu Gemma, użyj jednego z tych notatników Pythona z wybranym frameworkiem uczenia maszynowego:
Dostrajanie modeli
Działanie modeli Gemma możesz zmienić, dostrajając je. Dostrajanie modelu wymaga zbioru danych wejściowych i oczekiwanych odpowiedzi o odpowiedniej wielkości i różnorodności, aby kierować zachowaniem modelu. W porównaniu z uruchamianiem modelu Gemma do generowania tekstu, uruchomienie dostrajania wymaga znacznie większych zasobów obliczeniowych i pamięci. Aby skonfigurować środowisko programistyczne do dostrajania i dostroić model Gemma, użyj jednego z tych notatników w Pythonie:
- Dostrajanie modelu Gemma za pomocą Keras i dostrajania LoRA
- Dostrajanie większych modeli Gemma za pomocą trenowania rozproszonego
Następne kroki
Zapoznaj się z tymi przewodnikami, aby tworzyć więcej rozwiązań z użyciem Gemy: