Rodzina otwartych modeli Gemma obejmuje różne rozmiary, możliwości i warianty wyspecjalizowane w określonych zadaniach, co ułatwia tworzenie niestandardowych rozwiązań generatywnych. Oto główne ścieżki, które możesz obrać podczas korzystania z modeli Gemma w aplikacji:
- Wybierz model i wdroż go w aplikacji w niezmienionej postaci.
- Wybierz model, dostosuj go do konkretnego zadania, a następnie wdróż go w aplikacji lub udostępnij społeczności.
Z tego przewodnika dowiesz się, jak wybrać model, przetestować jego możliwości i opcjonalnie dostosować wybrany model do swojej aplikacji.
Pobierz w Kaggle Pobierz w Hugging Face
Wybierz model
Z tej sekcji dowiesz się więcej o oficjalnych wariantach modeli z rodziny Gemma i wybierzesz model do swojej aplikacji. Warianty modeli zapewniają ogólne możliwości lub są wyspecjalizowane w wykonywaniu konkretnych zadań. Są one dostępne w różnych rozmiarach parametrów, dzięki czemu możesz wybrać model, który ma preferowane przez Ciebie możliwości i spełnia Twoje wymagania dotyczące mocy obliczeniowej.
Lista modeli Gemma
W tabeli poniżej znajdziesz główne warianty rodziny modeli Gemma i platformy, na których są przeznaczone do wdrażania:
| Rozmiar parametru | Wejście | Dane wyjściowe | Wersja | Fundacja | Platformy docelowe |
|---|---|---|---|---|---|
| 270 MLN | Tekst | Tekst | Gemma 3 | Urządzenia mobilne i komputery jednopłytkowe | |
| 1B | Tekst | Tekst | Gemma 3 | Urządzenia mobilne i komputery jednopłytkowe | |
| E2B | Tekst, obrazy, dźwięk | Tekst | Gemma 3n | Urządzenia mobilne | |
| 2B | Tekst | Tekst | Gemma 2 | Urządzenia mobilne i laptopy | |
| Gemma 1 | |||||
| 3 MLD | Tekst, obrazy | Tekst | Gemma 2 | Komputery stacjonarne i małe serwery | |
| E4B | Tekst, obrazy, dźwięk | Tekst | Gemma 3n | Urządzenia mobilne i laptopy | |
| 4B | Tekst, obrazy | Tekst | Gemma 3 | Komputery stacjonarne i małe serwery | |
| 7B | Tekst | Tekst | Gemma 1 | Komputery stacjonarne i małe serwery | |
| 9B | Tekst | Tekst | Gemma 2 | Komputery stacjonarne i serwery z wyższej półki | |
| 10 mld | Tekst, obrazy | Tekst | Gemma 2 | Komputery stacjonarne i serwery z wyższej półki | |
| 12B | Tekst, obrazy | Tekst | Gemma 3 | Komputery stacjonarne i serwery z wyższej półki | |
| 27B | Tekst, obrazy | Tekst | Gemma 3 | Duże serwery lub klastry serwerów | |
| Tekst | Tekst | Gemma 2 | |||
| 28B | Tekst, obrazy | Tekst | Gemma 2 | Duże serwery lub klastry serwerów |
Rodzina modeli Gemma obejmuje też modele specjalnego przeznaczenia i modele badawcze, w tym ShieldGemma, DataGemma, Gemma Scope i Gemma-APS.
Testowanie modeli
Modele Gemma możesz przetestować, konfigurując środowisko deweloperskie z pobranym modelem i oprogramowaniem pomocniczym. Następnie możesz wydać modelowi polecenie i ocenić jego odpowiedzi. Aby skonfigurować środowisko testowe i wydać polecenie modelowi Gemma, użyj jednego z tych notatników Pythona z wybraną platformą uczenia maszynowego:
Dostrajanie modeli
Działanie modeli Gemma możesz zmienić, dostrajając je. Dostrajanie modelu wymaga zbioru danych wejściowych i oczekiwanych odpowiedzi o odpowiedniej wielkości i różnorodności, aby kierować zachowaniem modelu. W porównaniu z uruchamianiem modelu Gemma do generowania tekstu, uruchomienie dostrajania wymaga znacznie większych zasobów obliczeniowych i pamięci. Aby skonfigurować środowisko programistyczne do dostrajania i dostroić model Gemma, użyj jednego z tych notatników w Pythonie:
- Dostrajanie modelu Gemma za pomocą Keras i dostrajania LoRA
- Dostrajanie większych modeli Gemma za pomocą trenowania rozproszonego
Następne kroki
Zapoznaj się z tymi przewodnikami, aby tworzyć więcej rozwiązań z Gemma: