Omówienie modeli Gemma

Gemma to rodzina lekkiego, nowoczesnego modelu otwartego stworzonego na podstawie tych samych badań i technologii, które posłużyły do stworzenia modeli Gemini. Opracowana przez Google DeepMind i inne zespoły Google nazwa Gemma pochodzi od łacińskiego gemma, czyli kamienia szlachetnego. Wagi modelu Gemma są obsługiwane przez narzędzia dla programistów promujące innowacje, współpracę i odpowiedzialne wykorzystanie sztucznej inteligencji (AI).

Modele Gemma można uruchamiać w aplikacjach oraz na sprzęcie, urządzeniach mobilnych i usługach hostowanych. Możesz też dostosować te modele za pomocą technik dostrajania, tak aby były efektywne w wykonywaniu konkretnych zadań, które są ważne dla Ciebie i użytkowników. Modele Gemma czerpią inspirację z historii modeli z rodziny Gemini i są przeznaczone dla społeczności zajmującej się rozwojem AI.

Chcesz zacząć? Wypróbuj modele Gemma.

Modele wytrenowane i dostrojone w instrukcji

Działanie modeli Gemma można modyfikować przez dodatkowe trenowanie, aby model lepiej radził sobie z określonymi zadaniami. Proces ten nosi nazwę dostrajania i chociaż ta technika zwiększa zdolność modelu do wykonywania określonych zadań, może pogorszyć się również podczas wykonywania innych zadań. Dlatego modele Gemma są dostępne zarówno w wersjach dostrojonych, jak i wstępnie wytrenowanych:

  • Instrukcje dostrojone (IT) – te wersje modelu są trenowane przy użyciu interakcji ludzkich i mogą reagować na konwersacyjne dane wejściowe, podobnie jak na czacie bota.
  • Wstępnie wytrenowane (PT) – te wersje modelu nie są trenowane pod kątem żadnych konkretnych zadań ani instrukcji poza podstawowym zbiorem treningowym Gemma. Nie należy wdrażać tych modeli w aplikacjach bez dostrojenia.

Dalsze kroki

Rozpocznij swoją przygodę z tworzeniem aplikacji z Gemmą od przewodnika Pierwsze kroki z Gemma.