Começar a usar os modelos Gemma

A família de modelos abertos do Gemma inclui uma variedade de tamanhos, recursos e variações especializadas em tarefas para ajudar você a criar soluções generativas personalizadas. Estes são os principais caminhos que você pode seguir ao usar modelos da Gemma em um aplicativo:

  • Selecione um modelo e implante-o como está no seu aplicativo.
  • Selecione um modelo, ajuste-o para uma tarefa específica e implante-o em um aplicativo ou compartilhe com a comunidade.

Este guia ajuda você a escolher um modelo, testar os recursos dele e, opcionalmente, ajustar o modelo selecionado para seu aplicativo.

Disponível no Kaggle Disponível no Hugging Face

Escolher um modelo

Esta seção ajuda você a entender as variantes oficiais da família de modelos Gemma e selecionar um modelo para seu aplicativo. As variantes de modelo oferecem recursos gerais ou são especializadas para tarefas específicas e são fornecidas em diferentes tamanhos de parâmetros para que você possa escolher um modelo com os recursos preferidos e que atenda aos seus requisitos de computação.

A tabela a seguir lista as principais variantes da família de modelos Gemma e as plataformas de implantação pretendidas:

Família Gemma 4

A geração mais recente com entradas multimodais (texto, imagem, áudio).

Tamanho Variante Entrada ➔ Saída Plataforma pretendida
E2B Gemma 4 (principal) Texto, imagens, áudio ➔ Texto Dispositivos móveis
E4B Gemma 4 (principal) Texto, imagens, áudio ➔ Texto Dispositivos móveis e laptops
A4B Gemma 4 (principal) Texto, imagens ➔ Texto Computadores desktop e pequenos servidores
31B Gemma 4 (principal) Texto, imagens ➔ Texto Servidores ou clusters de servidores grandes

Família Gemma 3 e 3n

Modelos principais para processamento escalonável de texto e imagens, além de variantes "3n" para entradas multimodais expandidas.

Tamanho Variante Entrada ➔ Saída Plataforma pretendida
270 mi Gemma 3 (principal) Texto ➔ Texto Dispositivos móveis e computadores de placa única
1B Gemma 3 (principal) Texto ➔ Texto Dispositivos móveis e computadores de placa única
E2B Gemma 3n Texto, imagens, áudio ➔ Texto Dispositivos móveis
4B Gemma 3 (principal) Texto, imagens ➔ Texto Computadores desktop e pequenos servidores
E4B Gemma 3n Texto, imagens, áudio ➔ Texto Dispositivos móveis e laptops
12B Gemma 3 (principal) Texto, imagens ➔ Texto Computadores desktop e servidores mais avançados
27B Gemma 3 (principal) Texto, imagens ➔ Texto Servidores ou clusters de servidores grandes

Família Gemma 2

Inclui modelos de texto padrão e as variantes multimodais de linguagem/visão do PaliGemma 2.

Tamanho Variante Entrada ➔ Saída Plataforma pretendida
2 bi Gemma 2 (principal) Texto ➔ Texto Dispositivos móveis e laptops
3B PaliGemma 2 Texto, imagens ➔ Texto Computadores desktop e pequenos servidores
9B Gemma 2 (principal) Texto ➔ Texto Computadores desktop e servidores mais avançados
10B PaliGemma 2 Texto, imagens ➔ Texto Computadores desktop e servidores mais avançados
27B Gemma 2 (principal) Texto ➔ Texto Servidores ou clusters de servidores grandes
28B PaliGemma 2 Texto, imagens ➔ Texto Servidores ou clusters de servidores grandes

Família Gemma 1

A geração original, incluindo variantes específicas de programação.

Tamanho Variante Entrada ➔ Saída Plataforma pretendida
2 bi Gemma (principal)
CodeGemma
Texto ➔ Texto Dispositivos móveis e laptops
7B Gemma (principal)
CodeGemma
Texto ➔ Texto Computadores desktop e pequenos servidores

A família de modelos Gemma também inclui modelos de pesquisa e para fins especiais, como ShieldGemma, DataGemma, Gemma Scope e Gemma-APS.

Testar modelos

Para testar os modelos Gemma, configure um ambiente de desenvolvimento com um modelo baixado e um software compatível. Depois, você pode fazer solicitações ao modelo e avaliar as respostas. Use um dos notebooks Python a seguir com seu framework de machine learning preferido para configurar um ambiente de teste e enviar uma solicitação a um modelo do Gemma:

Ajustar modelos

É possível mudar o comportamento dos modelos da Gemma ajustando-os. Para ajustar um modelo, é necessário um conjunto de dados de entradas e respostas esperadas de tamanho e variação suficientes para orientar o comportamento do modelo. Você também precisa de muito mais recursos de computação e memória para concluir uma execução de ajuste em comparação com a execução de um modelo Gemma para geração de texto. Use um dos seguintes notebooks Python para configurar um ambiente de desenvolvimento de ajuste e ajustar um modelo do Gemma:

Próximas etapas

Confira estes guias para criar mais soluções com a Gemma: