Gemma 4 lançado com entrada de texto, áudio e imagem e janela de contexto longa de até 256 mil tokens! Saiba mais

Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Começar a usar os modelos Gemma

A família de modelos abertos do Gemma inclui uma variedade de tamanhos, recursos e variações especializadas em tarefas para ajudar você a criar soluções generativas personalizadas. Estes são os principais caminhos que você pode seguir ao usar modelos da Gemma em um aplicativo:

Selecione um modelo e implante-o como está no seu aplicativo.
Selecione um modelo, ajuste-o para uma tarefa específica e implante-o em um aplicativo ou compartilhe com a comunidade.

Este guia ajuda você a escolher um modelo, testar os recursos dele e, opcionalmente, ajustar o modelo selecionado para seu aplicativo.

Disponível no Kaggle Disponível no Hugging Face

Escolher um modelo

Esta seção ajuda você a entender as variantes oficiais da família de modelos Gemma e selecionar um modelo para seu aplicativo. As variantes de modelo oferecem recursos gerais ou são especializadas para tarefas específicas e são fornecidas em diferentes tamanhos de parâmetros para que você possa escolher um modelo com os recursos preferidos e que atenda aos seus requisitos de computação.

A tabela a seguir lista as principais variantes da família de modelos Gemma e as plataformas de implantação pretendidas:

Família Gemma 4

A geração mais recente com entradas multimodais (texto, imagem, áudio).

Tamanho	Variante	Entrada ➔ Saída	Plataforma pretendida
E2B	Gemma 4 (principal)	Texto, imagens, áudio ➔ Texto	Dispositivos móveis
E4B	Gemma 4 (principal)	Texto, imagens, áudio ➔ Texto	Dispositivos móveis e laptops
A4B	Gemma 4 (principal)	Texto, imagens ➔ Texto	Computadores desktop e pequenos servidores
31B	Gemma 4 (principal)	Texto, imagens ➔ Texto	Servidores ou clusters de servidores grandes

Família Gemma 3 e 3n

Modelos principais para processamento escalonável de texto e imagens, além de variantes "3n" para entradas multimodais expandidas.

Tamanho	Variante	Entrada ➔ Saída	Plataforma pretendida
270 mi	Gemma 3 (principal)	Texto ➔ Texto	Dispositivos móveis e computadores de placa única
1B	Gemma 3 (principal)	Texto ➔ Texto	Dispositivos móveis e computadores de placa única
E2B	Gemma 3n	Texto, imagens, áudio ➔ Texto	Dispositivos móveis
4B	Gemma 3 (principal)	Texto, imagens ➔ Texto	Computadores desktop e pequenos servidores
E4B	Gemma 3n	Texto, imagens, áudio ➔ Texto	Dispositivos móveis e laptops
12B	Gemma 3 (principal)	Texto, imagens ➔ Texto	Computadores desktop e servidores mais avançados
27B	Gemma 3 (principal)	Texto, imagens ➔ Texto	Servidores ou clusters de servidores grandes

Família Gemma 2

Inclui modelos de texto padrão e as variantes multimodais de linguagem/visão do PaliGemma 2.

Tamanho	Variante	Entrada ➔ Saída	Plataforma pretendida
2 bi	Gemma 2 (principal)	Texto ➔ Texto	Dispositivos móveis e laptops
3B	PaliGemma 2	Texto, imagens ➔ Texto	Computadores desktop e pequenos servidores
9B	Gemma 2 (principal)	Texto ➔ Texto	Computadores desktop e servidores mais avançados
10B	PaliGemma 2	Texto, imagens ➔ Texto	Computadores desktop e servidores mais avançados
27B	Gemma 2 (principal)	Texto ➔ Texto	Servidores ou clusters de servidores grandes
28B	PaliGemma 2	Texto, imagens ➔ Texto	Servidores ou clusters de servidores grandes

Família Gemma 1

A geração original, incluindo variantes específicas de programação.

Tamanho	Variante	Entrada ➔ Saída	Plataforma pretendida
2 bi	Gemma (principal) CodeGemma	Texto ➔ Texto	Dispositivos móveis e laptops
7B	Gemma (principal) CodeGemma	Texto ➔ Texto	Computadores desktop e pequenos servidores

A família de modelos Gemma também inclui modelos de pesquisa e para fins especiais, como ShieldGemma, DataGemma, Gemma Scope e Gemma-APS.

Testar modelos

Para testar os modelos Gemma, configure um ambiente de desenvolvimento com um modelo baixado e um software compatível. Depois, você pode fazer solicitações ao modelo e avaliar as respostas. Use um dos notebooks Python a seguir com seu framework de machine learning preferido para configurar um ambiente de teste e enviar uma solicitação a um modelo do Gemma:

Ajustar modelos

É possível mudar o comportamento dos modelos da Gemma ajustando-os. Para ajustar um modelo, é necessário um conjunto de dados de entradas e respostas esperadas de tamanho e variação suficientes para orientar o comportamento do modelo. Você também precisa de muito mais recursos de computação e memória para concluir uma execução de ajuste em comparação com a execução de um modelo Gemma para geração de texto. Use um dos seguintes notebooks Python para configurar um ambiente de desenvolvimento de ajuste e ajustar um modelo do Gemma:

Próximas etapas

Confira estes guias para criar mais soluções com a Gemma: