A família de modelos abertos do Gemma inclui uma variedade de tamanhos, recursos e variações especializadas em tarefas para ajudar você a criar soluções generativas personalizadas. Estes são os principais caminhos que você pode seguir ao usar modelos da Gemma em um aplicativo:
- Selecione um modelo e implante-o como está no seu aplicativo.
- Selecione um modelo, ajuste-o para uma tarefa específica e implante-o em um aplicativo ou compartilhe com a comunidade.
Este guia ajuda você a escolher um modelo, testar os recursos dele e, opcionalmente, ajustar o modelo selecionado para seu aplicativo.
Disponível no Kaggle Disponível no Hugging Face
Escolher um modelo
Esta seção ajuda você a entender as variantes oficiais da família de modelos Gemma e selecionar um modelo para seu aplicativo. As variantes de modelo oferecem recursos gerais ou são especializadas para tarefas específicas e são fornecidas em diferentes tamanhos de parâmetros para que você possa escolher um modelo com os recursos preferidos e que atenda aos seus requisitos de computação.
A tabela a seguir lista as principais variantes da família de modelos Gemma e as plataformas de implantação pretendidas:
Família Gemma 4
A geração mais recente com entradas multimodais (texto, imagem, áudio).
| Tamanho | Variante | Entrada ➔ Saída | Plataforma pretendida |
|---|---|---|---|
| E2B | Gemma 4 (principal) | Texto, imagens, áudio ➔ Texto | Dispositivos móveis |
| E4B | Gemma 4 (principal) | Texto, imagens, áudio ➔ Texto | Dispositivos móveis e laptops |
| A4B | Gemma 4 (principal) | Texto, imagens ➔ Texto | Computadores desktop e pequenos servidores |
| 31B | Gemma 4 (principal) | Texto, imagens ➔ Texto | Servidores ou clusters de servidores grandes |
Família Gemma 3 e 3n
Modelos principais para processamento escalonável de texto e imagens, além de variantes "3n" para entradas multimodais expandidas.
| Tamanho | Variante | Entrada ➔ Saída | Plataforma pretendida |
|---|---|---|---|
| 270 mi | Gemma 3 (principal) | Texto ➔ Texto | Dispositivos móveis e computadores de placa única |
| 1B | Gemma 3 (principal) | Texto ➔ Texto | Dispositivos móveis e computadores de placa única |
| E2B | Gemma 3n | Texto, imagens, áudio ➔ Texto | Dispositivos móveis |
| 4B | Gemma 3 (principal) | Texto, imagens ➔ Texto | Computadores desktop e pequenos servidores |
| E4B | Gemma 3n | Texto, imagens, áudio ➔ Texto | Dispositivos móveis e laptops |
| 12B | Gemma 3 (principal) | Texto, imagens ➔ Texto | Computadores desktop e servidores mais avançados |
| 27B | Gemma 3 (principal) | Texto, imagens ➔ Texto | Servidores ou clusters de servidores grandes |
Família Gemma 2
Inclui modelos de texto padrão e as variantes multimodais de linguagem/visão do PaliGemma 2.
| Tamanho | Variante | Entrada ➔ Saída | Plataforma pretendida |
|---|---|---|---|
| 2 bi | Gemma 2 (principal) | Texto ➔ Texto | Dispositivos móveis e laptops |
| 3B | PaliGemma 2 | Texto, imagens ➔ Texto | Computadores desktop e pequenos servidores |
| 9B | Gemma 2 (principal) | Texto ➔ Texto | Computadores desktop e servidores mais avançados |
| 10B | PaliGemma 2 | Texto, imagens ➔ Texto | Computadores desktop e servidores mais avançados |
| 27B | Gemma 2 (principal) | Texto ➔ Texto | Servidores ou clusters de servidores grandes |
| 28B | PaliGemma 2 | Texto, imagens ➔ Texto | Servidores ou clusters de servidores grandes |
Família Gemma 1
A geração original, incluindo variantes específicas de programação.
| Tamanho | Variante | Entrada ➔ Saída | Plataforma pretendida |
|---|---|---|---|
| 2 bi | Gemma (principal) CodeGemma |
Texto ➔ Texto | Dispositivos móveis e laptops |
| 7B | Gemma (principal) CodeGemma |
Texto ➔ Texto | Computadores desktop e pequenos servidores |
A família de modelos Gemma também inclui modelos de pesquisa e para fins especiais, como ShieldGemma, DataGemma, Gemma Scope e Gemma-APS.
Testar modelos
Para testar os modelos Gemma, configure um ambiente de desenvolvimento com um modelo baixado e um software compatível. Depois, você pode fazer solicitações ao modelo e avaliar as respostas. Use um dos notebooks Python a seguir com seu framework de machine learning preferido para configurar um ambiente de teste e enviar uma solicitação a um modelo do Gemma:
Ajustar modelos
É possível mudar o comportamento dos modelos da Gemma ajustando-os. Para ajustar um modelo, é necessário um conjunto de dados de entradas e respostas esperadas de tamanho e variação suficientes para orientar o comportamento do modelo. Você também precisa de muito mais recursos de computação e memória para concluir uma execução de ajuste em comparação com a execução de um modelo Gemma para geração de texto. Use um dos seguintes notebooks Python para configurar um ambiente de desenvolvimento de ajuste e ajustar um modelo do Gemma:
- Ajustar o Gemma com o Keras e o ajuste de LoRA
- Ajustar modelos maiores do Gemma com treinamento distribuído
Próximas etapas
Confira estes guias para criar mais soluções com a Gemma: