A família de modelos abertos do Gemma inclui uma variedade de tamanhos, recursos e variações especializadas em tarefas para ajudar você a criar soluções generativas personalizadas. Estes são os principais caminhos que você pode seguir ao usar modelos da Gemma em um aplicativo:
- Selecione um modelo e implante-o como está no seu aplicativo.
- Selecione um modelo, ajuste-o para uma tarefa específica e implante-o em um aplicativo ou compartilhe com a comunidade.
Este guia ajuda você a escolher um modelo, testar as funcionalidades dele e, opcionalmente, ajustar o modelo selecionado para seu aplicativo.
Disponível no Kaggle Disponível no Hugging Face
Escolher um modelo
Esta seção ajuda você a entender as variantes oficiais da família de modelos Gemma e a selecionar um modelo para seu aplicativo. As variantes de modelo oferecem recursos gerais ou são especializadas para tarefas específicas e são fornecidas em diferentes tamanhos de parâmetros para que você possa escolher um modelo com os recursos preferidos e que atenda aos seus requisitos de computação.
Lista de modelos do Gemma
A tabela a seguir lista as principais variantes da família de modelos Gemma e as plataformas de implantação pretendidas:
| Tamanho do parâmetro | Entrada | Saída | Variant | Foundation | Plataformas pretendidas |
|---|---|---|---|---|---|
| 270 milhões | Texto | Texto | Gemma 3 | Dispositivos móveis e computadores de placa única | |
| 1 bilhão | Texto | Texto | Gemma 3 | Dispositivos móveis e computadores de placa única | |
| E2B | Texto, imagens, áudio | Texto | Gemma 3n | Dispositivos móveis | |
| 2 bilhões | Texto | Texto | Gemma 2 | Dispositivos móveis e laptops | |
| Gemma 1 | |||||
| 3 bilhões | Texto, imagens | Texto | Gemma 2 | Computadores desktop e pequenos servidores | |
| E4B | Texto, imagens, áudio | Texto | Gemma 3n | Dispositivos móveis e laptops | |
| 4B | Texto, imagens | Texto | Gemma 3 | Computadores desktop e pequenos servidores | |
| 7B | Texto | Texto | Gemma 1 | Computadores desktop e pequenos servidores | |
| 9 bilhões | Texto | Texto | Gemma 2 | Computadores desktop e servidores mais avançados | |
| 10B | Texto, imagens | Texto | Gemma 2 | Computadores desktop e servidores mais avançados | |
| 12 bilhões | Texto, imagens | Texto | Gemma 3 | Computadores desktop e servidores mais avançados | |
| 27B | Texto, imagens | Texto | Gemma 3 | Servidores ou clusters de servidores grandes | |
| Texto | Texto | Gemma 2 | |||
| 28B | Texto, imagens | Texto | Gemma 2 | Servidores ou clusters de servidores grandes |
A família de modelos Gemma também inclui modelos de pesquisa e para fins especiais, como ShieldGemma, DataGemma, Gemma Scope e Gemma-APS.
Testar modelos
Para testar os modelos Gemma, configure um ambiente de desenvolvimento com um modelo baixado e software de suporte. Depois, você pode fazer solicitações ao modelo e avaliar as respostas dele. Use um dos notebooks Python a seguir com seu framework de machine learning preferido para configurar um ambiente de teste e enviar uma solicitação a um modelo do Gemma:
Ajustar modelos
É possível mudar o comportamento dos modelos da Gemma ajustando-os. Para ajustar um modelo, é necessário um conjunto de dados de entradas e respostas esperadas de tamanho e variação suficientes para orientar o comportamento do modelo. Você também precisa de muito mais recursos de computação e memória para concluir uma execução de ajuste em comparação com a execução de um modelo Gemma para geração de texto. Use um dos seguintes notebooks Python para configurar um ambiente de desenvolvimento de ajuste e ajustar um modelo do Gemma:
- Ajustar o Gemma com o Keras e o ajuste LoRA
- Ajustar modelos maiores do Gemma com treinamento distribuído
Próximas etapas
Confira estes guias para criar mais soluções com a Gemma: