A família Gemma de modelos abertos inclui uma variedade de tamanhos de modelo, recursos e variações especializadas em tarefas para ajudar você a criar soluções generativas personalizadas. Estes são os principais caminhos que você pode seguir ao usar os modelos Gemma em um aplicativo:
- Selecione um modelo e implante-o no estado em que se encontra no aplicativo
- Selecione um modelo, ajuste-o para uma tarefa específica e implante-o em um aplicativo ou compartilhe-o com a comunidade.
Este guia ajuda você a começar a escolher um modelo, testar os recursos dele e, opcionalmente, ajustar o modelo selecionado para o aplicativo.
Escolha um modelo
Esta seção ajuda a entender as variantes oficiais da família de modelos Gemma e a selecionar um modelo para seu aplicativo. As variantes de modelo fornecem recursos gerais ou são especializadas para tarefas específicas e são fornecidas em diferentes tamanhos de parâmetro para que você possa escolher um modelo que tenha seus recursos preferidos e atenda aos seus requisitos de computação.
Lista de modelos do Gemma
A tabela a seguir lista as principais variantes da família de modelos Gemma e os respectivos recursos de alto nível:
Tamanho do parâmetro | Entrada | Saída | Arquitetura | Variantes | Plataformas pretendidas |
---|---|---|---|---|---|
2 bilhões | Texto | Texto | Gemma 1 (link em inglês) | Dispositivos móveis e laptops | |
3 bi | Texto, imagens | Texto | Gemma 1 (link em inglês) | Dispositivos móveis e laptops | |
7 bi | Texto | Texto | Gemma 1 (link em inglês) | Computadores desktop e pequenos servidores | |
9 bilhões | Texto | Texto | Servidores e computadores desktop de última geração | ||
27 bi | Texto | Texto | Gemma 2 (link em inglês) | Servidores grandes ou clusters de servidor |
É possível fazer o download de todas as variantes oficiais do Gemma nos modelos Kaggle (link em inglês).
Testar modelos
É possível testar modelos do Gemma configurando um ambiente de desenvolvimento com um modelo transferido por download e um software de suporte. Depois, é possível enviar comandos ao modelo e avaliar as respostas. Use um dos seguintes notebooks Python com o framework de machine learning de sua preferência para configurar um ambiente de teste e solicitar um modelo Gemma:
Testar o Gemma 2 no AI Studio
É possível testar o Gemma 2 rapidamente sem configurar um ambiente de desenvolvimento usando o Google AI Studio. Com esse aplicativo da Web, é possível testar comandos com o Gemma 2 e avaliar os recursos dele.
Para testar o Gemma 2 no Google AI Studio:
Abra o AI Studio.
No painel Configurações de execução à direita, no campo Modelo, selecione um modelo Gemma 2.
Na parte de baixo do painel central, digite um comando e selecione Executar.
Para mais informações sobre como usar o AI Studio, consulte o Guia de início rápido do Google AI Studio.
Ajustar modelos
Você pode ajustar o comportamento dos modelos do Gemma para alterá-los. O ajuste de um modelo requer um conjunto de dados de entradas e respostas esperadas de tamanho e variação suficientes para orientar o comportamento do modelo. Você também precisa de muito mais recursos de computação e memória para concluir um ajuste em comparação com um modelo Gemma para geração de texto. Use um dos seguintes notebooks Python para configurar um ambiente de desenvolvimento e ajustar um modelo Gemma:
- Ajuste do Gemma com o ajuste do Keras e LoRA
- Ajuste o Gemma com o JAX
- Ajuste modelos maiores do Gemma com treinamento distribuído
Próximas etapas
Confira estes guias para criar mais soluções com o Gemma: