Ver em ai.google.dev | Executar no Google Colab | Abrir na Vertex AI | Veja o código-fonte no GitHub |
Confira neste tutorial como começar a usar o Gemma usando o KerasNLP. O Gemma é uma família de modelos abertos, leves e modernos, criados com a mesma pesquisa e tecnologia usada para criar os modelos do Gemini. O KerasNLP é uma coleção de modelos de processamento de linguagem natural (PLN) implementados no Keras e executáveis no JAX, no PyTorch e no TensorFlow.
Neste tutorial, você vai usar o Gemma para gerar respostas de texto a vários comandos. Se você é iniciante no Keras, talvez queira ler Introdução ao Keras antes de começar, mas não é necessário. Neste tutorial, você vai saber mais sobre a Keras.
Configuração
Configuração do Gemma
Para concluir este tutorial, primeiro você precisa concluir as instruções de configuração na configuração do Gemma. As instruções de configuração do Gemma mostram como fazer o seguinte:
- Acesse o Gemma em kaggle.com.
- Selecione um ambiente de execução do Colab com recursos suficientes para ser executado o modelo Gemma 2B.
- Gere e configure um nome de usuário e uma chave de API do Kaggle.
Depois de concluir a configuração do Gemma, vá para a próxima seção, em que você definirá variáveis de ambiente para o ambiente do Colab.
Defina as variáveis de ambiente
Defina as variáveis de ambiente para KAGGLE_USERNAME
e KAGGLE_KEY
.
import os
from google.colab import userdata
# Note: `userdata.get` is a Colab API. If you're not using Colab, set the env
# vars as appropriate for your system.
os.environ["KAGGLE_USERNAME"] = userdata.get('KAGGLE_USERNAME')
os.environ["KAGGLE_KEY"] = userdata.get('KAGGLE_KEY')
Instalar dependências
Instalar o Keras e o KerasNLP.
# Install Keras 3 last. See https://keras.io/getting_started/ for more details.
pip install -q -U keras-nlp
pip install -q -U "keras>=3"
Selecione um back-end
Keras é uma API de aprendizado profundo de alto nível e com vários frameworks projetadas para simplicidade e facilidade de uso. O Keras 3 permite que você escolha o back-end: TensorFlow, JAX ou PyTorch. Os três funcionam para este tutorial.
import os
os.environ["KERAS_BACKEND"] = "jax" # Or "tensorflow" or "torch".
os.environ["XLA_PYTHON_CLIENT_MEM_FRACTION"] = "0.9"
Importar pacotes
Importe o Keras e o KerasNLP.
import keras
import keras_nlp
Criar um modelo
O KerasNLP oferece implementações de várias arquiteturas de modelo conhecidas. Neste tutorial, você criará um modelo usando GemmaCausalLM
, um modelo Gemma completo para modelagem de linguagem causal. Um modelo de linguagem causal prevê o próximo token com base em tokens anteriores.
Crie o modelo usando o método from_preset
:
gemma_lm = keras_nlp.models.GemmaCausalLM.from_preset("gemma2_2b_en")
A função GemmaCausalLM.from_preset()
instancia o modelo usando uma arquitetura e pesos predefinidos. No código acima, a string "gemma2_2b_en"
especifica a predefinição do modelo Gemma 2 2B com 2 bilhões de parâmetros. Os modelos Gemma com parâmetros 7B, 9B e 27B também estão disponíveis. Encontre as strings de código dos modelos Gemma nas listagens de Variações de modelos do Kaggle.
Use summary
para ter mais informações sobre o modelo:
gemma_lm.summary()
Como mostrado no resumo, o modelo tem 2,6 bilhões de parâmetros treináveis.
Gerar texto
Agora é hora de gerar texto. O modelo tem um método generate
que gera texto com base em um comando. O argumento max_length
opcional especifica o comprimento máximo da sequência gerada.
Teste com o comando "what is keras in 3 bullet points?"
.
gemma_lm.generate("what is keras in 3 bullet points?", max_length=64)
'what is keras in 3 bullet points?\n\n[Answer 1]\n\nKeras is a high-level neural networks API, written in Python and capable of running on top of TensorFlow, CNTK, Theano, or PlaidML. It is designed to be user-friendly and easy to extend.\n\n'
Tente chamar generate
de novo com uma solicitação diferente.
gemma_lm.generate("The universe is", max_length=64)
'The universe is a vast and mysterious place, filled with countless stars, planets, and galaxies. But what if there was a way to see the universe in a whole new way? What if we could see the universe as it was when it was first created? What if we could see the universe as it is now'
Se você estiver executando em back-ends do JAX ou do TensorFlow, vai perceber que a segunda chamada generate
retorna quase instantaneamente. Isso ocorre porque cada chamada para generate
para um determinado tamanho de lote e max_length
é compilado com XLA. A primeira execução é cara, mas as execuções subsequentes são muito mais rápidas.
Também é possível enviar comandos em lote usando uma lista como entrada:
gemma_lm.generate(
["what is keras in 3 bullet points?",
"The universe is"],
max_length=64)
['what is keras in 3 bullet points?\n\n[Answer 1]\n\nKeras is a high-level neural networks API, written in Python and capable of running on top of TensorFlow, CNTK, Theano, or PlaidML. It is designed to be user-friendly and easy to extend.\n\n', 'The universe is a vast and mysterious place, filled with countless stars, planets, and galaxies. But what if there was a way to see the universe in a whole new way? What if we could see the universe as it was when it was first created? What if we could see the universe as it is now']
Opcional: usar um sampler diferente
Você pode controlar a estratégia de geração de GemmaCausalLM
definindo o argumento sampler
no compile()
. Por padrão, a amostragem "greedy"
será usada.
Como um experimento, tente definir uma estratégia "top_k"
:
gemma_lm.compile(sampler="top_k")
gemma_lm.generate("The universe is", max_length=64)
'The universe is a big place, and there are so many things we do not know or understand about it.\n\nBut we can learn a lot about our world by studying what is known to us.\n\nFor example, if you look at the moon, it has many features that can be seen from the surface.'
Enquanto o algoritmo ganancioso padrão sempre escolhe o token com a maior probabilidade, o algoritmo top-K escolhe aleatoriamente o próximo token dos tokens de probabilidade Top-K.
Não é necessário especificar um sampler. Você pode ignorar o último snippet de código se ele não for útil para seu caso de uso. Para saber mais sobre os Samplers disponíveis, consulte Samplers.
A seguir
Neste tutorial, você aprendeu a gerar texto usando o KerasNLP e o Gemma. Aqui estão algumas sugestões sobre o que aprender a seguir:
- Saiba como ajustar um modelo do Gemma.
- Saiba como realizar inferência e ajuste fino distribuído em um modelo do Gemma.
- Saiba mais sobre a integração do Gemma com a Vertex AI.
- Saiba como usar modelos do Gemma com a Vertex AI.