RecurrentGemma

O RecurrentGemma é um modelo aberto baseado no Griffin (link em inglês), um modelo híbrido que combina recorrências lineares controladas com atenção de janela deslizante local.

Assim como o Gemma, o RecurrentGemma é adequado para várias tarefas de geração de texto, incluindo respostas a perguntas, resumo e raciocínio. No entanto, a arquitetura exclusiva do RecurrentGemma oferece as seguintes vantagens:

  • Requisitos mais baixos de memória permitem a geração de amostras mais longas em dispositivos com memória limitada, como GPUs ou CPUs únicas.
  • O RecurrentGemma pode realizar inferência em tamanhos de lote significativamente maiores, o que significa que ele pode gerar muito mais tokens por segundo, especialmente ao gerar sequências longas.
  • O RecurrentGemma corresponde ao desempenho da Gemma, mas exige menos memória e alcança inferências mais rápidas.

Mais recursos

O card de modelo do RecurrentGemma contém informações detalhadas sobre o modelo, informações de implementação, informações de avaliação, uso e limitações do modelo e muito mais.
Confira mais códigos, notebooks do Colab, informações e discussões sobre o RecurrentGemma no Kaggle.
Executar notebooks do Colab de exemplo para JAX e PyTorch no GitHub