RecurrentGemma

Confira o repositório do Gemma Cookbook para ver exemplos de geração e ajuste. Saiba mais

Esta página foi traduzida pela API Cloud Translation.

O RecurrentGemma é um modelo aberto baseado no Griffin, uma arquitetura de modelo híbrido que mistura recorrências lineares controladas com atenção da janela deslizante local.

Assim como a Gemma, o RecurrentGemma é ideal para uma variedade de tarefas de geração de texto, incluindo resposta a perguntas, resumo e raciocínio. No entanto, a arquitetura exclusiva do RecurrentGemma oferece as seguintes vantagens:

Redução no uso da memória

Requisitos mais baixos de memória permitem a geração de amostras mais longas em dispositivos com memória limitada, como GPUs ou CPUs únicas.
Capacidade maior

O RecurrentGemma pode realizar inferência em tamanhos de lote significativamente maiores, o que significa que ele pode gerar muito mais tokens por segundo, especialmente ao gerar sequências longas.
Alto desempenho

O RecurrentGemma corresponde ao desempenho da Gemma, mas exige menos memória e alcança inferências mais rápidas.

Mais recursos

Ver o card de modelo

O card de modelo do RecurrentGemma contém informações detalhadas sobre o modelo, informações de implementação, informações de avaliação, uso e limitações do modelo e muito mais.

Ver no Kaggle

Confira mais códigos, notebooks do Colab, informações e discussões sobre o RecurrentGemma no Kaggle.

Executar no GitHub

Executar notebooks do Colab de exemplo para JAX e PyTorch no GitHub

Redução no uso da memória

Capacidade maior

Alto desempenho

Ver o card de modelo

Ver no Kaggle

Executar no GitHub