RecurrentGemma

RecurrentGemma est un modèle ouvert basé sur Griffin, une architecture de modèle hybride qui combine des récurrences linéaires contrôlées avec l'attention sur les fenêtres glissantes locales.

Tout comme Gemma, RecurrentGemma convient à diverses tâches de génération de texte, y compris la réponse à des questions, la synthèse et le raisonnement. Cependant, l'architecture unique de RecurrentGemma offre les avantages supplémentaires suivants:

  • Des exigences de mémoire réduites permettent de générer des échantillons plus longs sur les appareils disposant d'une mémoire limitée, comme les GPU ou les processeurs uniques.
  • RecurrentGemma peut effectuer des inférences à des tailles de lot nettement plus élevées, ce qui signifie qu'il peut générer beaucoup plus de jetons par seconde, en particulier lorsqu'il génère de longues séquences.
  • RecurrentGemma profite des performances de Gemma tout en nécessitant moins de mémoire et en accélérant l'inférence.

Autres ressources

La fiche de modèle de RecurrentGemma contient des informations détaillées sur le modèle, des informations sur son implémentation, des informations sur l'évaluation, son utilisation et ses limites, etc.
Consultez plus de code, de notebooks Colab, d'informations et de discussions sur RecurrentGemma sur Kaggle.
Exécutez des exemples de notebooks Colab pour JAX et PyTorch sur GitHub.