RecurrentGemma

Gemma 3n est disponible avec une entrée audio et est optimisé pour les appareils du quotidien. En savoir plus

RecurrentGemma est un modèle ouvert basé sur Griffin, une architecture de modèle hybride mélange des récurrences linéaires contrôlées et l'attention sur les fenêtres glissantes locales.

Tout comme Gemma, RecurrentGemma convient parfaitement une variété de tâches de génération de texte, notamment les réponses à des questions, la synthèse et le raisonnement. Cependant, l'architecture unique de RecurrentGemma offre les fonctionnalités supplémentaires suivantes : avantages:

Réduction de l'utilisation de la mémoire

Des exigences de mémoire réduites permettent de générer des échantillons plus longs sur les appareils disposant d'une mémoire limitée, comme les GPU ou les processeurs uniques.
Débit plus élevé

RecurrentGemma peut effectuer des inférences à des tailles de lot nettement plus élevées, ce qui signifie qu'il peut générer beaucoup plus de jetons par seconde, en particulier lorsqu'il génère de longues séquences.
Haut performance

RecurrentGemma profite des performances de Gemma tout en nécessitant moins de mémoire et en accélérant l'inférence.

RecurrentGemma

Réduction de l'utilisation de la mémoire

Débit plus élevé

Haut performance

Autres ressources

Afficher la fiche du modèle

Afficher sur Kaggle

Exécuter sur GitHub