RecurrentGemma

Gemma 3n mit Audioeingabe und optimiert für die Verwendung in Alltagsgeräten. Weitere Informationen

RecurrentGemma ist ein offenes Modell, Griffin, eine hybride Modellarchitektur, vermischt gesteuerte lineare Wiederholungen mit lokaler gleitender Fenster-Aufmerksamkeit.

Wie Gemma eignet sich auch RecurrentGemma gut für Textgenerierung, einschließlich Fragenbeantwortung, Zusammenfassung Logik. Die einzigartige Architektur von RecurrentGemma bietet jedoch folgende zusätzliche Vorteile:

Geringere Arbeitsspeichernutzung

Niedrigere Speicheranforderungen ermöglichen das Generieren längerer Stichproben auf Geräten mit begrenztem Arbeitsspeicher, z. B. einzelnen GPUs oder CPUs.
Höherer Durchsatz

RecurrentGemma kann Inferenzen bei deutlich höheren Batchgrößen ausführen, was bedeutet, dass es deutlich mehr Tokens pro Sekunde generieren kann, insbesondere bei langen Sequenzen.
Hohe Leistung

RecurrentGemma gleicht Gemmas Leistung ab, benötigt dafür weniger Arbeitsspeicher und erzielt schnellere Inferenzen.

Weitere Ressourcen

Modellkarte ansehen

Die Modellkarte von RecurrentGemma enthält unter anderem detaillierte Informationen zum Modell, Implementierungsinformationen, Bewertungsinformationen, Modellnutzung und -einschränkungen.

Auf Kaggle ansehen

Hier finden Sie weiteren Code, Colab-Notebooks, Informationen und Diskussionen über RecurrentGemma auf Kaggle.

Auf GitHub ausführen

Colab-Beispiel-Notebooks für JAX und PyTorch auf GitHub ausführen

Geringere Arbeitsspeichernutzung

Höherer Durchsatz

Hohe Leistung

Modellkarte ansehen

Auf Kaggle ansehen

Auf GitHub ausführen