RecurrentGemma

RecurrentGemma ist ein offenes Modell, Griffin, eine hybride Modellarchitektur, vermischt gesteuerte lineare Wiederholungen mit lokaler gleitender Fenster-Aufmerksamkeit.

Wie Gemma eignet sich auch RecurrentGemma gut für Textgenerierung, einschließlich Fragenbeantwortung, Zusammenfassung Logik. Die einzigartige Architektur von RecurrentGemma bietet jedoch folgende zusätzliche Vorteile:

  • Niedrigere Speicheranforderungen ermöglichen das Generieren längerer Stichproben auf Geräten mit begrenztem Arbeitsspeicher, z. B. einzelnen GPUs oder CPUs.
  • RecurrentGemma kann Inferenzen bei deutlich höheren Batchgrößen ausführen, was bedeutet, dass es deutlich mehr Tokens pro Sekunde generieren kann, insbesondere bei langen Sequenzen.
  • RecurrentGemma gleicht Gemmas Leistung ab, benötigt dafür weniger Arbeitsspeicher und erzielt schnellere Inferenzen.

Weitere Ressourcen

Die Modellkarte von RecurrentGemma enthält unter anderem detaillierte Informationen zum Modell, Implementierungsinformationen, Bewertungsinformationen, Modellnutzung und -einschränkungen.
Hier finden Sie weiteren Code, Colab-Notebooks, Informationen und Diskussionen über RecurrentGemma auf Kaggle.
Colab-Beispiel-Notebooks für JAX und PyTorch auf GitHub ausführen