RecurrentGemma

RecurrentGemma ist ein offenes Modell, das auf Griffin basiert, einem Hybridmodell, das Gated lineare Wiederholungen mit lokaler gleitender Fensterbeachtung kombiniert.

Wie Gemma eignet sich auch RecurrentGemma gut für eine Vielzahl von Aufgaben zur Textgenerierung, einschließlich Fragen beantworten, Zusammenfassungen und Logik. Die einzigartige Architektur von RecurrentGemma bietet jedoch auch folgende zusätzliche Vorteile:

  • Niedrigere Speicheranforderungen ermöglichen das Generieren längerer Stichproben auf Geräten mit begrenztem Arbeitsspeicher, z. B. einzelnen GPUs oder CPUs.
  • RecurrentGemma kann Inferenzen bei deutlich höheren Batchgrößen ausführen, was bedeutet, dass es deutlich mehr Tokens pro Sekunde generieren kann, insbesondere bei langen Sequenzen.
  • RecurrentGemma gleicht Gemmas Leistung ab, benötigt dafür weniger Arbeitsspeicher und erzielt schnellere Inferenzen.

Weitere Ressourcen

Die Modellkarte von RecurrentGemma enthält unter anderem detaillierte Informationen zum Modell, Implementierungsinformationen, Bewertungsinformationen, Modellnutzung und -einschränkungen.
Hier finden Sie weiteren Code, Colab-Notebooks, Informationen und Diskussionen über RecurrentGemma auf Kaggle.
Colab-Beispiel-Notebooks für JAX und PyTorch auf GitHub ausführen