RecurrentGemma
RecurrentGemma ist ein offenes Modell, Griffin, eine hybride Modellarchitektur, vermischt gesteuerte lineare Wiederholungen mit lokaler gleitender Fenster-Aufmerksamkeit.
Wie Gemma eignet sich auch RecurrentGemma gut für Textgenerierung, einschließlich Fragenbeantwortung, Zusammenfassung Logik. Die einzigartige Architektur von RecurrentGemma bietet jedoch folgende zusätzliche Vorteile:
-
Geringere Arbeitsspeichernutzung
Niedrigere Speicheranforderungen ermöglichen das Generieren längerer Stichproben auf Geräten mit begrenztem Arbeitsspeicher, z. B. einzelnen GPUs oder CPUs. -
Höherer Durchsatz
RecurrentGemma kann Inferenzen bei deutlich höheren Batchgrößen ausführen, was bedeutet, dass es deutlich mehr Tokens pro Sekunde generieren kann, insbesondere bei langen Sequenzen. -
Hohe Leistung
RecurrentGemma gleicht Gemmas Leistung ab, benötigt dafür weniger Arbeitsspeicher und erzielt schnellere Inferenzen.