RecurrentGemma

Gemma 4 è stato rilasciato con input di testo, audio e immagini e una finestra contestuale lunga fino a 256.000 token. Scopri di più

Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

RecurrentGemma è un modello aperto basato Griffin, un'architettura di modelli ibridi che mescola ricorrenze lineari ad accesso riservato con l'attenzione locale tramite finestre scorrevoli.

Come Gemma, RecurrentGemma è adatta a un diverse attività di generazione di testi, tra cui la risposta alle domande, il riassunto e ragionare. Tuttavia, l'architettura unica di RecurrentGemma offre le seguenti vantaggi:

Riduzione della memoria utilizzata

Requisiti di memoria inferiori consentono la generazione di campioni più lunghi su dispositivi con memoria limitata, come GPU singole o CPU.
Velocità effettiva superiore

RecurrentGemma può eseguire l'inferenza a dimensioni significativamente più elevate in batch, il che significa che può generare molti più token al secondo, soprattutto durante la generazione di sequenze lunghe.
Prestazioni elevate

RecurrentGemma si adatta alle prestazioni di Gemma, richiedendo meno memoria e ottenendo un'inferenza più rapida.

RecurrentGemma

Riduzione della memoria utilizzata

Velocità effettiva superiore

Prestazioni elevate

Altre risorse

Visualizza la scheda del modello

Visualizza su Kaggle

Esegui su GitHub