Zadbaj o dobrą organizację dzięki kolekcji
Zapisuj i kategoryzuj treści zgodnie ze swoimi preferencjami.
RecurrentGemma
RecurrentGemma to otwarty model oparty na
Griffin – architektura modelu hybrydowego,
łączy zamknięte powtarzanie liniowe z lokalną uwagą dotyczącą przesuwnych okien.
Podobnie jak Gemma, RecurrentGemma to świetny wybór
różnego rodzaju zadania związane z generowaniem tekstu, w tym odpowiadanie na pytania, streszczanie,
wyciągania wniosków. Unikalna architektura RecurrentGemma zapewnia jednak następujące dodatkowe
zalety:
memory
Zmniejszone wykorzystanie pamięci
Mniejsze wymagania dotyczące pamięci umożliwiają generowanie dłuższych próbek na urządzeniach z ograniczoną ilością pamięci, takich jak pojedyncze procesory graficzne lub procesory.
multiple_stop
Większa przepustowość
RecurrentGemma może wnioskować przy znacznie większych wsadach, co oznacza, że może generować znacznie więcej tokenów na sekundę – zwłaszcza podczas generowania długich sekwencji.
trending_up
Wysoka wydajność
RecurrentGemma dopasowuje wydajność Gemmy, wymagając przy tym mniej pamięci i uzyskując szybsze wnioskowanie.
Karta modelu RecurrentGemma zawiera szczegółowe informacje o modelu, implementacji, ocenie, użyciu modelu i jego ograniczeniach, a także inne informacje.