RecurrentGemma

RecurrentGemma es un modelo abierto basado en Griffin, un modelo híbrido que combina recurrencias lineales controladas con atención local de ventana deslizante.

Al igual que Gemma, RecurrentGemma es ideal para una variedad de tareas de generación de texto, como la respuesta de preguntas, el resumen y el razonamiento. Sin embargo, la arquitectura única de RecurrentGemma ofrece las siguientes ventajas adicionales:

  • Los requisitos de memoria más bajos permiten la generación de muestras más largas en dispositivos con memoria limitada, como GPU únicas o CPU.
  • RecurrentGemma puede realizar inferencias en tamaños de lote significativamente más altos, lo que significa que puede generar muchos más tokens por segundo, en especial cuando se generan secuencias largas.
  • RecurrentGemma coincide con su rendimiento mientras requiere menos memoria y logra una inferencia más rápida.

Más recursos

La tarjeta de modelo de RecurrentGemma contiene información detallada sobre el modelo, la información de implementación, la información de evaluación, el uso y las limitaciones del modelo, y mucho más.
Consulta más código, notebooks de Colab, información y debates sobre RecurrentGemma en Kaggle.
Ejecuta notebooks de Colab de ejemplo para JAX y PyTorch en GitHub.