RecurrentGemma

RecurrentGemma es un modelo abierto basado en Griffin, una arquitectura de modelo híbrido que combina las recurrencias lineales cerradas con la atención de la ventana deslizante local.

Al igual que Gemma, RecurrentGemma es adecuada para una varias tareas de generación de texto, como responder preguntas, resumir y el razonamiento. Sin embargo, la arquitectura única de RecurrentGemma ofrece los siguientes beneficios ventajas:

  • Los requisitos de memoria más bajos permiten la generación de muestras más largas en dispositivos con memoria limitada, como GPU únicas o CPU.
  • RecurrentGemma puede realizar inferencias en tamaños de lote significativamente más altos, lo que significa que puede generar muchos más tokens por segundo, en especial cuando se generan secuencias largas.
  • RecurrentGemma coincide con su rendimiento mientras requiere menos memoria y logra una inferencia más rápida.

Más recursos

La tarjeta de modelo de RecurrentGemma contiene información detallada sobre el modelo, la información de implementación, la información de evaluación, el uso y las limitaciones del modelo, y mucho más.
Consulta más código, notebooks de Colab, información y debates sobre RecurrentGemma en Kaggle.
Ejecuta notebooks de Colab de ejemplo para JAX y PyTorch en GitHub.