Comienza a usar modelos de Gemma

La familia de modelos abiertos de Gemma incluye una variedad de tamaños, capacidades y variaciones especializadas en tareas para ayudarte a crear soluciones generativas personalizadas. Estas son las principales rutas que puedes seguir cuando usas modelos de Gemma en una aplicación:

  • Selecciona un modelo y implementa tal como está en tu aplicación.
  • Selecciona un modelo, ajústalo para una tarea específica y, luego, impleméntalo en una aplicación o compártelo con la comunidad.

Esta guía te ayuda a comenzar a elegir un modelo, probar sus capacidades y, de manera opcional, ajustar el modelo que seleccionaste para tu aplicación.

Obtener en Kaggle Obtener en Hugging Face

Elige un modelo

En esta sección, se explica cómo comprender las variantes oficiales de la familia de modelos de Gemma y seleccionar un modelo para tu aplicación. Las variantes del modelo proporcionan capacidades generales o se especializan en tareas específicas, y se ofrecen en diferentes tamaños de parámetros para que puedas elegir un modelo que tenga las capacidades que prefieras y cumpla con tus requisitos de procesamiento.

En la siguiente tabla, se enumeran las principales variantes de la familia de modelos Gemma y las plataformas de implementación previstas:

Familia de Gemma 4

La generación más reciente incluye entradas multimodales (texto, imagen y audio).

Tamaño Variante Entrada ➔ Salida Plataforma prevista
E2B Gemma 4 (núcleo) Texto, imágenes, audio ➔ Texto Dispositivos móviles
E4B Gemma 4 (núcleo) Texto, imágenes, audio ➔ Texto Dispositivos móviles y laptops
A4B Gemma 4 (núcleo) Texto, imágenes ➔ Texto Computadoras de escritorio y servidores pequeños
31B Gemma 4 (núcleo) Texto, imágenes ➔ Texto Servidores grandes o clústeres de servidores

Familia de Gemma 3 y 3n

Modelos principales para el procesamiento escalable de texto e imágenes, además de variantes "3n" para entradas multimodales expandidas.

Tamaño Variante Entrada ➔ Salida Plataforma prevista
270 millones Gemma 3 (core) Texto ➔ Texto Dispositivos móviles y computadoras de placa única
1B Gemma 3 (core) Texto ➔ Texto Dispositivos móviles y computadoras de placa única
E2B Gemma 3n Texto, imágenes, audio ➔ Texto Dispositivos móviles
4B Gemma 3 (core) Texto, imágenes ➔ Texto Computadoras de escritorio y servidores pequeños
E4B Gemma 3n Texto, imágenes, audio ➔ Texto Dispositivos móviles y laptops
12B Gemma 3 (core) Texto, imágenes ➔ Texto Computadoras de escritorio y servidores de alta gama
27B Gemma 3 (core) Texto, imágenes ➔ Texto Servidores grandes o clústeres de servidores

Familia Gemma 2

Incluye modelos de texto estándares y las variantes multimodales de visión y lenguaje de PaliGemma 2.

Tamaño Variante Entrada ➔ Salida Plataforma prevista
2B Gemma 2 (principal) Texto ➔ Texto Dispositivos móviles y laptops
3B PaliGemma 2 Texto, imágenes ➔ Texto Computadoras de escritorio y servidores pequeños
9B Gemma 2 (principal) Texto ➔ Texto Computadoras de escritorio y servidores de alta gama
10B PaliGemma 2 Texto, imágenes ➔ Texto Computadoras de escritorio y servidores de alta gama
27B Gemma 2 (principal) Texto ➔ Texto Servidores grandes o clústeres de servidores
28B PaliGemma 2 Texto, imágenes ➔ Texto Servidores grandes o clústeres de servidores

Familia de Gemma 1

La generación original, incluidas las variantes específicas de codificación

Tamaño Variante Entrada ➔ Salida Plataforma prevista
2B Gemma (core)
CodeGemma
Texto ➔ Texto Dispositivos móviles y laptops
7B Gemma (core)
CodeGemma
Texto ➔ Texto Computadoras de escritorio y servidores pequeños

La familia de modelos de Gemma también incluye modelos de investigación y de propósito especial, como ShieldGemma, DataGemma, Gemma Scope y Gemma-APS.

Probar modelos

Puedes probar los modelos de Gemma configurando un entorno de desarrollo con un modelo descargado y software compatible. Luego, puedes darle instrucciones al modelo y evaluar sus respuestas. Usa uno de los siguientes notebooks de Python con tu framework de aprendizaje automático preferido para configurar un entorno de prueba y solicitar un modelo de Gemma:

Ajustar modelos

Puedes cambiar el comportamiento de los modelos de Gemma si los ajustas. Ajustar un modelo requiere un conjunto de datos de entradas y respuestas esperadas con el tamaño y la variación suficientes para guiar el comportamiento del modelo. También necesitas muchos más recursos de procesamiento y memoria para completar una ejecución de ajuste en comparación con la ejecución de un modelo de Gemma para la generación de texto. Usa uno de los siguientes notebooks de Python para configurar un entorno de desarrollo de ajuste y ajustar un modelo de Gemma:

Próximos pasos

Consulta estas guías para crear más soluciones con Gemma: