Consulta el repositorio de Libro de recetas de Gemma para ver ejemplos de generación y ajuste. Más información

Se usó la API de Cloud Translation para traducir esta página.

Modelos abiertos de Gemma

Una familia de modelos abiertos ligeros y de última generación creados a partir de la misma investigación y tecnología que se usaron para crear los modelos de Gemini

Comenzar

Diseño responsable desde el punto de vista

Estos modelos incorporan medidas de seguridad integrales para garantizar soluciones de IA responsables y confiables a través de conjuntos de datos seleccionados y un ajuste riguroso.

Rendimiento sin igual en tamaño

Los modelos de Gemma logran resultados de comparativas excepcionales en sus tamaños de 2B, 7B, 9B y 27B, incluso superan a algunos modelos abiertos más grandes.

Entorno flexible

Con Keras 3.0, disfruta de una compatibilidad perfecta con JAX, TensorFlow y PyTorch, lo que te permite elegir y cambiar de framework sin esfuerzo según la tarea.

Presentamos
Gemma 2

Gemma 2, rediseñado para ofrecer un rendimiento superior y una eficiencia inigualable, se optimiza para realizar inferencias ultrarrápidas en diversos hardware.

Prueba Gemma 2 en Google AI Studio

5 tomas

MMLU

La comparativa de MMLU es una prueba que mide la amplitud del conocimiento y la capacidad de resolución de problemas que adquieren los modelos grandes de lenguaje durante el entrenamiento previo.

25 fotos

ARC‐C

La comparativa de ARC-c es un subconjunto más enfocado del conjunto de datos de ARC-e, que contiene solo preguntas respondidas de forma incorrecta por algoritmos comunes (basados en la recuperación y la coocurrencia de palabras).

5 tomas

GSM8K

La comparativa GSM8K prueba la capacidad de un modelo de lenguaje para resolver problemas matemáticos a nivel de la escuela primaria que, a menudo, requieren varios pasos de razonamiento.

3 a 5 tomas

AGIEval

La comparativa de AGIEval pone a prueba la inteligencia general de un modelo de lenguaje mediante preguntas derivadas de exámenes del mundo real diseñados para evaluar las capacidades intelectuales humanas.

3 tomas, CoT

BBH

La comparativa BBH (BIG-Bench Hard) se enfoca en tareas que se consideran más allá de las capacidades de los modelos de lenguaje actuales y prueba sus límites en varios dominios de razonamiento y comprensión.

3 tomas, F1

DROP

DROP es una comparativa de comprensión lectora que requiere un razonamiento discreto en lugar de párrafos.

5 tomas

Winogrande

La comparativa de Winogrande prueba la capacidad de un modelo de lenguaje para resolver tareas ambiguas de completar el espacio en blanco con opciones binarias, lo que requiere un razonamiento generalizado de sentido común.

10 intentos

HellaSwag

La comparativa de HellaSwag desafía la capacidad de un modelo de lenguaje para comprender y aplicar el razonamiento de sentido común seleccionando el final más lógico para una historia.

4 tomas

MATH

MATH evalúa la capacidad de un modelo de lenguaje para resolver problemas verbales matemáticos complejos, lo que requiere razonamiento, resolución de problemas de varios pasos y comprensión de conceptos matemáticos.

Sin ejemplos

ARC-e

La comparativa ARC-e prueba las habilidades avanzadas de respuesta a preguntas de un modelo de lenguaje con preguntas de ciencia de opción múltiple genuinas a nivel de la escuela primaria.

Sin ejemplos

PIQA

La comparativa PIQA prueba la capacidad de un modelo de lenguaje para comprender y aplicar el conocimiento físico del sentido común respondiendo preguntas sobre las interacciones físicas cotidianas.

Sin ejemplos

SIQA

La comparativa SIQA evalúa la comprensión de un modelo de lenguaje de las interacciones sociales y el sentido común social mediante preguntas sobre las acciones de las personas y sus implicaciones sociales.

Sin ejemplos

Boolq

La comparativa de BoolQ prueba la capacidad de un modelo de lenguaje para responder preguntas de sí o no que ocurren de forma natural, lo que prueba la capacidad de los modelos para realizar tareas de inferencia de lenguaje natural en el mundo real.

5 tomas

TriviaQA

La comparativa de TriviaQA prueba las habilidades de comprensión lectora con triples pregunta-respuesta-evidencia.

5 tomas

La comparativa de NQ (preguntas naturales) prueba la capacidad de un modelo de lenguaje para encontrar y comprender respuestas en artículos completos de Wikipedia, simulando situaciones de respuesta a preguntas del mundo real.

pass@1

HumanEval

La comparativa HumanEval prueba las capacidades de generación de código de un modelo de lenguaje evaluando si sus soluciones pasan las pruebas de unidades funcionales para problemas de programación.

3 tomas

MBPP

La comparativa de MBPP prueba la capacidad de un modelo de lenguaje para resolver problemas básicos de programación de Python, enfocándose en los conceptos fundamentales de programación y el uso de bibliotecas estándar.

100%

75%

50%

25%

100%

75%

50%

25%

Gemma 1

2,500 millones

42.3

Gemma 2

2,600 millones

51.3

Mistral

7,000 millones

62.5

LLAMA 3

66.6

Gemma 1

64.4

Gemma 2

9,000 millones

71,3

Gemma 2

27,000 millones

75.2

Gemma 1

2,500 millones

48.5

Gemma 2

2,600 millones

55.4

Mistral

60.5

LLAMA 3

59.2

Gemma 1

61.1

Gemma 2

9,000 millones

68.4

Gemma 2

27B

71.4

Gemma 1

2,500 millones

15.1

Gemma 2

2,600 millones

23,9

Mistral

39,6

LLAMA 3

8,000 millones

45.7

Gemma 1

51.8

Gemma 2

9,000 millones

68.6

Gemma 2

27B

74.0

Gemma 1

2,500 millones

24.2

Gemma 2

2,600 millones

30.6

Mistral

7,000 millones

44.0

LLAMA 3

8,000 millones

45.9

Gemma 1

7,000 millones

44.9

Gemma 2

9,000 millones

52.8

Gemma 2

27B

55.1

Gemma 1

2,500 millones

35.2

Gemma 2

2,600 millones

41.9

Mistral

56.0

LLAMA 3

8,000 millones

61.1

Gemma 1

7,000 millones

59.0

Gemma 2

9,000 millones

68.2

Gemma 2

27,000 millones

74.9

Gemma 1

2,500 millones

48.5

Gemma 2

2,600 millones

52.0

Mistral

63.8

LLAMA 3

58.4

Gemma 1

56.3

Gemma 2

9,000 millones

69.4

Gemma 2

27B

74,2

Gemma 1

2,500 millones

66.8

Gemma 2

2,600 millones

70.9

Mistral

78.5

LLAMA 3

8,000 millones

76.1

Gemma 1

79.0

Gemma 2

9,000 millones

80.6

Gemma 2

27B

83.7

Gemma 1

2,500 millones

71.7

Gemma 2

2,600 millones

73.0

Mistral

83.0

LLAMA 3

82.0

Gemma 1

82.3

Gemma 2

9,000 millones

81.9

Gemma 2

27B

86.4

Gemma 1

2,500 millones

11.8

Gemma 2

2,600 millones

15.0

Mistral

12.7

Gemma 1

7,000 millones

24.3

Gemma 2

9,000 millones

36,6

Gemma 2

27,000 millones

42.3

Gemma 1

2,500 millones

73.2

Gemma 2

2,600 millones

80,1

Mistral

80.5

Gemma 1

81.5

Gemma 2

9,000 millones

88.0

Gemma 2

27B

88.6

Gemma 1

2,500 millones

77.3

Gemma 2

2,600 millones

77.8

Mistral

82.2

Gemma 1

7,000 millones

81.2

Gemma 2

9,000 millones

81,7

Gemma 2

27B

83.2

Gemma 1

2,500 millones

49,7

Gemma 2

2,600 millones

51.9

Mistral

47.0

Gemma 1

51.8

Gemma 2

9,000 millones

53.4

Gemma 2

27B

53.7

Gemma 1

2,500 millones

69.4

Gemma 2

2,600 millones

72.5

Mistral

83.2

Gemma 1

83.2

Gemma 2

9,000 millones

84,2

Gemma 2

27B

84.8

Gemma 1

2,500 millones

53.2

Gemma 2

2,600 millones

59,4

Mistral

7,000 millones

62.5

Gemma 1

63.4

Gemma 2

9,000 millones

76.6

Gemma 2

27B

83.7

Gemma 1

2,500 millones

12.5

Gemma 2

2,600 millones

16.7

Mistral

23.2

Gemma 1

23.0

Gemma 2

9,000 millones

29.2

Gemma 2

27,000 millones

34.5

Gemma 1

2,500 millones

22.0

Gemma 2

2,600 millones

17.7

Mistral

26.2

Gemma 1

32.3

Gemma 2

9,000 millones

40.2

Gemma 2

27B

51.8

Gemma 1

2,500 millones

29.2

Gemma 2

2,600 millones

29.6

Mistral

7,000 millones

40.2

Gemma 1

44,4

Gemma 2

9,000 millones

52.4

Gemma 2

27B

62.6

*Estas son las comparativas de los modelos previamente entrenados. Consulta el informe técnico para obtener detalles sobre el rendimiento con otras metodologías.

Lee el informe técnico

Familia de modelos de Gemma

Nuevo lanzamiento

Gemma 2

Gemma 2 ofrece tres modelos nuevos, potentes y eficientes disponibles en 2, 9 y 27 mil millones de tamaños de parámetros, todos con avances de seguridad integrados.

Comienza a usar Hugging Face Comienza a usar Kaggle

Nuevo lanzamiento

DataGemma

DataGemma son los primeros modelos abiertos diseñados para conectar LLM con datos extensos del mundo real extraídos de Data Commons de Google.

Comienza a usar Kaggle

Gemma 1

Los modelos de Gemma son modelos de lenguaje grandes ligeros, de texto a texto y solo de decodificador, entrenados con un conjunto de datos masivo de texto, código y contenido matemático para una variedad de tareas de procesamiento de lenguaje natural.

Comienza a usar Kaggle

RecurrentGemma

RecurrentGemma es un modelo técnicamente distinto que aprovecha las redes neuronales recurrentes y la atención local para mejorar la eficiencia de la memoria.

Comienza a usar Kaggle

PaliGemma

PaliGemma es un modelo abierto de visión y lenguaje inspirado en PaLI-3, que aprovecha SigLIP y Gemma, diseñado como un modelo versátil para transferir a una amplia variedad de tareas de visión y lenguaje.

Comenzar a usar Kaggle

CodeGemma

CodeGemma aprovecha los fundamentos de nuestros modelos originales previamente entrenados de Gemma y ofrece potentes capacidades de finalización y generación de código en tamaños que se adaptan a tu computadora local.

Comienza a usar Kaggle

Explora nuestras herramientas

ShieldGemma

ShieldGemma es un paquete de modelos de clasificadores de contenido de seguridad creados en Gemma 2 para filtrar las entradas y salidas de los modelos de IA y proteger al usuario.

Alcance de Gemma

Gemma Scope ofrece a los investigadores una transparencia sin precedentes en los procesos de toma de decisiones de nuestros modelos de Gemma 2.

Guías de inicio rápido para desarrolladores

Descubre las guías de inicio rápido en Kaggle

Visita la página de modelos de Kaggle para encontrar guías de inicio rápido, ejemplos de código y debates sobre Gemma.

Abrir en Kaggle

Entrena y, luego, implementa en Google Cloud

Gemma 2 funciona mejor en Google Cloud, con una optimización de TPU de extremo a extremo para obtener un rendimiento líder en el mercado y un costo total de propiedad en Vertex.

Abrir en Vertex AI

Prueba la adaptación de rango bajo con JAX a través de Keras 3

Adapta los modelos de Gemma a tu dominio y datos únicos con el framework de backend que elijas a través de Keras 3.

Abrir en Colab

Ver todas las guías de inicio rápido en nuestra documentación Ver todas las guías de inicio rápido

Guías de inicio rápido para socios

Hugging Face

Usa Hugging Face Transformers y TRL para realizar tareas de inferencia y ajustes con los modelos de Gemma.

NVIDIA

Afina los modelos de Gemma con el framework de NVIDIA NeMo y expórtalos a TensorRT-LLM para la producción.

LangChain

En este instructivo, se muestra cómo comenzar a usar Gemma y LangChain, que se ejecutan en Google Cloud o en tu entorno de Colab.

Cualquier escala

En estos documentos, se muestra cómo usar Gemma a través de Anyscale Endpoint como extremos de API completamente administrados.

MongoDB

En este artículo, se presenta cómo aprovechar Gemma como modelo de base en una canalización o un sistema de generación de recuperación aumentada.

Weights and Biases

Explora en detalle las herramientas de registro y lanzamiento de modelos de W&B a través de un ejemplo paso a paso con los modelos de Gemma de Google.

Libro de soluciones de Gemma

Explora una colección de recetas y ejemplos prácticos que muestran el poder y la versatilidad de Gemma para tareas como la creación de leyendas de imágenes con PaliGemma, la generación de código con CodeGemma y la compilación de chatbots con modelos de Gemma ajustados.

Cocinar

Accede a los modelos de Gemma hoy mismo

Modelos de Kaggle

Accede a los modelos de Gemma 2 en Kaggle

Vertex AI Model Garden

Personaliza Gemma 2 con tus propios datos

Modelos de Hugging Face

Accede a Gemma, ajústalo y, luego, impleméntalo

Desarrollo de IA responsable

Responsabilidad desde el diseño

Se entrenan previamente con datos seleccionados cuidadosamente y se ajustan para priorizar la seguridad, lo que ayuda a potenciar el desarrollo de IA seguro y responsable basado en modelos de Gemma.

Evaluación sólida y transparente

Las evaluaciones integrales y los informes transparentes revelan las limitaciones del modelo para adoptar un enfoque responsable para cada caso de uso.

Impulsa el desarrollo responsable

El kit de herramientas de IA generativa responsable ayuda a los desarrolladores a diseñar e implementar las prácticas recomendadas de la IA responsable.

Explora el kit de herramientas de IA generativa responsable

Optimizado para Google Cloud

Con los modelos de Gemma en Google Cloud, puedes personalizar en profundidad el modelo según tus necesidades específicas con las herramientas completamente administradas de Vertex AI o la opción autoadministrada de GKE y, luego, implementarlo en una infraestructura flexible, rentable y optimizada para la IA.

Obtén más información en el blog de Google Cloud

Aceleración de la investigación académica con créditos de Google Cloud

Recientemente, el programa de investigación académica concluyó su período de solicitud y otorgó créditos de Google Cloud para apoyar a los investigadores que superan los límites del descubrimiento científico con modelos de Gemma. Esperamos con ansias ver las investigaciones innovadoras que surgirán de esta iniciativa.

No te pierdas las próximas oportunidades para avanzar en la investigación con Google Cloud.

Únete a la comunidad

Conéctate, explora y comparte tus conocimientos con otros miembros de la comunidad de modelos de AA.

Modelos abiertos de Gemma

Diseño responsable desde el punto de vista

Rendimiento sin igual en tamaño

Entorno flexible

Presentamos
Gemma 2

Familia de modelos de Gemma

Gemma 2

DataGemma

Gemma 1

RecurrentGemma

PaliGemma

CodeGemma

Explora nuestras herramientas

Guías de inicio rápido para desarrolladores

Descubre las guías de inicio rápido en Kaggle

Entrena y, luego, implementa en Google Cloud

Prueba la adaptación de rango bajo con JAX a través de Keras 3

Guías de inicio rápido para socios

Libro de soluciones de Gemma

Accede a los modelos de Gemma hoy mismo

Desarrollo de IA responsable

Optimizado para Google Cloud

Aceleración de la investigación académica con créditos de Google Cloud

Únete a la comunidad

Kaggle

Discord

Blog

Modelos abiertos de Gemma

Diseño responsable desde el punto de vista

Rendimiento sin igual en tamaño

Entorno flexible

Presentamos Gemma 2

Familia de modelos de Gemma

Gemma 2

DataGemma

Gemma 1

RecurrentGemma

PaliGemma

CodeGemma

Explora nuestras herramientas

Guías de inicio rápido para desarrolladores

Descubre las guías de inicio rápido en Kaggle

Entrena y, luego, implementa en Google Cloud

Prueba la adaptación de rango bajo con JAX a través de Keras 3

Guías de inicio rápido para socios

Libro de soluciones de Gemma

Accede a los modelos de Gemma hoy mismo

Desarrollo de IA responsable

Optimizado para Google Cloud

Aceleración de la investigación académica con créditos de Google Cloud

Únete a la comunidad

Kaggle

Discord

Blog

Presentamos
Gemma 2