Visor Gemma

Analiza Gemma 3 con Gemma Scope 2

Gemma Scope 2 es un conjunto integral y abierto de herramientas de interpretabilidad diseñadas para la colección de modelos Gemma 3. Esta herramienta te permite examinar el comportamiento de las capas individuales. Permite a los investigadores analizar comportamientos complejos de los modelos de lenguaje y depurar comportamientos emergentes, como las evasiones o las alucinaciones.

Este kit de herramientas actúa como un microscopio para el modelo, ya que proporciona autoencoders dispersos (SAE) y transcodificadores entrenados en cada capa de la familia Gemma 3.

¿Buscas la versión anterior?
El alcance de Gemma (para Gemma 2) original sigue disponible para los investigadores que trabajan con la familia de modelos de Gemma 2.

  • Usa codificadores automáticos dispersos (SAE) y transcodificadores para analizar comportamientos internos complejos y algoritmos de varios pasos en Gemma 3.
  • Analizar comportamientos específicos del chat, mecanismos de rechazo y fidelidad de la cadena de pensamiento para crear agentes de IA más seguros

Más información

Obtén información sobre la nueva arquitectura, los datos de entrenamiento y las capacidades de Gemma Scope 2.
Accede a los pesos, el código y la documentación del paquete de interpretabilidad de Gemma 3.
Prueba el instructivo interactivo para visualizar las funciones y modificar el comportamiento del modelo.
Accede al blog y a los recursos del alcance original de Gemma para Gemma 2.