Visor Gemma
Analiza Gemma 3 con Gemma Scope 2
Gemma Scope 2 es un conjunto integral y abierto de herramientas de interpretabilidad diseñadas para la colección de modelos Gemma 3. Esta herramienta te permite examinar el comportamiento de las capas individuales. Permite a los investigadores analizar comportamientos complejos de los modelos de lenguaje y depurar comportamientos emergentes, como las evasiones o las alucinaciones.
Este kit de herramientas actúa como un microscopio para el modelo, ya que proporciona autoencoders dispersos (SAE) y transcodificadores entrenados en cada capa de la familia Gemma 3.
¿Buscas la versión anterior?
El alcance de Gemma (para Gemma 2) original
sigue disponible para los investigadores que trabajan con la familia de modelos de Gemma 2.
-
Evaluación del comportamiento del modelo
Usa codificadores automáticos dispersos (SAE) y transcodificadores para analizar comportamientos internos complejos y algoritmos de varios pasos en Gemma 3. -
Seguridad y depuración del chatbot
Analizar comportamientos específicos del chat, mecanismos de rechazo y fidelidad de la cadena de pensamiento para crear agentes de IA más seguros