Джемма Скоуп

Проанализируйте Джемму 3 с помощью Джеммы Scope 2.

Gemma Scope 2 — это комплексный открытый набор инструментов для анализа интерпретируемости, разработанный для коллекции моделей Gemma 3. Этот инструмент позволяет изучать поведение отдельных слоев. Он дает исследователям возможность анализировать сложное поведение языковых моделей и отлаживать возникающие проблемы, такие как «взлом системы» или «галлюцинации».

Этот набор инструментов выступает в роли микроскопа для модели, предоставляя разреженные автокодировщики (SAE) и транскодировщики, обученные на каждом слое семейства Gemma 3.

Ищете предыдущую версию?
Оригинальная версия Gemma Scope (для Gemma 2) по-прежнему доступна исследователям, работающим с семейством моделей Gemma 2.

  • Используйте SAE и транскодеры для анализа сложных внутренних процессов и многошаговых алгоритмов в Gemma 3.
  • Анализ конкретных моделей поведения в чате, механизмов отказа и верности цепочке рассуждений позволит создать более безопасных агентов искусственного интеллекта. Проанализируйте поведение пользователей в чате, механизмы отказа и цепочку рассуждений, чтобы создать более безопасных агентов ИИ.

Подробнее

Узнайте больше о новой архитектуре, обучающих данных и возможностях Gemma Scope 2.
Получите доступ к весам, коду и документации для набора инструментов проверки интерпретируемости Gemma 3.
Воспользуйтесь интерактивным руководством, чтобы визуализировать характеристики и изменить поведение модели.
Ознакомьтесь с блогом и ресурсами, посвященными оригинальной версии учебника Gemma Scope для Gemma 2.