Джемма Скоуп
Проанализируйте Джемму 3 с помощью Джеммы Scope 2.
Gemma Scope 2 — это комплексный открытый набор инструментов для анализа интерпретируемости, разработанный для коллекции моделей Gemma 3. Этот инструмент позволяет изучать поведение отдельных слоев. Он дает исследователям возможность анализировать сложное поведение языковых моделей и отлаживать возникающие проблемы, такие как «взлом системы» или «галлюцинации».
Этот набор инструментов выступает в роли микроскопа для модели, предоставляя разреженные автокодировщики (SAE) и транскодировщики, обученные на каждом слое семейства Gemma 3.
Ищете предыдущую версию?
Оригинальная версия Gemma Scope (для Gemma 2) по-прежнему доступна исследователям, работающим с семейством моделей Gemma 2.
-
Оценка поведения модели
Используйте SAE и транскодеры для анализа сложных внутренних процессов и многошаговых алгоритмов в Gemma 3. -
Безопасность и отладка чат-ботов
Анализ конкретных моделей поведения в чате, механизмов отказа и верности цепочке рассуждений позволит создать более безопасных агентов искусственного интеллекта. Проанализируйте поведение пользователей в чате, механизмы отказа и цепочку рассуждений, чтобы создать более безопасных агентов ИИ.