Gemma 범위

Gemma Scope 2로 Gemma 3 분석

Gemma Scope 2는 Gemma 3 모델 모음을 위해 설계된 포괄적인 개방형 해석 가능성 도구 모음입니다. 이 도구를 사용하면 개별 레이어의 동작을 검사할 수 있습니다. 이를 통해 연구자는 복잡한 언어 모델 동작을 분석하고, 브레이크아웃이나 환각과 같은 새로운 동작을 디버그할 수 있습니다.

이 툴킷은 모델의 현미경 역할을 하며, Gemma 3 제품군의 모든 레이어에서 학습된 희소 자동 인코더 (SAE)트랜스코더를 제공합니다.

이전 버전을 찾고 계신가요?
원래 Gemma 범위 (Gemma 2용)는 Gemma 2 모델 제품군을 사용하는 연구자가 계속 사용할 수 있습니다.

  • SAE 및 트랜스코더를 사용하여 Gemma 3의 복잡한 내부 동작과 다단계 알고리즘을 분석합니다.
  • 안전한 AI 에이전트를 구축하기 위해 특정 채팅 동작, 거부 메커니즘, 사고 과정 충실도를 분석합니다.

자세히 알아보기

Gemma Scope 2의 새로운 아키텍처, 학습 데이터, 기능에 대해 알아보세요.
Gemma 3 해석 가능성 스위트의 가중치, 코드, 문서에 액세스하세요.
대화형 튜토리얼을 사용하여 기능을 시각화하고 모델 동작을 수정해 보세요.
Gemma 2의 원래 Gemma 범위에 관한 블로그와 리소스에 액세스하세요.