Gemma 범위
Gemma Scope 2로 Gemma 3 분석
Gemma Scope 2는 Gemma 3 모델 모음을 위해 설계된 포괄적인 개방형 해석 가능성 도구 모음입니다. 이 도구를 사용하면 개별 레이어의 동작을 검사할 수 있습니다. 이를 통해 연구자는 복잡한 언어 모델 동작을 분석하고, 브레이크아웃이나 환각과 같은 새로운 동작을 디버그할 수 있습니다.
이 툴킷은 모델의 현미경 역할을 하며, Gemma 3 제품군의 모든 레이어에서 학습된 희소 자동 인코더 (SAE)와 트랜스코더를 제공합니다.
이전 버전을 찾고 계신가요?
원래 Gemma 범위 (Gemma 2용)는
Gemma 2 모델 제품군을 사용하는 연구자가 계속 사용할 수 있습니다.
-
모델 행동 평가
SAE 및 트랜스코더를 사용하여 Gemma 3의 복잡한 내부 동작과 다단계 알고리즘을 분석합니다. -
챗봇 안전 및 디버깅
안전한 AI 에이전트를 구축하기 위해 특정 채팅 동작, 거부 메커니즘, 사고 과정 충실도를 분석합니다.
자세히 알아보기
Gemma 범위 2 블로그 읽기
Gemma Scope 2의 새로운 아키텍처, 학습 데이터, 기능에 대해 알아보세요.
Hugging Face에서 다운로드
Gemma 3 해석 가능성 스위트의 가중치, 코드, 문서에 액세스하세요.
Colab에서 실행
대화형 튜토리얼을 사용하여 기능을 시각화하고 모델 동작을 수정해 보세요.
이전 버전 (Gemma 2용 범위 Gemma)
Gemma 2의 원래 Gemma 범위에 관한 블로그와 리소스에 액세스하세요.