Gemma-Umfang

Gemma 4 wurde veröffentlicht und unterstützt Text-, Audio- und Bildeingaben sowie ein langes Kontextfenster mit bis zu 256.000 Tokens. Weitere Informationen

Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Gemma 3 mit Gemma Scope 2 analysieren

Gemma Scope 2 ist eine umfassende, offene Suite von Interpretierbarkeitstools, die für die Gemma 3-Modellsammlung entwickelt wurde. Mit diesem Tool können Sie das Verhalten einzelner Ebenen untersuchen. Damit können Forscher komplexes Verhalten von Sprachmodellen analysieren und neu auftretende Verhaltensweisen wie Jailbreaks oder Halluzinationen debuggen.

Dieses Toolkit fungiert als Mikroskop für das Modell und bietet dünnbesetzte Autoencoder (Sparse Autoencoders, SAEs) und Transcoder, die für jede Ebene der Gemma 3-Familie trainiert wurden.

Sie suchen die vorherige Version?
Der ursprüngliche Gemma Scope (für Gemma 2) ist weiterhin für Forscher verfügbar, die mit der Gemma 2-Modellfamilie arbeiten.

Bewertung des Modellverhaltens

Mit SAEs und Transcodern können Sie komplexe interne Verhaltensweisen und mehrstufige Algorithmen in Gemma 3 analysieren.
Chatbot-Sicherheit und ‑Debugging

Analysieren Sie bestimmte Chat-Verhaltensweisen, Ablehnungsmechanismen und die Treue der Gedankenkette, um sicherere KI-Agents zu entwickeln.

Gemma-Umfang

Gemma 3 mit Gemma Scope 2 analysieren

Bewertung des Modellverhaltens

Chatbot-Sicherheit und ‑Debugging

Weitere Informationen

Blog zu Gemma Scope 2 lesen

Von Hugging Face herunterladen

In Colab ausführen

Vorherige Version (Gemma für Gemma 2)