Gemma Scope, Gemma Scope
Analizoni Gemma 3 me Gemma Scope 2
Gemma Scope 2 është një suitë gjithëpërfshirëse dhe e hapur mjetesh interpretueshmërie, e projektuar për koleksionin e modeleve Gemma 3. Ky mjet ju lejon të shqyrtoni sjelljen e shtresave individuale. Ai u lejon studiuesve të analizojnë sjelljet komplekse të modeleve gjuhësore dhe të debugojnë sjelljet emergjente, të tilla si jailbreak-et ose halucinacionet.
Ky komplet mjetesh vepron si mikroskop për modelin, duke ofruar Autoenkoderë të rrallë (SAE) dhe Transkoderë të trajnuar në çdo shtresë të familjes Gemma 3.
Po kërkoni versionin e mëparshëm?
Gemma Scope origjinal (për Gemma 2) mbetet i disponueshëm për studiuesit që punojnë me familjen e modeleve Gemma 2.
-
Vlerësimi i modelit të sjelljes
Përdorni SAE dhe Transkoderë për të analizuar sjelljet komplekse të brendshme dhe algoritmet me shumë hapa në Gemma 3. -
Siguria dhe debuggimi i chatbot-eve
Analizoni sjelljet specifike të bisedës, mekanizmat e refuzimit dhe besnikërinë e zinxhirit të mendimit për të ndërtuar agjentë më të sigurt të inteligjencës artificiale.