Gemma 镜
Gemma Scope 是一款研究工具,用于分析和了解 Gemma 2 生成式 AI 模型的内部运作方式。借助该工具,您可以在 Gemma 2 模型处理请求时检查 Gemma 2 模型的各个 AI 模型层的行为。研究人员可以应用此技术来检查和帮助解决幻觉、偏见和操纵等重大问题,最终打造更安全、更值得信赖的 AI 系统。
此工具为研究人员提供了一套稀疏自动编码器,用于检查 Gemma 2 核心模型学到的特征和表示法。您可以使用该工具,通过提供的自动编码器对 Gemma 2 模型进行插桩,以便在处理请求时检查各个 AI 模型层的行为。如需详细了解如何使用此工具分析 Gemma 2 模型,请参阅 Gemma 作用域指南。
-
模型行为评估
通过层级别分析评估 Gemma 2 模型的精确行为。 -
修改 Gemma 模型行为
使用 Gemma Scope 修改模型层并评估对整体模型行为的影响。
了解详情
阅读博文
详细了解 Gemma Scope 的用途和功能。
从 Hugging Face 下载
查看有关 Gemma Scope 的代码、笔记本、信息和讨论。
在 Colab 中运行
运行一个可运行的示例 Gemma Scope 测试装置,用于评估 Gemma 2 模型。