ShieldGemma

ShieldGemma 是一组指令微调的模型,用于评估文本提示的安全性 输入和文本输出响应。您可以使用 将该模型作为更大规模部署生成式 AI 应用的一部分,以帮助 评估和防止生成式 AI 应用违反安全政策。

ShieldGemma 模型基于 Gemma 2 在 2B、9B 和 270 亿个参数大小。模型具有开放权重,让您可以对其进行微调 找到最适合您的具体应用场景的解决方案。这组模型和示例实现代码是 组件的 Responsible Generative AI Toolkit

  • 根据一组已定义的安全政策,评估提示输入和输出响应的安全性。
  • ShieldGemma 模型具有开放权重,可以根据您的具体应用场景进行微调。

了解详情

ShieldGemma 的模型卡片包含有关模型实现、评估、模型使用和限制等的详细信息。
在 Kaggle 上查看有关 ShieldGemma 的更多代码、Colab 笔记本、信息和讨论。
运行一个使用 ShieldGemma 来评估文本提示输入和输出的有效示例。