ShieldGemma

ShieldGemma は、テキスト プロンプトの安全性を評価するための指示用に調整されたモデルのセット 一連の定義済みの安全性ポリシーに照らして、入力およびテキスト出力のレスポンスを次を使用: このモデルは、生成 AI アプリケーションの大規模な実装の一部として実装されています。 生成 AI アプリケーションの安全性に関するポリシー違反を評価して防止します。

ShieldGemma モデルは Gemma 2 上に構築されており、2B、9B、 27B パラメータ サイズ。モデルにはオープン ウェイトが用意されているため、微調整が可能です。 選択することもできますこのモデルのセットと実装コード例は、 コンポーネントの 責任ある生成 AI ツールキット

  • 定義済みの安全性ポリシーに照らして、プロンプトの入力レスポンスと出力レスポンスの安全性を評価します。
  • ShieldGemma モデルにはオープン ウェイトが提供されており、特定のユースケースに合わせてファインチューニングできます。

詳細

ShieldGemma のモデルカードには、モデルの実装、評価、モデルの使用状況、制限事項などに関する詳細情報が含まれています。
Kaggle の ShieldGemma に関するコード、Colab ノートブック、情報、ディスカッションをご覧ください。
ShieldGemma を使用してテキスト プロンプトの入力と出力を評価する実際の例を実行します。