ShieldGemma 是一組現成的、經過指令調整的開放權重內容分類器模型,以 Gemma 2 建構,可判斷使用者提供、模型產生或混合內容是否違反內容安全政策。ShieldGemma 經過訓練 傷害 - 色情內容、危險內容、騷擾和仇恨言論 提供三種大小的變化版本:2B、9B 和 270 參數,讓您可以在速度、效能和 符合任何部署項目的可推論性。詳情請參閱 模型資訊卡,進一步瞭解兩者之間的差異 子類
使用 ShieldGemma 保護模型
啟動 Google Colab (Keras) | 啟動 Google Colab (Transformer) |
你可以在下列架構中使用 ShieldGemma 模型。
- KerasNLP,模型查核點可從 Kaggle 取得。如要開始使用,請參閱 Keras Colab 中的 ShieldGemma。
- Hugging Face Transformers,可從 Hugging Face Hub 取得模型查核點。查看 Transformer Colab 的 ShieldGemma 已開始。