ShieldGemma est un ensemble de modèles de classification de contenu prêts à l'emploi, affinés par instruction et à poids ouverts, basés sur Gemma 2. Ils peuvent déterminer si le contenu fourni par l'utilisateur, généré par un modèle ou mixte enfreint un règlement sur la sécurité du contenu. ShieldGemma est entraîné pour identifier quatre types de contenus nuisibles : les contenus à caractère sexuel, les contenus dangereux, le harcèlement et les propos haineux. Il existe trois variantes de taille (paramètres 2 B, 9 B et 27 B) qui vous permettent d'équilibrer la vitesse, les performances et la généralisabilité en fonction de vos besoins pour tout déploiement. Consultez le fiche modèle pour en savoir plus sur la différence entre ces .
Protéger vos modèles avec ShieldGemma
Lancer Google Colab (Keras) | Lancer Google Colab (Transformers) |
Vous pouvez utiliser les modèles ShieldGemma dans les frameworks suivants.
- KerasNLP, avec des points de contrôle du modèle disponibles Kaggle. Consultez le ShieldGemma dans Keras Colab pour commencer.
- Hugging Face Transformers, avec des points de contrôle de modèle disponibles sur le Hub Hugging Face. Consultez le ShieldGemma dans Transformers Colab pour obtenir pour commencer.