ShieldGemma

ShieldGemma est un ensemble de modèles de classification de contenu prêts à l'emploi, affinés par instruction et à poids ouverts, basés sur Gemma 2. Ils peuvent déterminer si le contenu fourni par l'utilisateur, généré par un modèle ou mixte enfreint un règlement sur la sécurité du contenu. ShieldGemma est entraîné pour identifier quatre types de contenus nuisibles : les contenus à caractère sexuel, les contenus dangereux, le harcèlement et les propos haineux. Il existe trois variantes de taille (paramètres 2 B, 9 B et 27 B) qui vous permettent d'équilibrer la vitesse, les performances et la généralisabilité en fonction de vos besoins pour tout déploiement. Consultez le fiche modèle pour en savoir plus sur la différence entre ces .

Protéger vos modèles avec ShieldGemma

Lancer Google Colab (Keras) Lancer Google Colab (Transformers)

Vous pouvez utiliser les modèles ShieldGemma dans les frameworks suivants.