Riskleri değerlendirme ve güvenlik politikaları belirleme

İçerik güvenliği politikaları, online platformlarda ne tür zararlı içeriklere izin verilmediğini tanımlar. YouTube veya Google Play gibi platformların içerik politikalarına aşina olabilirsiniz. Üretken yapay zeka uygulamalarıyla ilgili içerik politikaları da benzerdir. Bu politikalar, uygulamanızın oluşturmaması gereken içerik türlerini tanımlar, modellerin nasıl inceleneceğini ve hangi uygun önlemlerin ekleneceğini belirtir.

Politikalarınız uygulamanızın kullanım alanını yansıtmalıdır. Örneğin, topluluk önerilerine dayalı aile etkinlikleri hakkında fikirler sunmayı amaçlayan bir üretken yapay zeka ürünü, kullanıcılara zarar verebileceği için doğası gereği şiddet barındıran içeriklerin üretilmesini yasaklayan bir politikaya sahip olabilir. Öte yandan, kullanıcıların önerdiği bilim kurgu hikayesi fikirlerini özetleyen bir uygulama, bu türde birçok hikayeye konu olduğu için şiddetin oluşturulmasına izin vermek isteyebilir.

Güvenlik politikalarınız, kullanıcılar için zararlı veya yasa dışı içerik oluşturmayı yasaklamalı ve uygulamanız için bu sınıra uygun oluşturulan içerik türlerini belirtmelidir. Eğitici, belgesel, bilimsel veya sanatsal içerikler söz konusu olduğunda, zararlı olarak kabul edilebilecek içerikler için istisna oluşturabilirsiniz.

Örnekler içeren politika istisnaları da dahil olmak üzere, son derece ayrıntılı bir ayrıntı düzeyinde net politikalar tanımlamak, sorumlu bir ürün oluşturmak için çok önemlidir. Politikalarınız, model geliştirme sürecinizin her adımında kullanılır. Veri temizliği veya etiketleme için hatalı etiketleme; verilerin yanlış etiketlenmesine, verilerin aşırı veya yetersiz şekilde kaldırılmasına veya kaldırılmasına yol açarak modelinizin güvenlik yanıtlarını etkileyebilir. Yanlış tanımlanmış politikalar, değerlendirme açısından değerlendiriciler arası yüksek sapmalara yol açarak modelinizin güvenlik standartlarınızı karşılayıp karşılamadığını görmeyi zorlaştırır.

Varsayımsal politikalar (yalnızca açıklama amaçlı)

Kullanım alanınıza uygun olduğu sürece uygulamanız için kullanabileceğiniz politikalara dair bazı örnekleri aşağıda bulabilirsiniz.

Politika kategorisi Politika
Hassas Kimlik Bilgileri (SPII) Başvuruda hassas ve kimliği tanımlayabilecek bilgiler (ör. bir özel kişinin e-posta adresi, kredi kartı numarası veya sosyal güvenlik numarası) alıntı yapmayacaktır.
Nefret söylemi Uygulama, kimliği ve/veya korunan özellikleri (ör. ırkçı hakaretler, ayrımcılığın teşviki, korunan gruplara karşı şiddet çağrıları) hedefleyen olumsuz ya da zararlı içerikler oluşturmaz.
Taciz Uygulama, başka bir kişiyi hedefleyen kötü amaçlı, göz korkutucu, zorbalık niteliğinde veya kötüye kullanım amaçlı içerikler (ör. fiziksel tehditler, trajik olayların inkar edilmesi, şiddet mağdurlarını küçük düşüren) oluşturmamalıdır.
Tehlikeli İçerikler Uygulama, kendinize ve/veya başkalarına zarar verme (ör. ateşli silahlara ve patlayıcı cihazlara erişme veya bunları üretme, terörizmin tanıtımı, intihara yönelik talimatlar) konusunda talimatlar veya tavsiyeler üretmez.
Müstehcenlik Uygulama, cinsel eylemlere veya diğer açık saçık içeriklere (ör. cinsel açıdan sansürsüz açıklamalar, uyarılmaya yönelik içerik) referanslar barındıran içerikler oluşturmayacaktır.
Zararlı Ürün ve Hizmetlere Erişim Sağlama Uygulama, potansiyel olarak zararlı ürünleri, hizmetleri ve etkinlikleri (ör. kumar, ilaç, havai fişek, cinsel hizmetler tanıtımına erişimi kolaylaştıran) teşvik eden veya bunlara erişim sağlayan içerikler oluşturmamalıdır.
Kötü Amaçlı İçerik Uygulama, yasa dışı veya yanıltıcı faaliyetlerin (ör. kimlik avı hilekarlığı, spam veya toplu talep amaçlı içerik, jailbreak'li uygulama oluşturma) gerçekleştirilmesine yönelik talimatlar oluşturmaz.

Geliştirici kaynakları

Üretken yapay zeka politikalarına örnekler: