يمكن أن ينشئ الذكاء الاصطناعي التوليدي (GenAI) مجموعة أوسع من المحتوى المتنوّع على نطاق واسع لم يسبق له تخيله. وفي حين أنّ الغالبية العظمى من هذه الاستخدامات هي لأغراض مشروعة، إلا أنّ هناك مخاوف من إمكانية أن تساهم في حدوث مشاكل متعلقة بالمعلومات الخاطئة والإحالة الخاطئة. إنّ وضع العلامة المائية هو أحد الأساليب التي تساعد في التخفيف من هذه التأثيرات المحتملة. يمكن تطبيق علامات مائية غير مرئية للبشر على المحتوى من إنشاء الذكاء الاصطناعي، ويمكن لنماذج رصد المحتوى منح تقييمات لمحتوى عشوائي للإشارة إلى احتمالية وضع علامة مائية عليه.
SynthID هي تكنولوجيا تقدّمها Google DeepMind لإضافة العلامات المائية وتحديد المحتوى الذي يتم إنشاؤه عبر الذكاء الاصطناعي عن طريق تضمين علامات مائية رقمية مباشرةً في صور أو أصوات أو فيديوهات من إنشاء الذكاء الاصطناعي. تم إتاحة رمز SynthID Text المفتوح المصدر لإتاحة إضافة علامة مائية لإنشاء النصوص للمطوّرين. يمكنك قراءة البحث في Nature للحصول على وصف تقني أكثر اكتمالاً للطريقة.
يتوفّر تطبيق SynthID Text على مستوى الإنتاج في Hugging Face Transformers v4.46.0 والإصدارات الأحدث، ويمكنك تجربته في مساحة SynthID Text الرسمية. يتوفّر أيضًا على GitHub تطبيق مرجعي قد يكون مفيدًا لمشرفي المحتوى المفتوحة المصدر والمساهمين الذين يريدون استخدام هذه التقنية في إطارات عمل أخرى.
تطبيق العلامة المائية
من الناحية العملية، فإن SynthID Text هو معالج لوجيس يتم تطبيقه على مسار إنشاء نموذجك بعد Top-K وTop-P، ويزيد من لوجيت النموذج باستخدام دالة g الزائفة لترميز المعلومات بهدف إضافة العلامات المائية بطريقة تساعدك في تحديد ما إذا تم إنشاء النص من خلال نموذجك، بدون التأثير بشكل كبير على جودة النص. اطّلِع على المقالة للحصول على وصف فني كامل للخوارزمية وتحليلات عن كيفية تأثير قيم الضبط المختلفة في الأداء.
يتم ضبط العلامات المائية لمعلَمة الدالة g وكيفية تطبيقها أثناء إنشائها. يجبتخزين كل إعدادات وضع العلامة المائية التي تستخدمها بأمان وبشكل خاص، وإلا قد يتم نسخ علامتك المائية بسهولة من قِبل الآخرين.
يجب تحديد مَعلمتَين في كلّ إعدادات وضع العلامة المائية:
- المَعلمة
keys
هي قائمة بأرقام صحيحة عشوائية وفريدة تُستخدَم للقيام بحساب نتائج الدالة g في جميع المفردات في النموذج. يحدد طول هذه القائمة عدد طبقات العلامات المائية التي يتم تطبيقها. اطّلِع على الملحق C.1 في الورقة للحصول على مزيد من التفاصيل. - تُستخدَم المَعلمة
ngram_len
لتحقيق التوازن بين المتانة وإمكانية رصد العلامة المائية، فكلما كانت القيمة أكبر، كان من الأسهل رصد العلامة المائية، ولكن مع التكلفة المتمثّلة في التعرّض بشكل أكبر للتغييرات. وتكون القيمة التلقائية الجيدة هي 5.
يمكنك ضبط العلامة المائية بشكل أكبر استنادًا إلى متطلبات الأداء:
- يتمّ إعداد جدول عيّنات باستخدام سمتَين، وهما
sampling_table_size
وsampling_table_seed
. تريد استخدامsampling_table_size
لا يقل عن \( 2^{16} \) لضمان الحصول على دالة g غير متحيّزة ومستقرة عند أخذ العيّنات، ولكن عليك الانتباه إلى أنّ حجم جدول أخذ العيّنات يؤثر في مقدار الذاكرة المطلوبة في وقت الاستنتاج. يمكنك استخدام أي عدد صحيح تريده لسمةsampling_table_seed
. - ولا يتم وضع علامة مائية على وحدات n المتكررة في الرموز المميّزة السابقة لـ
context_history_size
لتحسين إمكانية رصدها.
لا يلزم إجراء تدريب إضافي لإنشاء نص يتضمّن علامة مائية من SynthID Text
باستخدام نماذجك، ما عليك سوى تحديد
إعدادات العلامة المائية التي يتم تمريرها إلى .generate()
في النموذج لتفعيل معالج سجلّات الأركان الأساسية في SynthID Text. يمكنك الاطّلاع على مشاركة المدونة وSpace للحصول على أمثلة على الرموز البرمجية التي توضّح كيفية تطبيق علامة مائية في مكتبة Transformers.
رصد العلامة المائية والتحقّق منها
احتمال رصد العلامة المائية. يتوفّر أداة رصد باستخدام نموذج بايزي مع Hugging Face Transformers وعلى GitHub. يمكن أن يعرض هذا الكاشف ثلاث حالات محتملة للكشف: تم وضع علامة مائية أو لم يتم وضع علامة مائية أو غير مؤكد، ويمكن تخصيص السلوك من خلال ضبط قيمتَي حدّ لتحقيق معدّل محدّد للنتائج الإيجابية الزائفة والنتائج السلبية الزائفة. يُرجى الاطّلاع على الملحق C.8 في الورقة لمزيد من التفاصيل.
يمكن للنماذج التي تستخدم أداة الترميز نفسها أيضًا مشاركة إعدادات أداة رصد العلامة المائية، وبالتالي مشاركة علامة مائية شائعة، ما دامت مجموعة تدريب أداة الكشف تتضمّن أمثلة من جميع النماذج التي تشترك في العلامة المائية.
بعد أن يكون لديك نظام رصد مدرَّب، يمكنك اختيار ما إذا كنت تريد إظهاره للمستخدمين والجمهور بشكل عام، وتحديد كيفية إظهاره.
- لا يؤدي خيار الخصوصية الكاملة إلى إزالة أداة رصد الأصوات أو إظهارها بأي شكل من الأشكال.
- لا يؤدي الخيار شبه خاص إلى إزالة أداة رصد المحتوى، ولكنه يعرضه من خلال واجهة برمجة تطبيقات.
- يؤدي خيار الإصدار العلني إلى إتاحة أداة رصد الفيروسات للآخرين لتنزيلها واستخدامها.
عليك أنت ومؤسستك تحديد منهج التحقّق من رصد التهديدات الذي يناسب احتياجاتك على أفضل وجه، استنادًا إلى قدرتك على إتاحة البنية الأساسية والعمليات المرتبطة.
القيود
إنّ علامات مائية النص SynthID مقاومة لبعض عمليات التحويل، مثل اقتصاص أجزاء من النص أو تعديل بعض الكلمات أو إعادة الصياغة بشكل بسيط، ولكن لهذه الطريقة قيود.
- يكون استخدام العلامة المائية أقل فعالية في الردود الوقائعية، إذ تتوفّر فرص أقل لتعزيز عملية الإنشاء بدون تقليل مستوى الدقة.
- يمكن أن تنخفض بشكل كبير نتائج ثقة أداة الرصد عندما يتم إعادة كتابة نص أنشأه الذكاء الاصطناعي بدقة أو ترجمته إلى لغة أخرى.
لم يتم تصميم SynthID Text لمنع الخصوم المتحمسين مباشرة من التسبب في الأذى. مع ذلك، قد يصعب استخدام المحتوى الذي تم إنشاؤه عبر الذكاء الاصطناعي للأغراض الضارة، ويمكن دمجه مع أساليب أخرى لتوفير تغطية أفضل على مستوى أنواع المحتوى والمنصات.