لمحة عن النماذج التوليدية

يمكن لنماذج الذكاء الاصطناعي التوليدي (AI) مثل مجموعة نماذج Gemini إنشاء محتوى من أنواع مختلفة من إدخالات البيانات، بما في ذلك النصوص والصور والمقاطع الصوتية. تعمل هذه النماذج، في أبسط مستوياتها، مثل تطبيقات الإكمال التلقائي المتقدمة. بالنظر إلى نص الإدخال ("يمكنك أن تقود حصانًا إلى الماء")، يمكن للنموذج التوليدي التنبؤ بأن نص الناتج الذي من المرجح إحصائيًا اتباعه ("ولكن لا يمكنك شربه")، بناءً على الأنماط المستفادة من بيانات التدريب. يمكنك استخدام هذه السمة الأساسية للنماذج التوليدية لتطبيقات مختلفة:

  • إنشاء كتابات إبداعية مثل الشعر والقصص القصيرة والاستعارات ومشاركات المدونات
  • تحويل البيانات المنظَّمة إلى نص حر الشكل
  • استخراج المعلومات وتلخيصها من النص الحر
  • إنشاء شفرة
  • الترجمة بين العديد من اللغات

لا يتطلب استخدام النماذج التوليدية لإنشاء هذه الميزات أي خبرة في تعلُّم الآلة. لا تحتاج إلى جمع مجموعة بيانات كبيرة أو تدريب نموذج. كل ما يتطلبه الأمر لبدء نموذجك الأوّلي الأول هو وصف ما تريد أن يفعله النموذج في بضع جمل.

تُعرف النماذج التوليدية التي تعالج فقط إدخال النص وإخراجه باسم النماذج اللغوية الكبيرة (LLM). ويمكن لمجموعة نماذج Gemini معالجة أكثر من البيانات النصية، وعلى الرغم من أنّها يمكنها تنفيذ وظائف النموذج اللغوي الكبير (LLM)، إلّا أنّها تُعرَف أكثر باسم النماذج التوليدية.

أمثلة على التطبيقات

تعرض الأمثلة التالية المدخلات النصية النموذجية للنموذج التوليدي ومخرجاته.

إنشاء قصيدة

البيانات التي أدخلها المستخدم: Write me a four-line poem about puppies and Android phones. Make sure it rhymes.

إخراج النموذج:

Puppies are cute,
Android phones are neat,
They both bring joy,
And make life complete.

إنشاء قائمة

البيانات التي أدخلها المستخدم: Generate a bulleted list of items I need to pack for a three-day camping trip.

إخراج النموذج:

*   Tent
*   Sleeping bag
*   Sleeping pad
*   Camp stove
*   Pots and pans
*   Utensils
*   Food
*   Water
*   First-aid kit
*   Sunscreen
*   Insect repellent
*   ...

يمكنك الحصول على نماذج إنشاءية لإنتاج جميع أنواع السلوكيات المفيدة مثل هذه، من خلال صياغة نص الإدخال الصحيح، والذي يُعرف أيضًا باسم الطلب. يُطلق على فن وعلم تحديد الصياغة الصحيحة لإعداد النماذج التوليدية اسم تصميم الطلبات (يسمى أيضًا "هندسة الطلبات" أو ببساطة "الطلب").

تصميم المطالبة 101

أظهر القسم السابق بعض الأمثلة على المطالبات التي تحتوي على تعليمات، مثل "اكتب لي قصيدة". قد يعمل هذا النوع من التعليمات بشكل جيد لأنواع معينة من المهام. ومع ذلك، بالنسبة إلى التطبيقات الأخرى، قد يكون من الأفضل استخدام أسلوب آخر من أساليب تقديم الطلب، وهو تقديم طلب ببضع لقطات. تستفيد المطالبات ذات اللقطات القليلة من حقيقة أن النماذج اللغوية الكبيرة جيدة بشكل لا يصدق في التعرف على الأنماط في البيانات النصية وتكرارها. والفكرة هي إرسال نمط نصي يتعلم إكماله للنموذج التوليدي. على سبيل المثال، لنفترض أنك تريد إنشاء تطبيق يتخذ كإدخال اسم بلد ويخرج مدينة عاصمةها. إليك مطالبة نصية تم تصميمها للقيام بذلك:

Italy : Rome
France : Paris
Germany :

في هذا الطلب، أنشئ نقشًا: [country] : [capital]. إذا أرسلت هذا الطلب إلى نموذج لغوي كبير، فسيتم إكمال النمط تلقائيًا ويعرض شيئًا مثل هذا:

     Berlin
Turkey : Ankara
Greece : Athens

قد تبدو استجابة النموذج هذه غريبة بعض الشيء. لم يعرض النموذج عاصمة ألمانيا فقط (البلد الأخير في طلبك المكتوب بخط اليد)، بل تضمّن أيضًا قائمة كاملة بالبلدان الإضافية وأزواج رأس المال. ذلك لأن النموذج التوليدي هو "استمرار النمط". إذا كان كل ما تحاول تنفيذه هو إنشاء دالة تخبرك بعاصمة بلد الإدخال ("ألمانيا: برلين")، فربما لا تكون مهتمًا بأي نصوص يتم إنشاؤها بعد "برلين". في الواقع، كمصممي تطبيقات، ربما ترغب في اقتطاع تلك الأمثلة الغريبة. علاوة على ذلك، من الأفضل أن تضبط الإدخال، لكي لا تكون ألمانيا سلسلة ثابتة، بل متغيرًا يوفّره المستخدم النهائي:

Italy : Rome
France : Paris
<user input here> :

لقد كتبت للتو مطالبة مكونة من بضع لقطات لإنشاء عواصم البلدان.

يمكنك إنجاز عدد كبير من المهام باتباع نموذج الطلب الذي يتضمن لقطات قليلة. إليك طلب بضع لقطات بتنسيق مختلف قليلاً يحوّل Python إلى JavaScript:

Convert Python to JavaScript.
Python: print("hello world")
JavaScript: console.log("hello world")
Python: for x in range(0, 100):
JavaScript: for(var i = 0; i < 100; i++) {
Python: ${USER INPUT HERE}
JavaScript:

أو يمكنك استخدام هذا الطلب من "القاموس العكسي". بالنظر إلى التعريف، يتم إرجاع الكلمة التي تناسب هذا التعريف:

Given a definition, return the word it defines.
Definition: When you're happy that other people are also sad.
Word: schadenfreude
Definition: existing purely in the mind, but not in physical reality
Word: abstract
Definition: ${USER INPUT HERE}
Word:

ربما لاحظت أن النمط الدقيق لهذه المطالبات باللقطات القليلة يختلف قليلاً. بالإضافة إلى تضمين أمثلة، يشكّل تقديم التعليمات في طلباتك استراتيجية إضافية يجب مراعاتها عند كتابة الطلبات الخاصة بك، لأنّ ذلك يساعد في توضيح هدفك من النموذج.

المطالبة مقابل تطوير البرامج التقليدي

وعلى عكس البرامج التقليدية المُصممة وفقًا لمواصفات مكتوبة بعناية، لا يمكن لسلوك النماذج التوليدية كثيرًا أن يكون معتمًا حتى بالنسبة إلى مدرّبي النماذج. نتيجة لذلك، غالبًا لا يمكنك التنبؤ مسبقًا بأنواع هياكل المطالبة التي ستعمل بشكل أفضل مع نموذج معين. علاوة على ذلك، يتم تحديد سلوك النموذج التوليدي بشكل كبير من خلال بيانات التدريب، وبما أنّ النماذج يتم ضبطها باستمرار على مجموعات البيانات الجديدة، يتغيّر النموذج بدرجة كافية بحيث يغيّر بدون قصد بُنى الطلب التي تعمل بشكل أفضل. ماذا يعني هذا بالنسبة لك؟ إجراء التجارب! جرِّب تنسيقات مختلفة للطلبات.

معلمات النموذج

إنّ كل طلب ترسله إلى النموذج يتضمّن قيم معلَمات تتحكّم في طريقة إنشاء النموذج للاستجابة. يمكن أن ينشئ النموذج نتائج مختلفة لقيم معاملات مختلفة. معلمات النموذج الأكثر شيوعًا هي:

  1. الحد الأقصى للرموز المميزة للإخراج: يحدد الحد الأقصى لعدد الرموز المميزة التي يمكن إنشاؤها في الرد. يتكون الرمز المميز من أربعة أحرف تقريبًا. يتوافق 100 رمز مميز مع ما يقرب من 60-80 كلمة.

  2. درجة الحرارة: تتحكّم درجة الحرارة في درجة العشوائية في اختيار الرمز المميّز. وتُستخدم درجة الحرارة في أخذ العيّنات أثناء إنشاء الاستجابة، ويحدث ذلك عند تطبيق topP وtopK. درجات الحرارة المنخفضة تكون جيدة للمطالبات التي تتطلب استجابة أكثر حتمية أو أقل مفتوحة، بينما يمكن أن تؤدي درجات الحرارة الأعلى إلى نتائج أكثر تنوعًا أو إبداعًا. تكون درجة الحرارة 0 أمرًا حتميًا، مما يعني أنه يتم دائمًا تحديد أعلى استجابة الاحتمال.

  3. topK: تغيّر المَعلمة topK طريقة اختيار النموذج للرموز المميّزة للإخراج. تعني القيمة topK من 1 أنّ الرمز المميّز هو الأكثر احتمالاً من بين جميع الرموز المميّزة في مفردات النموذج (وهو ما يُعرف أيضًا باسم "فك الترميز الجامح"، بينما تعني القيمة topK من 3 أنّه يتم اختيار الرمز المميّز التالي من بين الرموز الثلاثة الأكثر احتمالاً باستخدام درجة الحرارة. في كل خطوة من خطوات اختيار الرموز المميّزة، يتم أخذ عيّنة من رموز topK المميّزة ذات الاحتمالات الأعلى. بعد ذلك، تتم فلترة الرموز المميّزة بشكل أكبر بناءً على topP مع اختيار الرمز المميّز النهائي باستخدام عيّنات درجات الحرارة.

  4. topP: تغيّر المَعلمة topP طريقة اختيار النموذج للرموز المميّزة للإخراج. يتم اختيار الرموز المميّزة من الأكثر إلى الأقل احتمالاً إلى أن يساوي مجموع احتمالاتها القيمة topP. على سبيل المثال، إذا كانت الرموز المميزة A وB وC لها احتمالية 0.3 و0.2 و0.1 وكانت قيمة topP 0.5، سيختار النموذج A أو B كرمز مميّز تاليًا باستخدام درجة الحرارة مع استبعاد C كعنصر مرشّح. القيمة التلقائية topP هي 0.95.

  5. stop_sequences: اضبط تسلسل إيقاف لتوجيه النموذج إلى التوقف عن إنشاء المحتوى. يمكن أن يكون تسلسل التوقف أي تسلسل للأحرف. حاول تجنب استخدام تسلسل من الأحرف التي قد تظهر في المحتوى الذي تم إنشاؤه.

أنواع الطلبات

واعتمادًا على مستوى المعلومات السياقية التي تتضمنها هذه الطلبات، يتم تصنيف الطلبات على نطاق واسع إلى ثلاثة أنواع.

الطلبات بلا لقطات

ولا تتضمّن هذه الطلبات أمثلة لتكرار النموذج. تُظهر الطلبات التي لا تتضمّن أي لقطات بشكل أساسي قدرة النموذج على إكمال المطالبة بدون أي أمثلة أو معلومات إضافية. وهذا يعني أن النموذج يجب أن يعتمد على معرفته الموجودة مسبقًا للوصول إلى إجابة مقنعة.

في ما يلي بعض أنماط الطلبات التي لا يتم استخدامها عادةً:

  • محتوى إرشادي
<Overall instruction>
<Content to operate on>

على سبيل المثال:

Summarize the following into two sentences at the third-grade level:

Hummingbirds are the smallest birds in the world, and they are also one of the
most fascinating. They are found in North and South America, and they are known
for their long, thin beaks and their ability to fly at high speeds.

Hummingbirds are made up of three main parts: the head, the body, and the tail.
The head is small and round, and it contains the eyes, the beak, and the brain.
The body is long and slender, and it contains the wings, the legs, and the
heart. The tail is long and forked, and it helps the hummingbird to balance
while it is flying.

Hummingbirds are also known for their coloration. They come in a variety of
colors, including green, blue, red, and purple. Some hummingbirds are even able
to change their color!

Hummingbirds are very active creatures. They spend most of their time flying,
and they are also very good at hovering. Hummingbirds need to eat a lot of food
in order to maintain their energy, and they often visit flowers to drink nectar.

Hummingbirds are amazing creatures. They are small, but they are also very
powerful. They are beautiful, and they are very important to the ecosystem.
  • محتوى إرشادي وتعليمات
<Overall instruction or context setting>
<Content to operate on>
<Final instruction>

على سبيل المثال:

Here is some text I'd like you to summarize:

Hummingbirds are the smallest birds in the world, and they are also one of the
most fascinating. They are found in North and South America, and they are known
for their long, thin beaks and their ability to fly at high speeds. Hummingbirds
are made up of three main parts: the head, the body, and the tail. The head is
small and round, and it contains the eyes, the beak, and the brain. The body is
long and slender, and it contains the wings, the legs, and the heart. The tail
is long and forked, and it helps the hummingbird to balance while it is flying.
Hummingbirds are also known for their coloration. They come in a variety of
colors, including green, blue, red, and purple. Some hummingbirds are even able
to change their color! Hummingbirds are very active creatures. They spend most
of their time flying, and they are also very good at hovering. Hummingbirds need
to eat a lot of food in order to maintain their energy, and they often visit
flowers to drink nectar. Hummingbirds are amazing creatures. They are small, but
they are also very powerful. They are beautiful, and they are very important to
the ecosystem.

Summarize it in two sentences at the third-grade reading level.
  • المتابعة. وفي بعض الأحيان، يمكنك جعل النموذج يواصل النص بدون أي تعليمات. على سبيل المثال، إليك طلب اللقطة التي يكون فيها النموذج مُصممًا لمواصلة الإدخال المقدم:
Once upon a time, there was a little sparrow building a nest in a farmer's
barn. This sparrow

استخدِم الطلبات التي لا تتطلب أي لقطة شاشة لإنشاء تنسيقات نصية إبداعية، مثل القصائد أو الرموز البرمجية أو النصوص البرمجية أو القطع الموسيقية أو الرسائل الإلكترونية أو الخطابات.

الطلبات من خلال لقطة واحدة

تقدم هذه المطالبات إلى النموذج مثالاً واحدًا لتكرار النمط ومواصلته. يسمح هذا بإنشاء ردود يمكن توقعها من النموذج.

على سبيل المثال، يمكنك إنشاء أنواع مختلفة من الطعام، مثل:

Food: Apple
Pairs with: Cheese
Food: Pear
Pairs with:

طلبات ذات لقطات قليلة

وتقدِّم هذه الطلبات إلى النموذج عدة أمثلة يمكن تكرارها. استخدم مطالبات قليلة لإكمال المهام المعقدة، مثل تجميع البيانات بناءً على نمط.

في ما يلي مثال على الطلب:

Generate a grocery shopping list for a week for one person. Use the JSON format
given below.
{"item": "eggs", "quantity": "6"}
{"item": "bread", "quantity": "one loaf"}

مزيد من التفاصيل عن النماذج التوليدية

يهدف هذا القسم إلى الإجابة عن السؤال التالي: هل هناك عشوائية في ردود النماذج التوليدية، أم أنّها حتمية؟

الإجابة المختصرة هي نعم لكليهما. عند طلب إنشاء نموذج توليدي، يتم إنشاء ردّ نصي على مرحلتين. في المرحلة الأولى، يعالج النموذج التوليدي طلب الإدخال وينشئ توزيعًا للاحتمالية مقارنةً بالرموز المميزة (الكلمات) المحتملة التي يُرجّح أن تأتي بعد ذلك. على سبيل المثال، إذا طلبت نص الإدخال "الكلب قفز فوق ... "، سينتج النموذج التوليدي صفيفًا من الكلمات التالية المحتملة:

[("fence", 0.77), ("ledge", 0.12), ("blanket", 0.03), ...]

هذه العملية حتمية، وسينتج عن النموذج التوليدي التوزيع نفسه في كل مرة يتم فيها إدخال نص الطلب نفسه.

في المرحلة الثانية، يحوّل النموذج التوليدي هذه التوزيعات إلى استجابات نصية فعلية من خلال إحدى استراتيجيات فك الترميز المتعدّدة. قد تحدد استراتيجية بسيطة لفك الترميز الرمز المميز الأكثر احتمالاً في كل خطوة زمنية. ستكون هذه العملية دائمًا حتمية. مع ذلك، يمكنك اختيار إنشاء ردّ من خلال أخذ عيّنات عشوائيًا على التوزيع الذي يعرضه النموذج. وستكون هذه العملية عشوائية (عشوائية). تحكم في درجة العشوائية المسموح بها في عملية فك الترميز هذه عن طريق ضبط درجة الحرارة. وعندما تكون درجة الحرارة 0، يعني ذلك اختيار الرموز المميزة الأكثر احتمالاً فقط، وليس هناك أي ترتيب عشوائي. وبالعكس، تمنح درجة الحرارة المرتفعة درجة عالية من العشوائية في الرموز المميزة التي يحددها النموذج، مما يؤدي إلى استجابات نموذج غير متوقعة ومدهشة أكثر.

محتوى إضافي للقراءة

  • بعد أن أوضحت تفاصيل الطلبات والنماذج التوليدية، يمكنك كتابة طلباتك الخاصة باستخدام استوديو Google AI Studio.
  • راجِع إرشادات الطلب للاطّلاع على مزيد من المعلومات حول أفضل الممارسات لإنشاء الطلبات.