يمكن لنماذج الذكاء الاصطناعي التوليدي، مثل مجموعة Gemini، إنشاء محتوى باستخدام أنواع مختلفة من إدخال البيانات، بما في ذلك النصوص والصور والمقاطع الصوتية. على المستوى الأساسي، تعمل هذه النماذج مثل تطبيقات الإكمال التلقائي المتقدّمة. استنادًا إلى النص الذي يتم إدخاله ("يمكنك إغراء حصان بالماء،")، يمكن للنموذج التوليدي توقّع النص الذي يُحتمل أن يليه من الناحية الإحصائية ("ولكن لا يمكنك إجباره على الشرب")، استنادًا إلى الأنماط التي تعلّمها من بيانات التدريب. يمكنك استخدام هذه الخاصية الأساسية ل النماذج التوليدية في تطبيقات مختلفة:
- إنشاء أعمال إبداعية، مثل القصائد والقصص القصيرة والاستعارات ومقالات المدونات
- تحويل البيانات المنظَّمة إلى نص حر الشكل
- استخراج المعلومات من النص الحر وتلخيصه
- إنشاء شفرة
- الترجمة بين اللغات
لا يتطلّب استخدام النماذج التوليدية لإنشاء هذه الميزات أيّ خبرة في تعلُّم الآلة. لست بحاجة إلى جمع مجموعة بيانات كبيرة أو تدريب نموذج. لبدء إنشاء النموذج الأوّلي الأول، ما عليك سوى وصف ما تريده من النموذج في بضع جمل.
تُعرَف النماذج التوليدية التي تعالج عمليات إدخال وإخراج النص فقط باسم النماذج اللغوية الكبيرة (LLM). يمكن لمجموعة Gemini من النماذج معالجة أكثر من البيانات النصية. ومع أنّ هذه النماذج قادرة على أداء وظائف النموذج اللغوي الكبير، فإنّها تُعرف أكثر باسم النماذج التوليدية.
أمثلة على التطبيقات
تعرض الأمثلة التالية الإدخالات النصية النموذجية والمخرجات من النموذج التوليدي.
إنشاء قصيدة
إدخال المستخدم: Write me a four-line poem about puppies and Android phones. Make
sure it rhymes.
ناتج النموذج:
Puppies are cute,
Android phones are neat,
They both bring joy,
And make life complete.
إنشاء قائمة
إدخال المستخدم: Generate a bulleted list of items I need to pack for a three-day
camping trip.
مخرجات النموذج:
* Tent
* Sleeping bag
* Sleeping pad
* Camp stove
* Pots and pans
* Utensils
* Food
* Water
* First-aid kit
* Sunscreen
* Insect repellent
* ...
يمكنك استخدام النماذج التوليدية لإنشاء جميع أنواع السلوكيات المفيدة مثل هذا، وذلك من خلال إنشاء نص الإدخال المناسب، والذي يُعرف أيضًا باسم الطلب. يُطلق على الفن والعلم المتعلقان بتحديد الصياغة الصحيحة لحثّ النماذج التوليدية على تنفيذ ما تريده اسم تصميم الطلب (يُعرف أيضًا باسم "هندسة الطلب" أو "طلب النموذج" ببساطة).
الدليل الإرشادي لتصميم الطلبات
عرض القسم السابق بعض الأمثلة على الطلبات التي تحتوي على تعليمات، مثل "أريد منك كتابة قصيدة". قد يكون هذا النوع من التعليمات مناسبًا لأنواع معيّنة من المهام. ومع ذلك، في التطبيقات الأخرى، قد يكون من الأفضل استخدام أسلوب توجيه طلبات مختلف يُعرف باسم توجيه طلبات من خلال لقطات قليلة. تستفيد طلبات النماذج اللغوية الكبيرة التي تستخدم أمثلة قليلة من حقيقة أنّ هذه النماذج جيدة جدًا في التعرّف على الأنماط في بيانات النصوص وتكرارها. والفكرة هي إرسال نمط نصي إلى ال نموذج التوليدي ليتمكّن من إكماله. على سبيل المثال، لنفترض أنّك تريد إنشاء تطبيق يأخذ اسم بلد كمدخل ويعرض اسم عاصمته. إليك طلب نصي مصمّم للقيام بذلك:
Italy : Rome
France : Paris
Germany :
في هذا الطلب، يمكنك إنشاء نمط: [country] : [capital]
. إذا أرسلت
هذه الرسالة إلى نموذج لغوي كبير، سيكمل النموذج النمط تلقائيًا ويعرض بدوره العبارة التالية:
Berlin
Turkey : Ankara
Greece : Athens
قد يبدو هذا النموذج من الردود غريبًا بعض الشيء. لم يعرض النموذج عاصمة ألمانيا فقط (آخر بلد في الطلب المكتوب بخط اليد)، بل يعرض أيضًا قائمة كاملة من أزواج البلدان والعواصم الإضافية. ويعود سبب ذلك إلى أنّ ال نموذج التوليدي "يواصل النمط". إذا كان كل ما تحاول فعله هو إنشاء دالة تُعلمك بعاصمة بلد مُدخل ("ألمانيا : برلين")، قد لا يهمّك أي من النصوص التي يُنشئها النموذج بعد "برلين". في الواقع، وبصفتك مصممًا للتطبيقات، ربما ترغب في اقتطاع تلك الأمثلة الغريبة. بالإضافة إلى ذلك، قد تحتاج إلى تحديد مَعلمات الإدخال، لكي لا تكون ألمانيا سلسلة ثابتة بل متغيّر يقدّمه المستخدم النهائي:
Italy : Rome
France : Paris
<user input here> :
لقد كتبت للتو طلبًا من بضع لقطات لإنشاء عواصم البلدان.
يمكنك إنجاز عدد كبير من المهام باتّباع نموذج الطلبات التي تتضمّن عددًا قليلاً من اللقطات. إليك طلب من بضع لقطات بتنسيق مختلف قليلاً يحول بايثون إلى JavaScript:
Convert Python to JavaScript.
Python: print("hello world")
JavaScript: console.log("hello world")
Python: for x in range(0, 100):
JavaScript: for(var i = 0; i < 100; i++) {
Python: ${USER INPUT HERE}
JavaScript:
يمكنك أيضًا استخدام طلب "القاموس العكسي" هذا. بناءً على تعريف، يتم إرجاع الكلمة التي تناسب هذا التعريف:
Given a definition, return the word it defines.
Definition: When you're happy that other people are also sad.
Word: schadenfreude
Definition: existing purely in the mind, but not in physical reality
Word: abstract
Definition: ${USER INPUT HERE}
Word:
ربما لاحظت أنّ النمط الدقيق لهذه الطلبات التي تتضمّن لقطات قليلة يختلف قليلاً. بالإضافة إلى احتوائها على أمثلة، يُعدّ تقديم تعليمات في طلباتك استراتيجية إضافية يجب أخذها في الاعتبار عند كتابة طلباتك، لأنّه يساعد في إيصال رغبتك إلى النموذج.
المطالبة مقابل تطوير البرامج التقليدية
على عكس البرامج التقليدية المصمّمة وفقًا لمواصفات مكتوبة بعناية، فإنّ سلوك النماذج التوليدية غير واضح إلى حد كبير حتى بالنسبة إلى مدربي النماذج. نتيجةً لذلك، لا يمكنك غالبًا توقّع أنواع بنية الطلبات التي ستكون أفضل لنموذج معيّن. بالإضافة إلى ذلك، يتم تحديد سلوك النموذج التوليدي بدرجة كبيرة من خلال بيانات التدريب، وبما أنّ النماذج يتم تعديلها باستمرار استنادًا إلى مجموعات بيانات جديدة، يتغيّر النموذج أحيانًا بشكل كافٍ لدرجة أنّه يغيّر بدون قصد هياكل الطلبات التي تعمل بشكل أفضل. كيف سيؤثّر ذلك فيك؟ إجراء التجارب! جرِّب تنسيقات طلبات مختلفة.
مَعلمات النموذج
تتضمّن كل طلب ترسله إلى النموذج قيم مَعلمات تتحكّم في كيفية توليد النموذج للردّ. يمكن أن يُنشئ النموذج نتائج مختلفة لقيم المَعلمات المختلفة. معلمات النموذج الأكثر شيوعًا هي:
الحد الأقصى للرموز المميزة للمخرجات: يحدد الحد الأقصى لعدد الرموز المميزة التي يمكن إنشاءها في الرد. يتكون الرمز المميّز من أربعة أحرف تقريبًا. تقابل 100 رمز تقريبًا 60 إلى 80 كلمة.
درجة الحرارة: تتحكّم درجة الحرارة في درجة العشوائية في اختيار الرموز المميّزة. تُستخدَم درجة الحرارة في أخذ العينات أثناء إنشاء الردّ، وذلك عند تطبيق
topP
وtopK
. تكون درجات الحرارة المنخفضة مناسبة للطلبات التي تتطلّب ردًا أكثر تحديدًا أو أقل انفتاحًا، في حين يمكن أن تؤدي درجات الحرارة المرتفعة إلى نتائج أكثر تنوعًا أو إبداعًا. تكون قيمة درجة الحرارة 0 حتمية، ما يعني أنّه يتم دائمًا اختيار القيمة التي تشير إلى احتمالات ردّ الفعل الأعلى.topK
: تغيّر المَعلمةtopK
طريقة اختيار النموذج للرموز المميّزة لتحديد النتيجة. إذا كانت قيمةtopK
هي 1، يعني ذلك أنّ الرمز المحدَّد هو الأكثر احتمالًا بين جميع الرموز في مفردات النموذج (يُعرف ذلك أيضًا باسم الترميز الجشع)، في حين أنّ قيمةtopK
هي 3 تعني أنّ الرمز التالي يتم اختياره من بين 3 الرموز الأكثر احتمالًا باستخدام درجة الحرارة. في كل خطوة لاختيار الرموز، يتم أخذ عيّنات من رموًعtopK
التي تحقّق أعلى احتمالات. بعد ذلك، تتم تصفية الرموز المميّزة بشكل إضافي استنادًا إلىtopP
، ويتم اختيار الرمز المميّز النهائي باستخدام تحليل عيّنات درجة الحرارة.topP
: تغيّر المَعلمةtopP
طريقة اختيار النموذج للرموز المميّزة لتحديد النتيجة. يتم اختيار الرموز من الأكثر إلى الأقل احتمالية إلى أن يصبح مجموع احتمالاتها مساويًا لقيمةtopP
. على سبيل المثال، إذا كانت احتمالات ظهور الرموز A وB وC هي 0.3 و0.2 و0.1 وكانت قيمةtopP
هي 0.5، سيختار النموذج A أو B كرمز لاحق باستخدام درجة الحرارة ويستبعد C كرمز مرشح. القيمة التلقائيةtopP
هي 0.95.stop_sequences
: يمكنك ضبط تسلسل إيقاف لتوجيه النموذج إلى التوقف عن إنشاء المحتوى. يمكن أن يكون تسلسل التوقف أي تسلسل من الأحرف. حاول تجنُّب استخدام تسلسل أحرف قد يظهر في المحتوى الذي تم إنشاؤه.
أنواع الطلبات
استنادًا إلى مستوى المعلومات السياقية الواردة فيها، يتم تصنيف الطلبات على نطاق واسع إلى ثلاثة أنواع.
طلبات بلا مثال
لا تحتوي هذه الطلبات على أمثلة يمكن من خلالها تكرار النموذج. تظهر المطالبات بدون لقطة شاشة قدرة النموذج على إكمال المطالبة دون أي أمثلة أو معلومات إضافية. وهذا يعني أنّه على النموذج الاعتماد على معرفته الحالية لإنشاء إجابة معقولة.
في ما يلي بعض أنماط طلبات البحث بدون إشارات سابقة الشائعة الاستخدام:
- Instruction-content
<Overall instruction>
<Content to operate on>
على سبيل المثال،
Summarize the following into two sentences at the third-grade level:
Hummingbirds are the smallest birds in the world, and they are also one of the
most fascinating. They are found in North and South America, and they are known
for their long, thin beaks and their ability to fly at high speeds.
Hummingbirds are made up of three main parts: the head, the body, and the tail.
The head is small and round, and it contains the eyes, the beak, and the brain.
The body is long and slender, and it contains the wings, the legs, and the
heart. The tail is long and forked, and it helps the hummingbird to balance
while it is flying.
Hummingbirds are also known for their coloration. They come in a variety of
colors, including green, blue, red, and purple. Some hummingbirds are even able
to change their color!
Hummingbirds are very active creatures. They spend most of their time flying,
and they are also very good at hovering. Hummingbirds need to eat a lot of food
in order to maintain their energy, and they often visit flowers to drink nectar.
Hummingbirds are amazing creatures. They are small, but they are also very
powerful. They are beautiful, and they are very important to the ecosystem.
- تعليمات-المحتوى-الإرشادي
<Overall instruction or context setting>
<Content to operate on>
<Final instruction>
على سبيل المثال،
Here is some text I'd like you to summarize:
Hummingbirds are the smallest birds in the world, and they are also one of the
most fascinating. They are found in North and South America, and they are known
for their long, thin beaks and their ability to fly at high speeds. Hummingbirds
are made up of three main parts: the head, the body, and the tail. The head is
small and round, and it contains the eyes, the beak, and the brain. The body is
long and slender, and it contains the wings, the legs, and the heart. The tail
is long and forked, and it helps the hummingbird to balance while it is flying.
Hummingbirds are also known for their coloration. They come in a variety of
colors, including green, blue, red, and purple. Some hummingbirds are even able
to change their color! Hummingbirds are very active creatures. They spend most
of their time flying, and they are also very good at hovering. Hummingbirds need
to eat a lot of food in order to maintain their energy, and they often visit
flowers to drink nectar. Hummingbirds are amazing creatures. They are small, but
they are also very powerful. They are beautiful, and they are very important to
the ecosystem.
Summarize it in two sentences at the third-grade reading level.
- المتابعة. في بعض الأحيان، يمكنك توجيه النموذج لمواصلة النص بدون أي تعليمات. على سبيل المثال، إليك طلب لقطة صفرية حيث يكون النموذج مخصصًا لمواصلة الإدخال المقدم:
Once upon a time, there was a little sparrow building a nest in a farmer's
barn. This sparrow
استخدِم طلبات "الإنشاء من الصفر" لإنشاء تنسيقات نصية إبداعية، مثل القصائد أو الرموز البرمجية أو النصوص أو المقطوعات الموسيقية أو الرسائل الإلكترونية أو الرسائل.
الطلبات التي تتطلب مثالاً واحدًا
تقدّم هذه الطلبات للنموذج مثالاً واحدًا لتكراره ومواصلة النمط. يتيح ذلك إنشاء ردود متوقّعة من النموذج.
على سبيل المثال، يمكنك إنشاء اقتراحات للأطباق مثل:
Food: Apple
Pairs with: Cheese
Food: Pear
Pairs with:
الطلبات التي تتطلب تقديم أمثلة قليلة
تقدّم هذه الطلبات للنموذج أمثلة متعددة لتكرارها. استخدِم نماذج الطلبات التي تتضمّن بضع عبارات لإكمال المهام المعقّدة، مثل تجميع البيانات استنادًا إلى نمط معيّن.
يمكن أن يكون مثال على طلب المراجعة على النحو التالي:
Generate a grocery shopping list for a week for one person. Use the JSON format
given below.
{"item": "eggs", "quantity": "6"}
{"item": "bread", "quantity": "one loaf"}
النماذج التوليدية الأساسية
يهدف هذا القسم إلى الإجابة عن السؤال التالي: هل هناك عشوائية في ردود نماذج الإنشاء، أم هي حتمية؟
الإجابة المختصرة هي نعم لكلا السؤالين. عند طلب نموذج توليدي، يتم إنشاء ردّ نصي في مرحلتين. في المرحلة الأولى، يعالج النموذج التوليدي الطلب الذي يتم إدخاله وينشئ توزيعًا الاحتمالية على الرموز (الكلمات) المحتملة التي من المرجّح أن تظهر بعد ذلك. على سبيل المثال، إذا طلبت باستخدام النص الذي يتم إدخاله "قفز الكلب فوق ... "، سيُنشئ النموذج التوليدي صفيفًا من الكلمات التالية المحتمَلة:
[("fence", 0.77), ("ledge", 0.12), ("blanket", 0.03), ...]
هذه العملية حتمية، وسينتج النموذج التوليدي هذا التوزيع نفسه في كل مرة يتم فيها إدخال نص الطلب نفسه.
في المرحلة الثانية، يحوّل النموذج التوليدي هذه التوزيعات إلى ردود نصية فعلية من خلال إحدى استراتيجيات فك الترميز العديدة. قد تختار استراتيجية رمز ترميز بسيطة الرمز الأكثر احتمالًا في كل خطوة زمنية. ستكون هذه العملية دائمًا حتمية. ومع ذلك، يمكنك بدلاً من ذلك اختيار إنشاء ردّ من خلال تحليل عيّنات عشوائية من التوزيع الذي يعرضه النموذج. ستكون هذه العملية عشوائية. يمكنك التحكّم في درجة العشوائية المسموح بها في عملية فك التشفير هذه من خلال ضبط درجة الحرارة. تعني قيمة الصعوبة 0 أنّه يتم اختيار الرموز الأكثر احتمالًا فقط، ولا يتم استخدام أي عامل عشوائية. في المقابل، يؤدي مستوى الإبداع المرتفع إلى إدخال درجة عالية من العشوائية في الرموز التي يختارها النموذج، ما يؤدي إلى ردود نموذج أكثر غرابةً وعدم توقع.
مراجع إضافية
- بعد أن اكتسبت فهمًا أعمق للطلبات والنماذج التوليدية، جرِّب كتابة طلباتك الخاصة باستخدام Google AI Studio.
- اطّلِع على إرشادات طلبات المعلومات للتعرّف على مزيد من المعلومات عن أفضل الممارسات لإنشاء طلبات المعلومات.