واجهة برمجة تطبيقات الملفات

تم تصميم مجموعة نماذج الذكاء الاصطناعي (AI) في Gemini للتعامل مع أنواع مختلفة من بيانات الإدخال، بما في ذلك النصوص والصور والمحتوى الصوتي. بما أنّ نماذج Gemini هذه يمكنها التعامل مع أكثر من نوع واحد أو وضع واحد من البيانات، تُعرف نماذج Gemini باسم النماذج المتعددة الوسائط أو تُفسر على أنّها تمتلك إمكانات متعددة الوسائط.

يوضّح لك هذا الدليل كيفية العمل مع ملفات الوسائط باستخدام واجهة برمجة التطبيقات Files API. إنّ العمليات الأساسية متماثلة للملفات الصوتية والصور والفيديوهات والمستندات وغيرها من أنواع الملفات المتوافقة.

للحصول على إرشادات بشأن طلب الملفات، يُرجى الاطّلاع على قسم دليل طلب الملفات.

تحميل ملف

يمكنك استخدام Files API لتحميل ملف وسائط. استخدِم دائمًا Files API عندما يكون إجمالي حجم الطلب (بما في ذلك الملفات والطلبات النصية وتعليمات النظام وغيرها) أكبر من 20 ميغابايت.

يعمل الرمز البرمجي التالي على تحميل ملف ثم استخدامه في طلب generateContent.

from google import genai

client = genai.Client(api_key="GOOGLE_API_KEY")

myfile = client.files.upload(file="path/to/sample.mp3")

response = client.models.generate_content(
    model="gemini-2.0-flash", contents=["Describe this audio clip", myfile]
)

print(response.text)
import {
  GoogleGenAI,
  createUserContent,
  createPartFromUri,
} from "@google/genai";

const ai = new GoogleGenAI({ apiKey: "GOOGLE_API_KEY" });

async function main() {
  const myfile = await ai.files.upload({
    file: "path/to/sample.mp3",
    config: { mimeType: "audio/mpeg" },
  });

  const response = await ai.models.generateContent({
    model: "gemini-2.0-flash",
    contents: createUserContent([
      createPartFromUri(myfile.uri, myfile.mimeType),
      "Describe this audio clip",
    ]),
  });
  console.log(response.text);
}

await main();
file, err := client.UploadFileFromPath(ctx, "path/to/sample.mp3", nil)
if err != nil {
    log.Fatal(err)
}
defer client.DeleteFile(ctx, file.Name)

model := client.GenerativeModel("gemini-2.0-flash")
resp, err := model.GenerateContent(ctx,
    genai.FileData{URI: file.URI},
    genai.Text("Describe this audio clip"))
if err != nil {
    log.Fatal(err)
}

printResponse(resp)
AUDIO_PATH="path/to/sample.mp3"
MIME_TYPE=$(file -b --mime-type "${AUDIO_PATH}")
NUM_BYTES=$(wc -c < "${AUDIO_PATH}")
DISPLAY_NAME=AUDIO

tmp_header_file=upload-header.tmp

# Initial resumable request defining metadata.
# The upload url is in the response headers dump them to a file.
curl "${BASE_URL}/upload/v1beta/files?key=${GOOGLE_API_KEY}" \
  -D upload-header.tmp \
  -H "X-Goog-Upload-Protocol: resumable" \
  -H "X-Goog-Upload-Command: start" \
  -H "X-Goog-Upload-Header-Content-Length: ${NUM_BYTES}" \
  -H "X-Goog-Upload-Header-Content-Type: ${MIME_TYPE}" \
  -H "Content-Type: application/json" \
  -d "{'file': {'display_name': '${DISPLAY_NAME}'}}" 2> /dev/null

upload_url=$(grep -i "x-goog-upload-url: " "${tmp_header_file}" | cut -d" " -f2 | tr -d "\r")
rm "${tmp_header_file}"

# Upload the actual bytes.
curl "${upload_url}" \
  -H "Content-Length: ${NUM_BYTES}" \
  -H "X-Goog-Upload-Offset: 0" \
  -H "X-Goog-Upload-Command: upload, finalize" \
  --data-binary "@${AUDIO_PATH}" 2> /dev/null > file_info.json

file_uri=$(jq ".file.uri" file_info.json)
echo file_uri=$file_uri

# Now generate content using that file
curl "https://generativelanguage.googleapis.com/v1beta/models/gemini-2.0-flash:generateContent?key=$GOOGLE_API_KEY" \
    -H 'Content-Type: application/json' \
    -X POST \
    -d '{
      "contents": [{
        "parts":[
          {"text": "Describe this audio clip"},
          {"file_data":{"mime_type": "${MIME_TYPE}", "file_uri": '$file_uri'}}]
        }]
      }' 2> /dev/null > response.json

cat response.json
echo

jq ".candidates[].content.parts[].text" response.json

الحصول على البيانات الوصفية لملف

يمكنك التحقّق من أنّ واجهة برمجة التطبيقات قد نجحت في تخزين الملف المحمَّل والحصول على ملفه الوصفي من خلال استدعاء files.get.

myfile = client.files.upload(file='path/to/sample.mp3')
file_name = myfile.name
myfile = client.files.get(name=file_name)
print(myfile)
const myfile = await ai.files.upload({
  file: "path/to/sample.mp3",
  config: { mimeType: "audio/mpeg" },
});

const fileName = myfile.name;
const fetchedFile = await ai.files.get({ name: fileName });
console.log(fetchedFile);
file, err := client.UploadFileFromPath(ctx, "path/to/sample.mp3", nil)
if err != nil {
    log.Fatal(err)
}

gotFile, err := client.GetFile(ctx, file.Name)
if err != nil {
    log.Fatal(err)
}
fmt.Println("Got file:", gotFile.Name)
# file_info.json was created in the upload example
name=$(jq ".file.name" file_info.json)
# Get the file of interest to check state
curl https://generativelanguage.googleapis.com/v1beta/files/$name > file_info.json
# Print some information about the file you got
name=$(jq ".file.name" file_info.json)
echo name=$name
file_uri=$(jq ".file.uri" file_info.json)
echo file_uri=$file_uri

إدراج الملفات المحمَّلة

يمكنك تحميل ملفات متعددة باستخدام Files API. يحصل الرمز التالي على قائمة بجميع الملفات التي تم تحميلها:

print('My files:')
for f in client.files.list():
    print(' ', f.name)
const listResponse = await ai.files.list({ config: { pageSize: 10 } });
for await (const file of listResponse) {
  console.log(file.name);
}
iter := client.ListFiles(ctx)
for {
    ifile, err := iter.Next()
    if err == iterator.Done {
        break
    }
    if err != nil {
        log.Fatal(err)
    }
    fmt.Println(ifile.Name)
}
echo "My files: "

curl "https://generativelanguage.googleapis.com/v1beta/files?key=$GOOGLE_API_KEY"

حذف الملفات المحمَّلة

يتم حذف الملفات تلقائيًا بعد 48 ساعة. يمكنك أيضًا حذف ملف uploaded يدويًا:

myfile = client.files.upload(file='path/to/sample.mp3')
client.files.delete(name=myfile.name)
const myfile = await ai.files.upload({
  file: "path/to/sample.mp3",
  config: { mimeType: "audio/mpeg" },
});

const fileName = myfile.name;
await ai.files.delete({ name: fileName });
file, err := client.UploadFileFromPath(ctx, "path/to/sample.mp3", nil)
if err != nil {
    log.Fatal(err)
}
client.DeleteFile(ctx, file.Name)
curl --request "DELETE" https://generativelanguage.googleapis.com/v1beta/files/$name?key=$GOOGLE_API_KEY

معلومات الاستخدام

يمكنك استخدام واجهة برمجة التطبيقات Files API لتحميل ملفات الوسائط والتفاعل معها. تتيح لك Files API تخزين ما يصل إلى 20 غيغابايت من الملفات لكل مشروع، مع الحد الأقصى لحجم كل ملف وهو 2 غيغابايت. يتم تخزين الملفات لمدة 48 ساعة. خلال هذه الفترة، يمكنك استخدام واجهة برمجة التطبيقات للحصول على بيانات وصفية عن الملفات، ولكن لا يمكنك تنزيل الملفات. تتوفّر واجهة برمجة التطبيقات Files API بدون أي تكلفة في جميع المناطق التي تتوفّر فيها واجهة برمجة التطبيقات Gemini API.

يوفّر هذا القسم إرشادات وأفضل الممارسات لاستخدام ملفات الوسائط مع طلبات Gemini API.

تمنحك إمكانية استخدام أنواع مختلفة من البيانات في طلباتك مزيدًا من مرونة من حيث المهام التي يمكنك إنجازها باستخدام Gemini API. على سبيل المثال، يمكنك إرسال صورة لوجبة لذيذة إلى النموذج وطلب كتابة مدوّنة قصيرة عن الوجبة.

الطلب الاستجابة

اكتب مشاركة مدوّنة قصيرة وجذابة استنادًا إلى هذه الصورة. يجب أن يضمّن الوصف وصفًا للوجبة المعروضة في الصورة وحديثًا عن تجربتي في إعداد الوجبات.


بسكويت

يُعدّ تحضير الوجبات طريقة رائعة لتوفير الوقت والمال، ويمكن أن يساعدك أيضًا على تناول طعام صحي. هذه الوجبة هي مثال رائع على وجبة صحية وشهية يمكن تحضيرها بسهولة مسبقًا.

تتضمّن هذه الوجبة الأرز البني والخضروات المشوية والدجاج بصلصة التارياكي. الأرز البني هو كربوهيدرات صحية ومعقدة تمنحك الطاقة المستدامة. إنّ الخضار المشوية هي طريقة رائعة للحصول على الكمية اليومية من الفيتامينات والمعادن، وتعدّ دجاجة الترياكي خيارًا لذيذًا وغنيًا بالبروتين.

من السهل جدًا أيضًا تحضير هذه الوجبة. ما عليك سوى طهي الأرز البني، وشوي الخضار، وطهي دجاج التيرايكي. بعد طهي كل المكونات، يمكنك تقسيمها إلى حاويات لتحضير الوجبات وتخزينها في الثلاجة. يمكنك بعد ذلك أخذ حاوية والبدء في العمل في الصباحات المزدحمة.

إذا كنت تبحث عن وجبة صحية ولذيذة يمكن تحضيرها بسهولة مسبقًا، هذه الوجبة هي خيار رائع. إنّه مليء بالمواد المغذية والطعم، ومن المؤكد أنّه سيجعلك تشعر بالشبع والرضا.

ونتمنّى لك إعداد وجبات صحية ولذيذة.

إذا كنت تواجه مشكلة في الحصول على النتيجة التي تريدها من الطلبات التي تستخدمملفّات الوسائط، هناك بعض الاستراتيجيات التي يمكن أن تساعدك في الحصول على النتائج التي تريدها. تقدّم الأقسام التالية طرق تصميم ونصائح لتحديد المشاكل المتعلّقة بالطلبات التي تستخدم إدخالًا متعدد الوسائط وحلّها.

يمكنك تحسين طلباتك المتعدّدة الوسائط باتّباع أفضل الممارسات التالية:

    • تحديد التعليمات بوضوح: احرص على تقديم تعليمات واضحة وموجزة لا تترك مجالًا للتفسير الخاطئ.
    • إضافة بعض الأمثلة إلى طلبك: استخدِم أمثلة واقعية قليلة اللقطات لتوضيح ما تريد تحقيقه.
    • تقسيم المهام إلى خطوات: يمكنك تقسيم المهام المعقّدة إلى أهداف فرعية قابلة للإدارة، ما يوجّه النموذج خلال العملية.
    • تحديد تنسيق الإخراج: في الطلب، اطلب أن يكون الإخراج بالتنسيق الذي تريده، مثل Markdown وJSON وHTML والمزيد.
    • وضع صورتك أولاً في الطلبات التي تتضمّن صورة واحدة: على الرغم من أنّ Gemini يمكنه معالجة الإدخالات النصية والمرئية بأي ترتيب، إلا أنّه قد يحقّق أداءً أفضل في الطلبات التي تتضمّن صورة واحدة إذا تم وضع هذه الصورة (أو الفيديو) قبل الطلب النصي. ومع ذلك، بالنسبة إلى الطلبات التي تتطلّب تداخل الصور مع النصوص بشكل كبير لتكون منطقية، استخدِم أي ترتيب يبدو لك طبيعيًا.
  • تحديد مشاكل طلب التفاعل المتعدّد الوسائط وحلّها

    • إذا لم يكن النموذج يستخرج المعلومات من الجزء ذي الصلة من الصورة: أضِف تلميحات تشير إلى جوانب الصورة التي تريد أن يستخرج منها الطلب المعلومات.
    • إذا كانت نتيجة النموذج عامة جدًا (غير مخصّصة بما يكفي لإدخال الصورة أو الفيديو): في بداية الطلب، حاوِل أن تطلب من النموذج وصف الصور أو الفيديو قبل تقديم تعليمات المهمة، أو حاوِل أن تطلب من النموذج الإشارة إلى ما هو معروض في الصورة.
    • لتحديد الجزء الذي تعذّر عليه حلّ المشكلة: اطلب من النموذج وصف الصورة أو شرح سببه لقياس فهمه الأولي.
    • إذا أدّى طلبك إلى عرض محتوى هلوسة: جرِّب خفض درجة الحرارة أو طلب أوصاف أقصر من النموذج لتقليل احتمالية استنتاج تفاصيل إضافية.
    • ضبط مَعلمات أخذ العينات: جرِّب إعدادات مختلفة لدرجة الحرارة واختيارات "أهم k" لتعديل الإبداع في النموذج.

كن محددًا في تعليماتك

تحقّق الطلبات أكبر قدر من النجاح عندما تكون واضحة ومفصّلة. إذا كان لديك نتيجة محدّدة في البال، من الأفضل تضمين هذا الشرط في الطلب لضمان الحصول على النتيجة التي تريدها.

بالنسبة إلى هذه الصورة التي تعرض لوحة معلومات في مطار، يمكن أن يؤدي طلب "وصف هذه الصورة" من النموذج إلى إنشاء وصف عام. إذا كنت بحاجة إلى أن يفكّك النموذج الوقت والمدينة من الصورة، يمكنك تضمين هذا الطلب مباشرةً في طلبك.

الطلب الردّ النموذجي

صِف هذه الصورة.

تعرض الصورة لوحة بيانات الرحلات الجوية الواردة والمغادرة في مطار.

الطلب المعدَّل الردّ المحسّن
جدول مواعيد السفر

تحليل الوقت والمدينة من لوحة المطار المعروضة في هذه الصورة إلى قائمة

  • 10:50 موسكو
  • 11:05 إدنبرة
  • 11:05 لندن
  • 11:10 بوخارست
  • 11:30 كييف
  • 11:35 دبلن
  • 11:45 شرق ميدلاندز
  • 12:15 صوفيا
  • 12:30 لندن
  • 12:30 نيوكاسل
  • 12:40 سانت بطرسبرغ
  • 12:40 لندن
  • 12:45 مانشستر
  • أضِف بعض الأمثلة.

    يمكن أن يقبل نموذج Gemini إدخالات متعددة يمكنه استخدامها كأمثلة لفهم النتيجة التي تريدها. يمكن أن تساعد إضافة هذه الأمثلة النموذج في تحديد الأنماط وتطبيق العلاقة بين الصور والردود المقدَّمة على المثال الجديد. ويُعرف ذلك أيضًا باسم "التعلّم ببضع فُرَص".

    في المثال أدناه، يتم كتابة الإخراج الأوّلي في شكل جملة، ويحتوي أيضًا على البلد (البرازيل). لنفترض أنّك تريد الحصول على الإخراج بتنسيق أو نمط مختلفَين، وأنّك تريد المدينة فقط، وليس البلد. يمكن أن تؤدي إضافة أمثلة على لقطات قليلة إلى توجيه النموذج للقيام بالردّ بالطريقة التي تريدها.

    الطلب استجابة النموذج
    جدول مواعيد السفر

    حدِّد المدينة والمعلم.

    المَعلم هو تمثال "المسيح الفادي" في ريو دي جانيرو، البرازيل.

    الطلب المعدَّل الردّ المحسّن

    حدِّد المدينة والمعلم.

    كولوسيوم

    المدينة: روما، المعلم: الكولوسيوم

    المدينة المحرمة

    city: Beijing, landmark: Forbidden City

    forbidden-city

    المدينة: ريو دي جانيرو، المَعلم: تمثال "المسيح الفادي"

    تقسيم الخطوات إلى أجزاء صغيرة

    بالنسبة إلى المهام المعقّدة، مثل تلك التي تتطلّب فهمًا بصريًا و استدلالاً، قد يكون من المفيد تقسيم المهمة إلى خطوات أصغر وأكثر وضوحًا. بدلاً من ذلك، قد يكون من الفعال أيضًا طلبك من النموذج مباشرةً "التفكير خطوة بخطوة" في طلبك.

    الطلب الردّ النموذجي

    متى ستنفد مناديل الحمام؟

    قريبًا، ستتبقّى لديك 3 لفات فقط.

    الطلب المعدَّل الردّ المحسّن

      1. أولاً، احصِل عدد لفات ورق التواليت في هذه الصورة.
      2- بعد ذلك، حدِّد كمية ورق التواليت التي يستخدمها الشخص العادي يوميًا.
      3- احتسِب المدة التي ستستغرقها هذه اللفات من ورق التواليت.

      1. تظهر في هذه الصورة 3 لفات من ورق المرحاض.
      2- يستخدم الشخص العادي حوالي 20 ورقة من ورق التواليت يوميًا.
      3- إذا كانت كل لفة تحتوي على 200 ورقة، ستستمر كل لفة لمدة 10 أيام تقريبًا. وبالتالي، ستستمر اللفات الثلاث لمدة شهر تقريبًا.

    إنّ المسائل الرياضية أو أنواع أخرى من المسائل الكلامية هي خيارات رائعة لطلب من النموذج التفكير خطوة بخطوة.

    الطلب الاستجابة

    ما هو الحدّ الرابع في المتتالية؟

    -135

    الاستجابة الواردة من النموذج غير صحيحة. تشمل بعض الطرق لتحسين ذلك توجيه النموذج إلى تحليل المشكلة قبل الإجابة عن الطلب.

    الطلب الاستجابة

    عليك تحليل الصيغة في الصورة أولاً.

    استنادًا إلى الصيغة، يُرجى الإجابة عن السؤال "ما هو المصطلح الرابع في التسلسل؟".

    انقر لتوسيع النتيجة

    \( b(n) = b(n-1) * (-3) \)

    \( b(1) = 15 \)

    1. استبدِل n = 4 في الصيغة:
    2. \( b(4) = b(4-1) * (-3) \)

      \( b(4) = b(3) * (-3) \)

    3. لا نعرف قيمة b(3)، لذا استبدِل n = 3 في الصيغة:
    4. \( b(3) = b(3-1) * (-3) \)

      \( b(3) = b(2) * (-3) \)

    5. لا نعرف قيمة b(2)، لذا استبدِل n = 2 في الصيغة:
    6. \( b(2) = b(2-1) * (-3) \)

      \( b(2) = b(1) * (-3) \)

    7. نعلم أنّ قيمة b(1) هي 15، لذا سنستبدِلها في الصيغة:
    8. \( b(2) = 15 * (-3) \)

      \( b(2) = -45 \)

    9. الآن بعد أن عرفنا قيمة b(2)، يمكننا استبدالها في صيغة b(3):
    10. \( b(3) = b(2) * (-3) \)

      \( b(3) = -45 * (-3) \)

      \( b(3) = 135 \)

    11. الآن بعد أن عرفنا قيمة b(3)، يمكننا استبدالها في صيغة b(4):
    12. \( b(4) = b(3) * (-3) \)

      \( b(4) = 135 * (-3) \)

      \( b(4) = -405 \)

    وبالتالي، فإنّ الحدّ الرابع في التسلسل هو -405.

    هذا الردّ من النموذج صحيح. لجعل الردّ أكثر سلاسة، يمكنك أن تطلب من النموذج التفكير خطوة بخطوة.

    الطلب المعدَّل الردّ المحسّن

    ما هو الحدّ الرابع في المتتالية؟ فكِّر بالخطوات.

    المدة الأولى هي 15.

    العبارة الثانية هي b(1) * (-3) = 15 * (-3) = -45.

    المصطلح الثالث هو ب(2) * (-3) = -45 * (-3) = 135.

    المصطلح الرابع هو b(3) * (-3) = 135 * (-3) = -405.

    تحديد تنسيق الإخراج

    من المشاكل الشائعة الحاجة إلى أن يكون ناتج النموذج بتنسيق معيّن (مثل Markdown أو JSON أو HTML)، خاصةً إذا كانت مهمة ما بعد المعالجة تحتاج إلى نقل ناتج النموذج. يمكنك محاولة إنشاء إخراج بهذا التنسيق من خلال توجيه النموذج لإجراء ذلك في الطلب. في ما يلي مثالان:

    الطلب الردّ النموذجي

    تحليل الجدول في هذه الصورة إلى تنسيق Markdown

    | الموضوع | الحالة | الوقت | تاريخ البدء | تاريخ الاستحقاق |

    | ------- | ------ | ---- | --------- | ------ |

    | الرياضيات | تم | ساعة ونصف | 29‏/11‏/2023 | 1‏/12‏/2023 |

    | الموقع الجغرافي | مكتمل | 30 دقيقة | 2/12/2023 | 4/12/2023 |

    | الفيزياء | قيد التقدّم | ساعتان | 3/12/2023 | 5/12/2023 |

    | Biology | Not started | 6 hrs | 11/2/2016 | 12/6/2023 |

    الطلب استجابة النموذج

    قدِّم قائمة بجميع السمات التالية:

    المكونات ونوع المطبخ وهل هو نباتي أم لا، بتنسيق JSON

    ```json```

    {

    "ingredients": [

    "rice",

    "shrimp",

    "clams",

    "mussels",

    "peas",

    "tomatoes",

    "onions",

    "garlic",

    "olive oil",

    "paprika",

    "salt",

    "pepper"

    ],

    "type of cuisine": "Spanish",

    "vegetarian": false

    وضع صورتك أولاً في الطلبات التي تتضمّن صورة واحدة

    على الرغم من أنّ Gemini يمكنه تفسير الصورة والنص بأي ترتيب ضمن طلب، قد يؤدي وضع صورة واحدة قبل الطلب النصي إلى تحقيق نتائج أفضل. في العيّنات التالية، ستلاحظ أنّ الصورة تظهر أولاً قبل النص في كل طلب.

    تحديد المشاكل في طلبك المتعدّد الوسائط وحلّها

    قد تحتاج إلى تحديد المشاكل وحلّها في طلبك إذا لم تتلقَّ ردًا مفعّلاً. في ما يلي بعض الاستراتيجيات التي يمكنك تجربتها.

    إذا لم يكن النموذج يستخرج المعلومات من الجزء ذي الصلة من الصورة

    للحصول على ردّ أكثر تحديدًا، يمكنك الإشارة إلى جوانب الصورة التي تريد من الطلب استخراج المعلومات منها لتحديد ردّه.

    الطلب الردّ النموذجي

    كم يومًا يمكن أن يستخدِم الطفل هذه الحفاضات؟

    ستستمر الحفاضات لمدة 198 يومًا قبل أن تنفد.

    الطلب المعدَّل الردّ المحسّن

    ما هي المدة التي ستستمر فيها هذه الحفاضات قبل أن تنفد؟

    استخدِم الوزن الظاهر على العلبة لتحديد عمر الطفل، واستخدِم إجمالي عدد الحفاضات في العلبة.

    اقسم إجمالي عدد الحفاضات على عدد الحفاضات التي يستخدمها الطفل يوميًا.

    يحتوي العلبة على 198 حفاضة. يشير العلبة إلى أنّ الحفاضات مخصّصة لطفل يتراوح وزنه بين 10 و17 كيلوغرامًا.

    من المرجّح أن يكون عمر الطفل المتوسط في نطاق الوزن هذا بين سنة واحدة وسنتين.

    يستخدم الطفل البالغ من العمر عامَين عادةً 6 حفاضات في اليوم، وبالتالي ستستمر الحفاضات لمدة 33 يومًا تقريبًا (198/6).

    إذا كان الناتج من النموذج عامًا جدًا وغير مخصّص بما يكفي لمدخلات الصورة

    لمساعدة النموذج في تخصيص رده على الصور، حاوِل أن تطلب منه وصف الصور قبل تنفيذ مهمة الاستدلال.

    الطلب الردّ النموذجي

    ما هو القاسم المشترك بين هذه الصور؟

    كل الصور الأربعة هي أمثلة على التصوير الفوتوغرافي في الوضع الأفقي.

    الطلب المعدَّل الردّ المحسّن

    أولاً، يُرجى وصف ما يظهر في كل صورة بالتفصيل. ما هو القاسم المشترك بين هذه الصور؟

    تعرض الصورة الأولى شخصًا يحزم حقيبة سفر. تعرض الصورة الثانية مدخلًا فارغًا في مركز تسوق. تعرض الصورة الثالثة لفة ورق تواليت. تعرض الصورة الرابعة بحرًا مظلمًا وممطرًا.

    تتشابه هذه الصور في أنّها جميعًا أمثلة على المساحات الانتقالية. المساحات الانتقالية هي الأماكن أو المواقف التي تقع بين مكانين أو موقفَين آخرين. وغالبًا ما تتسم هذه المشاعر بعدم اليقين أو الغموض.

    تعرض الصورة الأولى الشخص في منزله وفي رحلة. تعرض الصورة الثانية المدخل بين متجرين. الصورة الثالثة تصوّر ورق تواليت، ما قد يشير إلى حمام. الحمّام هو مساحة انتقالية بين المجالين الخاص والعام. وهو المكان الذي نستعد فيه للدخول إلى العالم الخارجي أو الخروج منه.

    تعرض الصورة الرابعة البحر بين الهدوء والعاصفة.

    يمكن أن تكون المساحات الانتقالية مثيرة ومزعجة في الوقت نفسه. يمكن أن تكون هذه الأماكن أماكن لبدايات جديدة أو أماكن لنهاية تجارب. يمكن أن يكون مكانًا للتفكير أو مكانًا للتنفيذ.

    يمكنك أيضًا محاولة توجيه النموذج صراحةً إلى الإشارة إلى ما هو معروض في الصورة.

    الطلب المعدَّل الردّ المحسّن

    ما هو القاسم المشترك بين هذه الصور؟ يُرجى الإشارة إلى محتوى الصور في ردك.

    أن تكون جميع الصور ذات صلة بالسفر تعرض الصورة الأولى شخصًا يحزم حقيبة سفر، وتعرض الصورة الثانية ممرًا فارغًا في مركز تسوّق، وتعرض الصورة الثالثة حزمة من ورق التواليت، وتعرض الصورة الرابعة بحرًا مظلمًا وممطرًا.

    ترتبط كل هذه الصور بالسفر لأنّها كلها أشياء يحتاجها المستخدمون أو يستخدمونها عند السفر. تعرض الصورة الأولى شخصًا يحزم حقيبة سفر، وهو ما يفعله الأشخاص عند الذهاب في رحلة. تعرض الصورة الثانية ممرًا فارغًا في مركز تسوّق، وهو مكان يذهب إليه الناس غالبًا لشراء أشياء لرحلاتهم. تعرض الصورة الثالثة حزمة من ورق التواليت، وهو منتج يستخدمه الأشخاص غالبًا أثناء السفر. تعرض الصورة الرابعة بحرًا مظلمًا وعاصفًا، وهو ما يواجهه الأشخاص غالبًا أثناء السفر.

    تنطبق النصائح نفسها على تصميمات الإعلانات التي يتم إنشاؤها من الصور. في المثال التالي الذي يعرض أرنبًا، يمكن أن يؤدي طلب تضمين جوانب من الصورة إلى تحسين النتيجة.

    الطلب الردّ النموذجي

    هل يمكنك كتابة قصيدة عن هذه الصورة؟

    أرنب صغير، ناعم وبني،
    يقفز في الحقل، للأعلى وللأسفل.
    آذانك طويلة جدًا وذيلك صغير جدًا،
    أنت أجمل مخلوق على الإطلاق.

    أنت تقتطع من العشب الأخضر الجميل،
    وتقفز بعيدًا عندما تراني.
    ولكنني سأظل صديقك إلى الأبد،
    الأرنب الصغير، حتى النهاية.

    الطلب المعدَّل الردّ المحسّن

    هل يمكنك كتابة قصيدة وصفية ومسرحية عن هذه الصورة وتضمين الموقع الجغرافي؟

    أرنب صغير على العشب،
    آذان طويلة وحذرة.
    ما الذي تراه هناك،
    في الأفق حيث تنظر؟

    هل هو لون المحيط الأزرق،
    البراق في لون الشمس؟
    أم الأمواج التي تتلاطم وتدوي،
    هل هي إيقاع يعجبك؟

    أرنب صغير، قل لي بصدق،
    ما الذي يجذب انتباهك؟
    هل هو النسيم المالح،
    أم صرخات طيور النورس التي تسرّك؟

    ربما يكون السبب هو اتّساع نطاق كل ذلك،
    فالعالم كبير وصغير في الوقت نفسه.
    مكان يمكن فيه للحلم أن يحلّق،
    ويمكن فيه بدء مغامرات.

    أرنب صغير، أتساءل ما الذي تحلم به،
    وأنت جالس على العشب، هادئ جدًا.
    هل لديك شغف باستكشاف الأعماق،
    أم تفضّل البقاء على اليابسة حيث يمكنك القفز؟

    مهما كان الأمر يا بيبي الأرنب،
    حافظ على شرارة الفضول مشتعلة.
    ففي أحلامك وطموحاتك،
    يكمن عالم ينتظر إبداعك.

    تحديد جزء الطلب الذي تعذّر تنفيذه وحلّ المشكلة

    قد يكون من الصعب معرفة ما إذا تعذّر تنفيذ طلب معيّن لأنّ النموذج لم يفهم الصورة في البداية، أو إذا كان قد فهم الصورة ولكنه لم ينفِّذ خطوات الاستدلال الصحيحة بعد ذلك. للتمييز بين هذه الأسباب، اطلب من النموذج وصف ما هو معروض في الصورة.

    في المثال التالي، إذا ردّ النموذج بوجبة خفيفة تبدو مفاجئة عند إقرانها بالشاي (مثل الفشار)، يمكنك أولاً تحديد المشاكل وحلّها لتحديد ما إذا كان النموذج قد تعرّف بشكل صحيح على أنّ الصورة تحتوي على كوب شاي.

    الطلب طلب تحديد المشاكل وحلّها

    ما هي وجبة خفيفة يمكنني تحضيرها في دقيقة واحدة تتناسب مع هذا الطبق؟

    يُرجى وصف ما يظهر في هذه الصورة.

    هناك استراتيجية أخرى تتمثل في طلب شرح من النموذج لطريقة التفكير التي اتّبعها. يمكن أن يساعدك ذلك في تحديد الجزء الذي حدث فيه خلل في الاستدلال، إن وجد.

    الطلب طلب تحديد المشاكل وحلّها

    ما هي وجبة خفيفة يمكنني تحضيرها في دقيقة واحدة تتناسب مع هذا الطبق؟

    ما هي وجبة خفيفة يمكنني تحضيرها في دقيقة واحدة تتناسب مع هذا الطبق؟ يُرجى توضيح السبب.

    الخطوات التالية

    • جرِّب كتابة طلبات متعددة الوسائط باستخدام Google AI Studio.
    • للحصول على معلومات عن استخدام Gemini Files API لتحميل ملفات الوسائط وتضمينها في طلباتك، اطّلِع على أدلة الرؤية والصوت ومعالجة المستندات.
    • لمزيد من الإرشادات حول تصميم الطلبات، مثل ضبط مَعلمات أخذ العينات، يُرجى الاطّلاع على صفحة استراتيجيات الطلبات.