ما الجديد في Gemini 3.5 Flash؟

‫Gemini 3.5 Flash متوفّر للجمهور العام وثابت وجاهز للاستخدام على نطاق واسع في بيئات الإنتاج. باعتباره نموذج Flash الأكثر ذكاءً لدينا، يقدّم أداءً متطوّرًا ومستدامًا في التنفيذ المستند إلى الذكاء الاصطناعي الوكيل والترميز والمهام الطويلة الأمد على نطاق واسع.

يتضمّن هذا الدليل نظرة عامة على التحسينات والتغييرات في واجهة برمجة التطبيقات وإرشادات نقل البيانات إلى Gemini 3.5 Flash.

النموذج الجديد

الطراز رقم تعريف الطراز الوصف
Gemini 3.5 Flash gemini-3.5-flash هذا النموذج هو الأكثر تطورًا لدينا، وهو يقدّم أداءً متقدّمًا ومستدامًا في المهام المستندة إلى الذكاء الاصطناعي الوكيل ومهام الترميز.

يتوافق Gemini 3.5 Flash مع قدرة استيعاب مليون رمز مميّز، و65 ألف رمز مميّز كحد أقصى للناتج، بالإضافة إلى إمكانات "المفكِّر" ومجموعة الأدوات وميزات المنصة نفسها المتوفّرة في Gemini 3 Flash. لا تتوفّر ميزة استخدام الكمبيوتر في الوقت الحالي.

للاطّلاع على المواصفات الكاملة، يُرجى مراجعة نظرة عامة على الطُرز. للاطّلاع على الأسعار، يُرجى الانتقال إلى صفحة الأسعار.

البدء السريع

تستخدِم جميع الأمثلة الواردة في هذا الدليل واجهة برمجة التطبيقات GenerateContent API. تتوفّر أيضًا واجهة برمجة التطبيقات Interactions API، وتنطبق عليها خيارات الإعداد والاقتراحات نفسها.

Python

from google import genai

client = genai.Client()

response = client.models.generate_content(
    model="gemini-3.5-flash",
    contents="Explain how parallel agentic execution works in three sentences.",
)
print(response.text)

JavaScript

import { GoogleGenAI } from "@google/genai";

const ai = new GoogleGenAI({});

async function main() {
  const response = await ai.models.generateContent({
    model: "gemini-3.5-flash",
    contents: "Explain how parallel agentic execution works in three sentences.",
  });
  console.log(response.text);
}

main();

REST

curl "https://generativelanguage.googleapis.com/v1beta/models/gemini-3.5-flash:generateContent" \
  -H "x-goog-api-key: $GEMINI_API_KEY" \
  -H 'Content-Type: application/json' \
  -X POST \
  -d '{
    "contents": [{
      "parts": [{"text": "Explain how parallel agentic execution works in three sentences."}]
    }]
  }'

الميزات الجديدة

  • أداء متواصل على أعلى مستوى: نموذج Flash الأكثر ذكاءً لدينا، تم تحسينه لأداء مهام الترميز والمهام المستندة إلى الذكاء الاصطناعي الوكيل على نطاق واسع.
  • التنفيذ المستند إلى الوكلاء: نشر الوكلاء الفرعيين وحلّ المشاكل وإنشاء حلقات مستندة إلى الوكلاء بسرعة وعلى نطاق واسع
  • الترميز: دورات الترميز التكرارية والاستكشاف السريع وإنشاء النماذج الأولية لاختبار المسارات البديلة واستكشاف الحلول بشكل ديناميكي
  • المدى الطويل: مهام سير العمل المتعدّدة الخطوات واستخدام الأدوات على نطاق واسع
  • الحفاظ على الأفكار: يحافظ النموذج تلقائيًا على عملية الاستدلال الوسيطة في المحادثات المترابطة. لا يلزم إجراء أي تغييرات على واجهة برمجة التطبيقات.
  • مستوى الجهد التلقائي الجديد: تم تغيير مستوى الجهد التلقائي للتفكير من high إلى medium. لمزيد من التفاصيل، يُرجى الاطّلاع على مستوى الجهد التلقائي الجديد.
  • تحسين low في التفكير: تم تحسين low بشكل كبير للرموز البرمجية والمهام التي تتطلب عددًا أقل من الخطوات، ما يوفّر جودة عالية مع تقليل وقت الاستجابة والتكلفة.
  • الإصدار المتاح للجميع: نموذج ثابت للاستخدام الموسّع في عملية الإنتاج

اختيار نموذج Flash المناسب

‫Gemini 3.5 Flash هو نموذج Flash الأكثر ذكاءً وفعالية. ومع ذلك، قد تتطلّب حالات الاستخدام المختلفة تكلفة ووقت استجابة مختلفَين.

  • ‫Gemini 3.1 Flash-Lite: ننصحك باستخدام ‫Gemini 3.1 Flash-Lite للمهام التي تتطلّب معالجة كميات كبيرة من البيانات بتكلفة منخفضة ولا تتطلّب إمكانات الاستدلال المتقدّمة التي يوفّرها ‫3.5 Flash. وهو نموذج ثابت وطويل الأمد ومحسَّن لتحقيق الكفاءة. يمكنك الاطّلاع على دليل مطوِّر Flash-Lite للحصول على مزيد من التفاصيل.
  • إصدار Gemini 3 Flash التجريبي: ننصحك بالانتقال إلى الإصدار 3.5 Flash لتحقيق الاستقرار في الإصدار المتاح للجميع وتحسين قدرات الاستدلال، ولكن سيظل إصدار Gemini 3 Flash التجريبي متاحًا للمطوّرين الذين يريدون مواصلة الاختبار باستخدام الإصدار التجريبي.

التغييرات السلوكية

مستوى الجهد التلقائي الجديد: medium

أصبح مستوى التفكير التلقائي الآن medium، بعد أن كان high في النسخة الحصرية من Gemini 3 Flash. يحقّق نموذج medium نتائج جيدة جدًا في مجموعة كبيرة من المهام، كما أنّه أسرع وأكثر فعالية من حيث التكلفة. بالنسبة إلى المشاكل المعقّدة، يشجّع high النموذج على التفكير بشكل أعمق.

مستوى الجهد حالات الاستخدام
minimal تم تحسينه لزيادة سرعة الاستجابة. حالات الاستخدام الشبيهة بالدردشة، والإجابات السريعة المستندة إلى الحقائق، وعمليات استدعاء الأدوات الأبسط
low الرموز البرمجية والمهام المستندة إلى الوكلاء التي تتطلّب وقت استجابة أقل وعددًا أقل من الخطوات وهي مناسبة أيضًا لمهام التحليل والكتابة التي تتطلّب بعض التفكير.
medium (تلقائية) أفضل جودة لمعظم المهام يُنصح باستخدامه في حالات الاستخدام المعقّدة للرموز البرمجية والوكلاء.
high تزيد هذه الميزة من قدرة النموذج على التفكير واستخدام الأدوات. الخيار الأفضل للاستدلال المعقّد والرياضيات الصعبة ومهام الرموز البرمجية أو الوكلاء الأكثر صعوبة تتيح هذه الميزة التفكير الموسّع واستخدام الدوال.

لتجاوز الإعداد التلقائي، اضبط thinking_level في ملف الإعداد:

Python

from google import genai
from google.genai import types

client = genai.Client()

response = client.models.generate_content(
    model="gemini-3.5-flash",
    contents="Prove that the square root of 2 is irrational.",
    config=types.GenerateContentConfig(
        thinking_config=types.ThinkingConfig(thinking_level="high")
    ),
)

print(response.text)

JavaScript

import { GoogleGenAI } from "@google/genai";

const ai = new GoogleGenAI({});

async function main() {
  const response = await ai.models.generateContent({
    model: "gemini-3.5-flash",
    contents: "Prove that the square root of 2 is irrational.",
    config: {
      thinkingConfig: {
        thinkingLevel: "HIGH",
      },
    },
  });
  console.log(response.text);
}

main();

REST

curl "https://generativelanguage.googleapis.com/v1beta/models/gemini-3.5-flash:generateContent" \
  -H "x-goog-api-key: $GEMINI_API_KEY" \
  -H 'Content-Type: application/json' \
  -X POST \
  -d '{
    "contents": [{
      "parts": [{"text": "Prove that the square root of 2 is irrational."}]
    }],
    "generationConfig": {
      "thinkingConfig": {
        "thinkingLevel": "HIGH"
      }
    }
  }'

يوضّح الجدول التالي مستويات التفكير المتاحة لكل نموذج:

مستوى التفكير Gemini 3.5 Flash Gemini 3.1 Pro Gemini 3.1 Flash-Lite Gemini 3 Flash الوصف
minimal متاح غير متاح متاح (تلقائي) متاح يتطابق هذا الخيار مع الإعداد "بدون تفكير" لمعظم طلبات البحث. يُرجى العِلم أنّ minimal لا يضمن إيقاف التفكير، فقد يقدّم النموذج أسبابًا بسيطة جدًا للمهام المعقّدة.
low متاح متاح متاح متاح يقلّل من زمن الانتقال والتكلفة.
medium متاح (تلقائي) متاح متاح متاح التفكير المتوازن لمعظم المهام
high متاح (ديناميكي) متاح (تلقائي، ديناميكي) متاح (ديناميكي) متاح (تلقائي، ديناميكي) زيادة عمق الاستدلال إلى أقصى حد

الحفاظ على الأفكار

يحافظ النموذج على عملية الاستدلال الوسيطة في المحادثات المترابطة تلقائيًا. عند توفّر سياق الاستدلال في سجلّ المحادثات، يتم الاحتفاظ به، ما يؤدي إلى تحسين الأداء في المهام المعقّدة المتعدّدة الخطوات، مثل تصحيح الأخطاء بشكل متكرّر وإعادة تصميم الرموز البرمجية. لا يلزم إجراء أي تغييرات على واجهة برمجة التطبيقات:

  • Interactions API: يتم تلقائيًا الاحتفاظ بالأفكار. لا يحدث أي تغيير في السلوك.
  • ‫GenerateContent API: بدءًا من Gemini 3.5 Flash، يستخدم النموذج سياق الاستدلال من جميع الجوانب السابقة عندما تكون توقيعات الأفكار متوفّرة في سجلّ المحادثات. لتفعيل هذه الميزة، يجب تمرير سجلّ المحادثات الكامل وغير المعدَّل (بما في ذلك توقيعات الأفكار) في contents. وتتعامل حِزم SDK مع هذه العملية تلقائيًا.

آخر الأخبار حول المَعلمات وأفضل الممارسات في الإصدار 3.x من Gemini

تنطبق ما يلي على جميع نماذج Gemini 3.x، بما في ذلك Gemini 3.5 Flash.

  • temperature وtop_p وtop_k: ننصح بشدة بعدم تغيير القيم التلقائية. تم تحسين إمكانات الاستدلال في Gemini 3 لتناسب الإعدادات التلقائية.
  • يُرجى استخدام thinking_level بدلاً من thinking_budget.
  • مطابقة الردود على استدعاء الدوال: يجب أن تتطابق id وname وعدد الردود مع المكالمات السابقة.
  • ردود الدوال المتعددة الوسائط: يجب تضمين محتوى متعدد الوسائط داخل رد الدالة، وليس خارجه.
  • التعليمات المضمّنة في ردود الدوال: يتم إلحاقها بنص الرد الخاص بالدالة، وليس كأجزاء منفصلة.
  • تقليل عدد طلبات استخدام الأدوات غير الضرورية: استخدِم مستويات تفكير أقل أو جرِّب تعليمات النظام لتقليل عدد طلبات استخدام الأدوات في سير العمل الذي يتطلّب وكيلًا.

راجِع الأقسام أدناه لمعرفة كيفية تعديل الرمز.

مَعلَمات اختيار العيّنات (لم يعُد يُنصح بها)

لم يعُد يُنصح باستخدام temperature وtop_p وtop_k مع جميع نماذج Gemini 3.x. تم تحسين قدرات الاستنتاج في Gemini 3 لتتوافق مع الإعدادات التلقائية. إزالة هذه المَعلمات من جميع الطلبات

# ⚠️ Remove these parameters (not recommended)
config = types.GenerateContentConfig(
    temperature=0.7,
    top_p=0.9,
    top_k=40
)

لضمان الحتمية، ننصحك بتحديد تعليمات نظام تتضمّن قواعد واضحة لحالة الاستخدام المحدّدة.

thinking_budget (لم يعُد هذا الخيار مُقترَحًا)

لم يعُد يُنصح باستخدام المَعلمة الرقمية الأولية thinking_budget في جميع نماذج Gemini 3.x. استخدِم تعداد السلسلة thinking_level بدلاً من ذلك.

# ⚠️ Before (not recommended)
config = types.GenerateContentConfig(
    thinking_config=types.ThinkingConfig(thinking_budget=7500)
)

# ✅ After
config = types.GenerateContentConfig(
    thinking_config=types.ThinkingConfig(thinking_level="medium")
)

القيم المتاحة: minimal وlow وmedium (القيمة التلقائية) وhigh.

استدعاء الدالة: مطابقة الردود بدقة

تُظهر Interactions API حاليًا أخطاءً عند عدم تطابق ردود الدوال. لا تعرض واجهة برمجة التطبيقات GenerateContent API خطأً حتى الآن، ولكن تؤدي الردود غير المتطابقة إلى أن يعرض النموذج ردودًا فارغة مع finish_reason: STOP في معظم الحالات. يجب دائمًا اتّباع هذه القواعد:

المتطلبات التفاصيل
التكلفة تشمل id. يجب أن يتضمّن كل FunctionResponse السمة id من FunctionCall المقابل
المباراة name يجب أن يتطابق name في الردّ مع name في الطلب
عدد حالات التطابق إرجاع FunctionResponse واحد بالضبط لكل FunctionCall تم استلامه

Python

# ✅ Include matching id and name in the function response
final_response = client.models.generate_content(
    model="gemini-3.5-flash",
    config=config,
    contents=[
        *previous_contents,
        response.candidates[0].content,
        types.Content(role="user", parts=[
            types.Part.from_function_response(
                name=tool_call.name,
                response={"result": result},
                id=tool_call.id,
            )
        ]),
    ],
)

JavaScript

// ✅ Include matching id and name in the function response
const functionResponsePart = {
  functionResponse: {
    name: toolCall.name,
    response: { result: result },
    id: toolCall.id,
  },
};

const finalResponse = await ai.models.generateContent({
  model: "gemini-3.5-flash",
  contents: [
    ...previousContents,
    { role: "model", parts: [{ functionCall: toolCall }] },
    { role: "user", parts: [functionResponsePart] },
  ],
  config: config,
});

REST

curl "https://generativelanguage.googleapis.com/v1beta/models/gemini-3.5-flash:generateContent" \
  -H "x-goog-api-key: $GEMINI_API_KEY" \
  -H 'Content-Type: application/json' \
  -X POST \
  -d '{
    "contents": [
      {"role": "user", "parts": [{"text": "..."}]},
      {"role": "model", "parts": [{"functionCall": {"name": "my_function", "args": {...}}}]},
      {"role": "user", "parts": [{"functionResponse": {"name": "my_function", "id": "call_id", "response": {"result": "..."}}}]}
    ]
  }'

استجابات الوظائف المتعددة الوسائط

نرى غالبًا أنّ العملاء يقدّمون صورًا خارج استجابة الدالة. ويمكن أن يؤدي ذلك إلى سلوك غير متوقّع من النموذج (مثل تسريب الأفكار) وإلى مخرجات أقل جودة. اتّبِع الاقتراح الوارد في مستندات Multimodal Function Responses API بدلاً من ذلك، وأدرِج محتوًى متعدّد الوسائط في أجزاء ردود الدوال التي ترسلها إلى النموذج. يمكن للنموذج معالجة هذا المحتوى المتعدد الوسائط في دوره التالي لتقديم ردّ أكثر دقة.

Python

# ✅ Include multimodal content in the function response
final_response = client.models.generate_content(
    model="gemini-3.5-flash",
    config=config,
    contents=[
        *previous_contents,
        response.candidates[0].content,
        types.Content(role="user", parts=[
            types.Part.from_function_response(
                name=tool_call.name,
                response={
                    "result": "instrument.jpg",
                    "image": base64_image_data,
                },
                id=tool_call.id,
            )
        ]),
    ],
)

JavaScript

// ✅ Include multimodal content in the function response
const finalResponse = await ai.models.generateContent({
  model: "gemini-3.5-flash",
  contents: [
    ...previousContents,
    { role: "model", parts: [{ functionCall: toolCall }] },
    {
      role: "user",
      parts: [{
        functionResponse: {
          name: toolCall.name,
          id: toolCall.id,
          response: {
            result: "instrument.jpg",
            image: base64ImageData,
          },
        },
      }],
    },
  ],
  config: config,
});

التعليمات المضمّنة في ردود الدوال

نلاحظ غالبًا أنّ العملاء يقدّمون تعليمات إضافية مع ردود الوظائف كـ Parts لاحق. ويمكن أن يؤدي ذلك إلى سلوك غير متوقّع للنموذج (مثل تسريب الأفكار) وإلى نتائج أقل جودة. بدلاً من ذلك، أضِف أي تعليمات إضافية إلى نهاية نص رد الدالة مع الفصل بينها بسطرين جديدين.

Python

# ✅ Append inline instructions to the end of the function response separated by two newlines
result_text = f"{json.dumps(result)}\n\n<your inline instructions>"

final_response = client.models.generate_content(
    model="gemini-3.5-flash",
    config=config,
    contents=[
        *previous_contents,
        response.candidates[0].content,
        types.Content(role="user", parts=[
            types.Part.from_function_response(
                name=tool_call.name,
                response={"result": result_text},
                id=tool_call.id,
            )
        ]),
    ],
)

JavaScript

// ✅ Append inline instructions to the end of the function response separated by two newlines
const resultText = `${JSON.stringify(result)}\n\n<your inline instructions>`;

const finalResponse = await ai.models.generateContent({
  model: "gemini-3.5-flash",
  contents: [
    ...previousContents,
    { role: "model", parts: [{ functionCall: toolCall }] },
    {
      role: "user",
      parts: [{
        functionResponse: {
          name: toolCall.name,
          id: toolCall.id,
          response: { result: resultText },
        },
      }],
    },
  ],
  config: config,
});

تقليل عدد طلبات استخدام الأدوات غير الضرورية

إذا لاحظت كثرة استخدام عمليات استدعاء الأدوات، هناك أسلوبان يساعدان في تقليلها:

  1. ابدأ بتقليل مستوى التفكير (medium أو low أو minimal): تشجّع مستويات التفكير الأعلى النموذج على استخدام المزيد من الأدوات للاستكشاف والتحقّق، لذا يمكن أن يؤدي خفض المستوى إلى تقليل عدد مرات استخدام الأدوات.

  2. إضافة تعليمات نظام: إذا استمر الاستخدام المفرط بعد تعديل مستوى التفكير، يمكنك استخدام طلب يقيّد استخدام الأدوات. على سبيل المثال:

    You have a limited action budget of <n> tool calls. Use them efficiently.
    

قائمة التحقّق الخاصة بعملية نقل البيانات

نقل البيانات من إصدار Gemini 3 Flash التجريبي

  • تعديل اسم النموذج: gemini-3-flash-previewgemini-3.5-flash
  • راجِع الأسعار. سعر Gemini 3.5 Flash أعلى من سعر الإصدار التجريبي من Gemini 3 Flash. إذا كانت حالة الاستخدام حساسة للغاية من حيث التكلفة، ننصحك بالانتقال إلى Gemini 3.1 Flash-Lite بدلاً من ذلك. يمكنك الاطّلاع على صفحة الأسعار للحصول على التفاصيل.
  • أزِل temperature وtop_p وtop_k من ملف الإعداد (لم يعُد ذلك خيارًا يُنصح به).
  • استبدِل thinking_budget بـ thinking_level.
  • أضِف id وname المطابق إلى جميع أجزاء FunctionResponse.
  • اختبِر طلباتك. تم تغيير الجهد التلقائي من high إلى medium، لذا يُرجى التحقّق من الجودة والسرعة والتكلفة.
  • أصبحت ميزة "الحفاظ على الأفكار" مفعَّلة تلقائيًا. يتم نقل سياق الاستدلال بين الأدوار، ما يحسّن الأداء ولكن قد يزيد من استخدام الرموز المميزة.
  • تقليل عدد طلبات الأدوات غير الضرورية: ابدأ بتقليل مستوى التفكير (medium أو low أو minimal)، وأضِف تعليمات نظامية لتقييد استخدام الأدوات في حال استمرار الإفراط في استخدامها.
  • لا تتوفّر ميزة استخدام الكمبيوتر في Gemini 3.5 Flash في الوقت الحالي. بالنسبة إلى أحمال عمل "استخدام الكمبيوتر"، واصِل استخدام "معاينة Gemini 3 السريعة".

نقل البيانات من Gemini 2.5

كل ما سبق، بالإضافة إلى:

  • تبسيط الطلبات إذا كنت تستخدم أسلوب هندسة الطلبات المستند إلى سلسلة الأفكار لفرض التفكير المنطقي، جرِّب استخدام thinking_level: "medium" أو "high" مع طلبات أبسط بدلاً من ذلك.
  • اختبار أحجام العمل الخاصة بملفات PDF والوسائط إذا كنت تعتمد على سلوك معيّن لتحليل المستندات الكثيفة، اختبِر الإعداد media_resolution_high للتأكّد من استمرار الدقة. قد يؤدي الانتقال إلى الإعدادات التلقائية في Gemini 3 أيضًا إلى زيادة استخدام الرموز المميزة في ملفات PDF، ولكنّه قد يقلّل من استخدامها في الفيديوهات. وإذا تجاوزت الطلبات قدرة الاستيعاب، عليك تقليل media_resolution بشكل صريح. لمزيد من التفاصيل، راجِع مستندات دقة الوسائط.
  • الاستفادة من استخدام الأدوات بشكل مدمج يمكن استخدام &quot;بحث Google&quot; وسياق عنوان URL وتنفيذ الرمز البرمجي والوظائف المخصّصة في الطلب نفسه.
  • في حال استخدام ردود الدوال المتعددة الوسائط، يجب نقل المحتوى المتعدد الوسائط إلى داخل أجزاء ردود الدوال، وليس بجانبها.
  • في حال استخدام تعليمات مضمّنة مع ردود الدوال، أضِفها إلى نص رد الدالة مع فصلها بسطرين جديدين، وليس كأجزاء منفصلة.
  • لا تتوفّر ميزة تقسيم الصور في الإصدار 3.x من Gemini. بالنسبة إلى أحمال العمل الخاصة بالتقسيم، واصِل استخدام Gemini 2.5 Flash مع إيقاف "المفكّر"، أو Gemini Robotics-ER 1.6.
  • إزالة candidate_count من ملف الإعداد (غير متاح في الإصدار 3.x من Gemini)

ميزات Gemini 3 للعائلة

يحتوي Gemini 3.5 Flash على جميع إمكانات مجموعة Gemini 3 باستثناء ميزة "استخدام الكمبيوتر". الميزات التي تم طرحها في Gemini 3 والتي سيتم نقلها إلى الإصدارات الأحدث:

  • التفكير: يتم الحفاظ على سياق الاستدلال المشفّر في جميع طلبات البيانات من واجهة برمجة التطبيقات. تلقائي في Interactions API، وضمني في GenerateContent
  • النتائج المنظَّمة باستخدام الأدوات: يمكنك الجمع بين وضع JSON والأدوات المضمّنة (البحث، وسياق عنوان URL، وتطبيق الرموز البرمجية، واستدعاء الدوال).
  • ردود الوظائف المتعدّدة الوسائط: عرض صور ومقاطع صوتية ووسائط أخرى في نتائج طلبات الوظائف
  • تنفيذ الرموز البرمجية باستخدام الصور: تنفيذ رموز برمجية تعالج الصور وتنشئها
  • استخدام الأدوات المدمجة: يمكنك استخدام الأدوات المدمجة واستدعاء الدوال المخصّصة في الطلب نفسه.
  • دقة الوسائط: تتيح لك هذه السمة التحكّم بدقة في عملية تخصيص الرموز المميزة للمدخلات من الصور والفيديوهات وملفات PDF. تتيح نماذج Gemini 3 إعدادات درجة الدقة لكل عنصر من المحتوى (low وmedium وhigh وultra_high) لطلبات الدقة المختلطة.
  • توقيعات الأفكار: تمثيلات مشفّرة لعمليات الاستدلال الداخلي التي يجريها النموذج. مطلوب لإجراء مكالمات متعددة الوظائف في محادثة مترابطة؛ وتتم إدارته تلقائيًا من خلال حِزم SDK الرسمية.

أفضل الممارسات المتعلّقة بإنشاء الطلبات

نماذج Gemini 3.x هي نماذج استدلال، ما يغيّر طريقة تقديم الطلبات.

  • تعليمات دقيقة: يجب أن تكون التعليمات موجزة. يقدّم Gemini 3.x أفضل ردّ عند تلقّي تعليمات مباشرة وواضحة. قد تؤدي أساليب هندسة الطلبات المطوّلة أو المعقّدة المصمّمة للنماذج القديمة إلى الإفراط في التحليل.
  • مستوى التفصيل في الإخراج: يكون مستوى التفصيل في الإصدار 3.x من Gemini أقل بشكل تلقائي، إذ يفضّل تقديم إجابات مباشرة وفعّالة. إذا كانت حالة الاستخدام تتطلّب أسلوبًا حواريًا، يجب توجيه النموذج بشكل صريح في طلبك (مثلاً، "اشرح هذا الموضوع بأسلوب ودود ومفصّل").
  • إدارة السياق: عند العمل مع مجموعات بيانات كبيرة (مثل كتب كاملة أو قواعد رموز أو فيديوهات طويلة)، ضَع تعليماتك أو أسئلتك المحدّدة في نهاية الطلب، بعد سياق البيانات. يمكنك تثبيت منطق النموذج من خلال بدء سؤالك بعبارة مثل "استنادًا إلى المعلومات السابقة...".

يمكنك الاطّلاع على مزيد من المعلومات حول استراتيجيات تصميم الطلبات في دليل هندسة الطلبات.

القيود

  • لا تتوفّر ميزة تقسيم الصور في الإصدار 3.x من Gemini. بالنسبة إلى أحمال العمل الخاصة بالتقسيم، واصِل استخدام Gemini 2.5 Flash مع إيقاف "المفكّر"، أو Gemini Robotics-ER 1.6.

الأسئلة الشائعة

  1. ما هو تاريخ آخر تحديث للبيانات لـ Gemini 3.5 Flash؟ يستند Gemini 3.5 Flash إلى بيانات حتى يناير 2025. للحصول على معلومات أحدث، استخدِم أداة البحث عن المستندات الأساسية.

  2. ما هي الحدود القصوى لقدرة الاستيعاب؟ يدعم Gemini 3.5 Flash قدرة استيعاب تصل إلى مليون رمز مميّز، ويمكنه إنشاء ما يصل إلى 65 ألف رمز مميّز.

  3. هل سيظلّ رمز thinking_budget القديم صالحًا؟ نعم، لا يزال thinking_budget متاحًا لضمان التوافق مع الأنظمة القديمة، ولكن ننصحك بالانتقال إلى thinking_level لتحقيق أداء أكثر قابلية للتوقّع. يُرجى عدم استخدام كليهما في الطلب نفسه.

  4. هل يتوافق Gemini 3.5 Flash مع Batch API؟ نعم. اطّلِع على دليل Batch API لمعرفة التفاصيل.

  5. هل تتوفّر ميزة "التخزين المؤقت للسياق"؟ نعم، تتوفّر ميزة التخزين المؤقت للمحتوى.

  6. ما هي الأدوات المتوافقة؟ يتوافق Gemini 3.5 Flash مع بحث Google واستخدام "خرائط Google" كمصدر والبحث عن الملفات وتطبيق الرموز البرمجية وسياق عنوان URL واستدعاء الدالة العادي، بما في ذلك استخدام الأدوات بشكل مدمج. استخدام الكمبيوتر غير متاح في Gemini 3.5 Flash.

الخطوات التالية