ما الجديد في Gemini 3.5 Flash؟

‫Gemini 3.5 Flash متوفّر للجمهور العام وثابت وجاهز للاستخدام على نطاق واسع في بيئات الإنتاج. باعتباره نموذج Flash الأكثر ذكاءً لدينا، يقدّم أداءً متطوّرًا ومستدامًا في التنفيذ المستند إلى الذكاء الاصطناعي الوكيل والترميز والمهام الطويلة الأمد على نطاق واسع.

يتضمّن هذا الدليل نظرة عامة على التحسينات والتغييرات في واجهة برمجة التطبيقات وإرشادات نقل البيانات الخاصة بنموذج Gemini 3.5 Flash.

النموذج الجديد

الطراز رقم تعريف الطراز الوصف
‫Gemini 3.5 Flash gemini-3.5-flash هذا النموذج هو الأكثر تطورًا لدينا، وهو يقدّم أداءً متقدّمًا ومستدامًا في المهام المستندة إلى الذكاء الاصطناعي الوكيل ومهام الترميز.

يتوافق Gemini 3.5 Flash مع قدرة استيعاب مليون رمز مميّز، و65 ألف رمز مميّز كحد أقصى للناتج، بالإضافة إلى إمكانات "المفكِّر" ومجموعة الأدوات وميزات المنصة نفسها المتوفّرة في Gemini 3 Flash. لا تتوفّر ميزة استخدام الكمبيوتر في الوقت الحالي.

للاطّلاع على المواصفات الكاملة، يُرجى مراجعة نظرة عامة على الطُرز. للاطّلاع على الأسعار، يُرجى الانتقال إلى صفحة الأسعار.

البدء السريع

تستخدِم جميع الأمثلة الواردة في هذا الدليل Interactions API. تتوفّر أيضًا واجهة برمجة التطبيقات GenerateContent، وينطبق عليها خيارات الإعداد والاقتراحات نفسها.

Python

from google import genai

client = genai.Client()

interaction = client.interactions.create(
    model="gemini-3.5-flash",
    input="Explain how parallel agentic execution works in three sentences."
)
print(interaction.output_text)

JavaScript

import { GoogleGenAI } from "@google/genai";

const client = new GoogleGenAI({});

async function main() {
  const interaction = await client.interactions.create({
    model: "gemini-3.5-flash",
    input: "Explain how parallel agentic execution works in three sentences.",
  });
  console.log(interaction.output_text);
}

main();

REST

curl -X POST "https://generativelanguage.googleapis.com/v1beta/interactions" \
  -H "x-goog-api-key: $GEMINI_API_KEY" \
  -H 'Content-Type: application/json' \
  -H "Api-Revision: 2026-05-20" \
  -d '{
    "model": "gemini-3.5-flash",
    "input": "Explain how parallel agentic execution works in three sentences."
  }'

الميزات الجديدة

  • أداء متواصل على مستوى عالٍ: نموذج Flash الأكثر ذكاءً لدينا، تم تحسينه لأداء مهام الترميز والمهام المستندة إلى الذكاء الاصطناعي الوكيل على نطاق واسع.
  • التنفيذ المستند إلى الوكلاء: نشر الوكلاء الفرعيين وحلّ المشاكل وإنشاء حلقات مستندة إلى الوكلاء بسرعة وعلى نطاق واسع
  • الترميز: دورات الترميز التكرارية والاستكشاف السريع وإنشاء النماذج الأولية لاختبار المسارات البديلة واستكشاف الحلول بشكل ديناميكي
  • المدى البعيد: مهام سير العمل المتعدّدة الخطوات واستخدام الأدوات على نطاق واسع
  • الحفاظ على الأفكار: يحافظ النموذج تلقائيًا على عملية الاستدلال الوسيطة في المحادثات المتعددة الأدوار. لا يلزم إجراء أي تغييرات على واجهة برمجة التطبيقات.
  • مستوى الجهد التلقائي الجديد: تم تغيير مستوى الجهد التلقائي للتفكير من high إلى medium. يمكنك الاطّلاع على مستوى الجهد التلقائي الجديد للحصول على التفاصيل.
  • تحسين low في التفكير: أصبح أداء low أفضل بكثير في ما يتعلّق بالرموز البرمجية والمهام التي تستند إلى الذكاء الاصطناعي الوكيل والتي تتطلّب خطوات أقل، ما يتيح تقديم جودة عالية بوقت استجابة أقل وتكلفة أقل.
  • الإصدار المتاح للجميع: نموذج ثابت للاستخدام الموسّع في عملية الإنتاج

التغييرات السلوكية

مستوى الجهد التلقائي الجديد: medium

أصبح مستوى التفكير التلقائي الآن medium، بعد أن كان high في النسخة الحصرية من Gemini 3 Flash. يحقّق نموذج medium نتائج جيدة جدًا في مجموعة كبيرة من المهام، كما أنّه أسرع وأكثر فعالية من حيث التكلفة. بالنسبة إلى المشاكل المعقّدة، يشجّع high النموذج على التفكير بشكل أعمق.

مستوى الجهد حالات الاستخدام
minimal تم تحسينه لزيادة سرعة الاستجابة. حالات الاستخدام الشبيهة بالدردشة، والإجابات السريعة المستندة إلى الحقائق، وعمليات استدعاء الأدوات الأبسط
low الرموز البرمجية والمهام التي تتطلب استجابة أسرع وعددًا أقل من الخطوات وهي مناسبة أيضًا لمهام التحليل والكتابة التي تتطلّب بعض التفكير.
medium (تلقائية) أفضل جودة لمعظم المهام: يُنصح باستخدامه في حالات الاستخدام المعقّدة للرموز البرمجية والوكلاء.
high تزيد هذه الميزة من قدرة النموذج على التفكير واستخدام الأدوات. الأفضل للاستدلال المعقّد والرياضيات الصعبة ومهام الرموز البرمجية أو الوكلاء الأكثر صعوبة يسمح بالتفكير الموسّع واستخدام الدوال.

لتجاوز الإعداد التلقائي، اضبط thinking_level في ملف الإعداد:

Python

from google import genai

client = genai.Client()

interaction = client.interactions.create(
    model="gemini-3.5-flash",
    input="Prove that the square root of 2 is irrational.",
    generation_config={"thinking_level": "high"},
)
print(interaction.output_text)

JavaScript

import { GoogleGenAI } from "@google/genai";

const client = new GoogleGenAI({});

async function main() {
  const interaction = await client.interactions.create({
    model: "gemini-3.5-flash",
    input: "Prove that the square root of 2 is irrational.",
    generationConfig: { thinkingLevel: "high" },
  });
  console.log(interaction.output_text);
}

main();

REST

curl -X POST "https://generativelanguage.googleapis.com/v1beta/interactions" \
  -H "x-goog-api-key: $GEMINI_API_KEY" \
  -H 'Content-Type: application/json' \
  -H "Api-Revision: 2026-05-20" \
  -d '{
    "model": "gemini-3.5-flash",
    "input": "Prove that the square root of 2 is irrational.",
    "generation_config": {"thinking_level": "high"}
  }'

الحفاظ على الأفكار

يحتفظ النموذج بالاستدلال الوسيط في المحادثات المتعددة الأدوار تلقائيًا. عند توفّر سياق الاستدلال في سجلّ المحادثات، يتم الاحتفاظ به، ما يؤدي إلى تحسين الأداء في المهام المعقّدة المتعدّدة الخطوات، مثل تصحيح الأخطاء بشكل متكرّر وإعادة تصميم الرموز البرمجية. لا يلزم إجراء أي تغييرات على واجهة برمجة التطبيقات:

  • واجهة برمجة التطبيقات الخاصة بالتفاعلات: يتم تلقائيًا الاحتفاظ بالأفكار. لن يتغيّر السلوك.
  • ‫GenerateContent API: بدءًا من Gemini 3.5 Flash، يستخدم النموذج سياق الاستدلال من جميع الجوانب السابقة عندما تكون توقيعات الأفكار متوفّرة في سجلّ المحادثات. لتفعيل هذه الميزة، يجب تمرير سجلّ المحادثات الكامل وغير المعدَّل (بما في ذلك توقيعات الأفكار) في contents. وتتعامل حِزم SDK مع هذه العملية تلقائيًا.

تعديلات على المَعلمات وأفضل الممارسات في الإصدار 3.x من Gemini

تنطبق ما يلي على جميع نماذج Gemini 3.x، بما في ذلك Gemini 3.5 Flash.

  • temperature وtop_p وtop_k: ننصح بشدة بعدم تغيير القيم التلقائية. تم تحسين إمكانات الاستدلال في Gemini 3 لتناسب الإعدادات التلقائية.
  • استخدِم thinking_level بدلاً من thinking_budget.
  • مطابقة الردود على طلبات استخدام الأدوات: يجب أن تتطابق id وname وعدد الردود مع الطلبات السابقة.
  • ردود الدوال المتعددة الوسائط: يجب تضمين المحتوى المتعدد الوسائط داخل رد الدالة وليس خارجه.
  • التعليمات المضمّنة في ردود الدوال: يتم إلحاقها بنص رد الدالة، وليس كأجزاء منفصلة.
  • تقليل عدد طلبات استخدام الأدوات غير الضرورية: استخدِم مستويات تفكير أقل أو جرِّب تعليمات النظام لتقليل عدد طلبات استخدام الأدوات في سير العمل الذي يتضمّن وكيلًا.

راجِع الأقسام أدناه لمعرفة كيفية تعديل الرمز.

مَعلَمات اختيار العيّنات (لم يعُد يُنصح بها)

لم يعُد يُنصح باستخدام temperature وtop_p وtop_k مع جميع نماذج Gemini 3.x. تم تحسين قدرات Gemini 3 الاستنتاجية لتتوافق مع الإعدادات التلقائية. إزالة هذه المَعلمات من جميع الطلبات

# ⚠️ Remove these parameters (not recommended)
generation_config = {
    "temperature": 0.7,
    "top_p": 0.9,
    "top_k": 40,
}

لضمان الحتمية، ننصحك بتحديد تعليمات نظام تتضمّن قواعد واضحة لحالة الاستخدام المحدّدة.

thinking_budget (لم يعُد هذا الخيار مُقترَحًا)

لم يعُد يُنصح باستخدام المَعلمة الرقمية الأولية thinking_budget في جميع نماذج Gemini 3.x. استخدِم تعداد السلسلة thinking_level بدلاً من ذلك.

# ⚠️ Before (not recommended)
generation_config = {
    "thinking": {"thinking_budget": 7500},
}

# ✅ After
generation_config = {
    "thinking": {"thinking_level": "medium"},
}

القيم المتاحة: minimal وlow وmedium (القيمة التلقائية) وhigh.

استدعاء الدالة: مطابقة الردود بدقة

تُبلغ Interactions API حاليًا عن أخطاء في حال عدم تطابق ردود الدوال. لا تعرض واجهة برمجة التطبيقات GenerateContent API خطأً حتى الآن، ولكن تؤدي الردود غير المتطابقة إلى أن يعرض النموذج ردودًا فارغة مع finish_reason: STOP في معظم الحالات. يجب دائمًا اتّباع هذه القواعد:

المتطلبات التفاصيل
التكلفة تشمل id. يجب أن يتضمّن كل FunctionResponse السمة id من FunctionCall المقابل
المباراة name يجب أن يتطابق name في الردّ مع name في الطلب
عدد حالات التطابق إرجاع FunctionResponse واحد بالضبط لكل FunctionCall تم استلامه

Python

# ✅ Include matching call_id and name in the function_result
final_interaction = client.interactions.create(
    model="gemini-3.5-flash",
    previous_interaction_id=interaction.id,
    tools=[my_tool],
    input=[{
        "type": "function_result",
        "name": fc_step.name,
        "call_id": fc_step.id,
        "result": [{"type": "text", "text": json.dumps(result)}],
    }],
)

JavaScript

// ✅ Include matching call_id and name in the function_result
const finalInteraction = await client.interactions.create({
  model: "gemini-3.5-flash",
  previousInteractionId: interaction.id,
  tools: [myTool],
  input: [{
    type: "function_result",
    name: fcStep.name,
    call_id: fcStep.id,
    result: [{ type: "text", text: JSON.stringify(result) }],
  }],
});

REST

curl -X POST "https://generativelanguage.googleapis.com/v1beta/interactions" \
  -H "x-goog-api-key: $GEMINI_API_KEY" \
  -H 'Content-Type: application/json' \
  -H "Api-Revision: 2026-05-20" \
  -d '{
    "model": "gemini-3.5-flash",
    "previous_interaction_id": "<INTERACTION_ID>",
    "tools": [...],
    "input": [{
      "type": "function_result",
      "name": "my_function",
      "call_id": "<CALL_ID>",
      "result": [{"type": "text", "text": "..."}]
    }]
  }'

استجابات الوظائف المتعددة الوسائط

نرى غالبًا أنّ العملاء يقدّمون صورًا خارج استجابة الدالة. ويمكن أن يؤدي ذلك إلى سلوك غير متوقّع من النموذج (مثل تسريب الأفكار) وإلى مخرجات أقل جودة. اتّبِع الاقتراح الوارد في مستندات Multimodal Function Responses API بدلاً من ذلك، وأدرِج محتوى متعدّد الوسائط في أجزاء ردود الدوال التي ترسلها إلى النموذج. يمكن للنموذج معالجة هذا المحتوى المتعدد الوسائط في دوره التالي لتقديم ردّ أكثر دقة.

Python

# ✅ Include multimodal content in the function response
final_interaction = client.interactions.create(
    model="gemini-3.5-flash",
    previous_interaction_id=interaction.id,
    input=[
        {
            "type": "function_result",
            "name": tool_call.name,
            "call_id": tool_call.id,
            "result": [
                {"type": "text", "text": "instrument.jpg"},
                {
                    "type": "image",
                    "mime_type": "image/jpeg",
                    "data": base64_image_data,
                },
            ],
        }
    ],
)

JavaScript

// ✅ Include multimodal content in the function response
const finalInteraction = await client.interactions.create({
  model: "gemini-3.5-flash",
  previousInteractionId: interaction.id,
  input: [{
    type: "function_result",
    name: toolCall.name,
    call_id: toolCall.id,
    result: [
      { type: "text", text: "instrument.jpg" },
      {
        type: "image",
        mime_type: "image/jpeg",
        data: base64ImageData,
      },
    ],
  }],
});

التعليمات المضمّنة في ردود الدوال

نرى غالبًا أنّ العملاء يقدّمون تعليمات إضافية مع ردود الوظائف كـ Parts لاحق. ويمكن أن يؤدي ذلك إلى سلوك غير متوقّع للنموذج (مثل تسريب الأفكار) وينتج عنه مخرجات أقل جودة. بدلاً من ذلك، أضِف أي تعليمات إضافية إلى نهاية نص رد الدالة مفصولة بسطرَين جديدَين.

Python

# ✅ Append inline instructions to the end of the function response separated by two newlines
result_text = f"{json.dumps(result)}\n\n<your inline instructions>"

final_interaction = client.interactions.create(
    model="gemini-3.5-flash",
    previous_interaction_id=interaction.id,
    tools=[my_tool],
    input=[{
        "type": "function_result",
        "name": fc_step.name,
        "call_id": fc_step.id,
        "result": [{"type": "text", "text": result_text}],
    }],
)

JavaScript

// ✅ Append inline instructions to the end of the function response separated by two newlines
const resultText = `${JSON.stringify(result)}\n\n<your inline instructions>`;

const finalInteraction = await client.interactions.create({
  model: "gemini-3.5-flash",
  previousInteractionId: interaction.id,
  tools: [myTool],
  input: [{
    type: "function_result",
    name: fcStep.name,
    call_id: fcStep.id,
    result: [{ type: "text", text: resultText }],
  }],
});

تقليل عدد طلبات استخدام الأدوات غير الضرورية

إذا لاحظت كثرة استخدام طلبات استدعاء الأدوات، هناك أسلوبان يساعدان في تقليلها:

  1. ابدأ بتقليل مستوى التفكير (medium أو low أو minimal): تشجّع مستويات التفكير الأعلى النموذج على استخدام المزيد من الأدوات للاستكشاف والتحقّق، لذا يمكن أن يؤدي خفض المستوى إلى تقليل عدد طلبات استخدام الأدوات.

  2. إضافة تعليمات نظام: إذا استمر الاستخدام المفرط للأدوات بعد تعديل مستوى التفكير، يمكنك تجربة طلب يقيّد استخدام الأدوات. على سبيل المثال:

    You have a limited action budget of <n> tool calls. Use them efficiently.
    

قائمة التحقّق الخاصة بعملية نقل البيانات

ننصحك بشدة بالتحديث إلى الإصدار 2.0.0 أو إصدار أحدث من حزمة تطوير البرامج (SDK) google-genai. يتضمّن هذا الإصدار تغييرات غير متوافقة مع الإصدارات السابقة في Interactions API. راجِع دليل نقل البيانات الخاص بالتغييرات غير المتوافقة مع الإصدارات السابقة للاطّلاع على التفاصيل.

نقل البيانات من الإصدار التجريبي من Gemini 3 Flash

  • تعديل اسم النموذج: gemini-3-flash-previewgemini-3.5-flash
  • راجِع الأسعار. ‫Gemini 3.5 Flash أغلى من إصدار Gemini 3 Flash التجريبي. يمكنك الاطّلاع على صفحة الأسعار للحصول على التفاصيل.
  • أزِل temperature وtop_p وtop_k من ملف الإعداد (لم يعُد ذلك موصى به).
  • استبدِل thinking_budget بـ thinking_level.
  • أضِف id وname المطابق إلى جميع أجزاء FunctionResponse.
  • اختبار الطلبات تم تغيير الجهد التلقائي من high إلى medium، لذا يُرجى التحقّق من الجودة والسرعة والتكلفة.
  • أصبحت ميزة "حفظ الأفكار" مفعَّلة تلقائيًا. يتم نقل سياق الاستدلال بين الأدوار، ما يحسّن الأداء ولكن قد يزيد من استخدام الرموز المميزة.
  • تقليل عدد طلبات الأدوات غير الضرورية: ابدأ بتقليل مستوى التفكير (medium أو low أو minimal)، وأضِف تعليمات نظامية للحدّ من استخدام الأدوات إذا استمر الإفراط في استخدامها.
  • لا تتوفّر ميزة استخدام الكمبيوتر في Gemini 3.5 Flash في الوقت الحالي. بالنسبة إلى أحمال عمل "استخدام الكمبيوتر"، واصِل استخدام الإصدار التجريبي السريع من Gemini 3.

النقل من Gemini 2.5

كل ما سبق، بالإضافة إلى:

  • تبسيط الطلبات إذا كنت تستخدم هندسة الطلبات المستندة إلى سلسلة الأفكار لفرض التفكير المنطقي، جرِّب استخدام thinking_level: "medium" أو "high" مع طلبات أبسط بدلاً من ذلك.
  • اختبار أحجام العمل الخاصة بملفات PDF والوسائط إذا كنت تعتمد على سلوك معيّن لتحليل المستندات الكثيفة، اختبِر الإعداد media_resolution_high لضمان استمرار الدقة. قد تؤدي عملية نقل البيانات إلى إعدادات Gemini 3 التلقائية أيضًا إلى زيادة استخدام الرموز المميزة في ملفات PDF، ولكنها قد تقلل من استخدامها في الفيديوهات. وإذا تجاوزت الطلبات قدرة الاستيعاب، عليك تقليل media_resolution بشكل صريح. لمزيد من التفاصيل، راجِع مستندات دقة الوسائط.
  • الاستفادة من استخدام الأدوات معًا يمكن استخدام &quot;بحث Google&quot; وسياق عنوان URL وتنفيذ الرمز البرمجي والوظائف المخصّصة في الطلب نفسه.
  • في حال استخدام ردود الدوال المتعددة الوسائط، يجب نقل المحتوى المتعدد الوسائط إلى داخل أجزاء ردود الدوال، وليس بجانبها.
  • في حال استخدام تعليمات مضمّنة مع ردود الدوال، أضِفها إلى نص رد الدالة مع فصلها بسطرين جديدين، وليس كأجزاء منفصلة.
  • لا تتوفّر ميزة تقسيم الصور في الإصدار 3.x من Gemini. بالنسبة إلى أحمال العمل الخاصة بالتجزئة، واصِل استخدام Gemini 2.5 Flash مع إيقاف "المفكّر"، أو Gemini Robotics-ER 1.6.

ميزات Gemini 3 للعائلة

يحتوي Gemini 3.5 Flash على جميع إمكانات مجموعة Gemini 3 باستثناء ميزة "استخدام الكمبيوتر". الميزات التي تم تقديمها في Gemini 3 والتي سيتم نقلها إلى الإصدارات الأحدث:

الخطوات التالية