ما جديد Gemini 3.5 Flash؟

‫Gemini 3.5 Flash متاح للجمهور العام (GA) وهو نموذج ثابت وجاهز للاستخدام في الإنتاج على نطاق واسع. يقدّم هذا النموذج، وهو الأكثر ذكاءً بين نماذج Flash، أداءً متطوّرًا ومستدامًا في التنفيذ المستند إلى الذكاء الاصطناعي الوكيل والترميز والمهام الطويلة الأجل على نطاق واسع.

يتضمّن هذا الدليل نظرة عامة على التحسينات والتغييرات في واجهة برمجة التطبيقات وإرشادات نقل البيانات إلى Gemini 3.5 Flash.

النموذج الجديد

الطراز رقم تعريف الطراز الوصف
Gemini 3.5 Flash gemini-3.5-flash النموذج الأكثر ذكاءً لدينا الذي يقدّم أداءً متطوّرًا ومستدامًا في المهام المستندة إلى الذكاء الاصطناعي الوكيل ومهام الترميز.

يتوافق Gemini 3.5 Flash مع قدرة استيعاب مليون رمز مميّز، و65 ألف رمز مميّز كحد أقصى للناتج، وإمكانات "المفكِّر"، ومجموعة الأدوات وميزات المنصة نفسها المتوفّرة في Gemini 3 Flash. لا تتوفّر حاليًا ميزة "استخدام الكمبيوتر".

للاطّلاع على المواصفات الكاملة، يُرجى مراجعة نظرة عامة على النماذج. للاطّلاع على الأسعار، يُرجى الانتقال إلى صفحة الأسعار.

التشغيل السريع

تستخدم جميع الأمثلة في هذا الدليل واجهة برمجة التطبيقات GenerateContent API. تتوفّر أيضًا واجهة برمجة التطبيقات Interactions API، وتنطبق عليها خيارات الإعداد والتوصيات نفسها.

Python

from google import genai

client = genai.Client()

response = client.models.generate_content(
    model="gemini-3.5-flash",
    contents="Explain how parallel agentic execution works in three sentences.",
)
print(response.text)

JavaScript

import { GoogleGenAI } from "@google/genai";

const ai = new GoogleGenAI({});

async function main() {
  const response = await ai.models.generateContent({
    model: "gemini-3.5-flash",
    contents: "Explain how parallel agentic execution works in three sentences.",
  });
  console.log(response.text);
}

main();

راحة

curl "https://generativelanguage.googleapis.com/v1beta/models/gemini-3.5-flash:generateContent" \
  -H "x-goog-api-key: $GEMINI_API_KEY" \
  -H 'Content-Type: application/json' \
  -X POST \
  -d '{
    "contents": [{
      "parts": [{"text": "Explain how parallel agentic execution works in three sentences."}]
    }]
  }'

الميزات الجديدة

  • أداء متطوّر ومستدام: النموذج الأكثر ذكاءً بين نماذج Flash، وهو محسّن للمهام المستندة إلى الذكاء الاصطناعي الوكيل ومهام الترميز على نطاق واسع.
  • التنفيذ المستند إلى الذكاء الاصطناعي الوكيل: نشر وكلاء فرعيين وحلّ المشاكل وحلقات الذكاء الاصطناعي الوكيل السريعة على نطاق واسع.
  • الترميز: دورات الترميز التكرارية والاستكشاف السريع وإنشاء النماذج الأوّلية لاختبار المسارات البديلة واستكشاف الحلول بشكل ديناميكي.
  • المهام الطويلة الأجل: سير العمل متعدد الخطوات واستخدام الأدوات على نطاق واسع.
  • الاحتفاظ بالأفكار: يحتفظ النموذج تلقائيًا بالاستدلالات الوسيطة في المحادثات المتعددة الأدوار. لا يلزم إجراء أي تغييرات على واجهة برمجة التطبيقات.
  • مستوى الجهد التلقائي الجديد: تم تغيير جهد "المفكِّر" التلقائي من high إلى medium. يُرجى الاطّلاع على مستوى الجهد التلقائي الجديد لمزيد من التفاصيل.
  • تحسين مستوى التفكير low: تم تحسين مستوى التفكير low بشكل كبير لمهام الترميز والمهام المستندة إلى الذكاء الاصطناعي الوكيل التي تتطلب عددًا أقل من الخطوات، ما يقدّم جودة عالية بتكلفة أقل ووقت استجابة أسرع.
  • الإصدار المتاح للجمهور العام: نموذج ثابت للاستخدام في الإنتاج على نطاق واسع.

التغييرات في السلوك

مستوى الجهد التلقائي الجديد: medium

أصبح جهد "المفكِّر" التلقائي الآن medium، بعد أن كان high في الإصدار التجريبي من Gemini 3 Flash. يقدّم مستوى الجهد medium نتائج جيدة جدًا في مجموعة كبيرة من المهام، مع سرعة أكبر وفعالية أعلى من حيث التكلفة. بالنسبة إلى المشاكل المعقّدة، يشجّع مستوى الجهد high النموذج على التفكير بشكل أعمق.

مستوى الجهد حالات الاستخدام
minimal محسّن لسرعة الاستجابة حالات استخدام مشابهة للمحادثة، وإجابات سريعة تستند إلى الحقائق، واستدعاءات أبسط للأدوات
low مهام الترميز والمهام المستندة إلى الذكاء الاصطناعي الوكيل التي تتطلب وقت استجابة أقل وعددًا أقل من الخطوات يقدّم أيضًا أداءً جيدًا في مهام التحليل والكتابة التي تتطلب بعض التفكير.
medium (تلقائي) أفضل جودة لمعظم المهام يُنصح به لحالات الاستخدام المعقّدة للترميز والذكاء الاصطناعي الوكيل
high يزيد إلى أقصى حد من قدرة النموذج على التفكير واستخدام الأدوات الأفضل للاستدلال المعقّد والمسائل الرياضية الصعبة ومهام الترميز أو الذكاء الاصطناعي الوكيل الأكثر صعوبة يسمح بالأفكار المطوّلة واستدعاءات الدوال

لتجاوز الإعداد التلقائي، اضبط thinking_level في الإعدادات:

Python

from google import genai
from google.genai import types

client = genai.Client()

response = client.models.generate_content(
    model="gemini-3.5-flash",
    contents="Prove that the square root of 2 is irrational.",
    config=types.GenerateContentConfig(
        thinking_config=types.ThinkingConfig(thinking_level="high")
    ),
)

print(response.text)

JavaScript

import { GoogleGenAI } from "@google/genai";

const ai = new GoogleGenAI({});

async function main() {
  const response = await ai.models.generateContent({
    model: "gemini-3.5-flash",
    contents: "Prove that the square root of 2 is irrational.",
    config: {
      thinkingConfig: {
        thinkingLevel: "HIGH",
      },
    },
  });
  console.log(response.text);
}

main();

راحة

curl "https://generativelanguage.googleapis.com/v1beta/models/gemini-3.5-flash:generateContent" \
  -H "x-goog-api-key: $GEMINI_API_KEY" \
  -H 'Content-Type: application/json' \
  -X POST \
  -d '{
    "contents": [{
      "parts": [{"text": "Prove that the square root of 2 is irrational."}]
    }],
    "generationConfig": {
      "thinkingConfig": {
        "thinkingLevel": "HIGH"
      }
    }
  }'

الاحتفاظ بالأفكار

يحتفظ النموذج تلقائيًا بالاستدلالات الوسيطة في المحادثات المتعددة الأدوار. عندما يكون سياق الاستدلال متاحًا في سجلّ المحادثات، يتم نقله إلى الأدوار التالية، ما يحسّن الأداء في المهام المعقّدة المتعددة الخطوات، مثل تصحيح الأخطاء التكراري وإعادة هيكلة الرموز البرمجية. لا يلزم إجراء أي تغييرات على واجهة برمجة التطبيقات:

  • واجهة برمجة التطبيقات Interactions API: يتم الاحتفاظ بالأفكار تلقائيًا. لا يوجد أي تغيير في السلوك.
  • واجهة برمجة التطبيقات GenerateContent API: بدءًا من Gemini 3.5 Flash، يستخدم النموذج سياق الاستدلال من جميع الأدوار السابقة عندما تكون توقيعات الأفكار متاحة في سجلّ المحادثات. لتفعيل هذه الميزة، مرِّر سجلّ المحادثات الكامل، وغير المعدَّل (بما في ذلك توقيعات الأفكار) في contents. تتعامل حِزم تطوير البرامج (SDK) مع هذه العملية تلقائيًا.

أفضل الممارسات وتعديلات المَعلمات في Gemini 3.x

تنطبق الإرشادات التالية على جميع نماذج Gemini 3.x، بما في ذلك Gemini 3.5 Flash.

  • temperatureوtop_p وtop_k: ننصحك بشدة بعدم تغيير القيم التلقائية. تم تحسين إمكانات الاستدلال في Gemini 3 للإعدادات التلقائية.
  • استخدِم thinking_level بدلاً من thinking_budget.
  • مطابقة الردود على استدعاءات الدوال: id، name، وعدد الردود يجب أن يتطابق مع الاستدعاءات السابقة.
  • الردود على الدوال المتعددة الوسائط: يجب تضمين المحتوى المتعدد الوسائط داخل الردّ على الدالة، وليس خارجه.
  • التعليمات المضمّنة في الردود على الدوال: يجب إلحاقها بنص الردّ على الدالة ، وليس كأجزاء منفصلة.
  • تقليل استدعاءات الأدوات غير الضرورية: استخدِم مستويات جهد أقل أو جرِّب التعليمات على مستوى النظام لتقليل استدعاءات الأدوات في سير العمل المستند إلى الذكاء الاصطناعي الوكيل.

يُرجى الاطّلاع على الأقسام أدناه لمعرفة كيفية تعديل الرمز البرمجي.

مَعلمات اختيار العيّنات (لم يعُد يُنصح بها)

لم يعُد يُنصح باستخدام temperature وtop_p وtop_k لجميع نماذج Gemini 3.x. تم تحسين إمكانات الاستدلال في Gemini 3 للإعدادات التلقائية. أزِل هذه المَعلمات من جميع الطلبات.

# ⚠️ Remove these parameters (not recommended)
config = types.GenerateContentConfig(
    temperature=0.7,
    top_p=0.9,
    top_k=40
)

لضمان الحتمية، ننصحك بتحديد تعليمات على مستوى النظام تتضمّن قواعد صريحة لحالة الاستخدام المحدّدة.

thinking_budget (لم يعُد يُنصح بها)

لم يعُد يُنصح باستخدام المَعلمة الرقمية الأولية thinking_budget في جميع نماذج Gemini 3.x. استخدِم بدلاً من ذلك تعداد السلسلة thinking_level.

# ⚠️ Before (not recommended)
config = types.GenerateContentConfig(
    thinking_config=types.ThinkingConfig(thinking_budget=7500)
)

# ✅ After
config = types.GenerateContentConfig(
    thinking_config=types.ThinkingConfig(thinking_level="medium")
)

القيم المتاحة: minimal وlow وmedium (تلقائي) وhigh.

استدعاء الدوال: المطابقة الدقيقة للردود

تعرض واجهة برمجة التطبيقات Interactions API حاليًا خطأً في حال عدم تطابق الردود على الدوال. لا تعرض واجهة برمجة التطبيقات GenerateContent API خطأً بعد، ولكن تؤدي الردود غير المتطابقة إلى أن يعرض النموذج ردودًا فارغة مع finish_reason: STOP في معظم الحالات. يجب دائمًا اتّباع هذه الاصطلاحات:

المتطلبات التفاصيل
تضمين id يجب أن يتضمّن كل FunctionResponse الرمز id من FunctionCall المقابل
مطابقة name يجب أن يتطابق name في الردّ مع name في الاستدعاء
مطابقة الأعداد يجب عرض FunctionResponse واحد فقط لكل FunctionCall يتم تلقّيه

Python

# ✅ Include matching id and name in the function response
final_response = client.models.generate_content(
    model="gemini-3.5-flash",
    config=config,
    contents=[
        *previous_contents,
        response.candidates[0].content,
        types.Content(role="user", parts=[
            types.Part.from_function_response(
                name=tool_call.name,
                response={"result": result},
                id=tool_call.id,
            )
        ]),
    ],
)

JavaScript

// ✅ Include matching id and name in the function response
const functionResponsePart = {
  functionResponse: {
    name: toolCall.name,
    response: { result: result },
    id: toolCall.id,
  },
};

const finalResponse = await ai.models.generateContent({
  model: "gemini-3.5-flash",
  contents: [
    ...previousContents,
    { role: "model", parts: [{ functionCall: toolCall }] },
    { role: "user", parts: [functionResponsePart] },
  ],
  config: config,
});

راحة

curl "https://generativelanguage.googleapis.com/v1beta/models/gemini-3.5-flash:generateContent" \
  -H "x-goog-api-key: $GEMINI_API_KEY" \
  -H 'Content-Type: application/json' \
  -X POST \
  -d '{
    "contents": [
      {"role": "user", "parts": [{"text": "..."}]},
      {"role": "model", "parts": [{"functionCall": {"name": "my_function", "args": {...}}}]},
      {"role": "user", "parts": [{"functionResponse": {"name": "my_function", "id": "call_id", "response": {"result": "..."}}}]}
    ]
  }'

الردود على الدوال المتعددة الوسائط

نلاحظ غالبًا أنّ العملاء يقدّمون صورًا خارج الردّ على الدالة. قد يؤدي ذلك إلى سلوك غير متوقّع من النموذج (مثل تسرّب الأفكار) ويؤدي إلى نواتج منخفضة الجودة. يُرجى اتّباع التوصية الواردة في مستندات واجهة برمجة التطبيقات للردود على الدوال المتعددة الوسائط بدلاً من ذلك، وتضمين المحتوى المتعدد الوسائط في أجزاء الردّ على الدالة التي تُرسِلها إلى النموذج. يمكن للنموذج معالجة هذا المحتوى المتعدد الوسائط في الدور التالي لإنتاج ردّ أكثر استنارة.

Python

# ✅ Include multimodal content in the function response
final_response = client.models.generate_content(
    model="gemini-3.5-flash",
    config=config,
    contents=[
        *previous_contents,
        response.candidates[0].content,
        types.Content(role="user", parts=[
            types.Part.from_function_response(
                name=tool_call.name,
                response={
                    "result": "instrument.jpg",
                    "image": base64_image_data,
                },
                id=tool_call.id,
            )
        ]),
    ],
)

JavaScript

// ✅ Include multimodal content in the function response
const finalResponse = await ai.models.generateContent({
  model: "gemini-3.5-flash",
  contents: [
    ...previousContents,
    { role: "model", parts: [{ functionCall: toolCall }] },
    {
      role: "user",
      parts: [{
        functionResponse: {
          name: toolCall.name,
          id: toolCall.id,
          response: {
            result: "instrument.jpg",
            image: base64ImageData,
          },
        },
      }],
    },
  ],
  config: config,
});

التعليمات المضمّنة في الردود على الدوال

نلاحظ غالبًا أنّ العملاء يقدّمون تعليمات إضافية مع الردود على الدوال كـ Parts لاحقة. قد يؤدي ذلك إلى سلوك غير متوقّع من النموذج (مثل تسرّب الأفكار) ويؤدي إلى نواتج منخفضة الجودة. بدلاً من ذلك، يجب إلحاق أي تعليمات إضافية بنهاية نص الردّ على الدالة مع الفصل بينهما بسطرَين جديدَين.

Python

# ✅ Append inline instructions to the end of the function response separated by two newlines
result_text = f"{json.dumps(result)}\n\n<your inline instructions>"

final_response = client.models.generate_content(
    model="gemini-3.5-flash",
    config=config,
    contents=[
        *previous_contents,
        response.candidates[0].content,
        types.Content(role="user", parts=[
            types.Part.from_function_response(
                name=tool_call.name,
                response={"result": result_text},
                id=tool_call.id,
            )
        ]),
    ],
)

JavaScript

// ✅ Append inline instructions to the end of the function response separated by two newlines
const resultText = `${JSON.stringify(result)}\n\n<your inline instructions>`;

const finalResponse = await ai.models.generateContent({
  model: "gemini-3.5-flash",
  contents: [
    ...previousContents,
    { role: "model", parts: [{ functionCall: toolCall }] },
    {
      role: "user",
      parts: [{
        functionResponse: {
          name: toolCall.name,
          id: toolCall.id,
          response: { result: resultText },
        },
      }],
    },
  ],
  config: config,
});

تقليل استدعاءات الأدوات غير الضرورية

إذا كنت تواجه مشكلة الإفراط في استخدام استدعاءات الأدوات، يمكن أن يساعدك أسلوبان في تقليلها:

  1. ابدأ بتقليل مستوى الجهد (medium أو low أو minimal): تشجّع مستويات الجهد الأعلى النموذج على استخدام المزيد من الأدوات للاستكشاف والتحقق، لذا يمكن أن يؤدي خفض المستوى إلى تقليل استدعاءات الأدوات.

  2. أضِف تعليمات على مستوى النظام: إذا استمر الإفراط في الاستخدام بعد تعديل مستوى الجهد، ننصحك باستخدام طلب يقيّد استخدام الأدوات. مثال:

    You have a limited action budget of <n> tool calls. Use them efficiently.
    

قائمة التحقُّق الخاصة بنقل البيانات

نقل البيانات من الإصدار التجريبي من Gemini 3 Flash

  • تعديل اسم النموذج: gemini-3-flash-previewgemini-3.5-flash
  • مراجعة الأسعار: Gemini 3.5 Flash أغلى من الإصدار التجريبي من Gemini 3 Flash. Gemini 3.5 Flash أغلى من Gemini 3 Flash. يُرجى الانتقال إلى صفحة الأسعار لمزيد من التفاصيل.
  • إزالة temperature وtop_p وtop_k من الإعدادات (لم يعُد يُنصح بها)
  • استبدال thinking_budget بـ thinking_level
  • إضافة id وname مطابقَين إلى جميع أجزاء FunctionResponse
  • اختبار الطلبات: تم تغيير الجهد التلقائي من `high` إلى `medium`، لذا يُرجى التحقق من الجودة والسرعة والتكلفة. تم تغيير الجهد التلقائي من high إلى medium، لذا يُرجى التحقق من الجودة والسرعة والتكلفة.
  • تم تفعيل ميزة "الاحتفاظ بالأفكار" تلقائيًا. يتم نقل سياق الاستدلال إلى الأدوار التالية، ما يحسّن الأداء ولكن قد يزيد من استخدام الرموز المميّزة.
  • تقليل استدعاءات الأدوات غير الضرورية: ابدأ بتقليل مستوى الجهد (medium أو low أو minimal)، وأضِف تعليمات على مستوى النظام لتقييد استخدام الأدوات إذا استمر الإفراط في الاستخدام.
  • لا تتوفّر حاليًا ميزة "استخدام الكمبيوتر" في Gemini 3.5 Flash. بالنسبة إلى أحمال عمل ميزة "استخدام الكمبيوتر"، استمر في استخدام الإصدار التجريبي من Gemini 3 Flash.

نقل البيانات من Gemini 2.5

كل ما ورد أعلاه بالإضافة إلى:

  • تبسيط الطلبات: إذا كنت تستخدم أسلوب "سلسلة الأفكار" لفرض الاستدلال، جرِّب `thinking_level: "medium"` أو `"high"` مع طلبات أبسط بدلاً من ذلك. إذا كنت تستخدم أسلوب "سلسلة الأفكار" في هندسة الطلبات لفرض الاستدلال، جرِّب thinking_level: "medium" أو "high" مع طلبات أبسط بدلاً من ذلك.
  • اختبار أحمال عمل ملفات PDF والوسائط: إذا كنت تعتمد على سلوك معيّن لتحليل المستندات الكثيفة، اختبِر الإعداد `media_resolution_high` لضمان استمرار الدقة. إذا كنت تعتمد على سلوك معيّن لتحليل المستندات الكثيفة، اختبِر الإعداد media_resolution_high لضمان استمرار الدقة. قد يؤدي نقل البيانات إلى الإعدادات التلقائية في Gemini 3 أيضًا إلى زيادة استخدام الرموز المميّزة لملفات PDF وتقليله للفيديوهات، وإذا تجاوزت الطلبات قدرة الاستيعاب، عليك تقليل media_resolution بشكل صريح. يُرجى الاطّلاع على مستندات دقة الوسائط لمزيد من التفاصيل.
  • الاستفادة من استخدام الأدوات المجمّع: يمكن استخدام "بحث Google" وسياق عنوان URL وتنفيذ الرموز البرمجية واستدعاء الدوال المخصّصة في الطلب نفسه. يمكن استخدام "بحث Google" وسياق عنوان URL وتنفيذ الرموز البرمجية واستدعاء الدوال المخصّصة في الطلب نفسه.
  • في حال استخدام الردود على الدوال المتعددة الوسائط، يجب نقل المحتوى المتعدد الوسائط إلى داخل أجزاء الردّ على الدالة، وليس بجانبها.
  • في حال استخدام التعليمات المضمّنة مع الردود على الدوال، يجب إلحاقها بنص الردّ على الدالة مع الفصل بينهما بسطرَين جديدَين، وليس كأجزاء منفصلة.
  • لا تتوفّر ميزة تقسيم الصور في Gemini 3.x. بالنسبة إلى أحمال عمل تقسيم الصور، استمر في استخدام Gemini 2.5 Flash مع إيقاف "المفكِّر"، أو Gemini Robotics-ER 1.6.

ميزات مجموعة نماذج Gemini 3

يرث Gemini 3.5 Flash جميع إمكانات مجموعة نماذج Gemini 3 باستثناء ميزة "استخدام الكمبيوتر". الميزات التي تم طرحها في Gemini 3 والتي يتم نقلها إلى الإصدارات اللاحقة:

الخطوات التالية