تستخدِم نماذج سلسلة Gemini 2.5 "عملية تفكير" داخلية أثناء توليد الردّ. وتساهم هذه العملية في تحسين قدرات التفكير لديهم، ويساعدهم ذلك في استخدام التخطيط المتعدّد الخطوات لحلّ المهام المعقّدة. وهذا يجعل هذه النماذج جيدة بشكل خاص في الترميز والرياضيات المتقدمة وتحليل البيانات والمهام الأخرى التي تتطلب التخطيط أو التفكير.
يوضّح لك هذا الدليل كيفية العمل مع إمكانات التفكير في Gemini باستخدام واجهة برمجة التطبيقات Gemini API.
استخدام نماذج التفكير
تتوفّر النماذج ذات القدرات التفكيرية في
Google AI Studio
ومن خلال Gemini API. تكون ميزة "التفكير" مفعّلة تلقائيًا في كلّ من واجهة برمجة التطبيقات وGoogle
AI Studio لأنّ نماذج السلسلة 2.5 يمكنها تحديد وقت التفكير ومدته تلقائيًا استنادًا إلى الطلب. بالنسبة لمعظم حالات الاستخدام،
من المفيد ترك التفكير فيها. ولكن إذا أردت
إيقاف التفكير، يمكنك إجراء ذلك من خلال ضبط المَعلمة thinkingBudget
على 0.
إرسال طلب أساسي
from google import genai
client = genai.Client(api_key="GOOGLE_API_KEY")
prompt = "Explain the concept of Occam's Razor and provide a simple, everyday example."
response = client.models.generate_content(
model="gemini-2.5-flash-preview-04-17",
contents=prompt
)
print(response.text)
import { GoogleGenAI } from "@google/genai";
const ai = new GoogleGenAI({ apiKey: "GOOGLE_API_KEY" });
async function main() {
const prompt = "Explain the concept of Occam's Razor and provide a simple, everyday example.";
const response = await ai.models.generateContent({
model: "gemini-2.5-flash-preview-04-17",
contents: prompt,
});
console.log(response.text);
}
main();
// import packages here
func main() {
ctx := context.Background()
client, err := genai.NewClient(ctx, option.WithAPIKey(os.Getenv("GOOGLE_API_KEY")))
if err != nil {
log.Fatal(err)
}
defer client.Close()
model := client.GenerativeModel("gemini-2.5-flash-preview-04-17")
resp, err := model.GenerateContent(ctx, genai.Text("Explain the concept of Occam's Razor and provide a simple, everyday example."))
if err != nil {
log.Fatal(err)
}
fmt.Println(resp.Text())
}
curl "https://generativelanguage.googleapis.com/v1beta/models/gemini-2.5-flash-preview-04-17:generateContent?key=$GOOGLE_API_KEY" \
-H 'Content-Type: application/json' \
-X POST \
-d '{
"contents": [
{
"parts": [
{
"text": "Explain the concept of Occam\''s Razor and provide a simple, everyday example."
}
]
}
]
}'
```
تعيين ميزانية على نماذج التفكير
تعطي المَعلمة thinkingBudget
إرشادات النموذج بشأن عدد الرموز المميّزة للتفكير التي يمكنها استخدامها عند إنشاء ردّ. عادةً ما يرتبط العدد الأكبر من الرموز المميزة بتفكير أكثر تفصيلاً،
وهو مطلوب لحل المهام الأكثر تعقيدًا. يجب أن يكون thinkingBudget
عددًا صحيحًا ضمن النطاق من 0 إلى 24576. يؤدي تعيين ميزانية التفكير على
0 إلى إيقاف التفكير.
وبناءً على الطلب، قد يتجاوز النموذج ميزانية الرمز المميّز أو ينخفض.
from google import genai
from google.genai import types
client = genai.Client()
response = client.models.generate_content(
model="gemini-2.5-flash-preview-04-17",
contents="Explain the Occam's Razor concept and provide everyday examples of it",
config=types.GenerateContentConfig(
thinking_config=types.ThinkingConfig(thinking_budget=1024)
),
)
print(response.text)
import { GoogleGenAI } from "@google/genai";
const ai = new GoogleGenAI({ apiKey: "GOOGLE_API_KEY" });
async function main() {
const response = await ai.models.generateContent({
model: "gemini-2.5-flash-preview-04-17",
contents: "Explain the Occam's Razor concept and provide everyday examples of it",
config: {
thinkingConfig: {
thinkingBudget: 1024,
},
},
});
console.log(response.text);
}
main();
curl "https://generativelanguage.googleapis.com/v1beta/models/gemini-2.5-flash-preview-04-17:generateContent?key=$GOOGLE_API_KEY" \
-H 'Content-Type: application/json' \
-X POST \
-d '{
"contents": [
{
"parts": [
{
"text": "Explain the Occam\''s Razor concept and provide everyday examples of it"
}
]
}
],
"generationConfig": {
"thinkingConfig": {
"thinkingBudget": 1024
}
}
}'
استخدام الأدوات مع نماذج التفكير
يمكنك الجمع بين استخدامك لنماذج التفكير وأي من أدوات Gemini وإمكاناته لتنفيذ إجراءات أخرى غير إنشاء النص. يتيح لهم ذلك التفاعل مع الأنظمة الخارجية أو تنفيذ التعليمات البرمجية أو الوصول إلى المعلومات في الوقت الفعلي، مع دمج النتائج في الأسباب والاستجابة النهائية.
تسمح أداة البحث للنموذج بطلب البحث عن محركات البحث الخارجية للعثور على معلومات أو معلومات حديثة بخلاف بيانات التدريب. يُعد هذا مفيدًا للأسئلة حول الأحداث الأخيرة أو الموضوعات المحددة للغاية.
تتيح أداة تنفيذ الرموز للنموذج إنشاء رموز Python وتشغيلها لإجراء العمليات الحسابية أو معالجة البيانات أو حلّ المشاكل التي من الأفضل التعامل معها باستخدام الخوارزميات. يتلقّى النموذج مخرج الرمز البرمجي ويمكنه استخدامه في ردّه.
باستخدام الإخراج المنظَّم، يمكنك تقييد Gemini للردّ باستخدام تنسيق JSON، وهو تنسيق إخراج منظَّم مناسب للمعالجة المبرمَجة. وهذا مفيد بشكل خاص لدمج ناتج النموذج في التطبيقات.
يربط استدعاء الدوال نموذج التفكير بالأدوات الخارجية وواجهات برمجة التطبيقات، حتى يتمكّن من تحديد وقت استدعاء الدالة الصحيحة والمعلَمات التي يجب تقديمها.
أفضل الممارسات
يتضمن هذا القسم بعض الإرشادات حول استخدام نماذج التفكير بكفاءة. وكالعادة، يمكنك تحقيق أفضل النتائج من خلال اتّباع الإرشادات وأفضل الممارسات.
تصحيح الأخطاء والتوجيه
مراجعة الأسباب: عندما لا تحصل على ردّك المتوقّع من نماذج التفكير، قد يساعدك تحليل عملية Gemini الاستنتاجية بعناية. يمكنك أن ترى كيف حللت المهمة ووصلت إلى نتيجتها، واستخدام هذه المعلومات لتصحيحها نحو النتائج الصحيحة.
تقديم إرشادات في التفكير الاستنتاجي: إذا كنت تأمل في الحصول على مخرجات طويلة جدًا من البيانات، يمكنك تقديم إرشادات ضمن طلبك للحدّ من قدرة التفكير التي يستخدمها النموذج. يتيح لك هذا حجز المزيد من ناتج الرمز المميز لردك.
مدى تعقيد المهمة
- المهام السهلة (يمكن إيقاف التفكير): بالنسبة إلى الطلبات المباشرة، لا يلزم استخدام تفكير معقد، مثل استرداد الحقائق أو تصنيفها بشكل مباشر. ومن الأمثلة على ذلك:
- "أين تم تأسيس شركة DeepMind؟"
- "هل هذه الرسالة الإلكترونية تطلب عقد اجتماع أم تقدّم معلومات فقط؟"
- المهام المتوسطة (الافتراضية/بعض التفكير): يستفيد العديد من الطلبات الشائعة من المعالجة خطوة بخطوة أو فهم أعمق. يمكن أن يستخدم Gemini بشكلٍ مرن
إمكانات التفكير في مهام مثل:
- قارِن بين عملية البناء الضوئي والنمو.
- قارِن بين السيارات الكهربائية والسيارات الهجينة.
- المهام الصعبة (الحد الأقصى من قدرات التفكير): بالنسبة إلى التحديات المعقّدة حقًا، يحتاج الذكاء الاصطناعي إلى تفعيل قدراته الكاملة في التفكير والتخطيط، ما يؤدي في كثير من الأحيان إلى تنفيذ العديد من الخطوات الداخلية قبل تقديم إجابة. ومن الأمثلة على ذلك:
- حلّ المسألة 1 في AIME 2025: ابحث عن مجموع كل قواعد الأعداد الصحيحة b > 9، علمًا أنّ 17b هو قاسم للعدد 97b.
- كتابة رمز Python لتطبيق ويب يعرض بيانات البورصة في الوقت الفعلي، بما في ذلك مصادقة المستخدم أن تكون فعّالة بقدرٍ متعالٍ قدر الإمكان
ما هي الخطوات التالية؟
- يمكنك تجربة الإصدار التجريبي من Gemini 2.5 Pro في Google AI Studio.
- لمزيد من المعلومات حول Gemini 2.5 Pro Preview وGemini Flash 2.0 Thinking، يمكنك الاطّلاع على صفحة النماذج.
- يمكنك تجربة المزيد من الأمثلة في كتاب التفكير في الطبخ.