במודלים של סדרת Gemini 2.5 נעשה שימוש ב'תהליך חשיבה' פנימי במהלך יצירת התשובה. התהליך הזה תורם לשיפור יכולות ההסקה שלהם, ומאפשר להם להשתמש בתכנון מרובות שלבים כדי לפתור משימות מורכבות. לכן המודלים האלה מתאימים במיוחד לתכנות, למתמטיקה מתקדמת, לניתוח נתונים ולמשימות אחרות שדורשות תכנון או חשיבה.
במדריך הזה מוסבר איך לעבוד עם יכולות החשיבה של Gemini באמצעות Gemini API.
שימוש במודלים של חשיבה
מודלים עם יכולות חשיבה זמינים ב-Google AI Studio דרך Gemini API. התכונה 'חשיבה' מופעלת כברירת מחדל גם ב-API וגם ב-AI Studio, כי למודלים מסדרה 2.5 יש יכולת להחליט באופן אוטומטי מתי וכמה לחשוב על סמך ההנחיה. ברוב התרחישים, מומלץ להשאיר את האפשרות הזו מופעלת. עם זאת, אם רוצים להשבית את החשיבה, אפשר להגדיר את הפרמטר thinkingBudget
לערך 0.
שליחת בקשה בסיסית
Python
from google import genai
client = genai.Client(api_key="GOOGLE_API_KEY")
prompt = "Explain the concept of Occam's Razor and provide a simple, everyday example."
response = client.models.generate_content(
model="gemini-2.5-flash-preview-04-17",
contents=prompt
)
print(response.text)
JavaScript
import { GoogleGenAI } from "@google/genai";
const ai = new GoogleGenAI({ apiKey: "GOOGLE_API_KEY" });
async function main() {
const prompt = "Explain the concept of Occam's Razor and provide a simple, everyday example.";
const response = await ai.models.generateContent({
model: "gemini-2.5-flash-preview-04-17",
contents: prompt,
});
console.log(response.text);
}
main();
Go
// import packages here
func main() {
ctx := context.Background()
client, err := genai.NewClient(ctx, option.WithAPIKey(os.Getenv("GOOGLE_API_KEY")))
if err != nil {
log.Fatal(err)
}
defer client.Close()
model := client.GenerativeModel("gemini-2.5-flash-preview-04-17")
resp, err := model.GenerateContent(ctx, genai.Text("Explain the concept of Occam's Razor and provide a simple, everyday example."))
if err != nil {
log.Fatal(err)
}
fmt.Println(resp.Text())
}
REST
curl "https://generativelanguage.googleapis.com/v1beta/models/gemini-2.5-flash-preview-04-17:generateContent?key=$GOOGLE_API_KEY" \
-H 'Content-Type: application/json' \
-X POST \
-d '{
"contents": [
{
"parts": [
{
"text": "Explain the concept of Occam\''s Razor and provide a simple, everyday example."
}
]
}
]
}'
```
הגדרת תקציב למודלים של חשיבה
הפרמטר thinkingBudget
מספק למודל הנחיות לגבי מספר אסימוני החשיבה שבהם הוא יכול להשתמש בזמן יצירת התשובה. בדרך כלל, מספר אסימונים גדול יותר משויך לחשיבה מפורטת יותר, שנדרשת כדי לפתור משימות מורכבות יותר. הערך של thinkingBudget
חייב להיות מספר שלם בטווח 0 עד 24576. הגדרת תקציב החשיבה ל-0 משביתה את החשיבה.
בהתאם להנחיה, יכול להיות שהמודל יגרום לחריגה ממכסת האסימונים או לחוסר שימוש במכסת האסימונים.
Python
from google import genai
from google.genai import types
client = genai.Client()
response = client.models.generate_content(
model="gemini-2.5-flash-preview-04-17",
contents="Explain the Occam's Razor concept and provide everyday examples of it",
config=types.GenerateContentConfig(
thinking_config=types.ThinkingConfig(thinking_budget=1024)
),
)
print(response.text)
JavaScript
import { GoogleGenAI } from "@google/genai";
const ai = new GoogleGenAI({ apiKey: "GOOGLE_API_KEY" });
async function main() {
const response = await ai.models.generateContent({
model: "gemini-2.5-flash-preview-04-17",
contents: "Explain the Occam's Razor concept and provide everyday examples of it",
config: {
thinkingConfig: {
thinkingBudget: 1024,
},
},
});
console.log(response.text);
}
main();
REST
curl "https://generativelanguage.googleapis.com/v1beta/models/gemini-2.5-flash-preview-04-17:generateContent?key=$GOOGLE_API_KEY" \
-H 'Content-Type: application/json' \
-X POST \
-d '{
"contents": [
{
"parts": [
{
"text": "Explain the Occam\''s Razor concept and provide everyday examples of it"
}
]
}
],
"generationConfig": {
"thinkingConfig": {
"thinkingBudget": 1024
}
}
}'
שימוש בכלים עם מודלים של חשיבה
אתם יכולים לשלב את השימוש במודלים של חשיבה עם כל אחד מהכלים והיכולות של Gemini כדי לבצע פעולות נוספות מלבד יצירת טקסט. כך הם יכולים לקיים אינטראקציה עם מערכות חיצוניות, להריץ קוד או לגשת למידע בזמן אמת, ולהטמיע את התוצאות בתהליך החשיבה ובתגובה הסופית שלהם.
כלי החיפוש מאפשר למודל לשלוח שאילתות למנועי חיפוש חיצוניים כדי למצוא מידע עדכני או מידע מעבר לנתוני האימון שלו. האפשרות הזו שימושית לשאלות על אירועים מהזמן האחרון או על נושאים ספציפיים מאוד.
כלי ההפעלה של הקוד מאפשר למודל ליצור ולהריץ קוד Python כדי לבצע חישובים, לבצע פעולות על נתונים או לפתור בעיות שהכי טוב לטפל בהן באופן אלגוריתמי. המודל מקבל את הפלט של הקוד ויכול להשתמש בו בתשובה שלו.
בעזרת פלט מובנה, תוכלו לאלץ את Gemini להשיב ב-JSON, פורמט פלט מובנה שמתאים לעיבוד אוטומטי. האפשרות הזו שימושית במיוחד לשילוב הפלט של המודל באפליקציות.
קריאה לפונקציה מחברת את מודל החשיבה לכלים חיצוניים ולממשקי API, כדי שהוא יוכל להבין מתי לקרוא לפונקציה הנכונה ואילו פרמטרים לספק.
שיטות מומלצות
בקטע הזה מפורטות כמה הנחיות לשימוש יעיל במודלים לחשיבה. כמו תמיד, כדי להשיג את התוצאות הטובות ביותר, מומלץ לפעול לפי ההנחיות והשיטות המומלצות שלנו לגבי הנחיות.
ניפוי באגים והכוונה
בדיקת התהליך של המסקנה: אם התשובה שקיבלתם מהמודלים של החשיבה לא תואמת לציפיות, כדאי לנתח היטב את תהליך המסקנה של Gemini. תוכלו לראות איך המערכת פיצלה את המשימה והגיעה למסקנה שלה, ולהשתמש במידע הזה כדי לתקן את הבעיה ולהגיע לתוצאות הנכונות.
הנחיה לגבי התהליך: אם אתם רוצים לקבל פלט ארוך במיוחד, כדאי לספק הנחיה בהנחיה כדי להגביל את כמות החשיבה שבה המודל משתמש. כך תוכלו להקצות יותר מתפוקת האסימון לתגובה שלכם.
מורכבות המשימה
- משימות פשוטות (Thinking יכול להיות מושבת): לבקשות פשוטות, לא נדרש חשיבה מורכבת, כמו אחזור פשוט של עובדות או סיווג פשוט. דוגמאות:
- "Where was DeepMind founded?"
- "האם האימייל הזה הוא בקשה לפגישה או שהוא רק מספק מידע?"
- משימות בינוניות (ברירת המחדל/חשיבה חלקית): בקשות נפוצות רבות נהנות מעיבוד מסוים של שלבים או מהבנה מעמיקה יותר. Gemini יכול להשתמש באופן גמיש ביכולת החשיבה במשימות כמו:
- השוואה בין פוטוסינתזה לבין התבגרות.
- השוואה וניגוד בין רכבים חשמליים לבין רכבים היברידיים.
- משימות קשות (יכולת חשיבה מקסימלית): כדי להתמודד עם אתגרים מורכבים באמת, ה-AI צריך להפעיל את מלוא יכולות התכנון והשיקול הדעת שלו, ולעיתים קרובות הוא צריך לבצע הרבה שלבים פנימיים לפני שהוא מספק תשובה. דוגמאות:
- פתרון בעיה 1 ב-AIME 2025: חישוב הסכום של כל הבסיסים המספריים b > 9 שבהם 17b הוא חלוק של 97b.
- כתיבת קוד Python לאפליקציית אינטרנט שמציגה נתונים של שוק המניות בזמן אמת, כולל אימות משתמשים. רצוי שהיא תהיה יעילה ככל האפשר.
מה השלב הבא?
- אפשר לנסות את Gemini 2.5 Pro Preview ב-Google AI Studio.
- מידע נוסף על גרסת הטרום-השקה של Gemini 2.5 Pro ועל המודל Gemini Flash 2.0 Thinking זמין בדף המודל.
- אפשר למצוא דוגמאות נוספות בספר הבישול של Thinking.