שילוב של כלים מובנים וקריאה לפונקציות

‫Gemini מאפשר לשלב כלים מובנים, כמו google_search, וקריאות לפונקציות (שנקראות גם כלים מותאמים אישית) באינטראקציה אחת, על ידי שמירה של היסטוריית ההקשר של הקריאות לכלים וחשיפה שלה. שילובים מובנים ומותאמים אישית של כלים מאפשרים תהליכי עבודה מורכבים ודינמיים. לדוגמה, המודל יכול להסתמך על נתונים מהאינטרנט בזמן אמת לפני שהוא מפעיל את הלוגיקה העסקית הספציפית שלכם.

דוגמה שבה מופעלים שילובים מובנים ומותאמים אישית של כלים באמצעות google_search ופונקציה מותאמת אישית getWeather:

Python

from google import genai

client = genai.Client()

getWeather = {
    "type": "function",
    "name": "getWeather",
    "description": "Gets the weather for a requested city.",
    "parameters": {
        "type": "object",
        "properties": {
            "city": {
                "type": "string",
                "description": "The city and state, e.g. Utqiaġvik, Alaska",
            },
        },
        "required": ["city"],
    },
}

# The Interactions API manages context automatically across tool calls.
# The model will first use Google Search, then call getWeather.
interaction = client.interactions.create(
    model="gemini-3-flash-preview",
    input="What is the northernmost city in the United States? What's the weather like there today?",
    tools=[
        {"google_search": {}},
        getWeather,
    ],
)

# Process steps: the interaction contains search results and a function call
for step in interaction.steps:
    if step.type == "function_call":
        print(f"Function call: {step.name} with args: {step.arguments}")
        # In a real application, you would execute the function here
        # and provide the result back to the model.

JavaScript

import { GoogleGenAI } from '@google/genai';

const client = new GoogleGenAI({});

const getWeather = {
    type: "function",
    name: "getWeather",
    description: "Get the weather in a given location",
    parameters: {
        type: "object",
        properties: {
            location: {
                type: "string",
                description: "The city and state, e.g. San Francisco, CA"
            }
        },
        required: ["location"]
    }
};

// The Interactions API manages context automatically across tool calls.
// The model will first use Google Search, then call getWeather.
const interaction = await client.interactions.create({
    model: "gemini-3-flash-preview",
    input: "What is the northernmost city in the United States? What's the weather like there today?",
    tools: [
        { googleSearch: {} },
        getWeather,
    ],
});

// Process steps: the interaction contains search results and a function call
for (const step of interaction.steps) {
    if (step.type === "function_call") {
        console.log(`Function call: ${step.name} with args: ${JSON.stringify(step.arguments)}`);
        // In a real application, you would execute the function here
        // and provide the result back to the model.
    }
}

REST

curl -X POST "https://generativelanguage.googleapis.com/v1beta/interactions" \
-H "Content-Type: application/json" \
-H "x-goog-api-key: $GEMINI_API_KEY" \
-d '{
  "model": "gemini-3-flash-preview",
  "input": "What is the northernmost city in the United States? What'\''s the weather like there today?",
  "tools": [
    { "type": "google_search" },
    {
      "type": "function",
      "name": "getWeather",
      "description": "Get the weather in a given location",
      "parameters": {
          "type": "object",
          "properties": {
              "location": {
                  "type": "string",
                  "description": "The city and state, e.g. San Francisco, CA"
              }
          },
          "required": ["location"]
      }
    }
  ]
}'

איך זה עובד

מודלים של Gemini 3 משתמשים בהעברת הקשר של כלי כדי לאפשר שילובים מובנים ושילובים בהתאמה אישית של כלים. הפצת ההקשר של כלי מאפשרת לשמור את ההקשר של כלים מובנים ולחשוף אותו, ולשתף אותו עם כלים מותאמים אישית באותו אינטראקציה.

הפעלת שילוב של כלים

  • כדי להפעיל את ההתנהגות המשולבת, צריך לכלול את function_declarations, יחד עם הכלים המובנים שבהם רוצים להשתמש.

השלבים שמוחזרים על ידי ה-API

בתגובה לאינטראקציה, ה-API מחזיר שלבים נפרדים לקריאות לכלים מובנים ולקריאות לפונקציות (כלים בהתאמה אישית):

  • שלבים מובנים בכלי: הממשק API מנהל את השלבים האלה באופן אוטומטי, ושומר על ההקשר בין התורות.
  • שלבים לבקשה להפעלת פונקציה: ה-API מחזיר function_call שלבים לפונקציות המותאמות אישית. מריצים את הפונקציה ומחזירים את התוצאה.

שדות קריטיים בשלבים שמוחזרים

יש שדות מסוימים בשלבים שמוחזרים שחשובים לשמירה על ההקשר של הכלי ולאפשר שילובים של כלים:

  • id: נמצא בשלבים function_call ו-function_response. מזהה ייחודי שממפה קריאה לתגובה שלה.
  • signature: נמצא בשלבים thought, וגם בכל השלבים של קריאות לכלים (למשל, function_call) ושל תוצאות (למשל, function_response) עבור מודלים של Gemini 3 ואילך. ההקשר המוצפן הזה מאפשר העברה של הקשר הכלי בין אינטראקציות.

ניהול השדות האלה:

  • מצב Stateful (מומלץ): כשמשתמשים ב-previous_interaction_id, השרת מטפל אוטומטית בשדות id ו-signature.
  • מצב ללא שמירת מצב: כשמנהלים את היסטוריית השיחות באופן ידני, צריך לוודא שמעבירים את השדות id ו-signature בחזרה למודל בבקשות הבאות כדי לאמת את האותנטיות ולשמור על ההקשר. ערכות ה-SDK הרשמיות מטפלות בזה באופן אוטומטי אם מעבירים את אובייקט התשובה המלא להיסטוריה.

נתונים ספציפיים לכלי

חלק מהכלים המובנים מחזירים ארגומנטים של נתונים שגלויים למשתמשים, שספציפיים לסוג הכלי.

כלי User visible tool call args (if any) תגובה של הכלי שגלויה למשתמש (אם יש)
google_search queries search_suggestions
google_maps queries places
google_maps_widget_context_token
url_context urls
כתובות URL לבדיקה
status: סטטוס הגלישה
retrieved_url: כתובות URL שנסרקו
file_search ללא ללא

אסימונים ותמחור

שימו לב: חלקי קריאה לכלים מובנים בבקשות נספרים במסגרת prompt_token_count. השלבים האלה של כלי הביניים גלויים לכם עכשיו ומוחזרים לכם, ולכן הם חלק מהיסטוריית השיחה. זה קורה רק בבקשות, ולא בתגובות.

הכלי של חיפוש Google הוא חריג לכלל הזה. חיפוש Google כבר מחיל מודל תמחור משלו ברמת השאילתה, כך שלא מתבצע חיוב כפול על טוקנים (אפשר לעיין בדף תמחור).

מידע נוסף זמין בדף אסימונים.

מגבלות

  • ברירת המחדל היא מצב validated (מצב auto לא נתמך) כשמחזור הקשר של הכלי מופעל.
  • כלים מובנים כמו google_search מסתמכים על מידע לגבי המיקום והשעה הנוכחית, ולכן אם יש סתירה במידע לגבי המיקום והשעה ב-system_instruction או ב-function_declaration.description, יכול להיות שהתכונה של שילוב כלים לא תפעל בצורה טובה.

כלים נתמכים

ההפצה הרגילה של הקשר בכלי חלה על כלים בצד השרת (כלים מובנים). הכלי Code Execution הוא גם כלי בצד השרת, אבל יש לו פתרון מובנה משלו להעברת הקשר. השימוש במחשב והפעלת פונקציות הם כלים בצד הלקוח, ויש להם גם פתרונות מובנים להעברת הקשר.

כלי צד הביצוע תמיכה בהעברת הקשר
חיפוש Google צד השרת נתמך
מפות Google צד השרת נתמך
הקשר של כתובת ה-URL צד השרת נתמך
חיפוש קבצים צד השרת נתמך
Code Execution צד השרת נתמך (מוכלל, משתמש בשלבים code_execution ו-code_execution_result)
שימוש במחשב בצד הלקוח נתמך (מוכלל, משתמש בשלבים function_call ו-function_response)
פונקציות מותאמות אישית בצד הלקוח נתמך (מוכלל, משתמש בשלבים function_call ו-function_response)

המאמרים הבאים