Gemini API

Gemini Interactions API là một API thử nghiệm cho phép nhà phát triển tạo các ứng dụng AI tạo sinh bằng mô hình Gemini. Gemini là mô hình mạnh nhất của chúng tôi, được xây dựng từ đầu theo hướng đa phương thức. Mô hình này có thể tổng quát hoá và hiểu một cách liền mạch, vận hành cũng như kết hợp nhiều loại thông tin, bao gồm cả ngôn ngữ, hình ảnh, âm thanh, video và mã nguồn. Bạn có thể sử dụng Gemini API cho các trường hợp sử dụng như suy luận trên văn bản và hình ảnh, tạo nội dung, tác nhân đối thoại, hệ thống tóm tắt và phân loại, v.v.

Tạo một hoạt động tương tác

post https://generativelanguage.googleapis.com/v1beta/interactions

Tạo một lượt tương tác mới.

Nội dung yêu cầu

Nội dung yêu cầu chứa dữ liệu với cấu trúc sau:

model ModelOption  (không bắt buộc)

Tên của "Mô hình" dùng để tạo lượt tương tác.
Bắt buộc nếu bạn không cung cấp "nhân viên hỗ trợ".

Các giá trị có thể có:

  • gemini-2.5-computer-use-preview-10-2025

    Một mô hình dựa trên khả năng của tác nhân được thiết kế để tương tác trực tiếp với giao diện, cho phép Gemini nhận biết và điều hướng các môi trường kỹ thuật số.

  • gemini-2.5-flash

    Mô hình suy luận kết hợp đầu tiên của chúng tôi hỗ trợ cửa sổ ngữ cảnh 1 triệu token và có ngân sách tư duy.

  • gemini-2.5-flash-image

    Mô hình tạo hình ảnh gốc của chúng tôi, được tối ưu hoá về tốc độ, tính linh hoạt và khả năng hiểu ngữ cảnh. Giá của văn bản đầu vào và đầu ra giống như giá của 2,5 Flash.

  • gemini-2.5-flash-lite

    Đây là mô hình nhỏ nhất và tiết kiệm chi phí nhất của chúng tôi, được xây dựng để sử dụng ở quy mô lớn.

  • gemini-2.5-flash-lite-preview-09-2025

    Mô hình mới nhất dựa trên Gemini 2.5 Flash lite được tối ưu hoá để tiết kiệm chi phí, có thông lượng cao và chất lượng cao.

  • gemini-2.5-flash-native-audio-preview-12-2025

    Các mô hình âm thanh gốc của chúng tôi được tối ưu hoá để mang đến đầu ra âm thanh chất lượng cao hơn với nhịp điệu, giọng nói tự nhiên, mức độ chi tiết và tâm trạng tốt hơn.

  • gemini-2.5-flash-preview-09-2025

    Mô hình mới nhất dựa trên mô hình 2.5 Flash. 2.5 Flash Preview phù hợp nhất với các tác vụ xử lý quy mô lớn, độ trễ thấp, khối lượng lớn đòi hỏi khả năng tư duy và các trường hợp sử dụng có tác nhân.

  • gemini-2.5-flash-preview-tts

    Mô hình chuyển văn bản sang lời nói 2.5 Flash được tối ưu hoá để tạo lời nói mạnh mẽ, có độ trễ thấp và có thể kiểm soát.

  • gemini-2.5-pro

    Mô hình đa năng tiên tiến của chúng tôi, vượt trội trong việc xử lý các nhiệm vụ lập trình và suy luận phức tạp.

  • gemini-2.5-pro-preview-tts

    Mô hình âm thanh chuyển văn bản sang lời nói 2.5 Pro của chúng tôi được tối ưu hoá để tạo lời nói mạnh mẽ với độ trễ thấp, giúp tạo ra kết quả tự nhiên hơn và dễ dàng điều hướng các câu lệnh.

  • gemini-3-flash-preview

    Mô hình thông minh nhất của chúng tôi được tối ưu hoá về tốc độ, kết hợp trí thông minh đột phá với khả năng tìm kiếm và tiếp thu thông tin vượt trội.

  • gemini-3-pro-image-preview

    Mô hình tạo và chỉnh sửa hình ảnh tiên tiến.

  • gemini-3-pro-preview

    Mô hình thông minh nhất của chúng tôi với khả năng suy luận và hiểu đa phương thức tiên tiến, cùng các tính năng tác nhân và lập trình theo cảm hứng mạnh mẽ.

  • gemini-3.1-pro-preview

    Mô hình suy luận SOTA mới nhất của chúng tôi với độ sâu và sắc thái chưa từng có, cùng khả năng hiểu đa phương thức và lập trình mạnh mẽ.

  • gemini-3.1-flash-image-preview

    Trí tuệ thị giác cấp chuyên nghiệp với hiệu suất tốc độ cao và khả năng tạo nội dung dựa trên thực tế.

  • gemini-3.1-flash-lite-preview

    Mô hình tiết kiệm chi phí nhất của chúng tôi, được tối ưu hoá cho các tác vụ có số lượng lớn, bản dịch và xử lý dữ liệu đơn giản.

  • gemini-3.1-flash-tts-preview

    TTS Gemini 3.1 Flash: Tạo lời nói mạnh mẽ với độ trễ thấp. Tận hưởng đầu ra tự nhiên, câu lệnh có thể điều hướng và thẻ âm thanh biểu cảm mới để kiểm soát chính xác lời tường thuật.

  • lyria-3-clip-preview

    Mô hình tạo nhạc có độ trễ thấp, được tối ưu hoá cho các đoạn âm thanh có độ trung thực cao và khả năng kiểm soát nhịp điệu chính xác.

  • lyria-3-pro-preview

    Mô hình tạo sinh tiên tiến, tạo toàn bộ bài hát của chúng tôi có khả năng hiểu biết sâu sắc về bố cục, được tối ưu hoá để kiểm soát cấu trúc chính xác và chuyển đổi phức tạp giữa nhiều phong cách âm nhạc.

Mô hình sẽ hoàn thành câu lệnh của bạn.\n\nHãy xem [các mô hình](https://ai.google.dev/gemini-api/docs/models) để biết thêm thông tin chi tiết.

agent AgentOption  (không bắt buộc)

Tên của "Nhân viên hỗ trợ" được dùng để tạo lượt tương tác.
Bắt buộc nếu bạn không cung cấp "model".

Các giá trị có thể có:

  • deep-research-pro-preview-12-2025

    Tác nhân Deep Research của Gemini

  • deep-research-preview-04-2026

    Tác nhân Deep Research của Gemini

  • deep-research-max-preview-04-2026

    Tác nhân Deep Research Max của Gemini

Tác nhân để tương tác.

input Content hoặc mảng (Content) hoặc mảng (Step) hoặc chuỗi  (bắt buộc)

Đầu vào cho hoạt động tương tác (áp dụng chung cho cả Mô hình và Agent).

system_instruction string  (không bắt buộc)

Hướng dẫn của hệ thống cho lượt tương tác.

tools mảng (Tool)  (không bắt buộc)

Danh sách các khai báo công cụ mà mô hình có thể gọi trong quá trình tương tác.

response_format ResponseFormat hoặc ResponseFormatList  (không bắt buộc)

Buộc phản hồi được tạo phải là một đối tượng JSON tuân thủ giản đồ JSON được chỉ định trong trường này.

response_mime_type string  (không bắt buộc)

Loại MIME của phản hồi. Bạn phải cung cấp thông tin này nếu đã đặt response_format.

stream boolean  (không bắt buộc)

Chỉ có đầu vào. Liệu hoạt động tương tác có được phát trực tiếp hay không.

store boolean  (không bắt buộc)

Chỉ có đầu vào. Có lưu trữ phản hồi và yêu cầu để truy xuất sau này hay không.

background boolean  (không bắt buộc)

Chỉ có đầu vào. Có chạy hoạt động tương tác mô hình ở chế độ nền hay không.

generation_config GenerationConfig  (không bắt buộc)

Cấu hình mô hình
Các thông số cấu hình cho hoạt động tương tác của mô hình.
Phương án thay thế cho "agent_config". Chỉ áp dụng khi bạn đặt "model".

Tham số cấu hình cho các lượt tương tác với mô hình.

Trường

temperature number  (không bắt buộc)

Kiểm soát tính ngẫu nhiên của đầu ra.

top_p number  (không bắt buộc)

Xác suất tích luỹ tối đa của các mã thông báo cần xem xét khi lấy mẫu.

seed integer  (không bắt buộc)

Dữ liệu gốc được dùng trong quá trình giải mã để có thể tái tạo.

stop_sequences mảng (chuỗi)  (không bắt buộc)

Danh sách các chuỗi ký tự sẽ dừng hoạt động tương tác đầu ra.

thinking_level ThinkingLevel  (không bắt buộc)

Mức độ của các mã thông báo suy nghĩ mà mô hình sẽ tạo.

Các giá trị có thể có:

  • minimal
  • low
  • medium
  • high

thinking_summaries ThinkingSummaries  (không bắt buộc)

Có nên đưa bản tóm tắt suy nghĩ vào câu trả lời hay không.

Các giá trị có thể có:

  • auto
  • none

max_output_tokens số nguyên  (không bắt buộc)

Số lượng mã thông báo tối đa cần đưa vào phản hồi.

speech_config SpeechConfig  (không bắt buộc)

Cấu hình cho hoạt động tương tác bằng lời nói.

Cấu hình cho hoạt động tương tác bằng lời nói.

Trường

voice string  (không bắt buộc)

Giọng nói của người nói.

language string  (không bắt buộc)

Ngôn ngữ của lời nói.

speaker string  (không bắt buộc)

Tên của người nói, tên này phải khớp với tên người nói trong câu lệnh.

image_config ImageConfig  (không bắt buộc)

Cấu hình cho hoạt động tương tác với hình ảnh.

Cấu hình cho hoạt động tương tác với hình ảnh.

Trường

aspect_ratio enum (string)  (không bắt buộc)

Không có mô tả nào được cung cấp.

Các giá trị có thể có:

  • 1:1
  • 2:3
  • 3:2
  • 3:4
  • 4:3
  • 4:5
  • 5:4
  • 9:16
  • 16:9
  • 21:9
  • 1:8
  • 8:1
  • 1:4
  • 4:1
image_size enum (string)  (không bắt buộc)

Không có mô tả nào được cung cấp.

Các giá trị có thể có:

  • 1K
  • 2K
  • 4K
  • 512
tool_choice ToolChoiceConfig hoặc ToolChoiceType  (không bắt buộc)

Cấu hình lựa chọn công cụ.

agent_config object  (không bắt buộc)

Cấu hình tác nhân
Cấu hình cho tác nhân.
Phương án thay thế cho "generation_config". Chỉ áp dụng khi bạn đặt "agent".

Các loại có thể có

Bộ phân biệt đa hình: type

DynamicAgentConfig

Cấu hình cho các tác nhân động.

type object  (bắt buộc)

Không có mô tả nào được cung cấp.

Luôn đặt thành "dynamic".

DeepResearchAgentConfig

Cấu hình cho tác nhân Deep Research.

type object  (bắt buộc)

Không có mô tả nào được cung cấp.

Luôn đặt thành "deep-research".

thinking_summaries ThinkingSummaries  (không bắt buộc)

Có nên đưa bản tóm tắt suy nghĩ vào câu trả lời hay không.

Các giá trị có thể có:

  • auto
  • none

visualization enum (string)  (không bắt buộc)

Có nên đưa hình ảnh trực quan vào câu trả lời hay không.

Các giá trị có thể có:

  • off
  • auto
collaborative_planning boolean  (không bắt buộc)

Cho phép lập kế hoạch có sự tham gia của con người cho tác nhân Deep Research. Nếu được đặt thành true, tác nhân Deep Research sẽ cung cấp một kế hoạch nghiên cứu trong phản hồi của mình. Sau đó, tác nhân sẽ chỉ tiếp tục nếu người dùng xác nhận kế hoạch ở lượt tiếp theo.

previous_interaction_id string  (không bắt buộc)

Mã của lượt tương tác trước đó (nếu có).

response_modalities ResponseModality  (không bắt buộc)

Các phương thức phản hồi được yêu cầu (VĂN BẢN, HÌNH ẢNH, ÂM THANH).

Các giá trị có thể có:

  • text
  • image
  • audio
  • video
  • document

service_tier ServiceTier  (không bắt buộc)

Cấp dịch vụ cho lượt tương tác.

Các giá trị có thể có:

  • flex
  • standard
  • priority

webhook_config WebhookConfig  (không bắt buộc)

Không bắt buộc. Cấu hình Webhook để nhận thông báo khi quá trình tương tác hoàn tất.

Thông báo để định cấu hình các sự kiện webhook cho một yêu cầu.

Trường

uris array (string)  (không bắt buộc)

Không bắt buộc. Nếu được đặt, các URI webhook này sẽ được dùng cho các sự kiện webhook thay vì các webhook đã đăng ký.

user_metadata object  (không bắt buộc)

Không bắt buộc. Siêu dữ liệu người dùng sẽ được trả về trên mỗi lần phát sự kiện cho webhook.

Phản hồi

Trả về tài nguyên Tương tác.

Yêu cầu đơn giản

Ví dụ về phản hồi

{
  "created": "2025-11-26T12:25:15Z",
  "id": "v1_ChdPU0F4YWFtNkFwS2kxZThQZ05lbXdROBIXT1NBeGFhbTZBcEtpMWU4UGdOZW13UTg",
  "model": "gemini-3-flash-preview",
  "object": "interaction",
  "steps": [
    {
      "type": "model_output",
      "content": [
        {
          "type": "text",
          "text": "Hello! I'm functioning perfectly and ready to assist you.\n\nHow are you doing today?"
        }
      ]
    }
  ],
  "status": "completed",
  "updated": "2025-11-26T12:25:15Z",
  "usage": {
    "input_tokens_by_modality": [
      {
        "modality": "text",
        "tokens": 7
      }
    ],
    "total_cached_tokens": 0,
    "total_input_tokens": 7,
    "total_output_tokens": 20,
    "total_thought_tokens": 22,
    "total_tokens": 49,
    "total_tool_use_tokens": 0
  }
}

Nhiều lượt

Ví dụ về phản hồi

{
  "id": "v1_ChdPU0F4YWFtNkFwS2kxZThQZ05lbXdROBIXT1NBeGFhbTZBcEtpMWU4UGdOZW13UTg",
  "model": "gemini-3-flash-preview",
  "status": "completed",
  "object": "interaction",
  "created": "2025-11-26T12:22:47Z",
  "updated": "2025-11-26T12:22:47Z",
  "steps": [
    {
      "type": "model_output",
      "content": [
        {
          "type": "text",
          "text": "The capital of France is Paris."
        }
      ]
    }
  ],
  "usage": {
    "input_tokens_by_modality": [
      {
        "modality": "text",
        "tokens": 50
      }
    ],
    "total_cached_tokens": 0,
    "total_input_tokens": 50,
    "total_output_tokens": 10,
    "total_thought_tokens": 0,
    "total_tokens": 60,
    "total_tool_use_tokens": 0
  }
}

Đầu vào hình ảnh

Ví dụ về phản hồi

{
  "id": "v1_ChdPU0F4YWFtNkFwS2kxZThQZ05lbXdROBIXT1NBeGFhbTZBcEtpMWU4UGdOZW13UTg",
  "model": "gemini-3-flash-preview",
  "status": "completed",
  "object": "interaction",
  "created": "2025-11-26T12:22:47Z",
  "updated": "2025-11-26T12:22:47Z",
  "steps": [
    {
      "type": "model_output",
      "content": [
        {
          "type": "text",
          "text": "A white humanoid robot with glowing blue eyes stands holding a red skateboard."
        }
      ]
    }
  ],
  "usage": {
    "input_tokens_by_modality": [
      {
        "modality": "text",
        "tokens": 10
      },
      {
        "modality": "image",
        "tokens": 258
      }
    ],
    "total_cached_tokens": 0,
    "total_input_tokens": 268,
    "total_output_tokens": 20,
    "total_thought_tokens": 0,
    "total_tokens": 288,
    "total_tool_use_tokens": 0
  }
}

Gọi hàm

Ví dụ về phản hồi

{
  "id": "v1_ChdPU0F4YWFtNkFwS2kxZThQZ05lbXdROBIXT1NBeGFhbTZBcEtpMWU4UGdOZW13UTg",
  "model": "gemini-3-flash-preview",
  "status": "requires_action",
  "object": "interaction",
  "created": "2025-11-26T12:22:47Z",
  "updated": "2025-11-26T12:22:47Z",
  "steps": [
    {
      "type": "function_call",
      "id": "gth23981",
      "name": "get_weather",
      "arguments": {
        "location": "Boston, MA"
      }
    }
  ],
  "usage": {
    "input_tokens_by_modality": [
      {
        "modality": "text",
        "tokens": 100
      }
    ],
    "total_cached_tokens": 0,
    "total_input_tokens": 100,
    "total_output_tokens": 25,
    "total_thought_tokens": 0,
    "total_tokens": 125,
    "total_tool_use_tokens": 50
  }
}

Deep Research

Ví dụ về phản hồi

{
  "id": "v1_ChdPU0F4YWFtNkFwS2kxZThQZ05lbXdROBIXT1NBeGFhbTZBcEtpMWU4UGdOZW13UTg",
  "agent": "deep-research-pro-preview-12-2025",
  "status": "completed",
  "object": "interaction",
  "created": "2025-11-26T12:22:47Z",
  "updated": "2025-11-26T12:22:47Z",
  "steps": [
    {
      "type": "model_output",
      "content": [
        {
          "type": "text",
          "text": "Here is a comprehensive research report on the current state of cancer research..."
        }
      ]
    }
  ],
  "usage": {
    "input_tokens_by_modality": [
      {
        "modality": "text",
        "tokens": 20
      }
    ],
    "total_cached_tokens": 0,
    "total_input_tokens": 20,
    "total_output_tokens": 1000,
    "total_thought_tokens": 500,
    "total_tokens": 1520,
    "total_tool_use_tokens": 0
  }
}

Truy xuất một lượt tương tác

get https://generativelanguage.googleapis.com/v1beta/interactions/{id}

Truy xuất thông tin chi tiết đầy đủ về một lượt tương tác dựa trên `Interaction.id`.

Tham số đường dẫn / truy vấn

id string  (bắt buộc)

Giá trị nhận dạng duy nhất của lượt tương tác cần truy xuất.

stream boolean  (không bắt buộc)

Nếu bạn đặt chính sách này thành true, thì nội dung được tạo sẽ được truyền trực tuyến theo gia số.

Mặc định là: False

last_event_id string  (không bắt buộc)

Không bắt buộc. Nếu được đặt, sẽ tiếp tục luồng tương tác từ đoạn tiếp theo sau sự kiện được đánh dấu bằng mã sự kiện. Chỉ có thể dùng nếu `stream` là true.

include_input boolean  (không bắt buộc)

Nếu được đặt thành true, thì sẽ thêm dữ liệu đầu vào vào phản hồi.

Mặc định là: False

api_version string  (không bắt buộc)

Nên dùng phiên bản API nào.

Phản hồi

Trả về tài nguyên Tương tác.

Nhận lượt tương tác

Ví dụ về phản hồi

{
  "id": "v1_ChdPU0F4YWFtNkFwS2kxZThQZ05lbXdROBIXT1NBeGFhbTZBcEtpMWU4UGdOZW13UTg",
  "model": "gemini-3-flash-preview",
  "status": "completed",
  "object": "interaction",
  "created": "2025-11-26T12:25:15Z",
  "updated": "2025-11-26T12:25:15Z",
  "steps": [
    {
      "type": "model_output",
      "content": [
        {
          "type": "text",
          "text": "I'm doing great, thank you for asking! How can I help you today?"
        }
      ]
    }
  ]
}

Xoá một lượt tương tác

delete https://generativelanguage.googleapis.com/v1beta/interactions/{id}

Xoá lượt tương tác theo mã nhận dạng.

Tham số đường dẫn / truy vấn

id string  (bắt buộc)

Giá trị nhận dạng riêng biệt của lượt tương tác cần xoá.

api_version string  (không bắt buộc)

Nên dùng phiên bản API nào.

Phản hồi

Nếu thành công, phản hồi sẽ trống.

Xoá lượt tương tác

Huỷ một lượt tương tác

post https://generativelanguage.googleapis.com/v1beta/interactions/{id}/cancel

Huỷ một lượt tương tác theo mã nhận dạng. Điều này chỉ áp dụng cho những hoạt động tương tác ở chế độ nền vẫn đang chạy.

Tham số đường dẫn / truy vấn

id string  (bắt buộc)

Giá trị nhận dạng riêng biệt của thao tác cần huỷ.

api_version string  (không bắt buộc)

Nên dùng phiên bản API nào.

Phản hồi

Trả về tài nguyên Tương tác.

Huỷ lượt tương tác

Ví dụ về phản hồi

{
  "id": "v1_ChdPU0F4YWFtNkFwS2kxZThQZ05lbXdROBIXT1NBeGFhbTZBcEtpMWU4UGdOZW13UTg",
  "agent": "deep-research-pro-preview-12-2025",
  "status": "cancelled",
  "object": "interaction",
  "created": "2025-11-26T12:25:15Z",
  "updated": "2025-11-26T12:25:15Z"
}

Tài nguyên

Tương tác

Tài nguyên Interaction.

Trường

model ModelOption  (không bắt buộc)

Tên của "Mô hình" dùng để tạo lượt tương tác.

Các giá trị có thể có:

  • gemini-2.5-computer-use-preview-10-2025

    Một mô hình dựa trên khả năng của tác nhân được thiết kế để tương tác trực tiếp với giao diện, cho phép Gemini nhận biết và điều hướng các môi trường kỹ thuật số.

  • gemini-2.5-flash

    Mô hình suy luận kết hợp đầu tiên của chúng tôi hỗ trợ cửa sổ ngữ cảnh 1 triệu token và có ngân sách tư duy.

  • gemini-2.5-flash-image

    Mô hình tạo hình ảnh gốc của chúng tôi, được tối ưu hoá về tốc độ, tính linh hoạt và khả năng hiểu ngữ cảnh. Giá của văn bản đầu vào và đầu ra giống như giá của 2,5 Flash.

  • gemini-2.5-flash-lite

    Đây là mô hình nhỏ nhất và tiết kiệm chi phí nhất của chúng tôi, được xây dựng để sử dụng ở quy mô lớn.

  • gemini-2.5-flash-lite-preview-09-2025

    Mô hình mới nhất dựa trên Gemini 2.5 Flash lite được tối ưu hoá để tiết kiệm chi phí, có thông lượng cao và chất lượng cao.

  • gemini-2.5-flash-native-audio-preview-12-2025

    Các mô hình âm thanh gốc của chúng tôi được tối ưu hoá để mang đến đầu ra âm thanh chất lượng cao hơn với nhịp điệu, giọng nói tự nhiên, mức độ chi tiết và tâm trạng tốt hơn.

  • gemini-2.5-flash-preview-09-2025

    Mô hình mới nhất dựa trên mô hình 2.5 Flash. 2.5 Flash Preview phù hợp nhất với các tác vụ xử lý quy mô lớn, độ trễ thấp, khối lượng lớn đòi hỏi khả năng tư duy và các trường hợp sử dụng có tác nhân.

  • gemini-2.5-flash-preview-tts

    Mô hình chuyển văn bản sang lời nói 2.5 Flash được tối ưu hoá để tạo lời nói mạnh mẽ, có độ trễ thấp và có thể kiểm soát.

  • gemini-2.5-pro

    Mô hình đa năng tiên tiến của chúng tôi, vượt trội trong việc xử lý các nhiệm vụ lập trình và suy luận phức tạp.

  • gemini-2.5-pro-preview-tts

    Mô hình âm thanh chuyển văn bản sang lời nói 2.5 Pro của chúng tôi được tối ưu hoá để tạo lời nói mạnh mẽ với độ trễ thấp, giúp tạo ra kết quả tự nhiên hơn và dễ dàng điều hướng các câu lệnh.

  • gemini-3-flash-preview

    Mô hình thông minh nhất của chúng tôi được tối ưu hoá về tốc độ, kết hợp trí thông minh đột phá với khả năng tìm kiếm và tiếp thu thông tin vượt trội.

  • gemini-3-pro-image-preview

    Mô hình tạo và chỉnh sửa hình ảnh tiên tiến.

  • gemini-3-pro-preview

    Mô hình thông minh nhất của chúng tôi với khả năng suy luận và hiểu đa phương thức tiên tiến, cùng các tính năng tác nhân và lập trình theo cảm hứng mạnh mẽ.

  • gemini-3.1-pro-preview

    Mô hình suy luận SOTA mới nhất của chúng tôi với độ sâu và sắc thái chưa từng có, cùng khả năng hiểu đa phương thức và lập trình mạnh mẽ.

  • gemini-3.1-flash-image-preview

    Trí tuệ thị giác cấp chuyên nghiệp với hiệu suất tốc độ cao và khả năng tạo nội dung dựa trên thực tế.

  • gemini-3.1-flash-lite-preview

    Mô hình tiết kiệm chi phí nhất của chúng tôi, được tối ưu hoá cho các tác vụ có số lượng lớn, bản dịch và xử lý dữ liệu đơn giản.

  • gemini-3.1-flash-tts-preview

    TTS Gemini 3.1 Flash: Tạo lời nói mạnh mẽ với độ trễ thấp. Tận hưởng đầu ra tự nhiên, câu lệnh có thể điều hướng và thẻ âm thanh biểu cảm mới để kiểm soát chính xác lời tường thuật.

  • lyria-3-clip-preview

    Mô hình tạo nhạc có độ trễ thấp, được tối ưu hoá cho các đoạn âm thanh có độ trung thực cao và khả năng kiểm soát nhịp điệu chính xác.

  • lyria-3-pro-preview

    Mô hình tạo sinh tiên tiến, tạo toàn bộ bài hát của chúng tôi có khả năng hiểu biết sâu sắc về bố cục, được tối ưu hoá để kiểm soát cấu trúc chính xác và chuyển đổi phức tạp giữa nhiều phong cách âm nhạc.

Mô hình sẽ hoàn thành câu lệnh của bạn.\n\nHãy xem [các mô hình](https://ai.google.dev/gemini-api/docs/models) để biết thêm thông tin chi tiết.

agent AgentOption  (không bắt buộc)

Tên của "Nhân viên hỗ trợ" được dùng để tạo lượt tương tác.

Các giá trị có thể có:

  • deep-research-pro-preview-12-2025

    Tác nhân Deep Research của Gemini

  • deep-research-preview-04-2026

    Tác nhân Deep Research của Gemini

  • deep-research-max-preview-04-2026

    Tác nhân Deep Research Max của Gemini

Tác nhân để tương tác.

id string  (không bắt buộc)

Bắt buộc. Chỉ có đầu ra. Giá trị nhận dạng riêng biệt cho lượt hoàn tất tương tác.

status enum (string)  (không bắt buộc)

Bắt buộc. Chỉ có đầu ra. Trạng thái của lượt tương tác.

Các giá trị có thể có:

  • in_progress
  • requires_action
  • completed
  • failed
  • cancelled
  • incomplete
created string  (không bắt buộc)

Bắt buộc. Chỉ có đầu ra. Thời gian tạo phản hồi ở định dạng ISO 8601 (YYYY-MM-DDThh:mm:ssZ).

updated string  (không bắt buộc)

Bắt buộc. Chỉ có đầu ra. Thời gian cập nhật phản hồi gần đây nhất ở định dạng ISO 8601 (YYYY-MM-DDThh:mm:ssZ).

role string  (không bắt buộc)

Chỉ có đầu ra. Vai trò của lượt tương tác.

system_instruction string  (không bắt buộc)

Hướng dẫn của hệ thống cho lượt tương tác.

tools mảng (Tool)  (không bắt buộc)

Danh sách các khai báo công cụ mà mô hình có thể gọi trong quá trình tương tác.

usage Usage  (không bắt buộc)

Chỉ có đầu ra. Số liệu thống kê về việc sử dụng mã thông báo của yêu cầu tương tác.

Số liệu thống kê về việc sử dụng mã thông báo của yêu cầu tương tác.

Trường

total_input_tokens số nguyên  (không bắt buộc)

Số lượng mã thông báo trong câu lệnh (ngữ cảnh).

input_tokens_by_modality ModalityTokens  (không bắt buộc)

Thông tin chi tiết về mức sử dụng mã thông báo đầu vào theo phương thức.

Số lượng mã thông báo cho một phương thức phản hồi duy nhất.

Trường

phương thức ResponseModality  (không bắt buộc)

Phương thức liên kết với số lượng mã thông báo.

Các giá trị có thể có:

  • text
  • image
  • audio
  • video
  • document

tokens integer  (không bắt buộc)

Số lượng mã thông báo cho phương thức.

total_cached_tokens integer  (không bắt buộc)

Số lượng mã thông báo trong phần được lưu vào bộ nhớ đệm của câu lệnh (nội dung được lưu vào bộ nhớ đệm).

cached_tokens_by_modality ModalityTokens  (không bắt buộc)

Bảng chi tiết về việc sử dụng mã thông báo được lưu vào bộ nhớ đệm theo phương thức.

Số lượng mã thông báo cho một phương thức phản hồi duy nhất.

Trường

phương thức ResponseModality  (không bắt buộc)

Phương thức liên kết với số lượng mã thông báo.

Các giá trị có thể có:

  • text
  • image
  • audio
  • video
  • document

tokens integer  (không bắt buộc)

Số lượng mã thông báo cho phương thức.

total_output_tokens integer  (không bắt buộc)

Tổng số mã thông báo trong tất cả các câu trả lời được tạo.

output_tokens_by_modality ModalityTokens  (không bắt buộc)

Thông tin chi tiết về việc sử dụng mã thông báo đầu ra theo phương thức.

Số lượng mã thông báo cho một phương thức phản hồi duy nhất.

Trường

phương thức ResponseModality  (không bắt buộc)

Phương thức liên kết với số lượng mã thông báo.

Các giá trị có thể có:

  • text
  • image
  • audio
  • video
  • document

tokens integer  (không bắt buộc)

Số lượng mã thông báo cho phương thức.

total_tool_use_tokens integer  (không bắt buộc)

Số lượng mã thông báo có trong(các) câu lệnh sử dụng công cụ.

tool_use_tokens_by_modality ModalityTokens  (không bắt buộc)

Bảng chi tiết về việc sử dụng mã thông báo sử dụng công cụ theo phương thức.

Số lượng mã thông báo cho một phương thức phản hồi duy nhất.

Trường

phương thức ResponseModality  (không bắt buộc)

Phương thức liên kết với số lượng mã thông báo.

Các giá trị có thể có:

  • text
  • image
  • audio
  • video
  • document

tokens integer  (không bắt buộc)

Số lượng mã thông báo cho phương thức.

total_thought_tokens integer  (không bắt buộc)

Số lượng mã thông báo về suy nghĩ đối với mô hình tư duy.

total_tokens integer  (không bắt buộc)

Tổng số mã thông báo cho yêu cầu tương tác (lời nhắc + câu trả lời + các mã thông báo nội bộ khác).

grounding_tool_count GroundingToolCount  (không bắt buộc)

Số lượng công cụ tiếp đất.

Số lượng công cụ tiếp đất.

Trường

type enum (string)  (không bắt buộc)

Loại công cụ cơ sở liên kết với số lượng.

Các giá trị có thể có:

  • google_search
  • google_maps
  • retrieval
count integer  (không bắt buộc)

Số lượng công cụ tiếp đất.

response_modalities ResponseModality  (không bắt buộc)

Các phương thức phản hồi được yêu cầu (VĂN BẢN, HÌNH ẢNH, ÂM THANH).

Các giá trị có thể có:

  • text
  • image
  • audio
  • video
  • document

response_mime_type string  (không bắt buộc)

Loại MIME của phản hồi. Bạn phải cung cấp thông tin này nếu đã đặt response_format.

previous_interaction_id string  (không bắt buộc)

Mã của lượt tương tác trước đó (nếu có).

service_tier ServiceTier  (không bắt buộc)

Cấp dịch vụ cho lượt tương tác.

Các giá trị có thể có:

  • flex
  • standard
  • priority

webhook_config WebhookConfig  (không bắt buộc)

Không bắt buộc. Cấu hình Webhook để nhận thông báo khi quá trình tương tác hoàn tất.

Thông báo để định cấu hình các sự kiện webhook cho một yêu cầu.

Trường

uris array (string)  (không bắt buộc)

Không bắt buộc. Nếu được đặt, các URI webhook này sẽ được dùng cho các sự kiện webhook thay vì các webhook đã đăng ký.

user_metadata object  (không bắt buộc)

Không bắt buộc. Siêu dữ liệu người dùng sẽ được trả về trên mỗi lần phát sự kiện cho webhook.

steps Step  (không bắt buộc)

Chỉ có đầu ra. Các bước tạo nên hoạt động tương tác.

Một bước trong lượt tương tác.

Các loại có thể có

Bộ phân biệt đa hình: type

UserInputStep

Thông tin đầu vào do người dùng cung cấp.

type object  (bắt buộc)

Không có mô tả nào được cung cấp.

Luôn đặt thành "user_input".

content mảng (Nội dung)  (không bắt buộc)

Không có mô tả nào được cung cấp.

ModelOutputStep

Đầu ra do mô hình tạo.

type object  (bắt buộc)

Không có mô tả nào được cung cấp.

Luôn đặt thành "model_output".

content mảng (Nội dung)  (không bắt buộc)

Không có mô tả nào được cung cấp.

ThoughtStep

Một bước tư duy.

type object  (bắt buộc)

Không có mô tả nào được cung cấp.

Luôn đặt thành "thought".

chữ ký chuỗi  (không bắt buộc)

Một hàm băm chữ ký để xác thực phụ trợ.

summary ThoughtSummaryContent  (không bắt buộc)

Tóm tắt suy nghĩ.

Các loại có thể có

Bộ phân biệt đa hình: type

TextContent

Một khối nội dung văn bản.

type object  (bắt buộc)

Không có mô tả nào được cung cấp.

Luôn đặt thành "text".

text string  (bắt buộc)

Bắt buộc. Nội dung văn bản.

annotations Chú thích  (không bắt buộc)

Thông tin trích dẫn cho nội dung do mô hình tạo.

Thông tin trích dẫn cho nội dung do mô hình tạo.

Các loại có thể có

Bộ phân biệt đa hình: type

UrlCitation

Chú thích trích dẫn URL.

type object  (bắt buộc)

Không có mô tả nào được cung cấp.

Luôn đặt thành "url_citation".

url string  (không bắt buộc)

URL.

title string  (không bắt buộc)

Tiêu đề của URL.

start_index integer  (không bắt buộc)

Điểm bắt đầu của đoạn phản hồi được phân bổ cho nguồn này. Chỉ mục cho biết điểm bắt đầu của đoạn, được đo bằng byte.

end_index integer  (không bắt buộc)

Kết thúc phân đoạn được phân bổ, không bao gồm.

FileCitation

Chú thích trích dẫn tệp.

type object  (bắt buộc)

Không có mô tả nào được cung cấp.

Luôn đặt thành "file_citation".

document_uri string  (không bắt buộc)

URI của tệp.

file_name string  (không bắt buộc)

Tên của tệp.

source string  (không bắt buộc)

Nguồn được phân bổ cho một phần văn bản.

custom_metadata object  (không bắt buộc)

Siêu dữ liệu do người dùng cung cấp về ngữ cảnh đã truy xuất.

page_number số nguyên  (không bắt buộc)

Số trang của tài liệu được trích dẫn (nếu có).

media_id string  (không bắt buộc)

Mã nhận dạng nội dung nghe nhìn trong trường hợp trích dẫn hình ảnh (nếu có).

start_index integer  (không bắt buộc)

Điểm bắt đầu của đoạn phản hồi được phân bổ cho nguồn này. Chỉ mục cho biết điểm bắt đầu của đoạn, được đo bằng byte.

end_index integer  (không bắt buộc)

Kết thúc phân đoạn được phân bổ, không bao gồm.

PlaceCitation

Chú thích trích dẫn địa điểm.

type object  (bắt buộc)

Không có mô tả nào được cung cấp.

Luôn đặt thành "place_citation".

place_id string  (không bắt buộc)

Mã nhận dạng của địa điểm, ở định dạng "places/{place_id}".

name string  (không bắt buộc)

Tên của địa điểm.

url string  (không bắt buộc)

URI tham chiếu của địa điểm.

review_snippets ReviewSnippet  (không bắt buộc)

Đoạn trích trong bài đánh giá được dùng để tạo câu trả lời về các tính năng của một địa điểm cụ thể trên Google Maps.

Đóng gói một đoạn trích của bài đánh giá người dùng để trả lời một câu hỏi về các tính năng của một địa điểm cụ thể trong Google Maps.

Trường

title string  (không bắt buộc)

Tiêu đề của bài đánh giá.

url string  (không bắt buộc)

Đường liên kết tương ứng với bài đánh giá của người dùng trên Google Maps.

review_id string  (không bắt buộc)

Mã của đoạn trích thông tin đánh giá.

start_index integer  (không bắt buộc)

Điểm bắt đầu của đoạn phản hồi được phân bổ cho nguồn này. Chỉ mục cho biết điểm bắt đầu của đoạn, được đo bằng byte.

end_index integer  (không bắt buộc)

Kết thúc phân đoạn được phân bổ, không bao gồm.

ImageContent

Một khối nội dung hình ảnh.

type object  (bắt buộc)

Không có mô tả nào được cung cấp.

Luôn đặt thành "image".

data string  (không bắt buộc)

Nội dung hình ảnh.

uri string  (không bắt buộc)

URI của hình ảnh.

mime_type enum (string)  (không bắt buộc)

Loại MIME của hình ảnh.

Các giá trị có thể có:

  • image/png
  • image/jpeg
  • image/webp
  • image/heic
  • image/heif
  • image/gif
  • image/bmp
  • image/tiff
resolution MediaResolution  (không bắt buộc)

Độ phân giải của nội dung nghe nhìn.

Các giá trị có thể có:

  • low
  • medium
  • high
  • ultra_high

FunctionCallStep

Một bước gọi công cụ hàm.

type object  (bắt buộc)

Không có mô tả nào được cung cấp.

Luôn đặt thành "function_call".

name string  (bắt buộc)

Bắt buộc. Tên của công cụ cần gọi.

arguments object  (bắt buộc)

Bắt buộc. Các đối số cần truyền vào hàm.

id string  (bắt buộc)

Bắt buộc. Mã nhận dạng duy nhất cho lệnh gọi công cụ cụ thể này.

chữ ký chuỗi  (không bắt buộc)

Một hàm băm chữ ký để xác thực phụ trợ.

CodeExecutionCallStep

Bước gọi thực thi mã.

type object  (bắt buộc)

Không có mô tả nào được cung cấp.

Luôn đặt thành "code_execution_call".

arguments CodeExecutionCallStepArguments  (bắt buộc)

Bắt buộc. Các đối số cần truyền đến quá trình thực thi mã.

Các đối số cần truyền đến quá trình thực thi mã.

Trường

language enum (string)  (không bắt buộc)

Ngôn ngữ lập trình của "code".

Các giá trị có thể có:

  • python
code string  (không bắt buộc)

Mã cần thực thi.

id string  (bắt buộc)

Bắt buộc. Mã nhận dạng duy nhất cho lệnh gọi công cụ cụ thể này.

chữ ký chuỗi  (không bắt buộc)

Một hàm băm chữ ký để xác thực phụ trợ.

UrlContextCallStep

Bước gọi ngữ cảnh URL.

type object  (bắt buộc)

Không có mô tả nào được cung cấp.

Luôn đặt thành "url_context_call".

arguments UrlContextCallStepArguments  (bắt buộc)

Bắt buộc. Các đối số cần chuyển đến ngữ cảnh URL.

Các đối số cần chuyển đến ngữ cảnh URL.

Trường

urls mảng (chuỗi)  (không bắt buộc)

Các URL cần tìm nạp.

id string  (bắt buộc)

Bắt buộc. Mã nhận dạng duy nhất cho lệnh gọi công cụ cụ thể này.

chữ ký chuỗi  (không bắt buộc)

Một hàm băm chữ ký để xác thực phụ trợ.

McpServerToolCallStep

Bước gọi công cụ MCPServer.

type object  (bắt buộc)

Không có mô tả nào được cung cấp.

Luôn đặt thành "mcp_server_tool_call".

name string  (bắt buộc)

Bắt buộc. Tên của công cụ đã được gọi.

server_name string  (bắt buộc)

Bắt buộc. Tên của máy chủ MCP được dùng.

arguments object  (bắt buộc)

Bắt buộc. Đối tượng JSON của các đối số cho hàm.

id string  (bắt buộc)

Bắt buộc. Mã nhận dạng duy nhất cho lệnh gọi công cụ cụ thể này.

chữ ký chuỗi  (không bắt buộc)

Một hàm băm chữ ký để xác thực phụ trợ.

GoogleSearchCallStep

Bước gọi trên Google Tìm kiếm.

type object  (bắt buộc)

Không có mô tả nào được cung cấp.

Luôn đặt thành "google_search_call".

arguments GoogleSearchCallStepArguments  (bắt buộc)

Bắt buộc. Các đối số cần truyền đến Google Tìm kiếm.

Các đối số cần truyền đến Google Tìm kiếm.

Trường

queries array (string)  (không bắt buộc)

Cụm từ tìm kiếm trên web để tìm kiếm trên web sau đó.

search_type enum (string)  (không bắt buộc)

Loại thông tin cơ sở được bật cho hoạt động tìm kiếm.

Các giá trị có thể có:

  • web_search
  • image_search
  • enterprise_web_search
id string  (bắt buộc)

Bắt buộc. Mã nhận dạng duy nhất cho lệnh gọi công cụ cụ thể này.

chữ ký chuỗi  (không bắt buộc)

Một hàm băm chữ ký để xác thực phụ trợ.

FileSearchCallStep

Bước gọi Tìm kiếm tệp.

type object  (bắt buộc)

Không có mô tả nào được cung cấp.

Luôn đặt thành "file_search_call".

id string  (bắt buộc)

Bắt buộc. Mã nhận dạng duy nhất cho lệnh gọi công cụ cụ thể này.

chữ ký chuỗi  (không bắt buộc)

Một hàm băm chữ ký để xác thực phụ trợ.

GoogleMapsCallStep

Bước gọi qua Google Maps.

type object  (bắt buộc)

Không có mô tả nào được cung cấp.

Luôn đặt thành "google_maps_call".

arguments GoogleMapsCallStepArguments  (không bắt buộc)

Các đối số cần truyền đến công cụ Google Maps.

Các đối số cần truyền đến công cụ Google Maps.

Trường

queries array (string)  (không bắt buộc)

Các truy vấn sẽ được thực thi.

id string  (bắt buộc)

Bắt buộc. Mã nhận dạng duy nhất cho lệnh gọi công cụ cụ thể này.

chữ ký chuỗi  (không bắt buộc)

Một hàm băm chữ ký để xác thực phụ trợ.

FunctionResultStep

Kết quả của một lệnh gọi công cụ hàm.

type object  (bắt buộc)

Không có mô tả nào được cung cấp.

Luôn đặt thành "function_result".

name string  (không bắt buộc)

Tên của công cụ đã được gọi.

is_error boolean  (không bắt buộc)

Liệu lệnh gọi công cụ có dẫn đến lỗi hay không.

call_id string  (bắt buộc)

Bắt buộc. Mã nhận dạng khớp với mã nhận dạng trong khối lệnh gọi hàm.

chữ ký chuỗi  (không bắt buộc)

Một hàm băm chữ ký để xác thực phụ trợ.

result array (FunctionResultSubcontent) hoặc string  (bắt buộc)

Kết quả của lệnh gọi công cụ.

CodeExecutionResultStep

Bước kết quả thực thi mã.

type object  (bắt buộc)

Không có mô tả nào được cung cấp.

Luôn đặt thành "code_execution_result".

result string  (bắt buộc)

Bắt buộc. Kết quả của quá trình thực thi mã.

is_error boolean  (không bắt buộc)

Liệu quá trình thực thi mã có dẫn đến lỗi hay không.

call_id string  (bắt buộc)

Bắt buộc. Mã nhận dạng khớp với mã nhận dạng trong khối lệnh gọi hàm.

chữ ký chuỗi  (không bắt buộc)

Một hàm băm chữ ký để xác thực phụ trợ.

UrlContextResultStep

Bước kết quả theo bối cảnh URL.

type object  (bắt buộc)

Không có mô tả nào được cung cấp.

Luôn đặt thành "url_context_result".

result UrlContextResultItem  (bắt buộc)

Bắt buộc. Kết quả của bối cảnh URL.

Kết quả của ngữ cảnh URL.

Trường

url string  (không bắt buộc)

URL đã được tìm nạp.

status enum (string)  (không bắt buộc)

Trạng thái truy xuất URL.

Các giá trị có thể có:

  • success
  • error
  • paywall
  • unsafe
is_error boolean  (không bắt buộc)

Liệu bối cảnh URL có gây ra lỗi hay không.

call_id string  (bắt buộc)

Bắt buộc. Mã nhận dạng khớp với mã nhận dạng trong khối lệnh gọi hàm.

chữ ký chuỗi  (không bắt buộc)

Một hàm băm chữ ký để xác thực phụ trợ.

GoogleSearchResultStep

Bước kết quả tìm kiếm trên Google.

type object  (bắt buộc)

Không có mô tả nào được cung cấp.

Luôn đặt thành "google_search_result".

result GoogleSearchResultItem  (bắt buộc)

Bắt buộc. Kết quả của Google Tìm kiếm.

Kết quả của Google Tìm kiếm.

Trường

search_suggestions string  (không bắt buộc)

Đoạn nội dung web có thể được nhúng vào một trang web hoặc webview của ứng dụng.

is_error boolean  (không bắt buộc)

Liệu Google Tìm kiếm có xảy ra lỗi hay không.

call_id string  (bắt buộc)

Bắt buộc. Mã nhận dạng khớp với mã nhận dạng trong khối lệnh gọi hàm.

chữ ký chuỗi  (không bắt buộc)

Một hàm băm chữ ký để xác thực phụ trợ.

McpServerToolResultStep

Bước kết quả của công cụ MCPServer.

type object  (bắt buộc)

Không có mô tả nào được cung cấp.

Luôn đặt thành "mcp_server_tool_result".

name string  (không bắt buộc)

Tên của công cụ được gọi cho lệnh gọi công cụ cụ thể này.

server_name string  (không bắt buộc)

Tên của máy chủ MCP được dùng.

call_id string  (bắt buộc)

Bắt buộc. Mã nhận dạng khớp với mã nhận dạng trong khối lệnh gọi hàm.

chữ ký chuỗi  (không bắt buộc)

Một hàm băm chữ ký để xác thực phụ trợ.

result array (FunctionResultSubcontent) hoặc string  (bắt buộc)

Đầu ra từ lệnh gọi máy chủ MCP. Có thể là văn bản đơn giản hoặc nội dung đa dạng thức.

FileSearchResultStep

Bước Kết quả tìm kiếm tệp.

type object  (bắt buộc)

Không có mô tả nào được cung cấp.

Luôn đặt thành "file_search_result".

call_id string  (bắt buộc)

Bắt buộc. Mã nhận dạng khớp với mã nhận dạng trong khối lệnh gọi hàm.

chữ ký chuỗi  (không bắt buộc)

Một hàm băm chữ ký để xác thực phụ trợ.

GoogleMapsResultStep

Bước kết quả trên Google Maps.

type object  (bắt buộc)

Không có mô tả nào được cung cấp.

Luôn đặt thành "google_maps_result".

result GoogleMapsResultItem  (bắt buộc)

Không có mô tả nào được cung cấp.

Kết quả của Google Maps.

Trường

places GoogleMapsResultPlaces  (không bắt buộc)

Không có mô tả nào được cung cấp.

Trường

place_id string  (không bắt buộc)

Không có mô tả nào được cung cấp.

name string  (không bắt buộc)

Không có mô tả nào được cung cấp.

url string  (không bắt buộc)

Không có mô tả nào được cung cấp.

review_snippets ReviewSnippet  (không bắt buộc)

Không có mô tả nào được cung cấp.

Đóng gói một đoạn trích của bài đánh giá người dùng để trả lời một câu hỏi về các tính năng của một địa điểm cụ thể trong Google Maps.

Trường

title string  (không bắt buộc)

Tiêu đề của bài đánh giá.

url string  (không bắt buộc)

Đường liên kết tương ứng với bài đánh giá của người dùng trên Google Maps.

review_id string  (không bắt buộc)

Mã của đoạn trích thông tin đánh giá.

widget_context_token string  (không bắt buộc)

Không có mô tả nào được cung cấp.

call_id string  (bắt buộc)

Bắt buộc. Mã nhận dạng khớp với mã nhận dạng trong khối lệnh gọi hàm.

chữ ký chuỗi  (không bắt buộc)

Một hàm băm chữ ký để xác thực phụ trợ.

input Nội dung hoặc mảng (Nội dung) hoặc mảng (Bước) hoặc chuỗi  (không bắt buộc)

Đầu vào cho lượt tương tác.

response_format ResponseFormat hoặc ResponseFormatList  (không bắt buộc)

Buộc phản hồi được tạo phải là một đối tượng JSON tuân thủ giản đồ JSON được chỉ định trong trường này.

agent_config object  (không bắt buộc)

Thông số cấu hình cho hoạt động tương tác của nhân viên hỗ trợ.

Các loại có thể có

Bộ phân biệt đa hình: type

DynamicAgentConfig

Cấu hình cho các tác nhân động.

type object  (bắt buộc)

Không có mô tả nào được cung cấp.

Luôn đặt thành "dynamic".

DeepResearchAgentConfig

Cấu hình cho tác nhân Deep Research.

type object  (bắt buộc)

Không có mô tả nào được cung cấp.

Luôn đặt thành "deep-research".

thinking_summaries ThinkingSummaries  (không bắt buộc)

Có nên đưa bản tóm tắt suy nghĩ vào câu trả lời hay không.

Các giá trị có thể có:

  • auto
  • none

visualization enum (string)  (không bắt buộc)

Có nên đưa hình ảnh trực quan vào câu trả lời hay không.

Các giá trị có thể có:

  • off
  • auto
collaborative_planning boolean  (không bắt buộc)

Cho phép lập kế hoạch có sự tham gia của con người cho tác nhân Deep Research. Nếu được đặt thành true, tác nhân Deep Research sẽ cung cấp một kế hoạch nghiên cứu trong phản hồi của mình. Sau đó, tác nhân sẽ chỉ tiếp tục nếu người dùng xác nhận kế hoạch ở lượt tiếp theo.

Ví dụ

Ví dụ:

{
  "created": "2025-12-04T15:01:45Z",
  "id": "v1_ChdXS0l4YWZXTk9xbk0xZThQczhEcmlROBIXV0tJeGFmV05PcW5NMWU4UHM4RHJpUTg",
  "model": "gemini-3-flash-preview",
  "object": "interaction",
  "steps": [
    {
      "type": "model_output",
      "content": [
        {
          "type": "text",
          "text": "Hello! I'm doing well, functioning as expected. Thank you for asking! How are you doing today?"
        }
      ]
    }
  ],
  "status": "completed",
  "updated": "2025-12-04T15:01:45Z",
  "usage": {
    "input_tokens_by_modality": [
      {
        "modality": "text",
        "tokens": 7
      }
    ],
    "total_cached_tokens": 0,
    "total_input_tokens": 7,
    "total_output_tokens": 23,
    "total_thought_tokens": 49,
    "total_tokens": 79,
    "total_tool_use_tokens": 0
  }
}

Mô hình dữ liệu

Nội dung

Nội dung của câu trả lời.

Các loại có thể có

Bộ phân biệt đa hình: type

TextContent

Một khối nội dung văn bản.

type object  (bắt buộc)

Không có mô tả nào được cung cấp.

Luôn đặt thành "text".

text string  (bắt buộc)

Bắt buộc. Nội dung văn bản.

annotations Chú thích  (không bắt buộc)

Thông tin trích dẫn cho nội dung do mô hình tạo.

Thông tin trích dẫn cho nội dung do mô hình tạo.

Các loại có thể có

Bộ phân biệt đa hình: type

UrlCitation

Chú thích trích dẫn URL.

type object  (bắt buộc)

Không có mô tả nào được cung cấp.

Luôn đặt thành "url_citation".

url string  (không bắt buộc)

URL.

title string  (không bắt buộc)

Tiêu đề của URL.

start_index integer  (không bắt buộc)

Điểm bắt đầu của đoạn phản hồi được phân bổ cho nguồn này. Chỉ mục cho biết điểm bắt đầu của đoạn, được đo bằng byte.

end_index integer  (không bắt buộc)

Kết thúc phân đoạn được phân bổ, không bao gồm.

FileCitation

Chú thích trích dẫn tệp.

type object  (bắt buộc)

Không có mô tả nào được cung cấp.

Luôn đặt thành "file_citation".

document_uri string  (không bắt buộc)

URI của tệp.

file_name string  (không bắt buộc)

Tên của tệp.

source string  (không bắt buộc)

Nguồn được phân bổ cho một phần văn bản.

custom_metadata object  (không bắt buộc)

Siêu dữ liệu do người dùng cung cấp về ngữ cảnh đã truy xuất.

page_number số nguyên  (không bắt buộc)

Số trang của tài liệu được trích dẫn (nếu có).

media_id string  (không bắt buộc)

Mã nhận dạng nội dung nghe nhìn trong trường hợp trích dẫn hình ảnh (nếu có).

start_index integer  (không bắt buộc)

Điểm bắt đầu của đoạn phản hồi được phân bổ cho nguồn này. Chỉ mục cho biết điểm bắt đầu của đoạn, được đo bằng byte.

end_index integer  (không bắt buộc)

Kết thúc phân đoạn được phân bổ, không bao gồm.

PlaceCitation

Chú thích trích dẫn địa điểm.

type object  (bắt buộc)

Không có mô tả nào được cung cấp.

Luôn đặt thành "place_citation".

place_id string  (không bắt buộc)

Mã nhận dạng của địa điểm, ở định dạng "places/{place_id}".

name string  (không bắt buộc)

Tên của địa điểm.

url string  (không bắt buộc)

URI tham chiếu của địa điểm.

review_snippets ReviewSnippet  (không bắt buộc)

Đoạn trích trong bài đánh giá được dùng để tạo câu trả lời về các tính năng của một địa điểm cụ thể trên Google Maps.

Đóng gói một đoạn trích của bài đánh giá người dùng để trả lời một câu hỏi về các tính năng của một địa điểm cụ thể trong Google Maps.

Trường

title string  (không bắt buộc)

Tiêu đề của bài đánh giá.

url string  (không bắt buộc)

Đường liên kết tương ứng với bài đánh giá của người dùng trên Google Maps.

review_id string  (không bắt buộc)

Mã của đoạn trích thông tin đánh giá.

start_index integer  (không bắt buộc)

Điểm bắt đầu của đoạn phản hồi được phân bổ cho nguồn này. Chỉ mục cho biết điểm bắt đầu của đoạn, được đo bằng byte.

end_index integer  (không bắt buộc)

Kết thúc phân đoạn được phân bổ, không bao gồm.

ImageContent

Một khối nội dung hình ảnh.

type object  (bắt buộc)

Không có mô tả nào được cung cấp.

Luôn đặt thành "image".

data string  (không bắt buộc)

Nội dung hình ảnh.

uri string  (không bắt buộc)

URI của hình ảnh.

mime_type enum (string)  (không bắt buộc)

Loại MIME của hình ảnh.

Các giá trị có thể có:

  • image/png
  • image/jpeg
  • image/webp
  • image/heic
  • image/heif
  • image/gif
  • image/bmp
  • image/tiff
resolution MediaResolution  (không bắt buộc)

Độ phân giải của nội dung nghe nhìn.

Các giá trị có thể có:

  • low
  • medium
  • high
  • ultra_high

AudioContent

Một khối nội dung âm thanh.

type object  (bắt buộc)

Không có mô tả nào được cung cấp.

Luôn đặt thành "audio".

data string  (không bắt buộc)

Nội dung âm thanh.

uri string  (không bắt buộc)

URI của âm thanh.

mime_type enum (string)  (không bắt buộc)

Loại MIME của âm thanh.

Các giá trị có thể có:

  • audio/wav
  • audio/mp3
  • audio/aiff
  • audio/aac
  • audio/ogg
  • audio/flac
  • audio/mpeg
  • audio/m4a
  • audio/l16
  • audio/opus
  • audio/alaw
  • audio/mulaw
channels số nguyên  (không bắt buộc)

Số lượng kênh âm thanh.

sample_rate integer  (không bắt buộc)

Tốc độ lấy mẫu của âm thanh.

DocumentContent

Một khối nội dung tài liệu.

type object  (bắt buộc)

Không có mô tả nào được cung cấp.

Luôn đặt thành "document".

data string  (không bắt buộc)

Nội dung tài liệu.

uri string  (không bắt buộc)

URI của tài liệu.

mime_type enum (string)  (không bắt buộc)

Loại MIME của tài liệu.

Các giá trị có thể có:

  • application/pdf
VideoContent

Một khối nội dung video.

type object  (bắt buộc)

Không có mô tả nào được cung cấp.

Luôn đặt thành "video".

data string  (không bắt buộc)

Nội dung video.

uri string  (không bắt buộc)

URI của video.

mime_type enum (string)  (không bắt buộc)

Loại MIME của video.

Các giá trị có thể có:

  • video/mp4
  • video/mpeg
  • video/mpg
  • video/mov
  • video/avi
  • video/x-flv
  • video/webm
  • video/wmv
  • video/3gpp
resolution MediaResolution  (không bắt buộc)

Độ phân giải của nội dung nghe nhìn.

Các giá trị có thể có:

  • low
  • medium
  • high
  • ultra_high

Ví dụ

Văn bản

{
  "type": "text",
  "text": "Hello, how are you?"
}

Hình ảnh

{
  "type": "image",
  "data": "BASE64_ENCODED_IMAGE",
  "mime_type": "image/png"
}

Âm thanh

{
  "type": "audio",
  "data": "BASE64_ENCODED_AUDIO",
  "mime_type": "audio/wav"
}

Tài liệu

{
  "type": "document",
  "data": "BASE64_ENCODED_DOCUMENT",
  "mime_type": "application/pdf"
}

Video

{
  "type": "video",
  "uri": "https://www.youtube.com/watch?v=9hE5-98ZeCg"
}

Công cụ

Một công cụ mà mô hình có thể sử dụng.

Các loại có thể có

Bộ phân biệt đa hình: type

Hàm

Một công cụ mà mô hình có thể sử dụng.

type object  (bắt buộc)

Không có mô tả nào được cung cấp.

Luôn đặt thành "function".

name string  (không bắt buộc)

Tên của hàm.

description string  (không bắt buộc)

Nội dung mô tả về hàm.

parameters object  (không bắt buộc)

Giản đồ JSON cho các tham số của hàm.

CodeExecution

Một công cụ mà mô hình có thể dùng để thực thi mã.

type object  (bắt buộc)

Không có mô tả nào được cung cấp.

Luôn đặt thành "code_execution".

UrlContext

Một công cụ mà mô hình có thể dùng để tìm nạp ngữ cảnh URL.

type object  (bắt buộc)

Không có mô tả nào được cung cấp.

Luôn đặt thành "url_context".

ComputerUse

Một công cụ mà mô hình có thể dùng để tương tác với máy tính.

type object  (bắt buộc)

Không có mô tả nào được cung cấp.

Luôn đặt thành "computer_use".

environment enum (string)  (không bắt buộc)

Môi trường đang hoạt động.

Các giá trị có thể có:

  • browser
excluded_predefined_functions array (string)  (không bắt buộc)

Danh sách các hàm được xác định trước bị loại trừ khỏi lệnh gọi mô hình.

McpServer

MCPServer là một máy chủ mà mô hình có thể gọi để thực hiện các hành động.

type object  (bắt buộc)

Không có mô tả nào được cung cấp.

Luôn đặt thành "mcp_server".

name string  (không bắt buộc)

Tên của MCPServer.

url string  (không bắt buộc)

URL đầy đủ cho điểm cuối MCPServer. Ví dụ: "https://api.example.com/mcp"

headers object  (không bắt buộc)

Không bắt buộc: Các trường cho tiêu đề xác thực, thời gian chờ, v.v. (nếu cần).

allowed_tools AllowedTools  (không bắt buộc)

Các công cụ được phép.

Cấu hình cho các công cụ được phép.

Trường

mode ToolChoiceType  (không bắt buộc)

Chế độ lựa chọn công cụ.

Các giá trị có thể có:

  • auto
  • any
  • none
  • validated

tools array (string)  (không bắt buộc)

Tên của các công cụ được phép.

GoogleSearch

Một công cụ mà mô hình có thể dùng để tìm kiếm trên Google.

type object  (bắt buộc)

Không có mô tả nào được cung cấp.

Luôn đặt thành "google_search".

search_types mảng (enum (string))  (không bắt buộc)

Các loại thông tin cơ sở để tìm kiếm cần bật.

Các giá trị có thể có:

  • web_search
  • image_search
  • enterprise_web_search
FileSearch

Một công cụ mà mô hình có thể dùng để tìm kiếm tệp.

type object  (bắt buộc)

Không có mô tả nào được cung cấp.

Luôn đặt thành "file_search".

file_search_store_names array (string)  (không bắt buộc)

Tên cửa hàng tìm kiếm tệp để tìm kiếm.

top_k số nguyên  (không bắt buộc)

Số lượng đoạn truy xuất ngữ nghĩa cần truy xuất.

metadata_filter string  (không bắt buộc)

Bộ lọc siêu dữ liệu để áp dụng cho các tài liệu và khối truy xuất ngữ nghĩa.

GoogleMaps

Một công cụ mà mô hình có thể dùng để gọi Google Maps.

type object  (bắt buộc)

Không có mô tả nào được cung cấp.

Luôn đặt thành "google_maps".

enable_widget boolean  (không bắt buộc)

Có trả về mã thông báo ngữ cảnh tiện ích trong kết quả lệnh gọi công cụ của phản hồi hay không.

latitude number  (không bắt buộc)

Vĩ độ của vị trí người dùng.

longitude number  (không bắt buộc)

Kinh độ của vị trí người dùng.

Truy xuất

Một công cụ mà mô hình có thể dùng để truy xuất tệp.

type object  (bắt buộc)

Không có mô tả nào được cung cấp.

Luôn đặt thành "retrieval".

retrieval_types array (enum (string))  (không bắt buộc)

Các loại truy xuất tệp cần bật.

Các giá trị có thể có:

  • vertex_ai_search
vertex_ai_search_config VertexAISearchConfig  (không bắt buộc)

Dùng để chỉ định cấu hình cho VertexAISearch.

Dùng để chỉ định cấu hình cho VertexAISearch.

Trường

engine string  (không bắt buộc)

Không bắt buộc. Dùng để chỉ định Vertex AI Search.

datastores mảng (chuỗi)  (không bắt buộc)

Không bắt buộc. Dùng để chỉ định các kho dữ liệu của Vertex AI Search.

Ví dụ

Chức năng

CodeExecution

UrlContext

ComputerUse

McpServer

GoogleSearch

FileSearch

GoogleMaps

Truy xuất

Không có ví dụ nào cho loại này.

InteractionSseEvent

Các loại có thể có

Bộ phân biệt đa hình: event_type

InteractionCreatedEvent

event_type object  (bắt buộc)

Không có mô tả nào được cung cấp.

Luôn đặt thành "interaction.created".

interaction Tương tác  (bắt buộc)

Không có mô tả nào được cung cấp.

event_id string  (không bắt buộc)

Mã thông báo event_id sẽ được dùng để tiếp tục luồng tương tác, bắt đầu từ sự kiện này.

InteractionCompletedEvent

event_type object  (bắt buộc)

Không có mô tả nào được cung cấp.

Luôn đặt thành "interaction.completed".

interaction Tương tác  (bắt buộc)

Bắt buộc. Tương tác hoàn tất mà không có thông tin xuất ra để giảm kích thước tải trọng. Sử dụng các sự kiện ContentDelta trước đó cho đầu ra thực tế.

event_id string  (không bắt buộc)

Mã thông báo event_id sẽ được dùng để tiếp tục luồng tương tác, bắt đầu từ sự kiện này.

InteractionStatusUpdate

event_type object  (bắt buộc)

Không có mô tả nào được cung cấp.

Luôn đặt thành "interaction.status_update".

interaction_id string  (bắt buộc)

Không có mô tả nào được cung cấp.

status enum (string)  (bắt buộc)

Không có mô tả nào được cung cấp.

Các giá trị có thể có:

  • in_progress
  • requires_action
  • completed
  • failed
  • cancelled
  • incomplete
event_id string  (không bắt buộc)

Mã thông báo event_id sẽ được dùng để tiếp tục luồng tương tác, bắt đầu từ sự kiện này.

ErrorEvent

event_type object  (bắt buộc)

Không có mô tả nào được cung cấp.

Luôn đặt thành "error".

error Error  (không bắt buộc)

Không có mô tả nào được cung cấp.

Thông báo lỗi từ một lượt tương tác.

Trường

code string  (không bắt buộc)

Một URI xác định loại lỗi.

message string  (không bắt buộc)

Thông báo lỗi mà con người có thể đọc được.

event_id string  (không bắt buộc)

Mã thông báo event_id sẽ được dùng để tiếp tục luồng tương tác, bắt đầu từ sự kiện này.

StepStart

event_type object  (bắt buộc)

Không có mô tả nào được cung cấp.

Luôn đặt thành "step.start".

index số nguyên  (bắt buộc)

Không có mô tả nào được cung cấp.

step Bước  (bắt buộc)

Không có mô tả nào được cung cấp.

Một bước trong lượt tương tác.

Các loại có thể có

Bộ phân biệt đa hình: type

UserInputStep

Thông tin đầu vào do người dùng cung cấp.

type object  (bắt buộc)

Không có mô tả nào được cung cấp.

Luôn đặt thành "user_input".

content mảng (Nội dung)  (không bắt buộc)

Không có mô tả nào được cung cấp.

ModelOutputStep

Đầu ra do mô hình tạo.

type object  (bắt buộc)

Không có mô tả nào được cung cấp.

Luôn đặt thành "model_output".

content mảng (Nội dung)  (không bắt buộc)

Không có mô tả nào được cung cấp.

ThoughtStep

Một bước tư duy.

type object  (bắt buộc)

Không có mô tả nào được cung cấp.

Luôn đặt thành "thought".

chữ ký chuỗi  (không bắt buộc)

Một hàm băm chữ ký để xác thực phụ trợ.

summary ThoughtSummaryContent  (không bắt buộc)

Tóm tắt suy nghĩ.

Các loại có thể có

Bộ phân biệt đa hình: type

TextContent

Một khối nội dung văn bản.

type object  (bắt buộc)

Không có mô tả nào được cung cấp.

Luôn đặt thành "text".

text string  (bắt buộc)

Bắt buộc. Nội dung văn bản.

annotations Chú thích  (không bắt buộc)

Thông tin trích dẫn cho nội dung do mô hình tạo.

Thông tin trích dẫn cho nội dung do mô hình tạo.

Các loại có thể có

Bộ phân biệt đa hình: type

UrlCitation

Chú thích trích dẫn URL.

type object  (bắt buộc)

Không có mô tả nào được cung cấp.

Luôn đặt thành "url_citation".

url string  (không bắt buộc)

URL.

title string  (không bắt buộc)

Tiêu đề của URL.

start_index integer  (không bắt buộc)

Điểm bắt đầu của đoạn phản hồi được phân bổ cho nguồn này. Chỉ mục cho biết điểm bắt đầu của đoạn, được đo bằng byte.

end_index integer  (không bắt buộc)

Kết thúc phân đoạn được phân bổ, không bao gồm.

FileCitation

Chú thích trích dẫn tệp.

type object  (bắt buộc)

Không có mô tả nào được cung cấp.

Luôn đặt thành "file_citation".

document_uri string  (không bắt buộc)

URI của tệp.

file_name string  (không bắt buộc)

Tên của tệp.

source string  (không bắt buộc)

Nguồn được phân bổ cho một phần văn bản.

custom_metadata object  (không bắt buộc)

Siêu dữ liệu do người dùng cung cấp về ngữ cảnh đã truy xuất.

page_number số nguyên  (không bắt buộc)

Số trang của tài liệu được trích dẫn (nếu có).

media_id string  (không bắt buộc)

Mã nhận dạng nội dung nghe nhìn trong trường hợp trích dẫn hình ảnh (nếu có).

start_index integer  (không bắt buộc)

Điểm bắt đầu của đoạn phản hồi được phân bổ cho nguồn này. Chỉ mục cho biết điểm bắt đầu của đoạn, được đo bằng byte.

end_index integer  (không bắt buộc)

Kết thúc phân đoạn được phân bổ, không bao gồm.

PlaceCitation

Chú thích trích dẫn địa điểm.

type object  (bắt buộc)

Không có mô tả nào được cung cấp.

Luôn đặt thành "place_citation".

place_id string  (không bắt buộc)

Mã nhận dạng của địa điểm, ở định dạng "places/{place_id}".

name string  (không bắt buộc)

Tên của địa điểm.

url string  (không bắt buộc)

URI tham chiếu của địa điểm.

review_snippets ReviewSnippet  (không bắt buộc)

Đoạn trích trong bài đánh giá được dùng để tạo câu trả lời về các tính năng của một địa điểm cụ thể trên Google Maps.

Đóng gói một đoạn trích của bài đánh giá người dùng để trả lời một câu hỏi về các tính năng của một địa điểm cụ thể trong Google Maps.

Trường

title string  (không bắt buộc)

Tiêu đề của bài đánh giá.

url string  (không bắt buộc)

Đường liên kết tương ứng với bài đánh giá của người dùng trên Google Maps.

review_id string  (không bắt buộc)

Mã của đoạn trích thông tin đánh giá.

start_index integer  (không bắt buộc)

Điểm bắt đầu của đoạn phản hồi được phân bổ cho nguồn này. Chỉ mục cho biết điểm bắt đầu của đoạn, được đo bằng byte.

end_index integer  (không bắt buộc)

Kết thúc phân đoạn được phân bổ, không bao gồm.

ImageContent

Một khối nội dung hình ảnh.

type object  (bắt buộc)

Không có mô tả nào được cung cấp.

Luôn đặt thành "image".

data string  (không bắt buộc)

Nội dung hình ảnh.

uri string  (không bắt buộc)

URI của hình ảnh.

mime_type enum (string)  (không bắt buộc)

Loại MIME của hình ảnh.

Các giá trị có thể có:

  • image/png
  • image/jpeg
  • image/webp
  • image/heic
  • image/heif
  • image/gif
  • image/bmp
  • image/tiff
resolution MediaResolution  (không bắt buộc)

Độ phân giải của nội dung nghe nhìn.

Các giá trị có thể có:

  • low
  • medium
  • high
  • ultra_high

FunctionCallStep

Một bước gọi công cụ hàm.

type object  (bắt buộc)

Không có mô tả nào được cung cấp.

Luôn đặt thành "function_call".

name string  (bắt buộc)

Bắt buộc. Tên của công cụ cần gọi.

arguments object  (bắt buộc)

Bắt buộc. Các đối số cần truyền vào hàm.

id string  (bắt buộc)

Bắt buộc. Mã nhận dạng duy nhất cho lệnh gọi công cụ cụ thể này.

chữ ký chuỗi  (không bắt buộc)

Một hàm băm chữ ký để xác thực phụ trợ.

CodeExecutionCallStep

Bước gọi thực thi mã.

type object  (bắt buộc)

Không có mô tả nào được cung cấp.

Luôn đặt thành "code_execution_call".

arguments CodeExecutionCallStepArguments  (bắt buộc)

Bắt buộc. Các đối số cần truyền đến quá trình thực thi mã.

Các đối số cần truyền đến quá trình thực thi mã.

Trường

language enum (string)  (không bắt buộc)

Ngôn ngữ lập trình của "code".

Các giá trị có thể có:

  • python
code string  (không bắt buộc)

Mã cần thực thi.

id string  (bắt buộc)

Bắt buộc. Mã nhận dạng duy nhất cho lệnh gọi công cụ cụ thể này.

chữ ký chuỗi  (không bắt buộc)

Một hàm băm chữ ký để xác thực phụ trợ.

UrlContextCallStep

Bước gọi ngữ cảnh URL.

type object  (bắt buộc)

Không có mô tả nào được cung cấp.

Luôn đặt thành "url_context_call".

arguments UrlContextCallStepArguments  (bắt buộc)

Bắt buộc. Các đối số cần chuyển đến ngữ cảnh URL.

Các đối số cần chuyển đến ngữ cảnh URL.

Trường

urls mảng (chuỗi)  (không bắt buộc)

Các URL cần tìm nạp.

id string  (bắt buộc)

Bắt buộc. Mã nhận dạng duy nhất cho lệnh gọi công cụ cụ thể này.

chữ ký chuỗi  (không bắt buộc)

Một hàm băm chữ ký để xác thực phụ trợ.

McpServerToolCallStep

Bước gọi công cụ MCPServer.

type object  (bắt buộc)

Không có mô tả nào được cung cấp.

Luôn đặt thành "mcp_server_tool_call".

name string  (bắt buộc)

Bắt buộc. Tên của công cụ đã được gọi.

server_name string  (bắt buộc)

Bắt buộc. Tên của máy chủ MCP được dùng.

arguments object  (bắt buộc)

Bắt buộc. Đối tượng JSON của các đối số cho hàm.

id string  (bắt buộc)

Bắt buộc. Mã nhận dạng duy nhất cho lệnh gọi công cụ cụ thể này.

chữ ký chuỗi  (không bắt buộc)

Một hàm băm chữ ký để xác thực phụ trợ.

GoogleSearchCallStep

Bước gọi trên Google Tìm kiếm.

type object  (bắt buộc)

Không có mô tả nào được cung cấp.

Luôn đặt thành "google_search_call".

arguments GoogleSearchCallStepArguments  (bắt buộc)

Bắt buộc. Các đối số cần truyền đến Google Tìm kiếm.

Các đối số cần truyền đến Google Tìm kiếm.

Trường

queries array (string)  (không bắt buộc)

Cụm từ tìm kiếm trên web để tìm kiếm trên web sau đó.

search_type enum (string)  (không bắt buộc)

Loại thông tin cơ sở được bật cho hoạt động tìm kiếm.

Các giá trị có thể có:

  • web_search
  • image_search
  • enterprise_web_search
id string  (bắt buộc)

Bắt buộc. Mã nhận dạng duy nhất cho lệnh gọi công cụ cụ thể này.

chữ ký chuỗi  (không bắt buộc)

Một hàm băm chữ ký để xác thực phụ trợ.

FileSearchCallStep

Bước gọi Tìm kiếm tệp.

type object  (bắt buộc)

Không có mô tả nào được cung cấp.

Luôn đặt thành "file_search_call".

id string  (bắt buộc)

Bắt buộc. Mã nhận dạng duy nhất cho lệnh gọi công cụ cụ thể này.

chữ ký chuỗi  (không bắt buộc)

Một hàm băm chữ ký để xác thực phụ trợ.

GoogleMapsCallStep

Bước gọi qua Google Maps.

type object  (bắt buộc)

Không có mô tả nào được cung cấp.

Luôn đặt thành "google_maps_call".

arguments GoogleMapsCallStepArguments  (không bắt buộc)

Các đối số cần truyền đến công cụ Google Maps.

Các đối số cần truyền đến công cụ Google Maps.

Trường

queries array (string)  (không bắt buộc)

Các truy vấn sẽ được thực thi.

id string  (bắt buộc)

Bắt buộc. Mã nhận dạng duy nhất cho lệnh gọi công cụ cụ thể này.

chữ ký chuỗi  (không bắt buộc)

Một hàm băm chữ ký để xác thực phụ trợ.

FunctionResultStep

Kết quả của một lệnh gọi công cụ hàm.

type object  (bắt buộc)

Không có mô tả nào được cung cấp.

Luôn đặt thành "function_result".

name string  (không bắt buộc)

Tên của công cụ đã được gọi.

is_error boolean  (không bắt buộc)

Liệu lệnh gọi công cụ có dẫn đến lỗi hay không.

call_id string  (bắt buộc)

Bắt buộc. Mã nhận dạng khớp với mã nhận dạng trong khối lệnh gọi hàm.

chữ ký chuỗi  (không bắt buộc)

Một hàm băm chữ ký để xác thực phụ trợ.

result array (FunctionResultSubcontent) hoặc string  (bắt buộc)

Kết quả của lệnh gọi công cụ.

CodeExecutionResultStep

Bước kết quả thực thi mã.

type object  (bắt buộc)

Không có mô tả nào được cung cấp.

Luôn đặt thành "code_execution_result".

result string  (bắt buộc)

Bắt buộc. Kết quả của quá trình thực thi mã.

is_error boolean  (không bắt buộc)

Liệu quá trình thực thi mã có dẫn đến lỗi hay không.

call_id string  (bắt buộc)

Bắt buộc. Mã nhận dạng khớp với mã nhận dạng trong khối lệnh gọi hàm.

chữ ký chuỗi  (không bắt buộc)

Một hàm băm chữ ký để xác thực phụ trợ.

UrlContextResultStep

Bước kết quả theo bối cảnh URL.

type object  (bắt buộc)

Không có mô tả nào được cung cấp.

Luôn đặt thành "url_context_result".

result UrlContextResultItem  (bắt buộc)

Bắt buộc. Kết quả của bối cảnh URL.

Kết quả của ngữ cảnh URL.

Trường

url string  (không bắt buộc)

URL đã được tìm nạp.

status enum (string)  (không bắt buộc)

Trạng thái truy xuất URL.

Các giá trị có thể có:

  • success
  • error
  • paywall
  • unsafe
is_error boolean  (không bắt buộc)

Liệu bối cảnh URL có gây ra lỗi hay không.

call_id string  (bắt buộc)

Bắt buộc. Mã nhận dạng khớp với mã nhận dạng trong khối lệnh gọi hàm.

chữ ký chuỗi  (không bắt buộc)

Một hàm băm chữ ký để xác thực phụ trợ.

GoogleSearchResultStep

Bước kết quả tìm kiếm trên Google.

type object  (bắt buộc)

Không có mô tả nào được cung cấp.

Luôn đặt thành "google_search_result".

result GoogleSearchResultItem  (bắt buộc)

Bắt buộc. Kết quả của Google Tìm kiếm.

Kết quả của Google Tìm kiếm.

Trường

search_suggestions string  (không bắt buộc)

Đoạn nội dung web có thể được nhúng vào một trang web hoặc webview của ứng dụng.

is_error boolean  (không bắt buộc)

Liệu Google Tìm kiếm có xảy ra lỗi hay không.

call_id string  (bắt buộc)

Bắt buộc. Mã nhận dạng khớp với mã nhận dạng trong khối lệnh gọi hàm.

chữ ký chuỗi  (không bắt buộc)

Một hàm băm chữ ký để xác thực phụ trợ.

McpServerToolResultStep

Bước kết quả của công cụ MCPServer.

type object  (bắt buộc)

Không có mô tả nào được cung cấp.

Luôn đặt thành "mcp_server_tool_result".

name string  (không bắt buộc)

Tên của công cụ được gọi cho lệnh gọi công cụ cụ thể này.

server_name string  (không bắt buộc)

Tên của máy chủ MCP được dùng.

call_id string  (bắt buộc)

Bắt buộc. Mã nhận dạng khớp với mã nhận dạng trong khối lệnh gọi hàm.

chữ ký chuỗi  (không bắt buộc)

Một hàm băm chữ ký để xác thực phụ trợ.

result array (FunctionResultSubcontent) hoặc string  (bắt buộc)

Đầu ra từ lệnh gọi máy chủ MCP. Có thể là văn bản đơn giản hoặc nội dung đa dạng thức.

FileSearchResultStep

Bước Kết quả tìm kiếm tệp.

type object  (bắt buộc)

Không có mô tả nào được cung cấp.

Luôn đặt thành "file_search_result".

call_id string  (bắt buộc)

Bắt buộc. Mã nhận dạng khớp với mã nhận dạng trong khối lệnh gọi hàm.

chữ ký chuỗi  (không bắt buộc)

Một hàm băm chữ ký để xác thực phụ trợ.

GoogleMapsResultStep

Bước kết quả trên Google Maps.

type object  (bắt buộc)

Không có mô tả nào được cung cấp.

Luôn đặt thành "google_maps_result".

result GoogleMapsResultItem  (bắt buộc)

Không có mô tả nào được cung cấp.

Kết quả của Google Maps.

Trường

places GoogleMapsResultPlaces  (không bắt buộc)

Không có mô tả nào được cung cấp.

Trường

place_id string  (không bắt buộc)

Không có mô tả nào được cung cấp.

name string  (không bắt buộc)

Không có mô tả nào được cung cấp.

url string  (không bắt buộc)

Không có mô tả nào được cung cấp.

review_snippets ReviewSnippet  (không bắt buộc)

Không có mô tả nào được cung cấp.

Đóng gói một đoạn trích của bài đánh giá người dùng để trả lời một câu hỏi về các tính năng của một địa điểm cụ thể trong Google Maps.

Trường

title string  (không bắt buộc)

Tiêu đề của bài đánh giá.

url string  (không bắt buộc)

Đường liên kết tương ứng với bài đánh giá của người dùng trên Google Maps.

review_id string  (không bắt buộc)

Mã của đoạn trích thông tin đánh giá.

widget_context_token string  (không bắt buộc)

Không có mô tả nào được cung cấp.

call_id string  (bắt buộc)

Bắt buộc. Mã nhận dạng khớp với mã nhận dạng trong khối lệnh gọi hàm.

chữ ký chuỗi  (không bắt buộc)

Một hàm băm chữ ký để xác thực phụ trợ.

event_id string  (không bắt buộc)

Mã thông báo event_id sẽ được dùng để tiếp tục luồng tương tác, bắt đầu từ sự kiện này.

StepDelta

event_type object  (bắt buộc)

Không có mô tả nào được cung cấp.

Luôn đặt thành "step.delta".

index số nguyên  (bắt buộc)

Không có mô tả nào được cung cấp.

delta StepDeltaData  (bắt buộc)

Không có mô tả nào được cung cấp.

Các loại có thể có

Bộ phân biệt đa hình: type

TextDelta

type object  (bắt buộc)

Không có mô tả nào được cung cấp.

Luôn đặt thành "text".

text string  (bắt buộc)

Không có mô tả nào được cung cấp.

ImageDelta

type object  (bắt buộc)

Không có mô tả nào được cung cấp.

Luôn đặt thành "image".

data string  (không bắt buộc)

Không có mô tả nào được cung cấp.

uri string  (không bắt buộc)

Không có mô tả nào được cung cấp.

mime_type enum (string)  (không bắt buộc)

Không có mô tả nào được cung cấp.

Các giá trị có thể có:

  • image/png
  • image/jpeg
  • image/webp
  • image/heic
  • image/heif
  • image/gif
  • image/bmp
  • image/tiff
resolution MediaResolution  (không bắt buộc)

Độ phân giải của nội dung nghe nhìn.

Các giá trị có thể có:

  • low
  • medium
  • high
  • ultra_high

AudioDelta

type object  (bắt buộc)

Không có mô tả nào được cung cấp.

Luôn đặt thành "audio".

data string  (không bắt buộc)

Không có mô tả nào được cung cấp.

uri string  (không bắt buộc)

Không có mô tả nào được cung cấp.

mime_type enum (string)  (không bắt buộc)

Không có mô tả nào được cung cấp.

Các giá trị có thể có:

  • audio/wav
  • audio/mp3
  • audio/aiff
  • audio/aac
  • audio/ogg
  • audio/flac
  • audio/mpeg
  • audio/m4a
  • audio/l16
  • audio/opus
  • audio/alaw
  • audio/mulaw
rate integer  (không bắt buộc)

Không dùng nữa. Thay vào đó, hãy sử dụng sample_rate. Giá trị này sẽ bị bỏ qua.

sample_rate integer  (không bắt buộc)

Tốc độ lấy mẫu của âm thanh.

channels số nguyên  (không bắt buộc)

Số lượng kênh âm thanh.

DocumentDelta

type object  (bắt buộc)

Không có mô tả nào được cung cấp.

Luôn đặt thành "document".

data string  (không bắt buộc)

Không có mô tả nào được cung cấp.

uri string  (không bắt buộc)

Không có mô tả nào được cung cấp.

mime_type enum (string)  (không bắt buộc)

Không có mô tả nào được cung cấp.

Các giá trị có thể có:

  • application/pdf
VideoDelta

type object  (bắt buộc)

Không có mô tả nào được cung cấp.

Luôn đặt thành "video".

data string  (không bắt buộc)

Không có mô tả nào được cung cấp.

uri string  (không bắt buộc)

Không có mô tả nào được cung cấp.

mime_type enum (string)  (không bắt buộc)

Không có mô tả nào được cung cấp.

Các giá trị có thể có:

  • video/mp4
  • video/mpeg
  • video/mpg
  • video/mov
  • video/avi
  • video/x-flv
  • video/webm
  • video/wmv
  • video/3gpp
resolution MediaResolution  (không bắt buộc)

Độ phân giải của nội dung nghe nhìn.

Các giá trị có thể có:

  • low
  • medium
  • high
  • ultra_high

ThoughtSummaryDelta

type object  (bắt buộc)

Không có mô tả nào được cung cấp.

Luôn đặt thành "thought_summary".

content ThoughtSummaryContent  (không bắt buộc)

Một mục tóm tắt mới sẽ được thêm vào suy nghĩ.

Các loại có thể có

Bộ phân biệt đa hình: type

TextContent

Một khối nội dung văn bản.

type object  (bắt buộc)

Không có mô tả nào được cung cấp.

Luôn đặt thành "text".

text string  (bắt buộc)

Bắt buộc. Nội dung văn bản.

annotations Chú thích  (không bắt buộc)

Thông tin trích dẫn cho nội dung do mô hình tạo.

Thông tin trích dẫn cho nội dung do mô hình tạo.

Các loại có thể có

Bộ phân biệt đa hình: type

UrlCitation

Chú thích trích dẫn URL.

type object  (bắt buộc)

Không có mô tả nào được cung cấp.

Luôn đặt thành "url_citation".

url string  (không bắt buộc)

URL.

title string  (không bắt buộc)

Tiêu đề của URL.

start_index integer  (không bắt buộc)

Điểm bắt đầu của đoạn phản hồi được phân bổ cho nguồn này. Chỉ mục cho biết điểm bắt đầu của đoạn, được đo bằng byte.

end_index integer  (không bắt buộc)

Kết thúc phân đoạn được phân bổ, không bao gồm.

FileCitation

Chú thích trích dẫn tệp.

type object  (bắt buộc)

Không có mô tả nào được cung cấp.

Luôn đặt thành "file_citation".

document_uri string  (không bắt buộc)

URI của tệp.

file_name string  (không bắt buộc)

Tên của tệp.

source string  (không bắt buộc)

Nguồn được phân bổ cho một phần văn bản.

custom_metadata object  (không bắt buộc)

Siêu dữ liệu do người dùng cung cấp về ngữ cảnh đã truy xuất.

page_number số nguyên  (không bắt buộc)

Số trang của tài liệu được trích dẫn (nếu có).

media_id string  (không bắt buộc)

Mã nhận dạng nội dung nghe nhìn trong trường hợp trích dẫn hình ảnh (nếu có).

start_index integer  (không bắt buộc)

Điểm bắt đầu của đoạn phản hồi được phân bổ cho nguồn này. Chỉ mục cho biết điểm bắt đầu của đoạn, được đo bằng byte.

end_index integer  (không bắt buộc)

Kết thúc phân đoạn được phân bổ, không bao gồm.

PlaceCitation

Chú thích trích dẫn địa điểm.

type object  (bắt buộc)

Không có mô tả nào được cung cấp.

Luôn đặt thành "place_citation".

place_id string  (không bắt buộc)

Mã nhận dạng của địa điểm, ở định dạng "places/{place_id}".

name string  (không bắt buộc)

Tên của địa điểm.

url string  (không bắt buộc)

URI tham chiếu của địa điểm.

review_snippets ReviewSnippet  (không bắt buộc)

Đoạn trích trong bài đánh giá được dùng để tạo câu trả lời về các tính năng của một địa điểm cụ thể trên Google Maps.

Đóng gói một đoạn trích của bài đánh giá người dùng để trả lời một câu hỏi về các tính năng của một địa điểm cụ thể trong Google Maps.

Trường

title string  (không bắt buộc)

Tiêu đề của bài đánh giá.

url string  (không bắt buộc)

Đường liên kết tương ứng với bài đánh giá của người dùng trên Google Maps.

review_id string  (không bắt buộc)

Mã của đoạn trích thông tin đánh giá.

start_index integer  (không bắt buộc)

Điểm bắt đầu của đoạn phản hồi được phân bổ cho nguồn này. Chỉ mục cho biết điểm bắt đầu của đoạn, được đo bằng byte.

end_index integer  (không bắt buộc)

Kết thúc phân đoạn được phân bổ, không bao gồm.

ImageContent

Một khối nội dung hình ảnh.

type object  (bắt buộc)

Không có mô tả nào được cung cấp.

Luôn đặt thành "image".

data string  (không bắt buộc)

Nội dung hình ảnh.

uri string  (không bắt buộc)

URI của hình ảnh.

mime_type enum (string)  (không bắt buộc)

Loại MIME của hình ảnh.

Các giá trị có thể có:

  • image/png
  • image/jpeg
  • image/webp
  • image/heic
  • image/heif
  • image/gif
  • image/bmp
  • image/tiff
resolution MediaResolution  (không bắt buộc)

Độ phân giải của nội dung nghe nhìn.

Các giá trị có thể có:

  • low
  • medium
  • high
  • ultra_high

ThoughtSignatureDelta

type object  (bắt buộc)

Không có mô tả nào được cung cấp.

Luôn đặt thành "thought_signature".

chữ ký chuỗi  (không bắt buộc)

Chữ ký khớp với nguồn phụ trợ sẽ là một phần của quá trình tạo.

TextAnnotationDelta

type object  (bắt buộc)

Không có mô tả nào được cung cấp.

Luôn đặt thành "text_annotation_delta".

annotations Chú thích  (không bắt buộc)

Thông tin trích dẫn cho nội dung do mô hình tạo.

Thông tin trích dẫn cho nội dung do mô hình tạo.

Các loại có thể có

Bộ phân biệt đa hình: type

UrlCitation

Chú thích trích dẫn URL.

type object  (bắt buộc)

Không có mô tả nào được cung cấp.

Luôn đặt thành "url_citation".

url string  (không bắt buộc)

URL.

title string  (không bắt buộc)

Tiêu đề của URL.

start_index integer  (không bắt buộc)

Điểm bắt đầu của đoạn phản hồi được phân bổ cho nguồn này. Chỉ mục cho biết điểm bắt đầu của đoạn, được đo bằng byte.

end_index integer  (không bắt buộc)

Kết thúc phân đoạn được phân bổ, không bao gồm.

FileCitation

Chú thích trích dẫn tệp.

type object  (bắt buộc)

Không có mô tả nào được cung cấp.

Luôn đặt thành "file_citation".

document_uri string  (không bắt buộc)

URI của tệp.

file_name string  (không bắt buộc)

Tên của tệp.

source string  (không bắt buộc)

Nguồn được phân bổ cho một phần văn bản.

custom_metadata object  (không bắt buộc)

Siêu dữ liệu do người dùng cung cấp về ngữ cảnh đã truy xuất.

page_number số nguyên  (không bắt buộc)

Số trang của tài liệu được trích dẫn (nếu có).

media_id string  (không bắt buộc)

Mã nhận dạng nội dung nghe nhìn trong trường hợp trích dẫn hình ảnh (nếu có).

start_index integer  (không bắt buộc)

Điểm bắt đầu của đoạn phản hồi được phân bổ cho nguồn này. Chỉ mục cho biết điểm bắt đầu của đoạn, được đo bằng byte.

end_index integer  (không bắt buộc)

Kết thúc phân đoạn được phân bổ, không bao gồm.

PlaceCitation

Chú thích trích dẫn địa điểm.

type object  (bắt buộc)

Không có mô tả nào được cung cấp.

Luôn đặt thành "place_citation".

place_id string  (không bắt buộc)

Mã nhận dạng của địa điểm, ở định dạng "places/{place_id}".

name string  (không bắt buộc)

Tên của địa điểm.

url string  (không bắt buộc)

URI tham chiếu của địa điểm.

review_snippets ReviewSnippet  (không bắt buộc)

Đoạn trích trong bài đánh giá được dùng để tạo câu trả lời về các tính năng của một địa điểm cụ thể trên Google Maps.

Đóng gói một đoạn trích của bài đánh giá người dùng để trả lời một câu hỏi về các tính năng của một địa điểm cụ thể trong Google Maps.

Trường

title string  (không bắt buộc)

Tiêu đề của bài đánh giá.

url string  (không bắt buộc)

Đường liên kết tương ứng với bài đánh giá của người dùng trên Google Maps.

review_id string  (không bắt buộc)

Mã của đoạn trích thông tin đánh giá.

start_index integer  (không bắt buộc)

Điểm bắt đầu của đoạn phản hồi được phân bổ cho nguồn này. Chỉ mục cho biết điểm bắt đầu của đoạn, được đo bằng byte.

end_index integer  (không bắt buộc)

Kết thúc phân đoạn được phân bổ, không bao gồm.

ArgumentsDelta

type object  (bắt buộc)

Không có mô tả nào được cung cấp.

Luôn đặt thành "arguments_delta".

partial_arguments string  (không bắt buộc)

Không có mô tả nào được cung cấp.

event_id string  (không bắt buộc)

Mã thông báo event_id sẽ được dùng để tiếp tục luồng tương tác, bắt đầu từ sự kiện này.

StepStop

event_type object  (bắt buộc)

Không có mô tả nào được cung cấp.

Luôn đặt thành "step.stop".

index số nguyên  (bắt buộc)

Không có mô tả nào được cung cấp.

event_id string  (không bắt buộc)

Mã thông báo event_id sẽ được dùng để tiếp tục luồng tương tác, bắt đầu từ sự kiện này.

Ví dụ

Đã tạo lượt tương tác

{
  "event_type": "interaction.created",
  "interaction": {
    "id": "v1_ChdXS0l4YWZXTk9xbk0xZThQczhEcmlROBIXV0tJeGFmV05PcW5NMWU4UHM4RHJpUTg",
    "model": "gemini-3-flash-preview",
    "status": "in_progress",
    "created": "2025-12-04T15:01:45Z",
    "updated": "2025-12-04T15:01:45Z"
  },
  "event_id": "evt_123"
}

Đã hoàn tất tương tác

{
  "event_type": "interaction.completed",
  "interaction": {
    "id": "v1_ChdXS0l4YWZXTk9xbk0xZThQczhEcmlROBIXV0tJeGFmV05PcW5NMWU4UHM4RHJpUTg",
    "model": "gemini-3-flash-preview",
    "status": "completed",
    "created": "2025-12-04T15:01:45Z",
    "updated": "2025-12-04T15:01:45Z"
  },
  "event_id": "evt_123"
}

Thông tin cập nhật về trạng thái tương tác

{
  "event_type": "interaction.status_update",
  "interaction_id": "v1_ChdTMjQ0YWJ5TUF1TzcxZThQdjRpcnFRcxIXUzI0NGFieU1BdU83MWU4UHY0aXJxUXM",
  "status": "in_progress"
}

Sự kiện lỗi

{
  "event_type": "error",
  "error": {
    "message": "Failed to get completed interaction: Result not found.",
    "code": "not_found"
  }
}

Bắt đầu bước

{
  "event_type": "step.start",
  "index": 0,
  "step": {
    "type": "model_output"
  }
}

Bước Delta

{
  "event_type": "step.delta",
  "index": 0,
  "delta": {
    "type": "text",
    "text": "Hello"
  }
}

Dừng theo bước

{
  "event_type": "step.stop",
  "index": 0
}