Gemini Interactions API là một API thử nghiệm cho phép nhà phát triển tạo các ứng dụng AI tạo sinh bằng mô hình Gemini. Gemini là mô hình mạnh nhất của chúng tôi, được xây dựng từ đầu theo hướng đa phương thức. Mô hình này có thể tổng quát hoá và hiểu một cách liền mạch, vận hành cũng như kết hợp nhiều loại thông tin, bao gồm cả ngôn ngữ, hình ảnh, âm thanh, video và mã nguồn. Bạn có thể sử dụng Gemini API cho các trường hợp sử dụng như suy luận trên văn bản và hình ảnh, tạo nội dung, tác nhân đối thoại, hệ thống tóm tắt và phân loại, v.v.
CreateWebhook
Tạo một Webhook mới.
Nội dung yêu cầu
Nội dung yêu cầu chứa dữ liệu với cấu trúc sau:
Không bắt buộc. Tên do người dùng cung cấp của webhook.
Bắt buộc. URI mà các sự kiện webhook sẽ được gửi đến.
Bắt buộc. Các sự kiện mà webhook đăng ký nhận. Các sự kiện có sẵn: - batch.succeeded - batch.expired - batch.failed - interaction.requires_action - interaction.completed - interaction.failed - video.generated
Phản hồi
Nếu thành công, phần nội dung phản hồi sẽ chứa dữ liệu có cấu trúc sau:
Không bắt buộc. Tên do người dùng cung cấp của webhook.
Bắt buộc. URI mà các sự kiện webhook sẽ được gửi đến.
Bắt buộc. Các sự kiện mà webhook đăng ký nhận. Các sự kiện có sẵn: - batch.succeeded - batch.expired - batch.failed - interaction.requires_action - interaction.completed - interaction.failed - video.generated
Chỉ có đầu ra. Dấu thời gian cho biết thời điểm tạo webhook.
Chỉ có đầu ra. Dấu thời gian khi webhook được cập nhật lần gần đây nhất.
signing_secrets SigningSecret (không bắt buộc)
Chỉ có đầu ra. Khoá bí mật ký liên kết với webhook này.
Trường
Chỉ có đầu ra. Phiên bản rút gọn của khoá bí mật ký.
Chỉ có đầu ra. Ngày hết hạn của khoá bí mật ký.
Chỉ có đầu ra. Trạng thái của webhook.
Các giá trị có thể có:
-
enabled -
disabled -
disabled_due_to_failed_deliveries
Chỉ có đầu ra. Khoá bí mật ký mới cho webhook. Chỉ được điền sẵn khi tạo.
Chỉ có đầu ra. Mã nhận dạng của webhook.
Ví dụ:
Ví dụ về phản hồi
{ "name": "string", "uri": "string", "subscribed_events": [ "string" ], "create_time": "string", "update_time": "string", "signing_secrets": [ { "truncated_secret": "string", "expire_time": "string" } ], "state": "enabled", "new_signing_secret": "string", "id": "string" }
ListWebhooks
Liệt kê tất cả Webhook.
Tham số đường dẫn / truy vấn
Không bắt buộc. Số lượng webhook tối đa cần trả về. Dịch vụ có thể trả về ít hơn giá trị này. Nếu không chỉ định, tối đa 50 webhook sẽ được trả về. Giá trị tối đa là 1.000.
Không bắt buộc. Mã thông báo trang nhận được từ lệnh gọi `ListWebhooks` trước đó. Cung cấp thông tin này để truy xuất trang tiếp theo.
Phản hồi
Nếu thành công, phần nội dung phản hồi sẽ chứa dữ liệu có cấu trúc sau:
Webhook.
Một mã thông báo có thể được gửi dưới dạng "page_token" để truy xuất trang tiếp theo. Nếu bạn bỏ qua trường này, thì sẽ không có trang tiếp theo.
Ví dụ:
Ví dụ về phản hồi
{ "webhooks": [ { "name": "string", "uri": "string", "subscribed_events": [ "string" ], "create_time": "string", "update_time": "string", "signing_secrets": [ { "truncated_secret": "string", "expire_time": "string" } ], "state": "enabled", "new_signing_secret": "string", "id": "string" } ], "next_page_token": "string" }
GetWebhook
Lấy một Webhook cụ thể.
Tham số đường dẫn / truy vấn
Bắt buộc. Mã nhận dạng của webhook cần truy xuất.
Phản hồi
Nếu thành công, phần nội dung phản hồi sẽ chứa dữ liệu có cấu trúc sau:
Không bắt buộc. Tên do người dùng cung cấp của webhook.
Bắt buộc. URI mà các sự kiện webhook sẽ được gửi đến.
Bắt buộc. Các sự kiện mà webhook đăng ký nhận. Các sự kiện có sẵn: - batch.succeeded - batch.expired - batch.failed - interaction.requires_action - interaction.completed - interaction.failed - video.generated
Chỉ có đầu ra. Dấu thời gian cho biết thời điểm tạo webhook.
Chỉ có đầu ra. Dấu thời gian khi webhook được cập nhật lần gần đây nhất.
signing_secrets SigningSecret (không bắt buộc)
Chỉ có đầu ra. Khoá bí mật ký liên kết với webhook này.
Trường
Chỉ có đầu ra. Phiên bản rút gọn của khoá bí mật ký.
Chỉ có đầu ra. Ngày hết hạn của khoá bí mật ký.
Chỉ có đầu ra. Trạng thái của webhook.
Các giá trị có thể có:
-
enabled -
disabled -
disabled_due_to_failed_deliveries
Chỉ có đầu ra. Khoá bí mật ký mới cho webhook. Chỉ được điền sẵn khi tạo.
Chỉ có đầu ra. Mã nhận dạng của webhook.
Ví dụ:
Ví dụ về phản hồi
{ "name": "string", "uri": "string", "subscribed_events": [ "string" ], "create_time": "string", "update_time": "string", "signing_secrets": [ { "truncated_secret": "string", "expire_time": "string" } ], "state": "enabled", "new_signing_secret": "string", "id": "string" }
UpdateWebhook
Cập nhật một Webhook hiện có.
Tham số đường dẫn / truy vấn
Bắt buộc. Mã của webhook cần cập nhật.
Không bắt buộc. Danh sách các trường cần cập nhật.
Nội dung yêu cầu
Nội dung yêu cầu chứa dữ liệu với cấu trúc sau:
Không bắt buộc. Tên do người dùng cung cấp của webhook.
Không bắt buộc. URI mà các sự kiện webhook sẽ được gửi đến.
Không bắt buộc. Các sự kiện mà webhook đăng ký nhận. Các sự kiện có sẵn: - batch.succeeded - batch.expired - batch.failed - interaction.requires_action - interaction.completed - interaction.failed - video.generated
Không bắt buộc. Trạng thái của webhook.
Các giá trị có thể có:
-
enabled -
disabled -
disabled_due_to_failed_deliveries
Phản hồi
Nếu thành công, phần nội dung phản hồi sẽ chứa dữ liệu có cấu trúc sau:
Không bắt buộc. Tên do người dùng cung cấp của webhook.
Bắt buộc. URI mà các sự kiện webhook sẽ được gửi đến.
Bắt buộc. Các sự kiện mà webhook đăng ký nhận. Các sự kiện có sẵn: - batch.succeeded - batch.expired - batch.failed - interaction.requires_action - interaction.completed - interaction.failed - video.generated
Chỉ có đầu ra. Dấu thời gian cho biết thời điểm tạo webhook.
Chỉ có đầu ra. Dấu thời gian khi webhook được cập nhật lần gần đây nhất.
signing_secrets SigningSecret (không bắt buộc)
Chỉ có đầu ra. Khoá bí mật ký liên kết với webhook này.
Trường
Chỉ có đầu ra. Phiên bản rút gọn của khoá bí mật ký.
Chỉ có đầu ra. Ngày hết hạn của khoá bí mật ký.
Chỉ có đầu ra. Trạng thái của webhook.
Các giá trị có thể có:
-
enabled -
disabled -
disabled_due_to_failed_deliveries
Chỉ có đầu ra. Khoá bí mật ký mới cho webhook. Chỉ được điền sẵn khi tạo.
Chỉ có đầu ra. Mã nhận dạng của webhook.
Ví dụ:
Ví dụ về phản hồi
{ "name": "string", "uri": "string", "subscribed_events": [ "string" ], "create_time": "string", "update_time": "string", "signing_secrets": [ { "truncated_secret": "string", "expire_time": "string" } ], "state": "enabled", "new_signing_secret": "string", "id": "string" }
DeleteWebhook
Xoá một Webhook.
Tham số đường dẫn / truy vấn
Bắt buộc. Mã của webhook cần xoá. Định dạng: `{webhook_id}`
Phản hồi
Nếu thành công, phản hồi sẽ trống.
Ví dụ:
RotateSigningSecret
Tạo một khoá bí mật ký mới cho Webhook.
Tham số đường dẫn / truy vấn
Bắt buộc. Mã nhận dạng của webhook mà bạn muốn tạo khoá bí mật ký. Định dạng: `{webhook_id}`
Nội dung yêu cầu
Nội dung yêu cầu chứa dữ liệu với cấu trúc sau:
Không bắt buộc. Hành vi thu hồi đối với các khoá bí mật dùng để ký trước đây.
Các giá trị có thể có:
-
revoke_previous_secrets_after_h24 -
revoke_previous_secrets_immediately
Phản hồi
Nếu thành công, phần nội dung phản hồi sẽ chứa dữ liệu có cấu trúc sau:
Chỉ có đầu ra. Khoá bí mật ký mới tạo.
Ví dụ:
Ví dụ về phản hồi
{ "secret": "string" }
PingWebhook
Gửi một sự kiện ping đến Webhook.
Tham số đường dẫn / truy vấn
Bắt buộc. Mã nhận dạng của webhook cần ping. Định dạng: `{webhook_id}`
Nội dung yêu cầu
Nội dung yêu cầu chứa dữ liệu với cấu trúc sau:
Phản hồi
Nếu thành công, phản hồi sẽ trống.
Ví dụ:
Tài nguyên
Webhook
Tài nguyên Webhook.
Trường
Không bắt buộc. Tên do người dùng cung cấp của webhook.
Bắt buộc. URI mà các sự kiện webhook sẽ được gửi đến.
Bắt buộc. Các sự kiện mà webhook đăng ký nhận. Các sự kiện có sẵn: - batch.succeeded - batch.expired - batch.failed - interaction.requires_action - interaction.completed - interaction.failed - video.generated
Chỉ có đầu ra. Dấu thời gian cho biết thời điểm tạo webhook.
Chỉ có đầu ra. Dấu thời gian khi webhook được cập nhật lần gần đây nhất.
signing_secrets SigningSecret (không bắt buộc)
Chỉ có đầu ra. Khoá bí mật ký liên kết với webhook này.
Trường
Chỉ có đầu ra. Phiên bản rút gọn của khoá bí mật ký.
Chỉ có đầu ra. Ngày hết hạn của khoá bí mật ký.
Chỉ có đầu ra. Trạng thái của webhook.
Các giá trị có thể có:
-
enabled -
disabled -
disabled_due_to_failed_deliveries
Chỉ có đầu ra. Khoá bí mật ký mới cho webhook. Chỉ được điền sẵn khi tạo.
Chỉ có đầu ra. Mã nhận dạng của webhook.
Mô hình dữ liệu
InteractionSseEvent
Các loại có thể có
Bộ phân biệt đa hình: event_type
InteractionCreatedEvent
Không có mô tả nào được cung cấp.
Luôn đặt thành "interaction.created".
interaction Tương tác (bắt buộc)
Không có mô tả nào được cung cấp.
Trường
model ModelOption (không bắt buộc)
Tên của "Mô hình" dùng để tạo lượt tương tác.
Các giá trị có thể có:
-
gemini-2.5-computer-use-preview-10-2025Một mô hình dựa trên khả năng của tác nhân được thiết kế để tương tác trực tiếp với giao diện, cho phép Gemini nhận biết và điều hướng các môi trường kỹ thuật số.
-
gemini-2.5-flashMô hình suy luận kết hợp đầu tiên của chúng tôi hỗ trợ cửa sổ ngữ cảnh 1 triệu token và có ngân sách tư duy.
-
gemini-2.5-flash-imageMô hình tạo hình ảnh gốc của chúng tôi, được tối ưu hoá về tốc độ, tính linh hoạt và khả năng hiểu ngữ cảnh. Giá của văn bản đầu vào và đầu ra giống như giá của 2,5 Flash.
-
gemini-2.5-flash-liteĐây là mô hình nhỏ nhất và tiết kiệm chi phí nhất của chúng tôi, được xây dựng để sử dụng ở quy mô lớn.
-
gemini-2.5-flash-lite-preview-09-2025Mô hình mới nhất dựa trên Gemini 2.5 Flash lite được tối ưu hoá để tiết kiệm chi phí, có thông lượng cao và chất lượng cao.
-
gemini-2.5-flash-native-audio-preview-12-2025Các mô hình âm thanh gốc của chúng tôi được tối ưu hoá để mang đến đầu ra âm thanh chất lượng cao hơn với nhịp điệu, giọng nói tự nhiên, mức độ chi tiết và tâm trạng tốt hơn.
-
gemini-2.5-flash-preview-09-2025Mô hình mới nhất dựa trên mô hình 2.5 Flash. 2.5 Flash Preview phù hợp nhất với các tác vụ xử lý quy mô lớn, độ trễ thấp, khối lượng lớn đòi hỏi khả năng tư duy và các trường hợp sử dụng có tác nhân.
-
gemini-2.5-flash-preview-ttsMô hình chuyển văn bản sang lời nói 2.5 Flash được tối ưu hoá để tạo lời nói mạnh mẽ, có độ trễ thấp và có thể kiểm soát.
-
gemini-2.5-proMô hình đa năng tiên tiến của chúng tôi, vượt trội trong việc xử lý các nhiệm vụ lập trình và suy luận phức tạp.
-
gemini-2.5-pro-preview-ttsMô hình âm thanh chuyển văn bản sang lời nói 2.5 Pro của chúng tôi được tối ưu hoá để tạo lời nói mạnh mẽ với độ trễ thấp, giúp tạo ra kết quả tự nhiên hơn và dễ dàng điều hướng các câu lệnh.
-
gemini-3-flash-previewMô hình thông minh nhất của chúng tôi được tối ưu hoá về tốc độ, kết hợp trí thông minh đột phá với khả năng tìm kiếm và tiếp thu thông tin vượt trội.
-
gemini-3-pro-image-previewMô hình tạo và chỉnh sửa hình ảnh tiên tiến.
-
gemini-3-pro-previewMô hình thông minh nhất của chúng tôi với khả năng suy luận và hiểu đa phương thức tiên tiến, cùng các tính năng tác nhân và lập trình theo cảm hứng mạnh mẽ.
-
gemini-3.1-pro-previewMô hình suy luận SOTA mới nhất của chúng tôi với độ sâu và sắc thái chưa từng có, cùng khả năng hiểu đa phương thức và lập trình mạnh mẽ.
-
gemini-3.1-flash-image-previewTrí tuệ thị giác cấp chuyên nghiệp với hiệu suất tốc độ cao và khả năng tạo nội dung dựa trên thực tế.
-
gemini-3.1-flash-lite-previewMô hình tiết kiệm chi phí nhất của chúng tôi, được tối ưu hoá cho các tác vụ có số lượng lớn, bản dịch và xử lý dữ liệu đơn giản.
-
gemini-3.1-flash-tts-previewTTS Gemini 3.1 Flash: Tạo lời nói mạnh mẽ với độ trễ thấp. Tận hưởng đầu ra tự nhiên, câu lệnh có thể điều hướng và thẻ âm thanh biểu cảm mới để kiểm soát chính xác lời tường thuật.
-
lyria-3-clip-previewMô hình tạo nhạc có độ trễ thấp, được tối ưu hoá cho các đoạn âm thanh có độ trung thực cao và khả năng kiểm soát nhịp điệu chính xác.
-
lyria-3-pro-previewMô hình tạo sinh tiên tiến, tạo toàn bộ bài hát của chúng tôi có khả năng hiểu biết sâu sắc về bố cục, được tối ưu hoá để kiểm soát cấu trúc chính xác và chuyển đổi phức tạp giữa nhiều phong cách âm nhạc.
agent AgentOption (không bắt buộc)
Tên của "Nhân viên hỗ trợ" được dùng để tạo lượt tương tác.
Các giá trị có thể có:
-
deep-research-pro-preview-12-2025Tác nhân Deep Research của Gemini
-
deep-research-preview-04-2026Tác nhân Deep Research của Gemini
-
deep-research-max-preview-04-2026Tác nhân Deep Research Max của Gemini
Bắt buộc. Chỉ có đầu ra. Giá trị nhận dạng riêng biệt cho lượt hoàn tất tương tác.
Bắt buộc. Chỉ có đầu ra. Trạng thái của lượt tương tác.
Các giá trị có thể có:
-
in_progress -
requires_action -
completed -
failed -
cancelled -
incomplete
Bắt buộc. Chỉ có đầu ra. Thời gian tạo phản hồi ở định dạng ISO 8601 (YYYY-MM-DDThh:mm:ssZ).
Bắt buộc. Chỉ có đầu ra. Thời gian cập nhật phản hồi gần đây nhất ở định dạng ISO 8601 (YYYY-MM-DDThh:mm:ssZ).
Chỉ có đầu ra. Vai trò của lượt tương tác.
Hướng dẫn của hệ thống cho lượt tương tác.
tools Tool (không bắt buộc)
Danh sách các khai báo công cụ mà mô hình có thể gọi trong quá trình tương tác.
Các loại có thể có
Bộ phân biệt đa hình: type
Hàm
Một công cụ mà mô hình có thể sử dụng.
Không có mô tả nào được cung cấp.
Luôn đặt thành "function".
Tên của hàm.
Nội dung mô tả về hàm.
Giản đồ JSON cho các tham số của hàm.
CodeExecution
Một công cụ mà mô hình có thể dùng để thực thi mã.
Không có mô tả nào được cung cấp.
Luôn đặt thành "code_execution".
UrlContext
Một công cụ mà mô hình có thể dùng để tìm nạp ngữ cảnh URL.
Không có mô tả nào được cung cấp.
Luôn đặt thành "url_context".
ComputerUse
Một công cụ mà mô hình có thể dùng để tương tác với máy tính.
Không có mô tả nào được cung cấp.
Luôn đặt thành "computer_use".
Môi trường đang hoạt động.
Các giá trị có thể có:
-
browser
Danh sách các hàm được xác định trước bị loại trừ khỏi lệnh gọi mô hình.
McpServer
MCPServer là một máy chủ mà mô hình có thể gọi để thực hiện các hành động.
Không có mô tả nào được cung cấp.
Luôn đặt thành "mcp_server".
Tên của MCPServer.
URL đầy đủ cho điểm cuối MCPServer. Ví dụ: "https://api.example.com/mcp"
Không bắt buộc: Các trường cho tiêu đề xác thực, thời gian chờ, v.v. (nếu cần).
allowed_tools AllowedTools (không bắt buộc)
Các công cụ được phép.
Trường
mode ToolChoiceType (không bắt buộc)
Chế độ lựa chọn công cụ.
Các giá trị có thể có:
-
auto -
any -
none -
validated
Tên của các công cụ được phép.
GoogleSearch
Một công cụ mà mô hình có thể dùng để tìm kiếm trên Google.
Không có mô tả nào được cung cấp.
Luôn đặt thành "google_search".
Các loại thông tin cơ sở để tìm kiếm cần bật.
Các giá trị có thể có:
-
web_search -
image_search -
enterprise_web_search
FileSearch
Một công cụ mà mô hình có thể dùng để tìm kiếm tệp.
Không có mô tả nào được cung cấp.
Luôn đặt thành "file_search".
Tên cửa hàng tìm kiếm tệp để tìm kiếm.
Số lượng đoạn truy xuất ngữ nghĩa cần truy xuất.
Bộ lọc siêu dữ liệu để áp dụng cho các tài liệu và khối truy xuất ngữ nghĩa.
GoogleMaps
Một công cụ mà mô hình có thể dùng để gọi Google Maps.
Không có mô tả nào được cung cấp.
Luôn đặt thành "google_maps".
Có trả về mã thông báo ngữ cảnh tiện ích trong kết quả lệnh gọi công cụ của phản hồi hay không.
Vĩ độ của vị trí người dùng.
Kinh độ của vị trí người dùng.
Truy xuất
Một công cụ mà mô hình có thể dùng để truy xuất tệp.
Không có mô tả nào được cung cấp.
Luôn đặt thành "retrieval".
Các loại truy xuất tệp cần bật.
Các giá trị có thể có:
-
vertex_ai_search
vertex_ai_search_config VertexAISearchConfig (không bắt buộc)
Dùng để chỉ định cấu hình cho VertexAISearch.
Trường
Không bắt buộc. Dùng để chỉ định Vertex AI Search.
Không bắt buộc. Dùng để chỉ định các kho dữ liệu của Vertex AI Search.
usage Usage (không bắt buộc)
Chỉ có đầu ra. Số liệu thống kê về việc sử dụng mã thông báo của yêu cầu tương tác.
Trường
Số lượng mã thông báo trong câu lệnh (ngữ cảnh).
input_tokens_by_modality ModalityTokens (không bắt buộc)
Thông tin chi tiết về mức sử dụng mã thông báo đầu vào theo phương thức.
Trường
phương thức ResponseModality (không bắt buộc)
Phương thức liên kết với số lượng mã thông báo.
Các giá trị có thể có:
-
text -
image -
audio -
video -
document
Số lượng mã thông báo cho phương thức.
Số lượng mã thông báo trong phần được lưu vào bộ nhớ đệm của câu lệnh (nội dung được lưu vào bộ nhớ đệm).
cached_tokens_by_modality ModalityTokens (không bắt buộc)
Bảng chi tiết về việc sử dụng mã thông báo được lưu vào bộ nhớ đệm theo phương thức.
Trường
phương thức ResponseModality (không bắt buộc)
Phương thức liên kết với số lượng mã thông báo.
Các giá trị có thể có:
-
text -
image -
audio -
video -
document
Số lượng mã thông báo cho phương thức.
Tổng số mã thông báo trong tất cả các câu trả lời được tạo.
output_tokens_by_modality ModalityTokens (không bắt buộc)
Thông tin chi tiết về việc sử dụng mã thông báo đầu ra theo phương thức.
Trường
phương thức ResponseModality (không bắt buộc)
Phương thức liên kết với số lượng mã thông báo.
Các giá trị có thể có:
-
text -
image -
audio -
video -
document
Số lượng mã thông báo cho phương thức.
Số lượng mã thông báo có trong(các) câu lệnh sử dụng công cụ.
tool_use_tokens_by_modality ModalityTokens (không bắt buộc)
Bảng chi tiết về việc sử dụng mã thông báo sử dụng công cụ theo phương thức.
Trường
phương thức ResponseModality (không bắt buộc)
Phương thức liên kết với số lượng mã thông báo.
Các giá trị có thể có:
-
text -
image -
audio -
video -
document
Số lượng mã thông báo cho phương thức.
Số lượng mã thông báo về suy nghĩ đối với mô hình tư duy.
Tổng số mã thông báo cho yêu cầu tương tác (lời nhắc + câu trả lời + các mã thông báo nội bộ khác).
grounding_tool_count GroundingToolCount (không bắt buộc)
Số lượng công cụ tiếp đất.
Trường
Loại công cụ cơ sở liên kết với số lượng.
Các giá trị có thể có:
-
google_search -
google_maps -
retrieval
Số lượng công cụ tiếp đất.
response_modalities ResponseModality (không bắt buộc)
Các phương thức phản hồi được yêu cầu (VĂN BẢN, HÌNH ẢNH, ÂM THANH).
Các giá trị có thể có:
-
text -
image -
audio -
video -
document
Loại MIME của phản hồi. Bạn phải cung cấp thông tin này nếu đã đặt response_format.
Mã của lượt tương tác trước đó (nếu có).
service_tier ServiceTier (không bắt buộc)
Cấp dịch vụ cho lượt tương tác.
Các giá trị có thể có:
-
flex -
standard -
priority
webhook_config WebhookConfig (không bắt buộc)
Không bắt buộc. Cấu hình Webhook để nhận thông báo khi quá trình tương tác hoàn tất.
Trường
Không bắt buộc. Nếu được đặt, các URI webhook này sẽ được dùng cho các sự kiện webhook thay vì các webhook đã đăng ký.
Không bắt buộc. Siêu dữ liệu người dùng sẽ được trả về trên mỗi lần phát sự kiện cho webhook.
steps Step (không bắt buộc)
Chỉ có đầu ra. Các bước tạo nên hoạt động tương tác.
Các loại có thể có
Bộ phân biệt đa hình: type
UserInputStep
Thông tin đầu vào do người dùng cung cấp.
Không có mô tả nào được cung cấp.
Luôn đặt thành "user_input".
content Nội dung (không bắt buộc)
Không có mô tả nào được cung cấp.
Các loại có thể có
Bộ phân biệt đa hình: type
TextContent
Một khối nội dung văn bản.
Không có mô tả nào được cung cấp.
Luôn đặt thành "text".
Bắt buộc. Nội dung văn bản.
annotations Chú thích (không bắt buộc)
Thông tin trích dẫn cho nội dung do mô hình tạo.
Các loại có thể có
Bộ phân biệt đa hình: type
UrlCitation
Chú thích trích dẫn URL.
Không có mô tả nào được cung cấp.
Luôn đặt thành "url_citation".
URL.
Tiêu đề của URL.
Điểm bắt đầu của đoạn phản hồi được phân bổ cho nguồn này. Chỉ mục cho biết điểm bắt đầu của đoạn, được đo bằng byte.
Kết thúc phân đoạn được phân bổ, không bao gồm.
FileCitation
Chú thích trích dẫn tệp.
Không có mô tả nào được cung cấp.
Luôn đặt thành "file_citation".
URI của tệp.
Tên của tệp.
Nguồn được phân bổ cho một phần văn bản.
Siêu dữ liệu do người dùng cung cấp về ngữ cảnh đã truy xuất.
Số trang của tài liệu được trích dẫn (nếu có).
Mã nhận dạng nội dung nghe nhìn trong trường hợp trích dẫn hình ảnh (nếu có).
Điểm bắt đầu của đoạn phản hồi được phân bổ cho nguồn này. Chỉ mục cho biết điểm bắt đầu của đoạn, được đo bằng byte.
Kết thúc phân đoạn được phân bổ, không bao gồm.
PlaceCitation
Chú thích trích dẫn địa điểm.
Không có mô tả nào được cung cấp.
Luôn đặt thành "place_citation".
Mã nhận dạng của địa điểm, ở định dạng "places/{place_id}".
Tên của địa điểm.
URI tham chiếu của địa điểm.
review_snippets ReviewSnippet (không bắt buộc)
Đoạn trích trong bài đánh giá được dùng để tạo câu trả lời về các tính năng của một địa điểm cụ thể trên Google Maps.
Trường
Tiêu đề của bài đánh giá.
Đường liên kết tương ứng với bài đánh giá của người dùng trên Google Maps.
Mã của đoạn trích thông tin đánh giá.
Điểm bắt đầu của đoạn phản hồi được phân bổ cho nguồn này. Chỉ mục cho biết điểm bắt đầu của đoạn, được đo bằng byte.
Kết thúc phân đoạn được phân bổ, không bao gồm.
ImageContent
Một khối nội dung hình ảnh.
Không có mô tả nào được cung cấp.
Luôn đặt thành "image".
Nội dung hình ảnh.
URI của hình ảnh.
Loại MIME của hình ảnh.
Các giá trị có thể có:
-
image/png -
image/jpeg -
image/webp -
image/heic -
image/heif -
image/gif -
image/bmp -
image/tiff
resolution MediaResolution (không bắt buộc)
Độ phân giải của nội dung nghe nhìn.
Các giá trị có thể có:
-
low -
medium -
high -
ultra_high
AudioContent
Một khối nội dung âm thanh.
Không có mô tả nào được cung cấp.
Luôn đặt thành "audio".
Nội dung âm thanh.
URI của âm thanh.
Loại MIME của âm thanh.
Các giá trị có thể có:
-
audio/wav -
audio/mp3 -
audio/aiff -
audio/aac -
audio/ogg -
audio/flac -
audio/mpeg -
audio/m4a -
audio/l16 -
audio/opus -
audio/alaw -
audio/mulaw
Số lượng kênh âm thanh.
Tốc độ lấy mẫu của âm thanh.
DocumentContent
Một khối nội dung tài liệu.
Không có mô tả nào được cung cấp.
Luôn đặt thành "document".
Nội dung tài liệu.
URI của tài liệu.
Loại MIME của tài liệu.
Các giá trị có thể có:
-
application/pdf
VideoContent
Một khối nội dung video.
Không có mô tả nào được cung cấp.
Luôn đặt thành "video".
Nội dung video.
URI của video.
Loại MIME của video.
Các giá trị có thể có:
-
video/mp4 -
video/mpeg -
video/mpg -
video/mov -
video/avi -
video/x-flv -
video/webm -
video/wmv -
video/3gpp
resolution MediaResolution (không bắt buộc)
Độ phân giải của nội dung nghe nhìn.
Các giá trị có thể có:
-
low -
medium -
high -
ultra_high
ModelOutputStep
Đầu ra do mô hình tạo.
Không có mô tả nào được cung cấp.
Luôn đặt thành "model_output".
content Nội dung (không bắt buộc)
Không có mô tả nào được cung cấp.
Các loại có thể có
Bộ phân biệt đa hình: type
TextContent
Một khối nội dung văn bản.
Không có mô tả nào được cung cấp.
Luôn đặt thành "text".
Bắt buộc. Nội dung văn bản.
annotations Chú thích (không bắt buộc)
Thông tin trích dẫn cho nội dung do mô hình tạo.
Các loại có thể có
Bộ phân biệt đa hình: type
UrlCitation
Chú thích trích dẫn URL.
Không có mô tả nào được cung cấp.
Luôn đặt thành "url_citation".
URL.
Tiêu đề của URL.
Điểm bắt đầu của đoạn phản hồi được phân bổ cho nguồn này. Chỉ mục cho biết điểm bắt đầu của đoạn, được đo bằng byte.
Kết thúc phân đoạn được phân bổ, không bao gồm.
FileCitation
Chú thích trích dẫn tệp.
Không có mô tả nào được cung cấp.
Luôn đặt thành "file_citation".
URI của tệp.
Tên của tệp.
Nguồn được phân bổ cho một phần văn bản.
Siêu dữ liệu do người dùng cung cấp về ngữ cảnh đã truy xuất.
Số trang của tài liệu được trích dẫn (nếu có).
Mã nhận dạng nội dung nghe nhìn trong trường hợp trích dẫn hình ảnh (nếu có).
Điểm bắt đầu của đoạn phản hồi được phân bổ cho nguồn này. Chỉ mục cho biết điểm bắt đầu của đoạn, được đo bằng byte.
Kết thúc phân đoạn được phân bổ, không bao gồm.
PlaceCitation
Chú thích trích dẫn địa điểm.
Không có mô tả nào được cung cấp.
Luôn đặt thành "place_citation".
Mã nhận dạng của địa điểm, ở định dạng "places/{place_id}".
Tên của địa điểm.
URI tham chiếu của địa điểm.
review_snippets ReviewSnippet (không bắt buộc)
Đoạn trích trong bài đánh giá được dùng để tạo câu trả lời về các tính năng của một địa điểm cụ thể trên Google Maps.
Trường
Tiêu đề của bài đánh giá.
Đường liên kết tương ứng với bài đánh giá của người dùng trên Google Maps.
Mã của đoạn trích thông tin đánh giá.
Điểm bắt đầu của đoạn phản hồi được phân bổ cho nguồn này. Chỉ mục cho biết điểm bắt đầu của đoạn, được đo bằng byte.
Kết thúc phân đoạn được phân bổ, không bao gồm.
ImageContent
Một khối nội dung hình ảnh.
Không có mô tả nào được cung cấp.
Luôn đặt thành "image".
Nội dung hình ảnh.
URI của hình ảnh.
Loại MIME của hình ảnh.
Các giá trị có thể có:
-
image/png -
image/jpeg -
image/webp -
image/heic -
image/heif -
image/gif -
image/bmp -
image/tiff
resolution MediaResolution (không bắt buộc)
Độ phân giải của nội dung nghe nhìn.
Các giá trị có thể có:
-
low -
medium -
high -
ultra_high
AudioContent
Một khối nội dung âm thanh.
Không có mô tả nào được cung cấp.
Luôn đặt thành "audio".
Nội dung âm thanh.
URI của âm thanh.
Loại MIME của âm thanh.
Các giá trị có thể có:
-
audio/wav -
audio/mp3 -
audio/aiff -
audio/aac -
audio/ogg -
audio/flac -
audio/mpeg -
audio/m4a -
audio/l16 -
audio/opus -
audio/alaw -
audio/mulaw
Số lượng kênh âm thanh.
Tốc độ lấy mẫu của âm thanh.
DocumentContent
Một khối nội dung tài liệu.
Không có mô tả nào được cung cấp.
Luôn đặt thành "document".
Nội dung tài liệu.
URI của tài liệu.
Loại MIME của tài liệu.
Các giá trị có thể có:
-
application/pdf
VideoContent
Một khối nội dung video.
Không có mô tả nào được cung cấp.
Luôn đặt thành "video".
Nội dung video.
URI của video.
Loại MIME của video.
Các giá trị có thể có:
-
video/mp4 -
video/mpeg -
video/mpg -
video/mov -
video/avi -
video/x-flv -
video/webm -
video/wmv -
video/3gpp
resolution MediaResolution (không bắt buộc)
Độ phân giải của nội dung nghe nhìn.
Các giá trị có thể có:
-
low -
medium -
high -
ultra_high
ThoughtStep
Một bước tư duy.
Không có mô tả nào được cung cấp.
Luôn đặt thành "thought".
Một hàm băm chữ ký để xác thực phụ trợ.
summary ThoughtSummaryContent (không bắt buộc)
Tóm tắt suy nghĩ.
Các loại có thể có
Bộ phân biệt đa hình: type
TextContent
Một khối nội dung văn bản.
Không có mô tả nào được cung cấp.
Luôn đặt thành "text".
Bắt buộc. Nội dung văn bản.
annotations Chú thích (không bắt buộc)
Thông tin trích dẫn cho nội dung do mô hình tạo.
Các loại có thể có
Bộ phân biệt đa hình: type
UrlCitation
Chú thích trích dẫn URL.
Không có mô tả nào được cung cấp.
Luôn đặt thành "url_citation".
URL.
Tiêu đề của URL.
Điểm bắt đầu của đoạn phản hồi được phân bổ cho nguồn này. Chỉ mục cho biết điểm bắt đầu của đoạn, được đo bằng byte.
Kết thúc phân đoạn được phân bổ, không bao gồm.
FileCitation
Chú thích trích dẫn tệp.
Không có mô tả nào được cung cấp.
Luôn đặt thành "file_citation".
URI của tệp.
Tên của tệp.
Nguồn được phân bổ cho một phần văn bản.
Siêu dữ liệu do người dùng cung cấp về ngữ cảnh đã truy xuất.
Số trang của tài liệu được trích dẫn (nếu có).
Mã nhận dạng nội dung nghe nhìn trong trường hợp trích dẫn hình ảnh (nếu có).
Điểm bắt đầu của đoạn phản hồi được phân bổ cho nguồn này. Chỉ mục cho biết điểm bắt đầu của đoạn, được đo bằng byte.
Kết thúc phân đoạn được phân bổ, không bao gồm.
PlaceCitation
Chú thích trích dẫn địa điểm.
Không có mô tả nào được cung cấp.
Luôn đặt thành "place_citation".
Mã nhận dạng của địa điểm, ở định dạng "places/{place_id}".
Tên của địa điểm.
URI tham chiếu của địa điểm.
review_snippets ReviewSnippet (không bắt buộc)
Đoạn trích trong bài đánh giá được dùng để tạo câu trả lời về các tính năng của một địa điểm cụ thể trên Google Maps.
Trường
Tiêu đề của bài đánh giá.
Đường liên kết tương ứng với bài đánh giá của người dùng trên Google Maps.
Mã của đoạn trích thông tin đánh giá.
Điểm bắt đầu của đoạn phản hồi được phân bổ cho nguồn này. Chỉ mục cho biết điểm bắt đầu của đoạn, được đo bằng byte.
Kết thúc phân đoạn được phân bổ, không bao gồm.
ImageContent
Một khối nội dung hình ảnh.
Không có mô tả nào được cung cấp.
Luôn đặt thành "image".
Nội dung hình ảnh.
URI của hình ảnh.
Loại MIME của hình ảnh.
Các giá trị có thể có:
-
image/png -
image/jpeg -
image/webp -
image/heic -
image/heif -
image/gif -
image/bmp -
image/tiff
resolution MediaResolution (không bắt buộc)
Độ phân giải của nội dung nghe nhìn.
Các giá trị có thể có:
-
low -
medium -
high -
ultra_high
FunctionCallStep
Một bước gọi công cụ hàm.
Không có mô tả nào được cung cấp.
Luôn đặt thành "function_call".
Bắt buộc. Tên của công cụ cần gọi.
Bắt buộc. Các đối số cần truyền vào hàm.
Bắt buộc. Mã nhận dạng duy nhất cho lệnh gọi công cụ cụ thể này.
Một hàm băm chữ ký để xác thực phụ trợ.
CodeExecutionCallStep
Bước gọi thực thi mã.
Không có mô tả nào được cung cấp.
Luôn đặt thành "code_execution_call".
arguments CodeExecutionCallStepArguments (bắt buộc)
Bắt buộc. Các đối số cần truyền đến quá trình thực thi mã.
Trường
Ngôn ngữ lập trình của "code".
Các giá trị có thể có:
-
python
Mã cần thực thi.
Bắt buộc. Mã nhận dạng duy nhất cho lệnh gọi công cụ cụ thể này.
Một hàm băm chữ ký để xác thực phụ trợ.
UrlContextCallStep
Bước gọi ngữ cảnh URL.
Không có mô tả nào được cung cấp.
Luôn đặt thành "url_context_call".
arguments UrlContextCallStepArguments (bắt buộc)
Bắt buộc. Các đối số cần chuyển đến ngữ cảnh URL.
Trường
Các URL cần tìm nạp.
Bắt buộc. Mã nhận dạng duy nhất cho lệnh gọi công cụ cụ thể này.
Một hàm băm chữ ký để xác thực phụ trợ.
McpServerToolCallStep
Bước gọi công cụ MCPServer.
Không có mô tả nào được cung cấp.
Luôn đặt thành "mcp_server_tool_call".
Bắt buộc. Tên của công cụ đã được gọi.
Bắt buộc. Tên của máy chủ MCP được dùng.
Bắt buộc. Đối tượng JSON của các đối số cho hàm.
Bắt buộc. Mã nhận dạng duy nhất cho lệnh gọi công cụ cụ thể này.
Một hàm băm chữ ký để xác thực phụ trợ.
GoogleSearchCallStep
Bước gọi trên Google Tìm kiếm.
Không có mô tả nào được cung cấp.
Luôn đặt thành "google_search_call".
arguments GoogleSearchCallStepArguments (bắt buộc)
Bắt buộc. Các đối số cần truyền đến Google Tìm kiếm.
Trường
Cụm từ tìm kiếm trên web để tìm kiếm trên web sau đó.
Loại thông tin cơ sở được bật cho hoạt động tìm kiếm.
Các giá trị có thể có:
-
web_search -
image_search -
enterprise_web_search
Bắt buộc. Mã nhận dạng duy nhất cho lệnh gọi công cụ cụ thể này.
Một hàm băm chữ ký để xác thực phụ trợ.
FileSearchCallStep
Bước gọi Tìm kiếm tệp.
Không có mô tả nào được cung cấp.
Luôn đặt thành "file_search_call".
Bắt buộc. Mã nhận dạng duy nhất cho lệnh gọi công cụ cụ thể này.
Một hàm băm chữ ký để xác thực phụ trợ.
GoogleMapsCallStep
Bước gọi qua Google Maps.
Không có mô tả nào được cung cấp.
Luôn đặt thành "google_maps_call".
arguments GoogleMapsCallStepArguments (không bắt buộc)
Các đối số cần truyền đến công cụ Google Maps.
Trường
Các truy vấn sẽ được thực thi.
Bắt buộc. Mã nhận dạng duy nhất cho lệnh gọi công cụ cụ thể này.
Một hàm băm chữ ký để xác thực phụ trợ.
FunctionResultStep
Kết quả của một lệnh gọi công cụ hàm.
Không có mô tả nào được cung cấp.
Luôn đặt thành "function_result".
Tên của công cụ đã được gọi.
Liệu lệnh gọi công cụ có dẫn đến lỗi hay không.
Bắt buộc. Mã nhận dạng khớp với mã nhận dạng trong khối lệnh gọi hàm.
Một hàm băm chữ ký để xác thực phụ trợ.
Kết quả của lệnh gọi công cụ.
CodeExecutionResultStep
Bước kết quả thực thi mã.
Không có mô tả nào được cung cấp.
Luôn đặt thành "code_execution_result".
Bắt buộc. Kết quả của quá trình thực thi mã.
Liệu quá trình thực thi mã có dẫn đến lỗi hay không.
Bắt buộc. Mã nhận dạng khớp với mã nhận dạng trong khối lệnh gọi hàm.
Một hàm băm chữ ký để xác thực phụ trợ.
UrlContextResultStep
Bước kết quả theo bối cảnh URL.
Không có mô tả nào được cung cấp.
Luôn đặt thành "url_context_result".
result UrlContextResultItem (bắt buộc)
Bắt buộc. Kết quả của bối cảnh URL.
Trường
URL đã được tìm nạp.
Trạng thái truy xuất URL.
Các giá trị có thể có:
-
success -
error -
paywall -
unsafe
Liệu bối cảnh URL có gây ra lỗi hay không.
Bắt buộc. Mã nhận dạng khớp với mã nhận dạng trong khối lệnh gọi hàm.
Một hàm băm chữ ký để xác thực phụ trợ.
GoogleSearchResultStep
Bước kết quả tìm kiếm trên Google.
Không có mô tả nào được cung cấp.
Luôn đặt thành "google_search_result".
result GoogleSearchResultItem (bắt buộc)
Bắt buộc. Kết quả của Google Tìm kiếm.
Trường
Đoạn nội dung web có thể được nhúng vào một trang web hoặc webview của ứng dụng.
Liệu Google Tìm kiếm có xảy ra lỗi hay không.
Bắt buộc. Mã nhận dạng khớp với mã nhận dạng trong khối lệnh gọi hàm.
Một hàm băm chữ ký để xác thực phụ trợ.
McpServerToolResultStep
Bước kết quả của công cụ MCPServer.
Không có mô tả nào được cung cấp.
Luôn đặt thành "mcp_server_tool_result".
Tên của công cụ được gọi cho lệnh gọi công cụ cụ thể này.
Tên của máy chủ MCP được dùng.
Bắt buộc. Mã nhận dạng khớp với mã nhận dạng trong khối lệnh gọi hàm.
Một hàm băm chữ ký để xác thực phụ trợ.
Đầu ra từ lệnh gọi máy chủ MCP. Có thể là văn bản đơn giản hoặc nội dung đa dạng thức.
FileSearchResultStep
Bước Kết quả tìm kiếm tệp.
Không có mô tả nào được cung cấp.
Luôn đặt thành "file_search_result".
Bắt buộc. Mã nhận dạng khớp với mã nhận dạng trong khối lệnh gọi hàm.
Một hàm băm chữ ký để xác thực phụ trợ.
GoogleMapsResultStep
Bước kết quả trên Google Maps.
Không có mô tả nào được cung cấp.
Luôn đặt thành "google_maps_result".
result GoogleMapsResultItem (bắt buộc)
Không có mô tả nào được cung cấp.
Trường
places GoogleMapsResultPlaces (không bắt buộc)
Không có mô tả nào được cung cấp.
Trường
Không có mô tả nào được cung cấp.
Không có mô tả nào được cung cấp.
Không có mô tả nào được cung cấp.
review_snippets ReviewSnippet (không bắt buộc)
Không có mô tả nào được cung cấp.
Trường
Tiêu đề của bài đánh giá.
Đường liên kết tương ứng với bài đánh giá của người dùng trên Google Maps.
Mã của đoạn trích thông tin đánh giá.
Không có mô tả nào được cung cấp.
Bắt buộc. Mã nhận dạng khớp với mã nhận dạng trong khối lệnh gọi hàm.
Một hàm băm chữ ký để xác thực phụ trợ.
Đầu vào cho lượt tương tác.
Buộc phản hồi được tạo phải là một đối tượng JSON tuân thủ giản đồ JSON được chỉ định trong trường này.
agent_config object (không bắt buộc)
Thông số cấu hình cho hoạt động tương tác của nhân viên hỗ trợ.
Các loại có thể có
Bộ phân biệt đa hình: type
DynamicAgentConfig
Cấu hình cho các tác nhân động.
Không có mô tả nào được cung cấp.
Luôn đặt thành "dynamic".
DeepResearchAgentConfig
Cấu hình cho tác nhân Deep Research.
Không có mô tả nào được cung cấp.
Luôn đặt thành "deep-research".
thinking_summaries ThinkingSummaries (không bắt buộc)
Có nên đưa bản tóm tắt suy nghĩ vào câu trả lời hay không.
Các giá trị có thể có:
-
auto -
none
Có nên đưa hình ảnh trực quan vào câu trả lời hay không.
Các giá trị có thể có:
-
off -
auto
Cho phép lập kế hoạch có sự tham gia của con người cho tác nhân Deep Research. Nếu được đặt thành true, tác nhân Deep Research sẽ cung cấp một kế hoạch nghiên cứu trong phản hồi của mình. Sau đó, tác nhân sẽ chỉ tiếp tục nếu người dùng xác nhận kế hoạch ở lượt tiếp theo.
Mã thông báo event_id sẽ được dùng để tiếp tục luồng tương tác, bắt đầu từ sự kiện này.
InteractionCompletedEvent
Không có mô tả nào được cung cấp.
Luôn đặt thành "interaction.completed".
interaction Tương tác (bắt buộc)
Bắt buộc. Tương tác hoàn tất mà không có thông tin xuất ra để giảm kích thước tải trọng. Sử dụng các sự kiện ContentDelta trước đó cho đầu ra thực tế.
Trường
model ModelOption (không bắt buộc)
Tên của "Mô hình" dùng để tạo lượt tương tác.
Các giá trị có thể có:
-
gemini-2.5-computer-use-preview-10-2025Một mô hình dựa trên khả năng của tác nhân được thiết kế để tương tác trực tiếp với giao diện, cho phép Gemini nhận biết và điều hướng các môi trường kỹ thuật số.
-
gemini-2.5-flashMô hình suy luận kết hợp đầu tiên của chúng tôi hỗ trợ cửa sổ ngữ cảnh 1 triệu token và có ngân sách tư duy.
-
gemini-2.5-flash-imageMô hình tạo hình ảnh gốc của chúng tôi, được tối ưu hoá về tốc độ, tính linh hoạt và khả năng hiểu ngữ cảnh. Giá của văn bản đầu vào và đầu ra giống như giá của 2,5 Flash.
-
gemini-2.5-flash-liteĐây là mô hình nhỏ nhất và tiết kiệm chi phí nhất của chúng tôi, được xây dựng để sử dụng ở quy mô lớn.
-
gemini-2.5-flash-lite-preview-09-2025Mô hình mới nhất dựa trên Gemini 2.5 Flash lite được tối ưu hoá để tiết kiệm chi phí, có thông lượng cao và chất lượng cao.
-
gemini-2.5-flash-native-audio-preview-12-2025Các mô hình âm thanh gốc của chúng tôi được tối ưu hoá để mang đến đầu ra âm thanh chất lượng cao hơn với nhịp điệu, giọng nói tự nhiên, mức độ chi tiết và tâm trạng tốt hơn.
-
gemini-2.5-flash-preview-09-2025Mô hình mới nhất dựa trên mô hình 2.5 Flash. 2.5 Flash Preview phù hợp nhất với các tác vụ xử lý quy mô lớn, độ trễ thấp, khối lượng lớn đòi hỏi khả năng tư duy và các trường hợp sử dụng có tác nhân.
-
gemini-2.5-flash-preview-ttsMô hình chuyển văn bản sang lời nói 2.5 Flash được tối ưu hoá để tạo lời nói mạnh mẽ, có độ trễ thấp và có thể kiểm soát.
-
gemini-2.5-proMô hình đa năng tiên tiến của chúng tôi, vượt trội trong việc xử lý các nhiệm vụ lập trình và suy luận phức tạp.
-
gemini-2.5-pro-preview-ttsMô hình âm thanh chuyển văn bản sang lời nói 2.5 Pro của chúng tôi được tối ưu hoá để tạo lời nói mạnh mẽ với độ trễ thấp, giúp tạo ra kết quả tự nhiên hơn và dễ dàng điều hướng các câu lệnh.
-
gemini-3-flash-previewMô hình thông minh nhất của chúng tôi được tối ưu hoá về tốc độ, kết hợp trí thông minh đột phá với khả năng tìm kiếm và tiếp thu thông tin vượt trội.
-
gemini-3-pro-image-previewMô hình tạo và chỉnh sửa hình ảnh tiên tiến.
-
gemini-3-pro-previewMô hình thông minh nhất của chúng tôi với khả năng suy luận và hiểu đa phương thức tiên tiến, cùng các tính năng tác nhân và lập trình theo cảm hứng mạnh mẽ.
-
gemini-3.1-pro-previewMô hình suy luận SOTA mới nhất của chúng tôi với độ sâu và sắc thái chưa từng có, cùng khả năng hiểu đa phương thức và lập trình mạnh mẽ.
-
gemini-3.1-flash-image-previewTrí tuệ thị giác cấp chuyên nghiệp với hiệu suất tốc độ cao và khả năng tạo nội dung dựa trên thực tế.
-
gemini-3.1-flash-lite-previewMô hình tiết kiệm chi phí nhất của chúng tôi, được tối ưu hoá cho các tác vụ có số lượng lớn, bản dịch và xử lý dữ liệu đơn giản.
-
gemini-3.1-flash-tts-previewTTS Gemini 3.1 Flash: Tạo lời nói mạnh mẽ với độ trễ thấp. Tận hưởng đầu ra tự nhiên, câu lệnh có thể điều hướng và thẻ âm thanh biểu cảm mới để kiểm soát chính xác lời tường thuật.
-
lyria-3-clip-previewMô hình tạo nhạc có độ trễ thấp, được tối ưu hoá cho các đoạn âm thanh có độ trung thực cao và khả năng kiểm soát nhịp điệu chính xác.
-
lyria-3-pro-previewMô hình tạo sinh tiên tiến, tạo toàn bộ bài hát của chúng tôi có khả năng hiểu biết sâu sắc về bố cục, được tối ưu hoá để kiểm soát cấu trúc chính xác và chuyển đổi phức tạp giữa nhiều phong cách âm nhạc.
agent AgentOption (không bắt buộc)
Tên của "Nhân viên hỗ trợ" được dùng để tạo lượt tương tác.
Các giá trị có thể có:
-
deep-research-pro-preview-12-2025Tác nhân Deep Research của Gemini
-
deep-research-preview-04-2026Tác nhân Deep Research của Gemini
-
deep-research-max-preview-04-2026Tác nhân Deep Research Max của Gemini
Bắt buộc. Chỉ có đầu ra. Giá trị nhận dạng riêng biệt cho lượt hoàn tất tương tác.
Bắt buộc. Chỉ có đầu ra. Trạng thái của lượt tương tác.
Các giá trị có thể có:
-
in_progress -
requires_action -
completed -
failed -
cancelled -
incomplete
Bắt buộc. Chỉ có đầu ra. Thời gian tạo phản hồi ở định dạng ISO 8601 (YYYY-MM-DDThh:mm:ssZ).
Bắt buộc. Chỉ có đầu ra. Thời gian cập nhật phản hồi gần đây nhất ở định dạng ISO 8601 (YYYY-MM-DDThh:mm:ssZ).
Chỉ có đầu ra. Vai trò của lượt tương tác.
Hướng dẫn của hệ thống cho lượt tương tác.
tools Tool (không bắt buộc)
Danh sách các khai báo công cụ mà mô hình có thể gọi trong quá trình tương tác.
Các loại có thể có
Bộ phân biệt đa hình: type
Hàm
Một công cụ mà mô hình có thể sử dụng.
Không có mô tả nào được cung cấp.
Luôn đặt thành "function".
Tên của hàm.
Nội dung mô tả về hàm.
Giản đồ JSON cho các tham số của hàm.
CodeExecution
Một công cụ mà mô hình có thể dùng để thực thi mã.
Không có mô tả nào được cung cấp.
Luôn đặt thành "code_execution".
UrlContext
Một công cụ mà mô hình có thể dùng để tìm nạp ngữ cảnh URL.
Không có mô tả nào được cung cấp.
Luôn đặt thành "url_context".
ComputerUse
Một công cụ mà mô hình có thể dùng để tương tác với máy tính.
Không có mô tả nào được cung cấp.
Luôn đặt thành "computer_use".
Môi trường đang hoạt động.
Các giá trị có thể có:
-
browser
Danh sách các hàm được xác định trước bị loại trừ khỏi lệnh gọi mô hình.
McpServer
MCPServer là một máy chủ mà mô hình có thể gọi để thực hiện các hành động.
Không có mô tả nào được cung cấp.
Luôn đặt thành "mcp_server".
Tên của MCPServer.
URL đầy đủ cho điểm cuối MCPServer. Ví dụ: "https://api.example.com/mcp"
Không bắt buộc: Các trường cho tiêu đề xác thực, thời gian chờ, v.v. (nếu cần).
allowed_tools AllowedTools (không bắt buộc)
Các công cụ được phép.
Trường
mode ToolChoiceType (không bắt buộc)
Chế độ lựa chọn công cụ.
Các giá trị có thể có:
-
auto -
any -
none -
validated
Tên của các công cụ được phép.
GoogleSearch
Một công cụ mà mô hình có thể dùng để tìm kiếm trên Google.
Không có mô tả nào được cung cấp.
Luôn đặt thành "google_search".
Các loại thông tin cơ sở để tìm kiếm cần bật.
Các giá trị có thể có:
-
web_search -
image_search -
enterprise_web_search
FileSearch
Một công cụ mà mô hình có thể dùng để tìm kiếm tệp.
Không có mô tả nào được cung cấp.
Luôn đặt thành "file_search".
Tên cửa hàng tìm kiếm tệp để tìm kiếm.
Số lượng đoạn truy xuất ngữ nghĩa cần truy xuất.
Bộ lọc siêu dữ liệu để áp dụng cho các tài liệu và khối truy xuất ngữ nghĩa.
GoogleMaps
Một công cụ mà mô hình có thể dùng để gọi Google Maps.
Không có mô tả nào được cung cấp.
Luôn đặt thành "google_maps".
Có trả về mã thông báo ngữ cảnh tiện ích trong kết quả lệnh gọi công cụ của phản hồi hay không.
Vĩ độ của vị trí người dùng.
Kinh độ của vị trí người dùng.
Truy xuất
Một công cụ mà mô hình có thể dùng để truy xuất tệp.
Không có mô tả nào được cung cấp.
Luôn đặt thành "retrieval".
Các loại truy xuất tệp cần bật.
Các giá trị có thể có:
-
vertex_ai_search
vertex_ai_search_config VertexAISearchConfig (không bắt buộc)
Dùng để chỉ định cấu hình cho VertexAISearch.
Trường
Không bắt buộc. Dùng để chỉ định Vertex AI Search.
Không bắt buộc. Dùng để chỉ định các kho dữ liệu của Vertex AI Search.
usage Usage (không bắt buộc)
Chỉ có đầu ra. Số liệu thống kê về việc sử dụng mã thông báo của yêu cầu tương tác.
Trường
Số lượng mã thông báo trong câu lệnh (ngữ cảnh).
input_tokens_by_modality ModalityTokens (không bắt buộc)
Thông tin chi tiết về mức sử dụng mã thông báo đầu vào theo phương thức.
Trường
phương thức ResponseModality (không bắt buộc)
Phương thức liên kết với số lượng mã thông báo.
Các giá trị có thể có:
-
text -
image -
audio -
video -
document
Số lượng mã thông báo cho phương thức.
Số lượng mã thông báo trong phần được lưu vào bộ nhớ đệm của câu lệnh (nội dung được lưu vào bộ nhớ đệm).
cached_tokens_by_modality ModalityTokens (không bắt buộc)
Bảng chi tiết về việc sử dụng mã thông báo được lưu vào bộ nhớ đệm theo phương thức.
Trường
phương thức ResponseModality (không bắt buộc)
Phương thức liên kết với số lượng mã thông báo.
Các giá trị có thể có:
-
text -
image -
audio -
video -
document
Số lượng mã thông báo cho phương thức.
Tổng số mã thông báo trong tất cả các câu trả lời được tạo.
output_tokens_by_modality ModalityTokens (không bắt buộc)
Thông tin chi tiết về việc sử dụng mã thông báo đầu ra theo phương thức.
Trường
phương thức ResponseModality (không bắt buộc)
Phương thức liên kết với số lượng mã thông báo.
Các giá trị có thể có:
-
text -
image -
audio -
video -
document
Số lượng mã thông báo cho phương thức.
Số lượng mã thông báo có trong(các) câu lệnh sử dụng công cụ.
tool_use_tokens_by_modality ModalityTokens (không bắt buộc)
Bảng chi tiết về việc sử dụng mã thông báo sử dụng công cụ theo phương thức.
Trường
phương thức ResponseModality (không bắt buộc)
Phương thức liên kết với số lượng mã thông báo.
Các giá trị có thể có:
-
text -
image -
audio -
video -
document
Số lượng mã thông báo cho phương thức.
Số lượng mã thông báo về suy nghĩ đối với mô hình tư duy.
Tổng số mã thông báo cho yêu cầu tương tác (lời nhắc + câu trả lời + các mã thông báo nội bộ khác).
grounding_tool_count GroundingToolCount (không bắt buộc)
Số lượng công cụ tiếp đất.
Trường
Loại công cụ cơ sở liên kết với số lượng.
Các giá trị có thể có:
-
google_search -
google_maps -
retrieval
Số lượng công cụ tiếp đất.
response_modalities ResponseModality (không bắt buộc)
Các phương thức phản hồi được yêu cầu (VĂN BẢN, HÌNH ẢNH, ÂM THANH).
Các giá trị có thể có:
-
text -
image -
audio -
video -
document
Loại MIME của phản hồi. Bạn phải cung cấp thông tin này nếu đã đặt response_format.
Mã của lượt tương tác trước đó (nếu có).
service_tier ServiceTier (không bắt buộc)
Cấp dịch vụ cho lượt tương tác.
Các giá trị có thể có:
-
flex -
standard -
priority
webhook_config WebhookConfig (không bắt buộc)
Không bắt buộc. Cấu hình Webhook để nhận thông báo khi quá trình tương tác hoàn tất.
Trường
Không bắt buộc. Nếu được đặt, các URI webhook này sẽ được dùng cho các sự kiện webhook thay vì các webhook đã đăng ký.
Không bắt buộc. Siêu dữ liệu người dùng sẽ được trả về trên mỗi lần phát sự kiện cho webhook.
steps Step (không bắt buộc)
Chỉ có đầu ra. Các bước tạo nên hoạt động tương tác.
Các loại có thể có
Bộ phân biệt đa hình: type
UserInputStep
Thông tin đầu vào do người dùng cung cấp.
Không có mô tả nào được cung cấp.
Luôn đặt thành "user_input".
content Nội dung (không bắt buộc)
Không có mô tả nào được cung cấp.
Các loại có thể có
Bộ phân biệt đa hình: type
TextContent
Một khối nội dung văn bản.
Không có mô tả nào được cung cấp.
Luôn đặt thành "text".
Bắt buộc. Nội dung văn bản.
annotations Chú thích (không bắt buộc)
Thông tin trích dẫn cho nội dung do mô hình tạo.
Các loại có thể có
Bộ phân biệt đa hình: type
UrlCitation
Chú thích trích dẫn URL.
Không có mô tả nào được cung cấp.
Luôn đặt thành "url_citation".
URL.
Tiêu đề của URL.
Điểm bắt đầu của đoạn phản hồi được phân bổ cho nguồn này. Chỉ mục cho biết điểm bắt đầu của đoạn, được đo bằng byte.
Kết thúc phân đoạn được phân bổ, không bao gồm.
FileCitation
Chú thích trích dẫn tệp.
Không có mô tả nào được cung cấp.
Luôn đặt thành "file_citation".
URI của tệp.
Tên của tệp.
Nguồn được phân bổ cho một phần văn bản.
Siêu dữ liệu do người dùng cung cấp về ngữ cảnh đã truy xuất.
Số trang của tài liệu được trích dẫn (nếu có).
Mã nhận dạng nội dung nghe nhìn trong trường hợp trích dẫn hình ảnh (nếu có).
Điểm bắt đầu của đoạn phản hồi được phân bổ cho nguồn này. Chỉ mục cho biết điểm bắt đầu của đoạn, được đo bằng byte.
Kết thúc phân đoạn được phân bổ, không bao gồm.
PlaceCitation
Chú thích trích dẫn địa điểm.
Không có mô tả nào được cung cấp.
Luôn đặt thành "place_citation".
Mã nhận dạng của địa điểm, ở định dạng "places/{place_id}".
Tên của địa điểm.
URI tham chiếu của địa điểm.
review_snippets ReviewSnippet (không bắt buộc)
Đoạn trích trong bài đánh giá được dùng để tạo câu trả lời về các tính năng của một địa điểm cụ thể trên Google Maps.
Trường
Tiêu đề của bài đánh giá.
Đường liên kết tương ứng với bài đánh giá của người dùng trên Google Maps.
Mã của đoạn trích thông tin đánh giá.
Điểm bắt đầu của đoạn phản hồi được phân bổ cho nguồn này. Chỉ mục cho biết điểm bắt đầu của đoạn, được đo bằng byte.
Kết thúc phân đoạn được phân bổ, không bao gồm.
ImageContent
Một khối nội dung hình ảnh.
Không có mô tả nào được cung cấp.
Luôn đặt thành "image".
Nội dung hình ảnh.
URI của hình ảnh.
Loại MIME của hình ảnh.
Các giá trị có thể có:
-
image/png -
image/jpeg -
image/webp -
image/heic -
image/heif -
image/gif -
image/bmp -
image/tiff
resolution MediaResolution (không bắt buộc)
Độ phân giải của nội dung nghe nhìn.
Các giá trị có thể có:
-
low -
medium -
high -
ultra_high
AudioContent
Một khối nội dung âm thanh.
Không có mô tả nào được cung cấp.
Luôn đặt thành "audio".
Nội dung âm thanh.
URI của âm thanh.
Loại MIME của âm thanh.
Các giá trị có thể có:
-
audio/wav -
audio/mp3 -
audio/aiff -
audio/aac -
audio/ogg -
audio/flac -
audio/mpeg -
audio/m4a -
audio/l16 -
audio/opus -
audio/alaw -
audio/mulaw
Số lượng kênh âm thanh.
Tốc độ lấy mẫu của âm thanh.
DocumentContent
Một khối nội dung tài liệu.
Không có mô tả nào được cung cấp.
Luôn đặt thành "document".
Nội dung tài liệu.
URI của tài liệu.
Loại MIME của tài liệu.
Các giá trị có thể có:
-
application/pdf
VideoContent
Một khối nội dung video.
Không có mô tả nào được cung cấp.
Luôn đặt thành "video".
Nội dung video.
URI của video.
Loại MIME của video.
Các giá trị có thể có:
-
video/mp4 -
video/mpeg -
video/mpg -
video/mov -
video/avi -
video/x-flv -
video/webm -
video/wmv -
video/3gpp
resolution MediaResolution (không bắt buộc)
Độ phân giải của nội dung nghe nhìn.
Các giá trị có thể có:
-
low -
medium -
high -
ultra_high
ModelOutputStep
Đầu ra do mô hình tạo.
Không có mô tả nào được cung cấp.
Luôn đặt thành "model_output".
content Nội dung (không bắt buộc)
Không có mô tả nào được cung cấp.
Các loại có thể có
Bộ phân biệt đa hình: type
TextContent
Một khối nội dung văn bản.
Không có mô tả nào được cung cấp.
Luôn đặt thành "text".
Bắt buộc. Nội dung văn bản.
annotations Chú thích (không bắt buộc)
Thông tin trích dẫn cho nội dung do mô hình tạo.
Các loại có thể có
Bộ phân biệt đa hình: type
UrlCitation
Chú thích trích dẫn URL.
Không có mô tả nào được cung cấp.
Luôn đặt thành "url_citation".
URL.
Tiêu đề của URL.
Điểm bắt đầu của đoạn phản hồi được phân bổ cho nguồn này. Chỉ mục cho biết điểm bắt đầu của đoạn, được đo bằng byte.
Kết thúc phân đoạn được phân bổ, không bao gồm.
FileCitation
Chú thích trích dẫn tệp.
Không có mô tả nào được cung cấp.
Luôn đặt thành "file_citation".
URI của tệp.
Tên của tệp.
Nguồn được phân bổ cho một phần văn bản.
Siêu dữ liệu do người dùng cung cấp về ngữ cảnh đã truy xuất.
Số trang của tài liệu được trích dẫn (nếu có).
Mã nhận dạng nội dung nghe nhìn trong trường hợp trích dẫn hình ảnh (nếu có).
Điểm bắt đầu của đoạn phản hồi được phân bổ cho nguồn này. Chỉ mục cho biết điểm bắt đầu của đoạn, được đo bằng byte.
Kết thúc phân đoạn được phân bổ, không bao gồm.
PlaceCitation
Chú thích trích dẫn địa điểm.
Không có mô tả nào được cung cấp.
Luôn đặt thành "place_citation".
Mã nhận dạng của địa điểm, ở định dạng "places/{place_id}".
Tên của địa điểm.
URI tham chiếu của địa điểm.
review_snippets ReviewSnippet (không bắt buộc)
Đoạn trích trong bài đánh giá được dùng để tạo câu trả lời về các tính năng của một địa điểm cụ thể trên Google Maps.
Trường
Tiêu đề của bài đánh giá.
Đường liên kết tương ứng với bài đánh giá của người dùng trên Google Maps.
Mã của đoạn trích thông tin đánh giá.
Điểm bắt đầu của đoạn phản hồi được phân bổ cho nguồn này. Chỉ mục cho biết điểm bắt đầu của đoạn, được đo bằng byte.
Kết thúc phân đoạn được phân bổ, không bao gồm.
ImageContent
Một khối nội dung hình ảnh.
Không có mô tả nào được cung cấp.
Luôn đặt thành "image".
Nội dung hình ảnh.
URI của hình ảnh.
Loại MIME của hình ảnh.
Các giá trị có thể có:
-
image/png -
image/jpeg -
image/webp -
image/heic -
image/heif -
image/gif -
image/bmp -
image/tiff
resolution MediaResolution (không bắt buộc)
Độ phân giải của nội dung nghe nhìn.
Các giá trị có thể có:
-
low -
medium -
high -
ultra_high
AudioContent
Một khối nội dung âm thanh.
Không có mô tả nào được cung cấp.
Luôn đặt thành "audio".
Nội dung âm thanh.
URI của âm thanh.
Loại MIME của âm thanh.
Các giá trị có thể có:
-
audio/wav -
audio/mp3 -
audio/aiff -
audio/aac -
audio/ogg -
audio/flac -
audio/mpeg -
audio/m4a -
audio/l16 -
audio/opus -
audio/alaw -
audio/mulaw
Số lượng kênh âm thanh.
Tốc độ lấy mẫu của âm thanh.
DocumentContent
Một khối nội dung tài liệu.
Không có mô tả nào được cung cấp.
Luôn đặt thành "document".
Nội dung tài liệu.
URI của tài liệu.
Loại MIME của tài liệu.
Các giá trị có thể có:
-
application/pdf
VideoContent
Một khối nội dung video.
Không có mô tả nào được cung cấp.
Luôn đặt thành "video".
Nội dung video.
URI của video.
Loại MIME của video.
Các giá trị có thể có:
-
video/mp4 -
video/mpeg -
video/mpg -
video/mov -
video/avi -
video/x-flv -
video/webm -
video/wmv -
video/3gpp
resolution MediaResolution (không bắt buộc)
Độ phân giải của nội dung nghe nhìn.
Các giá trị có thể có:
-
low -
medium -
high -
ultra_high
ThoughtStep
Một bước tư duy.
Không có mô tả nào được cung cấp.
Luôn đặt thành "thought".
Một hàm băm chữ ký để xác thực phụ trợ.
summary ThoughtSummaryContent (không bắt buộc)
Tóm tắt suy nghĩ.
Các loại có thể có
Bộ phân biệt đa hình: type
TextContent
Một khối nội dung văn bản.
Không có mô tả nào được cung cấp.
Luôn đặt thành "text".
Bắt buộc. Nội dung văn bản.
annotations Chú thích (không bắt buộc)
Thông tin trích dẫn cho nội dung do mô hình tạo.
Các loại có thể có
Bộ phân biệt đa hình: type
UrlCitation
Chú thích trích dẫn URL.
Không có mô tả nào được cung cấp.
Luôn đặt thành "url_citation".
URL.
Tiêu đề của URL.
Điểm bắt đầu của đoạn phản hồi được phân bổ cho nguồn này. Chỉ mục cho biết điểm bắt đầu của đoạn, được đo bằng byte.
Kết thúc phân đoạn được phân bổ, không bao gồm.
FileCitation
Chú thích trích dẫn tệp.
Không có mô tả nào được cung cấp.
Luôn đặt thành "file_citation".
URI của tệp.
Tên của tệp.
Nguồn được phân bổ cho một phần văn bản.
Siêu dữ liệu do người dùng cung cấp về ngữ cảnh đã truy xuất.
Số trang của tài liệu được trích dẫn (nếu có).
Mã nhận dạng nội dung nghe nhìn trong trường hợp trích dẫn hình ảnh (nếu có).
Điểm bắt đầu của đoạn phản hồi được phân bổ cho nguồn này. Chỉ mục cho biết điểm bắt đầu của đoạn, được đo bằng byte.
Kết thúc phân đoạn được phân bổ, không bao gồm.
PlaceCitation
Chú thích trích dẫn địa điểm.
Không có mô tả nào được cung cấp.
Luôn đặt thành "place_citation".
Mã nhận dạng của địa điểm, ở định dạng "places/{place_id}".
Tên của địa điểm.
URI tham chiếu của địa điểm.
review_snippets ReviewSnippet (không bắt buộc)
Đoạn trích trong bài đánh giá được dùng để tạo câu trả lời về các tính năng của một địa điểm cụ thể trên Google Maps.
Trường
Tiêu đề của bài đánh giá.
Đường liên kết tương ứng với bài đánh giá của người dùng trên Google Maps.
Mã của đoạn trích thông tin đánh giá.
Điểm bắt đầu của đoạn phản hồi được phân bổ cho nguồn này. Chỉ mục cho biết điểm bắt đầu của đoạn, được đo bằng byte.
Kết thúc phân đoạn được phân bổ, không bao gồm.
ImageContent
Một khối nội dung hình ảnh.
Không có mô tả nào được cung cấp.
Luôn đặt thành "image".
Nội dung hình ảnh.
URI của hình ảnh.
Loại MIME của hình ảnh.
Các giá trị có thể có:
-
image/png -
image/jpeg -
image/webp -
image/heic -
image/heif -
image/gif -
image/bmp -
image/tiff
resolution MediaResolution (không bắt buộc)
Độ phân giải của nội dung nghe nhìn.
Các giá trị có thể có:
-
low -
medium -
high -
ultra_high
FunctionCallStep
Một bước gọi công cụ hàm.
Không có mô tả nào được cung cấp.
Luôn đặt thành "function_call".
Bắt buộc. Tên của công cụ cần gọi.
Bắt buộc. Các đối số cần truyền vào hàm.
Bắt buộc. Mã nhận dạng duy nhất cho lệnh gọi công cụ cụ thể này.
Một hàm băm chữ ký để xác thực phụ trợ.
CodeExecutionCallStep
Bước gọi thực thi mã.
Không có mô tả nào được cung cấp.
Luôn đặt thành "code_execution_call".
arguments CodeExecutionCallStepArguments (bắt buộc)
Bắt buộc. Các đối số cần truyền đến quá trình thực thi mã.
Trường
Ngôn ngữ lập trình của "code".
Các giá trị có thể có:
-
python
Mã cần thực thi.
Bắt buộc. Mã nhận dạng duy nhất cho lệnh gọi công cụ cụ thể này.
Một hàm băm chữ ký để xác thực phụ trợ.
UrlContextCallStep
Bước gọi ngữ cảnh URL.
Không có mô tả nào được cung cấp.
Luôn đặt thành "url_context_call".
arguments UrlContextCallStepArguments (bắt buộc)
Bắt buộc. Các đối số cần chuyển đến ngữ cảnh URL.
Trường
Các URL cần tìm nạp.
Bắt buộc. Mã nhận dạng duy nhất cho lệnh gọi công cụ cụ thể này.
Một hàm băm chữ ký để xác thực phụ trợ.
McpServerToolCallStep
Bước gọi công cụ MCPServer.
Không có mô tả nào được cung cấp.
Luôn đặt thành "mcp_server_tool_call".
Bắt buộc. Tên của công cụ đã được gọi.
Bắt buộc. Tên của máy chủ MCP được dùng.
Bắt buộc. Đối tượng JSON của các đối số cho hàm.
Bắt buộc. Mã nhận dạng duy nhất cho lệnh gọi công cụ cụ thể này.
Một hàm băm chữ ký để xác thực phụ trợ.
GoogleSearchCallStep
Bước gọi trên Google Tìm kiếm.
Không có mô tả nào được cung cấp.
Luôn đặt thành "google_search_call".
arguments GoogleSearchCallStepArguments (bắt buộc)
Bắt buộc. Các đối số cần truyền đến Google Tìm kiếm.
Trường
Cụm từ tìm kiếm trên web để tìm kiếm trên web sau đó.
Loại thông tin cơ sở được bật cho hoạt động tìm kiếm.
Các giá trị có thể có:
-
web_search -
image_search -
enterprise_web_search
Bắt buộc. Mã nhận dạng duy nhất cho lệnh gọi công cụ cụ thể này.
Một hàm băm chữ ký để xác thực phụ trợ.
FileSearchCallStep
Bước gọi Tìm kiếm tệp.
Không có mô tả nào được cung cấp.
Luôn đặt thành "file_search_call".
Bắt buộc. Mã nhận dạng duy nhất cho lệnh gọi công cụ cụ thể này.
Một hàm băm chữ ký để xác thực phụ trợ.
GoogleMapsCallStep
Bước gọi qua Google Maps.
Không có mô tả nào được cung cấp.
Luôn đặt thành "google_maps_call".
arguments GoogleMapsCallStepArguments (không bắt buộc)
Các đối số cần truyền đến công cụ Google Maps.
Trường
Các truy vấn sẽ được thực thi.
Bắt buộc. Mã nhận dạng duy nhất cho lệnh gọi công cụ cụ thể này.
Một hàm băm chữ ký để xác thực phụ trợ.
FunctionResultStep
Kết quả của một lệnh gọi công cụ hàm.
Không có mô tả nào được cung cấp.
Luôn đặt thành "function_result".
Tên của công cụ đã được gọi.
Liệu lệnh gọi công cụ có dẫn đến lỗi hay không.
Bắt buộc. Mã nhận dạng khớp với mã nhận dạng trong khối lệnh gọi hàm.
Một hàm băm chữ ký để xác thực phụ trợ.
Kết quả của lệnh gọi công cụ.
CodeExecutionResultStep
Bước kết quả thực thi mã.
Không có mô tả nào được cung cấp.
Luôn đặt thành "code_execution_result".
Bắt buộc. Kết quả của quá trình thực thi mã.
Liệu quá trình thực thi mã có dẫn đến lỗi hay không.
Bắt buộc. Mã nhận dạng khớp với mã nhận dạng trong khối lệnh gọi hàm.
Một hàm băm chữ ký để xác thực phụ trợ.
UrlContextResultStep
Bước kết quả theo bối cảnh URL.
Không có mô tả nào được cung cấp.
Luôn đặt thành "url_context_result".
result UrlContextResultItem (bắt buộc)
Bắt buộc. Kết quả của bối cảnh URL.
Trường
URL đã được tìm nạp.
Trạng thái truy xuất URL.
Các giá trị có thể có:
-
success -
error -
paywall -
unsafe
Liệu bối cảnh URL có gây ra lỗi hay không.
Bắt buộc. Mã nhận dạng khớp với mã nhận dạng trong khối lệnh gọi hàm.
Một hàm băm chữ ký để xác thực phụ trợ.
GoogleSearchResultStep
Bước kết quả tìm kiếm trên Google.
Không có mô tả nào được cung cấp.
Luôn đặt thành "google_search_result".
result GoogleSearchResultItem (bắt buộc)
Bắt buộc. Kết quả của Google Tìm kiếm.
Trường
Đoạn nội dung web có thể được nhúng vào một trang web hoặc webview của ứng dụng.
Liệu Google Tìm kiếm có xảy ra lỗi hay không.
Bắt buộc. Mã nhận dạng khớp với mã nhận dạng trong khối lệnh gọi hàm.
Một hàm băm chữ ký để xác thực phụ trợ.
McpServerToolResultStep
Bước kết quả của công cụ MCPServer.
Không có mô tả nào được cung cấp.
Luôn đặt thành "mcp_server_tool_result".
Tên của công cụ được gọi cho lệnh gọi công cụ cụ thể này.
Tên của máy chủ MCP được dùng.
Bắt buộc. Mã nhận dạng khớp với mã nhận dạng trong khối lệnh gọi hàm.
Một hàm băm chữ ký để xác thực phụ trợ.
Đầu ra từ lệnh gọi máy chủ MCP. Có thể là văn bản đơn giản hoặc nội dung đa dạng thức.
FileSearchResultStep
Bước Kết quả tìm kiếm tệp.
Không có mô tả nào được cung cấp.
Luôn đặt thành "file_search_result".
Bắt buộc. Mã nhận dạng khớp với mã nhận dạng trong khối lệnh gọi hàm.
Một hàm băm chữ ký để xác thực phụ trợ.
GoogleMapsResultStep
Bước kết quả trên Google Maps.
Không có mô tả nào được cung cấp.
Luôn đặt thành "google_maps_result".
result GoogleMapsResultItem (bắt buộc)
Không có mô tả nào được cung cấp.
Trường
places GoogleMapsResultPlaces (không bắt buộc)
Không có mô tả nào được cung cấp.
Trường
Không có mô tả nào được cung cấp.
Không có mô tả nào được cung cấp.
Không có mô tả nào được cung cấp.
review_snippets ReviewSnippet (không bắt buộc)
Không có mô tả nào được cung cấp.
Trường
Tiêu đề của bài đánh giá.
Đường liên kết tương ứng với bài đánh giá của người dùng trên Google Maps.
Mã của đoạn trích thông tin đánh giá.
Không có mô tả nào được cung cấp.
Bắt buộc. Mã nhận dạng khớp với mã nhận dạng trong khối lệnh gọi hàm.
Một hàm băm chữ ký để xác thực phụ trợ.
Đầu vào cho lượt tương tác.
Buộc phản hồi được tạo phải là một đối tượng JSON tuân thủ giản đồ JSON được chỉ định trong trường này.
agent_config object (không bắt buộc)
Thông số cấu hình cho hoạt động tương tác của nhân viên hỗ trợ.
Các loại có thể có
Bộ phân biệt đa hình: type
DynamicAgentConfig
Cấu hình cho các tác nhân động.
Không có mô tả nào được cung cấp.
Luôn đặt thành "dynamic".
DeepResearchAgentConfig
Cấu hình cho tác nhân Deep Research.
Không có mô tả nào được cung cấp.
Luôn đặt thành "deep-research".
thinking_summaries ThinkingSummaries (không bắt buộc)
Có nên đưa bản tóm tắt suy nghĩ vào câu trả lời hay không.
Các giá trị có thể có:
-
auto -
none
Có nên đưa hình ảnh trực quan vào câu trả lời hay không.
Các giá trị có thể có:
-
off -
auto
Cho phép lập kế hoạch có sự tham gia của con người cho tác nhân Deep Research. Nếu được đặt thành true, tác nhân Deep Research sẽ cung cấp một kế hoạch nghiên cứu trong phản hồi của mình. Sau đó, tác nhân sẽ chỉ tiếp tục nếu người dùng xác nhận kế hoạch ở lượt tiếp theo.
Mã thông báo event_id sẽ được dùng để tiếp tục luồng tương tác, bắt đầu từ sự kiện này.
InteractionStatusUpdate
Không có mô tả nào được cung cấp.
Luôn đặt thành "interaction.status_update".
Không có mô tả nào được cung cấp.
Không có mô tả nào được cung cấp.
Các giá trị có thể có:
-
in_progress -
requires_action -
completed -
failed -
cancelled -
incomplete
Mã thông báo event_id sẽ được dùng để tiếp tục luồng tương tác, bắt đầu từ sự kiện này.
ErrorEvent
Không có mô tả nào được cung cấp.
Luôn đặt thành "error".
error Error (không bắt buộc)
Không có mô tả nào được cung cấp.
Trường
Một URI xác định loại lỗi.
Thông báo lỗi mà con người có thể đọc được.
Mã thông báo event_id sẽ được dùng để tiếp tục luồng tương tác, bắt đầu từ sự kiện này.
StepStart
Không có mô tả nào được cung cấp.
Luôn đặt thành "step.start".
Không có mô tả nào được cung cấp.
step Bước (bắt buộc)
Không có mô tả nào được cung cấp.
Các loại có thể có
Bộ phân biệt đa hình: type
UserInputStep
Thông tin đầu vào do người dùng cung cấp.
Không có mô tả nào được cung cấp.
Luôn đặt thành "user_input".
content Nội dung (không bắt buộc)
Không có mô tả nào được cung cấp.
Các loại có thể có
Bộ phân biệt đa hình: type
TextContent
Một khối nội dung văn bản.
Không có mô tả nào được cung cấp.
Luôn đặt thành "text".
Bắt buộc. Nội dung văn bản.
annotations Chú thích (không bắt buộc)
Thông tin trích dẫn cho nội dung do mô hình tạo.
Các loại có thể có
Bộ phân biệt đa hình: type
UrlCitation
Chú thích trích dẫn URL.
Không có mô tả nào được cung cấp.
Luôn đặt thành "url_citation".
URL.
Tiêu đề của URL.
Điểm bắt đầu của đoạn phản hồi được phân bổ cho nguồn này. Chỉ mục cho biết điểm bắt đầu của đoạn, được đo bằng byte.
Kết thúc phân đoạn được phân bổ, không bao gồm.
FileCitation
Chú thích trích dẫn tệp.
Không có mô tả nào được cung cấp.
Luôn đặt thành "file_citation".
URI của tệp.
Tên của tệp.
Nguồn được phân bổ cho một phần văn bản.
Siêu dữ liệu do người dùng cung cấp về ngữ cảnh đã truy xuất.
Số trang của tài liệu được trích dẫn (nếu có).
Mã nhận dạng nội dung nghe nhìn trong trường hợp trích dẫn hình ảnh (nếu có).
Điểm bắt đầu của đoạn phản hồi được phân bổ cho nguồn này. Chỉ mục cho biết điểm bắt đầu của đoạn, được đo bằng byte.
Kết thúc phân đoạn được phân bổ, không bao gồm.
PlaceCitation
Chú thích trích dẫn địa điểm.
Không có mô tả nào được cung cấp.
Luôn đặt thành "place_citation".
Mã nhận dạng của địa điểm, ở định dạng "places/{place_id}".
Tên của địa điểm.
URI tham chiếu của địa điểm.
review_snippets ReviewSnippet (không bắt buộc)
Đoạn trích trong bài đánh giá được dùng để tạo câu trả lời về các tính năng của một địa điểm cụ thể trên Google Maps.
Trường
Tiêu đề của bài đánh giá.
Đường liên kết tương ứng với bài đánh giá của người dùng trên Google Maps.
Mã của đoạn trích thông tin đánh giá.
Điểm bắt đầu của đoạn phản hồi được phân bổ cho nguồn này. Chỉ mục cho biết điểm bắt đầu của đoạn, được đo bằng byte.
Kết thúc phân đoạn được phân bổ, không bao gồm.
ImageContent
Một khối nội dung hình ảnh.
Không có mô tả nào được cung cấp.
Luôn đặt thành "image".
Nội dung hình ảnh.
URI của hình ảnh.
Loại MIME của hình ảnh.
Các giá trị có thể có:
-
image/png -
image/jpeg -
image/webp -
image/heic -
image/heif -
image/gif -
image/bmp -
image/tiff
resolution MediaResolution (không bắt buộc)
Độ phân giải của nội dung nghe nhìn.
Các giá trị có thể có:
-
low -
medium -
high -
ultra_high
AudioContent
Một khối nội dung âm thanh.
Không có mô tả nào được cung cấp.
Luôn đặt thành "audio".
Nội dung âm thanh.
URI của âm thanh.
Loại MIME của âm thanh.
Các giá trị có thể có:
-
audio/wav -
audio/mp3 -
audio/aiff -
audio/aac -
audio/ogg -
audio/flac -
audio/mpeg -
audio/m4a -
audio/l16 -
audio/opus -
audio/alaw -
audio/mulaw
Số lượng kênh âm thanh.
Tốc độ lấy mẫu của âm thanh.
DocumentContent
Một khối nội dung tài liệu.
Không có mô tả nào được cung cấp.
Luôn đặt thành "document".
Nội dung tài liệu.
URI của tài liệu.
Loại MIME của tài liệu.
Các giá trị có thể có:
-
application/pdf
VideoContent
Một khối nội dung video.
Không có mô tả nào được cung cấp.
Luôn đặt thành "video".
Nội dung video.
URI của video.
Loại MIME của video.
Các giá trị có thể có:
-
video/mp4 -
video/mpeg -
video/mpg -
video/mov -
video/avi -
video/x-flv -
video/webm -
video/wmv -
video/3gpp
resolution MediaResolution (không bắt buộc)
Độ phân giải của nội dung nghe nhìn.
Các giá trị có thể có:
-
low -
medium -
high -
ultra_high
ModelOutputStep
Đầu ra do mô hình tạo.
Không có mô tả nào được cung cấp.
Luôn đặt thành "model_output".
content Nội dung (không bắt buộc)
Không có mô tả nào được cung cấp.
Các loại có thể có
Bộ phân biệt đa hình: type
TextContent
Một khối nội dung văn bản.
Không có mô tả nào được cung cấp.
Luôn đặt thành "text".
Bắt buộc. Nội dung văn bản.
annotations Chú thích (không bắt buộc)
Thông tin trích dẫn cho nội dung do mô hình tạo.
Các loại có thể có
Bộ phân biệt đa hình: type
UrlCitation
Chú thích trích dẫn URL.
Không có mô tả nào được cung cấp.
Luôn đặt thành "url_citation".
URL.
Tiêu đề của URL.
Điểm bắt đầu của đoạn phản hồi được phân bổ cho nguồn này. Chỉ mục cho biết điểm bắt đầu của đoạn, được đo bằng byte.
Kết thúc phân đoạn được phân bổ, không bao gồm.
FileCitation
Chú thích trích dẫn tệp.
Không có mô tả nào được cung cấp.
Luôn đặt thành "file_citation".
URI của tệp.
Tên của tệp.
Nguồn được phân bổ cho một phần văn bản.
Siêu dữ liệu do người dùng cung cấp về ngữ cảnh đã truy xuất.
Số trang của tài liệu được trích dẫn (nếu có).
Mã nhận dạng nội dung nghe nhìn trong trường hợp trích dẫn hình ảnh (nếu có).
Điểm bắt đầu của đoạn phản hồi được phân bổ cho nguồn này. Chỉ mục cho biết điểm bắt đầu của đoạn, được đo bằng byte.
Kết thúc phân đoạn được phân bổ, không bao gồm.
PlaceCitation
Chú thích trích dẫn địa điểm.
Không có mô tả nào được cung cấp.
Luôn đặt thành "place_citation".
Mã nhận dạng của địa điểm, ở định dạng "places/{place_id}".
Tên của địa điểm.
URI tham chiếu của địa điểm.
review_snippets ReviewSnippet (không bắt buộc)
Đoạn trích trong bài đánh giá được dùng để tạo câu trả lời về các tính năng của một địa điểm cụ thể trên Google Maps.
Trường
Tiêu đề của bài đánh giá.
Đường liên kết tương ứng với bài đánh giá của người dùng trên Google Maps.
Mã của đoạn trích thông tin đánh giá.
Điểm bắt đầu của đoạn phản hồi được phân bổ cho nguồn này. Chỉ mục cho biết điểm bắt đầu của đoạn, được đo bằng byte.
Kết thúc phân đoạn được phân bổ, không bao gồm.
ImageContent
Một khối nội dung hình ảnh.
Không có mô tả nào được cung cấp.
Luôn đặt thành "image".
Nội dung hình ảnh.
URI của hình ảnh.
Loại MIME của hình ảnh.
Các giá trị có thể có:
-
image/png -
image/jpeg -
image/webp -
image/heic -
image/heif -
image/gif -
image/bmp -
image/tiff
resolution MediaResolution (không bắt buộc)
Độ phân giải của nội dung nghe nhìn.
Các giá trị có thể có:
-
low -
medium -
high -
ultra_high
AudioContent
Một khối nội dung âm thanh.
Không có mô tả nào được cung cấp.
Luôn đặt thành "audio".
Nội dung âm thanh.
URI của âm thanh.
Loại MIME của âm thanh.
Các giá trị có thể có:
-
audio/wav -
audio/mp3 -
audio/aiff -
audio/aac -
audio/ogg -
audio/flac -
audio/mpeg -
audio/m4a -
audio/l16 -
audio/opus -
audio/alaw -
audio/mulaw
Số lượng kênh âm thanh.
Tốc độ lấy mẫu của âm thanh.
DocumentContent
Một khối nội dung tài liệu.
Không có mô tả nào được cung cấp.
Luôn đặt thành "document".
Nội dung tài liệu.
URI của tài liệu.
Loại MIME của tài liệu.
Các giá trị có thể có:
-
application/pdf
VideoContent
Một khối nội dung video.
Không có mô tả nào được cung cấp.
Luôn đặt thành "video".
Nội dung video.
URI của video.
Loại MIME của video.
Các giá trị có thể có:
-
video/mp4 -
video/mpeg -
video/mpg -
video/mov -
video/avi -
video/x-flv -
video/webm -
video/wmv -
video/3gpp
resolution MediaResolution (không bắt buộc)
Độ phân giải của nội dung nghe nhìn.
Các giá trị có thể có:
-
low -
medium -
high -
ultra_high
ThoughtStep
Một bước tư duy.
Không có mô tả nào được cung cấp.
Luôn đặt thành "thought".
Một hàm băm chữ ký để xác thực phụ trợ.
summary ThoughtSummaryContent (không bắt buộc)
Tóm tắt suy nghĩ.
Các loại có thể có
Bộ phân biệt đa hình: type
TextContent
Một khối nội dung văn bản.
Không có mô tả nào được cung cấp.
Luôn đặt thành "text".
Bắt buộc. Nội dung văn bản.
annotations Chú thích (không bắt buộc)
Thông tin trích dẫn cho nội dung do mô hình tạo.
Các loại có thể có
Bộ phân biệt đa hình: type
UrlCitation
Chú thích trích dẫn URL.
Không có mô tả nào được cung cấp.
Luôn đặt thành "url_citation".
URL.
Tiêu đề của URL.
Điểm bắt đầu của đoạn phản hồi được phân bổ cho nguồn này. Chỉ mục cho biết điểm bắt đầu của đoạn, được đo bằng byte.
Kết thúc phân đoạn được phân bổ, không bao gồm.
FileCitation
Chú thích trích dẫn tệp.
Không có mô tả nào được cung cấp.
Luôn đặt thành "file_citation".
URI của tệp.
Tên của tệp.
Nguồn được phân bổ cho một phần văn bản.
Siêu dữ liệu do người dùng cung cấp về ngữ cảnh đã truy xuất.
Số trang của tài liệu được trích dẫn (nếu có).
Mã nhận dạng nội dung nghe nhìn trong trường hợp trích dẫn hình ảnh (nếu có).
Điểm bắt đầu của đoạn phản hồi được phân bổ cho nguồn này. Chỉ mục cho biết điểm bắt đầu của đoạn, được đo bằng byte.
Kết thúc phân đoạn được phân bổ, không bao gồm.
PlaceCitation
Chú thích trích dẫn địa điểm.
Không có mô tả nào được cung cấp.
Luôn đặt thành "place_citation".
Mã nhận dạng của địa điểm, ở định dạng "places/{place_id}".
Tên của địa điểm.
URI tham chiếu của địa điểm.
review_snippets ReviewSnippet (không bắt buộc)
Đoạn trích trong bài đánh giá được dùng để tạo câu trả lời về các tính năng của một địa điểm cụ thể trên Google Maps.
Trường
Tiêu đề của bài đánh giá.
Đường liên kết tương ứng với bài đánh giá của người dùng trên Google Maps.
Mã của đoạn trích thông tin đánh giá.
Điểm bắt đầu của đoạn phản hồi được phân bổ cho nguồn này. Chỉ mục cho biết điểm bắt đầu của đoạn, được đo bằng byte.
Kết thúc phân đoạn được phân bổ, không bao gồm.
ImageContent
Một khối nội dung hình ảnh.
Không có mô tả nào được cung cấp.
Luôn đặt thành "image".
Nội dung hình ảnh.
URI của hình ảnh.
Loại MIME của hình ảnh.
Các giá trị có thể có:
-
image/png -
image/jpeg -
image/webp -
image/heic -
image/heif -
image/gif -
image/bmp -
image/tiff
resolution MediaResolution (không bắt buộc)
Độ phân giải của nội dung nghe nhìn.
Các giá trị có thể có:
-
low -
medium -
high -
ultra_high
FunctionCallStep
Một bước gọi công cụ hàm.
Không có mô tả nào được cung cấp.
Luôn đặt thành "function_call".
Bắt buộc. Tên của công cụ cần gọi.
Bắt buộc. Các đối số cần truyền vào hàm.
Bắt buộc. Mã nhận dạng duy nhất cho lệnh gọi công cụ cụ thể này.
Một hàm băm chữ ký để xác thực phụ trợ.
CodeExecutionCallStep
Bước gọi thực thi mã.
Không có mô tả nào được cung cấp.
Luôn đặt thành "code_execution_call".
arguments CodeExecutionCallStepArguments (bắt buộc)
Bắt buộc. Các đối số cần truyền đến quá trình thực thi mã.
Trường
Ngôn ngữ lập trình của "code".
Các giá trị có thể có:
-
python
Mã cần thực thi.
Bắt buộc. Mã nhận dạng duy nhất cho lệnh gọi công cụ cụ thể này.
Một hàm băm chữ ký để xác thực phụ trợ.
UrlContextCallStep
Bước gọi ngữ cảnh URL.
Không có mô tả nào được cung cấp.
Luôn đặt thành "url_context_call".
arguments UrlContextCallStepArguments (bắt buộc)
Bắt buộc. Các đối số cần chuyển đến ngữ cảnh URL.
Trường
Các URL cần tìm nạp.
Bắt buộc. Mã nhận dạng duy nhất cho lệnh gọi công cụ cụ thể này.
Một hàm băm chữ ký để xác thực phụ trợ.
McpServerToolCallStep
Bước gọi công cụ MCPServer.
Không có mô tả nào được cung cấp.
Luôn đặt thành "mcp_server_tool_call".
Bắt buộc. Tên của công cụ đã được gọi.
Bắt buộc. Tên của máy chủ MCP được dùng.
Bắt buộc. Đối tượng JSON của các đối số cho hàm.
Bắt buộc. Mã nhận dạng duy nhất cho lệnh gọi công cụ cụ thể này.
Một hàm băm chữ ký để xác thực phụ trợ.
GoogleSearchCallStep
Bước gọi trên Google Tìm kiếm.
Không có mô tả nào được cung cấp.
Luôn đặt thành "google_search_call".
arguments GoogleSearchCallStepArguments (bắt buộc)
Bắt buộc. Các đối số cần truyền đến Google Tìm kiếm.
Trường
Cụm từ tìm kiếm trên web để tìm kiếm trên web sau đó.
Loại thông tin cơ sở được bật cho hoạt động tìm kiếm.
Các giá trị có thể có:
-
web_search -
image_search -
enterprise_web_search
Bắt buộc. Mã nhận dạng duy nhất cho lệnh gọi công cụ cụ thể này.
Một hàm băm chữ ký để xác thực phụ trợ.
FileSearchCallStep
Bước gọi Tìm kiếm tệp.
Không có mô tả nào được cung cấp.
Luôn đặt thành "file_search_call".
Bắt buộc. Mã nhận dạng duy nhất cho lệnh gọi công cụ cụ thể này.
Một hàm băm chữ ký để xác thực phụ trợ.
GoogleMapsCallStep
Bước gọi qua Google Maps.
Không có mô tả nào được cung cấp.
Luôn đặt thành "google_maps_call".
arguments GoogleMapsCallStepArguments (không bắt buộc)
Các đối số cần truyền đến công cụ Google Maps.
Trường
Các truy vấn sẽ được thực thi.
Bắt buộc. Mã nhận dạng duy nhất cho lệnh gọi công cụ cụ thể này.
Một hàm băm chữ ký để xác thực phụ trợ.
FunctionResultStep
Kết quả của một lệnh gọi công cụ hàm.
Không có mô tả nào được cung cấp.
Luôn đặt thành "function_result".
Tên của công cụ đã được gọi.
Liệu lệnh gọi công cụ có dẫn đến lỗi hay không.
Bắt buộc. Mã nhận dạng khớp với mã nhận dạng trong khối lệnh gọi hàm.
Một hàm băm chữ ký để xác thực phụ trợ.
Kết quả của lệnh gọi công cụ.
CodeExecutionResultStep
Bước kết quả thực thi mã.
Không có mô tả nào được cung cấp.
Luôn đặt thành "code_execution_result".
Bắt buộc. Kết quả của quá trình thực thi mã.
Liệu quá trình thực thi mã có dẫn đến lỗi hay không.
Bắt buộc. Mã nhận dạng khớp với mã nhận dạng trong khối lệnh gọi hàm.
Một hàm băm chữ ký để xác thực phụ trợ.
UrlContextResultStep
Bước kết quả theo bối cảnh URL.
Không có mô tả nào được cung cấp.
Luôn đặt thành "url_context_result".
result UrlContextResultItem (bắt buộc)
Bắt buộc. Kết quả của bối cảnh URL.
Trường
URL đã được tìm nạp.
Trạng thái truy xuất URL.
Các giá trị có thể có:
-
success -
error -
paywall -
unsafe
Liệu bối cảnh URL có gây ra lỗi hay không.
Bắt buộc. Mã nhận dạng khớp với mã nhận dạng trong khối lệnh gọi hàm.
Một hàm băm chữ ký để xác thực phụ trợ.
GoogleSearchResultStep
Bước kết quả tìm kiếm trên Google.
Không có mô tả nào được cung cấp.
Luôn đặt thành "google_search_result".
result GoogleSearchResultItem (bắt buộc)
Bắt buộc. Kết quả của Google Tìm kiếm.
Trường
Đoạn nội dung web có thể được nhúng vào một trang web hoặc webview của ứng dụng.
Liệu Google Tìm kiếm có xảy ra lỗi hay không.
Bắt buộc. Mã nhận dạng khớp với mã nhận dạng trong khối lệnh gọi hàm.
Một hàm băm chữ ký để xác thực phụ trợ.
McpServerToolResultStep
Bước kết quả của công cụ MCPServer.
Không có mô tả nào được cung cấp.
Luôn đặt thành "mcp_server_tool_result".
Tên của công cụ được gọi cho lệnh gọi công cụ cụ thể này.
Tên của máy chủ MCP được dùng.
Bắt buộc. Mã nhận dạng khớp với mã nhận dạng trong khối lệnh gọi hàm.
Một hàm băm chữ ký để xác thực phụ trợ.
Đầu ra từ lệnh gọi máy chủ MCP. Có thể là văn bản đơn giản hoặc nội dung đa dạng thức.
FileSearchResultStep
Bước Kết quả tìm kiếm tệp.
Không có mô tả nào được cung cấp.
Luôn đặt thành "file_search_result".
Bắt buộc. Mã nhận dạng khớp với mã nhận dạng trong khối lệnh gọi hàm.
Một hàm băm chữ ký để xác thực phụ trợ.
GoogleMapsResultStep
Bước kết quả trên Google Maps.
Không có mô tả nào được cung cấp.
Luôn đặt thành "google_maps_result".
result GoogleMapsResultItem (bắt buộc)
Không có mô tả nào được cung cấp.
Trường
places GoogleMapsResultPlaces (không bắt buộc)
Không có mô tả nào được cung cấp.
Trường
Không có mô tả nào được cung cấp.
Không có mô tả nào được cung cấp.
Không có mô tả nào được cung cấp.
review_snippets ReviewSnippet (không bắt buộc)
Không có mô tả nào được cung cấp.
Trường
Tiêu đề của bài đánh giá.
Đường liên kết tương ứng với bài đánh giá của người dùng trên Google Maps.
Mã của đoạn trích thông tin đánh giá.
Không có mô tả nào được cung cấp.
Bắt buộc. Mã nhận dạng khớp với mã nhận dạng trong khối lệnh gọi hàm.
Một hàm băm chữ ký để xác thực phụ trợ.
Mã thông báo event_id sẽ được dùng để tiếp tục luồng tương tác, bắt đầu từ sự kiện này.
StepDelta
Không có mô tả nào được cung cấp.
Luôn đặt thành "step.delta".
Không có mô tả nào được cung cấp.
delta StepDeltaData (bắt buộc)
Không có mô tả nào được cung cấp.
Các loại có thể có
Bộ phân biệt đa hình: type
TextDelta
Không có mô tả nào được cung cấp.
Luôn đặt thành "text".
Không có mô tả nào được cung cấp.
ImageDelta
Không có mô tả nào được cung cấp.
Luôn đặt thành "image".
Không có mô tả nào được cung cấp.
Không có mô tả nào được cung cấp.
Không có mô tả nào được cung cấp.
Các giá trị có thể có:
-
image/png -
image/jpeg -
image/webp -
image/heic -
image/heif -
image/gif -
image/bmp -
image/tiff
resolution MediaResolution (không bắt buộc)
Độ phân giải của nội dung nghe nhìn.
Các giá trị có thể có:
-
low -
medium -
high -
ultra_high
AudioDelta
Không có mô tả nào được cung cấp.
Luôn đặt thành "audio".
Không có mô tả nào được cung cấp.
Không có mô tả nào được cung cấp.
Không có mô tả nào được cung cấp.
Các giá trị có thể có:
-
audio/wav -
audio/mp3 -
audio/aiff -
audio/aac -
audio/ogg -
audio/flac -
audio/mpeg -
audio/m4a -
audio/l16 -
audio/opus -
audio/alaw -
audio/mulaw
Không dùng nữa. Thay vào đó, hãy sử dụng sample_rate. Giá trị này sẽ bị bỏ qua.
Tốc độ lấy mẫu của âm thanh.
Số lượng kênh âm thanh.
DocumentDelta
Không có mô tả nào được cung cấp.
Luôn đặt thành "document".
Không có mô tả nào được cung cấp.
Không có mô tả nào được cung cấp.
Không có mô tả nào được cung cấp.
Các giá trị có thể có:
-
application/pdf
VideoDelta
Không có mô tả nào được cung cấp.
Luôn đặt thành "video".
Không có mô tả nào được cung cấp.
Không có mô tả nào được cung cấp.
Không có mô tả nào được cung cấp.
Các giá trị có thể có:
-
video/mp4 -
video/mpeg -
video/mpg -
video/mov -
video/avi -
video/x-flv -
video/webm -
video/wmv -
video/3gpp
resolution MediaResolution (không bắt buộc)
Độ phân giải của nội dung nghe nhìn.
Các giá trị có thể có:
-
low -
medium -
high -
ultra_high
ThoughtSummaryDelta
Không có mô tả nào được cung cấp.
Luôn đặt thành "thought_summary".
content ThoughtSummaryContent (không bắt buộc)
Một mục tóm tắt mới sẽ được thêm vào suy nghĩ.
Các loại có thể có
Bộ phân biệt đa hình: type
TextContent
Một khối nội dung văn bản.
Không có mô tả nào được cung cấp.
Luôn đặt thành "text".
Bắt buộc. Nội dung văn bản.
annotations Chú thích (không bắt buộc)
Thông tin trích dẫn cho nội dung do mô hình tạo.
Các loại có thể có
Bộ phân biệt đa hình: type
UrlCitation
Chú thích trích dẫn URL.
Không có mô tả nào được cung cấp.
Luôn đặt thành "url_citation".
URL.
Tiêu đề của URL.
Điểm bắt đầu của đoạn phản hồi được phân bổ cho nguồn này. Chỉ mục cho biết điểm bắt đầu của đoạn, được đo bằng byte.
Kết thúc phân đoạn được phân bổ, không bao gồm.
FileCitation
Chú thích trích dẫn tệp.
Không có mô tả nào được cung cấp.
Luôn đặt thành "file_citation".
URI của tệp.
Tên của tệp.
Nguồn được phân bổ cho một phần văn bản.
Siêu dữ liệu do người dùng cung cấp về ngữ cảnh đã truy xuất.
Số trang của tài liệu được trích dẫn (nếu có).
Mã nhận dạng nội dung nghe nhìn trong trường hợp trích dẫn hình ảnh (nếu có).
Điểm bắt đầu của đoạn phản hồi được phân bổ cho nguồn này. Chỉ mục cho biết điểm bắt đầu của đoạn, được đo bằng byte.
Kết thúc phân đoạn được phân bổ, không bao gồm.
PlaceCitation
Chú thích trích dẫn địa điểm.
Không có mô tả nào được cung cấp.
Luôn đặt thành "place_citation".
Mã nhận dạng của địa điểm, ở định dạng "places/{place_id}".
Tên của địa điểm.
URI tham chiếu của địa điểm.
review_snippets ReviewSnippet (không bắt buộc)
Đoạn trích trong bài đánh giá được dùng để tạo câu trả lời về các tính năng của một địa điểm cụ thể trên Google Maps.
Trường
Tiêu đề của bài đánh giá.
Đường liên kết tương ứng với bài đánh giá của người dùng trên Google Maps.
Mã của đoạn trích thông tin đánh giá.
Điểm bắt đầu của đoạn phản hồi được phân bổ cho nguồn này. Chỉ mục cho biết điểm bắt đầu của đoạn, được đo bằng byte.
Kết thúc phân đoạn được phân bổ, không bao gồm.
ImageContent
Một khối nội dung hình ảnh.
Không có mô tả nào được cung cấp.
Luôn đặt thành "image".
Nội dung hình ảnh.
URI của hình ảnh.
Loại MIME của hình ảnh.
Các giá trị có thể có:
-
image/png -
image/jpeg -
image/webp -
image/heic -
image/heif -
image/gif -
image/bmp -
image/tiff
resolution MediaResolution (không bắt buộc)
Độ phân giải của nội dung nghe nhìn.
Các giá trị có thể có:
-
low -
medium -
high -
ultra_high
ThoughtSignatureDelta
Không có mô tả nào được cung cấp.
Luôn đặt thành "thought_signature".
Chữ ký khớp với nguồn phụ trợ sẽ là một phần của quá trình tạo.
TextAnnotationDelta
Không có mô tả nào được cung cấp.
Luôn đặt thành "text_annotation_delta".
annotations Chú thích (không bắt buộc)
Thông tin trích dẫn cho nội dung do mô hình tạo.
Các loại có thể có
Bộ phân biệt đa hình: type
UrlCitation
Chú thích trích dẫn URL.
Không có mô tả nào được cung cấp.
Luôn đặt thành "url_citation".
URL.
Tiêu đề của URL.
Điểm bắt đầu của đoạn phản hồi được phân bổ cho nguồn này. Chỉ mục cho biết điểm bắt đầu của đoạn, được đo bằng byte.
Kết thúc phân đoạn được phân bổ, không bao gồm.
FileCitation
Chú thích trích dẫn tệp.
Không có mô tả nào được cung cấp.
Luôn đặt thành "file_citation".
URI của tệp.
Tên của tệp.
Nguồn được phân bổ cho một phần văn bản.
Siêu dữ liệu do người dùng cung cấp về ngữ cảnh đã truy xuất.
Số trang của tài liệu được trích dẫn (nếu có).
Mã nhận dạng nội dung nghe nhìn trong trường hợp trích dẫn hình ảnh (nếu có).
Điểm bắt đầu của đoạn phản hồi được phân bổ cho nguồn này. Chỉ mục cho biết điểm bắt đầu của đoạn, được đo bằng byte.
Kết thúc phân đoạn được phân bổ, không bao gồm.
PlaceCitation
Chú thích trích dẫn địa điểm.
Không có mô tả nào được cung cấp.
Luôn đặt thành "place_citation".
Mã nhận dạng của địa điểm, ở định dạng "places/{place_id}".
Tên của địa điểm.
URI tham chiếu của địa điểm.
review_snippets ReviewSnippet (không bắt buộc)
Đoạn trích trong bài đánh giá được dùng để tạo câu trả lời về các tính năng của một địa điểm cụ thể trên Google Maps.
Trường
Tiêu đề của bài đánh giá.
Đường liên kết tương ứng với bài đánh giá của người dùng trên Google Maps.
Mã của đoạn trích thông tin đánh giá.
Điểm bắt đầu của đoạn phản hồi được phân bổ cho nguồn này. Chỉ mục cho biết điểm bắt đầu của đoạn, được đo bằng byte.
Kết thúc phân đoạn được phân bổ, không bao gồm.
ArgumentsDelta
Không có mô tả nào được cung cấp.
Luôn đặt thành "arguments_delta".
Không có mô tả nào được cung cấp.
Mã thông báo event_id sẽ được dùng để tiếp tục luồng tương tác, bắt đầu từ sự kiện này.
StepStop
Không có mô tả nào được cung cấp.
Luôn đặt thành "step.stop".
Không có mô tả nào được cung cấp.
Mã thông báo event_id sẽ được dùng để tiếp tục luồng tương tác, bắt đầu từ sự kiện này.
Ví dụ
Đã tạo lượt tương tác
{ "event_type": "interaction.created", "interaction": { "id": "v1_ChdXS0l4YWZXTk9xbk0xZThQczhEcmlROBIXV0tJeGFmV05PcW5NMWU4UHM4RHJpUTg", "model": "gemini-3-flash-preview", "status": "in_progress", "created": "2025-12-04T15:01:45Z", "updated": "2025-12-04T15:01:45Z" }, "event_id": "evt_123" }
Đã hoàn tất tương tác
{ "event_type": "interaction.completed", "interaction": { "id": "v1_ChdXS0l4YWZXTk9xbk0xZThQczhEcmlROBIXV0tJeGFmV05PcW5NMWU4UHM4RHJpUTg", "model": "gemini-3-flash-preview", "status": "completed", "created": "2025-12-04T15:01:45Z", "updated": "2025-12-04T15:01:45Z" }, "event_id": "evt_123" }
Thông tin cập nhật về trạng thái tương tác
{ "event_type": "interaction.status_update", "interaction_id": "v1_ChdTMjQ0YWJ5TUF1TzcxZThQdjRpcnFRcxIXUzI0NGFieU1BdU83MWU4UHY0aXJxUXM", "status": "in_progress" }
Sự kiện lỗi
{ "event_type": "error", "error": { "message": "Failed to get completed interaction: Result not found.", "code": "not_found" } }
Bắt đầu bước
{ "event_type": "step.start", "index": 0, "step": { "type": "model_output" } }
Delta bước
{ "event_type": "step.delta", "index": 0, "delta": { "type": "text", "text": "Hello" } }
Dừng theo bước
{ "event_type": "step.stop", "index": 0 }