Tác nhân Antigravity

Tác nhân Antigravity là một tác nhân được quản lý đa năng trên Gemini API. Một lệnh gọi API duy nhất sẽ cung cấp cho bạn một tác nhân có khả năng suy luận, thực thi mã, quản lý tệp và duyệt web trong hộp cát Linux bảo mật của riêng bạn, do Google lưu trữ.

Công cụ này dựa trên Gemini 3.5 Flash và sử dụng cùng một cơ chế như Antigravity IDE. Bạn có thể sử dụng thông qua Interactions APIGoogle AI Studio.

Python

from google import genai

client = genai.Client()

interaction = client.interactions.create(
    agent="antigravity-preview-05-2026",
    input="Read Hacker News, summarize the top 10 stories, and save the results as a PDF.",
    environment="remote",
)

print(interaction.output_text)

JavaScript

import { GoogleGenAI } from "@google/genai";

const client = new GoogleGenAI({});

const interaction = await client.interactions.create({
    agent: "antigravity-preview-05-2026",
    input: "Read Hacker News, summarize the top 10 stories, and save the results as a PDF.",
    environment: "remote",
}, { timeout: 300000 });

console.log(interaction.output_text);

REST

curl -X POST "https://generativelanguage.googleapis.com/v1beta/interactions" \
-H "Content-Type: application/json" \
-H "x-goog-api-key: $GEMINI_API_KEY" \
-H "Api-Revision: 2026-05-20" \
-d '{
    "agent": "antigravity-preview-05-2026",
    "input": "Read Hacker News, summarize the top 10 stories, and save the results as a PDF.",
    "environment": "remote"
}'

Tính năng

Mỗi lệnh gọi có thể cung cấp một hộp cát Linux và bắt đầu một vòng lặp sử dụng công cụ. Tác nhân lập kế hoạch, hành động, quan sát kết quả và lặp lại cho đến khi hoàn thành nhiệm vụ.

  • Thực thi mã: Chạy các lệnh Bash, Python và Node.js. Cài đặt gói, chạy kiểm thử, tạo ứng dụng.
  • Quản lý tệp: Đọc, ghi, chỉnh sửa, tìm kiếm và liệt kê các tệp trong hộp cát. Các tệp vẫn tồn tại trong các lượt tương tác.
  • Quyền truy cập vào web: Google Tìm kiếm và tìm nạp URL để lấy dữ liệu.
  • Nén bối cảnh: Tự động nén bối cảnh (kích hoạt ở khoảng 135.000 mã thông báo) để hỗ trợ các phiên kéo dài nhiều lượt mà không làm mất bối cảnh hoặc vượt quá giới hạn mã thông báo.

Hãy xem phần Bắt đầu nhanh để biết cách sử dụng nhiều lượt và phát trực tuyến.

Các công cụ được hỗ trợ

Theo mặc định, tác nhân có quyền truy cập vào code_execution, google_searchurl_context. Các công cụ hệ thống tệp sẽ tự động được bật khi bạn chỉ định tham số environment. Bạn chỉ cần chỉ định tham số tools khi tuỳ chỉnh hoặc hạn chế bộ mặc định:

Công cụ Giá trị loại Mô tả
Thực thi mã code_execution Chạy các lệnh shell (bash, Python, Node) với tính năng ghi lại stdout/stderr.
Google Tìm kiếm google_search Tìm kiếm trên web công khai.
Ngữ cảnh URL url_context Tìm nạp và đọc các trang web.
Hệ thống tệp (được bật thông qua environment) Đọc, ghi, chỉnh sửa, tìm kiếm và liệt kê các tệp trong hộp cát. Không có loại công cụ riêng biệt – tự động bật khi bạn đặt environment.

Để giới hạn tác nhân ở những công cụ cụ thể, chỉ truyền những công cụ bạn cần:

Python

from google import genai

client = genai.Client()

interaction = client.interactions.create(
    agent="antigravity-preview-05-2026",
    input="Search for the latest AI research papers on reasoning and summarize them.",
    environment="remote",
    tools=[
        {"type": "google_search"},
        {"type": "url_context"},
    ],
)

print(interaction.output_text)

JavaScript

import { GoogleGenAI } from "@google/genai";

const client = new GoogleGenAI({});

const interaction = await client.interactions.create({
    agent: "antigravity-preview-05-2026",
    input: "Search for the latest AI research papers on reasoning and summarize them.",
    environment: "remote",
    tools: [
        { type: "google_search" },
        { type: "url_context" },
    ],
}, { timeout: 300000 });

console.log(interaction.output_text);

REST

curl -X POST "https://generativelanguage.googleapis.com/v1beta/interactions" \
-H "Content-Type: application/json" \
-H "x-goog-api-key: $GEMINI_API_KEY" \
-H "Api-Revision: 2026-05-20" \
-d '{
    "agent": "antigravity-preview-05-2026",
    "input": "Search for the latest AI research papers on reasoning and summarize them.",
    "environment": "remote",
    "tools": [
        {"type": "google_search"},
        {"type": "url_context"}
    ]
}'

Thông tin đầu vào đa phương thức

Trợ lý Antigravity hỗ trợ thông tin đầu vào đa phương thức. Hiện tại, chỉ có đầu vào textimage được hỗ trợ. Bạn phải cung cấp hình ảnh dưới dạng chuỗi được mã hoá base64 cùng dòng (data).

Python

import base64
from google import genai

client = genai.Client()

with open("path/to/chart.png", "rb") as f:
    image_bytes = f.read()

interaction_inline = client.interactions.create(
    agent="antigravity-preview-05-2026",
    input=[
        {"type": "text", "text": "Analyze this chart and summarize the trends."},
        {
            "type": "image",
            "data": base64.b64encode(image_bytes).decode("utf-8"),
            "mime_type": "image/png",
        },
    ],
    environment="remote",
)

JavaScript


import { GoogleGenAI } from "@google/genai";

import * as fs from "node:fs";

const client = new GoogleGenAI({});
const base64Image = fs.readFileSync("path/to/chart.png", { encoding: "base64" });

const interactionInline = await client.interactions.create({
    agent: "antigravity-preview-05-2026",
    input: [
        { type: "text", text: "Analyze this chart and summarize the trends." },
        {
            type: "image",
            data: base64Image,
            mime_type: "image/png",
        },
    ],
    environment: "remote",
}, { timeout: 300000 });

REST

BASE64_IMAGE=$(base64 -w0 /path/to/chart.png)

curl -X POST "https://generativelanguage.googleapis.com/v1beta/interactions" \
-H "Content-Type: application/json" \
-H "x-goog-api-key: $GEMINI_API_KEY" \
-H "Api-Revision: 2026-05-20" \
-d "{
    \"agent\": \"antigravity-preview-05-2026\",
    \"input\": [
        {\"type\": \"text\", \"text\": \"Analyze this chart and summarize the trends.\"},
        {
            \"type\": \"image\",
            \"mime_type\": \"image/png\",
            \"data\": \"$BASE64_IMAGE\"
        }
    ],
    \"environment\": \"remote\"
}"

Hướng dẫn về hệ thống

Tuỳ chỉnh hành vi của tác nhân bằng system_instruction cho các câu lệnh nội tuyến hoặc bằng cách gắn các tệp hướng dẫn vào môi trường:

Python

from google import genai

client = genai.Client()

interaction = client.interactions.create(
    agent="antigravity-preview-05-2026",
    input="Analyze the uploaded CSV and create a report.",
    environment="remote",
    system_instruction="You are a data analyst. Always include visualizations and export results as PDF.",
)

print(interaction.output_text)

JavaScript

import { GoogleGenAI } from "@google/genai";

const client = new GoogleGenAI({});

const interaction = await client.interactions.create({
    agent: "antigravity-preview-05-2026",
    input: "Analyze the uploaded CSV and create a report.",
    environment: "remote",
    system_instruction: "You are a data analyst. Always include visualizations and export results as PDF.",
}, { timeout: 300000 });

console.log(interaction.output_text);

REST

curl -X POST "https://generativelanguage.googleapis.com/v1beta/interactions" \
-H "Content-Type: application/json" \
-H "x-goog-api-key: $GEMINI_API_KEY" \
-H "Api-Revision: 2026-05-20" \
-d '{
    "agent": "antigravity-preview-05-2026",
    "input": "Analyze the uploaded CSV and create a report.",
    "environment": "remote",
    "system_instruction": "You are a data analyst. Always include visualizations and export results as PDF."
}'

Tác nhân sẽ tự động tải các tệp hướng dẫn từ môi trường:

  • AGENTS.md: Được thêm vào dưới dạng hướng dẫn hệ thống khi tìm thấy trong .agents/ hoặc thư mục gốc của không gian làm việc.
  • SKILL.md: Được tải từ .agents/skills/ và đăng ký dưới dạng các chức năng mà tác nhân có thể gọi.

Ví dụ:

Python

from google import genai

client = genai.Client()

interaction = client.interactions.create(
    agent="antigravity-preview-05-2026",
    input="Analyze the Q1 revenue data and create a slide deck.",
    environment={
        "type": "remote",
        "sources": [
            {
                "type": "inline",
                "target": ".agents/AGENTS.md",
                "content": "You are a data analyst. Always use matplotlib for charts.",
            },
            {
                "type": "inline",
                "target": ".agents/skills/slide-maker/SKILL.md",
                "content": "---\nname: slide-maker\n---\n# Slide Maker\nCreate HTML slide decks...",
            },
        ],
    },
)

print(interaction.output_text)

JavaScript

import { GoogleGenAI } from "@google/genai";

const client = new GoogleGenAI({});

const interaction = await client.interactions.create({
    agent: "antigravity-preview-05-2026",
    input: "Analyze the Q1 revenue data and create a slide deck.",
    environment: {
        type: "remote",
        sources: [
            {
                type: "inline",
                target: ".agents/AGENTS.md",
                content: "You are a data analyst. Always use matplotlib for charts.",
            },
            {
                type: "inline",
                target: ".agents/skills/slide-maker/SKILL.md",
                content: "---\nname: slide-maker\n---\n# Slide Maker\nCreate HTML slide decks...",
            },
        ],
    },
}, { timeout: 300000 });

console.log(interaction.output_text);

REST

curl -X POST "https://generativelanguage.googleapis.com/v1beta/interactions" \
-H "Content-Type: application/json" \
-H "x-goog-api-key: $API_KEY" \
-d '{
    "agent": "antigravity-preview-05-2026",
    "input": "Analyze the Q1 revenue data and create a slide deck.",
    "environment": {
        "type": "remote",
        "sources": [
            {
                "type": "inline",
                "target": ".agents/AGENTS.md",
                "content": "You are a data analyst. Always use matplotlib for charts."
            },
            {
                "type": "inline",
                "target": ".agents/skills/slide-maker/SKILL.md",
                "content": "---\nname: slide-maker\n---\n# Slide Maker\nCreate HTML slide decks..."
            }
        ]
    }
}'

Hãy xem phần Tạo tác nhân tuỳ chỉnh để biết định dạng định nghĩa đầy đủ về tác nhân và các tác nhân được đặt tên có thể dùng lại.

Môi trường

Mỗi lệnh gọi sẽ tạo hoặc dùng lại một hộp cát Linux. Tham số environment có 3 dạng:

Biểu mẫu Mô tả
"remote" Cung cấp một hộp cát mới với chế độ cài đặt mặc định.
"env_abc123" Tái sử dụng một môi trường hiện có theo mã nhận dạng, giữ nguyên mọi tệp và trạng thái.
{...} EnvironmentConfig đầy đủ với các nguồn và quy tắc mạng tuỳ chỉnh.

Hãy xem phần Môi trường để biết thông tin chi tiết về các nguồn (Git, GCS, nội tuyến), mạng, vòng đời và hạn mức tài nguyên.

Tình trạng còn hàng và giá

Bạn có thể dùng thử tác nhân Antigravity thông qua Interactions API trong Google AI Studio và Gemini API.

Giá được tính theo mô hình trả tiền theo mức dùng dựa trên số lượng token của mô hình Gemini cơ bản và các công cụ mà tác nhân sử dụng. Không giống như yêu cầu trò chuyện tiêu chuẩn tạo ra một đầu ra duy nhất, tương tác Antigravity là một quy trình làm việc dựa trên tác nhân. Một yêu cầu duy nhất sẽ kích hoạt một vòng lặp tự động gồm suy luận, thực thi công cụ, chạy mã và quản lý tệp.

Chi phí ước tính

Chi phí thay đổi tuỳ theo độ phức tạp của nhiệm vụ. Tác nhân tự động xác định số lượng lệnh gọi công cụ, lượt thực thi mã và thao tác với tệp cần thiết. Các số liệu ước tính sau đây dựa trên các lần chạy.

Danh mục việc cần làm Mã thông báo đầu vào Mã thông báo đầu ra Chi phí thông thường
Nghiên cứu và tổng hợp thông tin 100.000 – 500.000 10.000 – 40.000 0,3 – 1 USD
Tạo tài liệu và nội dung 100.000 – 500.000 15.000 – 50.000 0,30 – 1,30 USD
Thiết kế quy trình và hệ thống 100.000 – 400.000 10.000 – 30.000 0,25 – 0,80 USD
Xử lý và phân tích dữ liệu 300.000 – 3.000.000 30.000 – 150.000 0,70 – 3,25 USD

Thông thường, 50 – 70% mã thông báo đầu vào được lưu vào bộ nhớ đệm. Các quy trình làm việc phức tạp của tác nhân với nhiều lệnh gọi công cụ có thể tích luỹ từ 3 đến 5 triệu mã thông báo trong một lượt tương tác, với chi phí lên đến khoảng 5 USD.

Điện toán môi trường (CPU, bộ nhớ, thực thi hộp cát) sẽ không bị tính phí trong thời gian xem trước.

Các điểm hạn chế

  • Trạng thái xem trước: Antigravity Agent và Interactions API đang ở trạng thái xem trước. Các tính năng và giản đồ có thể thay đổi.
  • Cấu hình tạo không được hỗ trợ: Các tham số sau không được hỗ trợ và trả về lỗi 400: temperature, top_p, top_k, stop_sequences, max_output_tokens.
  • Đầu ra có cấu trúc: Đặc vụ Antigravity không hỗ trợ đầu ra có cấu trúc.
  • Các công cụ không dùng được: file_search, computer_use, google_maps, function_callingmcp hiện chưa được hỗ trợ.
  • Công cụ hệ thống tệp: Hiện không có công cụ hệ thống tệp. Đây là một phần của environment.
  • Bối cảnh: Trợ lý không hỗ trợ việc sử dụng background=True và yêu cầu store=True.
  • Các loại nội dung đa phương thức không được hỗ trợ. Hiện tại, chúng tôi không hỗ trợ dữ liệu đầu vào là âm thanh, video và tài liệu. Bạn chỉ được phép sử dụng văn bản và hình ảnh.

Bước tiếp theo