Gemini Deep Research ist jetzt in der Vorabversion mit Funktionen wie gemeinsamer Planung, Visualisierung und MCP-Unterstützung verfügbar.

Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Antigravity-Agent

Der Antigravity-Agent ist ein verwalteter Agent für allgemeine Zwecke in der Gemini API. Mit einem einzigen API-Aufruf erhalten Sie einen Agenten, der in Ihrer eigenen sicheren Linux-Sandbox, die von Google gehostet wird, Schlussfolgerungen zieht, Code ausführt, Dateien verwaltet und im Web surft.

Er basiert auf Gemini 3.5 Flash und verwendet dieselbe Harness wie die Antigravity IDE. Er ist über die Interactions API und Google AI Studio verfügbar.

Python

from google import genai

client = genai.Client()

interaction = client.interactions.create(
    agent="antigravity-preview-05-2026",
    input="Read Hacker News, summarize the top 10 stories, and save the results as a PDF.",
    environment="remote",
)

print(interaction.output_text)

JavaScript

import { GoogleGenAI } from "@google/genai";

const client = new GoogleGenAI({});

const interaction = await client.interactions.create({
    agent: "antigravity-preview-05-2026",
    input: "Read Hacker News, summarize the top 10 stories, and save the results as a PDF.",
    environment: "remote",
}, { timeout: 300000 });

console.log(interaction.output_text);

REST

curl -X POST "https://generativelanguage.googleapis.com/v1beta/interactions" \
-H "Content-Type: application/json" \
-H "x-goog-api-key: $GEMINI_API_KEY" \
-H "Api-Revision: 2026-05-20" \
-d '{
    "agent": "antigravity-preview-05-2026",
    "input": "Read Hacker News, summarize the top 10 stories, and save the results as a PDF.",
    "environment": "remote"
}'

Leistungsspektrum

Bei jedem Aufruf kann eine Linux-Sandbox bereitgestellt werden und ein Tool-Nutzungszyklus wird gestartet. Der Agent plant, handelt, beobachtet die Ergebnisse und wiederholt den Vorgang, bis die Aufgabe abgeschlossen ist.

Codeausführung:Führen Sie Bash-, Python- und Node.js-Befehle aus. Installieren Sie Pakete, führen Sie Tests aus und erstellen Sie Apps.
Dateiverwaltung:Lesen, schreiben, bearbeiten, suchen und listen Sie Dateien in der Sandbox auf. Dateien bleiben über Interaktionen hinweg erhalten.
Webzugriff:Google Suche und URL-Abruf für Daten.
Kontextkomprimierung:Automatische Kontextkomprimierung (bei etwa 135.000 Tokens ausgelöst), um lange Sitzungen mit mehreren Gesprächsrunden zu unterstützen, ohne den Kontext zu verlieren oder Tokenlimits zu erreichen.

Weitere Informationen zur Verwendung mit mehreren Gesprächsrunden und zum Streaming finden Sie in der Kurzanleitung.

Unterstützte Tools

Standardmäßig hat der Agent Zugriff auf code_execution, google_search und url_context. Dateisystemtools werden automatisch aktiviert, wenn Sie den Parameter environment angeben. Sie müssen den Parameter tools nur angeben, wenn Sie den Standardsatz anpassen oder einschränken möchten.

Tool	Typwert	Beschreibung
Codeausführung	`code_execution`	Führen Sie Shell-Befehle (Bash, Python, Node) mit stdout/stderr-Erfassung aus.
Google Suche	`google_search`	Im öffentlichen Web suchen.
URL-Kontext	`url_context`	Webseiten abrufen und lesen.
Dateisystem	(über `environment` aktiviert)	Lesen, schreiben, bearbeiten, suchen und listen Sie Dateien in der Sandbox auf. Kein separater Tooltyp. Wird automatisch aktiviert, wenn `environment` festgelegt ist.

Wenn Sie den Agenten auf bestimmte Tools beschränken möchten, übergeben Sie nur die benötigten Tools:

Python

from google import genai

client = genai.Client()

interaction = client.interactions.create(
    agent="antigravity-preview-05-2026",
    input="Search for the latest AI research papers on reasoning and summarize them.",
    environment="remote",
    tools=[
        {"type": "google_search"},
        {"type": "url_context"},
    ],
)

print(interaction.output_text)

JavaScript

import { GoogleGenAI } from "@google/genai";

const client = new GoogleGenAI({});

const interaction = await client.interactions.create({
    agent: "antigravity-preview-05-2026",
    input: "Search for the latest AI research papers on reasoning and summarize them.",
    environment: "remote",
    tools: [
        { type: "google_search" },
        { type: "url_context" },
    ],
}, { timeout: 300000 });

console.log(interaction.output_text);

REST

curl -X POST "https://generativelanguage.googleapis.com/v1beta/interactions" \
-H "Content-Type: application/json" \
-H "x-goog-api-key: $GEMINI_API_KEY" \
-H "Api-Revision: 2026-05-20" \
-d '{
    "agent": "antigravity-preview-05-2026",
    "input": "Search for the latest AI research papers on reasoning and summarize them.",
    "environment": "remote",
    "tools": [
        {"type": "google_search"},
        {"type": "url_context"}
    ]
}'

Multimodale Eingabe

Der Antigravity-Agent unterstützt multimodale Eingaben. Derzeit werden nur text- und image-Eingaben unterstützt. Bilder müssen als Inline-Strings im Base64-Format (data) angegeben werden.

Python

import base64
from google import genai

client = genai.Client()

with open("path/to/chart.png", "rb") as f:
    image_bytes = f.read()

interaction_inline = client.interactions.create(
    agent="antigravity-preview-05-2026",
    input=[
        {"type": "text", "text": "Analyze this chart and summarize the trends."},
        {
            "type": "image",
            "data": base64.b64encode(image_bytes).decode("utf-8"),
            "mime_type": "image/png",
        },
    ],
    environment="remote",
)

JavaScript


import { GoogleGenAI } from "@google/genai";

import * as fs from "node:fs";

const client = new GoogleGenAI({});
const base64Image = fs.readFileSync("path/to/chart.png", { encoding: "base64" });

const interactionInline = await client.interactions.create({
    agent: "antigravity-preview-05-2026",
    input: [
        { type: "text", text: "Analyze this chart and summarize the trends." },
        {
            type: "image",
            data: base64Image,
            mime_type: "image/png",
        },
    ],
    environment: "remote",
}, { timeout: 300000 });

REST

BASE64_IMAGE=$(base64 -w0 /path/to/chart.png)

curl -X POST "https://generativelanguage.googleapis.com/v1beta/interactions" \
-H "Content-Type: application/json" \
-H "x-goog-api-key: $GEMINI_API_KEY" \
-H "Api-Revision: 2026-05-20" \
-d "{
    \"agent\": \"antigravity-preview-05-2026\",
    \"input\": [
        {\"type\": \"text\", \"text\": \"Analyze this chart and summarize the trends.\"},
        {
            \"type\": \"image\",
            \"mime_type\": \"image/png\",
            \"data\": \"$BASE64_IMAGE\"
        }
    ],
    \"environment\": \"remote\"
}"

Agent anpassen

Sie können den Antigravity-Agenten erweitern, indem Sie seine Anweisungen, Tools und Umgebung anpassen. Der Agent unterstützt einen dateisystemnativen Ansatz für die Anpassung: Sie können Dateien wie AGENTS.md für Anweisungen und Fähigkeiten unter .agents/skills/ direkt in die Sandbox einbinden oder die Konfiguration zur Interaktionszeit inline übergeben. Sie können Ihre Konfiguration inline iterieren und sie dann als verwalteten Agenten speichern, wenn Sie bereit sind.

Ausführliche Informationen zum Erstellen benutzerdefinierter Agenten finden Sie unter Verwaltete Agenten erstellen.

Umgebungen

Bei jedem Aufruf wird eine Linux-Sandbox erstellt oder wiederverwendet. Der Parameter environment hat drei Formen:

Formular	Beschreibung
`"remote"`	Stellen Sie eine neue Sandbox mit Standardeinstellungen bereit.
`"env_abc123"`	Verwenden Sie eine vorhandene Umgebung anhand der ID wieder und behalten Sie alle Dateien und den Status bei.
`{...}`	Vollständige `EnvironmentConfig` mit benutzerdefinierten Quellen und Netzwerkregeln.

Weitere Informationen zu Quellen (Git, GCS, inline), Netzwerken, Lebenszyklus und Ressourcenlimits finden Sie unter Umgebungen.

Verfügbarkeit und Preisgestaltung

Der Antigravity-Agent ist in der Vorabversion über die Interactions API in Google AI Studio und der Gemini API verfügbar.

Die Preise basieren auf einem Pay-as-you-go-Modell, das auf den zugrunde liegenden Gemini-Modelltokens und den vom Agenten verwendeten Tools basiert. Im Gegensatz zu einer Standard-Chatanfrage, die eine einzelne Ausgabe erzeugt, ist eine Antigravity-Interaktion ein agentischer Workflow. Eine einzelne Anfrage löst einen autonomen Zyklus aus, der aus Schlussfolgerungen, Toolausführung, Codeausführung und Dateiverwaltung besteht.

Geschätzte Kosten

Die Kosten variieren je nach Komplexität der Aufgabe. Der Agent bestimmt autonom, wie viele Toolaufrufe, Codeausführungen und Dateivorgänge erforderlich sind. Die folgenden Schätzungen basieren auf Ausführungen.

Aufgabenkategorie	Eingabetokens	Ausgabetokens	Typische Kosten
Recherche und Informationssynthese	100.000–500.000	10.000–40.000	0,30–1,00 $
Dokument- und Content-Generierung	100.000–500.000	15.000–50.000	0,30–1,30 $
Prozess- und Systemdesign	100.000–400.000	10.000–30.000	0,25–0,80 $
Datenverarbeitung und ‑analyse	300.000–3.000.000	30.000–150.000	0,70–3,25 $

50–70% der Eingabetokens werden in der Regel im Cache gespeichert. Bei komplexen Agentenworkflows mit vielen Toolaufrufen können in einer einzigen Interaktion 3–5 Millionen Tokens anfallen, was Kosten von bis zu etwa 5 $ verursacht.

Die Umgebungsberechnung (CPU, Arbeitsspeicher, Sandbox-Ausführung) wird während des Vorabzeitraums nicht in Rechnung gestellt.

Beschränkungen

Vorabversion:Der Antigravity-Agent und die Interactions API sind in der Vorabversion verfügbar. Funktionen und Schemas können sich ändern.
Nicht unterstützte Generierungskonfiguration:Die folgenden Parameter werden nicht unterstützt und geben einen 400-Fehler zurück: temperature, top_p, top_k, stop_sequences, max_output_tokens.
Strukturierte Ausgabe:Der Antigravity-Agent unterstützt keine strukturierten Ausgaben.
Nicht verfügbare Tools:file_search, computer_use, google_maps, function_calling und mcp werden noch nicht unterstützt.
Dateisystemtool:Derzeit ist kein Dateisystemtool verfügbar. Es ist Teil der environment.
Hintergrund:Der Agent unterstützt die Verwendung von background=True nicht und erfordert store=True.
Nicht unterstützte multimodale Typen Audio-, Video- und Dokumenteingaben werden derzeit nicht unterstützt. Nur Text und Bilder sind zulässig.

Nächste Schritte

Kurzanleitung: Unterhaltungen mit mehreren Gesprächsrunden und Streaming.
Benutzerdefinierte Agenten erstellen: benutzerdefinierte Anweisungen, Fähigkeiten und Agenten speichern.
Umgebungen: Sandbox-Konfiguration, Quellen, Netzwerke.
Deep Research Agent: umfangreiche Rechercheaufgaben.
Interactions API: die zugrunde liegende API.