Wir empfehlen, für alle neuen Projekte die Interactions API zu verwenden. Sie ist für agentische Workflows, die Statusverwaltung und die neuesten Modelle optimiert. Weitere Informationen finden Sie in der Übersicht zur Interactions API.
Der schnellste Weg vom Prompt zur Produktion mit Gemini, Veo, Nano Banana und mehr.
Python
from google import genai
client = genai.Client()
interaction = client.interactions.create(
model="gemini-3.5-flash",
input="Explain how AI works in a few words"
)
print(interaction.output_text)
JavaScript
import { GoogleGenAI } from "@google/genai";
const ai = new GoogleGenAI({});
const interaction = await ai.interactions.create({
model: "gemini-3.5-flash",
input: "Explain how AI works in a few words",
});
console.log(interaction.output_text);
REST
curl -X POST "https://generativelanguage.googleapis.com/v1beta/interactions" \
-H "x-goog-api-key: $GEMINI_API_KEY" \
-H 'Content-Type: application/json' \
-d '{
"model": "gemini-3.5-flash",
"input": "Explain how AI works in a few words"
}'
Folgen Sie unserer Kurzanleitung, um einen API-Schlüssel zu erhalten und Ihren ersten API-Aufruf in wenigen Minuten zu senden.
Die Modelle
Alle ansehenGemini 3.1 Pro Neu
Unser intelligentestes Modell, das weltweit beste für multimodales Verstehen, basierend auf modernster Schlussfolgerungstechnologie.
Gemini 3.5 Flash Neu
Leistung der Frontier-Klasse, die mit größeren Modellen mithalten kann, zu einem Bruchteil der Kosten.
Gemini 3.1 Flash-Lite Neu
Kostengünstiges Modell für hohes Volumen mit der Leistung und Qualität der Gemini 3-Serie.
Gemini 3 Flash
Leistung der Frontier-Klasse, die mit größeren Modellen mithalten kann, zu einem Bruchteil der Kosten.
🍌 Nano Banana 2 und Nano Banana Pro
Hochmoderne Modelle für die Bildgenerierung und ‑bearbeitung.
Veo 3.1
Unser hochmodernes Modell zur Videogenerierung mit nativer Audiofunktion.
Gemini Robotics
Ein Vision-Language-Modell (VLM), das die agentischen Funktionen von Gemini in die Robotik bringt und logisches Schlussfolgern in der physischen Welt ermöglicht.
Funktionen
Native Bildgenerierung (Nano Banana)
Mit Gemini 2.5 Flash Image können Sie kontextbezogene Bilder nativ generieren und bearbeiten.
Langer Kontext
Geben Sie Millionen von Tokens in Gemini-Modelle ein und gewinnen Sie Erkenntnisse aus unstrukturierten Bildern, Videos und Dokumenten.
Strukturierte Ausgaben
Beschränken Sie Gemini so, dass es mit JSON antwortet, einem strukturierten Datenformat, das für die automatisierte Verarbeitung geeignet ist.
Funktionsaufrufe
Erstellen Sie agentische Workflows, indem Sie Gemini mit externen APIs und Tools verbinden.
Videogenerierung mit Veo 3.1
Mit unserem hochmodernen Modell können Sie hochwertige Videoinhalte aus Text- oder Bildprompts erstellen.
Sprachagenten mit der Live API
Mit der Live API können Sie Sprachagenten und ‑anwendungen in Echtzeit erstellen.
Tools
Verbinden Sie Gemini mit der Welt über integrierte Tools wie die Google Suche, URL-Kontext, Google Maps, Codeausführung und Computernutzung.
Verständnis von Dokumenten
Verarbeiten Sie bis zu 1.000 Seiten von PDF-Dateien mit vollständigem multimodalen Verständnis oder anderen textbasierten Dateitypen.
Thinking
Erfahren Sie, wie Denkfähigkeiten die Schlussfolgerungen für komplexe Aufgaben und Agenten verbessern.