Die Interactions API ist jetzt allgemein verfügbar. Wir empfehlen, diese API zu verwenden, um auf alle aktuellen Funktionen und Modelle zuzugreifen.

Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Gemini API

Wir empfehlen, für alle neuen Projekte die Interactions API zu verwenden. Sie ist für agentische Workflows, die Statusverwaltung und die neuesten Modelle optimiert. Weitere Informationen finden Sie in der Übersicht zur Interactions API.

Der schnellste Weg vom Prompt zur Produktion mit Gemini, Veo, Nano Banana und mehr.

Python

from google import genai

client = genai.Client()

interaction = client.interactions.create(
    model="gemini-3.5-flash",
    input="Explain how AI works in a few words"
)

print(interaction.output_text)

JavaScript

import { GoogleGenAI } from "@google/genai";

const ai = new GoogleGenAI({});

const interaction = await ai.interactions.create({
  model: "gemini-3.5-flash",
  input: "Explain how AI works in a few words",
});

console.log(interaction.output_text);

REST

curl -X POST "https://generativelanguage.googleapis.com/v1beta/interactions" \
  -H "x-goog-api-key: $GEMINI_API_KEY" \
  -H 'Content-Type: application/json' \
  -d '{
    "model": "gemini-3.5-flash",
    "input": "Explain how AI works in a few words"
  }'

Losstaunen

Folgen Sie unserer Kurzanleitung, um einen API-Schlüssel zu erhalten und Ihren ersten API-Aufruf in wenigen Minuten zu senden.

Die Modelle

Alle ansehen

Gemini 3.1 Pro Neu

Unser intelligentestes Modell, das weltweit beste für multimodales Verstehen, basierend auf modernster Schlussfolgerungstechnologie.

Gemini 3.5 Flash Neu

Leistung der Frontier-Klasse, die mit größeren Modellen mithalten kann, zu einem Bruchteil der Kosten.

Gemini 3.1 Flash-Lite Neu

Kostengünstiges Modell für hohes Volumen mit der Leistung und Qualität der Gemini 3-Serie.

Gemini 3 Flash

Leistung der Frontier-Klasse, die mit größeren Modellen mithalten kann, zu einem Bruchteil der Kosten.

🍌 Nano Banana 2 und Nano Banana Pro

Hochmoderne Modelle für die Bildgenerierung und ‑bearbeitung.

Veo 3.1

Unser hochmodernes Modell zur Videogenerierung mit nativer Audiofunktion.

Gemini Robotics

Ein Vision-Language-Modell (VLM), das die agentischen Funktionen von Gemini in die Robotik bringt und logisches Schlussfolgern in der physischen Welt ermöglicht.

Funktionen

Native Bildgenerierung (Nano Banana)

Mit Gemini 2.5 Flash Image können Sie kontextbezogene Bilder nativ generieren und bearbeiten.

Langer Kontext

Geben Sie Millionen von Tokens in Gemini-Modelle ein und gewinnen Sie Erkenntnisse aus unstrukturierten Bildern, Videos und Dokumenten.

Strukturierte Ausgaben

Beschränken Sie Gemini so, dass es mit JSON antwortet, einem strukturierten Datenformat, das für die automatisierte Verarbeitung geeignet ist.

Funktionsaufrufe

Erstellen Sie agentische Workflows, indem Sie Gemini mit externen APIs und Tools verbinden.

Videogenerierung mit Veo 3.1

Mit unserem hochmodernen Modell können Sie hochwertige Videoinhalte aus Text- oder Bildprompts erstellen.

Sprachagenten mit der Live API

Mit der Live API können Sie Sprachagenten und ‑anwendungen in Echtzeit erstellen.

Tools

Verbinden Sie Gemini mit der Welt über integrierte Tools wie die Google Suche, URL-Kontext, Google Maps, Codeausführung und Computernutzung.

Verständnis von Dokumenten

Verarbeiten Sie bis zu 1.000 Seiten von PDF-Dateien mit vollständigem multimodalen Verständnis oder anderen textbasierten Dateitypen.

Thinking

Erfahren Sie, wie Denkfähigkeiten die Schlussfolgerungen für komplexe Aufgaben und Agenten verbessern.