Recomendamos usar la API de Interactions para todos los proyectos nuevos. Está optimizado para flujos de trabajo de agentes, administración de estados y los modelos más recientes. Obtén más información en la descripción general de la API de Interactions.
La ruta más rápida desde la instrucción hasta la producción con Gemini, Veo, Nano Banana y mucho más.
Python
from google import genai
client = genai.Client()
interaction = client.interactions.create(
model="gemini-3.5-flash",
input="Explain how AI works in a few words"
)
print(interaction.output_text)
JavaScript
import { GoogleGenAI } from "@google/genai";
const ai = new GoogleGenAI({});
const interaction = await ai.interactions.create({
model: "gemini-3.5-flash",
input: "Explain how AI works in a few words",
});
console.log(interaction.output_text);
REST
curl -X POST "https://generativelanguage.googleapis.com/v1beta/interactions" \
-H "x-goog-api-key: $GEMINI_API_KEY" \
-H 'Content-Type: application/json' \
-d '{
"model": "gemini-3.5-flash",
"input": "Explain how AI works in a few words"
}'
Sigue nuestra guía de inicio rápido para obtener una clave de API y realizar tu primera llamada a la API en cuestión de minutos.
Conoce los modelos
Ver todosGemini 3.1 Pro Nuevo
Nuestro modelo más inteligente, el mejor del mundo para la comprensión multimodal, todo basado en un razonamiento de estado del arte.
Gemini 3.5 Flash Nuevo
Rendimiento de clase Frontier que compite con modelos más grandes a una fracción del costo.
Gemini 3.1 Flash-Lite Nuevo
Modelo de gran volumen y sensible a los costos con el rendimiento y la calidad de la serie Gemini 3.
Gemini 3 Flash
Rendimiento de clase Frontier que compite con modelos más grandes a una fracción del costo.
Nano Banana 2 y Nano Banana Pro
Modelos de estado del arte para la generación y edición de imágenes
Veo 3.1
Nuestro modelo de generación de videos de estado del arte, con audio nativo.
Gemini Robotics
Un modelo de lenguaje de visión (VLM) que aporta las capacidades de agente de Gemini a la robótica y permite un razonamiento avanzado en el mundo físico.
Explora las capacidades
Generación de imágenes nativa (Nano Banana)
Genera y edita imágenes altamente contextuales de forma nativa con Gemini 2.5 Flash Image.
Contexto largo
Ingresa millones de tokens en los modelos de Gemini y obtén información a partir de imágenes, videos y documentos no estructurados.
Resultados estructurados
Restringe Gemini para que responda con JSON, un formato de datos estructurados adecuado para el procesamiento automatizado.
Llamadas a funciones
Crea flujos de trabajo de agentes conectando Gemini a APIs y herramientas externas.
Generación de video con Veo 3.1
Crea contenido de video de alta calidad a partir de instrucciones de texto o imágenes con nuestro modelo de estado del arte.
Agentes de voz con la API de Live
Crea aplicaciones y agentes de voz en tiempo real con la API de Live.
Herramientas
Conecta Gemini al mundo a través de herramientas integradas, como la Búsqueda de Google, el Contexto de URL, Google Maps, la Ejecución de código y el Uso de la computadora.
Comprensión de documentos
Procesa hasta 1,000 páginas de archivos PDF con comprensión multimodal completa o con otros tipos de archivos basados en texto.
Pensando
Explora cómo las capacidades de pensamiento mejoran el razonamiento para las tareas y los agentes complejos.