La API de Interactions ya está disponible de forma general. Te recomendamos que uses esta API para acceder a todos los modelos y funciones más recientes.

Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Gemini API

Recomendamos usar la API de Interactions para todos los proyectos nuevos. Está optimizado para flujos de trabajo de agentes, administración de estados y los modelos más recientes. Obtén más información en la descripción general de la API de Interactions.

La ruta más rápida desde la instrucción hasta la producción con Gemini, Veo, Nano Banana y mucho más.

Python

from google import genai

client = genai.Client()

interaction = client.interactions.create(
    model="gemini-3.5-flash",
    input="Explain how AI works in a few words"
)

print(interaction.output_text)

JavaScript

import { GoogleGenAI } from "@google/genai";

const ai = new GoogleGenAI({});

const interaction = await ai.interactions.create({
  model: "gemini-3.5-flash",
  input: "Explain how AI works in a few words",
});

console.log(interaction.output_text);

REST

curl -X POST "https://generativelanguage.googleapis.com/v1beta/interactions" \
  -H "x-goog-api-key: $GEMINI_API_KEY" \
  -H 'Content-Type: application/json' \
  -d '{
    "model": "gemini-3.5-flash",
    "input": "Explain how AI works in a few words"
  }'

Comenzar a desarrollar

Sigue nuestra guía de inicio rápido para obtener una clave de API y realizar tu primera llamada a la API en cuestión de minutos.

Conoce los modelos

Ver todos

Gemini 3.1 Pro Nuevo

Nuestro modelo más inteligente, el mejor del mundo para la comprensión multimodal, todo basado en un razonamiento de estado del arte.

Gemini 3.5 Flash Nuevo

Rendimiento de clase Frontier que compite con modelos más grandes a una fracción del costo.

Gemini 3.1 Flash-Lite Nuevo

Modelo de gran volumen y sensible a los costos con el rendimiento y la calidad de la serie Gemini 3.

Gemini 3 Flash

Rendimiento de clase Frontier que compite con modelos más grandes a una fracción del costo.

Nano Banana 2 y Nano Banana Pro

Modelos de estado del arte para la generación y edición de imágenes

Veo 3.1

Nuestro modelo de generación de videos de estado del arte, con audio nativo.

Gemini Robotics

Un modelo de lenguaje de visión (VLM) que aporta las capacidades de agente de Gemini a la robótica y permite un razonamiento avanzado en el mundo físico.

Explora las capacidades

Generación de imágenes nativa (Nano Banana)

Genera y edita imágenes altamente contextuales de forma nativa con Gemini 2.5 Flash Image.

Contexto largo

Ingresa millones de tokens en los modelos de Gemini y obtén información a partir de imágenes, videos y documentos no estructurados.

Resultados estructurados

Restringe Gemini para que responda con JSON, un formato de datos estructurados adecuado para el procesamiento automatizado.

Llamadas a funciones

Crea flujos de trabajo de agentes conectando Gemini a APIs y herramientas externas.

Generación de video con Veo 3.1

Crea contenido de video de alta calidad a partir de instrucciones de texto o imágenes con nuestro modelo de estado del arte.

Agentes de voz con la API de Live

Crea aplicaciones y agentes de voz en tiempo real con la API de Live.

Herramientas

Conecta Gemini al mundo a través de herramientas integradas, como la Búsqueda de Google, el Contexto de URL, Google Maps, la Ejecución de código y el Uso de la computadora.

Comprensión de documentos

Procesa hasta 1,000 páginas de archivos PDF con comprensión multimodal completa o con otros tipos de archivos basados en texto.

Pensando

Explora cómo las capacidades de pensamiento mejoran el razonamiento para las tareas y los agentes complejos.