La API de Interactions ya está disponible de forma general. Te recomendamos que uses esta API para acceder a todos los modelos y funciones más recientes.

Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Modelos

Gemini 3

Gemini 3.1 Pro

Inteligencia avanzada, habilidades para resolver problemas complejos y potentes capacidades de codificación de agentes y de ambiente.

Vista previa

Gemini 3.5 Flash

Es el modelo más inteligente para un rendimiento de frontera sostenido en tareas de programación y de agentes.

Estable

Gemini 3 Flash

Rendimiento de clase Frontier que compite con modelos más grandes a una fracción del costo.

Vista previa

Gemini 3.1 Flash-Lite

Rendimiento de clase Frontier que compite con modelos más grandes a una fracción del costo.

Estable

Nano Banana 2

Generación y edición de imágenes potentes y de alta eficiencia, optimizadas para la velocidad y los casos de uso de gran volumen.

Estable

Nano Banana Pro

Modelos de estado del arte para la generación y edición de imágenes que permiten crear imágenes nativas altamente contextuales.

Estable

Gemini 3.5 Live Translate

Modelo de traducción de voz a voz en tiempo real y de baja latencia que admite más de 70 idiomas.

Vista previa Nueva

Gemini 3.1 Flash Live

Modelo de API de Live de alta calidad y baja latencia para aplicaciones de IA que privilegian la voz y el diálogo en tiempo real.

Vista previa Nueva

TTS de Gemini 3.1 Flash

Generación de voz potente y de baja latencia

Vista previa Nueva

Gemini 2.5 Flash

Nuestro mejor modelo de relación precio-rendimiento para tareas de gran volumen y baja latencia que requieren razonamiento.

Nano Banana

Generación y edición de imágenes nativas de vanguardia diseñadas para flujos de trabajo creativos y rápidos.

Gemini 2.5 Flash Live versión preliminar

Se optimizó para agentes conversacionales en tiempo real con transmisión de audio nativa de menos de un segundo.

TTS de Gemini 2.5 Flash versión preliminar

Generación de audio de texto a voz controlable con un control preciso sobre el estilo y el ritmo.

Gemini 2.5 Flash-Lite

Es el modelo multimodal más rápido y económico de la familia 2.5.

Gemini 2.5 Pro

Nuestro modelo más avanzado para tareas complejas, con capacidades de razonamiento y programación profundas.

TTS de Gemini 2.5 Pro versión preliminar

Síntesis de voz de alta fidelidad optimizada para la calidad en flujos de trabajo estructurados, como podcasts y audiolibros.

Modelos de audio

En esta sección, se incluyen todos los modelos de audio, incluidos los que ya se pueden encontrar en otras secciones

Versión preliminar de Gemini 3.1 Flash Live

Nuestro modelo de audio a audio (A2A) de alta calidad y baja latencia diseñado para diálogos en tiempo real y aplicaciones de IA centradas en la voz.

TTS de Gemini 3.1 Flash versión preliminar

Potente generación de voz de baja latencia, con resultados naturales, instrucciones guiadas y nuevas etiquetas de audio expresivas para un control preciso de la narración.

Gemini 2.5 Flash Live versión preliminar

Nuestro modelo insignia de la API de Live para agentes de voz y video bidireccionales de baja latencia con razonamiento de audio nativo.

TTS de Gemini 2.5 Flash versión preliminar

Text-to-Speech rápido y controlable para aplicaciones rentables y de baja latencia, y asistentes en tiempo real.

TTS de Gemini 2.5 Pro versión preliminar

Síntesis de voz de alta fidelidad optimizada para la calidad en flujos de trabajo estructurados, como podcasts y audiolibros.

Modelos de contenido multimedia generativo

En esta sección, se incluyen todos los modelos de medios generativos, incluidos los que ya se pueden enumerar en otras secciones

Nano Banana 2

Creación visual a escala de producción y alta eficiencia, que combina la inteligencia de la serie Gemini 3 con velocidades de generación ultrarrápidas.

Vista previa de Veo 3.1

Generación de videos cinematográficos de estado del arte con controles creativos avanzados y audio sincronizado de forma nativa.

Nano Banana Pro

Un motor de diseño profesional con un núcleo de razonamiento para imágenes visuales 4K de calidad de estudio, diseños complejos y renderización de texto precisa.

Versión preliminar de Veo 3.1 Lite

Generación y edición de video, y control cinematográfico de alta eficiencia, bajo costo y con enfoque en los desarrolladores de la familia Veo 3.1.

Nano Banana

Generación y edición de imágenes nativas de vanguardia diseñadas para flujos de trabajo creativos y rápidos.

Imagen 4

Modelo de texto a imagen que ofrece una generación rápida y ultrarrápida, y una claridad excepcional con una resolución de hasta 2K.

Modelos de generación de música

En esta sección, se incluyen todos los modelos de generación de música, incluidos los que ya se pueden enumerar en otras secciones

Lyria 3 Pro Vista previa

Es nuestro modelo insignia de generación de música, optimizado para canciones completas con coherencia estructural compleja.

Clip de Lyria 3 Preview

Está optimizado para generar clips musicales cortos, bucles y vistas previas de hasta 30 segundos.

Lyria RealTime Experimental

Modelo de generación de música de alta fidelidad que proporciona control creativo detallado y capacidades de transmisión en tiempo real.

Modelos de herramientas y agentes

Uso de la computadora Vista previa

Es un modelo especializado que puede "ver" una pantalla digital y realizar acciones de la IU, como hacer clic, escribir y navegar, para automatizar tareas complejas del navegador.

Versión preliminar de Deep Research de Gemini

Es un modelo basado en agentes que planifica y ejecuta de forma autónoma investigaciones de varios pasos en cientos de fuentes para producir informes interactivos con citas.

Vista previa de Gemini Deep Research Max

Máxima exhaustividad para la recopilación y síntesis automatizadas de contexto en cientos de fuentes

Agente de Antigravity Versión preliminar

Es un agente administrado de uso general que planifica, razona, ejecuta código, administra archivos y navega por la Web de forma autónoma dentro de una zona de pruebas de Linux segura y aislada.

Modelos especializados para tareas

Gemini Embedding 2

Nuestro primer modelo de embedding multimodal, que asigna texto, imágenes, videos, audio y PDFs a un espacio de embedding unificado para sistemas avanzados de búsqueda semántica y RAG.

Embedding de Gemini

Representaciones vectoriales de alta dimensión para la búsqueda semántica avanzada, la clasificación de texto y los sistemas RAG.

Gemini Robotics-ER 1.6Versión preliminar

Modelo avanzado de razonamiento integrado que comprende los espacios físicos y planifica tareas de varios pasos para agentes robóticos con nuevas capacidades, como la lectura de instrumentos y un razonamiento espacial y físico mejorado.

Modelos anteriores

Apagar Gemini 2.0 Flash

Nuestro modelo de segunda generación, con funciones de nueva generación y capacidades mejoradas, como velocidad superior, uso de herramientas nativas y una ventana de contexto de 1 millón de tokens.

Gemini 2.0 Flash-Lite Apagar

Es nuestro modelo de segunda generación más rápido, optimizado para la rentabilidad y la baja latencia.

Versión preliminar de Gemini 3.1 Flash-Lite Cierre

Es nuestro modelo multimodal más rentable, que ofrece el rendimiento más rápido para tareas ligeras y de alta frecuencia.

Cierre de la versión preliminar de Gemini 3 Pro

Nuestro modelo de razonamiento de vanguardia, con comprensión multimodal avanzada.

Patrones de nombres de versiones del modelo

Los modelos de Gemini están disponibles en versiones estables, preliminares, más recientes o experimentales.

Estable

Apunta a un modelo estable específico. Los modelos estables no suelen cambiar. La mayoría de las apps de producción deben usar un modelo estable específico.

Por ejemplo: gemini-3.5-flash.

Vista previa

Apunta a un modelo de vista previa que se puede usar para la producción. Por lo general, los modelos de vista previa tendrán habilitada la facturación, podrían tener límites de frecuencia más restrictivos y se darán de baja con un aviso de, al menos, 2 semanas.

Por ejemplo: gemini-2.5-flash-preview-09-2025.

Más recientes

Apunta al último lanzamiento de una variante de modelo específica. Puede ser un lanzamiento estable, preliminar o experimental. Este alias se intercambiará en caliente con cada nuevo lanzamiento de una variante de modelo específica. Se proporcionará un aviso con 2 semanas de anticipación por correo electrónico antes de que se cambie la versión anterior a la más reciente.

Por ejemplo: gemini-flash-latest.

Experimental

Señala un modelo experimental que, por lo general, no será adecuado para el uso en producción y tendrá límites de frecuencia más restrictivos. Lanzamos modelos experimentales para recopilar comentarios y poner nuestras actualizaciones más recientes en manos de los desarrolladores rápidamente.

Los modelos experimentales no son estables y la disponibilidad de los extremos de los modelos está sujeta a cambios.

Bajas de modelos

Para obtener información sobre las bajas de modelos, visita la página Bajas de Gemini.