Modelos


Gemini 3


Gemini 2.5 Flash

Gemini 2.5 Flash

Nuestro mejor modelo de relación precio-rendimiento para tareas de gran volumen y baja latencia que requieren razonamiento.

Nano Banana

Generación y edición de imágenes nativas de vanguardia diseñadas para flujos de trabajo creativos y rápidos.

Gemini 2.5 Flash Live versión preliminar

Se optimizó para agentes conversacionales en tiempo real con transmisión de audio nativa de menos de un segundo.

TTS de Gemini 2.5 Flash Versión preliminar

Generación de audio de texto a voz controlable con un control preciso sobre el estilo y el ritmo.


Gemini 2.5 Flash-Lite

Gemini 2.5 Flash-Lite

Es el modelo multimodal más rápido y económico de la familia 2.5.


Gemini 2.5 Pro

Gemini 2.5 Pro

Nuestro modelo más avanzado para tareas complejas, con capacidades de razonamiento y programación profundas.

TTS de Gemini 2.5 Pro (versión preliminar)

Síntesis de voz de alta fidelidad optimizada para la calidad en flujos de trabajo estructurados, como podcasts y audiolibros.


Modelos de audio

En esta sección, se incluyen todos los modelos de audio, incluidos los que ya se pueden encontrar en otras secciones

Gemini 3.1 Flash Live Vista previa

Nuestro modelo de audio a audio (A2A) de alta calidad y baja latencia diseñado para diálogos en tiempo real y aplicaciones de IA centradas en la voz.

TTS de Gemini 3.1 Flash versión preliminar

Potente generación de voz de baja latencia, con resultados naturales, instrucciones orientables y nuevas etiquetas de audio expresivas para un control preciso de la narración.

Gemini 2.5 Flash Live versión preliminar

Nuestro modelo insignia de la API de Live para agentes de voz y video bidireccionales y de baja latencia con razonamiento de audio nativo.

TTS de Gemini 2.5 Flash Versión preliminar

Text-to-Speech rápido y controlable para aplicaciones rentables y de baja latencia, y asistentes en tiempo real.

TTS de Gemini 2.5 Pro versión preliminar

Síntesis de voz de alta fidelidad optimizada para la calidad en flujos de trabajo estructurados, como podcasts y audiolibros.


Modelos de contenido multimedia generativo

En esta sección, se incluyen todos los modelos de medios generativos, incluidos los que ya se pueden enumerar en otras secciones

Nano Banana 2 Vista previa

Creación visual a escala de producción y alta eficiencia, que combina la inteligencia de la serie Gemini 3 con velocidades de generación ultrarrápidas.

Vista previa de Veo 3.1

Generación de videos cinematográficos de vanguardia con controles creativos avanzados y audio sincronizado de forma nativa.

Nano Banana Pro Vista previa

Un motor de diseño profesional con un núcleo de razonamiento para imágenes en 4K con calidad de estudio, diseños complejos y renderización de texto precisa.

Versión preliminar de Veo 3.1 Lite

Generación y edición de video, y control cinematográfico de alta eficiencia y bajo costo de la familia Veo 3.1, diseñados para desarrolladores.

Nano Banana

Generación y edición de imágenes nativas de vanguardia diseñadas para flujos de trabajo creativos y rápidos.

Imagen 4

Modelo de texto a imagen que ofrece una generación rápida y ultrarrápida, y una claridad excepcional con una resolución de hasta 2K.


Modelos de generación de música

En esta sección, se incluyen todos los modelos de generación de música, incluidos los que ya se pueden enumerar en otras secciones

Lyria 3 Pro Vista previa

Es nuestro modelo insignia de generación de música, optimizado para canciones de larga duración con coherencia estructural compleja.

Clip de Lyria 3 Preview

Está optimizado para generar clips musicales cortos, bucles y vistas previas de hasta 30 segundos.

Lyria RealTime Experimental

Modelo de generación de música de alta fidelidad que proporciona control creativo detallado y capacidades de transmisión en tiempo real.


Modelos de herramientas y agentes

Uso de la computadora Vista previa

Un modelo especializado que puede "ver" una pantalla digital y realizar acciones de la IU, como hacer clic, escribir y navegar, para automatizar tareas complejas del navegador.

Versión preliminar de Deep Research de Gemini

Es un modelo basado en agentes que planifica y ejecuta de forma autónoma investigaciones de varios pasos en cientos de fuentes para producir informes interactivos con citas.

Vista previa de Gemini Deep Research Max

Máxima exhaustividad para la recopilación y síntesis automatizadas de contexto en cientos de fuentes

Agente de Antigravity Versión preliminar

Es un agente administrado de uso general que planifica, razona, ejecuta código, administra archivos y navega por la Web de forma autónoma dentro de una zona de pruebas de Linux segura y aislada.


Modelos especializados para tareas

Gemini Embedding 2

Nuestro primer modelo de embedding multimodal, que asigna texto, imágenes, videos, audio y PDFs a un espacio de embedding unificado para sistemas avanzados de búsqueda semántica y RAG.

Gemini Embedding

Representaciones vectoriales de alta dimensión para la búsqueda semántica avanzada, la clasificación de texto y los sistemas de RAG.

Gemini Robotics-ER 1.6Versión preliminar

Modelo de razonamiento avanzado incorporado que comprende los espacios físicos y planifica tareas de varios pasos para agentes robóticos con nuevas capacidades, como la lectura de instrumentos y un razonamiento espacial y físico mejorado.


Modelos anteriores

Gemini 2.0 Flash obsoleto

Nuestro modelo de segunda generación, con funciones de nueva generación y capacidades mejoradas, como velocidad superior, uso de herramientas nativas y una ventana de contexto de 1 millón de tokens.

Gemini 2.0 Flash-Lite Obsoleto

Es nuestro modelo de segunda generación más rápido, optimizado para la rentabilidad y la baja latencia.

Versión preliminar de Gemini 3.1 Flash-Lite Cierre

Es nuestro modelo multimodal más rentable, que ofrece el rendimiento más rápido para tareas ligeras y de alta frecuencia.

Versión preliminar de Gemini 3 Pro Cierre

Nuestro modelo de razonamiento de vanguardia, con comprensión multimodal avanzada.


Patrones de nombres de versiones del modelo

Los modelos de Gemini están disponibles en versiones estables, preliminares, más recientes o experimentales.

Estable

Apunta a un modelo estable específico. Los modelos estables no suelen cambiar. La mayoría de las apps de producción deben usar un modelo estable específico.

Por ejemplo: gemini-3.5-flash.

Vista previa

Apunta a un modelo de vista previa que se puede usar para la producción. Por lo general, los modelos de vista previa tendrán habilitada la facturación, podrían tener límites de frecuencia más restrictivos y se darán de baja con una notificación con al menos 2 semanas de anticipación.

Por ejemplo: gemini-2.5-flash-preview-09-2025.

Más recientes

Apunta a la versión más reciente de una variación de modelo específica. Puede ser una versión estable, de vista previa o experimental. Este alias se intercambiará en caliente con cada nuevo lanzamiento de una variación de modelo específica. Se proporcionará un aviso con 2 semanas de anticipación por correo electrónico antes de que se cambie la versión anterior a la más reciente.

Por ejemplo: gemini-flash-latest.

Experimental

Apunta a un modelo experimental que, por lo general, no será adecuado para el uso en producción y tendrá límites de frecuencia más restrictivos. Lanzamos modelos experimentales para recopilar comentarios y poner nuestras actualizaciones más recientes en manos de los desarrolladores rápidamente.

Los modelos experimentales no son estables y la disponibilidad de los extremos de los modelos está sujeta a cambios.

Bajas de modelos

Para obtener información sobre las bajas de modelos, visita la página Bajas de Gemini.