Modelos


Gemini 3


Gemini 2.5 Flash

Gemini 2.5 Flash

Nuestro mejor modelo de relación precio-rendimiento para tareas de baja latencia y gran volumen que requieren razonamiento.

Nano Banana

Generación y edición de imágenes nativas de vanguardia diseñadas para flujos de trabajo creativos y rápidos.

Versión preliminar de Gemini 2.5 Flash Live

Optimizado para agentes conversacionales en tiempo real con transmisión de audio nativa de menos de un segundo.

Versión preliminar de Gemini 2.5 Flash TTS

Generación de audio de texto a voz controlable con control preciso sobre el estilo y el ritmo.


Gemini 2.5 Flash-Lite

Gemini 2.5 Flash-Lite

El modelo multimodal más rápido y económico de la familia 2.5.


Gemini 2.5 Pro

Gemini 2.5 Pro

Nuestro modelo más avanzado para tareas complejas, con capacidades de razonamiento y programación profundas.

Versión preliminarde Gemini 2.5 Pro TTS

Síntesis de voz de alta fidelidad optimizada para la calidad en flujos de trabajo estructurados, como podcasts y audiolibros.


Modelos de audio

Esta sección contiene todos los modelos de audio, incluidos los que ya pueden aparecer en otras secciones.

Versión preliminar de Gemini 3.1 Flash Live

Nuestro modelo de audio a audio (A2A) de alta calidad y baja latencia diseñado para aplicaciones de IA de diálogo en tiempo real y de voz primero.

Versión preliminar de Gemini 3.1 Flash TTS

Generación de voz potente y de baja latencia, con salidas naturales, instrucciones orientables y nuevas etiquetas de audio expresivas para un control preciso de la narración.

Versión preliminar de Gemini 2.5 Flash Live

Nuestro modelo insignia de API de Live para agentes de voz y video bidireccionales de baja latencia con razonamiento de audio nativo.

Versión preliminar de Gemini 2.5 Flash TTS

Texto a voz rápido y controlable para aplicaciones de baja latencia y rentables, y asistentes en tiempo real.

Versión preliminarde Gemini 2.5 Pro TTS

Síntesis de voz de alta fidelidad optimizada para la calidad en flujos de trabajo estructurados, como podcasts y audiolibros.


Modelos de medios generativos

Esta sección contiene todos los modelos de medios generativos, incluidos los que ya pueden aparecer en otras secciones.

Versión preliminar de Nano Banana 2

Creación visual de alta eficiencia a escala de producción, que combina la inteligencia de la serie Gemini 3 con velocidades de generación ultrarrápidas.

Versión preliminar de Veo 3.1

Generación de videos cinematográficos de vanguardia con controles creativos avanzados y audio sincronizado de forma nativa.

Versión preliminar de Nano Banana Pro

Un motor de diseño profesional con un núcleo de razonamiento para imágenes 4K de calidad de estudio, diseños complejos y renderización de texto precisa.

Versión preliminar de Veo 3.1 Lite

Generación, edición y control cinematográfico de videos de alta eficiencia, bajo costo y primero para desarrolladores de la familia Veo 3.1.

Nano Banana

Generación y edición de imágenes nativas de vanguardia diseñadas para flujos de trabajo creativos y rápidos.

Imagen 4

Modelo de texto a imagen, con generación rápida y ultrarrápida, y claridad excepcional hasta una resolución de 2K.


Modelos de generación de música

Esta sección contiene todos los modelos de generación de música, incluidos los que ya pueden aparecer en otras secciones.

Versión preliminar de Lyria 3 Pro

Nuestro modelo insignia de generación de música, optimizado para canciones completas con coherencia estructural compleja.

Versión preliminarde Lyria 3 Clip

Optimizado para generar clips musicales cortos, bucles y vistas previas de hasta 30 segundos.

Lyria RealTime Experimental

Modelo de generación de música de alta fidelidad que proporciona control creativo detallado y capacidades de transmisión en tiempo real.


Modelos de herramientas y agentes

Versión preliminar de Computer Use

Un modelo especializado que puede "ver" una pantalla digital y realizar acciones de la IU, como hacer clic, escribir y navegar, para automatizar tareas complejas del navegador.

Versión preliminarde Gemini Deep Research

Un modelo de agente que planifica y ejecuta de forma autónoma investigaciones de varios pasos en cientos de fuentes para producir informes interactivos y citados.

Versión preliminarde Gemini Deep Research Max

Máxima exhaustividad para la recopilación y síntesis automatizadas de contexto en cientos de fuentes.


Modelos de tareas especializadas

Gemini Embedding 2

Nuestro primer modelo de embedding multimodal, que asigna texto, imágenes, video, audio y PDFs a un espacio de embedding unificado para la búsqueda semántica avanzada y los sistemas RAG.

Gemini Embedding

Representaciones vectoriales de alta dimensión para la búsqueda semántica avanzada, la clasificación de texto y los sistemas RAG.

Versión preliminar de Gemini Robotics-ER 1.6

Modelo de razonamiento integrado avanzado que comprende espacios físicos y planifica tareas de varios pasos para agentes robóticos con nuevas capacidades, como lectura de instrumentos y razonamiento espacial y físico mejorado.


Modelos anteriores

Gemini 2.0 Flash obsoleto

Nuestro modelo de caballo de batalla de segunda generación, con funciones de nueva generación y capacidades mejoradas, como velocidad superior, uso de herramientas nativas y una ventana de contexto de 1 millón de tokens.

Gemini 2.0 Flash-Lite obsoleto

Nuestro modelo de segunda generación más rápido, optimizado para la rentabilidad y la baja latencia.

Cierre de la versión preliminar de Gemini 3 Pro Shut down

Nuestro modelo de razonamiento de vanguardia, con comprensión multimodal avanzada.


Patrones de nombres de versiones de modelos

Los modelos de Gemini están disponibles en versiones estables, preliminares, más recientes o experimentales.

Estable

Apunta a un modelo estable específico. Por lo general, los modelos estables no cambian. La mayoría de las apps de producción deben usar un modelo estable específico.

Por ejemplo: gemini-2.5-flash.

Vista previa

Apunta a un modelo de versión preliminar que se puede usar para la producción. Por lo general, los modelos de versión preliminar tienen habilitada la facturación, pueden incluir límites de frecuencia más restrictivos y dejarán de estar disponibles con un aviso de al menos 2 semanas.

Por ejemplo: gemini-2.5-flash-preview-09-2025.

Más recientes

Apunta a la versión más reciente de una variación de modelo específica. Puede ser una versión estable, preliminar o experimental. Este alias se intercambiará en caliente con cada nuevo lanzamiento de una variación de modelo específica. Se enviará un aviso de 2 semanas por correo electrónico antes de que se cambie la versión anterior a la más reciente.

Por ejemplo: gemini-flash-latest.

Experimental

Apunta a un modelo experimental que, por lo general, no será adecuado para el uso en producción y tendrá límites de frecuencia más restrictivos. Lanzamos modelos experimentales para recopilar comentarios y poner nuestras actualizaciones más recientes en manos de los desarrolladores rápidamente.

Los modelos experimentales no son estables y la disponibilidad de los extremos de los modelos está sujeta a cambios.

Bajas de modelos

Para obtener información sobre las bajas de modelos, visita la página de bajas de Gemini.