Gemini 3
Gemini 3.1 Pro
Inteligencia avanzada, habilidades para resolver problemas complejos y potentes capacidades de codificación de agentes y ambiente.
Vista previa
Gemini 3 Flash
Rendimiento de clase superior que compite con modelos más grandes a una fracción del costo.
Vista previa
Gemini 3.1 Flash-Lite
Rendimiento de clase superior que compite con modelos más grandes a una fracción del costo.
Vista previa
Nano Banana 2
Generación y edición de imágenes potentes y de alta eficiencia, optimizadas para la velocidad y los casos de uso de gran volumen.
Vista previa
Nano Banana Pro
Modelos de generación y edición de imágenes de vanguardia para la creación de imágenes nativas altamente contextuales.
Vista previa
Gemini 3.1 Flash Live
Modelo de API de Live de alta calidad y baja latencia para aplicaciones de IA de diálogo en tiempo real y de voz primero.
Nueva versión preliminar
Gemini 3.1 Flash TTS
Generación de voz potente y de baja latencia.
Nueva versión preliminar
Gemini 2.5 Flash
Gemini 2.5 Flash
Nuestro mejor modelo de relación precio-rendimiento para tareas de baja latencia y gran volumen que requieren razonamiento.
Nano Banana
Generación y edición de imágenes nativas de vanguardia diseñadas para flujos de trabajo creativos y rápidos.
Versión preliminar de Gemini 2.5 Flash Live
Optimizado para agentes conversacionales en tiempo real con transmisión de audio nativa de menos de un segundo.
Versión preliminar de Gemini 2.5 Flash TTS
Generación de audio de texto a voz controlable con control preciso sobre el estilo y el ritmo.
Gemini 2.5 Flash-Lite
Gemini 2.5 Flash-Lite
El modelo multimodal más rápido y económico de la familia 2.5.
Gemini 2.5 Pro
Gemini 2.5 Pro
Nuestro modelo más avanzado para tareas complejas, con capacidades de razonamiento y programación profundas.
Versión preliminarde Gemini 2.5 Pro TTS
Síntesis de voz de alta fidelidad optimizada para la calidad en flujos de trabajo estructurados, como podcasts y audiolibros.
Modelos de audio
Esta sección contiene todos los modelos de audio, incluidos los que ya pueden aparecer en otras secciones.
Versión preliminar de Gemini 3.1 Flash Live
Nuestro modelo de audio a audio (A2A) de alta calidad y baja latencia diseñado para aplicaciones de IA de diálogo en tiempo real y de voz primero.
Versión preliminar de Gemini 3.1 Flash TTS
Generación de voz potente y de baja latencia, con salidas naturales, instrucciones orientables y nuevas etiquetas de audio expresivas para un control preciso de la narración.
Versión preliminar de Gemini 2.5 Flash Live
Nuestro modelo insignia de API de Live para agentes de voz y video bidireccionales de baja latencia con razonamiento de audio nativo.
Versión preliminar de Gemini 2.5 Flash TTS
Texto a voz rápido y controlable para aplicaciones de baja latencia y rentables, y asistentes en tiempo real.
Versión preliminarde Gemini 2.5 Pro TTS
Síntesis de voz de alta fidelidad optimizada para la calidad en flujos de trabajo estructurados, como podcasts y audiolibros.
Modelos de medios generativos
Esta sección contiene todos los modelos de medios generativos, incluidos los que ya pueden aparecer en otras secciones.
Versión preliminar de Nano Banana 2
Creación visual de alta eficiencia a escala de producción, que combina la inteligencia de la serie Gemini 3 con velocidades de generación ultrarrápidas.
Versión preliminar de Veo 3.1
Generación de videos cinematográficos de vanguardia con controles creativos avanzados y audio sincronizado de forma nativa.
Versión preliminar de Nano Banana Pro
Un motor de diseño profesional con un núcleo de razonamiento para imágenes 4K de calidad de estudio, diseños complejos y renderización de texto precisa.
Versión preliminar de Veo 3.1 Lite
Generación, edición y control cinematográfico de videos de alta eficiencia, bajo costo y primero para desarrolladores de la familia Veo 3.1.
Nano Banana
Generación y edición de imágenes nativas de vanguardia diseñadas para flujos de trabajo creativos y rápidos.
Imagen 4
Modelo de texto a imagen, con generación rápida y ultrarrápida, y claridad excepcional hasta una resolución de 2K.
Modelos de generación de música
Esta sección contiene todos los modelos de generación de música, incluidos los que ya pueden aparecer en otras secciones.
Versión preliminar de Lyria 3 Pro
Nuestro modelo insignia de generación de música, optimizado para canciones completas con coherencia estructural compleja.
Versión preliminarde Lyria 3 Clip
Optimizado para generar clips musicales cortos, bucles y vistas previas de hasta 30 segundos.
Lyria RealTime Experimental
Modelo de generación de música de alta fidelidad que proporciona control creativo detallado y capacidades de transmisión en tiempo real.
Modelos de herramientas y agentes
Versión preliminar de Computer Use
Un modelo especializado que puede "ver" una pantalla digital y realizar acciones de la IU, como hacer clic, escribir y navegar, para automatizar tareas complejas del navegador.
Versión preliminarde Gemini Deep Research
Un modelo de agente que planifica y ejecuta de forma autónoma investigaciones de varios pasos en cientos de fuentes para producir informes interactivos y citados.
Versión preliminarde Gemini Deep Research Max
Máxima exhaustividad para la recopilación y síntesis automatizadas de contexto en cientos de fuentes.
Modelos de tareas especializadas
Gemini Embedding 2
Nuestro primer modelo de embedding multimodal, que asigna texto, imágenes, video, audio y PDFs a un espacio de embedding unificado para la búsqueda semántica avanzada y los sistemas RAG.
Gemini Embedding
Representaciones vectoriales de alta dimensión para la búsqueda semántica avanzada, la clasificación de texto y los sistemas RAG.
Versión preliminar de Gemini Robotics-ER 1.6
Modelo de razonamiento integrado avanzado que comprende espacios físicos y planifica tareas de varios pasos para agentes robóticos con nuevas capacidades, como lectura de instrumentos y razonamiento espacial y físico mejorado.
Modelos anteriores
Gemini 2.0 Flash obsoleto
Nuestro modelo de caballo de batalla de segunda generación, con funciones de nueva generación y capacidades mejoradas, como velocidad superior, uso de herramientas nativas y una ventana de contexto de 1 millón de tokens.
Gemini 2.0 Flash-Lite obsoleto
Nuestro modelo de segunda generación más rápido, optimizado para la rentabilidad y la baja latencia.
Cierre de la versión preliminar de Gemini 3 Pro Shut down
Nuestro modelo de razonamiento de vanguardia, con comprensión multimodal avanzada.
Patrones de nombres de versiones de modelos
Los modelos de Gemini están disponibles en versiones estables, preliminares, más recientes o experimentales.
Estable
Apunta a un modelo estable específico. Por lo general, los modelos estables no cambian. La mayoría de las apps de producción deben usar un modelo estable específico.
Por ejemplo: gemini-2.5-flash.
Vista previa
Apunta a un modelo de versión preliminar que se puede usar para la producción. Por lo general, los modelos de versión preliminar tienen habilitada la facturación, pueden incluir límites de frecuencia más restrictivos y dejarán de estar disponibles con un aviso de al menos 2 semanas.
Por ejemplo: gemini-2.5-flash-preview-09-2025.
Más recientes
Apunta a la versión más reciente de una variación de modelo específica. Puede ser una versión estable, preliminar o experimental. Este alias se intercambiará en caliente con cada nuevo lanzamiento de una variación de modelo específica. Se enviará un aviso de 2 semanas por correo electrónico antes de que se cambie la versión anterior a la más reciente.
Por ejemplo: gemini-flash-latest.
Experimental
Apunta a un modelo experimental que, por lo general, no será adecuado para el uso en producción y tendrá límites de frecuencia más restrictivos. Lanzamos modelos experimentales para recopilar comentarios y poner nuestras actualizaciones más recientes en manos de los desarrolladores rápidamente.
Los modelos experimentales no son estables y la disponibilidad de los extremos de los modelos está sujeta a cambios.
Bajas de modelos
Para obtener información sobre las bajas de modelos, visita la página de bajas de Gemini.