La versión preliminar de Gemini 2.5 Pro ya está disponible para su uso en producción. Más información

Se usó la API de Cloud Translation para traducir esta página.

Modelos de Gemini

2.5 Pro

Nuestro modelo de pensamiento más potente con la máxima precisión de respuesta y un rendimiento de vanguardia

Ingresa audio, imágenes, video y texto, y obtén respuestas de texto
Aborda problemas difíciles, analiza bases de datos grandes y mucho más
Ideal para la programación, el razonamiento y la comprensión multimodal complejos

2.5 Flash

Nuestro mejor modelo en términos de precio y rendimiento, que ofrece capacidades equilibradas.

Ingresa audio, imágenes, video y texto, y obtén respuestas de texto
El modelo piensa según sea necesario, o bien puedes configurar un presupuesto de pensamiento.
Ideal para tareas de alto volumen y baja latencia que requieren pensamiento

2.0 Flash

Nuestro modelo multimodal más reciente, con funciones de nueva generación y capacidades mejoradas

Ingresa audio, imágenes, video y texto, y obtén respuestas de texto
Generar código e imágenes, extraer datos, analizar archivos, generar gráficos y mucho más
Latencia baja, rendimiento mejorado, creado para potenciar experiencias de agentes

Variantes del modelo

La API de Gemini ofrece diferentes modelos optimizados para casos de uso específicos. A continuación, se incluye una breve descripción general de las variantes de Gemini disponibles:

Variante del modelo	Entradas	Salida	Optimizado para
Versión preliminar de Gemini 2.5 Flash 04-17 `gemini-2.5-flash-preview-04-17`	Audio, imágenes, videos y texto	Texto	Pensamiento adaptativo y rentabilidad
Versión preliminar de Gemini 2.5 Pro `gemini-2.5-pro-preview-03-25`	Audio, imágenes, videos y texto	Texto	Pensamiento y razonamiento mejorados, comprensión multimodal, programación avanzada y mucho más
Gemini 2.0 Flash `gemini-2.0-flash`	Audio, imágenes, videos y texto	Texto, imágenes (experimental) y audio (próximamente)	Funciones, velocidad, pensamiento, transmisión en tiempo real y generación multimodal de nueva generación
Gemini 2.0 Flash-Lite `gemini-2.0-flash-lite`	Audio, imágenes, videos y texto	Texto	Rentabilidad y baja latencia
Gemini 1.5 Flash `gemini-1.5-flash`	Audio, imágenes, videos y texto	Texto	Rendimiento rápido y versátil en una amplia variedad de tareas
Gemini 1.5 Flash-8B `gemini-1.5-flash-8b`	Audio, imágenes, videos y texto	Texto	Tareas de alto volumen y menor inteligencia
Gemini 1.5 Pro `gemini-1.5-pro`	Audio, imágenes, videos y texto	Texto	Tareas de razonamiento complejas que requieren más inteligencia
Incorporación de Gemini `gemini-embedding-exp`	Texto	Incorporaciones de texto	Cómo medir la relación entre cadenas de texto
Imagen 3 `imagen-3.0-generate-002`	Texto	Imágenes	Nuestro modelo de generación de imágenes más avanzado
Veo 2 `veo-2.0-generate-001`	Texto, imágenes	Video	Generación de videos de alta calidad
Gemini 2.0 Flash Live `gemini-2.0-flash-live-001`	Audio, video y texto	Texto y audio	Interacciones de voz y video bidireccionales de baja latencia

Puedes ver los límites de frecuencia de cada modelo en la página de límites de frecuencia.

Versión preliminar de Gemini 2.5 Flash 04-17

Nuestro mejor modelo en términos de precio y rendimiento, que ofrece capacidades equilibradas. Los límites de frecuencia de Gemini 2.5 Flash son más restrictivos, ya que es un modelo experimental o de versión preliminar.

Probar en Google AI Studio

Detalles del modelo

Propiedad	Descripción
Código de modelo	`models/gemini-2.5-flash-preview-04-17`
Tipos de datos admitidos	Entradas Texto, imágenes, video y audio Resultado Texto
Límites de tokens^[*]	Límite de tokens de entrada 1,048,576 Límite de tokens de salida 65,536
Funciones de	Generación de audio No compatible Almacenamiento en caché No compatible Ejecución de código Admitido Llamada a función Admitido Generación de imágenes No compatible Buscar Admitido Resultados estructurados Admitido Pensamiento Admitido Ajuste No compatible
Versiones	Lee los patrones de versiones de modelos para obtener más información. Vista previa: `gemini-2.5-flash-preview-04-17`
Última actualización	Abril de 2025
Fecha límite de conocimiento	Enero de 2025

Versión preliminar de Gemini 2.5 Pro

Gemini 2.5 Pro es nuestro modelo de razonamiento de vanguardia, capaz de razonar sobre problemas complejos en código, matemáticas y STEM, así como analizar grandes conjuntos de datos, bases de código y documentos con contexto extenso. Los límites de frecuencia de Gemini 2.5 Pro son más estrictos, ya que es un modelo experimental o de vista previa.

Probar en Google AI Studio

Detalles del modelo

Propiedad	Descripción
Código de modelo	Pagada: `gemini-2.5-pro-preview-03-25`, Experimental: `gemini-2.5-pro-exp-03-25`
Tipos de datos admitidos	Entradas Audio, imágenes, video y texto Resultado Texto
Límites de tokens^[*]	Límite de tokens de entrada 1,048,576 Límite de tokens de salida 65,536
Funciones de	Resultados estructurados Admitido Almacenamiento en caché Admitido Ajuste No compatible Llamada a función Admitido Ejecución de código Admitido Fundamentación de la Búsqueda Admitido Generación de imágenes No compatible Generación de audio No compatible API de Live No compatible Pensamiento Admitido
Versiones	Lee los patrones de versiones de modelos para obtener más información. Vista previa: `gemini-2.5-pro-preview-03-25` Experimental: `gemini-2.5-pro-exp-03-25`
Última actualización	Marzo de 2025
Fecha límite de conocimiento	Enero de 2025

Gemini 2.0 Flash

Gemini 2.0 Flash ofrece funciones de nueva generación y capacidades mejoradas, como velocidad superior, uso de herramientas nativas, generación multimodal y una ventana de contexto de 1 millón de tokens.

Probar en Google AI Studio

Detalles del modelo

Propiedad	Descripción
Código de modelo	`models/gemini-2.0-flash`
Tipos de datos admitidos	Entradas Audio, imágenes, video y texto Resultado Texto, imágenes (experimental) y audio(próximamente)
Límites de tokens^[*]	Límite de tokens de entrada 1,048,576 Límite de tokens de salida 8,192
Funciones de	Resultados estructurados Admitido Almacenamiento en caché Admitido Ajuste No compatible Llamada a función Admitido Ejecución de código Admitido Buscar Admitido Generación de imágenes Experimental Generación de audio Próximamente API de Live Admitido Pensamiento Experimental
Versiones	Lee los patrones de versiones de modelos para obtener más información. Más reciente: `gemini-2.0-flash` Estable: `gemini-2.0-flash-001` Experimental: `gemini-2.0-flash-exp` y `gemini-2.0-flash-exp-image-generation` apuntan al mismo modelo subyacente Actualmente, gemini-2.0-flash-exp-image-generation no es compatible con varios países de Europa, Oriente Medio y África.
Última actualización	Febrero de 2025
Fecha límite de conocimiento	Agosto de 2024

Gemini 2.0 Flash-Lite

Un modelo Gemini 2.0 Flash optimizado para la eficiencia de costos y la baja latencia.

Probar en Google AI Studio

Detalles del modelo

Propiedad	Descripción
Código de modelo	`models/gemini-2.0-flash-lite`
Tipos de datos admitidos	Entradas Audio, imágenes, video y texto Resultado Texto
Límites de tokens^[*]	Límite de tokens de entrada 1,048,576 Límite de tokens de salida 8,192
Funciones de	Resultados estructurados Admitido Almacenamiento en caché Admitido Ajuste No compatible Llamada a función Admitido Ejecución de código No compatible Buscar No compatible Generación de imágenes No compatible Generación de audio No compatible API de Live No compatible
Versiones	Lee los patrones de versiones de modelos para obtener más información. Más reciente: `gemini-2.0-flash-lite` Estable: `gemini-2.0-flash-lite-001`
Última actualización	Febrero de 2025
Fecha límite de conocimiento	Agosto de 2024

Gemini 1.5 Flash

Gemini 1.5 Flash es un modelo multimodal rápido y versátil para escalar en diversas tareas.

Probar en Google AI Studio

Detalles del modelo

Propiedad	Descripción
Código de modelo	`models/gemini-1.5-flash`
Tipos de datos admitidos	Entradas Audio, imágenes, video y texto Resultado Texto
Límites de tokens^[*]	Límite de tokens de entrada 1,048,576 Límite de tokens de salida 8,192
Especificaciones de audio y video	Cantidad máxima de imágenes por instrucción 3,600 Duración máxima del video 1 hora Duración máxima del audio Aproximadamente 9.5 horas
Funciones de	Instrucciones del sistema Admitido Modo JSON Admitido Esquema JSON Admitido Configuración de seguridad ajustable Admitido Almacenamiento en caché Admitido Ajuste Admitido Llamada a función Admitido Ejecución de código Admitido API de Live No compatible
Versiones	Lee los patrones de versiones de modelos para obtener más información. Más reciente: `gemini-1.5-flash-latest` Versión estable más reciente: `gemini-1.5-flash` Estable: `gemini-1.5-flash-001` `gemini-1.5-flash-002`
Última actualización	Septiembre de 2024

Gemini 1.5 Flash-8B

Gemini 1.5 Flash-8B es un modelo pequeño diseñado para tareas de menor inteligencia.

Probar en Google AI Studio

Detalles del modelo

Propiedad	Descripción
Código de modelo	`models/gemini-1.5-flash-8b`
Tipos de datos admitidos	Entradas Audio, imágenes, video y texto Resultado Texto
Límites de tokens^[*]	Límite de tokens de entrada 1,048,576 Límite de tokens de salida 8,192
Especificaciones de audio y video	Cantidad máxima de imágenes por instrucción 3,600 Duración máxima del video 1 hora Duración máxima del audio Aproximadamente 9.5 horas
Funciones de	Instrucciones del sistema Admitido Modo JSON Admitido Esquema JSON Admitido Configuración de seguridad ajustable Admitido Almacenamiento en caché Admitido Ajuste Admitido Llamada a función Admitido Ejecución de código Admitido API de Live No compatible
Versiones	Lee los patrones de versiones de modelos para obtener más información. Más reciente: `gemini-1.5-flash-8b-latest` Versión estable más reciente: `gemini-1.5-flash-8b` Estable: `gemini-1.5-flash-8b-001`
Última actualización	Octubre de 2024

Gemini 1.5 Pro

Prueba la versión preliminar de Gemini 2.5 Pro, nuestro modelo de Gemini más avanzado hasta la fecha.

Gemini 1.5 Pro es un modelo multimodal de tamaño mediano que está optimizado para una amplia variedad de tareas de razonamiento. La versión 1.5 Pro puede procesar grandes cantidades de datos a la vez, incluidas 2 horas de video, 19 horas de audio, bases de código con 60,000 líneas de código o 2,000 páginas de texto.

Probar en Google AI Studio

Detalles del modelo

Propiedad	Descripción
Código de modelo	`models/gemini-1.5-pro`
Tipos de datos admitidos	Entradas Audio, imágenes, video y texto Resultado Texto
Límites de tokens^[*]	Límite de tokens de entrada 2,097,152 Límite de tokens de salida 8,192
Especificaciones de audio y video	Cantidad máxima de imágenes por instrucción 7,200 Duración máxima del video 2 horas Duración máxima del audio Aproximadamente 19 horas
Funciones de	Instrucciones del sistema Admitido Modo JSON Admitido Esquema JSON Admitido Configuración de seguridad ajustable Admitido Almacenamiento en caché Admitido Ajuste No compatible Llamada a función Admitido Ejecución de código Admitido API de Live No compatible
Versiones	Lee los patrones de versiones de modelos para obtener más información. Más reciente: `gemini-1.5-pro-latest` Versión estable más reciente: `gemini-1.5-pro` Estable: `gemini-1.5-pro-001` `gemini-1.5-pro-002`
Última actualización	Septiembre de 2024

Imagen 3

Imagen 3 es nuestro modelo de texto a imagen de mayor calidad, capaz de generar imágenes con aún más detalles, una iluminación más rica y menos artefactos distractores que nuestros modelos anteriores.

Detalles del modelo

Propiedad	Descripción
Código de modelo	API de Gemini `imagen-3.0-generate-002`
Tipos de datos admitidos	Entrada Texto Resultado Imágenes
Límites de tokens^[*]	Límite de tokens de entrada N/A Imágenes de salida Hasta 4
Última actualización	Febrero de 2025

Veo 2

Veo 2 es nuestro modelo de alta calidad de texto a video y de imagen a video, capaz de generar videos detallados que capturan los matices artísticos de tus instrucciones.

Detalles del modelo

Propiedad	Descripción
Código de modelo	API de Gemini `veo-2.0-generate-001`
Tipos de datos admitidos	Entrada Texto, imagen Resultado Video
Límites de	Entrada de texto N/A Entrada de imagen Cualquier resolución de imagen y relación de aspecto con un tamaño de archivo de hasta 20 MB Video de salida Hasta 2
Última actualización	Abril de 2025

Gemini 2.0 Flash Live

El modelo Gemini 2.0 Flash en vivo funciona con la API de Live para habilitar interacciones de voz y video bidireccionales de baja latencia con Gemini. El modelo puede procesar entradas de texto, audio y video, y puede proporcionar salidas de texto y audio.

Probar en Google AI Studio

Detalles del modelo

Propiedad	Descripción
Código de modelo	`models/gemini-2.0-flash-live-001`
Tipos de datos admitidos	Entradas Audio, video y texto Resultado Texto y audio
Límites de tokens^[*]	Límite de tokens de entrada 1,048,576 Límite de tokens de salida 8,192
Funciones de	Resultados estructurados Admitido Ajuste No compatible Llamada a función Admitido Ejecución de código Admitido Buscar Admitido Generación de imágenes No compatible Generación de audio Admitido Pensamiento No compatible
Versiones	Lee los patrones de versiones de modelos para obtener más información. Vista previa: `gemini-2.0-flash-live-001`
Última actualización	Abril de 2025
Fecha límite de conocimiento	Agosto de 2024

Gemini Embedding Experimental

Gemini embedding logra un rendimiento de vanguardia en muchas dimensiones clave, como el código, la recuperación y la multilingüismo. Los límites de frecuencia de incorporación de Gemini son más restrictivos, ya que es un modelo experimental.

Detalles del modelo

Propiedad	Descripción
Código de modelo	API de Gemini `gemini-embedding-exp-03-07`
Tipos de datos admitidos	Entrada Texto Resultado Incorporaciones de texto
Límites de tokens^[*]	Límite de tokens de entrada 8,192 Tamaño de la dimensión de salida Elastic admite 3072, 1536 o 768.
Última actualización	Marzo de 2025

Incorporación de texto y de objetos

Incorporación de texto

Prueba nuestro nuevo modelo experimental de incorporación de Gemini, que logra un rendimiento de vanguardia.

Las incorporaciones de texto se usan para medir la relación entre cadenas y se usan ampliamente en muchas aplicaciones de IA.

text-embedding-004 logra un rendimiento de recuperación más sólido y supera a los modelos existentes con dimensiones comparables en las comparativas de incorporación de MTEB estándar.

Detalles del modelo

Propiedad	Descripción
Código de modelo	API de Gemini `models/text-embedding-004`
Tipos de datos admitidos	Entrada Texto Resultado Incorporaciones de texto
Límites de tokens^[*]	Límite de tokens de entrada 2,048 Tamaño de la dimensión de salida 768
Límites de frecuencia^[**]	1,500 solicitudes por minuto
Configuración de seguridad ajustable	No compatible
Última actualización	Abril de 2024

Embedding

Puedes usar el modelo de incorporación para generar incorporaciones de texto para el texto de entrada.

El modelo de incorporación está optimizado para crear incorporaciones con 768 dimensiones para texto de hasta 2,048 tokens.

Detalles del modelo de incorporación

Propiedad	Descripción
Código de modelo	`models/embedding-001`
Tipos de datos admitidos	Entrada Texto Resultado Incorporaciones de texto
Límites de tokens^[*]	Límite de tokens de entrada 2,048 Tamaño de la dimensión de salida 768
Límites de frecuencia^[**]	1,500 solicitudes por minuto
Configuración de seguridad ajustable	No compatible
Última actualización	Diciembre de 2023

AQA

Puedes usar el modelo de AQA para realizar tareas relacionadas con la respuesta a preguntas atribuidas (AQA) en un documento, un corpus o un conjunto de pasajes. El modelo de AQA muestra respuestas a preguntas que se basan en las fuentes proporcionadas, junto con la estimación de la probabilidad de respuesta.

Detalles del modelo

Propiedad	Descripción
Código de modelo	`models/aqa`
Tipos de datos admitidos	Entrada Texto Resultado Texto
Idioma admitido	Inglés
Límites de tokens^[*]	Límite de tokens de entrada 7,168 Límite de tokens de salida 1,024
Límites de frecuencia^[**]	1,500 solicitudes por minuto
Configuración de seguridad ajustable	Admitido
Última actualización	Diciembre de 2023

Consulta los ejemplos para explorar las capacidades de estas variaciones de modelos.

[*] Un token equivale a aproximadamente 4 caracteres para los modelos de Gemini. 100 tokens son entre 60 y 80 palabras en inglés.

Patrones de nombres de versiones de modelos

Los modelos de Gemini están disponibles en versiones experimentales, estables o de vista previa. En tu código, puedes usar uno de los siguientes formatos de nombre de modelo para especificar cuál es el modelo y la versión que deseas usar.

Versión estable más reciente: Hace referencia a la versión estable más reciente que se lanzó para la generación y variación de modelos especificadas.

Para especificar la versión estable más reciente, usa el siguiente patrón: <model>-<generation>-<variation>. Por ejemplo, gemini-2.0-flash
Estable: Hace referencia a un modelo estable específico. Los modelos estables suelen no cambiar. La mayoría de las apps de producción deben usar un modelo estable específico.

Para especificar una versión estable, usa el siguiente patrón: <model>-<generation>-<variation>-<version>. Por ejemplo, gemini-2.0-flash-001
Versión preliminar: Indica un modelo de versión preliminar que puede no ser adecuado para el uso en producción, tiene límites de tarifas más restrictivos, pero puede tener habilitada la facturación.

Para especificar una versión preliminar, usa el siguiente patrón: <model>-<generation>-<variation>-<version>. Por ejemplo, gemini-2.5-pro-preview-03-25
Experimental: Indica un modelo experimental que puede no ser adecuado para el uso en producción y que tiene límites de frecuencia más restrictivos. Lanzamos modelos experimentales para recopilar comentarios y que nuestros desarrolladores tengan acceso rápido a las actualizaciones más recientes.

Para especificar una versión experimental, usa el siguiente patrón: <model>-<generation>-<variation>-<version>. Por ejemplo, gemini-2.0-pro-exp-02-05

Modelos experimentales

Además de los modelos estables, la API de Gemini ofrece modelos experimentales que pueden no ser adecuados para el uso en producción y tienen límites de frecuencia más restrictivos.

Lanzamos modelos experimentales para recopilar comentarios, llevar nuestras actualizaciones más recientes a los desarrolladores con rapidez y destacar el ritmo de innovación que se lleva a cabo en Google. Lo que aprendemos de los lanzamientos experimentales nos permite lanzar modelos de forma más amplia. Un modelo experimental se puede intercambiar por otro sin aviso previo. No garantizamos que un modelo experimental se convierta en un modelo estable en el futuro.

Modelos experimentales anteriores

A medida que estén disponibles versiones nuevas o estables, quitaremos y reemplazaremos los modelos experimentales. Puedes encontrar los modelos experimentales anteriores que lanzamos en la siguiente sección junto con la versión de reemplazo:

Código del modelo	Modelo base	Versión de reemplazo
`gemini-2.0-flash-thinking-exp-01-21`	Gemini 2.5 Flash	`gemini-2.5-flash-preview-04-17`
`gemini-2.0-pro-exp-02-05`	Gemini 2.0 Pro Experimental	`gemini-2.5-pro-preview-03-25`
`gemini-2.0-flash-exp`	Gemini 2.0 Flash	`gemini-2.0-flash`
`gemini-exp-1206`	Gemini 2.0 Pro	`gemini-2.0-pro-exp-02-05`
`gemini-2.0-flash-thinking-exp-1219`	Gemini 2.0 Flash Thinking	`gemini-2.0-flash-thinking-exp-01-21`
`gemini-exp-1121`	Gemini	`gemini-exp-1206`
`gemini-exp-1114`	Gemini	`gemini-exp-1206`
`gemini-1.5-pro-exp-0827`	Gemini 1.5 Pro	`gemini-exp-1206`
`gemini-1.5-pro-exp-0801`	Gemini 1.5 Pro	`gemini-exp-1206`
`gemini-1.5-flash-8b-exp-0924`	Gemini 1.5 Flash-8B	`gemini-1.5-flash-8b`
`gemini-1.5-flash-8b-exp-0827`	Gemini 1.5 Flash-8B	`gemini-1.5-flash-8b`

Idiomas admitidos

Los modelos de Gemini se entrenan para funcionar con los siguientes idiomas:

Árabe (ar)
Bengalí (bn)
Búlgaro (bg)
Chino simplificado y tradicional (zh)
Croata (hr)
Checo (cs)
Danés (da)
Neerlandés (nl)
Inglés (en)
Estonio (et)
Finés (fi)
Francés (fr)
Alemán (de)
Griego (el)
Hebreo (iw)
Hindi (hi)
Húngaro (hu)
Indonesio (id)
Italiano (it)
Japonés (ja)
Coreano (ko)
Letón (lv)
Lituano (lt)
Noruego (no)
Polaco (pl)
Portugués (pt)
Rumano (ro)
Ruso (ru)
Serbio (sr)
Eslovaco (sk)
Esloveno (sl)
Español (es)
Suajili (sw)
Sueco (sv)
Tailandés (th)
Turco (tr)
Ucraniano (uk)
Vietnamita (vi)