Gemini 2.5 Pro Experimental, nuestro modelo más avanzado, ya está disponible. Más información

Se usó la API de Cloud Translation para traducir esta página.

Modelos de Gemini

2.5 Pro

Nuestro modelo de pensamiento más potente con la máxima precisión de respuesta y un rendimiento de vanguardia

Ingresa audio, imágenes, video y texto, y obtén respuestas de texto
Aborda problemas difíciles, analiza bases de datos grandes y mucho más
Ideal para la programación, el razonamiento y la comprensión multimodal complejos

2.0 Flash

Nuestro modelo multimodal más reciente, con funciones de nueva generación y capacidades mejoradas

Ingresa audio, imágenes, video y texto, y obtén respuestas de texto
Generar código e imágenes, extraer datos, analizar archivos, generar gráficos y mucho más
Latencia baja, rendimiento mejorado y diseñado para potenciar experiencias de agentes

2.0 Flash-Lite

Un modelo Gemini 2.0 Flash optimizado para la eficiencia de costos y la baja latencia

Ingresa audio, imágenes, video y texto, y obtén respuestas de texto
Rendimiento superior al de Flash 1.5 en la mayoría de las comparativas
Una ventana de contexto de 1 millón de tokens y una entrada multimodal, como Flash 2.0

Variantes del modelo

La API de Gemini ofrece diferentes modelos optimizados para casos de uso específicos. A continuación, se incluye una breve descripción general de las variantes de Gemini disponibles:

Variante del modelo	Entradas	Resultado	Optimizado para
Gemini 2.5 Pro Experimental `gemini-2.5-pro-exp-03-25`	Audio, imágenes, videos y texto	Texto	Pensamiento y razonamiento mejorados, comprensión multimodal, programación avanzada y mucho más
Gemini 2.0 Flash `gemini-2.0-flash`	Audio, imágenes, videos y texto	Texto, imágenes (experimental) y audio (próximamente)	Funciones, velocidad, pensamiento, transmisión en tiempo real y generación multimodal de nueva generación
Gemini 2.0 Flash-Lite `gemini-2.0-flash-lite`	Audio, imágenes, videos y texto	Texto	Rentabilidad y baja latencia
Gemini 1.5 Flash `gemini-1.5-flash`	Audio, imágenes, videos y texto	Texto	Rendimiento rápido y versátil en una amplia variedad de tareas
Gemini 1.5 Flash-8B `gemini-1.5-flash-8b`	Audio, imágenes, videos y texto	Texto	Tareas de alto volumen y menor inteligencia
Gemini 1.5 Pro `gemini-1.5-pro`	Audio, imágenes, videos y texto	Texto	Tareas de razonamiento complejas que requieren más inteligencia
Incorporación de Gemini `gemini-embedding-exp`	Texto	Incorporaciones de texto	Cómo medir la relación entre cadenas de texto
Imagen 3 `imagen-3.0-generate-002`	Texto	Imágenes	Nuestro modelo de generación de imágenes más avanzado

Puedes ver los límites de frecuencia de cada modelo en la página de límites de frecuencia.

Gemini 2.5 Pro Experimental

Gemini 2.5 Pro Experimental es nuestro modelo de pensamiento de vanguardia, capaz de razonar sobre problemas complejos en código, matemáticas y STEM, así como analizar grandes conjuntos de datos, bases de código y documentos con contexto extenso.

Probar en Google AI Studio

Detalles del modelo

Propiedad	Descripción
Código de modelo	`gemini-2.5-pro-exp-03-25`
Tipos de datos admitidos	Entradas Audio, imágenes, video y texto Resultado Texto
Límites de tokens^[*]	Límite de tokens de entrada 1,048,576 Límite de tokens de salida 65,536
Funciones de	Resultados estructurados Admitido Almacenamiento en caché No compatible Ajuste No compatible Llamada a función Admitido Ejecución de código Admitido Fundamentación de la Búsqueda Admitido Generación de imágenes No compatible Uso de herramientas nativas Admitido Generación de audio No compatible API de Live No compatible Pensamiento Admitido
Versiones	Lee los patrones de versiones de modelos para obtener más información. Experimental: `gemini-2.5-pro-exp-03-25`
Última actualización	Marzo de 2025
Cutoff de conocimiento	Enero de 2025

Gemini 2.0 Flash

Gemini 2.0 Flash ofrece funciones de nueva generación y capacidades mejoradas, como velocidad superior, uso de herramientas nativas, generación multimodal y una ventana de contexto de 1 millón de tokens.

Probar en Google AI Studio

Detalles del modelo

Propiedad	Descripción
Código de modelo	`models/gemini-2.0-flash`
Tipos de datos admitidos	Entradas Audio, imágenes, video y texto Resultado Texto, imágenes (experimental) y audio(próximamente)
Límites de tokens^[*]	Límite de tokens de entrada 1,048,576 Límite de tokens de salida 8,192
Funciones de	Resultados estructurados Admitido Almacenamiento en caché Próximamente Ajuste No compatible Llamada a función Admitido Ejecución de código Admitido Buscar Admitido Generación de imágenes Experimental Uso de herramientas nativas Admitido Generación de audio Próximamente API de Live Experimental Pensamiento Experimental
Versiones	Lee los patrones de versiones de modelos para obtener más información. Más reciente: `gemini-2.0-flash` Estable: `gemini-2.0-flash-001` Experimental: `gemini-2.0-flash-exp` Experimental: `gemini-2.0-flash-thinking-exp-01-21`
Última actualización	Febrero de 2025
Cutoff de conocimiento	Agosto de 2024

Gemini 2.0 Flash-Lite

Un modelo Gemini 2.0 Flash optimizado para la eficiencia de costos y la baja latencia.

Probar en Google AI Studio

Detalles del modelo

Propiedad	Descripción
Código de modelo	`models/gemini-2.0-flash-lite`
Tipos de datos admitidos	Entradas Audio, imágenes, video y texto Resultado Texto
Límites de tokens^[*]	Límite de tokens de entrada 1,048,576 Límite de tokens de salida 8,192
Funciones de	Resultados estructurados Admitido Almacenamiento en caché No compatible Ajuste No compatible Llamada a función No compatible Ejecución de código No compatible Buscar No compatible Generación de imágenes No compatible Uso de herramientas nativas No compatible Generación de audio No compatible API de Live No compatible
Versiones	Lee los patrones de versiones de modelos para obtener más información. Más reciente: `gemini-2.0-flash-lite` Estable: `gemini-2.0-flash-lite-001`
Última actualización	Febrero de 2025
Cutoff de conocimiento	Agosto de 2024

Gemini 1.5 Flash

Gemini 1.5 Flash es un modelo multimodal rápido y versátil para escalar en diversas tareas.

Probar en Google AI Studio

Detalles del modelo

Propiedad	Descripción
Código de modelo	`models/gemini-1.5-flash`
Tipos de datos admitidos	Entradas Audio, imágenes, video y texto Resultado Texto
Límites de tokens^[*]	Límite de tokens de entrada 1,048,576 Límite de tokens de salida 8,192
Especificaciones de audio y video	Cantidad máxima de imágenes por instrucción 3,600 Duración máxima del video 1 hora Duración máxima del audio Aproximadamente 9.5 horas
Funciones de	Instrucciones del sistema Admitido Modo JSON Admitido Esquema JSON Admitido Configuración de seguridad ajustable Admitido Almacenamiento en caché Admitido Ajuste Admitido Llamada a función Admitido Ejecución de código Admitido API de Live No compatible
Versiones	Lee los patrones de versiones de modelos para obtener más información. Más reciente: `gemini-1.5-flash-latest` Versión estable más reciente: `gemini-1.5-flash` Estable: `gemini-1.5-flash-001` `gemini-1.5-flash-002`
Última actualización	Septiembre de 2024

Gemini 1.5 Flash-8B

Gemini 1.5 Flash-8B es un modelo pequeño diseñado para tareas de menor inteligencia.

Probar en Google AI Studio

Detalles del modelo

Propiedad	Descripción
Código de modelo	`models/gemini-1.5-flash-8b`
Tipos de datos admitidos	Entradas Audio, imágenes, video y texto Resultado Texto
Límites de tokens^[*]	Límite de tokens de entrada 1,048,576 Límite de tokens de salida 8,192
Especificaciones de audio y video	Cantidad máxima de imágenes por instrucción 3,600 Duración máxima del video 1 hora Duración máxima del audio Aproximadamente 9.5 horas
Funciones de	Instrucciones del sistema Admitido Modo JSON Admitido Esquema JSON Admitido Configuración de seguridad ajustable Admitido Almacenamiento en caché Admitido Ajuste Admitido Llamada a función Admitido Ejecución de código Admitido API de Live No compatible
Versiones	Lee los patrones de versiones de modelos para obtener más información. Más reciente: `gemini-1.5-flash-8b-latest` Versión estable más reciente: `gemini-1.5-flash-8b` Estable: `gemini-1.5-flash-8b-001`
Última actualización	Octubre de 2024

Gemini 1.5 Pro

Prueba Gemini 2.0 Pro Experimental, nuestro modelo de Gemini más avanzado hasta la fecha.

Gemini 1.5 Pro es un modelo multimodal de tamaño mediano que está optimizado para una amplia variedad de tareas de razonamiento. La versión 1.5 Pro puede procesar grandes cantidades de datos a la vez, incluidas 2 horas de video, 19 horas de audio, bases de código con 60,000 líneas de código o 2,000 páginas de texto.

Probar en Google AI Studio

Detalles del modelo

Propiedad	Descripción
Código de modelo	`models/gemini-1.5-pro`
Tipos de datos admitidos	Entradas Audio, imágenes, video y texto Resultado Texto
Límites de tokens^[*]	Límite de tokens de entrada 2,097,152 Límite de tokens de salida 8,192
Especificaciones de audio y video	Cantidad máxima de imágenes por instrucción 7,200 Duración máxima del video 2 horas Duración máxima del audio Aproximadamente 19 horas
Funciones de	Instrucciones del sistema Admitido Modo JSON Admitido Esquema JSON Admitido Configuración de seguridad ajustable Admitido Almacenamiento en caché Admitido Ajuste No compatible Llamada a función Admitido Ejecución de código Admitido API de Live No compatible
Versiones	Lee los patrones de versiones de modelos para obtener más información. Más reciente: `gemini-1.5-pro-latest` Versión estable más reciente: `gemini-1.5-pro` Estable: `gemini-1.5-pro-001` `gemini-1.5-pro-002`
Última actualización	Septiembre de 2024

Imagen 3

Imagen 3 es nuestro modelo de texto a imagen de mayor calidad, capaz de generar imágenes con aún más detalles, una iluminación más rica y menos artefactos distractores que nuestros modelos anteriores.

Detalles del modelo

Propiedad	Descripción
Código de modelo	API de Gemini `imagen-3.0-generate-002`
Tipos de datos admitidos	Entrada Texto Resultado Imágenes
Límites de tokens^[*]	Límite de tokens de entrada N/A Imágenes de salida Hasta 4
Última actualización	Febrero de 2025

Gemini Embedding Experimental

Gemini embedding logra un rendimiento de vanguardia en muchas dimensiones clave, como el código, la recuperación y la multilingüismo.

Detalles del modelo

Propiedad	Descripción
Código de modelo	API de Gemini `gemini-embedding-exp-03-07`
Tipos de datos admitidos	Entrada Texto Resultado Incorporaciones de texto
Límites de tokens^[*]	Límite de tokens de entrada 8,192 Tamaño de la dimensión de salida Elastic admite 3072, 1536 o 768.
Última actualización	Marzo de 2025

Incorporación de texto y de embeddings

Incorporación de texto

Prueba nuestro nuevo modelo experimental de incorporación de Gemini, que logra un rendimiento de vanguardia.

Las incorporaciones de texto se usan para medir la relación entre cadenas y se usan ampliamente en muchas aplicaciones de IA.

text-embedding-004 logra un rendimiento de recuperación más sólido y supera a los modelos existentes con dimensiones comparables en las comparativas de incorporación de MTEB estándar.

Detalles del modelo

Propiedad	Descripción
Código de modelo	API de Gemini `models/text-embedding-004`
Tipos de datos admitidos	Entrada Texto Resultado Incorporaciones de texto
Límites de tokens^[*]	Límite de tokens de entrada 2,048 Tamaño de la dimensión de salida 768
Límites de frecuencia^[**]	1,500 solicitudes por minuto
Configuración de seguridad ajustable	No compatible
Última actualización	Abril de 2024

Embedding

Puedes usar el modelo de incorporación para generar incorporaciones de texto para el texto de entrada.

El modelo de incorporación está optimizado para crear incorporaciones con 768 dimensiones para texto de hasta 2,048 tokens.

Detalles del modelo de incorporación

Propiedad	Descripción
Código de modelo	`models/embedding-001`
Tipos de datos admitidos	Entrada Texto Resultado Incorporaciones de texto
Límites de tokens^[*]	Límite de tokens de entrada 2,048 Tamaño de la dimensión de salida 768
Límites de frecuencia^[**]	1,500 solicitudes por minuto
Configuración de seguridad ajustable	No compatible
Última actualización	Diciembre de 2023

AQA

Puedes usar el modelo de AQA para realizar tareas relacionadas con la respuesta a preguntas atribuidas (AQA) en un documento, un corpus o un conjunto de pasajes. El modelo de AQA muestra respuestas a preguntas que se basan en las fuentes proporcionadas, junto con la estimación de la probabilidad de respuesta.

Detalles del modelo

Propiedad	Descripción
Código de modelo	`models/aqa`
Tipos de datos admitidos	Entrada Texto Resultado Texto
Idioma admitido	Inglés
Límites de tokens^[*]	Límite de tokens de entrada 7,168 Límite de tokens de salida 1,024
Límites de frecuencia^[**]	1,500 solicitudes por minuto
Configuración de seguridad ajustable	Admitido
Última actualización	Diciembre de 2023

Consulta los ejemplos para explorar las capacidades de estas variaciones de modelos.

[*] Un token equivale a cerca de 4 caracteres para los modelos de Gemini. 100 tokens son entre 60 y 80 palabras en inglés.

Patrones de nombres de versiones de modelos

Los modelos de Gemini están disponibles en versiones preliminares o estables. En tu código, puedes usar uno de los siguientes formatos de nombre de modelo para especificar qué modelo y versión deseas usar.

Más reciente: Indica la versión más reciente del modelo para una generación y una variación especificadas. El modelo subyacente se actualiza con regularidad y podría ser una versión preliminar. Solo las apps y los prototipos de pruebas exploratorias deben usar este alias.

Para especificar la versión más reciente, usa el siguiente patrón: <model>-<generation>-<variation>-latest. Por ejemplo, gemini-1.0-pro-latest
Versión estable más reciente: Hace referencia a la versión estable más reciente que se lanzó para la generación y variación de modelos especificadas.

Para especificar la versión estable más reciente, usa el siguiente patrón: <model>-<generation>-<variation>. Por ejemplo, gemini-1.0-pro
Estable: Hace referencia a un modelo estable específico. Los modelos estables suelen no cambiar. La mayoría de las apps de producción deben usar un modelo estable específico.

Para especificar una versión estable, usa el siguiente patrón: <model>-<generation>-<variation>-<version>. Por ejemplo, gemini-1.0-pro-001
Experimental: Indica un modelo experimental (no para uso en producción). Lanzamos modelos experimentales para recopilar comentarios, llevar nuestras actualizaciones más recientes a los desarrolladores rápidamente y destacar el ritmo de innovación que se lleva a cabo en Google.

Para especificar una versión experimental, usa el siguiente patrón: <model>-<generation>-<variation>-<version>. Por ejemplo, gemini-2.0-pro-exp-02-05

Modelos experimentales

Además de los modelos listos para producción, la API de Gemini ofrece modelos experimentales (no para uso en producción, como se define en nuestros Términos).

Lanzamos modelos experimentales para recopilar comentarios, llevar nuestras actualizaciones más recientes a los desarrolladores con rapidez y destacar el ritmo de innovación que se lleva a cabo en Google. Lo que aprendemos de los lanzamientos experimentales nos permite definir cómo podemos realizar lanzamientos a una mayor escala. Un modelo experimental se puede intercambiar por otro sin aviso previo. No garantizamos que un modelo experimental se convierta en un modelo estable en el futuro.

Modelos experimentales anteriores

A medida que estén disponibles versiones nuevas o estables, quitaremos y reemplazaremos los modelos experimentales. Puedes encontrar los modelos experimentales anteriores que lanzamos en la siguiente sección junto con la versión de reemplazo:

Código del modelo	Modelo base	Versión de reemplazo
`gemini-2.0-pro-exp-02-05`	Gemini 2.0 Pro Experimental	`gemini-2.5-pro-exp-03-25`
`gemini-2.0-flash-exp`	Gemini 2.0 Flash	`gemini-2.0-flash`
`gemini-exp-1206`	Gemini 2.0 Pro	`gemini-2.0-pro-exp-02-05`
`gemini-2.0-flash-thinking-exp-1219`	Gemini 2.0 Flash Thinking	`gemini-2.0-flash-thinking-exp-01-21`
`gemini-exp-1121`	Gemini	`gemini-exp-1206`
`gemini-exp-1114`	Gemini	`gemini-exp-1206`
`gemini-1.5-pro-exp-0827`	Gemini 1.5 Pro	`gemini-exp-1206`
`gemini-1.5-pro-exp-0801`	Gemini 1.5 Pro	`gemini-exp-1206`
`gemini-1.5-flash-8b-exp-0924`	Gemini 1.5 Flash-8B	`gemini-1.5-flash-8b`
`gemini-1.5-flash-8b-exp-0827`	Gemini 1.5 Flash-8B	`gemini-1.5-flash-8b`

Idiomas admitidos

Los modelos de Gemini se entrenan para funcionar con los siguientes idiomas:

Árabe (ar)
Bengalí (bn)
Búlgaro (bg)
Chino simplificado y tradicional (zh)
Croata (hr)
Checo (cs)
Danés (da)
Neerlandés (nl)
Inglés (en)
Estonio (et)
Finés (fi)
Francés (fr)
Alemán (de)
Griego (el)
Hebreo (iw)
Hindi (hi)
Húngaro (hu)
Indonesio (id)
Italiano (it)
Japonés (ja)
Coreano (ko)
Letón (lv)
Lituano (lt)
Noruego (no)
Polaco (pl)
Portugués (pt)
Rumano (ro)
Ruso (ru)
Serbio (sr)
Eslovaco (sk)
Esloveno (sl)
Español (es)
Suajili (sw)
Sueco (sv)
Tailandés (th)
Turco (tr)
Ucraniano (uk)
Vietnamita (vi)