En esta página, se documentan las actualizaciones de la API de Gemini.
29 de septiembre de 2025
- Los siguientes modelos de Gemini 1.5 ahora están obsoletos:
gemini-1.5-pro
gemini-1.5-flash-8b
gemini-1.5-flash
25 de septiembre de 2025
Se lanzó el modelo Gemini Robotics-ER 1.5 en versión preliminar. Consulta la descripción general de la robótica para obtener información sobre cómo usar el modelo en tu aplicación de robótica.
Se lanzaron los siguientes modelos de vista previa:
gemini-2.5-flash-preview-09-2025
gemini-2.5-flash-lite-preview-09-2025
Consulta la página Modelos para obtener más detalles.
23 de septiembre de 2025
- Se lanzó
gemini-2.5-flash-native-audio-preview-09-2025
, un nuevo modelo de audio nativo para la API de Live con una mejor llamada a función y manejo de cortes de voz. Para obtener más información, consulta la guía de la API de Live y Gemini 2.5 Flash Native Audio.
16 de septiembre de 2025
Los siguientes modelos dejarán de estar disponibles en octubre de 2025:
embedding-001
embedding-gecko-001
gemini-embedding-exp-03-07
(gemini-embedding-exp
)
Consulta la página Embeddings para obtener detalles sobre el modelo de embeddings más reciente.
10 de septiembre de 2025
- Se lanzó la compatibilidad con el modelo de Embeddings en la API de Batch y se agregó la API de Batch a la biblioteca de compatibilidad con OpenAI para que sea aún más fácil comenzar a usar las consultas por lotes.
9 de septiembre de 2025
- Se lanzaron las versiones de GA de Veo 3 y Veo 3 Fast, con precios más bajos y nuevas opciones para las relaciones de aspecto, la resolución y la generación de imágenes iniciales. Lee la documentación de Veo para obtener más información.
26 de agosto de 2025
- Lanzamos Gemini 2.5 Image Preview, nuestro modelo de generación de imágenes nativo más reciente.
18 de agosto de 2025
- Se lanzó la herramienta de contexto de URL para la disponibilidad general (DG), una herramienta para proporcionar URLs como contexto adicional para las instrucciones. En una semana, se dejará de admitir el uso del contexto de URL con el modelo
gemini-2.0-flash
(disponible durante la versión experimental).
14 de agosto de 2025
- Se lanzaron los modelos Imagen 4 Ultra, Standard y Fast como disponibles para el público en general (DG). Para obtener más información, consulta la página Imagen.
7 de agosto de 2025
- El parámetro de configuración
allow_adult
en la generación de imágenes a video ahora está disponible en regiones restringidas. Consulta la página de Veo para obtener más detalles.
31 de julio de 2025
- Se lanzó la generación de videos a partir de imágenes para el modelo Veo 3 Preview.
- Se lanzó el modelo de versión preliminar de Veo 3 Fast.
- Para obtener más información sobre Veo 3, visita la página de Veo.
22 de julio de 2025
- Lanzamos
gemini-2.5-flash-lite
, nuestro modelo de Gemini 2.5 rápido, económico y de alto rendimiento. Para obtener más información, consulta Gemini 2.5 Flash-Lite.
17 de julio de 2025
Se lanzó
veo-3.0-generate-preview
, la actualización más reciente de Veo que introduce la generación de videos con audio. Para obtener más información sobre Veo 3, visita la página de Veo.Se aumentaron los límites de frecuencia para Imagen 4 Estándar y Ultra. Visita la página Límites de frecuencia para obtener más detalles.
14 de julio de 2025
- Lanzamos
gemini-embedding-001
, la versión estable de nuestro modelo de embedding de texto. Para obtener más información, consulta embeddings. El modelogemini-embedding-exp-03-07
quedará obsoleto a partir del 14 de agosto de 2025.
7 de julio de 2025
- Se lanzó el modo por lotes de la API de Gemini. Agrupa las solicitudes en lotes y envíalas para que se procesen de forma asíncrona. Para obtener más información, consulta Modo por lotes.
26 de junio de 2025
Los modelos preliminares
gemini-2.5-pro-preview-05-06
ygemini-2.5-pro-preview-03-25
ahora se redireccionan a la versión estable más recientegemini-2.5-pro
.gemini-2.5-pro-exp-03-25
ya no está disponible.
24 de junio de 2025
- Se lanzaron los modelos de vista previa de Imagen 4 Ultra y Standard. Para obtener más información, consulta la página Generación de imágenes.
17 de junio de 2025
- Lanzamos
gemini-2.5-pro
, la versión estable de nuestro modelo más potente, ahora con pensamiento adaptativo. Para obtener más información, consulta Gemini 2.5 Pro y Pensamiento.gemini-2.5-pro-preview-05-06
se redireccionará agemini-2.5-pro
el 26 de junio de 2025. - Lanzamos
gemini-2.5-flash
, nuestro primer modelo estable de 2.5 Flash. Para obtener más información, consulta Gemini 2.5 Flash.gemini-2.5-flash-preview-04-17
quedará obsoleta a partir del 15 de julio de 2025. - Se lanzó
gemini-2.5-flash-lite-preview-06-17
, un modelo de Gemini 2.5 de alto rendimiento y bajo costo. Para obtener más información, consulta la versión preliminar de Gemini 2.5 Flash-Lite.
5 de junio de 2025
- Lanzamos
gemini-2.5-pro-preview-06-05
, una nueva versión de nuestro modelo más potente, ahora con pensamiento adaptativo. Para obtener más información, consulta Versión preliminar de Gemini 2.5 Pro y Pensamiento.gemini-2.5-pro-preview-05-06
se redireccionará agemini-2.5-pro
el 26 de junio de 2025.
20 de mayo de 2025
Actualizaciones de la API:
- Se lanzó la compatibilidad con el preprocesamiento de video personalizado con intervalos de recorte y muestreo de velocidad de fotogramas configurable.
- Se lanzó el uso de varias herramientas, que admite la configuración de la ejecución de código y la fundamentación con la Búsqueda de Google en la misma solicitud de
generateContent
. - Se lanzó la compatibilidad con las llamadas a funciones asíncronas en la API de Live.
- Se lanzó una herramienta experimental de contexto de URL para proporcionar URLs como contexto adicional a las instrucciones.
Actualizaciones del modelo:
- Se lanzó
gemini-2.5-flash-preview-05-20
, un modelo de vista previa de Gemini optimizado para el rendimiento en relación con el precio y el pensamiento adaptativo. Para obtener más información, consulta Gemini 2.5 Flash Preview y Thinking. - Se lanzaron los modelos
gemini-2.5-pro-preview-tts
ygemini-2.5-flash-preview-tts
, que pueden generar voz con uno o dos oradores. - Lanzamos el modelo
lyria-realtime-exp
, que genera música en tiempo real. - Se lanzaron
gemini-2.5-flash-preview-native-audio-dialog
ygemini-2.5-flash-exp-native-audio-thinking-dialog
, nuevos modelos de Gemini para la API de Live con capacidades de salida de audio nativas. Para obtener más información, consulta la guía de la API de Live y Audio nativo de Gemini 2.5 Flash. - Se lanzó la versión preliminar de
gemma-3n-e4b-it
, disponible en AI Studio y a través de la API de Gemini, como parte del lanzamiento de Gemma 3n.
7 de mayo de 2025
- Lanzamos
gemini-2.0-flash-preview-image-generation
, un modelo de vista previa para generar y editar imágenes. Para obtener más información, consulta Generación de imágenes y Generación de imágenes con Gemini 2.0 Flash Preview.
6 de mayo de 2025
- Lanzamos
gemini-2.5-pro-preview-05-06
, una nueva versión de nuestro modelo más potente, con mejoras en el código y las llamadas a funciones.gemini-2.5-pro-preview-03-25
apuntará automáticamente a la nueva versión del modelo.
17 de abril de 2025
- Se lanzó
gemini-2.5-flash-preview-04-17
, un modelo de vista previa de Gemini optimizado para el rendimiento en relación con el precio y el pensamiento adaptativo. Para obtener más información, consulta Gemini 2.5 Flash Preview y Thinking.
16 de abril de 2025
- Se lanzó el almacenamiento en caché del contexto para Gemini 2.0 Flash.
9 de abril de 2025
Actualizaciones del modelo:
- Se lanzó
veo-2.0-generate-001
, un modelo de texto y de imagen a video con disponibilidad general (DG) capaz de generar videos detallados y con matices artísticos. Para obtener más información, consulta los documentos de Veo. Se lanzó
gemini-2.0-flash-live-001
, una versión de vista previa pública del modelo de la API de Live con la facturación habilitada.Administración y confiabilidad de sesiones mejoradas
- Reanudación de sesión: Mantén las sesiones activas durante las interrupciones temporales de la red. La API ahora admite el almacenamiento del estado de la sesión del servidor (hasta por 24 horas) y proporciona identificadores (session_resumption) para volver a conectarse y reanudar la sesión donde la dejaste.
- Sesiones más largas a través de la compresión de contexto: Permite interacciones extendidas más allá de los límites de tiempo anteriores. Configura la compresión de la ventana de contexto con un mecanismo de ventana deslizante para administrar automáticamente la longitud del contexto y evitar terminaciones abruptas debido a los límites de contexto.
- Notificación de desconexión correcta: Recibe un mensaje del servidor
GoAway
que indica cuándo está por cerrarse una conexión, lo que permite un manejo correcto antes de la finalización.
Más control sobre la dinámica de interacción
Detección de actividad de voz (VAD) configurable: Elige niveles de sensibilidad o inhabilita la VAD automática por completo y usa nuevos eventos del cliente (
activityStart
,activityEnd
) para el control manual del turno.Manejo de interrupciones configurable: Decide si la entrada del usuario debe interrumpir la respuesta del modelo.
Cobertura de turnos configurable: Elige si la API procesa toda la entrada de audio y video de forma continua o solo la captura cuando se detecta que el usuario final está hablando.
Resolución de medios configurable: Selecciona la resolución de los medios de entrada para optimizar la calidad o el uso de tokens.
Salida y funciones más enriquecidas
Opciones de voz y lenguaje expandidas: Elige entre dos voces nuevas y 30 idiomas nuevos para la salida de audio. Ahora se puede configurar el idioma de salida en
speechConfig
.Transmisión de texto: Recibe respuestas de texto de forma incremental a medida que se generan, lo que permite mostrarlas más rápido al usuario.
Informes de uso de tokens: Obtén estadísticas sobre el uso con recuentos detallados de tokens proporcionados en el campo
usageMetadata
de los mensajes del servidor, desglosados por modalidad y fases de instrucciones o respuestas.
4 de abril de 2025
- Se lanzó
gemini-2.5-pro-preview-03-25
, una versión preliminar pública de Gemini 2.5 Pro con la facturación habilitada. Puedes seguir usandogemini-2.5-pro-exp-03-25
en el nivel gratuito.
25 de marzo de 2025
- Se lanzó
gemini-2.5-pro-exp-03-25
, un modelo experimental público de Gemini con el modo de pensamiento siempre activado de forma predeterminada. Para obtener más información, consulta Gemini 2.5 Pro Experimental.
12 de marzo de 2025
Actualizaciones del modelo:
- Se lanzó un modelo experimental de Gemini 2.0 Flash capaz de generar y editar imágenes.
- Se lanzó
gemma-3-27b-it
y está disponible en AI Studio y a través de la API de Gemini, como parte del lanzamiento de Gemma 3.
Actualizaciones de la API:
- Se agregó compatibilidad con las URLs de YouTube como fuente de medios.
- Se agregó compatibilidad para incluir un video intercalado de menos de 20 MB.
March 11, 2025
Actualizaciones del SDK:
- Se lanzó el SDK de IA generativa de Google para TypeScript y JavaScript en versión preliminar pública.
7 de marzo de 2025
Actualizaciones del modelo:
- Se lanzó
gemini-embedding-exp-03-07
, un modelo de incorporaciones experimental basado en Gemini en versión preliminar pública.
28 de febrero de 2025
Actualizaciones de la API:
- Se agregó compatibilidad con Search como herramienta a
gemini-2.0-pro-exp-02-05
, un modelo experimental basado en Gemini 2.0 Pro.
25 de febrero de 2025
Actualizaciones del modelo:
- Lanzamos
gemini-2.0-flash-lite
, una versión con disponibilidad general (DG) de Gemini 2.0 Flash-Lite, que se optimizó para la velocidad, la escala y la rentabilidad.
19 de febrero de 2025
Actualizaciones de AI Studio:
- Se agregó compatibilidad con regiones adicionales (Kosovo, Groenlandia y las Islas Feroe).
Actualizaciones de la API:
- Se agregó compatibilidad con regiones adicionales (Kosovo, Groenlandia y las Islas Feroe).
18 de febrero de 2025
Actualizaciones del modelo:
- Ya no se admite Gemini 1.0 Pro. Para obtener la lista de modelos compatibles, consulta Modelos de Gemini.
11 de febrero de 2025
Actualizaciones de la API:
- Se actualizaron las bibliotecas de OpenAI para que sean compatibles.
6 de febrero de 2025
Actualizaciones del modelo:
- Se lanzó
imagen-3.0-generate-002
, una versión con disponibilidad general (DG) de Imagen 3 en la API de Gemini.
Actualizaciones del SDK:
- Se lanzó el SDK de IA generativa de Google para Java en versión preliminar pública.
5 de febrero de 2025
Actualizaciones del modelo:
- Lanzamos
gemini-2.0-flash-001
, una versión con disponibilidad general (DG) de Gemini 2.0 Flash que admite resultados solo de texto. - Se lanzó
gemini-2.0-pro-exp-02-05
, una versión preliminar pública experimental de Gemini 2.0 Pro. - Se lanzó
gemini-2.0-flash-lite-preview-02-05
, una versión preliminar pública experimental de un modelo optimizado para la rentabilidad.
Actualizaciones de la API:
- Se agregó compatibilidad con la entrada de archivos y la salida de gráficos para la ejecución de código.
Actualizaciones del SDK:
- Se lanzó el SDK de IA generativa de Google para Python para la disponibilidad general (GA).
21 de enero de 2025
Actualizaciones del modelo:
- Se lanzó
gemini-2.0-flash-thinking-exp-01-21
, la versión preliminar más reciente del modelo que impulsa el modelo Gemini 2.0 Flash Thinking.
December 19, 2024
Actualizaciones del modelo:
Se lanzó el modo Gemini 2.0 Flash Thinking en versión preliminar pública. El Modo de pensamiento es un modelo de procesamiento en el tiempo de prueba que te permite ver el proceso de pensamiento del modelo mientras genera una respuesta y produce respuestas con capacidades de razonamiento más sólidas.
Obtén más información sobre el modo Gemini 2.0 Flash Thinking en nuestra página de descripción general.
11 de diciembre de 2024
Actualizaciones del modelo:
- Se lanzó Gemini 2.0 Flash Experimental para la versión preliminar pública. La lista parcial de funciones de Gemini 2.0 Flash Experimental incluye lo siguiente:
- El doble de rápido que Gemini 1.5 Pro
- Transmisión bidireccional con nuestra API de Live
- Generación de respuestas multimodales en forma de texto, imágenes y voz
- Uso de herramientas integradas con razonamiento de varios turnos para usar funciones como ejecución de código, búsqueda, llamada a función y mucho más
Obtén más información sobre Gemini 2.0 Flash en nuestra página de descripción general.
21 de noviembre de 2024
Actualizaciones del modelo:
- Se lanzó
gemini-exp-1121
, un modelo de API de Gemini experimental aún más potente.
Actualizaciones del modelo:
- Se actualizaron los alias de los modelos
gemini-1.5-flash-latest
ygemini-1.5-flash
para usargemini-1.5-flash-002
.- Cambio en el parámetro
top_k
: El modelogemini-1.5-flash-002
admite valores detop_k
entre 1 y 41 (sin incluir este último). Los valores superiores a 40 se cambiarán a 40.
- Cambio en el parámetro
14 de noviembre de 2024
Actualizaciones del modelo:
- Se lanzó
gemini-exp-1114
, un potente modelo experimental de la API de Gemini.
8 de noviembre de 2024
Actualizaciones de la API:
- Se agregó compatibilidad con Gemini en las bibliotecas de OpenAI y la API de REST.
31 de octubre de 2024
Actualizaciones de la API:
3 de octubre de 2024
Actualizaciones del modelo:
- Lanzamos
gemini-1.5-flash-8b-001
, una versión estable de nuestro modelo de API de Gemini más pequeño.
24 de septiembre de 2024
Actualizaciones del modelo:
- Lanzamos
gemini-1.5-pro-002
ygemini-1.5-flash-002
, dos nuevas versiones estables de Gemini 1.5 Pro y 1.5 Flash, disponibles de forma general. - Se actualizó el código del modelo
gemini-1.5-pro-latest
para usargemini-1.5-pro-002
y el código del modelogemini-1.5-flash-latest
para usargemini-1.5-flash-002
. - Se lanzó
gemini-1.5-flash-8b-exp-0924
para reemplazargemini-1.5-flash-8b-exp-0827
. - Se lanzó el filtro de seguridad de integridad cívica para la API de Gemini y AI Studio.
- Se lanzó la compatibilidad con dos parámetros nuevos para Gemini 1.5 Pro y 1.5 Flash en Python y Node.js:
frequencyPenalty
ypresencePenalty
.
19 de septiembre de 2024
Actualizaciones de AI Studio:
- Se agregaron botones de Me gusta y No me gusta a las respuestas del modelo para que los usuarios puedan proporcionar comentarios sobre la calidad de una respuesta.
Actualizaciones de la API:
- Se agregó compatibilidad con los créditos de Google Cloud, que ahora se pueden usar para el uso de la API de Gemini.
17 de septiembre de 2024
Actualizaciones de AI Studio:
- Se agregó un botón Abrir en Colab que exporta una instrucción y el código para ejecutarla a un notebook de Colab. La función aún no admite la generación de instrucciones con herramientas (modo JSON, llamadas a funciones o ejecución de código).
13 de septiembre de 2024
Actualizaciones de AI Studio:
- Se agregó compatibilidad con el modo de comparación, que te permite comparar respuestas en diferentes modelos y mensajes para encontrar la mejor opción para tu caso de uso.
30 de agosto de 2024
Actualizaciones del modelo:
- Gemini 1.5 Flash admite proporcionar esquemas JSON a través de la configuración del modelo.
27 de agosto de 2024
Actualizaciones del modelo:
- Se lanzaron los siguientes modelos experimentales:
gemini-1.5-pro-exp-0827
gemini-1.5-flash-exp-0827
gemini-1.5-flash-8b-exp-0827
9 de agosto de 2024
Actualizaciones de la API:
- Se agregó compatibilidad con el procesamiento de PDF.
5 de agosto de 2024
Actualizaciones del modelo:
- Se lanzó la compatibilidad con el ajuste para Gemini 1.5 Flash.
1 de agosto de 2024
Actualizaciones del modelo:
- Lanzamos
gemini-1.5-pro-exp-0801
, una nueva versión experimental de Gemini 1.5 Pro.
12 de julio de 2024
Actualizaciones del modelo:
- Se quitó la compatibilidad con Gemini 1.0 Pro Vision de los servicios y las herramientas de la IA de Google.
27 de junio de 2024
Actualizaciones del modelo:
- Se lanzó la versión de disponibilidad general de la ventana de contexto de 2 millones de tokens de Gemini 1.5 Pro.
Actualizaciones de la API:
- Se agregó compatibilidad con la ejecución de código.
18 de junio de 2024
Actualizaciones de la API:
- Se agregó compatibilidad con el almacenamiento en caché del contexto.
12 de junio de 2024
Actualizaciones del modelo:
- Se dejó de usar Gemini 1.0 Pro Vision.
23 de mayo de 2024
Actualizaciones del modelo:
- Gemini 1.5 Pro (
gemini-1.5-pro-001
) tiene disponibilidad general (DG). - Gemini 1.5 Flash (
gemini-1.5-flash-001
) está disponible de forma general (DG).
14 de mayo de 2024
Actualizaciones de la API:
- Se introdujo una ventana de contexto de 2 millones de tokens para Gemini 1.5 Pro (lista de espera).
- Se introdujo la facturación de pago por uso para Gemini 1.0 Pro, y próximamente se incluirá la facturación de Gemini 1.5 Pro y Gemini 1.5 Flash.
- Se aumentaron los límites de frecuencia para el próximo nivel pagado de Gemini 1.5 Pro.
- Se agregó compatibilidad con videos integrados a la API de File.
- Se agregó compatibilidad con texto sin formato a la API de File.
- Se agregó compatibilidad con la llamada a función paralela, que devuelve más de una llamada a la vez.
10 de mayo de 2024
Actualizaciones del modelo:
- Se lanzó Gemini 1.5 Flash (
gemini-1.5-flash-latest
) en versión preliminar.
9 de abril de 2024
Actualizaciones del modelo:
- Se lanzó Gemini 1.5 Pro (
gemini-1.5-pro-latest
) en versión preliminar. - Se lanzó un nuevo modelo de embedding de texto,
text-embeddings-004
, que admite tamaños de embedding elástico inferiores a 768.
Actualizaciones de la API:
- Se lanzó la API de File para almacenar temporalmente archivos multimedia y usarlos en instrucciones.
- Se agregó compatibilidad con instrucciones que incluyen datos de texto, imágenes y audio, también conocidas como instrucciones multimodales. Para obtener más información, consulta Cómo generar instrucciones con contenido multimedia.
- Se lanzaron las Instrucciones del sistema en versión beta.
- Se agregó el modo de llamada a función, que define el comportamiento de ejecución para la llamada a función.
- Se agregó compatibilidad con la opción de configuración
response_mime_type
, que te permite solicitar respuestas en formato JSON.
19 de marzo de 2024
Actualizaciones del modelo:
- Se agregó compatibilidad para ajustar Gemini 1.0 Pro en Google AI Studio o con la API de Gemini.
13 de diciembre de 2023
Actualizaciones del modelo:
- gemini-pro: Es un nuevo modelo de texto para una amplia variedad de tareas. Equilibra la capacidad y la eficiencia.
- gemini-pro-vision: Es un nuevo modelo multimodal para una amplia variedad de tareas. Equilibra la capacidad y la eficiencia.
- embedding-001: Es un nuevo modelo de embeddings.
- aqa: Es un nuevo modelo especialmente ajustado que se entrena para responder preguntas usando pasajes de texto para fundamentar las respuestas generadas.
Consulta Modelos de Gemini para obtener más detalles.
Actualizaciones de la versión de la API:
- v1: Es el canal de la API estable.
- v1beta: Es el canal beta. Este canal tiene funciones que pueden estar en desarrollo.
Consulta el tema sobre las versiones de la API para obtener más detalles.
Actualizaciones de la API:
GenerateContent
es un único extremo unificado para chat y texto.- La transmisión está disponible a través del método
StreamGenerateContent
. - Capacidad multimodal: La imagen es una nueva modalidad admitida
- Nuevas funciones beta:
- Llamada a función
- Semantic Retriever
- Búsqueda de respuestas atribuidas (AQA)
- Se actualizó el recuento de candidatos: Los modelos de Gemini solo devuelven 1 candidato.
- Diferentes categorías de configuración de seguridad y clasificación de seguridad Consulta la configuración de seguridad para obtener más detalles.
- Aún no se admite el ajuste de modelos de Gemini (trabajo en curso).