Retención de datos cero en la API de Gemini Developer

En esta página, se describen los detalles de lo que comúnmente se conoce como "retención cero de datos" en la API de Gemini para desarrolladores.

Restricción de entrenamiento

Como se describe en las Condiciones del Servicio de la API de Gemini, cuando usas los Servicios Pagados, Google no utiliza tus instrucciones (incluidas las instrucciones del sistema asociadas, el contenido almacenado en caché y los archivos, como imágenes, videos o documentos) ni las respuestas para mejorar nuestros productos. Los Servicios Pagados se definen aquí.

Retención de datos del cliente y logro de la retención cero de datos

Por lo general, los datos de los clientes se retienen durante períodos limitados en las siguientes situaciones y condiciones. Para lograr la retención cero de datos, los clientes deben realizar acciones específicas o evitar funciones específicas en cada una de estas áreas:

  • Registro de instrucciones para supervisar el abuso: Como se describe en las Condiciones del Servicio Adicionales de la API de Gemini, para los Servicios Pagados, Google registra las instrucciones y las respuestas durante un período limitado únicamente para detectar incumplimientos de la Política de Uso Prohibido. Cuando se aprueba tu solicitud de ZDR para un proyecto en particular, se borra todo el contenido del usuario (instrucciones y respuestas) y los metadatos identificables (como las direcciones IP y los IDs de las Cuentas de Google) antes de que se registren. El registro resultante se marca como saneado y no contiene datos identificables del usuario, lo que garantiza la paridad con la política de retención de datos cero de Vertex AI.

  • Fundamentación con la Búsqueda de Google: Como se describe en las Condiciones del Servicio Adicionales de la API de Gemini, Google almacena las instrucciones, la información contextual y el resultado generado durante treinta (30) días para crear resultados fundamentados y sugerencias de búsqueda. Esta información almacenada se puede usar para depurar y probar los sistemas que admiten la fundamentación. No hay forma de inhabilitar el almacenamiento de esta información si usas la Fundamentación con la Búsqueda de Google.

  • Fundamentación con Google Maps: Como se describe en las Condiciones del Servicio Adicionales de la API de Gemini, Google almacena las instrucciones, la información contextual y el resultado generado durante treinta (30) días para crear resultados fundamentados. Esta información almacenada solo se puede usar para la ingeniería de confiabilidad, como la depuración en caso de problemas con el servicio. No hay forma de inhabilitar el almacenamiento de esta información si usas Grounding con Google Maps.

  • API de Interactions: La API de Interactions administra el estado activo de una conversación para habilitar turnos de varios intercambios. De forma predeterminada, la API de Interactions habilita el almacenamiento de estado. Para garantizar que no se deje ningún rastro de datos, debes establecer de forma explícita el parámetro store en false en tus solicitudes a la API para inhabilitar la retención del estado predeterminado.

  • API de Live: Esta API con estado permite la reconexión en tiempo real almacenando el estado de la conversación. Para lograr una retención de datos nula, no configures SessionResumptionConfig. Si se genera un identificador de sesión, el estado de la conversación (incluidos el texto, el audio y el video) se retiene durante un máximo de 24 horas.

  • Almacenamiento de la API de File: La API de File permite a los usuarios subir recursos grandes. Los archivos se almacenan en reposo hasta que el usuario los borra o hasta que vencen. El uso de la API de File es independiente del registro de ZDR. Los usuarios deben borrar los archivos de forma manual para garantizar que no queden rastros de datos.

  • Almacenamiento en caché de contexto explícito: Los usuarios pueden almacenar en caché manualmente conjuntos de datos grandes (p.ej., videos largos o bibliotecas de documentos) con el campo cached_content. Si bien los registros de estas solicitudes siguen las políticas de descarte de ZDR, el contexto almacenado en caché se almacena con un ttl o expire_time definido por el usuario. Para lograr una huella de datos nula absoluta, no utilices la función cached_content.

  • Almacenamiento en caché implícito en memoria: De forma predeterminada, los modelos de Gemini almacenan datos en caché en la memoria para reducir la latencia y los costos para los desarrolladores. Estos datos se encuentran estrictamente en la RAM (no en reposo), están aislados a nivel del proyecto y tienen un TTL de 24 horas. Esto no incumple la política de Retención Cero de Datos.

¿Qué sigue?