El servicio de incorporación de la API de Gemini genera incorporaciones de vanguardia para palabras, frases y oraciones. Las incorporaciones resultantes se pueden usar para tareas de PLN, como búsqueda semántica, clasificación de texto y agrupamiento en clústeres, entre muchas otras. En esta página, se describe qué son las incorporaciones y se destacan algunos casos prácticos clave para el servicio de incorporaciones que te ayudarán a comenzar.
¿Qué son las incorporaciones?
Las incorporaciones de texto son una técnica de procesamiento de lenguaje natural (PLN) que convierte texto en vectores numéricos. Las incorporaciones capturan el significado y el contexto semánticos, lo que da como resultado un texto con significados similares que tiene incorporaciones más cercanas. Por ejemplo, las oraciones "Llegué a mi perro al veterinario" y "Llegué a mi gato al veterinario" tendrían incorporaciones que están cerca unas de otras en el espacio vectorial, ya que ambas describen un contexto similar.
Esto es importante porque desbloquea muchos algoritmos que pueden operar sobre vectores, pero no directamente en texto.
Puedes usar estas incorporaciones o vectores para comparar diferentes textos y entender cómo se relacionan. Por ejemplo, si las incorporaciones del texto "gato" y "perro" están muy juntas, puedes inferir que estas palabras son similares en significado o contexto, o ambos. Esta capacidad permite una variedad de casos de uso descritos en la siguiente sección.
Casos de uso
Las incorporaciones de texto impulsan una variedad de casos de uso de PLN. Por ejemplo:
- Recuperación de información: El objetivo es recuperar texto con una semántica similar a partir de un texto de entrada. Un sistema de recuperación de información puede admitir varias aplicaciones, como la búsqueda semántica, la respuesta a preguntas o el resumen. Consulta el notebook de búsqueda de documentos para ver un ejemplo.
- Clasificación: Puedes usar incorporaciones para entrenar un modelo a fin de clasificar documentos en categorías. Por ejemplo, si deseas clasificar los comentarios de los usuarios como negativos o positivos, puedes usar el servicio de incorporaciones a fin de obtener la representación vectorial de cada comentario para entrenar el clasificador. Consulta el ejemplo del clasificador de Gemini para obtener más detalles.
- Agrupamiento en clústeres: la comparación de vectores de texto puede mostrar qué tan similares o diferentes son. Esta característica se puede usar para entrenar un modelo de agrupamiento en clústeres que agrupe textos o documentos similares y para detectar anomalías en los datos.
- Base de datos de vectores: Puedes almacenar las incorporaciones generadas en una base de datos vectorial para mejorar la precisión y eficiencia de tu aplicación de PLN. Consulta esta página para aprender a usar una base de datos vectorial para traducir instrucciones de texto en vectores numéricos.
Incorporaciones elásticas
El modelo de incorporación de texto de Gemini, que comienza con text-embedding-004
, ofrece tamaños de incorporación elásticos inferiores a 768.
Puedes usar incorporaciones elásticas para generar dimensiones de salida más pequeñas y, posiblemente, ahorrar costos de procesamiento y almacenamiento con una pequeña pérdida de rendimiento.
Próximos pasos
- Si estás listo para comenzar a desarrollar, puedes encontrar el código ejecutable completo en las guías de inicio rápido de Python, Go, Node.js y Dart (Flutter).