EmbeddingGemma es un modelo de incorporación de texto multilingüe con 308 millones de parámetros basado en Gemma 3. Está optimizado para su uso en dispositivos cotidianos, como teléfonos, laptops y tablets. El modelo produce representaciones numéricas del texto que se usarán para tareas posteriores, como la recuperación de información, la búsqueda de similitud semántica, la clasificación y la agrupación en clústeres.
EmbeddingGemma incluye las siguientes funciones clave:
- Compatibilidad con varios idiomas: Amplia comprensión de datos lingüísticos, con entrenamiento en más de 100 idiomas
- Dimensiones de salida flexibles: Personaliza tus dimensiones de salida de 768 a 128 para obtener un equilibrio entre velocidad y almacenamiento con el aprendizaje de representación de Matryoshka (MRL).
- Contexto de 2,000 tokens: Contexto de entrada sustancial para procesar datos de texto y documentos directamente en tu hardware.
- Eficiente en el almacenamiento: Ejecútalo con menos de 200 MB de RAM con cuantificación.
- Baja latencia: Las incorporaciones generativas tardan menos de 22 ms en EdgeTPU, lo que permite crear aplicaciones rápidas y fluidas.
- Sin conexión y seguro: Genera incorporaciones de documentos directamente en tu hardware. Funciona sin conexión a Internet para mantener seguros los datos sensibles.
Obtenerlo en Hugging Face Obtenerlo en Kaggle Acceder en Vertex
Al igual que con otros modelos de Gemma, EmbeddingGemma se proporciona con pesos abiertos y se licencia para un uso comercial responsable, lo que te permite ajustarlo y, luego, implementarlo en tus propios proyectos y aplicaciones.