EmbeddingGemma est un modèle d'embedding de texte multilingue à 308 millions de paramètres basé sur Gemma 3. Il est optimisé pour une utilisation sur des appareils du quotidien, tels que les téléphones, les ordinateurs portables et les tablettes. Le modèle produit des représentations numériques de texte à utiliser pour des tâches en aval telles que la récupération d'informations, la recherche de similarités sémantiques, la classification et le clustering.
EmbeddingGemma inclut les principales fonctionnalités suivantes :
- Compatibilité multilingue : compréhension étendue des données linguistiques, entraînée dans plus de 100 langues.
- Dimensions de sortie flexibles : personnalisez vos dimensions de sortie de 768 à 128 pour optimiser la vitesse et le stockage à l'aide de l'apprentissage de la représentation Matryoshka (MRL).
- Contexte de 2 000 jetons : contexte d'entrée important pour traiter les données textuelles et les documents directement sur votre matériel.
- Efficacité du stockage : exécutez-le sur moins de 200 Mo de RAM avec quantification.
- Faible latence : les embeddings génératifs sont disponibles en moins de 22 ms sur EdgeTPU pour des applications rapides et fluides.
- Hors connexion et sécurisé : générez des embeddings de documents directement sur votre matériel. Cette fonctionnalité fonctionne sans connexion Internet pour protéger les données sensibles.
Obtenir sur Hugging Face Obtenir sur Kaggle Accéder sur Vertex
Comme les autres modèles Gemma, EmbeddingGemma est fourni avec des pondérations ouvertes et est concédé sous licence pour un usage commercial responsable. Vous pouvez ainsi l'affiner et le déployer dans vos propres projets et applications.