Panoramica del modello EmbeddingGemma

EmbeddingGemma è un modello di incorporamento di testo multilingue con 308 milioni di parametri basato su Gemma 3. È ottimizzato per l'uso in dispositivi di uso quotidiano, come smartphone, laptop e tablet. Il modello produce rappresentazioni numeriche del testo da utilizzare per attività downstream come il recupero di informazioni, la ricerca di somiglianze semantiche, la classificazione e il clustering.

EmbeddingGemma include le seguenti funzionalità principali:

  • Supporto multilingue: ampia comprensione dei dati linguistici, addestramento in oltre 100 lingue.
  • Dimensioni di output flessibili: personalizza le dimensioni di output da 768 a 128 per compromessi tra velocità e spazio di archiviazione utilizzando Matryoshka Representation Learning (MRL).
  • Contesto di 2000 token: contesto di input sostanziale per l'elaborazione di dati di testo e documenti direttamente sull'hardware.
  • Efficiente in termini di spazio di archiviazione: eseguilo con meno di 200 MB di RAM con quantizzazione
  • Bassa latenza: incorporamenti generativi in meno di 22 ms su EdgeTPU per applicazioni rapide e fluide.
  • Offline e sicuri: genera incorporamenti di documenti direttamente sull'hardware, funziona senza connessione a internet per mantenere al sicuro i dati sensibili.

Scaricalo da Hugging Face Scaricalo da Kaggle Accedi su Vertex

Come gli altri modelli Gemma, EmbeddingGemma viene fornito con pesi aperti e con licenza per l'uso commerciale responsabile, consentendoti di ottimizzarlo e implementarlo nei tuoi progetti e applicazioni.

Prova EmbeddingGemma Ottimizza EmbeddingGemma