Omówienie modelu EmbeddingGemma

EmbeddingGemma to wielojęzyczny model wektorów dystrybucyjnych tekstu z 308 milionami parametrów oparty na modelu Gemma 3. Jest zoptymalizowany pod kątem codziennego użytku na urządzeniach takich jak telefony, laptopy i tablety. Model generuje liczbowe reprezentacje tekstu, które są używane w dalszych zadaniach, takich jak wyszukiwanie informacji, wyszukiwanie podobieństw semantycznych, klasyfikacja i klastrowanie.

EmbeddingGemma ma te kluczowe funkcje:

  • Obsługa wielu języków: szerokie zrozumienie danych językowych, trenowane w ponad 100 językach.
  • Elastyczne wymiary wyjściowe: dostosuj wymiary wyjściowe w zakresie od 768 do 128, aby uzyskać kompromis między szybkością a pamięcią, korzystając z uczenia reprezentacji matrioszki (MRL).
  • Kontekst 2 tys. tokenów: obszerny kontekst wejściowy do przetwarzania danych tekstowych i dokumentów bezpośrednio na urządzeniu.
  • Wydajne wykorzystanie pamięci: model działa na mniej niż 200 MB pamięci RAM z kwantyzacją.
  • Niewielkie opóźnienie: generatywne osadzanie w mniej niż 22 ms na EdgeTPU zapewnia szybkie i płynne działanie aplikacji.
  • Offline i bezpieczne: generuj osadzanie dokumentów bezpośrednio na urządzeniu. Działa bez połączenia z internetem, aby chronić dane wrażliwe.

Pobierz z Hugging Face Pobierz z Kaggle Uzyskaj dostęp w Vertex

Podobnie jak inne modele Gemma, EmbeddingGemma jest udostępniany z otwartymi wagami i licencją na odpowiedzialne użycie komercyjne, co pozwala na dostrajanie i wdrażanie go we własnych projektach i aplikacjach.

Wypróbuj EmbeddingGemma Dostrajanie EmbeddingGemma