Обзор модели EmbeddingGemma

EmbeddingGemma — это многоязычная модель встраивания текста с 308 млн параметров, основанная на Gemma 3. Она оптимизирована для использования на повседневных устройствах, таких как телефоны, ноутбуки и планшеты. Модель создает числовые представления текста для последующих задач, таких как поиск информации, поиск по семантическому сходству, классификация и кластеризация.

EmbeddingGemma включает в себя следующие ключевые функции:

  • Многоязыковая поддержка : широкое понимание лингвистических данных, обучение на более чем 100 языках.
  • Гибкие выходные размеры : настройте выходные размеры от 768 до 128 для достижения компромиссов между скоростью и хранилищем, используя Matryoshka Representation Learning (MRL).
  • Контекст токена 2K : существенный входной контекст для обработки текстовых данных и документов непосредственно на вашем оборудовании.
  • Эффективное использование памяти : использование менее 200 МБ ОЗУ с квантованием
  • Низкая задержка : генеративное внедрение менее чем за 22 мс на EdgeTPU для быстрых и плавных приложений.
  • Офлайн и безопасно : создавайте вставки документов непосредственно на вашем оборудовании, работая без подключения к Интернету, что позволяет сохранять конфиденциальные данные в безопасности.

Получите это на Hugging Face Получите это на Kaggle Получите это на Vertex

Как и другие модели Gemma, EmbeddingGemma поставляется с открытыми весами и лицензирована для ответственного коммерческого использования , что позволяет вам настраивать ее и развертывать в собственных проектах и ​​приложениях.

Попробуйте EmbeddingGemma. Тонкая настройка EmbeddingGemma.