EmbeddingGemma là một mô hình nhúng văn bản đa ngôn ngữ có 308 triệu tham số dựa trên Gemma 3. Đây là phiên bản được tối ưu hoá để sử dụng trên các thiết bị hằng ngày, chẳng hạn như điện thoại, máy tính xách tay và máy tính bảng. Mô hình này tạo ra các biểu diễn bằng số của văn bản để dùng cho các tác vụ tiếp theo như truy xuất thông tin, tìm kiếm mức độ tương đồng về ngữ nghĩa, phân loại và phân cụm.
EmbeddingGemma có các tính năng chính sau:
- Hỗ trợ đa ngôn ngữ: Hiểu được nhiều dữ liệu ngôn ngữ, được huấn luyện bằng hơn 100 ngôn ngữ.
- Kích thước đầu ra linh hoạt: Tuỳ chỉnh kích thước đầu ra từ 768 đến 128 để đánh đổi tốc độ và bộ nhớ bằng cách sử dụng Matryoshka Representation Learning (MRL).
- Ngữ cảnh 2K token: Ngữ cảnh đầu vào đáng kể để xử lý dữ liệu văn bản và tài liệu ngay trên phần cứng của bạn.
- Lưu trữ hiệu quả: Chạy trên RAM dưới 200 MB bằng cách định lượng
- Độ trễ thấp: Các mục nhúng tạo sinh trong vòng chưa đến 22 mili giây trên EdgeTPU cho các ứng dụng nhanh và mượt mà.
- Ngoại tuyến và an toàn: Tạo các vectơ nhúng của tài liệu ngay trên phần cứng của bạn, hoạt động mà không cần kết nối Internet để đảm bảo an toàn cho dữ liệu nhạy cảm.
Tải xuống trên Hugging Face Tải xuống trên Kaggle Truy cập trên Vertex
Giống như các mô hình Gemma khác, EmbeddingGemma được cung cấp với trọng số mở và được cấp phép cho mục đích thương mại có trách nhiệm, cho phép bạn tinh chỉnh và triển khai mô hình này trong các dự án và ứng dụng của riêng mình.