EmbeddingGemma เป็นโมเดลการฝังข้อความแบบหลายภาษาที่มีพารามิเตอร์ 308 ล้านรายการซึ่งอิงตาม Gemma 3 โดยได้รับการเพิ่มประสิทธิภาพให้ใช้งานในอุปกรณ์ที่ใช้ในชีวิตประจำวัน เช่น โทรศัพท์ แล็ปท็อป และแท็บเล็ต โมเดลจะสร้างการแสดงข้อความในรูปแบบตัวเลขเพื่อใช้ สำหรับงานขั้นปลาย เช่น การดึงข้อมูล การค้นหาความคล้ายคลึงเชิงความหมาย การจัดประเภท และการจัดกลุ่ม
EmbeddingGemma มีฟีเจอร์หลักๆ ดังนี้
- การรองรับหลายภาษา: เข้าใจข้อมูลทางภาษาอย่างกว้างขวาง โดยได้รับการฝึกในภาษาต่างๆ กว่า 100 ภาษา
- ขนาดเอาต์พุตที่ยืดหยุ่น: ปรับแต่งขนาดเอาต์พุตจาก 768 เป็น 128 เพื่อแลกเปลี่ยนความเร็วและพื้นที่เก็บข้อมูลโดยใช้ Matryoshka Representation Learning (MRL)
- บริบทโทเค็น 2,000 รายการ: บริบทอินพุตที่สำคัญสำหรับการประมวลผลข้อมูลข้อความและ เอกสารในฮาร์ดแวร์โดยตรง
- ประหยัดพื้นที่เก็บข้อมูล: เรียกใช้บน RAM น้อยกว่า 200MB ด้วยการควอนไทซ์
- เวลาในการตอบสนองต่ำ: การฝังแบบ Generative ในเวลาไม่ถึง 22 มิลลิวินาทีบน EdgeTPU เพื่อแอปพลิเคชันที่รวดเร็วและราบรื่น
- ออฟไลน์และปลอดภัย: สร้างการฝังเอกสารโดยตรงในฮาร์ดแวร์ของคุณ ทำงานได้โดยไม่ต้องเชื่อมต่ออินเทอร์เน็ตเพื่อรักษาความปลอดภัยของข้อมูลที่ละเอียดอ่อน
ดาวน์โหลดใน Hugging Face ดาวน์โหลดใน Kaggle เข้าถึงใน Vertex
เช่นเดียวกับโมเดล Gemma อื่นๆ EmbeddingGemma มาพร้อมกับน้ำหนักแบบเปิดและ ได้รับอนุญาตให้ใช้เชิงพาณิชย์อย่างมีความรับผิดชอบ ซึ่งช่วยให้คุณ ปรับแต่งและนําไปใช้ในโปรเจ็กต์และแอปพลิเคชันของคุณเองได้