ภาพรวมโมเดล Embedding Gemma

EmbeddingGemma เป็นโมเดลการฝังข้อความแบบหลายภาษาที่มีพารามิเตอร์ 308 ล้านรายการซึ่งอิงตาม Gemma 3 โดยได้รับการเพิ่มประสิทธิภาพให้ใช้งานในอุปกรณ์ที่ใช้ในชีวิตประจำวัน เช่น โทรศัพท์ แล็ปท็อป และแท็บเล็ต โมเดลจะสร้างการแสดงข้อความในรูปแบบตัวเลขเพื่อใช้ สำหรับงานขั้นปลาย เช่น การดึงข้อมูล การค้นหาความคล้ายคลึงเชิงความหมาย การจัดประเภท และการจัดกลุ่ม

EmbeddingGemma มีฟีเจอร์หลักๆ ดังนี้

  • การรองรับหลายภาษา: เข้าใจข้อมูลทางภาษาอย่างกว้างขวาง โดยได้รับการฝึกในภาษาต่างๆ กว่า 100 ภาษา
  • ขนาดเอาต์พุตที่ยืดหยุ่น: ปรับแต่งขนาดเอาต์พุตจาก 768 เป็น 128 เพื่อแลกเปลี่ยนความเร็วและพื้นที่เก็บข้อมูลโดยใช้ Matryoshka Representation Learning (MRL)
  • บริบทโทเค็น 2,000 รายการ: บริบทอินพุตที่สำคัญสำหรับการประมวลผลข้อมูลข้อความและ เอกสารในฮาร์ดแวร์โดยตรง
  • ประหยัดพื้นที่เก็บข้อมูล: เรียกใช้บน RAM น้อยกว่า 200MB ด้วยการควอนไทซ์
  • เวลาในการตอบสนองต่ำ: การฝังแบบ Generative ในเวลาไม่ถึง 22 มิลลิวินาทีบน EdgeTPU เพื่อแอปพลิเคชันที่รวดเร็วและราบรื่น
  • ออฟไลน์และปลอดภัย: สร้างการฝังเอกสารโดยตรงในฮาร์ดแวร์ของคุณ ทำงานได้โดยไม่ต้องเชื่อมต่ออินเทอร์เน็ตเพื่อรักษาความปลอดภัยของข้อมูลที่ละเอียดอ่อน

ดาวน์โหลดใน Hugging Face ดาวน์โหลดใน Kaggle เข้าถึงใน Vertex

เช่นเดียวกับโมเดล Gemma อื่นๆ EmbeddingGemma มาพร้อมกับน้ำหนักแบบเปิดและ ได้รับอนุญาตให้ใช้เชิงพาณิชย์อย่างมีความรับผิดชอบ ซึ่งช่วยให้คุณ ปรับแต่งและนําไปใช้ในโปรเจ็กต์และแอปพลิเคชันของคุณเองได้

ลองใช้ EmbeddingGemma ปรับแต่ง EmbeddingGemma