ขอแนะนํา Google AI Edge Portal: เปรียบเทียบประสิทธิภาพ AI บนอุปกรณ์ขอบในวงกว้าง ลงชื่อสมัครใช้เพื่อขอสิทธิ์เข้าถึงในช่วงเวอร์ชันตัวอย่างก่อนเปิดตัว

ทำให้โมเดล GenAI ใช้งานได้ด้วย LiteRT

LiteRT ช่วยให้ติดตั้งใช้งานโมเดล Generative AI ประสิทธิภาพสูงในแพลตฟอร์มต่างๆ ได้แก่ อุปกรณ์เคลื่อนที่ เดสก์ท็อป และเว็บ LiteRT ใช้ประโยชน์จากการเร่งฮาร์ดแวร์จาก CPU, GPU และ NPU ได้อย่างราบรื่น จึงมอบประสิทธิภาพที่ล้ำสมัยสำหรับการอนุมาน GenAI ในอุปกรณ์

คุณสามารถติดตั้งใช้งานโมเดล GenAI ที่ซับซ้อนได้โดยใช้เทคโนโลยีแบบผสานรวมต่อไปนี้

Torch Generative API: โมดูล Python ภายในไลบรารี LiteRT Torch สำหรับ การเขียนและการแปลงโมเดล PyTorch GenAI โดยมีบล็อกการสร้างที่ได้รับการเพิ่มประสิทธิภาพ ซึ่งช่วยให้มั่นใจได้ว่าการดำเนินการในอุปกรณ์จะมีประสิทธิภาพสูง ดูรายละเอียดเพิ่มเติมได้ที่แปลงโมเดล GenAI ของ PyTorch
LiteRT-LM: เลเยอร์การจัดระเบียบเฉพาะที่สร้างขึ้นบน LiteRT เพื่อ จัดการความซับซ้อนเฉพาะของ LLM เช่น การโคลนเซสชัน การจัดการแคช KV การแคช/การให้คะแนนพรอมต์ การอนุมานแบบมีสถานะ ดูรายละเอียดเพิ่มเติมได้ที่ ที่เก็บ GitHub ของ LiteRT-LM
LiteRT Converter และรันไทม์: เครื่องมือพื้นฐานที่ช่วยให้ การแปลงโมเดล การดำเนินการรันไทม์ และการเพิ่มประสิทธิภาพเป็นไปอย่างมีประสิทธิภาพ ซึ่งช่วยให้ การเร่งฮาร์ดแวร์ขั้นสูงใน CPU, GPU และ NPU เป็นไปได้

ที่เก็บโมเดล GenAI ของ LiteRT

LiteRT รองรับโมเดลแบบเปิดน้ำหนักยอดนิยมที่เพิ่มขึ้นเรื่อยๆ ในชุมชน LiteRT Hugging Face โมเดลเหล่านี้ได้รับการแปลงและปรับแต่งล่วงหน้าเพื่อการติดตั้งใช้งานได้ทันที ซึ่งช่วยให้คุณ ใช้ประโยชน์จากประสิทธิภาพสูงสุดใน CPU, GPU และ NPU ได้ทันที

Gemma Family
- Gemma 3 270M
- Gemma 3 1B
- Gemma 3n E2B/E4B
- การฝัง Gemma 300M: ดูแอป C++ LiteRT สำหรับความคล้ายกันเชิงความหมายของ EmbeddingGemma
- ฟังก์ชัน Gemma 270M
Qwen Family
Llama
Phi
SmoLM
FastVLM

ทำให้โมเดล GenAI ใช้งานได้ด้วย LiteRT

ที่เก็บโมเดล GenAI ของ LiteRT

ข้อมูลเชิงลึกที่แนะนำ