Gemini Nano เวอร์ชันที่มีขนาดเล็กที่สุดของตระกูลโมเดล Gemini ใช้งานได้ บนอุปกรณ์ Android ที่รองรับการใช้งานตั้งแต่ Google Pixel 8 Pro และ Samsung S24 Series
หากต้องการใช้งานโมเดล Gemini Nano บน Android คุณจะต้องใช้ Google AI Edge SDK สำหรับ Android ซึ่งมี API สำหรับทำสิ่งต่อไปนี้
- ตรวจสอบว่าอุปกรณ์ที่ใช้ Android ที่เกี่ยวข้องได้รับการสนับสนุนหรือไม่
- รับสิทธิ์เข้าถึงโมเดล Gemini Nano
- ปรับแต่งการตั้งค่าความปลอดภัย
- เรียกใช้การอนุมานที่ประสิทธิภาพสูงและใช้ทางเลือกสำรอง
- หรือระบุบล็อกการปรับแต่ง LoRA เพื่อปรับปรุงประสิทธิภาพของ สำหรับกรณีการใช้งานของคุณ
API สำหรับการเข้าถึง Gemini Nano รองรับรูปแบบการแปลงข้อความเป็นข้อความ และอื่นๆ อีกมากมาย วิธีการต่างๆ ที่กำลังจะเกิดขึ้นในอนาคต
ข้อดีของการดำเนินการในอุปกรณ์
การดำเนินการในอุปกรณ์จะเปิดใช้สิ่งต่อไปนี้
- การประมวลผลข้อมูลที่ละเอียดอ่อนภายในเครื่อง: การประมวลผลข้อมูลในเครื่องสามารถช่วยคุณได้ หลีกเลี่ยงการส่งข้อมูลผู้ใช้ไปยังระบบคลาวด์ ซึ่งสำคัญมากสำหรับแอปที่ ข้อมูลที่ละเอียดอ่อน เช่น แอปรับส่งข้อความที่มีการเข้ารหัสจากต้นทางถึงปลายทาง
- การเข้าถึงแบบออฟไลน์: ผู้ใช้สามารถเข้าถึงฟีเจอร์ AI ได้แม้จะไม่มี อินเทอร์เน็ต ซึ่งมีประโยชน์สำหรับแอปพลิเคชันที่ต้องทำงาน แบบออฟไลน์หรือเมื่อมีการเชื่อมต่อที่ไม่แน่นอน
- การประหยัดต้นทุน: คุณสามารถลดต้นทุนการอนุมานได้โดยลดภาระการดำเนินการลงใน ฮาร์ดแวร์สำหรับผู้บริโภค ซึ่งจะช่วยประหยัดค่าใช้จ่ายได้อย่างมากสำหรับแอปที่ใช้บ่อย การไหลเวียนของผู้ใช้
การดำเนินการในอุปกรณ์ของ Gemini มีประโยชน์มากมายดังนี้ แต่สำหรับกรณีการใช้งาน และจำเป็นต้องใช้โมเดล Gemini ที่มีขนาดใหญ่ขึ้น และเพื่อให้รองรับอุปกรณ์ได้อย่างหลากหลาย คุณอาจ ต้องการพิจารณาใช้ Gemini API เพื่อเข้าถึง Gemini บนเซิร์ฟเวอร์ คุณ ซึ่งทำได้ผ่านการผสานรวมแบ็กเอนด์ (ด้วย Python ไป, Node.js หรือ REST) หรือจากโดยตรง ผ่านแอปพลิเคชัน SDK ไคลเอ็นต์ AI ของ Google สำหรับ Android
วิธีการทำงาน
การดำเนินการกับ Gemini Nano ในอุปกรณ์ขับเคลื่อนโดย Android AICore ซึ่งเป็น ความสามารถระดับระบบที่ให้สิทธิ์เข้าถึงโมเดลพื้นฐานในอุปกรณ์ ซึ่งเปิดตัวใน Android 14 โมเดลพื้นฐานจะติดตั้งไว้ล่วงหน้าโดยใช้ AICore คุณจึงไม่ต้องดาวน์โหลดหรือเผยแพร่ภายในแอป คุณ สามารถปรับแต่งโมเดลเหล่านี้สำหรับงานดาวน์สตรีมได้โดยใช้ LoRa Android AICore คือ มีเวอร์ชันที่ใช้งานจริงในอุปกรณ์ Google Pixel 8 Pro และ Samsung S24 Series แล้ว และขับเคลื่อนฟีเจอร์ที่เป็นนวัตกรรมในแอป Google อยู่แล้ว
ดูข้อมูลเพิ่มเติมได้ที่ Android AICore
ขั้นตอนถัดไป
- เพื่อดูวิธีใช้ประโยชน์จากการอนุมาน Gemini Pro บนเซิร์ฟเวอร์ของ Google ในแอป Android โปรดอ่านคู่มือเริ่มต้นฉบับย่อสำหรับ SDK ของไคลเอ็นต์ AI ของ Google สำหรับ Android