Google Tensor เป็น System-on-Chip (SoC) ที่ออกแบบมาโดยเฉพาะเพื่อใช้เรียกใช้โมเดล AI ในโทรศัพท์ Google Pixel Tensor ได้รับการเพิ่มประสิทธิภาพเพื่อประสิทธิภาพในการคำนวณและการใช้พลังงานที่น้อยที่สุด โดยใช้ตัวเร่งความเร็วการอนุมาน ML เฉพาะที่เรียกว่า TPU (Tensor Processing Unit) ซึ่งเข้าถึงได้ผ่าน Google Tensor SDK
ลงชื่อสมัครใช้เพื่อเข้าถึง Google Tensor SDK รุ่นเบต้า
Google Tensor SDK เป็นชุดพัฒนาซอฟต์แวร์ที่สร้างขึ้นเพื่อเพิ่มประสิทธิภาพแมชชีนเลิร์นนิงในอุปกรณ์สำหรับโทรศัพท์ Google Pixel โดยใช้ Tensor System-on-Chip (SoC) ที่กำหนดเองและตัวเร่งความเร็วการอนุมาน TPU เฉพาะ SDK นี้มีชุดเครื่องมือที่ครอบคลุมซึ่งช่วยให้นักพัฒนาแอป เข้าถึงโมเดลโอเพนซอร์สที่คัดสรรมาแล้วใน Model Garden นอกจากนี้ ชุดเครื่องมือนี้ยังช่วยให้คอมไพล์โมเดลเป็นรูปแบบที่เข้ากันได้กับ TPU ได้ด้วย
ฟีเจอร์หลัก
- การเข้าถึงฮาร์ดแวร์ TPU เฉพาะโดยตรง เพื่อการอนุมาน ML ที่มีประสิทธิภาพในอุปกรณ์ Pixel
- โมเดลโอเพนซอร์สที่คัดสรรมาแล้วซึ่งได้รับการเพิ่มประสิทธิภาพสำหรับ SDK ใน Model Garden
ตั้งค่าสภาพแวดล้อมในการพัฒนาซอฟต์แวร์
ข้อกำหนดฮาร์ดแวร์และซอฟต์แวร์ที่จำเป็น รวมถึงข้อกำหนดเบื้องต้นสำหรับการใช้ Google Tensor SDK มีดังนี้
ฮาร์ดแวร์
- เวิร์กสเตชันการพัฒนาในเครื่องที่ใช้ระบบปฏิบัติการแบบ Linux ที่มีสถาปัตยกรรม x86_64
- เคล็ดลับ: หากต้องการตรวจสอบสถาปัตยกรรมของเวิร์กสเตชัน ให้ใช้คำสั่ง
uname -mหรือเครื่องมือวินิจฉัยที่คล้ายกัน
- เคล็ดลับ: หากต้องการตรวจสอบสถาปัตยกรรมของเวิร์กสเตชัน ให้ใช้คำสั่ง
- ต้องมี RAM อย่างน้อย 16 GB
ความจุ RAM ที่เฉพาะเจาะจงซึ่งจำเป็นสำหรับการใช้ SDK จะขึ้นอยู่กับขนาดอินพุตของโมเดล สำหรับข้อมูลอินพุตที่มีขนาดใหญ่ขึ้น ขอแนะนำให้มี RAM อย่างน้อย 64 GB
ซอฟต์แวร์
- ระบบปฏิบัติการ: Ubuntu 22.04 LTS
- ระบบบิลด์: Bazel 7.4.1
- Android SDK: API ระดับ 34 (Android 14)
- Android NDK: รองรับ API ระดับ 28 (Android 9 Pie)
(ไม่บังคับ) Python 3.11.0
Android Debug Bridge (adb)
ข้อกำหนดเบื้องต้น
(ไม่บังคับ) โปรเจ็กต์ Google Cloud (GCP) ที่ทีม Tensor SDK ได้ให้สิทธิ์เข้าถึงอุปกรณ์ Pixel จากระยะไกล โปรดดูคำแนะนำเกี่ยวกับการสร้างโปรเจ็กต์ Google Cloud ที่หัวข้อ การสร้างและจัดการโปรเจ็กต์
(ไม่บังคับ) สำเนา
efficientnet_b0.tfliteที่ดาวน์โหลด
SoC ที่รองรับ
Google Tensor SDK รองรับ SoC ต่อไปนี้
- Google Tensor G5 (Tensor_G5)
ขั้นตอนถัดไป
ทำตามขั้นตอนการแปลงและการทำให้ใช้งานได้ใน การเร่งความเร็ว NPU ด้วย LiteRT โดยเลือก Google Tensor ตามความเหมาะสม
สำหรับโมเดลภาษา โปรดดูหัวข้อ เรียกใช้ LLM ใน NPU โดยใช้ LiteRT-LM