สร้างโมเดล LiteRT

หน้านี้มีคำแนะนำในการสร้างโมเดล TensorFlow ด้วย ความตั้งใจที่จะแปลงเป็นรูปแบบโมเดล LiteRT เครื่อง โมเดลการเรียนรู้ (ML) ที่คุณใช้กับ LiteRT เดิมสร้างขึ้นและ ได้รับการฝึกโดยใช้ไลบรารีและเครื่องมือหลักของ TensorFlow เมื่อสร้างโมเดลแล้ว เมื่อใช้แกน TensorFlow คุณจะแปลงเป็นโมเดล ML ที่มีขนาดเล็กลงแต่ทำงานได้อย่างมีประสิทธิภาพมากกว่า ที่เรียกว่าโมเดล LiteRT

หากคุณมีโมเดลที่จะแปลงอยู่แล้ว โปรดดูหัวข้อแปลงโมเดล หน้าภาพรวมสำหรับคำแนะนำในการแปลงรูปแบบ

กำลังสร้างโมเดล

หากคุณกำลังสร้างโมเดลที่กำหนดเองสำหรับกรณีการใช้งานเฉพาะของคุณ คุณควรเริ่ม ด้วยการพัฒนาและฝึกโมเดล TensorFlow หรือขยายโมเดลที่มีอยู่

ข้อจำกัดในการออกแบบโมเดล

ก่อนที่จะเริ่มกระบวนการพัฒนาโมเดล คุณควรทราบเกี่ยวกับ สำหรับโมเดล LiteRT และสร้างโมเดลของคุณด้วย ข้อจำกัดเหล่านี้

  • ความสามารถในการประมวลผลที่จำกัด - เทียบกับเซิร์ฟเวอร์ที่มีอุปกรณ์ครบครัน CPU หลายตัว ความจุหน่วยความจำสูง และตัวประมวลผลพิเศษ เช่น GPU และ TPU อุปกรณ์เคลื่อนที่และอุปกรณ์ Edge มีข้อจำกัดเพิ่มขึ้นมาก ขณะใช้งาน พลังการประมวลผลที่เพิ่มขึ้นและความเข้ากันได้ของฮาร์ดแวร์เฉพาะทาง และข้อมูลที่คุณสามารถประมวลผลอย่างมีประสิทธิภาพกับข้อมูลนั้นก็ยังมีข้อจำกัด
  • ขนาดของโมเดล - ความซับซ้อนโดยรวมของโมเดล รวมถึงข้อมูล ตรรกะก่อนการประมวลผลและจำนวนเลเยอร์ในโมเดล จะเพิ่ม ขนาดในหน่วยความจำของโมเดล โมเดลขนาดใหญ่อาจทำงานช้าจนไม่สามารถยอมรับได้หรือเพียงแค่ อาจไม่พอดีกับหน่วยความจำที่มีอยู่ของอุปกรณ์เคลื่อนที่หรืออุปกรณ์ Edge
  • ขนาดของข้อมูล - ขนาดของข้อมูลอินพุตที่ประมวลผลได้อย่างมีประสิทธิภาพ ที่มีโมเดลแมชชีนเลิร์นนิงถูกจำกัดในอุปกรณ์เคลื่อนที่หรืออุปกรณ์ Edge รุ่น ที่ใช้ไลบรารีข้อมูลขนาดใหญ่ เช่น ไลบรารีภาษา ไลบรารีรูปภาพ หรือวิดีโอคลิปอาจไม่พอดีกับอุปกรณ์เหล่านี้ และอาจต้อง พื้นที่เก็บข้อมูลนอกอุปกรณ์ และเข้าถึงโซลูชันการเข้าถึง
  • การดำเนินการของ TensorFlow ที่รองรับ - สภาพแวดล้อมรันไทม์ LiteRT จะรองรับชุดย่อยของการดำเนินการโมเดลแมชชีนเลิร์นนิงเมื่อเทียบกับปกติ โมเดล TensorFlow ขณะที่คุณพัฒนาโมเดลสำหรับใช้กับ LiteRT คุณ ควรติดตามความเข้ากันได้ของโมเดลของคุณกับความสามารถของ สภาพแวดล้อมรันไทม์ LiteRT

สำหรับข้อมูลเพิ่มเติมในการสร้างโมเดลประสิทธิภาพสูง ใช้ร่วมกันได้ และประสิทธิภาพสูงสำหรับ LiteRT โปรดดูแนวทางปฏิบัติแนะนำด้านประสิทธิภาพ

การพัฒนาโมเดล

หากต้องการสร้างโมเดล LiteRT คุณต้องสร้างโมเดลโดยใช้ ไลบรารีหลักของ TensorFlow ไลบรารีหลักของ TensorFlow คือระดับที่ต่ำลง ไลบรารีที่ให้บริการ API เพื่อสร้าง ฝึก และทำให้โมเดล ML ใช้งานได้

เวิร์กโฟลว์บิลด์ TFLite

TensorFlow มี 2 เส้นทางในการดำเนินการนี้ คุณสามารถพัฒนา โค้ดโมเดลหรือคุณสามารถเริ่มต้นจากการติดตั้งโมเดลที่มีอยู่ใน TensorFlow Model Garden

Model Garden

TensorFlow Model Garden แสดงการนำเทคโนโลยีที่ทันสมัยมากมายมาใช้ โมเดลแมชชีนเลิร์นนิง (ML) สำหรับการประมวลผลการมองเห็นและภาษาธรรมชาติ (NLP) นอกจากนี้ คุณยังจะพบเครื่องมือเวิร์กโฟลว์ที่ช่วยให้คุณกำหนดค่าและเรียกใช้เครื่องมือเหล่านั้นได้อย่างรวดเร็ว ในชุดข้อมูลมาตรฐาน โมเดลแมชชีนเลิร์นนิงในสวนโมเดล ระบุรหัสแบบเต็มเพื่อให้คุณสามารถทดสอบ ฝึกอบรม หรือฝึกอบรมอีกครั้งได้โดยใช้รหัสของคุณเอง ชุดข้อมูล

ไม่ว่าคุณต้องการเปรียบเทียบประสิทธิภาพสำหรับโมเดลที่รู้จักกันดี โปรดตรวจสอบ ผลการวิจัยที่เพิ่งเปิดตัว หรือขยายโมเดลที่มีอยู่ Garden ช่วยให้คุณบรรลุเป้าหมาย ML ได้

โมเดลที่กำหนดเอง

หากกรณีการใช้งานของคุณอยู่นอกช่วงวันที่ที่โมเดลใน Model Garden รองรับ คุณสามารถใช้ไลบรารีระดับสูง เช่น Keras เพื่อ โค้ดการฝึกที่กำหนดเองได้ หากต้องการเรียนรู้พื้นฐานของ TensorFlow โปรดดูที่ คู่มือ TensorFlow วิธีเริ่มต้นใช้งาน ดูตัวอย่างได้ที่บทแนะนำ TensorFlow ภาพรวมซึ่งมีตัวชี้ไปยัง ไปจนถึงบทแนะนำ ระดับผู้เชี่ยวชาญ

การประเมินโมเดล

เมื่อพัฒนาโมเดลแล้ว คุณควรประเมินประสิทธิภาพและทดสอบ บนอุปกรณ์ของผู้ใช้ปลายทาง โดย TensorFlow มีวิธีในการดำเนินการนี้อยู่ 2-3 วิธี

  • TensorBoard เป็นเครื่องมือสำหรับการให้ข้อมูลการวัดผลและการแสดงข้อมูลผ่านภาพที่จำเป็น ของแมชชีนเลิร์นนิง เปิดใช้การติดตามเมตริกการทดสอบ เช่น การสูญเสีย และความแม่นยำ แสดงภาพกราฟโมเดล และคาดการณ์ถึงการฝัง พื้นที่มิติ และอื่นๆ อีกมากมาย
  • เครื่องมือการเปรียบเทียบจะใช้ได้กับแต่ละอย่างที่รองรับ เช่น แอปเปรียบเทียบของ Android และแอปเปรียบเทียบใน iOS ใช้ เครื่องมือเหล่านี้เพื่อวัดและคำนวณสถิติสำหรับประสิทธิภาพที่สำคัญ เมตริกต่างๆ

การเพิ่มประสิทธิภาพโมเดล

มีข้อจํากัดเกี่ยวกับทรัพยากรสําหรับ TensorFlow โดยเฉพาะ โมเดล Lite การเพิ่มประสิทธิภาพโมเดลช่วยให้โมเดลของคุณมีประสิทธิภาพได้เป็นอย่างดี และใช้ทรัพยากรในการประมวลผลน้อยกว่า ประสิทธิภาพของโมเดลแมชชีนเลิร์นนิง ความสมดุลระหว่างขนาดและความเร็วในการอนุมานเทียบกับความแม่นยำ LiteRT ปัจจุบันรองรับการเพิ่มประสิทธิภาพผ่านการวัดปริมาณ การตัดออก และการจัดกลุ่ม โปรดดู โปรดดูรายละเอียดเพิ่มเติมในหัวข้อการเพิ่มประสิทธิภาพโมเดล ของเรา TensorFlow ยังมีการเพิ่มประสิทธิภาพโมเดล ชุดเครื่องมือที่มี API ในการนำสิ่งเหล่านี้ไปใช้ ของเรา

ขั้นตอนถัดไป