LiteRT-LM هي مكتبة متوافقة مع عدة منصات ومصمَّمة لتشغيل مسارات نماذج اللغة بكفاءة على مجموعة كبيرة من الأجهزة، بدءًا من الهواتف الجوّالة وصولاً إلى الأنظمة المضمَّنة. توفّر هذه الأداة للمطوّرين الأدوات اللازمة لإنشاء عمليات سير عمل متطورة لنماذج اللغة ونشرها، وهي تتضمّن الآن ميزة التكامل السلس مع وحدة المعالجة العصبية (NPU).
تشغيل نماذج اللغات الكبيرة على وحدة المعالجة المركزية ووحدة معالجة الرسومات
يمكنك الاطّلاع على مستودع LiteRT-LM على GitHub للحصول على تعليمات مفصّلة حول التطوير المتوافق مع عدة أنظمة أساسية وتسريع الأجهزة باستخدام وحدة المعالجة المركزية (CPU) أو وحدة معالجة الرسومات (GPU).
تشغيل النماذج اللغوية الكبيرة على وحدة المعالجة العصبية
توفّر وحدات المعالجة العصبية (NPU) وحدات أجهزة متخصّصة تم تحسينها لتناسب أحجام المعالجة في التعلّم العميق. وتتوفّر هذه الميزات بشكل متزايد في الأنظمة الحديثة على شريحة واحدة (SoC)، خاصةً على الأجهزة الجوّالة. وبفضل أدائها العالي، تُعدّ هذه الوحدات مناسبة جدًا لتنفيذ استنتاجات نماذج اللغات الكبيرة.
مورّدو وحدات المعالجة العصبية
يتيح LiteRT-LM تشغيل نماذج اللغات الكبيرة باستخدام تسريع وحدة المعالجة العصبية (NPU) مع المورّدين التاليين. اختَر التعليمات حسب المورّد الذي تريد تجربته:
البدء بسرعة
- اتّبِع المتطلبات الأساسية لإعداد البيئة والمستودع.
- تأكَّد من تثبيت
adbوتوصيل جهاز. - راجِع دليل البدء السريع و
litert_lm_mainالفيديو التوضيحي لسطر الأوامر.
Qualcomm AI Engine Direct
الخطوة 1: تنزيل نموذج .litertlm
نزِّل .litertlm يتوافق مع نظامك على الشريحة (أمثلة أدناه). يمكنك طلب معلومات عن نظام SoC الخاص بجهازك من خلال تنفيذ ما يلي:
SOC_MODEL=$(adb shell getprop ro.soc.model | tr '[:upper:]' '[:lower:]')
echo "https://huggingface.co/litert-community/Gemma3-1B-IT/blob/main/Gemma3-1B-IT_q4_ekv1280_${SOC_MODEL}.litertlm"
| الطراز | منظومة على رقاقة (SoC) | التكميم | حجم الاستيعاب | حجم النموذج (ميغابايت) | تنزيل |
|---|---|---|---|---|---|
| Gemma3-1B | SM8750 | 4 بت لكل قناة | 1280 | 658 | تنزيل |
| Gemma3-1B | SM8650 | 4 بت لكل قناة | 1280 | 658 | تنزيل |
| Gemma3-1B | SM8550 | 4 بت لكل قناة | 1280 | 657 | تنزيل |
الخطوة 2: تنزيل مكتبات QAIRT واستخراجها
نزِّل حزمة تطوير البرامج QAIRT، واستخرِجها، واضبط QAIRT_ROOT:
unzip <your_file.zip> -d ~/
QAIRT_ROOT=~/qairt/2.34.0.250424
الخطوة 3: إنشاء وقت التشغيل / المكتبات LiteRT-LM
ثبِّت الإصدار 28b أو إصدارًا أحدث من حزمة تطوير البرامج (NDK) لنظام التشغيل Android وأنشئ ما يلي:
bazel build --config=android_arm64 //runtime/engine:litert_lm_main
bazel build --config=android_arm64 \
@litert//litert/vendors/qualcomm/dispatch:dispatch_api_so
الخطوة 4: تشغيل النموذج على الجهاز
اضبط مسار جهازك وادفع مواد العرض:
export DEVICE_FOLDER=/data/local/tmp/
adb shell mkdir -p $DEVICE_FOLDER
export MODEL_PATH=<path-to-model.litertlm>
adb push $MODEL_PATH $DEVICE_FOLDER/model.litertlm
adb push $QAIRT_ROOT/lib/aarch64-android/* $DEVICE_FOLDER/
adb push bazel-bin/runtime/engine/litert_lm_main $DEVICE_FOLDER/
adb shell chmod +x $DEVICE_FOLDER/litert_lm_main
التشغيل:
adb shell "cd $DEVICE_FOLDER && \
QAIRT_ROOT=$DEVICE_FOLDER \
./litert_lm_main --model=model.litertlm \
--prompt='Explain the history of LiteRT in 3 bullet points' \
--device=qualcomm_npu --rounds=1"
MediaTek NeuroPilot
نظرة عامة على الخطوات
تتشابه عملية MediaTek مع عملية Qualcomm: استخدِم .litertlm مصمَّمًا خصيصًا لنظامك على الشريحة، وأدرِج مكتبات وقت التشغيل NeuroPilot، وأنشئ litert_lm_main، وأرسِل مواد العرض، وشغِّلها باستخدام --device=mediatek_npu.