وظایف MediaPipe

MediaPipe Tasks رابط برنامه نویسی اصلی مجموعه MediaPipe Solutions را فراهم می کند، شامل مجموعه ای از کتابخانه ها برای استقرار راه حل های ML نوآورانه بر روی دستگاه هایی با حداقل کد. این پلتفرم از چندین پلتفرم از جمله اندروید، وب / جاوا اسکریپت، پایتون و پشتیبانی از iOS به زودی ارائه می شود.

آسان برای استفاده، API های متقابل پلت فرم به خوبی تعریف شده
ML Inferences را فقط با 5 خط کد اجرا کنید. از API های راه حل قدرتمند و آسان در MediaPipe Tasks به عنوان بلوک های سازنده برای ساخت ویژگی های ML خود استفاده کنید.

راه حل های قابل تنظیم
می‌توانید از تمام مزایای MediaPipe Tasks استفاده کنید و به راحتی آن را با استفاده از مدل‌های ساخته شده با داده‌های خودتان از طریق Model Maker سفارشی کنید. برای مثال، می‌توانید مدلی ایجاد کنید که ژست‌های سفارشی را که با استفاده از Model Maker GestureRecognizer API تعریف کرده‌اید، تشخیص دهد و با استفاده از Tasks GestureRecognizer API، مدل را روی پلتفرم‌های مورد نظر مستقر کنید.

خطوط لوله ML با کارایی بالا
راه‌حل‌های معمولی ML روی دستگاه، چندین بلوک ML و غیرML را ترکیب می‌کنند و عملکرد را کاهش می‌دهند. MediaPipe Tasks خطوط لوله ML بهینه‌سازی شده را با شتاب سرتاسر در CPU، GPU و TPU ارائه می‌کند تا نیازهای موارد استفاده واقعی روی دستگاه را برآورده کند.

پلتفرم های پشتیبانی شده

این بخش یک نمای کلی از وظایف MediaPipe برای هر پلتفرم پشتیبانی شده ارائه می دهد. برای پیاده سازی های خاص، راهنمای توسعه پلت فرم خاص برای هر کار را ببینید. برای کمک به راه اندازی محیط توسعه خود برای استفاده از MediaPipe Tasks در یک پلت فرم، راهنمای راه اندازی پلت فرم را بررسی کنید.

اندروید

MediaPipe Tasks Java API برای Android به بسته‌هایی تقسیم می‌شود که وظایف ML را در حوزه‌های اصلی از جمله بینایی، زبان طبیعی و صدا انجام می‌دهند. در زیر لیستی از وابستگی هایی است که می توانید برای فعال کردن این API ها به پروژه توسعه برنامه اندروید خود اضافه کنید:

dependencies {
    implementation 'com.google.mediapipe:tasks-vision:latest.release'
    implementation 'com.google.mediapipe:tasks-text:latest.release'
    implementation 'com.google.mediapipe:tasks-audio:latest.release'
}

برای جزئیات پیاده سازی خاص، به راهنمای توسعه پلت فرم خاص برای هر راه حل در MediaPipe Tasks مراجعه کنید.

پایتون

MediaPipe Tasks Python API دارای چند ماژول اصلی برای راه حل هایی است که وظایف ML را در حوزه های اصلی از جمله بینایی، زبان طبیعی و صدا انجام می دهند. در زیر دستور install و لیستی از وارداتی که می توانید برای فعال کردن این API ها به پروژه توسعه پایتون خود اضافه کنید، به شما نشان می دهد:

$ python -m pip install mediapipe

import mediapipe as mp
from mediapipe.tasks import python
from mediapipe.tasks.python import vision
from mediapipe.tasks.python import text
from mediapipe.tasks.python import audio

برای جزئیات پیاده سازی خاص، به راهنمای توسعه پلت فرم خاص برای هر راه حل در MediaPipe Tasks مراجعه کنید.

وب و جاوا اسکریپت

MediaPipe Tasks Web JavaScript API به بسته هایی تقسیم می شود که وظایف ML را در حوزه های اصلی از جمله بینایی، زبان طبیعی و صدا انجام می دهند. در زیر لیستی از وارد کردن اسکریپت‌هایی است که می‌توانید برای فعال کردن این APIها به پروژه توسعه وب و جاوا اسکریپت خود اضافه کنید:

<head>
  <script src="https://cdn.jsdelivr.net/npm/@mediapipe/tasks-vision/vision_bundle.js"
    crossorigin="anonymous"></script>
  <script src="https://cdn.jsdelivr.net/npm/@mediapipe/tasks-text/text_bundle.js"
    crossorigin="anonymous"></script>
  <script src="https://cdn.jsdelivr.net/npm/@mediapipe/tasks-audio/audio_bundle.js"
    crossorigin="anonymous"></script>
</head>

برای جزئیات پیاده سازی خاص، به راهنمای توسعه پلت فرم خاص برای هر راه حل در MediaPipe Tasks مراجعه کنید.