Tác vụ của MediaPipe

MediaPipe Tasks cung cấp giao diện lập trình cốt lõi của bộ giải pháp MediaPipe, bao gồm một bộ thư viện để triển khai các giải pháp học máy tiên tiến trên các thiết bị có mã tối thiểu. API này hỗ trợ nhiều nền tảng, bao gồm Android, Web / JavaScript, Python và sẽ sớm hỗ trợ iOS.

API nhiều nền tảng, dễ sử dụng và được xác định rõ
Chạy dự đoán học máy chỉ với 5 dòng mã. Sử dụng các API giải pháp mạnh mẽ và dễ sử dụng trong MediaPipe Tasks làm thành phần để xây dựng các tính năng học máy của riêng bạn.

Các giải pháp có thể tuỳ chỉnh
Bạn có thể tận dụng tất cả lợi ích mà MediaPipe Tasks cung cấp và dễ dàng tuỳ chỉnh dịch vụ đó bằng cách sử dụng các mô hình được tạo bằng dữ liệu của riêng bạn thông qua Trình tạo mô hình. Ví dụ: bạn có thể tạo một mô hình nhận dạng các cử chỉ tuỳ chỉnh mà bạn đã xác định bằng Model Maker GestureRecognizer API và triển khai mô hình trên các nền tảng mong muốn bằng API Tasks GestureRecognizer.

Quy trình học máy hiệu suất cao
Các giải pháp học máy thông thường trên thiết bị kết hợp nhiều khối từ học máy và không phải học máy, làm chậm hiệu suất. MediaPipe Tasks cung cấp các quy trình học máy được tối ưu hoá với khả năng tăng tốc toàn diện trên CPU, GPU và TPU để đáp ứng nhu cầu của các trường hợp sử dụng trên thiết bị theo thời gian thực.

Nền tảng được hỗ trợ

Phần này cung cấp thông tin tổng quan về Tác vụ của MediaPipe cho từng nền tảng được hỗ trợ. Để biết những cách triển khai cụ thể, hãy xem hướng dẫn phát triển dành riêng cho từng nền tảng cho từng nhiệm vụ. Để được trợ giúp thiết lập môi trường phát triển nhằm sử dụng MediaPipe Tasks trên một nền tảng, hãy xem hướng dẫn thiết lập của nền tảng.

Android

API Java của MediaPipe Tasks dành cho Android được chia thành các gói thực hiện nhiệm vụ học máy trong các miền chính, bao gồm cả tầm nhìn, ngôn ngữ tự nhiên và âm thanh. Sau đây là danh sách các phần phụ thuộc mà bạn có thể thêm vào dự án phát triển ứng dụng Android của mình để bật các API này:

dependencies {
    implementation 'com.google.mediapipe:tasks-vision:latest.release'
    implementation 'com.google.mediapipe:tasks-text:latest.release'
    implementation 'com.google.mediapipe:tasks-audio:latest.release'
}

Để biết thông tin chi tiết về cách triển khai cụ thể, hãy xem hướng dẫn phát triển dành riêng cho nền tảng cho từng giải pháp trong MediaPipe Tasks.

Python

API Python của MediaPipe Tasks có một số mô-đun chính cho các giải pháp thực hiện nhiệm vụ học máy trong các miền chính, bao gồm cả thị giác, ngôn ngữ tự nhiên và âm thanh. Dưới đây là lệnh cài đặt và danh sách lệnh nhập mà bạn có thể thêm vào dự án phát triển Python để bật các API này:

$ python -m pip install mediapipe

import mediapipe as mp
from mediapipe.tasks import python
from mediapipe.tasks.python import vision
from mediapipe.tasks.python import text
from mediapipe.tasks.python import audio

Để biết thông tin chi tiết về cách triển khai cụ thể, hãy xem hướng dẫn phát triển dành riêng cho nền tảng cho từng giải pháp trong MediaPipe Tasks.

Web và JavaScript

API JavaScript cho web của MediaPipe Tasks được chia thành các gói thực hiện các nhiệm vụ học máy trong các miền chính, bao gồm cả thị giác, ngôn ngữ tự nhiên và âm thanh. Sau đây là danh sách các tệp nhập tập lệnh mà bạn có thể thêm vào dự án phát triển Web và JavaScript của mình để bật các API này:

<head>
  <script src="https://cdn.jsdelivr.net/npm/@mediapipe/tasks-vision/vision_bundle.js"
    crossorigin="anonymous"></script>
  <script src="https://cdn.jsdelivr.net/npm/@mediapipe/tasks-text/text_bundle.js"
    crossorigin="anonymous"></script>
  <script src="https://cdn.jsdelivr.net/npm/@mediapipe/tasks-audio/audio_bundle.js"
    crossorigin="anonymous"></script>
</head>

Để biết thông tin chi tiết về cách triển khai cụ thể, hãy xem hướng dẫn phát triển dành riêng cho nền tảng cho từng giải pháp trong MediaPipe Tasks.