MediaPipe Tasks bietet die Hauptprogrammierschnittstelle der MediaPipe Solutions-Suite, einschließlich einer Reihe von Bibliotheken zum Bereitstellen innovativer ML-Lösungen auf Geräten mit einem Minimum an Code. Es unterstützt mehrere Plattformen, darunter Android, Web / JavaScript und Python. Die Unterstützung für iOS folgt in Kürze.
Nutzerfreundliche, klar definierte plattformübergreifende APIs
Führen Sie ML-Inferenz mit nur 5 Codezeilen aus. Verwenden Sie die leistungsstarken und nutzerfreundlichen Lösungs-APIs in MediaPipe Tasks als Bausteine, um eigene ML-Funktionen zu entwickeln.
Anpassbare Lösungen
Sie können alle Vorteile von MediaPipe Tasks nutzen und sie
mit Modellen, die mit Ihren eigenen Daten über Model
Maker erstellt wurden, ganz einfach anpassen. Sie können beispielsweise ein Modell erstellen,
das die von Ihnen definierten benutzerdefinierten Gesten mit der Model Maker
GestureRecognizer API erkennt
und das Modell mit der Tasks GestureRecognizer
API auf den gewünschten Plattformen bereitstellen.
Leistungsstarke ML-Pipelines
Typische ML-Lösungen auf Geräten kombinieren mehrere ML- und Nicht-ML-Blöcke, was die Leistung verlangsamt. MediaPipe Tasks bietet optimierte ML-Pipelines mit End-to-End-Beschleunigung auf CPU, GPU und TPU, um die Anforderungen von Echtzeit-Anwendungsfällen auf Geräten zu erfüllen.
Unterstützte Plattformen
In diesem Abschnitt finden Sie eine Übersicht über MediaPipe Tasks für jede unterstützte Plattform. Spezifische Implementierungen finden Sie in den plattformspezifischen Entwickler leitfäden für die einzelnen Aufgaben. Hilfe bei der Einrichtung Ihrer Entwicklungsumgebung für die Verwendung von MediaPipe Tasks auf einer Plattform finden Sie in den Leitfäden zur Plattform setup guides.
Android
Die MediaPipe Tasks Java API für Android ist in Pakete unterteilt, die ML-Aufgaben in wichtigen Bereichen ausführen, darunter Vision, Natural Language und Audio. Im Folgenden finden Sie eine Liste der Abhängigkeiten, die Sie Ihrem Android-App-Entwicklungsprojekt hinzufügen können, um diese APIs zu aktivieren:
dependencies {
implementation 'com.google.mediapipe:tasks-vision:latest.release'
implementation 'com.google.mediapipe:tasks-text:latest.release'
implementation 'com.google.mediapipe:tasks-audio:latest.release'
}
Spezifische Implementierungsdetails finden Sie in den plattformspezifischen Entwickler leitfäden für die einzelnen Lösungen in MediaPipe Tasks.
Python
Die MediaPipe Tasks Python API enthält einige Haupt module für Lösungen, die ML-Aufgaben in wichtigen Bereichen ausführen, darunter Vision, Natural Language und Audio. Im Folgenden finden Sie den Installationsbefehl und eine Liste der Importe, die Sie Ihrem Python-Entwicklungsprojekt hinzufügen können, um diese APIs zu aktivieren:
$ python -m pip install mediapipe
import mediapipe as mp
from mediapipe.tasks import python
from mediapipe.tasks.python import vision
from mediapipe.tasks.python import text
from mediapipe.tasks.python import audio
Spezifische Implementierungsdetails finden Sie in den plattformspezifischen Entwickler leitfäden für die einzelnen Lösungen in MediaPipe Tasks.
Web und JavaScript
Die MediaPipe Tasks Web JavaScript API ist in Pakete unterteilt, die ML-Aufgaben in wichtigen Bereichen ausführen, darunter Vision, Natural Language und Audio. Im Folgenden finden Sie eine Liste der Skriptimporte, die Sie Ihrem Web- und JavaScript-Entwicklungsprojekt hinzufügen können, um diese APIs zu aktivieren:
<head>
<script src="https://cdn.jsdelivr.net/npm/@mediapipe/tasks-vision/vision_bundle.mjs"
crossorigin="anonymous"></script>
<script src="https://cdn.jsdelivr.net/npm/@mediapipe/tasks-text/text_bundle.js"
crossorigin="anonymous"></script>
<script src="https://cdn.jsdelivr.net/npm/@mediapipe/tasks-audio/audio_bundle.js"
crossorigin="anonymous"></script>
</head>
Spezifische Implementierungsdetails finden Sie in den plattformspezifischen Entwickler leitfäden für die einzelnen Lösungen in MediaPipe Tasks.
Nutzungsbedingungen
Durch die Verwendung von MediaPipe Tasks stimmen Sie den MediaPipe-Nutzungsbedingungen zu.