MediaPipe-Aufgaben

MediaPipe Tasks bietet die zentrale Programmierschnittstelle der MediaPipe Solutions Suite mit einer Reihe von Bibliotheken für die Bereitstellung innovativer ML-Lösungen auf Geräten mit minimalem Code. Sie unterstützt mehrere Plattformen, einschließlich Android, Web / JavaScript und Python. Unterstützung für iOS folgt demnächst.

Nutzerfreundliche, klar definierte plattformübergreifende APIs
Sie können ML-Inferenzen mit nur 5 Codezeilen ausführen. Verwenden Sie die leistungsstarken und nutzerfreundlichen Lösungs-APIs in MediaPipe Tasks als Bausteine, um eigene ML-Features zu erstellen.

Anpassbare Lösungen
Sie können alle Vorteile von MediaPipe Tasks nutzen und das Tool mithilfe von Modellen, die mit Ihren eigenen Daten über Model Maker erstellt wurden, ganz einfach anpassen. Sie können z. B. ein Modell erstellen, das die benutzerdefinierten Gesten erkennt, die Sie mit der Model Maker MovingDetectr API definiert haben, und das Modell dann mit der Tasks Gestenerkennung auf den gewünschten Plattformen bereitstellen.

Leistungsstarke ML-Pipelines
Typische On-Device-ML-Lösungen kombinieren mehrere ML- und Nicht-ML-Blöcke, was die Leistung verlangsamt. MediaPipe Tasks bietet optimierte ML-Pipelines mit End-to-End-Beschleunigung auf CPU, GPU und TPU, um die Anforderungen von Anwendungsfällen auf dem Gerät in Echtzeit zu erfüllen.

Unterstützte Plattformen

Dieser Abschnitt bietet einen Überblick über MediaPipe-Aufgaben für jede unterstützte Plattform. Informationen zu bestimmten Implementierungen finden Sie in den plattformspezifischen Entwicklungsleitfäden der einzelnen Aufgaben. Informationen dazu, wie Sie Ihre Entwicklungsumgebung für die Verwendung von MediaPipe Tasks auf einer Plattform einrichten, finden Sie in den Leitfäden zur Plattformeinrichtung.

Android

Die Java API von MediaPipe Tasks für Android ist in Pakete unterteilt, die ML-Aufgaben in den wichtigsten Bereichen wie Vision, Natural Language und Audio ausführen. Im Folgenden finden Sie eine Liste von Abhängigkeiten, die Sie Ihrem Android-App-Entwicklungsprojekt hinzufügen können, um diese APIs zu aktivieren:

dependencies {
    implementation 'com.google.mediapipe:tasks-vision:latest.release'
    implementation 'com.google.mediapipe:tasks-text:latest.release'
    implementation 'com.google.mediapipe:tasks-audio:latest.release'
}

Einzelheiten zur Implementierung finden Sie in den plattformspezifischen Entwicklungsleitfäden für jede Lösung in MediaPipe Tasks.

Python

Die Python API von MediaPipe Tasks bietet einige Hauptmodule für Lösungen, die ML-Aufgaben in wichtigen Bereichen wie Vision, Natural Language und Audio ausführen. Im Folgenden sehen Sie den Installationsbefehl und eine Liste der Importe, die Sie Ihrem Python-Entwicklungsprojekt hinzufügen können, um diese APIs zu aktivieren:

$ python -m pip install mediapipe

import mediapipe as mp
from mediapipe.tasks import python
from mediapipe.tasks.python import vision
from mediapipe.tasks.python import text
from mediapipe.tasks.python import audio

Einzelheiten zur Implementierung finden Sie in den plattformspezifischen Entwicklungsleitfäden für jede Lösung in MediaPipe Tasks.

Web und JavaScript

Die Web JavaScript API von MediaPipe Tasks ist in Pakete unterteilt, die ML-Aufgaben in wichtigen Bereichen wie Vision, Natural Language und Audio ausführen. Im Folgenden finden Sie eine Liste von Skriptimporten, die Sie in Ihr Web- und JavaScript-Entwicklungsprojekt einfügen können, um diese APIs zu aktivieren:

<head>
  <script src="https://cdn.jsdelivr.net/npm/@mediapipe/tasks-vision/vision_bundle.js"
    crossorigin="anonymous"></script>
  <script src="https://cdn.jsdelivr.net/npm/@mediapipe/tasks-text/text_bundle.js"
    crossorigin="anonymous"></script>
  <script src="https://cdn.jsdelivr.net/npm/@mediapipe/tasks-audio/audio_bundle.js"
    crossorigin="anonymous"></script>
</head>

Einzelheiten zur Implementierung finden Sie in den plattformspezifischen Entwicklungsleitfäden für jede Lösung in MediaPipe Tasks.