隆重推出 Google AI Edge Portal：大规模对边缘 AI 进行基准测试。注册以在非公开预览期间申请访问权限。

Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

适用于 Android 的人脸特征点检测指南

借助 MediaPipe Face Landmarker 任务，您可以检测图片和视频中的人脸特征点和面部表情。您可以使用此任务来识别人脸表情、应用人脸滤镜和效果，以及创建虚拟头像。此任务使用可处理单张图片或连续图片流的机器学习 (ML) 模型。该任务会输出 3 维面部地标、融合变形得分（表示面部表情的系数），以实时推断详细的面部表面，并输出转换矩阵以执行效果渲染所需的转换。

GitHub 上提供了这些说明中描述的代码示例。如需详细了解此任务的功能、模型和配置选项，请参阅概览。

代码示例

MediaPipe Tasks 示例代码是一个简单的 Android 版 Face Landmarker 应用实现。此示例使用实体 Android 设备上的摄像头来检测连续视频流中的人脸。该应用还可以检测设备图库中的图片和视频中的人脸。

您可以将该应用作为自己的 Android 应用的起点，也可以在修改现有应用时参考该应用。Face Landmarker 示例代码托管在 GitHub 上。

下载代码

以下说明展示了如何使用 git 命令行工具创建示例代码的本地副本。

如需下载示例代码，请执行以下操作：

使用以下命令克隆 Git 代码库：

git clone https://github.com/google-ai-edge/mediapipe-samples

（可选）将您的 Git 实例配置为使用稀疏检出，这样您就只会拥有 Face Landmarker 示例应用的文件：
```
cd mediapipe-samples
git sparse-checkout init --cone
git sparse-checkout set examples/face_landmarker/android
```

创建示例代码的本地版本后，您可以将项目导入 Android Studio 并运行应用。如需相关说明，请参阅 Android 设置指南。

关键组件

以下文件包含此面部标记示例应用的关键代码：

FaceLandmarkerHelper.kt - 初始化面部标记器并处理模型和委托选择。
CameraFragment.kt - 处理设备摄像头并处理图片和视频输入数据。
GalleryFragment.kt - 与 OverlayView 互动以显示输出图片或视频。
OverlayView.kt - 实现显示功能，为检测到的人脸添加面部网格。

设置

本部分介绍了设置开发环境和代码项目以专门使用 Face Landmarker 的关键步骤。如需了解有关设置开发环境以使用 MediaPipe 任务的一般信息（包括平台版本要求），请参阅 Android 设置指南。

依赖项

人脸地标检测器任务使用 com.google.mediapipe:tasks-vision 库。将此依赖项添加到 Android 应用的 build.gradle 文件中：

dependencies {
    implementation 'com.google.mediapipe:tasks-vision:latest.release'
}

型号

MediaPipe 人脸地标检测器任务需要与此任务兼容的已训练模型软件包。如需详细了解适用于人脸地标检测器的可用训练模型，请参阅任务概览的“模型”部分。

选择并下载模型，然后将其存储在项目目录中：

<dev-project-root>/src/main/assets

在 ModelAssetPath 参数中指定模型的路径。在示例代码中，模型是在 FaceLandmarkerHelper.kt 文件中定义的：

baseOptionsBuilder.setModelAssetPath(MP_FACE_LANDMARKER_TASK)

创建任务

MediaPipe 人脸地标检测器任务使用 createFromOptions() 函数来设置任务。createFromOptions() 函数接受配置选项的值。如需详细了解配置选项，请参阅配置选项。

Face Landmarker 支持以下输入数据类型：静态图片、视频文件和实时视频流。创建任务时，您需要指定与输入数据类型对应的运行模式。选择输入数据类型对应的标签页，了解如何创建任务和运行推理。

图片

val baseOptionsBuilder = BaseOptions.builder().setModelAssetPath(MP_FACE_LANDMARKER_TASK)
val baseOptions = baseOptionBuilder.build()

val optionsBuilder = 
    FaceLandmarker.FaceLandmarkerOptions.builder()
        .setBaseOptions(baseOptionsBuilder.build())
        .setMinFaceDetectionConfidence(minFaceDetectionConfidence)
        .setMinTrackingConfidence(minFaceTrackingConfidence)
        .setMinFacePresenceConfidence(minFacePresenceConfidence)
        .setNumFaces(maxNumFaces)
        .setRunningMode(RunningMode.IMAGE)

val options = optionsBuilder.build()
FaceLandmarker = FaceLandmarker.createFromOptions(context, options)

视频

val baseOptionsBuilder = BaseOptions.builder().setModelAssetPath(MP_FACE_LANDMARKER_TASK)
val baseOptions = baseOptionBuilder.build()

val optionsBuilder = 
    FaceLandmarker.FaceLandmarkerOptions.builder()
        .setBaseOptions(baseOptionsBuilder.build())
        .setMinFaceDetectionConfidence(minFaceDetectionConfidence)
        .setMinTrackingConfidence(minFaceTrackingConfidence)
        .setMinFacePresenceConfidence(minFacePresenceConfidence)
        .setNumFaces(maxNumFaces)
        .setRunningMode(RunningMode.VIDEO)

val options = optionsBuilder.build()
FaceLandmarker = FaceLandmarker.createFromOptions(context, options)

直播

val baseOptionsBuilder = BaseOptions.builder().setModelAssetPath(MP_FACE_LANDMARKER_TASK)
val baseOptions = baseOptionBuilder.build()

val optionsBuilder = 
    FaceLandmarker.FaceLandmarkerOptions.builder()
        .setBaseOptions(baseOptionsBuilder.build())
        .setMinFaceDetectionConfidence(minFaceDetectionConfidence)
        .setMinTrackingConfidence(minFaceTrackingConfidence)
        .setMinFacePresenceConfidence(minFacePresenceConfidence)
        .setNumFaces(maxNumFaces)
        .setResultListener(this::returnLivestreamResult)
        .setErrorListener(this::returnLivestreamError)
        .setRunningMode(RunningMode.LIVE_STREAM)

val options = optionsBuilder.build()
FaceLandmarker = FaceLandmarker.createFromOptions(context, options)

人脸地标检测器示例代码实现允许用户在处理模式之间切换。这种方法会使任务创建代码更加复杂，可能不适合您的使用场景。您可以在 FaceLandmarkerHelper.kt 文件中的 setupFaceLandmarker() 函数中看到此代码。

配置选项

此任务针对 Android 应用具有以下配置选项：

选项名称	说明	值范围	默认值
`runningMode`	设置任务的运行模式。共有三种模式： IMAGE：用于单张图片输入的模式。 VIDEO：视频解码帧的模式。 LIVE_STREAM：用于直播输入数据（例如来自摄像头的数据）的模式。在此模式下，必须调用 resultListener 来设置监听器以异步接收结果。	{`IMAGE, VIDEO, LIVE_STREAM`}	`IMAGE`
`numFaces`	`FaceLandmarker` 可检测到的人脸数量上限。仅当 `num_faces` 设置为 1 时，才会应用平滑处理。	`Integer > 0`	`1`
`minFaceDetectionConfidence`	人脸检测被视为成功所需的最低置信度得分。	`Float [0.0,1.0]`	`0.5`
`minFacePresenceConfidence`	人脸标志检测中人脸存在置信度分数的最低值。	`Float [0.0,1.0]`	`0.5`
`minTrackingConfidence`	人脸跟踪被视为成功所需的最低置信度得分。	`Float [0.0,1.0]`	`0.5`
`outputFaceBlendshapes`	人脸标记器是否输出人脸融合变形。面部混合形状用于渲染 3D 面部模型。	`Boolean`	`False`
`outputFacialTransformationMatrixes`	FaceLandmarker 是否输出面部转换矩阵。FaceLandmarker 使用该矩阵将人脸标志从规范人脸模型转换为检测到的人脸，以便用户在检测到的标志上应用效果。	`Boolean`	`False`
`resultListener`	设置结果监听器，以便在 FaceLandmarker 处于直播模式时异步接收地标检测器结果。只能在运行模式设置为 `LIVE_STREAM` 时使用	`ResultListener`	`N/A`
`errorListener`	设置可选的错误监听器。	`ErrorListener`	`N/A`

准备数据

Face Landmarker 可处理图片、视频文件和实时视频流。该任务负责处理数据输入预处理，包括调整大小、旋转和值归一化。

以下代码演示了如何移交数据以进行处理。这些示例详细介绍了如何处理来自图片、视频文件和实时视频流的数据。

图片

import com.google.mediapipe.framework.image.BitmapImageBuilder
import com.google.mediapipe.framework.image.MPImage

// Convert the input Bitmap object to an MPImage object to run inference
val mpImage = BitmapImageBuilder(image).build()

视频

import com.google.mediapipe.framework.image.BitmapImageBuilder
import com.google.mediapipe.framework.image.MPImage

val argb8888Frame =
    if (frame.config == Bitmap.Config.ARGB_8888) frame
    else frame.copy(Bitmap.Config.ARGB_8888, false)

// Convert the input Bitmap object to an MPImage object to run inference
val mpImage = BitmapImageBuilder(argb8888Frame).build()

直播

import com.google.mediapipe.framework.image.BitmapImageBuilder
import com.google.mediapipe.framework.image.MPImage

// Convert the input Bitmap object to an MPImage object to run inference
val mpImage = BitmapImageBuilder(rotatedBitmap).build()

在人脸标记点检测器示例代码中，数据准备是在 FaceLandmarkerHelper.kt 文件中处理的。

运行任务

根据您处理的数据类型，使用特定于该数据类型的 FaceLandmarker.detect...() 方法。使用 detect() 表示单个图片，使用 detectForVideo() 表示视频文件中的帧，使用 detectAsync() 表示视频流。在视频流上执行检测时，请务必在单独的线程上运行检测，以避免阻塞界面线程。

以下代码示例展示了如何在这些不同的数据模式下运行 Face Landmarker 的简单示例：

图片

val result = FaceLandmarker.detect(mpImage)

视频

val timestampMs = i * inferenceIntervalMs

FaceLandmarker.detectForVideo(mpImage, timestampMs)
    .let { detectionResult ->
        resultList.add(detectionResult)
    }

直播

val mpImage = BitmapImageBuilder(rotatedBitmap).build()
val frameTime = SystemClock.uptimeMillis()

FaceLandmarker.detectAsync(mpImage, frameTime)

请注意以下几点：

在视频模式或直播模式下运行时，您必须向 Face Landmarker 任务提供输入帧的时间戳。
在图片或视频模式下运行时，人脸地标检测器任务会阻塞当前线程，直到完成对输入图片或帧的处理。为避免阻塞界面，请在后台线程中执行处理。
在实时流模式下运行时，人脸地标检测器任务会立即返回，不会阻塞当前线程。每次完成对输入帧的处理后，它都会使用检测结果调用结果监听器。

在人脸标记点检测器示例代码中，detect、detectForVideo 和 detectAsync 函数在 FaceLandmarkerHelper.kt 文件中定义。

处理和显示结果

人脸标记器每次检测都会返回一个 FaceLandmarkerResult 对象。结果对象包含检测到的每张人脸的面部网格，其中包含每个人脸地标的坐标。（可选）结果对象还可以包含 blendshape（表示面部表情）和面部转换矩阵，以在检测到的地标上应用面部效果。

以下展示了此任务的输出数据示例：

FaceLandmarkerResult:
  face_landmarks:
    NormalizedLandmark #0:
      x: 0.5971359014511108
      y: 0.485361784696579
      z: -0.038440968841314316
    NormalizedLandmark #1:
      x: 0.3302789330482483
      y: 0.29289937019348145
      z: -0.09489090740680695
    ... (478 landmarks for each face)
  face_blendshapes:
    browDownLeft: 0.8296722769737244
    browDownRight: 0.8096957206726074
    browInnerUp: 0.00035583582939580083
    browOuterUpLeft: 0.00035752105759456754
    ... (52 blendshapes for each face)
  facial_transformation_matrixes:
    [9.99158978e-01, -1.23036895e-02, 3.91213447e-02, -3.70770246e-01]
    [1.66496094e-02,  9.93480563e-01, -1.12779640e-01, 2.27719707e+01]
    ...

下图显示了任务输出的可视化效果：

一位男士，其面部区域已通过几何方式映射出来，以指示其面部的形状和尺寸

人脸地标检测器示例代码演示了如何显示任务返回的结果，如需了解详情，请参阅 OverlayView 类。