隆重推出 Google AI Edge Portal：大规模对边缘 AI 进行基准测试。注册以在非公开预览期间申请访问权限。

此页面由 Cloud Translation API 翻译。

适用于 Android 的图片分类指南

借助 MediaPipe 图片分类器任务，您可以对图片进行分类。您可以使用此任务来确定图片在训练时定义的一组类别中代表的是什么。以下说明介绍了如何将图片分类器与 Android 应用搭配使用。这些说明中介绍的代码示例可在 GitHub 上找到。

您可以查看Web 演示，了解此任务的实际运作方式。如需详细了解此任务的功能、模型和配置选项，请参阅概览。

代码示例

MediaPipe Tasks 示例代码是对 Android 图片分类器应用的简单实现。该示例使用实体 Android 设备上的相机持续分类对象，还可以使用设备图库中的图片和视频静态分类对象。

您可以将该应用用作您自己的 Android 应用的起点，也可以在修改现有应用时参考该应用。图片分类器示例代码托管在 GitHub 上。

下载代码

以下说明介绍了如何使用 git 命令行工具创建示例代码的本地副本。

如需下载示例代码，请执行以下操作：

使用以下命令克隆 Git 代码库：

git clone https://github.com/google-ai-edge/mediapipe-samples

（可选）将您的 Git 实例配置为使用稀疏检出，以便您仅拥有 Image Classifier 示例应用的文件：
```
cd mediapipe-samples
git sparse-checkout init --cone
git sparse-checkout set examples/image_classification/android
```

创建示例代码的本地版本后，您可以将项目导入 Android Studio 并运行应用。如需了解相关说明，请参阅 Android 设置指南。

关键组件

以下文件包含此图片分类示例应用的重要代码：

ImageClassifierHelper.kt - 初始化图片分类器，并处理模型和委托选择。
MainActivity.kt - 实现应用，包括调用 ImageClassificationHelper 和 ClassificationResultsAdapter。
ClassificationResultsAdapter.kt - 处理和设置结果格式。

设置

本部分介绍了设置开发环境和编写代码项目以使用图片分类器的关键步骤。如需了解如何设置开发环境以使用 MediaPipe 任务（包括平台版本要求）的一般信息，请参阅 Android 设置指南。

依赖项

图片分类器使用 com.google.mediapipe:tasks-vision 库。将此依赖项添加到 Android 应用开发项目的 build.gradle 文件中。使用以下代码导入所需的依赖项：

dependencies {
    ...
    implementation 'com.google.mediapipe:tasks-vision:latest.release'
}

型号

MediaPipe 图片分类器任务需要与此任务兼容的训练模型。如需详细了解适用于图片分类器的可用训练模型，请参阅任务概览的“模型”部分。

选择并下载模型，然后将其存储在项目目录中：

<dev-project-root>/src/main/assets

使用 BaseOptions.Builder.setModelAssetPath() 方法指定模型使用的路径。下一部分的代码示例中会提及此方法。

在图片分类器示例代码中，模型在 ImageClassifierHelper.kt 文件中定义。

创建任务

您可以使用 createFromOptions 函数创建任务。createFromOptions 函数接受配置选项，包括运行模式、显示名称语言区域、结果数量上限、置信度阈值以及类别许可名单或拒绝名单。如需详细了解配置选项，请参阅配置概览。

图片分类器任务支持 3 种输入数据类型：静态图片、视频文件和实时视频直播。创建任务时，您需要指定与输入数据类型对应的运行模式。选择与输入数据类型对应的标签页，了解如何创建任务和运行推理。

Image

ImageClassifierOptions options =
  ImageClassifierOptions.builder()
    .setBaseOptions(
      BaseOptions.builder().setModelAssetPath("model.tflite").build())
    .setRunningMode(RunningMode.IMAGE)
    .setMaxResults(5)
    .build();
imageClassifier = ImageClassifier.createFromOptions(context, options);

视频

ImageClassifierOptions options =
  ImageClassifierOptions.builder()
    .setBaseOptions(
      BaseOptions.builder().setModelAssetPath("model.tflite").build())
    .setRunningMode(RunningMode.VIDEO)
    .setMaxResults(5)
    .build();
imageClassifier = ImageClassifier.createFromOptions(context, options);

直播

ImageClassifierOptions options =
  ImageClassifierOptions.builder()
    .setBaseOptions(
      BaseOptions.builder().setModelAssetPath("model.tflite").build())
    .setRunningMode(RunningMode.LIVE_STREAM)
    .setMaxResults(5)
    .setResultListener((result, inputImage) -> {
         // Process the classification result here.
    })
    .setErrorListener((result, inputImage) -> {
         // Process the classification errors here.
    })
    .build()
imageClassifier = ImageClassifier.createFromOptions(context, options)

图片分类器示例代码实现允许用户在处理模式之间切换。这种方法会使任务创建代码变得更复杂，可能不适合您的用例。您可以在 ImageClassifierHelper.kt 文件的 setupImageClassifier() 函数中看到此代码。

配置选项

此任务针对 Android 应用提供了以下配置选项：

选项名称	说明	值范围	默认值
`runningMode`	设置任务的运行模式。共有三种模式： IMAGE：适用于单张图片输入的模式。视频：视频的解码帧的模式。 LIVE_STREAM：输入数据（例如来自摄像头）的直播模式。在此模式下，必须调用 resultListener 以设置监听器以异步接收结果。	{`IMAGE, VIDEO, LIVE_STREAM`}	`IMAGE`
`displayNamesLocale`	设置要为任务模型的元数据（如果有）中提供的显示名称使用的标签语言。默认值为 `en`（英语）。您可以使用 TensorFlow Lite Metadata Writer API 向自定义模型的元数据添加本地化标签	语言区域代码	en
`maxResults`	设置可选的要返回的得分最高的分类结果的数量上限。如果小于 0，则会返回所有可用的结果。	任何正数	`-1`
`scoreThreshold`	设置预测得分阈值，该阈值会替换模型元数据中提供的阈值（如果有）。低于此值的结果将被拒绝。	任何浮点数	未设置
`categoryAllowlist`	设置允许的类别名称的可选列表。如果不为空，则系统会滤除类别名称不在该集合中的分类结果。系统会忽略重复或未知的类别名称。此选项与 `categoryDenylist` 互斥，同时使用这两个选项会导致错误。	任何字符串	未设置
`categoryDenylist`	设置不允许的类别名称的可选列表。如果不为空，系统会滤除类别名称在此集合中的分类结果。系统会忽略重复或未知的类别名称。此选项与 `categoryAllowlist` 互斥，同时使用这两个选项会导致错误。	任何字符串	未设置
`resultListener`	设置结果监听器，以便在图像分类器处于实时流模式时异步接收分类结果。仅当运行模式设置为 `LIVE_STREAM` 时才能使用	不适用	未设置
`errorListener`	设置可选的错误监听器。	不适用	未设置

准备数据

图片分类器适用于图片、视频文件和直播视频。该任务会处理数据输入预处理，包括调整大小、旋转和值归一化。

您需要先将输入图片或帧转换为 com.google.mediapipe.framework.image.MPImage 对象，然后才能将其传递给图片分类器。

Image

import com.google.mediapipe.framework.image.BitmapImageBuilder;
import com.google.mediapipe.framework.image.MPImage;

// Load an image on the user’s device as a Bitmap object using BitmapFactory.

// Convert an Android’s Bitmap object to a MediaPipe’s Image object.
Image mpImage = new BitmapImageBuilder(bitmap).build();

视频

import com.google.mediapipe.framework.image.BitmapImageBuilder;
import com.google.mediapipe.framework.image.MPImage;

// Load a video file on the user's device using MediaMetadataRetriever

// From the video’s metadata, load the METADATA_KEY_DURATION and
// METADATA_KEY_VIDEO_FRAME_COUNT value. You’ll need them
// to calculate the timestamp of each frame later.

// Loop through the video and load each frame as a Bitmap object.

// Convert the Android’s Bitmap object to a MediaPipe’s Image object.
Image mpImage = new BitmapImageBuilder(frame).build();

直播

import com.google.mediapipe.framework.image.MediaImageBuilder;
import com.google.mediapipe.framework.image.MPImage;

// Create a CameraX’s ImageAnalysis to continuously receive frames 
// from the device’s camera. Configure it to output frames in RGBA_8888
// format to match with what is required by the model.

// For each Android’s ImageProxy object received from the ImageAnalysis, 
// extract the encapsulated Android’s Image object and convert it to 
// a MediaPipe’s Image object.
android.media.Image mediaImage = imageProxy.getImage()
Image mpImage = new MediaImageBuilder(mediaImage).build();

在图片分类器示例代码中，数据准备是在 ImageClassifierHelper.kt 文件中处理的。

运行任务

您可以调用与运行模式对应的 classify 函数来触发推理。Image Classifier API 会返回输入图片或画面中对象的可能类别。

Image

ImageClassifierResult classifierResult = imageClassifier.classify(image);

视频

// Calculate the timestamp in milliseconds of the current frame.
long frame_timestamp_ms = 1000 * video_duration * frame_index / frame_count;

// Run inference on the frame.
ImageClassifierResult classifierResult =
    imageClassifier.classifyForVideo(image, frameTimestampMs);

直播

// Run inference on the frame. The classifications results will be available 
// via the `resultListener` provided in the `ImageClassifierOptions` when 
// the image classifier was created.
imageClassifier.classifyAsync(image, frameTimestampMs);

请注意以下几点：

在视频模式或直播模式下运行时，您还必须向图片分类器任务提供输入帧的时间戳。
在图片或视频模式下运行时，图片分类器任务会阻塞当前线程，直到其处理完输入图片或帧。为避免阻塞界面，请在后台线程中执行处理。
在直播模式下运行时，图片分类器任务不会阻塞当前线程，而是会立即返回。每当它处理完输入帧后，都会调用其结果监听器并传递检测结果。如果在图片分类器任务忙于处理其他帧时调用 classifyAsync 函数，该任务会忽略新的输入帧。

在图片分类器示例代码中，classify 函数在 ImageClassifierHelper.kt 文件中定义。

处理和显示结果

运行推理后，图片分类器任务会返回一个 ImageClassifierResult 对象，其中包含输入图片或帧中对象的可能类别列表。

以下是此任务的输出数据示例：

ImageClassifierResult:
 Classifications #0 (single classification head):
  head index: 0
  category #0:
   category name: "/m/01bwb9"
   display name: "Passer domesticus"
   score: 0.91406
   index: 671
  category #1:
   category name: "/m/01bwbt"
   display name: "Passer montanus"
   score: 0.00391
   index: 670

此结果是在以下平台上运行鸟类分类器后获得的：

一只家麻雀的特写照片

在图片分类器示例代码中，ClassificationResultsAdapter.kt 文件中的 ClassificationResultsAdapter 类会处理结果：

fun updateResults(imageClassifierResult: ImageClassifierResult? = null) {
    categories = MutableList(adapterSize) { null }
    if (imageClassifierResult != null) {
        val sortedCategories = imageClassifierResult.classificationResult()
            .classifications()[0].categories().sortedBy { it.index() }
        val min = kotlin.math.min(sortedCategories.size, categories.size)
        for (i in 0 until min) {
            categories[i] = sortedCategories[i]
        }
    }
}