隆重推出 Google AI Edge Portal：大规模对边缘 AI 进行基准测试。注册以在非公开预览期间申请访问权限。

Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

语言检测指南

示例界面：显示法语输入句子，输出中正确识别为法语。

借助 MediaPipe 语言检测器任务，您可以识别一段文本的语言。此任务使用机器学习 (ML) 模型处理文本数据，并输出预测列表，其中每个预测都包含 ISO 639-1 语言代码和概率。

开始使用

如需开始使用此任务，请按照适用于目标平台的以下任一实现指南操作。以下平台专用指南将引导您完成此任务的基本实现，包括推荐的模型，以及包含推荐配置选项的代码示例：

本部分介绍了此任务的功能、输入、输出和配置选项。

任务输入	任务输出
语言检测器接受以下输入数据类型：字符串	语言检测器会输出一个预测结果列表，其中包含：语言代码：ISO 639-1 (https://zh.wikipedia.org/wiki/ISO_639-1%E4%BB%A3%E7%A0%81%E8%A1%A8) 语言 / 语言区域代码（例如，英语为“en”、乌兹别克语为“uz”、日语（罗马音）为“ja-Latn”）的字符串。概率：此预测的置信度得分，表示为介于 0 到 1 之间的概率浮点值。

此任务具有以下配置选项：

选项名称	说明	值范围	默认值
`max_results`	设置可选的要返回的得分最高的语言预测的数量上限。如果此值小于零，则返回所有可用结果。	任何正数	`-1`
`score_threshold`	设置预测得分阈值，该阈值会替换模型元数据中提供的阈值（如果有）。低于此值的结果将被拒绝。	任何浮点数	未设置
`category_allowlist`	设置允许的语言代码的可选列表。如果不为空，系统会滤除语言代码不在该集合中的语言预测结果。此选项与 `category_denylist` 互斥，同时使用这两个选项会导致错误。	任何字符串	未设置
`category_denylist`	设置不允许使用的语言代码的选填列表。如果不为空，系统会滤除语言代码在此集中的语言预测。此选项与 `category_allowlist` 互斥，同时使用这两个选项会导致错误。	任何字符串	未设置

当您开始使用此任务进行开发时，我们会提供一个默认的推荐模型。

此模型旨在打造轻量级模型（315 KB），并采用基于嵌入的神经网络分类架构。该模型使用 ISO 639-1 语言代码识别语言，可识别 110 种语言。如需查看该模型支持的语言列表，请参阅标签文件，其中按 ISO 639-1 代码列出了各个语言。

模型名称	输入形状	量化类型	模型卡片	版本
语言检测器	字符串 UTF-8	无（float32）	信息	最新

下面是基于上述预训练模型的整个流水线的任务基准。延迟时间结果是使用 CPU / GPU 在 Pixel 6 上的平均延迟时间。

模型名称	CPU 延迟时间	GPU 延迟时间
语言检测器	0.31 毫秒	-