全新推出:LiteRT:Google 专为设备端 AI 打造的高性能运行时,以前称为 TensorFlow Lite。
语言检测指南
使用集合让一切井井有条
根据您的偏好保存内容并对其进行分类。
MediaPipe Language Detector 任务可让您识别一段文本所用的语言。此任务使用机器学习 (ML) 模型对文本数据进行处理,并输出预测列表,其中每个预测结果由 ISO 639-1 语言代码和概率组成。
试试吧!arrow_forward
开始使用
如需开始使用此任务,请按照适用于您的目标平台的其中一个实现指南进行操作。这些平台专用指南将引导您完成此任务的基本实现,包括推荐的模型和包含推荐配置选项的代码示例:
任务详情
本部分介绍此任务的功能、输入、输出和配置选项。
特性
- 分数阈值 - 根据预测分数过滤结果
- 标签许可名单和拒绝名单 - 指定检测到的类别
任务输入 |
任务输出 |
语言检测器接受以下输入数据类型:
|
语言检测器输出包含以下内容的预测结果列表:
- 语言代码:以字符串表示的 ISO 639-1 (https://en.wikipedia.org/wiki/List_of_ISO_639-1_codes) 语言 / 语言区域代码(例如,“en”表示英语,“uz”表示乌兹别克语,“ja-Latn”表示日语(罗马字)。
- 概率:此预测的置信度分数,表示为介于 0 到 1 之间的概率(以浮点值表示)。
|
配置选项
此任务具有以下配置选项:
选项名称 |
说明 |
值范围 |
默认值 |
max_results |
设置要返回的得分最高的语言预测结果(可选)上限。如果此值小于零,则返回所有可用的结果。 |
任何正数 |
-1 |
score_threshold |
设置预测分数阈值,以替换模型元数据中提供的阈值(如果有)。低于此值的结果会被拒绝。 |
任意浮点数 |
未设置 |
category_allowlist |
设置允许的语言代码的可选列表。如果为非空,则语言代码不在此集合之外的语言预测结果将被滤除。此选项与 category_denylist 互斥,同时使用这两者会导致错误。 |
任何字符串 |
未设置 |
category_denylist |
设置不允许使用的语言代码的可选列表。如果非空,语言代码在此集合中的语言预测将被滤除。此选项与 category_allowlist 互斥,同时使用这两者会导致错误。 |
任何字符串 |
未设置 |
模型
当您开始使用此任务进行开发时,我们会提供一个默认的推荐模型。
语言检测器模型(推荐)
该模型构建为轻量级 (315 KB),并使用基于嵌入的神经网络分类架构。该模型使用 ISO 639-1 语言代码识别语言,并且可以识别 110 种语言。如需查看模型支持的语言列表,请参阅标签文件,该文件按 ISO 639-1 代码列出语言。
模型名称 |
输入形状 |
量化类型 |
模型卡片 |
Versions |
语言检测器
| 字符串 UTF-8 |
无 (float32) |
信息
|
最新动态
|
任务基准
以下是基于上述预训练模型的整个流水线的任务基准。延迟时间结果是 Pixel 6 使用 CPU / GPU 时的平均延迟时间。
模型名称 |
CPU 延迟时间 |
GPU 延迟时间 |
语言检测器 |
0.31 毫秒 |
- |
如未另行说明,那么本页面中的内容已根据知识共享署名 4.0 许可获得了许可,并且代码示例已根据 Apache 2.0 许可获得了许可。有关详情,请参阅 Google 开发者网站政策。Java 是 Oracle 和/或其关联公司的注册商标。
最后更新时间 (UTC):2024-05-21。
[{
"type": "thumb-down",
"id": "missingTheInformationINeed",
"label":"没有我需要的信息"
},{
"type": "thumb-down",
"id": "tooComplicatedTooManySteps",
"label":"太复杂/步骤太多"
},{
"type": "thumb-down",
"id": "outOfDate",
"label":"内容需要更新"
},{
"type": "thumb-down",
"id": "translationIssue",
"label":"翻译问题"
},{
"type": "thumb-down",
"id": "samplesCodeIssue",
"label":"示例/代码问题"
},{
"type": "thumb-down",
"id": "otherDown",
"label":"其他"
}]
[{
"type": "thumb-up",
"id": "easyToUnderstand",
"label":"易于理解"
},{
"type": "thumb-up",
"id": "solvedMyProblem",
"label":"解决了我的问题"
},{
"type": "thumb-up",
"id": "otherUp",
"label":"其他"
}]
{"lastModified": "\u6700\u540e\u66f4\u65b0\u65f6\u95f4 (UTC)\uff1a2024-05-21\u3002"}
[[["易于理解","easyToUnderstand","thumb-up"],["解决了我的问题","solvedMyProblem","thumb-up"],["其他","otherUp","thumb-up"]],[["没有我需要的信息","missingTheInformationINeed","thumb-down"],["太复杂/步骤太多","tooComplicatedTooManySteps","thumb-down"],["内容需要更新","outOfDate","thumb-down"],["翻译问题","translationIssue","thumb-down"],["示例/代码问题","samplesCodeIssue","thumb-down"],["其他","otherDown","thumb-down"]],["最后更新时间 (UTC):2024-05-21。"],[],[]]