Guía de detección de idioma

La tarea del detector de idioma de MediaPipe te permite identificar el idioma de un texto. Esta tarea opera en datos de texto con un modelo de aprendizaje automático (AA) y genera una lista de predicciones, en la que cada predicción consta de un código de lenguaje ISO 639-1 y una probabilidad.

Probar

Comenzar

Comienza a utilizar esta tarea siguiendo una de estas guías de implementación para la plataforma de destino. En estas guías específicas de la plataforma, se explica la implementación básica de esta tarea, incluidos un modelo recomendado y un ejemplo de código con las opciones de configuración recomendadas:

Detalles de la tarea

En esta sección, se describen las capacidades, entradas, salidas y opciones de configuración de esta tarea.

Funciones

  • Umbral de puntuación: Filtra los resultados en función de las puntuaciones de predicción.
  • Lista de entidades permitidas y listas de bloqueo: Especifica las categorías detectadas.
Entradas de tareas Resultados de la tarea
El detector de idioma acepta el siguiente tipo de datos de entrada:
  • String
El detector de idiomas genera una lista de predicciones que contienen lo siguiente:
    • Código de idioma: Un código de idioma ISO 639-1 (https://en.wikipedia.org/wiki/List_of_ISO_639-1_codes) o de idioma / configuración regional (p.ej., "en" para inglés, "uz" para uzbeko, "ja-Latn" para japonés (romaji)) como una cadena.
    • Probabilidad: Es la puntuación de confianza de esta predicción, expresada como una probabilidad entre cero y uno como valor de punto flotante.

Opciones de configuración

Esta tarea incluye las siguientes opciones de configuración:

Nombre de la opción Descripción Rango de valores Valor predeterminado
max_results Configura la cantidad máxima opcional de predicciones de idioma con puntuaciones más altas que se mostrarán. Si este valor es menor que cero, se muestran todos los resultados disponibles. Cualquier número positivo -1
score_threshold Establece el umbral de puntuación de predicción que anula el proporcionado en los metadatos del modelo (si corresponde). Se rechazarán los resultados inferiores a este valor. Cualquier número de punto flotante No establecida
category_allowlist Establece la lista opcional de códigos de idioma permitidos. Si no está vacío, se filtrarán las predicciones de idioma cuyo código de idioma no se encuentre en este conjunto. Esta opción es mutuamente excluyente con category_denylist, y el uso de ambas genera un error. Cualquier cadena No establecida
category_denylist Establece la lista opcional de códigos de idioma que no están permitidos. Si no está vacío, se filtrarán las predicciones de idioma cuyo código de idioma se encuentre en este conjunto. Esta opción es mutuamente excluyente con category_allowlist, y el uso de ambas da como resultado un error. Cualquier cadena No establecida

ajustables

Ofrecemos un modelo predeterminado y recomendado cuando comiences a desarrollar con esta tarea.

Este modelo se diseñó para ser ligero (315 KB) y usa una arquitectura de clasificación de redes neuronales basada en incorporaciones. El modelo identifica el idioma con un código ISO 639-1 y puede identificar 110 idiomas. Para obtener una lista de los idiomas compatibles con el modelo, consulta el archivo de etiquetas, que enumera los idiomas según su código ISO 639-1.

Nombre del modelo Forma de entrada Tipo de cuantización Tarjeta de modelo Versiones
Detector de idioma cadena UTF-8 ninguno (float32) info Más reciente

Comparativas de tareas

Estas son las comparativas de tareas para toda la canalización basadas en los modelos previamente entrenados anteriores. El resultado de latencia es la latencia promedio en el Pixel 6 usando CPU / GPU.

Nombre del modelo Latencia de la CPU Latencia de GPU
Detector de idioma 0.31ms -