Creador de modelos de MediaPipe

MediaPipe Model Maker es una herramienta que te permite personalizar modelos de aprendizaje automático (AA) existentes para que funcionen con tus datos y aplicaciones. Puedes usar esta herramienta como una alternativa más rápida a crear y entrenar un modelo de AA nuevo. Model Maker usa una técnica de entrenamiento de AA llamada aprendizaje por transferencia que vuelve a entrenar modelos existentes con datos nuevos. Esta técnica reutiliza una parte significativa de la lógica del modelo existente, lo que significa que el entrenamiento lleva menos tiempo que entrenar un modelo nuevo y se puede hacer con menos datos.

Model Maker funciona en varios tipos de modelos, incluida la detección de objetos, el reconocimiento de gestos o los clasificadores de imágenes, texto o datos de audio. La herramienta vuelve a entrenar los modelos; para ello, quita las últimas capas del modelo que clasifican datos en categorías específicas y vuelve a compilar esas capas con los datos nuevos que proporcionas. Model Maker también admite alguna opción para ajustar las capas del modelo y mejorar la precisión y el rendimiento.

Modelo de aprendizaje automático que muestra la eliminación y el reemplazo de capas de clasificación

Figura 1: Model Maker quita las capas finales de un modelo existente y las vuelve a compilar con datos nuevos.

Por lo general, volver a entrenar un modelo con Model Maker reduce el tamaño del modelo, especialmente si lo vuelves a entrenar para que reconozca menos elementos. Esto significa que puedes usar Model Maker para crear modelos más enfocados que funcionen mejor para tu aplicación. La herramienta también puede ayudarte a aplicar técnicas de AA como la cuantización para que el modelo use menos recursos y se ejecute de manera más eficiente.

Requisitos de datos de entrenamiento

Puedes usar Model Maker para volver a entrenar modelos con muchos menos datos que con el entrenamiento de un modelo nuevo. Cuando se vuelve a entrenar un modelo con datos nuevos, el objetivo debe ser tener alrededor de 100 muestras de datos para cada clase entrenada. Por ejemplo, si vuelves a entrenar un modelo de clasificación de imágenes para que reconozca gatos, perros y loros, deberías tener alrededor de 100 imágenes de gatos, 100 imágenes de perros y 100 imágenes de loros. Según tu aplicación, es posible que puedas volver a entrenar un modelo útil con aún menos datos por categoría, aunque, por lo general, un conjunto de datos más grande mejora la precisión del modelo. Cuando crees tu conjunto de datos de entrenamiento, recuerda que tus datos de entrenamiento se dividen durante el proceso de reentrenamiento, por lo general, un 80% para el entrenamiento, un 10% para las pruebas y el resto para la validación.

Limitaciones de la personalización

Dado que el proceso de reentrenamiento quita las capas de clasificación anteriores, el modelo resultante solo puede reconocer elementos o clases proporcionados en los datos nuevos. Si el modelo anterior se entrenó para reconocer 30 clases de elementos diferentes, y usas Model Maker para volver a entrenarlo con datos de 10 elementos diferentes, el modelo resultante solo puede reconocer esos 10 elementos nuevos.

Volver a entrenar un modelo con Model Maker no puede cambiar la tarea del modelo de AA original para resolver, incluso si esos trabajos son similares. Por ejemplo, no puedes usar la herramienta para hacer que un modelo de clasificación de imágenes realice la detección de objetos, aunque esas tareas compartan alguna similitud.

Comenzar

Puedes comenzar a usar MediaPipe Model Maker ejecutando uno de los instructivos de personalización de soluciones para MediaPipe, como la clasificación de imágenes.