LangFlip
Traduce y sincroniza los labios de tus videos a cualquier idioma.
Qué hace
Langflip depende en gran medida de la API de Gemini Multimodal. Se enviará el video original a Gemini y se le pedirá que haga lo siguiente :
1. Genera subtítulos para los videos. Una de las principales complejidades de traducir videos es mantener el ritmo del video original. Por ejemplo, si queremos traducir un video en inglés al alemán, es muy probable que la traducción tenga más palabras y sea más larga que el video original. Gemini permite detectar cuando el orador se toma un descanso y agrupar el subtítulo hasta que se produce una pausa.
2. Genera las traducciones. Una vez más, queremos mantener el ritmo de los videos originales. Google Traductor proporcionará una traducción literal de las oraciones originales. Sin embargo, queremos que las traducciones tengan más o menos la misma duración que el video original. Gemini permite generar traducciones con más o menos la misma cantidad de caracteres que la oración original traducida.
3. Detecta qué fotogramas deben sincronizarse con los labios. Queremos enviar solo los fotogramas en los que el orador se ve claramente y habla con el modelo de IA de sincronización de labios. Si enviamos fotogramas sin un rostro visible a la IA, es posible que falle y no se complete el proceso de sincronización de labios. Gemini permite enviar el video y recibir todas las marcas de tiempo en las que aparece el orador en el video.
Con la tecnología de
- Flutter
- Firebase
Equipo
De
Rémy Menard
De
Francia