LangFlip

Tłumacz i synchronizuj swoje filmy z dźwiękiem w dowolnym języku.

Działanie

Langflip w dużej mierze korzysta z interfejsu Gemini Multimodal API. Prześle on oryginalny film do Gemini i poprosi go o :
1. generować napisy do filmów. Jednym z głównych problemów związanych z tłumaczeniem filmów jest zachowanie rytmu oryginalnego filmu. Jeśli na przykład chcemy przetłumaczyć film z języka angielskiego na niemiecki, jest bardzo prawdopodobne, że przetłumaczenie będzie dłuższe i zawierać więcej słów niż oryginalny film. Gemini umożliwia wykrywanie przerw w mowie i grupowanie napisów do momentu przerwy.
2. Wygeneruj tłumaczenia. Ponownie chcemy zachować rytm oryginalnych filmów. Tłumacz Google zapewni dosłowne tłumaczenie oryginalnych zdań. Chcemy jednak, aby tłumaczenia były mniej więcej tak samo długie jak oryginalny film. Gemini umożliwia generowanie tłumaczeń z mniej więcej taką samą liczbą znaków jak w tłumaczonym zdaniu.
3. wykrywanie, które klatki wymagają synchronizacji z ruchem warg. Chcemy wysyłać tylko te klatki, na których wyraźnie widać mówiącego, Jeśli wyślemy do AI klatki bez widocznej twarzy, może to spowodować jej zawieszenie i nieudane zsynchronizowanie ruchu warg. Gemini umożliwia wysyłanie filmów i otrzymywanie wszystkich sygnatur czasowych, w których widać osobę mówiącą.

Utworzone za pomocą

  • Flutter
  • Firebase

Zespół

Autor:

Rémy Menard

Od

Francja