Gerador de audiodescrição

Crie faixas de áudio descritivas para vídeos do YouTube em minutos.

O que faz?

O app Gerador de audiodescrição é uma ferramenta para criar faixas de áudio descritivo para vídeos curtos do YouTube em poucos minutos. Depois de receber um link do YouTube, o app busca o vídeo, o título e a descrição. Em seguida, ele começa a dividir o vídeo em partes menores. Esses pedaços, junto com os dados do YouTube, são usados primeiro para criar um "arquivo de contexto" usando o Gemini. Isso funciona como uma primeira passagem para detectar detalhes gerais e identificar caracteres. Em seguida, cada bloco é usado para criar um "arquivo de volume", que mede o volume em cada intervalo, e uma "transcrição" (usando o Gemini), que lista o diálogo do vídeo com carimbos de data/hora. Todas essas informações são enviadas ao Gemini novamente para criar um "script" de observações com carimbos de data/hora. Esses scripts são colocados na conversão de texto em voz do Google Cloud, o áudio resultante é juntado e o resultado final é apresentado ao usuário.

Desenvolvido com

  • Web/Chrome
  • Google Cloud: Text-to-Speech

Equipe

Por

Ryan Baumgart

De

Canadá