Gerador de audiodescrição
Crie faixas de áudio descritivas para vídeos do YouTube em minutos.
O que faz?
O app Gerador de audiodescrição é uma ferramenta para criar faixas de áudio descritivo para vídeos curtos do YouTube em poucos minutos. Depois de receber um link do YouTube, o app busca o vídeo, o título e a descrição. Em seguida, ele começa a dividir o vídeo em partes menores. Esses pedaços, junto com os dados do YouTube, são usados primeiro para criar um "arquivo de contexto" usando o Gemini. Isso funciona como uma primeira passagem para detectar detalhes gerais e identificar caracteres. Em seguida, cada bloco é usado para criar um "arquivo de volume", que mede o volume em cada intervalo, e uma "transcrição" (usando o Gemini), que lista o diálogo do vídeo com carimbos de data/hora. Todas essas informações são enviadas ao Gemini novamente para criar um "script" de observações com carimbos de data/hora. Esses scripts são colocados na conversão de texto em voz do Google Cloud, o áudio resultante é juntado e o resultado final é apresentado ao usuário.
Desenvolvido com
- Web/Chrome
- Google Cloud: Text-to-Speech
Equipe
Por
Ryan Baumgart
De
Canadá