Ambiente

Gerador de audiolivros imersivos

O que faz?

A Atmosphere interage com a API Google Gemini Flash em duas etapas independentes para gerar gravações de áudio imersivas e coesas.
Etapa 1: carimbos de data/hora
Inicialmente, a Atmosphere recebe a gravação de áudio completa e tem a tarefa de localizar os carimbos de data/hora no audiolivro que correspondem a cenas que seriam aprimoradas pelo áudio ambiente. Além de fornecer o carimbo de data/hora dessas cenas, o Gemini também produz uma descrição concisa do contexto da cena e das palavras-chave mais importantes que constroem o tom geral do segmento.
Etapa 2: mapeamentos
Usando as palavras-chave coletadas para cada cena identificada pelo Gemini, o Atmosphere analisa os mais de 33.000 efeitos sonoros e as palavras-chave associadas na biblioteca de efeitos sonoros da BBC e adquire todos os sons com pelo menos uma palavra-chave correspondente à cena. Com todos os efeitos sonoros, um mínimo de uma palavra-chave correspondente compilada em uma lista, o Gemini é solicitado a escolher o som da lista que melhor corresponde à descrição da cena criada pelo Gemini na etapa 1.
Etapa 3: sobreposição
Depois que todos os sons forem selecionados para cada cena, o Atmosphere normaliza, atenua, corta e sobrepõe os efeitos sonoros selecionados nos segmentos de audiolivro correspondentes.

Desenvolvido com

  • Web/Chrome

Equipe

Por

Paul Bokelman, Sawyer Rice, Rohan Koshy, Nik Belle

De

Estados Unidos