Ambiente

Generatore di audiolibri immersivi

Descrizione

Atmosphere interagisce con l'API Google Gemini Flash in due passaggi indipendenti per generare registrazioni audio immersive e coerenti.
Passaggio 1: timestamp
In un primo momento, ad Atmosphere viene fornita la registrazione audio nella sua interezza e viene incaricato di individuare i timestamp all'interno dell'audiolibro che corrispondono alle scene che verrebbero migliorate dall'audio ambientale. Oltre a fornire il timestamp di queste scene, Gemini produce anche una descrizione concisa del contesto della scena e le parole chiave salienti della scena che costruiscono il tono generale del segmento.
Passaggio 2: mappature
Utilizzando le parole chiave raccolte per ogni scena identificata da Gemini, Atmosphere analizza gli oltre 33.000 effetti sonori e le relative parole chiave associate nella raccolta di effetti sonori della BBC e acquisisce tutti i suoni con almeno una parola chiave corrispondente a quella della scena. Con tutti gli effetti sonori, viene compilato un elenco con almeno una parola chiave corrispondente e Gemini viene invitato a scegliere l'audio dall'elenco che corrisponde meglio alla descrizione della scena creata da Gemini nel passaggio 1.
Passaggio 3: sovrapposizione
Una volta selezionati tutti gli audio per ogni scena, Atmosphere normalizza, attenua, taglia e sovrappone gli effetti sonori selezionati ai segmenti dell'audiolibro corrispondenti.

Realizzato con

  • Web/Chrome

Team

Di

Paul Bokelman, Sawyer Rice, Rohan Koshy, Nik Belle

Da

Stati Uniti