Ambiance

Générateur de livres audio immersifs

Description

Atmosphere interagit avec l'API Google Gemini Flash en deux étapes distinctes pour générer des enregistrements audio immersifs et cohérents.
Étape 1: Codes temporels
Au départ, Atmosphere reçoit l'enregistrement audio dans son intégralité et doit localiser les codes temporels dans le livre audio qui correspondent aux scènes qui seraient améliorées par l'audio ambiant. En plus de fournir le code temporel de ces scènes, Gemini produit également une description concise du contexte de la scène et des mots clés pertinents qui constituent le ton général du segment.
Étape 2: Mise en correspondance
À l'aide des mots clés collectés pour chaque scène identifiée par Gemini, Atmosphere examine les plus de 33 000 effets sonores et les mots clés associés dans la bibliothèque d'effets sonores de la BBC, et acquiert tous les sons dont au moins un mot clé correspond à celui de la scène. Une fois que tous les effets sonores comportant au moins un mot clé correspondant ont été compilés dans une liste, Gemini est invité à choisir le son de la liste qui correspond le mieux à la description de la scène créée par Gemini à l'étape 1.
Étape 3: Superposition
Une fois que tous les sons ont été sélectionnés pour chaque scène, Atmosphere normalise, atténue, coupe et superpose les effets sonores sélectionnés aux segments du livre audio correspondants.

Conçu avec

  • Web/Chrome

Équipe

Par

Paul Bokelman, Sawyer Rice, Rohan Koshy, Nik Belle

De

États-Unis