Generatore di descrizioni audio
Crea tracce audio descrittive per i video di YouTube in pochi minuti.
Descrizione
L'app Generatore di descrizioni audio è uno strumento per creare tracce audio descrittive per brevi video di YouTube in pochi minuti. Una volta fornito un link di YouTube, l'app recupera il video, il titolo e la descrizione. A questo punto, inizia a suddividere il video in blocchi più piccoli. Questi chunk, insieme ai dati di YouTube, vengono utilizzati per creare un "file di contesto" utilizzando Gemini, che funge da prima analisi per rilevare dettagli generali e identificare eventuali personaggi. Ogni chunk viene poi utilizzato per creare un "file di livello di intensità" che misura il volume in ogni intervallo e una "trascrizione" (utilizzando Gemini) che elenca i dialoghi del video con i timestamp. Tutte queste informazioni vengono poi nuovamente inviate a Gemini per creare uno "script" di osservazioni con i timestamp. Questi script vengono poi sottoposti a Text-to-Speech di Google Cloud, l'audio risultante viene ricollegato e il risultato finale viene presentato all'utente.
Realizzato con
- Web/Chrome
- Google Cloud: Text-to-Speech
Team
Di
Ryan Baumgart
Da
Canada