Audiodeskriptionsgenerator

Erstelle in wenigen Minuten beschreibende Audiotracks für YouTube-Videos.

Funktion

Die App „Audio Description Generator“ ist ein Tool, mit dem du innerhalb weniger Minuten beschreibende Audiotracks für kurze YouTube-Videos erstellen kannst. Wenn ein YouTube-Link angegeben wird, ruft die App das Video, den Titel und die Beschreibung ab. Das Video wird dann in kleinere Segmente aufgeteilt. Diese Chunks werden zusammen mit den YouTube-Daten zuerst verwendet, um mit Gemini eine „Kontextdatei“ zu erstellen. Diese dient als erster Durchlauf, um allgemeine Details zu erkennen und alle Zeichen zu identifizieren. Aus jedem Chunk wird dann eine „Lautstärkedatei“ erstellt, in der die Lautstärke in jedem Intervall gemessen wird, sowie ein „Transkript“ (mit Gemini), in dem der Dialog aus dem Video mit Zeitstempeln aufgeführt wird. Alle diese Informationen werden dann noch einmal an Gemini gesendet, um ein „Script“ mit Beobachtungen mit Zeitstempeln zu erstellen. Diese Scripts werden dann über die Funktion „Text-to-Speech“ von Google Cloud verarbeitet, die resultierende Audiodatei wird wieder zusammengesetzt und das Endergebnis wird dem Nutzer präsentiert.

Basis

  • Web/Chrome
  • Google Cloud: Text-to-Speech

Team

Von

Ryan Baumgart

Von

Kanada