Generator Deskripsi Audio

Buat trek audio deskriptif untuk video YouTube dalam hitungan menit.

Fungsinya

Aplikasi Audio Description Generator adalah alat untuk membuat trek audio deskriptif untuk video YouTube berdurasi singkat dalam hitungan menit. Setelah diberi link YouTube, aplikasi akan mengambil video, judul, dan deskripsi. Kemudian, proses ini dimulai dengan membagi video menjadi beberapa bagian yang lebih kecil. Potongan ini, bersama dengan data YouTube, pertama kali digunakan untuk membuat "file konteks" menggunakan Gemini. Ini berfungsi sebagai langkah pertama untuk mendeteksi detail umum dan mengidentifikasi karakter apa pun. Kemudian, setiap bagian digunakan untuk membuat "file kenyaringan" yang mengukur volume pada setiap interval dan "transkrip" (menggunakan Gemini) yang mencantumkan dialog dari video dengan stempel waktu. Semua informasi ini kemudian dimasukkan ke Gemini lagi untuk membuat "skrip" pengamatan dengan stempel waktu. Skrip ini kemudian dimasukkan ke Text-to-Speech Google Cloud, audio yang dihasilkan akan digabungkan kembali, dan hasil akhirnya akan ditampilkan kepada pengguna.

Dibuat dengan

  • Web/Chrome
  • Google Cloud: Text-to-Speech

Tim

Oleh

Ryan Baumgart

From

Kanada