เครื่องมือสร้างเสียงบรรยาย

สร้างแทร็กเสียงที่สื่อความหมายสำหรับวิดีโอ YouTube ได้ภายในไม่กี่นาที

การทำงาน

แอป Audio Description Generator เป็นเครื่องมือสำหรับสร้างแทร็กเสียงบรรยายสำหรับวิดีโอ YouTube สั้นๆ ภายในไม่กี่นาที เมื่อได้รับลิงก์ YouTube แล้ว แอปจะดึงข้อมูลวิดีโอ ชื่อ และคำอธิบาย จากนั้นจะเริ่มด้วยการตัดวิดีโอออกเป็นส่วนเล็กๆ ระบบจะใช้ข้อมูล YouTube ร่วมกับข้อมูลโค้ดเหล่านี้เพื่อสร้าง "ไฟล์บริบท" โดยใช้ Gemini ซึ่งจะทำหน้าที่เป็นการตรวจสอบครั้งแรกเพื่อตรวจหารายละเอียดทั่วไปและระบุตัวละคร จากนั้นระบบจะใช้แต่ละกลุ่มเพื่อสร้าง "ไฟล์ระดับเสียง" ซึ่งจะวัดระดับเสียงในทุกช่วงเวลา และ "ข้อความถอดเสียง" (โดยใช้ Gemini) ซึ่งแสดงบทสนทนาจากวิดีโอพร้อมการประทับเวลา จากนั้นระบบจะส่งข้อมูลทั้งหมดนี้ไปยัง Gemini อีกครั้งเพื่อสร้าง "สคริปต์" ของการสังเกตการณ์พร้อมการประทับเวลา จากนั้นระบบจะส่งสคริปต์เหล่านี้ผ่านโปรแกรมอ่านออกเสียงของ Google Cloud, ระบบจะต่อเสียงที่ออกมาเข้าด้วยกัน และแสดงผลลัพธ์สุดท้ายต่อผู้ใช้

สร้างขึ้นด้วย

  • เว็บ/Chrome
  • Google Cloud: บริการอ่านออกเสียงข้อความ

ทีม

โดย

Ryan Baumgart

จาก

แคนาดา