ژنراتور توضیحات صوتی
در عرض چند دقیقه آهنگ های صوتی توصیفی را برای ویدیوهای YouTube ایجاد کنید.
کاری که انجام می دهد
برنامه Audio Description Generator ابزاری برای ایجاد آهنگ های صوتی توصیفی برای ویدیوهای کوتاه YouTube در عرض چند دقیقه است. پس از دریافت پیوند YouTube، برنامه ویدیو، عنوان و توضیحات را دریافت می کند. سپس با تقسیم ویدیو به تکه های کوچکتر شروع می شود. این تکهها، در کنار دادههای YouTube، ابتدا برای ایجاد یک "فایل زمینه" با استفاده از Gemini استفاده میشوند، این به عنوان اولین پاس برای شناسایی جزئیات کلی و شناسایی هر کاراکتر عمل میکند. سپس از هر تکه برای ایجاد یک "فایل بلندی صدا" استفاده می شود که حجم را در هر بازه اندازه گیری می کند و یک "رونویسی" (با استفاده از Gemini) که دیالوگ های ویدیو را با مُهر زمانی فهرست می کند. سپس تمام این اطلاعات یک بار دیگر به Gemini داده می شود تا یک "اسکریپت" از مشاهدات با مهر زمانی ایجاد کند. سپس این اسکریپتها از طریق Google Cloud Text-to-Speech قرار میگیرند، صدای حاصل دوباره به هم متصل میشوند و نتیجه نهایی به کاربر ارائه میشود.
ساخته شده با
- وب/کروم
- Google Cloud: تبدیل متن به گفتار
تیم
توسط
رایان بامگارت
از
کانادا