ژنراتور توضیحات صوتی

در عرض چند دقیقه آهنگ های صوتی توصیفی را برای ویدیوهای YouTube ایجاد کنید.

کاری که انجام می دهد

برنامه Audio Description Generator ابزاری برای ایجاد آهنگ های صوتی توصیفی برای ویدیوهای کوتاه YouTube در عرض چند دقیقه است. پس از دریافت پیوند YouTube، برنامه ویدیو، عنوان و توضیحات را دریافت می کند. سپس با تقسیم ویدیو به تکه های کوچکتر شروع می شود. این تکه‌ها، در کنار داده‌های YouTube، ابتدا برای ایجاد یک "فایل زمینه" با استفاده از Gemini استفاده می‌شوند، این به عنوان اولین پاس برای شناسایی جزئیات کلی و شناسایی هر کاراکتر عمل می‌کند. سپس از هر تکه برای ایجاد یک "فایل بلندی صدا" استفاده می شود که حجم را در هر بازه اندازه گیری می کند و یک "رونویسی" (با استفاده از Gemini) که دیالوگ های ویدیو را با مُهر زمانی فهرست می کند. سپس تمام این اطلاعات یک بار دیگر به Gemini داده می شود تا یک "اسکریپت" از مشاهدات با مهر زمانی ایجاد کند. سپس این اسکریپت‌ها از طریق Google Cloud Text-to-Speech قرار می‌گیرند، صدای حاصل دوباره به هم متصل می‌شوند و نتیجه نهایی به کاربر ارائه می‌شود.

ساخته شده با

  • وب/کروم
  • Google Cloud: تبدیل متن به گفتار

تیم

توسط

رایان بامگارت

از

کانادا