AIAautoResearcher

آخرین تحقیقات هوش مصنوعی را در قالب ویدیوی YouTube خلاصه و توضیح دهید

کاری که انجام می دهد

این برنامه جدیدترین تحقیقات در مورد هوش مصنوعی را در Arxiv بررسی می کند و آن را با استفاده از Gemini AI API تجزیه و تحلیل می کند. این اسکریپت یوتیوب حاوی مقدمه، تجزیه و تحلیل، outro و برخی ابرداده های مفید (مانند توضیحات ویدیو، برچسب ها، عنوان و غیره) تولید می کند. سپس از TortoiseTTS محلی برای تولید صدا استفاده می کند. سپس از ComfyUI محلی برای ایجاد آواتار همگام‌سازی لب استفاده می‌کند. پس از آن، مصنوعات ایجاد شده در یک ویدیوی سازگار با یوتیوب ترکیب می شوند و به طور خودکار با استفاده از YouTube API در یوتیوب آپلود می شوند. ابرداده ها (مانند عنوان، توضیحات، برچسب ها و غیره) نیز به صورت خودکار پر می شوند.
برای اینکه آن را قوی کنم، تصمیم گرفتم از زنجیره ای از دستورات برای Gemini LLM استفاده کنم. این رویکرد کنترل بهتری بر محتوا را امکان پذیر می کرد و پاسخ ها را بسیار جذاب تر و پیگیری آسان تر می کرد. من تصمیم گرفتم از فرمت JSON (و اعتبارسنجی فیلدهای مورد نیاز) برای همه درخواست‌ها استفاده کنم تا مطمئن شوم که مدل به درستی نیازمندی‌ها را تفسیر می‌کند و با فرمت مناسب پاسخ می‌دهد.
جایگزینی نصب محلی و منبع باز TortoiseTTS با Google TTS API پولی منجر به کیفیت بالاتر صدا و زمان پردازش سریعتر می شود.

ساخته شده با

  • وب/کروم
  • Youtube API

تیم

توسط

پاول شپیت

از

لهستان