AIAutoResearcher
تلخيص أحدث الأبحاث حول الذكاء الاصطناعي وشرحها في فيديو على YouTube
وظيفتها
يتحقّق التطبيق من أحدث الأبحاث حول الذكاء الاصطناعي على Arxiv ويحلّلها باستخدام Gemini AI API. ينشئ هذا التطبيق نصًا لفيديوهات YouTube يتضمّن مقدمة وتحليلًا ومقطعًا ختاميًا وبعض البيانات الوصفية المفيدة (مثل وصف الفيديو والعلامات والعنوان وما إلى ذلك). بعد ذلك، يستخدم التطبيق أداة TortoiseTTS المحلية لإنشاء المحتوى الصوتي. بعد ذلك، يستخدم ComfyUI على الجهاز لإنشاء صورة أفاتار تتماشى مع الصوت. بعد ذلك، يتم دمج العناصر التي تم إنشاؤها في فيديو متوافق مع YouTube ويتم تحميله إلى YouTube تلقائيًا باستخدام YouTube API. تتم تعبئة البيانات الوصفية (مثل العنوان والوصف والعلامات وما إلى ذلك) تلقائيًا أيضًا.
لتعزيز كفاءة هذه الميزة، قرّرت استخدام سلسلة من الطلبات الموجَّهة إلى نموذج "المعالجة اللغوية الكبيرة" في Gemini. سمح هذا الأسلوب بالتحكّم بشكل أفضل في المحتوى، وجعل الردود أكثر جاذبية وسهولة في المتابعة. قرّرت استخدام تنسيق JSON (والتحقّق من الحقول المطلوبة) لجميع الطلبات لضمان تفسير النموذج للمتطلبات بشكل صحيح والاستجابة بالتنسيق المناسب.
سيؤدي استبدال تثبيت TortoiseTTS المحلي ومفتوح المصدر بواجهة برمجة التطبيقات Google TTS API المدفوعة إلى تحسين جودة الصوت وتسريع وقت المعالجة.
مصمَّم بالاستناد إلى
- الويب/Chrome
- YouTube API
الفريق
من
Paweł Szpyt
من
بولندا