AIAutoResearcher

סיכום והסבר על המחקר העדכני ביותר בנושא AI בפורמט של סרטון YouTube

תיאור

האפליקציה בודקת את המחקרים העדכניים ביותר בנושא AI ב-Arxiv ומנתחת אותם באמצעות Gemini AI API. הכלי יוצר סקריפט ל-YouTube שכולל מבוא, ניתוח, קליפ לסיום הסרטון ומטא-נתונים שימושיים (כמו תיאור הסרטון, תגים, שם וכו'). לאחר מכן, המערכת משתמשת ב-TortoiseTTS המקומי כדי ליצור אודיו. לאחר מכן, המערכת משתמשת ב-ComfyUI המקומי כדי ליצור דמות עם סינכרון שפתיים. לאחר מכן, הארטיפקטים שנוצרו משולבים לסרטון תואם ל-YouTube ומועלו ל-YouTube באופן אוטומטי באמצעות YouTube API. גם המטא-נתונים (כמו שם, תיאור, תגים וכו') מתמלאים באופן אוטומטי.
כדי לשפר את העמידות של הפתרון, החלטתי להשתמש בשרשרת של הנחיות ל-LLM של Gemini. הגישה הזו אפשרה שליטה טובה יותר בתוכן, והתשובות הפכו למעניינות יותר ולקלות יותר לעקוב אחריהן. החלטתי להשתמש בפורמט JSON (ובאימות של שדות נדרשים) לכל הבקשות כדי לוודא שהמודל מפרש את הדרישות בצורה נכונה ומגיב בפורמט המתאים.
החלפת ההתקנה המקומית והקוד הפתוח של TortoiseTTS ב-Google TTS API בתשלום תוביל לאיכות אודיו גבוהה יותר ולזמן עיבוד מהיר יותר.

מבוסס על

  • אינטרנט/Chrome
  • YouTube API

קבוצה

על ידי

Paweł Szpyt

מאת

פולין