AIAutoResearcher
סיכום והסבר על המחקר העדכני ביותר בנושא AI בפורמט של סרטון YouTube
תיאור
האפליקציה בודקת את המחקרים העדכניים ביותר בנושא AI ב-Arxiv ומנתחת אותם באמצעות Gemini AI API. הכלי יוצר סקריפט ל-YouTube שכולל מבוא, ניתוח, קליפ לסיום הסרטון ומטא-נתונים שימושיים (כמו תיאור הסרטון, תגים, שם וכו'). לאחר מכן, המערכת משתמשת ב-TortoiseTTS המקומי כדי ליצור אודיו. לאחר מכן, המערכת משתמשת ב-ComfyUI המקומי כדי ליצור דמות עם סינכרון שפתיים. לאחר מכן, הארטיפקטים שנוצרו משולבים לסרטון תואם ל-YouTube ומועלו ל-YouTube באופן אוטומטי באמצעות YouTube API. גם המטא-נתונים (כמו שם, תיאור, תגים וכו') מתמלאים באופן אוטומטי.
כדי לשפר את העמידות של הפתרון, החלטתי להשתמש בשרשרת של הנחיות ל-LLM של Gemini. הגישה הזו אפשרה שליטה טובה יותר בתוכן, והתשובות הפכו למעניינות יותר ולקלות יותר לעקוב אחריהן. החלטתי להשתמש בפורמט JSON (ובאימות של שדות נדרשים) לכל הבקשות כדי לוודא שהמודל מפרש את הדרישות בצורה נכונה ומגיב בפורמט המתאים.
החלפת ההתקנה המקומית והקוד הפתוח של TortoiseTTS ב-Google TTS API בתשלום תוביל לאיכות אודיו גבוהה יותר ולזמן עיבוד מהיר יותר.
מבוסס על
- אינטרנט/Chrome
- YouTube API
קבוצה
על ידי
Paweł Szpyt
מאת
פולין