AIAutoResearcher
以 YouTube 影片格式摘要說明最新的 AI 研究
用途
應用程式會在 Arxiv 上檢查最新的 AI 研究,並使用 Gemini AI API 進行分析。它會產生 YouTube 劇本,其中包含開場白、分析、結尾和一些實用的中繼資料 (例如影片說明、標記、標題等)。接著,系統會使用本機 TortoiseTTS 產生音訊。然後使用本機 ComfyUI 建立嘴型同步顯示圖片。之後,系統會將產生的構件組合成與 YouTube 相容的影片,並使用 YouTube API 自動上傳至 YouTube。中繼資料 (例如標題、說明、標記等) 也會自動填入。
為了確保穩定性,我決定向 Gemini LLM 使用一連串提示。這項做法可讓我們更有效地控管內容,讓回覆更吸引人且更易於理解。我決定為所有要求使用 JSON 格式 (以及必要欄位的驗證),確保模型能正確解讀需求,並以適當格式回應。
如果將本地和開放原始碼 TortoiseTTS 安裝程式替換為付費的 Google TTS API,音訊品質會更高,處理時間也會更快。
採用
- 網頁/Chrome
- YouTube API
團隊
變更者
Paweł Szpyt
寄件者
波蘭