AIAutoResearcher

สรุปและอธิบายการวิจัย AI ล่าสุดในรูปแบบวิดีโอ YouTube

การทำงาน

แอปพลิเคชันจะตรวจสอบงานวิจัยล่าสุดเกี่ยวกับ AI ใน Arxiv และวิเคราะห์โดยใช้ Gemini AI API เครื่องมือนี้จะสร้างสคริปต์ YouTube ที่มีช่วงอินโทร การวิเคราะห์ ช่วงปิด และข้อมูลเมตาที่มีประโยชน์บางอย่าง (เช่น คำอธิบายวิดีโอ แท็ก ชื่อ ฯลฯ) จากนั้นจะใช้ TortoiseTTS ในเครื่องเพื่อสร้างเสียง จากนั้นจะใช้ ComfyUI ในเครื่องเพื่อสร้างรูปโปรไฟล์ที่ซิงค์กับเสียง หลังจากนั้น ระบบจะรวมอาร์ติแฟกต์ที่สร้างขึ้นเป็นวิดีโอที่เข้ากันได้กับ YouTube และอัปโหลดไปยัง YouTube โดยอัตโนมัติโดยใช้ YouTube API ระบบจะกรอกข้อมูลเมตา (เช่น ชื่อ คำอธิบาย แท็ก ฯลฯ) โดยอัตโนมัติด้วย
เราตัดสินใจใช้ชุดพรอมต์กับ LLM ของ Gemini เพื่อให้ระบบทำงานได้อย่างมีประสิทธิภาพ แนวทางนี้ช่วยให้ควบคุมเนื้อหาได้ดียิ่งขึ้น รวมถึงทำให้คำตอบน่าสนใจและติดตามได้ง่ายขึ้นมาก เราตัดสินใจใช้รูปแบบ JSON (และการตรวจสอบช่องที่ต้องกรอก) สำหรับคำขอทั้งหมดเพื่อให้แน่ใจว่าโมเดลจะตีความข้อกำหนดและตอบสนองด้วยรูปแบบที่เหมาะสม
การเปลี่ยนการติดตั้ง TortoiseTTS ในเครื่องและแบบโอเพนซอร์สด้วย Google TTS API แบบชำระเงินจะทำให้เสียงมีคุณภาพสูงขึ้นและเวลาประมวลผลเร็วขึ้น

สร้างขึ้นด้วย

  • เว็บ/Chrome
  • YouTube API

ทีม

โดย

Paweł Szpyt

จาก

โปแลนด์