AIAutoResearcher
En son yapay zeka araştırmalarını YouTube videosu biçiminde özetleme ve açıklama
Ne işe yarar?
Uygulama, Arxiv'deki yapay zeka ile ilgili en yeni araştırmaları kontrol eder ve Gemini Yapay Zeka API'sini kullanarak analiz eder. Giriş, analiz, kapanış ve bazı yararlı meta veriler (ör. video açıklaması, etiketler, başlık vb.) içeren bir YouTube senaryosu oluşturur. Ardından, ses oluşturmak için yerel TortoiseTTS'yi kullanır. Ardından, dudak senkronizasyonu yapılmış avatar oluşturmak için yerel ComfyUI'yi kullanır. Ardından, oluşturulan yapı taşları YouTube ile uyumlu bir videoda birleştirilir ve YouTube API kullanılarak otomatik olarak YouTube'a yüklenir. Meta veriler (ör. başlık, açıklama, etiketler vb.) de otomatik olarak doldurulur.
Bu özelliği sağlamlaştırmak için Gemini LLM'de bir istem zinciri kullanmaya karar verdim. Bu yaklaşım, içerik üzerinde daha iyi kontrol sahibi olmamızı sağladı ve yanıtları çok daha ilgi çekici ve takip edilmesi kolay hale getirdi. Modelin koşulları doğru şekilde yorumlamasını ve doğru biçimle yanıt vermesini sağlamak için tüm istekler için JSON biçimini (ve gerekli alanların doğrulanmasını) kullanmaya karar verdim.
Yerel ve açık kaynak TortoiseTTS kurulumunun ücretli Google TTS API ile değiştirilmesi, daha yüksek ses kalitesi ve daha hızlı işlem süresi sağlar.
Aşağıdakilerle tasarlandı:
- Web/Chrome
- YouTube API
Takım
Değişikliği yapan
Paweł Szpyt
Nereden
Polonya