AIAutoResearcher

En son yapay zeka araştırmalarını YouTube videosu biçiminde özetleme ve açıklama

Ne işe yarar?

Uygulama, Arxiv'deki yapay zeka ile ilgili en yeni araştırmaları kontrol eder ve Gemini Yapay Zeka API'sini kullanarak analiz eder. Giriş, analiz, kapanış ve bazı yararlı meta veriler (ör. video açıklaması, etiketler, başlık vb.) içeren bir YouTube senaryosu oluşturur. Ardından, ses oluşturmak için yerel TortoiseTTS'yi kullanır. Ardından, dudak senkronizasyonu yapılmış avatar oluşturmak için yerel ComfyUI'yi kullanır. Ardından, oluşturulan yapı taşları YouTube ile uyumlu bir videoda birleştirilir ve YouTube API kullanılarak otomatik olarak YouTube'a yüklenir. Meta veriler (ör. başlık, açıklama, etiketler vb.) de otomatik olarak doldurulur.
Bu özelliği sağlamlaştırmak için Gemini LLM'de bir istem zinciri kullanmaya karar verdim. Bu yaklaşım, içerik üzerinde daha iyi kontrol sahibi olmamızı sağladı ve yanıtları çok daha ilgi çekici ve takip edilmesi kolay hale getirdi. Modelin koşulları doğru şekilde yorumlamasını ve doğru biçimle yanıt vermesini sağlamak için tüm istekler için JSON biçimini (ve gerekli alanların doğrulanmasını) kullanmaya karar verdim.
Yerel ve açık kaynak TortoiseTTS kurulumunun ücretli Google TTS API ile değiştirilmesi, daha yüksek ses kalitesi ve daha hızlı işlem süresi sağlar.

Aşağıdakilerle tasarlandı:

  • Web/Chrome
  • YouTube API

Takım

Değişikliği yapan

Paweł Szpyt

Nereden

Polonya