AIAautoStudier
Përmblidhni dhe shpjegoni hulumtimet më të fundit të AI në formatin e videos në YouTube
Çfarë bën
Aplikacioni kontrollon kërkimet më të reja rreth AI në Arxiv dhe e analizon atë duke përdorur Gemini AI API. Ai prodhon skript në youtube që përmban hyrje, analizë, outro dhe disa meta të dhëna të dobishme (si përshkrimi i videos, etiketat, titulli etj.). Pastaj përdor TortoiseTTS lokale për të prodhuar audio. Pastaj përdor ComfyUI lokale për të krijuar avatar të sinkronizuar me buzë. Pas kësaj, artefaktet e krijuara kombinohen në një video të pajtueshme me youtube dhe ngarkohen automatikisht në Youtube duke përdorur YouTube API. Meta të dhënat (si titulli, përshkrimi, etiketat etj) plotësohen gjithashtu automatikisht.
Për ta bërë atë të fortë, vendosa të përdor një zinxhir kërkesash për Gemini LLM. Kjo qasje lejoi kontroll më të mirë mbi përmbajtjen dhe i bëri përgjigjet shumë më tërheqëse dhe më të lehta për t'u ndjekur. Vendosa të përdor formatin JSON (dhe vërtetimin e fushave të kërkuara) për të gjitha kërkesat për t'u siguruar që modeli interpreton siç duhet kërkesat dhe përgjigjet me formatin e duhur.
Zëvendësimi i instalimit TortoiseTTS lokal dhe me burim të hapur me Google TTS API me pagesë do të çojë në cilësi më të lartë të audios dhe kohë më të shpejtë të përpunimit.
E ndertuar me
- Web/Chrome
- Youtube API
Ekipi
Nga
Paweł Szpyt
Nga
Polonia