AIAutoResearcher

Обобщите и объясните последние исследования в области искусственного интеллекта в формате видео на YouTube

Что он делает

Приложение проверяет новейшие исследования об ИИ на Arxiv и анализирует их с помощью API Gemini AI. Оно создает скрипт youtube, содержащий введение, анализ, аутро и некоторые полезные метаданные (например, описание видео, теги, заголовок и т. д.). Затем оно использует локальный TortoiseTTS для создания звука. Затем оно использует локальный ComfyUI для создания аватара с синхронизацией губ. После этого созданные артефакты объединяются в совместимое с youtube видео и автоматически загружаются на Youtube с помощью API YouTube. Метаданные (например, заголовок, описание, теги и т. д.) также заполняются автоматически.
Чтобы сделать его надежным, я решил использовать цепочку подсказок для Gemini LLM. Этот подход позволил лучше контролировать контент и сделал ответы намного более интересными и простыми для понимания. Я решил использовать формат JSON (и проверку обязательных полей) для всех запросов, чтобы гарантировать, что модель правильно интерпретирует требования и отвечает в правильном формате.
Замена локальной установки TortoiseTTS с открытым исходным кодом на платный API Google TTS приведет к повышению качества звука и сокращению времени обработки.

Построено с

  • Веб/Хром
  • API YouTube

Команда

К

Павел Шпыт

От

Польша