Атмосфера
Генератор захватывающих аудиокниг
Что он делает
Atmosphere взаимодействует с API Google Gemini Flash в два независимых этапа для создания захватывающих и связных аудиозаписей.
Шаг 1: Временные метки
Первоначально Atmosphere предоставляется аудиозапись в полном объеме, и ей поручено найти временные метки в аудиокниге, которые соответствуют сценам, которые будут улучшены фоновым звуком. Помимо предоставления временной метки этих сцен, Gemini также создает краткое описание контекста сцены и основные ключевые слова из сцены, которые создают общий тон сегмента.
Шаг 2: Сопоставление
Используя ключевые слова, собранные для каждой сцены, идентифицированной Gemini, Atmosphere просеивает более 33 000 звуковых эффектов и связанных с ними ключевых слов в библиотеке звуковых эффектов BBC и получает все звуки, в которых есть хотя бы одно ключевое слово, совпадающее с ключевым словом сцены. Поскольку все звуковые эффекты содержат минимум одно совпадающее ключевое слово, собранное в список, Gemini предлагается выбрать из списка звук, который лучше всего соответствует описанию сцены, созданному Gemini на шаге 1.
Шаг 3: Наложение
После того, как все звуки выбраны для каждой сцены, Atmosphere нормализует, затухает, обрезает, а затем накладывает выбранные звуковые эффекты на соответствующие сегменты аудиокниги.
Построено с
- Веб/Хром
Команда
К
Пол Бокельман, Сойер Райс, Рохан Коши, Ник Белль
От
Соединенные Штаты