Видимый
Visibl превращает аудиокниги в видеокниги
Что он делает
Visibl — это приложение iOS, которое преобразует аудиокниги в захватывающие видеокниги, превращая ваш опыт прослушивания в визуальное путешествие. Пока вы слушаете, Visibl динамически генерирует изображения в реальном времени, позволяя пользователям видеть уникальную визуальную интерпретацию аудиокниги, которой они наслаждаются. Приложение не просто создает статические изображения; оно позволяет пользователям влиять на визуальные эффекты и направлять их, делая каждое путешествие по книге в высшей степени персонализированным.
Visibl использует возможности API Gemini тремя основными способами:
- Транскрипция аудио: приложение транскрибирует аудиокнигу в текст, обеспечивая точное отображение содержания.
- Распознавание именованных сущностей (NER): позволяет приложению идентифицировать и фокусироваться на ключевых персонажах, местах и объектах в тексте, которые имеют решающее значение для создания контекстно-релевантных визуальных эффектов (Gemini 1.5 Pro)
- Генерация подсказок в виде изображений: используя данные транскрипции и NER, приложение генерирует подробные и персонализированные подсказки в виде изображений, которые затем используются моделями диффузии для создания визуальных эффектов в режиме реального времени. (Gemini 1.5 Pro)
Такое сочетание функций API Gemini гарантирует, что Visibl не только предоставляет новый способ прослушивания аудиокниг, но и адаптирует этот опыт под каждого пользователя.
Построено с
- Firebase
Команда
К
видимый
От
Великобритания