Visibl

Visibl mengubah buku audio menjadi videobook

Fungsinya

Visibl adalah aplikasi iOS yang mengubah buku audio menjadi videobook imersif, sehingga mengubah pengalaman mendengarkan Anda menjadi perjalanan visual. Saat Anda mendengarkan, Visibl secara dinamis menghasilkan gambar secara real-time, sehingga pengguna dapat melihat interpretasi visual yang unik dari buku audio yang mereka nikmati. Aplikasi ini tidak hanya membuat gambar statis; aplikasi ini memungkinkan pengguna memengaruhi dan memandu visual, sehingga setiap perjalanan melalui buku sangat dipersonalisasi.

Visibl memanfaatkan kecanggihan Gemini API dengan tiga cara utama:

- Transkripsi Audio: Aplikasi mentranskripsikan audio buku audio menjadi teks, sehingga memastikan representasi konten yang akurat.

- Named Entity Recognition (NER): Hal ini memungkinkan aplikasi mengidentifikasi dan berfokus pada karakter, tempat, dan objek utama dalam teks, yang sangat penting untuk menghasilkan visual yang relevan secara kontekstual (Gemini 1.5 Pro)

- Pembuatan Perintah Gambar: Dengan menggunakan insight dari transkripsi dan NER, aplikasi menghasilkan perintah gambar yang mendetail dan dipersonalisasi, yang kemudian digunakan oleh model difusi untuk membuat visual secara real time. (Gemini 1.5 Pro)

Kombinasi fitur Gemini API ini memastikan bahwa Visibl tidak hanya memberikan cara baru untuk menikmati buku audio, tetapi juga menyesuaikan pengalaman secara unik untuk setiap pengguna.

Dibuat dengan

  • Firebase

Tim

Oleh

visibl

From

Inggris Raya