Visibl

Visibl 將有聲書轉換為視訊書

用途

Visibl 是 iOS 應用程式,可將有聲書轉換成沉浸式有聲書,讓你在聆聽時也能享受視覺體驗。在使用者聆聽時,Visbl 會動態即時產生圖片,讓使用者看到自己正在收聽的有聲書的獨特視覺詮釋。應用程式不只會產生靜態圖片,還可讓使用者影響及引導視覺效果,讓每一次閱讀體驗都更加個人化。

Visibl 透過三種主要方式運用 Gemini API 的強大功能:

- 音訊轉錄:應用程式會將有聲書音訊轉錄成文字,確保內容正確呈現。

- 命名實體辨識 (NER):這項功能可讓應用程式辨識並著重於文字中的關鍵人物、地點和物件,這對於產生與內容脈絡相關的視覺效果至關重要 (Gemini 1.5 Pro)。

- 圖片提示產生:應用程式會運用轉錄和 NER 的洞察資料,產生詳細且個人化的圖片提示,然後由擴散模型用於即時產生視覺效果。(Gemini 1.5 Pro)

透過 Gemini API 功能的組合,Visibli 不僅提供全新的體驗方式,讓使用者能以獨特的方式享受有聲書,還能為每位使用者提供個人化的體驗。

採用

  • Firebase

團隊

變更者

visibl

寄件者

英國