E dukshme

Visibl i kthen librat audio në libra video

Çfarë bën

Visibl është një aplikacion iOS që transformon librat audio në videolibra gjithëpërfshirës, ​​duke e kthyer përvojën tuaj të dëgjimit në një udhëtim vizual. Ndërsa dëgjoni, Visibl gjeneron në mënyrë dinamike imazhe në kohë reale, duke i lejuar përdoruesit të shohin një interpretim unik vizual të librit audio që po shijojnë. Aplikacioni nuk krijon vetëm imazhe statike; Ai u mundëson përdoruesve të ndikojnë dhe drejtojnë pamjet vizuale, duke e bërë çdo udhëtim nëpër një libër shumë të personalizuar.

Visibl përdor fuqinë e Gemini API në tre mënyra kryesore:

- Transkriptimi i audios: Aplikacioni transkripton audion e librit audio në tekst, duke siguruar përfaqësim të saktë të përmbajtjes.

- Njohja e entitetit të emërtuar (NER): Kjo i lejon aplikacionit të identifikojë dhe të fokusohet në personazhet, vendet dhe objektet kryesore brenda tekstit, të cilat janë thelbësore për gjenerimin e pamjeve vizuale përkatëse kontekstuale (Gemini 1.5 Pro)

- Gjenerimi i kërkesave të imazhit: Duke përdorur njohuritë nga transkriptimi dhe NER, aplikacioni gjeneron kërkesa të detajuara dhe të personalizuara të imazhit, të cilat më pas përdoren nga modelet e difuzionit për të krijuar pamjet vizuale në kohë reale. (Gemini 1.5 Pro)

Ky kombinim i veçorive të Gemini API siguron që Visibl jo vetëm që ofron një mënyrë të re për të përjetuar libra audio, por gjithashtu përshtat përvojën në mënyrë unike për çdo përdorues.

E ndertuar me

  • Firebase

Ekipi

Nga

e dukshme

Nga

MB