E dukshme
Visibl i kthen librat audio në libra video
Çfarë bën
Visibl është një aplikacion iOS që transformon librat audio në videolibra gjithëpërfshirës, duke e kthyer përvojën tuaj të dëgjimit në një udhëtim vizual. Ndërsa dëgjoni, Visibl gjeneron në mënyrë dinamike imazhe në kohë reale, duke i lejuar përdoruesit të shohin një interpretim unik vizual të librit audio që po shijojnë. Aplikacioni nuk krijon vetëm imazhe statike; Ai u mundëson përdoruesve të ndikojnë dhe drejtojnë pamjet vizuale, duke e bërë çdo udhëtim nëpër një libër shumë të personalizuar.
Visibl përdor fuqinë e Gemini API në tre mënyra kryesore:
- Transkriptimi i audios: Aplikacioni transkripton audion e librit audio në tekst, duke siguruar përfaqësim të saktë të përmbajtjes.
- Njohja e entitetit të emërtuar (NER): Kjo i lejon aplikacionit të identifikojë dhe të fokusohet në personazhet, vendet dhe objektet kryesore brenda tekstit, të cilat janë thelbësore për gjenerimin e pamjeve vizuale përkatëse kontekstuale (Gemini 1.5 Pro)
- Gjenerimi i kërkesave të imazhit: Duke përdorur njohuritë nga transkriptimi dhe NER, aplikacioni gjeneron kërkesa të detajuara dhe të personalizuara të imazhit, të cilat më pas përdoren nga modelet e difuzionit për të krijuar pamjet vizuale në kohë reale. (Gemini 1.5 Pro)
Ky kombinim i veçorive të Gemini API siguron që Visibl jo vetëm që ofron një mënyrë të re për të përjetuar libra audio, por gjithashtu përshtat përvojën në mënyrë unike për çdo përdorues.
E ndertuar me
- Firebase
Ekipi
Nga
e dukshme
Nga
MB