Syri i Dytë
Asistenti juaj vizual interaktiv dhe i mësueshëm
Çfarë bën
SecondEye është një asistent vizual interaktiv dhe i mësueshëm. Mund të përdoret për një sërë detyrash dhe raste përdorimi që lidhen me vizionin. Mund të mësohet gjithashtu të kryejë detyra të personalizuara të shikimit pa trajnim ose programim. Të gjitha në një mënyrë interaktive dhe përsëritëse.
SecondEye mund të ndërtohet aktualisht vetëm me Gemini për shkak të aftësive unike të modelit të mëposhtëm:
1. Zbulimi i objekteve me aftësinë për të kthyer pozicionet e sakta të kutisë kufizuese
2. Mbështetje origjinale për video me aftësinë për të kthyer informacionin e stampuar me kohë
3. Dritarja e madhe e kontekstit
SecondEye shfrytëzon këto aftësi për të ofruar këto përvoja unike dhe krejtësisht të reja të AI:
• Për imazhet (duke përdorur aftësinë nr. 1):
◦ Përkufizimet e objekteve të shënuara
◦ Pyetja për një pjesë specifike të një imazhi
◦ Përmirësimi:
▪ Kërkimi i objekteve
▪ Si të riparohen apo montohen pyetjet
▪ Kërkesat për reagime vizuale
◦ Mësimi i modelit për një pjesë të shënuar të një imazhi
• Për video (duke përdorur aftësinë nr. 2):
◦ Përvoja e përmirësuar e kërkimit të videos
• Për video me kamerë të drejtpërdrejtë (duke përdorur aftësinë nr. 3):
◦ Analizë video e personalizuar në kohë reale
◦ Duke i mësuar diçka modeles me video
◦ Asistencë vizuale në kohë reale për njerëzit me dëmtime shikimi, me aftësinë për të memorizuar fytyrat, objektet dhe vendet për njohje në të ardhmen.
• Për ndarjen e drejtpërdrejtë të ekranit (duke përdorur aftësinë nr. 3):
◦ Mësimi i modelit një rrjedhë pune
◦ Mbështetje për IT ose programim.
◦ Përmirësoni shfletimin në ueb dhe përvojën e përgjithshme kompjuterike për njerëzit me dëmtime shikimi
E ndertuar me
- Web/Chrome
- Firebase
- Firebase Genkit
- Google Speech-to-Text/Text-to-Speech
Ekipi
Nga
Zakaria KADDARI
Nga
Maroku