Compagno cieco | Gemini API Developer Competition

Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Tecnologia vocale di assistenza per utenti ciechi

Descrizione

L'applicazione riceve segnali acustici tramite i comandi vocali dell'utente e li analizza utilizzando l'API Google Gemini per convertirli in azioni. Questi comandi possono variare. Possono essere comandi per aprire un'applicazione specifica e visitare un sito web specifico su internet. Confermo che l'applicazione può gestire in modo efficiente tutte queste attività complesse. Passando alle specifiche, questo risultato viene ottenuto grazie all'integrazione di una tecnologia di riconoscimento vocale avanzata per acquisire la voce e convertirla in testo, quindi integrando una tecnologia di sintesi vocale che esegue il processo opposto, il che consente agli utenti di avere un'esperienza confortevole senza dover utilizzare una tastiera. L'utilizzo dell'API Google Gemini consente all'applicazione di fornire risposte rapide e accurate, migliorando l'esperienza utente. Ora è il momento di spiegare i passaggi che ho seguito per implementare l'idea. Dopo aver avuto l'idea, ho iniziato a pensare agli strumenti che avrei probabilmente utilizzato e poi ho iniziato a implementare il progetto. Dopodiché ho iniziato a lavorare all'applicazione. Il primo problema che ho riscontrato è stato un problema con il download del programma Python. Dopo alcune ricerche, ho trovato una soluzione a questo problema tramite Google. Questo è il codice che ho raccolto da diverse librerie online. Il codice di ogni libreria esegue una funzione specifica. Dopo aver aperto il terminale e aver aspettato qualche secondo, diremo la parola "Apri" e il programma si aprirà.

Realizzato con

Riconoscimento vocale
Sintesi vocale (TTS)

Team

World Assistants

Egitto

Blind Companion