Anuj Sharma

Assistente vocale in grado di vedere il mondo

Descrizione

adoro l'API di Google (gemini) perché fornisce risultati soddisfacenti e voglio realizzare il mio progetto secondario con l'aiuto dell'API gemini, quindi
creo un'applicazione Python o un tipo di software con l'obiettivo di creare un'AI o un assistente vocale singularity ora ci sono molti codici o progetti in cui gli assistenti vocali prendono il comando in voce e restituiscono il risultato in voce, ma non sono in grado di vedere la nostra query sotto forma di visione, quindi ho creato questo tipo di progetto con l'aiuto dell'API Gemini (pro e vision pro) ora il mio assistente vocale è in grado di ricevere l'input come immagine e rispondere alla mia risposta sia in testo che in voce

Realizzato con

  • Nessuna
  • Firebase

Team

Di

Kritrim

Da

India