Anuj Sharma

Dünyayı görebilen sesli asistan

Ne işe yarar?

Google'ın (gemini) API'sini seviyorum çünkü verimli sonuçlar sağlıyor. Küçük projemi Gemini API'nin yardımıyla yapmak istiyorum. Bu nedenle
, tekil yapay zeka veya sesli asistan oluşturma vizyonuyla bir Python uygulaması ya da yazılım türü oluşturuyorum. Şu anda sesli asistanların sesli komutları alıp sonucu sesli olarak döndürdüğü çok sayıda kod veya proje var ancak sorgularımızı görsel olarak göremiyorlar. Bu nedenle, bu tür bir projeyi Gemini API'nin (pro ve vision pro) yardımıyla oluşturdum. Artık sesli asistanım da girişi resim olarak alıp cevabımı hem metin hem de ses olarak yanıtlayabiliyor.

Aşağıdakilerle tasarlandı:

  • Yok
  • Firebase

Takım

Değişikliği yapan

Kritrim

Nereden

Hindistan