Anuj Sharma
Dünyayı görebilen sesli asistan
Ne işe yarar?
Google'ın (gemini) API'sini seviyorum çünkü verimli sonuçlar sağlıyor. Küçük projemi Gemini API'nin yardımıyla yapmak istiyorum. Bu nedenle
, tekil yapay zeka veya sesli asistan oluşturma vizyonuyla bir Python uygulaması ya da yazılım türü oluşturuyorum. Şu anda sesli asistanların sesli komutları alıp sonucu sesli olarak döndürdüğü çok sayıda kod veya proje var ancak sorgularımızı görsel olarak göremiyorlar. Bu nedenle, bu tür bir projeyi Gemini API'nin (pro ve vision pro) yardımıyla oluşturdum. Artık sesli asistanım da girişi resim olarak alıp cevabımı hem metin hem de ses olarak yanıtlayabiliyor.
Aşağıdakilerle tasarlandı:
- Yok
- Firebase
Takım
Değişikliği yapan
Kritrim
Nereden
Hindistan