أنوج شارما

مساعد صوتي يمكنه الاطّلاع على العالم

وظيفتها

أحب واجهة برمجة التطبيقات من Google (Gemini) لأنّها توفّر نتائج مثمرة وأريد إنشاء مشروعي الصغير بمساعدة واجهة برمجة التطبيقات Gemini API، لذا
أُنشئ تطبيقًا أو نوعًا من البرامج باستخدام Python بهدف إنشاء ذكاء اصطناعي أو مساعد صوتي فريد. في الوقت الحالي، تتوفّر الكثير من الرموز البرمجية أو المشاريع التي يتلقّى فيها المساعد الصوتي الأوامر بصوت عالٍ ويعرض النتيجة بصوت عالٍ أيضًا، ولكنّه لا يمكنه الاطّلاع على طلب البحث بصريًا. لذلك، أنشأت هذا النوع من المشاريع بمساعدة واجهة برمجة التطبيقات Gemini API (pro وvision pro). والآن، يمكن لمساعدي الصوت أيضًا الحصول على الإدخال كصورة والردّ على إجابتي في النص وكذلك بالصوت أيضًا.

مصمَّم بالاستناد إلى

  • ما من شبكة
  • Firebase

الفريق

من

Kritrim

من

الهند