Anuj Sharma
עוזרת אישית קולית שיכולה לראות את העולם
תיאור
אני אוהב את ה-API של Google (Gemini) כי הוא מספק תוצאות מלאות, ואני רוצה ליצור את הפרויקט המשני שלי בעזרת Gemini API.
אני יוצר אפליקציית Python או סוג של תוכנה עם חזון ליצירת AI או עוזרת קול של Singularty. יש הרבה קודים או פרויקטים שבהם עוזרות הקול מקבלות פקודות קוליות ומחזירות את התוצאה בקול, אבל הן לא יכולות לראות את השאילתה שלנו בצורה של חזון. לכן יצרתי את סוג הפרויקט הזה בעזרת Gemini API (Pro ו-Vision Pro). עכשיו עוזרת הקול שלי יכולה גם לקבל את הקלט כתמונה ולענות על התשובה שלי בטקסט וגם בקול.
מבוסס על
- ללא
- Firebase
קבוצה
על ידי
Kritrim
מאת
הודו