Gemini Voice Companion

שימוש ב-Gemini כעוזר אישי מבוסס-קול

תיאור

זהו עוזר אישי מבוסס-קול שמבוסס על ה-AI של Gemini, עם יכולות מקומיות של המרת טקסט לדיבור והמרת דיבור לטקסט שמאפשרות לבצע אינטראקציות קוליות וטקסטואליות. ה-API של Gemini מצטיין בהבנת ההקשר ובשליחת פקודות בתרחישים שונים. בעזרת בניית הקשר ושימוש בשילובי API, Gemini יכולה להריץ סקריפטים של Python כדי לבצע פונקציות שונות.
באפליקציה הזו, המשתמשים יכולים לקיים אינטראקציה עם העוזרת באופן מלא באמצעות הקול, וכך להפעיל אותה ללא ידיים וללא עיניים. לכן, היא שימושית במיוחד במצבים שבהם הקול הוא אמצעי התקשורת היחיד שזמין. היכולות של העוזרת כוללות:

זיהוי של מספר דוברים
סינון רעשי קול לא מוכרים
שליטה במכשירים ביתיים חכמים
חיקוי הקול של המשתמש
מעבר בין קולות ודמויות שונות
קריאה וסיכום של כתבות חדשות
קבלת מידע על מזג האוויר ומידע נוסף
הפעלת מוזיקה ב-Spotify
צילום תמונות וניתוח שלהן
ניווט בקישור דרך Chrome
תזמון תזכורת קולית או פעולה גנרית

הגמישות והעיצוב הממוקד-קול של העוזרת שמבוססת על Gemini הופכים אותה לכלי רב-תכליתי למגוון רחב של אפליקציות לשימוש ללא ידיים וללא עיניים, כולל בידור ברכב, מדריך הליכה, ניהול הבית ועוד.

מבוסס על

  • אינטרנט/Chrome

קבוצה

על ידי

ז'ניה יאנג (Zhenya Yang)

מאת

אוסטרליה