Cognitive Strike

שיחות וידאו משופרות ב-Gemini – שיפור היכולות שלכם לכל תרחיש

תיאור

המטרה של האפליקציה היא לשנות את האופן שבו מתכוננים לתרחישים שונים באמצעות Gemini. הוא תוכנן כדי לדמות אינטראקציות ריאליסטיות בסרטונים. שיפרנו את התפקיד 'תפקיד מערכת' כך שיציע מפגשי סימולציה מותאמים אישית, בהתאם לצרכים הספציפיים של המשתמשים, ויעזור להם להתכונן לראיונות.

באפליקציה יש שני מצבים דינמיים: צ'אט ווידאו. במצב צ'אט, המשתמשים מקיימים אינטראקציה עם מראיין מותאם אישית של Gemini, ולאחר מכן עונים על חידונים מותאמים אישית שנוצרו על סמך השיחה הספציפית הזו. מצב הווידאו מדמה שיחת וידאו בזמן אמת עם המשתמש באמצעות Google Cloud TTS ו-webSTT. המודל הזה מעלה באופן אסינכררוני את פיד הסרטונים של המשתמש ויוצר תגובה דינמית מ-Gemini על סמך מה שהמודל רואה ומה שהמשתמש אומר.

PS – ה-LLM API היחיד שנעשה בו שימוש כאן הוא Gemini. ממשק ה-API השני הוא Google Cloud Text-to-Speech.

מבוסס על

  • Chromium ו-Google Cloud Text-to-Speech

קבוצה

על ידי

Automa

מאת

הודו