יצירת תיאורים קוליים

יצירת טראקים של אודיו תיאורי לסרטונים ב-YouTube תוך דקות ספורות.

תיאור

אפליקציית הכלי ליצירת תיאורים קוליים היא כלי ליצירת טראקים של תיאור קולי לסרטונים קצרים ב-YouTube תוך דקות ספורות. אחרי שמזינים קישור ל-YouTube, האפליקציה מאחזרת את הסרטון, השם והתיאור שלו. לאחר מכן, המערכת מתחילה לפצל את הסרטון לקטעים קטנים יותר. הקטעים האלה, לצד נתוני YouTube, משמשים קודם ליצירת 'קובץ הקשר' באמצעות Gemini. זהו שלב ראשון לזיהוי פרטים כלליים ולזיהוי תווים. לאחר מכן, כל מקטע משמש ליצירת 'קובץ עוצמת קול' שמודד את עוצמת הקול בכל מרווח זמן, ו'תמליל' (באמצעות Gemini) שמפרט את הדיאלוג מהסרטון עם חותמות זמן. לאחר מכן, כל המידע הזה מועבר שוב אל Gemini כדי ליצור 'תסריט' של תצפיות עם חותמות זמן. לאחר מכן, הסקריפטים האלה עוברים עיבוד באמצעות Text-to-Speech של Google Cloud, האודיו שנוצר נתפר מחדש והתוצאה הסופית מוצגת למשתמש.

מבוסס על

  • אינטרנט/Chrome
  • Google Cloud: Text-to-Speech

קבוצה

על ידי

ריאן בומרגארט (Ryan Baumgart)

מאת

קנדה