الأجواء
أداة إنشاء كتب مسموعة غامرة
وظيفتها
يتفاعل تطبيق Atmosphere مع Google Gemini Flash API في خطوتَين مستقلتَين لإنشاء تسجيلات صوتية شاملة ومتسقة.
الخطوة 1: الطوابع الزمنية
في البداية، يتم تزويد تطبيق Atmosphere بالتسجيل الصوتي بالكامل، ويتم تكليفه بتحديد الطوابع الزمنية في الكتاب المسموع التي تتوافق مع المشاهد التي يمكن تحسينها باستخدام الصوت المحيط. بالإضافة إلى توفير الطابع الزمني لهذه المشاهد، يقدّم Gemini أيضًا وصفًا موجزًا لسياق المشهد والكلمات الرئيسية البارزة منه التي تشكل الأسلوب العام للقسم.
الخطوة 2: عمليات الربط
باستخدام الكلمات الرئيسية التي تم جمعها لكل مشهد حدّده Gemini، يبحث Atmosphere في أكثر من 33,000 مؤثر صوتي والكلمات الرئيسية المرتبطة بها في مكتبة المؤثرات الصوتية في BBC، ويحصل على كل الأصوات التي تحتوي على كلمة رئيسية واحدة على الأقل تتطابق مع كلمة المشهد الرئيسية. بعد تجميع جميع المؤثرات الصوتية في قائمة تتضمّن كلمة رئيسية واحدة مطابقة على الأقل، يُطلب من Gemini اختيار الصوت من القائمة الذي يتطابق بشكل أفضل مع وصف المشهد الذي أنشأه Gemini في الخطوة 1.
الخطوة 3: التراكب
بعد اختيار جميع الأصوات لكل مشهد، تعمل ميزة "الجو" على تطبيع المؤثرات الصوتية وخفض مستوى صوتها وقطعها ثم تداخلها مع مقاطع الكتاب المسموع المقابلة.
تم إنشاؤه باستخدام
- الويب/Chrome
الفريق
من
بول بوكملان، وساويرز رايس، ورهان كوشي، بيل
من
الولايات المتحدة