جو
مولد کتاب صوتی همهجانبه
کاری که انجام می دهد
Atmosphere با Google Gemini Flash API در 2 مرحله مستقل تعامل میکند تا ضبطهای صوتی همهجانبه و منسجمی ایجاد کند.
مرحله 1: مهر زمانی
در ابتدا، Atmosphere با ضبط صدا به طور کامل ارائه می شود و وظیفه دارد مهرهای زمانی را در کتاب صوتی که مربوط به صحنه هایی است که با صدای محیط بهبود می یابد، تعیین کند. جمینی علاوه بر ارائه مهر زمانی این صحنهها، توصیف مختصری از زمینه صحنه و کلمات کلیدی برجسته از صحنه که لحن کلی بخش را میسازد، تولید میکند.
مرحله 2: نقشه برداری
با استفاده از کلمات کلیدی جمعآوریشده برای هر صحنه شناساییشده توسط Gemini، Atmosphere بیش از 33000 جلوه صوتی و کلیدواژههای مرتبط با آنها را در کتابخانه جلوههای صوتی BBC بررسی میکند و همه صداها را با حداقل یک کلمه کلیدی مطابق با صحنه به دست میآورد. با تمام جلوههای صوتی که حداقل یک کلمه کلیدی منطبق را در یک فهرست جمعآوری کردهاند، از Gemini خواسته میشود تا صدایی را از لیست انتخاب کند که به بهترین وجه با توصیف صحنه ایجاد شده توسط Gemini در مرحله 1 مطابقت دارد.
مرحله 3: پوشش
هنگامی که همه صداها برای هر صحنه انتخاب شدند، اتمسفر عادی می شود، محو می شود، و سپس جلوه های صوتی انتخاب شده را روی بخش های کتاب صوتی مربوطه می پوشاند.
ساخته شده با
- وب/کروم
تیم
توسط
پل بوکلمن، ساویر رایس، روهان کوشی، نیک بل
از
ایالات متحده