جو

مولد کتاب صوتی همهجانبه

کاری که انجام می دهد

Atmosphere با Google Gemini Flash API در 2 مرحله مستقل تعامل می‌کند تا ضبط‌های صوتی همهجانبه و منسجمی ایجاد کند.
مرحله 1: مهر زمانی
در ابتدا، Atmosphere با ضبط صدا به طور کامل ارائه می شود و وظیفه دارد مهرهای زمانی را در کتاب صوتی که مربوط به صحنه هایی است که با صدای محیط بهبود می یابد، تعیین کند. جمینی علاوه بر ارائه مهر زمانی این صحنه‌ها، توصیف مختصری از زمینه صحنه و کلمات کلیدی برجسته از صحنه که لحن کلی بخش را می‌سازد، تولید می‌کند.
مرحله 2: نقشه برداری
با استفاده از کلمات کلیدی جمع‌آوری‌شده برای هر صحنه شناسایی‌شده توسط Gemini، Atmosphere بیش از 33000 جلوه صوتی و کلیدواژه‌های مرتبط با آن‌ها را در کتابخانه جلوه‌های صوتی BBC بررسی می‌کند و همه صداها را با حداقل یک کلمه کلیدی مطابق با صحنه به دست می‌آورد. با تمام جلوه‌های صوتی که حداقل یک کلمه کلیدی منطبق را در یک فهرست جمع‌آوری کرده‌اند، از Gemini خواسته می‌شود تا صدایی را از لیست انتخاب کند که به بهترین وجه با توصیف صحنه ایجاد شده توسط Gemini در مرحله 1 مطابقت دارد.
مرحله 3: پوشش
هنگامی که همه صداها برای هر صحنه انتخاب شدند، اتمسفر عادی می شود، محو می شود، و سپس جلوه های صوتی انتخاب شده را روی بخش های کتاب صوتی مربوطه می پوشاند.

ساخته شده با

  • وب/کروم

تیم

توسط

پل بوکلمن، ساویر رایس، روهان کوشی، نیک بل

از

ایالات متحده