雰囲気

没入感のあるオーディオブック生成ツール

機能

Atmosphere は、Google Gemini Flash API と 2 つの独立したステップでやり取りし、没入感のあるまとまりのある音声録音を生成します。
ステップ 1: タイムスタンプ
最初に、Atmosphere には音声録音全体が提供され、アンビエント音声で強化されるシーンに対応するタイムスタンプをオーディオブック内で特定します。Gemini は、これらのシーンのタイムスタンプを提供するだけでなく、シーンのコンテキストの簡潔な説明と、シーンから抽出したセグメントの全体的なトーンを構成する重要なキーワードも生成します。
ステップ 2: マッピング
Gemini によって識別された各シーンについて収集されたキーワードを使用して、Atmosphere は BBC サウンドエフェクト ライブラリ内の 3 万を超えるサウンドエフェクトとそれらに関連付けられたキーワードを精査し、シーンのキーワードと一致するキーワードが 1 つ以上含まれるすべてのサウンドを取得します。すべての効果音が 1 つ以上の一致するキーワードとともにリストにコンパイルされると、Gemini は、ステップ 1 で作成したシーンの説明に最もよく一致する効果音をリストから選択するよう求めるメッセージが表示されます。
ステップ 3: オーバーレイ
各シーンのすべての音声が選択されると、Atmosphere は、選択した効果音を、対応するオーディオブック セグメントに正規化、フェード、トリミング、オーバーレイします。

構成

  • ウェブ/Chrome

チーム

By

Paul Bokelman、Sawyer Rice、Rohan Koshy、Nik Belle

From

米国