Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

音声による説明生成ツール

YouTube 動画の説明音声トラックを数分で作成できます。

機能

音声による説明生成アプリは、YouTube のショート動画の音声による説明トラックを数分で作成するためのツールです。YouTube リンクを指定すると、アプリは動画、タイトル、説明を取得します。まず、動画を小さなチャンクに分割します。これらのチャンクは、YouTube データとともに、まず Gemini を使用して「コンテキストファイル」を作成するために使用されます。これは、一般的な詳細を検出して文字を識別する最初のパスとして機能します。その後、各チャンクを使用して、各間隔で音量を測定する「ラウドネスファイル」と、動画の台詞をタイムスタンプ付きでリストする「文字起こし」（Gemini を使用）を作成します。これらの情報はすべて Gemini に再度フィードされ、タイムスタンプ付きの観測の「スクリプト」が作成されます。これらのスクリプトは Google Cloud の Text-to-Speech に送られ、生成された音声がつなぎ合わされて、最終的な結果がユーザーに表示されます。

構成

ウェブ/Chrome
Google Cloud: Text-to-Speech

チーム

Ryan Baumgart

差出人

カナダ