Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

语音描述生成器

只需几分钟，即可为 YouTube 视频创建描述性音轨。

作用

语音描述生成器应用是一款工具，可让您在几分钟内为 YouTube 短视频创建描述性音轨。获得 YouTube 链接后，应用会提取视频、标题和说明。然后，它会开始将视频拆分成较小的片段。这些数据块以及 YouTube 数据首先会用于使用 Gemini 创建“上下文文件”，这会作为第一轮来检测一般详细信息并识别任何字符。然后，系统会使用每个分块制作“响度文件”（用于测量每个时间间隔的音量）和“转写内容”（使用 Gemini 制作，用于列出视频中的对话内容以及时间戳）。然后，系统会再次将所有这些信息馈送给 Gemini，以创建包含时间戳的观察“脚本”。然后，这些脚本会通过 Google Cloud 的文字转语音功能处理，生成的音频会重新拼接在一起，最终结果会呈现给用户。

可采用以下设备打造

Web/Chrome
Google Cloud：文本转语音

团队

更新者

Ryan Baumgart

发件人

加拿大