语音描述生成器
只需几分钟,即可为 YouTube 视频创建描述性音轨。
作用
语音描述生成器应用是一款工具,可让您在几分钟内为 YouTube 短视频创建描述性音轨。获得 YouTube 链接后,应用会提取视频、标题和说明。然后,它会开始将视频拆分成较小的片段。这些数据块以及 YouTube 数据首先会用于使用 Gemini 创建“上下文文件”,这会作为第一轮来检测一般详细信息并识别任何字符。然后,系统会使用每个分块制作“响度文件”(用于测量每个时间间隔的音量)和“转写内容”(使用 Gemini 制作,用于列出视频中的对话内容以及时间戳)。然后,系统会再次将所有这些信息馈送给 Gemini,以创建包含时间戳的观察“脚本”。然后,这些脚本会通过 Google Cloud 的文字转语音功能处理,生成的音频会重新拼接在一起,最终结果会呈现给用户。
可采用以下设备打造
- Web/Chrome
- Google Cloud:文本转语音
团队
更新者
Ryan Baumgart
发件人
加拿大