Google uses AI technology to translate content into your preferred language. AI translations can contain errors.
语音描述生成器
只需几分钟,即可为 YouTube 视频创建描述性音轨。
作用
语音描述生成器应用是一款工具,可让您在几分钟内为 YouTube 短视频创建描述性音轨。获得 YouTube 链接后,应用会提取视频、标题和说明。然后,它会开始将视频拆分成较小的片段。这些数据块以及 YouTube 数据首先会用于使用 Gemini 创建“上下文文件”,这会作为第一轮来检测一般详细信息并识别任何字符。然后,系统会使用每个分块制作“响度文件”(用于测量每个时间间隔的音量)和“转写内容”(使用 Gemini 制作,用于列出视频中的对话内容以及时间戳)。然后,系统会再次将所有这些信息馈送给 Gemini,以创建包含时间戳的观察“脚本”。然后,这些脚本会通过 Google Cloud 的文字转语音功能处理,生成的音频会重新拼接在一起,最终结果会呈现给用户。
[[["易于理解","easyToUnderstand","thumb-up"],["解决了我的问题","solvedMyProblem","thumb-up"],["其他","otherUp","thumb-up"]],[["没有我需要的信息","missingTheInformationINeed","thumb-down"],["太复杂/步骤太多","tooComplicatedTooManySteps","thumb-down"],["内容需要更新","outOfDate","thumb-down"],["翻译问题","translationIssue","thumb-down"],["示例/代码问题","samplesCodeIssue","thumb-down"],["其他","otherDown","thumb-down"]],[],[],[]]