Trình tạo nội dung mô tả bằng âm thanh

Tạo bản âm thanh mô tả cho video trên YouTube chỉ trong vài phút.

Ý nghĩa

Ứng dụng Trình tạo bản mô tả bằng âm thanh là một công cụ giúp tạo bản âm thanh mô tả cho video ngắn trên YouTube chỉ trong vài phút. Sau khi nhận được đường liên kết đến YouTube, ứng dụng sẽ tìm nạp video, tiêu đề và nội dung mô tả. Sau đó, công cụ này bắt đầu bằng cách chia video thành các đoạn nhỏ hơn. Trước tiên, các đoạn này (cùng với dữ liệu YouTube) được dùng để tạo "tệp ngữ cảnh" bằng Gemini. Đây là bước đầu tiên để phát hiện thông tin chung và xác định mọi ký tự. Sau đó, mỗi đoạn được dùng để tạo một "tệp âm lượng" đo lường âm lượng tại mỗi khoảng thời gian và một "bản chép lời" (sử dụng Gemini) liệt kê lời thoại trong video kèm theo dấu thời gian. Sau đó, tất cả thông tin này được cung cấp lại cho Gemini để tạo một "kịch bản" quan sát có dấu thời gian. Sau đó, các tập lệnh này được đưa vào tính năng Văn bản sang lời nói của Google Cloud, âm thanh thu được sẽ được ghép lại với nhau và kết quả cuối cùng sẽ được trình bày cho người dùng.

Được tạo bằng

  • Web/Chrome
  • Google Cloud: Chuyển văn bản sang lời nói

Nhóm

Người cập nhật

Ryan Baumgart

Từ

Canada