Suasana

Generator buku audio imersif

Fungsinya

Atmosphere berinteraksi dengan Google Gemini Flash API dalam 2 langkah independen untuk menghasilkan rekaman audio yang imersif dan kohesif.
Langkah 1: Stempel waktu
Awalnya, Atmosphere diberi rekaman audio secara keseluruhan, dan ditugaskan untuk menemukan stempel waktu dalam buku audio yang sesuai dengan adegan yang akan ditingkatkan oleh audio ambient. Selain memberikan stempel waktu untuk adegan ini, Gemini juga menghasilkan deskripsi ringkas tentang konteks adegan, dan kata kunci yang jelas dari adegan yang membentuk keseluruhan nuansa segmen.
Langkah 2: Pemetaan
Dengan menggunakan kata kunci yang dikumpulkan untuk setiap adegan yang diidentifikasi oleh Gemini, Atmosphere menyaring lebih dari 33.000 efek suara dan kata kunci terkait di library efek suara BBC, dan memperoleh semua suara dengan setidaknya satu kata kunci yang cocok dengan kata kunci adegan. Dengan semua efek suara minimal satu kata kunci yang cocok yang dikompilasi ke dalam daftar, Gemini akan diminta untuk memilih suara dari daftar yang paling cocok dengan deskripsi scene yang dibuat oleh Gemini pada langkah 1.
Langkah 3: Overlay
Setelah semua suara dipilih untuk setiap scene, Atmosphere akan menormalisasi, memudar, memangkas, lalu menempatkan efek suara yang dipilih ke segmen buku audio yang sesuai.

Dibuat dengan

  • Web/Chrome

Tim

Oleh

Paul Bokelman, Sawyer Rice, Rohan Koshy, Nik Belle

From

Amerika Serikat