Hỗn hợp

Đài phát dựa trên AI được cá nhân hoá

Ý nghĩa

Chúng tôi phát triển một ứng dụng phát thanh có thể lắng nghe người dùng, hiểu được yêu cầu của họ. Đồng thời, với sự trợ giúp của NLP, mô hình ngôn ngữ lớn của Gemini (LLM) và thuật toán đề xuất bài hát, chúng tôi tạo ra trải nghiệm nghe đài phát thanh được cá nhân hoá và điều chỉnh cho phù hợp với họ.

Chúng tôi đã dùng Flutter để phát triển ứng dụng dành cho người dùng, ứng dụng này giao tiếp với một máy chủ được phát triển bằng Express. Máy chủ Express này chịu trách nhiệm nhận lời nhắc, tạo mã thông báo, tạo ra một hỗn hợp được cá nhân hoá và giao đến người dùng một cách kịp thời. Máy chủ Express giao tiếp với một máy chủ khác được phát triển bằng Flask. Dịch vụ vi mô Flask xử lý việc thu thập dữ liệu, tạo tập lệnh cho các đường liên kết bằng Gemini, đồng thời nhân bản tập lệnh bằng Eleven Labs TTS. Cả hai máy chủ đều dùng chung một cơ sở dữ liệu MongoDB.

Gemini sử dụng dữ liệu cóp nhặt và một vài thông số khác, chẳng hạn như thời gian trong ngày và tâm trạng, để tạo một tập lệnh cho đường liên kết mà RJ sẽ dùng. Sau đó, tập lệnh này được gửi đến API TTS của Eleven Labs để tạo dữ liệu thanh toán. Dữ liệu giọng nói được xử lý để tạo ra một đường liên kết cuối cùng được điều chỉnh riêng cho người dùng.

Được tạo bằng

  • Lật úp

Nhóm

Người cập nhật

NaCl

Từ

Ấn Độ