NGÀY 11 THÁNG 12 NĂM 2024
Volley tạo bản nguyên mẫu cho một trò chơi ưu tiên âm thanh bằng Gemini 2.0 Flash và API Trực tiếp đa phương thức
API Gemini giúp nhà phát triển xây dựng các trải nghiệm sống động thế hệ mới, còn Volley đang dẫn đầu trong thế giới trò chơi AI điều khiển bằng giọng nói. Được biết đến với các trò chơi ăn khách như Jeopardy! và Song Quiz, Volley đang tận dụng các tính năng tiên tiến của Gemini 2.0 Flash (hiện đang ở giai đoạn thử nghiệm) để tạo bản nguyên mẫu cho một phiên bản mới của trò chơi kinh điển 20 Questions, trong đó âm thanh được đặt lên hàng đầu.
Volley đã thu hút hàng triệu người chơi bằng các trò chơi hấp dẫn sử dụng giọng nói trên TV thông minh, Amazon Alexa, Trợ lý Google và các nền tảng di động. Giờ đây, họ đang hướng đến một lĩnh vực mới: biến đổi trò chơi giải trí thông thường bằng sức mạnh của các tính năng đa phương thức, trực tiếp của AI tạo sinh — bắt đầu bằng 20 Câu hỏi.
Gemini 2.0 Flash: Chìa khoá để chơi trò chơi bằng giọng nói sống động
Nguyên mẫu 20 câu hỏi mới của Volley sử dụng các tính năng chính của Gemini 2.0 Flash để tạo ra trải nghiệm thực sự độc đáo, vượt xa khả năng AI hiện tại của trò chơi. Mặc dù trò chơi cổ điển có nội dung động được tạo nhanh chóng, nhưng Gemini 2.0 Flash đã biến nó thành một thứ phi thường – mang đến những câu trả lời nhanh như chớp, tính cách mới đầy cảm xúc và luồng trò chuyện mang đậm chất con người.
Sau đây là những lợi ích của Gemini 2.0 Flash:
Tạo câu hỏi và câu trả lời động có độ trễ thấp: Đầu ra âm thanh gốc của Gemini 2.0 Flash và các lượt tương tác có độ trễ thấp được mở khoá bằng API Trực tiếp đa phương thức mới cho phép các cuộc trò chuyện động với một AI Riddlemaster. Nguyên mẫu này cho phép trò chuyện tự nhiên, qua lại với Riddlemaster: đặt câu hỏi, nhận gợi ý và làm nhiều việc khác. Việc kết hợp trí tuệ mô hình và bộ nhớ ngữ cảnh dài hạn đảm bảo trải nghiệm được cá nhân hoá phát triển theo thời gian thực, dựa trên các hoạt động tương tác của người chơi. Độ trễ dưới một giây giúp cuộc trò chuyện diễn ra tự nhiên như khi con người trò chuyện với nhau.
Phát hiện hoạt động bằng giọng nói: Khả năng tích hợp của API cho phép ngắt lời tự nhiên bằng giọng nói vào câu trả lời của mô hình, giúp cuộc trò chuyện diễn ra suôn sẻ và dễ tiếp cận mà không cần nhập liệu bằng hình ảnh hoặc xúc giác.
Tương lai của trò chơi ưu tiên giọng nói: Dùng công nghệ của Gemini
Volley hình dung một tương lai mà AI thoại là yếu tố cốt lõi của lối chơi, tạo ra trải nghiệm dễ tiếp cận và sống động cho mọi người. Cam kết của công ty đối với việc đổi mới AI đã giúp họ trở thành một trong những công ty tiên phong trong lĩnh vực mới mẻ và đầy thú vị này. Max Child, đồng sáng lập kiêm Giám đốc điều hành của Gemini, giải thích: "LLM và công nghệ nhận dạng giọng nói đang biến đổi trò chơi, thổi hồn vào trò chơi thông qua trải nghiệm tương tác, linh động. Nhờ đó, người chơi có thể đắm mình vào những cuộc phiêu lưu sống động, hấp dẫn, trong đó giọng nói của họ thực sự là yếu tố thúc đẩy câu chuyện".
Trò chơi 20 câu hỏi mới nhất của Volley, được cung cấp bởi API Trực tiếp đa phương thức của Gemini 2.0 Flash, vẫn đang trong giai đoạn tạo nguyên mẫu, nhưng hãy chú ý theo dõi để biết thêm thông tin sớm.
Bắt đầu sử dụng Gemini API: Tạo thế giới tương tác của riêng bạn
Công việc của Volley với Gemini 2.0 Flash và API Trực tiếp đa phương thức cho thấy những khả năng thú vị của AI trong trò chơi, đặc biệt là tiềm năng cho lối chơi linh động, nhân vật sống động và cuộc trò chuyện tự nhiên. Là nhà phát triển trò chơi, bạn có thể khai thác sức mạnh của Gemini API để tạo ra những trải nghiệm sống động và sáng tạo tương tự.
Khám phá tài liệu về API Gemini và tìm hiểu cách các tính năng của API này có thể giúp bạn xây dựng các trò chơi hấp dẫn và phù hợp với mọi người ở thế hệ tiếp theo.