Ngày 16 tháng 5 năm 2025
Volley Crafts Immersive Voice-AI Dungeon Adventures with Gemini 2.5 and Veo 2

Volley Crafts Immersive Voice-AI Dungeon Adventures with Gemini 2.5 and Veo 2
Dựa trên nguyên mẫu "20 câu hỏi" thành công nhờ Gemini 2.0 Flash, Volley một lần nữa mở rộng giới hạn của hoạt động giải trí bằng âm thanh mang tính tương tác bằng cách phát triển một trò chơi khám phá hầm ngục bằng AI giọng nói độc đáo. Dự án mới này cho thấy cách Gemini 2.0 Flash tạo hình ảnh và Veo 2 tạo ra hình ảnh tuyệt đẹp trong trò chơi, trong khi khả năng lập trình của Gemini 2.5 Pro Preview đang cách mạng hoá chính quy trình phát triển trò chơi, mang đến một cuộc phiêu lưu sống động chưa từng có.
Từ phiên hỏi đáp nhanh đến cuộc phiêu lưu trực quan, phong phú
Volley đã thu hút hàng triệu người chơi bằng các trò chơi dựa trên giọng nói. Nguyên mẫu ban đầu "20 câu hỏi" của họ đã cho thấy tiềm năng của Gemini 2.5 Pro trong việc đưa ra câu trả lời cực nhanh và tạo ra cuộc trò chuyện qua lại hấp dẫn. Giờ đây, Volley đang nâng cao trải nghiệm khám phá hầm ngục linh hoạt bằng cách khai thác một bộ tính năng mạnh mẽ của Gemini 2.5 Pro Preview và mô hình tạo video Veo 2 của Google. Mục tiêu: một cuộc phiêu lưu ưu tiên âm thanh, trong đó mọi nhân vật tương tác đều do AI tạo ra, tạo ra hình ảnh phong phú trong trò chơi một cách linh hoạt.
Tạo ra một thế giới mới cho lối chơi điều khiển bằng giọng nói
Nguyên mẫu đầy tham vọng này tận dụng những tiến bộ cụ thể của mô hình Gemini và Veo 2:
- Ý tưởng về nhân vật dựa trên AI bằng Imagen 3: Cartwheel tích hợp các tính năng chuyển văn bản sang hình ảnh của Imagen 3, cho phép nhà sáng tạo sử dụng câu lệnh văn bản để lên ý tưởng và tạo hình ảnh nhân vật độc đáo ngay trong nền tảng. Bạn có thể tạo hiệu ứng cho những nhân vật được thiết kế riêng này bằng ngôn ngữ tự nhiên, sau đó xuất nhân vật đã được trang bị đầy đủ và sẵn sàng cho phần mềm chỉnh sửa 3D theo tiêu chuẩn ngành như Maya hoặc Blender, cho phép tích hợp vào môi trường sản xuất chuyên nghiệp.
-
Hỗ trợ hoạt động Nghiên cứu và phát triển (R&D) và Tối ưu hoá bằng Gemini 2.5 Pro Preview: Nhóm Cartwheel sử dụng Gemini 2.5 Pro Preview nội bộ để hỗ trợ quy trình kỹ thuật và nghiên cứu:
- Tạo hình ảnh động về trò chơi bằng Gemini 2.0 Flash và Veo 2: Để bổ sung cho trải nghiệm ưu tiên giọng nói, Volley đang khai thác khả năng tạo hình ảnh của Gemini 2.0 Flash và sức mạnh của Veo 2 để tạo ra một khía cạnh hình ảnh sống động. Các trường hợp sử dụng bao gồm tạo bản phác thảo ý tưởng, hình ảnh nhân vật, hình ảnh cài đặt cảnh linh hoạt cho các địa điểm và sự kiện chính, cũng như hình ảnh cho các vật phẩm và môi trường trong trò chơi, tất cả đều được thiết kế để tăng mức độ nhập vai của người chơi.
- Khai thác Gemini 2.5 Pro Preview làm công cụ phát triển trò chơi: Volley đang sử dụng khả năng suy luận và lập trình nâng cao của Gemini 2.5 Pro Preview để đơn giản hoá và nâng cao quy trình phát triển. Điều này bao gồm việc đẩy nhanh quá trình viết và gỡ lỗi logic trò chơi và hệ thống nhiệm vụ, nhanh chóng tạo nguyên mẫu cơ chế trò chơi mới và hỗ trợ tạo nội dung cốt truyện cơ bản, các điểm cốt truyện và câu chuyện nền của nhân vật để nhóm phát triển có thể dựa vào đó để xây dựng.
Phát triển trò chơi nhập vai ưu tiên giọng nói
Nguyên mẫu trò chơi khám phá hầm ngục mới này thể hiện tầm nhìn của Volley về những trò chơi dễ tiếp cận và có độ chân thực cao bằng cách tận dụng AI. Dự án này hướng đến việc tận dụng những điểm mạnh được xác định trong nguyên mẫu "20 câu hỏi" (một luồng hội thoại nhanh chóng, giàu cảm xúc và tự nhiên) và áp dụng những điểm mạnh đó trong một cuộc phiêu lưu phức tạp hơn và có hình ảnh sống động hơn.
Bằng cách sử dụng tính năng tạo hình ảnh Gemini 2.0 Flash và Veo 2 cho hình ảnh, cũng như Gemini 2.5 Pro (bản dùng thử) để hỗ trợ quá trình phát triển, Volley đang hướng đến một trò chơi mà tương tác bằng giọng nói sẽ dẫn dắt câu chuyện, được bổ sung bằng hình ảnh phong phú.
Như Max Child, Đồng sáng lập và Giám đốc điều hành của Volley từng tuyên bố (và điều này càng phù hợp hơn với nỗ lực mới này): "LLM và công nghệ nhận dạng giọng nói đang biến đổi trò chơi, mang đến sức sống cho hoạt động chơi thông qua trải nghiệm năng động và mang tính tương tác. Những công cụ này giúp người chơi đắm chìm trong những cuộc phiêu lưu sống động và hấp dẫn, nơi giọng nói của họ thực sự dẫn dắt câu chuyện." Trò chơi khám phá hầm ngục này, với những sáng tạo được hỗ trợ bởi AI, là một biểu hiện trực tiếp của tầm nhìn đó, hứa hẹn mang đến một trò chơi mà mọi lời nói đều định hình con đường phía trước.
Làm quen với Gemini API: Tạo nên hành trình phiêu lưu của riêng bạn
Công việc tiên phong của Volley cho thấy tiềm năng của các mô hình AI của Google trong việc tạo ra thế hệ trải nghiệm chơi trò chơi mới mẻ và hấp dẫn. Các nhà phát triển có thể khai thác sức mạnh của tính năng tạo hình ảnh của Gemini 2.0 Flash, Veo 2 để tạo video và hình ảnh tuyệt đẹp, cũng như Gemini 2.5 Pro Preview để hỗ trợ viết mã và tạo nội dung nâng cao, nhằm xây dựng thế giới tương tác của riêng họ.
Bạn đã sẵn sàng xây dựng? Khám phá tài liệu về Gemini API và bắt đầu sử dụng Google AI Studio ngay hôm nay.
Volley là một thành viên của Quỹ AI cho tương lai của Google. Quỹ này đầu tư và hợp tác với những công ty khởi nghiệp đầy tham vọng đang xây dựng những sản phẩm AI của tương lai.