แชร์

11 ธ.ค. 2024

Volley สร้างต้นแบบเกมที่เน้นเสียงเป็นหลักด้วย Gemini 2.0 Flash และ Multimodal Live API

Max Child

Volley

Vishal Dharmadhikari

วิศวกรโซลูชันผลิตภัณฑ์

ฮีโร่ของโชว์เคส Volley

Gemini API ช่วยให้นักพัฒนาแอปสร้างประสบการณ์ที่สมจริงรุ่นใหม่ได้ และ Volley ก็เป็นผู้นำในโลกของเกม AI ที่ควบคุมด้วยเสียง Volley เป็นที่รู้จักจากเกมยอดนิยมอย่าง Jeopardy! และ Song Quiz โดยใช้ประโยชน์จากความสามารถล้ำสมัยของ Gemini 2.0 Flash ซึ่งปัจจุบันอยู่ในเวอร์ชันทดลอง เพื่อสร้างต้นแบบเกม 20 คำถามในรูปแบบใหม่ที่เน้นเสียงเป็นอันดับแรก

Volley ได้ดึงดูดผู้คนนับล้านด้วยเกมที่น่าสนใจซึ่งสั่งงานด้วยเสียงบนสมาร์ททีวี, Amazon Alexa, Google Assistant และแพลตฟอร์มอุปกรณ์เคลื่อนที่ ตอนนี้พวกเขากำลังมองหาพรมแดนใหม่ นั่นคือการเปลี่ยนโฉมหน้าเกมแบบสบายๆ ด้วยพลังของความสามารถแบบเรียลไทม์และมัลติโมดัลของ Generative AI โดยเริ่มจากเกม 20 คำถาม

Gemini 2.0 Flash: กุญแจสำคัญในการเล่นเกมด้วยเสียงที่สมจริง

ต้นแบบเกม 20 คำถามใหม่ของ Volley ใช้ฟีเจอร์หลักของ Gemini 2.0 Flash เพื่อสร้างประสบการณ์การใช้งานที่ไม่เหมือนใครอย่างแท้จริง ซึ่งเหนือกว่าความสามารถด้าน AI ปัจจุบันของเกม แม้ว่าเกมคลาสสิกจะมีเนื้อหาแบบไดนามิกที่สร้างขึ้นแบบเรียลไทม์ แต่ Gemini 2.0 Flash จะเปลี่ยนเกมให้กลายเป็นสิ่งที่ไม่ธรรมดา โดยจะให้คำตอบที่รวดเร็วราวกับสายฟ้า บุคลิกใหม่ที่แสดงอารมณ์ และการสนทนาที่ให้ความรู้สึกเหมือนมนุษย์อย่างน่าทึ่ง

ต้นแบบของเกม 20 คำถามของ Volley: เกมแรกๆ ที่ขับเคลื่อนโดย Gemini 2.0 Flash และ Multimodal Live API (ลำดับสั้นลง)

Gemini 2.0 Flash ช่วยคุณได้ดังนี้

  • การสร้างคำถามและคำตอบแบบไดนามิกที่มีเวลาในการตอบสนองต่ำ: เอาต์พุตเสียงดั้งเดิมของ Gemini 2.0 Flash และการโต้ตอบที่มีเวลาในการตอบสนองต่ำซึ่งปลดล็อกโดย Multimodal Live API ใหม่ช่วยให้สนทนาแบบไดนามิกกับ AI Riddlemaster ได้ ต้นแบบนี้ช่วยให้คุณสนทนากับ Riddlemaster ได้อย่างเป็นธรรมชาติและโต้ตอบกันไปมา ไม่ว่าจะเป็นการถามคำถาม รับคำใบ้ และอื่นๆ การผสมผสานความสามารถของโมเดลและหน่วยความจำบริบทแบบยาวช่วยให้มั่นใจได้ถึงประสบการณ์การใช้งานที่ปรับเปลี่ยนในแบบของคุณซึ่งพัฒนาแบบเรียลไทม์ตามการโต้ตอบของผู้เล่น เวลาในการตอบสนองที่ต่ำกว่า 1 วินาทีช่วยให้การสนทนาเป็นธรรมชาติและคล้ายกับมนุษย์อย่างแท้จริง

  • การตรวจหาการพูด: ความสามารถในตัวของ API ที่อนุญาตให้มีการขัดจังหวะด้วยเสียงที่เป็นธรรมชาติในการตอบกลับของโมเดลช่วยให้การสนทนาเป็นไปอย่างราบรื่นและเข้าถึงได้โดยไม่ต้องใช้ข้อมูลภาพหรือการสัมผัส

อนาคตของการเล่นเกมแบบสั่งงานด้วยเสียง: ขับเคลื่อนโดย Gemini

Volley มองเห็นอนาคตที่ AI สั่งงานด้วยเสียงเป็นหัวใจสำคัญของการเล่นเกม ซึ่งจะสร้างประสบการณ์ที่ทุกคนเข้าถึงได้และสมจริง ความมุ่งมั่นของบริษัทในการสร้างสรรค์นวัตกรรม AI ทำให้บริษัทเป็นผู้นำในขอบเขตใหม่ที่น่าตื่นเต้นนี้ Max Child ผู้ร่วมก่อตั้งและซีอีโออธิบายว่า "LLM และเทคโนโลยีการจดจำเสียงกำลังเปลี่ยนโฉมหน้าของเกม โดยมอบชีวิตชีวาให้กับการเล่นผ่านประสบการณ์แบบอินเทอร์แอกทีฟแบบไดนามิก ซึ่งจะช่วยให้ผู้เล่นได้ดื่มด่ำไปกับการผจญภัยที่สนุกสนานและน่าติดตาม ซึ่งเสียงของผู้เล่นจะขับเคลื่อนเรื่องราวอย่างแท้จริง"

เกม 20 คำถามใหม่ล่าสุดของ Volley ซึ่งขับเคลื่อนโดย Multimodal Live API ของ Gemini 2.0 Flash ยังอยู่ในขั้นตอนการสร้างต้นแบบ โปรดติดตามข้อมูลเพิ่มเติมเร็วๆ นี้

เริ่มต้นใช้งาน Gemini API: สร้างโลกแบบอินเทอร์แอกทีฟของคุณเอง

การทำงานของ Volley ร่วมกับ Gemini 2.0 Flash และ Multimodal Live API แสดงให้เห็นถึงความเป็นไปได้ที่น่าตื่นเต้นของ AI ในการเล่นเกม โดยเฉพาะอย่างยิ่งศักยภาพในการเล่นเกมแบบไดนามิก ตัวละครที่สมจริง และการสนทนาที่ฟังเป็นธรรมชาติ ในฐานะนักพัฒนาเกม คุณสามารถใช้ประโยชน์จาก Gemini API เพื่อสร้างประสบการณ์ที่สมจริงและสร้างสรรค์ในลักษณะเดียวกันได้

ดูเอกสารประกอบของ Gemini API และค้นพบว่าความสามารถของ API นี้จะช่วยให้คุณสร้างเกมรุ่นถัดไปที่น่าสนใจและครอบคลุมได้อย่างไร