به اشتراک بگذارید

11 دسامبر 2024

Volley اولین بازی صوتی را با Gemini 2.0 Flash و Multimodal Live API ساخت

مکس کودک

رگبار

ویشال دارمادیکاری

مهندس راه حل های محصول

قهرمان ویترین رگبار

Gemini API به توسعه‌دهندگان قدرت می‌دهد تا نسل بعدی تجربیات همهجانبه را بسازند و Volley در دنیای بازی‌های هوش مصنوعی با کنترل صدا پیشرو است. شناخته شده برای بازی های موفق خود مانند Jeopardy! و Song Quiz ، Volley از قابلیت‌های پیشرفته Gemini 2.0 Flash استفاده می‌کند، که در حال حاضر در پیش‌نمایش آزمایشی قرار دارد، تا نمونه اولیه یک پیچ صوتی جدید را در بازی کلاسیک، 20 Question بسازد.

Volley میلیون‌ها نفر را با بازی‌های صوتی جذاب در تلویزیون‌های هوشمند، آمازون الکسا، دستیار گوگل و پلتفرم‌های تلفن همراه مجذوب خود کرده است. اکنون، آن‌ها چشم‌انداز خود را روی مرز جدیدی قرار داده‌اند: تغییر بازی‌های معمولی با قدرت قابلیت‌های زنده و چندوجهی هوش مصنوعی – با ۲۰ سوال شروع می‌شود.

Gemini 2.0 Flash: The Key to Immersive Voice Gameplay

نمونه اولیه 20 سوال جدید Volley از ویژگی های کلیدی Gemini 2.0 Flash استفاده می کند تا تجربه ای واقعا منحصر به فرد ایجاد کند که فراتر از قابلیت های هوش مصنوعی فعلی بازی است. در حالی که بازی کلاسیک دارای محتوای پویا تولید شده در پرواز است، Gemini 2.0 Flash آن را به چیزی خارق‌العاده تبدیل می‌کند - پاسخ‌های سریع برق آسا، شخصیت‌های جدید احساس‌کننده، و جریان مکالمه‌ای که به‌طور قابل‌توجهی احساس انسان می‌کند.

نمونه اولیه 20 سوال Volley: یکی از اولین بازی هایی که توسط Gemini 2.0 Flash و Multimodal Live API (توالی کوتاه شده) طراحی شده است.

در اینجا نحوه کمک Gemini 2.0 Flash آمده است:

  • تولید پرسش و پاسخ پویا با تأخیر کم: خروجی صدای بومی Gemini 2.0 Flash و تعاملات با تأخیر کم که توسط Multimodal Live API جدید باز شده است، مکالمات پویا را با یک AI Riddlemaster فعال می کند. نمونه اولیه یک مکالمه طبیعی و پشت سر هم با Riddlemaster را امکان پذیر می کند: پرسیدن سؤال، دریافت نکات و موارد دیگر. ترکیبی از هوش مدل و حافظه با زمینه طولانی، تجربه‌های شخصی‌سازی‌شده را تضمین می‌کند که در زمان واقعی، بر اساس تعاملات بازیکن، تکامل می‌یابند. تأخیر فرعی یک مکالمه واقعاً طبیعی شبیه انسان را امکان پذیر می کند.

  • تشخیص فعالیت صوتی: توانایی داخلی API برای ایجاد وقفه های صوتی طبیعی در پاسخ های مدل، مکالمات روان و قابل دسترس را بدون نیاز به ورودی بصری یا لمسی امکان پذیر می کند.

The Future of Voice-First Gaming: پشتیبانی شده توسط Gemini

Volley آینده‌ای را متصور است که در آن هوش مصنوعی صوتی در مرکز گیم‌پلی قرار دارد و تجربه‌های قابل دسترس و همه جانبه‌ای را برای همه ایجاد می‌کند. تعهد این شرکت به نوآوری هوش مصنوعی، آنها را در خط مقدم این مرز هیجان انگیز جدید قرار می دهد. همانطور که یکی از بنیانگذاران و مدیر عامل شرکت Max Child توضیح می دهد، "LLM ها و فناوری تشخیص صدا بازی ها را تغییر می دهند، زندگی را از طریق تجربیات پویا و تعاملی به بازی می بخشند. آنها بازیکنان را قادر می سازند تا خود را در ماجراجویی های پر جنب و جوش و جذاب غوطه ور کنند، جایی که صدای آنها واقعاً داستان را هدایت می کند."

جدیدترین بازی Volley 20 Questions که توسط API چندوجهی زنده Gemini 2.0 Flash ارائه شده است، هنوز در مرحله نمونه سازی است، اما برای اطلاعات بیشتر به زودی با ما همراه باشید.

شروع به کار با Gemini API: جهان های تعاملی خود را بسازید

کار Volley با Gemini 2.0 Flash و Multimodal Live API امکانات هیجان انگیز هوش مصنوعی را در بازی به نمایش می گذارد، به ویژه پتانسیل بازی پویا، شخصیت های واقعی و مکالمات با صدای طبیعی. به‌عنوان یک توسعه‌دهنده بازی، می‌توانید از قدرت Gemini API برای ایجاد تجربیات فراگیر و خلاقانه استفاده کنید.

اسناد Gemini API را کاوش کنید و کشف کنید که چگونه قابلیت‌های آن می‌تواند شما را برای ساختن نسل بعدی بازی‌های جذاب و فراگیر توانمند کند.

تکان دادن

آزمایش Gemini 2.0 برای ایجاد شخصیت‌های مجازی و روایت صوتی برای پلتفرم ویدیویی مجهز به هوش مصنوعی