اشتراک گذاری

۱۶ مه ۲۰۲۵

والی با Gemini 2.5 و Veo 2 ماجراجویی‌های سیاه‌چاله فراگیر با هوش مصنوعی و صدا را خلق می‌کند

مکس چایلد

والی

دیوید بنجامین

عملیات

ویشال دارمادیکاری

توسعه‌دهنده هوش مصنوعی

قهرمان نمایشی والیبال

والی با Gemini 2.5 و Veo 2 ماجراجویی‌های سیاه‌چاله فراگیر با هوش مصنوعی و صدا را خلق می‌کند

والی با تکیه بر نمونه اولیه موفق "20 سوال" مبتنی بر Gemini 2.0 Flash ، بار دیگر با توسعه یک بازی جستجوی سیاه‌چال با هوش مصنوعی صوتی که در نوع خود بی‌نظیر است، مرزهای سرگرمی صوتی تعاملی را جابجا می‌کند. این سرمایه‌گذاری جدید نشان می‌دهد که چگونه تولید تصویر Gemini 2.0 Flash و Veo 2 در حال تولید تصاویر خیره‌کننده در بازی هستند، در حالی که قابلیت کدنویسی Gemini 2.5 Pro Preview در حال متحول کردن خود فرآیند توسعه بازی است و در یک ماجراجویی همه‌جانبه بی‌نظیر به اوج خود می‌رسد.

از پرسش و پاسخ سریع تا یک ماجراجویی غنی و بصری

والی (Valley) با بازی‌های صوتی خود میلیون‌ها نفر را مجذوب خود کرده است. نمونه اولیه "20 سوالی" آنها پتانسیل Gemini 2.5 Pro را برای پاسخ‌های سریع و دیالوگ‌های جذاب نشان داد. اکنون، والی با بهره‌گیری از مجموعه‌ای قدرتمند از ویژگی‌های پیش‌نمایش Gemini 2.5 Pro و مدل تولید ویدیوی Veo 2 گوگل، یک تجربه پویای پیمایش سیاه‌چال را ارتقا می‌دهد. هدف: یک ماجراجویی صوتی که در آن هر شخصیت تعاملی توسط هوش مصنوعی تولید می‌شود و به صورت پویا جلوه‌های بصری غنی در بازی ایجاد می‌کند.

ایجاد قلمرو جدیدی از گیم‌پلی با کنترل صوتی

این نمونه اولیه جاه‌طلبانه از بازی Dungeon crawler از پیشرفت‌های خاص مدل Gemini و Veo 2 بهره می‌برد:

  • طراحی شخصیت مبتنی بر هوش مصنوعی با Imagen 3: Cartwheel قابلیت‌های تبدیل متن به تصویر Imagen 3 را ادغام می‌کند و به سازندگان اجازه می‌دهد تا از پیام‌های متنی برای مفهوم‌سازی و تولید تصاویر منحصر به فرد شخصیت‌ها مستقیماً در داخل پلتفرم استفاده کنند. این شخصیت‌های سفارشی را می‌توان با استفاده از زبان طبیعی متحرک‌سازی کرد، سپس به طور کامل ریگ‌بندی شده و آماده برای نرم‌افزارهای ویرایش سه‌بعدی استاندارد صنعتی مانند Maya یا Blender صادر کرد و امکان ادغام در محیط‌های تولید حرفه‌ای را فراهم نمود.
  • کمک به تحقیق و توسعه و بهینه‌سازی با پیش‌نمایش Gemini 2.5 Pro: تیم Cartwheel از پیش‌نمایش Gemini 2.5 Pro به صورت داخلی برای پشتیبانی از گردش‌های کاری مهندسی و تحقیقاتی خود استفاده می‌کند:
    • تولید تصاویر پویای بازی با Gemini 2.0 Flash و Veo 2: برای تکمیل تجربه مبتنی بر صدا، Volley از تولید تصویر Gemini 2.0 Flash و قدرت Veo 2 برای ایجاد یک بُعد بصری پر جنب و جوش بهره می‌برد. موارد استفاده شامل تولید هنر مفهومی، تصاویر شخصیت، تصاویر پویای صحنه برای مکان‌ها و رویدادهای کلیدی و تصاویر برای آیتم‌ها و محیط‌های درون بازی است که همگی برای عمیق‌تر کردن غوطه‌وری بازیکن طراحی شده‌اند.
    • استفاده از پیش‌نمایش Gemini 2.5 Pro به عنوان ابزاری برای توسعه بازی: Volley از قابلیت‌های پیشرفته استدلال و کدنویسی Gemini 2.5 Pro Preview برای ساده‌سازی و بهبود فرآیند توسعه استفاده می‌کند. این شامل تسریع نوشتن و اشکال‌زدایی منطق بازی و سیستم‌های جستجو، نمونه‌سازی سریع مکانیک‌های جدید بازی و کمک به تولید محتوای روایی بنیادی، نقاط عطف داستان و پیش‌زمینه شخصیت‌ها برای تیم توسعه جهت توسعه بازی می‌شود.

بازی فراگیر و تکامل‌یافته با اولویت صدا

این نمونه اولیه جدید بازی Dungeon crawler، چشم‌انداز Volley برای بازی‌های قابل دسترس و عمیقاً فراگیر را با بهره‌گیری از هوش مصنوعی، مجسم می‌کند. هدف این پروژه استفاده از نقاط قوت شناسایی شده در نمونه اولیه «20 سوال» - یک جریان مکالمه سریع، احساسی و طبیعی - و به‌کارگیری آنها در یک ماجراجویی پیچیده‌تر و بصری بهبود یافته است.

با استفاده از تولید تصویر Gemini 2.0 Flash و Veo 2 برای جلوه‌های بصری، و Gemini 2.5 Pro Preview برای کمک به توسعه، Volley در حال کار بر روی بازی‌ای است که در آن تعامل صوتی، داستان را پیش می‌برد و با جلوه‌های بصری غنی تقویت می‌شود.

همانطور که مکس چایلد، یکی از بنیانگذاران و مدیرعامل والی، پیش از این گفته بود، و این گفته با این تلاش جدید حتی قوی‌تر هم می‌شود، «بازی‌های LLM و فناوری تشخیص صدا، بازی‌ها را متحول می‌کنند و از طریق تجربیات پویا و تعاملی، به بازی جان می‌بخشند. آن‌ها به بازیکنان این امکان را می‌دهند که خود را در ماجراجویی‌های پر جنب و جوش و جذابی غرق کنند که در آن صدایشان واقعاً داستان را پیش می‌برد.» این بازی سیاه‌چاله، با خلاقیت‌های مبتنی بر هوش مصنوعی خود، تجلی مستقیمی از آن دیدگاه است و نوید بازی‌ای را می‌دهد که در آن هر کلمه‌ی گفته شده، مسیر پیش رو را شکل می‌دهد.

شروع کار با رابط برنامه‌نویسی نرم‌افزار Gemini: ماجراجویی‌های خودتان را بسازید

کار پیشگامانه‌ی والی، پتانسیل مدل‌های هوش مصنوعی گوگل را برای خلق نسل بعدی تجربیات بازی نوآورانه و جذاب به نمایش می‌گذارد. توسعه‌دهندگان می‌توانند از قدرت تولید تصویر Gemini 2.0 Flash، Veo 2 برای تولید ویدیو و تصویر خیره‌کننده، و Gemini 2.5 Pro Preview برای کدنویسی پیشرفته و کمک به محتوا، برای ساخت دنیای تعاملی خود بهره ببرند.

آماده ساخت هستید؟ مستندات API Gemini را بررسی کنید و همین امروز با Google AI Studio شروع به کار کنید.

والی یکی از اعضای صندوق آینده هوش مصنوعی گوگل است که در استارت‌آپ‌های بلندپروازی که در حال ساخت آینده هوش مصنوعی هستند، سرمایه‌گذاری و با آنها همکاری می‌کند.

هوش مصنوعی بهینه

هوش مصنوعی بهینه (Optimal AI) با استفاده از رابط برنامه‌نویسی Gemini، زمان بررسی کد را تا 50 درصد کاهش می‌دهد.