۱۶ مه ۲۰۲۵
والی با Gemini 2.5 و Veo 2 ماجراجوییهای سیاهچاله فراگیر با هوش مصنوعی و صدا را خلق میکند

والی با Gemini 2.5 و Veo 2 ماجراجوییهای سیاهچاله فراگیر با هوش مصنوعی و صدا را خلق میکند
والی با تکیه بر نمونه اولیه موفق "20 سوال" مبتنی بر Gemini 2.0 Flash ، بار دیگر با توسعه یک بازی جستجوی سیاهچال با هوش مصنوعی صوتی که در نوع خود بینظیر است، مرزهای سرگرمی صوتی تعاملی را جابجا میکند. این سرمایهگذاری جدید نشان میدهد که چگونه تولید تصویر Gemini 2.0 Flash و Veo 2 در حال تولید تصاویر خیرهکننده در بازی هستند، در حالی که قابلیت کدنویسی Gemini 2.5 Pro Preview در حال متحول کردن خود فرآیند توسعه بازی است و در یک ماجراجویی همهجانبه بینظیر به اوج خود میرسد.
از پرسش و پاسخ سریع تا یک ماجراجویی غنی و بصری
والی (Valley) با بازیهای صوتی خود میلیونها نفر را مجذوب خود کرده است. نمونه اولیه "20 سوالی" آنها پتانسیل Gemini 2.5 Pro را برای پاسخهای سریع و دیالوگهای جذاب نشان داد. اکنون، والی با بهرهگیری از مجموعهای قدرتمند از ویژگیهای پیشنمایش Gemini 2.5 Pro و مدل تولید ویدیوی Veo 2 گوگل، یک تجربه پویای پیمایش سیاهچال را ارتقا میدهد. هدف: یک ماجراجویی صوتی که در آن هر شخصیت تعاملی توسط هوش مصنوعی تولید میشود و به صورت پویا جلوههای بصری غنی در بازی ایجاد میکند.
ایجاد قلمرو جدیدی از گیمپلی با کنترل صوتی
این نمونه اولیه جاهطلبانه از بازی Dungeon crawler از پیشرفتهای خاص مدل Gemini و Veo 2 بهره میبرد:
- طراحی شخصیت مبتنی بر هوش مصنوعی با Imagen 3: Cartwheel قابلیتهای تبدیل متن به تصویر Imagen 3 را ادغام میکند و به سازندگان اجازه میدهد تا از پیامهای متنی برای مفهومسازی و تولید تصاویر منحصر به فرد شخصیتها مستقیماً در داخل پلتفرم استفاده کنند. این شخصیتهای سفارشی را میتوان با استفاده از زبان طبیعی متحرکسازی کرد، سپس به طور کامل ریگبندی شده و آماده برای نرمافزارهای ویرایش سهبعدی استاندارد صنعتی مانند Maya یا Blender صادر کرد و امکان ادغام در محیطهای تولید حرفهای را فراهم نمود.
- کمک به تحقیق و توسعه و بهینهسازی با پیشنمایش Gemini 2.5 Pro: تیم Cartwheel از پیشنمایش Gemini 2.5 Pro به صورت داخلی برای پشتیبانی از گردشهای کاری مهندسی و تحقیقاتی خود استفاده میکند:
- تولید تصاویر پویای بازی با Gemini 2.0 Flash و Veo 2: برای تکمیل تجربه مبتنی بر صدا، Volley از تولید تصویر Gemini 2.0 Flash و قدرت Veo 2 برای ایجاد یک بُعد بصری پر جنب و جوش بهره میبرد. موارد استفاده شامل تولید هنر مفهومی، تصاویر شخصیت، تصاویر پویای صحنه برای مکانها و رویدادهای کلیدی و تصاویر برای آیتمها و محیطهای درون بازی است که همگی برای عمیقتر کردن غوطهوری بازیکن طراحی شدهاند.
- استفاده از پیشنمایش Gemini 2.5 Pro به عنوان ابزاری برای توسعه بازی: Volley از قابلیتهای پیشرفته استدلال و کدنویسی Gemini 2.5 Pro Preview برای سادهسازی و بهبود فرآیند توسعه استفاده میکند. این شامل تسریع نوشتن و اشکالزدایی منطق بازی و سیستمهای جستجو، نمونهسازی سریع مکانیکهای جدید بازی و کمک به تولید محتوای روایی بنیادی، نقاط عطف داستان و پیشزمینه شخصیتها برای تیم توسعه جهت توسعه بازی میشود.
بازی فراگیر و تکاملیافته با اولویت صدا
این نمونه اولیه جدید بازی Dungeon crawler، چشمانداز Volley برای بازیهای قابل دسترس و عمیقاً فراگیر را با بهرهگیری از هوش مصنوعی، مجسم میکند. هدف این پروژه استفاده از نقاط قوت شناسایی شده در نمونه اولیه «20 سوال» - یک جریان مکالمه سریع، احساسی و طبیعی - و بهکارگیری آنها در یک ماجراجویی پیچیدهتر و بصری بهبود یافته است.
با استفاده از تولید تصویر Gemini 2.0 Flash و Veo 2 برای جلوههای بصری، و Gemini 2.5 Pro Preview برای کمک به توسعه، Volley در حال کار بر روی بازیای است که در آن تعامل صوتی، داستان را پیش میبرد و با جلوههای بصری غنی تقویت میشود.
همانطور که مکس چایلد، یکی از بنیانگذاران و مدیرعامل والی، پیش از این گفته بود، و این گفته با این تلاش جدید حتی قویتر هم میشود، «بازیهای LLM و فناوری تشخیص صدا، بازیها را متحول میکنند و از طریق تجربیات پویا و تعاملی، به بازی جان میبخشند. آنها به بازیکنان این امکان را میدهند که خود را در ماجراجوییهای پر جنب و جوش و جذابی غرق کنند که در آن صدایشان واقعاً داستان را پیش میبرد.» این بازی سیاهچاله، با خلاقیتهای مبتنی بر هوش مصنوعی خود، تجلی مستقیمی از آن دیدگاه است و نوید بازیای را میدهد که در آن هر کلمهی گفته شده، مسیر پیش رو را شکل میدهد.
شروع کار با رابط برنامهنویسی نرمافزار Gemini: ماجراجوییهای خودتان را بسازید
کار پیشگامانهی والی، پتانسیل مدلهای هوش مصنوعی گوگل را برای خلق نسل بعدی تجربیات بازی نوآورانه و جذاب به نمایش میگذارد. توسعهدهندگان میتوانند از قدرت تولید تصویر Gemini 2.0 Flash، Veo 2 برای تولید ویدیو و تصویر خیرهکننده، و Gemini 2.5 Pro Preview برای کدنویسی پیشرفته و کمک به محتوا، برای ساخت دنیای تعاملی خود بهره ببرند.
آماده ساخت هستید؟ مستندات API Gemini را بررسی کنید و همین امروز با Google AI Studio شروع به کار کنید.
والی یکی از اعضای صندوق آینده هوش مصنوعی گوگل است که در استارتآپهای بلندپروازی که در حال ساخت آینده هوش مصنوعی هستند، سرمایهگذاری و با آنها همکاری میکند.
هوش مصنوعی بهینه
هوش مصنوعی بهینه (Optimal AI) با استفاده از رابط برنامهنویسی Gemini، زمان بررسی کد را تا 50 درصد کاهش میدهد.