11 декабря 2024 г.
Volley создает прототип игры со звуком с помощью Gemini 2.0 Flash и API Multimodal Live

API Gemini открывает разработчикам возможности для создания захватывающих игр нового поколения, а Volley занимает лидирующие позиции в мире игр с голосовым управлением и искусственным интеллектом. Компания Volley, известная такими хитами, как Jeopardy! и Song Quiz , использует передовые возможности Gemini 2.0 Flash , который сейчас находится в стадии экспериментального тестирования, для создания прототипа новой версии классической игры «20 Questions», где звуковое сопровождение играет ключевую роль.
Компания Volley покорила миллионы людей увлекательными голосовыми играми на смарт-телевизорах, Amazon Alexa, Google Assistant и мобильных платформах. Теперь они стремятся выйти на новый уровень: трансформировать казуальные игры с помощью возможностей генеративного искусственного интеллекта, доступных в режиме реального времени и в режиме мультимодального взаимодействия, — начиная с 20 вопросов.
Gemini 2.0 Flash: ключ к захватывающему голосовому игровому процессу
Новый прототип игры Volley «20 вопросов» использует ключевые возможности Gemini 2.0 Flash для создания поистине уникального игрового опыта, выходящего за рамки возможностей искусственного интеллекта. В то время как классическая игра использует динамический контент, генерируемый на лету, Gemini 2.0 Flash превращает её в нечто экстраординарное, предлагая молниеносные ответы, новые эмоциональные образы и удивительно реалистичный диалог.
Вот как помогает Gemini 2.0 Flash:
Динамическая генерация вопросов и ответов с малой задержкой: встроенный аудиовыход Gemini 2.0 Flash и взаимодействие с малой задержкой, открываемое новым API Multimodal Live, позволяют вести динамичные диалоги с ИИ-мастером загадок. Прототип позволяет вести естественный диалог с мастером загадок: задавать вопросы, получать подсказки и многое другое. Сочетание интеллектуальных моделей и долговременной контекстной памяти обеспечивает персонализированный опыт, развивающийся в режиме реального времени в зависимости от взаимодействия с игроком. Задержка менее секунды обеспечивает по-настоящему естественное общение, похожее на человеческое.
Обнаружение голосовой активности: встроенная возможность API обеспечивать естественные голосовые прерывания ответов модели позволяет вести плавные и доступные разговоры без необходимости визуального или тактильного ввода.
Будущее голосовых игр: на платформе Gemini
Volley представляет будущее, в котором голосовой ИИ станет основой игрового процесса, создавая доступные и захватывающие впечатления для каждого. Приверженность компании инновациям в области ИИ ставит её в авангард этого захватывающего нового направления. Как поясняет соучредитель и генеральный директор Макс Чайлд: «Степень магистра права и технологии распознавания голоса меняют игры, вдыхая в них жизнь благодаря динамичному интерактивному опыту. Они позволяют игрокам погрузиться в яркие, захватывающие приключения, где их голоса действительно определяют сюжет».
Новейшая игра Volley «20 вопросов», работающая на базе API Multimodal Live от Gemini 2.0 Flash, все еще находится на стадии разработки прототипа, но следите за новостями, чтобы узнать больше.
Начало работы с API Gemini: создание собственных интерактивных миров
Работа Volley с Gemini 2.0 Flash и Multimodal Live API демонстрирует захватывающие возможности ИИ в играх, в частности, потенциал для динамичного игрового процесса, реалистичных персонажей и естественно звучащих диалогов. Как разработчик игр, вы можете использовать возможности Gemini API для создания столь же захватывающих и инновационных игровых процессов.
Изучите документацию API Gemini и узнайте, как его возможности могут помочь вам создать новое поколение увлекательных и инклюзивных игр.
Виггл
Эксперименты с Gemini 2.0 по созданию виртуальных персонажей и аудиокомментариев для их видеоплатформы на базе искусственного интеллекта