11 декабря 2024 г.
Компания Volley разработала прототип игры с приоритетом звука, используя Gemini 2.0 Flash и Multimodal Live API.

API Gemini позволяет разработчикам создавать захватывающие впечатления нового поколения, и Volley лидирует в мире игр с голосовым управлением и искусственным интеллектом. Известная своими хитами, такими как Jeopardy! и Song Quiz , компания Volley использует передовые возможности Gemini 2.0 Flash , в настоящее время находящегося в экспериментальной предварительной версии, для создания прототипа новой версии классической игры «20 вопросов», ориентированной на аудио.
Volley покорила миллионы пользователей увлекательными играми с голосовым управлением на смарт-телевизорах, Amazon Alexa, Google Assistant и мобильных платформах. Теперь компания нацелилась на новую область: трансформацию казуальных игр с помощью возможностей генеративного ИИ, позволяющих в режиме реального времени взаимодействовать с различными устройствами — начиная с игры «20 вопросов».
Gemini 2.0 Flash: ключ к захватывающему голосовому геймплею.
Новый прототип игры Volley «20 вопросов» использует ключевые возможности Gemini 2.0 Flash для создания поистине уникального опыта, выходящего за рамки текущих возможностей искусственного интеллекта игры. В то время как классическая игра использует динамический контент, генерируемый на лету, Gemini 2.0 Flash превращает его в нечто необыкновенное — обеспечивая молниеносные ответы, новые эмоциональные персонажи и диалог, который кажется удивительно человечным.
Вот как помогает Gemini 2.0 Flash:
Генерация динамических вопросов и ответов с низкой задержкой: встроенный аудиовыход Flash Gemini 2.0 и интерактивные возможности с низкой задержкой, обеспечиваемые новым API Multimodal Live, позволяют вести динамичные беседы с ИИ-мастером загадок. Прототип обеспечивает естественный диалог с мастером загадок: задавать вопросы, получать подсказки и многое другое. Сочетание интеллектуальных функций модели и долговременной контекстной памяти гарантирует персонализированный опыт, который развивается в реальном времени на основе взаимодействия игрока. Задержка менее секунды обеспечивает по-настоящему естественный, человекоподобный диалог.
Обнаружение голосовой активности: Встроенная в API возможность учитывать естественные голосовые прерывания в ответах модели обеспечивает плавное и доступное общение без необходимости визуального или тактильного ввода.
Будущее игр с голосовым управлением: на платформе Gemini
Компания Volley видит будущее, где голосовой ИИ станет основой игрового процесса, создавая доступные и захватывающие впечатления для всех. Приверженность компании инновациям в области ИИ ставит её в авангард этого захватывающего нового направления. Как поясняет соучредитель и генеральный директор Макс Чайлд: «LLM-технологии и технология распознавания голоса преобразуют игры, наполняя игровой процесс жизнью благодаря динамичным интерактивным возможностям. Они позволяют игрокам погрузиться в живые и увлекательные приключения, где их голоса действительно определяют сюжет».
Новейшая игра Volley «20 вопросов», работающая на основе Multimodal Live API от Gemini 2.0 Flash, пока находится на стадии прототипирования, но следите за обновлениями, скоро появится больше информации.
Начало работы с API Gemini: создавайте собственные интерактивные миры
Работа Volley с Gemini 2.0 Flash и Multimodal Live API демонстрирует захватывающие возможности ИИ в играх, в частности, потенциал для динамичного игрового процесса, реалистичных персонажей и естественного звучания диалогов. Как разработчик игр, вы можете использовать возможности API Gemini для создания столь же захватывающих и инновационных впечатлений.
Изучите документацию по API Gemini и узнайте, как его возможности помогут вам создавать игры нового поколения, увлекательные и инклюзивные.
Виггл
Компания экспериментирует с Gemini 2.0 для создания виртуальных персонажей и озвучивания для своей видеоплатформы на основе искусственного интеллекта.