Compartilhar

11 DE DEZEMBRO DE 2024

O Volley cria um protótipo de jogo com foco em áudio com o Gemini 2.0 Flash e a API Multimodal Live

Max Child

Vôlei

Vishal Dharmadhikari

Engenheiro de soluções de produtos

Hero do Volley Showcase

A API Gemini está ajudando os desenvolvedores a criar a próxima geração de experiências imersivas, e o Volley está liderando o mundo dos jogos de IA controlados por voz. Conhecida por jogos de sucesso como Jeopardy! e Song Quiz, a Volley está usando os recursos de ponta do Gemini 2.0 Flash, que está em fase de pré-lançamento experimental, para criar um protótipo com foco em áudio para o jogo clássico 20 Perguntas.

Volley conquistou milhões de pessoas com jogos por voz em smart TVs, Amazon Alexa, Google Assistente e plataformas móveis. Agora, eles estão se preparando para uma nova fronteira: transformar jogos casuais com o poder dos recursos multimodais e em tempo real da IA generativa, começando com o jogo 20 Questions.

Gemini 2.0 Flash: a chave para jogos de voz imersivos

O novo protótipo 20 Questions do Volley usa os principais recursos do Gemini 2.0 Flash para criar uma experiência única que vai além dos recursos atuais de IA do jogo. Enquanto o jogo clássico tem conteúdo dinâmico gerado em tempo real, o Gemini 2.0 Flash o transforma em algo extraordinário, com respostas ultrarrápidas, novas personalidades emotivas e um fluxo de conversa que parece notavelmente humano.

Um protótipo do jogo 20 Questions do Volley: um dos primeiros jogos com o Gemini 2.0 Flash e a API Multimodal Live (sequência abreviada)

Confira como o Gemini 2.0 Flash ajuda:

  • Geração de perguntas e respostas dinâmicas com baixa latência:a saída de áudio nativa do Gemini 2.0 Flash e as interações de baixa latência desbloqueadas pela nova API Multimodal Live permitem conversas dinâmicas com um Riddlemaster de IA. O protótipo permite uma conversa natural com o Riddlemaster: fazer perguntas, receber dicas e muito mais. A combinação da inteligência do modelo e da memória de contexto longo garante experiências personalizadas que evoluem em tempo real com base nas interações do jogador. A latência de menos de um segundo permite uma conversa verdadeiramente natural e semelhante a humana.

  • Detecção de atividade de voz : a capacidade integrada da API de permitir interrupções de voz naturais nas respostas do modelo possibilita conversas fluidas e acessíveis, sem a necessidade de entrada visual ou tátil.

O futuro dos jogos com foco em voz: tecnologia do Gemini

O Volley imagina um futuro em que a IA por voz é o ponto principal do jogo, criando experiências acessíveis e imersivas para todos. O compromisso da empresa com a inovação em IA coloca a empresa na vanguarda dessa nova fronteira. Como explica o cofundador e CEO Max Child, "LLMs e a tecnologia de reconhecimento de voz estão transformando jogos, vida a eles com experiências dinâmicas e interativas. Eles permitem que os jogadores se aprofundem em aventuras animadas e envolventes em que as vozes deles realmente guiam a história."

O novo jogo "20 Questions" do Volley, que usa a API Multimodal Live da Gemini 2.0 Flash, ainda está na fase de prototipagem, mas em breve vamos divulgar mais informações.

Introdução à API Gemini: crie seus próprios mundos interativos

O trabalho do Volley com o Gemini 2.0 Flash e a API Multimodal Live mostra as possibilidades interessantes da IA em jogos, principalmente o potencial de jogabilidade dinâmica, personagens realistas e conversas naturais. Como desenvolvedor de jogos, você pode aproveitar o poder da API Gemini para criar experiências igualmente imersivas e inovadoras.

Confira a documentação da API Gemini e descubra como os recursos dela podem ajudar você a criar a próxima geração de jogos envolventes e inclusivos.