Compartir

11 de diciembre de 2024

Volley crea un prototipo de un juego en el que se prioriza el audio con Gemini 2.0 Flash y la API de Multimodal Live

Max Child

Volea

Vishal Dharmadhikari

Ingeniero de soluciones de productos

Hero de la demostración de Volley

La API de Gemini permite a los desarrolladores crear la nueva generación de experiencias envolventes, y Volley lidera la carga en el mundo de los juegos de IA controlados por voz. Volley, conocido por sus juegos exitosos como Jeopardy! y Song Quiz, aprovecha las capacidades de vanguardia de Gemini 2.0 Flash, que actualmente se encuentra en versión preliminar experimental, para crear un prototipo de una nueva versión del clásico juego 20 Preguntas en la que se prioriza el audio.

Volley cautivó a millones de personas con juegos atractivos con comandos por voz en smart TVs, Amazon Alexa, Asistente de Google y plataformas para dispositivos móviles. Ahora, se están enfocando en una nueva frontera: transformar los juegos casuales con el poder de las capacidades multimodales en vivo de la IA generativa, comenzando con 20 preguntas.

Gemini 2.0 Flash: La clave para un juego de voz inmersivo

El nuevo prototipo de 20 preguntas de Volley usa funciones clave de Gemini 2.0 Flash para crear una experiencia verdaderamente única que va más allá de las capacidades actuales de IA del juego. Mientras que el juego clásico incluye contenido dinámico generado sobre la marcha, Gemini 2.0 Flash lo transforma en algo extraordinario: ofrece respuestas rápidas, personalidades nuevas emotivas y un flujo de conversación que se siente notablemente humano.

Un prototipo de 20 preguntas de Volley: uno de los primeros juegos con Gemini 2.0 Flash y la API de Multimodal Live (secuencia abreviada)

A continuación, te mostramos cómo ayuda Gemini 2.0 Flash:

  • Generación de preguntas y respuestas dinámicas de baja latencia: La salida de audio nativa de Gemini 2.0 Flash y las interacciones de baja latencia que desbloquea la nueva API de Multimodal Live permiten conversaciones dinámicas con un AI Riddlemaster. El prototipo permite una conversación natural y fluida con el Riddlemaster: hacer preguntas, obtener sugerencias y mucho más. La combinación de la inteligencia del modelo y la memoria de contexto a largo plazo garantiza experiencias personalizadas que evolucionan en tiempo real, según las interacciones de los jugadores. La latencia inferior a un segundo permite una conversación verdaderamente natural y similar a la humana.

  • Detección de actividad de voz: La capacidad integrada de la API para permitir interrupciones de voz naturales en las respuestas del modelo permite conversaciones fluidas y accesibles, sin necesidad de entradas visuales o táctiles.

El futuro de los juegos que priorizan la voz: con tecnología de Gemini

Volley prevé un futuro en el que la IA por voz sea el centro de la jugabilidad, lo que creará experiencias accesibles y envolventes para todos. El compromiso de la empresa con la innovación en IA la posiciona a la vanguardia de esta nueva y emocionante frontera. Como explica Max Child, cofundador y director ejecutivo, “los LLM y la tecnología de reconocimiento de voz están transformando los juegos y les dan vida a través de experiencias interactivas y dinámicas. Permiten que los jugadores se sumerjan en aventuras animadas y atractivas en las que sus voces realmente impulsan la historia".

El juego de 20 preguntas más reciente de Volley, con la API de Multimodal Live de Gemini 2.0 Flash, aún se encuentra en la fase de prototipado, pero pronto tendremos más información.

Comienza a usar la API de Gemini: crea tus propios mundos interactivos

El trabajo de Volley con Gemini 2.0 Flash y la API de Multimodal Live muestra las emocionantes posibilidades de la IA en los juegos, en particular el potencial para un juego dinámico, personajes realistas y conversaciones que suenan naturales. Como desarrollador de juegos, puedes aprovechar la potencia de la API de Gemini para crear experiencias innovadoras y envolventes similares.

Explora la documentación de la API de Gemini y descubre cómo sus capacidades pueden ayudarte a crear la nueva generación de juegos atractivos y inclusivos.