Compartir

16 de mayo de 2025

Volley Crafts Immersive Voice-AI Dungeon Adventures con Gemini 2.5 y Veo 2

Max Child

Volea

David Benjamin

Operaciones

Vishal Dharmadhikari

Relaciones con desarrolladores de IA

Elemento hero de la presentación de Volley

Volley Crafts Immersive Voice-AI Dungeon Adventures con Gemini 2.5 y Veo 2

Tras el éxito de su prototipo de "20 preguntas" potenciado por Gemini 2.0 Flash, Volley vuelve a superar los límites del entretenimiento de audio interactivo con el desarrollo de un juego de exploración de mazmorras con IA de voz único en su tipo. Esta nueva iniciativa muestra cómo la generación de imágenes de Gemini 2.0 Flash y Veo 2 generan imágenes impresionantes en el juego, mientras que la capacidad de programación de la versión preliminar de Gemini 2.5 Pro revoluciona el proceso de desarrollo del juego en sí, lo que culmina en una aventura inmersiva sin igual.

De una sesión de preguntas y respuestas rápida a una aventura visual enriquecida

Volley cautivó a millones de personas con sus juegos activados por voz. Su prototipo inicial de "20 preguntas" demostró el potencial de Gemini 2.5 Pro para brindar respuestas ultrarrápidas y mantener diálogos atractivos. Ahora, Volley mejora la experiencia dinámica de exploración de mazmorras aprovechando un potente conjunto de funciones de la versión preliminar de Gemini 2.5 Pro y el modelo de generación de video Veo 2 de Google. El objetivo es crear una aventura basada en el audio en la que cada personaje interactivo se genere con IA, lo que crea de forma dinámica imágenes enriquecidas en el juego.

Forjando un nuevo reino de jugabilidad controlada por voz

Este ambicioso prototipo de exploración de mazmorras aprovecha los avances específicos del modelo de Gemini y de Veo 2:

  • Concepción de personajes impulsada por IA con Imagen 3: Cartwheel integra las capacidades de texto a imagen de Imagen 3, lo que permite a los creadores usar instrucciones de texto para conceptualizar y generar imágenes de personajes únicos directamente en la plataforma. Estos personajes diseñados a medida se pueden animar con lenguaje natural y, luego, exportar completamente equipados y listos para usar en software de edición 3D estándar de la industria, como Maya o Blender, lo que permite la integración en entornos de producción profesionales.
  • Asistencia para la I+D y la optimización con la versión preliminar de Gemini 2.5 Pro: El equipo de Cartwheel usa internamente la versión preliminar de Gemini 2.5 Pro para respaldar sus flujos de trabajo de ingeniería e investigación:
    • Generación de imágenes dinámicas de juegos con Gemini 2.0 Flash y Veo 2: Para complementar la experiencia de voz primero, Volley aprovecha la generación de imágenes de Gemini 2.0 Flash y el poder de Veo 2 para crear una dimensión visual vibrante. Entre los usos, se incluyen la generación de arte conceptual, imágenes de personajes, imágenes dinámicas de ambientación para ubicaciones y eventos clave, y elementos visuales para elementos y entornos del juego, todo diseñado para profundizar la inmersión del jugador.
    • Aprovechamiento de la versión preliminar de Gemini 2.5 Pro como herramienta de desarrollo de juegos: Volley utiliza las capacidades avanzadas de razonamiento y programación de la versión preliminar de Gemini 2.5 Pro para optimizar y mejorar el proceso de desarrollo. Esto incluye acelerar la escritura y la depuración de la lógica del juego y los sistemas de misiones, crear prototipos rápidamente de nuevas mecánicas de juego y ayudar a generar contenido narrativo fundamental, puntos de la trama y antecedentes de los personajes para que el equipo de desarrollo los utilice como base.

Evolución de los juegos inmersivos con prioridad de voz

Este nuevo prototipo de exploración de mazmorras encarna la visión de Volley de juegos accesibles y profundamente inmersivos aprovechando la IA. El objetivo del proyecto es usar los puntos fuertes identificados en el prototipo de "20 preguntas" (un flujo conversacional rápido, emotivo y natural) y aplicarlos en una aventura más compleja y con mejoras visuales.

Con la generación de imágenes de Gemini 2.0 Flash y Veo 2 para los elementos visuales, y la versión preliminar de Gemini 2.5 Pro para ayudar con el desarrollo, Volley está trabajando en un juego en el que la interacción por voz impulse la historia, aumentada por elementos visuales enriquecidos.

Como dijo anteriormente Max Child, cofundador y CEO de Volley, y que resuena aún más con este nuevo emprendimiento, “los LLM y la tecnología de reconocimiento de voz están transformando los juegos y les dan vida a través de experiencias dinámicas e interactivas. Permiten que los jugadores se sumerjan en aventuras animadas y atractivas en las que sus voces realmente impulsan la historia". Este juego de exploración de mazmorras, con sus creaciones asistidas por IA, es una manifestación directa de esa visión y promete un juego en el que cada palabra hablada da forma al camino por delante.

Comienza a usar la API de Gemini: Forja tus propias aventuras

El trabajo pionero de Volley demuestra el potencial de los modelos de IA de Google para crear la próxima generación de experiencias de juego innovadoras y atractivas. Los desarrolladores pueden aprovechar el poder de la generación de imágenes de Gemini 2.0 Flash, Veo 2 para la generación de imágenes y videos impresionantes, y la versión preliminar de Gemini 2.5 Pro para la asistencia avanzada de codificación y contenido, y así crear sus propios mundos interactivos.

¿Todo listo para compilar? Explora la documentación de la API de Gemini y comienza a usar Google AI Studio hoy mismo.

Volley participa en AI Futures Fund de Google, que invierte en startups ambiciosas y colabora con ellas para crear el futuro de la IA.