9 AVRIL 2025
Comment Wolf Games crée des histoires policières immersives au quotidien avec l'API Gemini

La demande de contenus récents et attrayants dans le secteur du gaming est incessante. Pour Wolf Games, une start-up innovante, cela signifie proposer chaque jour à ses joueurs de nouvelles histoires policières interactives. Pour atteindre cet objectif ambitieux, ils exploitent la puissance de l'API Gemini, en particulier Gemini 2.0 Flash et Gemini 2.0 Flash Thinking, afin de générer des récits complexes à une échelle sans précédent.
Wolf Games cible les joueurs mobiles et les amateurs de mystères qui recherchent des expériences de résolution de problèmes quotidiennes. Chaque jour, son application propose des scènes de crime réalistes, avec des rapports de police, des photos, des interviews et des personnages dynamiques. Les joueurs peuvent ainsi se plonger régulièrement dans de nouvelles affaires non résolues.
Le défi : développer des contenus narratifs quotidiens
Pour maintenir ce rythme quotidien, il faut générer du contenu rapidement et avec précision. Avant d'intégrer l'API Gemini, Wolf Games a rencontré des difficultés avec les modèles précédents, qui avaient du mal à fournir des résultats structurés cohérents (avec un taux de réussite de seulement 80 %) et qui présentaient des temps d'exécution des requêtes lents (jusqu'à six minutes).
"Nous exploitons l'API Gemini dans notre DAG d'exécution des requêtes pour générer des histoires policières originales et captivantes", explique Noah Rosenberg, cofondateur et directeur technique. "Notre processus orchestre de nombreuses requêtes finement ajustées pour générer du contenu structuré à partir d'un processus intrinsèquement non structuré : la génération de récits."


Moteur d'invite innovant de Wolf Games
Au cœur de la solution de Wolf Games se trouve son outil interne, "Prompt Composer", qui gère son DAG d'exécution des requêtes. Ce framework leur permet d'intégrer des appels de fonction, d'exécuter des scripts Python personnalisés pour la logique (par exemple, pour s'assurer que les noms sont uniques) et de gérer l'état tout au long du processus de génération. Ils pourront ainsi :
- Passez facilement d'un modèle à l'autre, y compris Gemini 2.5 Pro, Gemini 2.0 Flash et Gemini 2.0 Flash Thinking.
- Utilisez la génération augmentée par récupération (RAG) en stockant tout le contenu généré, comme l'histoire des personnages et les événements de l'enquête, dans une base de données persistante pour assurer la cohérence du récit. Par exemple, en référençant un graphique causal bayésien des événements, qui cartographie les dépendances logiques dans le récit, lors de la génération d'un relevé bancaire numérique pour garantir l'exactitude et la cohérence.
- Appliquez une sortie structurée, en particulier JSON, qui est ensuite validée à l'aide d'outils tels que Pydantic, ce qui garantit la fiabilité en aval.
Wolf Games utilise Gemini 2.0 Flash Thinking pour générer des textes complexes avec de grandes fenêtres de contexte (plus de 100 000 jetons) et des sorties, ce qui permet de consolider des workflows qui nécessitaient auparavant de nombreuses étapes. Ils trouvent Gemini 2.0 Flash "incroyablement performant et fiable" pour les tâches plus rapides, et utilisent souvent Gemini 2.5 Pro pour générer des exemples few-shot qui améliorent les performances de Gemini 2.0 Flash.
Google AI Studio est un outil clé de leur workflow. "Google AI Studio est devenu le produit Google que j'utilise le plus souvent, dépassant même Gmail, Agenda et la recherche en termes d'utilisation quotidienne", explique Noah, soulignant sa valeur pour l'expérimentation des requêtes.
Rapidité, précision et workflow amélioré
La migration vers les modèles Gemini a permis d'obtenir des améliorations remarquables :
- Précision accrue : le taux de réussite de l'exécution des requêtes est passé de 80 % à 96 %, ce qui garantit un contenu structuré de haute qualité.
- Latence réduite : le temps nécessaire pour générer une réponse à une requête a été considérablement réduit, passant de plusieurs minutes à moins de 20 secondes pour la plupart des requêtes.
- Production de contenu simplifiée : la vitesse et la fiabilité des modèles Gemini, en particulier Gemini 2.0 Flash, ont considérablement amélioré leur capacité à produire des articles détaillés sur des faits divers au quotidien.
"Les modèles Gemini répondent directement à notre besoin de générer rapidement et de manière fiable des contenus narratifs structurés", souligne Noah. Pour Wolf Games, le seuil critique consiste à générer du texte plus rapidement que ses rédacteurs ne peuvent le lire, tout en maintenant leur état de flow créatif. Les modèles Gemini l'ont aidé à atteindre cet objectif de manière constante.
Perspectives d'avenir
Wolf Games prévoit d'exploiter davantage l'API Gemini, en particulier le potentiel créatif des prochains modèles pour générer des preuves de jeu encore plus réalistes. En repensant à son expérience, Noah donne ce conseil aux développeurs :
"Prenez le temps de bien comprendre comment structurer les requêtes pour les modèles Gemini. Utilisez des modèles plus puissants pour créer les requêtes que les modèles plus rapides exécuteront." Il insiste sur l'importance d'un schéma bien structuré et d'exemples few-shot, et suggère aux développeurs de "mener des expériences pour mieux comprendre comment les modèles Gemini exploitent les données encodées dans l'espace latent".
Pour Noah, l'IA est un puissant catalyseur de créativité : "J'ai toujours été un peu maladroit avec les contenus… Grâce à l'IA, je peux désormais créer tout ce dont je rêve, sans effort."
L'utilisation innovante de l'API Gemini par Wolf Games démontre son potentiel pour révolutionner le développement de jeux, en permettant aux créateurs de produire des expériences immersives à un rythme sans précédent.
Vous pouvez commencer dans Google AI Studio et explorer la documentation de l'API Gemini pour commencer à créer l'avenir de l'IA.