9 KWIETNIA 2025 R.
Jak Wolf Games codziennie tworzy wciągające historie kryminalne za pomocą interfejsu Gemini API
Popyt na nowe, angażujące treści w branży gier jest nieustanny. Dla innowacyjnego startupu Wolf Games oznacza to dostarczanie graczom codziennie nowych, interaktywnych historii kryminalnych. Ten ambitny cel osiągają dzięki wykorzystaniu interfejsu Gemini API, a w szczególności modeli Gemini 2.0 Flash i Gemini 2.0 Flash Thinking, do generowania złożonych narracji na niespotykaną dotąd skalę.
Wolf Games jest skierowana do graczy mobilnych i miłośników zagadek, którzy lubią codziennie rozwiązywać problemy. Aplikacja codziennie dostarcza realistyczne sceny zbrodni wraz z raportami policyjnymi, zdjęciami, wywiadami i dynamicznymi postaciami, dzięki czemu gracze mogą regularnie rozwiązywać nowe sprawy.
Wyzwanie: skalowanie codziennych treści narracyjnych
Utrzymanie takiej codziennej częstotliwości wymaga szybkości i dokładności w generowaniu treści. Przed zintegrowaniem interfejsu Gemini API firma Wolf Games napotkała problemy z poprzednimi modelami, które miały trudności z generowaniem spójnych danych strukturalnych (osiągały tylko 80% skuteczności) i powoli wykonywały prompt (nawet do 6 minut).
„Wykorzystujemy interfejs Gemini API w naszym DAG wykonania prompta, aby generować nowe i ciekawe historie kryminalne” – wyjaśnia Noah Rosenberg, współzałożyciel i dyrektor ds. technicznych. „Nasz proces wykorzystuje wiele precyzyjnie dostrojonych promptów, aby uzyskać ustrukturyzowane treści z procesu z natury nieustrukturyzowanego – generowania narracji”.
Innowacyjny silnik promptów Wolf Games
Podstawą rozwiązania Wolf Games jest wewnętrzne narzędzie „Prompt Composer”, które zarządza grafem DAG wykonywania promptów. Umożliwia to integrowanie wywołań funkcji, wykonywanie niestandardowych skryptów w języku Python w celu zapewnienia unikalności nazw i zarządzania stanem w trakcie procesu generowania. Umożliwia to:
- Łatwe przełączanie się między różnymi modelami, w tym Gemini 2.5 Pro, Gemini 2.0 Flash i Gemini 2.0 Flash Thinking.
- Wykorzystaj generowanie rozszerzone przez wyszukiwanie w zapisanych informacjach (RAG), przechowując wszystkie wygenerowane treści, takie jak historie postaci i wydarzenia w sprawie, w trwałej bazie danych, co zapewnia spójność narracji. Na przykład podczas generowania cyfrowego wyciągu bankowego, aby zapewnić dokładność i spójność, można odwoływać się do bayesowskiego grafu przyczynowego zdarzeń, który przedstawia zależności logiczne w narracji.
- Wymuszaj uporządkowane dane wyjściowe, zwłaszcza w formacie JSON, które są następnie weryfikowane za pomocą narzędzi takich jak Pydantic, co zapewnia niezawodność na dalszych etapach.
Wolf Games wykorzystuje Gemini 2.0 Flash Thinking do generowania złożonych tekstów z dużymi oknami kontekstu (ponad 100 tys. tokenów) i danymi wyjściowymi, co upraszcza przepływy pracy, które wcześniej wymagały wielu kroków. Użytkownicy uważają, że Gemini 2.0 Flash jest „niezwykle wydajny i niezawodny” w przypadku szybszych zadań. Często używają Gemini 2.5 Pro do generowania przykładów, które zwiększają wydajność Gemini 2.0 Flash.
Kluczowym narzędziem w ich pracy jest Google AI Studio. „Google AI Studio stało się moją najczęściej używaną usługą Google, wyprzedzając nawet Gmaila, Kalendarz i wyszukiwarkę pod względem codziennego użytkowania” – mówi Noah, podkreślając wartość tej usługi w eksperymentowaniu z promptami.
Szybkość, dokładność i ulepszony przepływ pracy
Przejście na modele Gemini przyniosło znaczące ulepszenia:
- Większa dokładność: odsetek skutecznych wykonań promptów wzrósł z 80% do 96%, co zapewnia wysoką jakość i strukturalizację treści.
- Mniejsze opóźnienie: czas realizacji promptów znacznie się skrócił – z kilku minut do mniej niż 20 sekund w przypadku większości promptów.
- Usprawniona produkcja treści: szybkość i niezawodność modeli Gemini, zwłaszcza Gemini 2.0 Flash, znacznie zwiększyły ich możliwości codziennego tworzenia szczegółowych relacji z miejsca przestępstwa.
„Modele Gemini bezpośrednio odpowiadają na nasze potrzeby w zakresie szybkiego i niezawodnego generowania uporządkowanych treści narracyjnych” – podkreśla Noah. Krytycznym progiem dla Wolf Games jest generowanie tekstu szybciej, niż ich pisarze są w stanie go przeczytać, przy jednoczesnym zachowaniu stanu kreatywnego przepływu. Modele Gemini pomagają im w tym od dłuższego czasu.
Co dalej
Wolf Games planuje w dalszym ciągu korzystać z Gemini API, w szczególności z kreatywnego potencjału przyszłych modeli, aby generować jeszcze bardziej realistyczne dowody w grze. Noah dzieli się z deweloperami tymi radami:
„Poświęć czas na zrozumienie, jak tworzyć prompty dla modeli Gemini. Używaj bardziej zaawansowanych modeli do tworzenia promptów, które będą wykonywane przez szybsze modele”. Podkreśla on znaczenie dobrze skonstruowanego schematu i przykładów z niewielką liczbą elementów, sugerując programistom „przeprowadzanie eksperymentów, aby uzyskać intuicyjne wyobrażenie o tym, jak modele Gemini wykorzystują dane zakodowane w przestrzeni ukrytej”.
Dla Noaha AI jest potężnym katalizatorem kreatywności: „Całe życie byłem „niezdarą” w tworzeniu treści… Dzięki AI mogę teraz tworzyć wszystko, co tylko sobie wymarzę, bez całego tego trudu”.
Innowacyjne wykorzystanie interfejsu Gemini API przez Wolf Games pokazuje jego potencjał w rewolucjonizowaniu procesu tworzenia gier, umożliwiając twórcom generowanie wciągających wrażeń w niespotykanym dotąd tempie.
Możesz zacząć w Google AI Studio i zapoznać się z dokumentacją Gemini API, aby zacząć tworzyć przyszłość AI.