2024 年 12 月 11 日
Volley が Gemini 2.0 Flash と Multimodal Live API を使用して音声優先ゲームのプロトタイプを作成
Gemini API は、デベロッパーが次世代の没入型エクスペリエンスを構築できるようにします。Volley は、音声操作の AI ゲームの世界をリードしています。Jeopardy! や Song Quiz などの人気ゲームで知られる Volley は、現在試験運用版プレビュー中の Gemini 2.0 Flash の最先端の機能を活用して、古典的なゲーム「20 の質問」を音声重視でアレンジした新しいプロトタイプを開発しています。
Volley は、スマートテレビ、Amazon Alexa、Google アシスタント、モバイル プラットフォームで、魅力的な音声対応ゲームで何百万人ものユーザーを魅了してきました。20 問ゲームを皮切りに、生成 AI のライブ マルチモーダル機能の力でカジュアル ゲームを変革するという新たな目標を掲げています。
Gemini 2.0 Flash: 没入感のある音声ゲームプレイの鍵
Volley の新しい 20 の質問のプロトタイプでは、Gemini 2.0 Flash の主要な機能を使用して、ゲームの現在の AI 機能を超える、真にユニークなエクスペリエンスを実現しています。従来のゲームでは、その場で生成される動的コンテンツが特徴ですが、Gemini 2.0 Flash では、そのコンテンツが驚異的なものに変わります。超高速の応答、感情豊かな新しい個性、驚くほど人間らしい会話フローが実現します。
Gemini 2.0 Flash のメリットは次のとおりです。
低レイテンシの動的質問と回答の生成: Gemini 2.0 Flash のネイティブ音声出力と、新しい マルチモーダル ライブ API によって実現された低レイテンシのインタラクションにより、AI 謎解きマスターとの動的会話が可能になります。このプロトタイプでは、質問やヒントを求めるなど、謎解きマスターと自然なやり取りができます。モデルの知能と長いコンテキスト メモリの組み合わせにより、プレーヤーの操作に基づいてリアルタイムで進化するパーソナライズされたエクスペリエンスを実現します。1 秒未満のレイテンシにより、人間のように自然な会話が可能になります。
音声アクティビティ検出: モデルのレスポンスを自然な音声で中断できる API の組み込み機能により、視覚的または触覚的な入力を必要とせずに、スムーズでアクセスしやすい会話が可能になります。
音声ファーストのゲームの未来: Gemini を活用
Volley は、音声 AI がゲームプレイの中心となり、すべてのユーザーが利用しやすく没入感のあるエクスペリエンスを実現する未来を構想しています。AI イノベーションへの Google の取り組みは、このエキサイティングな新分野の最前線に立っています。共同創設者兼 CEO の Max Child 氏は次のように説明しています。「LLM と音声認識技術はゲームを変革し、ダイナミックでインタラクティブなエクスペリエンスを通じてゲームに命を吹き込んでいます。プレイヤーは、自分の声でストーリーを動かしながら、生き生きとした魅力的な冒険に没頭できます。」
Gemini 2.0 Flash の Multimodal Live API を活用した Volley の最新の 20 の質問ゲームは、まだプロトタイプ段階ですが、近日中に詳細をお知らせします。
Gemini API を使ってみる: 独自のインタラクティブな世界を構築する
Volley が Gemini 2.0 Flash と Multimodal Live API で行っている作業は、ゲームにおける AI の可能性を示しています。特に、ダイナミックなゲームプレイ、リアルなキャラクター、自然な会話の可能性を示しています。ゲーム デベロッパーは、Gemini API の力を活用して、同様に没入感のある革新的なエクスペリエンスを構築できます。
Gemini API のドキュメントで、この機能を使用して魅力的で包括的な次世代ゲームを構築する方法をご覧ください。