2024 年 12 月 11 日
Volley が Gemini 2.0 Flash と Multimodal Live API を使用した音声優先ゲームのプロトタイプを作成
Gemini API は、デベロッパーが次世代の没入型エクスペリエンスを構築できるように支援し、Volley は音声制御 AI ゲームの世界をリードしています。Jeopardy! や Song Quiz などのヒットゲームで知られる Volley は、現在試験的なプレビュー段階にある Gemini 2.0 Flash の最先端機能を活用して、古典的なゲーム「20 Questions」に新たなオーディオファーストのひねりを加えたプロトタイプを開発しています。
Volley は、スマートテレビ、Amazon Alexa、Google アシスタント、モバイル プラットフォームで、音声操作による魅力的なゲームを提供し、何百万人ものユーザーを魅了しています。現在、同社は新たなフロンティアを目指しています。それは、生成 AI のライブ マルチモーダル機能を活用してカジュアル ゲームを変革することです。まずは「20 の質問」から始めます。
Gemini 2.0 Flash: 臨場感あふれる音声ゲームプレイの鍵
Volley の新しい 20 Questions プロトタイプは、Gemini 2.0 Flash の主要機能を使用して、ゲームの現在の AI 機能を超える、真にユニークなエクスペリエンスを生み出します。クラシック ゲームでは、リアルタイムで生成される動的なコンテンツが特徴ですが、Gemini 2.0 Flash では、超高速の応答、感情豊かな新しいパーソナリティ、驚くほど人間らしい会話の流れなど、特別なものへと生まれ変わります。
Gemini 2.0 Flash がどのように役立つかを以下に示します。
低レイテンシの動的な質問と回答の生成: Gemini 2.0 Flash のネイティブ音声出力と、新しい Multimodal Live API によって実現される低レイテンシのインタラクションにより、AI なぞなぞマスターとの動的な会話が可能になります。このプロトタイプでは、質問したり、ヒントをもらったりするなど、リドルマスターとの自然な会話が可能になります。モデルのインテリジェンスと長文コンテキストのメモリを組み合わせることで、プレーヤーのインタラクションに基づいてリアルタイムで進化するパーソナライズされたエクスペリエンスが実現します。1 秒未満の遅延により、真に自然な人間のような会話が可能になります。
音声アクティビティ検出: モデルのレスポンスに自然な音声割り込みを許可する API の組み込み機能により、視覚入力や触覚入力を必要とせずに、スムーズでアクセスしやすい会話が可能になります。
音声ファーストゲームの未来:Gemini 搭載
Volley は、音声 AI がゲームプレイの中心となり、誰もがアクセスできる没入型の体験を生み出す未来を思い描いています。AI イノベーションへの取り組みにより、同社はこのエキサイティングな新分野の最前線に立っています。共同創設者兼 CEO のマックス・チャイルド氏は、「LLM と音声認識テクノロジーはゲームを変革し、ダイナミックでインタラクティブな体験を通じてゲームに命を吹き込んでいます。」と述べています。プレーヤーは、自分の声がストーリーを動かす、活気あふれる魅力的な冒険に没頭できます。」
Gemini 2.0 Flash の Multimodal Live API を活用した Volley の最新の 20 の質問ゲームは、まだプロトタイピングの段階ですが、近日中に詳細をお知らせします。
Gemini API 入門: 自分だけのインタラクティブな世界を構築しよう
Volley の Gemini 2.0 Flash と Multimodal Live API を使用した作業は、ゲームにおける AI の刺激的な可能性、特にダイナミックなゲームプレイ、リアルなキャラクター、自然な会話の可能性を示しています。ゲーム開発者は、Gemini API のパワーを活用して、同様に没入感のある革新的なエクスペリエンスを作成できます。
探索するGemini API ドキュメントその機能を活用して、魅力的で包括的な次世代ゲームを構築する方法をご確認ください。