Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Gemini 擬真機器人

由 Gemini 技術輔助的機器人，提供更自然且引人入勝的體驗。

用途

整合作業涉及多個重要元件：Chatbot 服務、Chatbot Bridge、語音辨識模組和對話模組。聊天機器人服務扮演著重要的角色，它會管理整個對話記錄，並使用 Gemini 模型根據先前的互動生成回覆。具體來說，Gemini-pro 模型會用來產生回覆。為彌補不同程式設計環境之間的通訊差距，Chatbot Bridge 會使用 ZeroMQ。這個元件可讓 Chatbot 服務與 NaoQi 擴充模組之間的通訊順暢無阻。語音辨識模組會使用 NaoQi ALAudioDevice，擷取機器人麥克風的音訊輸入。系統會根據音量門檻分割音訊錄音檔。系統會將這些分段錄音傳送至 Google 的雲端服務，進行語音轉文字分析。如果系統成功辨識語音，系統會將產生的文字轉介給 Chatbot Bridge。
對話模組會使用 NaoQi ALAnimatedSpeech，將 Gemini 產生的文字回應轉換為語音。這個模組也會與語音辨識模組協調，在機器人說話時暫停錄音，確保機器人以輪流方式聽取和回應的對話系統。

採用

類人機器人

團隊

寄件者

英國