Simón
会函数调用生成的行为的多模态玩具机器人
作用
Simón 会尝试模仿人类,就像玩“Simon 说”游戏一样。首先,用户会在触摸屏显示屏上通过 Chrome Gradio Python 应用录制一段简短的视频、图片或音频。Gemini API 会上传此媒体输入,并获取场景和所有人的文本说明。然后,系统会通过提示来设计文本说明,以便 Gemini 函数调用从几十个候选函数中选择最佳的聊天机器人行为函数。机器人行为函数是手动创建的,但您也可以使用脚本通过 Gemini(代码生成)生成新的新颖行为。我们举办了一场 YouTube 直播,向开发者介绍了如何创建自己的机器人行为函数。Simón 由泡沫、袜子和胶带制成,搭载了摄像头、USB 麦克风和扬声器、三个业余舵机、两个 LED 眼睛和一个触摸屏显示屏,并运行在 Raspberry Pi 上。所有代码均为开源代码,我们提供了完整的构建指南,其中包含安装说明和物料清单 (BOM)。我们提供了一个辅助脚本,让开发者可以向 Gemini 聊天实例询问有关 Simón 的问题,并预先填充相关上下文。所有代码均采用 Python 编写,我们使用 async 模块并行运行行为函数和 Gemini API 调用。代码设计采用模块化方式,可轻松实现自定义和扩展。我们希望开发者能以 Simón 为起点,构建自己的使用 Gemini API 的 Robotics 项目。
可采用以下设备打造
- Web/Chrome
团队
更新者
hu-po
发件人
美国