Agent Gemini pour la perception Turtlebot3

Améliorer les capacités visuelles de Gemini avec le dinosaure de référence

Description

L'application utilise un agent compatible avec Gemini pour surveiller l'emplacement d'un robot turtlebot3 sur une grille de 4 x 5 afin de planifier et de naviguer plus tard. Après avoir testé les fonctionnalités multimodales de Gemini, il est clair que la détection et la localisation d'objets ne sont pas des fonctionnalités prêtes à l'emploi. C'est pourquoi j'ai décidé d'intégrer un modèle spécialisé (Grounding DINO) en tant qu'outil pouvant aider l'agent Gemini à mieux détecter les robots. Une fois le robot détecté sur la grille, nous pouvons lui demander d'autres tâches complexes, comme planifier un parcours pour déplacer le robot d'un endroit à un autre, et même envoyer des commandes de contrôle pour exécuter le parcours avec l'intégration du pont ROS.

Conçu avec

  • Vertex AI

Équipe

Par

bracavisionai

De

États-Unis