Agente Gemini per la percezione di Turtlebot3

Miglioramento delle funzionalità visive di Gemini con il dinosauro di messa a terra

Descrizione

L'app utilizza un agente supportato da Gemini per monitorare la posizione di un robot turtlebot3 su una griglia 4x5 in modo che possa essere utilizzato per la pianificazione e la navigazione futura dei percorsi. In base ad alcuni test delle funzionalità multimodali di Geimini, è emerso chiaramente che il rilevamento degli oggetti e la posizione non sono funzionalità disponibili immediatamente. Per questo motivo, ho deciso di integrare un modello specializzato (Grounding DINO) come strumento che può aiutare l'agente Gemini a migliorare il rilevamento dei robot. Una volta rilevato il robot sulla griglia, possiamo chiedere all'agente altre attività complesse, come pianificare un percorso per spostare il robot da una posizione all'altra e persino inviare comandi di controllo per eseguire il percorso con l'integrazione del bridge ROS.

Realizzato con

  • Vertex AI

Team

Di

bracavisionai

Da

Stati Uniti