Анудж Шарма

Голосовой помощник, который умеет видеть мир

Что он делает

Мне нравится API Google (Gemini), потому что он обеспечивает полный результат Fruite, и я хочу сделать свой небольшой проект с помощью API Gemini, поэтому
Я создаю приложение Python или своего рода программное обеспечение с целью создания уникального искусственного интеллекта или голосового помощника. Сейчас существует множество кода или проектов, в которых голосовые помощники принимают команды голосом и возвращают результат голосом, но они не могут видеть наш запрос в виде изображения, поэтому я создал этот тип проекта с помощью API Gemini (pro и vision pro). Теперь мой голосовой помощник также может получать входные данные в виде изображения и отвечать на мой ответ как текстом, так и голосом.

Построено с

  • Никто
  • Firebase

Команда

К

Критрим

От

Индия