Anuj Sharma

Trợ lý thoại có thể nhìn thấy thế giới

Ý nghĩa

tôi yêu thích API của Google (gemini) vì API này cung cấp kết quả đầy đủ và tôi muốn tạo dự án nhỏ của mình với sự trợ giúp của API gemini, vì vậy
tôi tạo một ứng dụng python hoặc loại phần mềm có tầm nhìn để tạo một AI hoặc trợ lý thoại đơn nhất hiện có rất nhiều mã hoặc dự án trong đó trợ lý thoại nhận lệnh bằng giọng nói và trả về kết quả bằng giọng nói nhưng họ không thể xem truy vấn của chúng tôi ở dạng hình ảnh, vì vậy tôi đã tạo loại dự án này với sự trợ giúp của Gemini API (pro và vision pro) hiện trợ lý thoại của tôi cũng có thể nhận dữ liệu đầu vào dưới dạng hình ảnh và trả lời câu trả lời của tôi bằng văn bản cũng như bằng giọng nói

Được tạo bằng

  • None (Không có)
  • Firebase

Nhóm

Người cập nhật

Kritrim

Từ

Ấn Độ