아누즈 샤르마
세상을 볼 수 있는 음성 어시스턴트
기능
Google의 API (Gemini)를 좋아합니다. 실질적인 결과를 제공하기 때문입니다. Gemini API를 사용하여 마이너 프로젝트를 만들고 싶습니다. 그래서
Singularity AI 또는 음성 어시스턴트를 만들겠다는 비전을 가지고 Python 애플리케이션이나 일종의 소프트웨어를 만듭니다. 이제 음성 어시스턴트가 음성으로 명령을 받아 음성으로 결과를 반환하는 코드나 프로젝트가 많이 있지만, 이러한 코드나 프로젝트는 쿼리를 시각적 형식으로 볼 수 없습니다. 그래서 Gemini API (pro 및 vision pro)를 사용하여 이러한 유형의 프로젝트를 만들었습니다. 이제 음성 어시스턴트가 입력을 이미지로 가져와 텍스트로 답변할 뿐만 아니라 음성으로도 답변할 수 있습니다.
구성용 제품
- 없음
- Firebase
팀
작성자:
Kritrim
From
인도