Google Gemini, 음성 인식, OCR을 통합하여 진정으로 사용자 친화적인 앱을 만들어 시각 장애인을 지원하는 애플리케이션입니다. 생성형 AI는 자연어 처리에 탁월하여 매우 간단한 UI로 다양한 사용자 요구사항에 대응할 수 있습니다. 또한 JSON 기반의 구조화된 대답을 사용하여 상황에 따라 응답 형식을 조정할 수 있습니다. 여기에는 사용자의 다음 작업을 안내하는 데 도움이 되는 단순한 이미지 분석 결과 외의 응답을 생성하는 것이 포함됩니다.
구성용 제품
Android
Firebase
음성 인식기
TTS
텍스트 인식기
팀
작성자:
이타쿠라 켄
From
일본
[[["이해하기 쉬움","easyToUnderstand","thumb-up"],["문제가 해결됨","solvedMyProblem","thumb-up"],["기타","otherUp","thumb-up"]],[["필요한 정보가 없음","missingTheInformationINeed","thumb-down"],["너무 복잡함/단계 수가 너무 많음","tooComplicatedTooManySteps","thumb-down"],["오래됨","outOfDate","thumb-down"],["번역 문제","translationIssue","thumb-down"],["샘플/코드 문제","samplesCodeIssue","thumb-down"],["기타","otherDown","thumb-down"]],[],[],[]]