এই পৃষ্ঠাটি Cloud Translation API অনুবাদ করেছে।

VISION_AI

দৃষ্টি প্রতিবন্ধীদের জন্য বিপ্লবী নেভিগেশন।

এটা কি করে

ভিশন_এআই হল একটি এআই গাইডেন্স সিস্টেম যা অন্ধ ব্যক্তিদের রিয়েল-টাইম অডিও ফিডব্যাক এবং তাদের পারিপার্শ্বিক অবস্থা এবং প্রয়োজনের উপর ভিত্তি করে নির্দেশনা প্রদান করার জন্য ডিজাইন করা হয়েছে। অত্যাধুনিক জেনারেটিভ এআই এবং কম্পিউটার ভিশন ব্যবহার করে, সিস্টেমটি ব্যাপক সহায়তা প্রদানের জন্য পরিবেশ থেকে ছবি এবং শব্দগুলি ক্যাপচার করে এবং প্রক্রিয়া করে। স্বয়ংক্রিয় প্রক্রিয়ার মধ্যে রয়েছে রিয়েল-টাইম বাধা সনাক্তকরণ এবং পরিহার, এবং পরিধানযোগ্য ডিভাইসগুলির সাথে একীকরণ, অন্ধ ব্যক্তিদের স্বাধীনভাবে এবং নিরাপদে ভ্রমণ করতে সক্ষম করে তথ্য এবং পরিষেবাগুলি আরও সহজে অ্যাক্সেস করার সময়। প্রযুক্তি স্ট্যাক:
- **ইমেজ প্রসেসিংয়ের জন্য জেনারেটিভ এআই (জেমিনি)**
- **HTML/CSS**
- **ডেপথ সেন্সিং এপিআই, স্পিচ রিকগনিশন এপিআই, টেক্সট-টু-স্পিচ লাইব্রেরি**
- **ফায়ারবেস**
- **ইএসপি৩২ মডিউল ব্যবহার করে ব্লাইন্ড স্টিক ইন্টিগ্রেশন**
- **স্মার্ট চশমার সাথে ইন্টিগ্রেশন**
**আমরা কিভাবে GEMINI API ব্যবহার করি:**
Gemini API LiDAR এবং ক্যামেরা মডিউল থেকে AI প্রক্রিয়াকরণ ইউনিটে সেন্সর ডেটার অবিচ্ছিন্ন স্ট্রিমিং সক্ষম করে। এটি নিশ্চিত করে যে VISION_AI সর্বদা সর্বশেষ পরিবেশগত তথ্যে অ্যাক্সেস রয়েছে, যা বাস্তব-সময় বিশ্লেষণ এবং প্রতিক্রিয়ার জন্য অনুমতি দেয়।
Gemini API-এর মাধ্যমে, VISION_AI অবজেক্ট শনাক্তকরণ এবং দৃশ্যের বিবরণের জন্য Google-এর জেনারেটিভ এআইকে নির্বিঘ্নে সংহত করে। Gemini API ইমেজ প্রক্রিয়াকরণের জন্য প্রয়োজনীয় কার্যকারিতা প্রদান করে, যেমন ইমেজ ক্যাপচার, প্রিপ্রসেসিং এবং বৈশিষ্ট্য নিষ্কাশন
প্রতিক্রিয়া প্রক্রিয়া:
Gemini API-এর ক্ষমতাকে কাজে লাগিয়ে, VISION_AI ব্যবহারকারীকে তাৎক্ষণিক শ্রবণ ও স্পর্শকাতর প্রতিক্রিয়া প্রদান করে।

দিয়ে নির্মিত

ওয়েব/ক্রোম
ফায়ারবেস

দল

দ্বারা

VISION_AI

থেকে

ভারত