সবকিছু এআই এপিআই

ডেডিকেটেড বড় ডেটাসেটের প্রয়োজন ছাড়াই প্রশিক্ষিত AI টাস্ক।

এটা কি করে

এই এপিআই কোনো ডেটাসেটে প্রশিক্ষণের প্রয়োজন ছাড়াই ডিপফেক শনাক্ত করতে পারে, স্পিচকে টেক্সটে রূপান্তর করতে পারে, ASL সাইন ল্যাঙ্গুয়েজ বিশ্লেষণ করতে পারে ইত্যাদি। এটি সম্ভব হয়েছে জেমিনি ফ্ল্যাশ 1.5 এবং তাদের "ইমপোজিশন-কনটেক্সট" কৌশলের জন্য।
এই API-এ বর্তমানে এআই কাজগুলি অন্তর্ভুক্ত রয়েছে যেমন: ডিপফেক সনাক্তকরণ, বহুভাষিক অডিওতে হুইস্পার-লার্জ-ভি3-এর বেশি ফলাফল সহ বহুভাষিক বক্তৃতা-টু-টেক্সট রূপান্তর, ভিডিওগুলিতে ইশারা ভাষার বিশদ এবং নির্ভুল বিশ্লেষণ এবং ব্যাখ্যা, মাত্র 2 সেকেন্ডে পাঠ্যের 80টি মানসিক অবস্থার শ্রেণীবিভাগ এবং OCR থেকে বৃহত্তর অক্ষর সনাক্তকরণ এবং OCR থেকে কম্প্রিফিকেশন করা। সিস্টেম এবং আমি এখনও আরও এআই কাজগুলিকে একীভূত করার জন্য কাজ করছি।
আমরা যদি ভিডিওটিকে নিজের থেকে জেমিনি ফ্ল্যাশ 1.5-এ ফিড করি তবে এটি ডিপফেক সনাক্ত করতে সক্ষম হবে না। আপনি এখানে দেখতে পারেন, জেমিনি ফ্ল্যাশ 1.5 ডিপফেক সনাক্ত করতে লড়াই করছে। এই কারণেই আমি "ইম্পোজিং-কনটেক্সট" প্রম্পটিং কৌশলটি তৈরি করেছি।
প্রথাগত পদ্ধতির পরিবর্তে যেখানে ব্যবহারকারী মডেলটিকে অনুরোধ করে এবং এটি নিজেই প্রসঙ্গটি ব্যাখ্যা করার জন্য অপেক্ষা করে, "ইম্পোজিং-প্রসঙ্গ" সরাসরি মডেলের আউটপুট ইতিহাস নির্দেশ করে। মডেল নিজেই আসলে প্রতিক্রিয়া লেখে না, সেগুলি আমার দ্বারা লেখা।
কিন্তু যখন এটি চ্যাটের ইতিহাসের দিকে তাকায়, এটি ভুলভাবে বিশ্বাস করে যে এটি সেই উত্তরগুলি তৈরি করেছে। এটি ব্যবহারকারীর অভিপ্রায় বুঝতে বাধ্য করে। আপনি দেখতে পাচ্ছেন, এই পদ্ধতিটি আশ্চর্যজনক ফলাফল দেয়। জেমিনি ফ্ল্যাশ 1.5 শুধুমাত্র ডিপফেকগুলি বিশ্লেষণ করতে সক্ষম নয় কিন্তু অবিশ্বাস্য নির্ভুলতাও অর্জন করে৷

দিয়ে নির্মিত

  • API AI

দল

দ্বারা

ShynAI

থেকে

ভিয়েতনাম