۲۰ نوامبر ۲۰۲۴
OpusClip با Gemini Flash به 30 درصد صرفهجویی در هزینه دست مییابد

رابط برنامهنویسی نرمافزار Gemini با فراهم کردن دسترسی آسان به جدیدترین مدلهای Gemini، به توسعهدهندگان این امکان را میدهد تا از پتانسیل کامل هوش مصنوعی چندوجهی بهرهمند شوند. OpusClip ، یک پلتفرم نوآورانه برای تولید محتوای ویدیویی، نمونه بارزی از این قابلیت متحولکننده است. آنها از درک پیشرفته Gemini از دادههای بصری، صوتی و متنی برای متحول کردن نحوه تولید محتوای ویدیویی جذاب توسط سازندگان و کسبوکارها استفاده میکنند و مزایای عملی هوش مصنوعی پیشرفته را در برنامههای دنیای واقعی نشان میدهند.
درون OpusClip: باز کردن قفل "ClipAnything" با Gemini 1.5 Flash
ماموریت OpusClip این است که از طریق یک پلتفرم ویرایش خودکار ویدیو برای ایجاد ویدیوهای معتبر و شخصیسازیشده، به همه افراد امکان دهد بدون داشتن مهارتهای حرفهای، محتوای ویدیویی ایجاد کنند. پلتفرم آنها با بیش از ۷ میلیون کاربر، شامل سازندگان، بازاریابان، مشاغل و شرکتهای بزرگ رسانهای، از هوش مصنوعی برای استخراج خودکار نکات برجسته از ویدیوها، تغییر فریم کلیپها برای نسبتهای ابعاد مختلف و غنیسازی آنها با زیرنویسهای متحرک و B-Roll استفاده میکند و محتوای جذابی را برای اشتراکگذاری در رسانههای اجتماعی آماده میکند.
یکی از ارکان نوآوری OpusClip، ویژگی «ClipAnything» آن است، یک ابزار چندوجهی برش هوش مصنوعی. این ویژگی به کاربران اجازه میدهد تا صرفاً با توصیف لحظاتی که میخواهند ثبت کنند، با استفاده از دستورات زبان طبیعی، کلیپهایی تولید کنند. قابلیتهای چندوجهی Gemini 1.5 Flash در اینجا نقش مهمی ایفا میکنند و هوش مصنوعی را قادر میسازند تا با تجزیه و تحلیل تصاویر، اعمال، احساسات، صدا و دیالوگهای درون ویدیو، این دستورات را درک و تفسیر کند. ویتو ژو، دانشمند ارشد تحقیقات OpusClip، توضیح میدهد: «ما از Gemini 1.5 Flash برای ارائه توضیحات بصری دقیق برای افزایش درک ویدیوی خود استفاده میکنیم.» این درک عمیق به OpusClip اجازه میدهد تا مرتبطترین و جذابترین لحظات را بر اساس دستورات کاربر شناسایی کند و زمان و تلاش مورد نیاز برای ویرایش ویدیو را به شدت کاهش دهد.
هزینههای کمتر و تعامل بهتر با Gemini 1.5 Flash
ادغام Gemini 1.5 Flash به طور قابل توجهی کارایی و اثربخشی OpusClip را بهبود بخشید. این پلتفرم ضمن حفظ نرخ خروجی خود، 30٪ در پردازش توضیحات بصری صرفهجویی در هزینه را تجربه کرد. علاوه بر این، ویژگی "ClipAnything" مربوط به اعلان، 30٪ افزایش در تعامل کاربر (کلیکها) و 10٪ افزایش در نرخ خروجی را نشان داد که نشاندهنده دقت و ارتباط بهبود یافته ارائه شده توسط Gemini 1.5 Flash است.
ویتو خاطرنشان میکند: «Gemini 1.5 Flash توسعه ما را سادهتر کرد و امکان ارائه سریعتر به بازار را برای ویژگیهای مبتنی بر سرعت و ارائه نتایج بسیار دقیق فراهم کرد.» SDK API Gemini که به خوبی مستند شده است و پشتیبانی قابل اعتماد، تجربه توسعه آنها را بیش از پیش افزایش داد.
OpusClip قصد دارد ویژگیهای مربوط به اعلانهای خود را بیشتر اصلاح و گسترش دهد و گزینههای سفارشیسازی پیشرفتهای را برای کاربران بررسی کند. آنها همچنین از پیادهسازی توصیههای شخصیسازیشدهتر با استفاده از قابلیتهای Gemini 1.5 Flash برای تطبیق پویای محتوای ویدیویی با علایق کاربران، هیجانزده هستند.
شروع کار با رابط برنامهنویسی کاربردی Gemini: بینشهایی از سفر OpusClip
توصیه ویتو برای توسعهدهندگانی که پروژههایی را میسازند که شامل تحلیل محتوای بصری یا بازیابی لحظهای هستند، این است که با API Gemini بسازند و مدل مناسب برای مورد استفاده خود را پیدا کنند. «برای ما، عملکرد Gemini 1.5 Flash در دقت و سرعت بسیار فراتر از سایر راهحلها است و با راهاندازی مناسب، مقرونبهصرفه است.» او به توسعهدهندگان توصیه میکند که مانیتورینگ را از همان ابتدا راهاندازی کنند و اعلانها را بر اساس مجموعه دادههای خود تنظیم دقیق کنند، زیرا Gemini 1.5 Flash به تنظیمات اعلان بسیار پاسخگو است.
برای شروع ساخت با API Gemini، به مستندات توسعهدهندگان ما مراجعه کنید.
زیرلایه
ببینید که چگونه چارچوب عامل هوش مصنوعی مبتنی بر روبی، تیمهای توسعهدهنده را قادر میسازد تا با قدرت مدلهای Gemini، بهرهوری بیشتری داشته باشند.