به اشتراک بگذارید

20 نوامبر 2024

OpusClip با Gemini Flash به 30 درصد کاهش هزینه دست می یابد

ویتو ژو

OpusClip

ویشال دارمادیکاری

مهندس راه حل های محصول

قهرمان ویترین OpusClip

Gemini API به توسعه دهندگان این امکان را می دهد تا با دسترسی آسان به جدیدترین مدل های Gemini از پتانسیل کامل هوش مصنوعی چندوجهی استفاده کنند. OpusClip ، یک پلتفرم خلاقانه برای ایجاد محتوای ویدیویی، نمونه بارز این قابلیت تغییردهنده است. آنها از درک پیشرفته Gemini از داده‌های بصری، صوتی و متنی استفاده می‌کنند تا انقلابی در نحوه تولید محتوای ویدیویی جذاب توسط سازندگان و کسب‌وکارها ایجاد کنند و مزایای عملی هوش مصنوعی پیشرفته را در برنامه‌های کاربردی دنیای واقعی نشان دهند.

Inside OpusClip: باز کردن قفل "ClipAnything" با فلش Gemini 1.5

ماموریت OpusClip این است که همه را قادر می سازد تا محتوای ویدیویی را بدون مهارت های حرفه ای، از طریق یک پلت فرم ویرایش خودکار ویدیو برای ایجاد ویدیوی معتبر و شخصی، ایجاد کنند. با بیش از ۷ میلیون کاربر، شامل سازندگان، بازاریابان، مشاغل و شرکت‌های رسانه‌ای بزرگ، پلتفرم آن‌ها از هوش مصنوعی برای استخراج خودکار نکات برجسته از ویدیوها، قاب‌بندی مجدد کلیپ‌ها برای نسبت‌های مختلف و غنی‌سازی آن‌ها با زیرنویس‌های متحرک و B-Roll استفاده می‌کند. ایجاد محتوای جذاب و آماده برای اشتراک گذاری در رسانه های اجتماعی.

OpusClip از Gemini 1.5 Flash استفاده می کند تا کاربران را قادر سازد تا به راحتی کلیپ های کوتاه را با استفاده از زبان طبیعی تولید کنند

سنگ بنای نوآوری OpusClip ویژگی "ClipAnything" آن است که یک ابزار برش هوش مصنوعی چندوجهی است. این ویژگی به کاربران اجازه می‌دهد تا با توصیف لحظاتی که می‌خواهند ثبت کنند، با استفاده از اعلان‌های زبان طبیعی، کلیپ تولید کنند. قابلیت‌های چندوجهی فلش Gemini 1.5 نقش مهمی در اینجا ایفا می‌کند و هوش مصنوعی را قادر می‌سازد تا با تجزیه و تحلیل تصاویر، اقدامات، احساسات، صدا و گفتگو در ویدیو، این اعلان‌ها را درک و تفسیر کند. ویتو ژو، دانشمند ارشد تحقیقاتی OpusClip توضیح می‌دهد: «ما از Gemini 1.5 Flash برای ارائه توضیحات بصری دقیق برای افزایش درک ویدیوی خود استفاده می‌کنیم. این درک عمیق به OpusClip اجازه می‌دهد تا مرتبط‌ترین و جذاب‌ترین لحظات را بر اساس درخواست‌های کاربر شناسایی کند و زمان و تلاش مورد نیاز برای ویرایش ویدیو را به شدت کاهش دهد.

هزینه های پایین تر و درگیری بهبود یافته با Gemini 1.5 Flash

ادغام فلش جمینی 1.5 به طور قابل توجهی کارآیی و اثربخشی Opusclip را بهبود بخشید. این پلتفرم ضمن حفظ نرخ صادرات خود ، 30 ٪ صرفه جویی در هزینه را در پردازش توضیحات بصری تجربه کرد. به‌علاوه، ویژگی «ClipAnything» مربوط به فوریت شاهد افزایش 30 درصدی در تعامل کاربر (کلیک‌ها) و افزایش 10 درصدی در نرخ‌های صادرات بود که دقت و ارتباط ارائه شده توسط Gemini 1.5 Flash را نشان می‌دهد.

ویتو خاطرنشان می‌کند: «جمینی 1.5 فلش توسعه ما را ساده‌تر کرد، و امکان ورود سریع‌تر به بازار را برای ویژگی‌های مبتنی بر سریع فراهم کرد و نتایج بسیار دقیقی ارائه کرد. API SDK Gemini به خوبی مستند و پشتیبانی قابل اعتماد باعث افزایش تجربه توسعه آنها شد.

OpusClip قصد دارد تا ویژگی های مربوط به سریع خود را اصلاح و گسترش دهد ، و گزینه های پیشرفته سفارشی سازی را برای کاربران بررسی می کند. آنها همچنین در مورد اجرای توصیه های شخصی تر با استفاده از قابلیت های Gemini 1.5 Flash برای تطبیق پویا محتوای ویدیویی با علایق کاربر هیجان زده هستند.

شروع با Gemini API: بینش از سفر Opusclip

توصیه ویتو برای توسعه‌دهندگانی که پروژه‌هایی را می‌سازند که شامل تحلیل محتوای بصری یا بازیابی لحظه‌ای است، ساختن با Gemini API و یافتن مدل مناسب برای مورد استفاده‌شان است. "برای ما ، عملکرد Gemini 1.5 Flash در دقت و سرعت بسیار فراتر از راه حل های دیگر است و با تنظیم مناسب ، مقرون به صرفه است." او به توسعه‌دهندگان توصیه می‌کند که نظارت را زودتر تنظیم کنند و اعلان‌ها را بر اساس مجموعه داده‌های خود تنظیم کنند، زیرا Gemini 1.5 Flash به شدت به تنظیمات فوری پاسخ می‌دهد.
برای شروع ساخت با Gemini API، به مستندات توسعه دهنده ما مراجعه کنید.

زیر لایه

ببینید که چگونه چارچوب عامل هوش مصنوعی مبتنی بر Ruby به تیم‌های توسعه‌دهنده قدرت می‌دهد تا با قدرت مدل‌های Gemini بهره‌ورتر باشند.