به اشتراک بگذارید

20 نوامبر 2024

OpusClip با Gemini Flash به 30 درصد کاهش هزینه دست می یابد

ویتو ژو

OpusClip

ویشال دارمادیکاری

مهندس راه حل های محصول

قهرمان ویترین OpusClip

Gemini API به توسعه دهندگان این امکان را می دهد تا با دسترسی آسان به جدیدترین مدل های Gemini از پتانسیل کامل هوش مصنوعی چندوجهی استفاده کنند. OpusClip ، یک پلتفرم خلاقانه برای ایجاد محتوای ویدیویی، نمونه بارز این قابلیت تغییردهنده است. آنها از درک پیشرفته Gemini از داده‌های بصری، صوتی و متنی استفاده می‌کنند تا انقلابی در نحوه تولید محتوای ویدیویی جذاب توسط سازندگان و کسب‌وکارها ایجاد کنند و مزایای عملی هوش مصنوعی پیشرفته را در برنامه‌های کاربردی دنیای واقعی نشان دهند.

Inside OpusClip: باز کردن قفل "ClipAnything" با فلش Gemini 1.5

ماموریت OpusClip این است که همه را قادر می سازد تا محتوای ویدیویی را بدون مهارت های حرفه ای، از طریق یک پلت فرم ویرایش خودکار ویدیو برای ایجاد ویدیوی معتبر و شخصی، ایجاد کنند. با بیش از 7 میلیون کاربر، شامل سازندگان، بازاریابان، مشاغل و شرکت‌های رسانه‌ای بزرگ، پلتفرم آنها از هوش مصنوعی برای استخراج خودکار نکات برجسته از ویدیوها استفاده می‌کند، کلیپ‌ها را برای نسبت‌های مختلف قاب می‌کند و آنها را با زیرنویس‌های متحرک و B-Roll غنی می‌کند، و محتوای قانع‌کننده و آماده برای اشتراک‌گذاری رسانه‌های اجتماعی ایجاد می‌کند.

OpusClip از Gemini 1.5 Flash استفاده می کند تا کاربران را قادر سازد تا به راحتی کلیپ های کوتاه را با استفاده از زبان طبیعی تولید کنند

سنگ بنای نوآوری OpusClip ویژگی "ClipAnything" آن است که یک ابزار برش هوش مصنوعی چندوجهی است. این ویژگی به کاربران اجازه می‌دهد تا با توصیف لحظاتی که می‌خواهند ثبت کنند، با استفاده از اعلان‌های زبان طبیعی، کلیپ تولید کنند. قابلیت‌های چندوجهی فلش Gemini 1.5 نقش مهمی در اینجا ایفا می‌کند و هوش مصنوعی را قادر می‌سازد تا با تجزیه و تحلیل تصاویر، اقدامات، احساسات، صدا و گفتگو در ویدیو، این اعلان‌ها را درک و تفسیر کند. ویتو ژو، دانشمند ارشد تحقیقاتی OpusClip توضیح می‌دهد: «ما از Gemini 1.5 Flash برای ارائه توضیحات بصری دقیق برای افزایش درک ویدیوی خود استفاده می‌کنیم. این درک عمیق به OpusClip اجازه می‌دهد تا مرتبط‌ترین و جذاب‌ترین لحظات را بر اساس درخواست‌های کاربر شناسایی کند و زمان و تلاش مورد نیاز برای ویرایش ویدیو را به شدت کاهش دهد.

هزینه کمتر و تعامل بهبود یافته با Gemini 1.5 Flash

ادغام فلش Gemini 1.5 به طور قابل توجهی کارایی و اثربخشی OpusClip را بهبود بخشید. این پلتفرم با حفظ نرخ صادرات خود، 30 درصد صرفه جویی در هزینه را در پردازش توضیحات بصری تجربه کرد. به‌علاوه، ویژگی «ClipAnything» مربوط به فوریت شاهد افزایش 30 درصدی در تعامل کاربر (کلیک‌ها) و افزایش 10 درصدی در نرخ‌های صادرات بود که دقت و ارتباط ارائه شده توسط Gemini 1.5 Flash را نشان می‌دهد.

ویتو خاطرنشان می‌کند: «جمینی 1.5 فلش توسعه ما را ساده‌تر کرد، و امکان ورود سریع‌تر به بازار را برای ویژگی‌های مبتنی بر سریع فراهم کرد و نتایج بسیار دقیقی ارائه کرد. Gemini API SDK به خوبی مستند شده و پشتیبانی قابل اعتماد تجربه توسعه آنها را بیشتر کرد.

OpusClip قصد دارد ویژگی های مربوط به سریع خود را اصلاح و گسترش دهد و گزینه های سفارشی سازی پیشرفته را برای کاربران بررسی کند. آنها همچنین در مورد اجرای توصیه های شخصی تر با استفاده از قابلیت های Gemini 1.5 Flash برای تطبیق پویا محتوای ویدیویی با علایق کاربر هیجان زده هستند.

شروع به کار با Gemini API: بینش از سفر OpusClip

توصیه ویتو برای توسعه‌دهندگانی که پروژه‌هایی را می‌سازند که شامل تحلیل محتوای بصری یا بازیابی لحظه‌ای است، ساختن با Gemini API و یافتن مدل مناسب برای مورد استفاده‌شان است. برای ما، عملکرد Gemini 1.5 Flash در دقت و سرعت بسیار فراتر از راه حل های دیگر است و با راه اندازی مناسب، مقرون به صرفه است. او به توسعه‌دهندگان توصیه می‌کند که نظارت را زودتر تنظیم کنند و اعلان‌ها را بر اساس مجموعه داده‌های خود تنظیم کنند، زیرا Gemini 1.5 Flash به شدت به تنظیمات فوری پاسخ می‌دهد.
برای شروع ساخت با Gemini API، به مستندات توسعه دهنده ما مراجعه کنید.

زیر لایه

ببینید که چگونه چارچوب عامل هوش مصنوعی مبتنی بر Ruby به تیم‌های توسعه‌دهنده قدرت می‌دهد تا با قدرت مدل‌های Gemini بهره‌ورتر باشند.