20 نوامبر 2024
OpusClip با Gemini Flash به 30 درصد کاهش هزینه دست می یابد

Gemini API به توسعه دهندگان این امکان را می دهد تا با دسترسی آسان به جدیدترین مدل های Gemini از پتانسیل کامل هوش مصنوعی چندوجهی استفاده کنند. OpusClip ، یک پلتفرم خلاقانه برای ایجاد محتوای ویدیویی، نمونه بارز این قابلیت تغییردهنده است. آنها از درک پیشرفته Gemini از دادههای بصری، صوتی و متنی استفاده میکنند تا انقلابی در نحوه تولید محتوای ویدیویی جذاب توسط سازندگان و کسبوکارها ایجاد کنند و مزایای عملی هوش مصنوعی پیشرفته را در برنامههای کاربردی دنیای واقعی نشان دهند.
Inside OpusClip: باز کردن قفل "ClipAnything" با فلش Gemini 1.5
ماموریت OpusClip این است که همه را قادر می سازد تا محتوای ویدیویی را بدون مهارت های حرفه ای، از طریق یک پلت فرم ویرایش خودکار ویدیو برای ایجاد ویدیوی معتبر و شخصی، ایجاد کنند. با بیش از 7 میلیون کاربر، شامل سازندگان، بازاریابان، مشاغل و شرکتهای رسانهای بزرگ، پلتفرم آنها از هوش مصنوعی برای استخراج خودکار نکات برجسته از ویدیوها استفاده میکند، کلیپها را برای نسبتهای مختلف قاب میکند و آنها را با زیرنویسهای متحرک و B-Roll غنی میکند، و محتوای قانعکننده و آماده برای اشتراکگذاری رسانههای اجتماعی ایجاد میکند.
سنگ بنای نوآوری OpusClip ویژگی "ClipAnything" آن است که یک ابزار برش هوش مصنوعی چندوجهی است. این ویژگی به کاربران اجازه میدهد تا با توصیف لحظاتی که میخواهند ثبت کنند، با استفاده از اعلانهای زبان طبیعی، کلیپ تولید کنند. قابلیتهای چندوجهی فلش Gemini 1.5 نقش مهمی در اینجا ایفا میکند و هوش مصنوعی را قادر میسازد تا با تجزیه و تحلیل تصاویر، اقدامات، احساسات، صدا و گفتگو در ویدیو، این اعلانها را درک و تفسیر کند. ویتو ژو، دانشمند ارشد تحقیقاتی OpusClip توضیح میدهد: «ما از Gemini 1.5 Flash برای ارائه توضیحات بصری دقیق برای افزایش درک ویدیوی خود استفاده میکنیم. این درک عمیق به OpusClip اجازه میدهد تا مرتبطترین و جذابترین لحظات را بر اساس درخواستهای کاربر شناسایی کند و زمان و تلاش مورد نیاز برای ویرایش ویدیو را به شدت کاهش دهد.
هزینه کمتر و تعامل بهبود یافته با Gemini 1.5 Flash
ادغام فلش Gemini 1.5 به طور قابل توجهی کارایی و اثربخشی OpusClip را بهبود بخشید. این پلتفرم با حفظ نرخ صادرات خود، 30 درصد صرفه جویی در هزینه را در پردازش توضیحات بصری تجربه کرد. بهعلاوه، ویژگی «ClipAnything» مربوط به فوریت شاهد افزایش 30 درصدی در تعامل کاربر (کلیکها) و افزایش 10 درصدی در نرخهای صادرات بود که دقت و ارتباط ارائه شده توسط Gemini 1.5 Flash را نشان میدهد.
ویتو خاطرنشان میکند: «جمینی 1.5 فلش توسعه ما را سادهتر کرد، و امکان ورود سریعتر به بازار را برای ویژگیهای مبتنی بر سریع فراهم کرد و نتایج بسیار دقیقی ارائه کرد. Gemini API SDK به خوبی مستند شده و پشتیبانی قابل اعتماد تجربه توسعه آنها را بیشتر کرد.
OpusClip قصد دارد ویژگی های مربوط به سریع خود را اصلاح و گسترش دهد و گزینه های سفارشی سازی پیشرفته را برای کاربران بررسی کند. آنها همچنین در مورد اجرای توصیه های شخصی تر با استفاده از قابلیت های Gemini 1.5 Flash برای تطبیق پویا محتوای ویدیویی با علایق کاربر هیجان زده هستند.
شروع به کار با Gemini API: بینش از سفر OpusClip
توصیه ویتو برای توسعهدهندگانی که پروژههایی را میسازند که شامل تحلیل محتوای بصری یا بازیابی لحظهای است، ساختن با Gemini API و یافتن مدل مناسب برای مورد استفادهشان است. برای ما، عملکرد Gemini 1.5 Flash در دقت و سرعت بسیار فراتر از راه حل های دیگر است و با راه اندازی مناسب، مقرون به صرفه است. او به توسعهدهندگان توصیه میکند که نظارت را زودتر تنظیم کنند و اعلانها را بر اساس مجموعه دادههای خود تنظیم کنند، زیرا Gemini 1.5 Flash به شدت به تنظیمات فوری پاسخ میدهد.
برای شروع ساخت با Gemini API، به مستندات توسعه دهنده ما مراجعه کنید.
زیر لایه
ببینید که چگونه چارچوب عامل هوش مصنوعی مبتنی بر Ruby به تیمهای توسعهدهنده قدرت میدهد تا با قدرت مدلهای Gemini بهرهورتر باشند.