اشتراک گذاری

۲۰ نوامبر ۲۰۲۴

OpusClip با Gemini Flash به 30 درصد صرفه‌جویی در هزینه دست می‌یابد

ویتو ژو

اوپوس کلیپ

ویشال دارمادیکاری

مهندس راهکارهای محصول

قهرمان نمایشی OpusClip

رابط برنامه‌نویسی نرم‌افزار Gemini با فراهم کردن دسترسی آسان به جدیدترین مدل‌های Gemini، به توسعه‌دهندگان این امکان را می‌دهد تا از پتانسیل کامل هوش مصنوعی چندوجهی بهره‌مند شوند. OpusClip ، یک پلتفرم نوآورانه برای تولید محتوای ویدیویی، نمونه بارزی از این قابلیت متحول‌کننده است. آن‌ها از درک پیشرفته Gemini از داده‌های بصری، صوتی و متنی برای متحول کردن نحوه تولید محتوای ویدیویی جذاب توسط سازندگان و کسب‌وکارها استفاده می‌کنند و مزایای عملی هوش مصنوعی پیشرفته را در برنامه‌های دنیای واقعی نشان می‌دهند.

درون OpusClip: باز کردن قفل "ClipAnything" با Gemini 1.5 Flash

ماموریت OpusClip این است که از طریق یک پلتفرم ویرایش خودکار ویدیو برای ایجاد ویدیوهای معتبر و شخصی‌سازی‌شده، به همه افراد امکان دهد بدون داشتن مهارت‌های حرفه‌ای، محتوای ویدیویی ایجاد کنند. پلتفرم آنها با بیش از ۷ میلیون کاربر، شامل سازندگان، بازاریابان، مشاغل و شرکت‌های بزرگ رسانه‌ای، از هوش مصنوعی برای استخراج خودکار نکات برجسته از ویدیوها، تغییر فریم کلیپ‌ها برای نسبت‌های ابعاد مختلف و غنی‌سازی آنها با زیرنویس‌های متحرک و B-Roll استفاده می‌کند و محتوای جذابی را برای اشتراک‌گذاری در رسانه‌های اجتماعی آماده می‌کند.

OpusClip از Gemini 1.5 Flash استفاده می‌کند تا کاربران بتوانند به راحتی با استفاده از زبان طبیعی کلیپ‌های کوتاه تولید کنند.

یکی از ارکان نوآوری OpusClip، ویژگی «ClipAnything» آن است، یک ابزار چندوجهی برش هوش مصنوعی. این ویژگی به کاربران اجازه می‌دهد تا صرفاً با توصیف لحظاتی که می‌خواهند ثبت کنند، با استفاده از دستورات زبان طبیعی، کلیپ‌هایی تولید کنند. قابلیت‌های چندوجهی Gemini 1.5 Flash در اینجا نقش مهمی ایفا می‌کنند و هوش مصنوعی را قادر می‌سازند تا با تجزیه و تحلیل تصاویر، اعمال، احساسات، صدا و دیالوگ‌های درون ویدیو، این دستورات را درک و تفسیر کند. ویتو ژو، دانشمند ارشد تحقیقات OpusClip، توضیح می‌دهد: «ما از Gemini 1.5 Flash برای ارائه توضیحات بصری دقیق برای افزایش درک ویدیوی خود استفاده می‌کنیم.» این درک عمیق به OpusClip اجازه می‌دهد تا مرتبط‌ترین و جذاب‌ترین لحظات را بر اساس دستورات کاربر شناسایی کند و زمان و تلاش مورد نیاز برای ویرایش ویدیو را به شدت کاهش دهد.

هزینه‌های کمتر و تعامل بهتر با Gemini 1.5 Flash

ادغام Gemini 1.5 Flash به طور قابل توجهی کارایی و اثربخشی OpusClip را بهبود بخشید. این پلتفرم ضمن حفظ نرخ خروجی خود، 30٪ در پردازش توضیحات بصری صرفه‌جویی در هزینه را تجربه کرد. علاوه بر این، ویژگی "ClipAnything" مربوط به اعلان، 30٪ افزایش در تعامل کاربر (کلیک‌ها) و 10٪ افزایش در نرخ خروجی را نشان داد که نشان‌دهنده دقت و ارتباط بهبود یافته ارائه شده توسط Gemini 1.5 Flash است.

ویتو خاطرنشان می‌کند: «Gemini 1.5 Flash توسعه ما را ساده‌تر کرد و امکان ارائه سریع‌تر به بازار را برای ویژگی‌های مبتنی بر سرعت و ارائه نتایج بسیار دقیق فراهم کرد.» SDK API Gemini که به خوبی مستند شده است و پشتیبانی قابل اعتماد، تجربه توسعه آنها را بیش از پیش افزایش داد.

OpusClip قصد دارد ویژگی‌های مربوط به اعلان‌های خود را بیشتر اصلاح و گسترش دهد و گزینه‌های سفارشی‌سازی پیشرفته‌ای را برای کاربران بررسی کند. آنها همچنین از پیاده‌سازی توصیه‌های شخصی‌سازی‌شده‌تر با استفاده از قابلیت‌های Gemini 1.5 Flash برای تطبیق پویای محتوای ویدیویی با علایق کاربران، هیجان‌زده هستند.

شروع کار با رابط برنامه‌نویسی کاربردی Gemini: بینش‌هایی از سفر OpusClip

توصیه ویتو برای توسعه‌دهندگانی که پروژه‌هایی را می‌سازند که شامل تحلیل محتوای بصری یا بازیابی لحظه‌ای هستند، این است که با API Gemini بسازند و مدل مناسب برای مورد استفاده خود را پیدا کنند. «برای ما، عملکرد Gemini 1.5 Flash در دقت و سرعت بسیار فراتر از سایر راه‌حل‌ها است و با راه‌اندازی مناسب، مقرون‌به‌صرفه است.» او به توسعه‌دهندگان توصیه می‌کند که مانیتورینگ را از همان ابتدا راه‌اندازی کنند و اعلان‌ها را بر اساس مجموعه داده‌های خود تنظیم دقیق کنند، زیرا Gemini 1.5 Flash به تنظیمات اعلان بسیار پاسخگو است.
برای شروع ساخت با API Gemini، به مستندات توسعه‌دهندگان ما مراجعه کنید.

زیرلایه

ببینید که چگونه چارچوب عامل هوش مصنوعی مبتنی بر روبی، تیم‌های توسعه‌دهنده را قادر می‌سازد تا با قدرت مدل‌های Gemini، بهره‌وری بیشتری داشته باشند.