2024 年 11 月 20 日
OpusClip が Gemini Flash で 30% の費用削減を達成
Gemini API を使用すると、最新の Gemini モデルに簡単にアクセスできるため、デベロッパーはマルチモーダル AI の可能性を最大限に活用できます。革新的な動画コンテンツ作成プラットフォームである OpusClip は、この変革能力の好例です。Gemini は、視覚データ、音声データ、テキストデータに対する高度な理解を活用して、クリエイターや企業が魅力的な動画コンテンツを生成する方法を一新し、実世界のアプリケーションにおける最先端の AI の実際的なメリットを示しています。
OpusClip の内部: Gemini 1.5 Flash で「ClipAnything」を有効にする
OpusClip の使命は、本物でパーソナライズされた動画を作成できる自動動画編集プラットフォームを通じて、専門的なスキルがなくても誰もが動画コンテンツを作成できるようにすることです。クリエイター、マーケティング担当者、企業、大手メディア企業など、700 万人を超えるユーザーを抱えるこのプラットフォームは、AI を活用して動画からハイライトを自動的に抽出し、さまざまなアスペクト比に合わせてクリップを再フレームし、アニメーション 字幕や B ロールで補完して、ソーシャル メディアで共有できる魅力的なコンテンツを作成します。
OpusClip のイノベーションの基盤となるのは、マルチモーダル AI クリッピング ツールである 「ClipAnything」機能です。この機能を使用すると、自然言語プロンプトを使用して、撮影したい瞬間を説明するだけで、クリップを生成できます。ここでは、Gemini 1.5 Flash のマルチモーダル機能が重要な役割を果たします。この機能により、AI は動画内のビジュアル、アクション、感情、音声、会話を分析して、これらのプロンプトを理解し、解釈できます。「OpusClip では、Gemini 1.5 Flash を使用して詳細な視覚的な説明を提供し、動画の理解を深めています」と、OpusClip のチーフ リサーチ サイエンティストである Vito Zhu 氏は説明します。OpusClip は、この深い理解に基づいて、ユーザー プロンプトに基づいて最も関連性の高い魅力的な瞬間を特定できるため、動画編集に必要な時間と労力を大幅に削減できます。
Gemini 1.5 Flash で費用を削減し、エンゲージメントを高める
Gemini 1.5 Flash を統合したことで、OpusClip の効率と効果が大幅に向上しました。このプラットフォームでは、エクスポート率を維持しながら、画像の説明処理の費用を 30% 削減できました。さらに、プロンプト関連の「ClipAnything」機能では、ユーザー エンゲージメント(クリック数)が 30% 増加し、エクスポート率が 10% 増加しました。これは、Gemini 1.5 Flash によって精度と関連性が向上したことを示しています。
「Gemini 1.5 Flash により開発が効率化され、プロンプトベースの機能の市場投入が早まり、非常に正確な結果が得られました」と Vito 氏は述べています。詳細なドキュメントが用意された Gemini API SDK と信頼性の高いサポートにより、開発エクスペリエンスがさらに向上しました。
OpusClip は、プロンプト関連の機能をさらに改良して拡張し、ユーザー向けの高度なカスタマイズ オプションを検討する予定です。また、Gemini 1.5 Flash の機能を活用して、個々のユーザーの興味 / 関心に合わせて動画コンテンツを動的に適応させることで、よりパーソナライズされたおすすめを導入できることを楽しみにしています。
Gemini API のスタートガイド: OpusClip の取り組みから得た分析情報
ビジュアル コンテンツの分析やモーメントの取得に関わるプロジェクトを構築するデベロッパーには、Gemini API を使用して構築し、ユースケースに適したモデルを見つけることをおすすめします。「Gemini 1.5 Flash の精度と速度は他のソリューションよりもはるかに優れており、適切に設定すれば費用対効果も高くなります」と、彼は語ります。Gemini 1.5 Flash はプロンプトの調整に非常に敏感であるため、早い段階でモニタリングを設定し、データセットに基づいてプロンプトを微調整することをデベロッパーにおすすめします。
Gemini API を使用した開発を開始するには、デベロッパー向けドキュメントをご覧ください。