Instacap

次回のソーシャル メディア投稿に AI を活用した字幕をシームレスに生成

機能

- ユニークなセールスポイント: Instacap は、既存の AI ベースの字幕作成ツールとの間にある「プラットフォームのギャップ」を埋めます。現在のソリューションはモバイル ファーストではありませんが、ユーザーはモバイルを使用して画像を保存し、ソーシャル メディアに投稿することを好みます。
- 影響: 投稿のハードルが下がることで、ユーザーはリアクション、コメント、DM を通じてフォロワーとより積極的に交流できるようになります。これにより、既存のソーシャル メディアを「ネガティブな情報のスクロール」サービスから、よりピアベースのコンテンツ フィードに再構築できます。
UX の差別化要因: Instcap は React で構築されたプログレッシブ ウェブアプリ(PWA)であり、アプリストアをダウンロードしなくてもモバイルファースト エクスペリエンスを実現できます。スプラッシュ画面、非表示のブラウザバー、高速レンダリングなど、ネイティブに近い機能をユーザーは引き続き利用できます。
ベスト プラクティス: Firebase Cloud Functions と Remote Config によって実現されるサーバーレス アーキテクチャを使用します。この軽量なアプローチでは、負荷の高いオペレーションをオフボードで実行することでパフォーマンスが向上します。同時に、デベロッパーは再デプロイせずにシステム インストラクションとモデル構成を更新して、急速に進化する AI 分野に適応できます。
- GEMINI API の使用方法: キュレートされた字幕データセットに基づく少数ショット手法を使用します。Gemini のマルチターンの会話機能を活用して、前のコンテキストを追加し、セッション内で重複する字幕が表示されないようにします。
- V2 の機能: データセットのサイズに基づいて少数ショットからファインチューニングに移行することを検討し、わかりにくい用語(年越し」など)の追加、字幕の保存や字幕生成の追跡などのアカウント機能の強化を行いました。

構成

  • ウェブ/Chrome
  • Firebase

チーム

By

Bennett Diaz

差出人

米国