Pixtale
Gemini の AI マジックで、旅行の写真からナレーション付きの動画まで、数分で作成できます。
機能
Pixtale は、旅行の写真や動画をナレーション付きの動画ストーリーに変換する AI を活用したアプリです。仕組みは次のとおりです。
1. アップロード: ユーザーは、旅行のメディアを含む ZIP ファイルをアップロードするか、Google フォトのアルバムを選択します。
2. メタデータの抽出: アプリはメディアから日付、時刻、GPS データを抽出します。
3. AI による説明の生成: Gemini API が活躍する場面です。
- Gemini Flash は、個々の写真や動画の説明を生成します。
- Gemini 1.5 Pro は、これらの説明を入力として取り込み、シーンごとに一貫性のあるナラティブ スクリプトを作成します。
4. 音声ナレーション: Google の Text-to-Speech API がスクリプトを音声に変換します。
5. 動画の作成: FFmpeg はナレーションと元のメディアを組み合わせて、最終的な動画を作成します。
6. ソーシャル メディア コンテンツ: Pixtale では、さらに次のコンテンツも生成できます。
- 共有用の説明文とハッシュタグ
- 旅行のハイライトをまとめたミニブログ投稿(Gemini 1.5 Pro も使用)
7。ユーザーによるカスタマイズ: ユーザーは Google Maps API を使用して、シーンごとのロケーションの詳細を編集できます。
Pixtale は、Gemini の能力を活用して、ビジュアル データを解釈し、コンテキストを理解し、一貫性のある魅力的なコンテンツを生成し、パーソナライズされた本物らしいナラティブを作成します。この AI 主導のアプローチにより、手動で作成するには時間のかかる、豊富なマルチメディアの旅行記を迅速に作成できます。
構成
- Google Photos Library API
- Google Maps API
チーム
By
Pixtale
差出人
米国