Pixtale

Gemini の AI マジックで、旅行の写真からナレーション付きの動画まで、数分で作成できます。

機能

Pixtale は、旅行の写真や動画をナレーション付きの動画ストーリーに変換する AI を活用したアプリです。仕組みは次のとおりです。
1. アップロード: ユーザーは、旅行のメディアを含む ZIP ファイルをアップロードするか、Google フォトのアルバムを選択します。
2. メタデータの抽出: アプリはメディアから日付、時刻、GPS データを抽出します。
3. AI による説明の生成: Gemini API が活躍する場面です。
- Gemini Flash は、個々の写真や動画の説明を生成します。
- Gemini 1.5 Pro は、これらの説明を入力として取り込み、シーンごとに一貫性のあるナラティブ スクリプトを作成します。
4. 音声ナレーション: Google の Text-to-Speech API がスクリプトを音声に変換します。
5. 動画の作成: FFmpeg はナレーションと元のメディアを組み合わせて、最終的な動画を作成します。
6. ソーシャル メディア コンテンツ: Pixtale では、さらに次のコンテンツも生成できます。
- 共有用の説明文とハッシュタグ
- 旅行のハイライトをまとめたミニブログ投稿(Gemini 1.5 Pro も使用)
7。ユーザーによるカスタマイズ: ユーザーは Google Maps API を使用して、シーンごとのロケーションの詳細を編集できます。
Pixtale は、Gemini の能力を活用して、ビジュアル データを解釈し、コンテキストを理解し、一貫性のある魅力的なコンテンツを生成し、パーソナライズされた本物らしいナラティブを作成します。この AI 主導のアプローチにより、手動で作成するには時間のかかる、豊富なマルチメディアの旅行記を迅速に作成できます。

構成

  • Google Photos Library API
  • Google Maps API

チーム

By

Pixtale

差出人

米国