Pixtale

Mit der KI von Gemini können Sie in Minuten Fotos von Reisen in Videos mit Voiceover verwandeln.

Funktion

Pixtale ist eine KI-gestützte App, mit der Sie Ihre Reisefotos und -videos in Videostorys mit Voiceover verwandeln können. So funktionierts:
1. Hochladen: Nutzer laden eine ZIP-Datei mit Reisemedien hoch oder wählen ein Google Fotos-Album aus.
2. Metadaten-Extraktion: Die App extrahiert Datum, Uhrzeit und GPS-Daten aus den Medien.
3. KI-generierte Beschreibungen: Hier kommt die Gemini API ins Spiel:
– Gemini Flash generiert Beschreibungen für einzelne Fotos und Videos.
– Gemini 1.5 Pro nimmt diese Beschreibungen als Eingabe und erstellt Szene für Szene ein zusammenhängendes Storyboard.
4. Audiokommentar: Die Text-to-Speech API von Google wandelt das Script in Audio um.
5. Videoerstellung: FFmpeg kombiniert die Erzählung mit den Originalmedien, um das endgültige Video zu erstellen.
6. Social-Media-Inhalte: Pixtale geht noch einen Schritt weiter und generiert:
– Untertitel und Hashtags zum Teilen
– Einen Mini-Blogpost, in dem die Reise zusammengefasst wird (auch mit Gemini 1.5 Pro)
7. Nutzeranpassung: Nutzer können mit der Google Maps API Details zum Standort für jede Szene bearbeiten.
Pixtale nutzt die Fähigkeit von Gemini, visuelle Daten zu interpretieren, den Kontext zu verstehen, kohärente und ansprechende Inhalte zu generieren und Geschichten zu erstellen, die sich persönlich und authentisch anfühlen. Dieser KI-gestützte Ansatz ermöglicht die schnelle Erstellung reichhaltiger, multimedialer Reisegeschichten, die manuell zeitaufwendig zu produzieren wären.

Basis

  • Google Fotos Library API
  • Google Maps API

Team

Von

Pixtale

Von

USA