Pixtale

Dalle foto dei viaggi ai video con narrazione in pochi minuti con la magia dell'AI di Gemini.

Descrizione

Pixtale è un'app basata sull'IA che trasforma le foto e i video dei tuoi viaggi in storie video narrate. Ecco come funziona:
1. Caricamento: gli utenti caricano un file ZIP con i contenuti multimediali del viaggio o selezionano un album di Google Foto.
2. Estrazione dei metadati: l'app estrae data, ora e dati GPS dai contenuti multimediali.
3. Generazione di descrizioni con l'IA: è qui che l'API Gemini dà il meglio di sé:
- Gemini Flash genera descrizioni per singole foto e video.
- Gemini 1.5 Pro prende queste descrizioni come input e crea uno script narrativo coerente, scena per scena.
4. Narrazione audio: l'API Text-to-Speech di Google converte lo script in audio.
5. Creazione del video: FFmpeg combina la narrazione con i contenuti multimediali originali per creare il video finale.
6. Contenuti per i social media: Pixtale fa di più generando:
- Caption e hashtag per la condivisione
- Un mini post del blog che riassume il viaggio (utilizzando anche Gemini 1.5 Pro)
7. Personalizzazione dell'utente: gli utenti possono modificare i dettagli della posizione per ogni scena utilizzando l'API Google Maps.
Pixtale sfrutta la capacità di Gemini di interpretare i dati visivi, comprendere il contesto, generare contenuti coerenti e coinvolgenti e creare narrazioni che sembrano personali e autentiche. Questo approccio basato sull'IA consente di creare rapidamente storie di viaggio multimediali e complete che richiederebbero molto tempo se prodotte manualmente.

Realizzato con

  • API Google Photos Library
  • API di Google Maps

Team

Di

Pixtale

Da

Stati Uniti