Pixtale

De fotos de viagens a vídeos narrados em minutos com a magia da IA do Gemini.

O que faz?

O Pixtale é um app com tecnologia de IA que transforma fotos e vídeos de viagens em histórias em vídeo narradas. Veja como funciona:
1. Upload: os usuários fazem upload de um arquivo ZIP com mídia da viagem ou selecionam um álbum do Google Fotos.
2. Extração de metadados: o app extrai dados de data, hora e GPS da mídia.
3. Geração de descrições por IA: é aqui que a API Gemini se destaca:
- O Gemini Flash gera descrições para fotos e vídeos individuais.
- O Gemini 1.5 Pro usa essas descrições como entrada e cria um roteiro narrativo coeso, cena por cena.
4. Narração de áudio: a API Text-to-Speech do Google converte o roteiro em áudio.
5. Criação de vídeo: o FFmpeg combina a narração com a mídia original para criar o vídeo final.
6. Conteúdo para mídias sociais: o Pixtale vai além e gera:
- Legendas e hashtags para compartilhamento
- Uma minipostagem de blog resumindo a viagem (também usando o Gemini 1.5 Pro)
7. Personalização do usuário: os usuários podem editar os detalhes de localização de cada cena usando a API Google Maps.
O Pixtale aproveita a capacidade do Gemini de interpretar dados visuais, entender o contexto, gerar conteúdo coerente e envolvente e criar narrativas que parecem pessoais e autênticas. Essa abordagem baseada em IA permite a criação rápida de histórias de viagem ricas e multimídia que levariam muito tempo para serem produzidas manualmente.

Desenvolvido com

  • API Google Photos Library
  • API Google Maps

Equipe

Por

Pixtale

De

Estados Unidos