Pixtale

Dzięki magii sztucznej inteligencji Gemini możesz w kilka minut przekształcić zdjęcia z podróży w filmy z komentarzem.

Działanie

Pixtale to aplikacja wykorzystująca AI, która zamienia Twoje zdjęcia i filmy z podróży w opowiadane filmy. Jak to działa:
1. Przesyłanie: użytkownicy przesyłają plik ZIP z multimediami z podróży lub wybierają album w Zdjęciach Google.
2. Wyodrębnianie metadanych: aplikacja wyodrębnia z multimediów datę, godzinę i dane GPS.
3. Generowanie opisu za pomocą AI: to właśnie jest moc interfejsu Gemini API:
- Gemini Flash generuje opisy pojedynczych zdjęć i filmów.
- Gemini 1.5 Pro wykorzystuje te opisy jako dane wejściowe i tworzy spójny scenariusz narracji, scenę po scenie.
4. Narracja audio: interfejs Text-to-Speech API od Google konwertuje skrypt na dźwięk.
5. Tworzenie filmu: FFmpeg łączy narrację z oryginalnymi mediami, tworząc ostateczny film.
6. Treści w mediach społecznościowych: Pixtale generuje też:
- podpisy i hashtagi do udostępniania
- minibloga podsumowującego podróż (również za pomocą Gemini 1.5 Pro)
7. Personalizacja przez użytkownika: użytkownicy mogą edytować szczegóły lokalizacji w przypadku każdej sceny za pomocą interfejsu Google Maps API.
Pixtale wykorzystuje możliwości Gemini do interpretowania danych wizualnych, rozumienia kontekstu, generowania spójnych i ciekawych treści oraz tworzenia narracji, które są osobiste i autentyczne. Dzięki temu podejściu opartym na AI można szybko tworzyć bogate, multimedialne historie podróży, które wymagałyby sporo czasu, gdyby je tworzyć ręcznie.

Utworzone za pomocą

  • Google Photos Library API
  • Interfejs API Map Google

Zespół

Autor:

Pixtale

Od

Stany Zjednoczone