پیکستال

از عکس های سفر گرفته تا ویدیوهای روایت شده در چند دقیقه با جادوی جمینی AI..

کاری که انجام می دهد

Pixtale یک برنامه مبتنی بر هوش مصنوعی است که عکس‌ها و ویدیوهای سفر شما را به داستان‌های ویدیویی روایت‌شده تبدیل می‌کند. در اینجا نحوه کار آن آمده است:
1. آپلود: کاربران یک فایل فشرده را با رسانه سفر آپلود می کنند یا یک آلبوم Google Photos را انتخاب می کنند.
2. استخراج فراداده: برنامه تاریخ، زمان و داده های GPS را از رسانه استخراج می کند.
3. AI Description Generation: اینجاست که Gemini API می درخشد:
- Gemini Flash توضیحاتی را برای عکس ها و فیلم های فردی ایجاد می کند.
- Gemini 1.5 Pro این توضیحات را به عنوان ورودی می گیرد و یک فیلمنامه روایتی منسجم را صحنه به صحنه می سازد.
4. روایت صوتی: Google's Text-to-Speech API اسکریپت را به صدا تبدیل می کند.
5. ایجاد ویدیو: FFmpeg روایت را با رسانه اصلی ترکیب می کند تا ویدیوی نهایی را ایجاد کند.
6. محتوای رسانه های اجتماعی: Pixtale با تولید موارد زیر جلوتر می رود:
- زیرنویس ها و هشتگ ها برای به اشتراک گذاری
- یک پست وبلاگ کوچک که خلاصه سفر را ارائه می دهد (همچنین با استفاده از Gemini 1.5 Pro)
7. سفارشی سازی کاربر: کاربران می توانند جزئیات مکان را برای هر صحنه با استفاده از Google Maps API ویرایش کنند.
Pixtale از توانایی Gemini برای تفسیر داده‌های بصری، درک زمینه، تولید محتوای منسجم و جذاب و ساختن روایت‌هایی که احساس شخصی و معتبر می‌کند، استفاده می‌کند. این رویکرد مبتنی بر هوش مصنوعی امکان ایجاد سریع داستان‌های سفری غنی و چندرسانه‌ای را فراهم می‌کند که تولید دستی آن زمان‌بر است.

ساخته شده با

  • Google Photos Library API
  • Google Maps API

تیم

توسط

پیکستال

از

ایالات متحده