پیکستال
از عکس های سفر گرفته تا ویدیوهای روایت شده در چند دقیقه با جادوی جمینی AI..
کاری که انجام می دهد
Pixtale یک برنامه مبتنی بر هوش مصنوعی است که عکسها و ویدیوهای سفر شما را به داستانهای ویدیویی روایتشده تبدیل میکند. در اینجا نحوه کار آن آمده است:
1. آپلود: کاربران یک فایل فشرده را با رسانه سفر آپلود می کنند یا یک آلبوم Google Photos را انتخاب می کنند.
2. استخراج فراداده: برنامه تاریخ، زمان و داده های GPS را از رسانه استخراج می کند.
3. AI Description Generation: اینجاست که Gemini API می درخشد:
- Gemini Flash توضیحاتی را برای عکس ها و فیلم های فردی ایجاد می کند.
- Gemini 1.5 Pro این توضیحات را به عنوان ورودی می گیرد و یک فیلمنامه روایتی منسجم را صحنه به صحنه می سازد.
4. روایت صوتی: Google's Text-to-Speech API اسکریپت را به صدا تبدیل می کند.
5. ایجاد ویدیو: FFmpeg روایت را با رسانه اصلی ترکیب می کند تا ویدیوی نهایی را ایجاد کند.
6. محتوای رسانه های اجتماعی: Pixtale با تولید موارد زیر جلوتر می رود:
- زیرنویس ها و هشتگ ها برای به اشتراک گذاری
- یک پست وبلاگ کوچک که خلاصه سفر را ارائه می دهد (همچنین با استفاده از Gemini 1.5 Pro)
7. سفارشی سازی کاربر: کاربران می توانند جزئیات مکان را برای هر صحنه با استفاده از Google Maps API ویرایش کنند.
Pixtale از توانایی Gemini برای تفسیر دادههای بصری، درک زمینه، تولید محتوای منسجم و جذاب و ساختن روایتهایی که احساس شخصی و معتبر میکند، استفاده میکند. این رویکرد مبتنی بر هوش مصنوعی امکان ایجاد سریع داستانهای سفری غنی و چندرسانهای را فراهم میکند که تولید دستی آن زمانبر است.
ساخته شده با
- Google Photos Library API
- Google Maps API
تیم
توسط
پیکستال
از
ایالات متحده