Pixtale
يمكنك إنشاء فيديوهات من صور رحلاتك في دقائق باستخدام تكنولوجيات الذكاء الاصطناعي في Gemini.
وظيفتها
Pixtale هو تطبيق مستند إلى الذكاء الاصطناعي يحوّل صور رحلاتك وفيديوهاتك إلى قصص فيديو مصحوبة بتعليق صوتي. في ما يلي كيفية إجراء ذلك:
1. التحميل: يحمّل المستخدمون ملفًا مضغوطًا يتضمّن وسائط الرحلة أو يختارون ألبومًا في "صور Google".
2. استخراج البيانات الوصفية: يستخرج التطبيق بيانات التاريخ والوقت ونظام تحديد المواقع العالمي (GPS) من الوسائط.
3- إنشاء الأوصاف باستخدام الذكاء الاصطناعي: تُبرز Gemini API ميزاتها في ما يلي:
- تُنشئ أداة Gemini Flash أوصافًا للصور والفيديوهات الفردية.
- تأخذ أداة Gemini 1.5 Pro هذه الأوصاف كمدخلات وتُنشئ نصًا سرديًا متماسكًا مشهدًا تلو الآخر.
4. السرد الصوتي: تحوّل واجهة Text-to-Speech API من Google النص إلى صوت.
5. إنشاء الفيديو: يجمع FFmpeg السرد مع الوسائط الأصلية لإنشاء الفيديو النهائي.
6. محتوى وسائل التواصل الاجتماعي: توفّر Pixtale ميزات إضافية، مثل:
- مقاطع ترجمة وشرح وعلامات هاشتاغ لمشاركة المحتوى
- مشاركة منشور مصغر على مدونة يلخّص الرحلة (يستخدم أيضًا Gemini 1.5 Pro)
7. تخصيص المستخدم: يمكن للمستخدمين تعديل تفاصيل الموقع الجغرافي لكل مشهد باستخدام Google Maps API.
تستفيد Pixtale من قدرة Gemini على تفسير البيانات المرئية وفهم السياق وإنشاء محتوى متماسك وجذاب وصياغة قصص تبدو شخصية وأصيلة. يتيح هذا النهج المستنِد إلى الذكاء الاصطناعي إنشاء قصص سفر غنية بالوسائط المتعددة بسرعة، وهي قصص قد تستغرق وقتًا طويلاً إن تم إنشاؤها يدويًا.
مصمَّم بالاستناد إلى
- Google Photos Library API
- Google Maps API
الفريق
من
Pixtale
من
الولايات المتحدة