Pixtale

จากรูปภาพการเดินทางไปจนถึงวิดีโอบรรยายได้ในไม่กี่นาทีด้วยเวทมนตร์ AI ของ Gemini

การทำงาน

Pixtale เป็นแอปที่ทำงานด้วยระบบ AI ซึ่งจะเปลี่ยนรูปภาพและวิดีโอการเดินทางของคุณให้เป็นเรื่องราวแบบวิดีโอพร้อมเสียงบรรยาย วิธีการมีดังนี้
1. อัปโหลด: ผู้ใช้อัปโหลดไฟล์ ZIP ที่มีสื่อการเดินทางหรือเลือกอัลบั้ม Google Photos
2. การดึงข้อมูลเมตา: แอปจะดึงข้อมูลวันที่ เวลา และ GPS จากสื่อ
3. การสร้างคำอธิบายด้วย AI: นี่เป็นจุดเด่นของ Gemini API
- Gemini Flash จะสร้างคำอธิบายสำหรับรูปภาพและวิดีโอแต่ละรายการ
- Gemini 1.5 Pro จะใช้คำอธิบายเหล่านี้เป็นอินพุตและสร้างสคริปต์การบรรยายที่สอดคล้องกันทีละฉาก
4. คําบรรยายเสียง: Text-to-Speech API ของ Google จะแปลงสคริปต์เป็นเสียง
5. การสร้างวิดีโอ: FFmpeg รวมคําบรรยายเข้ากับสื่อต้นฉบับเพื่อสร้างวิดีโอสุดท้าย
6. เนื้อหาโซเชียลมีเดีย: Pixtale ทำได้มากกว่านั้นด้วยการสร้าง
- คำบรรยายและแฮชแท็กสำหรับการแชร์
- บล็อกโพสต์สั้นๆ ที่สรุปการเดินทาง (ใช้ Gemini 1.5 Pro ด้วย)
7. การปรับแต่งของผู้ใช้: ผู้ใช้สามารถแก้ไขรายละเอียดตำแหน่งของแต่ละฉากได้โดยใช้ Google Maps API
Pixtale ใช้ประโยชน์จากความสามารถของ Gemini ในการตีความข้อมูลภาพ ทำความเข้าใจบริบท สร้างเนื้อหาที่สอดคล้องกันและน่าสนใจ รวมถึงสร้างเรื่องราวที่รู้สึกเป็นส่วนตัวและน่าเชื่อถือ แนวทางที่ทำงานด้วยระบบ AI นี้ช่วยให้คุณสร้างเรื่องราวการเดินทางที่สมบูรณ์แบบและมีมัลติมีเดียได้อย่างรวดเร็ว ซึ่งหากทำด้วยตนเองอาจใช้เวลานาน

สร้างขึ้นด้วย

  • Google Photos Library API
  • Google Maps API

ทีม

โดย

Pixtale

จาก

สหรัฐอเมริกา