Instacap
รับคำบรรยายที่ทำงานด้วยระบบ AI สำหรับโพสต์โซเชียลมีเดียครั้งถัดไปได้อย่างราบรื่น
การทำงาน
- จุดขายที่ไม่เหมือนใคร: Instacap เป็นตัวเชื่อม "ช่องว่างของแพลตฟอร์ม" กับผลิตภัณฑ์คำบรรยายแทนเสียงที่อิงตาม AI ที่มีอยู่ในปัจจุบัน โซลูชันปัจจุบันไม่ได้เน้นอุปกรณ์เคลื่อนที่เป็นหลัก แต่ผู้ใช้ต้องการใช้อุปกรณ์เคลื่อนที่เพื่อจัดเก็บรูปภาพและโพสต์ไปยังโซเชียลมีเดีย
- ผลลัพธ์: การลดอุปสรรคในการโพสต์จะช่วยให้ผู้ใช้มีส่วนร่วมกับผู้ติดตามมากขึ้นผ่านรีแอ็กชัน ความคิดเห็น และ DM ซึ่งจะช่วยให้โซเชียลมีเดียที่มีอยู่เปลี่ยนจากบริการเลื่อนดูข่าวร้ายๆ ไปเป็นฟีดเนื้อหาที่เน้นการแชร์ประสบการณ์ของผู้ใช้มากขึ้น
ความแตกต่างด้าน UX: Instcap เป็น Progressive Web App (PWA) ที่สร้างขึ้นบน React เพื่อให้ประสบการณ์การใช้งานบนอุปกรณ์เคลื่อนที่เป็นหลักโดยไม่ต้องดาวน์โหลดจาก App Store ผู้ใช้จะยังคงได้รับประสบการณ์การใช้งานฟีเจอร์ที่เหมือนแอปเนทีฟ เช่น ภาพหน้าจอ แถบเบราว์เซอร์ที่ซ่อนอยู่ และการเรนเดอร์ที่รวดเร็ว
แนวทางปฏิบัติแนะนำ: ใช้สถาปัตยกรรมแบบเซิร์ฟเวอร์เสมือนที่เปิดใช้โดย Firebase Cloud Functions และการกำหนดค่าระยะไกล แนวทางที่เบาะนวลนี้ช่วยปรับปรุงประสิทธิภาพด้วยการดำเนินการที่เข้มข้นนอกระบบ ในขณะเดียวกัน นักพัฒนาแอปสามารถอัปเดตคำสั่ง sys. และการกำหนดค่าโมเดลได้โดยไม่ต้องทําให้การเผยแพร่ใหม่เพื่อปรับตัวให้เข้ากับพื้นที่ AI ที่พัฒนาอย่างรวดเร็ว
- การใช้ GEMINI API: ใช้เทคนิคแบบ Few-Shot โดยอิงตามชุดข้อมูลคำบรรยายวิดีโอที่ได้รับการดูแลจัดการ ใช้ประโยชน์จากความสามารถในการสนทนาแบบหลายรอบของ Gemini เพื่อเพิ่มบริบทก่อนหน้าต่อท้าย ผู้ใช้จึงไม่ต้องเห็นคำบรรยายที่ซ้ำกันในเซสชัน
- ฟีเจอร์ V2: ลองเปลี่ยนจากจำนวนตัวอย่างแบบจำกัดเป็นการปรับแต่งแบบละเอียดตามขนาดชุดข้อมูล ซึ่งจะอนุญาตให้แทรกบริบทสำหรับคำที่ไม่ชัดเจน (เช่น "New Year’s Eve") และปรับปรุงฟีเจอร์ของบัญชี เช่น การบันทึกคำบรรยายแทนเสียงและการติดตามการสร้างคำบรรยายแทนเสียง
สร้างขึ้นด้วย
- เว็บ/Chrome
- Firebase
ทีม
โดย
Bennett Diaz
จาก
สหรัฐอเมริกา