แชร์

11 ธ.ค. 2024

การสร้างวิดีโอรูปแบบใหม่ด้วย Gemini 2.0 Flash

Vishal Dharmadhikari

วิศวกรโซลูชันผลิตภัณฑ์

Hang Chu

Viggle

รูปภาพหลักของ Viggle Showcase

Gemini API ไม่ได้เป็นเพียงการปรับปรุงแอปเท่านั้น แต่ยังเป็นการจุดประกายการปฏิวัติการแสดงออกอย่างสร้างสรรค์ Viggle คือแอปวิดีโอ AI สุดฮิตที่ช่วยให้ทุกคนเปลี่ยนรูปภาพให้เป็นภาพเคลื่อนไหวที่น่าดึงดูดได้ ซึ่งถือเป็นผู้นำในการปฏิวัติครั้งนี้ Viggle กำลังสร้างฟีเจอร์ที่จะช่วยให้ผู้ใช้สามารถเนรมิตจินตนาการที่แปลกประหลาดที่สุดให้กลายเป็นจริงได้อย่างง่ายดายในแบบที่ไม่เคยมีมาก่อน ด้วยการทดลองใช้เวทมนตร์มัลติโมดของ Gemini 2.0 Flash ซึ่งขณะนี้มีให้บริการในเวอร์ชันทดลองเท่านั้น โดยเฉพาะอย่างยิ่งความสามารถในการเข้าใจวิดีโอขั้นสูงและเอาต์พุตเสียงควบคู่ไปกับการสร้างรูปภาพด้วย Imagen 3

เบื้องหลัง Viggle: ขับเคลื่อนการสร้างวิดีโอด้วย AI ด้วย Gemini 2.0 Flash และ Imagen 3

Viggle ดึงดูดผู้ใช้หลายล้านคนด้วยความสามารถในการเปลี่ยนรูปภาพนิ่งให้เป็นวิดีโอเคลื่อนไหวที่มีการเคลื่อนไหวของร่างกายอย่างง่ายดาย ซึ่งจุดประกายให้เนื้อหากลายเป็นไวรัลในแพลตฟอร์มโซเชียลมีเดียต่างๆ Viggle ให้บริการแอปบนอุปกรณ์เคลื่อนที่ (iOS และ Android) และแพลตฟอร์มเว็บ (viggle.ai) โดยเน้นที่เนื้อหาเกี่ยวกับมีมและท่าเต้น ฟีเจอร์ต่างๆ เช่น การสลับหน้า การทำให้รูปภาพเคลื่อนไหวด้วยท่าเต้น และการแทรกผู้ใช้ในฉากภาพยนตร์ได้รับความนิยมในฐานผู้ใช้ของ Viggle อยู่แล้ว และตอนนี้พวกเขากำลังสำรวจวิธีใหม่ๆ เพื่อยกระดับความคิดสร้างสรรค์ไปอีกขั้น

ตอนนี้ Viggle กำลังสร้างต้นแบบฟีเจอร์ 2 รายการที่ใช้ประโยชน์จากความสามารถของ Gemini 2.0 Flash และ Imagen 3 ดังนี้


  • การเปลี่ยนรูปภาพให้เป็นตัวละครวิดีโอเสมือนจริง: Viggle ใช้ Imagen 3 ในการสร้างรูปภาพเพื่อสร้างเครื่องมือสร้างตัวละครที่ทำงานด้วยระบบ AI ผู้ใช้สามารถป้อนพรอมต์ข้อความง่ายๆ เช่น "หุ่นยนต์เต้นที่มีดวงตาเปล่งแสง" หรือ "มังกรขนปุยสีรุ้ง" แล้วโมเดลจะสร้างตัวละครเสมือนจริงที่ไม่เหมือนใครให้พร้อมแสดงในวิดีโอ จากนั้นระบบจะผสานรวมตัวละครเหล่านี้เข้ากับเครื่องมือภาพเคลื่อนไหวของ Viggle อย่างราบรื่น ซึ่งเปิดโอกาสให้บอกเล่าเรื่องราวที่ปรับเปลี่ยนในแบบของคุณได้ ลองจินตนาการว่าคุณเป็นผู้กำกับภาพยนตร์สั้นแบบเคลื่อนไหวของคุณเองที่มีตัวละครที่เกิดจากจินตนาการของคุณทั้งหมด นี่คือความสามารถที่ Viggle และ Imagen 3 มอบให้คุณ

  • เสียงบรรยายแบบไดนามิกของ AI: Viggle ยังใช้ประโยชน์จากความสามารถของ Gemini 2.0 Flash ในการสร้างคำพูดและการเข้าใจวิดีโออย่างละเอียด เพื่อพัฒนาฟีเจอร์ที่เพิ่มเสียงบรรยายที่สื่อความหมายในบริบทต่างๆ ลงในวิดีโอ ฟีเจอร์นี้ไม่ใช่แค่เสียงพูดแบบโมโนโทนซึ่งอ่านสคริปต์ แต่เป็นผู้บรรยาย AI ที่วิเคราะห์เนื้อหาของวิดีโอ โดยระบุช่วงสำคัญ การกระทำ และแม้แต่อารมณ์ เพื่อสร้างคําบรรยายที่ส่งเสริมภาพได้อย่างลงตัว ไม่ว่าจะเป็นการบรรยายที่ตลกขบขันในวิดีโอการเต้นหรือการบรรยายฉากแฟนตาซีอันยิ่งใหญ่ ผู้บรรยาย AI จะเพิ่มมิติใหม่ในการมีส่วนร่วม

ปลดล็อกความคิดสร้างสรรค์และการมีส่วนร่วมไปอีกระดับ

การผสานรวม Generative AI จะช่วยปรับปรุงประสบการณ์การใช้งาน Viggle ได้หลายวิธีที่สำคัญ ดังนี้


  • การสร้างตัวละครที่ง่ายขึ้น: การสร้างรูปภาพของ Imagen 3 ช่วยปรับปรุงกระบวนการสร้างและปรับแต่งตัวละครวิดีโอ ตอนนี้ผู้ใช้สามารถสร้างตัวละครที่ไม่ซ้ำกันตามไอเดียของตนเองได้โดยไม่ต้องอาศัยทักษะการออกแบบขั้นสูงหรือใช้ตัวเลือกที่กำหนดไว้ล่วงหน้าแบบจำกัด เวิร์กโฟลว์ที่เรียบง่ายนี้จะช่วยให้ผู้ใช้จำนวนมากขึ้นสามารถสร้างสรรค์วิสัยทัศน์เชิงสร้างสรรค์ให้เป็นจริง

  • เนื้อหาที่ปรับเปลี่ยนในแบบของคุณมากขึ้น: Gemini 2.0 Flash ช่วยให้ผู้ใช้สร้างวิดีโอบรรยายที่ปรับเปลี่ยนในแบบของคุณได้อย่างมาก ตัวละครที่ออกแบบเองเมื่อรวมเข้ากับเสียงบรรยายแบบไดนามิกของ AI จะช่วยให้การเล่าเรื่องมีความโดดเด่นไม่เหมือนใคร ซึ่งจะช่วยกระชับความสัมพันธ์ระหว่างครีเอเตอร์กับผู้ชม

  • เปิดโอกาสให้ครีเอทีฟโฆษณาได้มากขึ้น: การผสมผสานระหว่างตัวละครเสมือนจริงกับการบรรยายของ AI ช่วยขยายศักยภาพการสร้างสรรค์ของวิดีโอแบบสั้นบน Viggle ผู้ใช้สามารถสำรวจรูปแบบการเล่าเรื่องใหม่ๆ ซึ่งแตกต่างจากรูปแบบวิดีโอแบบดั้งเดิม

ในอนาคต

Viggle รู้สึกตื่นเต้นที่จะได้สำรวจศักยภาพของ Gemini 2.0 และโมเดลการสร้างรูปภาพเพิ่มเติมเพื่อปรับปรุงแพลตฟอร์ม และคาดหวังถึงอนาคตที่ AI จะผสานรวมเข้ากับทุกขั้นตอนของกระบวนการสร้างสรรค์ได้อย่างราบรื่น ซึ่งจะช่วยให้ทุกคนสามารถเป็นผู้สร้างวิดีโอได้

"ทุกคนที่ Viggle ล้วนเป็นครีเอเตอร์ เรากำลังสร้างมีม สำรวจการจับภาพการเคลื่อนไหวสำหรับโปรเจ็กต์ระดับถัดไป และสร้างมัลติเวิร์สของเราเอง เราเชื่อว่าความสามารถของเสียงบรรยายที่สมจริงของ Gemini 2.0 Flash จะช่วยให้ผู้ใช้ปลดล็อกศักยภาพใหม่ๆ ในการสร้างสรรค์การเล่าเรื่องได้อย่างที่ไม่เคยมีมาก่อน"

— Hang Chu ผู้ก่อตั้ง Viggle

ผลงานของ Viggle กับ Gemini 2.0 Flash และ Imagen 3 แสดงให้เห็นถึงศักยภาพของ AI ในการปฏิวัติการสร้างวิดีโอและช่วยให้ผู้ใช้มีเครื่องมือใหม่ๆ ในการแสดงออก การทำงานร่วมกันครั้งนี้ถือเป็นก้าวสู่อนาคตของการเล่าเรื่องที่ทำงานด้วยระบบ AI ดูข้อมูลเพิ่มเติมเกี่ยวกับการสร้างด้วย Gemini ได้ที่เอกสารประกอบของ Gemini API และอ่านเพิ่มเติมเกี่ยวกับ Imagen 3 เพื่อดูความก้าวหน้าล่าสุดในการสร้างรูปภาพ