แชร์

11 ธ.ค. 2024

พลิกโฉมการสร้างวิดีโอด้วย Gemini 2.0 Flash

Vishal Dharmadhikari

วิศวกรโซลูชันผลิตภัณฑ์

Hang Chu

Viggle

รูปภาพหลักของ Viggle Showcase

API ของ Gemini ไม่ได้เพียงแค่ปรับปรุงแอป แต่ยังจุดประกายการปฏิวัติการแสดงออกอย่างสร้างสรรค์ด้วย Viggle ซึ่งเป็นแอปวิดีโอ AI ที่กำลังมาแรงและช่วยให้ทุกคนเปลี่ยนรูปภาพเป็นภาพเคลื่อนไหวที่น่าสนใจได้เป็นผู้นำในการปฏิวัติครั้งนี้ การทดลองใช้ความมหัศจรรย์แบบมัลติโมดัลของ Gemini 2.0 Flash ซึ่งปัจจุบันพร้อมให้บริการในเวอร์ชันทดลองเท่านั้น โดยเฉพาะความสามารถในการทำความเข้าใจวิดีโอขั้นสูงและเอาต์พุตเสียงควบคู่ไปกับการสร้างรูปภาพโดย Imagen 3 ทำให้ Viggle สร้างฟีเจอร์ที่จะช่วยให้ผู้ใช้เปลี่ยนจินตนาการที่บรรเจิดที่สุดให้กลายเป็นจริงได้อย่างง่ายดายในรูปแบบที่ไม่เคยมีมาก่อน

เบื้องหลัง Viggle: ขับเคลื่อนการสร้างวิดีโอ AI ด้วย Gemini 2.0 Flash และ Imagen 3

Viggle ได้ดึงดูดผู้ใช้หลายล้านคนด้วยความสามารถในการเปลี่ยนรูปภาพนิ่งให้เป็นวิดีโอเคลื่อนไหวที่มีการเคลื่อนไหวทั้งตัวได้อย่างง่ายดาย ซึ่งจุดประกายให้เกิดเนื้อหาที่กลายเป็นไวรัลในแพลตฟอร์มโซเชียลมีเดียต่างๆ Viggle มุ่งเน้นที่เนื้อหาเกี่ยวกับมุกตลกและเนื้อหาการเต้น โดยมีแอปบนอุปกรณ์เคลื่อนที่ (iOS และ Android) และแพลตฟอร์มเว็บ (viggle.ai) ฟีเจอร์ต่างๆ เช่น การสลับใบหน้า การทำให้รูปภาพเคลื่อนไหวด้วยท่าเต้น และการแทรกผู้ใช้ลงในฉากภาพยนตร์ได้รับความนิยมในฐานผู้ใช้ของ Viggle อยู่แล้ว และตอนนี้ Viggle กำลังหาวิธีใหม่ๆ ในการยกระดับความคิดสร้างสรรค์ไปอีกขั้น

ตอนนี้ Viggle กำลังสร้างต้นแบบฟีเจอร์ 2 อย่างที่ใช้ประโยชน์จากพลังของ Gemini 2.0 Flash และ Imagen 3 ดังนี้


  • เปลี่ยนรูปภาพเป็นตัวละครวิดีโอเสมือน: Viggle ใช้ Imagen 3 ในการสร้างรูปภาพเพื่อสร้างโรงหล่อตัวละครที่ทำงานด้วยระบบ AI ผู้ใช้สามารถป้อนพรอมต์ข้อความง่ายๆ เช่น "หุ่นยนต์เต้นรำที่มีดวงตาเรืองแสง" หรือ "มังกรปุยสีรุ้ง" แล้วโมเดลจะสร้างตัวละครเสมือนที่ไม่ซ้ำใครซึ่งพร้อมเป็นดาราในวิดีโอของผู้ใช้ จากนั้นระบบจะผสานรวมตัวละครเหล่านี้เข้ากับเอนจินภาพเคลื่อนไหวของ Viggle อย่างราบรื่น ซึ่งจะเปิดจักรวาลแห่งความเป็นไปได้ในการเล่าเรื่องที่ปรับเปลี่ยนในแบบของคุณ ลองจินตนาการถึงการกำกับภาพยนตร์สั้นแบบเคลื่อนไหวของคุณเองโดยมีตัวละครที่เกิดจากจินตนาการของคุณทั้งหมด นั่นคือพลังที่ Viggle และ Imagen 3 มอบให้คุณ

  • คำบรรยาย AI แบบไดนามิก: Viggle ยังใช้ความสามารถของ Gemini 2.0 Flash ในการสร้างคำพูดและความเข้าใจวิดีโออย่างลึกซึ้งเพื่อพัฒนาฟีเจอร์ที่จะเพิ่มเสียงบรรยายที่สมบูรณ์ตามบริบทลงในวิดีโอใดก็ได้ นี่ไม่ใช่แค่เสียงพูดที่อ่านสคริปต์แบบเรียบๆ แต่เป็นผู้เล่าเรื่องโดย AI ที่วิเคราะห์เนื้อหาของวิดีโอ โดยจะระบุช่วงเวลาสำคัญ การกระทำ และแม้แต่อารมณ์ เพื่อสร้างคำบรรยายที่เสริมภาพได้อย่างลงตัว ไม่ว่าจะเป็นการแสดงความคิดเห็นตลกๆ ในวิดีโอการเต้นหรือคำอธิบายสุดอลังการของฉากแฟนตาซี ผู้บรรยาย AI จะช่วยเพิ่มมิติใหม่ๆ ให้กับการมีส่วนร่วม

ปลดล็อกความคิดสร้างสรรค์และการมีส่วนร่วมไปอีกขั้น

การผสานรวม Generative AI พร้อมที่จะปรับปรุงประสบการณ์การใช้งาน Viggle ในหลายๆ ด้านที่สำคัญ ดังนี้


  • การสร้างตัวละครที่ง่ายขึ้น: การสร้างรูปภาพของ Imagen 3 ช่วยเพิ่มประสิทธิภาพกระบวนการสร้างและปรับแต่งตัวละครในวิดีโอ ตอนนี้ผู้ใช้สามารถสร้างตัวละครที่ไม่ซ้ำใครตามไอเดียของตนเองได้แล้ว โดยไม่ต้องมีทักษะการออกแบบขั้นสูงหรือพึ่งพาตัวเลือกที่กำหนดไว้ล่วงหน้าแบบจำกัด เวิร์กโฟลว์ที่เรียบง่ายนี้ช่วยให้ผู้ใช้จำนวนมากขึ้นสามารถสร้างสรรค์วิสัยทัศน์เชิงสร้างสรรค์ของตนให้เป็นจริงได้

  • เนื้อหาที่ปรับเปลี่ยนในแบบของคุณมากขึ้น: Gemini 2.0 Flash ช่วยให้ผู้ใช้สร้างเรื่องราววิดีโอที่ปรับเปลี่ยนในแบบของคุณได้อย่างมาก ตัวละครที่ออกแบบมาโดยเฉพาะเมื่อรวมกับการบรรยายด้วย AI แบบไดนามิกจะช่วยให้ครีเอเตอร์เล่าเรื่องราวที่ไม่เหมือนใครซึ่งจะช่วยกระชับความสัมพันธ์ระหว่างครีเอเตอร์กับผู้ชม

  • ความเป็นไปได้ด้านครีเอทีฟโฆษณาที่เพิ่มขึ้น: การผสมผสานตัวละครเสมือนจริงและการบรรยายด้วย AI จะช่วยขยายศักยภาพด้านครีเอทีฟโฆษณาของวิดีโอแบบสั้นบน Viggle ผู้ใช้สามารถสำรวจรูปแบบการเล่าเรื่องใหม่ๆ ที่นอกเหนือจากรูปแบบวิดีโอดั้งเดิม

ในอนาคต

Viggle ตื่นเต้นที่จะได้สำรวจศักยภาพของ Gemini 2.0 และโมเดล Image Gen เพิ่มเติมเพื่อปรับปรุงแพลตฟอร์มของตน และมองเห็นอนาคตที่ AI จะผสานรวมเข้ากับทุกขั้นตอนของกระบวนการสร้างสรรค์ได้อย่างราบรื่น ซึ่งจะช่วยให้ทุกคนเป็นครีเอเตอร์วิดีโอได้

"ที่ Viggle ทุกคนเป็นครีเอเตอร์ เรากำลังสร้างมีม สำรวจการจับภาพเคลื่อนไหวสำหรับโปรเจ็กต์ระดับถัดไป และสร้างมัลติเวิร์สของเราเอง ความสามารถในการบรรยายด้วยเสียงที่สมจริงของ Gemini 2.0 Flash จะช่วยให้ผู้ใช้ปลดล็อกศักยภาพใหม่ๆ และสร้างสรรค์การเล่าเรื่องได้อย่างที่ไม่เคยมีมาก่อน"

— Hang Chu ผู้ก่อตั้ง Viggle

การทำงานของ Viggle ร่วมกับ Gemini 2.0 Flash และ Imagen 3 แสดงให้เห็นถึงศักยภาพของ AI ในการพลิกโฉมการสร้างวิดีโอและเพิ่มศักยภาพให้ผู้ใช้ด้วยเครื่องมือใหม่ๆ สำหรับการแสดงออกถึงตัวตน การทำงานร่วมกันครั้งนี้ถือเป็นก้าวหนึ่งสู่อนาคตของการเล่าเรื่องที่ทำงานด้วยระบบ AI ดูข้อมูลเพิ่มเติมเกี่ยวกับการสร้างด้วย Gemini ได้ที่เอกสารประกอบของ Gemini API และอ่านเพิ่มเติมเกี่ยวกับ Imagen 3 เพื่อดูความก้าวหน้าล่าสุดของเราในการสร้างรูปภาพ