แชร์

11 ธ.ค. 2024

การสร้างวิดีโอรูปแบบใหม่ด้วย Gemini 2.0 Flash

Vishal Dharmadhikari

วิศวกรโซลูชันผลิตภัณฑ์

Hang Chu

Viggle

รูปภาพหลักของ Viggle Showcase

Gemini API ไม่ได้เป็นเพียงการปรับปรุงแอปเท่านั้น แต่ยังเป็นการจุดประกายการปฏิวัติการแสดงออกอย่างสร้างสรรค์ Viggle คือแอปวิดีโอ AI สุดฮิตที่ช่วยให้ทุกคนเปลี่ยนรูปภาพให้เป็นภาพเคลื่อนไหวที่น่าดึงดูดได้ ซึ่งถือเป็นผู้นำในการปฏิวัติครั้งนี้ Viggle กำลังสร้างฟีเจอร์ที่จะช่วยให้ผู้ใช้สามารถเนรมิตจินตนาการที่ยิ่งใหญ่ที่สุดของตนให้เป็นจริงได้อย่างง่ายดายด้วยวิธีใหม่ๆ ที่ไม่เคยมีมาก่อน ผ่านการทดลองใช้เวทมนตร์แบบหลายโมดัลของ Gemini 2.0 Flash ซึ่งพร้อมให้ใช้งานในเวอร์ชันทดลองเท่านั้นในปัจจุบัน โดยเฉพาะอย่างยิ่งการสร้างรูปภาพและเสียงควบคู่ไปกับความเข้าใจวิดีโอขั้นสูง

เจาะลึก Viggle: การสร้างวิดีโอด้วย AI ที่ทำงานด้วย Gemini 2.0 Flash

Viggle ดึงดูดผู้ใช้หลายล้านคนด้วยความสามารถในการเปลี่ยนรูปภาพนิ่งให้เป็นวิดีโอเคลื่อนไหวที่มีการเคลื่อนไหวของร่างกายอย่างง่ายดาย ซึ่งจุดประกายให้เนื้อหากลายเป็นไวรัลในแพลตฟอร์มโซเชียลมีเดียต่างๆ Viggle ให้บริการแอปบนอุปกรณ์เคลื่อนที่ (iOS และ Android) และแพลตฟอร์มเว็บ (viggle.ai) โดยเน้นที่เนื้อหาเกี่ยวกับมีมและท่าเต้น ฟีเจอร์ต่างๆ เช่น การสลับหน้า การทำให้รูปภาพเคลื่อนไหวด้วยท่าเต้น และการแทรกผู้ใช้ในฉากภาพยนตร์ได้รับความนิยมในฐานผู้ใช้ของ Viggle อยู่แล้ว และตอนนี้พวกเขากำลังสำรวจวิธีใหม่ๆ เพื่อยกระดับความคิดสร้างสรรค์ไปอีกขั้น

ตอนนี้ Viggle กำลังสร้างต้นแบบฟีเจอร์ 2 รายการที่ใช้ประโยชน์จากความสามารถของ Gemini 2.0 Flash


  • การเปลี่ยนรูปภาพให้เป็นตัวละครวิดีโอเสมือนจริง: Viggle ใช้การสร้างรูปภาพของ Gemini 2.0 Flash เพื่อสร้างเครื่องมือสร้างตัวละครที่ทำงานด้วยระบบ AI ผู้ใช้สามารถป้อนพรอมต์ข้อความง่ายๆ เช่น "หุ่นยนต์เต้นที่มีดวงตาเปล่งแสง" หรือ "มังกรขนปุยสีรุ้ง" แล้ว Gemini จะสร้างตัวละครเสมือนจริงที่ไม่ซ้ำกันซึ่งพร้อมที่จะแสดงในวิดีโอ จากนั้นระบบจะผสานรวมตัวละครเหล่านี้เข้ากับเครื่องมือภาพเคลื่อนไหวของ Viggle อย่างราบรื่น ซึ่งเปิดโอกาสให้บอกเล่าเรื่องราวที่ปรับเปลี่ยนในแบบของคุณได้ ลองจินตนาการว่าคุณเป็นผู้กำกับภาพยนตร์สั้นแบบเคลื่อนไหวของคุณเองที่มีตัวละครที่เกิดจากจินตนาการของคุณทั้งหมด นี่คือความสามารถที่ Viggle และ Gemini 2.0 Flash มอบให้คุณ

  • เสียงบรรยายแบบไดนามิกของ AI: Viggle ใช้ประโยชน์จากความสามารถของ Gemini 2.0 Flash ในการสร้างคำพูดและการเข้าใจวิดีโออย่างละเอียด เพื่อพัฒนาฟีเจอร์ที่เพิ่มเสียงบรรยายที่สื่อความหมายในบริบทต่างๆ ลงในวิดีโอ ฟีเจอร์นี้ไม่ใช่แค่เสียงพูดแบบโมโนโทนซึ่งอ่านสคริปต์ แต่เป็นผู้บรรยาย AI ที่วิเคราะห์เนื้อหาของวิดีโอ โดยระบุช่วงสำคัญ การกระทำ และแม้แต่อารมณ์ เพื่อสร้างคําบรรยายที่ส่งเสริมภาพได้อย่างลงตัว ไม่ว่าจะเป็นการบรรยายที่ตลกขบขันในวิดีโอการเต้นหรือการบรรยายฉากแฟนตาซีอันยิ่งใหญ่ ผู้บรรยาย AI จะเพิ่มมิติใหม่ในการมีส่วนร่วม

ปลดล็อกความคิดสร้างสรรค์และการมีส่วนร่วมไปอีกระดับ

การผสานรวม Gemini 2.0 Flash พร้อมที่จะยกระดับประสบการณ์การใช้งาน Viggle ในหลายวิธีสำคัญ ดังนี้


  • การสร้างตัวละครที่ง่ายขึ้น: การสร้างรูปภาพของ Gemini 2.0 Flash ช่วยปรับปรุงกระบวนการสร้างและปรับแต่งตัวละครวิดีโอ ตอนนี้ผู้ใช้สามารถสร้างตัวละครที่ไม่ซ้ำกันตามไอเดียของตนเองได้โดยไม่ต้องอาศัยทักษะการออกแบบขั้นสูงหรือใช้ตัวเลือกที่กำหนดไว้ล่วงหน้าแบบจำกัด เวิร์กโฟลว์ที่เรียบง่ายนี้จะช่วยให้ผู้ใช้จำนวนมากขึ้นสามารถสร้างสรรค์วิสัยทัศน์เชิงสร้างสรรค์ให้เป็นจริง

  • เนื้อหาที่ปรับเปลี่ยนในแบบของคุณมากขึ้น: Gemini 2.0 Flash ช่วยให้ผู้ใช้สร้างวิดีโอบรรยายที่ปรับเปลี่ยนในแบบของคุณได้อย่างมาก ตัวละครที่ออกแบบเองเมื่อรวมเข้ากับเสียงบรรยายแบบไดนามิกของ AI จะช่วยให้การเล่าเรื่องมีความโดดเด่นไม่เหมือนใคร ซึ่งจะช่วยกระชับความสัมพันธ์ระหว่างครีเอเตอร์กับผู้ชม

  • เปิดโอกาสให้ครีเอทีฟโฆษณาได้มากขึ้น: การผสมผสานระหว่างตัวละครเสมือนจริงกับการบรรยายของ AI ช่วยขยายศักยภาพการสร้างสรรค์ของวิดีโอแบบสั้นบน Viggle ผู้ใช้สามารถสำรวจรูปแบบการเล่าเรื่องใหม่ๆ ซึ่งแตกต่างจากรูปแบบวิดีโอแบบดั้งเดิม

ในอนาคต

Viggle รู้สึกตื่นเต้นที่จะได้สำรวจศักยภาพของโมเดล Gemini 2.0 เพิ่มเติมเพื่อปรับปรุงแพลตฟอร์ม และคาดหวังถึงอนาคตที่ AI จะผสานรวมเข้ากับทุกขั้นตอนของกระบวนการสร้างสรรค์อย่างราบรื่น ซึ่งจะช่วยให้ทุกคนสามารถเป็นครีเอเตอร์วิดีโอได้

"ทุกคนที่ Viggle ล้วนเป็นครีเอเตอร์ เรากำลังสร้างมีม สำรวจการจับภาพการเคลื่อนไหวสำหรับโปรเจ็กต์ระดับถัดไป และสร้างมัลติเวิร์สของเราเอง ความสามารถในการสร้างรูปภาพจากจินตนาการและการบรรยายด้วยเสียงสมจริงของ Gemini 2.0 Flash จะช่วยให้ผู้ใช้ปลดล็อกศักยภาพใหม่ๆ ในการสร้างสรรค์การเล่าเรื่องได้อย่างที่ไม่เคยมีมาก่อน"

— Hang Chu ผู้ก่อตั้ง Viggle

ผลงานของ Viggle กับ Gemini 2.0 Flash แสดงให้เห็นถึงศักยภาพของ AI ในการปฏิวัติการสร้างวิดีโอและช่วยให้ผู้ใช้แสดงออกด้วยเครื่องมือใหม่ๆ การทำงานร่วมกันครั้งนี้ถือเป็นก้าวสู่อนาคตของการเล่าเรื่องที่ทำงานด้วยระบบ AI ดูข้อมูลเพิ่มเติมเกี่ยวกับการสร้างด้วย Gemini ได้ที่เอกสารประกอบของ Gemini API