به اشتراک بگذارید

11 دسامبر 2024

ایجاد مجدد ویدیو با فلش Gemini 2.0

ویشال دارمادهیکاری

مهندس راه حل های محصول

هنگ چو

تکان دادن

قهرمان ویترین ویگل

Gemini API فقط برنامه ها را تقویت نمی کند. این جرقه یک انقلاب در بیان خلاق است. Viggle ، حس ویدیویی ویروسی هوش مصنوعی که به هر کسی اجازه می‌دهد عکس‌ها را به انیمیشن‌های جذاب تبدیل کند، در خط مقدم این انقلاب قرار دارد. با آزمایش جادوی چند وجهی Gemini 2.0 Flash که در حال حاضر فقط در پیش‌نمایش آزمایشی موجود است – به‌ویژه قابلیت درک ویدیویی و خروجی صوتی پیشرفته آن در کنار تولید تصویر توسط Imagen 3 – Viggle در حال ساخت ویژگی‌هایی است که کاربران را قادر می‌سازد تا بی‌دردسرترین تصورات خود را زنده کنند. به روش هایی که قبلاً هرگز ممکن نبود.

Inside Viggle: تقویت ساخت ویدیو با هوش مصنوعی با فلش Gemini 2.0 و Imagen 3

Viggle در حال حاضر میلیون ها کاربر را با توانایی خود در تبدیل آسان تصاویر استاتیک به فیلم های متحرک با حرکت تمام بدن مجذوب کرده است و باعث ایجاد محتوای ویروسی در سراسر پلتفرم های رسانه های اجتماعی می شود. Viggle با تمرکز بر میم ها و محتوای رقص، برنامه های تلفن همراه (iOS و Android) و یک پلت فرم وب (viggle.ai) را ارائه می دهد. ویژگی‌هایی مانند تعویض چهره، متحرک کردن تصاویر با حرکات رقص، و قرار دادن کاربران در صحنه‌های فیلم در حال حاضر در بین کاربران Viggle محبوب هستند و اکنون آنها در حال بررسی راه‌های جدیدی برای ارتقای خلاقیت به سطح بعدی هستند.

Viggle اکنون دو ویژگی را با استفاده از قدرت Gemini 2.0 Flash و Imagen 3 نمونه سازی می کند:


  • کاراکترهای ویدیویی تصویر به مجازی: Viggle از Imagen 3 برای تولید تصویر برای ایجاد یک شخصیت جعلی مبتنی بر هوش مصنوعی استفاده می کند. کاربران می‌توانند پیام‌های متنی ساده را ارائه دهند - «روبات رقصنده با چشم‌های درخشان» یا «اژدهای کرکی رنگین‌کمان» - و این مدل شخصیت‌های مجازی منحصربه‌فردی را تجسم می‌کند که آماده بازی در ویدیوهایشان هستند. سپس این شخصیت‌ها به‌طور یکپارچه در موتور انیمیشن Viggle ادغام می‌شوند و دنیایی از امکانات داستان‌گویی شخصی‌شده را باز می‌کنند. تصور کنید که فیلم کوتاه متحرک خود را کارگردانی می‌کنید که در آن شخصیت‌هایی کاملاً از تخیل شما متولد شده‌اند - این قدرتی است که Viggle و Imagen 3 در دستان شما قرار می‌دهند.

  • روایت هوش مصنوعی پویا: Viggle همچنین از توانایی Gemini 2.0 Flash برای تولید گفتار و درک عمیق ویدیویی آن بهره می‌برد تا قابلیتی را ایجاد کند که صداهای متناوب غنی را به هر ویدیویی اضافه کند. این فقط یک صدای یکنواخت در حال خواندن یک فیلمنامه نیست. این یک داستان سرای هوش مصنوعی است که محتوای ویدیو را تجزیه و تحلیل می‌کند - لحظات کلیدی، اقدامات و حتی احساسات را شناسایی می‌کند تا روایتی را تولید کند که کاملاً مکمل تصاویر باشد. خواه این یک تفسیر طنز در یک ویدیوی رقص باشد یا یک توصیف حماسی از یک صحنه فانتزی، راوی هوش مصنوعی بعد کاملاً جدیدی از تعامل را اضافه می کند.

باز کردن سطوح جدیدی از خلاقیت و تعامل

ادغام هوش مصنوعی مولد برای بهبود تجربه Viggle از چندین راه کلیدی آماده است:


  • ایجاد کاراکتر ساده شده: تولید تصویر Imagen 3 فرآیند ایجاد و سفارشی کردن کاراکترهای ویدیویی را ساده می کند. کاربران اکنون می توانند شخصیت های منحصر به فرد را بر اساس ایده های خود تولید کنند و نیاز به مهارت های طراحی پیشرفته یا اتکا به گزینه های از پیش تعیین شده محدود را از بین ببرند. این گردش کار ساده به کاربران بیشتری امکان می دهد تا دیدگاه های خلاقانه خود را زنده کنند.

  • محتوای شخصی‌شده‌تر: Gemini 2.0 Flash به کاربران امکان می‌دهد تا روایت‌های ویدیویی بسیار شخصی‌سازی‌شده را بسازند. کاراکترهای طراحی شده سفارشی، همراه با روایت پویا هوش مصنوعی، امکان داستان سرایی منحصر به فرد را فراهم می کند که ارتباط بین سازندگان و مخاطبانشان را تقویت می کند.

  • امکانات خلاقانه گسترده: ترکیب شخصیت‌های مجازی و روایت هوش مصنوعی، پتانسیل خلاقانه ویدیوهای کوتاه در Viggle را گسترش می‌دهد. کاربران می توانند اشکال جدیدی از داستان سرایی را کشف کنند و فراتر از فرمت های ویدیویی سنتی پیش بروند.

نگاه کردن به جلو

Viggle مشتاق است تا پتانسیل Gemini 2.0 و مدل‌های نسل تصویر را برای بهبود پلتفرم خود بررسی کند و آینده‌ای را متصور است که در آن هوش مصنوعی به طور یکپارچه در هر مرحله از فرآیند خلاقیت ادغام می‌شود و هر کسی را قادر می‌سازد تا یک سازنده ویدیو شود.

در Viggle، همه یک خالق هستند. ما در حال ساختن میم‌ها، کاوش تصویربرداری حرکتی برای پروژه‌های سطح بعدی، و ساختن چندجهانی خودمان هستیم. با قابلیت‌های صوتی واقعی Gemini 2.0 Flash، ما بر این باوریم که کاربران ما پتانسیل جدیدی را باز می‌کنند - داستان سرایی را مانند قبل از آن ساخته‌اند.

- هانگ چو، بنیانگذار Viggle

کار Viggle با Gemini 2.0 Flash و Imagen 3 پتانسیل هوش مصنوعی را برای تغییر ایجاد ویدیو و توانمندسازی کاربران با ابزارهای جدید برای بیان خود نشان می دهد. این همکاری گامی به سوی آینده داستان سرایی مبتنی بر هوش مصنوعی است. برای کسب اطلاعات بیشتر در مورد ساخت با Gemini، از مستندات Gemini API دیدن کنید و اطلاعات بیشتری در مورد Imagen 3 برای آخرین پیشرفت های ما در تولید تصویر بخوانید.

اتاق ها

باز کردن تعاملات آواتار غنی تر با قابلیت های متن و صوتی Gemini 2.0

،
به اشتراک بگذارید

11 دسامبر 2024

ایجاد مجدد ویدیو با فلش Gemini 2.0

ویشال دارمادیکاری

مهندس راه حل های محصول

هنگ چو

تکان دادن

قهرمان ویترین ویگل

Gemini API فقط برنامه‌ها را تقویت نمی‌کند. این جرقه یک انقلاب در بیان خلاق است. Viggle ، حس ویدیویی ویروسی هوش مصنوعی که به هر کسی اجازه می‌دهد عکس‌ها را به انیمیشن‌های جذاب تبدیل کند، در خط مقدم این انقلاب قرار دارد. با آزمایش جادوی چند وجهی Gemini 2.0 Flash که در حال حاضر فقط در پیش‌نمایش آزمایشی موجود است – به‌ویژه قابلیت درک ویدیویی و خروجی صوتی پیشرفته آن در کنار تولید تصویر توسط Imagen 3 – Viggle در حال ساخت ویژگی‌هایی است که کاربران را قادر می‌سازد تا بی‌دردسرترین تصورات خود را زنده کنند. به روش هایی که قبلاً ممکن نبود.

Inside Viggle: تقویت ساخت ویدیو با هوش مصنوعی با فلش Gemini 2.0 و Imagen 3

Viggle در حال حاضر میلیون ها کاربر را با توانایی خود در تبدیل آسان تصاویر استاتیک به فیلم های متحرک با حرکت تمام بدن مجذوب کرده است و باعث ایجاد محتوای ویروسی در سراسر پلتفرم های رسانه های اجتماعی می شود. Viggle با تمرکز بر میم ها و محتوای رقص، برنامه های تلفن همراه (iOS و Android) و یک پلت فرم وب (viggle.ai) را ارائه می دهد. ویژگی‌هایی مانند تعویض چهره، متحرک کردن تصاویر با حرکات رقص، و قرار دادن کاربران در صحنه‌های فیلم در حال حاضر در بین کاربران Viggle محبوب هستند و اکنون آنها در حال بررسی راه‌های جدیدی برای ارتقای خلاقیت به سطح بعدی هستند.

Viggle اکنون دو ویژگی را با استفاده از قدرت Gemini 2.0 Flash و Imagen 3 نمونه سازی می کند:


  • کاراکترهای ویدیویی تصویر به مجازی: Viggle از Imagen 3 برای تولید تصویر برای ایجاد یک شخصیت جعلی مبتنی بر هوش مصنوعی استفاده می کند. کاربران می‌توانند پیام‌های متنی ساده را ارائه دهند - «روبات رقصنده با چشم‌های درخشان» یا «اژدهای کرکی رنگین‌کمان» - و این مدل شخصیت‌های مجازی منحصربه‌فردی را تجسم می‌کند که آماده بازی در ویدیوهایشان هستند. سپس این شخصیت‌ها به‌طور یکپارچه در موتور انیمیشن Viggle ادغام می‌شوند و دنیایی از امکانات داستان‌گویی شخصی‌شده را باز می‌کنند. تصور کنید که فیلم کوتاه متحرک خود را کارگردانی می‌کنید که در آن شخصیت‌هایی کاملاً از تخیل شما متولد شده‌اند - این قدرتی است که Viggle و Imagen 3 در دستان شما قرار می‌دهند.

  • روایت هوش مصنوعی پویا: Viggle همچنین از توانایی Gemini 2.0 Flash برای تولید گفتار و درک عمیق ویدیویی آن بهره می‌برد تا قابلیتی را ایجاد کند که صداهای متناوب غنی را به هر ویدیویی اضافه کند. این فقط یک صدای یکنواخت در حال خواندن یک فیلمنامه نیست. این یک داستان سرای هوش مصنوعی است که محتوای ویدیو را تجزیه و تحلیل می‌کند - لحظات کلیدی، اقدامات و حتی احساسات را شناسایی می‌کند تا روایتی را تولید کند که کاملاً مکمل تصاویر باشد. خواه این یک تفسیر طنز در یک ویدیوی رقص باشد یا یک توصیف حماسی از یک صحنه فانتزی، راوی هوش مصنوعی بعد کاملاً جدیدی از تعامل را اضافه می کند.

باز کردن سطوح جدیدی از خلاقیت و تعامل

ادغام هوش مصنوعی مولد برای بهبود تجربه Viggle از چندین راه کلیدی آماده است:


  • ایجاد کاراکتر ساده شده: تولید تصویر Imagen 3 فرآیند ایجاد و سفارشی کردن کاراکترهای ویدیویی را ساده می کند. کاربران اکنون می توانند شخصیت های منحصر به فرد را بر اساس ایده های خود تولید کنند و نیاز به مهارت های طراحی پیشرفته یا اتکا به گزینه های از پیش تعیین شده محدود را از بین ببرند. این گردش کار ساده به کاربران بیشتری امکان می دهد تا دیدگاه های خلاقانه خود را زنده کنند.

  • محتوای شخصی‌شده‌تر: Gemini 2.0 Flash به کاربران امکان می‌دهد تا روایت‌های ویدیویی بسیار شخصی‌سازی‌شده را بسازند. کاراکترهای طراحی شده سفارشی، همراه با روایت پویا هوش مصنوعی، امکان داستان سرایی منحصر به فرد را فراهم می کند که ارتباط بین سازندگان و مخاطبانشان را تقویت می کند.

  • امکانات خلاقانه گسترده: ترکیب شخصیت‌های مجازی و روایت هوش مصنوعی، پتانسیل خلاقانه ویدیوهای کوتاه در Viggle را گسترش می‌دهد. کاربران می توانند اشکال جدیدی از داستان سرایی را کشف کنند و فراتر از فرمت های ویدیویی سنتی پیش بروند.

نگاه کردن به جلو

Viggle مشتاق است تا پتانسیل Gemini 2.0 و مدل‌های نسل تصویر را برای بهبود پلتفرم خود بررسی کند و آینده‌ای را متصور است که در آن هوش مصنوعی به طور یکپارچه در هر مرحله از فرآیند خلاقیت ادغام می‌شود و هر کسی را قادر می‌سازد تا یک سازنده ویدیو شود.

در Viggle، همه یک خالق هستند. ما در حال ساختن میم‌ها، کاوش تصویربرداری حرکتی برای پروژه‌های سطح بعدی، و ساختن چندجهانی خودمان هستیم. با قابلیت‌های صوتی واقعی Gemini 2.0 Flash، ما بر این باوریم که کاربران ما پتانسیل جدیدی را باز می‌کنند - داستان سرایی را مانند قبل از آن ساخته‌اند.

- هانگ چو، بنیانگذار Viggle

کار Viggle با Gemini 2.0 Flash و Imagen 3 پتانسیل هوش مصنوعی را برای تغییر ایجاد ویدیو و توانمندسازی کاربران با ابزارهای جدید برای بیان خود نشان می دهد. این همکاری گامی به سوی آینده داستان سرایی مبتنی بر هوش مصنوعی است. برای کسب اطلاعات بیشتر در مورد ساخت با Gemini، از مستندات Gemini API دیدن کنید و اطلاعات بیشتری در مورد Imagen 3 برای آخرین پیشرفت های ما در تولید تصویر بخوانید.

اتاق ها

باز کردن تعاملات آواتار غنی تر با قابلیت های متن و صوتی Gemini 2.0