Gemini API فقط برنامه ها را تقویت نمی کند. این جرقه یک انقلاب در بیان خلاق است. Viggle ، حس ویدیویی ویروسی هوش مصنوعی که به هر کسی اجازه میدهد عکسها را به انیمیشنهای جذاب تبدیل کند، در خط مقدم این انقلاب قرار دارد. با آزمایش جادوی چند وجهی Gemini 2.0 Flash که در حال حاضر فقط در پیشنمایش آزمایشی موجود است – بهویژه قابلیت درک ویدیویی و خروجی صوتی پیشرفته آن در کنار تولید تصویر توسط Imagen 3 – Viggle در حال ساخت ویژگیهایی است که کاربران را قادر میسازد تا بیدردسرترین تصورات خود را زنده کنند. به روش هایی که قبلاً هرگز ممکن نبود.
Inside Viggle: تقویت ساخت ویدیو با هوش مصنوعی با فلش Gemini 2.0 و Imagen 3
Viggle در حال حاضر میلیون ها کاربر را با توانایی خود در تبدیل آسان تصاویر استاتیک به فیلم های متحرک با حرکت تمام بدن مجذوب کرده است و باعث ایجاد محتوای ویروسی در سراسر پلتفرم های رسانه های اجتماعی می شود. Viggle با تمرکز بر میم ها و محتوای رقص، برنامه های تلفن همراه (iOS و Android) و یک پلت فرم وب (viggle.ai) را ارائه می دهد. ویژگیهایی مانند تعویض چهره، متحرک کردن تصاویر با حرکات رقص، و قرار دادن کاربران در صحنههای فیلم در حال حاضر در بین کاربران Viggle محبوب هستند و اکنون آنها در حال بررسی راههای جدیدی برای ارتقای خلاقیت به سطح بعدی هستند.
Viggle اکنون دو ویژگی را با استفاده از قدرت Gemini 2.0 Flash و Imagen 3 نمونه سازی می کند:
کاراکترهای ویدیویی تصویر به مجازی: Viggle از Imagen 3 برای تولید تصویر برای ایجاد یک شخصیت جعلی مبتنی بر هوش مصنوعی استفاده می کند. کاربران میتوانند پیامهای متنی ساده را ارائه دهند - «روبات رقصنده با چشمهای درخشان» یا «اژدهای کرکی رنگینکمان» - و این مدل شخصیتهای مجازی منحصربهفردی را تجسم میکند که آماده بازی در ویدیوهایشان هستند. سپس این شخصیتها بهطور یکپارچه در موتور انیمیشن Viggle ادغام میشوند و دنیایی از امکانات داستانگویی شخصیشده را باز میکنند. تصور کنید که فیلم کوتاه متحرک خود را کارگردانی میکنید که در آن شخصیتهایی کاملاً از تخیل شما متولد شدهاند - این قدرتی است که Viggle و Imagen 3 در دستان شما قرار میدهند.
روایت هوش مصنوعی پویا: Viggle همچنین از توانایی Gemini 2.0 Flash برای تولید گفتار و درک عمیق ویدیویی آن بهره میبرد تا قابلیتی را ایجاد کند که صداهای متناوب غنی را به هر ویدیویی اضافه کند. این فقط یک صدای یکنواخت در حال خواندن یک فیلمنامه نیست. این یک داستان سرای هوش مصنوعی است که محتوای ویدیو را تجزیه و تحلیل میکند - لحظات کلیدی، اقدامات و حتی احساسات را شناسایی میکند تا روایتی را تولید کند که کاملاً مکمل تصاویر باشد. خواه این یک تفسیر طنز در یک ویدیوی رقص باشد یا یک توصیف حماسی از یک صحنه فانتزی، راوی هوش مصنوعی بعد کاملاً جدیدی از تعامل را اضافه می کند.
ادغام هوش مصنوعی مولد برای بهبود تجربه Viggle از چندین راه کلیدی آماده است:
ایجاد کاراکتر ساده شده: تولید تصویر Imagen 3 فرآیند ایجاد و سفارشی کردن کاراکترهای ویدیویی را ساده می کند. کاربران اکنون می توانند شخصیت های منحصر به فرد را بر اساس ایده های خود تولید کنند و نیاز به مهارت های طراحی پیشرفته یا اتکا به گزینه های از پیش تعیین شده محدود را از بین ببرند. این گردش کار ساده به کاربران بیشتری امکان می دهد تا دیدگاه های خلاقانه خود را زنده کنند.
محتوای شخصیشدهتر: Gemini 2.0 Flash به کاربران امکان میدهد تا روایتهای ویدیویی بسیار شخصیسازیشده را بسازند. کاراکترهای طراحی شده سفارشی، همراه با روایت پویا هوش مصنوعی، امکان داستان سرایی منحصر به فرد را فراهم می کند که ارتباط بین سازندگان و مخاطبانشان را تقویت می کند.
امکانات خلاقانه گسترده: ترکیب شخصیتهای مجازی و روایت هوش مصنوعی، پتانسیل خلاقانه ویدیوهای کوتاه در Viggle را گسترش میدهد. کاربران می توانند اشکال جدیدی از داستان سرایی را کشف کنند و فراتر از فرمت های ویدیویی سنتی پیش بروند.
نگاه کردن به جلو
Viggle مشتاق است تا پتانسیل Gemini 2.0 و مدلهای نسل تصویر را برای بهبود پلتفرم خود بررسی کند و آیندهای را متصور است که در آن هوش مصنوعی به طور یکپارچه در هر مرحله از فرآیند خلاقیت ادغام میشود و هر کسی را قادر میسازد تا یک سازنده ویدیو شود.
در Viggle، همه یک خالق هستند. ما در حال ساختن میمها، کاوش تصویربرداری حرکتی برای پروژههای سطح بعدی، و ساختن چندجهانی خودمان هستیم. با قابلیتهای صوتی واقعی Gemini 2.0 Flash، ما بر این باوریم که کاربران ما پتانسیل جدیدی را باز میکنند - داستان سرایی را مانند قبل از آن ساختهاند.
- هانگ چو، بنیانگذار Viggle
کار Viggle با Gemini 2.0 Flash و Imagen 3 پتانسیل هوش مصنوعی را برای تغییر ایجاد ویدیو و توانمندسازی کاربران با ابزارهای جدید برای بیان خود نشان می دهد. این همکاری گامی به سوی آینده داستان سرایی مبتنی بر هوش مصنوعی است. برای کسب اطلاعات بیشتر در مورد ساخت با Gemini، از مستندات Gemini API دیدن کنید و اطلاعات بیشتری در مورد Imagen 3 برای آخرین پیشرفت های ما در تولید تصویر بخوانید.
مطالعات موردی مرتبط
Tldraw
نمونه سازی یک تجربه محاسباتی زبان طبیعی جدید بر روی بوم بی نهایت با Gemini 2.0
تونسوترا
استفاده از تواناییهای ترجمه چندزبانه متنی Gemini 2.0 برای دسترسی به کمیکها و وبتونها برای مخاطبان در هند در سراسر زبانهای منطقهای.
اتاق ها
باز کردن تعاملات آواتار غنی تر با قابلیت های متن و صوتی Gemini 2.0
،
به اشتراک بگذارید
11 دسامبر 2024
ایجاد مجدد ویدیو با فلش Gemini 2.0
ویشال دارمادیکاری
مهندس راه حل های محصول
هنگ چو
تکان دادن
Gemini API فقط برنامهها را تقویت نمیکند. این جرقه یک انقلاب در بیان خلاق است. Viggle ، حس ویدیویی ویروسی هوش مصنوعی که به هر کسی اجازه میدهد عکسها را به انیمیشنهای جذاب تبدیل کند، در خط مقدم این انقلاب قرار دارد. با آزمایش جادوی چند وجهی Gemini 2.0 Flash که در حال حاضر فقط در پیشنمایش آزمایشی موجود است – بهویژه قابلیت درک ویدیویی و خروجی صوتی پیشرفته آن در کنار تولید تصویر توسط Imagen 3 – Viggle در حال ساخت ویژگیهایی است که کاربران را قادر میسازد تا بیدردسرترین تصورات خود را زنده کنند. به روش هایی که قبلاً ممکن نبود.
Inside Viggle: تقویت ساخت ویدیو با هوش مصنوعی با فلش Gemini 2.0 و Imagen 3
Viggle در حال حاضر میلیون ها کاربر را با توانایی خود در تبدیل آسان تصاویر استاتیک به فیلم های متحرک با حرکت تمام بدن مجذوب کرده است و باعث ایجاد محتوای ویروسی در سراسر پلتفرم های رسانه های اجتماعی می شود. Viggle با تمرکز بر میم ها و محتوای رقص، برنامه های تلفن همراه (iOS و Android) و یک پلت فرم وب (viggle.ai) را ارائه می دهد. ویژگیهایی مانند تعویض چهره، متحرک کردن تصاویر با حرکات رقص، و قرار دادن کاربران در صحنههای فیلم در حال حاضر در بین کاربران Viggle محبوب هستند و اکنون آنها در حال بررسی راههای جدیدی برای ارتقای خلاقیت به سطح بعدی هستند.
Viggle اکنون دو ویژگی را با استفاده از قدرت Gemini 2.0 Flash و Imagen 3 نمونه سازی می کند:
کاراکترهای ویدیویی تصویر به مجازی: Viggle از Imagen 3 برای تولید تصویر برای ایجاد یک شخصیت جعلی مبتنی بر هوش مصنوعی استفاده می کند. کاربران میتوانند پیامهای متنی ساده را ارائه دهند - «روبات رقصنده با چشمهای درخشان» یا «اژدهای کرکی رنگینکمان» - و این مدل شخصیتهای مجازی منحصربهفردی را تجسم میکند که آماده بازی در ویدیوهایشان هستند. سپس این شخصیتها بهطور یکپارچه در موتور انیمیشن Viggle ادغام میشوند و دنیایی از امکانات داستانگویی شخصیشده را باز میکنند. تصور کنید که فیلم کوتاه متحرک خود را کارگردانی میکنید که در آن شخصیتهایی کاملاً از تخیل شما متولد شدهاند - این قدرتی است که Viggle و Imagen 3 در دستان شما قرار میدهند.
روایت هوش مصنوعی پویا: Viggle همچنین از توانایی Gemini 2.0 Flash برای تولید گفتار و درک عمیق ویدیویی آن بهره میبرد تا قابلیتی را ایجاد کند که صداهای متناوب غنی را به هر ویدیویی اضافه کند. این فقط یک صدای یکنواخت در حال خواندن یک فیلمنامه نیست. این یک داستان سرای هوش مصنوعی است که محتوای ویدیو را تجزیه و تحلیل میکند - لحظات کلیدی، اقدامات و حتی احساسات را شناسایی میکند تا روایتی را تولید کند که کاملاً مکمل تصاویر باشد. خواه این یک تفسیر طنز در یک ویدیوی رقص باشد یا یک توصیف حماسی از یک صحنه فانتزی، راوی هوش مصنوعی بعد کاملاً جدیدی از تعامل را اضافه می کند.
ادغام هوش مصنوعی مولد برای بهبود تجربه Viggle از چندین راه کلیدی آماده است:
ایجاد کاراکتر ساده شده: تولید تصویر Imagen 3 فرآیند ایجاد و سفارشی کردن کاراکترهای ویدیویی را ساده می کند. کاربران اکنون می توانند شخصیت های منحصر به فرد را بر اساس ایده های خود تولید کنند و نیاز به مهارت های طراحی پیشرفته یا اتکا به گزینه های از پیش تعیین شده محدود را از بین ببرند. این گردش کار ساده به کاربران بیشتری امکان می دهد تا دیدگاه های خلاقانه خود را زنده کنند.
محتوای شخصیشدهتر: Gemini 2.0 Flash به کاربران امکان میدهد تا روایتهای ویدیویی بسیار شخصیسازیشده را بسازند. کاراکترهای طراحی شده سفارشی، همراه با روایت پویا هوش مصنوعی، امکان داستان سرایی منحصر به فرد را فراهم می کند که ارتباط بین سازندگان و مخاطبانشان را تقویت می کند.
امکانات خلاقانه گسترده: ترکیب شخصیتهای مجازی و روایت هوش مصنوعی، پتانسیل خلاقانه ویدیوهای کوتاه در Viggle را گسترش میدهد. کاربران می توانند اشکال جدیدی از داستان سرایی را کشف کنند و فراتر از فرمت های ویدیویی سنتی پیش بروند.
نگاه کردن به جلو
Viggle مشتاق است تا پتانسیل Gemini 2.0 و مدلهای نسل تصویر را برای بهبود پلتفرم خود بررسی کند و آیندهای را متصور است که در آن هوش مصنوعی به طور یکپارچه در هر مرحله از فرآیند خلاقیت ادغام میشود و هر کسی را قادر میسازد تا یک سازنده ویدیو شود.
در Viggle، همه یک خالق هستند. ما در حال ساختن میمها، کاوش تصویربرداری حرکتی برای پروژههای سطح بعدی، و ساختن چندجهانی خودمان هستیم. با قابلیتهای صوتی واقعی Gemini 2.0 Flash، ما بر این باوریم که کاربران ما پتانسیل جدیدی را باز میکنند - داستان سرایی را مانند قبل از آن ساختهاند.
- هانگ چو، بنیانگذار Viggle
کار Viggle با Gemini 2.0 Flash و Imagen 3 پتانسیل هوش مصنوعی را برای تغییر ایجاد ویدیو و توانمندسازی کاربران با ابزارهای جدید برای بیان خود نشان می دهد. این همکاری گامی به سوی آینده داستان سرایی مبتنی بر هوش مصنوعی است. برای کسب اطلاعات بیشتر در مورد ساخت با Gemini، از مستندات Gemini API دیدن کنید و اطلاعات بیشتری در مورد Imagen 3 برای آخرین پیشرفت های ما در تولید تصویر بخوانید.
مطالعات موردی مرتبط
Tldraw
نمونه سازی یک تجربه محاسباتی زبان طبیعی جدید بر روی بوم بی نهایت با Gemini 2.0
تونسوترا
استفاده از تواناییهای ترجمه چندزبانه متنی Gemini 2.0 برای دسترسی به کمیکها و وبتونها برای مخاطبان در هند در سراسر زبانهای منطقهای.
اتاق ها
باز کردن تعاملات آواتار غنی تر با قابلیت های متن و صوتی Gemini 2.0
[[["درک آسان","easyToUnderstand","thumb-up"],["مشکلم را برطرف کرد","solvedMyProblem","thumb-up"],["غیره","otherUp","thumb-up"]],[["اطلاعاتی که نیاز دارم وجود ندارد","missingTheInformationINeed","thumb-down"],["بیشازحد پیچیده/ مراحل بسیار زیاد","tooComplicatedTooManySteps","thumb-down"],["قدیمی","outOfDate","thumb-down"],["مشکل ترجمه","translationIssue","thumb-down"],["مشکل کد / نمونهها","samplesCodeIssue","thumb-down"],["غیره","otherDown","thumb-down"]],[],[],[]]