11 GRUDNIA 2024 R.
Nowe możliwości tworzenia filmów dzięki Gemini 2.0 Flash
Interfejs Gemini API nie tylko ulepsza aplikacje, ale też powoduje rewolucję w wyrażaniu kreatywności. Viggle, wirusowy film z AI, który pozwala każdemu przekształcić zdjęcia w uwodzicielskie animacje, jest na czele tej rewolucji. Eksperymentując z multimodalną magią Gemini 2.0 Flash, która jest obecnie dostępna tylko w wersji eksperymentalnej, a która obejmuje zaawansowane rozpoznawanie filmów i możliwość generowania dźwięku oraz generowanie obrazów za pomocą Imagen 3, Viggle tworzy funkcje, które pozwolą użytkownikom bez wysiłku urzeczywistniać swoje najśmielsze pomysły w zupełnie nowy sposób.
Inside Viggle: Powering AI Video Creation with Gemini 2.0 Flash and Imagen 3
Viggle już teraz przyciąga miliony użytkowników dzięki możliwości łatwego przekształcania statycznych zdjęć w animowane filmy z ruchem całego ciała, które stają się treściami wirusowymi w mediach społecznościowych. Viggle koncentruje się na memach i treściach związanych z tańcem. Oferuje aplikacje mobilne (na iOS i Androida) oraz platformę internetową (viggle.ai). Funkcje takie jak wymiana twarzy, animacja zdjęć z ruchami tanecznymi i wstawianie użytkowników do scen filmowych są już popularne wśród użytkowników Viggle, a teraz zespół bada nowe sposoby na rozwijanie kreatywności.
Firma Viggle tworzy obecnie prototypy 2 funkcji wykorzystujących potencjał Gemini 2.0 Flash i Imagen 3:
Przekształcanie obrazów w wirtualne postacie filmowe: Viggle wykorzystuje Imagen 3 do generowania obrazów w celu tworzenia postaci opartych na AI. Użytkownicy mogą podać proste prompty tekstowe – np. „tańczący robot ze świecącymi oczami” lub „puszysty, tęczowy smok” – a model wygeneruje unikalne postacie wirtualne, które mogą wystąpić w ich filmach. Następnie są one płynnie integrowane z silnikiem animacji Viggle, co otwiera mnóstwo możliwości tworzenia spersonalizowanych opowieści. Wyobraź sobie, że reżyserujesz własny animowany film krótkometrażowy z postaciami stworzonymi całkowicie przez Twoją wyobraźnię – to właśnie daje Ci Viggle i Imagen 3.
Dynamiczny podkład głosowy AI: Viggle korzysta też z możliwości generowania mowy i głębokiego zrozumienia treści filmów przez Gemini 2.0 Flash, aby opracować funkcję, która dodaje do filmów kontekstowe podkłady głosowe. Nie jest to tylko monotonny głos czytający scenariusz. To opowiadacz oparty na AI, który analizuje treść filmu, identyfikując kluczowe momenty, działania, a nawet emocje, aby wygenerować narrację, która idealnie uzupełnia obraz. Niezależnie od tego, czy jest to humorystyczny komentarz do filmu z tańcem, czy epicki opis sceny fantasy, lektor AI dodaje zupełnie nowy wymiar zaangażowania.
Nowy poziom kreatywności i zaangażowania
Integracja generatywnej AI pozwoli poprawić działanie Viggle na kilka kluczowych sposobów:
Uproszczone tworzenie postaci: generowanie obrazów w Imagen 3 upraszcza proces tworzenia i dostosowywania postaci w filmach. Użytkownicy mogą teraz generować unikalne postacie na podstawie swoich pomysłów, bez konieczności posiadania zaawansowanych umiejętności projektowania ani korzystania z ograniczonych wstępnie ustawionych opcji. Dzięki temu uproszczonemu procesowi więcej użytkowników może realizować swoje pomysły.
Bardziej spersonalizowane treści: Gemini 2.0 Flash umożliwia użytkownikom tworzenie bardzo spersonalizowanych narracji wideo. Niestandardowe postacie w połączeniu z dynamicznym lektorem AI umożliwiają tworzenie unikalnych opowieści, które wzmacniają więź między twórcami a ich odbiorcami.
Rozszerzone możliwości kreacji: połączenie wirtualnych postaci z narracją AI zwiększa potencjał kreatywny krótkich filmów w Viggle. Użytkownicy mogą poznawać nowe formy opowiadania historii, wykraczając poza tradycyjne formaty wideo.
Co dalej
Firma Viggle z niecierpliwością czeka na dalsze wykorzystanie potencjału Gemini 2.0 i modeli generacji obrazów w celu ulepszania platformy. Firma widzi przyszłość, w której sztuczna inteligencja będzie płynnie integrowana na każdym etapie procesu twórczego, umożliwiając każdemu tworzenie filmów.
„W Viggle każdy jest twórcą. Tworzymy memy, testujemy technikę motion capture na potrzeby projektów na najwyższym poziomie i budujemy własny multiwersum. Dzięki realistycznym możliwościom narracji głosowej w Gemini 2.0 Flash użytkownicy mogą odkrywać nowe możliwości i tworzyć historie w zupełnie nowy sposób.
Współpraca Viggle z Gemini 2.0 Flash i Imagen 3 pokazuje potencjał AI w zakresie tworzenia filmów i daje użytkownikom nowe narzędzia do wyrażania siebie. Ta współpraca to krok w kierunku przyszłości opowieści opartej na AI. Więcej informacji o tworzeniu aplikacji z wykorzystaniem Gemini znajdziesz w dokumentacji interfejsu Gemini API. Aby poznać najnowsze osiągnięcia w zakresie generowania obrazów, zapoznaj się z Imagen 3.