Reinventando a criação de vídeos com o Gemini 2.0 Flash

Vishal Dharmadhikari

Engenheiro de soluções de produtos

Hang Chu

Viggle

A API Gemini não está apenas aprimorando apps, mas também iniciando uma revolução na expressão criativa. A Viggle, a sensação viral de vídeos com IA que permite transformar fotos em animações incríveis, está na vanguarda dessa revolução. Ao testar a magia multimodal do Gemini 2.0 Flash, disponível no momento apenas em prévia experimental, especificamente a capacidade avançada de compreensão de vídeo e saída de áudio, além da geração de imagens pelo Imagen 3, o Viggle está criando recursos que vão permitir aos usuários dar vida às ideias mais incríveis de maneira fácil, de formas nunca antes possíveis.

Por dentro do Viggle: como a criação de vídeos com IA é feita com o Gemini 2.0 Flash e o Imagen 3

A Viggle já conquistou milhões de usuários com a capacidade de transformar fotos estáticas em vídeos animados com movimento de corpo inteiro, gerando conteúdo viral em plataformas de mídia social. Com foco em memes e conteúdo de dança, o Viggle oferece apps para dispositivos móveis (iOS e Android) e uma plataforma da Web (viggle.ai). Recursos como troca de rostos, animação de fotos com passos de dança e inserção de usuários em cenas de filmes já são populares entre os usuários do Viggle, e agora eles estão explorando novas maneiras de levar a criatividade a outro nível.

O Viggle agora está prototipando dois recursos que aproveitam o poder do Gemini 2.0 Flash e do Imagen 3:

Personagens de vídeo virtuais com base em imagens:o Viggle usa o Imagen 3 para geração de imagens e criação de uma forja de personagens com tecnologia de IA. Os usuários podem enviar comandos de texto simples, como "um robô dançando com olhos brilhantes" ou "um dragão fofo e colorido", e o modelo vai criar personagens virtuais únicos prontos para estrelar os vídeos. Esses personagens são integrados ao mecanismo de animação do Viggle, abrindo um universo de possibilidades de narrativa personalizada. Imagine dirigir seu próprio curta-metragem de animação com personagens criados totalmente pela sua imaginação. Esse é o poder que o Viggle e o Imagen 3 colocam nas suas mãos.
Narração dinâmica com IA:o Viggle também está aproveitando a capacidade do Gemini 2.0 Flash de gerar fala e o profundo entendimento de vídeo para desenvolver um recurso que adiciona narrações contextualmente ricas a qualquer vídeo. Não é apenas uma voz monótona lendo um roteiro. É um contador de histórias com IA que analisa o conteúdo do vídeo, identificando momentos, ações e até emoções importantes para gerar uma narração que complementa perfeitamente os recursos visuais. Seja um comentário divertido em um vídeo de dança ou uma descrição épica de uma cena de fantasia, o narrador de IA adiciona uma dimensão totalmente nova de engajamento.

Como alcançar novos níveis de criatividade e engajamento

A integração da IA generativa vai melhorar a experiência do Viggle de várias maneiras importantes:

Criação simplificada de personagens:a geração de imagens da Imagen 3 simplifica o processo de criação e personalização de personagens de vídeo. Agora os usuários podem gerar personagens únicos com base nas ideias deles, sem precisar de habilidades avançadas de design ou depender de opções predefinidas limitadas. Esse fluxo de trabalho simplificado permite que mais usuários criem conteúdo.
Conteúdo mais personalizado:o Gemini 2.0 Flash permite que os usuários criem narrativas de vídeo altamente personalizadas. Personagens personalizados, combinados com narração dinâmica de IA, permitem uma narrativa única que fortalece a conexão entre criadores de conteúdo e público.
Mais possibilidades criativas : a combinação de personagens virtuais e narração com IA aumenta o potencial criativo dos vídeos curtos no Viggle. Os usuários podem explorar novas formas de narrativa, indo além dos formatos de vídeo tradicionais.

O que nos espera

O Viggle está animado para explorar ainda mais o potencial do Gemini 2.0 e dos modelos de geração de imagens para melhorar a plataforma. A empresa prevê um futuro em que a IA se integra perfeitamente a todas as etapas do processo criativo, permitindo que qualquer pessoa se torne um criador de vídeos.

"Na Viggle, todo mundo é criador de conteúdo. Estamos criando memes, explorando a captura de movimento para projetos de nível superior e construindo nosso próprio multiverso. Com os recursos de narração de voz realistas do Gemini 2.0 Flash, acreditamos que nossos usuários vão descobrir um novo potencial, criando histórias como nunca antes".

— Hang Chu, fundador da Viggle

O trabalho da Viggle com o Gemini 2.0 Flash e o Imagen 3 demonstra o potencial da IA para transformar a criação de vídeos e oferecer aos usuários novas ferramentas de autoexpressão. Essa colaboração marca um passo em direção ao futuro da narrativa com tecnologia de IA. Para saber mais sobre como criar com o Gemini, acesse a documentação da API Gemini e leia sobre o Imagen 3 para conhecer nossos avanços mais recentes na geração de imagens.

Reinventando a criação de vídeos com o Gemini 2.0 Flash

Por dentro do Viggle: como a criação de vídeos com IA é feita com o Gemini 2.0 Flash e o Imagen 3

Como alcançar novos níveis de criatividade e engajamento

O que nos espera

Estudos de caso relacionados