Compartilhar

11 DE DEZEMBRO DE 2024

Como criar vídeos com o Gemini 2.0 Flash

Vishal Dharmadhikari

Engenheiro de soluções de produtos

Hang Chu

Viggle

Hero de apresentação do Viggle

A API Gemini não está apenas aprimorando apps, ela está causando uma revolução na expressão criativa. O Viggle, a sensação viral de IA em vídeo que permite que qualquer pessoa transforme fotos em animações cativantes, está na vanguarda dessa revolução. Ao experimentar a magia multimodal do Gemini 2.0 Flash, disponível atualmente apenas na visualização experimental, especificamente a capacidade avançada de compreensão de vídeo e saída de áudio, além da geração de imagens pelo Imagen 3, a Viggle está criando recursos que vão permitir que os usuários deem vida às ideias mais malucas sem esforço, de uma forma nunca antes possível.

Inside Viggle: Powering AI Video Creation with Gemini 2.0 Flash and Imagen 3

O Viggle já conquistou milhões de usuários com a capacidade de transformar imagens estáticas em vídeos animados com movimentos de corpo inteiro, gerando conteúdo viral nas plataformas de mídia social. Com foco em memes e conteúdo de dança, o Viggle oferece apps para dispositivos móveis (iOS e Android) e uma plataforma da Web (viggle.ai). Recursos como troca de rosto, animação de fotos com movimentos de dança e inserção de usuários em cenas de filmes já são populares entre os usuários do Viggle, e agora a empresa está explorando novas maneiras de aumentar a criatividade.

A Viggle está criando protótipos de dois recursos que aproveitam o poder do Gemini 2.0 Flash e do Imagen 3:


  • Imagem para personagens de vídeo virtuais:a Viggle está usando o Imagen 3 para gerar imagens e criar um personagem com tecnologia de IA. Os usuários podem fornecer comandos de texto simples, como "um robô dançante com olhos brilhantes" ou "um dragão fofo e colorido", e o modelo vai criar personagens virtuais únicos prontos para estrelar os vídeos. Esses personagens são integrados ao mecanismo de animação do Viggle, abrindo um universo de possibilidades de contar histórias personalizadas. Imagine dirigir seu próprio curta-metragem de animação com personagens que nasceram totalmente da sua imaginação. Esse é o poder que o Viggle e o Imagen 3 estão colocando nas suas mãos.

  • Narração dinâmica com IA:o Viggle também está usando a capacidade do Gemini 2.0 Flash de gerar fala e a compreensão profunda de vídeos para desenvolver um recurso que adiciona narrações ricas em contexto a qualquer vídeo. Não é apenas uma voz monótona lendo um roteiro. É um narrador de IA que analisa o conteúdo do vídeo, identificando momentos-chave, ações e até emoções, para gerar uma narração que complementa perfeitamente os recursos visuais. Seja um comentário bem-humorado em um vídeo de dança ou uma descrição épica de uma cena de fantasia, o narrador de IA adiciona uma nova dimensão de engajamento.

Como alcançar novos níveis de criatividade e engajamento

A integração da IA generativa está pronta para melhorar a experiência do Viggle de várias maneiras:


  • Criação de personagens simplificada:a geração de imagens do Imagen 3 simplifica o processo de criação e personalização de personagens de vídeo. Agora os usuários podem gerar personagens únicos com base nas ideias deles, sem precisar de habilidades avançadas de design ou depender de opções predefinidas limitadas. Esse fluxo de trabalho simplificado permite que mais usuários deem vida às ideias criativas.

  • Mais conteúdo personalizado:o Flash Gemini 2.0 permite que os usuários criem narrativas de vídeo altamente personalizadas. Personagens personalizados, combinados com a narração dinâmica de IA, permitem uma narrativa única que fortalece a conexão entre os criadores de conteúdo e o público.

  • Possibilidades criativas ampliadas : a combinação de personagens virtuais e narração por IA amplia o potencial criativo dos vídeos curtos no Viggle. Os usuários podem explorar novas formas de contar histórias, indo além dos formatos de vídeo tradicionais.

O que nos espera

A Viggle está ansiosa para explorar ainda mais o potencial do Gemini 2.0 e dos modelos de geração de imagens para melhorar a plataforma. A empresa imagina um futuro em que a IA se integra perfeitamente a cada etapa do processo criativo, permitindo que qualquer pessoa se torne um criador de vídeos.

"No Viggle, todo mundo é criador. Estamos criando memes, testando a captura de movimento para projetos de nível avançado e construindo nosso próprio multiverso. Com os recursos de narração de voz realistas do Gemini 2.0 Flash, acreditamos que nossos usuários vão desbloquear novos potenciais, criando narrativas como nunca antes."

— Hang Chu, fundador da Viggle

O trabalho da Viggle com o Gemini 2.0 Flash e o Imagen 3 demonstra o potencial da IA para transformar a criação de vídeos e capacitar os usuários com novas ferramentas de autoexpressão. Essa colaboração marca uma etapa no futuro da narrativa com tecnologia de IA. Para saber mais sobre como criar com o Gemini, acesse a documentação da API Gemini e leia mais sobre o Imagen 3 para conferir nossos avanços mais recentes na geração de imagens.