Desenvolvido com o objetivo de realizar “pesquisas avançadas sobre ferramentas para permitir os usuários a animar seus conteúdos pessoais”, o Google Dreamix é baseado no sistema de difusão estável. Ele usa textos para gerar imagens, buscando ser o mais próximo possível da necessidade do indivíduo.
Para editar vídeos ou criá-los, a inteligência artificial pega o material fonte e passa pelo modelo de difusão. Em seguida, utiliza as palavras para formar o produto final.
Por exemplo: no vídeo abaixo, a pessoa pegou uma foto e pediu para a IA produzir um vídeo que contém “uma tomada debaixo d’água de uma tartaruga marinha com um tubarão se aproximando por trás”. O resultado é bastante interessante.
Já no que diz respeito a edição do vídeo em si, o Dreamix também consegue pegar algo pronto e criar a partir daí. No exemplo a seguir, a inteligência artificial teve como base um curto conteúdo de uma praia. Assim, a pessoa pediu para que fosse gerado algo com “uma praia com palmeiras e gansos na água”.
Mais uma vez, o resultado empolga:
É claro que o produto ainda está em fase de testes, mas já é um passo interessante, ainda mais se compararmos com algo como o chamado Neural Radiance Fields (NeRF), que usa modelos 3D e os emenda com movimentos de câmera e outras imagens.
Ferramenta é a primeira do tipo
A tecnologia surgiu a partir de uma parceria entre a gigante de buscas e a Universidade Hebraica de Jerusalém. De acordo com as palavras do Google, o Dreamix é o primeiro método baseado em difusão que é “capaz de realizar movimento baseado em texto e edição de aparência de vídeos em geral”.
Outra parte importante do projeto é a ideia de que a empresa busca por um alto nível de fidelidade no produto final. Ela afirma que o processo exige a adição de um estágio preliminar de ajuste fino do modelo no vídeo original. Dessa maneira, o resultado fica o mais próximo possível da primeira versão, mas com o novo conteúdo.
Na apresentação, a companhia explica de um jeito mais simplificado como a IA funciona durante as etapas de edição:
Primeiramente, transformamos a imagem em um vídeo bruto por operações simples de processamento, como replicação e projeções geométricas em perspectiva, e depois usamos nosso editor de vídeo geral para animá-la.
Por fim, o Google divulgou um vídeo completo sobre os testes feitos com a inteligência artificial:
Produto não deverá chegar para o público
Que a novidade empolga, isso é verdade. No entanto, os usuários comuns não deverão colocar as mãos nela tão cedo, ou talvez nunca.
A verdade é que o Dreamix foi desenvolvido para testar a tecnologia e, a partir dela, criar produtos futuros. Isso porque há diversas opções de uso da ferramenta, de propagandas a animações curtas. É possível pensar mais a fundo e deduzir que criminosos poderiam utilizar a IA para enganar pessoas ou, até mesmo, promover caos ou chantagens.
Sendo assim, enquanto a OpenAI lança projetos focados no consumidor, o Google ainda complica um pouco mais com suas ideias.
Com informações: Google Dreamix.
Google Dreamix é uma IA que cria e edita vídeos para você
You must be logged in to post a comment.