Pesquisadores da Universidade de Edimburgo, na Escócia, desenvolveram um novo modelo composto por uma rede neural artificial capaz de gerar trailers de filmes e séries automaticamente. O sistema possui um algoritmo de aprendizagem de máquina baseado em gráficos não supervisionados para escolher as imagens.

Para treinar a inteligência artificial (IA), os cientistas dividiriam o trabalho em duas subtarefas: uma para identificar a estrutura da narrativa das imagens e outra para prever o “sentimento” transmitido por elas. Essa técnica processa as partes do filme em conjunto com trechos de texto do roteiro, resultando em um vídeo compacto.

“Modelamos filmes como gráficos, em que os nós são planos e as arestas relações semânticas entre eles. Aprendemos essas relações usando o treinamento que aproveita informações textuais privilegiadas, como personagens, ações e situações a partir de roteiros. Um algoritmo não supervisionado processa o gráfico e gera os trailers”, explica o cientista de computação Pinelopi Papalamidi, coautor do estudo.

Redes neurais

Esse método de geração automática é composto por duas redes neurais que processam tomadas derivadas do fluxo de vídeo e analisam representações de cenas textuais, baseadas no roteiro do filme. Quando combinadas, essas redes neurais identificam os pontos de inflexão, geralmente usados nos trailers.

Os chamados “pontos de virada” no cinema incluem um oportunidade, uma mudança de plano, um ponto sem volta, um grande revés ou o clímax de uma determinada cena. Essas características prendem a atenção e dão ao público a sensação de que algo grandioso está por vir, aumentando a expectativa pelo filme completo.

“Os trailers costumam ser elementos cruciais nas estratégias promocionais empregadas pelas produtoras de cinema. Para serem mais eficazes, eles devem resumir brevemente o enredo de um filme, transmitindo seu estilo artístico e o clima geral de maneiras atraentes”, acrescenta Papalamidi.

Edição automática

Os pesquisadores usaram as redes neurais para criar os trailers de 41 filmes diferentes. Eles compararam a qualidade do material produzido com vídeos gerados por modelos supervisionados por seres humanos, perguntando aos voluntários quais eles preferiam ou achavam mais interessantes.

Para a surpresa dos cientistas, a maioria dos entrevistados gostou mais dos trailers criados pelas redes neurais do que aqueles feitos com a utilização de modelos supervisionados. Segundo a equipe, essa técnica ainda não cria videoclipes compactos 100% perfeitos, mas pode ser usada para facilitar ou acelerar a produção de trailers em breve.

“Neste trabalho, consideramos sentimentos positivos ou negativos como um substituto para as emoções, devido à ausência de conjuntos de dados mais precisos. No futuro, gostaríamos de nos concentrar em métodos para prever emoções refinadas, como tristeza, repulsa, terror ou alegria para produzir trailers cada vez mais fiéis aos filmes que representam”, encerra Papalamidi.