Quem não gosta de ler legendas geralmente prefere a versão dublada de um filme estrangeiro. Mas isso também pode ocasionar um claro incômodo quando os movimentos da boca de um ator estão completamente fora de sincronia com o que está sendo dito. Portanto, uma empresa chamada Flawless criou uma solução que utiliza lucidez sintético para que o movimento facial de um ator corresponda às palavras em um filme dublado.
Existem boas razões para se preocupar com o uso de lucidez sintético e ferramentas de rede neural para manipular fotos e vídeos a término de fabricar situações que nunca aconteceram ou fazer figuras públicas aparecerem dizendo um pouco que não disseram (porquê os deepfakes que se espalham rapidamente pela internet). Mas essas ferramentas também têm um potencial interessante para outros usos — porquê continuar a tornar a produção de filmes mais alcançável e econômica.
Essa mesma impaciência apareceu quando a computação gráfica avançou aos trancos e barrancos graças a filmes porquê O Exterminador do Horizonte 2, Twister e Jurassic Park, que aprimoraram os efeitos visuais fotorrealistas de maneiras que nunca havíamos visto antes. Esses avanços acabaram chegando ao consumidor e, com exclusivamente um smartphone e um laptop, criadores amadores podem produzir filmes do calibre de Hollywood sem a premência de um orçamento do tamanho de Hollywood.
Essas ferramentas também se tornaram cada vez mais fáceis de usar graças aos avanços contínuos no processamento de imagens fundamentado em IA. Extinguir objetos manualmente em um videoclipe já foi um processo muito demorado, que exigia máscaras complexas e ajustes quadro a quadro, mas agora é um recurso padrão e automatizado no After Effects da Adobe.
O que a Flawless está prometendo fazer com seu software TrueSync é usar as mesmas ferramentas responsáveis por vídeos deepfake para manipular e ajustar o rosto de um ator em um filme de modo que os movimentos de suas bocas, e por sua vez os músculos de seus rostos, correspondam mais fielmente a porquê...
eles se moveriam se a atuação original fosse no linguagem que um público estrangeiro está ouvindo. Portanto, mesmo que um ator tenha feito um filme em inglês, para um testemunha em Berlim assistindo ao filme dublado em germânico, parecerá que todos os atores estão realmente falando boche.
Isso é necessário? Essa questão certamente está em debate. Sevandija, que levou o Oscar de Melhor Filme em 2020, reacendeu a discussão sobre dublar um filme estrangeiro em vez de simplesmente assisti-lo com legendas. Secção da audiência sente que uma sequência interminável de texto sobre um filme distrai e tira o foco de tudo o que está acontecendo na tela, enquanto outros acreditam que mesmo uma dublagem muito feita simplesmente não consegue igualar ou recriar as emoções por trás da atuação do ator original, e ouvi-las, mesmo que as palavras não sejam compreendidas, é importante para gozar de sua atuação porquê um todo.
A Flawless diz: “No coração do sistema está um mecanismo de preservação da performance que conquista todas as nuances e emoções do material original.” Portanto, apesar do rosto de um ator ser substituído, sua performance original com nuances será preservada e transportada para o rosto “fixo” com os movimentos labiais corretos para uma língua estrangeira. A empresa compartilhou alguns exemplos do que a instrumento TrueSync é capaz em seu site e, com certeza, Tom Hanks parece estar falando um nipónico perfeito em Forrest Gump.
Mas ainda há um pouco incorrecto com esses clipes processados via TrueSync. Eles não parecem tão naturais quanto as performances originais, e a tecnologia por trás deles, ainda em seus dias iniciais, é parcialmente responsável por isso. Até mesmo empresas porquê a Disney estão trabalhando para melhorar a qualidade da tecnologia deepfake, de modo que logo ela seja boa o suficiente para o que Hollywood exige. A grande questão é se essa abordagem é melhor ou pior do que as opções que temos hoje para tornar um filme atingível a um público mais espaçoso, e se vale a pena o dispêndio suplementar de atualizar um filme inteiro de duas horas.