Nova IA da Google cria vídeos apenas com quadros iniciais e finais

Pesquisadores da divisão de Inteligência Artificial do Google desenvolveram um novo sistema que pode gerar sequências de vídeos a partir de somente quadros iniciais e finais. O processo foi nomeado de inbeteweening.

O sistema é um passo para transformar a indústria de animação. “Imagine se pudéssemos ensinar um sistema inteligente a transformar automaticamente os quadrinhos em animações”, escreveram os pesquisadores.

“Embora essa capacidade imensamente poupadora de mão-de-obra ainda esteja além do atual estado da arte, os avanços em visão computacional e aprendizado de máquina estão tornando essa meta cada vez mais tangível”, complementam.

Como funciona

O sistema de IA desenvolvido compreende um modelo convolucional, ou seja, uma classe de redes neurais profundas inspiradas pelo córtex visual animal. O modelo usado apresenta três componentes: um decodificador de imagem convolucional 2D, um gerador de representação latente 3D convolucional e um gerador de vídeo.

O ciclo, de acordo com o Venture Beat, funciona da seguinte forma: o decodificador de imagens mapeia quadros iniciais e finais de vídeos enquanto o gerador de representação latente aprende a incorporar as informações contidas nos quadros de entrada. Finalmente, o gerador de vídeo decodifica a representação latente em quadros de vídeo.

O resultado, de acordo com os pesquisadores, é que as sequências geradas pela IA são semelhantes em estilo e consistentes com os quadros iniciais e finais fornecidos.