Pesquisadores da divisão de Inteligência Artificial do Google desenvolveram um novo sistema que pode gerar sequências de vídeos a partir de somente quadros iniciais e finais. O processo foi nomeado de inbeteweening.
O sistema é um passo para transformar a indústria de animação. “Imagine se pudéssemos ensinar um sistema inteligente a transformar automaticamente os quadrinhos em animações”, escreveram os pesquisadores.
“Embora essa capacidade imensamente poupadora de mão-de-obra ainda esteja além do atual estado da arte, os avanços em visão computacional e aprendizado de máquina estão tornando essa meta cada vez mais tangível”, complementam.
Como funciona
O sistema de IA desenvolvido compreende um modelo convolucional, ou seja, uma classe de redes neurais profundas inspiradas pelo córtex visual animal. O modelo usado apresenta três componentes: um decodificador de imagem convolucional 2D, um gerador de representação latente 3D convolucional e um gerador de vídeo.
O ciclo, de acordo com o Venture Beat, funciona da seguinte forma: o decodificador de imagens mapeia quadros iniciais e finais de vídeos enquanto o gerador de representação latente aprende a incorporar as informações contidas nos quadros de entrada. Finalmente, o gerador de vídeo decodifica a representação latente em quadros de vídeo.
O resultado, de acordo com os pesquisadores, é que as sequências geradas pela IA são semelhantes em estilo e consistentes com os quadros iniciais e finais fornecidos.