Google gera vídeos com IA a partir de frases simples
Tecmundo
O Google mostrou como pode produzir conteúdo audiovisual a partir de frases simples utilizando tecnologia de Inteligência Artificial (IA). Com um próprio vídeo, a companhia detalhou o Imagen Video, um sistema que foi treinado com 14 milhões de pares de vídeo-texto e 60 milhões de pares de imagem-texto.
(Fonte: Google/Divulgação)
A companhia comemora o feito e destaca os seus diferenciais. “Além de gerar audiovisual de alta definição, o Imagen Video tem um grau de controle e de conhecimento de mundo, incluindo a habilidade de gerar vídeos diversos e animações de texto em vários estilos artísticos”, afirma um artigo publicado pela empresa.
(Fonte: Google/Divulgação)
De acordo com a Big Tech, a tecnologia demonstrou a capacidade de compreender a profundidade de campo e a tridimensionalidade. Isso possibilita a criação de vídeos simulando um voo de drone, girando e capturando objetos sem distorcer a sua imagem.
(Fonte: Google/Divulgação)
O Imagen Video produz arquivos com baixa resolução para aumentar a definição a partir de algoritmos. Com a descrição da imagem, o aplicativo gera um clipe em 16 quadros, com três quadros por segundo e uma resolução baixíssima de 24 por 48 pixels.
Em seguida, faz um upscale complementando os quadros para resultar em um arquivo de 128 quadros, ou 24 quadros por segundo em 1280 x 760, com cinco segundos no total. Essa duração não é suficiente para se fazer uso em larga escala, tanto comercial ou educacional.
Assim como o Make-A-Video oferecido pela Meta, o Imagen Video distorce alguns quadros do vídeo, além de misturar objetos fisicamente de uma forma artificial. A equipe de pesquisadores planeja combinar esforços com o Phenaki, um sistema de texto recém-lançado pelo Google que consegue gerar clipes com mais de dois minutos em qualidade inferior.