Uma legenda não especifica tudo o que está contido em uma imagem, portanto, é necessário que um modelo se baseie em muito bom senso sobre o mundo para preencher os detalhes
O Allen Institute for Artificial Intelligence (AI2), desenvolveu uma nova ferramenta que pode gerar imagens a partir de uma legenda. Apesar de as imagens finais geradas pelo modelo não serem tão realistas quanto deepfakes gerados por GANs, elas apontam uma direção promissora para a o desenvolvimento da Artificial General Intelligence (AGI) e, talvez, de robôs mais inteligentes.
Até aqui, os modelos de linguagem visual treinados em texto e imagens eram capazes de gerar uma legenda a partir de uma foto. O inverso é muito mais difícil. Uma legenda não especifica tudo o que está contido em uma imagem, portanto, é necessário que um modelo se baseie em muito bom senso sobre o mundo para preencher os detalhes. O fato de o modelo fazer isso significa que a IA pode ter atingido um novo nível de compreensão do mundo.
Conteúdo exclusivo para membros da The Shift
Aproveite a promoção e assine
Usar o corpo humano como uma plataforma de dados oferece enormes possibilidades, mas também novos riscos
A tecnologia que pode impulsionar de vez o setor dos carros driverless precisa enxergar, literalmente, os objetos que estão escondidos atrás da esquina
A previsão é a de que receita global de software de automação de processos robóticos (RPA) chegue a US$ 1,89 bilhão em 2021