s
INTELIGÊNCIA ARTIFICIAL

A corrida da IA no text-to-video

Nas últimas semanas, OpenAI e o Google revelaram novos modelos e recursos impressionantes, a um ritmo alucinante, cada um deles ampliando os limites do que a IA pode fazer.

Primeiro, a OpenAI deu ao ChatGPT a capacidade de lembrar conversas anteriores com os usuários, bem como seus detalhes e preferências pessoais. Em seguida, o Google lançou seu modelo mais potente, o Gemini 1.0 Ultra, em uma versão ampla. Em seguida, lançou de forma limitada um novo modelo Gemini 1.5 Pro com a mesma capacidade do Ultra, mas em um pacote menor e mais barato. O que torna o 1.5 Pro especial é sua "janela de contexto" notavelmente grande. Pode analisar uma hora de vídeo, 11 horas de áudio ou cerca de sete livros de texto. E, entre seus poderes, criar vídeos a partir de descrições. Na sequência, a OpenAI apresentou o Sora, um novo modelo de geração de texto para vídeo que pode produzir vídeos de um minuto com qualidade impressionante (e algumas alucinações).

O que poucos se deram conta foi que o movimento todo começou quando a Meta (outra concorrente de peso) publicou um artigo sobre a iniciativa V-JEPA (Video Joint Embedding Predictive Architecture). Pesquisadores da empresa encontraram uma forma de exigir menos dos algoritmos. Em vez de pedir aos algoritmos que encontrem padrões em cada píxel em movimento de um vídeo, eles selecionam um trecho importante da cena e pedem ao software para adivinhar, em termos gerais, o que está faltando.

A OpenAI e o Google fizeram seus anúncios focados no tripé:

  • Texto para vídeo: geração de vídeos sem esforço de até 60 segundos a partir de simples solicitações de texto. Há vários exemplos do Sora aqui.
  • Imagem em vídeo: transformação de imagens estáticas em cenas dinâmicas com movimento contínuo.
  • Aprimoramento de vídeo: adição de novas sequências a vídeos pré-existentes.

Este é um conteúdo exclusivo para assinantes.

Cadastre-se grátis para ler agora
e acesse 5 conteúdos por mês.

É assinante ou já tem senha? Faça login. Já recebe a newsletter? Ative seu acesso.

IA avança fora das empresas, mas trava dentro dos escritórios

Inteligência Artificial

IA avança fora das empresas, mas trava dentro dos escritórios

Apesar do uso pessoal elevado, o uso de IA dentro das empresas estagnou em 51%. Estudo global do BCG mostra que treinamento, ferramentas e apoio da liderança são cruciais para capturar valor e reduzir o medo da substituição por máquina...

Por dentro da transformação AI-First na Evertec + Sinqia

Inteligência Artificial

Por dentro da transformação AI-First na Evertec + Sinqia

Se você está tentando descobrir como tornar a IA uma parte essencial do DNA da sua empresa, em vez de apenas mais uma iniciativa tecnológica, esta conversa oferece um modelo viável.

Na berlinda, o rumo à superinteligência

Inteligência Artificial

Na berlinda, o rumo à superinteligência

A Apple diz que os LLMs não conseguem realmente raciocinar, enquanto Sam Altman declara que a "singularidade suave" será inevitável até 2030. Quem tem razão?

“Quem lidera precisa entender IA – não para codificar, mas para direcionar”

Inteligência Artificial

“Quem lidera precisa entender IA – não para codificar, mas para d...

Em entrevista à The Shift, Marcelo Braga, presidente da IBM Brasil, defende que a IA não é só uma tecnologia, mas uma transformação estrutural que exige experimentação, letramento no topo e uma nova forma de liderar

Indicadores para medir a IA em termos humanos

Inteligência Artificial

Indicadores para medir a IA em termos humanos

Em meio a tantas promessas e exageros sobre o que a Inteligência Artificial pode fazer, o índice da OCDE é ferramenta valiosa para a tomada de decisões informada, separando o hype da realidade.

IA no organograma: os novos cidadãos corporativos das empresas

Inteligência Artificial

IA no organograma: os novos cidadãos corporativos das empresas

Agentes de IA já dividem tarefas com humanos e exigem novas estruturas de trabalho, gestão e confiança nas organizações