s
INTELIGÊNCIA ARTIFICIAL

A corrida da IA no text-to-video

Nas últimas semanas, OpenAI e o Google revelaram novos modelos e recursos impressionantes, a um ritmo alucinante, cada um deles ampliando os limites do que a IA pode fazer.

Primeiro, a OpenAI deu ao ChatGPT a capacidade de lembrar conversas anteriores com os usuários, bem como seus detalhes e preferências pessoais. Em seguida, o Google lançou seu modelo mais potente, o Gemini 1.0 Ultra, em uma versão ampla. Em seguida, lançou de forma limitada um novo modelo Gemini 1.5 Pro com a mesma capacidade do Ultra, mas em um pacote menor e mais barato. O que torna o 1.5 Pro especial é sua "janela de contexto" notavelmente grande. Pode analisar uma hora de vídeo, 11 horas de áudio ou cerca de sete livros de texto. E, entre seus poderes, criar vídeos a partir de descrições. Na sequência, a OpenAI apresentou o Sora, um novo modelo de geração de texto para vídeo que pode produzir vídeos de um minuto com qualidade impressionante (e algumas alucinações).

O que poucos se deram conta foi que o movimento todo começou quando a Meta (outra concorrente de peso) publicou um artigo sobre a iniciativa V-JEPA (Video Joint Embedding Predictive Architecture). Pesquisadores da empresa encontraram uma forma de exigir menos dos algoritmos. Em vez de pedir aos algoritmos que encontrem padrões em cada píxel em movimento de um vídeo, eles selecionam um trecho importante da cena e pedem ao software para adivinhar, em termos gerais, o que está faltando.

A OpenAI e o Google fizeram seus anúncios focados no tripé:

  • Texto para vídeo: geração de vídeos sem esforço de até 60 segundos a partir de simples solicitações de texto. Há vários exemplos do Sora aqui.
  • Imagem em vídeo: transformação de imagens estáticas em cenas dinâmicas com movimento contínuo.
  • Aprimoramento de vídeo: adição de novas sequências a vídeos pré-existentes.

Este é um conteúdo exclusivo para assinantes.

Cadastre-se grátis para ler agora
e acesse 5 conteúdos por mês.

É assinante ou já tem senha? Faça login. Já recebe a newsletter? Ative seu acesso.

Quatro tensões redesenham a gestão na era da IA Agêntica

Inteligência Artificial

Quatro tensões redesenham a gestão na era da IA Agêntica

São rupturas estruturais que exigem mais das organizações do que a mera adoção de uma nova tecnologia, aponta o novo relatório do MIT em parceria com o BCG.

Liderança ausente é maior ameaça a trabalhadores do que IA

Inteligência Artificial

Liderança ausente é maior ameaça a trabalhadores do que IA

A verdadeira ameaça à força de trabalho não é a automação, mas a falta de direção das lideranças

Uma corrida de trilhões está reorganizando o setor de tecnologia

Inteligência Artificial

Uma corrida de trilhões está reorganizando o setor de tecnologia

Estudo da Accel projeta US$ 4,1 trilhões em investimentos em data centers, crescimento acelerado de aplicações e novos limites energéticos.

IA Física: a nova fronteira da automação inteligente

Inteligência Artificial

IA Física: a nova fronteira da automação inteligente

De humanoides a veículos autônomos, a robótica entra em fase de maturação com dados sintéticos, teleoperação e modelos generativos que aprendem a agir no mundo real.

Superinteligência sim, com regras diferentes

Inteligência Artificial

Superinteligência sim, com regras diferentes

Enquanto o Vale do Silício corre para criar máquinas que superem a mente humana, a Microsoft aposta em outro tipo de corrida: a por uma superinteligência poderosa, mas sob controle humano.

O novo tabuleiro da IA corporativa

Inteligência Artificial

O novo tabuleiro da IA corporativa

IA Soberana sai dos gabinetes de governo e entra no coração da estratégia corporativa, redefinindo quem controla dados, energia e vantagem competitiva.