s
INTELIGÊNCIA ARTIFICIAL

A corrida da IA no text-to-video

Nas últimas semanas, OpenAI e o Google revelaram novos modelos e recursos impressionantes, a um ritmo alucinante, cada um deles ampliando os limites do que a IA pode fazer.

Primeiro, a OpenAI deu ao ChatGPT a capacidade de lembrar conversas anteriores com os usuários, bem como seus detalhes e preferências pessoais. Em seguida, o Google lançou seu modelo mais potente, o Gemini 1.0 Ultra, em uma versão ampla. Em seguida, lançou de forma limitada um novo modelo Gemini 1.5 Pro com a mesma capacidade do Ultra, mas em um pacote menor e mais barato. O que torna o 1.5 Pro especial é sua "janela de contexto" notavelmente grande. Pode analisar uma hora de vídeo, 11 horas de áudio ou cerca de sete livros de texto. E, entre seus poderes, criar vídeos a partir de descrições. Na sequência, a OpenAI apresentou o Sora, um novo modelo de geração de texto para vídeo que pode produzir vídeos de um minuto com qualidade impressionante (e algumas alucinações).

O que poucos se deram conta foi que o movimento todo começou quando a Meta (outra concorrente de peso) publicou um artigo sobre a iniciativa V-JEPA (Video Joint Embedding Predictive Architecture). Pesquisadores da empresa encontraram uma forma de exigir menos dos algoritmos. Em vez de pedir aos algoritmos que encontrem padrões em cada píxel em movimento de um vídeo, eles selecionam um trecho importante da cena e pedem ao software para adivinhar, em termos gerais, o que está faltando.

A OpenAI e o Google fizeram seus anúncios focados no tripé:

  • Texto para vídeo: geração de vídeos sem esforço de até 60 segundos a partir de simples solicitações de texto. Há vários exemplos do Sora aqui.
  • Imagem em vídeo: transformação de imagens estáticas em cenas dinâmicas com movimento contínuo.
  • Aprimoramento de vídeo: adição de novas sequências a vídeos pré-existentes.

Este é um conteúdo exclusivo para assinantes.

Cadastre-se grátis para ler agora
e acesse 5 conteúdos por mês.

É assinante ou já tem senha? Faça login. Já recebe a newsletter? Ative seu acesso.

Mais do que demissões: IA impulsiona reinvenção organizacional

Inteligência Artificial

Mais do que demissões: IA impulsiona reinvenção organizacional

A Inteligência Artificial está acelerando uma transformação estrutural nas empresas: mais do que cortes, há uma realocação estratégica de talentos e investimentos para construir a próxima era da tecnologia.

Semana de muitas novidades no campo da IA

Inteligência Artificial

Semana de muitas novidades no campo da IA

AlphaEvolve, Codex, Jules, GitHub Copilot, Claude 4, Gemini 2.5 Pro... A corrida armamentista da IA acelerou em todas as frentes: chips, conteúdo, credibilidade e controle.

Modelos de raciocínio guardam seus segredos

Inteligência Artificial

Modelos de raciocínio guardam seus segredos

Escondem deliberadamente seus processos de pensamento. Este não é apenas um problema técnico.

IA no trabalho: o que separa quem avança de quem fica para trás

Inteligência Artificial

IA no trabalho: o que separa quem avança de quem fica para trás

Treinamento, renda e idade são os principais divisores no uso de IA, segundo estudo global da KPMG com 17 mil pessoas em 17 países

iFood se posiciona como empresa de IA e aposta em mil agentes autônomos

Inteligência Artificial

iFood se posiciona como empresa de IA e aposta em mil agentes autônom...

Em nova fase estratégica, o iFood deixa de ser apenas tech e assume a identidade de empresa de IA, com agentes inteligentes atuando em Vendas, Atendimento e Marketing

Como ser citado pela IA

Inteligência Artificial

Como ser citado pela IA

Se você quer ser encontrado em pesquisas de IA, escreva como um humano, tenha autoridade, profundidade, legibilidade e abrangência