s
INTELIGÊNCIA ARTIFICIAL

A corrida da IA no text-to-video

Nas últimas semanas, OpenAI e o Google revelaram novos modelos e recursos impressionantes, a um ritmo alucinante, cada um deles ampliando os limites do que a IA pode fazer.

Primeiro, a OpenAI deu ao ChatGPT a capacidade de lembrar conversas anteriores com os usuários, bem como seus detalhes e preferências pessoais. Em seguida, o Google lançou seu modelo mais potente, o Gemini 1.0 Ultra, em uma versão ampla. Em seguida, lançou de forma limitada um novo modelo Gemini 1.5 Pro com a mesma capacidade do Ultra, mas em um pacote menor e mais barato. O que torna o 1.5 Pro especial é sua "janela de contexto" notavelmente grande. Pode analisar uma hora de vídeo, 11 horas de áudio ou cerca de sete livros de texto. E, entre seus poderes, criar vídeos a partir de descrições. Na sequência, a OpenAI apresentou o Sora, um novo modelo de geração de texto para vídeo que pode produzir vídeos de um minuto com qualidade impressionante (e algumas alucinações).

O que poucos se deram conta foi que o movimento todo começou quando a Meta (outra concorrente de peso) publicou um artigo sobre a iniciativa V-JEPA (Video Joint Embedding Predictive Architecture). Pesquisadores da empresa encontraram uma forma de exigir menos dos algoritmos. Em vez de pedir aos algoritmos que encontrem padrões em cada píxel em movimento de um vídeo, eles selecionam um trecho importante da cena e pedem ao software para adivinhar, em termos gerais, o que está faltando.

A OpenAI e o Google fizeram seus anúncios focados no tripé:

  • Texto para vídeo: geração de vídeos sem esforço de até 60 segundos a partir de simples solicitações de texto. Há vários exemplos do Sora aqui.
  • Imagem em vídeo: transformação de imagens estáticas em cenas dinâmicas com movimento contínuo.
  • Aprimoramento de vídeo: adição de novas sequências a vídeos pré-existentes.

Este é um conteúdo exclusivo para assinantes.

Cadastre-se grátis para ler agora
e acesse 5 conteúdos por mês.

É assinante ou já tem senha? Faça login. Já recebe a newsletter? Ative seu acesso.

A IA está em todo lugar: o problema agora é estratégia

Inteligência Artificial

A IA está em todo lugar: o problema agora é estratégia

Pesquisa global com quase 12 mil profissionais mostra que 74% dos trabalhadores já usam IA regularmente — mas a maioria das organizações ainda não sabe como converter esse uso em valor real

O trabalho invisível da IA Física

Inteligência Artificial

O trabalho invisível da IA Física

Empresas contratam trabalhadores domésticos para coletar os dados que vão treinar humanoides. A disputa por esse ativo pode definir os vencedores da próxima onda da IA.

Adotar IA ficou simples. Sustentar operações inteligentes, não

Inteligência Artificial

Adotar IA ficou simples. Sustentar operações inteligentes, não

A ISO/IEC 42001 reconhece o que muitas empresas ainda ignoram: IA é sistema crítico de operação, não ferramenta de produtividade.

Por Jesse Fernandes *
A IA Visual entra na produção

Inteligência Artificial

A IA Visual entra na produção

O valor da IA Visual está mudando. O que começou criando imagens agora ajuda a construir produtos, softwares e modelos usados nos processos de engenharia e manufatura.

IA muda primeiro emprego; não como acreditávamos

Inteligência Artificial

IA muda primeiro emprego; não como acreditávamos

Empresas com IA integrada estão contratando mais profissionais juniores, enquanto as tarefas que formavam esses profissionais estão desaparecendo ao mesmo tempo.

De plataforma de design a ponto de encontro de criatividade e produtividade: a virada do Canva

Inteligência Artificial

De plataforma de design a ponto de encontro de criatividade e produtiv...

Com 5.000 funcionários em uma semana dedicada à IA e US$ 4 bilhões em receita, a empresa redefine o que significa colocar o cliente no centro