s
INTELIGÊNCIA ARTIFICIAL

A corrida da IA no text-to-video

Nas últimas semanas, OpenAI e o Google revelaram novos modelos e recursos impressionantes, a um ritmo alucinante, cada um deles ampliando os limites do que a IA pode fazer.

Primeiro, a OpenAI deu ao ChatGPT a capacidade de lembrar conversas anteriores com os usuários, bem como seus detalhes e preferências pessoais. Em seguida, o Google lançou seu modelo mais potente, o Gemini 1.0 Ultra, em uma versão ampla. Em seguida, lançou de forma limitada um novo modelo Gemini 1.5 Pro com a mesma capacidade do Ultra, mas em um pacote menor e mais barato. O que torna o 1.5 Pro especial é sua "janela de contexto" notavelmente grande. Pode analisar uma hora de vídeo, 11 horas de áudio ou cerca de sete livros de texto. E, entre seus poderes, criar vídeos a partir de descrições. Na sequência, a OpenAI apresentou o Sora, um novo modelo de geração de texto para vídeo que pode produzir vídeos de um minuto com qualidade impressionante (e algumas alucinações).

O que poucos se deram conta foi que o movimento todo começou quando a Meta (outra concorrente de peso) publicou um artigo sobre a iniciativa V-JEPA (Video Joint Embedding Predictive Architecture). Pesquisadores da empresa encontraram uma forma de exigir menos dos algoritmos. Em vez de pedir aos algoritmos que encontrem padrões em cada píxel em movimento de um vídeo, eles selecionam um trecho importante da cena e pedem ao software para adivinhar, em termos gerais, o que está faltando.

A OpenAI e o Google fizeram seus anúncios focados no tripé:

  • Texto para vídeo: geração de vídeos sem esforço de até 60 segundos a partir de simples solicitações de texto. Há vários exemplos do Sora aqui.
  • Imagem em vídeo: transformação de imagens estáticas em cenas dinâmicas com movimento contínuo.
  • Aprimoramento de vídeo: adição de novas sequências a vídeos pré-existentes.

Este é um conteúdo exclusivo para assinantes.

Cadastre-se grátis para ler agora
e acesse 5 conteúdos por mês.

É assinante ou já tem senha? Faça login. Já recebe a newsletter? Ative seu acesso.

Deep techs na América Latina: ambição global, desafios locais

Inteligência Artificial

Deep techs na América Latina: ambição global, desafios locais

Mesmo com talento e ciência de ponta, a América Latina ainda enfrenta barreiras como pouco investimento e falta de ambição global para escalar suas deep techs

Software virou mão de obra. Quanto custa o trabalho da IA?

Inteligência Artificial

Software virou mão de obra. Quanto custa o trabalho da IA?

Agentes autônomos desafiam o manual do SaaS e expõem a batalha entre ROI, narrativas de valor e dumping algorítmico.

Transformação digital na América Latina: o salto bilionário guiado pelo Brasil

Inteligência Artificial

Transformação digital na América Latina: o salto bilionário guiado...

De IA a inclusão financeira, a região prepara salto de eficiência — com o Brasil na linha de frente

Empresas adotam IA sem plano e colhem riscos em vez de retorno

Inteligência Artificial

Empresas adotam IA sem plano e colhem riscos em vez de retorno

Apesar da popularização das ferramentas de IA, ainda falta clareza, políticas e treinamento. O uso incorreto expõe empresas a riscos e desperdícios de potencial.

O dilema da IA em Life Sciences: maturidade alta, retorno baixo

Inteligência Artificial

O dilema da IA em Life Sciences: maturidade alta, retorno baixo

Apesar da adoção de IA, pilotos no setor ainda focam em tarefas simples, longe de impactar modelos operacionais

Saúde, Indústria e Agronegócio puxam registros de patentes de IA no Brasil

Inteligência Artificial

Saúde, Indústria e Agronegócio puxam registros de patentes de IA no...

Enquanto EUA e China aceleram, o Brasil patina: apenas 8 patentes de IA concedidas em cinco anos