s
INTELIGÊNCIA ARTIFICIAL

A corrida da IA no text-to-video

Nas últimas semanas, OpenAI e o Google revelaram novos modelos e recursos impressionantes, a um ritmo alucinante, cada um deles ampliando os limites do que a IA pode fazer.

Primeiro, a OpenAI deu ao ChatGPT a capacidade de lembrar conversas anteriores com os usuários, bem como seus detalhes e preferências pessoais. Em seguida, o Google lançou seu modelo mais potente, o Gemini 1.0 Ultra, em uma versão ampla. Em seguida, lançou de forma limitada um novo modelo Gemini 1.5 Pro com a mesma capacidade do Ultra, mas em um pacote menor e mais barato. O que torna o 1.5 Pro especial é sua "janela de contexto" notavelmente grande. Pode analisar uma hora de vídeo, 11 horas de áudio ou cerca de sete livros de texto. E, entre seus poderes, criar vídeos a partir de descrições. Na sequência, a OpenAI apresentou o Sora, um novo modelo de geração de texto para vídeo que pode produzir vídeos de um minuto com qualidade impressionante (e algumas alucinações).

O que poucos se deram conta foi que o movimento todo começou quando a Meta (outra concorrente de peso) publicou um artigo sobre a iniciativa V-JEPA (Video Joint Embedding Predictive Architecture). Pesquisadores da empresa encontraram uma forma de exigir menos dos algoritmos. Em vez de pedir aos algoritmos que encontrem padrões em cada píxel em movimento de um vídeo, eles selecionam um trecho importante da cena e pedem ao software para adivinhar, em termos gerais, o que está faltando.

A OpenAI e o Google fizeram seus anúncios focados no tripé:

  • Texto para vídeo: geração de vídeos sem esforço de até 60 segundos a partir de simples solicitações de texto. Há vários exemplos do Sora aqui.
  • Imagem em vídeo: transformação de imagens estáticas em cenas dinâmicas com movimento contínuo.
  • Aprimoramento de vídeo: adição de novas sequências a vídeos pré-existentes.

Este é um conteúdo exclusivo para assinantes.

Cadastre-se grátis para ler agora
e acesse 5 conteúdos por mês.

É assinante ou já tem senha? Faça login. Já recebe a newsletter? Ative seu acesso.

Inteligência Artificial: De ferramenta a membro da equipe

Inteligência Artificial

Inteligência Artificial: De ferramenta a membro da equipe

A IA Generativa já pode atuar como colega de trabalho, embora muitas empresas ainda a tratem apenas como ferramenta. Sua integração está próxima e inevitável.

Agentic AI: Um novo mercado, de US$ 10 trilhões

Inteligência Artificial

Agentic AI: Um novo mercado, de US$ 10 trilhões

As empresas de IA estão indo atrás dos lucros do setor de serviços, remodelando como pensamos a automação.

Avanços na Inteligência Artificial dominam a Ciência

Inteligência Artificial

Avanços na Inteligência Artificial dominam a Ciência

Os Prêmios Nobel de 2024 em Física e Química nos deram um vislumbre de como as ferramentas de IA já estão ajudando a empurrar adiante os limites do conhecimento humano.

Inteligência Artificial: O que vem por aí?

Inteligência Artificial

Inteligência Artificial: O que vem por aí?

2024 viu investimentos massivos em AGI, apesar de ainda estarmos debatendo sua definição. Muitos pesquisadores continuam céticos em relação ao caminho do LLM para a AGI, e dessa para a ASI.

A IA se tornou uma força motriz para os investidores de risco

Inteligência Artificial

A IA se tornou uma força motriz para os investidores de risco

Um terço de todo o dinheiro investido por VCs este ano foi para empreendimentos de IA, segundo relatório recém-publicado pelo CB Insights.

IA Vertical: o que é e como gerar valor

Inteligência Artificial

IA Vertical: o que é e como gerar valor

A Inteligência Artificial Vertical (AI Vertical) já está presente, oferecendo soluções especializadas em diversos setores, criando novas oportunidades para empresas de todos os tamanhos.