s
INTELIGÊNCIA ARTIFICIAL

A corrida da IA no text-to-video

Nas últimas semanas, OpenAI e o Google revelaram novos modelos e recursos impressionantes, a um ritmo alucinante, cada um deles ampliando os limites do que a IA pode fazer.

Primeiro, a OpenAI deu ao ChatGPT a capacidade de lembrar conversas anteriores com os usuários, bem como seus detalhes e preferências pessoais. Em seguida, o Google lançou seu modelo mais potente, o Gemini 1.0 Ultra, em uma versão ampla. Em seguida, lançou de forma limitada um novo modelo Gemini 1.5 Pro com a mesma capacidade do Ultra, mas em um pacote menor e mais barato. O que torna o 1.5 Pro especial é sua "janela de contexto" notavelmente grande. Pode analisar uma hora de vídeo, 11 horas de áudio ou cerca de sete livros de texto. E, entre seus poderes, criar vídeos a partir de descrições. Na sequência, a OpenAI apresentou o Sora, um novo modelo de geração de texto para vídeo que pode produzir vídeos de um minuto com qualidade impressionante (e algumas alucinações).

O que poucos se deram conta foi que o movimento todo começou quando a Meta (outra concorrente de peso) publicou um artigo sobre a iniciativa V-JEPA (Video Joint Embedding Predictive Architecture). Pesquisadores da empresa encontraram uma forma de exigir menos dos algoritmos. Em vez de pedir aos algoritmos que encontrem padrões em cada píxel em movimento de um vídeo, eles selecionam um trecho importante da cena e pedem ao software para adivinhar, em termos gerais, o que está faltando.

A OpenAI e o Google fizeram seus anúncios focados no tripé:

  • Texto para vídeo: geração de vídeos sem esforço de até 60 segundos a partir de simples solicitações de texto. Há vários exemplos do Sora aqui.
  • Imagem em vídeo: transformação de imagens estáticas em cenas dinâmicas com movimento contínuo.
  • Aprimoramento de vídeo: adição de novas sequências a vídeos pré-existentes.

Este é um conteúdo exclusivo para assinantes.

Cadastre-se grátis para ler agora
e acesse 5 conteúdos por mês.

É assinante ou já tem senha? Faça login. Já recebe a newsletter? Ative seu acesso.

E a IA dominou a pista

Inteligência Artificial

E a IA dominou a pista

O relatório anual Enterprise Tech 30, que publica a lista das startups de tecnologia corporativa mais promissoras, na visão dos grandes VCs do Silicon Valley, mostra que as startups de IA estão ocupando espaços do SaaS.

Bolha de IA Generativa? Talvez não...

Inteligência Artificial

Bolha de IA Generativa? Talvez não...

"Momento desânimo" na comunidade de IA. A constatação de que os bilhões de dólares investidos até agora não vão retornar tão rápido, faz nascer a ideia de uma bolha de IA Generativa.

Olá, head de GenAI!

Inteligência Artificial

Olá, head de GenAI!

Pensando na carreira? Tem cargo novo no mercado: Chefe Global de IA Generativa.

Da automação à autonomia

Inteligência Artificial

Da automação à autonomia

2024 será o ano dos Agentes de IA, que provarão ser mais do que apenas assistentes digitais. Serão catalisadores de transformações em todos os setores e na vida quotidiana.

Como fica a propriedade intelectual em tempos de IA Generativa?

Inteligência Artificial

Como fica a propriedade intelectual em tempos de IA Generativa?

E por que ela deve caminhar lado a lado com a proteção de dados pessoais?

Por Yasodara Cordova *
Tendências de IA a partir de 2024

Inteligência Artificial

Tendências de IA a partir de 2024

A corrida para 2028 já está acelerada. Empresas investem em tecnologias inovadoras, em fase inicial, para ganhar quando estiverem maduras. Aqui estão 29 tendências de IA que agitarão o circuito.