s
INTELIGÊNCIA ARTIFICIAL

A corrida da IA no text-to-video

Nas últimas semanas, OpenAI e o Google revelaram novos modelos e recursos impressionantes, a um ritmo alucinante, cada um deles ampliando os limites do que a IA pode fazer.

Primeiro, a OpenAI deu ao ChatGPT a capacidade de lembrar conversas anteriores com os usuários, bem como seus detalhes e preferências pessoais. Em seguida, o Google lançou seu modelo mais potente, o Gemini 1.0 Ultra, em uma versão ampla. Em seguida, lançou de forma limitada um novo modelo Gemini 1.5 Pro com a mesma capacidade do Ultra, mas em um pacote menor e mais barato. O que torna o 1.5 Pro especial é sua "janela de contexto" notavelmente grande. Pode analisar uma hora de vídeo, 11 horas de áudio ou cerca de sete livros de texto. E, entre seus poderes, criar vídeos a partir de descrições. Na sequência, a OpenAI apresentou o Sora, um novo modelo de geração de texto para vídeo que pode produzir vídeos de um minuto com qualidade impressionante (e algumas alucinações).

O que poucos se deram conta foi que o movimento todo começou quando a Meta (outra concorrente de peso) publicou um artigo sobre a iniciativa V-JEPA (Video Joint Embedding Predictive Architecture). Pesquisadores da empresa encontraram uma forma de exigir menos dos algoritmos. Em vez de pedir aos algoritmos que encontrem padrões em cada píxel em movimento de um vídeo, eles selecionam um trecho importante da cena e pedem ao software para adivinhar, em termos gerais, o que está faltando.

A OpenAI e o Google fizeram seus anúncios focados no tripé:

  • Texto para vídeo: geração de vídeos sem esforço de até 60 segundos a partir de simples solicitações de texto. Há vários exemplos do Sora aqui.
  • Imagem em vídeo: transformação de imagens estáticas em cenas dinâmicas com movimento contínuo.
  • Aprimoramento de vídeo: adição de novas sequências a vídeos pré-existentes.

Este é um conteúdo exclusivo para assinantes.

Cadastre-se grátis para ler agora
e acesse 5 conteúdos por mês.

É assinante ou já tem senha? Faça login. Já recebe a newsletter? Ative seu acesso.

Pequenos Modelos de Linguagem: Por que menor às vezes é melhor

Inteligência Artificial

Pequenos Modelos de Linguagem: Por que menor às vezes é melhor

A nova tendência para o mercado de inteligência artificial são os Pequenos Modelos de Linguagem, que cativou empresas como Hugging Face, Mistral AI, Nvidia e OpenAI, entre outros.

AI e o reflorestamento de empregos

Inteligência Artificial

AI e o reflorestamento de empregos

Se uma empresa que desmata ou polui é cobrada por reflorestar determinada área, uma empresa que troque empregos pela adoção de IA deveria também ser cobrada por investir em educação e upskilling da IA?

Por Por Rodrigo Helcer, Marília Tosetto, Álvaro Schocair e Joseph Teperman *
Co-Inteligência: o que é e como colaborar com a IA Generativa

Inteligência Artificial

Co-Inteligência: o que é e como colaborar com a IA Generativa

A Co-Inteligência gira em torno da colaboração entre a Inteligência Artificial e humanos, aproveitando os pontos fortes de cada um. Entenda

Inteligência Artificial: Foque no desempenho humano

Inteligência Artificial

Inteligência Artificial: Foque no desempenho humano

Uma nova pesquisa mostra que é preciso valorizar as habilidades exclusivas dos seres humanos para progredir no uso das tecnologias.

Inteligência Artificial: 10 tendências quentes para 2030

Inteligência Artificial

Inteligência Artificial: 10 tendências quentes para 2030

A nova pesquisa produzida pelo Ericsson ConsumerLab convidou 6.500 usuários pioneiros de IA para avaliar e identificar quais serão as principais tendências para a próxima década.

IA Responsável? Só no papel...

Inteligência Artificial

IA Responsável? Só no papel...

Recente pesquisa mostrou que as empresas de tecnologia não estão tomando as medidas apropriadas em relação ao uso de IA Responsável