s
INTELIGÊNCIA ARTIFICIAL

Estamos entrando na era da “IA faz-tudo”

Nos próximos anos, a multimodalidade será norma para os LLMs, que vão ser treinados para responder a prompts de texto, imagem, código, voz e vídeo.

Anote aí: a multimodalidade será a norma da próxima era dos grandes modelos de linguagem (os LLMs). O que significa que eles serão treinados para lidar com combinações de texto, imagem, vídeo e prompts de código, abrindo muitos novos casos de uso e experiências de usuário. A OpenAI já trabalha nessa direção. E, não por acaso, o Google criou o Gemini para ser multimodal desde o lançamento.

"A IA multimodal se tornará o padrão, mesmo para aplicativos regulares de chatbot”, opina Robert Nishihara, CEO da Anyscale, a empresa por trás da estrutura de desenvolvimento Ray, que impulsionou grande parte do boom da IA Generativa.

O pulo do gato será a criação de LLMs multimodais desde sua concepção, exigindo mudanças ao nível de arquitetura. Embora já existam alguns modelos multimodais hoje, os recursos para lidar com diferentes tipos de dados foram costurados em cima de LLMs baseados em texto. Pesquisadores chineses endereçam bem essa necessidade de mudança de arquitetura em um paper apresentando o OneLLM, um grande modelo de linguagem multimodal (MLLM) que suporta oito modalidades diferentes de dados. Ficou curioso? Experimente a partir do que já foi liberado sobre o OneLLM no GitHub.

Este é um conteúdo exclusivo para assinantes.

Cadastre-se grátis para ler agora
e acesse 5 conteúdos por mês.

É assinante ou já tem senha? Faça login. Já recebe a newsletter? Ative seu acesso.

IA muda primeiro emprego; não como acreditávamos

Inteligência Artificial

IA muda primeiro emprego; não como acreditávamos

Empresas com IA integrada estão contratando mais profissionais juniores, enquanto as tarefas que formavam esses profissionais estão desaparecendo ao mesmo tempo.

De plataforma de design a ponto de encontro de criatividade e produtividade: a virada do Canva

Inteligência Artificial

De plataforma de design a ponto de encontro de criatividade e produtiv...

Com 5.000 funcionários em uma semana dedicada à IA e US$ 4 bilhões em receita, a empresa redefine o que significa colocar o cliente no centro

A corrida pela IA mudou de lógica. A aposta agora é na IA que se reinventa

Inteligência Artificial

A corrida pela IA mudou de lógica. A aposta agora é na IA que se rei...

O autoaperfeiçoamento recursivo avança dos laboratórios para a estratégia corporativa, com impacto sobre chips, infraestrutura e soberania computacional.

O Vale do Silício foi ao Vaticano. O Papa não cedeu.

Inteligência Artificial

O Vale do Silício foi ao Vaticano. O Papa não cedeu.

Por meses, representantes de Meta, Google, Amazon e OpenAI trabalharam para moldar a primeira encíclica sobre IA. O texto publicado em 25 de maio ignorou o argumento central que levaram.

Cinco futuros possíveis: como a convergência tecnológica vai mudar o modo de viver

Inteligência Artificial

Cinco futuros possíveis: como a convergência tecnológica vai mudar...

De santuários analógicos a comunidades inteligentes autossustentáveis, um relatório da Universidade Monash — baseado em 93 estudos e entrevistas com 20 especialistas — mapeia as forças que vão definir onde habitamos, como envelhec...

Deepfake-as-a-Service ganha escala

Inteligência Artificial

Deepfake-as-a-Service ganha escala

Governos e empresas precisam criar estruturas de confiança digital diante da escalada de fraudes sintéticas, clonagem de identidade e campanhas automatizadas de desinformação.