s
INTELIGÊNCIA ARTIFICIAL

Estamos entrando na era da “IA faz-tudo”

Nos próximos anos, a multimodalidade será norma para os LLMs, que vão ser treinados para responder a prompts de texto, imagem, código, voz e vídeo.

Anote aí: a multimodalidade será a norma da próxima era dos grandes modelos de linguagem (os LLMs). O que significa que eles serão treinados para lidar com combinações de texto, imagem, vídeo e prompts de código, abrindo muitos novos casos de uso e experiências de usuário. A OpenAI já trabalha nessa direção. E, não por acaso, o Google criou o Gemini para ser multimodal desde o lançamento.

"A IA multimodal se tornará o padrão, mesmo para aplicativos regulares de chatbot”, opina Robert Nishihara, CEO da Anyscale, a empresa por trás da estrutura de desenvolvimento Ray, que impulsionou grande parte do boom da IA Generativa.

O pulo do gato será a criação de LLMs multimodais desde sua concepção, exigindo mudanças ao nível de arquitetura. Embora já existam alguns modelos multimodais hoje, os recursos para lidar com diferentes tipos de dados foram costurados em cima de LLMs baseados em texto. Pesquisadores chineses endereçam bem essa necessidade de mudança de arquitetura em um paper apresentando o OneLLM, um grande modelo de linguagem multimodal (MLLM) que suporta oito modalidades diferentes de dados. Ficou curioso? Experimente a partir do que já foi liberado sobre o OneLLM no GitHub.

Este é um conteúdo exclusivo para assinantes.

Cadastre-se grátis para ler agora
e acesse 5 conteúdos por mês.

É assinante ou já tem senha? Faça login. Já recebe a newsletter? Ative seu acesso.

Engenharia e P&D sob pressão: custos sobem, decisões atrasam

Inteligência Artificial

Engenharia e P&D sob pressão: custos sobem, decisões atrasam

Relatório global da Capgemini mostra por que tecnologia não é mais o gargalo — e como a lentidão organizacional ameaça a competitividade.

A IA já funciona. Mas tem um problema estrutural

Inteligência Artificial

A IA já funciona. Mas tem um problema estrutural

A tecnologia amadureceu. Porém, organizações, processos e governança não acompanharam a velocidade da IA em escala.

Um tutor digital para cada pessoa

Inteligência Artificial

Um tutor digital para cada pessoa

A equação "IA + supervisão humana" redefine aprendizagem, reduz desigualdades e cria novo padrão de qualificação. A IA vira infraestrutura cognitiva, reconfigurando talento, ensino e competitividade.

Modelos demais, valor de menos

Inteligência Artificial

Modelos demais, valor de menos

Em 2026, o maior risco de IA pode ser o excesso de modelos e a ausência de integração. O contexto se perde. E o ROI também.

A monetização via anúncios chegou às buscas de IA

Inteligência Artificial

A monetização via anúncios chegou às buscas de IA

O desafio agora é manter neutralidade e valor estratégico em um ambiente que tende à manipulação invisível.

A corrida da IA é vencida (ou perdida) na camada de dados

Inteligência Artificial

A corrida da IA é vencida (ou perdida) na camada de dados

Relatórios da IBM e da Deloitte apontam na mesma direção: empresas só extraem valor de IA quando CDOs garantem governança, integração e métricas consistentes para os dados.