s
INTELIGÊNCIA ARTIFICIAL

Estamos entrando na era da “IA faz-tudo”

Nos próximos anos, a multimodalidade será norma para os LLMs, que vão ser treinados para responder a prompts de texto, imagem, código, voz e vídeo.

Anote aí: a multimodalidade será a norma da próxima era dos grandes modelos de linguagem (os LLMs). O que significa que eles serão treinados para lidar com combinações de texto, imagem, vídeo e prompts de código, abrindo muitos novos casos de uso e experiências de usuário. A OpenAI já trabalha nessa direção. E, não por acaso, o Google criou o Gemini para ser multimodal desde o lançamento.

"A IA multimodal se tornará o padrão, mesmo para aplicativos regulares de chatbot”, opina Robert Nishihara, CEO da Anyscale, a empresa por trás da estrutura de desenvolvimento Ray, que impulsionou grande parte do boom da IA Generativa.

O pulo do gato será a criação de LLMs multimodais desde sua concepção, exigindo mudanças ao nível de arquitetura. Embora já existam alguns modelos multimodais hoje, os recursos para lidar com diferentes tipos de dados foram costurados em cima de LLMs baseados em texto. Pesquisadores chineses endereçam bem essa necessidade de mudança de arquitetura em um paper apresentando o OneLLM, um grande modelo de linguagem multimodal (MLLM) que suporta oito modalidades diferentes de dados. Ficou curioso? Experimente a partir do que já foi liberado sobre o OneLLM no GitHub.

Este é um conteúdo exclusivo para assinantes.

Cadastre-se grátis para ler agora
e acesse 5 conteúdos por mês.

É assinante ou já tem senha? Faça login. Já recebe a newsletter? Ative seu acesso.

Inteligência barata, infraestrutura cara

Inteligência Artificial

Inteligência barata, infraestrutura cara

A queda no preço por token amplia demanda e pressiona ROI, enquanto US$ 1,3 trilhão em CapEX redesenha a indústria até 2027.

SaaS, agentes e a nova economia do software

Inteligência Artificial

SaaS, agentes e a nova economia do software

A automação por IA está deslocando valor da interface para dados, controle e orquestração.

IA Agêntica depende mais de gente que de código

Inteligência Artificial

IA Agêntica depende mais de gente que de código

Agentes prometem escala e eficiência, mas expõem limites organizacionais. O diferencial está na capacidade das empresas de gerir IA como rotina operacional.

Quem define as regras quando agentes se coordenam?

Inteligência Artificial

Quem define as regras quando agentes se coordenam?

O que o experimento MoltBook revela sobre o valor econômico, a governança e a liderança em sistemas autônomos.

Capital cerebral: o limite invisível do crescimento na era da IA

Inteligência Artificial

Capital cerebral: o limite invisível do crescimento na era da IA

A economia avança com IA, mas esbarra na qualidade do julgamento humano — um fator ainda ausente das métricas e da governança corporativa.

A IA entrou no orçamento. Falta entrar no modelo de negócio


Inteligência Artificial

A IA entrou no orçamento. Falta entrar no modelo de negócio


Pesquisas da PwC e do MIT mostram por que os investimentos em IA avançam mais rápido do que a capacidade das empresas de capturar valor. E por que o problema não é tecnológico, mas estrutural.