s
INTELIGÊNCIA ARTIFICIAL

Estamos entrando na era da “IA faz-tudo”

Nos próximos anos, a multimodalidade será norma para os LLMs, que vão ser treinados para responder a prompts de texto, imagem, código, voz e vídeo.

Anote aí: a multimodalidade será a norma da próxima era dos grandes modelos de linguagem (os LLMs). O que significa que eles serão treinados para lidar com combinações de texto, imagem, vídeo e prompts de código, abrindo muitos novos casos de uso e experiências de usuário. A OpenAI já trabalha nessa direção. E, não por acaso, o Google criou o Gemini para ser multimodal desde o lançamento.

"A IA multimodal se tornará o padrão, mesmo para aplicativos regulares de chatbot”, opina Robert Nishihara, CEO da Anyscale, a empresa por trás da estrutura de desenvolvimento Ray, que impulsionou grande parte do boom da IA Generativa.

O pulo do gato será a criação de LLMs multimodais desde sua concepção, exigindo mudanças ao nível de arquitetura. Embora já existam alguns modelos multimodais hoje, os recursos para lidar com diferentes tipos de dados foram costurados em cima de LLMs baseados em texto. Pesquisadores chineses endereçam bem essa necessidade de mudança de arquitetura em um paper apresentando o OneLLM, um grande modelo de linguagem multimodal (MLLM) que suporta oito modalidades diferentes de dados. Ficou curioso? Experimente a partir do que já foi liberado sobre o OneLLM no GitHub.

Este é um conteúdo exclusivo para assinantes.

Cadastre-se grátis para ler agora
e acesse 5 conteúdos por mês.

É assinante ou já tem senha? Faça login. Já recebe a newsletter? Ative seu acesso.

IA Física: a nova fronteira da automação inteligente

Inteligência Artificial

IA Física: a nova fronteira da automação inteligente

De humanoides a veículos autônomos, a robótica entra em fase de maturação com dados sintéticos, teleoperação e modelos generativos que aprendem a agir no mundo real.

Superinteligência sim, com regras diferentes

Inteligência Artificial

Superinteligência sim, com regras diferentes

Enquanto o Vale do Silício corre para criar máquinas que superem a mente humana, a Microsoft aposta em outro tipo de corrida: a por uma superinteligência poderosa, mas sob controle humano.

O novo tabuleiro da IA corporativa

Inteligência Artificial

O novo tabuleiro da IA corporativa

IA Soberana sai dos gabinetes de governo e entra no coração da estratégia corporativa, redefinindo quem controla dados, energia e vantagem competitiva.

Agentes de IA e o novo ciclo da decisão corporativa

Inteligência Artificial

Agentes de IA e o novo ciclo da decisão corporativa

Simulações baseadas em agentes autônomos estão acelerando decisões de negócios — e já superam pesquisas tradicionais em precisão e tempo. Mas há desafios para o uso em escala.

Rotulagem de dados: o “combustível cognitivo” da IA corporativa

Inteligência Artificial

Rotulagem de dados: o “combustível cognitivo” da IA corporativa

Empresas que tratam rotulagem como capex cognitivo, e não custo operacional, estão melhor preparadas para transformar aprendizado em ROI.

Vibe coding encontra a realidade corporativa

Inteligência Artificial

Vibe coding encontra a realidade corporativa

O pico de expectativas sobre vibe coding está cedendo lugar a um uso mais controlado. Em protótipos e automações locais, funciona. Em produção, sem governança, vira dívida técnica e risco.