s
INTELIGÊNCIA ARTIFICIAL

Estamos entrando na era da “IA faz-tudo”

Nos próximos anos, a multimodalidade será norma para os LLMs, que vão ser treinados para responder a prompts de texto, imagem, código, voz e vídeo.

Anote aí: a multimodalidade será a norma da próxima era dos grandes modelos de linguagem (os LLMs). O que significa que eles serão treinados para lidar com combinações de texto, imagem, vídeo e prompts de código, abrindo muitos novos casos de uso e experiências de usuário. A OpenAI já trabalha nessa direção. E, não por acaso, o Google criou o Gemini para ser multimodal desde o lançamento.

"A IA multimodal se tornará o padrão, mesmo para aplicativos regulares de chatbot”, opina Robert Nishihara, CEO da Anyscale, a empresa por trás da estrutura de desenvolvimento Ray, que impulsionou grande parte do boom da IA Generativa.

O pulo do gato será a criação de LLMs multimodais desde sua concepção, exigindo mudanças ao nível de arquitetura. Embora já existam alguns modelos multimodais hoje, os recursos para lidar com diferentes tipos de dados foram costurados em cima de LLMs baseados em texto. Pesquisadores chineses endereçam bem essa necessidade de mudança de arquitetura em um paper apresentando o OneLLM, um grande modelo de linguagem multimodal (MLLM) que suporta oito modalidades diferentes de dados. Ficou curioso? Experimente a partir do que já foi liberado sobre o OneLLM no GitHub.

Este é um conteúdo exclusivo para assinantes.

Cadastre-se grátis para ler agora
e acesse 5 conteúdos por mês.

É assinante ou já tem senha? Faça login. Já recebe a newsletter? Ative seu acesso.

Os agentes de IA avançam. As empresas, nem tanto

Inteligência Artificial

Os agentes de IA avançam. As empresas, nem tanto

Muitas organizações têm dificuldade em transformar a IA Agêntica em ROI. Desafios estruturais como governança, déficit técnico, custo e confiança ainda limitam o impacto desejado

IA no trabalho: entre dopamina, workslop e risco regulatório

Inteligência Artificial

IA no trabalho: entre dopamina, workslop e risco regulatório

Pesquisas recentes mostram que chatbots e copilots podem capturar atenção como redes sociais e máquinas caça-níqueis. E já há um preço alto sendo pago nas empresas.

Como aumentar a segurança da GenAI?

Inteligência Artificial

Como aumentar a segurança da GenAI?

Tratando segurança como arquitetura e não como filtro no fim do funil. Aplicações que nascem com detecção, supervisão e resposta em camadas independentes escalam com menos sustos.

Otimismo e medo: como os brasileiros veem a IA no trabalho

Inteligência Artificial

Otimismo e medo: como os brasileiros veem a IA no trabalho

Pesquisa mostra que 85% dos trabalhadores acham que a IA vai impactar seus empregos. O Brasil é o mais otimista da América Latina, mas também sente medo de ser substituído

IA boa é IA governada

Inteligência Artificial

IA boa é IA governada

Sem fundação sólida, projetos viram castelos de areia: executivos da MATH explicam como transformar hype em vantagem competitiva com governança, resiliência e ROI real.

Deep techs na América Latina: ambição global, desafios locais

Inteligência Artificial

Deep techs na América Latina: ambição global, desafios locais

Mesmo com talento e ciência de ponta, a América Latina ainda enfrenta barreiras como pouco investimento e falta de ambição global para escalar suas deep techs. Brasil é destaque, mas falta paciência dos investidores