Anote aí: a multimodalidade será a norma da próxima era dos grandes modelos de linguagem (os LLMs). O que significa que eles serão treinados para lidar com combinações de texto, imagem, vídeo e prompts de código, abrindo muitos novos casos de uso e experiências de usuário. A OpenAI já trabalha nessa direção. E, não por acaso, o Google criou o Gemini para ser multimodal desde o lançamento.
"A IA multimodal se tornará o padrão, mesmo para aplicativos regulares de chatbot”, opina Robert Nishihara, CEO da Anyscale, a empresa por trás da estrutura de desenvolvimento Ray, que impulsionou grande parte do boom da IA Generativa.
O pulo do gato será a criação de LLMs multimodais desde sua concepção, exigindo mudanças ao nível de arquitetura. Embora já existam alguns modelos multimodais hoje, os recursos para lidar com diferentes tipos de dados foram costurados em cima de LLMs baseados em texto. Pesquisadores chineses endereçam bem essa necessidade de mudança de arquitetura em um paper apresentando o OneLLM, um grande modelo de linguagem multimodal (MLLM) que suporta oito modalidades diferentes de dados. Ficou curioso? Experimente a partir do que já foi liberado sobre o OneLLM no GitHub.
Este é um conteúdo exclusivo para assinantes.
Cadastre-se grátis para ler agora
e acesse 5 conteúdos por mês.
É assinante ou já tem senha? Faça login. Já recebe a newsletter? Ative seu acesso.
Testemunhamos hoje o surgimento da força de trabalho de IA, unindo habilidades humanas com software. Sua chegada provocará mudanças nos empregos, mas trará oportunidades para startups.
Durante o evento SAS Innovate 2024, a fornecedora mostrou soluções para auxiliar clientes a aproveitar os benefícios da tecnologia com segurança.
Mostra um avanço significativo da IA, conduzido principalmente pela iniciativa privada. Mas a corrida tem seus efeitos colaterais. Faltam avaliações robustas e padronizadas para a IA Responsável. Além disso, a IA vence os humanos em al...
Muitos heavy users exigirão além do que a tecnologia pode entregar, e as próprias corporações, sem políticas de inovação nem dados estruturados, deixarão de aproveitar a promessa de eficiência
Daniela Rus, roboticista e diretora do MIT CSAIL em parceria com Gregory Mone mostram como a robótica pode auxiliar a humanidade no futuro em um novo livro.
O relatório anual Enterprise Tech 30, que publica a lista das startups de tecnologia corporativa mais promissoras, na visão dos grandes VCs, mostra startups de IA ocupando espaços do SaaS.
Aproveite nossas promoções de renovação
Clique aquiPara continuar navegando como visitante, vá por aqui.
Cadastre-se grátis, leia até 5 conteúdos por mês,
e receba nossa newsletter diária.
Já recebe a newsletter? Ative seu acesso