s
INTELIGÊNCIA ARTIFICIAL

Estamos entrando na era da “IA faz-tudo”

Nos próximos anos, a multimodalidade será norma para os LLMs, que vão ser treinados para responder a prompts de texto, imagem, código, voz e vídeo.

Anote aí: a multimodalidade será a norma da próxima era dos grandes modelos de linguagem (os LLMs). O que significa que eles serão treinados para lidar com combinações de texto, imagem, vídeo e prompts de código, abrindo muitos novos casos de uso e experiências de usuário. A OpenAI já trabalha nessa direção. E, não por acaso, o Google criou o Gemini para ser multimodal desde o lançamento.

"A IA multimodal se tornará o padrão, mesmo para aplicativos regulares de chatbot”, opina Robert Nishihara, CEO da Anyscale, a empresa por trás da estrutura de desenvolvimento Ray, que impulsionou grande parte do boom da IA Generativa.

O pulo do gato será a criação de LLMs multimodais desde sua concepção, exigindo mudanças ao nível de arquitetura. Embora já existam alguns modelos multimodais hoje, os recursos para lidar com diferentes tipos de dados foram costurados em cima de LLMs baseados em texto. Pesquisadores chineses endereçam bem essa necessidade de mudança de arquitetura em um paper apresentando o OneLLM, um grande modelo de linguagem multimodal (MLLM) que suporta oito modalidades diferentes de dados. Ficou curioso? Experimente a partir do que já foi liberado sobre o OneLLM no GitHub.

Este é um conteúdo exclusivo para assinantes.

Cadastre-se grátis para ler agora
e acesse 5 conteúdos por mês.

É assinante ou já tem senha? Faça login. Já recebe a newsletter? Ative seu acesso.

Avanços na Inteligência Artificial dominam a Ciência

Inteligência Artificial

Avanços na Inteligência Artificial dominam a Ciência

Os Prêmios Nobel de 2024 em Física e Química nos deram um vislumbre de como as ferramentas de IA já estão ajudando a empurrar adiante os limites do conhecimento humano.

Inteligência Artificial: O que vem por aí?

Inteligência Artificial

Inteligência Artificial: O que vem por aí?

2024 viu investimentos massivos em AGI, apesar de ainda estarmos debatendo sua definição. Muitos pesquisadores continuam céticos em relação ao caminho do LLM para a AGI, e dessa para a ASI.

A IA se tornou uma força motriz para os investidores de risco

Inteligência Artificial

A IA se tornou uma força motriz para os investidores de risco

Um terço de todo o dinheiro investido por VCs este ano foi para empreendimentos de IA, segundo relatório recém-publicado pelo CB Insights.

IA Vertical: o que é e como gerar valor

Inteligência Artificial

IA Vertical: o que é e como gerar valor

A Inteligência Artificial Vertical (AI Vertical) já está presente, oferecendo soluções especializadas em diversos setores, criando novas oportunidades para empresas de todos os tamanhos.

Agentes, o eldorado da IA corporativa

Inteligência Artificial

Agentes, o eldorado da IA corporativa

A revolução da Inteligência Artificial tem o potencial de elevar a eficiência corporativa, integrando grandes modelos de linguagem com dados e interfaces de usuário para transformar o modo como trabalhamos.

A influência da CoT e de seus sucessores para os LLMs

Inteligência Artificial

A influência da CoT e de seus sucessores para os LLMs

A técnica Chain of Thought (CoT) se tornou uma das bases para chegarmos a uma IA que consegue raciocinar como os humanos. Entenda.