s
INTELIGÊNCIA ARTIFICIAL

Pequenos Modelos de Linguagem: Por que menor às vezes é melhor

A nova tendência para o mercado de inteligência artificial são os Pequenos Modelos de Linguagem, que cativou empresas como Hugging Face, Mistral AI, Nvidia e OpenAI, entre outros.

Esta semana marca mais uma tendência em IA com o surgimento de pequenos modelos de linguagem da Hugging Face, Mistral AI, Nvidia e OpenAI, entre outros. Essas e outras empresas estão voltando sua atenção para modelos menos potentes, esperando que custos mais baixos e desempenho sólido conquistem mais clientes.

Devemos esperar ver modelos 100 vezes menores e mais baratos nos próximos um a dois anos. "Em cinco, eles se tornarão mais eficientes, os LLMs continuarão a se tornar mais baratos de treinar e a inferência de LLM se tornará generalizada”, profetizou Bindu Reddy, a CEO da Abacus.AI.

Na prática, começa a ficar muito claro que, para muitas tarefas, como resumir documentos ou gerar imagens, modelos grandes podem ser um exagero. Como consequência, os consumidores têm buscado maneiras de executar tecnologia generativa baseada em IA de forma mais barata, principalmente nessa fase em que os retornos do investimento em IA Generativa ainda não são claros. Como os Small Language Models (SLMs) usam menos poder de computação, eles podem responder perguntas por apenas um sexto do custo de modelos de linguagem grandes em muitos casos, calcula Yoav Shoham, cofundador da AI21 Labs.

Este é um conteúdo exclusivo para assinantes.

Cadastre-se grátis para ler agora
e acesse 5 conteúdos por mês.

É assinante ou já tem senha? Faça login. Já recebe a newsletter? Ative seu acesso.

Quem controla os agentes de IA?

Inteligência Artificial

Quem controla os agentes de IA?

Relatórios da Cisco e análises da McKinsey indicam que empresas estão concedendo autonomia operacional a sistemas de IA antes de estabelecer mecanismos confiáveis de controle.

Cortar equipes de cibersegurança sai caro: o novo risco está na falta de skills, não de vagas

Inteligência Artificial

Cortar equipes de cibersegurança sai caro: o novo risco está na falt...

Mesmo com milhares de vagas abertas, empresas seguem congelando contratações, reduzindo orçamento e operando com lacunas críticas de habilidades. O resultado é um ambiente mais vulnerável justamente quando a IA amplia a superfície de...

Um modelo só não é suficiente: a IA composta como nova arquitetura empresarial

Inteligência Artificial

Um modelo só não é suficiente: a IA composta como nova arquitetura...

O avanço da Inteligência Artificial começa a migrar da escala dos modelos para arquiteturas que combinam múltiplas formas de inteligência computacional.

Nova geração de apps de IA Generativa começa a tomar forma

Inteligência Artificial

Nova geração de apps de IA Generativa começa a tomar forma

O avanço dos agentes, a memória persistente e a integração entre aplicativos estão gerando novas arquiteturas de software e redefinindo a competição no mercado pessoal de GenAI.

IA Aplicada, fintechs e deeptech: o que deve guiar o próximo ciclo de VC na América Latina

Inteligência Artificial

IA Aplicada, fintechs e deeptech: o que deve guiar o próximo ciclo de...

Apesar da escassez de exits e da instabilidade política, quase metade dos investidores planeja ampliar aportes. O foco agora está na digitalização de setores tradicionais da economia

IA Agêntica pode ampliar em até 70% a capacidade operacional dos bancos

Inteligência Artificial

IA Agêntica pode ampliar em até 70% a capacidade operacional dos ban...

Estudos mostram que agentes de IA podem automatizar crédito, compliance e análise financeira, mas o setor ainda enfrenta barreiras para escalar a tecnologia