s
INTELIGÊNCIA ARTIFICIAL

Pequenos Modelos de Linguagem: Por que menor às vezes é melhor

A nova tendência para o mercado de inteligência artificial são os Pequenos Modelos de Linguagem, que cativou empresas como Hugging Face, Mistral AI, Nvidia e OpenAI, entre outros.

Esta semana marca mais uma tendência em IA com o surgimento de pequenos modelos de linguagem da Hugging Face, Mistral AI, Nvidia e OpenAI, entre outros. Essas e outras empresas estão voltando sua atenção para modelos menos potentes, esperando que custos mais baixos e desempenho sólido conquistem mais clientes.

Devemos esperar ver modelos 100 vezes menores e mais baratos nos próximos um a dois anos. "Em cinco, eles se tornarão mais eficientes, os LLMs continuarão a se tornar mais baratos de treinar e a inferência de LLM se tornará generalizada”, profetizou Bindu Reddy, a CEO da Abacus.AI.

Na prática, começa a ficar muito claro que, para muitas tarefas, como resumir documentos ou gerar imagens, modelos grandes podem ser um exagero. Como consequência, os consumidores têm buscado maneiras de executar tecnologia generativa baseada em IA de forma mais barata, principalmente nessa fase em que os retornos do investimento em IA Generativa ainda não são claros. Como os Small Language Models (SLMs) usam menos poder de computação, eles podem responder perguntas por apenas um sexto do custo de modelos de linguagem grandes em muitos casos, calcula Yoav Shoham, cofundador da AI21 Labs.

Este é um conteúdo exclusivo para assinantes.

Cadastre-se grátis para ler agora
e acesse 5 conteúdos por mês.

É assinante ou já tem senha? Faça login. Já recebe a newsletter? Ative seu acesso.

Ter IA não é mais diferencial. Ter a arquitetura certa de IA é

Inteligência Artificial

Ter IA não é mais diferencial. Ter a arquitetura certa de IA é

Principalmente quando ciência, tecnologia e pessoas se encontram.

Por Alexandre Kavinski *
O mundo não é feito de palavras

Inteligência Artificial

O mundo não é feito de palavras

Avanços em IA cognitiva e física deslocam a fronteira da tecnologia para a execução do trabalho e reabrem a disputa entre modelos de linguagem e modelos de mundo.

Da engrenagem do Pix à IA Agêntica: como a Red Hat enxerga o futuro do serviço público no Brasil

Inteligência Artificial

Da engrenagem do Pix à IA Agêntica: como a Red Hat enxerga o futuro...

Jason Corey, VP do Americas Office of Technology da Red Hat, explica por que o open source entrega mais segurança, como agentes de IA podem modernizar sistemas legados sem interromper serviços e o que coloca o Brasil na vanguarda

Neutralidade de modelo: quando o acesso à IA se torna um risco estratégico

Inteligência Artificial

Neutralidade de modelo: quando o acesso à IA se torna um risco estrat...

O bloqueio dos modelos mais avançados da Anthropic acelerou uma mudança na arquitetura corporativa de IA. A pergunta central deixou de ser qual modelo é melhor e passou a ser quem controla o acesso a ele.

O TSE e o

Inteligência Artificial

O TSE e o "tsunami" da IA: como a Justiça Eleitoral se arma para 2026

Em painel no 6° Congresso de Internet, promovido pela Abranet, o ministro Floriano Azevedo Marques detalhou as regras do TSE sobre Inteligência Artificial, defendeu a "moratória" de conteúdo sintético e explicou por que a IA não poder...

Atenção à luz vermelha da IA

Inteligência Artificial

Atenção à luz vermelha da IA

Em 12 de junho, o governo dos EUA obrigou a Anthropic a desligar Fable 5 e Mythos 5 no mundo todo, 72 horas após o lançamento. Para quem opera sobre IA de fronteira, o acesso passou a ser ativo revogável sem aviso.