s
INTELIGÊNCIA ARTIFICIAL

Pequenos Modelos de Linguagem: Por que menor às vezes é melhor

A nova tendência para o mercado de inteligência artificial são os Pequenos Modelos de Linguagem, que cativou empresas como Hugging Face, Mistral AI, Nvidia e OpenAI, entre outros.

Esta semana marca mais uma tendência em IA com o surgimento de pequenos modelos de linguagem da Hugging Face, Mistral AI, Nvidia e OpenAI, entre outros. Essas e outras empresas estão voltando sua atenção para modelos menos potentes, esperando que custos mais baixos e desempenho sólido conquistem mais clientes.

Devemos esperar ver modelos 100 vezes menores e mais baratos nos próximos um a dois anos. "Em cinco, eles se tornarão mais eficientes, os LLMs continuarão a se tornar mais baratos de treinar e a inferência de LLM se tornará generalizada”, profetizou Bindu Reddy, a CEO da Abacus.AI.

Na prática, começa a ficar muito claro que, para muitas tarefas, como resumir documentos ou gerar imagens, modelos grandes podem ser um exagero. Como consequência, os consumidores têm buscado maneiras de executar tecnologia generativa baseada em IA de forma mais barata, principalmente nessa fase em que os retornos do investimento em IA Generativa ainda não são claros. Como os Small Language Models (SLMs) usam menos poder de computação, eles podem responder perguntas por apenas um sexto do custo de modelos de linguagem grandes em muitos casos, calcula Yoav Shoham, cofundador da AI21 Labs.

Este é um conteúdo exclusivo para assinantes.

Cadastre-se grátis para ler agora
e acesse 5 conteúdos por mês.

É assinante ou já tem senha? Faça login. Já recebe a newsletter? Ative seu acesso.

Da engrenagem do Pix à IA Agêntica: como a Red Hat enxerga o futuro do serviço público no Brasil

Inteligência Artificial

Da engrenagem do Pix à IA Agêntica: como a Red Hat enxerga o futuro...

Jason Corey, VP do Americas Office of Technology da Red Hat, explica por que o open source entrega mais segurança, como agentes de IA podem modernizar sistemas legados sem interromper serviços e o que coloca o Brasil na vanguarda

Neutralidade de modelo: quando o acesso à IA se torna um risco estratégico

Inteligência Artificial

Neutralidade de modelo: quando o acesso à IA se torna um risco estrat...

O bloqueio dos modelos mais avançados da Anthropic acelerou uma mudança na arquitetura corporativa de IA. A pergunta central deixou de ser qual modelo é melhor e passou a ser quem controla o acesso a ele.

O TSE e o

Inteligência Artificial

O TSE e o "tsunami" da IA: como a Justiça Eleitoral se arma para 2026

Em painel no 6° Congresso de Internet, promovido pela Abranet, o ministro Floriano Azevedo Marques detalhou as regras do TSE sobre Inteligência Artificial, defendeu a "moratória" de conteúdo sintético e explicou por que a IA não poder...

Atenção à luz vermelha da IA

Inteligência Artificial

Atenção à luz vermelha da IA

Em 12 de junho, o governo dos EUA obrigou a Anthropic a desligar Fable 5 e Mythos 5 no mundo todo, 72 horas após o lançamento. Para quem opera sobre IA de fronteira, o acesso passou a ser ativo revogável sem aviso.

A fatura da IA chegou e virou problema de conselho

Inteligência Artificial

A fatura da IA chegou e virou problema de conselho

Token é pingo de torneira: um não custa nada, milhões por dia viram a conta do mês. Assim a IA chegou a 25% dos orçamentos de TI para 2027, desafiando a indústria a ser mais transparente

Anthropic abre o Mythos, modelo que trancou por risco

Inteligência Artificial

Anthropic abre o Mythos, modelo que trancou por risco

Versão Claude Fable 5 estreia um jeito novo de vender IA avançada: quase toda a capacidade do modelo, com um filtro de segurança decidindo o que fica de fora.