s
INTELIGÊNCIA ARTIFICIAL

Pequenos Modelos de Linguagem: Por que menor às vezes é melhor

A nova tendência para o mercado de inteligência artificial são os Pequenos Modelos de Linguagem, que cativou empresas como Hugging Face, Mistral AI, Nvidia e OpenAI, entre outros.

Esta semana marca mais uma tendência em IA com o surgimento de pequenos modelos de linguagem da Hugging Face, Mistral AI, Nvidia e OpenAI, entre outros. Essas e outras empresas estão voltando sua atenção para modelos menos potentes, esperando que custos mais baixos e desempenho sólido conquistem mais clientes.

Devemos esperar ver modelos 100 vezes menores e mais baratos nos próximos um a dois anos. "Em cinco, eles se tornarão mais eficientes, os LLMs continuarão a se tornar mais baratos de treinar e a inferência de LLM se tornará generalizada”, profetizou Bindu Reddy, a CEO da Abacus.AI.

Na prática, começa a ficar muito claro que, para muitas tarefas, como resumir documentos ou gerar imagens, modelos grandes podem ser um exagero. Como consequência, os consumidores têm buscado maneiras de executar tecnologia generativa baseada em IA de forma mais barata, principalmente nessa fase em que os retornos do investimento em IA Generativa ainda não são claros. Como os Small Language Models (SLMs) usam menos poder de computação, eles podem responder perguntas por apenas um sexto do custo de modelos de linguagem grandes em muitos casos, calcula Yoav Shoham, cofundador da AI21 Labs.

Este é um conteúdo exclusivo para assinantes.

Cadastre-se grátis para ler agora
e acesse 5 conteúdos por mês.

É assinante ou já tem senha? Faça login. Já recebe a newsletter? Ative seu acesso.

Sam Altman quer regular a IA. A pergunta é: podemos confiar nele?

Inteligência Artificial

Sam Altman quer regular a IA. A pergunta é: podemos confiar nele?

A empresa posicionada para capturar os maiores lucros da IA propõe como ela deve ser tributada, regulada e distribuída — e pede ao governo que faça o que ela própria não se compromete a fazer.

Limites cognitivos e a vida emocional oculta dos LLMs

Inteligência Artificial

Limites cognitivos e a vida emocional oculta dos LLMs

Pesquisa de interpretabilidade da Anthropic identifica 171 representações internas de emoção no Claude Sonnet 4.5. Elas são causais e o modelo já desenvolveu mecanismos para ocultá-las.

A órbita como infraestrutura

Inteligência Artificial

A órbita como infraestrutura

SpaceX, Google e Nvidia convergem para a mesma aposta: computação de IA no espaço. Os dados técnicos mostram onde estão os gargalos — e onde está o dinheiro.

A IA já constrói um modelo de quem somos, mas não podemos auditá-lo

Inteligência Artificial

A IA já constrói um modelo de quem somos, mas não podemos auditá-l...

Memória persistente transforma sistemas de IA em infraestruturas de identidade, sem mecanismos claros de explicação, correção ou limites de uso.

O radar da deep tech: 25 tecnologias que podem transformar o mundo

Inteligência Artificial

O radar da deep tech: 25 tecnologias que podem transformar o mundo

Novo relatório do EIC mapeia avanços em IA, materiais avançados, computação quântica e biotecnologia que começam a ganhar escala na corrida global pela inovação

Integridade, a capacidade que falta para a IA

Inteligência Artificial

Integridade, a capacidade que falta para a IA

Por razões técnicas e estratégicas, a AI Integrity emerge como o próximo campo crítico da segurança corporativa