Esta semana marca mais uma tendência em IA com o surgimento de pequenos modelos de linguagem da Hugging Face, Mistral AI, Nvidia e OpenAI, entre outros. Essas e outras empresas estão voltando sua atenção para modelos menos potentes, esperando que custos mais baixos e desempenho sólido conquistem mais clientes.
Devemos esperar ver modelos 100 vezes menores e mais baratos nos próximos um a dois anos. "Em cinco, eles se tornarão mais eficientes, os LLMs continuarão a se tornar mais baratos de treinar e a inferência de LLM se tornará generalizada”, profetizou Bindu Reddy, a CEO da Abacus.AI.
Na prática, começa a ficar muito claro que, para muitas tarefas, como resumir documentos ou gerar imagens, modelos grandes podem ser um exagero. Como consequência, os consumidores têm buscado maneiras de executar tecnologia generativa baseada em IA de forma mais barata, principalmente nessa fase em que os retornos do investimento em IA Generativa ainda não são claros. Como os Small Language Models (SLMs) usam menos poder de computação, eles podem responder perguntas por apenas um sexto do custo de modelos de linguagem grandes em muitos casos, calcula Yoav Shoham, cofundador da AI21 Labs.
Este é um conteúdo exclusivo para assinantes.
Cadastre-se grátis para ler agora 
e acesse 5 conteúdos por mês.
É assinante ou já tem senha? Faça login. Já recebe a newsletter? Ative seu acesso.
 
                            Empresas que tratam rotulagem como capex cognitivo, e não custo operacional, estão melhor preparadas para transformar aprendizado em ROI.
 
                            O pico de expectativas sobre vibe coding está cedendo lugar a um uso mais controlado. Em protótipos e automações locais, funciona. Em produção, sem governança, vira dívida técnica e risco.
 
                            Cisco mede a prontidão, IBM mede a transformação — juntas, expõem o ponto cego da maturidade em IA. Charlene Li mostra o caminho para atingi-la.
 
                            Segundo a McKinsey, liderar na era da IA Agêntica exige CEOs fluentes em tecnologia, capazes de equilibrar velocidade, confiança e responsabilidade em um modelo híbrido entre humanos e agentes inteligentes
 
                            Para que a IA gere valor real, as empresas precisam abandonar pilotos isolados e investir no que torna o trabalho mais humano
 
                            Em 2026, infraestrutura, governança e métricas reais começam a substituir promessas e hype, segundo novo relatório do Gartner.
 
      Aproveite nossas promoções de renovação
Clique aquiPara continuar navegando como visitante, vá por aqui.
 
          
      
    
      Cadastre-se grátis, leia até 5 conteúdos por mês,
e receba nossa newsletter diária.
Já recebe a newsletter? Ative seu acesso
