s
INTELIGÊNCIA ARTIFICIAL

A quantidade de parâmetros pode deixar de ser referência para os LLMs

Segundo Sam Altman, CEO da OpenAI, estamos no fim da era dos modelos gigantescos. A indústria vai torná-los melhores de outras maneiras

Modelos de linguagem cada vez maiores não são o futuro. Pelo menos não na visão do CEO da OpenAI, Sam Altman. “Acho que estamos no fim da era desses modelos gigantes, e vamos torná-los melhores de outras maneiras”, disse ele na semana passada, durante um evento do MIT. "É melhor focar em aumentar rapidamente a capacidade, em vez de na contagem de parâmetros", explicou.

Altman já havia dito algo parecido durante sua conversa com Lex Fridman, publicada aqui semanas atrás. A ideia é obter melhorias de capacidade com contagens de parâmetros mais baixas ou aproveitando vários modelos menores juntos. O que sugere que o GPT-4 pode ser o último avanço da IA fruto da estratégia de tornar os modelos maiores e alimentá-los com mais dados. Infelizmente, Altman não detalhou as estratégias ou técnicas de pesquisa que poderiam substituí-la. "Existem muitas maneiras de tornar os modelos Transformers melhores e mais úteis, e muitas delas não envolvem a adição de parâmetros ao modelo", concorda Nick Frostst, da Cohere.

A questão é quanto progresso virá de novos designs de modelos, arquiteturas, aprimoramento da eficiência de dados, avanço de técnicas algorítmicas ou ajuste adicional, propostos por muitos. Técnicas como as dos modelos ajustados para tarefas específicas provavelmente trarão progresso, mas talvez nada parecido com o que vimos nos últimos anos. A esperança é que mantenham o ritmo, reduzindo o custo de desenvolvimento.

Este é um conteúdo exclusivo para assinantes.

Cadastre-se grátis para ler agora
e acesse 5 conteúdos por mês.

É assinante ou já tem senha? Faça login. Já recebe a newsletter? Ative seu acesso.

Robôs humanoides podem rivalizar com trabalho humano até 2030

Inteligência Artificial

Robôs humanoides podem rivalizar com trabalho humano até 2030

Com IA Generativa, custo em queda e mobilidade avançada, humanoides devem ganhar força na indústria e nas residências, de acordo com estudo

Protocolo A2A quer resolver a interoperabilidade entre agentes de IA

Inteligência Artificial

Protocolo A2A quer resolver a interoperabilidade entre agentes de IA

Nova padronização entre agentes lançada pelo Google promete reduzir custos e acelerar inovações

Guerra do futuro será travada por chips, genes e códigos

Inteligência Artificial

Guerra do futuro será travada por chips, genes e códigos

O novo relatório da OTAN revela um campo de batalha onde IA, Biotecnologia e Big Data definem estratégias, alianças e riscos inéditos

Bancos brasileiros apostam alto em Inteligência Artificial

Inteligência Artificial

Bancos brasileiros apostam alto em Inteligência Artificial

O crescimento do investimento é impulsionado por iniciativas estratégicas para viabilizar uma base tecnológica robusta, especialmente na adoção de IA, GenAI e Cloud

AI Index 2025: a corrida não é por capacidade, e sim por controle

Inteligência Artificial

AI Index 2025: a corrida não é por capacidade, e sim por controle

Relatório anual de Stanford mostra que a inteligência artificial ficou mais barata, rápida e onipresente — e que o verdadeiro poder está agora nas mãos de quem implementa

A nova era do trabalho exige IA para trabalhadores de todas as idades

Inteligência Artificial

A nova era do trabalho exige IA para trabalhadores de todas as idades

Garantir que tecnologias de IA sejam acessíveis e justas para trabalhadores mais velhos não é apenas um imperativo ético — é uma vantagem competitiva em um mundo que envelhece rapidamente