s
INTELIGÊNCIA ARTIFICIAL

A quantidade de parâmetros pode deixar de ser referência para os LLMs

Segundo Sam Altman, CEO da OpenAI, estamos no fim da era dos modelos gigantescos. A indústria vai torná-los melhores de outras maneiras

Modelos de linguagem cada vez maiores não são o futuro. Pelo menos não na visão do CEO da OpenAI, Sam Altman. “Acho que estamos no fim da era desses modelos gigantes, e vamos torná-los melhores de outras maneiras”, disse ele na semana passada, durante um evento do MIT. "É melhor focar em aumentar rapidamente a capacidade, em vez de na contagem de parâmetros", explicou.

Altman já havia dito algo parecido durante sua conversa com Lex Fridman, publicada aqui semanas atrás. A ideia é obter melhorias de capacidade com contagens de parâmetros mais baixas ou aproveitando vários modelos menores juntos. O que sugere que o GPT-4 pode ser o último avanço da IA fruto da estratégia de tornar os modelos maiores e alimentá-los com mais dados. Infelizmente, Altman não detalhou as estratégias ou técnicas de pesquisa que poderiam substituí-la. "Existem muitas maneiras de tornar os modelos Transformers melhores e mais úteis, e muitas delas não envolvem a adição de parâmetros ao modelo", concorda Nick Frostst, da Cohere.

A questão é quanto progresso virá de novos designs de modelos, arquiteturas, aprimoramento da eficiência de dados, avanço de técnicas algorítmicas ou ajuste adicional, propostos por muitos. Técnicas como as dos modelos ajustados para tarefas específicas provavelmente trarão progresso, mas talvez nada parecido com o que vimos nos últimos anos. A esperança é que mantenham o ritmo, reduzindo o custo de desenvolvimento.

Este é um conteúdo exclusivo para assinantes.

Cadastre-se grátis para ler agora
e acesse 5 conteúdos por mês.

É assinante ou já tem senha? Faça login. Já recebe a newsletter? Ative seu acesso.

Mais do que demissões: IA impulsiona reinvenção organizacional

Inteligência Artificial

Mais do que demissões: IA impulsiona reinvenção organizacional

A Inteligência Artificial está acelerando uma transformação estrutural nas empresas: mais do que cortes, há uma realocação estratégica de talentos e investimentos para construir a próxima era da tecnologia.

Semana de muitas novidades no campo da IA

Inteligência Artificial

Semana de muitas novidades no campo da IA

AlphaEvolve, Codex, Jules, GitHub Copilot, Claude 4, Gemini 2.5 Pro... A corrida armamentista da IA acelerou em todas as frentes: chips, conteúdo, credibilidade e controle.

Modelos de raciocínio guardam seus segredos

Inteligência Artificial

Modelos de raciocínio guardam seus segredos

Escondem deliberadamente seus processos de pensamento. Este não é apenas um problema técnico.

IA no trabalho: o que separa quem avança de quem fica para trás

Inteligência Artificial

IA no trabalho: o que separa quem avança de quem fica para trás

Treinamento, renda e idade são os principais divisores no uso de IA, segundo estudo global da KPMG com 17 mil pessoas em 17 países

iFood se posiciona como empresa de IA e aposta em mil agentes autônomos

Inteligência Artificial

iFood se posiciona como empresa de IA e aposta em mil agentes autônom...

Em nova fase estratégica, o iFood deixa de ser apenas tech e assume a identidade de empresa de IA, com agentes inteligentes atuando em Vendas, Atendimento e Marketing

Como ser citado pela IA

Inteligência Artificial

Como ser citado pela IA

Se você quer ser encontrado em pesquisas de IA, escreva como um humano, tenha autoridade, profundidade, legibilidade e abrangência