s
INTELIGÊNCIA ARTIFICIAL

A quantidade de parâmetros pode deixar de ser referência para os LLMs

Segundo Sam Altman, CEO da OpenAI, estamos no fim da era dos modelos gigantescos. A indústria vai torná-los melhores de outras maneiras

Modelos de linguagem cada vez maiores não são o futuro. Pelo menos não na visão do CEO da OpenAI, Sam Altman. “Acho que estamos no fim da era desses modelos gigantes, e vamos torná-los melhores de outras maneiras”, disse ele na semana passada, durante um evento do MIT. "É melhor focar em aumentar rapidamente a capacidade, em vez de na contagem de parâmetros", explicou.

Altman já havia dito algo parecido durante sua conversa com Lex Fridman, publicada aqui semanas atrás. A ideia é obter melhorias de capacidade com contagens de parâmetros mais baixas ou aproveitando vários modelos menores juntos. O que sugere que o GPT-4 pode ser o último avanço da IA fruto da estratégia de tornar os modelos maiores e alimentá-los com mais dados. Infelizmente, Altman não detalhou as estratégias ou técnicas de pesquisa que poderiam substituí-la. "Existem muitas maneiras de tornar os modelos Transformers melhores e mais úteis, e muitas delas não envolvem a adição de parâmetros ao modelo", concorda Nick Frostst, da Cohere.

A questão é quanto progresso virá de novos designs de modelos, arquiteturas, aprimoramento da eficiência de dados, avanço de técnicas algorítmicas ou ajuste adicional, propostos por muitos. Técnicas como as dos modelos ajustados para tarefas específicas provavelmente trarão progresso, mas talvez nada parecido com o que vimos nos últimos anos. A esperança é que mantenham o ritmo, reduzindo o custo de desenvolvimento.

Este é um conteúdo exclusivo para assinantes.

Cadastre-se grátis para ler agora
e acesse 5 conteúdos por mês.

É assinante ou já tem senha? Faça login. Já recebe a newsletter? Ative seu acesso.

Como a IA corta custos e cria riscos nas violações de dados no Brasil

Inteligência Artificial

Como a IA corta custos e cria riscos nas violações de dados no Brasi...

Relatório da IBM mostra que o custo médio é de R$ 7,19 milhões por violação. Mais de 60% das empresas não têm política de uso e uma em cada 6 violações usam IA para atacar organizações

Seu board pessoal com IA: passo a passo para começar agora

Inteligência Artificial

Seu board pessoal com IA: passo a passo para começar agora

Crie um conselho consultivo com personas geradas por IA para tomar decisões mais estratégicas, com clareza sob demanda e diversidade de pensamento

Corrida por talentos de IA é mais que estratégica

Inteligência Artificial

Corrida por talentos de IA é mais que estratégica

Os próximos grandes saltos não ocorrerão necessariamente nos mesmos lugares. 

Agentes de IA: o valor chegou, a confiança não

Inteligência Artificial

Agentes de IA: o valor chegou, a confiança não

Desconfiança e falta de estrutura freiam adoção, apesar do alto potencial de ROI

Software-as-an-Agent: o futuro do SaaS na era da IA

Inteligência Artificial

Software-as-an-Agent: o futuro do SaaS na era da IA

Com IA, o valor do SaaS deixa de ser o número de usuários e passa a ser o quanto o software trabalha por você. E isso muda tudo

IA no trabalho: alta expectativa, baixa confiança — e acesso desigual

Inteligência Artificial

IA no trabalho: alta expectativa, baixa confiança — e acesso desigu...

Trabalhadores esperam que a IA traga eficiência, mas não confiam em seu julgamento. E o acesso desigual à tecnologia e ao treinamento amplia a exclusão