s
INTELIGÊNCIA ARTIFICIAL

A quantidade de parâmetros pode deixar de ser referência para os LLMs

Segundo Sam Altman, CEO da OpenAI, estamos no fim da era dos modelos gigantescos. A indústria vai torná-los melhores de outras maneiras

Modelos de linguagem cada vez maiores não são o futuro. Pelo menos não na visão do CEO da OpenAI, Sam Altman. “Acho que estamos no fim da era desses modelos gigantes, e vamos torná-los melhores de outras maneiras”, disse ele na semana passada, durante um evento do MIT. "É melhor focar em aumentar rapidamente a capacidade, em vez de na contagem de parâmetros", explicou.

Altman já havia dito algo parecido durante sua conversa com Lex Fridman, publicada aqui semanas atrás. A ideia é obter melhorias de capacidade com contagens de parâmetros mais baixas ou aproveitando vários modelos menores juntos. O que sugere que o GPT-4 pode ser o último avanço da IA fruto da estratégia de tornar os modelos maiores e alimentá-los com mais dados. Infelizmente, Altman não detalhou as estratégias ou técnicas de pesquisa que poderiam substituí-la. "Existem muitas maneiras de tornar os modelos Transformers melhores e mais úteis, e muitas delas não envolvem a adição de parâmetros ao modelo", concorda Nick Frostst, da Cohere.

A questão é quanto progresso virá de novos designs de modelos, arquiteturas, aprimoramento da eficiência de dados, avanço de técnicas algorítmicas ou ajuste adicional, propostos por muitos. Técnicas como as dos modelos ajustados para tarefas específicas provavelmente trarão progresso, mas talvez nada parecido com o que vimos nos últimos anos. A esperança é que mantenham o ritmo, reduzindo o custo de desenvolvimento.

Este é um conteúdo exclusivo para assinantes.

Cadastre-se grátis para ler agora
e acesse 5 conteúdos por mês.

É assinante ou já tem senha? Faça login. Já recebe a newsletter? Ative seu acesso.

Software virou mão de obra. Quanto custa o trabalho da IA?

Inteligência Artificial

Software virou mão de obra. Quanto custa o trabalho da IA?

Agentes autônomos desafiam o manual do SaaS e expõem a batalha entre ROI, narrativas de valor e dumping algorítmico.

Transformação digital na América Latina: o salto bilionário guiado pelo Brasil

Inteligência Artificial

Transformação digital na América Latina: o salto bilionário guiado...

De IA a inclusão financeira, a região prepara salto de eficiência — com o Brasil na linha de frente

Empresas adotam IA sem plano e colhem riscos em vez de retorno

Inteligência Artificial

Empresas adotam IA sem plano e colhem riscos em vez de retorno

Apesar da popularização das ferramentas de IA, ainda falta clareza, políticas e treinamento. O uso incorreto expõe empresas a riscos e desperdícios de potencial.

O dilema da IA em Life Sciences: maturidade alta, retorno baixo

Inteligência Artificial

O dilema da IA em Life Sciences: maturidade alta, retorno baixo

Apesar da adoção de IA, pilotos no setor ainda focam em tarefas simples, longe de impactar modelos operacionais

Saúde, Indústria e Agronegócio puxam registros de patentes de IA no Brasil

Inteligência Artificial

Saúde, Indústria e Agronegócio puxam registros de patentes de IA no...

Enquanto EUA e China aceleram, o Brasil patina: apenas 8 patentes de IA concedidas em cinco anos

IA cria sósias — e põe em xeque a nossa identidade e autenticidade

Inteligência Artificial

IA cria sósias — e põe em xeque a nossa identidade e autenticidade

Como contestamos algo que nunca autorizamos — mas que soa exatamente como cada um de nós? Até onde vai nossa autonomia, quando nossa “alma digital” continua agindo mesmo offline?