s
INTELIGÊNCIA ARTIFICIAL

A quantidade de parâmetros pode deixar de ser referência para os LLMs

Segundo Sam Altman, CEO da OpenAI, estamos no fim da era dos modelos gigantescos. A indústria vai torná-los melhores de outras maneiras

Modelos de linguagem cada vez maiores não são o futuro. Pelo menos não na visão do CEO da OpenAI, Sam Altman. “Acho que estamos no fim da era desses modelos gigantes, e vamos torná-los melhores de outras maneiras”, disse ele na semana passada, durante um evento do MIT. "É melhor focar em aumentar rapidamente a capacidade, em vez de na contagem de parâmetros", explicou.

Altman já havia dito algo parecido durante sua conversa com Lex Fridman, publicada aqui semanas atrás. A ideia é obter melhorias de capacidade com contagens de parâmetros mais baixas ou aproveitando vários modelos menores juntos. O que sugere que o GPT-4 pode ser o último avanço da IA fruto da estratégia de tornar os modelos maiores e alimentá-los com mais dados. Infelizmente, Altman não detalhou as estratégias ou técnicas de pesquisa que poderiam substituí-la. "Existem muitas maneiras de tornar os modelos Transformers melhores e mais úteis, e muitas delas não envolvem a adição de parâmetros ao modelo", concorda Nick Frostst, da Cohere.

A questão é quanto progresso virá de novos designs de modelos, arquiteturas, aprimoramento da eficiência de dados, avanço de técnicas algorítmicas ou ajuste adicional, propostos por muitos. Técnicas como as dos modelos ajustados para tarefas específicas provavelmente trarão progresso, mas talvez nada parecido com o que vimos nos últimos anos. A esperança é que mantenham o ritmo, reduzindo o custo de desenvolvimento.

Este é um conteúdo exclusivo para assinantes.

Cadastre-se grátis para ler agora
e acesse 5 conteúdos por mês.

É assinante ou já tem senha? Faça login. Já recebe a newsletter? Ative seu acesso.

IA muda primeiro emprego; não como acreditávamos

Inteligência Artificial

IA muda primeiro emprego; não como acreditávamos

Empresas com IA integrada estão contratando mais profissionais juniores, enquanto as tarefas que formavam esses profissionais estão desaparecendo ao mesmo tempo.

De plataforma de design a ponto de encontro de criatividade e produtividade: a virada do Canva

Inteligência Artificial

De plataforma de design a ponto de encontro de criatividade e produtiv...

Com 5.000 funcionários em uma semana dedicada à IA e US$ 4 bilhões em receita, a empresa redefine o que significa colocar o cliente no centro

A corrida pela IA mudou de lógica. A aposta agora é na IA que se reinventa

Inteligência Artificial

A corrida pela IA mudou de lógica. A aposta agora é na IA que se rei...

O autoaperfeiçoamento recursivo avança dos laboratórios para a estratégia corporativa, com impacto sobre chips, infraestrutura e soberania computacional.

O Vale do Silício foi ao Vaticano. O Papa não cedeu.

Inteligência Artificial

O Vale do Silício foi ao Vaticano. O Papa não cedeu.

Por meses, representantes de Meta, Google, Amazon e OpenAI trabalharam para moldar a primeira encíclica sobre IA. O texto publicado em 25 de maio ignorou o argumento central que levaram.

Cinco futuros possíveis: como a convergência tecnológica vai mudar o modo de viver

Inteligência Artificial

Cinco futuros possíveis: como a convergência tecnológica vai mudar...

De santuários analógicos a comunidades inteligentes autossustentáveis, um relatório da Universidade Monash — baseado em 93 estudos e entrevistas com 20 especialistas — mapeia as forças que vão definir onde habitamos, como envelhec...

Deepfake-as-a-Service ganha escala

Inteligência Artificial

Deepfake-as-a-Service ganha escala

Governos e empresas precisam criar estruturas de confiança digital diante da escalada de fraudes sintéticas, clonagem de identidade e campanhas automatizadas de desinformação.