s
INTELIGÊNCIA ARTIFICIAL

A quantidade de parâmetros pode deixar de ser referência para os LLMs

Segundo Sam Altman, CEO da OpenAI, estamos no fim da era dos modelos gigantescos. A indústria vai torná-los melhores de outras maneiras

Modelos de linguagem cada vez maiores não são o futuro. Pelo menos não na visão do CEO da OpenAI, Sam Altman. “Acho que estamos no fim da era desses modelos gigantes, e vamos torná-los melhores de outras maneiras”, disse ele na semana passada, durante um evento do MIT. "É melhor focar em aumentar rapidamente a capacidade, em vez de na contagem de parâmetros", explicou.

Altman já havia dito algo parecido durante sua conversa com Lex Fridman, publicada aqui semanas atrás. A ideia é obter melhorias de capacidade com contagens de parâmetros mais baixas ou aproveitando vários modelos menores juntos. O que sugere que o GPT-4 pode ser o último avanço da IA fruto da estratégia de tornar os modelos maiores e alimentá-los com mais dados. Infelizmente, Altman não detalhou as estratégias ou técnicas de pesquisa que poderiam substituí-la. "Existem muitas maneiras de tornar os modelos Transformers melhores e mais úteis, e muitas delas não envolvem a adição de parâmetros ao modelo", concorda Nick Frostst, da Cohere.

A questão é quanto progresso virá de novos designs de modelos, arquiteturas, aprimoramento da eficiência de dados, avanço de técnicas algorítmicas ou ajuste adicional, propostos por muitos. Técnicas como as dos modelos ajustados para tarefas específicas provavelmente trarão progresso, mas talvez nada parecido com o que vimos nos últimos anos. A esperança é que mantenham o ritmo, reduzindo o custo de desenvolvimento.

Este é um conteúdo exclusivo para assinantes.

Cadastre-se grátis para ler agora
e acesse 5 conteúdos por mês.

É assinante ou já tem senha? Faça login. Já recebe a newsletter? Ative seu acesso.

Inteligência Artificial: 1 a cada 3 dólares de venture capital vai para a tecnologia

Inteligência Artificial

Inteligência Artificial: 1 a cada 3 dólares de venture capital vai p...

Um terço do dinheiro investido por venture capital em startups globais, este ano, foi para empreendimentos de IA, segundo o relatório recém-publicado pelo CB Insights.

IA Vertical: o que é e como gerar valor

Inteligência Artificial

IA Vertical: o que é e como gerar valor

A Inteligência Artificial Vertical (AI Vertical) já está presente, oferecendo soluções especializadas em diversos setores, criando novas oportunidades para empresas de todos os tamanhos.

Agentes, o eldorado da IA corporativa

Inteligência Artificial

Agentes, o eldorado da IA corporativa

A revolução da Inteligência Artificial tem o potencial de elevar a eficiência corporativa, integrando grandes modelos de linguagem com dados e interfaces de usuário para transformar o modo como trabalhamos.

A influência da CoT e de seus sucessores para os LLMs

Inteligência Artificial

A influência da CoT e de seus sucessores para os LLMs

A técnica Chain of Thought (CoT) se tornou uma das bases para chegarmos a uma IA que consegue raciocinar como os humanos. Entenda.

Em busca da IA prática

Inteligência Artificial

Em busca da IA prática

A indústria de IA trabalha em modelos cada vez maiores, mas enfrenta questões sobre custos, eficiência e propósito. Para que continuar criando modelos gigantescos? Não seria o caso mudar o foco para modelos menores e mais úteis?

IA Segura: sonho ou nosso pior pesadelo?

Inteligência Artificial

IA Segura: sonho ou nosso pior pesadelo?

Estudos da IBM e da EY revelam o que é preciso fazer para navegar pelos perigos com segurança e na velocidade que fará a diferença entre tornar a tecnologia uma vantagem competitiva para a organização.