s
INTELIGÊNCIA ARTIFICIAL

Estamos atingindo os limites de escala da IA?

Modelos gigantescos já não estão entregando mais os melhores resultados. Talvez o próximo avanço em LLMs não venha do dimensionamento por força bruta. E isso pode ser bom.

Quando a OpenAI lançou o GPT-4 em março de 2023, ajudou a consolidar o conceito das Leis de Escala (Scaling Laws). O GPT-4 era cerca de 10 vezes maior do que o modelo que alimentava o ChatGPT original, e seu tamanho maior produziu um salto significativo no desempenho dos GPTs. Desde então, o mercado passou a ansiar por um GPT-5, gigantesco e poderoso. Mas 18 meses depois, a OpenAI limitou-se a lançar vários outros modelos com capacidades impressionantes, incluindo o GPT-4o, em maio, e o o1, em setembro, sem revelar o tamanho desses modelos. Hoje, acredita-se amplamente que eles não são muito maiores do que o GPT-4 original — e podem até ser menores.

A história tem sido semelhante em outros laboratórios líderes em IA. Alguns meses atrás, tanto Google quanto Anthropic atualizaram seus modelos de pequeno e médio porte (Sonnet 3.5 e Haiku 3.5 para Anthropic, Pro 1.5 e Flash 1.5 para Google). Mas ainda estamos esperando por atualizações correspondentes para seus modelos maiores (Opus 3.5 para o Anthropic e Ultra 1.5 para o Google).

As leis de escala estão perdendo força? A revolução da IA Generativa — construída com base na crença de que os modelos continuarão melhorando à medida que crescem vertiginosamente — começa a estagnar?

Este é um conteúdo exclusivo para assinantes.

Cadastre-se grátis para ler agora
e acesse 5 conteúdos por mês.

É assinante ou já tem senha? Faça login. Já recebe a newsletter? Ative seu acesso.

Da engrenagem do Pix à IA agêntica: como a Red Hat enxerga o futuro do serviço público no Brasil

Inteligência Artificial

Da engrenagem do Pix à IA agêntica: como a Red Hat enxerga o futuro...

Jason Corey, VP do Americas Office of Technology da Red Hat, explica por que a abertura entrega mais segurança, como agentes de IA podem modernizar sistemas legados sem interromper serviços e o que coloca o Brasil na vanguarda

Neutralidade de modelo: quando o acesso à IA se torna um risco estratégico

Inteligência Artificial

Neutralidade de modelo: quando o acesso à IA se torna um risco estrat...

O bloqueio dos modelos mais avançados da Anthropic acelerou uma mudança na arquitetura corporativa de IA. A pergunta central deixou de ser qual modelo é melhor e passou a ser quem controla o acesso a ele.

O TSE e o

Inteligência Artificial

O TSE e o "tsunami" da IA: como a Justiça Eleitoral se arma para 2026

Em painel no 6° Congresso de Internet, promovido pela Abranet, o ministro Floriano Azevedo Marques detalhou as regras do TSE sobre Inteligência Artificial, defendeu a "moratória" de conteúdo sintético e explicou por que a IA não poder...

Atenção à luz vermelha da IA

Inteligência Artificial

Atenção à luz vermelha da IA

Em 12 de junho, o governo dos EUA obrigou a Anthropic a desligar Fable 5 e Mythos 5 no mundo todo, 72 horas após o lançamento. Para quem opera sobre IA de fronteira, o acesso passou a ser ativo revogável sem aviso.

A fatura da IA chegou e virou problema de conselho

Inteligência Artificial

A fatura da IA chegou e virou problema de conselho

Token é pingo de torneira: um não custa nada, milhões por dia viram a conta do mês. Assim a IA chegou a 25% dos orçamentos de TI para 2027, desafiando a indústria a ser mais transparente

Anthropic abre o Mythos, modelo que trancou por risco

Inteligência Artificial

Anthropic abre o Mythos, modelo que trancou por risco

Versão Claude Fable 5 estreia um jeito novo de vender IA avançada: quase toda a capacidade do modelo, com um filtro de segurança decidindo o que fica de fora.