INTELIGÊNCIA ARTIFICIAL

A corrida pela IA mudou de lógica. A aposta agora é na IA que se reinventa

O autoaperfeiçoamento recursivo avança dos laboratórios para a estratégia corporativa, com impacto sobre chips, infraestrutura e soberania computacional.

Por Cristina De Luca 27/05/2026

Desde 2023, boa parte da conversa sobre a evolução da IA tem girado em torno da AGI, a Inteligência Artificial Geral capaz de superar humanos em qualquer tarefa cognitiva. O conceito mobilizou capital, gerou manchetes e, na prática, acelerou a adoção corporativa de ferramentas que ainda nem chegavam perto disso.

Agora, parte da indústria afirma que o próximo ciclo do desenvolvimento da IA já está entre nós: Recursive self-improvement (RSI), ou autoaperfeiçoamento recursivo. A ideia é que um sistema de IA melhore seu próprio código, sua própria arquitetura, gerando versões sucessivamente mais capazes, sem intervenção humana no meio do caminho.

Jack Clark, cofundador da Anthropic, descreveu o cenário em termos diretos ao Axios: “Você seria capaz de dizer ao sistema: ‘Faça uma versão melhor de você mesmo.’ E ele simplesmente faz isso, de forma completamente autônoma.”

CADASTRE-SE GRÁTIS PARA ACESSAR 5 CONTEÚDOS MENSAIS

Já recebe a newsletter? Ative seu acesso

Se AGI era a promessa de uma IA tão boa quanto um humano, RSI é a aposta em uma IA que aprende a se tornar melhor do que qualquer versão anterior de si mesma, com potencial de remodelar a forma como empresas e governos operam nos próximos anos.

Para entender o que muda, vale comparar dois ciclos.

O ciclo atual de desenvolvimento de IA depende inteiramente de humanos: pesquisadores identificam o que o modelo não consegue fazer, engenheiros projetam melhorias, equipes retreinam e validam. É um processo lento, caro e limitado pela capacidade humana de detectar problemas e imaginar soluções.

RSI propõe automatizar esse ciclo inteiro. Na versão que está emergindo nos laboratórios, mais incremental do que a “explosão de inteligência” dos cenários teóricos, o processo opera em cinco etapas: a IA escreve código, avalia o código, gera testes, otimiza pipelines e acelera a própria pesquisa de IA. Mesmo sem uma ruptura abrupta, esse ciclo cria aceleração cumulativa.

Se isso funcionar em escala, o gargalo deixa de ser inteligência. Passa a ser computação, energia e infraestrutura. A pergunta estratégica muda: de “como construir uma IA mais inteligente?” para “onde direcionar inteligência que se aperfeiçoa sozinha primeiro?”, com candidatos em pesquisa de doenças, modelagem climática, segurança cibernética e design de chips.

Vale registrar uma distinção que o debate público frequentemente ignora: RSI e AGI são caminhos independentes. RSI pode ocorrer antes de AGI, e AGI não produz RSI automaticamente. Demis Hassabis, CEO do Google DeepMind, afirmou ao Axios após o Google I/O que os agentes atuais são um “ensaio para AGI” e que a humanidade está nos “contrafortes da singularidade”. Ele antecipou sua previsão de AGI para 2029 e posicionou RSI como o próximo marco crítico: “Todos os principais laboratórios estão bastante focados nisso”, disse.

Em 2026, o conceito deixou de ser puramente teórico: surgiram os primeiros sistemas capazes de automatizar partes do ciclo de melhoria. Andrej Karpathy, ex-diretor de IA da Tesla e ex-pesquisador da OpenAI, opera um pesquisador automatizado de machine learning, um sistema que conduz ciclos de pesquisa sem intervenção humana contínua. O METR, organização especializada em avaliação de segurança de IA, está ficando sem benchmarks para desafiar os modelos atuais: o instrumento de medição se aproxima do limite antes do fenômeno que deveria medir. A Anthropic apresentou em 6 de maio de 2026 uma técnica chamada “dreaming”, em que agentes revisam sessões anteriores, identificam padrões de erro e refinam comportamento futuro entre execuções. A empresa formalizou esses desenvolvimentos no documento Focus Areas for The Anthropic Institute, em que reconhece sinais de IA acelerando seu próprio desenvolvimento. O workshop dedicado exclusivamente ao tema na ICLR 2026, realizado no Rio de Janeiro, marca a entrada de RSI no calendário científico formal.

O dinheiro chegou antes da prova

Em maio de 2026, uma startup chamada Recursive Superintelligence captou US$ 650 milhões com avaliação de US$ 4,65 bilhões. A empresa tem cerca de 20 funcionários. Foi fundada por Richard Socher, ex-cientista-chefe da Salesforce, e Tim Rocktäschel, professor de IA no University College London e ex-pesquisador principal do Google DeepMind. A rodada foi liderada pelo braço de investimentos do Google, com participação da Nvidia. Socher descreveu a meta como IA capaz de “pesquisar e melhorar a si mesma indefinidamente”.

A empresa ainda não publicou resultados em produção. O que ela vende, por ora, é uma tese: de que é possível construir sistemas que automatizem a própria pesquisa em IA, modelos que experimentam, avaliam e se refinam sem depender de um ciclo de engenharia humano.

A OpenAI moveu-se na mesma direção por outro vetor: abriu vagas no time de Preparedness com salários entre US$ 295 mil e US$ 445 mil para pesquisadores focados em riscos de RSI. Sam Altman definiu a meta de ter um “AI research intern automatizado” rodando em setembro de 2026 e um “AI researcher autônomo” até março de 2028.

Jack Clark estimou probabilidade superior a 60% de que esse limiar seja atingido até 2028. Para contextualizar: é a mesma probabilidade que os mercados de previsão atribuíam, em maio de 2026, ao Partido Democrata vencer a próxima eleição presidencial americana.

Por que arquiteturas recursivas mudam a equação de desempenho

O capital se moveu. Antes de avaliar o que isso significa, vale observar o que já está acontecendo nos benchmarks — não em RSI pleno, mas em uma família de arquiteturas que antecipa sua lógica.

Enquanto o debate sobre RSI pleno ainda é em grande parte teórico, uma consequência prática já aparece nos benchmarks: modelos com arquitetura recursiva, muito menores que os modelos de fronteira, estão entregando resultados que os grandes não alcançam. Em vez de tentar processar tudo em uma única passada, esses sistemas dividem problemas em etapas, consultam memória externa e iteram sobre a própria resposta.

A distinção técnica importa. Modelos que consultam subpartes de um problema recursivamente ou mantêm contexto externo não configuram RSI. São arquiteturas de raciocínio e inferência. O que elas demonstram, no entanto, é um princípio relevante: sistemas menores já conseguem melhorar desempenho reorganizando dinamicamente como processam informação, um precursor operacional da lógica de autoaperfeiçoamento.

A lógica é simples. Os grandes modelos tentam ingerir tudo de uma vez. Quando a entrada é longa, a qualidade cai, não porque o modelo atingiu um limite técnico, mas porque a atenção se dilui. É como pedir a um analista que memorize 500 documentos antes de responder uma pergunta: tecnicamente possível, praticamente ineficiente.

Os modelos recursivos operam de forma diferente. Mantêm o contexto fora de si mesmos, consultam apenas o que precisam, chamam a si próprios para analisar partes separadas e consolidam as respostas no final. A enciclopédia fica na mesa, com índice. O analista consulta o que precisa.

Em testes específicos de raciocínio lógico, como o benchmark Sudoku-Extreme, modelos com essa arquitetura desenvolvidos pela Samsung com 5 a 7 milhões de parâmetros registraram resultados significativamente superiores a modelos de fronteira como o DeepSeek-R1. Em velocidade, chegaram a ser 100 vezes mais rápidos em tarefas determinísticas. Nenhum exigiu novo treinamento: os ganhos vieram apenas de mudar como o modelo processa informação em tempo de execução. .

O PostTrainBench mede algo mais direto: dá a um modelo uma GPU, um modelo menor e 10 horas para maximizar o desempenho desse modelo em outros benchmarks. Hoje é o experimento de IA mais próximo disponível, de realiza pesquisa em condições controladas. O Opus 4.7, da Anthropic, está próximo de saturar o benchmark, o que indica que o gap entre “IA que escreve código” e “IA que melhora IA” está se fechando em velocidade mensurável.

Em sistemas com múltiplos agentes operando juntos, cada vez mais comuns em automação de processos corporativos, uma variação dessa arquitetura reduziu o uso de tokens em 75% e acelerou a inferência em 2,4 vezes.

O que muda para quem decide

A implicação mais imediata é sobre custo. Modelos menores com arquitetura recursiva estão superando os grandes em tarefas de raciocínio estruturado: análise de contratos, verificação de dados entre documentos, leitura de bases extensas. A mesma qualidade, por menos.

A implicação mais profunda é sobre o modelo mental que guia os investimentos em IA. Quem construiu seus sistemas nos últimos dois anos operou com uma premissa: dar ao modelo o máximo de contexto possível. Essa arquitetura tem teto. O que está sendo construído agora parte de outra lógica, modelos que sabem o que precisam ler, em vez de tentar ler tudo.

Se a pesquisa econômica do NBER publicada em 2026, com autores da Forethought, da Columbia University e da University of Virginia, estiver certa, as apostas aumentam consideravelmente. O estudo identifica dois canais que se reforçam mutuamente: um ciclo de feedback tecnológico, em que inovação gera mais inovação ao longo da rede de pesquisa, e um ciclo de feedback econômico, em que maior produção gera mais recursos para financiar novo crescimento. Quando os dois operam juntos, a dinâmica se torna não linear.

Os limiares calculados pelo modelo são baixos. Automatizar 13% das tarefas de forma distribuída entre setores já é suficiente para empurrar a economia ao regime explosivo. Para hardware de semicondutores isolado, o limiar é 20%, porque os retornos da pesquisa em chips são cinco vezes maiores do que os de software. Uma única tarefa automatizada no design de semicondutores move a economia tanto quanto cinco tarefas automatizadas em software.

Os autores sugerem que monitorar os níveis de automação em P&D de IA pode ser tão relevante quanto acompanhar indicadores macroeconômicos tradicionais, e que essa medição poderia funcionar como sistema de alerta precoce para aceleração de crescimento. É uma recomendação que ainda não encontrou eco em nenhum banco central ou órgão regulador.

Há uma dimensão geopolítica que o debate técnico frequentemente subestima. RSI transforma capacidade computacional, energia, fabricação de chips e data centers em ativos ainda mais estratégicos do que já são. A concentração de laboratórios de fronteira nos Estados Unidos, combinada com os controles de exportação de semicondutores direcionados à China, significa que o primeiro país a operar RSI em escala industrial carrega vantagem estrutural sobre cadeias de inovação inteiras. Soberania computacional, termo ainda vago nas agendas de política industrial, pode se tornar tão concreto quanto soberania energética.

O gap que a regulação atual não cobre

A divulgação da Anthropic sobre os primeiros sinais de RSI colocou uma questão que reguladores ainda não responderam: as regras atuais foram desenhadas para IA estática. Sistemas que se modificam sozinhos operam em outro regime.

“Quando você entra em RSI, está criando um sistema que pode se auto-iterar mais rápido do que qualquer pessoa consegue acompanhar”, disse Eran Kahana, advogado e pesquisador de IA da Stanford Law School. As ferramentas regulatórias em discussão, auditorias de código, proibições de uso específico e aprovação prévia antes do lançamento de modelos, foram concebidas para sistemas que não se modificam entre uma revisão e outra.

Três modelos de responsabilidade civil já circulam entre pesquisadores de direito. O primeiro ancora a responsabilidade na previsibilidade do dano: quanto mais o sistema evoluir a partir do estado original, menor a exposição do desenvolvedor. É o modelo mais favorável à inovação, mas pode dificultar a reparação de vítimas. O segundo aplica responsabilidade objetiva, independente de previsibilidade, o mesmo padrão usado para acidentes em usinas nucleares e derramamentos de petróleo. O terceiro, considerado o mais viável por Kahana, é o sistema de licenças: empresas precisariam de autorização prévia para desenvolver RSI, com exigências de segurança, seguro de responsabilidade e auditorias definidas pelo regulador. “Quanto maior o risco da aplicação, mais justificada é a estrutura de licença”, disse ele.

Uma posição mais direta circula entre pesquisadores: RSI deveria ser ilegal sem divulgação pública obrigatória. O argumento é que um grupo restrito de empresas não deveria decidir, sem transparência, o que uma tecnologia com esse potencial de impacto sistêmico fará. Nenhum dos modelos regulatórios está em vigor em qualquer jurisdição.

Há vozes céticas qualificadas nesse debate. Yu Su, professor de ciência da computação na Ohio State University e CEO da NeoCognition, argumenta que os cenários mais extremos ignoram uma distinção fundamental: sistemas artificiais não têm objetivos inatos nem instinto de sobrevivência. Seb Krier, pesquisador do Google DeepMind, acrescenta um argumento estrutural: mesmo com RSI funcionando, uma aceleração de inteligência esbarra no mundo físico, limites de energia, velocidade de fabricação robótica e a complexidade de integrar software e robôs em instituições humanas. O precedente do aprendizado por reforço aponta nessa direção: a tecnologia não saltou de jogos de tabuleiro para robôs e linguagem. Pode acontecer o mesmo com RSI.

O que ainda não está resolvido

A transição do laboratório para a produção ainda não aconteceu em escala. Os resultados publicados sobre modelos recursivos vêm de ambientes controlados. Custos operacionais se tornam imprevisíveis quando o modelo decide, sozinho, quantas subconsultas precisa fazer.

Há também um risco técnico pouco discutido fora dos laboratórios: modelos treinados em volume excessivo de dados sintéticos ou em outputs gerados por outras IAs podem entrar em degeneração estatística, um fenômeno conhecido como model collapse, em que a qualidade das respostas deteriora progressivamente à medida que o sistema perde contato com dados do mundo real. É o limite interno do próprio ciclo de autoaperfeiçoamento.

O impacto mais plausível de RSI no curto prazo talvez não seja uma superinteligência fora de controle, mas organizações capazes de iterar pesquisa, software e automação em velocidades inalcançáveis para concorrentes humanos. Assimetria de capacidade antes de qualquer explosão de inteligência.

O histórico recente pede ceticismo calibrado. Em 2023, a narrativa da AGI acelerou adoção real e gerou expectativas que o produto não entregou no prazo prometido. A RSI pode seguir o mesmo padrão, ou pode chegar mais rápido, porque desta vez os modelos menores já estão entregando resultados que os grandes não conseguem replicar, a Anthropic registrou os primeiros sinais operacionais do fenômeno, e Demis Hassabis está antecipando suas próprias previsões.

Essa é a diferença entre os dois ciclos. Em 2023, a aposta era no tamanho. Em 2027, a aposta é na arquitetura. A questão estratégica deixa de ser quem tem o maior modelo, e passa a ser quem consegue acelerar mais rápido o próprio ciclo de melhoria.

A corrida pela IA mudou de lógica. A aposta agora é na IA que se reinventa