s
INTELIGÊNCIA ARTIFICIAL

Modelos de raciocínio guardam seus segredos

Escondem deliberadamente seus processos de pensamento. Este não é apenas um problema técnico.

Sua IA pode estar escondendo seu processo de pensamento – e isso é um problema maior do que você imagina. Uma nova pesquisa da Anthropic revela que os principais modelos de linguagem não revelam partes importantes de seu processo de raciocínio, criando uma grave lacuna de transparência que pode prejudicar os esforços de segurança da IA. Se os modelos podem usar informações silenciosamente sem revelá-las, e/ou ocultarem dicas e atalhos que utilizam, como confiar na transparência de seu processo de raciocínio?

Resumindo: a técnica Chain of Thought (CoT) tornou-se uma das bases para a IA que “raciocina”. Pesquisadores de segurança em IA têm apostado no raciocínio por cadeia de pensamento (CoT) como uma maneira de detectar comportamentos perigosos antes que causem danos. Principalmente comportamentos desalinhados ou inseguros em ambientes de alto risco. No estudo “Reasoning Models Don't Always Say What They Think”, a equipe da Anthropic revela uma série de limitações nas abordagens atuais para monitorar os processos de pensamento da IA.

Foram testados seis tipos diferentes de dicas – de metadados neutros a avisos diretos de “desbloqueio” – em dois LLMs de raciocínio de ponta (Claude 3.7 Sonnet, DeepSeek R1). Ambos falharam consistentemente em revelar o uso das dicas. Mesmo quando os modelos exploram dicas mais de 90% das vezes, verbalizam essas dicas no CoT menos de 20% das vezes, em média – e menos de 5% para dicas de desalinhamento.

Este é um conteúdo exclusivo para assinantes.

Cadastre-se grátis para ler agora
e acesse 5 conteúdos por mês.

É assinante ou já tem senha? Faça login. Já recebe a newsletter? Ative seu acesso.

Indústria puxa boom dos edifícios inteligentes até 2030

Inovação

Indústria puxa boom dos edifícios inteligentes até 2030

Fábricas e data centers impulsionam crescimento global de smart buildings em busca de eficiência e sustentabilidade

Software virou mão de obra. Quanto custa o trabalho da IA?

Inteligência Artificial

Software virou mão de obra. Quanto custa o trabalho da IA?

Agentes autônomos desafiam o manual do SaaS e expõem a batalha entre ROI, narrativas de valor e dumping algorítmico.

Transformação digital na América Latina: o salto bilionário guiado pelo Brasil

Inteligência Artificial

Transformação digital na América Latina: o salto bilionário guiado...

De IA a inclusão financeira, a região prepara salto de eficiência — com o Brasil na linha de frente

Empresas adotam IA sem plano e colhem riscos em vez de retorno

Inteligência Artificial

Empresas adotam IA sem plano e colhem riscos em vez de retorno

Apesar da popularização das ferramentas de IA, ainda falta clareza, políticas e treinamento. O uso incorreto expõe empresas a riscos e desperdícios de potencial.

O dilema da IA em Life Sciences: maturidade alta, retorno baixo

Inteligência Artificial

O dilema da IA em Life Sciences: maturidade alta, retorno baixo

Apesar da adoção de IA, pilotos no setor ainda focam em tarefas simples, longe de impactar modelos operacionais

Saúde, Indústria e Agronegócio puxam registros de patentes de IA no Brasil

Inteligência Artificial

Saúde, Indústria e Agronegócio puxam registros de patentes de IA no...

Enquanto EUA e China aceleram, o Brasil patina: apenas 8 patentes de IA concedidas em cinco anos