The Shift

A influência da CoT e de seus sucessores para os LLMs

Como você sabe há duas semana a OpenAI lançou uma prévia de um novo tipo de modelo, o o1, que faz uso de Chain-of-Thought (CoT) para resolução de problemas complexos. Um passo na direção certa para modelos text to actions projetados para converter solicitações de usuários em ações (não apenas respostas).

Desde o lançamento do modelo OpenAI o1  o conceito Chain-of-Thought (CoT) tornou-se popular. Já falamos muito dele aqui ao abordar técnicas que permitem aos LLMs resolver problemas complexos — exatamente o que a OpenA diz que o o1 consegue fazer, como demonstrado nesses vídeos, e que a DeepMind atribui aos seus recém-lançados modelos AlphaProof e AlphaGeometry 2, assim como pesquisadores de Stanford atribuem ao g1 (desenvolvido a partir do Llama-3.1).

A associação de CoT com outras técnicas, como o Aprendizado por Reforço (RL), tem se revelado fundamental para o desenvolvimento de sistemas de IA mais avançados e autônomos. Um passo adiante em direção ao futuro dos agentes inteligentes e à Inteligência Artificial Geral (AGI). Por meio da combinação com o Machine Learning, por exemplo, o o1 aprende a aprimorar sua cadeia de pensamento e a refinar as estratégias que utiliza. Até por que CoT ainda tem suas limitações.

Este é um conteúdo exclusivo para assinantes.

Cadastre-se grátis para ler agora
e acesse 5 conteúdos por mês.

É assinante ou já tem senha? Faça login. Já recebe a newsletter? Ative seu acesso.

Se você já recebe nossas newsletters,

preencha seu e-mail que lhe mandaremos instruções

Voltar
Enviar
Opa! Parece que este e-mail não está cadastrado ainda.
Tente novamente ou, se quiser fazer um novo cadastro, clique aqui.

Crie sua senha para o e-mail

e atualize suas informações

Atualizar

É assinante ou já tem senha? Faça login. Já recebe a newsletter? Ative seu acesso.

Cadastre-se grátis, leia até 5 conteúdos por mês,

e receba nossa newsletter diária.

Voltar

Ao cadastrar-se você declara que está de acordo
com nossos Termos de Uso e Privacidade.

Cadastrar

Pronto! Só falta um passo.

Clique no link do e-mail que enviamos para
retornar aqui e finalizar seu cadastro.