s
INTELIGÊNCIA ARTIFICIAL

Limitações e problemas dos Large Language Models

Dá para "hackear" um LLM com um poema? Aparentemente sim. Ao avaliar a segurança do ChatGPT, pesquisadores usaram a palavra "poem" para explorar a "memorização extraível".

O que aconteceria se você pedisse ao ChatGPTpara repetir uma palavra como “poema” para sempre? Uma nova pesquisa revela que esse prompt pode levar o chatbot a vazar dados de treinamento, incluindo informações de identificação pessoal e outros materiais extraídos da web. Os resultados, ainda não revisados ​​por pares, levantam questões sobre a segurança do ChatGPT e de outros LLMs.

Os pesquisadores — uma equipe do Google DeepMind, das universidades de Washington, Cornell, Carnegie Mellon, Berkeley e da ETH Zurich — exploraram o fenômeno da “memorização extraível”, que ocorre quando um adversário extrai dados de treinamento consultando um modelo de aprendizado de máquina (neste caso, pedindo ao ChatGPT para repetir a palavra “poema” para sempre”).

Por que isso é relevante? Com modelos de código aberto que disponibilizam publicamente seus pesos de modelo e dados de treinamento, a extração de dados de treinamento é fácil. No entanto, modelos como o ChatGPT estão “alinhados” com o feedback humano, o que supostamente evitaria que o modelo “regurgitasse dados de treinamento”. Enganá-lo para fazê-lo divulgar os seus dados de treinamento foi bizarramente fácil com as técnicas certas — como mandá-lo repetir a palavra “poema” ad infinitum.

Este é um conteúdo exclusivo para assinantes.

Cadastre-se grátis para ler agora
e acesse 5 conteúdos por mês.

É assinante ou já tem senha? Faça login. Já recebe a newsletter? Ative seu acesso.

Brasil acelera na adoção de IA: 67% dos CEOs já usam agentes inteligentes

Inteligência Artificial

Brasil acelera na adoção de IA: 67% dos CEOs já usam agentes inteli...

Estudo do IBM Institute for Business Value mostra que os líderes brasileiros estão à frente da média global no uso de Inteligência Artificial, reconfigurando estratégias, processos e culturas para não ficarem para trás

Convergência tecnológica: oito domínios que vão mudar o mundo

Inteligência Artificial

Convergência tecnológica: oito domínios que vão mudar o mundo

A interação entre tecnologias como IA, Biotecnologia, Computação Quântica e Robótica está transformando setores econômicos e criando soluções inéditas para desafios sistêmicos. O novo relatório do Fórum Econômico Mundial dest...

Quem irá controlar o ponto de entrada para a Economia da Intenção?

Inteligência Artificial

Quem irá controlar o ponto de entrada para a Economia da Intenção?

Os agentes de IA substituirão as plataformas? Ou serão cooptados por elas?

Mais do que demissões: IA impulsiona reinvenção organizacional

Inteligência Artificial

Mais do que demissões: IA impulsiona reinvenção organizacional

A Inteligência Artificial está acelerando uma transformação estrutural nas empresas: mais do que cortes, há uma realocação estratégica de talentos e investimentos para construir a próxima era da tecnologia.

Semana de muitas novidades no campo da IA

Inteligência Artificial

Semana de muitas novidades no campo da IA

AlphaEvolve, Codex, Jules, GitHub Copilot, Claude 4, Gemini 2.5 Pro... A corrida armamentista da IA acelerou em todas as frentes: chips, conteúdo, credibilidade e controle.

Modelos de raciocínio guardam seus segredos

Inteligência Artificial

Modelos de raciocínio guardam seus segredos

Escondem deliberadamente seus processos de pensamento. Este não é apenas um problema técnico.