s
INTELIGÊNCIA ARTIFICIAL

Limitações e problemas dos Large Language Models

Dá para "hackear" um LLM com um poema? Aparentemente sim. Ao avaliar a segurança do ChatGPT, pesquisadores usaram a palavra "poem" para explorar a "memorização extraível".

O que aconteceria se você pedisse ao ChatGPTpara repetir uma palavra como “poema” para sempre? Uma nova pesquisa revela que esse prompt pode levar o chatbot a vazar dados de treinamento, incluindo informações de identificação pessoal e outros materiais extraídos da web. Os resultados, ainda não revisados ​​por pares, levantam questões sobre a segurança do ChatGPT e de outros LLMs.

Os pesquisadores — uma equipe do Google DeepMind, das universidades de Washington, Cornell, Carnegie Mellon, Berkeley e da ETH Zurich — exploraram o fenômeno da “memorização extraível”, que ocorre quando um adversário extrai dados de treinamento consultando um modelo de aprendizado de máquina (neste caso, pedindo ao ChatGPT para repetir a palavra “poema” para sempre”).

Por que isso é relevante? Com modelos de código aberto que disponibilizam publicamente seus pesos de modelo e dados de treinamento, a extração de dados de treinamento é fácil. No entanto, modelos como o ChatGPT estão “alinhados” com o feedback humano, o que supostamente evitaria que o modelo “regurgitasse dados de treinamento”. Enganá-lo para fazê-lo divulgar os seus dados de treinamento foi bizarramente fácil com as técnicas certas — como mandá-lo repetir a palavra “poema” ad infinitum.

Este é um conteúdo exclusivo para assinantes.

Cadastre-se grátis para ler agora
e acesse 5 conteúdos por mês.

É assinante ou já tem senha? Faça login. Já recebe a newsletter? Ative seu acesso.

A IA entrou no orçamento. Falta entrar no modelo de negócio


Inteligência Artificial

A IA entrou no orçamento. Falta entrar no modelo de negócio


Pesquisas da PwC e do MIT mostram por que os investimentos em IA avançam mais rápido do que a capacidade das empresas de capturar valor. E por que o problema não é tecnológico, mas estrutural.

A IA sai do chat e entra no caixa

Inteligência Artificial

A IA sai do chat e entra no caixa

A Anthropic aposta em agentes pagos; a OpenAI recorre à publicidade para sustentar a escala do ChatGPT.

Paradoxo latino: IA cresce, impacto não

Inteligência Artificial

Paradoxo latino: IA cresce, impacto não

Com ativos estratégicos e escala, o Brasil pode liderar ou perpetuar o descompasso regional.

Decisores estratégicos ainda resistem à IA

Inteligência Artificial

Decisores estratégicos ainda resistem à IA

Apesar da experimentação crescente e de ganhos já percebidos, a governança segue como principal freio à adoção formal da IA e da IA Generativa, segundo a Capgemini.

2026, o ano no qual o Chief AI Officer é o CEO

Inteligência Artificial

2026, o ano no qual o Chief AI Officer é o CEO

O AI Radar 2026 do BCG mostra CEOs assumindo decisões de IA, concentrando capital, risco e governança.

Apple e Google: o acordo que redesenha a IA de consumo

Inteligência Artificial

Apple e Google: o acordo que redesenha a IA de consumo

Mais do que acelerar a Siri, a parceria reorganiza poder quando a IA deixa de ser recurso e vira infraestrutura.