Inteligências Artificiais (IAs) são construídas sobre dados, muitos dados. Quanto maior a quantidade deles, melhores os resultados produzidos por essa base. Desde algoritmos de treinamento, passando pelo aprendizado de máquina até chegar a respostas mais complexas, como as apresentadas pela IA generativa: sem as informações contidas na internet, a IA ainda seria um episódio de ficção científica.
Boa parte dos dados estudados e usados como referência pela IA são nossos. As pessoas que desenvolvem os algoritmos usam a imagem do bolo que você postou no Instagram para aprender o que é um bolo; as fotos da sua viagem para a Bahia para entender o que é uma praia; e as suas divagações no X (ex-twitter) para treinar com dados as AIs. Seguindo essa linha de raciocínio, me pergunte: “o texto ou o planejamento que fiz para o trabalho também são usados para treinar IAs?” Se estiverem online, a resposta provavelmente é sim.
Proteger a propriedade intelectual — ou seja, produtos como invenções, patentes, imagens, textos, criações artísticas etc — na internet pode ser desafiador. As principais leis que tratam de propriedade intelectual no Brasil são a Lei de Direitos Autorais (Lei nº 9.610/1998), a lei da propriedade Industrial (Lei nº 9.279/1996), a Lei de Software (Lei nº 9.609/1998) e a Lei de Cultivares (Lei nº 9.456/1997). Elas foram criadas para proteger a criação intelectual e possibilitam promover a inovação, mas não para proteger dados.
A coleta digital de dados pessoais é regulamentada por outra lei, a Lei Geral de Proteção de Dados Pessoais, que delineia as regras para coleta e tratamento de dados no Brasil, além de traçar os princípios da privacidade: um direito das pessoas que está escrito na constituição brasileira. Isso significa que todos têm direito de controlar os seus dados pessoais, inclusive pedir que sejam apagados de bancos de dados, ou modificados. Em tese, se a pessoa não tiver concordado previamente com a coleta, suas informações pessoais não podem ser utilizadas.
Assim, temos duas situações importantes. A primeira é que, uma vez que quaisquer dados sejam utilizados para o treinamento de uma IA Generativa, ela não tem como “desaprender” essas informações. A segunda é que as pessoas precisam entender que as empresas estão lucrando com dados pessoais coletados para um fim, mas usados para outros escopos — e aí ficamos com o sentimento de que fomos enganados.
Esses acontecimentos nos levam a acreditar que a Lei de Propriedade Intelectual pode nos ajudar com isso, mas apenas em determinados casos. Um exemplo recente foi o anúncio do Reddit, uma espécie de fórum de discussões que soma cerca de 52 milhões de usuários diários, de que iria vender o conteúdo de seus fóruns para treinamento de IAs. É muito provável que estas conversas não estejam protegidas por leis de direitos autorais. Um possível desfecho é o início de debates e atualizações em torno das leis de propriedade intelectual, para poderem abraçar a necessidade das pessoas de resguardar conteúdo ou imagens postadas casualmente na internet. Isso, no entanto, dependerá dos reguladores de cada país e da mobilização da sociedade civil em cada contexto.
No estudo "Tecnologias digitais e direitos autorais: Tendências internacionais e implicações para países em desenvolvimento", da professora Mariana Valente, ela destaca que a política de propriedade intelectual precisa se adaptar aos contextos econômicos e sociais, com base em evidências e alinhada às prioridades de políticas públicas e desenvolvimento. É importante que os reguladores de cada país considerem os contextos locais na hora de analisar as empresas que simplesmente compram dados pessoais ou conteúdo postado em redes sociais para treinar as IAs Generativas. O risco de prejudicar a privacidade das pessoas ou até cometer plágio é muito grande.
Além do uso indevido dos dados, temos o problema na outra ponta: a utilização indevida de informações ou materiais criados por autores diversos e utilizados pela IA para a produção de conteúdo. A Coalizão pela Procedência e Autenticidade de Conteúdo, ou C2PA da sigla em inglês, possui uma iniciativa interessante para comprovar a autoria de informações e combater a disseminação online de fake news. Ela usa IA com padrões técnicos que certificam a origem e histórico de qualquer conteúdo de mídia.
Porém, para comprovar que o autor de determinado conteúdo não é um robô, é necessária também a identificação desse autor do conteúdo. Há cerca de seis anos, coescrevi um artigo com meu colega de Harvard, Arjun Bisen, para a revista Policy Options, sobre a crescente presença de ferramentas automatizadas, como bots, no cenário digital e a necessidade de sistemas transparentes para identificar essas contas automatizadas, garantindo que não causassem danos à sociedade. Essa distinção é fundamental para construir confiança e permitir a identificação e exclusão de bots prejudiciais, para assim preservar aqueles que oferecem benefícios reais à sociedade.
As IAs Generativas estão entre nós e ficarão online, misturando o seu discurso com o de humanos, tornando essencial que sejam identificadas corretamente. Afinal, a privacidade e a propriedade intelectual estão moldando o futuro da tecnologia, destacando cada vez mais a importância da proteção de dados pessoais como um fator inegociável nessa relação de evolução. Estamos marcando o início de uma nova era de responsabilidade digital.
(*) Yasodara Cordova é pesquisadora-chefe em Privacidade da Unico
Este é um conteúdo exclusivo para assinantes.
Cadastre-se grátis para ler agora
e acesse 5 conteúdos por mês.
É assinante ou já tem senha? Faça login. Já recebe a newsletter? Ative seu acesso.
A chave para transformar a IA em um impulsionador de crescimento para o negócio? Comece com um problema e escale a partir daí. A analogia da "messy inbox" do a16z é um exemplo perfeito.
Conforme a maturidade da empresa, sistemas Multiagentes estarão em todo lugar a toda hora.
Não demora e teremos agentes de IA pagando contas, comprando e investindo. Como esses agentes provarão sua identidade para agir em nosso nome, sem a nossa intervenção direta, garantindo segurança e privacidade?
A interface de bate-papo foi só o começo. A IA de Voz em tempo real está prestes a mudar tudo sobre como interagimos com computadores.
Modelos gigantescos já não estão entregando mais os melhores resultados. Talvez o próximo avanço em LLMs não venha do dimensionamento por força bruta. E isso pode ser bom.
Chegou a hora de dar boas-vindas aos ecossistemas que permitem que agentes autônomos de Inteligência Artificial se encontrem, colaborem, interajam e realizem transações de forma segura, eficiente e confiável.
Aproveite nossas promoções de renovação
Clique aquiPara continuar navegando como visitante, vá por aqui.
Cadastre-se grátis, leia até 5 conteúdos por mês,
e receba nossa newsletter diária.
Já recebe a newsletter? Ative seu acesso