Em um post recente sobre Dados Abertos, falamos sobre como eles são dados majoritariamente de origem governamental, disponibilizados livremente para que qualquer pessoa tenha acesso, a fim de que através deles seja possível realizar pesquisas ou desenvolver inovações que impactem positivamente na vida da população. Para que esses dados sejam utilizados de forma que a privacidade das pessoas seja preservada, eles passam por um processo de anonimização, que consiste na remoção de informações sensíveis, como nome, CPF, endereço e outros dados de identificação, e são então chamados de dados anônimos. Contudo, será que esse procedimento é o suficiente para garantir o anonimato dos indivíduos?

No post de hoje vamos falar um pouco sobre a privacidade dos indivíduos nos bancos de dados abertos e o porquê do processo de anonimização muitas vezes não ser o suficiente para proteger o sigilo de suas identidades. Se você ficou curioso e quer saber mais, então fica de olho aqui!

Dados Anônimos, mesmo?

Como você pode imaginar, dados anônimos são aqueles que não permitem a identificação da pessoa a quem eles se referem. Dessa forma é possível aproveitar informações pessoais para fins estatísticos sem que se saiba a quem essas informações pertencem, sendo assim seus donos são preservados de qualquer tipo de impacto ao fazerem parte dessa base de dados. Em outras palavras, os dados pessoais deixam de ser pessoais. Ou pelo menos é assim que deveria ser.

Na verdade o processo de anonimização total é bastante complexo e difícil, uma vez que a reidentificação dos indivíduos pode ser realizada facilmente através do cruzamento das informações disponíveis com outras bases de dados. Em 2013, a publicação Nature Scientific Reports realizou um estudo comprovando essa possibilidade, em que com apenas mais quatro informações sobre cada usuário os dados anonimizados de uma companhia telefônica podiam ser revertidos com aproximadamente 95% de precisão.

Se você ainda não entendeu o risco que isso pode representar, imagine um banco de dados em que as informações sensíveis (capazes de identificar diretamente uma pessoa) tenham sido removidas. O cruzamento desse banco de dados com outros pode não só reidentificar o indivíduo, mas reunir mais informações do que teriam os bancos de dados isoladamente, ampliando a exposição exponencialmente. E funciona como uma bola de neve: quantos mais bancos de dados forem cruzados, mais informações reunidas e maiores as possibilidades de cruzamento com outros bancos de dados.

Potencial vs. Privacidade

A possibilidade de reversão dos dados anônimos com alguma facilidade levanta vários questionamentos pertinentes à discussão. Se não é possível assegurar a não reidentificação desses dados, seria ao menos possível reduzir os riscos? O que vale mais, respeitar a privacidade dos indivíduos que compõem essa base de dados ou focar no benefício que essas informações podem trazer, mesmo sem a garantia do anonimato? Quem deve ser responsabilizado no caso de uma eventual reidentificação, o conceito aparentemente falho de dados anônimos ou o indivíduo responsável por cruzar bases de dados e romper com o anonimato de terceiros?

Todas essas são perguntas polêmicas e nenhuma delas é fácil de ser respondida. Ao mesmo tempo em que a privacidade é um direito básico extremamente importante quando falamos do universo de Big Data, os dados anônimos têm se mostrado bastante valiosos no desenvolvimento de políticas públicas e no aperfeiçoamento da governança em diversos lugares.

Ao considerar dados anônimos retirados de relatórios médicos do SUS, por exemplo, é possível saber quais as enfermidades mais comuns em um determinado perfil de cidadão, e assim não só direcionar os recursos necessários para atender essa demanda, mas buscar entender essa relação e trabalhar preventivamente. No entanto, caso haja uma ocorrência de reversão do anonimato, a exposição dessas informações pode ser prejudicial ao indivíduo e causar constrangimentos, principalmente se considerarmos diagnósticos de doenças como a Aids e o câncer.

Parece claro que os dados anônimos, aliados às ferramentas e tecnologias de Big Data, têm o potencial de proporcionar inúmeras possibilidades de inovações em políticas públicas que podem impactar positivamente na vida da população. O debate atual é sobre a que preço, já que a privacidade dos indivíduos estaria sendo um alto custo para todo esse desenvolvimento.

 

BigData Corp

Deixe uma resposta

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *