Que o Big Data e suas tecnologias relacionadas revolucionaram a forma como nós lidamos com dados pessoais, nossos e de outrem, todo mundo sabe. As ferramentas de análise se propõem a encontrar respostas e evidências baseadas em parâmetros que já existem, mas que acabam sendo muito difíceis de enxergar a olho nu, devido à imensa quantidade de informações disponíveis, oriundas de movimentações online e outros bancos de dados, como os financeiros e os sociais, mantidos pelos governos. Entretanto, e se algumas dessas análises escondessem vieses que na verdade distorcem resultados e penalizam pessoas indevidamente?

No post de hoje nós vamos falar sobre a importância de evitar o viés na análise de dados e sobre como ele pode comprometer resultados que deveriam ser isentos de preconceitos. Se você se interessou sobre o tema e quer saber mais sobre como isso funciona, fica ligado aqui!

O Viés e seus Riscos

Para começar, chamamos de viés as análises que não são baseadas no princípio da imparcialidade ou ainda a tendência que o analista de dados pode ter em subestimar ou superestimar um parâmetro. Há ainda o viés de confirmação, que nada mais é do que a pré-disposição humana em encontrar evidências que confirmem crenças e ideias pré-concebidas, rejeitando tudo que destoe das nossas convicções. Afinal, profissionais de dados são pessoas, e é impossível, em qualquer profissão, nos descolarmos completamente de quem somos para analisar o que quer que seja. E é por isso que estabelecer processos que evitem a presença do viés é tão importante para qualquer negócio.

presença do viés na análise de dados é extremamente prejudicial, pois pode levar a resultados falsos e incompletos, sob o ponto de vista da empresa. Porém, ao analisarmos os impactos que isso pode ter na vida das pessoas, esses são ainda mais extremos, pois podem se manifestar através de padrões discriminatórios e excludentes. Imagine o impacto do viés em casos de policiamento preditivo, por exemplo.

O Impacto do Viés na Análise de Dados

Em um caso real, uma companhia de RH implantou um sistema de análise de dados para seleção de candidatos. Entre um dos critérios de convocação para processos seletivos estava o de inadimplência, no qual os candidatos que se encontrassem com dívidas eram eliminados logo de cara, pois o sistema concluía que uma pessoa com dificuldades de administrar a própria vida financeira não teria chances de ser um bom colaborador.

Todavia, se um candidato se encontra desempregado por um período, é natural que suas finanças fiquem momentaneamente desequilibradas. Então, nesse caso, o que o viés da análise de dados fazia era transformar o desemprego desse profissional em uma bola de neve, onde ele contraía dívidas por não ter um emprego, e não conseguiria um emprego por ter contraído dívidas.

Contudo, em alguns casos atitudes já vêm sendo tomadas para evitar o impacto do viés na análise de dados. Nos Estados Unidos, em outro exemplo, é proibida a utilização do CEP em um modelo de crédito, pois já foi comprovado que o mesmo pode ser utilizado para discriminação racial ou religiosa, dependendo do local onde o cidadão viva.

Como Evitar?

Infelizmente não há resposta simples nem fórmula mágica. O que ajuda a evitar o caso de vieses que poluem os resultados de análise de dados é um conjunto de ações que dependem muito mais de autocrítica do que da tecnologia em si. Na hora de definir um modelo de análise de dados, uma das sugestões é envolver mais de um profissional, para que os parâmetros não sejam definidos somente por uma única pessoa. Vale também pedir uma terceira ou quarta opinião, de preferência de indivíduos que tenham perfis bem diferentes dos responsáveis pelo projeto.

Além disso, os profissionais envolvidos devem sempre se debruçar profundamente sobre a análise e desconfiar de padrões que saltem aos olhos logo de cara, parecendo bons demais pra ser verdade. Afinal, são esses que os analistas buscam normalmente, consciente ou inconscientemente, pois são os que despertam mais familiaridade.

 

Não há dúvidas sobre a importância do Big Data e seu potencial de melhorar (e muito!) o desempenho dos negócios. No entanto, devemos sempre lembrar que tecnologias são feitas por pessoas, e que essas são fruto de seu contexto, trazendo consigo uma grande carga de informação prévia. Sobre isso, não há nada que possamos fazer. No entanto, o que podemos, e devemos, é trabalhar sempre para que o cuidado com a imparcialidade de resultados não seja negligenciado, garantindo assim os melhores resultados para as empresas e pessoas envolvidas.

BigData Corp

Deixe uma resposta

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *