Pular para o conteúdo principal
InicioBlogAlfabetização em dados

Uma introdução à ética de dados: O que é o uso ético dos dados?

Aprenda tudo o que você precisa saber sobre ética de dados, incluindo os princípios fundamentais e como eles são aplicados aos seus dados.
abr. de 2024  · 15 min leer

O que é ética de dados?

Em resumo, a ética dos dados refere-se aos princípios por trás de como as organizações coletam, protegem e usam os dados. É um campo da ética que se concentra nas obrigações morais que as entidades têm (ou deveriam ter) ao coletar e divulgar informações sobre nós. Em um mundo em que os dados são mais valiosos e onipresentes do que nunca, as questões de ética de dados são mais urgentes agora do que em qualquer outro momento da história. 

Por que a ética dos dados é importante

Vamos dar uma olhada em alguns exemplos da importância da ética dos dados: 

  • Em setembro de 2018, os hackers injetaram um código malicioso no site da British Airways, desviando o tráfego para um site de réplica fraudulento. Os clientes, sem saber, forneciam suas informações aos fraudadores, incluindo detalhes de login, informações de cartão de pagamento, endereço e informações de reserva de viagens.
  • Em 2019, depois que a Apple apresentou seu cartão de crédito aos consumidores, surgiram alegações de um algoritmo com preconceito de gênero. Vários executivos de tecnologia proeminentes (incluindo Steve Wozniak, o famoso tecnólogo e cofundador da Apple) descreveram que recebiam limites de crédito exponencialmente mais altos do que suas esposas, com quem compartilhavam bens. Além do gênero, nenhum fator claro poderia sugerir essa diferença. 
  • Em março de 2021, a privacidade de mais de 533 milhões de usuários do Facebook foi comprometida quando seus dados foram publicados em um fórum aberto de hackers. Essa foi uma das maiores violações de dados de todos os tempos. O incidente levantou preocupações sobre como as organizações armazenam e protegem as informações pessoais e se, em primeiro lugar, elas deveriam ter permissão para acessar esses dados.

Esses exemplos são uma pequena amostra das violações da segurança digital. Até mesmo a DataCamp sofreu uma violação de segurança em 2019. 

Independentemente de sua baixa tecnologia, a importância da ética dos dados não pode ser exagerada. É impossível ignorar o fato de que estamos vivendo em um mundo que depende cada vez mais de informações e, consequentemente, a ética dos dados se tornará um fator essencial para todos. 

Os dados são um ativo valioso que pode criar o próximo grande negócio ou inovação para melhorar a vida de inúmeras pessoas. No entanto, também é um recurso que muitas organizações não estão protegendo ou usando de forma ética.

É por isso que entender a ética dos dados é tão essencial. Ele nos ajuda a discernir o que estamos fazendo com nossas próprias informações e como podemos nos proteger de seu uso indevido sem sacrificar nossa capacidade de participar da sociedade. Isso também nos ajuda a pensar em como queremos que a sociedade funcione no futuro, não apenas em nossas vidas, mas para as gerações futuras, à medida que a tecnologia continua a evoluir. 

É também por isso que a regulamentação relacionada à tecnologia não se trata apenas de proteger a privacidade ou a segurança dos dados; trata-se de proteger os seres humanos das consequências desconhecidas de suas próprias ações. 

Entendendo o cenário atual e o potencial futuro da ética de dados

É essencial lembrar que a IA e o aprendizado de máquina ainda são tecnologias relativamente novas - elas não desaparecerão tão cedo, mas também não estão em sua forma final agora. É por isso que há urgência em relação às questões sobre como essas tecnologias devem ser usadas para garantir que elas continuem sendo um benefício para a sociedade. Saiba mais sobre as questões relacionadas ao futuro da IA responsável com nosso podcast DataFramed. 

Como vivemos nossas vidas cada vez mais on-line, a linha entre o privado e o público ficou embaçada. E, embora existam algumas proteções legais para seus dados (como a Regulamentação Geral de Proteção de Dados da União Europeia ou a CCPA da Califórnia), também há áreas cinzentas suficientes para dificultar o gerenciamento de sua própria privacidade.

Pesquisas sobre aplicativos móveis e sites sociais populares revelam que muitos deles vendem nossas informações pessoais a terceiros. 

Dados pessoais

[Referência: Statista 2021

E se você usa com frequência algumas dessas plataformas, pode se surpreender com os dados que estão sendo vendidos. Desde seu e-mail até seu histórico de bate-papo e localização, as agências de publicidade ou outros compradores podem ganhar muito quando você, sem querer, os deixa entrar em sua vida por meio de aplicativos. 

Ética dos dados Coleta de dados
[Referência: Harvard Business Review].

Muitas organizações estão desenvolvendo a infraestrutura para tornar a IA e a ciência de dados possíveis em vários setores, o que significa que a pesquisa sobre exposição está apenas começando. O consentimento e a venda de informações pessoais se tornarão um tópico importante em cada vez mais partes da vida. 

Para entender o potencial de impacto quando determinadas empresas desenvolvem a infraestrutura para facilitar os projetos de big data, as ferramentas artísticas de IA de código aberto, como DALL-E e Stable Diffusion, demonstram a rapidez com que a IA pode melhorar quando se torna amplamente disponível. Com esses rápidos desenvolvimentos, nossa única garantia para o futuro é que a privacidade dos dados, a segurança e o senso de justiça se tornarão cada vez mais difíceis de garantir. 

Princípios da ética de Big Data

Embora não exista um método padrão para abordar projetos de dados - grandes ou não - o objetivo essencial é traduzir os direitos humanos básicos para a era digital. Independentemente dos termos usados, considerar os possíveis danos às pessoas, às organizações e aos sistemas é a motivação por trás desses princípios. 

As agências governamentais de risco forneceram algumas orientações sobre a aplicação prática. O NIST, a organização de padrões tecnológicos dos EUA, e o DataEthics.eu apresentam esta abordagem para considerar os desafios exclusivos de seu setor: 

  • Danos às pessoas
      • Impacto adverso nas liberdades civis ou na segurança física de um indivíduo, na discriminação de grupos de pessoas ou na repressão da participação democrática em escala.
  • Danos às organizações:
      • Impacto adverso nas operações comerciais (perda monetária, violações de segurança e danos à reputação)
  • Danos aos sistemas:
    • Danos em grande escala, como aos sistemas financeiros.

Algumas empresas também incluíram os seguintes valores que se referem diretamente às suas ofertas: boa intenção, tomada de decisão orientada por dados e design orientado pelo usuário. Caso contrário, ao desenvolver um projeto de dados, os quatro princípios de ética de dados a seguir são uma base clara e acionável para o desenvolvimento: 

Transparência 

Transparência refere-se à comunicação clara de quais dados serão coletados, se serão armazenados e com quem poderão ser compartilhados. Embora os documentos de termos e condições possam ser longos, complicados e quase exijam conhecimento jurídico, os usuários devem entender como a empresa usará suas informações. Você pode encontrar alguns exemplos de como isso é incorporado na OCDE

Responsabilidade 

Responsabilidade refere-se ao fato de uma organização assumir a responsabilidade pelo que acontece com os dados de um indivíduo depois de coletá-los. De vazamentos de dados a vendas para terceiros, as empresas precisam assumir a responsabilidade pelos danos que seus processos podem causar aos usuários. Você pode encontrar exemplos de como empresas como a Coloplast e a Novo Nordisk aplicam isso. 

Agência individual

Agência refere-se à capacidade de uma pessoa de fazer escolhas significativas sobre dados pessoais. Seja a capacidade de acessar, remover-se completamente ou escolher quais informações coletadas devem ser armazenadas, permitir que os indivíduos controlem o que acontece com suas informações deve ser um direito humano.

Privacidade de dados

Privacidade refere-se à capacidade de uma pessoa de esperar proteção contra a exposição pública de seus dados. Se você consentir que uma organização colete seus dados, terá a expectativa razoável de armazenamento ou uso contínuo com base em seu acordo inicial. 

Informações de identificação pessoal (PII) referem-se a qualquer informação vinculada à identidade de uma pessoa, inclusive o número VIN de um veículo, assinatura de voz ou número de telefone.  No entanto, hackers e tecnólogos éticos conseguiram identificar indivíduos com muito menos detalhes pessoais. 

Embora a maioria das organizações tenha uma política de privacidade e um aviso adicional ao coletar suas informações, o que acaba determinando se elas podem cumprir sua parte do acordo é algo completamente diferente: o protocolo de segurança. Você pode encontrar mais análises sobre esse princípio de ética de dados na Harvard Business School.

Aplicação da ética de dados

Além de contemplar a filosofia geral, os profissionais individuais e os líderes organizacionais enfrentam desafios para integrar esses valores às práticas e aos processos cotidianos. 

Orientação sobre ética de dados para profissionais individuais

Engenheiros de software, aprendizado de máquina ou IA

As habilidades necessárias para desenvolver software não são as mesmas que determinam se um projeto é ético. Isso é evidenciado por muitos exemplos de algoritmos e produtos de software altamente tendenciosos e antiéticos defendidos por fundadores técnicos. 

Embora os engenheiros de software possam (e devam) ampliar sua compreensão das armadilhas éticas comuns, a principal aplicação para colaboradores técnicos individuais é colaborar com especialistas em ética em questões desafiadoras. Entender que o tempo e o esforço adicionais para trabalhar com análises éticas de um produto não são desperdiçados, nem um atraso na "inovação", é fundamental para aceitar o novo normal dessa função.  

A documentação e a revisão cuidadosa dos dados são práticas recomendadas que serão ainda mais importantes à medida que a transparência, a responsabilidade e a acessibilidade forem incorporadas aos seus produtos. Embora muitas questões éticas estejam fora do escopo do desenvolvimento, podem surgir preocupações imprevistas nessa fase, portanto, os desenvolvedores devem participar ativamente.

Gerentes de projetos técnicos

Como gerente de projeto, navegar por requisitos adicionais relacionados a proteções éticas será um novo desafio. Estimar o tempo e o esforço relacionados a essas tarefas sem precedentes e desenvolver uma compreensão clara das novas partes interessadas (pesquisadores, especialistas em ética, etc.) será fundamental para criar resultados significativos para a sua equipe técnica. 

Gerenciar os requisitos e navegar pelo escopo e pelas demandas de todos os lados já torna o gerenciamento de projetos um trabalho exigente, mas manter-se firme no alinhamento de um produto com os princípios éticos tornará sua função ainda mais crítica. 

Trabalhar com os desenvolvedores para criar uma documentação significativa de todas as tentativas de detectar preconceito e discriminação será essencial para a iteração de protocolos internos sobre iniciativas justas e éticas. 

Gerente de produtos

Como gerente de produto, você pode ter a função mais prática em relação à aprovação de uma ideia em um teste de ética. A navegação pelas solicitações e requisitos o forçará a trabalhar em estreita colaboração com os líderes das equipes de entrega e desenvolvimento para garantir que os recursos tenham sido exaustivamente testados pelos usuários e revisados quanto à inclusão. Se sua organização ainda não tiver medidas padrão para receber feedback, desenvolva processos para iterar se surgirem violações éticas. 

Orientação sobre ética de dados para líderes organizacionais

Startups

Para as startups que desenvolvem tecnologia e ferramentas que incluem aplicativos de IA, é essencial estar atento às implicações éticas. Pode ser um desafio para as pequenas empresas dedicar recursos adicionais à análise ética, mas é ainda mais importante que essas empresas desenvolvam essas práticas desde o início. 

Empresas de pequeno/médio porte

À medida que muitas pequenas empresas crescem, elas podem começar a usar mais tecnologia. A coleta de dados de usuários, o desenvolvimento de bancos de dados de compras e a possível contratação de engenheiros podem se tornar a norma. No entanto, com esses desenvolvimentos, há um crescimento exponencial dos riscos relacionados.

Os líderes desse tipo de negócio podem priorizar a transparência e a acessibilidade à medida que crescem. Manter os clientes informados sobre os dados coletados e como eles serão usados é fundamental à medida que você continua a desenvolver seus processos. Solicitar consentimento e manter altos níveis de comunicação em relação às mudanças na tecnologia e nas expectativas é outra forma de as PMEs garantirem que estão crescendo de forma sustentável. 

Corporações globais

Devido à escala de impacto da maioria das empresas multinacionais, o desenvolvimento de processos confiáveis de segurança, privacidade e ética é ainda mais essencial. Corporações de setores muito diferentes foram vítimas de ransomware, vazamentos e uso indevido de dados por funcionários; no entanto, alegar ignorância dos riscos não é mais aceitável. 

O desenvolvimento de grupos de trabalho internos e interdepartamentais é uma primeira etapa valiosa no desenvolvimento de uma mudança de valores e compartilhamento de conhecimento em toda a empresa. A expansão do treinamento necessário para os funcionários e o incentivo à análise regular para gerentes e colaboradores individuais também comunicarão o valor das considerações éticas relacionadas aos dados para todos. 

Ética de dados Violações de dados
[Referência: Spanning].

Os desafios de hoje: Exemplos de ética de dados

Algoritmos éticos

Os algoritmos têm o potencial de ampliar o impacto de qualquer ação um milhão de vezes à medida que são implementados. Mesmo na infância de sua capacidade, há muitos exemplos de como a falta de salvaguardas éticas para os algoritmos nos afeta. 

Contratação de algoritmos na Amazon

Os projetos relacionados a recursos humanos são quase sempre de alto risco, pois determinam o acesso ao emprego, e os impactos podem ser uma clara ameaça aos meios de subsistência das pessoas. No entanto, com aplicativos on-line e ferramentas como o LinkedIn, encontrar o candidato certo e garantir a igualdade de oportunidades apresenta novos desafios.

 Em 2016-2017, a Amazon tentou resolver esses dois problemas com um algoritmo interno de contratação que decidiria quais currículos passariam para a próxima etapa de contratação. Não demorou muito para que o preconceito contra as mulheres em cargos técnicos se tornasse óbvio. Devido ao viés existente nos dados históricos, o algoritmo aprendeu sozinho a identificar e destacar as mulheres sem preconceito. 

Embora a Amazon possa ter descartado esse algoritmo, ​a maioria dos representantes de RH prevê o uso regular de ferramentas de IA em seus processos de contratação no futuro. Leia mais sobre como usar eticamente o aprendizado de máquina para tomar decisões em um artigo separado. 

O reconhecimento facial tem dificuldade para detectar tons de pele mais escuros

O reconhecimento facial ganhou uso generalizado não apenas em relação ao acesso a telefones e contas, mas também como uma ferramenta essencial para a vigilância policial, triagem de passageiros em aeroportos e decisões sobre emprego e moradia.

No entanto, em 2018, uma pesquisa revelou que esses algoritmos tiveram um desempenho notavelmente pior em mulheres de pele escura, com taxas de erro até 34% mais altas do que em homens de pele mais clara. 

Se você estiver curioso para saber como funciona a detecção de faces, confira nosso tutorial sobre detecção de faces com Python usando o OpenCV

Privacidade de dados 

Saiba mais sobre privacidade de dados e anonimização em Python com nosso curso interativo. 

Aplicativos de monitoramento de períodos

Desde a proteção federal ao aborto, Roe v. Wade, foi derrubado nos EUA no início deste ano, os aplicativos de rastreamento de período tornaram-se um possível meio de acusação em qualquer futura proibição total do aborto. Embora a maioria dos aplicativos tenha termos que permitem o compartilhamento de dados pessoais com terceiros, muitos aplicativos de rastreamento de período têm uma linguagem obscura sobre se os dados podem ser compartilhados com as autoridades para mandados de prisão

Embora talvez você precise de um especialista jurídico para interpretar os termos e condições de todos os aplicativos que usa diariamente, a compreensão das compensações e dos riscos aos quais você se expõe só se tornará mais importante.

Uber rastreia políticos e celebridades com o "Modo Deus"

Em 2014, reportagens afirmaram que o "god-mode" da Uber dava a todos os funcionários acesso a dados completos dos usuários, que eram frequentemente usados para rastrear celebridades, políticos e até mesmo conexões pessoais (como ex-parceiros). Um ex-funcionário também entrou com um processo descrevendo um comportamento imprudente com o comportamento do usuário e um "total desrespeito" pela privacidade.  

Na mesma época, em 2016, a Uber tentou encobrir uma grande violação de dados pagando hackers e não relatando o incidente. Apesar de uma investigação pendente sobre a segurança da empresa pela Comissão Federal de Comércio dos EUA na mesma época. 

Segurança de dados

De falhas de segurança inerentes a vulnerabilidades de hackers, a segurança de dados pode colocar em risco mais do que suas informações de login. Aplicativos e sites de todos os tipos podem identificar sua localização, ler suas mensagens, ver quem você bloqueou e como você gasta seu dinheiro. 

Quer você seja uma borboleta social on-line ou apenas participe de serviços digitais mínimos (serviços bancários, mensagens de texto, e-mail etc.), provavelmente está exposto de mais maneiras do que imagina. 

Regulamentos atuais de ética de dados

Muitas pessoas estão cientes da importância da ética dos dados, mas o que isso significa para nós, consumidores? O que isso significa para as empresas? O que isso significa para as agências governamentais? 

A resposta a essas perguntas depende de onde você mora. Em alguns países, já existem leis que exigem que as empresas sejam transparentes sobre como lidam com informações pessoais; em outros, não há nenhuma regulamentação.

Além disso, há as questões éticas que enfrentamos todos os dias: O quanto compartilhamos uns com os outros on-line? Deveríamos estar compartilhando menos? E o que acontece quando algo dá errado? Todas essas são questões urgentes que exigem uma análise cuidadosa e uma liderança forte dos líderes do governo e do setor para que nosso futuro não seja ameaçado por um comportamento antiético ou pela falta dele.

Em todo o mundo, os governos estão tentando novos métodos para regulamentar a coleta ética de dados, a IA e os vários usos de dados (por exemplo, marketing direcionado etc.). 

Aqui estão alguns regulamentos que vale a pena conhecer e seguir para entender o estado atual da regulamentação de dados onde você mora: 

Proteção de dados 
  • GDPR (União Europeia) 
  • CCPR, CCPA (USA - California) 
Uso de IA 
Regulamentação da plataforma
  • Lei de Serviços Digitais (União Europeia)

Embora a UE e os EUA liderem o caminho em termos de legislação ratificada, a maioria dessas políticas é nova e está em constante desenvolvimento. 

Educação continuada sobre ética de dados

Para os interessados em preparar suas carreiras para essas mudanças em desenvolvimento na tecnologia e nos negócios, há muitas coisas que podem facilitar a mudança ou a entrada em uma carreira em dados éticos. Comece com nosso curso Introdução aos dados, que aborda a ética e a privacidade dos dados. A partir daí, você encontrará várias certificações para explorar: 

  • Privacidade de dados
      • Certificação CIPM (Certified Information Privacy Manager) do IAPP
      • Certificação Securiti PrivacyOps
      • Certificação ISACA Certified Data Privacy Solutions Engineer (CDPSE) 
      • Certificação CIPP (Certified Information Privacy Professional) do IAPP
  • Segurança de dados
    • CompTIA Security+
    • Hacker Ético Certificado (CEH)
    • Certificação GIAC Security Essentials (GSEC)
    • Profissional Certificado em Segurança Ofensiva (OSCP)
Temas
Relacionado

blog

A importância dos dados: 5 principais motivos

Por que os dados são importantes? Saiba mais sobre a importância dos dados no mundo atual e descubra alguns cursos para ajudá-lo a aprimorar suas próprias habilidades com dados.

Kurtis Pykes

6 min

blog

O que é cultura de dados? Um guia abrangente para ser uma organização mais orientada por dados

Descubra nossas principais dicas para criar uma cultura de dados em sua organização e obter a adesão de todos. 
Matt Crabtree's photo

Matt Crabtree

17 min

blog

O que é alfabetização em dados? Um guia para líderes de dados e análise

Descubra a importância da alfabetização em dados no mundo atual, orientado por dados.
Matt Crabtree's photo

Matt Crabtree

21 min

Artificial Intelligence Concept Art

blog

Guia de casos de uso de ciência de dados

Conheça os casos de uso da ciência de dados e descubra como ela pode ser implementada em vários setores para impulsionar o crescimento e a tomada de decisões.
Elena Kosourova 's photo

Elena Kosourova

16 min

blog

O que significa democratizar os dados? Liberando o poder das culturas de dados

Saiba mais sobre a democratização de dados, por que ela é importante e como alcançá-la. Explore como ele pode melhorar a alfabetização de dados, capacitar indivíduos e empresas e criar um impacto social positivo.
Matt Crabtree's photo

Matt Crabtree

13 min

blog

O que é análise de dados? Um guia especializado com exemplos

Explore o mundo da análise de dados com nosso guia abrangente. Saiba mais sobre sua importância, processo, tipos, técnicas, ferramentas e as principais carreiras em 2023
Matt Crabtree's photo

Matt Crabtree

15 min

See MoreSee More