History

leestott ddda89c203 🌐 Update translations via Co-op Translator		2 weeks ago
..
README.md	🌐 Update translations via Co-op Translator	2 weeks ago
assignment.md	🌐 Update translations via Co-op Translator	4 weeks ago

README.md

Introdução à Ética de Dados


Ética em Ciência de Dados - Sketchnote por @nitya

Somos todos cidadãos de dados vivendo num mundo dataficado.

As tendências de mercado indicam que, até 2022, 1 em cada 3 grandes organizações comprará e venderá os seus dados através de Mercados e Bolsas online. Como Desenvolvedores de Aplicações, será mais fácil e barato integrar insights baseados em dados e automação orientada por algoritmos nas experiências diárias dos utilizadores. Mas, à medida que a IA se torna mais presente, também será necessário compreender os potenciais danos causados pela armação desses algoritmos em larga escala.

As tendências também indicam que criaremos e consumiremos mais de 180 zettabytes de dados até 2025. Como Cientistas de Dados, isso nos dá níveis sem precedentes de acesso a dados pessoais. Isso significa que podemos construir perfis comportamentais de utilizadores e influenciar a tomada de decisões de formas que criam uma ilusão de escolha livre, enquanto potencialmente direcionamos os utilizadores para resultados que preferimos. Isso também levanta questões mais amplas sobre privacidade de dados e proteção dos utilizadores.

A ética de dados é agora uma barreira necessária para a ciência e engenharia de dados, ajudando-nos a minimizar potenciais danos e consequências não intencionais das nossas ações orientadas por dados. O Ciclo de Hype da Gartner para IA identifica tendências relevantes em ética digital, IA responsável e governança de IA como motores-chave para megatendências maiores em torno da democratização e industrialização da IA.

Nesta lição, exploraremos a área fascinante da ética de dados - desde conceitos e desafios fundamentais até estudos de caso e conceitos aplicados de IA, como governança - que ajudam a estabelecer uma cultura ética em equipas e organizações que trabalham com dados e IA.

Questionário pré-aula 🎯

Definições Básicas

Vamos começar por entender a terminologia básica.

A palavra "ética" vem da palavra grega "ethikos" (e sua raiz "ethos"), que significa caráter ou natureza moral.

Ética trata dos valores compartilhados e princípios morais que governam o nosso comportamento na sociedade. A ética não se baseia em leis, mas em normas amplamente aceitas sobre o que é "certo versus errado". No entanto, considerações éticas podem influenciar iniciativas de governança corporativa e regulamentações governamentais que criam mais incentivos para conformidade.

Ética de Dados é um novo ramo da ética que "estuda e avalia problemas morais relacionados a dados, algoritmos e práticas correspondentes". Aqui, "dados" foca em ações relacionadas à geração, gravação, curadoria, processamento, disseminação, partilha e uso; "algoritmos" foca em IA, agentes, aprendizagem automática e robôs; e "práticas" foca em tópicos como inovação responsável, programação, hacking e códigos de ética.

Ética Aplicada é a aplicação prática de considerações morais. É o processo de investigar ativamente questões éticas no contexto de ações, produtos e processos do mundo real, e tomar medidas corretivas para garantir que permaneçam alinhados com os nossos valores éticos definidos.

Cultura Ética trata de operacionalizar a ética aplicada para garantir que os nossos princípios e práticas éticas sejam adotados de forma consistente e escalável em toda a organização. Culturas éticas bem-sucedidas definem princípios éticos em toda a organização, fornecem incentivos significativos para conformidade e reforçam normas éticas ao encorajar e amplificar comportamentos desejados em todos os níveis da organização.

Conceitos de Ética

Nesta secção, discutiremos conceitos como valores compartilhados (princípios) e desafios éticos (problemas) para ética de dados - e exploraremos estudos de caso que ajudam a entender esses conceitos em contextos do mundo real.

1. Princípios Éticos

Toda estratégia de ética de dados começa por definir princípios éticos - os "valores compartilhados" que descrevem comportamentos aceitáveis e orientam ações conformes nos nossos projetos de dados e IA. Pode-se defini-los a nível individual ou de equipa. No entanto, a maioria das grandes organizações delineia isso numa declaração de missão ou estrutura de IA ética definida a nível corporativo e aplicada consistentemente em todas as equipas.

Exemplo: A declaração de missão de IA Responsável da Microsoft diz: "Estamos comprometidos com o avanço da IA orientada por princípios éticos que colocam as pessoas em primeiro lugar" - identificando 6 princípios éticos na estrutura abaixo:

Vamos explorar brevemente esses princípios. Transparência e responsabilidade são valores fundamentais sobre os quais outros princípios são construídos - então vamos começar por aí:

Responsabilidade torna os profissionais responsáveis pelas suas operações de dados e IA, e pela conformidade com esses princípios éticos.
Transparência garante que as ações de dados e IA sejam compreensíveis (interpretáveis) para os utilizadores, explicando o quê e o porquê por trás das decisões.
Justiça - foca em garantir que a IA trate todas as pessoas de forma justa, abordando quaisquer preconceitos sociotécnicos sistémicos ou implícitos nos dados e sistemas.
Fiabilidade e Segurança - garante que a IA se comporte de forma consistente com os valores definidos, minimizando potenciais danos ou consequências não intencionais.
Privacidade e Segurança - trata de entender a origem dos dados e fornecer privacidade de dados e proteções relacionadas aos utilizadores.
Inclusão - trata de projetar soluções de IA com intenção, adaptando-as para atender a uma ampla gama de necessidades e capacidades humanas.

🚨 Pense no que poderia ser a sua declaração de missão de ética de dados. Explore estruturas de IA ética de outras organizações - aqui estão exemplos da IBM, Google e Facebook. Quais valores compartilhados têm em comum? Como esses princípios se relacionam com o produto ou indústria de IA em que operam?

2. Desafios Éticos

Depois de definir os princípios éticos, o próximo passo é avaliar as nossas ações de dados e IA para ver se estão alinhadas com esses valores compartilhados. Pense nas suas ações em duas categorias: coleta de dados e design de algoritmos.

Na coleta de dados, as ações provavelmente envolverão dados pessoais ou informações pessoalmente identificáveis (PII) de indivíduos identificáveis. Isso inclui diversos itens de dados não pessoais que, coletivamente, identificam um indivíduo. Os desafios éticos podem estar relacionados à privacidade de dados, propriedade de dados e tópicos relacionados, como consentimento informado e direitos de propriedade intelectual dos utilizadores.

No design de algoritmos, as ações envolverão a coleta e curadoria de conjuntos de dados, e o uso deles para treinar e implementar modelos de dados que preveem resultados ou automatizam decisões em contextos do mundo real. Os desafios éticos podem surgir de viés nos conjuntos de dados, problemas de qualidade dos dados, injustiça e má representação nos algoritmos - incluindo alguns problemas que são sistémicos por natureza.

Em ambos os casos, os desafios éticos destacam áreas onde as nossas ações podem entrar em conflito com os nossos valores compartilhados. Para detetar, mitigar, minimizar ou eliminar essas preocupações, precisamos fazer perguntas morais "sim/não" relacionadas às nossas ações e tomar medidas corretivas conforme necessário. Vamos dar uma olhada em alguns desafios éticos e nas perguntas morais que eles levantam:

2.1 Propriedade de Dados

A coleta de dados muitas vezes envolve dados pessoais que podem identificar os sujeitos dos dados. Propriedade de dados trata do controlo e direitos dos utilizadores relacionados à criação, processamento e disseminação de dados.

As perguntas morais que precisamos fazer são:

Quem é o proprietário dos dados? (utilizador ou organização)
Quais direitos têm os sujeitos dos dados? (ex: acesso, eliminação, portabilidade)
Quais direitos têm as organizações? (ex: retificar avaliações maliciosas de utilizadores)

2.2 Consentimento Informado

Consentimento informado define o ato de os utilizadores concordarem com uma ação (como coleta de dados) com um entendimento completo dos factos relevantes, incluindo o propósito, os riscos potenciais e as alternativas.