History

leestott 96f3257873 🌐 Update translations via Co-op Translator		4 weeks ago
..
README.md	🌐 Update translations via Co-op Translator	4 weeks ago
assignment.md	🌐 Update translations via Co-op Translator	4 weeks ago

README.md

Introductie tot Data-ethiek


Data Science Ethiek - Sketchnote door @nitya

We zijn allemaal databurgers die leven in een wereld vol data.

Markttrends voorspellen dat tegen 2022, 1 op de 3 grote organisaties hun data zal kopen en verkopen via online marktplaatsen en beurzen. Als app-ontwikkelaars wordt het voor ons eenvoudiger en goedkoper om datagestuurde inzichten en algoritmegestuurde automatisering te integreren in dagelijkse gebruikerservaringen. Maar naarmate AI alomtegenwoordig wordt, moeten we ook de potentiële schade begrijpen die kan worden veroorzaakt door de bewapening van dergelijke algoritmen op grote schaal.

Trends geven ook aan dat we tegen 2025 meer dan 180 zettabytes aan data zullen creëren en consumeren. Als datawetenschappers geeft dit ons ongekende toegang tot persoonlijke gegevens. Dit betekent dat we gedragsprofielen van gebruikers kunnen opstellen en besluitvorming kunnen beïnvloeden op manieren die een illusie van vrije keuze creëren, terwijl we gebruikers mogelijk naar door ons gewenste uitkomsten sturen. Dit roept ook bredere vragen op over gegevensprivacy en gebruikersbescherming.

Data-ethiek is nu een noodzakelijke leidraad voor datawetenschap en engineering, die ons helpt potentiële schade en onbedoelde gevolgen van onze datagestuurde acties te minimaliseren. De Gartner Hype Cycle voor AI identificeert relevante trends in digitale ethiek, verantwoordelijke AI en AI-governance als belangrijke drijfveren voor grotere megatrends rond democratisering en industrialisering van AI.

In deze les verkennen we het fascinerende gebied van data-ethiek - van kernconcepten en uitdagingen tot casestudies en toegepaste AI-concepten zoals governance - die helpen een ethische cultuur te vestigen in teams en organisaties die met data en AI werken.

Pre-lecture quiz 🎯

Basisdefinities

Laten we beginnen met het begrijpen van de basisterminologie.

Het woord "ethiek" komt van het Griekse woord "ethikos" (en de wortel "ethos") wat karakter of morele aard betekent.

Ethiek gaat over de gedeelde waarden en morele principes die ons gedrag in de samenleving sturen. Ethiek is niet gebaseerd op wetten, maar op algemeen geaccepteerde normen van wat "goed versus fout" is. Echter, ethische overwegingen kunnen invloed hebben op initiatieven voor corporate governance en overheidsreguleringen die meer prikkels creëren voor naleving.

Data-ethiek is een nieuwe tak van ethiek die "morele problemen bestudeert en evalueert met betrekking tot data, algoritmen en bijbehorende praktijken". Hier richt "data" zich op acties zoals generatie, registratie, curatie, verwerking, verspreiding, delen en gebruik; "algoritmen" op AI, agenten, machine learning en robots; en "praktijken" op onderwerpen zoals verantwoord innoveren, programmeren, hacken en ethische codes.

Toegepaste ethiek is de praktische toepassing van morele overwegingen. Het is het proces van actief onderzoeken van ethische kwesties in de context van real-world acties, producten en processen, en het nemen van corrigerende maatregelen om ervoor te zorgen dat deze in lijn blijven met onze gedefinieerde ethische waarden.

Ethiekcultuur gaat over het operationeel maken van toegepaste ethiek om ervoor te zorgen dat onze ethische principes en praktijken consistent en schaalbaar worden toegepast in de hele organisatie. Succesvolle ethiekculturen definiëren organisatiebrede ethische principes, bieden zinvolle prikkels voor naleving en versterken ethische normen door gewenst gedrag op elk niveau van de organisatie aan te moedigen en te versterken.

Ethiekconcepten

In deze sectie bespreken we concepten zoals gedeelde waarden (principes) en ethische uitdagingen (problemen) voor data-ethiek - en verkennen we casestudies die je helpen deze concepten te begrijpen in real-world contexten.

1. Ethiekprincipes

Elke data-ethiekstrategie begint met het definiëren van ethische principes - de "gedeelde waarden" die acceptabel gedrag beschrijven en compliant acties sturen in onze data- en AI-projecten. Je kunt deze definiëren op individueel of teamniveau. Echter, de meeste grote organisaties schetsen deze in een ethische AI-missieverklaring of raamwerk dat op bedrijfsniveau wordt gedefinieerd en consistent wordt gehandhaafd in alle teams.

Voorbeeld: De Responsible AI-missieverklaring van Microsoft luidt: "We zijn toegewijd aan de vooruitgang van AI, gedreven door ethische principes die mensen op de eerste plaats zetten" - met daarin 6 ethische principes zoals hieronder weergegeven:

Laten we deze principes kort verkennen. Transparantie en verantwoordelijkheid zijn fundamentele waarden waarop andere principes zijn gebaseerd - dus laten we daar beginnen:

Verantwoordelijkheid maakt beoefenaars verantwoordelijk voor hun data- en AI-operaties en naleving van deze ethische principes.
Transparantie zorgt ervoor dat data- en AI-acties begrijpelijk (interpreteerbaar) zijn voor gebruikers, waarbij wordt uitgelegd wat en waarom beslissingen worden genomen.
Eerlijkheid richt zich op het waarborgen dat AI alle mensen eerlijk behandelt, en eventuele systemische of impliciete sociaal-technische vooroordelen in data en systemen aanpakt.
Betrouwbaarheid & Veiligheid zorgt ervoor dat AI zich consistent gedraagt met gedefinieerde waarden, en potentiële schade of onbedoelde gevolgen minimaliseert.
Privacy & Beveiliging gaat over het begrijpen van de herkomst van data en het bieden van gegevensprivacy en gerelateerde bescherming aan gebruikers.
Inclusiviteit gaat over het intentioneel ontwerpen van AI-oplossingen en deze aanpassen om te voldoen aan een breed scala aan menselijke behoeften en capaciteiten.

🚨 Denk na over wat jouw data-ethiek missieverklaring zou kunnen zijn. Verken ethische AI-raamwerken van andere organisaties - hier zijn voorbeelden van IBM, Google, en Facebook. Welke gedeelde waarden hebben ze gemeen? Hoe relateren deze principes aan het AI-product of de industrie waarin ze opereren?

2. Ethiekuitdagingen

Zodra we ethische principes hebben gedefinieerd, is de volgende stap om onze data- en AI-acties te evalueren om te zien of ze in lijn zijn met die gedeelde waarden. Denk aan je acties in twee categorieën: dataverzameling en algoritmeontwerp.

Bij dataverzameling zullen acties waarschijnlijk betrekking hebben op persoonlijke gegevens of persoonlijk identificeerbare informatie (PII) van identificeerbare levende individuen. Dit omvat diverse items van niet-persoonlijke gegevens die gezamenlijk een individu identificeren. Ethische uitdagingen kunnen betrekking hebben op gegevensprivacy, gegevensbezit en gerelateerde onderwerpen zoals geïnformeerde toestemming en intellectuele eigendomsrechten voor gebruikers.

Bij algoritmeontwerp zullen acties betrekking hebben op het verzamelen en samenstellen van datasets, en deze vervolgens gebruiken om datamodellen te trainen en in te zetten die uitkomsten voorspellen of beslissingen automatiseren in real-world contexten. Ethische uitdagingen kunnen voortkomen uit datasetbias, gegevenskwaliteit problemen, oneerlijkheid en verkeerde voorstelling in algoritmen - inclusief enkele problemen die systemisch van aard zijn.

In beide gevallen benadrukken ethische uitdagingen gebieden waar onze acties mogelijk in conflict komen met onze gedeelde waarden. Om deze zorgen te detecteren, te beperken, te minimaliseren of te elimineren, moeten we morele "ja/nee"-vragen stellen met betrekking tot onze acties en vervolgens corrigerende maatregelen nemen indien nodig. Laten we enkele ethische uitdagingen en de morele vragen die ze oproepen bekijken:

2.1 Gegevensbezit

Dataverzameling omvat vaak persoonlijke gegevens die de betrokkenen kunnen identificeren. Gegevensbezit gaat over controle en gebruikersrechten met betrekking tot de creatie, verwerking en verspreiding van gegevens.

De morele vragen die we moeten stellen zijn:

Wie bezit de gegevens? (gebruiker of organisatie)
Welke rechten hebben betrokkenen? (bijv. toegang, verwijdering, overdraagbaarheid)
Welke rechten hebben organisaties? (bijv. rectificatie van schadelijke gebruikersbeoordelingen)

2.2 Geïnformeerde Toestemming

Geïnformeerde toestemming definieert de handeling waarbij gebruikers instemmen met een actie (zoals dataverzameling) met een volledig begrip van relevante feiten, inclusief het doel, de potentiële risico's en alternatieven.