History

leestott a12f5d4c2d 🌐 Update translations via Co-op Translator		9 months ago
..
README.md	🌐 Update translations via Co-op Translator	9 months ago
assignment.md	🌐 Update translations via Co-op Translator	11 months ago

README.md

Introductie tot Data-ethiek


Data Science Ethiek - Sketchnote door @nitya

We zijn allemaal databurgers die leven in een gedigitaliseerde wereld.

Markttrends voorspellen dat tegen 2022 één op de drie grote organisaties hun data zal kopen en verkopen via online marktplaatsen en beurzen. Als app-ontwikkelaars zullen we merken dat het eenvoudiger en goedkoper wordt om datagestuurde inzichten en algoritmische automatisering te integreren in dagelijkse gebruikerservaringen. Maar naarmate AI alomtegenwoordig wordt, zullen we ook de potentiële schade moeten begrijpen die wordt veroorzaakt door de bewapening van dergelijke algoritmen op grote schaal.

Trends suggereren dat we tegen 2025 meer dan 180 zettabytes aan data zullen genereren en consumeren. Voor datawetenschappers biedt deze explosie van informatie ongekende toegang tot persoonlijke en gedragsgegevens. Dit geeft de mogelijkheid om gedetailleerde gebruikersprofielen op te bouwen en subtiel besluitvorming te beïnvloeden—vaak op manieren die een illusie van vrije keuze creëren. Hoewel dit kan worden gebruikt om gebruikers naar gewenste uitkomsten te sturen, roept het ook kritische vragen op over gegevensprivacy, autonomie en de ethische grenzen van algoritmische invloed.

Data-ethiek zijn nu noodzakelijke vangrails voor datawetenschap en engineering, die ons helpen potentiële schade en onbedoelde gevolgen van onze datagestuurde acties te minimaliseren. De Gartner Hype Cycle voor AI identificeert relevante trends in digitale ethiek, verantwoorde AI en AI-governance als belangrijke drijfveren voor grotere megatrends rond democratisering en industrialisering van AI.

In deze les verkennen we het fascinerende gebied van data-ethiek - van kernconcepten en uitdagingen tot casestudy's en toegepaste AI-concepten zoals governance - die helpen een ethische cultuur te vestigen in teams en organisaties die met data en AI werken.

Pre-lecture quiz 🎯

Basisdefinities

Laten we beginnen met het begrijpen van de basisbegrippen.

Het woord "ethiek" komt van het Griekse woord "ethikos" (en de wortel "ethos") wat karakter of morele aard betekent.

Ethiek gaat over de gedeelde waarden en morele principes die ons gedrag in de samenleving sturen. Ethiek is niet gebaseerd op wetten, maar op algemeen geaccepteerde normen van wat "goed versus fout" is. Echter, ethische overwegingen kunnen invloed hebben op initiatieven voor corporate governance en overheidsreguleringen die meer prikkels creëren voor naleving.

Data-ethiek is een nieuwe tak van ethiek die "morele problemen met betrekking tot data, algoritmen en bijbehorende praktijken bestudeert en evalueert". Hier richt "data" zich op acties met betrekking tot generatie, registratie, curatie, verwerking, verspreiding, delen en gebruik, "algoritmen" richt zich op AI, agenten, machine learning en robots, en "praktijken" richt zich op onderwerpen zoals verantwoordelijke innovatie, programmeren, hacken en ethische codes.

Toegepaste ethiek is de praktische toepassing van morele overwegingen. Het is het proces van actief onderzoeken van ethische kwesties in de context van real-world acties, producten en processen, en het nemen van corrigerende maatregelen om ervoor te zorgen dat deze in lijn blijven met onze gedefinieerde ethische waarden.

Ethiekcultuur gaat over het operationeel maken van toegepaste ethiek om ervoor te zorgen dat onze ethische principes en praktijken op een consistente en schaalbare manier worden toegepast in de hele organisatie. Succesvolle ethiekculturen definiëren organisatiebrede ethische principes, bieden zinvolle prikkels voor naleving en versterken ethische normen door gewenst gedrag op elk niveau van de organisatie aan te moedigen en te versterken.

Ethiekconcepten

In deze sectie bespreken we concepten zoals gedeelde waarden (principes) en ethische uitdagingen (problemen) voor data-ethiek - en verkennen we casestudy's die je helpen deze concepten te begrijpen in real-world contexten.

1. Ethiekprincipes

Elke data-ethiekstrategie begint met het definiëren van ethische principes - de "gedeelde waarden" die acceptabel gedrag beschrijven en compliant acties sturen in onze data- en AI-projecten. Je kunt deze definiëren op individueel of teamniveau. Echter, de meeste grote organisaties schetsen deze in een ethisch AI missieverklaring of raamwerk dat op bedrijfsniveau wordt gedefinieerd en consequent wordt gehandhaafd in alle teams.

Voorbeeld: Microsoft's Responsible AI missieverklaring luidt: "We zijn toegewijd aan de vooruitgang van AI, gedreven door ethische principes die mensen centraal stellen" - en identificeert 6 ethische principes in het onderstaande raamwerk:

Laten we deze principes kort verkennen. Transparantie en verantwoordelijkheid zijn fundamentele waarden waarop andere principes zijn gebouwd - laten we daar beginnen:

Verantwoordelijkheid maakt beoefenaars verantwoordelijk voor hun data- en AI-operaties en naleving van deze ethische principes.
Transparantie zorgt ervoor dat data- en AI-acties begrijpelijk (interpreteerbaar) zijn voor gebruikers, waarbij wordt uitgelegd wat en waarom beslissingen worden genomen.
Eerlijkheid - richt zich op het waarborgen dat AI alle mensen eerlijk behandelt, en pakt eventuele systemische of impliciete sociaal-technische vooroordelen in data en systemen aan.
Betrouwbaarheid en veiligheid - zorgt ervoor dat AI consistent handelt met gedefinieerde waarden, en potentiële schade of onbedoelde gevolgen minimaliseert.
Privacy en beveiliging - gaat over het begrijpen van de herkomst van data en het bieden van gegevensprivacy en gerelateerde bescherming aan gebruikers.
Inclusiviteit - gaat over het ontwerpen van AI-oplossingen met intentie, en het aanpassen ervan om te voldoen aan een breed scala aan menselijke behoeften en capaciteiten.

🚨 Denk na over wat jouw data-ethiek missieverklaring zou kunnen zijn. Verken ethische AI-raamwerken van andere organisaties - hier zijn voorbeelden van IBM, Google, en Facebook. Welke gedeelde waarden hebben ze gemeen? Hoe verhouden deze principes zich tot het AI-product of de industrie waarin ze opereren?

2. Ethiekuitdagingen

Zodra we ethische principes hebben gedefinieerd, is de volgende stap om onze data- en AI-acties te evalueren om te zien of ze in lijn zijn met die gedeelde waarden. Denk aan je acties in twee categorieën: dataverzameling en algoritmeontwerp.

Bij dataverzameling zullen acties waarschijnlijk betrekking hebben op persoonlijke gegevens of persoonlijk identificeerbare informatie (PII) van identificeerbare levende individuen. Dit omvat diverse soorten niet-persoonlijke gegevens die gezamenlijk een individu identificeren. Ethische uitdagingen kunnen betrekking hebben op gegevensprivacy, gegevensbezit en gerelateerde onderwerpen zoals geïnformeerde toestemming en intellectuele eigendomsrechten voor gebruikers.

Bij algoritmeontwerp zullen acties betrekking hebben op het verzamelen en cureren van datasets, en het gebruik ervan om datamodellen te trainen en in te zetten die uitkomsten voorspellen of beslissingen automatiseren in real-world contexten. Ethische uitdagingen kunnen voortkomen uit datasetbias, gegevenskwaliteit problemen, oneerlijkheid en verkeerde voorstelling in algoritmen - inclusief enkele problemen die systemisch van aard zijn.

In beide gevallen benadrukken ethische uitdagingen gebieden waar onze acties mogelijk in conflict komen met onze gedeelde waarden. Om deze zorgen te detecteren, te beperken, te minimaliseren of te elimineren, moeten we morele "ja/nee"-vragen stellen met betrekking tot onze acties en vervolgens corrigerende maatregelen nemen indien nodig. Laten we enkele ethische uitdagingen en de morele vragen die ze oproepen bekijken:

2.1 Gegevensbezit

Dataverzameling omvat vaak persoonlijke gegevens die de betrokken personen kunnen identificeren. Gegevensbezit gaat over controle en gebruikersrechten met betrekking tot de creatie, verwerking en verspreiding van gegevens.

De morele vragen die we moeten stellen zijn:

Wie bezit de gegevens? (gebruiker of organisatie)
Welke rechten hebben betrokkenen? (bijv. toegang, verwijdering, overdraagbaarheid)
Welke rechten hebben organisaties? (bijv. rectificatie van schadelijke gebruikersbeoordelingen)

2.2 Geïnformeerde toestemming

Geïnformeerde toestemming definieert de handeling waarbij gebruikers akkoord gaan met een actie (zoals dataverzameling) met een volledig begrip van relevante feiten, inclusief het doel, potentiële risico's en alternatieven.