|
|
1 month ago | |
|---|---|---|
| .. | ||
| README.md | 1 month ago | |
| assignment.md | 1 month ago | |
README.md
Úvod do dátovej etiky
![]() |
|---|
| Etika dátovej vedy - Sketchnote od @nitya |
Všetci sme občanmi dátového sveta, v ktorom žijeme.
Trhové trendy naznačujú, že do roku 2022 bude 1 z 3 veľkých organizácií kupovať a predávať svoje dáta prostredníctvom online trhovísk a výmenných platforiem. Ako vývojári aplikácií budeme mať jednoduchší a lacnejší prístup k integrácii dátových poznatkov a automatizácie založenej na algoritmoch do každodenných používateľských skúseností. Avšak s rozšírením AI budeme musieť pochopiť aj potenciálne škody spôsobené zbraňovaním takýchto algoritmov vo veľkom rozsahu.
Trendy naznačujú, že do roku 2025 budeme generovať a spotrebovávať viac ako 180 zettabajtov dát. Pre dátových vedcov tento výbuch informácií poskytuje bezprecedentný prístup k osobným a behaviorálnym dátam. S tým prichádza moc vytvárať podrobné používateľské profily a jemne ovplyvňovať rozhodovanie – často spôsobom, ktorý podporuje ilúziu voľby. Hoci to môže byť použité na usmernenie používateľov k preferovaným výsledkom, zároveň to vyvoláva zásadné otázky o ochrane dát, autonómii a etických hraniciach algoritmického vplyvu.
Dátová etika je teraz nevyhnutným ochranným rámcom pre dátovú vedu a inžinierstvo, ktorý nám pomáha minimalizovať potenciálne škody a neúmyselné dôsledky našich dátovo riadených akcií. Gartnerov Hype Cycle pre AI identifikuje relevantné trendy v digitálnej etike, zodpovednej AI a správe AI ako kľúčové faktory pre väčšie megatrendy okolo demokratizácie a industrializácie AI.
V tejto lekcii preskúmame fascinujúcu oblasť dátovej etiky – od základných konceptov a výziev, cez prípadové štúdie až po aplikované koncepty AI, ako je správa – ktoré pomáhajú vytvárať kultúru etiky v tímoch a organizáciách pracujúcich s dátami a AI.
Kvíz pred prednáškou 🎯
Základné definície
Začnime pochopením základnej terminológie.
Slovo "etika" pochádza z gréckeho slova "ethikos" (a jeho koreňa "ethos"), čo znamená charakter alebo morálna povaha.
Etika sa týka spoločných hodnôt a morálnych princípov, ktoré riadia naše správanie v spoločnosti. Etika nie je založená na zákonoch, ale na všeobecne prijatých normách toho, čo je "správne vs. nesprávne". Avšak etické úvahy môžu ovplyvniť iniciatívy korporátnej správy a vládne regulácie, ktoré vytvárajú viac stimulov na dodržiavanie pravidiel.
Dátová etika je nová vetva etiky, ktorá "študuje a hodnotí morálne problémy súvisiace s dátami, algoritmami a zodpovedajúcimi praktikami". Tu sa "dáta" zameriavajú na akcie súvisiace s generovaním, zaznamenávaním, kuráciou, spracovaním, šírením, zdieľaním a používaním, "algoritmy" sa zameriavajú na AI, agentov, strojové učenie a roboty, a "praktiky" sa zameriavajú na témy ako zodpovedná inovácia, programovanie, hacking a etické kódy.
Aplikovaná etika je praktická aplikácia morálnych úvah. Ide o proces aktívneho skúmania etických otázok v kontexte reálnych akcií, produktov a procesov a prijímania nápravných opatrení na zabezpečenie toho, aby zostali v súlade s našimi definovanými etickými hodnotami.
Kultúra etiky sa týka operacionalizácie aplikovanej etiky, aby sa zabezpečilo, že naše etické princípy a praktiky sú prijaté konzistentne a škálovateľne v celej organizácii. Úspešné kultúry etiky definujú celopodnikové etické princípy, poskytujú zmysluplné stimuly na dodržiavanie pravidiel a posilňujú normy etiky podporovaním a amplifikáciou požadovaného správania na každej úrovni organizácie.
Koncepty etiky
V tejto sekcii sa budeme zaoberať konceptmi ako spoločné hodnoty (princípy) a etické výzvy (problémy) pre dátovú etiku – a preskúmame prípadové štúdie, ktoré vám pomôžu pochopiť tieto koncepty v reálnych kontextoch.
1. Princípy etiky
Každá stratégia dátovej etiky začína definovaním etických princípov – "spoločných hodnôt", ktoré opisujú prijateľné správanie a usmerňujú súladné akcie v našich dátových a AI projektoch. Môžete ich definovať na individuálnej alebo tímovej úrovni. Avšak väčšina veľkých organizácií ich uvádza v etickom AI vyhlásení alebo rámci, ktorý je definovaný na korporátnej úrovni a dôsledne presadzovaný vo všetkých tímoch.
Príklad: Vyhlásenie Microsoftu o zodpovednej AI znie: "Sme odhodlaní k pokroku AI riadenému etickými princípmi, ktoré kladú ľudí na prvé miesto" – identifikujúc 6 etických princípov v rámci nižšie:
Poďme si stručne preskúmať tieto princípy. Transparentnosť a zodpovednosť sú základné hodnoty, na ktorých sú postavené ostatné princípy – začnime teda nimi:
- Zodpovednosť robí praktikov zodpovednými za ich dátové a AI operácie a súlad s týmito etickými princípmi.
- Transparentnosť zabezpečuje, že dátové a AI akcie sú pochopiteľné (interpretovateľné) pre používateľov, vysvetľujúc čo a prečo za rozhodnutiami.
- Spravodlivosť – zameriava sa na zabezpečenie, že AI zaobchádza so všetkými ľuďmi spravodlivo, riešiac akékoľvek systémové alebo implicitné sociálno-technické predsudky v dátach a systémoch.
- Spoľahlivosť a bezpečnosť – zabezpečuje, že AI sa správa konzistentne s definovanými hodnotami, minimalizujúc potenciálne škody alebo neúmyselné dôsledky.
- Ochrana súkromia a bezpečnosť – ide o pochopenie pôvodu dát a poskytovanie ochrany súkromia a súvisiacich opatrení používateľom.
- Inkluzívnosť – ide o navrhovanie AI riešení s úmyslom, prispôsobujúc ich na splnenie širokého spektra ľudských potrieb a schopností.
🚨 Zamyslite sa nad tým, aké by mohlo byť vaše vyhlásenie o dátovej etike. Preskúmajte etické AI rámce od iných organizácií – tu sú príklady od IBM, Google a Facebook. Aké spoločné hodnoty majú? Ako sa tieto princípy vzťahujú na AI produkt alebo odvetvie, v ktorom pôsobia?
2. Výzvy etiky
Keď máme definované etické princípy, ďalším krokom je vyhodnotenie našich dátových a AI akcií, aby sme zistili, či sú v súlade s týmito spoločnými hodnotami. Zamyslite sa nad svojimi akciami v dvoch kategóriách: zber dát a návrh algoritmov.
Pri zbere dát budú akcie pravdepodobne zahŕňať osobné údaje alebo osobne identifikovateľné informácie (PII) pre identifikovateľné živé osoby. To zahŕňa rôzne položky neosobných údajov, ktoré spoločne identifikujú jednotlivca. Etické výzvy sa môžu týkať ochrany dát, vlastníctva dát a súvisiacich tém ako informovaný súhlas a práva duševného vlastníctva pre používateľov.
Pri návrhu algoritmov budú akcie zahŕňať zber a kuráciu datasetov, potom ich použitie na trénovanie a nasadenie dátových modelov, ktoré predpovedajú výsledky alebo automatizujú rozhodnutia v reálnych kontextoch. Etické výzvy môžu vzniknúť z predsudkov v datasetoch, problémov s kvalitou dát, nespravodlivosti a skreslenia v algoritmoch – vrátane niektorých problémov, ktoré sú systémové.
V oboch prípadoch etické výzvy poukazujú na oblasti, kde naše akcie môžu naraziť na konflikt s našimi spoločnými hodnotami. Na detekciu, zmiernenie, minimalizáciu alebo elimináciu týchto obáv – musíme klásť morálne "áno/nie" otázky týkajúce sa našich akcií a následne prijať nápravné opatrenia podľa potreby. Pozrime sa na niektoré etické výzvy a morálne otázky, ktoré vyvolávajú:
2.1 Vlastníctvo dát
Zber dát často zahŕňa osobné údaje, ktoré môžu identifikovať subjekty dát. Vlastníctvo dát sa týka kontroly a práv používateľov súvisiacich s vytváraním, spracovaním a šírením dát.
Morálne otázky, ktoré musíme klásť, sú:
- Kto vlastní dáta? (používateľ alebo organizácia)
- Aké práva majú subjekty dát? (napr. prístup, vymazanie, prenosnosť)
- Aké práva majú organizácie? (napr. oprava škodlivých používateľských recenzií)
2.2 Informovaný súhlas
Informovaný súhlas definuje akt používateľov, ktorí súhlasia s akciou (ako je zber dát) s plným pochopením relevantných faktov vrátane účelu, potenciálnych rizík a alternatív.
Otázky na preskúmanie tu sú:
- Dal používateľ (subjekt dát) povolenie na zber a používanie dát?
- Pochopil používateľ účel, na ktorý boli dáta zhromaždené?
- Pochopil používateľ potenciálne riziká z ich účasti?
2.3 Duševné vlastníctvo
Duševné vlastníctvo sa týka nehmotných výtvorov vyplývajúcich z ľudskej iniciatívy, ktoré môžu mať ekonomickú hodnotu pre jednotlivcov alebo podniky.
Otázky na preskúmanie tu sú:
- Mali zhromaždené dáta ekonomickú hodnotu pre používateľa alebo podnik?
- Má používateľ duševné vlastníctvo v tomto prípade?
- Má organizácia duševné vlastníctvo v tomto prípade?
- Ak tieto práva existujú, ako ich chránime?
2.4 Ochrana dát
Ochrana dát alebo ochrana informácií sa týka zachovania súkromia používateľov a ochrany identity používateľov vo vzťahu k osobne identifikovateľným informáciám.
Otázky na preskúmanie tu sú:
- Sú osobné údaje používateľov zabezpečené proti hackom a únikom?
- Sú údaje používateľov prístupné iba autorizovaným používateľom a kontextom?
- Je anonymita používateľov zachovaná pri zdieľaní alebo šírení dát?
- Môže byť používateľ de-identifikovaný z anonymizovaných datasetov?
2.5 Právo byť zabudnutý
Právo byť zabudnutý alebo Právo na vymazanie poskytuje používateľom dodatočnú ochranu osobných údajov. Konkrétne dáva používateľom právo požiadať o vymazanie alebo odstránenie osobných údajov z internetových vyhľadávaní a iných miest, za špecifických okolností – umožňujúc im nový začiatok online bez toho, aby ich minulé akcie boli proti nim použité.
Otázky na preskúmanie tu sú:
- Umožňuje systém subjektom dát požiadať o vymazanie?
- Mal by odvolanie súhlasu používateľa spustiť automatické vymazanie?
- Boli dáta zhromaždené bez súhlasu alebo nezákonnými prostriedkami?
- Sme v súlade s vládnymi reguláciami na ochranu dát?
2.6 Predsudky v datasetoch
Dataset alebo predsudky pri zbere sa týkajú výberu nereprezentatívnej podmnožiny dát na vývoj algoritmov, čo vytvára potenciálnu nespravodlivosť vo výsledkoch pre rôzne skupiny. Typy predsudkov zahŕňajú výberové alebo vzorkové predsudky, dobrovoľnícke predsudky a nástrojové predsudky.
Otázky na preskúmanie tu sú:
- Rekrutovali sme reprezentatívnu skupinu subjektov dát?
- Testovali sme náš zhromaždený alebo kurátorský dataset na rôzne predsudky?
- Môžeme zmierniť alebo odstrániť akékoľvek zistené predsudky
- Je informácia zachytená presne tak, aby odrážala realitu?
2.8 Spravodlivosť algoritmov
Spravodlivosť algoritmov skúma, či návrh algoritmu systematicky nediskriminuje konkrétne podskupiny subjektov údajov, čo môže viesť k potenciálnym škodám v alokácii (keď sú zdroje odmietnuté alebo zadržiavané tejto skupine) a kvalite služieb (keď AI nie je tak presná pre niektoré podskupiny ako pre iné).
Otázky na preskúmanie:
- Hodnotili sme presnosť modelu pre rôzne podskupiny a podmienky?
- Skúmali sme systém kvôli potenciálnym škodám (napr. stereotypizácia)?
- Môžeme upraviť údaje alebo preškoliť modely na zmiernenie identifikovaných škôd?
Preskúmajte zdroje ako kontrolné zoznamy spravodlivosti AI, aby ste sa dozvedeli viac.
2.9 Nesprávne zobrazenie údajov
Nesprávne zobrazenie údajov sa zaoberá otázkou, či komunikujeme poznatky z čestne hlásených údajov zavádzajúcim spôsobom na podporu požadovaného naratívu.
Otázky na preskúmanie:
- Hlásime neúplné alebo nepresné údaje?
- Vizualizujeme údaje spôsobom, ktorý vedie k zavádzajúcim záverom?
- Používame selektívne štatistické techniky na manipuláciu s výsledkami?
- Existujú alternatívne vysvetlenia, ktoré môžu ponúknuť iný záver?
2.10 Slobodná voľba
Ilúzia slobodnej voľby nastáva, keď systémy "architektúry voľby" používajú algoritmy rozhodovania na ovplyvnenie ľudí, aby prijali preferovaný výsledok, pričom im dávajú pocit, že majú možnosti a kontrolu. Tieto temné vzory môžu spôsobiť sociálne a ekonomické škody používateľom. Keďže rozhodnutia používateľov ovplyvňujú profily správania, tieto akcie potenciálne ovplyvňujú budúce voľby, ktoré môžu zosilniť alebo rozšíriť dopad týchto škôd.
Otázky na preskúmanie:
- Rozumel používateľ dôsledkom prijatia tejto voľby?
- Bol používateľ informovaný o (alternatívnych) možnostiach a výhodách a nevýhodách každej z nich?
- Môže používateľ neskôr zvrátiť automatizovanú alebo ovplyvnenú voľbu?
3. Prípadové štúdie
Aby sme tieto etické výzvy zasadili do kontextu reálneho sveta, je užitočné pozrieť sa na prípadové štúdie, ktoré poukazujú na potenciálne škody a dôsledky pre jednotlivcov a spoločnosť, keď sa takéto etické porušenia prehliadajú.
Tu je niekoľko príkladov:
| Etická výzva | Prípadová štúdia |
|---|---|
| Informovaný súhlas | 1972 - Štúdia o syfilise v Tuskegee - Afroamerickým mužom, ktorí sa zúčastnili štúdie, bola sľúbená bezplatná lekárska starostlivosť, ale boli oklamaní výskumníkmi, ktorí im neoznámili ich diagnózu ani dostupnosť liečby. Mnohí účastníci zomreli a ich partneri alebo deti boli ovplyvnení; štúdia trvala 40 rokov. |
| Ochrana údajov | 2007 - Netflix data prize poskytla výskumníkom 10 miliónov anonymizovaných hodnotení filmov od 50 tisíc zákazníkov, aby pomohla zlepšiť algoritmy odporúčania. Výskumníci však dokázali prepojiť anonymizované údaje s osobne identifikovateľnými údajmi v externých datasetoch (napr. komentáre na IMDb), čím efektívne "de-anonymizovali" niektorých predplatiteľov Netflixu. |
| Zberová zaujatosť | 2013 - Mesto Boston vyvinulo Street Bump, aplikáciu, ktorá umožnila občanom nahlasovať výtlky, čím mesto získalo lepšie údaje o cestách na identifikáciu a opravu problémov. Avšak ľudia s nižšími príjmami mali menší prístup k autám a telefónom, čo spôsobilo, že ich problémy s cestami boli v aplikácii neviditeľné. Vývojári spolupracovali s akademikmi na riešení otázok rovnakého prístupu a digitálnych rozdielov pre spravodlivosť. |
| Spravodlivosť algoritmov | 2018 - MIT Gender Shades Study hodnotila presnosť AI produktov na klasifikáciu pohlavia, pričom odhalila medzery v presnosti pre ženy a osoby tmavej pleti. Apple Card z roku 2019 sa zdala ponúkať menej úveru ženám ako mužom. Obe ukázali problémy s algoritmickou zaujatosťou vedúcou k socio-ekonomickým škodám. |
| Nesprávne zobrazenie údajov | 2020 - Ministerstvo zdravotníctva Georgie zverejnilo grafy COVID-19, ktoré sa zdali zavádzať občanov o trendoch potvrdených prípadov s nechronologickým usporiadaním na osi x. Toto ilustruje nesprávne zobrazenie prostredníctvom vizualizačných trikov. |
| Ilúzia slobodnej voľby | 2020 - Vzdelávacia aplikácia ABCmouse zaplatila 10 miliónov dolárov na urovnanie sťažnosti FTC, kde boli rodičia uväznení v platení za predplatné, ktoré nemohli zrušiť. Toto ilustruje temné vzory v architektúre voľby, kde boli používatelia ovplyvnení k potenciálne škodlivým rozhodnutiam. |
| Ochrana údajov a práva používateľov | 2021 - Facebook Únik údajov odhalil údaje 530 miliónov používateľov, čo viedlo k pokute 5 miliárd dolárov od FTC. Napriek tomu odmietol informovať používateľov o úniku, čím porušil práva používateľov na transparentnosť a prístup k údajom. |
Chcete preskúmať viac prípadových štúdií? Pozrite si tieto zdroje:
- Ethics Unwrapped - etické dilemy v rôznych odvetviach.
- Kurz etiky dátovej vedy - preskúmané významné prípadové štúdie.
- Kde sa veci pokazili - kontrolný zoznam Deon s príkladmi.
🚨 Zamyslite sa nad prípadovými štúdiami, ktoré ste videli - zažili ste alebo boli ovplyvnení podobnou etickou výzvou vo svojom živote? Dokážete si predstaviť aspoň jednu ďalšiu prípadovú štúdiu, ktorá ilustruje jednu z etických výziev, o ktorých sme diskutovali v tejto sekcii?
Aplikovaná etika
Hovorili sme o etických konceptoch, výzvach a prípadových štúdiách v kontexte reálneho sveta. Ale ako začať uplatňovať etické princípy a praktiky vo svojich projektoch? A ako zaviesť tieto praktiky pre lepšie riadenie? Preskúmajme niektoré reálne riešenia:
1. Profesionálne kódexy
Profesijné kódexy ponúkajú jednu možnosť pre organizácie, ako "motivovať" členov k podpore ich etických princípov a poslania. Kódexy sú morálne smernice pre profesionálne správanie, ktoré pomáhajú zamestnancom alebo členom robiť rozhodnutia v súlade s princípmi ich organizácie. Sú však účinné len do miery, do akej ich členovia dobrovoľne dodržiavajú; mnohé organizácie však ponúkajú dodatočné odmeny a sankcie na motiváciu členov k dodržiavaniu.
Príklady zahŕňajú:
- Oxford Munich Etický kódex
- Data Science Association Kódex správania (vytvorený v roku 2013)
- ACM Code of Ethics and Professional Conduct (od roku 1993)
🚨 Patríte do profesionálnej organizácie pre inžinierstvo alebo dátovú vedu? Preskúmajte ich webovú stránku, aby ste zistili, či definujú profesionálny etický kódex. Čo to hovorí o ich etických princípoch? Ako motivujú členov k dodržiavaniu kódexu?
2. Etické kontrolné zoznamy
Zatiaľ čo profesionálne kódexy definujú požadované etické správanie od odborníkov, majú známe obmedzenia v presadzovaní, najmä pri veľkých projektoch. Namiesto toho mnohí odborníci na dátovú vedu odporúčajú kontrolné zoznamy, ktoré môžu spájať princípy s praktikami deterministickým a akčným spôsobom.
Kontrolné zoznamy prevádzajú otázky na úlohy "áno/nie", ktoré môžu byť zavedené, čo umožňuje ich sledovanie ako súčasť štandardných pracovných postupov pri vydávaní produktov.
Príklady zahŕňajú:
- Deon - všeobecný kontrolný zoznam etiky dát vytvorený z odporúčaní priemyslu s nástrojom príkazového riadku pre jednoduchú integráciu.
- Kontrolný zoznam auditu ochrany súkromia - poskytuje všeobecné usmernenia pre praktiky spracovania informácií z právneho a sociálneho hľadiska.
- Kontrolný zoznam spravodlivosti AI - vytvorený odborníkmi na AI na podporu prijatia a integrácie kontrol spravodlivosti do vývojových cyklov AI.
- 22 otázok pre etiku v dátach a AI - otvorenejší rámec, štruktúrovaný na počiatočné preskúmanie etických otázok v dizajne, implementácii a organizačných kontextoch.
3. Etické regulácie
Etika je o definovaní spoločných hodnôt a dobrovoľnom konaní správne. Dodržiavanie je o dodržiavaní zákona, ak je definovaný. Riadenie všeobecne pokrýva všetky spôsoby, ktorými organizácie fungujú na presadzovanie etických princípov a dodržiavanie stanovených zákonov.
Dnes riadenie nadobúda dve formy v rámci organizácií. Po prvé, ide o definovanie etických AI princípov a zavedenie praktík na podporu prijatia vo všetkých projektoch súvisiacich s AI v organizácii. Po druhé, ide o dodržiavanie všetkých vládou stanovených regulácií ochrany údajov pre regióny, v ktorých pôsobí.
Príklady regulácií ochrany údajov a súkromia:
1974, US Privacy Act - reguluje federálnu vládu pri zbere, používaní a zverejňovaní osobných údajov.1996, US Health Insurance Portability & Accountability Act (HIPAA) - chráni osobné zdravotné údaje.1998, US Children's Online Privacy Protection Act (COPPA) - chráni súkromie údajov detí mladších ako 13 rokov.2018, General Data Protection Regulation (GDPR) - poskytuje práva používateľov, ochranu údajov a súkromie.2018, California Consumer Privacy Act (CCPA) poskytuje spotrebiteľom viac práv nad ich (osobnými) údajmi.2021, Čína Zákon o ochrane osobných údajov práve schválila, čím vytvorila jednu z najsilnejších regulácií online ochrany údajov na svete.
🚨 Európska únia definovala GDPR (General Data Protection Regulation), ktorý zostáva jednou z najvplyvnejších regulácií ochrany údajov dnes. Vedeli ste, že definuje aj 8 práv používateľov na ochranu digitálneho súkromia a osobných údajov občanov? Zistite, čo to je a prečo sú dôležité.
4. Etická kultúra
Poznamenajte, že stále existuje nehmotná medzera medzi dodržiavaním (urobením dostatočného na splnenie "litery zákona") a riešením systémových problémov (ako je zakorenenie, informačná asymetria a distribučná nespravodlivosť), ktoré môžu urýchliť zneužitie AI.
Druhé vyžaduje spoluprácu pri definovaní etických kultúr, ktoré budujú emocionálne spojenia a konzistentné spoločné hodnoty naprieč organizáciami v priemysle. To si vyžaduje viac formalizovaných kultúr etiky dát v organizáciách - umožňujúc komukoľvek zatiahnuť Andon šnúru (na včasné upozornenie na etické problémy) a robiť etické hodnotenia (napr. pri nábore) ako základné kritérium formovania tímov v projektoch
- Strojové učenie pre začiatočníkov - lekcia o spravodlivosti od spoločnosti Microsoft.
- Princípy zodpovednej AI - bezplatná vzdelávacia cesta od Microsoft Learn.
- Etika a dátová veda - EBook od O'Reilly (M. Loukides, H. Mason a kol.)
- Etika dátovej vedy - online kurz od University of Michigan.
- Etika odhalená - prípadové štúdie od University of Texas.
Zadanie
Napíšte prípadovú štúdiu o etike dát
Upozornenie:
Tento dokument bol preložený pomocou služby AI prekladu Co-op Translator. Hoci sa snažíme o presnosť, prosím, berte na vedomie, že automatizované preklady môžu obsahovať chyby alebo nepresnosti. Pôvodný dokument v jeho rodnom jazyku by mal byť považovaný za autoritatívny zdroj. Pre kritické informácie sa odporúča profesionálny ľudský preklad. Nenesieme zodpovednosť za akékoľvek nedorozumenia alebo nesprávne interpretácie vyplývajúce z použitia tohto prekladu.

