You can not select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.
Data-Science-For-Beginners/translations/sk/1-Introduction/02-ethics/README.md

28 KiB

Úvod do dátovej etiky

 Sketchnote od (@sketchthedocs)
Etika dátovej vedy - Sketchnote od @nitya

Sme všetci dátoví občania žijúci v dátovom svete.

Trhové trendy naznačujú, že do roku 2022 bude 1 z 3 veľkých organizácií kupovať a predávať svoje dáta prostredníctvom online trhov a výmen. Ako vývojári aplikácií zistíme, že je jednoduchšie a lacnejšie integrovať poznatky založené na dátach a automatizáciu riadenú algoritmami do každodenných používateľských skúseností. Ale ako sa AI stáva všadeprítomnou, budeme musieť pochopiť aj potenciálne škody spôsobené zbraňovaním takýchto algoritmov vo veľkom rozsahu.

Trendy tiež naznačujú, že do roku 2025 vytvoríme a spotrebujeme viac ako 180 zettabajtov dát. Ako dátoví vedci získame bezprecedentný prístup k osobným údajom. To znamená, že môžeme vytvárať behaviorálne profily používateľov a ovplyvňovať rozhodovanie spôsobmi, ktoré vytvárajú ilúziu voľby, pričom potenciálne posúvame používateľov k výsledkom, ktoré preferujeme. To tiež otvára širšie otázky o ochrane súkromia a práv používateľov.

Dátová etika je teraz nevyhnutným ochranným mechanizmom pre dátovú vedu a inžinierstvo, pomáhajúc nám minimalizovať potenciálne škody a neúmyselné dôsledky našich rozhodnutí založených na dátach. Gartnerov Hype Cycle pre AI identifikuje relevantné trendy v digitálnej etike, zodpovednej AI a správe AI ako kľúčové faktory pre väčšie megatrendy okolo demokratizácie a industrializácie AI.

Gartnerov Hype Cycle pre AI - 2020

V tejto lekcii preskúmame fascinujúcu oblasť dátovej etiky - od základných konceptov a výziev, cez prípadové štúdie až po aplikované koncepty AI, ako je správa - ktoré pomáhajú vytvárať kultúru etiky v tímoch a organizáciách pracujúcich s dátami a AI.

Kvíz pred prednáškou 🎯

Základné definície

Začnime pochopením základnej terminológie.

Slovo "etika" pochádza z gréckeho slova "ethikos" (a jeho koreňa "ethos"), čo znamená charakter alebo morálna povaha.

Etika sa týka spoločných hodnôt a morálnych princípov, ktoré riadia naše správanie v spoločnosti. Etika nie je založená na zákonoch, ale na všeobecne akceptovaných normách toho, čo je "správne vs. nesprávne". Etické úvahy však môžu ovplyvniť iniciatívy korporátneho riadenia a vládne regulácie, ktoré vytvárajú viac stimulov na dodržiavanie pravidiel.

Dátová etika je nová oblasť etiky, ktorá "študuje a hodnotí morálne problémy súvisiace s dátami, algoritmami a zodpovedajúcimi praktikami". Tu sa "dáta" zameriavajú na akcie súvisiace s generovaním, zaznamenávaním, kuráciou, spracovaním, šírením, zdieľaním a používaním, "algoritmy" sa zameriavajú na AI, agentov, strojové učenie a roboty, a "praktiky" sa zameriavajú na témy ako zodpovedná inovácia, programovanie, hacking a etické kódy.

Aplikovaná etika je praktická aplikácia morálnych úvah. Ide o proces aktívneho skúmania etických otázok v kontexte reálnych akcií, produktov a procesov a prijímania nápravných opatrení na zabezpečenie toho, že zostanú v súlade s našimi definovanými etickými hodnotami.

Kultúra etiky sa týka operacionalizácie aplikovanej etiky, aby sa zabezpečilo, že naše etické princípy a praktiky budú prijaté konzistentne a škálovateľne naprieč celou organizáciou. Úspešné kultúry etiky definujú etické princípy na úrovni celej organizácie, poskytujú zmysluplné stimuly na dodržiavanie pravidiel a posilňujú normy etiky podporovaním a amplifikáciou požadovaného správania na každej úrovni organizácie.

Koncepty etiky

V tejto sekcii sa budeme zaoberať konceptmi ako spoločné hodnoty (princípy) a etické výzvy (problémy) v dátovej etike - a preskúmame prípadové štúdie, ktoré vám pomôžu pochopiť tieto koncepty v reálnych kontextoch.

1. Princípy etiky

Každá stratégia dátovej etiky začína definovaním etických princípov - "spoločných hodnôt", ktoré opisujú prijateľné správanie a usmerňujú súladné akcie v našich dátových a AI projektoch. Môžete ich definovať na individuálnej alebo tímovej úrovni. Väčšina veľkých organizácií však tieto princípy uvádza v misijnom vyhlásení alebo rámci etickej AI, ktorý je definovaný na korporátnej úrovni a dôsledne presadzovaný naprieč všetkými tímami.

Príklad: Misijné vyhlásenie Microsoftu Zodpovedná AI znie: "Sme odhodlaní k pokroku AI riadenému etickými princípmi, ktoré kladú ľudí na prvé miesto" - identifikujúc 6 etických princípov v rámci nižšie:

Zodpovedná AI v Microsoft

Poďme si stručne preskúmať tieto princípy. Transparentnosť a zodpovednosť sú základné hodnoty, na ktorých sú postavené ostatné princípy - začnime teda nimi:

  • Zodpovednosť robí praktikov zodpovednými za ich dátové a AI operácie a súlad s týmito etickými princípmi.
  • Transparentnosť zabezpečuje, že akcie dát a AI sú pochopiteľné (interpretovateľné) pre používateľov, vysvetľujúc čo a prečo za rozhodnutiami.
  • Spravodlivosť - zameriava sa na zabezpečenie, že AI zaobchádza so všetkými ľuďmi spravodlivo, riešiac akékoľvek systémové alebo implicitné sociálno-technické predsudky v dátach a systémoch.
  • Spoľahlivosť a bezpečnosť - zabezpečuje, že AI sa správa konzistentne s definovanými hodnotami, minimalizujúc potenciálne škody alebo neúmyselné dôsledky.
  • Súkromie a bezpečnosť - ide o pochopenie pôvodu dát a poskytovanie ochrany súkromia a súvisiacich práv používateľom.
  • Inkluzívnosť - ide o navrhovanie AI riešení s úmyslom, prispôsobujúc ich na splnenie širokého spektra ľudských potrieb a schopností.

🚨 Zamyslite sa nad tým, aké by mohlo byť vaše misijné vyhlásenie dátovej etiky. Preskúmajte rámce etickej AI od iných organizácií - tu sú príklady od IBM, Google a Facebook. Aké spoločné hodnoty majú? Ako sa tieto princípy vzťahujú na AI produkt alebo odvetvie, v ktorom pôsobia?

2. Výzvy etiky

Keď máme definované etické princípy, ďalším krokom je vyhodnotenie našich dátových a AI akcií, aby sme zistili, či sú v súlade s týmito spoločnými hodnotami. Zamyslite sa nad svojimi akciami v dvoch kategóriách: zber dát a návrh algoritmov.

Pri zbere dát budú akcie pravdepodobne zahŕňať osobné údaje alebo osobne identifikovateľné informácie (PII) pre identifikovateľné živé osoby. To zahŕňa rôzne položky neosobných údajov, ktoré spoločne identifikujú jednotlivca. Etické výzvy sa môžu týkať ochrany súkromia, vlastníctva dát a súvisiacich tém ako informovaný súhlas a práva duševného vlastníctva pre používateľov.

Pri návrhu algoritmov budú akcie zahŕňať zber a kuráciu datasetov, potom ich použitie na trénovanie a nasadenie dátových modelov, ktoré predpovedajú výsledky alebo automatizujú rozhodnutia v reálnych kontextoch. Etické výzvy môžu vzniknúť z predsudkov v datasetoch, problémov s kvalitou dát, nespravodlivosti a nesprávneho zastúpenia v algoritmoch - vrátane niektorých problémov, ktoré sú systémové.

V oboch prípadoch etické výzvy poukazujú na oblasti, kde naše akcie môžu naraziť na konflikt s našimi spoločnými hodnotami. Na ich detekciu, zmiernenie, minimalizáciu alebo elimináciu musíme klásť morálne "áno/nie" otázky týkajúce sa našich akcií a následne prijať nápravné opatrenia podľa potreby. Pozrime sa na niektoré etické výzvy a morálne otázky, ktoré vyvolávajú:

2.1 Vlastníctvo dát

Zber dát často zahŕňa osobné údaje, ktoré môžu identifikovať subjekty dát. Vlastníctvo dát sa týka kontroly a práv používateľov súvisiacich s vytváraním, spracovaním a šírením dát.

Morálne otázky, ktoré musíme klásť, sú:

  • Kto vlastní dáta? (používateľ alebo organizácia)
  • Aké práva majú subjekty dát? (napr. prístup, vymazanie, prenosnosť)
  • Aké práva majú organizácie? (napr. oprava škodlivých používateľských recenzií)

2.2 Informovaný súhlas

Informovaný súhlas definuje akt, keď používateľ súhlasí s akciou (napr. zber dát) s plným pochopením relevantných faktov vrátane účelu, potenciálnych rizík a alternatív.

Otázky na preskúmanie:

  • Dal používateľ (subjekt dát) povolenie na zber a použitie dát?
  • Pochopil používateľ účel, na ktorý boli dáta zhromaždené?
  • Pochopil používateľ potenciálne riziká z ich účasti?

2.3 Duševné vlastníctvo

Duševné vlastníctvo sa týka nehmotných výtvorov vyplývajúcich z ľudskej iniciatívy, ktoré môžu mať ekonomickú hodnotu pre jednotlivcov alebo podniky.

Otázky na preskúmanie:

  • Mali zhromaždené dáta ekonomickú hodnotu pre používateľa alebo podnik?
  • používateľ duševné vlastníctvo v tomto prípade?
  • organizácia duševné vlastníctvo v tomto prípade?
  • Ak tieto práva existujú, ako ich chránime?

2.4 Ochrana súkromia dát

Ochrana súkromia dát alebo informačné súkromie sa týka zachovania súkromia používateľov a ochrany identity používateľov vo vzťahu k osobne identifikovateľným informáciám.

Otázky na preskúmanie:

  • Sú osobné údaje používateľov zabezpečené proti útokom a únikom?
  • Sú údaje používateľov prístupné iba autorizovaným používateľom a kontextom?
  • Je anonymita používateľov zachovaná pri zdieľaní alebo šírení dát?
  • Môže byť používateľ de-identifikovaný z anonymizovaných datasetov?

2.5 Právo byť zabudnutý

Právo byť zabudnutý alebo Právo na vymazanie poskytuje používateľom dodatočnú ochranu osobných údajov. Konkrétne dáva používateľom právo požiadať o vymazanie alebo odstránenie osobných údajov z internetových vyhľadávaní a iných miest, za určitých okolností - umožňujúc im nový začiatok online bez toho, aby ich minulé akcie boli proti nim použité.

Otázky na preskúmanie:

  • Umožňuje systém subjektom dát požiadať o vymazanie?
  • Mal by odvolanie súhlasu používateľa automaticky spustiť vymazanie?
  • Boli dáta zhromaždené bez súhlasu alebo nezákonnými prostriedkami?
  • Sme v súlade s vládnymi reguláciami na ochranu súkromia dát?

2.6 Predsudky v datasetoch

Predsudky v datasetoch alebo Predsudky pri zbere dát sa týkajú výberu nereprezentatívnej podmnožiny dát na vývoj algoritmov, čo môže vytvárať potenciálnu nespravodlivosť vo výsledkoch pre rôzne skupiny. Typy predsudkov zahŕňajú výberové alebo vzorkové predsudky, dobrovoľnícke predsudky a nástrojové predsudky.

Otázky na preskúmanie:

  • Rekrutovali sme reprezentatívnu skupinu subjektov dát?
  • Testovali sme náš zhromaždený alebo kurátovaný dataset na rôzne predsudky?
  • Môžeme zmierniť alebo odstrániť objavené predsudky?

2.7 Kval

Algorithm Fairness skúma, či návrh algoritmu systematicky nediskriminuje konkrétne podskupiny subjektov údajov, čo vedie k potenciálnym škodám v alokácii (kde sú zdroje odmietnuté alebo zadržané tejto skupine) a kvalite služieb (kde AI nie je tak presná pre niektoré podskupiny ako pre iné).

Otázky na preskúmanie:

  • Vyhodnotili sme presnosť modelu pre rôzne podskupiny a podmienky?
  • Preskúmali sme systém kvôli potenciálnym škodám (napr. stereotypizácia)?
  • Môžeme upraviť údaje alebo preškoliť modely na zmiernenie identifikovaných škôd?

Preskúmajte zdroje ako AI Fairness checklists pre viac informácií.

2.9 Skreslenie údajov

Skreslenie údajov sa týka otázky, či komunikujeme poznatky z čestne hlásených údajov zavádzajúcim spôsobom na podporu požadovaného naratívu.

Otázky na preskúmanie:

  • Hlásime neúplné alebo nepresné údaje?
  • Vizualizujeme údaje spôsobom, ktorý vedie k zavádzajúcim záverom?
  • Používame selektívne štatistické techniky na manipuláciu výsledkov?
  • Existujú alternatívne vysvetlenia, ktoré môžu ponúknuť iný záver?

2.10 Ilúzia voľby

Ilúzia voľby nastáva, keď "architektúry voľby" systému používajú algoritmy rozhodovania na ovplyvnenie ľudí, aby prijali preferovaný výsledok, pričom im dávajú pocit možností a kontroly. Tieto temné vzory môžu spôsobiť sociálne a ekonomické škody používateľom. Keďže rozhodnutia používateľov ovplyvňujú profily správania, tieto akcie môžu potenciálne poháňať budúce voľby, ktoré môžu zosilniť alebo rozšíriť dopad týchto škôd.

Otázky na preskúmanie:

  • Rozumel používateľ dôsledkom prijatia tejto voľby?
  • Bol používateľ informovaný o (alternatívnych) možnostiach a výhodách a nevýhodách každej z nich?
  • Môže používateľ neskôr zvrátiť automatizovanú alebo ovplyvnenú voľbu?

3. Prípadové štúdie

Aby sme tieto etické výzvy zasadili do kontextu reálneho sveta, je užitočné pozrieť sa na prípadové štúdie, ktoré zdôrazňujú potenciálne škody a dôsledky pre jednotlivcov a spoločnosť, keď sa takéto etické porušenia prehliadajú.

Tu je niekoľko príkladov:

Etická výzva Prípadová štúdia
Informovaný súhlas 1972 - Tuskegee Syphilis Study - Afroamerickým mužom, ktorí sa zúčastnili štúdie, bola sľúbená bezplatná lekárska starostlivosť, ale boli oklamaní výskumníkmi, ktorí im neoznámili diagnózu ani dostupnosť liečby. Mnohí účastníci zomreli a ich partneri či deti boli ovplyvnení; štúdia trvala 40 rokov.
Ochrana údajov 2007 - Netflix data prize poskytla výskumníkom 10M anonymizovaných hodnotení filmov od 50K zákazníkov na zlepšenie odporúčacích algoritmov. Výskumníci však dokázali prepojiť anonymizované údaje s osobne identifikovateľnými údajmi v externých datasetoch (napr. komentáre na IMDb), čím efektívne "de-anonymizovali" niektorých predplatiteľov Netflixu.
Zber dát s predsudkami 2013 - Mesto Boston vyvinulo Street Bump, aplikáciu, ktorá umožnila občanom hlásiť výtlky, čím mesto získalo lepšie údaje o cestách na identifikáciu a opravu problémov. Avšak ľudia z nižších príjmových skupín mali menší prístup k autám a telefónom, čo spôsobilo, že ich problémy s cestami boli v aplikácii neviditeľné. Vývojári spolupracovali s akademikmi na riešení problémov rovnakého prístupu a digitálnych rozdielov pre spravodlivosť.
Spravodlivosť algoritmov 2018 - MIT Gender Shades Study hodnotila presnosť AI produktov na klasifikáciu pohlavia, pričom odhalila medzery v presnosti pre ženy a osoby tmavej pleti. Apple Card z roku 2019 sa zdala ponúkať menej úveru ženám ako mužom. Obe ukázali problémy s predsudkami v algoritmoch vedúce k socio-ekonomickým škodám.
Skreslenie údajov 2020 - Ministerstvo zdravotníctva Georgie zverejnilo COVID-19 grafy, ktoré sa zdali zavádzať občanov o trendoch potvrdených prípadov s nechronologickým usporiadaním na osi x. Toto ilustruje skreslenie prostredníctvom vizualizačných trikov.
Ilúzia voľby 2020 - Vzdelávacia aplikácia ABCmouse zaplatila $10M na urovnanie sťažnosti FTC, kde boli rodičia uväznení v platení za predplatné, ktoré nemohli zrušiť. Toto ilustruje temné vzory v architektúrach voľby, kde boli používatelia ovplyvnení k potenciálne škodlivým rozhodnutiam.
Ochrana údajov a práva používateľov 2021 - Facebook Únik údajov odhalil údaje 530M používateľov, čo viedlo k urovnaniu vo výške $5B s FTC. Napriek tomu odmietol informovať používateľov o úniku, čím porušil práva používateľov na transparentnosť a prístup k údajom.

Chcete preskúmať viac prípadových štúdií? Pozrite si tieto zdroje:

🚨 Zamyslite sa nad prípadovými štúdiami, ktoré ste videli - zažili ste alebo boli ovplyvnení podobnou etickou výzvou vo svojom živote? Dokážete si spomenúť na aspoň jednu ďalšiu prípadovú štúdiu, ktorá ilustruje jednu z etických výziev, o ktorých sme diskutovali v tejto sekcii?

Aplikovaná etika

Hovorili sme o etických konceptoch, výzvach a prípadových štúdiách v kontexte reálneho sveta. Ale ako začať uplatňovať etické princípy a praktiky vo svojich projektoch? A ako operacionalizovať tieto praktiky pre lepšie riadenie? Poďme preskúmať niektoré riešenia z praxe:

1. Profesionálne kódexy

Profesionálne kódexy ponúkajú jednu možnosť pre organizácie, ako "motivovať" členov k podpore ich etických princípov a misijného vyhlásenia. Kódexy sú morálne usmernenia pre profesionálne správanie, ktoré pomáhajú zamestnancom alebo členom robiť rozhodnutia v súlade s princípmi organizácie. Sú však účinné len do miery dobrovoľného dodržiavania členmi; mnohé organizácie však ponúkajú dodatočné odmeny a sankcie na motiváciu dodržiavania.

Príklady zahŕňajú:

🚨 Patríte do profesionálnej organizácie pre inžinierov alebo dátových vedcov? Preskúmajte ich webovú stránku, či definujú profesionálny etický kódex. Čo to hovorí o ich etických princípoch? Ako motivujú členov k dodržiavaniu kódexu?

2. Etické kontrolné zoznamy

Zatiaľ čo profesionálne kódexy definujú požadované etické správanie od odborníkov, majú známe obmedzenia pri presadzovaní, najmä vo veľkých projektoch. Namiesto toho mnohí odborníci na dátovú vedu odporúčajú kontrolné zoznamy, ktoré môžu prepojiť princípy s praxou deterministickým a akčným spôsobom.

Kontrolné zoznamy prevádzajú otázky na úlohy "áno/nie", ktoré môžu byť operacionalizované, čo umožňuje ich sledovanie ako súčasť štandardných pracovných postupov pri vydávaní produktov.

Príklady zahŕňajú:

3. Etické regulácie

Etika je o definovaní spoločných hodnôt a dobrovoľnom konaní správne. Dodržiavanie predpisov je o dodržiavaní zákona, ak je definovaný. Riadenie zahŕňa všetky spôsoby, ktorými organizácie presadzujú etické princípy a dodržiavajú stanovené zákony.

Dnes má riadenie dve formy v rámci organizácií. Po prvé, ide o definovanie princípov etickej AI a zavedenie praktík na operacionalizáciu prijatia vo všetkých projektoch súvisiacich s AI v organizácii. Po druhé, ide o dodržiavanie všetkých vládou stanovených regulácií ochrany údajov pre regióny, v ktorých organizácia pôsobí.

Príklady regulácií ochrany údajov a súkromia:

🚨 Európska únia definovala GDPR (General Data Protection Regulation), ktorý zostáva jedným z najvplyvnejších regulácií ochrany údajov dnes. Vedeli ste, že tiež definuje 8 práv používateľov na ochranu digitálneho súkromia a osobných údajov občanov? Zistite, čo to sú a prečo sú dôležité.

4. Kultúra etiky

Treba si uvedomiť, že stále existuje nehmotná medzera medzi dodržiavaním predpisov (urobením dostatočného na splnenie "litery zákona") a riešením systémových problémov (ako je zakorenenie, informačná asymetria a distribučná nespravodlivosť), ktoré môžu urýchliť zneužitie AI.

Riešenie týchto problémov si vyžaduje spoluprácu pri definovaní kultúr etiky, ktoré budujú emocionálne spojenia a konzistentné spoločné hodnoty naprieč organizáciami v priemysle. To si vyžaduje viac formalizovaných kultúr etiky dát v organizáciách - umožňujúc komukoľvek zatiahnuť Andon šnúru (na včasné upozornenie na etické problémy) a robiť etické hodnotenia (napr. pri nábore) ako základné kritérium pri formovaní tímov v AI projektoch.


Kvíz po prednáške 🎯

Prehľad a samoštúdium

Kurzy a knihy pomáhajú pochopiť základné etické koncepty a výzvy, zatiaľ čo prípadové štúdie a nástroje pomá

Zadanie

Napíšte prípadovú štúdiu o etike dát


Upozornenie:
Tento dokument bol preložený pomocou služby AI prekladu Co-op Translator. Hoci sa snažíme o presnosť, prosím, berte na vedomie, že automatizované preklady môžu obsahovať chyby alebo nepresnosti. Pôvodný dokument v jeho rodnom jazyku by mal byť považovaný za autoritatívny zdroj. Pre kritické informácie sa odporúča profesionálny ľudský preklad. Nie sme zodpovední za akékoľvek nedorozumenia alebo nesprávne interpretácie vyplývajúce z použitia tohto prekladu.