You can not select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.
Data-Science-For-Beginners/translations/sk/1-Introduction/02-ethics
localizeflow[bot] 188a326676
chore(i18n): sync translations with latest source changes (chunk 1/1, 213 changes)
1 month ago
..
README.md chore(i18n): sync translations with latest source changes (chunk 1/1, 213 changes) 1 month ago
assignment.md chore(i18n): sync translations with latest source changes (chunk 1/1, 213 changes) 1 month ago

README.md

Úvod do dátovej etiky

 Sketchnote od (@sketchthedocs)
Etika dátovej vedy - Sketchnote od @nitya

Všetci sme občanmi dátového sveta, v ktorom žijeme.

Trhové trendy naznačujú, že do roku 2022 bude 1 z 3 veľkých organizácií kupovať a predávať svoje dáta prostredníctvom online trhovísk a výmenných platforiem. Ako vývojári aplikácií budeme mať jednoduchší a lacnejší prístup k integrácii dátových poznatkov a automatizácie založenej na algoritmoch do každodenných používateľských skúseností. Avšak s rozšírením AI budeme musieť pochopiť aj potenciálne škody spôsobené zbraňovaním takýchto algoritmov vo veľkom rozsahu.

Trendy naznačujú, že do roku 2025 budeme generovať a spotrebovávať viac ako 180 zettabajtov dát. Pre dátových vedcov tento výbuch informácií poskytuje bezprecedentný prístup k osobným a behaviorálnym dátam. S tým prichádza moc vytvárať podrobné používateľské profily a jemne ovplyvňovať rozhodovanie často spôsobom, ktorý podporuje ilúziu voľby. Hoci to môže byť použité na usmernenie používateľov k preferovaným výsledkom, zároveň to vyvoláva zásadné otázky o ochrane dát, autonómii a etických hraniciach algoritmického vplyvu.

Dátová etika je teraz nevyhnutným ochranným rámcom pre dátovú vedu a inžinierstvo, ktorý nám pomáha minimalizovať potenciálne škody a neúmyselné dôsledky našich dátovo riadených akcií. Gartnerov Hype Cycle pre AI identifikuje relevantné trendy v digitálnej etike, zodpovednej AI a správe AI ako kľúčové faktory pre väčšie megatrendy okolo demokratizácie a industrializácie AI.

Gartnerov Hype Cycle pre AI - 2020

V tejto lekcii preskúmame fascinujúcu oblasť dátovej etiky od základných konceptov a výziev, cez prípadové štúdie až po aplikované koncepty AI, ako je správa ktoré pomáhajú vytvárať kultúru etiky v tímoch a organizáciách pracujúcich s dátami a AI.

Kvíz pred prednáškou 🎯

Základné definície

Začnime pochopením základnej terminológie.

Slovo "etika" pochádza z gréckeho slova "ethikos" (a jeho koreňa "ethos"), čo znamená charakter alebo morálna povaha.

Etika sa týka spoločných hodnôt a morálnych princípov, ktoré riadia naše správanie v spoločnosti. Etika nie je založená na zákonoch, ale na všeobecne prijatých normách toho, čo je "správne vs. nesprávne". Avšak etické úvahy môžu ovplyvniť iniciatívy korporátnej správy a vládne regulácie, ktoré vytvárajú viac stimulov na dodržiavanie pravidiel.

Dátová etika je nová vetva etiky, ktorá "študuje a hodnotí morálne problémy súvisiace s dátami, algoritmami a zodpovedajúcimi praktikami". Tu sa "dáta" zameriavajú na akcie súvisiace s generovaním, zaznamenávaním, kuráciou, spracovaním, šírením, zdieľaním a používaním, "algoritmy" sa zameriavajú na AI, agentov, strojové učenie a roboty, a "praktiky" sa zameriavajú na témy ako zodpovedná inovácia, programovanie, hacking a etické kódy.

Aplikovaná etika je praktická aplikácia morálnych úvah. Ide o proces aktívneho skúmania etických otázok v kontexte reálnych akcií, produktov a procesov a prijímania nápravných opatrení na zabezpečenie toho, aby zostali v súlade s našimi definovanými etickými hodnotami.

Kultúra etiky sa týka operacionalizácie aplikovanej etiky, aby sa zabezpečilo, že naše etické princípy a praktiky sú prijaté konzistentne a škálovateľne v celej organizácii. Úspešné kultúry etiky definujú celopodnikové etické princípy, poskytujú zmysluplné stimuly na dodržiavanie pravidiel a posilňujú normy etiky podporovaním a amplifikáciou požadovaného správania na každej úrovni organizácie.

Koncepty etiky

V tejto sekcii sa budeme zaoberať konceptmi ako spoločné hodnoty (princípy) a etické výzvy (problémy) pre dátovú etiku a preskúmame prípadové štúdie, ktoré vám pomôžu pochopiť tieto koncepty v reálnych kontextoch.

1. Princípy etiky

Každá stratégia dátovej etiky začína definovaním etických princípov "spoločných hodnôt", ktoré opisujú prijateľné správanie a usmerňujú súladné akcie v našich dátových a AI projektoch. Môžete ich definovať na individuálnej alebo tímovej úrovni. Avšak väčšina veľkých organizácií ich uvádza v etickom AI vyhlásení alebo rámci, ktorý je definovaný na korporátnej úrovni a dôsledne presadzovaný vo všetkých tímoch.

Príklad: Vyhlásenie Microsoftu o zodpovednej AI znie: "Sme odhodlaní k pokroku AI riadenému etickými princípmi, ktoré kladú ľudí na prvé miesto" identifikujúc 6 etických princípov v rámci nižšie:

Zodpovedná AI v Microsoft

Poďme si stručne preskúmať tieto princípy. Transparentnosť a zodpovednosť sú základné hodnoty, na ktorých sú postavené ostatné princípy začnime teda nimi:

  • Zodpovednosť robí praktikov zodpovednými za ich dátové a AI operácie a súlad s týmito etickými princípmi.
  • Transparentnosť zabezpečuje, že dátové a AI akcie sú pochopiteľné (interpretovateľné) pre používateľov, vysvetľujúc čo a prečo za rozhodnutiami.
  • Spravodlivosť zameriava sa na zabezpečenie, že AI zaobchádza so všetkými ľuďmi spravodlivo, riešiac akékoľvek systémové alebo implicitné sociálno-technické predsudky v dátach a systémoch.
  • Spoľahlivosť a bezpečnosť zabezpečuje, že AI sa správa konzistentne s definovanými hodnotami, minimalizujúc potenciálne škody alebo neúmyselné dôsledky.
  • Ochrana súkromia a bezpečnosť ide o pochopenie pôvodu dát a poskytovanie ochrany súkromia a súvisiacich opatrení používateľom.
  • Inkluzívnosť ide o navrhovanie AI riešení s úmyslom, prispôsobujúc ich na splnenie širokého spektra ľudských potrieb a schopností.

🚨 Zamyslite sa nad tým, aké by mohlo byť vaše vyhlásenie o dátovej etike. Preskúmajte etické AI rámce od iných organizácií tu sú príklady od IBM, Google a Facebook. Aké spoločné hodnoty majú? Ako sa tieto princípy vzťahujú na AI produkt alebo odvetvie, v ktorom pôsobia?

2. Výzvy etiky

Keď máme definované etické princípy, ďalším krokom je vyhodnotenie našich dátových a AI akcií, aby sme zistili, či sú v súlade s týmito spoločnými hodnotami. Zamyslite sa nad svojimi akciami v dvoch kategóriách: zber dát a návrh algoritmov.

Pri zbere dát budú akcie pravdepodobne zahŕňať osobné údaje alebo osobne identifikovateľné informácie (PII) pre identifikovateľné živé osoby. To zahŕňa rôzne položky neosobných údajov, ktoré spoločne identifikujú jednotlivca. Etické výzvy sa môžu týkať ochrany dát, vlastníctva dát a súvisiacich tém ako informovaný súhlas a práva duševného vlastníctva pre používateľov.

Pri návrhu algoritmov budú akcie zahŕňať zber a kuráciu datasetov, potom ich použitie na trénovanie a nasadenie dátových modelov, ktoré predpovedajú výsledky alebo automatizujú rozhodnutia v reálnych kontextoch. Etické výzvy môžu vzniknúť z predsudkov v datasetoch, problémov s kvalitou dát, nespravodlivosti a skreslenia v algoritmoch vrátane niektorých problémov, ktoré sú systémové.

V oboch prípadoch etické výzvy poukazujú na oblasti, kde naše akcie môžu naraziť na konflikt s našimi spoločnými hodnotami. Na detekciu, zmiernenie, minimalizáciu alebo elimináciu týchto obáv musíme klásť morálne "áno/nie" otázky týkajúce sa našich akcií a následne prijať nápravné opatrenia podľa potreby. Pozrime sa na niektoré etické výzvy a morálne otázky, ktoré vyvolávajú:

2.1 Vlastníctvo dát

Zber dát často zahŕňa osobné údaje, ktoré môžu identifikovať subjekty dát. Vlastníctvo dát sa týka kontroly a práv používateľov súvisiacich s vytváraním, spracovaním a šírením dát.

Morálne otázky, ktoré musíme klásť, sú:

  • Kto vlastní dáta? (používateľ alebo organizácia)
  • Aké práva majú subjekty dát? (napr. prístup, vymazanie, prenosnosť)
  • Aké práva majú organizácie? (napr. oprava škodlivých používateľských recenzií)

2.2 Informovaný súhlas

Informovaný súhlas definuje akt používateľov, ktorí súhlasia s akciou (ako je zber dát) s plným pochopením relevantných faktov vrátane účelu, potenciálnych rizík a alternatív.

Otázky na preskúmanie tu sú:

  • Dal používateľ (subjekt dát) povolenie na zber a používanie dát?
  • Pochopil používateľ účel, na ktorý boli dáta zhromaždené?
  • Pochopil používateľ potenciálne riziká z ich účasti?

2.3 Duševné vlastníctvo

Duševné vlastníctvo sa týka nehmotných výtvorov vyplývajúcich z ľudskej iniciatívy, ktoré môžu mať ekonomickú hodnotu pre jednotlivcov alebo podniky.

Otázky na preskúmanie tu sú:

  • Mali zhromaždené dáta ekonomickú hodnotu pre používateľa alebo podnik?
  • používateľ duševné vlastníctvo v tomto prípade?
  • organizácia duševné vlastníctvo v tomto prípade?
  • Ak tieto práva existujú, ako ich chránime?

2.4 Ochrana dát

Ochrana dát alebo ochrana informácií sa týka zachovania súkromia používateľov a ochrany identity používateľov vo vzťahu k osobne identifikovateľným informáciám.

Otázky na preskúmanie tu sú:

  • Sú osobné údaje používateľov zabezpečené proti hackom a únikom?
  • Sú údaje používateľov prístupné iba autorizovaným používateľom a kontextom?
  • Je anonymita používateľov zachovaná pri zdieľaní alebo šírení dát?
  • Môže byť používateľ de-identifikovaný z anonymizovaných datasetov?

2.5 Právo byť zabudnutý

Právo byť zabudnutý alebo Právo na vymazanie poskytuje používateľom dodatočnú ochranu osobných údajov. Konkrétne dáva používateľom právo požiadať o vymazanie alebo odstránenie osobných údajov z internetových vyhľadávaní a iných miest, za špecifických okolností umožňujúc im nový začiatok online bez toho, aby ich minulé akcie boli proti nim použité.

Otázky na preskúmanie tu sú:

  • Umožňuje systém subjektom dát požiadať o vymazanie?
  • Mal by odvolanie súhlasu používateľa spustiť automatické vymazanie?
  • Boli dáta zhromaždené bez súhlasu alebo nezákonnými prostriedkami?
  • Sme v súlade s vládnymi reguláciami na ochranu dát?

2.6 Predsudky v datasetoch

Dataset alebo predsudky pri zbere sa týkajú výberu nereprezentatívnej podmnožiny dát na vývoj algoritmov, čo vytvára potenciálnu nespravodlivosť vo výsledkoch pre rôzne skupiny. Typy predsudkov zahŕňajú výberové alebo vzorkové predsudky, dobrovoľnícke predsudky a nástrojové predsudky.

Otázky na preskúmanie tu sú:

  • Rekrutovali sme reprezentatívnu skupinu subjektov dát?
  • Testovali sme náš zhromaždený alebo kurátorský dataset na rôzne predsudky?
  • Môžeme zmierniť alebo odstrániť akékoľvek zistené predsudky
  • Je informácia zachytená presne tak, aby odrážala realitu?

2.8 Spravodlivosť algoritmov

Spravodlivosť algoritmov skúma, či návrh algoritmu systematicky nediskriminuje konkrétne podskupiny subjektov údajov, čo môže viesť k potenciálnym škodám v alokácii (keď sú zdroje odmietnuté alebo zadržiavané tejto skupine) a kvalite služieb (keď AI nie je tak presná pre niektoré podskupiny ako pre iné).

Otázky na preskúmanie:

  • Hodnotili sme presnosť modelu pre rôzne podskupiny a podmienky?
  • Skúmali sme systém kvôli potenciálnym škodám (napr. stereotypizácia)?
  • Môžeme upraviť údaje alebo preškoliť modely na zmiernenie identifikovaných škôd?

Preskúmajte zdroje ako kontrolné zoznamy spravodlivosti AI, aby ste sa dozvedeli viac.

2.9 Nesprávne zobrazenie údajov

Nesprávne zobrazenie údajov sa zaoberá otázkou, či komunikujeme poznatky z čestne hlásených údajov zavádzajúcim spôsobom na podporu požadovaného naratívu.

Otázky na preskúmanie:

  • Hlásime neúplné alebo nepresné údaje?
  • Vizualizujeme údaje spôsobom, ktorý vedie k zavádzajúcim záverom?
  • Používame selektívne štatistické techniky na manipuláciu s výsledkami?
  • Existujú alternatívne vysvetlenia, ktoré môžu ponúknuť iný záver?

2.10 Slobodná voľba

Ilúzia slobodnej voľby nastáva, keď systémy "architektúry voľby" používajú algoritmy rozhodovania na ovplyvnenie ľudí, aby prijali preferovaný výsledok, pričom im dávajú pocit, že majú možnosti a kontrolu. Tieto temné vzory môžu spôsobiť sociálne a ekonomické škody používateľom. Keďže rozhodnutia používateľov ovplyvňujú profily správania, tieto akcie potenciálne ovplyvňujú budúce voľby, ktoré môžu zosilniť alebo rozšíriť dopad týchto škôd.

Otázky na preskúmanie:

  • Rozumel používateľ dôsledkom prijatia tejto voľby?
  • Bol používateľ informovaný o (alternatívnych) možnostiach a výhodách a nevýhodách každej z nich?
  • Môže používateľ neskôr zvrátiť automatizovanú alebo ovplyvnenú voľbu?

3. Prípadové štúdie

Aby sme tieto etické výzvy zasadili do kontextu reálneho sveta, je užitočné pozrieť sa na prípadové štúdie, ktoré poukazujú na potenciálne škody a dôsledky pre jednotlivcov a spoločnosť, keď sa takéto etické porušenia prehliadajú.

Tu je niekoľko príkladov:

Etická výzva Prípadová štúdia
Informovaný súhlas 1972 - Štúdia o syfilise v Tuskegee - Afroamerickým mužom, ktorí sa zúčastnili štúdie, bola sľúbená bezplatná lekárska starostlivosť, ale boli oklamaní výskumníkmi, ktorí im neoznámili ich diagnózu ani dostupnosť liečby. Mnohí účastníci zomreli a ich partneri alebo deti boli ovplyvnení; štúdia trvala 40 rokov.
Ochrana údajov 2007 - Netflix data prize poskytla výskumníkom 10 miliónov anonymizovaných hodnotení filmov od 50 tisíc zákazníkov, aby pomohla zlepšiť algoritmy odporúčania. Výskumníci však dokázali prepojiť anonymizované údaje s osobne identifikovateľnými údajmi v externých datasetoch (napr. komentáre na IMDb), čím efektívne "de-anonymizovali" niektorých predplatiteľov Netflixu.
Zberová zaujatosť 2013 - Mesto Boston vyvinulo Street Bump, aplikáciu, ktorá umožnila občanom nahlasovať výtlky, čím mesto získalo lepšie údaje o cestách na identifikáciu a opravu problémov. Avšak ľudia s nižšími príjmami mali menší prístup k autám a telefónom, čo spôsobilo, že ich problémy s cestami boli v aplikácii neviditeľné. Vývojári spolupracovali s akademikmi na riešení otázok rovnakého prístupu a digitálnych rozdielov pre spravodlivosť.
Spravodlivosť algoritmov 2018 - MIT Gender Shades Study hodnotila presnosť AI produktov na klasifikáciu pohlavia, pričom odhalila medzery v presnosti pre ženy a osoby tmavej pleti. Apple Card z roku 2019 sa zdala ponúkať menej úveru ženám ako mužom. Obe ukázali problémy s algoritmickou zaujatosťou vedúcou k socio-ekonomickým škodám.
Nesprávne zobrazenie údajov 2020 - Ministerstvo zdravotníctva Georgie zverejnilo grafy COVID-19, ktoré sa zdali zavádzať občanov o trendoch potvrdených prípadov s nechronologickým usporiadaním na osi x. Toto ilustruje nesprávne zobrazenie prostredníctvom vizualizačných trikov.
Ilúzia slobodnej voľby 2020 - Vzdelávacia aplikácia ABCmouse zaplatila 10 miliónov dolárov na urovnanie sťažnosti FTC, kde boli rodičia uväznení v platení za predplatné, ktoré nemohli zrušiť. Toto ilustruje temné vzory v architektúre voľby, kde boli používatelia ovplyvnení k potenciálne škodlivým rozhodnutiam.
Ochrana údajov a práva používateľov 2021 - Facebook Únik údajov odhalil údaje 530 miliónov používateľov, čo viedlo k pokute 5 miliárd dolárov od FTC. Napriek tomu odmietol informovať používateľov o úniku, čím porušil práva používateľov na transparentnosť a prístup k údajom.

Chcete preskúmať viac prípadových štúdií? Pozrite si tieto zdroje:

🚨 Zamyslite sa nad prípadovými štúdiami, ktoré ste videli - zažili ste alebo boli ovplyvnení podobnou etickou výzvou vo svojom živote? Dokážete si predstaviť aspoň jednu ďalšiu prípadovú štúdiu, ktorá ilustruje jednu z etických výziev, o ktorých sme diskutovali v tejto sekcii?

Aplikovaná etika

Hovorili sme o etických konceptoch, výzvach a prípadových štúdiách v kontexte reálneho sveta. Ale ako začať uplatňovať etické princípy a praktiky vo svojich projektoch? A ako zaviesť tieto praktiky pre lepšie riadenie? Preskúmajme niektoré reálne riešenia:

1. Profesionálne kódexy

Profesijné kódexy ponúkajú jednu možnosť pre organizácie, ako "motivovať" členov k podpore ich etických princípov a poslania. Kódexy sú morálne smernice pre profesionálne správanie, ktoré pomáhajú zamestnancom alebo členom robiť rozhodnutia v súlade s princípmi ich organizácie. Sú však účinné len do miery, do akej ich členovia dobrovoľne dodržiavajú; mnohé organizácie však ponúkajú dodatočné odmeny a sankcie na motiváciu členov k dodržiavaniu.

Príklady zahŕňajú:

🚨 Patríte do profesionálnej organizácie pre inžinierstvo alebo dátovú vedu? Preskúmajte ich webovú stránku, aby ste zistili, či definujú profesionálny etický kódex. Čo to hovorí o ich etických princípoch? Ako motivujú členov k dodržiavaniu kódexu?

2. Etické kontrolné zoznamy

Zatiaľ čo profesionálne kódexy definujú požadované etické správanie od odborníkov, majú známe obmedzenia v presadzovaní, najmä pri veľkých projektoch. Namiesto toho mnohí odborníci na dátovú vedu odporúčajú kontrolné zoznamy, ktoré môžu spájať princípy s praktikami deterministickým a akčným spôsobom.

Kontrolné zoznamy prevádzajú otázky na úlohy "áno/nie", ktoré môžu byť zavedené, čo umožňuje ich sledovanie ako súčasť štandardných pracovných postupov pri vydávaní produktov.

Príklady zahŕňajú:

3. Etické regulácie

Etika je o definovaní spoločných hodnôt a dobrovoľnom konaní správne. Dodržiavanie je o dodržiavaní zákona, ak je definovaný. Riadenie všeobecne pokrýva všetky spôsoby, ktorými organizácie fungujú na presadzovanie etických princípov a dodržiavanie stanovených zákonov.

Dnes riadenie nadobúda dve formy v rámci organizácií. Po prvé, ide o definovanie etických AI princípov a zavedenie praktík na podporu prijatia vo všetkých projektoch súvisiacich s AI v organizácii. Po druhé, ide o dodržiavanie všetkých vládou stanovených regulácií ochrany údajov pre regióny, v ktorých pôsobí.

Príklady regulácií ochrany údajov a súkromia:

🚨 Európska únia definovala GDPR (General Data Protection Regulation), ktorý zostáva jednou z najvplyvnejších regulácií ochrany údajov dnes. Vedeli ste, že definuje aj 8 práv používateľov na ochranu digitálneho súkromia a osobných údajov občanov? Zistite, čo to je a prečo sú dôležité.

4. Etická kultúra

Poznamenajte, že stále existuje nehmotná medzera medzi dodržiavaním (urobením dostatočného na splnenie "litery zákona") a riešením systémových problémov (ako je zakorenenie, informačná asymetria a distribučná nespravodlivosť), ktoré môžu urýchliť zneužitie AI.

Druhé vyžaduje spoluprácu pri definovaní etických kultúr, ktoré budujú emocionálne spojenia a konzistentné spoločné hodnoty naprieč organizáciami v priemysle. To si vyžaduje viac formalizovaných kultúr etiky dát v organizáciách - umožňujúc komukoľvek zatiahnuť Andon šnúru (na včasné upozornenie na etické problémy) a robiť etické hodnotenia (napr. pri nábore) ako základné kritérium formovania tímov v projektoch

Zadanie

Napíšte prípadovú štúdiu o etike dát


Upozornenie:
Tento dokument bol preložený pomocou služby AI prekladu Co-op Translator. Hoci sa snažíme o presnosť, prosím, berte na vedomie, že automatizované preklady môžu obsahovať chyby alebo nepresnosti. Pôvodný dokument v jeho rodnom jazyku by mal byť považovaný za autoritatívny zdroj. Pre kritické informácie sa odporúča profesionálny ľudský preklad. Nenesieme zodpovednosť za akékoľvek nedorozumenia alebo nesprávne interpretácie vyplývajúce z použitia tohto prekladu.