You can not select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.
Data-Science-For-Beginners/translations/lt/1-Introduction/02-ethics/README.md

27 KiB

Duomenų etikos įvadas

 Sketchnote by (@sketchthedocs)
Duomenų mokslo etika - Sketchnote by @nitya

Mes visi esame duomenų piliečiai, gyvenantys duomenų pasaulyje.

Rinkos tendencijos rodo, kad iki 2022 m. 1 iš 3 didelių organizacijų pirks ir parduos savo duomenis per internetines turgavietes ir mainų platformas. Kaip programėlių kūrėjai, mes pastebėsime, kad duomenimis pagrįstų įžvalgų ir algoritmais pagrįstos automatizacijos integravimas į kasdienes vartotojų patirtis taps lengvesnis ir pigesnis. Tačiau, kai dirbtinis intelektas tampa visur paplitęs, turėsime suprasti ir galimą žalą, kurią gali sukelti tokių algoritmų ginklavimas dideliu mastu.

Tendencijos taip pat rodo, kad iki 2025 m. sukursime ir suvartosime daugiau nei 180 zettabaitų duomenų. Kaip duomenų mokslininkai, mes turėsime precedento neturintį prieigą prie asmeninių duomenų. Tai reiškia, kad galėsime kurti vartotojų elgsenos profilius ir daryti įtaką sprendimų priėmimui taip, kad sukurtume laisvo pasirinkimo iliuziją, tuo pačiu galimai nukreipdami vartotojus link mums pageidaujamų rezultatų. Tai taip pat kelia platesnius klausimus apie duomenų privatumą ir vartotojų apsaugą.

Duomenų etika dabar yra būtinos gairės duomenų mokslui ir inžinerijai, padedančios sumažinti galimą žalą ir netyčines pasekmes, kylančias iš mūsų veiksmų, pagrįstų duomenimis. Gartner Hype Cycle for AI identifikuoja skaitmeninės etikos, atsakingo DI ir DI valdymo tendencijas kaip pagrindinius veiksnius, skatinančius didesnes megatendencijas, susijusias su DI demokratizacija ir industrializacija.

Gartner's Hype Cycle for AI - 2020

Šioje pamokoje mes nagrinėsime įdomią duomenų etikos sritį nuo pagrindinių sąvokų ir iššūkių iki atvejų analizių ir taikomų DI koncepcijų, tokių kaip valdymas, kurios padeda sukurti etikos kultūrą komandose ir organizacijose, dirbančiose su duomenimis ir DI.

Prieš paskaitą vykdomas testas 🎯

Pagrindinės sąvokos

Pradėkime nuo pagrindinių terminų supratimo.

Žodis „etika“ kilęs iš graikiško žodžio „ethikos“ (ir jo šaknies „ethos“), reiškiančio charakterį arba moralinę prigimtį.

Etika tai bendros vertybės ir moraliniai principai, kurie reguliuoja mūsų elgesį visuomenėje. Etika grindžiama ne įstatymais, o plačiai priimtomis normomis, kas yra „teisinga prieš neteisinga“. Tačiau etiniai svarstymai gali turėti įtakos įmonių valdymo iniciatyvoms ir vyriausybės reglamentams, kurie sukuria daugiau paskatų laikytis taisyklių.

Duomenų etika yra nauja etikos šaka, kuri „tiria ir vertina moralines problemas, susijusias su duomenimis, algoritmais ir atitinkama praktika“. Čia „duomenys“ apima veiksmus, susijusius su duomenų generavimu, įrašymu, tvarkymu, apdorojimu, platinimu, dalijimusi ir naudojimu, „algoritmai“ apima DI, agentus, mašininį mokymąsi ir robotus, o „praktika“ apima tokias temas kaip atsakingos inovacijos, programavimas, įsilaužimai ir etikos kodeksai.

Taikomoji etika yra moralinių svarstymų praktinis taikymas. Tai procesas, kai aktyviai tiriamos etinės problemos realių veiksmų, produktų ir procesų kontekste, ir imamasi korekcinių veiksmų, kad jie išliktų suderinti su mūsų apibrėžtomis etinėmis vertybėmis.

Etikos kultūra yra apie taikomosios etikos įgyvendinimą, siekiant užtikrinti, kad mūsų etikos principai ir praktika būtų nuosekliai ir masteliškai taikomi visoje organizacijoje. Sėkmingos etikos kultūros apibrėžia organizacijos mastu taikomus etikos principus, suteikia prasmingas paskatas laikytis taisyklių ir stiprina etikos normas, skatindamos ir amplifikuodamos pageidaujamą elgesį kiekviename organizacijos lygmenyje.

Etikos sąvokos

Šioje dalyje aptarsime tokias sąvokas kaip bendros vertybės (principai) ir etikos iššūkiai (problemos) duomenų etikoje ir nagrinėsime atvejų analizes, kurios padės suprasti šias sąvokas realiame kontekste.

1. Etikos principai

Kiekviena duomenų etikos strategija prasideda nuo etinių principų apibrėžimo „bendrų vertybių“, kurios apibūdina priimtiną elgesį ir vadovauja atitinkamiems veiksmams mūsų duomenų ir DI projektuose. Juos galima apibrėžti individualiu ar komandos lygmeniu. Tačiau dauguma didelių organizacijų šiuos principus apibrėžia etinio DI misijos pareiškime arba sistemoje, kuri yra nustatyta korporaciniu lygmeniu ir nuosekliai taikoma visose komandose.

Pavyzdys: „Microsoft“ atsakingo DI misijos pareiškimas skamba taip: „Mes esame įsipareigoję skatinti DI, vadovaujantis etikos principais, kurie pirmiausia rūpinasi žmonėmis“ identifikuojant 6 etikos principus žemiau pateiktoje sistemoje:

Atsakingas DI „Microsoft“

Trumpai aptarkime šiuos principus. Skaidrumas ir atsakomybė yra pagrindinės vertybės, ant kurių statomi kiti principai todėl pradėkime nuo jų:

  • Atsakomybė užtikrina, kad specialistai būtų atsakingi už savo duomenų ir DI veiksmus bei atitiktį šiems etikos principams.
  • Skaidrumas užtikrina, kad duomenų ir DI veiksmai būtų suprantami vartotojams, paaiškinant, kas ir kodėl buvo nuspręsta.
  • Teisingumas siekia užtikrinti, kad DI elgtųsi teisingai su visais žmonėmis, sprendžiant bet kokias sistemines ar implicitines šališkumo problemas duomenyse ir sistemose.
  • Patikimumas ir saugumas užtikrina, kad DI elgtųsi nuosekliai su apibrėžtomis vertybėmis, sumažinant galimą žalą ar netyčines pasekmes.
  • Privatumas ir saugumas tai duomenų kilmės supratimas ir duomenų privatumo bei susijusių apsaugų teikimas vartotojams.
  • Įtrauktis tai DI sprendimų kūrimas su intencija, pritaikant juos, kad jie atitiktų platų žmonių poreikių ir gebėjimų spektrą.

🚨 Pagalvokite, kokia galėtų būti jūsų duomenų etikos misijos pareiškimas. Išnagrinėkite kitų organizacijų etinio DI sistemas čia pateikiami pavyzdžiai iš IBM, Google ir Facebook. Kokias bendras vertybes jie turi? Kaip šie principai susiję su DI produktu ar pramone, kurioje jie veikia?

2. Etikos iššūkiai

Kai turime apibrėžtus etikos principus, kitas žingsnis yra įvertinti mūsų duomenų ir DI veiksmus, siekiant nustatyti, ar jie atitinka šias bendras vertybes. Pagalvokite apie savo veiksmus dviejose kategorijose: duomenų rinkimas ir algoritmų kūrimas.

Renkant duomenis, veiksmai greičiausiai apims asmeninius duomenis arba asmeniškai identifikuojamą informaciją (PII), susijusią su atpažįstamais gyvais asmenimis. Tai apima įvairius neasmeninių duomenų elementus, kurie kartu gali identifikuoti asmenį. Etikos iššūkiai gali būti susiję su duomenų privatumu, duomenų nuosavybe ir susijusiomis temomis, tokiomis kaip informuotas sutikimas ir intelektinės nuosavybės teisės vartotojams.

Kuriant algoritmus, veiksmai apims duomenų rinkinių rinkimą ir tvarkymą, o tada jų naudojimą duomenų modeliams mokyti ir diegti, siekiant prognozuoti rezultatus arba automatizuoti sprendimus realiame kontekste. Etikos iššūkiai gali kilti dėl rinkinio šališkumo, duomenų kokybės problemų, neteisingumo ir klaidingo atvaizdavimo algoritmuose įskaitant kai kurias sistemines problemas.

Abiem atvejais etikos iššūkiai pabrėžia sritis, kuriose mūsų veiksmai gali prieštarauti mūsų bendroms vertybėms. Norėdami aptikti, sumažinti, sušvelninti ar pašalinti šias problemas, turime užduoti moralinius „taip/ne“ klausimus, susijusius su mūsų veiksmais, ir prireikus imtis korekcinių veiksmų. Pažvelkime į kai kuriuos etikos iššūkius ir moralinius klausimus, kuriuos jie kelia:

2.1 Duomenų nuosavybė

Duomenų rinkimas dažnai apima asmeninius duomenis, kurie gali identifikuoti duomenų subjektus. Duomenų nuosavybė yra apie kontrolę ir vartotojų teises, susijusias su duomenų kūrimu, apdorojimu ir platinimu.

Moraliniai klausimai, kuriuos turime užduoti:

  • Kas valdo duomenis? (vartotojas ar organizacija)
  • Kokias teises turi duomenų subjektai? (pvz., prieiga, ištrynimas, perkeliamumas)
  • Kokias teises turi organizacijos? (pvz., taisyti kenksmingas vartotojų apžvalgas)

2.2 Informuotas sutikimas

Informuotas sutikimas apibrėžia veiksmą, kai vartotojai sutinka su veiksmu (pvz., duomenų rinkimu), turėdami pilną supratimą apie svarbius faktus, įskaitant tikslą, galimą riziką ir alternatyvas.

Klausimai, kuriuos reikia nagrinėti:

  • Ar vartotojas (duomenų subjektas) davė leidimą rinkti ir naudoti duomenis?
  • Ar vartotojas suprato tikslą, dėl kurio buvo renkami duomenys?
  • Ar vartotojas suprato galimą riziką, susijusią su jų dalyvavimu?

2.3 Intelektinė nuosavybė

Intelektinė nuosavybė reiškia nematerialius kūrinius, atsiradusius dėl žmogaus iniciatyvos, kurie gali turėti ekonominę vertę asmenims ar verslui.

Klausimai, kuriuos reikia nagrinėti:

  • Ar surinkti duomenys turėjo ekonominę vertę vartotojui ar verslui?
  • Ar vartotojas turi intelektinę nuosavybę čia?
  • Ar organizacija turi intelektinę nuosavybę čia?
  • Jei šios teisės egzistuoja, kaip mes jas saugome?

2.4 Duomenų privatumas

Duomenų privatumas arba informacijos privatumas reiškia vartotojų privatumo išsaugojimą ir jų tapatybės apsaugą, susijusią su asmeniškai identifikuojama informacija.

Klausimai, kuriuos reikia nagrinėti:

  • Ar vartotojų (asmeniniai) duomenys yra apsaugoti nuo įsilaužimų ir nutekėjimų?
  • Ar vartotojų duomenys yra prieinami tik įgaliotiems vartotojams ir kontekstams?
  • Ar vartotojų anonimiškumas išsaugomas, kai duomenys yra dalijami ar platinami?
  • Ar vartotojas gali būti deanonimizuotas iš anonimizuotų duomenų rinkinių?

2.5 Teisė būti pamirštam

Teisė būti pamirštam arba teisė į ištrynimą suteikia papildomą asmeninių duomenų apsaugą vartotojams. Konkrečiai, ji suteikia vartotojams teisę prašyti asmeninių duomenų ištrynimo ar pašalinimo iš interneto paieškų ir kitų vietų, tam tikromis aplinkybėmis leidžiant jiems pradėti iš naujo internete, nes jų praeities veiksmai nebūtų laikomi prieš juos.

Klausimai, kuriuos reikia nagrinėti:

  • Ar sistema leidžia duomenų subjektams prašyti ištrynimo?
  • Ar vartotojo sutikimo atšaukimas turėtų automatiškai sukelti ištrynimą?
  • Ar duomenys buvo surinkti be sutikimo ar neteisėtomis priemonėmis?
  • Ar mes laikomės vyriausybės reglamentų dėl duomenų privatumo?

2.6 Duomenų rinkinio šališkumas

Duomenų rinkinys arba [rinkimo š Algoritmų sąžiningumas tikrina, ar algoritmų kūrimas sistemingai nediskriminuoja tam tikrų duomenų subjektų grupių, sukeldamas galimą žalą paskirstymo (kai ištekliai atimami arba nesuteikiami tai grupei) ir paslaugų kokybės (kai dirbtinis intelektas nėra toks tikslus kai kurioms grupėms kaip kitoms) srityse.

Klausimai, kuriuos verta apsvarstyti:

  • Ar įvertinome modelio tikslumą įvairioms grupėms ir sąlygoms?
  • Ar išanalizavome sistemą dėl galimos žalos (pvz., stereotipizavimo)?
  • Ar galime peržiūrėti duomenis arba iš naujo apmokyti modelius, kad sumažintume nustatytą žalą?

Susipažinkite su tokiais šaltiniais kaip AI sąžiningumo kontroliniai sąrašai, kad sužinotumėte daugiau.

2.9 Netinkamas duomenų pateikimas

Netinkamas duomenų pateikimas kelia klausimą, ar mes pateikiame įžvalgas iš sąžiningai pateiktų duomenų taip, kad klaidintume ir palaikytume norimą naratyvą.

Klausimai, kuriuos verta apsvarstyti:

  • Ar pateikiame neišsamius ar netikslius duomenis?
  • Ar vizualizuojame duomenis taip, kad sukeltume klaidingas išvadas?
  • Ar naudojame selektyvius statistinius metodus rezultatams manipuliuoti?
  • Ar yra alternatyvių paaiškinimų, kurie galėtų pateikti kitokią išvadą?

2.10 Laisvo pasirinkimo iliuzija

Laisvo pasirinkimo iliuzija atsiranda, kai sistemos „pasirinkimo architektūros“ naudoja sprendimų priėmimo algoritmus, kad paskatintų žmones priimti pageidaujamą rezultatą, tuo pačiu suteikdamos jiems pasirinkimo ir kontrolės iliuziją. Šie tamsieji modeliai gali sukelti socialinę ir ekonominę žalą vartotojams. Kadangi vartotojų sprendimai daro įtaką elgsenos profiliams, šie veiksmai gali sustiprinti arba pratęsti šios žalos poveikį.

Klausimai, kuriuos verta apsvarstyti:

  • Ar vartotojas suprato, kokias pasekmes turi jo pasirinkimas?
  • Ar vartotojas buvo informuotas apie (alternatyvius) pasirinkimus ir jų privalumus bei trūkumus?
  • Ar vartotojas gali vėliau atšaukti automatizuotą ar įtakotą pasirinkimą?

3. Atvejų analizės

Norint suprasti šiuos etikos iššūkius realiame pasaulyje, verta peržiūrėti atvejų analizes, kurios parodo galimą žalą ir pasekmes asmenims bei visuomenei, kai tokie etikos pažeidimai yra ignoruojami.

Štai keletas pavyzdžių:

Etikos iššūkis Atvejo analizė
Informuotas sutikimas 1972 m. - Tuskegee sifilio tyrimas - Afroamerikiečiai vyrai, dalyvavę tyrime, buvo pažadėti nemokama medicininė priežiūra, bet buvo apgauti tyrėjų, kurie neinformavo jų apie diagnozę ar gydymo galimybes. Daugelis dalyvių mirė, o jų partneriai ar vaikai buvo paveikti; tyrimas truko 40 metų.
Duomenų privatumas 2007 m. - Netflix duomenų prizas pateikė tyrėjams 10 mln. anonimizuotų filmų įvertinimų iš 50 tūkst. klientų, siekiant pagerinti rekomendacijų algoritmus. Tačiau tyrėjai sugebėjo susieti anonimizuotus duomenis su asmeniškai identifikuojamais duomenimis iš išorinių duomenų rinkinių (pvz., IMDb komentarų), efektyviai „deanonimizuodami“ kai kuriuos Netflix abonentus.
Duomenų rinkimo šališkumas 2013 m. - Bostono miestas sukūrė Street Bump, programėlę, leidžiančią piliečiams pranešti apie duobes, suteikiant miestui geresnius duomenis apie kelių būklę. Tačiau žmonės iš mažesnių pajamų grupių turėjo mažiau prieigos prie automobilių ir telefonų, todėl jų kelių problemos tapo nematomos šioje programėlėje. Kūrėjai bendradarbiavo su akademikais, kad spręstų teisingos prieigos ir skaitmeninės atskirties klausimus.
Algoritmų sąžiningumas 2018 m. - MIT Gender Shades tyrimas įvertino AI produktų tikslumą pagal lytį, atskleisdamas tikslumo spragas moterims ir spalvotiems žmonėms. 2019 m. Apple kortelė atrodė, kad siūlo mažiau kredito moterims nei vyrams. Abu atvejai parodė algoritminio šališkumo problemas, sukeliančias socialinę ir ekonominę žalą.
Netinkamas duomenų pateikimas 2020 m. - Džordžijos sveikatos departamentas paskelbė COVID-19 diagramas, kurios atrodė klaidinančios piliečius apie patvirtintų atvejų tendencijas, pateikdamos nechronologinę x ašies tvarką. Tai iliustruoja netinkamą pateikimą naudojant vizualizacijos triukus.
Laisvo pasirinkimo iliuzija 2020 m. - Mokymosi programėlė ABCmouse sumokėjo 10 mln. dolerių, kad išspręstų FTC skundą, kai tėvai buvo priversti mokėti už prenumeratas, kurių negalėjo atšaukti. Tai iliustruoja tamsiuosius modelius pasirinkimo architektūrose, kur vartotojai buvo paskatinti priimti potencialiai žalingus sprendimus.
Duomenų privatumas ir vartotojų teisės 2021 m. - Facebook duomenų nutekėjimas atskleidė 530 mln. vartotojų duomenis, dėl ko buvo skirta 5 mlrd. dolerių bauda FTC. Tačiau Facebook atsisakė informuoti vartotojus apie nutekėjimą, pažeisdama vartotojų teises į duomenų skaidrumą ir prieigą.

Norite sužinoti daugiau atvejų analizių? Peržiūrėkite šiuos šaltinius:

🚨 Pagalvokite apie matytas atvejų analizes ar esate patyrę ar buvote paveikti panašaus etikos iššūkio savo gyvenime? Ar galite sugalvoti bent vieną kitą atvejo analizę, kuri iliustruotų vieną iš šiame skyriuje aptartų etikos iššūkių?

Taikomoji etika

Mes aptarėme etikos sąvokas, iššūkius ir atvejų analizes realiame pasaulyje. Bet kaip pradėti taikyti etikos principus ir praktikas savo projektuose? Ir kaip įgyvendinti šias praktikas geresniam valdymui? Pažvelkime į keletą realių sprendimų:

1. Profesiniai kodeksai

Profesiniai kodeksai siūlo vieną iš būdų organizacijoms „skatinti“ narius palaikyti jų etikos principus ir misiją. Kodeksai yra moralinės gairės profesiniam elgesiui, padedančios darbuotojams ar nariams priimti sprendimus, atitinkančius jų organizacijos principus. Jie yra veiksmingi tiek, kiek nariai savanoriškai jų laikosi; tačiau daugelis organizacijų siūlo papildomas paskatas ir bausmes, kad motyvuotų narius laikytis kodekso.

Pavyzdžiai:

🚨 Ar priklausote profesinei inžinerijos ar duomenų mokslo organizacijai? Peržiūrėkite jų svetainę, kad pamatytumėte, ar jie apibrėžia profesinį etikos kodeksą. Ką tai sako apie jų etikos principus? Kaip jie „skatina“ narius laikytis kodekso?

2. Etikos kontroliniai sąrašai

Nors profesiniai kodeksai apibrėžia reikalaujamą etišką elgesį specialistams, jie turi žinomų apribojimų vykdymo užtikrinime, ypač didelio masto projektuose. Vietoj to, daugelis duomenų mokslo ekspertų rekomenduoja kontrolinius sąrašus, kurie gali susieti principus su praktikomis labiau apibrėžtais ir veiksmais pagrįstais būdais.

Kontroliniai sąrašai paverčia klausimus „taip/ne“ užduotimis, kurias galima įgyvendinti, leidžiant jas stebėti kaip standartinių produktų išleidimo darbo eigų dalį.

Pavyzdžiai:

3. Etikos reguliavimas

Etika yra apie bendrų vertybių apibrėžimą ir teisingų veiksmų atlikimą savanoriškai. Atitiktis yra apie įstatymų laikymąsi, jei jie yra apibrėžti. Valdymas apima visas organizacijų veiklos formas, skirtas etikos principų įgyvendinimui ir nustatytų įstatymų laikymuisi.

Šiandien valdymas organizacijose vyksta dviem formomis. Pirma, tai yra apie etiško AI principų apibrėžimą ir praktikų įgyvendinimą, siekiant užtikrinti jų taikymą visuose organizacijos AI projektuose. Antra, tai yra apie visų vyriausybės nustatytų duomenų apsaugos reguliavimų laikymąsi regionuose, kuriuose organizacija veikia.

Duomenų apsaugos ir privatumo reguliavimo pavyzdžiai:

🚨 Europos Sąjungos apibrėžtas GDPR (Bendrasis duomenų apsaugos reglamentas) išlieka vienu iš įtakingiausių duomenų privatumo reguliavimų šiandien. Ar žinojote, kad jis taip pat apibrėžia 8 vartotojų teises, skirtas apsaugoti piliečių skaitmeninį privatumą ir asmens duomenis? Sužinokite, kokios jos yra ir kodėl jos svarbios.

4. Etikos kultūra

Atkreipkite dėmesį, kad vis dar egzistuoja nematomas atotrūkis tarp atitikties (pakankamo veikimo pagal „įstatymo raidę“) ir sisteminių problemų sprendimo (pvz., informacijos asimetrijos ir paskirstymo neteisingumo), kurios gali paspartinti AI ginklavimą.

Pastarasis reikalauja bendradarbiavimo metodų etikos kultūrų kūrimui, kurie užtikrina emocinius ryšius ir nuoseklias bendras vertybes visose organizacijose pramonėje. Tai reikalauja daugiau formalizuotų duomenų etikos kultūrų organizacijose leidžiant bet kam traukti Andon virvę

Užduotis

Parašykite duomenų etikos atvejo analizę


Atsakomybės apribojimas:
Šis dokumentas buvo išverstas naudojant AI vertimo paslaugą Co-op Translator. Nors siekiame tikslumo, prašome atkreipti dėmesį, kad automatiniai vertimai gali turėti klaidų ar netikslumų. Originalus dokumentas jo gimtąja kalba turėtų būti laikomas autoritetingu šaltiniu. Kritinei informacijai rekomenduojama naudoti profesionalų žmogaus vertimą. Mes neprisiimame atsakomybės už nesusipratimus ar klaidingus interpretavimus, atsiradusius dėl šio vertimo naudojimo.