You can not select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.
Data-Science-For-Beginners/translations/lt/1-Introduction/02-ethics
leestott a12f5d4c2d
🌐 Update translations via Co-op Translator
4 months ago
..
README.md 🌐 Update translations via Co-op Translator 4 months ago
assignment.md 🌐 Update translations via Co-op Translator 5 months ago

README.md

Įvadas į duomenų etiką

 Sketchnote by (@sketchthedocs)
Duomenų mokslo etika - Sketchnote by @nitya

Mes visi esame duomenų piliečiai, gyvenantys duomenų pasaulyje.

Rinkos tendencijos rodo, kad iki 2022 m. 1 iš 3 didelių organizacijų pirks ir parduos savo duomenis per internetines rinkas ir mainų platformas. Kaip programėlių kūrėjai, mes galėsime lengviau ir pigiau integruoti duomenimis pagrįstas įžvalgas ir algoritmais valdomą automatizaciją į kasdienes vartotojų patirtis. Tačiau, kai dirbtinis intelektas tampa visur paplitęs, turėsime suprasti galimą žalą, kurią gali sukelti tokių algoritmų panaudojimas kaip ginklas dideliu mastu.

Tendencijos rodo, kad iki 2025 m. mes generuosime ir naudosime daugiau nei 180 zettabaitų duomenų. Duomenų mokslininkams šis informacijos sprogimas suteikia precedento neturinčią prieigą prie asmeninių ir elgsenos duomenų. Tai suteikia galimybę kurti detalius vartotojų profilius ir subtiliai paveikti sprendimų priėmimą—dažnai taip, kad sukuriama laisvo pasirinkimo iliuzija. Nors tai gali būti naudojama vartotojų nukreipimui link pageidaujamų rezultatų, tai taip pat kelia svarbius klausimus apie duomenų privatumą, autonomiją ir etines algoritminės įtakos ribas.

Duomenų etika dabar yra būtinos gairės duomenų mokslui ir inžinerijai, padedančios sumažinti galimą žalą ir netyčines pasekmes, kylančias iš mūsų duomenimis pagrįstų veiksmų. Gartner Hype Cycle for AI identifikuoja svarbias tendencijas skaitmeninėje etikoje, atsakingame dirbtiniame intelekte ir AI valdyme kaip pagrindinius veiksnius didesnėms megatendencijoms, susijusioms su demokratizacija ir industrializacija AI.

Gartner's Hype Cycle for AI - 2020

Šioje pamokoje mes nagrinėsime įdomią duomenų etikos sritį—nuo pagrindinių sąvokų ir iššūkių iki atvejų analizės ir taikomų AI koncepcijų, tokių kaip valdymas, kurios padeda sukurti etikos kultūrą komandose ir organizacijose, dirbančiose su duomenimis ir AI.

Prieš paskaitos testas 🎯

Pagrindinės sąvokos

Pradėkime nuo pagrindinių terminų supratimo.

Žodis „etika“ kilęs iš graikiško žodžio „ethikos“ (ir jo šaknies „ethos“), reiškiančio charakterį ar moralinę prigimtį.

Etika yra apie bendras vertybes ir moralinius principus, kurie reguliuoja mūsų elgesį visuomenėje. Etika grindžiama ne įstatymais, o plačiai priimtomis normomis, kas yra „teisinga vs. neteisinga“. Tačiau etiniai svarstymai gali paveikti įmonių valdymo iniciatyvas ir vyriausybės reglamentus, kurie sukuria daugiau paskatų laikytis taisyklių.

Duomenų etika yra nauja etikos šaka, kuri „tiria ir vertina moralines problemas, susijusias su duomenimis, algoritmais ir atitinkamomis praktikomis“. Čia „duomenys“ orientuojasi į veiksmus, susijusius su generavimu, įrašymu, kuravimu, apdorojimu, sklaida, dalijimusi ir naudojimu, „algoritmai“ orientuojasi į AI, agentus, mašininį mokymąsi ir robotus, o „praktikos“ orientuojasi į tokias temas kaip atsakinga inovacija, programavimas, įsilaužimas ir etikos kodeksai.

Taikomoji etika yra moralinių svarstymų praktinis taikymas. Tai procesas, kai aktyviai tiriamos etinės problemos realių veiksmų, produktų ir procesų kontekste, ir imamasi korekcinių veiksmų, kad jie išliktų suderinti su apibrėžtomis etinėmis vertybėmis.

Etikos kultūra yra apie taikomosios etikos operatyvinimą, siekiant užtikrinti, kad mūsų etiniai principai ir praktikos būtų nuosekliai ir masteliškai priimtos visoje organizacijoje. Sėkmingos etikos kultūros apibrėžia organizacijos mastu etinius principus, suteikia prasmingas paskatas laikytis taisyklių ir stiprina etikos normas, skatindamos ir amplifikuodamos pageidaujamą elgesį kiekviename organizacijos lygyje.

Etikos sąvokos

Šiame skyriuje aptarsime tokias sąvokas kaip bendros vertybės (principai) ir etikos iššūkiai (problemos) duomenų etikoje—bei nagrinėsime atvejų analizes, kurios padės suprasti šias sąvokas realiame kontekste.

1. Etikos principai

Kiekviena duomenų etikos strategija prasideda nuo etinių principų apibrėžimo—„bendrų vertybių“, kurios apibūdina priimtiną elgesį ir vadovauja veiksmams, atitinkantiems taisykles, mūsų duomenų ir AI projektuose. Juos galite apibrėžti individualiu ar komandos lygiu. Tačiau dauguma didelių organizacijų apibrėžia juos etinio AI misijos pareiškime ar sistemoje, kuri yra apibrėžta korporatyviniu lygiu ir nuosekliai įgyvendinama visose komandose.

Pavyzdys: „Microsoft“ atsakingo AI misijos pareiškimas skamba: „Mes esame įsipareigoję AI pažangai, grindžiamai etiniais principais, kurie pirmiausia rūpinasi žmonėmis“—identifikuojant 6 etinius principus žemiau pateiktoje sistemoje:

Atsakingas AI „Microsoft“

Trumpai aptarkime šiuos principus. Skaidrumas ir atsakomybė yra pagrindinės vertybės, ant kurių statomi kiti principai—pradėkime nuo jų:

  • Atsakomybė daro praktikantus atsakingus už jų duomenų ir AI operacijas bei atitiktį šiems etiniams principams.
  • Skaidrumas užtikrina, kad duomenų ir AI veiksmai būtų suprantami vartotojams, paaiškinant, kas ir kodėl priimami sprendimai.
  • Teisingumas—orientuojasi į tai, kad AI elgtųsi su visais žmonėmis teisingai, sprendžiant bet kokius sisteminius ar implicitinius socialinius-techninius šališkumus duomenyse ir sistemose.
  • Patikimumas ir saugumas—užtikrina, kad AI elgtųsi nuosekliai su apibrėžtomis vertybėmis, sumažinant galimą žalą ar netyčines pasekmes.
  • Privatumas ir saugumas—yra apie duomenų kilmės supratimą ir duomenų privatumo bei susijusių apsaugų suteikimą vartotojams.
  • Įtrauktis—yra apie AI sprendimų kūrimą su intencija, pritaikant juos plačiam žmonių poreikių ir gebėjimų spektrui.

🚨 Pagalvokite, kokia galėtų būti jūsų duomenų etikos misijos pareiškimas. Išnagrinėkite kitų organizacijų etinio AI sistemas—čia yra pavyzdžiai iš IBM, Google ir Facebook. Kokias bendras vertybes jie turi? Kaip šie principai susiję su AI produktu ar pramone, kurioje jie veikia?

2. Etikos iššūkiai

Kai turime apibrėžtus etinius principus, kitas žingsnis yra įvertinti mūsų duomenų ir AI veiksmus, kad pamatytume, ar jie atitinka tas bendras vertybes. Pagalvokite apie savo veiksmus dviejose kategorijose: duomenų rinkimas ir algoritmų kūrimas.

Renkant duomenis, veiksmai greičiausiai apims asmeninius duomenis arba asmeniškai identifikuojamą informaciją (PII), susijusią su identifikuojamais gyvais asmenimis. Tai apima įvairius neasmeninių duomenų elementus, kurie kolektyviai identifikuoja asmenį. Etikos iššūkiai gali būti susiję su duomenų privatumu, duomenų nuosavybe ir susijusiomis temomis, tokiomis kaip informuotas sutikimas ir intelektinės nuosavybės teisės vartotojams.

Kuriant algoritmus, veiksmai apims duomenų rinkinių rinkimą ir kuravimą, o vėliau jų naudojimą duomenų modelių mokymui ir diegimui, kurie prognozuoja rezultatus arba automatizuoja sprendimus realiame kontekste. Etikos iššūkiai gali kilti dėl duomenų rinkinio šališkumo, duomenų kokybės problemų, neteisingumo ir klaidingo atvaizdavimo algoritmuose—įskaitant kai kurias problemas, kurios yra sisteminio pobūdžio.

Abiem atvejais etikos iššūkiai pabrėžia sritis, kuriose mūsų veiksmai gali susidurti su konfliktu su mūsų bendromis vertybėmis. Norėdami aptikti, sumažinti, minimizuoti ar pašalinti šiuos rūpesčius, turime užduoti moralinius „taip/ne“ klausimus, susijusius su mūsų veiksmais, ir prireikus imtis korekcinių veiksmų. Pažvelkime į kai kuriuos etikos iššūkius ir moralinius klausimus, kuriuos jie kelia:

2.1 Duomenų nuosavybė

Duomenų rinkimas dažnai apima asmeninius duomenis, kurie gali identifikuoti duomenų subjektus. Duomenų nuosavybė yra apie kontrolę ir vartotojų teises, susijusias su duomenų kūrimu, apdorojimu ir sklaida.

Moraliniai klausimai, kuriuos turime užduoti:

  • Kas valdo duomenis? (vartotojas ar organizacija)
  • Kokias teises turi duomenų subjektai? (pvz., prieiga, ištrynimas, perkeliamumas)
  • Kokias teises turi organizacijos? (pvz., pataisyti kenksmingas vartotojų apžvalgas)

2.2 Informuotas sutikimas

Informuotas sutikimas apibrėžia vartotojų sutikimą veiksmui (pvz., duomenų rinkimui) su pilnu supratimu apie svarbius faktus, įskaitant tikslą, galimą riziką ir alternatyvas.

Klausimai, kuriuos reikia nagrinėti:

  • Ar vartotojas (duomenų subjektas) davė leidimą duomenų rinkimui ir naudojimui?
  • Ar vartotojas suprato tikslą, dėl kurio tie duomenys buvo surinkti?
  • Ar vartotojas suprato galimą riziką, susijusią su jų dalyvavimu?

2.3 Intelektinė nuosavybė

Intelektinė nuosavybė reiškia nematerialius kūrinius, atsiradusius iš žmogaus iniciatyvos, kurie gali turėti ekonominę vertę asmenims ar verslui.

Klausimai, kuriuos reikia nagrinėti:

  • Ar surinkti duomenys turėjo ekonominę vertę vartotojui ar verslui?
  • Ar vartotojas turi intelektinę nuosavybę čia?
  • Ar organizacija turi intelektinę nuosavybę čia?
  • Jei šios teisės egzistuoja, kaip mes jas saugome?

2.4 Duomenų privatumas

Duomenų privatumas arba informacijos privatumas reiškia vartotojų privatumo išsaugojimą ir vartotojų tapatybės apsaugą, susijusią su asmeniškai identifikuojama informacija.

Klausimai, kuriuos reikia nagrinėti:

  • Ar vartotojų (asmeniniai) duomenys yra apsaugoti nuo įsilaužimų ir nutekėjimų?
  • Ar vartotojų duomenys yra prieinami tik įgaliotiems vartotojams ir kontekstams?
  • Ar vartotojų anonimiškumas išsaugomas, kai duomenys yra dalijami ar skleidžiami?
  • Ar vartotojas gali būti deidentifikuotas iš anonimizuotų duomenų rinkinių?

2.5 Teisė būti pamirštam

Teisė būti pamirštam arba Teisė į ištrynimą suteikia papildomą asmeninių duomenų apsaugą vartotojams. Konkrečiai, tai suteikia vartotojams teisę prašyti asmeninių duomenų ištrynimo ar pašalinimo iš interneto paieškų ir kitų vietų, tam tikromis aplinkybėmis—leidžiant jiems naują pradžią internete, be praeities veiksmų, kurie būtų laikomi prieš juos.

Klausimai, kuriuos reikia nagrinėti:

  • Ar sistema leidžia duomenų subjektams prašyti ištrynimo?
  • Ar vartotojo sutikimo atšaukimas turėtų automatiškai sukelti ištrynimą?
  • Ar duomenys buvo surinkti be sutikimo ar neteisėtais būdais?
  • Ar mes laikomės vyriausybės reglamentų dėl duomenų privatumo?

2.6 Duomen

  • Ar informacija užfiksuota tiksliai atspindint realybę?

2.8 Algoritmų sąžiningumas

Algoritmų sąžiningumas tikrina, ar algoritmų dizainas sistemingai nediskriminuoja tam tikrų duomenų subjektų grupių, sukeldamas galimą žalą paskirstymo srityje (kai ištekliai atimami ar nesuteikiami tam tikrai grupei) ir paslaugų kokybės srityje (kai dirbtinis intelektas nėra toks tikslus tam tikroms grupėms kaip kitoms).

Klausimai, kuriuos verta apsvarstyti:

  • Ar įvertinome modelio tikslumą įvairioms grupėms ir sąlygoms?
  • Ar išanalizavome sistemą dėl galimos žalos (pvz., stereotipų formavimo)?
  • Ar galime peržiūrėti duomenis ar iš naujo apmokyti modelius, kad sumažintume nustatytą žalą?

Susipažinkite su tokiais šaltiniais kaip AI sąžiningumo kontroliniai sąrašai, kad sužinotumėte daugiau.

2.9 Netinkamas duomenų pateikimas

Netinkamas duomenų pateikimas reiškia klausimą, ar mes pateikiame įžvalgas iš sąžiningai surinktų duomenų taip, kad klaidintume ir palaikytume norimą naratyvą.

Klausimai, kuriuos verta apsvarstyti:

  • Ar pateikiame neišsamius ar netikslius duomenis?
  • Ar vizualizuojame duomenis taip, kad sukeltume klaidingas išvadas?
  • Ar naudojame selektyvius statistinius metodus rezultatams manipuliuoti?
  • Ar yra alternatyvių paaiškinimų, kurie galėtų pasiūlyti kitokią išvadą?

2.10 Laisvo pasirinkimo iliuzija

Laisvo pasirinkimo iliuzija atsiranda, kai sistemos „pasirinkimo architektūros“ naudoja sprendimų priėmimo algoritmus, kad paskatintų žmones priimti pageidaujamą rezultatą, tuo pačiu suteikiant jiems pasirinkimo ir kontrolės iliuziją. Tokie tamsūs modeliai gali sukelti socialinę ir ekonominę žalą vartotojams. Kadangi vartotojų sprendimai daro įtaką elgesio profiliams, šie veiksmai gali sustiprinti ar pratęsti šios žalos poveikį.

Klausimai, kuriuos verta apsvarstyti:

  • Ar vartotojas suprato, kokias pasekmes turės jo pasirinkimas?
  • Ar vartotojas buvo informuotas apie (alternatyvius) pasirinkimus ir jų privalumus bei trūkumus?
  • Ar vartotojas gali atšaukti automatizuotą ar įtakotą pasirinkimą vėliau?

3. Atvejų analizės

Norint suprasti šiuos etikos iššūkius realiame pasaulyje, naudinga pažvelgti į atvejų analizes, kurios parodo galimą žalą ir pasekmes asmenims bei visuomenei, kai tokie etikos pažeidimai yra ignoruojami.

Štai keletas pavyzdžių:

Etikos iššūkis Atvejo analizė
Informuotas sutikimas 1972 m. - Tuskegee sifilio tyrimas - Afrikos amerikiečiai vyrai, dalyvavę tyrime, buvo pažadėta nemokama medicininė priežiūra, bet jie buvo apgauti tyrėjų, kurie neinformavo jų apie diagnozę ar gydymo galimybes. Daugelis dalyvių mirė, o jų partneriai ar vaikai buvo paveikti; tyrimas truko 40 metų.
Duomenų privatumas 2007 m. - Netflix duomenų prizas pateikė tyrėjams 10 mln. anonimizuotų filmų įvertinimų iš 50 tūkst. klientų, siekiant pagerinti rekomendacijų algoritmus. Tačiau tyrėjai sugebėjo susieti anonimizuotus duomenis su asmeniškai identifikuojamais duomenimis iš išorinių duomenų rinkinių (pvz., IMDb komentarų), efektyviai „deanonimizuodami“ kai kuriuos Netflix prenumeratorius.
Surinkimo šališkumas 2013 m. - Bostono miestas sukūrė Street Bump, programėlę, leidžiančią piliečiams pranešti apie duobes, suteikiant miestui geresnius duomenis apie kelių problemas. Tačiau žmonės iš mažesnių pajamų grupių turėjo mažiau prieigos prie automobilių ir telefonų, todėl jų kelių problemos tapo nematomos šioje programėlėje. Kūrėjai dirbo su akademikais, kad spręstų teisingumo ir skaitmeninės atskirties klausimus.
Algoritmų sąžiningumas 2018 m. - MIT Gender Shades tyrimas įvertino lyties klasifikavimo AI produktų tikslumą, atskleidžiant spragas tikslume moterims ir spalvotiems žmonėms. 2019 m. Apple kortelė atrodė, kad siūlo mažiau kredito moterims nei vyrams. Abu atvejai parodė algoritminio šališkumo problemas, sukeliančias socialinę ir ekonominę žalą.
Netinkamas duomenų pateikimas 2020 m. - Džordžijos sveikatos departamentas paskelbė COVID-19 diagramas, kurios atrodė klaidinančios piliečius apie patvirtintų atvejų tendencijas, naudojant nechronologinę x ašies tvarką. Tai iliustruoja netinkamą pateikimą per vizualizacijos triukus.
Laisvo pasirinkimo iliuzija 2020 m. - Mokymosi programėlė ABCmouse sumokėjo 10 mln. dolerių, kad išspręstų FTC skundą, kai tėvai buvo įstrigę mokėti už prenumeratas, kurių negalėjo atšaukti. Tai iliustruoja tamsius modelius pasirinkimo architektūrose, kur vartotojai buvo nukreipti į galimai žalingus pasirinkimus.
Duomenų privatumas ir vartotojų teisės 2021 m. - Facebook duomenų nutekėjimas atskleidė 530 mln. vartotojų duomenis, dėl ko buvo skirta 5 mlrd. dolerių bauda FTC. Tačiau Facebook atsisakė informuoti vartotojus apie nutekėjimą, pažeidžiant vartotojų teises į duomenų skaidrumą ir prieigą.

Norite daugiau atvejų analizių? Peržiūrėkite šiuos šaltinius:

🚨 Pagalvokite apie matytus atvejų tyrimus ar esate patyrę ar buvote paveikti panašaus etikos iššūkio savo gyvenime? Ar galite sugalvoti bent vieną kitą atvejo analizę, kuri iliustruotų vieną iš šiame skyriuje aptartų etikos iššūkių?

Taikomoji etika

Mes aptarėme etikos sąvokas, iššūkius ir atvejų analizes realiame pasaulyje. Bet kaip pradėti taikyti etikos principus ir praktiką savo projektuose? Ir kaip operacionalizuoti šias praktikas geresniam valdymui? Pažvelkime į keletą realių sprendimų:

1. Profesiniai kodeksai

Profesiniai kodeksai siūlo vieną iš būdų organizacijoms „skatinti“ narius palaikyti jų etikos principus ir misijos pareiškimą. Kodeksai yra moralinės gairės profesiniam elgesiui, padedančios darbuotojams ar nariams priimti sprendimus, atitinkančius jų organizacijos principus. Jie yra veiksmingi tiek, kiek nariai savanoriškai jų laikosi; tačiau daugelis organizacijų siūlo papildomus apdovanojimus ir bausmes, kad paskatintų narius laikytis kodekso.

Pavyzdžiai:

🚨 Ar priklausote profesinei inžinerijos ar duomenų mokslo organizacijai? Peržiūrėkite jų svetainę, kad pamatytumėte, ar jie apibrėžia profesinį etikos kodeksą. Ką tai sako apie jų etikos principus? Kaip jie „skatina“ narius laikytis kodekso?

2. Etikos kontroliniai sąrašai

Nors profesiniai kodeksai apibrėžia reikalaujamą etišką elgesį iš praktikų, jie turi žinomų apribojimų vykdymo srityje, ypač didelio masto projektuose. Vietoj to, daugelis duomenų mokslo ekspertų rekomenduoja kontrolinius sąrašus, kurie gali susieti principus su praktikomis labiau deterministiniais ir veiksmais pagrįstais būdais.

Kontroliniai sąrašai paverčia klausimus „taip/ne“ užduotimis, kurias galima operacionalizuoti, leidžiant jas sekti kaip standartinių produktų išleidimo darbo eigų dalį.

Pavyzdžiai:

3. Etikos reglamentai

Etika yra apie bendrų vertybių apibrėžimą ir teisingų veiksmų atlikimą savanoriškai. Atitiktis yra apie įstatymų laikymąsi, jei ir kur jie yra apibrėžti. Valdymas apima visas organizacijų veiklos formas, skirtas etikos principų įgyvendinimui ir nustatytų įstatymų laikymuisi.

Šiandien valdymas organizacijose vyksta dviem formomis. Pirma, tai yra apie etiško AI principų apibrėžimą ir praktikų nustatymą, siekiant operacionalizuoti jų taikymą visiems organizacijos AI susijusiems projektams. Antra, tai yra apie visų vyriausybės nustatytų duomenų apsaugos reglamentų laikymąsi regionuose, kuriuose organizacija veikia.

Duomenų apsaugos ir privatumo reglamentų pavyzdžiai:

🚨 Europos Sąjungos apibrėžtas GDPR (Bendrasis duomenų apsaugos reglamentas) išlieka vienu įtakingiausių duomenų privatumo reglamentų šiandien. Ar žinojote, kad jis taip pat apibrėžia 8 vartotojų teises, skirtas apsaugoti piliečių skaitmeninį privatumą ir asmeninius duomenis? Sužinokite, kokios jos yra ir kodėl jos svarbios.

4. Etikos kultūra

Atkreipkite dėmesį, kad išlieka nematomas atotrūkis tarp atitikties (pakankamo veikimo pagal „įstatymo raidę“) ir sisteminių problemų sprendimo (pvz., informacijos asimetrijos ir paskirstymo neteisingumo), kurios gali paspartinti AI ginklavimą.

Pastarasis reikalauja bendradarbiavimo metodų etikos kultūrų apibrėžimui, kurie kuria emocinius ryšius ir nuoseklias bendras vertybes visose organizacijose pramonėje. Tai reikalauja daugiau formalizuotų duomenų etikos kultūrų organizacijose

Užduotis

Parašykite duomenų etikos atvejo analizę


Atsakomybės atsisakymas:
Šis dokumentas buvo išverstas naudojant AI vertimo paslaugą Co-op Translator. Nors siekiame tikslumo, prašome atkreipti dėmesį, kad automatiniai vertimai gali turėti klaidų ar netikslumų. Originalus dokumentas jo gimtąja kalba turėtų būti laikomas autoritetingu šaltiniu. Kritinei informacijai rekomenduojama naudoti profesionalų žmogaus vertimą. Mes neprisiimame atsakomybės už nesusipratimus ar neteisingus aiškinimus, kylančius dėl šio vertimo naudojimo.