You can not select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.
Data-Science-For-Beginners/translations/hu/1-Introduction/02-ethics/README.md

27 KiB

Bevezetés az adatetika világába

 Sketchnote készítette: (@sketchthedocs)
Adattudományi etika - Sketchnote készítette: @nitya

Mindannyian adatpolgárok vagyunk egy adatokkal átszőtt világban.

A piaci trendek azt mutatják, hogy 2022-re minden harmadik nagy szervezet online piactereken és tőzsdéken keresztül fog adatokat vásárolni és eladni. Alkalmazásfejlesztőként egyre könnyebb és olcsóbb lesz adatvezérelt betekintéseket és algoritmusvezérelt automatizációt integrálni a mindennapi felhasználói élményekbe. Azonban, ahogy a mesterséges intelligencia (MI) mindent áthatóvá válik, meg kell értenünk azokat a potenciális károkat is, amelyeket az ilyen algoritmusok fegyverként való alkalmazása okozhat nagy léptékben.

A trendek azt is jelzik, hogy 2025-re több mint 180 zettabájtnyi adatot fogunk létrehozni és fogyasztani. Adattudósként ez példátlan szintű hozzáférést biztosít számunkra a személyes adatokhoz. Ez lehetővé teszi, hogy felhasználói viselkedési profilokat építsünk, és olyan döntéshozatalt befolyásoljunk, amely a szabad választás illúzióját kelti, miközben esetleg a számunkra kedvező eredmények felé tereljük a felhasználókat. Ez szélesebb körű kérdéseket is felvet az adatvédelemről és a felhasználói jogok védelméről.

Az adatetika ma már elengedhetetlen irányelv az adattudomány és a mérnöki munka számára, amely segít minimalizálni az adatvezérelt cselekedeteinkből eredő potenciális károkat és nem szándékos következményeket. A Gartner MI Hype Cycle azonosítja a digitális etika, a felelős MI és az MI irányítás releváns trendjeit, mint kulcsfontosságú hajtóerőket az MI demokratizálása és iparosítása körüli nagyobb megatrendekhez.

Gartner MI Hype Cycle - 2020

Ebben a leckében az adatetika lenyűgöző területét fogjuk felfedezni - az alapfogalmaktól és kihívásoktól kezdve az esettanulmányokon át az alkalmazott MI fogalmakig, mint például az irányítás -, amelyek segítenek az etikai kultúra kialakításában az adatokkal és MI-vel dolgozó csapatokban és szervezetekben.

Előadás előtti kvíz 🎯

Alapvető meghatározások

Kezdjük az alapvető terminológia megértésével.

Az "etika" szó a görög "ethikos" (és annak gyökere, az "ethos") szóból származik, amely jellemet vagy erkölcsi természetet jelent.

Etika azokról a közös értékekről és erkölcsi elvekről szól, amelyek irányítják viselkedésünket a társadalomban. Az etika nem törvényeken alapul, hanem azon a széles körben elfogadott normán, hogy mi a "helyes és helytelen". Azonban az etikai megfontolások befolyásolhatják a vállalatirányítási kezdeményezéseket és a kormányzati szabályozásokat, amelyek több ösztönzőt teremtenek a megfelelésre.

Adatetika egy új etikai ág, amely "az adatokkal, algoritmusokkal és a hozzájuk kapcsolódó gyakorlatokkal kapcsolatos erkölcsi problémákat tanulmányozza és értékeli". Itt az "adatok" az adatok generálásával, rögzítésével, kurálásával, feldolgozásával, terjesztésével, megosztásával és felhasználásával kapcsolatos cselekvésekre összpontosítanak, az "algoritmusok" az MI-re, ügynökökre, gépi tanulásra és robotokra, míg a "gyakorlatok" olyan témákra, mint a felelős innováció, programozás, hackelés és etikai kódexek.

Alkalmazott etika az erkölcsi megfontolások gyakorlati alkalmazása. Ez az a folyamat, amely során aktívan vizsgáljuk az etikai kérdéseket a valós cselekvések, termékek és folyamatok kontextusában, és korrekciós intézkedéseket teszünk annak érdekében, hogy ezek összhangban maradjanak a meghatározott etikai értékeinkkel.

Etikai kultúra az alkalmazott etika operacionalizálásáról szól, hogy biztosítsuk, hogy etikai elveinket és gyakorlatainkat következetesen és skálázható módon alkalmazzák a szervezet egészében. A sikeres etikai kultúrák szervezet-szintű etikai elveket határoznak meg, jelentős ösztönzőket biztosítanak a megfeleléshez, és megerősítik az etikai normákat azáltal, hogy minden szinten ösztönzik és erősítik a kívánt viselkedéseket.

Etikai fogalmak

Ebben a részben olyan fogalmakat tárgyalunk, mint a közös értékek (elvek) és az etikai kihívások (problémák) az adatetika területén - valamint esettanulmányokat vizsgálunk, amelyek segítenek megérteni ezeket a fogalmakat a valós kontextusokban.

1. Etikai elvek

Minden adatetikai stratégia az etikai elvek meghatározásával kezdődik - azokkal a "közös értékekkel", amelyek leírják az elfogadható viselkedéseket, és irányítják a megfelelőségi cselekvéseket az adat- és MI-projektjeinkben. Ezeket egyéni vagy csapatszinten is meghatározhatjuk. Azonban a legtöbb nagy szervezet ezeket egy etikus MI küldetésnyilatkozatban vagy keretrendszerben foglalja össze, amelyet vállalati szinten határoznak meg, és következetesen érvényesítenek minden csapatban.

Példa: A Microsoft Felelős MI küldetésnyilatkozata így szól: "Elkötelezettek vagyunk az MI fejlődése iránt, amelyet olyan etikai elvek vezérelnek, amelyek az embereket helyezik előtérbe" - az alábbi keretrendszerben 6 etikai elvet azonosítva:

Felelős MI a Microsoftnál

Vizsgáljuk meg röviden ezeket az elveket. A transzparencia és az elszámoltathatóság alapvető értékek, amelyekre a többi elv épül - kezdjük ezekkel:

  • Elszámoltathatóság biztosítja, hogy a szakemberek felelősséget vállaljanak adat- és MI-műveleteikért, valamint az etikai elvek betartásáért.
  • Transzparencia biztosítja, hogy az adat- és MI-műveletek érthetőek legyenek a felhasználók számára, megmagyarázva a döntések mögötti mit és miért.
  • Méltányosság - biztosítja, hogy az MI minden embert méltányosan kezeljen, kezelve az adat- és rendszerszintű implicit társadalmi-technikai torzításokat.
  • Megbízhatóság és biztonság - biztosítja, hogy az MI következetesen viselkedjen a meghatározott értékekkel összhangban, minimalizálva a potenciális károkat vagy nem szándékos következményeket.
  • Adatvédelem és biztonság - az adatok eredetének megértéséről és a felhasználók számára adatvédelem és kapcsolódó védelem biztosításáról szól.
  • Befogadás - az MI-megoldások szándékos tervezéséről szól, hogy azok széles körű emberi igényekhez és képességekhez alkalmazkodjanak.

🚨 Gondolkodj el azon, hogy mi lehetne a te adatetikai küldetésnyilatkozatod. Fedezd fel más szervezetek etikus MI-keretrendszereit - itt van néhány példa: IBM, Google, és Facebook. Milyen közös értékeket találsz bennük? Hogyan kapcsolódnak ezek az elvek az általuk működtetett MI-termékekhez vagy iparágakhoz?

2. Etikai kihívások

Miután meghatároztuk az etikai elveket, a következő lépés az adat- és MI-műveleteink értékelése annak érdekében, hogy azok összhangban állnak-e ezekkel a közös értékekkel. Gondolj a cselekedeteidre két kategóriában: adatgyűjtés és algoritmus tervezés.

Az adatok gyűjtése során a műveletek valószínűleg személyes adatokat vagy személyesen azonosítható információkat (PII) érintenek, amelyek azonosítható élő személyekre vonatkoznak. Ez magában foglalja a különféle nem személyes adatokat, amelyek együttesen azonosítanak egy személyt. Az etikai kihívások kapcsolódhatnak az adatvédelemhez, adatbirtokláshoz és kapcsolódó témákhoz, mint például a tájékozott beleegyezés és a felhasználói szellemi tulajdonjogok.

Az algoritmus tervezése során a műveletek magukban foglalják a adatkészletek gyűjtését és kurálását, majd ezek felhasználását adatmodellek betanítására és telepítésére, amelyek valós környezetben jósolnak eredményeket vagy automatizálnak döntéseket. Az etikai kihívások felmerülhetnek az adatkészlet torzításából, adatminőségi problémákból, méltánytalanságból és félrevezetésből az algoritmusokban - beleértve néhány rendszerszintű problémát is.

Mindkét esetben az etikai kihívások olyan területeket emelnek ki, ahol cselekedeteink konfliktusba kerülhetnek közös értékeinkkel. Az ilyen aggályok észleléséhez, enyhítéséhez, minimalizálásához vagy megszüntetéséhez erkölcsi "igen/nem" kérdéseket kell feltennünk a cselekedeteinkkel kapcsolatban, majd szükség esetén korrekciós intézkedéseket kell tennünk. Nézzünk meg néhány etikai kihívást és az általuk felvetett erkölcsi kérdéseket:

2.1 Adatbirtoklás

Az adatok gyűjtése gyakran személyes adatokat érint, amelyek az adat alanyait azonosíthatják. Az adatbirtoklás az adatok létrehozásával, feldolgozásával és terjesztésével kapcsolatos ellenőrzésről és felhasználói jogokról szól.

Az erkölcsi kérdések, amelyeket fel kell tennünk:

  • Ki birtokolja az adatokat? (felhasználó vagy szervezet)
  • Milyen jogai vannak az adat alanyainak? (pl. hozzáférés, törlés, hordozhatóság)
  • Milyen jogai vannak a szervezeteknek? (pl. rosszindulatú felhasználói vélemények helyesbítése)

2.2 Tájékozott beleegyezés

A tájékozott beleegyezés azt jelenti, hogy a felhasználók egy cselekvéshez (például adatgyűjtéshez) teljes körű megértéssel járulnak hozzá, beleértve a célokat, a lehetséges kockázatokat és az alternatívákat.

Itt feltett kérdések:

  • A felhasználó (adat alanya) engedélyt adott az adatok rögzítésére és felhasználására?
  • A felhasználó megértette, hogy mi célból gyűjtötték az adatokat?
  • A felhasználó megértette a részvételéből eredő lehetséges kockázatokat?

2.3 Szellemi tulajdon

A szellemi tulajdon az emberi kezdeményezésből származó immateriális alkotásokra utal, amelyek gazdasági értékkel bírhatnak egyének vagy vállalkozások számára.

Itt feltett kérdések:

  • Az összegyűjtött adatok gazdasági értékkel bírnak-e egy felhasználó vagy vállalkozás számára?
  • Van-e a felhasználónak szellemi tulajdona itt?
  • Van-e a szervezetnek szellemi tulajdona itt?
  • Ha ezek a jogok léteznek, hogyan védjük őket?

2.4 Adatvédelem

Az adatvédelem vagy információs magánélet a felhasználói magánélet megőrzésére és a felhasználói identitás védelmére vonatkozik a személyesen azonosítható információk tekintetében.

Itt feltett kérdések:

  • A felhasználók (személyes) adatai védettek-e a hackelésekkel és szivárgásokkal szemben?
  • A felhasználók adatai csak jogosult felhasználók és kontextusok számára érhetők el?
  • A felhasználók anonimitása megmarad-e, amikor az adatokat megosztják vagy terjesztik?
  • Egy felhasználó Algorithmusok méltányossága azt vizsgálja, hogy az algoritmus tervezése szisztematikusan diszkriminálja-e az adatközösségek bizonyos alcsoportjait, ami potenciális károkat okozhat az erőforrások elosztásában (amikor az erőforrásokat megtagadják vagy visszatartják az adott csoporttól) és a szolgáltatás minőségében (amikor az AI nem olyan pontos bizonyos alcsoportok esetében, mint másoknál).

Kérdések, amelyeket érdemes megvizsgálni:

  • Értékeltük-e a modell pontosságát különböző alcsoportok és körülmények között?
  • Vizsgáltuk-e a rendszert potenciális károk (pl. sztereotípiák) szempontjából?
  • Tudjuk-e módosítani az adatokat vagy újratanítani a modelleket az azonosított károk enyhítése érdekében?

Fedezz fel olyan forrásokat, mint az AI méltányossági ellenőrzőlisták, hogy többet megtudj.

2.9 Félrevezetés

Adataz félrevezetése arra vonatkozik, hogy vajon őszintén jelentett adatokból származó betekintéseket megtévesztő módon kommunikálunk-e, hogy támogassunk egy kívánt narratívát.

Kérdések, amelyeket érdemes megvizsgálni:

  • Jelentünk-e hiányos vagy pontatlan adatokat?
  • Úgy vizualizáljuk-e az adatokat, hogy félrevezető következtetéseket vonjanak le belőlük?
  • Használunk-e szelektív statisztikai technikákat az eredmények manipulálására?
  • Vannak-e alternatív magyarázatok, amelyek más következtetést kínálhatnak?

2.10 Szabad választás

A szabad választás illúziója akkor fordul elő, amikor a rendszer "választási architektúrái" döntéshozó algoritmusokat használnak arra, hogy az embereket egy preferált eredmény felé tereljék, miközben úgy tűnik, hogy lehetőségeket és kontrollt adnak nekik. Ezek a sötét minták társadalmi és gazdasági károkat okozhatnak a felhasználóknak. Mivel a felhasználói döntések befolyásolják a viselkedési profilokat, ezek a cselekvések potenciálisan meghatározhatják a jövőbeli választásokat, amelyek felerősíthetik vagy kiterjeszthetik a károk hatását.

Kérdések, amelyeket érdemes megvizsgálni:

  • Értette-e a felhasználó annak a választásnak a következményeit?
  • Tudott-e a felhasználó az (alternatív) választási lehetőségekről és azok előnyeiről és hátrányairól?
  • Visszafordíthatja-e a felhasználó egy automatizált vagy befolyásolt döntést később?

3. Esettanulmányok

Ahhoz, hogy ezeket az etikai kihívásokat valós kontextusba helyezzük, érdemes olyan esettanulmányokat megvizsgálni, amelyek kiemelik az egyénekre és a társadalomra gyakorolt potenciális károkat és következményeket, amikor az ilyen etikai vétségeket figyelmen kívül hagyják.

Íme néhány példa:

Etikai kihívás Esettanulmány
Tájékozott beleegyezés 1972 - Tuskegee szifilisz tanulmány - Az afrikai-amerikai férfiak, akik részt vettek a tanulmányban, ingyenes orvosi ellátást ígértek, de megtévesztették őket a kutatók, akik nem tájékoztatták őket a diagnózisukról vagy a kezelés elérhetőségéről. Sok alany meghalt, és partnereik vagy gyermekeik is érintettek voltak; a tanulmány 40 évig tartott.
Adatvédelem 2007 - A Netflix adatdíj kutatóknak 10M anonimizált filmértékelést 50K ügyféltől biztosított, hogy javítsák az ajánlási algoritmusokat. Azonban a kutatók képesek voltak az anonimizált adatokat személyazonosító adatokkal összekapcsolni külső adatbázisokban (pl. IMDb kommentek), hatékonyan "deanonimizálva" néhány Netflix előfizetőt.
Gyűjtési torzítás 2013 - Boston városa kifejlesztette a Street Bump alkalmazást, amely lehetővé tette a polgárok számára, hogy kátyúkat jelentsenek, jobb úthálózati adatokat biztosítva a városnak a problémák megtalálásához és javításához. Azonban az alacsonyabb jövedelmű csoportoknak kevesebb hozzáférésük volt autókhoz és telefonokhoz, így az ő úthálózati problémáik láthatatlanok maradtak az alkalmazásban. A fejlesztők akadémikusokkal dolgoztak együtt, hogy méltányos hozzáférést és digitális szakadékokat kezeljenek a méltányosság érdekében.
Algoritmusok méltányossága 2018 - Az MIT Gender Shades Study értékelte a nemek osztályozására szolgáló AI termékek pontosságát, feltárva a pontossági hiányosságokat a nők és színes bőrűek esetében. Egy 2019-es Apple Card látszólag kevesebb hitelt kínált a nőknek, mint a férfiaknak. Mindkettő az algoritmikus torzítás problémáit illusztrálta, amelyek társadalmi-gazdasági károkat okoztak.
Adatok félrevezetése 2020 - A Georgia Egészségügyi Minisztérium COVID-19 grafikonokat tett közzé, amelyek látszólag félrevezették a polgárokat az igazolt esetek trendjeiről, nem kronológiai sorrendben az x-tengelyen. Ez a vizualizációs trükkök általi félrevezetést illusztrálja.
Szabad választás illúziója 2020 - A tanulási alkalmazás ABCmouse 10M dollárt fizetett az FTC panasz rendezésére, ahol a szülők nem tudták lemondani az előfizetéseket, amelyekbe belecsúsztak. Ez a választási architektúrák sötét mintáit illusztrálja, ahol a felhasználókat potenciálisan káros döntések felé terelték.
Adatvédelem és felhasználói jogok 2021 - A Facebook adatvédelmi incidens 530M felhasználó adatait tette ki, ami 5B dolláros egyezséget eredményezett az FTC-vel. Azonban megtagadta a felhasználók értesítését az incidensről, megsértve a felhasználói jogokat az adatátláthatóság és hozzáférés terén.

Szeretnél további esettanulmányokat felfedezni? Nézd meg ezeket a forrásokat:

🚨 Gondolj azokra az esettanulmányokra, amelyeket láttál - tapasztaltál vagy érintett-e hasonló etikai kihívást az életedben? Tudsz legalább egy másik esettanulmányt, amely illusztrálja az ebben a szakaszban tárgyalt etikai kihívások egyikét?

Alkalmazott etika

Beszéltünk az etikai fogalmakról, kihívásokról és esettanulmányokról valós kontextusban. De hogyan kezdhetjük el alkalmazni az etikai elveket és gyakorlatokat a projektjeinkben? És hogyan operacionalizálhatjuk ezeket a gyakorlatokat a jobb irányítás érdekében? Nézzünk meg néhány valós megoldást:

1. Szakmai kódexek

A szakmai kódexek egy lehetőséget kínálnak a szervezetek számára, hogy "ösztönözzék" tagjaikat az etikai elveik és küldetésük támogatására. A kódexek erkölcsi iránymutatások a szakmai viselkedéshez, segítve az alkalmazottakat vagy tagokat olyan döntések meghozatalában, amelyek összhangban vannak a szervezet elveivel. Csak annyira hatékonyak, amennyire a tagok önkéntes megfelelése; azonban sok szervezet további jutalmakat és büntetéseket kínál, hogy motiválja a tagokat a megfelelésre.

Példák:

🚨 Tagja vagy valamilyen szakmai mérnöki vagy adatkutatási szervezetnek? Nézd meg a weboldalukat, hogy meghatároznak-e szakmai etikai kódexet. Mit mond ez az etikai elveikről? Hogyan "ösztönzik" a tagokat a kódex követésére?

2. Etikai ellenőrzőlisták

Míg a szakmai kódexek meghatározzák a szakemberek etikai viselkedését, ismert korlátokkal rendelkeznek a végrehajtásban, különösen nagyszabású projektek esetében. Ehelyett sok adatkutatási szakértő ellenőrzőlistákat javasol, amelyek összekapcsolják az elveket a gyakorlatokkal determinisztikusabb és cselekvőképesebb módon.

Az ellenőrzőlisták a kérdéseket "igen/nem" feladatokká alakítják, amelyek operacionalizálhatók, lehetővé téve, hogy nyomon kövessék őket a szokásos termékkiadási munkafolyamatok részeként.

Példák:

  • Deon - általános célú adatetikai ellenőrzőlista, amelyet iparági ajánlások alapján hoztak létre, parancssori eszközzel a könnyű integráció érdekében.
  • Adatvédelmi audit ellenőrzőlista - általános iránymutatást nyújt az információkezelési gyakorlatokhoz jogi és társadalmi kitettség szempontjából.
  • AI méltányossági ellenőrzőlista - AI szakemberek által létrehozva, hogy támogassák a méltányossági ellenőrzések bevezetését és integrációját az AI fejlesztési ciklusokba.
  • 22 kérdés az adatok és AI etikájáról - nyitottabb keretrendszer, amelyet az etikai kérdések kezdeti feltárására strukturáltak a tervezés, megvalósítás és szervezeti kontextusokban.

3. Etikai szabályozások

Az etika közös értékek meghatározásáról és a helyes cselekvésről szól önkéntesen. Megfelelés arról szól, hogy követjük a törvényt, ha és ahol meghatározták. Irányítás szélesebb értelemben magában foglalja az összes módot, ahogyan a szervezetek működnek az etikai elvek érvényesítése és a meghatározott törvények betartása érdekében.

Ma az irányítás két formát ölt a szervezeteken belül. Először is, az etikus AI elvek meghatározásáról és a gyakorlatok létrehozásáról szól, hogy operacionalizálják az elfogadást az összes AI-val kapcsolatos projektben a szervezeten belül. Másodszor, arról szól, hogy megfeleljenek az összes kormány által előírt adatvédelmi szabályozásnak azokban a régiókban, ahol működnek.

Adatvédelmi és adatvédelmi szabályozások példái:

🚨 Az Európai Unió által meghatározott GDPR (Általános Adatvédelmi Rendelet) ma az egyik legbefolyásosabb adatvédelmi szabályozás. Tudtad, hogy 8 felhasználói jogot is meghatároz a digitális adatvédelem és személyes adatok védelme érdek

Feladat

Írj egy esettanulmányt az adatetikáról


Felelősség kizárása:
Ez a dokumentum az AI fordítási szolgáltatás, a Co-op Translator segítségével lett lefordítva. Bár törekszünk a pontosságra, kérjük, vegye figyelembe, hogy az automatikus fordítások hibákat vagy pontatlanságokat tartalmazhatnak. Az eredeti dokumentum az eredeti nyelvén tekintendő hiteles forrásnak. Kritikus információk esetén javasolt professzionális emberi fordítást igénybe venni. Nem vállalunk felelősséget semmilyen félreértésért vagy téves értelmezésért, amely a fordítás használatából eredhet.