|
|
5 months ago | |
|---|---|---|
| .. | ||
| README.md | 5 months ago | |
| assignment.md | 6 months ago | |
README.md
Bevezetés az adatetikába
![]() |
|---|
| Adattudományi etika - Sketchnote készítette: @nitya |
Mindannyian adatpolgárok vagyunk egy adatvezérelt világban.
A piaci trendek azt mutatják, hogy 2022-re minden harmadik nagy szervezet online piactereken és tőzsdéken keresztül fog adatokat vásárolni és eladni. Alkalmazásfejlesztőként könnyebb és olcsóbb lesz adatvezérelt betekintéseket és algoritmusvezérelt automatizálást integrálni a mindennapi felhasználói élményekbe. Azonban ahogy az AI egyre elterjedtebbé válik, meg kell értenünk az olyan algoritmusok fegyveresítéséből származó potenciális károkat is, amelyek nagy léptékben működnek.
A trendek azt sugallják, hogy 2025-re több mint 180 zettabájtnyi adatot fogunk generálni és fogyasztani. Adattudósokként ez az információrobbanás példátlan hozzáférést biztosít személyes és viselkedési adatokhoz. Ez lehetőséget ad részletes felhasználói profilok létrehozására és a döntéshozatal finom befolyásolására—gyakran olyan módon, amely egy szabad választás illúzióját kelti. Bár ez felhasználható arra, hogy a felhasználókat preferált eredmények felé tereljük, komoly kérdéseket vet fel az adatvédelemről, autonómiáról és az algoritmikus befolyás etikai határairól.
Az adatetika mostanra szükséges korlátokat jelent az adattudomány és mérnöki munka számára, segítve a potenciális károk és nem szándékos következmények minimalizálását az adatvezérelt cselekvéseinkből. A Gartner AI Hype Cycle azonosítja a digitális etika, a felelős AI és az AI irányítás releváns trendjeit, mint kulcsfontosságú hajtóerőket az AI demokratizálása és iparosítása körüli nagyobb megatrendekhez.
Ebben a leckében az adatetika lenyűgöző területét fogjuk felfedezni—az alapfogalmaktól és kihívásoktól kezdve az esettanulmányokon és alkalmazott AI fogalmakon át, mint az irányítás—amelyek segítenek az etikai kultúra kialakításában az adatokat és AI-t használó csapatokban és szervezetekben.
Előadás előtti kvíz 🎯
Alapvető meghatározások
Kezdjük az alapvető terminológia megértésével.
Az "etika" szó a görög "ethikos" (és annak "ethos" gyökere) szóból származik, amely jellemet vagy erkölcsi természetet jelent.
Etika azokról a közös értékekről és erkölcsi elvekről szól, amelyek irányítják viselkedésünket a társadalomban. Az etika nem törvényeken alapul, hanem széles körben elfogadott normákon arról, hogy mi a "helyes és helytelen". Az etikai megfontolások azonban befolyásolhatják a vállalatirányítási kezdeményezéseket és a kormányzati szabályozásokat, amelyek több ösztönzőt teremtenek a megfelelésre.
Adatetika egy új etikai ág, amely "tanulmányozza és értékeli az adatokkal, algoritmusokkal és kapcsolódó gyakorlatokkal kapcsolatos erkölcsi problémákat". Itt az "adatok" az adatok létrehozásával, rögzítésével, gondozásával, feldolgozásával, terjesztésével, megosztásával és felhasználásával kapcsolatos cselekvésekre összpontosítanak, az "algoritmusok" az AI-ra, ügynökökre, gépi tanulásra és robotokra, míg a "gyakorlatok" olyan témákra, mint a felelős innováció, programozás, hackelés és etikai kódexek.
Alkalmazott etika az erkölcsi megfontolások gyakorlati alkalmazása. Ez az etikai kérdések aktív vizsgálatának folyamata a valós cselekvések, termékek és folyamatok kontextusában, és korrekciós intézkedések megtétele annak érdekében, hogy ezek összhangban maradjanak a meghatározott etikai értékeinkkel.
Etikai kultúra az alkalmazott etika működtetése, hogy biztosítsuk, hogy etikai elveink és gyakorlataink következetesen és skálázható módon kerüljenek alkalmazásra az egész szervezetben. A sikeres etikai kultúrák szervezet-szintű etikai elveket határoznak meg, jelentős ösztönzőket biztosítanak a megfeleléshez, és megerősítik az etikai normákat azáltal, hogy ösztönzik és felerősítik a kívánt viselkedéseket a szervezet minden szintjén.
Etikai fogalmak
Ebben a részben olyan fogalmakat tárgyalunk, mint a közös értékek (elvek) és etikai kihívások (problémák) az adatetikában—valamint esettanulmányokat vizsgálunk, amelyek segítenek megérteni ezeket a fogalmakat a valós helyzetekben.
1. Etikai elvek
Minden adatetikai stratégia az etikai elvek meghatározásával kezdődik—azokkal a "közös értékekkel", amelyek leírják az elfogadható viselkedéseket, és irányítják a megfelelési cselekvéseket adat- és AI-projektjeinkben. Ezeket egyéni vagy csapatszinten is meghatározhatjuk. Azonban a legtöbb nagy szervezet ezeket egy etikus AI küldetésnyilatkozatban vagy keretrendszerben határozza meg, amelyet vállalati szinten definiálnak és következetesen érvényesítenek minden csapatnál.
Példa: A Microsoft Felelős AI küldetésnyilatkozata így szól: "Elkötelezettek vagyunk az AI fejlődése mellett, amelyet etikai elvek vezérelnek, és az embereket helyezik előtérbe"—6 etikai elvet azonosítva az alábbi keretrendszerben:
Nézzük meg röviden ezeket az elveket. A transzparencia és elszámoltathatóság alapvető értékek, amelyekre a többi elv épül—kezdjük ezekkel:
- Elszámoltathatóság arra kötelezi a szakembereket, hogy felelősséget vállaljanak adat- és AI-műveleteikért, valamint az etikai elvek betartásáért.
- Transzparencia biztosítja, hogy az adat- és AI-cselekvések érthetőek legyenek a felhasználók számára, megmagyarázva a döntések mögötti mit és miért.
- Méltányosság arra összpontosít, hogy az AI minden embert méltányosan kezeljen, foglalkozva az adatokban és rendszerekben lévő szisztematikus vagy implicit szociotechnikai torzításokkal.
- Megbízhatóság és biztonság biztosítja, hogy az AI következetesen viselkedjen a meghatározott értékekkel, minimalizálva a potenciális károkat vagy nem szándékos következményeket.
- Adatvédelem és biztonság az adatok eredetének megértéséről szól, és adatvédelemhez kapcsolódó védelmet nyújt a felhasználóknak.
- Befogadás az AI-megoldások szándékos tervezéséről szól, alkalmazkodva a széles körű emberi igényekhez és képességekhez.
🚨 Gondolkodj el azon, hogy mi lehetne az adatetikai küldetésnyilatkozatod. Fedezd fel más szervezetek etikus AI keretrendszereit—példák: IBM, Google, és Facebook. Milyen közös értékekkel rendelkeznek? Hogyan kapcsolódnak ezek az elvek az AI-termékhez vagy iparághoz, amelyben működnek?
2. Etikai kihívások
Miután meghatároztuk az etikai elveket, a következő lépés az adat- és AI-cselekvéseink értékelése, hogy megfelelnek-e ezeknek a közös értékeknek. Gondolj a cselekvésekre két kategóriában: adatgyűjtés és algoritmus tervezés.
Az adatgyűjtés során a cselekvések valószínűleg személyes adatokkal vagy személyesen azonosítható információkkal (PII) kapcsolatosak, amelyek azonosítható élő személyekre vonatkoznak. Ez magában foglalja a különféle nem személyes adatokat, amelyek együttesen azonosítanak egy személyt. Az etikai kihívások kapcsolódhatnak adatvédelemhez, adat tulajdonjoghoz, és kapcsolódó témákhoz, mint tájékozott beleegyezés és szellemi tulajdonjogok a felhasználók számára.
Az algoritmus tervezés során a cselekvések magukban foglalják adatkészletek gyűjtését és gondozását, majd ezek felhasználását adatmodellek képzésére és telepítésére, amelyek valós helyzetekben előrejelzéseket készítenek vagy automatizált döntéseket hoznak. Etikai kihívások merülhetnek fel adatkészlet torzítás, adatminőség problémák, méltánytalanság, és félrevezetés miatt az algoritmusokban—beleértve néhány szisztematikus jellegű problémát.
Mindkét esetben az etikai kihívások olyan területeket emelnek ki, ahol cselekvéseink konfliktusba kerülhetnek közös értékeinkkel. Ezek észleléséhez, enyhítéséhez, minimalizálásához vagy megszüntetéséhez erkölcsi "igen/nem" kérdéseket kell feltennünk cselekvéseinkkel kapcsolatban, majd szükség esetén korrekciós intézkedéseket kell tennünk. Nézzünk meg néhány etikai kihívást és az általuk felvetett erkölcsi kérdéseket:
2.1 Adattulajdonjog
Az adatgyűjtés gyakran személyes adatokat foglal magában, amelyek azonosíthatják az adat alanyait. Az adattulajdonjog az adatok létrehozásával, feldolgozásával és terjesztésével kapcsolatos ellenőrzésről és felhasználói jogokról szól.
Az erkölcsi kérdések, amelyeket fel kell tennünk:
- Ki birtokolja az adatokat? (felhasználó vagy szervezet)
- Milyen jogokkal rendelkeznek az adat alanyai? (pl. hozzáférés, törlés, hordozhatóság)
- Milyen jogokkal rendelkeznek a szervezetek? (pl. rosszindulatú felhasználói vélemények helyesbítése)
2.2 Tájékozott beleegyezés
A tájékozott beleegyezés azt jelenti, hogy a felhasználók beleegyeznek egy cselekvésbe (például adatgyűjtésbe) a releváns tények teljes megértésével, beleértve a célt, a potenciális kockázatokat és az alternatívákat.
Itt felmerülő kérdések:
- A felhasználó (adat alany) engedélyt adott az adatok rögzítésére és felhasználására?
- A felhasználó megértette, hogy miért gyűjtötték az adatokat?
- A felhasználó megértette a részvételéből származó potenciális kockázatokat?
2.3 Szellemi tulajdon
A szellemi tulajdon az emberi kezdeményezésből származó immateriális alkotásokra utal, amelyek gazdasági értékkel bírhatnak egyének vagy vállalkozások számára.
Itt felmerülő kérdések:
- A gyűjtött adatok gazdasági értékkel bírnak-e egy felhasználó vagy vállalkozás számára?
- Van-e a felhasználónak szellemi tulajdona itt?
- Van-e a szervezetnek szellemi tulajdona itt?
- Ha ezek a jogok léteznek, hogyan védjük őket?
2.4 Adatvédelem
Az adatvédelem vagy információs magánélet a felhasználói magánélet megőrzésére és a felhasználói identitás védelmére vonatkozik a személyesen azonosítható információk tekintetében.
Itt felmerülő kérdések:
- A felhasználók (személyes) adatai védettek-e a hackelésekkel és szivárgásokkal szemben?
- A felhasználók adatai csak jogosult felhasználók és kontextusok számára hozzáférhetők?
- A felhasználók anonimitása megmarad-e, amikor az adatokat megosztják vagy terjesztik?
- Lehet-e egy felhasználót azonosítani anonimizált adatkészletekből?
2.5 Az elfeledtetés joga
Az [elfeledtetés joga](https://en
- Tükrözi az információ pontosan a valóságot?
2.8 Algoritmusok méltányossága
Algoritmusok méltányossága azt vizsgálja, hogy az algoritmus tervezése szisztematikusan diszkriminálja-e az adatközlők bizonyos alcsoportjait, ami potenciális károkat okozhat az elosztásban (ahol erőforrásokat tagadnak meg vagy tartanak vissza az adott csoporttól) és a szolgáltatás minőségében (ahol az AI nem olyan pontos bizonyos alcsoportok esetében, mint másoknál).
A következő kérdéseket érdemes megvizsgálni:
- Értékeltük-e a modell pontosságát különböző alcsoportok és feltételek esetében?
- Vizsgáltuk-e a rendszert potenciális károk (pl. sztereotipizálás) szempontjából?
- Tudjuk-e módosítani az adatokat vagy újratanítani a modelleket az azonosított károk enyhítése érdekében?
Fedezze fel az olyan forrásokat, mint az AI méltányossági ellenőrzőlisták, hogy többet megtudjon.
2.9 Félrevezetés
Adatok félrevezetése arról szól, hogy vajon őszintén közölt adatokból származó betekintéseket használunk-e fel megtévesztő módon egy kívánt narratíva támogatására.
A következő kérdéseket érdemes megvizsgálni:
- Jelentünk-e be hiányos vagy pontatlan adatokat?
- Úgy vizualizáljuk-e az adatokat, hogy félrevezető következtetéseket vonjanak le belőlük?
- Használunk-e szelektív statisztikai technikákat az eredmények manipulálására?
- Vannak-e alternatív magyarázatok, amelyek más következtetést kínálhatnak?
2.10 Szabad választás
A szabad választás illúziója akkor fordul elő, amikor a rendszer „választási architektúrái” döntéshozó algoritmusokat használnak arra, hogy az embereket egy preferált eredmény felé tereljék, miközben látszólag lehetőségeket és kontrollt kínálnak nekik. Ezek a sötét minták társadalmi és gazdasági károkat okozhatnak a felhasználóknak. Mivel a felhasználói döntések befolyásolják a viselkedési profilokat, ezek a cselekvések potenciálisan meghatározhatják a jövőbeli választásokat, amelyek felerősíthetik vagy kiterjeszthetik ezen károk hatását.
A következő kérdéseket érdemes megvizsgálni:
- Megértette-e a felhasználó annak a választásnak a következményeit?
- Tudott-e a felhasználó (alternatív) választási lehetőségekről és azok előnyeiről és hátrányairól?
- Visszavonhatja-e a felhasználó egy automatizált vagy befolyásolt döntést később?
3. Esettanulmányok
Ahhoz, hogy ezeket az etikai kihívásokat valós környezetben megértsük, érdemes olyan esettanulmányokat megvizsgálni, amelyek rávilágítanak az egyénekre és a társadalomra gyakorolt potenciális károkra és következményekre, amikor az ilyen etikai vétségeket figyelmen kívül hagyják.
Íme néhány példa:
| Etikai kihívás | Esettanulmány |
|---|---|
| Tájékozott beleegyezés | 1972 - Tuskegee szifilisz tanulmány - Az afrikai-amerikai férfiak, akik részt vettek a tanulmányban, ingyenes orvosi ellátást ígértek, de megtévesztették őket a kutatók, akik nem tájékoztatták őket a diagnózisukról vagy a kezelés elérhetőségéről. Sok alany meghalt, és partnereik vagy gyermekeik is érintettek voltak; a tanulmány 40 évig tartott. |
| Adatvédelem | 2007 - A Netflix adatdíj kutatóknak 10M anonimizált filmértékelést biztosított 50K ügyféltől, hogy javítsák az ajánlási algoritmusokat. Azonban a kutatók képesek voltak az anonimizált adatokat személyazonosító adatokkal összekapcsolni külső adatbázisokban (pl. IMDb kommentek), hatékonyan „deanonimizálva” néhány Netflix előfizetőt. |
| Gyűjtési torzítás | 2013 - Boston városa kifejlesztette a Street Bump alkalmazást, amely lehetővé tette a polgárok számára, hogy kátyúkat jelentsenek, jobb úthálózati adatokat biztosítva a városnak a problémák megtalálásához és javításához. Azonban az alacsonyabb jövedelmű csoportoknak kevesebb hozzáférésük volt autókhoz és telefonokhoz, így az ő úthálózati problémáik láthatatlanok maradtak az alkalmazásban. A fejlesztők akadémikusokkal dolgoztak együtt az egyenlő hozzáférés és digitális szakadék kérdéseinek megoldása érdekében. |
| Algoritmusok méltányossága | 2018 - Az MIT Gender Shades tanulmány értékelte a nemek osztályozására szolgáló AI termékek pontosságát, feltárva a pontossági hiányosságokat a nők és színes bőrűek esetében. Egy 2019-es Apple Card úgy tűnt, hogy kevesebb hitelt kínál a nőknek, mint a férfiaknak. Mindkettő az algoritmikus torzítás problémáit illusztrálta, amelyek társadalmi-gazdasági károkat okoztak. |
| Adatok félrevezetése | 2020 - A Georgia Egészségügyi Minisztérium COVID-19 grafikonokat tett közzé, amelyek félrevezetően mutatták a megerősített esetek trendjeit, nem kronológiai sorrendben az x-tengelyen. Ez a vizualizációs trükkök általi félrevezetést illusztrálja. |
| Szabad választás illúziója | 2020 - Az ABCmouse tanulási alkalmazás 10M dollárt fizetett az FTC panasz rendezésére, ahol a szülők olyan előfizetésekért fizettek, amelyeket nem tudtak lemondani. Ez a választási architektúrák sötét mintáit illusztrálja, ahol a felhasználókat potenciálisan káros döntések felé terelték. |
| Adatvédelem és felhasználói jogok | 2021 - A Facebook adatvédelmi incidens 530M felhasználó adatait tette ki, ami 5B dolláros egyezséget eredményezett az FTC-vel. Azonban megtagadta a felhasználók értesítését az incidensről, megsértve a felhasználói jogokat az adatátláthatóság és hozzáférés terén. |
Szeretne további esettanulmányokat felfedezni? Nézze meg ezeket a forrásokat:
- Ethics Unwrapped - etikai dilemmák különböző iparágakban.
- Data Science Ethics kurzus - mérföldkőnek számító esettanulmányok.
- Hol mentek félre a dolgok - Deon ellenőrzőlista példákkal.
🚨 Gondoljon azokra az esettanulmányokra, amelyeket látott – tapasztalt-e, vagy érintették-e hasonló etikai kihívások az életében? Tud-e legalább egy másik esettanulmányt, amely illusztrálja az ebben a szakaszban tárgyalt etikai kihívások egyikét?
Alkalmazott etika
Beszéltünk az etikai fogalmakról, kihívásokról és esettanulmányokról valós környezetben. De hogyan kezdhetjük el az etikai elvek és gyakorlatok alkalmazását a projektjeinkben? És hogyan valósíthatjuk meg ezeket a gyakorlatokat a jobb irányítás érdekében? Nézzünk meg néhány valós megoldást:
1. Szakmai kódexek
A szakmai kódexek egy lehetőséget kínálnak a szervezetek számára, hogy „ösztönözzék” tagjaikat az etikai elveik és küldetésük támogatására. A kódexek erkölcsi iránymutatások a szakmai viselkedéshez, segítve az alkalmazottakat vagy tagokat olyan döntések meghozatalában, amelyek összhangban vannak a szervezetük elveivel. Csak annyira hatékonyak, amennyire a tagok önkéntes megfelelése; azonban sok szervezet további jutalmakat és büntetéseket kínál, hogy motiválja a tagok megfelelését.
Példák:
- Oxford Munich Etikai Kódex
- Data Science Association Magatartási Kódex (2013-ban készült)
- ACM Etikai Kódex és Szakmai Magatartás (1993 óta)
🚨 Tagja-e valamilyen szakmai mérnöki vagy adatkutatási szervezetnek? Nézze meg a weboldalukat, hogy meghatároznak-e szakmai etikai kódexet. Mit mond ez az etikai elveikről? Hogyan „ösztönzik” a tagokat a kódex követésére?
2. Etikai ellenőrzőlisták
Míg a szakmai kódexek meghatározzák a gyakorlók által megkövetelt etikai viselkedést, ismert korlátokkal rendelkeznek a végrehajtásban, különösen nagyszabású projektek esetében. Ehelyett sok adatkutatási szakértő ellenőrzőlistákat javasol, amelyek összekapcsolják az elveket a gyakorlatokkal determinisztikusabb és cselekvőképesebb módon.
Az ellenőrzőlisták a kérdéseket „igen/nem” feladatokká alakítják, amelyek operacionalizálhatók, lehetővé téve, hogy nyomon kövessék őket a szokásos termékkiadási munkafolyamatok részeként.
Példák:
- Deon - általános célú adatetikai ellenőrzőlista, amelyet iparági ajánlásokból hoztak létre, parancssori eszközzel a könnyű integráció érdekében.
- Adatvédelmi audit ellenőrzőlista - általános iránymutatást nyújt az információkezelési gyakorlatokhoz jogi és társadalmi kitettség szempontjából.
- AI méltányossági ellenőrzőlista - AI szakemberek által létrehozva, hogy támogassák a méltányossági ellenőrzések bevezetését és integrációját az AI fejlesztési ciklusokba.
- 22 kérdés az adatok és AI etikájáról - nyitottabb keretrendszer, amelyet az etikai kérdések kezdeti feltárására terveztek a tervezés, megvalósítás és szervezeti kontextusokban.
3. Etikai szabályozások
Az etika közös értékek meghatározásáról és a helyes cselekvésről szól önkéntesen. Megfelelés arról szól, hogy követjük a törvényt, ha és ahol meghatározták. Irányítás széles körben lefedi az összes módot, ahogyan a szervezetek működnek az etikai elvek érvényesítése és a meghatározott törvények betartása érdekében.
Ma az irányítás két formát ölt a szervezeteken belül. Először is, az etikus AI elvek meghatározásáról és a gyakorlatok létrehozásáról szól, hogy operacionalizálják az elfogadást az összes AI-val kapcsolatos projektben a szervezeten belül. Másodszor, a kormány által előírt adatvédelmi szabályozások betartásáról szól azokban a régiókban, ahol működik.
Adatvédelmi és adatkezelési szabályozások példái:
1974, US Privacy Act - szabályozza a szövetségi kormány személyes adatok gyűjtését, használatát és közzétételét.1996, US Health Insurance Portability & Accountability Act (HIPAA) - védi a személyes egészségügyi adatokat.1998, US Children's Online Privacy Protection Act (COPPA) - védi a 13 év alatti gyermekek adatvédelmét.2018, General Data Protection Regulation (GDPR) - felhasználói jogokat, adatvédelmet és adatbiztonságot biztosít.2018, California Consumer Privacy Act (CCPA) több jogot biztosít a fogyasztóknak a (személyes) adataik felett.2021, Kína Személyes Adatvédelmi Törvénye éppen elfogadva, létrehozva az egyik legerősebb online adatvédelmi szabályozást világszerte.
🚨 Az Európai Unió által meghatározott GDPR (General Data Protection Regulation) ma az egyik legbefolyásosabb adatvédelmi szabályozás. Tudta, hogy ez 8 felhasználói jogot is meghatároz az állampolgárok digitális adatvédelmének és személyes adat
- Machine Learning For Beginners - lecke az igazságosságról, a Microsofttól.
- A Felelős MI Alapelvei - ingyenes tanulási útvonal a Microsoft Learn-től.
- Etika és Adattudomány - O'Reilly e-könyv (M. Loukides, H. Mason és mások)
- Adattudományi Etika - online kurzus a Michigani Egyetemtől.
- Etika Kibontva - esettanulmányok a Texasi Egyetemtől.
Feladat
Írj egy esettanulmányt az adatetikáról
Felelősség kizárása:
Ez a dokumentum az Co-op Translator AI fordítási szolgáltatás segítségével lett lefordítva. Bár törekszünk a pontosságra, kérjük, vegye figyelembe, hogy az automatikus fordítások hibákat vagy pontatlanságokat tartalmazhatnak. Az eredeti dokumentum az eredeti nyelvén tekintendő hiteles forrásnak. Kritikus információk esetén javasolt professzionális emberi fordítást igénybe venni. Nem vállalunk felelősséget semmilyen félreértésért vagy téves értelmezésért, amely a fordítás használatából eredhet.

