28 KiB

Raw Permalink Blame History

Uvod u etiku podataka


Etika u znanosti o podacima - Sketchnote by @nitya

Svi smo mi građani podataka koji živimo u svijetu prepunom podataka.

Tržišni trendovi pokazuju da će do 2022. godine jedna od tri velike organizacije kupovati i prodavati svoje podatke putem online tržnica i burzi. Kao razvijatelji aplikacija, bit će nam lakše i jeftinije integrirati uvide temeljene na podacima i automatizaciju vođenu algoritmima u svakodnevna korisnička iskustva. No, kako AI postaje sveprisutna, morat ćemo razumjeti i potencijalne štete koje može prouzročiti oružavanje takvih algoritama u velikim razmjerima.

Trendovi također pokazuju da ćemo do 2025. godine stvoriti i konzumirati preko 180 zettabajta podataka. Kao znanstvenici podataka, to nam daje neviđenu razinu pristupa osobnim podacima. To znači da možemo graditi profile ponašanja korisnika i utjecati na donošenje odluka na načine koji stvaraju iluziju slobodnog izbora, dok potencijalno usmjeravamo korisnike prema ishodima koji nama odgovaraju. Također se postavljaju šira pitanja o privatnosti podataka i zaštiti korisnika.

Etika podataka sada su nužne zaštitne mjere za znanost o podacima i inženjering, pomažući nam da minimiziramo potencijalne štete i nenamjerne posljedice naših radnji vođenih podacima. Gartnerov Hype Cycle za AI identificira relevantne trendove u digitalnoj etici, odgovornoj AI i upravljanju AI-jem kao ključne pokretače većih megatrendova oko demokratizacije i industrijalizacije AI-ja.

U ovoj lekciji istražit ćemo fascinantno područje etike podataka - od osnovnih pojmova i izazova, do studija slučaja i primijenjenih AI koncepata poput upravljanja - koji pomažu uspostaviti kulturu etike u timovima i organizacijama koje rade s podacima i AI-jem.

Kviz prije predavanja 🎯

Osnovne definicije

Započnimo razumijevanjem osnovne terminologije.

Riječ "etika" dolazi od grčke riječi "ethikos" (i njenog korijena "ethos") što znači karakter ili moralna priroda.

Etika se odnosi na zajedničke vrijednosti i moralna načela koja upravljaju našim ponašanjem u društvu. Etika se ne temelji na zakonima, već na široko prihvaćenim normama o tome što je "ispravno naspram pogrešnog". Međutim, etička razmatranja mogu utjecati na inicijative korporativnog upravljanja i vladine regulative koje stvaraju više poticaja za usklađenost.

Etika podataka je nova grana etike koja "proučava i procjenjuje moralne probleme povezane s podacima, algoritmima i odgovarajućim praksama". Ovdje se "podaci" fokusiraju na radnje povezane s generiranjem, snimanjem, kuriranjem, obradom, širenjem, dijeljenjem i korištenjem, "algoritmi" se fokusiraju na AI, agente, strojno učenje i robote, a "prakse" se fokusiraju na teme poput odgovorne inovacije, programiranja, hakiranja i etičkih kodeksa.

Primijenjena etika je praktična primjena moralnih razmatranja. To je proces aktivnog istraživanja etičkih pitanja u kontekstu stvarnih radnji, proizvoda i procesa te poduzimanja korektivnih mjera kako bi se osiguralo da ostanu usklađeni s našim definiranim etičkim vrijednostima.

Kultura etike odnosi se na operacionalizaciju primijenjene etike kako bi se osiguralo da se naši etički principi i prakse dosljedno i skalabilno usvajaju u cijeloj organizaciji. Uspješne kulture etike definiraju etičke principe na razini organizacije, pružaju značajne poticaje za usklađenost i jačaju norme etike poticanjem i amplifikacijom željenih ponašanja na svakoj razini organizacije.

Koncepti etike

U ovom dijelu raspravljat ćemo o konceptima poput zajedničkih vrijednosti (principa) i etičkih izazova (problema) za etiku podataka - te istražiti studije slučaja koje vam pomažu razumjeti ove koncepte u stvarnim kontekstima.

1. Principi etike

Svaka strategija etike podataka započinje definiranjem etičkih principa - "zajedničkih vrijednosti" koje opisuju prihvatljiva ponašanja i vode usklađene radnje u našim projektima podataka i AI-ja. Možete ih definirati na individualnoj ili timskoj razini. Međutim, većina velikih organizacija ih navodi u misiji etičkog AI-ja ili okviru koji je definiran na korporativnoj razini i dosljedno proveden u svim timovima.

Primjer: Microsoftova Misija odgovornog AI-ja glasi: "Posvećeni smo razvoju AI-ja vođenog etičkim principima koji stavljaju ljude na prvo mjesto" - identificirajući 6 etičkih principa u okviru ispod:

Kratko istražimo ove principe. Transparentnost i odgovornost su temeljne vrijednosti na kojima se grade ostali principi - pa krenimo od njih:

Odgovornost čini praktičare odgovornima za njihove operacije s podacima i AI-jem te usklađenost s ovim etičkim principima.
Transparentnost osigurava da su radnje s podacima i AI-jem razumljive korisnicima, objašnjavajući što i zašto iza odluka.
Pravednost - fokusira se na osiguravanje da AI sve ljude tretira pravedno, rješavajući sistemske ili implicitne socio-tehničke pristranosti u podacima i sustavima.
Pouzdanost i sigurnost - osigurava da se AI ponaša dosljedno s definiranim vrijednostima, minimizirajući potencijalne štete ili nenamjerne posljedice.
Privatnost i sigurnost - odnosi se na razumijevanje podrijetla podataka i pružanje privatnosti podataka i povezanih zaštita korisnicima.
Uključivost - odnosi se na dizajniranje AI rješenja s namjerom, prilagođavajući ih za zadovoljavanje širokog raspona ljudskih potreba i sposobnosti.

🚨 Razmislite o tome što bi mogla biti vaša misija etike podataka. Istražite okvire etičkog AI-ja drugih organizacija - evo primjera iz IBM-a, Googlea i Facebooka. Koje zajedničke vrijednosti imaju? Kako se ti principi odnose na AI proizvod ili industriju u kojoj djeluju?

2. Etički izazovi

Nakon što definiramo etičke principe, sljedeći korak je procjena naših radnji s podacima i AI-jem kako bismo vidjeli jesu li usklađene s tim zajedničkim vrijednostima. Razmislite o svojim radnjama u dvije kategorije: prikupljanje podataka i dizajn algoritama.

Kod prikupljanja podataka, radnje će vjerojatno uključivati osobne podatke ili osobno prepoznatljive informacije (PII) za identificirane žive pojedince. To uključuje različite stavke neosobnih podataka koje zajedno identificiraju pojedinca. Etički izazovi mogu se odnositi na privatnost podataka, vlasništvo podataka i povezane teme poput informiranog pristanka i prava intelektualnog vlasništva za korisnike.

Kod dizajna algoritama, radnje će uključivati prikupljanje i kuriranje skupova podataka, a zatim njihovo korištenje za treniranje i implementaciju modela podataka koji predviđaju ishode ili automatiziraju odluke u stvarnim kontekstima. Etički izazovi mogu se pojaviti zbog pristranosti skupa podataka, problema kvalitete podataka, nepravednosti i pogrešnog predstavljanja u algoritmima - uključujući neke probleme koji su sistemske prirode.

U oba slučaja, etički izazovi ističu područja gdje naše radnje mogu biti u sukobu s našim zajedničkim vrijednostima. Kako bismo otkrili, ublažili, minimizirali ili eliminirali te zabrinutosti - trebamo postavljati moralna "da/ne" pitanja vezana uz naše radnje, a zatim poduzeti korektivne mjere prema potrebi. Pogledajmo neke etičke izazove i moralna pitanja koja postavljaju:

2.1 Vlasništvo podataka

Prikupljanje podataka često uključuje osobne podatke koji mogu identificirati subjekte podataka. Vlasništvo podataka odnosi se na kontrolu i prava korisnika vezana uz stvaranje, obradu i širenje podataka.

Moralna pitanja koja trebamo postaviti su:

Tko posjeduje podatke? (korisnik ili organizacija)
Koja prava imaju subjekti podataka? (npr. pristup, brisanje, prenosivost)
Koja prava imaju organizacije? (npr. ispravljanje zlonamjernih korisničkih recenzija)

2.2 Informirani pristanak

Informirani pristanak definira čin korisnika koji pristaju na radnju (poput prikupljanja podataka) s potpunim razumijevanjem relevantnih činjenica, uključujući svrhu, potencijalne rizike i alternative.