28 KiB

Raw Permalink Blame History

Uvod u etiku podataka


Etika znanosti o podacima - Sketchnote od @nitya

Svi smo mi građani podataka koji živimo u svijetu prepunom podataka.

Tržišni trendovi pokazuju da će do 2022. godine 1 od 3 velike organizacije kupovati i prodavati svoje podatke putem online tržnica i razmjena. Kao razvijatelji aplikacija, lakše ćemo i jeftinije integrirati uvide temeljene na podacima i automatizaciju vođenu algoritmima u svakodnevna korisnička iskustva. No, kako umjetna inteligencija (AI) postaje sveprisutna, morat ćemo razumjeti i potencijalne štete uzrokovane oružavanjem takvih algoritama u velikim razmjerima.

Trendovi također pokazuju da ćemo do 2025. godine stvoriti i konzumirati preko 180 zettabajta podataka. Kao znanstvenici o podacima, to nam daje neviđenu razinu pristupa osobnim podacima. To znači da možemo graditi profile ponašanja korisnika i utjecati na donošenje odluka na načine koji stvaraju iluziju slobodnog izbora, dok potencijalno usmjeravamo korisnike prema ishodima koji nama odgovaraju. To također otvara šira pitanja o privatnosti podataka i zaštiti korisnika.

Etika podataka sada su nužne smjernice za znanost o podacima i inženjering, pomažući nam da minimiziramo potencijalne štete i nenamjerne posljedice naših akcija temeljenih na podacima. Gartnerov Hype Cycle za AI identificira relevantne trendove u digitalnoj etici, odgovornoj AI i upravljanju AI-jem kao ključne pokretače većih megatrendova oko demokratizacije i industrijalizacije AI-ja.

U ovoj lekciji istražit ćemo fascinantno područje etike podataka - od osnovnih koncepata i izazova, do studija slučaja i primijenjenih AI koncepata poput upravljanja - koji pomažu uspostaviti kulturu etike u timovima i organizacijama koje rade s podacima i AI-jem.

Kviz prije predavanja 🎯

Osnovne definicije

Počnimo s razumijevanjem osnovne terminologije.

Riječ "etika" dolazi od grčke riječi "ethikos" (i njenog korijena "ethos") što znači karakter ili moralna priroda.

Etika se odnosi na zajedničke vrijednosti i moralna načela koja upravljaju našim ponašanjem u društvu. Etika se ne temelji na zakonima, već na široko prihvaćenim normama o tome što je "ispravno naspram pogrešnog". Međutim, etička razmatranja mogu utjecati na inicijative korporativnog upravljanja i vladine regulative koje stvaraju više poticaja za usklađenost.

Etika podataka je nova grana etike koja "proučava i procjenjuje moralne probleme povezane s podacima, algoritmima i odgovarajućim praksama". Ovdje se "podaci" fokusiraju na radnje povezane s generiranjem, bilježenjem, kuriranjem, obradom, širenjem, dijeljenjem i korištenjem, "algoritmi" na AI, agente, strojno učenje i robote, a "prakse" na teme poput odgovorne inovacije, programiranja, hakiranja i etičkih kodeksa.

Primijenjena etika je praktična primjena moralnih razmatranja. To je proces aktivnog istraživanja etičkih pitanja u kontekstu stvarnih radnji, proizvoda i procesa te poduzimanja korektivnih mjera kako bi se osiguralo da ostanu usklađeni s našim definiranim etičkim vrijednostima.

Kultura etike odnosi se na operacionalizaciju primijenjene etike kako bi se osiguralo da se naši etički principi i prakse dosljedno i skalabilno usvajaju u cijeloj organizaciji. Uspješne kulture etike definiraju etičke principe na razini organizacije, pružaju značajne poticaje za usklađenost i jačaju norme etike poticanjem i pojačavanjem željenih ponašanja na svakoj razini organizacije.

Koncepti etike

U ovom ćemo odjeljku raspraviti koncepte poput zajedničkih vrijednosti (principa) i etičkih izazova (problema) za etiku podataka - te istražiti studije slučaja koje vam pomažu razumjeti te koncepte u stvarnim kontekstima.

1. Etički principi

Svaka strategija etike podataka započinje definiranjem etičkih principa - "zajedničkih vrijednosti" koje opisuju prihvatljiva ponašanja i vode usklađene radnje u našim projektima s podacima i AI-jem. Možete ih definirati na individualnoj ili timskoj razini. Međutim, većina velikih organizacija ih navodi u misiji ili okviru etičkog AI-ja koji je definiran na korporativnoj razini i dosljedno proveden u svim timovima.

Primjer: Microsoftova Misija odgovornog AI-ja glasi: "Predani smo razvoju AI-ja vođenog etičkim principima koji stavljaju ljude na prvo mjesto" - identificirajući 6 etičkih principa u okviru ispod:

Pogledajmo ukratko ove principe. Transparentnost i odgovornost su temeljne vrijednosti na kojima se grade ostali principi - pa krenimo od njih:

Odgovornost čini praktičare odgovornima za njihove operacije s podacima i AI-jem te usklađenost s ovim etičkim principima.
Transparentnost osigurava da su radnje s podacima i AI-jem razumljive (interpretabilne) korisnicima, objašnjavajući što i zašto iza odluka.
Pravednost - fokusira se na osiguravanje da AI tretira sve ljude pravedno, rješavajući bilo kakve sustavne ili implicitne socio-tehničke pristranosti u podacima i sustavima.
Pouzdanost i sigurnost - osigurava da se AI ponaša dosljedno s definiranim vrijednostima, minimizirajući potencijalne štete ili nenamjerne posljedice.
Privatnost i sigurnost - odnosi se na razumijevanje porijekla podataka i pružanje privatnosti podataka i povezanih zaštita korisnicima.
Uključivost - odnosi se na dizajniranje AI rješenja s namjerom, prilagođavajući ih kako bi zadovoljila širok raspon ljudskih potreba i sposobnosti.

🚨 Razmislite o tome kakva bi mogla biti vaša misija etike podataka. Istražite okvire etičkog AI-ja drugih organizacija - ovdje su primjeri iz IBM-a, Googlea i Facebooka. Koje zajedničke vrijednosti dijele? Kako se ti principi odnose na AI proizvod ili industriju u kojoj djeluju?

2. Etički izazovi

Nakon što definiramo etičke principe, sljedeći korak je procijeniti naše radnje s podacima i AI-jem kako bismo vidjeli jesu li usklađene s tim zajedničkim vrijednostima. Razmislite o svojim radnjama u dvije kategorije: prikupljanje podataka i dizajn algoritama.

Kod prikupljanja podataka, radnje će vjerojatno uključivati osobne podatke ili osobno prepoznatljive informacije (PII) za identificirane žive pojedince. To uključuje različite stavke neosobnih podataka koje zajedno identificiraju pojedinca. Etički izazovi mogu se odnositi na privatnost podataka, vlasništvo nad podacima i povezane teme poput informiranog pristanka i prava intelektualnog vlasništva korisnika.

Kod dizajna algoritama, radnje će uključivati prikupljanje i kuriranje skupova podataka, a zatim njihovo korištenje za treniranje i implementaciju modela podataka koji predviđaju ishode ili automatiziraju odluke u stvarnim kontekstima. Etički izazovi mogu proizaći iz pristranosti skupa podataka, problema s kvalitetom podataka, nepravednosti i pogrešnog predstavljanja u algoritmima - uključujući neke probleme koji su sustavne prirode.

U oba slučaja, etički izazovi ističu područja gdje naše radnje mogu doći u sukob s našim zajedničkim vrijednostima. Kako bismo otkrili, ublažili, minimizirali ili eliminirali te zabrinutosti, trebamo postavljati moralna "da/ne" pitanja vezana uz naše radnje, a zatim poduzeti korektivne mjere prema potrebi. Pogledajmo neke etičke izazove i moralna pitanja koja postavljaju:

2.1 Vlasništvo nad podacima

Prikupljanje podataka često uključuje osobne podatke koji mogu identificirati subjekte podataka. Vlasništvo nad podacima odnosi se na kontrolu i prava korisnika vezana uz stvaranje, obradu i širenje podataka.

Moralna pitanja koja trebamo postaviti su:

Tko posjeduje podatke? (korisnik ili organizacija)
Koja prava imaju subjekti podataka? (npr. pristup, brisanje, prenosivost)
Koja prava imaju organizacije? (npr. ispravljanje zlonamjernih korisničkih recenzija)

2.2 Informirani pristanak

Informirani pristanak definira čin korisnika koji pristaju na radnju (poput prikupljanja podataka) uz potpuno razumijevanje relevantnih činjenica, uključujući svrhu, potencijalne rizike i alternative.