# Uvod u etiku podataka |![ Sketchnote od [(@sketchthedocs)](https://sketchthedocs.dev) ](../../sketchnotes/02-Ethics.png)| |:---:| | Etika znanosti o podacima - _Sketchnote od [@nitya](https://twitter.com/nitya)_ | --- Svi smo mi građani podataka koji živimo u svijetu prepunom podataka. Tržišni trendovi pokazuju da će do 2022. godine 1 od 3 velike organizacije kupovati i prodavati svoje podatke putem online [tržnica i razmjena](https://www.gartner.com/smarterwithgartner/gartner-top-10-trends-in-data-and-analytics-for-2020/). Kao **razvijatelji aplikacija**, lakše ćemo i jeftinije integrirati uvide temeljene na podacima i automatizaciju vođenu algoritmima u svakodnevna korisnička iskustva. No, kako umjetna inteligencija (AI) postaje sveprisutna, morat ćemo razumjeti i potencijalne štete uzrokovane [oružavanjem](https://www.youtube.com/watch?v=TQHs8SA1qpk) takvih algoritama u velikim razmjerima. Trendovi također pokazuju da ćemo do 2025. godine stvoriti i konzumirati preko [180 zettabajta](https://www.statista.com/statistics/871513/worldwide-data-created/) podataka. Kao **znanstvenici o podacima**, to nam daje neviđenu razinu pristupa osobnim podacima. To znači da možemo graditi profile ponašanja korisnika i utjecati na donošenje odluka na načine koji stvaraju [iluziju slobodnog izbora](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice), dok potencijalno usmjeravamo korisnike prema ishodima koji nama odgovaraju. To također otvara šira pitanja o privatnosti podataka i zaštiti korisnika. Etika podataka sada su _nužne smjernice_ za znanost o podacima i inženjering, pomažući nam da minimiziramo potencijalne štete i nenamjerne posljedice naših akcija temeljenih na podacima. [Gartnerov Hype Cycle za AI](https://www.gartner.com/smarterwithgartner/2-megatrends-dominate-the-gartner-hype-cycle-for-artificial-intelligence-2020/) identificira relevantne trendove u digitalnoj etici, odgovornoj AI i upravljanju AI-jem kao ključne pokretače većih megatrendova oko _demokratizacije_ i _industrijalizacije_ AI-ja. ![Gartnerov Hype Cycle za AI - 2020](https://images-cdn.newscred.com/Zz1mOWJhNzlkNDA2ZTMxMWViYjRiOGFiM2IyMjQ1YmMwZQ==) U ovoj lekciji istražit ćemo fascinantno područje etike podataka - od osnovnih koncepata i izazova, do studija slučaja i primijenjenih AI koncepata poput upravljanja - koji pomažu uspostaviti kulturu etike u timovima i organizacijama koje rade s podacima i AI-jem. ## [Kviz prije predavanja](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/2) 🎯 ## Osnovne definicije Počnimo s razumijevanjem osnovne terminologije. Riječ "etika" dolazi od [grčke riječi "ethikos"](https://en.wikipedia.org/wiki/Ethics) (i njenog korijena "ethos") što znači _karakter ili moralna priroda_. **Etika** se odnosi na zajedničke vrijednosti i moralna načela koja upravljaju našim ponašanjem u društvu. Etika se ne temelji na zakonima, već na široko prihvaćenim normama o tome što je "ispravno naspram pogrešnog". Međutim, etička razmatranja mogu utjecati na inicijative korporativnog upravljanja i vladine regulative koje stvaraju više poticaja za usklađenost. **Etika podataka** je [nova grana etike](https://royalsocietypublishing.org/doi/full/10.1098/rsta.2016.0360#sec-1) koja "proučava i procjenjuje moralne probleme povezane s _podacima, algoritmima i odgovarajućim praksama_". Ovdje se **"podaci"** fokusiraju na radnje povezane s generiranjem, bilježenjem, kuriranjem, obradom, širenjem, dijeljenjem i korištenjem, **"algoritmi"** na AI, agente, strojno učenje i robote, a **"prakse"** na teme poput odgovorne inovacije, programiranja, hakiranja i etičkih kodeksa. **Primijenjena etika** je [praktična primjena moralnih razmatranja](https://en.wikipedia.org/wiki/Applied_ethics). To je proces aktivnog istraživanja etičkih pitanja u kontekstu _stvarnih radnji, proizvoda i procesa_ te poduzimanja korektivnih mjera kako bi se osiguralo da ostanu usklađeni s našim definiranim etičkim vrijednostima. **Kultura etike** odnosi se na [_operacionalizaciju_ primijenjene etike](https://hbr.org/2019/05/how-to-design-an-ethical-organization) kako bi se osiguralo da se naši etički principi i prakse dosljedno i skalabilno usvajaju u cijeloj organizaciji. Uspješne kulture etike definiraju etičke principe na razini organizacije, pružaju značajne poticaje za usklađenost i jačaju norme etike poticanjem i pojačavanjem željenih ponašanja na svakoj razini organizacije. ## Koncepti etike U ovom ćemo odjeljku raspraviti koncepte poput **zajedničkih vrijednosti** (principa) i **etičkih izazova** (problema) za etiku podataka - te istražiti **studije slučaja** koje vam pomažu razumjeti te koncepte u stvarnim kontekstima. ### 1. Etički principi Svaka strategija etike podataka započinje definiranjem _etičkih principa_ - "zajedničkih vrijednosti" koje opisuju prihvatljiva ponašanja i vode usklađene radnje u našim projektima s podacima i AI-jem. Možete ih definirati na individualnoj ili timskoj razini. Međutim, većina velikih organizacija ih navodi u misiji ili okviru _etičkog AI-ja_ koji je definiran na korporativnoj razini i dosljedno proveden u svim timovima. **Primjer:** Microsoftova [Misija odgovornog AI-ja](https://www.microsoft.com/en-us/ai/responsible-ai) glasi: _"Predani smo razvoju AI-ja vođenog etičkim principima koji stavljaju ljude na prvo mjesto"_ - identificirajući 6 etičkih principa u okviru ispod: ![Odgovorni AI u Microsoftu](https://docs.microsoft.com/en-gb/azure/cognitive-services/personalizer/media/ethics-and-responsible-use/ai-values-future-computed.png) Pogledajmo ukratko ove principe. _Transparentnost_ i _odgovornost_ su temeljne vrijednosti na kojima se grade ostali principi - pa krenimo od njih: * [**Odgovornost**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) čini praktičare _odgovornima_ za njihove operacije s podacima i AI-jem te usklađenost s ovim etičkim principima. * [**Transparentnost**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) osigurava da su radnje s podacima i AI-jem _razumljive_ (interpretabilne) korisnicima, objašnjavajući što i zašto iza odluka. * [**Pravednost**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1%3aprimaryr6) - fokusira se na osiguravanje da AI tretira _sve ljude_ pravedno, rješavajući bilo kakve sustavne ili implicitne socio-tehničke pristranosti u podacima i sustavima. * [**Pouzdanost i sigurnost**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - osigurava da se AI ponaša _dosljedno_ s definiranim vrijednostima, minimizirajući potencijalne štete ili nenamjerne posljedice. * [**Privatnost i sigurnost**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - odnosi se na razumijevanje porijekla podataka i pružanje _privatnosti podataka i povezanih zaštita_ korisnicima. * [**Uključivost**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - odnosi se na dizajniranje AI rješenja s namjerom, prilagođavajući ih kako bi zadovoljila _širok raspon ljudskih potreba_ i sposobnosti. > 🚨 Razmislite o tome kakva bi mogla biti vaša misija etike podataka. Istražite okvire etičkog AI-ja drugih organizacija - ovdje su primjeri iz [IBM-a](https://www.ibm.com/cloud/learn/ai-ethics), [Googlea](https://ai.google/principles) i [Facebooka](https://ai.facebook.com/blog/facebooks-five-pillars-of-responsible-ai/). Koje zajedničke vrijednosti dijele? Kako se ti principi odnose na AI proizvod ili industriju u kojoj djeluju? ### 2. Etički izazovi Nakon što definiramo etičke principe, sljedeći korak je procijeniti naše radnje s podacima i AI-jem kako bismo vidjeli jesu li usklađene s tim zajedničkim vrijednostima. Razmislite o svojim radnjama u dvije kategorije: _prikupljanje podataka_ i _dizajn algoritama_. Kod prikupljanja podataka, radnje će vjerojatno uključivati **osobne podatke** ili osobno prepoznatljive informacije (PII) za identificirane žive pojedince. To uključuje [različite stavke neosobnih podataka](https://ec.europa.eu/info/law/law-topic/data-protection/reform/what-personal-data_en) koje _zajedno_ identificiraju pojedinca. Etički izazovi mogu se odnositi na _privatnost podataka_, _vlasništvo nad podacima_ i povezane teme poput _informiranog pristanka_ i _prava intelektualnog vlasništva_ korisnika. Kod dizajna algoritama, radnje će uključivati prikupljanje i kuriranje **skupova podataka**, a zatim njihovo korištenje za treniranje i implementaciju **modela podataka** koji predviđaju ishode ili automatiziraju odluke u stvarnim kontekstima. Etički izazovi mogu proizaći iz _pristranosti skupa podataka_, problema s _kvalitetom podataka_, _nepravednosti_ i _pogrešnog predstavljanja_ u algoritmima - uključujući neke probleme koji su sustavne prirode. U oba slučaja, etički izazovi ističu područja gdje naše radnje mogu doći u sukob s našim zajedničkim vrijednostima. Kako bismo otkrili, ublažili, minimizirali ili eliminirali te zabrinutosti, trebamo postavljati moralna "da/ne" pitanja vezana uz naše radnje, a zatim poduzeti korektivne mjere prema potrebi. Pogledajmo neke etičke izazove i moralna pitanja koja postavljaju: #### 2.1 Vlasništvo nad podacima Prikupljanje podataka često uključuje osobne podatke koji mogu identificirati subjekte podataka. [Vlasništvo nad podacima](https://permission.io/blog/data-ownership) odnosi se na _kontrolu_ i [_prava korisnika_](https://permission.io/blog/data-ownership) vezana uz stvaranje, obradu i širenje podataka. Moralna pitanja koja trebamo postaviti su: * Tko posjeduje podatke? (korisnik ili organizacija) * Koja prava imaju subjekti podataka? (npr. pristup, brisanje, prenosivost) * Koja prava imaju organizacije? (npr. ispravljanje zlonamjernih korisničkih recenzija) #### 2.2 Informirani pristanak [Informirani pristanak](https://legaldictionary.net/informed-consent/) definira čin korisnika koji pristaju na radnju (poput prikupljanja podataka) uz _potpuno razumijevanje_ relevantnih činjenica, uključujući svrhu, potencijalne rizike i alternative. Pitanja za istraživanje ovdje su: * Je li korisnik (subjekt podataka) dao dopuštenje za prikupljanje i korištenje podataka? * Je li korisnik razumio svrhu za koju su ti podaci prikupljeni? * Je li korisnik razumio potencijalne rizike od svog sudjelovanja? #### 2.3 Intelektualno vlasništvo [Intelektualno vlasništvo](https://en.wikipedia.org/wiki/Intellectual_property) odnosi se na nematerijalne kreacije koje proizlaze iz ljudske inicijative, a koje mogu _imati ekonomsku vrijednost_ za pojedince ili tvrtke. Pitanja za istraživanje ovdje su: * Jesu li prikupljeni podaci imali ekonomsku vrijednost za korisnika ili tvrtku? * Ima li **korisnik** intelektualno vlasništvo ovdje? * Ima li **organizacija** intelektualno vlasništvo ovdje? * Ako ta prava postoje, kako ih štitimo? #### 2.4 Privatnost podataka [Privatnost podataka](https://www.northeastern.edu/graduate/blog/what-is-data-privacy/) ili informacijska privatnost odnosi se na očuvanje privatnosti korisnika i zaštitu identiteta korisnika u vezi s osobno prepoznatljivim informacijama. Pitanja za istraživanje ovdje su: * Jesu li korisnički (osobni) podaci zaštićeni od hakiranja i curenja? * Jesu li korisnički podaci dostupni samo ovlaštenim korisnicima i kontekstima? * Je li anonimnost korisnika očuvana kada se podaci dijele ili šire? * Može li se korisnik deidentificirati iz anonimiziranih skupova podataka? #### 2.5 Pravo na zaborav [Pravo na zaborav](https://en.wikipedia.org/wiki/Right_to_be_forgotten) ili [Pravo na brisanje](https://www.gdpreu.org/right-to-be-forgotten/) pruža dodatnu zaštitu osobnih podataka korisnicima. Konkretno, daje korisnicima pravo da zatraže brisanje ili uklanjanje osobnih podataka iz internetskih pretraživanja i drugih lokacija, _pod određenim okolnostima_ - omogućujući im novi početak online bez da ih prošle radnje opterećuju. Pitanja za istraživanje ovdje su: * Omogućuje li sustav subjektima podataka da zatraže brisanje? * Treba li povlačenje korisničkog pristanka automatski pokrenuti brisanje? * Jesu li podaci prikupljeni bez pristanka ili nezakonitim sredstvima? * Jesmo li usklađeni s vladinim regulativama za privatnost podataka? #### 2.6 Pristranost skupa podataka Pristranost skupa podataka ili [pristranost prikupljanja](http://researcharticles.com/index.php/bias-in-data-collection-in-research/) odnosi se na odabir _nereprezentativnog_ podskupa podataka za razvoj algoritama, stvarajući potencijalnu nepravednost u ishodima za različite skupine. Vrste pristranosti uključuju pristranost odabira ili uzorkovanja, pristranost volontera i pristranost instrumenata. Pitanja za istraživanje ovdje su: * Jesmo li regrutirali reprezentativan skup subjekata podataka? * Jesmo li testirali naš prikupljeni ili kurirani skup podataka na razne pristranosti? * Možemo li ublažiti ili ukloniti otkrivene pristranosti? #### 2.7 Kvaliteta podataka [Kvaliteta podataka](https://lakefs.io/data-quality-testing/) odnosi se na valjanost kuriranog skupa podataka korištenog za razvoj naših algoritama, provjeravajući zadovoljavaju li značajke i zapisi zahtjeve za razinom točnosti i dosljednosti potrebnom za našu AI svrhu. Pitanja za istraživanje ovdje su: * Jesmo li uhvatili valjane _značajke_ za naš slučaj upotrebe? * Jesu li podaci dosljedno prikupljeni iz različitih izvora podataka? * Je li skup podataka _potpun_ za različite uvjete ili scenarije? * Jesu li informacije točno zabilježene u odražavanju stvarnosti? #### 2.8 Pravednost algoritama [Algorithm Fairness](https://towardsdatascience.com/what-is-algorithm-fairness-3182e161cf9f) provjerava dizajn algoritma kako bi se utvrdilo diskriminira li sustavno određene podskupine ispitanika, što može dovesti do [potencijalnih šteta](https://docs.microsoft.com/en-us/azure/machine-learning/concept-fairness-ml) u _raspodjeli_ (kada se resursi uskraćuju ili odbijaju toj skupini) i _kvaliteti usluge_ (kada AI nije jednako precizan za neke podskupine kao za druge). Pitanja za istraživanje: * Jesmo li procijenili točnost modela za različite podskupine i uvjete? * Jesmo li detaljno analizirali sustav zbog potencijalnih šteta (npr. stereotipiziranja)? * Možemo li revidirati podatke ili ponovno trenirati modele kako bismo ublažili identificirane štete? Istražite resurse poput [AI Fairness checklists](https://query.prod.cms.rt.microsoft.com/cms/api/am/binary/RE4t6dA) za više informacija. #### 2.9 Pogrešno predstavljanje [Pogrešno predstavljanje podataka](https://www.sciencedirect.com/topics/computer-science/misrepresentation) odnosi se na pitanje jesmo li komunikaciju utemeljenu na iskreno prijavljenim podacima koristili na obmanjujući način kako bismo podržali željeni narativ. Pitanja za istraživanje: * Prijavljujemo li nepotpune ili netočne podatke? * Vizualiziramo li podatke na način koji vodi do pogrešnih zaključaka? * Koristimo li selektivne statističke tehnike za manipulaciju rezultatima? * Postoje li alternativna objašnjenja koja mogu ponuditi drugačiji zaključak? #### 2.10 Slobodan izbor [Iluzija slobodnog izbora](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice) događa se kada sustavi "arhitekture izbora" koriste algoritme za donošenje odluka kako bi usmjerili ljude prema preferiranom ishodu, dok im se pritom čini da imaju opcije i kontrolu. Ovi [tamni obrasci](https://www.darkpatterns.org/) mogu uzrokovati društvene i ekonomske štete korisnicima. Budući da odluke korisnika utječu na profile ponašanja, te radnje potencijalno oblikuju buduće izbore, što može pojačati ili proširiti utjecaj tih šteta. Pitanja za istraživanje: * Je li korisnik razumio implikacije donošenja tog izbora? * Je li korisnik bio svjestan (alternativnih) izbora i prednosti i nedostataka svakog? * Može li korisnik kasnije poništiti automatizirani ili utjecani izbor? ### 3. Studije slučaja Kako bismo ove etičke izazove stavili u kontekst stvarnog svijeta, korisno je pogledati studije slučaja koje ističu potencijalne štete i posljedice za pojedince i društvo kada se zanemaruju etička kršenja. Evo nekoliko primjera: | Etički izazov | Studija slučaja | |--- |--- | | **Informirani pristanak** | 1972 - [Tuskegee Syphilis Study](https://en.wikipedia.org/wiki/Tuskegee_Syphilis_Study) - Afroameričkim muškarcima koji su sudjelovali u studiji obećana je besplatna medicinska skrb _ali su ih istraživači obmanuli_ ne informirajući ih o dijagnozi ili dostupnosti liječenja. Mnogi su umrli, a partneri i djeca su bili pogođeni; studija je trajala 40 godina. | | **Privatnost podataka** | 2007 - [Netflix data prize](https://www.wired.com/2007/12/why-anonymous-data-sometimes-isnt/) omogućio je istraživačima pristup _10M anonimnih ocjena filmova od 50K korisnika_ kako bi poboljšali algoritme preporuka. Međutim, istraživači su uspjeli povezati anonimne podatke s osobno identificirajućim podacima u _vanjskim skupovima podataka_ (npr. IMDb komentari) - učinkovito "deanonimizirajući" neke Netflix pretplatnike.| | **Pristranost u prikupljanju podataka** | 2013 - Grad Boston [razvio Street Bump](https://www.boston.gov/transportation/street-bump), aplikaciju koja je omogućila građanima da prijave rupe na cestama, dajući gradu bolje podatke o cestama za pronalaženje i popravak problema. Međutim, [ljudi s nižim prihodima imali su manje pristupa automobilima i telefonima](https://hbr.org/2013/04/the-hidden-biases-in-big-data), čineći njihove probleme s cestama nevidljivima u ovoj aplikaciji. Programeri su surađivali s akademicima na pitanjima _pravednog pristupa i digitalnih podjela_ radi pravednosti. | | **Pravednost algoritma** | 2018 - MIT [Gender Shades Study](http://gendershades.org/overview.html) procijenio je točnost AI proizvoda za klasifikaciju spola, otkrivajući nedostatke u točnosti za žene i osobe tamnije boje kože. [Apple Card iz 2019.](https://www.wired.com/story/the-apple-card-didnt-see-genderand-thats-the-problem/) činilo se da nudi manje kredita ženama nego muškarcima. Oba primjera ilustriraju probleme pristranosti algoritma koji dovode do socio-ekonomskih šteta.| | **Pogrešno predstavljanje podataka** | 2020 - [Odjel za javno zdravstvo Georgije objavio COVID-19 grafikone](https://www.vox.com/covid-19-coronavirus-us-response-trump/2020/5/18/21262265/georgia-covid-19-cases-declining-reopening) koji su izgledali kao da obmanjuju građane o trendovima potvrđenih slučajeva s ne-kronološkim redoslijedom na x-osi. Ovo ilustrira pogrešno predstavljanje kroz trikove vizualizacije. | | **Iluzija slobodnog izbora** | 2020 - Edukacijska aplikacija [ABCmouse platila je $10M za nagodbu s FTC-om](https://www.washingtonpost.com/business/2020/09/04/abcmouse-10-million-ftc-settlement/) gdje su roditelji bili zarobljeni u plaćanju pretplata koje nisu mogli otkazati. Ovo ilustrira tamne obrasce u arhitekturi izbora, gdje su korisnici bili usmjereni prema potencijalno štetnim izborima. | | **Privatnost podataka i prava korisnika** | 2021 - Facebook [curenje podataka](https://www.npr.org/2021/04/09/986005820/after-data-breach-exposes-530-million-facebook-says-it-will-not-notify-users) otkrilo je podatke 530M korisnika, što je rezultiralo nagodbom od $5B s FTC-om. Međutim, odbili su obavijestiti korisnike o curenju, kršeći prava korisnika na transparentnost i pristup podacima. | Želite istražiti više studija slučaja? Pogledajte ove resurse: * [Ethics Unwrapped](https://ethicsunwrapped.utexas.edu/case-studies) - etičke dileme u raznim industrijama. * [Tečaj o etici u znanosti o podacima](https://www.coursera.org/learn/data-science-ethics#syllabus) - ključne studije slučaja. * [Primjeri gdje su stvari krenule po zlu](https://deon.drivendata.org/examples/) - Deon popis s primjerima. > 🚨 Razmislite o studijama slučaja koje ste vidjeli - jeste li doživjeli ili bili pogođeni sličnim etičkim izazovom u svom životu? Možete li se sjetiti barem jedne druge studije slučaja koja ilustrira jedan od etičkih izazova koje smo raspravili u ovom odjeljku? ## Primijenjena etika Razgovarali smo o konceptima etike, izazovima i studijama slučaja u kontekstu stvarnog svijeta. No kako započeti _primjenu_ etičkih načela i praksi u našim projektima? I kako _operacionalizirati_ ove prakse za bolju upravu? Istražimo neka rješenja iz stvarnog svijeta: ### 1. Profesionalni kodeksi Profesionalni kodeksi nude jednu opciju za organizacije da "potaknu" članove na podršku njihovim etičkim načelima i misiji. Kodeksi su _moralne smjernice_ za profesionalno ponašanje, pomažući zaposlenicima ili članovima da donose odluke koje su u skladu s načelima njihove organizacije. Oni su učinkoviti koliko i dobrovoljna usklađenost članova; međutim, mnoge organizacije nude dodatne nagrade i kazne kako bi motivirale članove na usklađenost. Primjeri uključuju: * [Oxford Munich](http://www.code-of-ethics.org/code-of-conduct/) Kodeks etike * [Data Science Association](http://datascienceassn.org/code-of-conduct.html) Kodeks ponašanja (kreiran 2013.) * [ACM Kodeks etike i profesionalnog ponašanja](https://www.acm.org/code-of-ethics) (od 1993.) > 🚨 Pripadate li profesionalnoj organizaciji za inženjering ili znanost o podacima? Istražite njihovu stranicu kako biste vidjeli definiraju li profesionalni kodeks etike. Što to govori o njihovim etičkim načelima? Kako "potiču" članove na pridržavanje kodeksa? ### 2. Etički popisi za provjeru Dok profesionalni kodeksi definiraju potrebna _etička ponašanja_ od praktičara, oni [imaju poznata ograničenja](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md) u provedbi, posebno u projektima velikih razmjera. Umjesto toga, mnogi stručnjaci za znanost o podacima [zagovaraju popise za provjeru](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md), koji mogu **povezati načela s praksama** na deterministički i provediv način. Popisi za provjeru pretvaraju pitanja u zadatke "da/ne" koji se mogu operacionalizirati, omogućujući njihovo praćenje kao dio standardnih tijekova rada za izdavanje proizvoda. Primjeri uključuju: * [Deon](https://deon.drivendata.org/) - opći popis za provjeru etike podataka kreiran prema [preporukama industrije](https://deon.drivendata.org/#checklist-citations) s alatom naredbenog retka za jednostavnu integraciju. * [Popis za provjeru privatnosti](https://cyber.harvard.edu/ecommerce/privacyaudit.html) - pruža opće smjernice za praksu rukovanja informacijama iz pravne i društvene perspektive. * [Popis za provjeru pravednosti AI-a](https://www.microsoft.com/en-us/research/project/ai-fairness-checklist/) - kreiran od strane AI praktičara za podršku usvajanju i integraciji provjera pravednosti u razvojne cikluse AI-a. * [22 pitanja za etiku u podacima i AI-u](https://medium.com/the-organization/22-questions-for-ethics-in-data-and-ai-efb68fd19429) - otvoreniji okvir, strukturiran za početno istraživanje etičkih pitanja u dizajnu, implementaciji i organizacijskim kontekstima. ### 3. Etičke regulative Etika se odnosi na definiranje zajedničkih vrijednosti i činjenje ispravnih stvari _dobrovoljno_. **Usklađenost** se odnosi na _poštivanje zakona_ ako i gdje je definiran. **Upravljanje** općenito pokriva sve načine na koje organizacije djeluju kako bi provele etička načela i uskladile se s utvrđenim zakonima. Danas upravljanje ima dva oblika unutar organizacija. Prvo, radi se o definiranju načela **etičkog AI-a** i uspostavljanju praksi za operacionalizaciju usvajanja u svim AI projektima organizacije. Drugo, radi se o usklađivanju sa svim vladinim propisima o **zaštiti podataka** za regije u kojima djeluje. Primjeri propisa o zaštiti podataka i privatnosti: * `1974`, [US Privacy Act](https://www.justice.gov/opcl/privacy-act-1974) - regulira _saveznu vladu_ u prikupljanju, korištenju i otkrivanju osobnih podataka. * `1996`, [US Health Insurance Portability & Accountability Act (HIPAA)](https://www.cdc.gov/phlp/publications/topic/hipaa.html) - štiti osobne zdravstvene podatke. * `1998`, [US Children's Online Privacy Protection Act (COPPA)](https://www.ftc.gov/enforcement/rules/rulemaking-regulatory-reform-proceedings/childrens-online-privacy-protection-rule) - štiti privatnost podataka djece mlađe od 13 godina. * `2018`, [General Data Protection Regulation (GDPR)](https://gdpr-info.eu/) - pruža prava korisnicima, zaštitu podataka i privatnost. * `2018`, [California Consumer Privacy Act (CCPA)](https://www.oag.ca.gov/privacy/ccpa) daje potrošačima više _prava_ nad njihovim (osobnim) podacima. * `2021`, Kineski [Zakon o zaštiti osobnih podataka](https://www.reuters.com/world/china/china-passes-new-personal-data-privacy-law-take-effect-nov-1-2021-08-20/) upravo je usvojen, stvarajući jedan od najjačih propisa o privatnosti podataka na internetu u svijetu. > 🚨 Europska unija definirala je GDPR (Opća uredba o zaštiti podataka), koji ostaje jedan od najutjecajnijih propisa o privatnosti podataka danas. Jeste li znali da također definira [8 prava korisnika](https://www.freeprivacypolicy.com/blog/8-user-rights-gdpr) za zaštitu digitalne privatnosti i osobnih podataka građana? Saznajte koja su to prava i zašto su važna. ### 4. Kultura etike Napominjemo da i dalje postoji nematerijalni jaz između _usklađenosti_ (činjenja dovoljno da se zadovolji "slovo zakona") i rješavanja [sustavnih problema](https://www.coursera.org/learn/data-science-ethics/home/week/4) (poput osifikacije, asimetrije informacija i distribucijske nepravednosti) koji mogu ubrzati upotrebu AI-a u štetne svrhe. Potonje zahtijeva [suradničke pristupe za definiranje kultura etike](https://towardsdatascience.com/why-ai-ethics-requires-a-culture-driven-approach-26f451afa29f) koje grade emocionalne veze i dosljedne zajedničke vrijednosti _među organizacijama_ u industriji. To poziva na više [formaliziranih kultura etike podataka](https://www.codeforamerica.org/news/formalizing-an-ethical-data-culture/) u organizacijama - omogućujući _svima_ da [povuku Andon kabel](https://en.wikipedia.org/wiki/Andon_(manufacturing)) (kako bi rano ukazali na etičke probleme) i čineći _etičke procjene_ (npr. pri zapošljavanju) ključnim kriterijem za formiranje timova u AI projektima. --- ## [Post-lecture quiz](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/3) 🎯 ## Pregled i samostalno učenje Tečajevi i knjige pomažu u razumijevanju osnovnih etičkih koncepata i izazova, dok studije slučaja i alati pomažu u primjeni etičkih praksi u stvarnim kontekstima. Evo nekoliko resursa za početak. * [Machine Learning For Beginners](https://github.com/microsoft/ML-For-Beginners/blob/main/1-Introduction/3-fairness/README.md) - lekcija o pravednosti, od Microsofta. * [Principi odgovorne umjetne inteligencije](https://docs.microsoft.com/en-us/learn/modules/responsible-ai-principles/) - besplatni obrazovni put na Microsoft Learn platformi. * [Etika i znanost o podacima](https://resources.oreilly.com/examples/0636920203964) - O'Reilly e-knjiga (M. Loukides, H. Mason i dr.) * [Etika u znanosti o podacima](https://www.coursera.org/learn/data-science-ethics#syllabus) - online tečaj Sveučilišta Michigan. * [Etika razotkrivena](https://ethicsunwrapped.utexas.edu/case-studies) - studije slučaja sa Sveučilišta Texas. # Zadatak [Napišite studiju slučaja o etici podataka](assignment.md) --- **Odricanje od odgovornosti**: Ovaj dokument je preveden korištenjem AI usluge za prevođenje [Co-op Translator](https://github.com/Azure/co-op-translator). Iako nastojimo osigurati točnost, imajte na umu da automatski prijevodi mogu sadržavati pogreške ili netočnosti. Izvorni dokument na izvornom jeziku treba smatrati mjerodavnim izvorom. Za ključne informacije preporučuje se profesionalni prijevod od strane stručnjaka. Ne preuzimamo odgovornost za bilo kakve nesporazume ili pogrešne interpretacije proizašle iz korištenja ovog prijevoda.