History

localizeflow[bot] 4fa2ae4b91 chore(i18n): sync translations with latest source changes (chunk 1/1, 3 changes)		2 weeks ago
..
README.md	chore(i18n): sync translations with latest source changes (chunk 1/1, 3 changes)	2 weeks ago
assignment.md	chore(i18n): sync translations with latest source changes (chunk 1/1, 213 changes)	6 months ago

README.md

Unescape Escape

Увод у етику података


Етика у науци о подацима - Sketchnote by @nitya

Сви смо ми грађани података који живе у свету у којем су подаци свеобухватни.

Трендови на тржишту говоре нам да ће до 2022. године једна од три велике организације куповати и продавати своје податке преко онлајн тржишта и берзи. Као програмери апликација, биће нам лакше и јефтиније да интегришемо увиде добијене из података и аутоматизацију засновану на алгоритмима у свакодневне корисничке доживљаје. Међутим, како вештачка интелигенција постаје све присутнија, мораћемо да разумемо и потенцијалне штете које могу настати због коришћења таквих алгоритама у великом обиму.

Трендови указују да ћемо до 2025. године генерисати и конзумирати преко 180 зетабајтова података. За научнике података, ова експлозија информација пружа невиђени приступ личним и биолошким подацима. Уз то долази моћ да се изграде детаљни профили корисника и суптилно утиче на одлучивање—често на начине који стварају илузију слободног избора. Иако се то може користити да се корисници усмере ка жељеним исходима, такође поставља критична питања о приватности података, аутономији и моралним границама утицаја алгоритама.

Етика података сада представља неопходне ограде за науку о подацима и инжењерство, које нам помажу да минимизирамо потенцијалну штету и нежељене последице наших акција заснованих на подацима. Гартнеров циклус хипе-а за вештачку интелигенцију препознаје релевантне трендове у дигиталној етици, одговорном коришћењу вештачке интелигенције и управљању вештачком интелигенцијом као кључне покретаче већих мегатрендова око демократизације и индустријализације вештачке интелигенције.

У овом часу истражићемо фасцинантно подручје етике података - од кључних појмова и изазова до студија случаја и примењених концепата вештачке интелигенције као што је управљање - који помажу у успостављању културе етике у тимовима и организацијама које раде са подацима и вештачком интелигенцијом.

Претходни квиз 🎯

Основне дефиниције

Хајде да почнемо тако што ћемо разумети основну терминологију.

Реч „етика“ потиче од грчке речи „ethikos“ (и њеног корена „ethos“) која значи карактер или морална природа.

Етика се тиче заједничких вредности и моралних принципа који управљају нашим понашањем у друштву. Етика није заснована на законима већ на широко прихваћеним нормама о томе шта је „право“ а шта „погрешно“. Међутим, етичке процене могу утицати на иницијативе корпоративног управљања и државне прописе који стварају више подстицаја за усаглашеност.

Етика података је нова грана етике која „проучава и процењује моралне проблеме повезане са подацима, алгоритмима и одговарајућим праксама“. Овде се под „податцима“ фокусира на радње везане за генерисање, снимање, уређење, обраду, ширење, дељење и коришћење, „алгоритми“ се односе на вештачку интелигенцију, агенте, машинско учење и роботе, а „практике“ на теме као што су одговорне иновације, програмирање, хаковање и етички кодекси.

Примењена етика је практична примена моралних разматрања. То је процес активног истраживања етичких питања у контексту стварних акција, производа и процеса и предузимања корективних мера како би се обезбедило да те вредности остану у складу са нашим дефинисаним етичким вредностима.

Култура етике је о операционализацији примењене етике како би се осигурало да наши етички принципи и праксе буду доследно и скалабилно усвојени у целој организацији. Успешне културе етике дефинишу етичке принципе широм организације, пружају значајне подстицаје за усаглашеност и јачају етичке норме подстицањем и појачавањем пожељних понашања на сваком нивоу организације.

Пojмови етике

У овом одељку ћемо разговарати о концептима као што су заједничке вредности (принципи) и етички изазови (проблеми) за етику података - и истражити студије случаја које помажу да разумете ове концепте у стварним светским контекстима.

1. Принципи етике

Свака стратегија етике података почиње дефинисањем етичких принципа - „заједничких вредности“ које описују прихватљива понашања и водич су за усаглашене акције у нашим пројектима који укључују податке и вештачку интелигенцију. Ове принципе можете дефинисати на нивоу појединца или тима. Међутим, већина великих организација их наводи у мисији или оквиру око одговорне вештачке интелигенције који је одређен на корпоративном нивоу и доследно спроводи кроз све тимове.

Пример: Microsoft-ова мисија за одговорну вештачку интелигенцију гласи: „Посвећени смо напретку вештачке интелигенције вођене етичким принципима који стављају људе на прво место“ - идентификујући 6 етичких принципа у следећем оквиру:

Хајде да укратко истражимо ове принципе. Прозирност и одговорност су темељне вредности на којима се други принципи ослањају - па почнимо с тим:

Одговорност чини практичаре одговорним за операције са подацима и вештачком интелигенцијом и за усаглашеност са овим етичким принципима.
Прозирност осигурава да су акције са подацима и вештачком интелигенцијом разумљиве (интерпретабилне) корисницима, објашњавајући шта и зашто иза одлука.
Праведност - фокусира се на осигуравање да ВИ третира све људе праведно, решавајући било какве системске или имплицитне социо-техничке предрасуде у подацима и системима.
Поузданост и безбедност - осигурава да ВИ делује доследно са дефинисаним вредностима, минимизирајући потенцијалне штете или нежељене последице.
Приватност и безбедност - односи се на разумевање порекла података, и обезбеђивање приватности података и сродних заштита корисницима.
Инклузивност - односи се на дизајн ВИ решења са намером, прилагођавајући их за задовољење широког спектра људских потреба и способности.

🚨 Размислите о својој могућој мисији етике података. Истражите оквире етике вештачке интелигенције других организација - ево примера из IBM-а, Google-а, и Facebook-а. Које заједничке вредности имају? Како се ти принципи односе на ВИ производ или индустрију у којој раде?

2. Изазови етике

Када дефинишемо етичке принципе, следећи корак је да проценимо наше акције са подацима и вештачком интелигенцијом да видимо да ли су у складу са тим заједничким вредностима. Размислите о вашим акцијама у две категорије: прикупљање података и дизајн алгоритама.

Код прикупљања података, радње ће се вероватно односити на личне податке или лично идентификационе информације (PII) за идентификоване живе појединце. Ово укључује различите ставке непersonalnih podataka које колективно идентификују појединца. Етички изазови могу се односити на приватност података, власништво над подацима и сродне теме као што су информисани пристанак и права интелектуалне својине корисника.

Код дизајна алгоритама, радње ће укључивати прикупљање и уређење скупова података, а затим коришћење истих за тренирање и имплементацију модела података који предвиђају исходе или аутоматизују одлуке у стварном свету. Етички изазови могу настати због пристрасности у скупу података, проблема са квалитетом података, неправедности и погрешне представе у алгоритмима – укључујући и неке проблеме који су системске природе.

У оба случаја, изазови етике истичу области где наши поступци могу доћи у сукоб са заједничким вредностима. Да бисмо открили, ублажили, минимизирали или елиминисали ове бриге – морамо постављати морална „да/не“ питања у вези са нашим акцијама, а затим предузимати корективне мере по потреби. Погледајмо неке етичке изазове и морална питања која они покрећу:

2.1 Власништво над подацима

Прикупљање података често укључује личне податке који могу идентификовати субјекте података. Власништво над подацима односи се на контролу и корисничка права у вези са креирањем, обрадом и ширењем података.

Морална питања која треба поставити су:

Ко је власник података? (корисник или организација)
Која права имају субјекти података? (нпр. приступ, брисање, преносивост)
Која права имају организације? (нпр. исправка злонамерних корисничких рецензија)

2.2 Информисани пристанак

Информисани пристанак дефинише чин сагласности корисника за одређену радњу (као што је прикупљање података) са потпуним разумевањем релевантних чињеница, укључујући сврху, потенцијалне ризике и алтернативе.

Питања за испитивање су:

Да ли је корисник (субјект података) дао дозволу за прикупљање и коришћење података?
Да ли је корисник разумео сврху за коју су подаци прикупљени?
Да ли је корисник разумео потенцијалне ризике од учешћа?

2.3 Интелектуална својина

Интелектуална својина односи се на нематеријалне творевине које произлазе из људске иницијативе и које могу имати економску вредност за појединце или предузећа.

Питања за испитивање су:

Да ли прикупљени подаци имају економску вредност за корисника или предузеће?
Да ли корисник има овде права интелектуалне својине?
Да ли организација има овде права интелектуалне својине?
Ако права постоје, како их штитимо?

2.4 Приватност података

Приватност података или заштита информација односи се на очување корисничке приватности и заштиту идентитета корисника у погледу лично идентификационих информација.

Питања за испитивање су:

Да ли су лични подаци корисника заштићени од провала и цурења?
Да ли су подаци корисника доступни само овлашћеним лицима и у овлашћеним контекстима?
Да ли је анонимност корисника очувана када се подаци деле или шире?
Да ли се корисник може дешифровати из анонимизованих скупова података?

2.5 Право на заборав

Право на заборав или Право на брисање пружа додатну заштиту личних података корисницима. Конкретно, омогућава корисницима да затраже брисање или уклањање личних података из претраживања интернета и других места, под специфичним околностима - што им омогућава нови почетак на мрежи без да се прошлост против њих користи.

Питања за испитивање су:

Да ли систем омогућава субјектима података да захтевају брисање?
Да ли повлачење корисничког пристанка покреће аутоматско брисање?
Да ли су подаци прикупљени без пристанка или незаконитим средствима?
Да ли смо усклађени са државним прописима о заштити података?

2.6 Пристрасност скупова података

Пристрасност у скупу података или пристрасност при прикупљању односи се на избор непредстављивог подскупа података за развој алгоритама, што може створити неправедне резултате за разноврсне групе. Типови пристрасности укључују пристрасност избора или узорковања, пристрасност волонтера и инструменталну пристрасност.

Питања за испитивање су:

Да ли смо ангажовали репрезентативан скуп субјеката података?
Да ли смо тестирали наш прикупљени или уређени скуп података на различите пристрасности?
Можемо ли ублажити или уклонити откривене пристрасности?

2.7 Квалитет података

Квалитет података се односи на валидност уређеног скупa података који користимо за развој наших алгоритама, проверавајући да ли подаци испуњавају захтеве за ниво тачности и доследности потребан за нашу сврху у ВИ.

Питања за испитивање су:

Да ли смо прикупили важеће карактеристике за наш случај употребе?
Да ли су подаци прикупљени доследно из различитих извора података?
Да ли је скуп података комплетан за разне услове или сценарије?
Да ли је информација прикупљена тачно у одражавању стварности?

2.8 Праведност алгоритама

Праведност алгоритама проверава да ли дизајн алгоритма систематски дискриминише одређене подгрупе субјеката података, што води ка потенцијалној штети у расподели (где се ресурси одбијају или ускраћују тој групи) и квалитету услуге (где вештачка интелигенција није подједнако прецизна за неке подгрупе као за друге).

Питања која треба испитати су:

Да ли смо проценили прецизност модела за различите подгрупе и услове?
Да ли смо пажљиво прегледали систем у погледу потенцијалне штете (нпр. стереотипизације)?
Можемо ли изменити податке или поново обучити моделе да ублажимо идентификовану штету?

Истражите ресурсе као што су AI Fairness checklists за више информација.

2.9 Погрешно представљање

Погрешно представљање података поставља питање да ли комуницирамо увиде из поштено пријављених података на обманујући начин да бисмо подржали жељени наратив.

Питања која треба испитати су:

Да ли пријављујемо непотпуне или нетачне податке?
Да ли визуализујемо податке на начин који води до завођења погрешним закључцима?
Да ли користимо селективне статистичке технике за манипулацију резултатима?
Постоје ли алтернативна објашњења која могу понудити другачији закључак?

2.10 Илузија слободног избора

Илузија слободног избора јавља се када "архитектуре избора" система користе алгоритме доношења одлука да нагнају људе ка жељеном исходу, при чему им се чини да имају избор и контролу. Ови мрачни обрасци могу изазвати социјалну и економску штету корисницима. Пошто корисничке одлуке утичу на профиле понашања, ове акције потенцијално покрећу будуће изборе који могу повећати или продужити утицај те штете.

Питања која треба испитати су:

Да ли је корисник разумео импликације доношења тог избора?
Да ли је корисник био упознат са (алтернативним) изборима и предностима и манама сваког?
Може ли корисник касније опозвати аутоматски или утицани избор?

3. Студије случаја

Да бисмо поставили ове етичке изазове у стварне контексте, корисно је погледати студије случаја које илуструју потенцијалну штету и последице по појединце и друштво када се таква кршења етике занемарују.

Ево неколико примера:

Етички изазов	Студија случаја
Информисани пристанак	1972 - Таскиги студија сифилиса - Афроамерички мушкарци који су учествовали у студији добили су обећање о бесплатној медицинској нези, али су их истраживачи заварили јер им нису саопштили дијагнозу нити постојање лечења. Многи су умрли, а партнери и деца били су погођени; студија је трајала 40 година.
Приватност података	2007 - Netflix data prize омогућио је истраживачима 10 милиона анонимизираних рангирања филмова од 50.000 корисника ради побољшања алгоритама препорука. Међутим, истраживачи су успели да корелирају анонимне податке са лично идентификационим подацима у екстерним скуповима података (нпр. коментари на IMDb), ефективно "деанонимизујући" неке претплатнике Netflix-а.
Прикупљање пристрасности	2013 - Град Бостон је развио апликацију Street Bump за пријављивање рупа на путу, пружајући боље податке за идентификовање и поправку проблема. Међутим, људи из нижих прихода имали су ограничен приступ аутомобилима и телефонама, чинећи њихове проблеме невидљивим у апликацији. Развојни тим је сарађивао са академицима на проблемима праведног приступа и дигиталних подела ради праведности.
Праведност алгоритама	2018 - Истраживање MIT Gender Shades проценило је прецизност AI производа за класификацију пола и открило недостатке у прецизности за жене и особе боје. Apple Card 2019 је изгледао као да мање даје кредита женама него мушкарцима. Оба случаја илуструју питања алгоритамске пристрасности која доводе до социо-економске штете.
Погрешно представљање података	2020 - Грузијски одсек за јавно здравље објавио је графиконе COVID-19 који су изгледали као да збуњују грађане о трендовима потврђених случајева непоредним хронолошким редоследом на x-оси. Ово илуструје погрешно представљање кроз трикове визуализације.
Илузија слободног избора	2020 - Апликација за учење ABCmouse платила је 10 милиона долара за решавање жалбе FTC-а у којој су родитељи били приморани да плаћају претплате које нису могли отказати. Ово илуструје мрачне обрасце у архитектурама избора, где су корисници били нагнути ка потенцијално штетним изборима.
Приватност података и корисничка права	2021 - Facebook испад података изложио је податке 530 милиона корисника, што је резултирало нагодбом од 5 милијарди долара са FTC-ом. Међутим, компанија је одбила да обавести кориснике о пропусту, кршећи њихова права на транспарентност и приступ подацима.

Желите ли да истражите више студија случаја? Погледајте ове ресурсе:

Ethics Unwrapped - етичке дилеме из различитих индустрија.
Data Science Ethics course - бави се значајним студијама случаја.
Where things have gone wrong - деон контролне листе са примерима

🚨 Размислите о студијама случаја које сте видели - да ли сте доживели или били погођени сличним етичким изазовом у свом животу? Можете ли се сетити још једне студије случаја која илуструје један од етичких изазова о којима смо разговарали у овом одељку?

Примена етике

Разговарали смо о концептима етике, изазовима и студијама случаја у стварним контекстима. Али како да почнемо да примењујемо етичке принципе и праксе у нашим пројектима? И како да операционализујемо те праксе за боље управљање? Хајде да истражимо нека решења из стварног света:

1. Професионални кодекси

Професионални кодекси нуде једну опцију организацијама да "мотивишу" чланове да подрже њихове етичке принципе и мисију. Кодекси су моралне смернице за професионално понашање, помажући запосленима или члановима да доносе одлуке у складу са принципима организације. Они важе у мери у којој се чланови добровољно придржавају; ипак, многе организације нуде додатне награде и казне ради мотивације поштовања кодекса.

Примери укључују:

Oxford Munich Кодекс етике
Data Science Association Кодекс понашања (настао 2013)
ACM Code of Ethics and Professional Conduct (од 1993)

🚨 Да ли припадате некој професионалној инжењерској или научној организацији за податке? Истражите њихов сајт да видите да ли дефинишу професионални кодекс етике. Шта то говори о њиховим етичким принципима? Како "мотивишу" чланове да поштују тај кодекс?

2. Етичке контролне листе

Док професионални кодекси дефинишу захтевано етичко понашање од стране практичара, они имају позната ограничења у спровођењу, посебно у великим пројектима. Уместо тога, многи стручњаци из области науке о подацима залажу се за контролне листе, које могу повезати принципе са праксама на одређенији и применљивији начин.

Контролне листе претварају питања у задатке "да/не" који се могу операционализовати и пратити као део стандардних процеса пуштања производа.

Примери укључују:

Deon - општа контролна листа о етици података направљена према препорукама индустрије са алатом командне линије за лаку интеграцију.
Privacy Audit Checklist - пружа опште смернице за праксе руковања информацијама из правне и друштвене перспективе.
AI Fairness Checklist - креирана од стране AI стручњака за подршку усвајању и интеграцији провера праведности у циклусе развоја вештачке интелигенције.
22 questions for ethics in data and AI - више отворени оквир, структурисан за почетно истраживање етичких питања у дизајну, имплементацији и организационим контекстима.

3. Регулативе етике

Етика је о дефинисању заједничких вредности и чинењу исправне ствари добровољно. Поштовање регулатива је о придржавању закона где је он дефинисан. Управљање обухвата све начине на које организације делују ради спровођења етичких принципа и законских прописа.

Данас управљање има два облика унутар организација. Прво, ради се о дефинисању принципа етичке вештачке интелигенције и успостављању пракси за оперативну примену у свим AI пројектима у организацији. Друго, ради се о поштовању свих државних прописа о заштити података за регије у којима послује.

Примери прописа о заштити и приватности података:

1974, US Privacy Act - регулише прикупљање, коришћење и објављивање личних података у федералној влади.
1996, US Health Insurance Portability & Accountability Act (HIPAA) - штити личне здравствене податке.
1998, US Children's Online Privacy Protection Act (COPPA) - штити приватност података деце млађе од 13 година.
2018, General Data Protection Regulation (GDPR) - пружа корисничка права, заштиту података и приватност.
2018, California Consumer Privacy Act (CCPA) даје корисницима више права над њиховим (личним) подацима.
2021, Кина је усвојила Закон о заштити личних података, који је један од најстрожих закона о онлајн приватности података на свету.

🚨 Европска унија је дефинисала GDPR (Општа уредба о заштити података) која остаје једна од најутицајнијих регулатива о приватности података данас. Да ли сте знали да она такође дефинише 8 корисничких права за заштиту дигиталне приватности и личних података грађана? Сазнајте која су то права и зашто су важна.

4. Култура етике

Обратите пажњу да постоји нематеријална разлика између поштовања закона (чињење довољног да се испуни "слово закона") и решавања системских проблема (као што су оживљавање структурних неравнина, несиметрија информација и дистрибутивна неправда) који могу убрзати коришћење AI као оружја.

Ово последње захтева сарадничке приступе дефинисању култура етике које граде емотивне везе и конзистентне заједничке вредности између организација у индустрији. То захтева формализованије културе етике података у организацијама – омогућавајући сваком да повуче Andon кабл (да рано пријави етичке проблеме) и да чини етичке процене (нпр. при запошљавању) кључним критеријумом формирања тимова у AI пројектима.

Тест након предавања 🎯

Ревизија и самоучење

Курсеви и књиге помажу у разумевању основних концепата и етичких изазова, док студије случаја и алати помажу у примени етичких пракси у стварним контекстима. Ево неколико ресурса за почетак.

Machine Learning For Beginners - лекција о праведности, од Microsoft-а.
Принципи одговорне вештачке интелигенције - бесплатан курс компаније Microsoft Learn.
Етика и наука о подацима - О’Рајли е-књига (М. Лукидес, Х. Мејсон и др.)
Етика у науци о подацима - онлајн курс Универзитета у Мичигену.
Етика у откривеном облику - студије случаја Универзитета у Тексасу.

Задатак

Напишите студију случая о етици података

Изјава о одрицању одговорности: Овај документ је преведен коришћењем услуге за аутоматски превод Co-op Translator. Иако тежимо тачности, имајте у виду да аутоматски преводи могу садржати грешке или нетачности. Оригинални документ на његовом изворном језику треба сматрати ауторитативним извором. За критичне информације препоручује се професионални људски превод. Нисмо одговорни за било каква неспоразума или погрешна тумачења која произилазе из коришћења овог превода.

README.md Unescape Escape

Увод у етику података

Претходни квиз 🎯

Основне дефиниције

Пojмови етике

1. Принципи етике

2. Изазови етике

2.1 Власништво над подацима

2.2 Информисани пристанак

2.3 Интелектуална својина

2.4 Приватност података

2.5 Право на заборав

2.6 Пристрасност скупова података

2.7 Квалитет података

2.8 Праведност алгоритама

2.9 Погрешно представљање

2.10 Илузија слободног избора

3. Студије случаја

Примена етике

1. Професионални кодекси

2. Етичке контролне листе

3. Регулативе етике

4. Култура етике

Тест након предавања 🎯

Ревизија и самоучење

Задатак

README.md

Unescape Escape