You can not select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.
Data-Science-For-Beginners/translations/uk/1-Introduction/02-ethics
leestott a12f5d4c2d
🌐 Update translations via Co-op Translator
4 months ago
..
README.md 🌐 Update translations via Co-op Translator 4 months ago
assignment.md 🌐 Update translations via Co-op Translator 5 months ago

README.md

Вступ до етики даних

Скетчнот від (@sketchthedocs)
Етика науки про дані - Скетчнот від @nitya

Ми всі є громадянами світу даних, живучи в епоху, де дані відіграють ключову роль.

Ринкові тенденції показують, що до 2022 року кожна третя велика організація буде купувати та продавати свої дані через онлайн маркетплейси та біржі. Як розробники додатків, ми зможемо легше та дешевше інтегрувати аналітику, засновану на даних, та автоматизацію, керовану алгоритмами, у щоденний досвід користувачів. Але з поширенням штучного інтелекту ми також повинні розуміти потенційні загрози, які можуть виникнути через використання таких алгоритмів у масштабах.

Тенденції вказують, що до 2025 року ми будемо генерувати та споживати понад 180 зетабайтів даних. Для науковців з даних цей вибух інформації надає безпрецедентний доступ до персональних та поведінкових даних. Це дає можливість створювати детальні профілі користувачів і тонко впливати на прийняття рішень — часто таким чином, що створюється ілюзія вільного вибору. Хоча це може бути використано для стимулювання користувачів до бажаних результатів, це також піднімає важливі питання про конфіденційність даних, автономію та етичні межі впливу алгоритмів.

Етика даних тепер є необхідними обмеженнями для науки про дані та інженерії, допомагаючи мінімізувати потенційні загрози та непередбачені наслідки наших дій, заснованих на даних. Цикл гіперболічного розвитку Gartner для AI визначає актуальні тенденції в цифровій етиці, відповідальному AI та управлінні AI як ключові рушії для більших мегатрендів навколо демократизації та індустріалізації AI.

Цикл гіперболічного розвитку Gartner для AI - 2020

У цьому уроці ми дослідимо захоплюючу сферу етики даних — від основних концепцій і викликів до кейсів і прикладних концепцій AI, таких як управління, які допомагають створити культуру етики в командах і організаціях, що працюють з даними та AI.

Тест перед лекцією 🎯

Основні визначення

Почнемо з розуміння базової термінології.

Слово "етика" походить від грецького слова "ethikos" (і його кореня "ethos"), що означає характер або моральну природу.

Етика стосується спільних цінностей і моральних принципів, які регулюють нашу поведінку в суспільстві. Етика базується не на законах, а на широко прийнятих нормах того, що є "правильним чи неправильним". Однак етичні міркування можуть впливати на ініціативи корпоративного управління та урядові регуляції, які створюють більше стимулів для дотримання.

Етика даних — це новий напрямок етики, який "вивчає та оцінює моральні проблеми, пов'язані з даними, алгоритмами та відповідними практиками". Тут "дані" зосереджуються на діях, пов'язаних із генерацією, записом, кураторством, обробкою, поширенням, обміном і використанням; "алгоритми" зосереджуються на AI, агентах, машинному навчанні та роботах; а "практики" охоплюють такі теми, як відповідальні інновації, програмування, хакінг і кодекси етики.

Прикладна етика — це практичне застосування моральних міркувань. Це процес активного дослідження етичних питань у контексті реальних дій, продуктів і процесів та вжиття коригувальних заходів для забезпечення їх відповідності визначеним етичним цінностям.

Культура етики — це операціоналізація прикладної етики, щоб гарантувати, що наші етичні принципи та практики приймаються послідовно та масштабовано в усій організації. Успішні культури етики визначають загальноорганізаційні етичні принципи, забезпечують значущі стимули для дотримання та підсилюють норми етики, заохочуючи та підсилюючи бажану поведінку на кожному рівні організації.

Концепції етики

У цьому розділі ми обговоримо такі концепції, як спільні цінності (принципи) та етичні виклики (проблеми) для етики даних, а також розглянемо кейс-стадії, які допоможуть вам зрозуміти ці концепції в реальних контекстах.

1. Принципи етики

Кожна стратегія етики даних починається з визначення етичних принципів — "спільних цінностей", які описують прийнятну поведінку та спрямовують дії, що відповідають нормам, у наших проектах з даними та AI. Ви можете визначити їх на індивідуальному або командному рівні. Однак більшість великих організацій формулюють їх у вигляді місії або рамкової програми етичного AI, яка визначається на корпоративному рівні та послідовно впроваджується у всіх командах.

Приклад: Місія Відповідального AI Microsoft звучить так: "Ми прагнемо до розвитку AI, керованого етичними принципами, які ставлять людей на перше місце" — визначаючи 6 етичних принципів у рамковій програмі нижче:

Відповідальний AI у Microsoft

Давайте коротко розглянемо ці принципи. Прозорість і відповідальність є основними цінностями, на яких будуються інші принципи, тому почнемо з них:

  • Відповідальність робить практиків відповідальними за їхні операції з даними та AI, а також за дотримання цих етичних принципів.
  • Прозорість забезпечує, щоб дії з даними та AI були зрозумілими (інтерпретованими) для користувачів, пояснюючи, що і чому стоїть за рішеннями.
  • Справедливість — зосереджується на забезпеченні того, щоб AI ставився до всіх людей справедливо, вирішуючи будь-які системні або приховані соціально-технічні упередження в даних і системах.
  • Надійність і безпека — гарантує, що AI поводиться послідовно з визначеними цінностями, мінімізуючи потенційні загрози або непередбачені наслідки.
  • Конфіденційність і безпека — стосується розуміння походження даних і забезпечення захисту конфіденційності даних для користувачів.
  • Інклюзивність — це про створення AI-рішень з наміром, адаптуючи їх для задоволення широкого спектру людських потреб і можливостей.

🚨 Подумайте, якою могла б бути ваша місія етики даних. Досліджуйте рамкові програми етичного AI інших організацій — ось приклади від IBM, Google та Facebook. Які спільні цінності вони мають? Як ці принципи пов'язані з продуктом AI або галуззю, в якій вони працюють?

2. Виклики етики

Після того, як ми визначили етичні принципи, наступним кроком є оцінка наших дій з даними та AI, щоб переконатися, що вони відповідають цим спільним цінностям. Подумайте про свої дії у двох категоріях: збір даних та розробка алгоритмів.

При зборі даних дії, ймовірно, будуть включати персональні дані або персонально ідентифіковану інформацію (PII) для ідентифікованих живих осіб. Це включає різноманітні елементи неперсональних даних, які колективно ідентифікують особу. Етичні виклики можуть стосуватися конфіденційності даних, власності даних та пов'язаних тем, таких як інформована згода та права інтелектуальної власності для користувачів.

При розробці алгоритмів дії будуть включати збір і кураторство наборів даних, а потім їх використання для навчання та розгортання моделей даних, які прогнозують результати або автоматизують рішення в реальних контекстах. Етичні виклики можуть виникати через упередженість набору даних, проблеми якості даних, несправедливість та спотворення в алгоритмах — включаючи деякі системні проблеми.

У обох випадках етичні виклики висвітлюють області, де наші дії можуть вступати в конфлікт із нашими спільними цінностями. Щоб виявити, пом'якшити, мінімізувати або усунути ці проблеми, нам потрібно ставити моральні "так/ні" питання щодо наших дій, а потім вживати коригувальних заходів за потреби. Давайте розглянемо деякі етичні виклики та моральні питання, які вони піднімають:

2.1 Власність даних

Збір даних часто включає персональні дані, які можуть ідентифікувати суб'єктів даних. Власність даних стосується контролю та прав користувачів, пов'язаних із створенням, обробкою та поширенням даних.

Моральні питання, які потрібно поставити:

  • Хто володіє даними? (користувач чи організація)
  • Які права мають суб'єкти даних? (наприклад, доступ, видалення, перенесення)
  • Які права мають організації? (наприклад, виправлення шкідливих відгуків користувачів)

2.2 Інформована згода

Інформована згода визначає акт, коли користувачі погоджуються на дію (наприклад, збір даних) з повним розумінням відповідних фактів, включаючи мету, потенційні ризики та альтернативи.

Питання для дослідження:

  • Чи дав користувач (суб'єкт даних) дозвіл на збір та використання даних?
  • Чи розумів користувач мету, для якої ці дані були зібрані?
  • Чи розумів користувач потенційні ризики від своєї участі?

2.3 Інтелектуальна власність

Інтелектуальна власність стосується нематеріальних творінь, що виникають внаслідок людської ініціативи, які можуть мати економічну цінність для осіб або бізнесу.

Питання для дослідження:

  • Чи мали зібрані дані економічну цінність для користувача або бізнесу?
  • Чи має користувач інтелектуальну власність тут?
  • Чи має організація інтелектуальну власність тут?
  • Якщо ці права існують, як ми їх захищаємо?

2.4 Конфіденційність даних

Конфіденційність даних або інформаційна конфіденційність стосується збереження конфіденційності користувачів та захисту їхньої ідентичності щодо персонально ідентифікованої інформації.

Питання для дослідження:

  • Чи захищені дані користувачів (персональні) від хакерських атак та витоків?
  • Чи доступні дані користувачів лише для авторизованих користувачів та контекстів?
  • Чи збережена анонімність користувачів при обміні або поширенні даних?
  • Чи можна деідентифікувати користувача з анонімізованих наборів даних?

2.5 Право бути забутим

Право бути забутим або право на видалення надає додатковий захист персональних даних користувачам. Зокрема, це дає користувачам право вимагати видалення або усунення персональних даних з пошукових систем Інтернету та інших місць, за певних обставин, дозволяючи їм новий старт онлайн без того, щоб минулі дії були використані проти них.

Питання для дослідження:

  • Чи дозволяє система суб'єктам даних запитувати видалення?
  • Чи повинно відкликання згоди користувача автоматично запускати видалення?
  • Чи були дані зібрані без згоди або незаконними засобами?
  • Чи відповідаємо ми урядовим регуляціям щодо конфіденційності даних?

2.6 Упередженість набору даних

Упередженість набору даних або упередженість збору стосується вибору нерепрезентативного підмножини даних для розробки алгоритму, що створює потенційну несправедливість у результатах для різних груп. Типи упередженості включають упередженість вибору або вибірки, упередженість добровольців та упередженість інструментів.

Питання

  • Чи інформація відображає реальність точно?

2.8 Справедливість алгоритмів

Справедливість алгоритмів перевіряє, чи дизайн алгоритму систематично дискримінує певні підгрупи суб'єктів даних, що може призводити до потенційних шкод у розподілі (коли ресурси відмовляють або утримують від цієї групи) та якості обслуговування (коли штучний інтелект менш точний для деяких підгруп порівняно з іншими).

Питання для розгляду:

  • Чи ми оцінювали точність моделі для різних підгруп і умов?
  • Чи ми аналізували систему на предмет потенційних шкод (наприклад, стереотипів)?
  • Чи можемо ми переглянути дані або перенавчити моделі для зменшення виявлених шкод?

Досліджуйте ресурси, такі як контрольні списки справедливості AI, щоб дізнатися більше.

2.9 Неправильне представлення даних

Неправильне представлення даних стосується питання, чи ми передаємо висновки з чесно представлених даних у спосіб, що вводить в оману, щоб підтримати бажаний наратив.

Питання для розгляду:

  • Чи ми повідомляємо неповні або неточні дані?
  • Чи ми візуалізуємо дані так, що це сприяє хибним висновкам?
  • Чи ми використовуємо вибіркові статистичні методи для маніпулювання результатами?
  • Чи існують альтернативні пояснення, які можуть запропонувати інший висновок?

2.10 Свобода вибору

Ілюзія свободи вибору виникає, коли "архітектури вибору" системи використовують алгоритми прийняття рішень, щоб підштовхнути людей до прийняття бажаного результату, водночас створюючи видимість наявності варіантів і контролю. Ці темні патерни можуть завдати соціальної та економічної шкоди користувачам. Оскільки рішення користувачів впливають на профілі поведінки, ці дії потенційно формують майбутні вибори, що можуть посилювати або розширювати вплив цих шкод.

Питання для розгляду:

  • Чи користувач розумів наслідки прийняття цього рішення?
  • Чи користувач був обізнаний про (альтернативні) варіанти та їхні плюси й мінуси?
  • Чи може користувач скасувати автоматизоване або впливове рішення пізніше?

3. Кейси

Щоб розглянути ці етичні виклики в реальних контекстах, корисно ознайомитися з кейсами, які демонструють потенційні шкоди та наслідки для окремих осіб і суспільства, коли такі порушення етики ігноруються.

Ось кілька прикладів:

Етичний виклик Кейси
Інформована згода 1972 - Дослідження сифілісу в Таскігі - афроамериканським чоловікам, які брали участь у дослідженні, обіцяли безкоштовну медичну допомогу, але обманули, не повідомивши про діагноз або доступність лікування. Багато учасників померли, а їхні партнери чи діти постраждали; дослідження тривало 40 років.
Конфіденційність даних 2007 - Конкурс даних Netflix надав дослідникам 10 млн анонімних оцінок фільмів від 50 тис. клієнтів, щоб покращити алгоритми рекомендацій. Однак дослідники змогли зіставити анонімні дані з персонально ідентифікованими даними в зовнішніх наборах даних (наприклад, коментарі IMDb), фактично "деанонімізуючи" деяких підписників Netflix.
Упередженість у зборі даних 2013 - Місто Бостон розробило Street Bump, додаток, який дозволяв громадянам повідомляти про ями, надаючи місту кращі дані про дороги для вирішення проблем. Однак люди з низьким рівнем доходу мали менший доступ до автомобілів і телефонів, що робило їхні проблеми з дорогами невидимими для цього додатка. Розробники співпрацювали з академіками для вирішення питань справедливого доступу та цифрових розривів.
Справедливість алгоритмів 2018 - Дослідження MIT Gender Shades оцінювало точність AI-продуктів для класифікації гендеру, виявляючи прогалини в точності для жінок і людей кольору. У 2019 році Apple Card здавалося, пропонувала менший кредит жінкам, ніж чоловікам. Обидва випадки ілюструють проблеми алгоритмічної упередженості, що призводить до соціально-економічних шкод.
Неправильне представлення даних 2020 - Департамент охорони здоров'я Джорджії опублікував графіки COVID-19, які, здається, вводили громадян в оману щодо тенденцій підтверджених випадків через не-хронологічне упорядкування на осі x. Це ілюструє неправильне представлення через трюки візуалізації.
Ілюзія свободи вибору 2020 - Навчальний додаток ABCmouse заплатив $10 млн для врегулювання скарги FTC, де батьки були змушені платити за підписки, які вони не могли скасувати. Це ілюструє темні патерни в архітектурах вибору, де користувачів підштовхували до потенційно шкідливих рішень.
Конфіденційність даних та права користувачів 2021 - Витік даних Facebook розкрив дані 530 млн користувачів, що призвело до штрафу $5 млрд від FTC. Однак компанія відмовилася повідомити користувачів про витік, порушуючи права користувачів щодо прозорості даних та доступу.

Хочете дослідити більше кейсів? Ознайомтеся з цими ресурсами:

🚨 Подумайте про кейси, які ви бачили - чи ви стикалися або були під впливом подібного етичного виклику у своєму житті? Чи можете ви згадати хоча б один інший кейс, який ілюструє один із етичних викликів, обговорених у цьому розділі?

Прикладна етика

Ми обговорили концепції етики, виклики та кейси в реальних контекстах. Але як почати застосовувати етичні принципи та практики у своїх проектах? І як операціоналізувати ці практики для кращого управління? Давайте розглянемо деякі реальні рішення:

1. Професійні кодекси

Професійні кодекси пропонують один із варіантів для організацій "стимулювати" членів підтримувати їхні етичні принципи та місію. Кодекси є моральними орієнтирами для професійної поведінки, допомагаючи співробітникам або членам приймати рішення, які відповідають принципам їхньої організації. Вони ефективні настільки, наскільки добровільно дотримуються членами; однак багато організацій пропонують додаткові винагороди та санкції для мотивації дотримання.

Приклади:

🚨 Чи ви є членом професійної організації з інженерії або Data Science? Ознайомтеся з їхнім сайтом, щоб дізнатися, чи вони визначають професійний кодекс етики. Що це говорить про їхні етичні принципи? Як вони "стимулюють" членів дотримуватися кодексу?

2. Контрольні списки етики

Хоча професійні кодекси визначають необхідну етичну поведінку від практиків, вони мають відомі обмеження у забезпеченні виконання, особливо в масштабних проектах. Натомість багато експертів з Data Science рекомендують контрольні списки, які можуть перевести принципи в практичні дії у більш детермінований і дієвий спосіб.

Контрольні списки перетворюють питання на завдання "так/ні", які можна операціоналізувати, дозволяючи їх відстежувати як частину стандартних робочих процесів випуску продукту.

Приклади:

3. Регулювання етики

Етика стосується визначення спільних цінностей і добровільного виконання правильних дій. Дотримання стосується виконання закону, якщо він визначений. Управління охоплює всі способи, якими організації забезпечують дотримання етичних принципів і виконання встановлених законів.

Сьогодні управління має дві форми в організаціях. По-перше, це визначення принципів етичного AI та встановлення практик для операціоналізації впровадження у всіх проектах, пов'язаних з AI, в організації. По-друге, це дотримання всіх урядових регуляцій щодо захисту даних, які діють у регіонах, де працює організація.

Приклади регуляцій щодо захисту даних і конфіденційності:

🚨 Європейський Союз визначив GDPR (Загальний регламент захисту даних), який залишається одним із найвпливовіших регуляцій щодо конфіденційності даних сьогодні. Чи знали ви, що він також визначає 8 прав користувачів для захисту цифрової конфіденційності та персональних даних громадян? Дізнайтеся, що це за права і чому вони важливі.

4. Культура етики

Зверніть увагу, що існує невловима різниця між дотриманням (виконанням "букви закону") та вирішенням системних проблем (таких як закостенілість, інформаційна асиметрія та розподільна несправедливість), які можуть прискорити використання AI у шкідливих цілях.

Останнє вимагає спільних підходів до визначення культури етики, які створюють емоційні зв'язки та послідовні спільні цінності в організаціях галузі. Це закликає до більш формалізованих культур етики даних в організаціях - дозволяючи будь-кому потягнути шнур Андон (щоб підняти етичні питання на ранніх етапах процесу) і роблячи етичні оцінки (наприклад, при наймі) основним критерієм формування команди в AI-проектах.


[Тест після лекції](https://ff-quizzes.netlify.app/en/d

Завдання

Напишіть кейс-стадію з етики даних


Відмова від відповідальності:
Цей документ був перекладений за допомогою сервісу автоматичного перекладу Co-op Translator. Хоча ми прагнемо до точності, будь ласка, майте на увазі, що автоматичні переклади можуть містити помилки або неточності. Оригінальний документ на його рідній мові слід вважати авторитетним джерелом. Для критичної інформації рекомендується професійний людський переклад. Ми не несемо відповідальності за будь-які непорозуміння або неправильні тлумачення, що виникають внаслідок використання цього перекладу.