# مقدمه‌ای بر اخلاق داده

|![طرح‌نگاری توسط [(@sketchthedocs)](https://sketchthedocs.dev)](../../sketchnotes/02-Ethics.png)|
|:---:|
| اخلاق داده در علم داده - _طرح‌نگاری توسط [@nitya](https://twitter.com/nitya)_ |

---

ما همه شهروندان داده‌ای هستیم که در دنیای داده‌محور زندگی می‌کنیم.

روندهای بازار نشان می‌دهند که تا سال ۲۰۲۲، یک‌سوم سازمان‌های بزرگ داده‌های خود را از طریق [بازارها و مبادلات آنلاین](https://www.gartner.com/smarterwithgartner/gartner-top-10-trends-in-data-and-analytics-for-2020/) خرید و فروش خواهند کرد. به عنوان **توسعه‌دهندگان اپلیکیشن**، ما راحت‌تر و ارزان‌تر می‌توانیم بینش‌های مبتنی بر داده و اتوماسیون مبتنی بر الگوریتم را در تجربه‌های روزمره کاربران ادغام کنیم. اما با گسترش هوش مصنوعی، باید آسیب‌های احتمالی ناشی از [سلاح‌سازی](https://www.youtube.com/watch?v=TQHs8SA1qpk) این الگوریتم‌ها در مقیاس بزرگ را نیز درک کنیم.

روندها نشان می‌دهند که تا سال ۲۰۲۵، ما بیش از [۱۸۰ زتابایت](https://www.statista.com/statistics/871513/worldwide-data-created/) داده تولید و مصرف خواهیم کرد. برای **دانشمندان داده**، این انفجار اطلاعات دسترسی بی‌سابقه‌ای به داده‌های شخصی و رفتاری فراهم می‌کند. این قدرت ایجاد پروفایل‌های دقیق کاربران و تأثیرگذاری ظریف بر تصمیم‌گیری‌ها را به همراه دارد—اغلب به گونه‌ای که [توهم انتخاب آزاد](https://www.datasciencecentral.com/the-pareto-set-and-the-paradox-of-choice/) را تقویت می‌کند. در حالی که این می‌تواند کاربران را به سمت نتایج مطلوب هدایت کند، همچنین سوالات مهمی درباره حریم خصوصی داده‌ها، خودمختاری و مرزهای اخلاقی تأثیر الگوریتمی ایجاد می‌کند.

اخلاق داده اکنون به عنوان _محافظ‌های ضروری_ برای علم داده و مهندسی عمل می‌کند، و به ما کمک می‌کند آسیب‌های احتمالی و پیامدهای ناخواسته ناشی از اقدامات مبتنی بر داده را به حداقل برسانیم. [چرخه هیجان گارتنر برای هوش مصنوعی](https://www.gartner.com/smarterwithgartner/2-megatrends-dominate-the-gartner-hype-cycle-for-artificial-intelligence-2020/) روندهای مرتبط با اخلاق دیجیتال، هوش مصنوعی مسئولانه و حاکمیت هوش مصنوعی را به عنوان عوامل کلیدی برای روندهای بزرگ‌تر پیرامون _دموکراتیزه‌سازی_ و _صنعتی‌سازی_ هوش مصنوعی شناسایی می‌کند.

![چرخه هیجان گارتنر برای هوش مصنوعی - ۲۰۲۰](https://images-cdn.newscred.com/Zz1mOWJhNzlkNDA2ZTMxMWViYjRiOGFiM2IyMjQ1YmMwZQ==)

در این درس، ما به بررسی حوزه جذاب اخلاق داده خواهیم پرداخت - از مفاهیم و چالش‌های اصلی گرفته تا مطالعات موردی و مفاهیم کاربردی هوش مصنوعی مانند حاکمیت - که به ایجاد فرهنگ اخلاقی در تیم‌ها و سازمان‌هایی که با داده و هوش مصنوعی کار می‌کنند کمک می‌کند.

## [آزمون پیش از درس](https://ff-quizzes.netlify.app/en/ds/quiz/2) 🎯

## تعاریف پایه

بیایید با درک اصطلاحات پایه شروع کنیم.

کلمه "اخلاق" از [کلمه یونانی "ethikos"](https://en.wikipedia.org/wiki/Ethics) (و ریشه آن "ethos") به معنای _شخصیت یا طبیعت اخلاقی_ گرفته شده است.

**اخلاق** درباره ارزش‌های مشترک و اصول اخلاقی است که رفتار ما در جامعه را هدایت می‌کنند. اخلاق بر اساس قوانین نیست بلکه بر اساس هنجارهای پذیرفته‌شده عمومی درباره "درست در مقابل غلط" است. با این حال، ملاحظات اخلاقی می‌توانند بر ابتکارات حاکمیت شرکتی و مقررات دولتی تأثیر بگذارند که انگیزه‌های بیشتری برای رعایت ایجاد می‌کنند.

**اخلاق داده** یک [شاخه جدید از اخلاق](https://royalsocietypublishing.org/doi/full/10.1098/rsta.2016.0360#sec-1) است که "مشکلات اخلاقی مرتبط با _داده‌ها، الگوریتم‌ها و شیوه‌های مربوطه_ را مطالعه و ارزیابی می‌کند". در اینجا، **"داده‌ها"** بر اقدامات مرتبط با تولید، ضبط، مدیریت، پردازش، انتشار، اشتراک‌گذاری و استفاده تمرکز دارند، **"الگوریتم‌ها"** بر هوش مصنوعی، عوامل، یادگیری ماشین و ربات‌ها تمرکز دارند، و **"شیوه‌ها"** بر موضوعاتی مانند نوآوری مسئولانه، برنامه‌نویسی، هک کردن و کدهای اخلاقی تمرکز دارند.

**اخلاق کاربردی** [کاربرد عملی ملاحظات اخلاقی](https://en.wikipedia.org/wiki/Applied_ethics) است. این فرآیند بررسی فعالانه مسائل اخلاقی در زمینه _اقدامات، محصولات و فرآیندهای واقعی_ و اتخاذ اقدامات اصلاحی برای اطمینان از هم‌راستایی آنها با ارزش‌های اخلاقی تعریف‌شده ما است.

**فرهنگ اخلاقی** درباره [_عملیاتی کردن_ اخلاق کاربردی](https://hbr.org/2019/05/how-to-design-an-ethical-organization) است تا اطمینان حاصل شود که اصول و شیوه‌های اخلاقی ما به طور مداوم و مقیاس‌پذیر در سراسر سازمان پذیرفته می‌شوند. فرهنگ‌های اخلاقی موفق اصول اخلاقی سازمانی را تعریف می‌کنند، انگیزه‌های معناداری برای رعایت ارائه می‌دهند و هنجارهای اخلاقی را با تشویق و تقویت رفتارهای مطلوب در هر سطح سازمان تقویت می‌کنند.

## مفاهیم اخلاقی

در این بخش، ما مفاهیمی مانند **ارزش‌های مشترک** (اصول) و **چالش‌های اخلاقی** (مشکلات) برای اخلاق داده را بررسی خواهیم کرد - و **مطالعات موردی** را بررسی خواهیم کرد که به شما کمک می‌کنند این مفاهیم را در زمینه‌های واقعی درک کنید.

### 1. اصول اخلاقی

هر استراتژی اخلاق داده با تعریف _اصول اخلاقی_ آغاز می‌شود - "ارزش‌های مشترک" که رفتارهای قابل قبول را توصیف می‌کنند و اقدامات مطابق را در پروژه‌های داده و هوش مصنوعی ما هدایت می‌کنند. شما می‌توانید این اصول را در سطح فردی یا تیمی تعریف کنید. با این حال، بیشتر سازمان‌های بزرگ این اصول را در قالب بیانیه مأموریت یا چارچوب _هوش مصنوعی اخلاقی_ در سطح شرکتی تعریف می‌کنند و به طور مداوم در سراسر تیم‌ها اجرا می‌کنند.

**مثال:** بیانیه مأموریت [هوش مصنوعی مسئولانه](https://www.microsoft.com/en-us/ai/responsible-ai) مایکروسافت می‌گوید: _"ما متعهد به پیشرفت هوش مصنوعی بر اساس اصول اخلاقی هستیم که انسان‌ها را در اولویت قرار می‌دهد"_ - و ۶ اصل اخلاقی را در چارچوب زیر شناسایی می‌کند:

![هوش مصنوعی مسئولانه در مایکروسافت](https://docs.microsoft.com/en-gb/azure/cognitive-services/personalizer/media/ethics-and-responsible-use/ai-values-future-computed.png)

بیایید این اصول را به طور مختصر بررسی کنیم. _شفافیت_ و _مسئولیت‌پذیری_ ارزش‌های بنیادی هستند که سایر اصول بر اساس آنها ساخته شده‌اند - بنابراین از اینجا شروع می‌کنیم:

* [**مسئولیت‌پذیری**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) متخصصان را _مسئول_ عملیات داده و هوش مصنوعی خود و رعایت این اصول اخلاقی می‌کند.
* [**شفافیت**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) اطمینان می‌دهد که اقدامات داده و هوش مصنوعی برای کاربران _قابل فهم_ (قابل تفسیر) هستند و توضیح می‌دهند که چه چیزی و چرا پشت تصمیمات قرار دارد.
* [**عدالت**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1%3aprimaryr6) - بر اطمینان از رفتار عادلانه هوش مصنوعی با _همه افراد_ تمرکز دارد و به هرگونه تعصب اجتماعی-فنی سیستماتیک یا ضمنی در داده‌ها و سیستم‌ها می‌پردازد.
* [**قابلیت اطمینان و ایمنی**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - اطمینان می‌دهد که هوش مصنوعی به طور _ثابت_ با ارزش‌های تعریف‌شده رفتار می‌کند و آسیب‌های احتمالی یا پیامدهای ناخواسته را به حداقل می‌رساند.
* [**حریم خصوصی و امنیت**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - درباره درک منشأ داده‌ها و ارائه _حریم خصوصی داده و حفاظت‌های مرتبط_ به کاربران است.
* [**شمول‌پذیری**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - درباره طراحی راه‌حل‌های هوش مصنوعی با قصد، و تطبیق آنها برای پاسخگویی به _طیف گسترده‌ای از نیازها و قابلیت‌های انسانی_ است.

> 🚨 به این فکر کنید که بیانیه مأموریت اخلاق داده شما چه می‌تواند باشد. چارچوب‌های هوش مصنوعی اخلاقی از سازمان‌های دیگر را بررسی کنید - اینجا نمونه‌هایی از [IBM](https://www.ibm.com/cloud/learn/ai-ethics)، [Google](https://ai.google/principles)، و [Facebook](https://ai.facebook.com/blog/facebooks-five-pillars-of-responsible-ai/) آورده شده است. چه ارزش‌های مشترکی دارند؟ این اصول چگونه به محصول هوش مصنوعی یا صنعتی که در آن فعالیت می‌کنند مرتبط هستند؟

### 2. چالش‌های اخلاقی

پس از تعریف اصول اخلاقی، گام بعدی ارزیابی اقدامات داده و هوش مصنوعی ما است تا ببینیم آیا با آن ارزش‌های مشترک هم‌راستا هستند یا خیر. به اقدامات خود در دو دسته فکر کنید: _جمع‌آوری داده‌ها_ و _طراحی الگوریتم_.

در جمع‌آوری داده‌ها، اقدامات احتمالاً شامل **داده‌های شخصی** یا اطلاعات قابل شناسایی شخصی (PII) برای افراد قابل شناسایی خواهد بود. این شامل [موارد متنوعی از داده‌های غیرشخصی](https://ec.europa.eu/info/law/law-topic/data-protection/reform/what-personal-data_en) است که _به طور جمعی_ یک فرد را شناسایی می‌کنند. چالش‌های اخلاقی می‌توانند به موضوعاتی مانند _حریم خصوصی داده‌ها_، _مالکیت داده‌ها_ و موضوعات مرتبط مانند _رضایت آگاهانه_ و _حقوق مالکیت معنوی_ برای کاربران مرتبط باشند.

در طراحی الگوریتم، اقدامات شامل جمع‌آوری و مدیریت **مجموعه داده‌ها** و سپس استفاده از آنها برای آموزش و استقرار **مدل‌های داده** است که نتایج را پیش‌بینی می‌کنند یا تصمیمات را در زمینه‌های واقعی خودکار می‌کنند. چالش‌های اخلاقی می‌توانند از _تعصب مجموعه داده‌ها_، مشکلات _کیفیت داده‌ها_، _بی‌عدالتی_ و _نمایش نادرست_ در الگوریتم‌ها ناشی شوند - از جمله برخی مسائل که ذاتاً سیستماتیک هستند.

در هر دو مورد، چالش‌های اخلاقی مناطقی را برجسته می‌کنند که اقدامات ما ممکن است با ارزش‌های مشترک ما در تضاد باشند. برای شناسایی، کاهش، به حداقل رساندن یا حذف این نگرانی‌ها - باید سوالات اخلاقی "بله/خیر" مرتبط با اقدامات خود را بپرسیم و سپس اقدامات اصلاحی لازم را انجام دهیم. بیایید نگاهی به برخی چالش‌های اخلاقی و سوالات اخلاقی که مطرح می‌کنند بیندازیم:

#### 2.1 مالکیت داده‌ها

جمع‌آوری داده‌ها اغلب شامل داده‌های شخصی است که می‌تواند افراد داده‌شده را شناسایی کند. [مالکیت داده‌ها](https://permission.io/blog/data-ownership) درباره _کنترل_ و [_حقوق کاربران_](https://permission.io/blog/data-ownership) مرتبط با ایجاد، پردازش و انتشار داده‌ها است.

سوالات اخلاقی که باید پرسیده شوند:
* چه کسی مالک داده‌ها است؟ (کاربر یا سازمان)
* چه حقوقی برای افراد داده‌شده وجود دارد؟ (مثلاً دسترسی، حذف، قابلیت انتقال)
* چه حقوقی برای سازمان‌ها وجود دارد؟ (مثلاً اصلاح نظرات مخرب کاربران)

#### 2.2 رضایت آگاهانه

[رضایت آگاهانه](https://legaldictionary.net/informed-consent/) عمل موافقت کاربران با یک اقدام (مانند جمع‌آوری داده‌ها) با _درک کامل_ حقایق مرتبط از جمله هدف، خطرات احتمالی و جایگزین‌ها را تعریف می‌کند.

سوالاتی که باید بررسی شوند:
* آیا کاربر (فرد داده‌شده) اجازه جمع‌آوری و استفاده از داده‌ها را داده است؟
* آیا کاربر هدف از جمع‌آوری داده‌ها را درک کرده است؟
* آیا کاربر خطرات احتمالی ناشی از مشارکت خود را درک کرده است؟

#### 2.3 مالکیت معنوی

[مالکیت معنوی](https://en.wikipedia.org/wiki/Intellectual_property) به آفرینش‌های غیرملموس ناشی از ابتکار انسانی اشاره دارد که ممکن است _ارزش اقتصادی_ برای افراد یا کسب‌وکارها داشته باشد.

سوالاتی که باید بررسی شوند:
* آیا داده‌های جمع‌آوری‌شده ارزش اقتصادی برای یک کاربر یا کسب‌وکار دارند؟
* آیا **کاربر** مالکیت معنوی در اینجا دارد؟
* آیا **سازمان** مالکیت معنوی در اینجا دارد؟
* اگر این حقوق وجود دارند، چگونه آنها را محافظت می‌کنیم؟

#### 2.4 حریم خصوصی داده‌ها

[حریم خصوصی داده‌ها](https://www.northeastern.edu/graduate/blog/what-is-data-privacy/) یا حریم اطلاعات به حفظ حریم خصوصی کاربران و حفاظت از هویت کاربران در ارتباط با اطلاعات قابل شناسایی شخصی اشاره دارد.

سوالاتی که باید بررسی شوند:
* آیا داده‌های (شخصی) کاربران در برابر هک‌ها و نشت‌ها ایمن هستند؟
* آیا داده‌های کاربران فقط برای کاربران و زمینه‌های مجاز قابل دسترسی هستند؟
* آیا ناشناس بودن کاربران هنگام اشتراک‌گذاری یا انتشار داده‌ها حفظ می‌شود؟
* آیا می‌توان یک کاربر را از مجموعه داده‌های ناشناس شناسایی کرد؟

#### 2.5 حق فراموش شدن

[حق فراموش شدن](https://en.wikipedia.org/wiki/Right_to_be_forgotten) یا [حق حذف](https://www.gdpreu.org/right-to-be-forgotten/) حفاظت اضافی از داده‌های شخصی را برای کاربران فراهم می‌کند. به طور خاص، این حق به کاربران اجازه می‌دهد درخواست حذف یا حذف داده‌های شخصی از جستجوهای اینترنتی و مکان‌های دیگر را _تحت شرایط خاص_ بدهند - به آنها اجازه می‌دهد یک شروع تازه آنلاین داشته باشند بدون اینکه اقدامات گذشته علیه آنها استفاده شود.

سوالاتی که باید بررسی شوند:
* آیا سیستم اجازه می‌دهد افراد داده‌شده درخواست حذف کنند؟
* آیا باید انصراف کاربر از رضایت باعث حذف خودکار شود؟
* آیا داده‌ها بدون رضایت یا به روش‌های غیرقانونی جمع‌آوری شده‌اند؟
* آیا ما با مقررات دولتی برای حریم خصوصی داده‌ها مطابقت داریم؟

#### 2.6 تعصب مجموعه داده‌ها

تعصب مجموعه داده‌ها یا [تعصب جمع‌آوری](http://researcharticles.com/index.php/bias-in-data-collection-in-research/) درباره انتخاب یک زیرمجموعه _غیرنماینده_ از داده‌ها برای توسعه الگوریتم است که ممکن است منجر به نتایج ناعادلانه برای گروه‌های مختلف شود. انواع تعصب شامل تعصب انتخاب یا نمونه‌گیری، تعصب داوطلبانه و تعصب ابزار است.

سوالاتی که باید بررسی شوند:
* آیا ما یک مجموعه نماینده از افراد داده‌شده را انتخاب کرده‌ایم؟
* آیا مجموعه داده‌های جمع‌آوری‌شده یا مدیریت‌شده خود را برای انواع مختلف تعصب آزمایش کرده‌ایم؟
* آیا می‌توانیم هرگونه تعصب کشف‌شده را کاهش دهیم یا حذف کنیم؟

#### 2.7 کیفیت داده‌ها

[کیفیت داده‌ها](https://lakefs.io/data-quality-testing/) به اعتبار مجموعه داده‌های مدیریت‌شده که برای توسعه الگوریتم‌های ما استفاده می‌شود نگاه می‌کند، و بررسی می‌کند که آیا ویژگی‌ها و رکوردها الزامات سطح دقت و سازگاری مورد نیاز برای هدف هوش مصنوعی ما را برآورده می‌کنند یا خیر.

سوالاتی که باید بررسی شوند:
* آیا ما ویژگی‌های معتبر برای مورد استفاده خود را جمع‌آوری کرده‌ایم؟
* آیا داده‌ها به طور _سازگار_ در منابع داده مختلف جمع‌آوری شده‌اند؟
* آیا مجموعه داده برای شرایط یا سناریوهای مختلف _کامل_ است؟
* آیا اطلاعات به‌طور _دقیق_ واقعیت را منعکس می‌کند؟

#### 2.8 عدالت الگوریتمی

[عدالت الگوریتمی](https://towardsdatascience.com/what-is-algorithm-fairness-3182e161cf9f) بررسی می‌کند که آیا طراحی الگوریتم به‌طور سیستماتیک علیه گروه‌های خاصی از افراد تبعیض قائل می‌شود و منجر به [آسیب‌های احتمالی](https://docs.microsoft.com/en-us/azure/machine-learning/concept-fairness-ml) در _تخصیص_ (جایی که منابع از آن گروه محروم یا withheld می‌شوند) و _کیفیت خدمات_ (جایی که دقت هوش مصنوعی برای برخی گروه‌ها کمتر از دیگران است) می‌شود.

سؤالاتی که باید در اینجا بررسی شوند:
* آیا دقت مدل را برای گروه‌ها و شرایط متنوع ارزیابی کردیم؟
* آیا سیستم را برای آسیب‌های احتمالی (مانند کلیشه‌سازی) بررسی کردیم؟
* آیا می‌توانیم داده‌ها را اصلاح کنیم یا مدل‌ها را دوباره آموزش دهیم تا آسیب‌های شناسایی‌شده را کاهش دهیم؟

منابعی مانند [چک‌لیست‌های عدالت هوش مصنوعی](https://query.prod.cms.rt.microsoft.com/cms/api/am/binary/RE4t6dA) را برای یادگیری بیشتر بررسی کنید.

#### 2.9 تحریف اطلاعات

[تحریف داده‌ها](https://www.sciencedirect.com/topics/computer-science/misrepresentation) به این موضوع می‌پردازد که آیا ما بینش‌های حاصل از داده‌های گزارش‌شده صادقانه را به‌گونه‌ای فریبنده برای حمایت از یک روایت مطلوب منتقل می‌کنیم.

سؤالاتی که باید در اینجا بررسی شوند:
* آیا داده‌های ناقص یا نادرست را گزارش می‌دهیم؟
* آیا داده‌ها را به‌گونه‌ای بصری‌سازی می‌کنیم که منجر به نتیجه‌گیری‌های گمراه‌کننده شود؟
* آیا از تکنیک‌های آماری انتخابی برای دستکاری نتایج استفاده می‌کنیم؟
* آیا توضیحات جایگزینی وجود دارد که ممکن است نتیجه متفاوتی ارائه دهد؟

#### 2.10 انتخاب آزاد

[توهم انتخاب آزاد](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice) زمانی رخ می‌دهد که "معماری انتخاب" سیستم از الگوریتم‌های تصمیم‌گیری برای هدایت افراد به سمت یک نتیجه ترجیحی استفاده می‌کند، در حالی که به نظر می‌رسد به آن‌ها گزینه‌ها و کنترل داده شده است. این [الگوهای تاریک](https://www.darkpatterns.org/) می‌توانند به کاربران آسیب‌های اجتماعی و اقتصادی وارد کنند. از آنجا که تصمیمات کاربران بر پروفایل‌های رفتاری تأثیر می‌گذارد، این اقدامات ممکن است انتخاب‌های آینده را تقویت یا گسترش دهد و تأثیر این آسیب‌ها را افزایش دهد.

سؤالاتی که باید در اینجا بررسی شوند:
* آیا کاربر پیامدهای انتخاب خود را درک کرده است؟
* آیا کاربر از گزینه‌های (جایگزین) و مزایا و معایب هر یک آگاه بوده است؟
* آیا کاربر می‌تواند یک انتخاب خودکار یا تحت تأثیر قرار گرفته را بعداً تغییر دهد؟

### 3. مطالعات موردی

برای قرار دادن این چالش‌های اخلاقی در زمینه‌های واقعی، کمک می‌کند که به مطالعات موردی نگاه کنیم که آسیب‌ها و پیامدهای احتمالی برای افراد و جامعه را نشان می‌دهند، زمانی که چنین نقض‌های اخلاقی نادیده گرفته شوند.

در اینجا چند مثال آورده شده است:

| چالش اخلاقی | مطالعه موردی | 
|--- |--- |
| **رضایت آگاهانه** | 1972 - [مطالعه سیفلیس توسکیگی](https://en.wikipedia.org/wiki/Tuskegee_Syphilis_Study) - به مردان آفریقایی-آمریکایی که در این مطالعه شرکت کردند وعده مراقبت پزشکی رایگان داده شد، _اما توسط محققان فریب داده شدند_ که به آن‌ها در مورد تشخیص بیماری یا در دسترس بودن درمان اطلاع ندادند. بسیاری از شرکت‌کنندگان جان خود را از دست دادند و شرکا یا فرزندان آن‌ها تحت تأثیر قرار گرفتند؛ این مطالعه 40 سال طول کشید. | 
| **حریم خصوصی داده‌ها** | 2007 - [جایزه داده‌های نتفلیکس](https://www.wired.com/2007/12/why-anonymous-data-sometimes-isnt/) به محققان _10 میلیون رتبه‌بندی فیلم ناشناس از 50 هزار مشتری_ ارائه داد تا الگوریتم‌های توصیه را بهبود دهند. با این حال، محققان توانستند داده‌های ناشناس را با داده‌های قابل‌شناسایی شخصی در _مجموعه‌های داده خارجی_ (مانند نظرات IMDb) مرتبط کنند - به‌طور مؤثر برخی از مشترکان نتفلیکس را "غیرناشناس" کردند.|
| **تعصب در جمع‌آوری داده‌ها** | 2013 - شهر بوستون [اپلیکیشن Street Bump](https://www.boston.gov/transportation/street-bump) را توسعه داد که به شهروندان اجازه می‌داد چاله‌ها را گزارش دهند و به شهر داده‌های بهتر جاده‌ای برای یافتن و رفع مشکلات ارائه دهد. با این حال، [افراد در گروه‌های کم‌درآمد دسترسی کمتری به خودروها و تلفن‌ها داشتند](https://hbr.org/2013/04/the-hidden-biases-in-big-data)، که مشکلات جاده‌ای آن‌ها را در این اپلیکیشن نامرئی می‌کرد. توسعه‌دهندگان با دانشگاهیان برای حل مسائل _دسترسی عادلانه و شکاف‌های دیجیتال_ همکاری کردند. |
| **عدالت الگوریتمی** | 2018 - مطالعه [Gender Shades](http://gendershades.org/overview.html) MIT دقت محصولات هوش مصنوعی در طبقه‌بندی جنسیت را ارزیابی کرد و شکاف‌های دقت برای زنان و افراد رنگین‌پوست را آشکار کرد. یک [کارت اپل 2019](https://www.wired.com/story/the-apple-card-didnt-see-genderand-thats-the-problem/) به نظر می‌رسید که اعتبار کمتری به زنان نسبت به مردان ارائه می‌دهد. هر دو مسائل تعصب الگوریتمی را نشان دادند که منجر به آسیب‌های اجتماعی-اقتصادی می‌شود.|
| **تحریف داده‌ها** | 2020 - [وزارت بهداشت جورجیا نمودارهای COVID-19](https://www.vox.com/covid-19-coronavirus-us-response-trump/2020/5/18/21262265/georgia-covid-19-cases-declining-reopening) منتشر کرد که به نظر می‌رسید شهروندان را در مورد روند موارد تأییدشده با ترتیب غیرزمانی در محور x گمراه کند. این مثال تحریف از طریق ترفندهای بصری‌سازی را نشان می‌دهد. |
| **توهم انتخاب آزاد** | 2020 - اپلیکیشن یادگیری [ABCmouse برای حل شکایت FTC](https://www.washingtonpost.com/business/2020/09/04/abcmouse-10-million-ftc-settlement/) 10 میلیون دلار پرداخت کرد، جایی که والدین مجبور به پرداخت اشتراک‌هایی شدند که نمی‌توانستند لغو کنند. این مثال الگوهای تاریک در معماری انتخاب را نشان می‌دهد، جایی که کاربران به سمت انتخاب‌های بالقوه مضر هدایت شدند. |
| **حریم خصوصی داده‌ها و حقوق کاربران** | 2021 - [نقص داده‌های فیسبوک](https://www.npr.org/2021/04/09/986005820/after-data-breach-exposes-530-million-facebook-says-it-will-not-notify-users) داده‌های 530 میلیون کاربر را افشا کرد و منجر به تسویه 5 میلیارد دلاری با FTC شد. با این حال، فیسبوک از اطلاع‌رسانی به کاربران در مورد نقص خودداری کرد و حقوق کاربران در مورد شفافیت داده‌ها و دسترسی را نقض کرد. |

می‌خواهید مطالعات موردی بیشتری را بررسی کنید؟ این منابع را بررسی کنید:
* [Ethics Unwrapped](https://ethicsunwrapped.utexas.edu/case-studies) - معضلات اخلاقی در صنایع مختلف.
* [دوره اخلاق در علم داده](https://www.coursera.org/learn/data-science-ethics#syllabus) - مطالعات موردی برجسته بررسی شده.
* [جایی که مسائل اشتباه پیش رفته‌اند](https://deon.drivendata.org/examples/) - چک‌لیست Deon با مثال‌ها.

> 🚨 به مطالعات موردی که دیده‌اید فکر کنید - آیا شما تجربه یا تحت تأثیر چالش اخلاقی مشابهی در زندگی خود قرار گرفته‌اید؟ آیا می‌توانید حداقل یک مطالعه موردی دیگر را که یکی از چالش‌های اخلاقی مورد بحث در این بخش را نشان می‌دهد، به یاد بیاورید؟

## اخلاق کاربردی

ما درباره مفاهیم اخلاقی، چالش‌ها و مطالعات موردی در زمینه‌های واقعی صحبت کردیم. اما چگونه می‌توانیم اصول و شیوه‌های اخلاقی را در پروژه‌های خود _اعمال_ کنیم؟ و چگونه می‌توانیم این شیوه‌ها را برای حکمرانی بهتر _عملیاتی_ کنیم؟ بیایید برخی از راه‌حل‌های واقعی را بررسی کنیم:

### 1. کدهای حرفه‌ای

کدهای حرفه‌ای یک گزینه برای سازمان‌ها ارائه می‌دهند تا اعضای خود را "تشویق" کنند که از اصول اخلاقی و بیانیه مأموریت آن‌ها حمایت کنند. کدها _راهنمای اخلاقی_ برای رفتار حرفه‌ای هستند که به کارکنان یا اعضا کمک می‌کنند تصمیماتی بگیرند که با اصول سازمانشان همسو باشد. آن‌ها تنها به اندازه رعایت داوطلبانه اعضا مؤثر هستند؛ با این حال، بسیاری از سازمان‌ها پاداش‌ها و مجازات‌های اضافی برای انگیزه دادن به اعضا برای رعایت کدها ارائه می‌دهند.

نمونه‌ها شامل موارد زیر هستند:

* [کد اخلاق آکسفورد مونیخ](http://www.code-of-ethics.org/code-of-conduct/)
* [کد رفتار انجمن علم داده](http://datascienceassn.org/code-of-conduct.html) (ایجاد شده در 2013)
* [کد اخلاق و رفتار حرفه‌ای ACM](https://www.acm.org/code-of-ethics) (از سال 1993)

> 🚨 آیا شما عضو یک سازمان حرفه‌ای مهندسی یا علم داده هستید؟ سایت آن‌ها را بررسی کنید تا ببینید آیا کد اخلاق حرفه‌ای تعریف کرده‌اند. این کد درباره اصول اخلاقی آن‌ها چه می‌گوید؟ چگونه اعضا را "تشویق" می‌کنند که از کد پیروی کنند؟

### 2. چک‌لیست‌های اخلاقی

در حالی که کدهای حرفه‌ای رفتار _اخلاقی مورد نیاز_ از متخصصان را تعریف می‌کنند، آن‌ها [محدودیت‌های شناخته‌شده‌ای](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md) در اجرا دارند، به‌ویژه در پروژه‌های بزرگ‌مقیاس. در عوض، بسیاری از متخصصان علم داده [از چک‌لیست‌ها حمایت می‌کنند](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md) که می‌توانند **اصول را به شیوه‌ها** به‌طور قطعی و قابل‌اجرا متصل کنند.

چک‌لیست‌ها سؤالات را به وظایف "بله/خیر" تبدیل می‌کنند که می‌توانند عملیاتی شوند و به‌عنوان بخشی از جریان‌های کاری استاندارد انتشار محصول ردیابی شوند.

نمونه‌ها شامل موارد زیر هستند:
* [Deon](https://deon.drivendata.org/) - یک چک‌لیست اخلاق داده عمومی که از [توصیه‌های صنعتی](https://deon.drivendata.org/#checklist-citations) ایجاد شده است و دارای ابزار خط فرمان برای ادغام آسان است.
* [چک‌لیست ممیزی حریم خصوصی](https://cyber.harvard.edu/ecommerce/privacyaudit.html) - راهنمایی کلی برای شیوه‌های مدیریت اطلاعات از دیدگاه‌های قانونی و اجتماعی ارائه می‌دهد.
* [چک‌لیست عدالت هوش مصنوعی](https://www.microsoft.com/en-us/research/project/ai-fairness-checklist/) - توسط متخصصان هوش مصنوعی ایجاد شده است تا از پذیرش و ادغام بررسی‌های عدالت در چرخه‌های توسعه هوش مصنوعی حمایت کند.
* [22 سؤال برای اخلاق در داده‌ها و هوش مصنوعی](https://medium.com/the-organization/22-questions-for-ethics-in-data-and-ai-efb68fd19429) - چارچوبی بازتر، ساختار یافته برای بررسی اولیه مسائل اخلاقی در طراحی، اجرا و زمینه‌های سازمانی.

### 3. مقررات اخلاقی

اخلاق درباره تعریف ارزش‌های مشترک و انجام کار درست _به‌طور داوطلبانه_ است. **رعایت** درباره _پیروی از قانون_ در صورت تعریف است. **حکمرانی** به‌طور کلی شامل تمام روش‌هایی است که سازمان‌ها برای اجرای اصول اخلاقی و رعایت قوانین تعریف‌شده عمل می‌کنند.

امروزه، حکمرانی در سازمان‌ها دو شکل دارد. اول، تعریف اصول **هوش مصنوعی اخلاقی** و ایجاد شیوه‌هایی برای عملیاتی کردن پذیرش در تمام پروژه‌های مرتبط با هوش مصنوعی در سازمان. دوم، رعایت تمام مقررات حفاظت از داده‌ها که توسط دولت برای مناطقی که در آن فعالیت می‌کند، تعریف شده است.

نمونه‌هایی از مقررات حفاظت از داده‌ها و حریم خصوصی:

* `1974`، [قانون حریم خصوصی ایالات متحده](https://www.just
* [یادگیری ماشین برای مبتدیان](https://github.com/microsoft/ML-For-Beginners/blob/main/1-Introduction/3-fairness/README.md) - درس درباره انصاف، از مایکروسافت.  
* [اصول هوش مصنوعی مسئولانه](https://docs.microsoft.com/en-us/learn/modules/responsible-ai-principles/) - مسیر یادگیری رایگان از Microsoft Learn.  
* [اخلاق و علم داده](https://resources.oreilly.com/examples/0636920203964) - کتاب الکترونیکی O'Reilly (M. Loukides, H. Mason و دیگران)  
* [اخلاق علم داده](https://www.coursera.org/learn/data-science-ethics#syllabus) - دوره آنلاین از دانشگاه میشیگان.  
* [اخلاق باز نشده](https://ethicsunwrapped.utexas.edu/case-studies) - مطالعات موردی از دانشگاه تگزاس.  

# تکلیف  

[نوشتن یک مطالعه موردی اخلاق داده](assignment.md)  

---

**سلب مسئولیت**:  
این سند با استفاده از سرویس ترجمه هوش مصنوعی [Co-op Translator](https://github.com/Azure/co-op-translator) ترجمه شده است. در حالی که ما تلاش می‌کنیم دقت را حفظ کنیم، لطفاً توجه داشته باشید که ترجمه‌های خودکار ممکن است شامل خطاها یا نادرستی‌ها باشند. سند اصلی به زبان اصلی آن باید به عنوان منبع معتبر در نظر گرفته شود. برای اطلاعات حساس، توصیه می‌شود از ترجمه انسانی حرفه‌ای استفاده کنید. ما مسئولیتی در قبال سوء تفاهم‌ها یا تفسیرهای نادرست ناشی از استفاده از این ترجمه نداریم.