Merge pull request #646 from microsoft/update-translations

🌐 Update translations via Co-op Translator
pull/647/head
Lee Stott 9 months ago committed by GitHub
commit f8e500dc22
No known key found for this signature in database
GPG Key ID: B5690EEEBB952194

@ -1,8 +1,8 @@
<!--
CO_OP_TRANSLATOR_METADATA:
{
"original_hash": "8796f41f566a0a8ebb72863a83d558ed",
"translation_date": "2025-08-27T08:45:59+00:00",
"original_hash": "3a34157cc63516eba97c89a0b2f8c3e6",
"translation_date": "2025-09-03T20:53:57+00:00",
"source_file": "1-Introduction/02-ethics/README.md",
"language_code": "ar"
}
@ -19,9 +19,9 @@ CO_OP_TRANSLATOR_METADATA:
تشير اتجاهات السوق إلى أنه بحلول عام 2022، ستقوم واحدة من كل ثلاث مؤسسات كبيرة بشراء وبيع بياناتها عبر [الأسواق والمنصات الإلكترونية](https://www.gartner.com/smarterwithgartner/gartner-top-10-trends-in-data-and-analytics-for-2020/). كـ **مطوري تطبيقات**، سنجد أنه من الأسهل والأرخص دمج رؤى تعتمد على البيانات وأتمتة تعتمد على الخوارزميات في تجارب المستخدم اليومية. ولكن مع انتشار الذكاء الاصطناعي، سنحتاج أيضًا إلى فهم الأضرار المحتملة الناتجة عن [تسليح](https://www.youtube.com/watch?v=TQHs8SA1qpk) هذه الخوارزميات على نطاق واسع.
تشير الاتجاهات أيضًا إلى أننا سنقوم بإنشاء واستهلاك أكثر من [180 زيتابايت](https://www.statista.com/statistics/871513/worldwide-data-created/) من البيانات بحلول عام 2025. كـ **علماء بيانات**، يمنحنا هذا مستويات غير مسبوقة من الوصول إلى البيانات الشخصية. وهذا يعني أنه يمكننا بناء ملفات تعريف سلوكية للمستخدمين والتأثير على اتخاذ القرارات بطرق تخلق [وهم الاختيار الحر](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice) بينما ندفع المستخدمين نحو نتائج نفضلها. كما يثير ذلك أسئلة أوسع حول خصوصية البيانات وحماية المستخدمين.
تشير الاتجاهات أيضًا إلى أننا سنقوم بإنشاء واستهلاك أكثر من [180 زيتابايت](https://www.statista.com/statistics/871513/worldwide-data-created/) من البيانات بحلول عام 2025. كـ **علماء بيانات**، يمنحنا هذا مستويات غير مسبوقة من الوصول إلى البيانات الشخصية. وهذا يعني أنه يمكننا بناء ملفات تعريف سلوكية للمستخدمين والتأثير على اتخاذ القرارات بطرق تخلق [وهم الاختيار الحر](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice) بينما نوجه المستخدمين نحو نتائج نفضلها. كما يثير ذلك أسئلة أوسع حول خصوصية البيانات وحماية المستخدمين.
أخلاقيات البيانات أصبحت الآن _حواجز ضرورية_ لعلم البيانات والهندسة، حيث تساعدنا على تقليل الأضرار المحتملة والعواقب غير المقصودة الناتجة عن أفعالنا المعتمدة على البيانات. يحدد [دورة الضجيج للذكاء الاصطناعي من Gartner](https://www.gartner.com/smarterwithgartner/2-megatrends-dominate-the-gartner-hype-cycle-for-artificial-intelligence-2020/) اتجاهات ذات صلة بالأخلاقيات الرقمية، الذكاء الاصطناعي المسؤول، وحوكمة الذكاء الاصطناعي كعوامل رئيسية تدفع اتجاهات أكبر حول _دمقرطة_ و _تصنيع_ الذكاء الاصطناعي.
أصبحت أخلاقيات البيانات الآن _حواجز ضرورية_ لعلم البيانات والهندسة، حيث تساعدنا على تقليل الأضرار المحتملة والعواقب غير المقصودة الناتجة عن أفعالنا المعتمدة على البيانات. يحدد [دورة الضجيج للذكاء الاصطناعي من Gartner](https://www.gartner.com/smarterwithgartner/2-megatrends-dominate-the-gartner-hype-cycle-for-artificial-intelligence-2020/) اتجاهات ذات صلة في الأخلاقيات الرقمية، الذكاء الاصطناعي المسؤول، وحوكمة الذكاء الاصطناعي كعوامل رئيسية لدفع الاتجاهات الكبرى حول _دمقرطة_ و _تصنيع_ الذكاء الاصطناعي.
![دورة الضجيج للذكاء الاصطناعي من Gartner - 2020](https://images-cdn.newscred.com/Zz1mOWJhNzlkNDA2ZTMxMWViYjRiOGFiM2IyMjQ1YmMwZQ==)
@ -37,11 +37,11 @@ CO_OP_TRANSLATOR_METADATA:
**الأخلاقيات** تتعلق بالقيم المشتركة والمبادئ الأخلاقية التي تحكم سلوكنا في المجتمع. الأخلاقيات لا تعتمد على القوانين بل على الأعراف المقبولة عمومًا لما هو "صحيح مقابل خطأ". ومع ذلك، يمكن أن تؤثر الاعتبارات الأخلاقية على مبادرات الحوكمة المؤسسية واللوائح الحكومية التي تخلق المزيد من الحوافز للامتثال.
**أخلاقيات البيانات** هي [فرع جديد من الأخلاقيات](https://royalsocietypublishing.org/doi/full/10.1098/rsta.2016.0360#sec-1) يدرس ويقيم المشكلات الأخلاقية المتعلقة بـ _البيانات، الخوارزميات والممارسات المرتبطة بها_. هنا، **"البيانات"** تركز على الإجراءات المتعلقة بإنشاء البيانات، تسجيلها، تنظيمها، معالجتها، نشرها، مشاركتها واستخدامها، **"الخوارزميات"** تركز على الذكاء الاصطناعي، الوكلاء، التعلم الآلي، والروبوتات، و**"الممارسات"** تركز على مواضيع مثل الابتكار المسؤول، البرمجة، القرصنة، ومدونات الأخلاقيات.
**أخلاقيات البيانات** هي [فرع جديد من الأخلاقيات](https://royalsocietypublishing.org/doi/full/10.1098/rsta.2016.0360#sec-1) يدرس ويقيم المشكلات الأخلاقية المتعلقة بـ _البيانات، الخوارزميات والممارسات المرتبطة بها_. هنا، **"البيانات"** تركز على الإجراءات المتعلقة بإنشاء، تسجيل، تنظيم، معالجة، نشر، مشاركة، واستخدام البيانات، **"الخوارزميات"** تركز على الذكاء الاصطناعي، الوكلاء، التعلم الآلي، والروبوتات، و**"الممارسات"** تركز على مواضيع مثل الابتكار المسؤول، البرمجة، القرصنة، ومدونات الأخلاقيات.
**الأخلاقيات التطبيقية** هي [التطبيق العملي للاعتبارات الأخلاقية](https://en.wikipedia.org/wiki/Applied_ethics). إنها عملية التحقيق النشط في القضايا الأخلاقية في سياق _الإجراءات، المنتجات والعمليات الواقعية_، واتخاذ إجراءات تصحيحية لضمان توافقها مع القيم الأخلاقية المحددة.
**الأخلاقيات التطبيقية** هي [التطبيق العملي للاعتبارات الأخلاقية](https://en.wikipedia.org/wiki/Applied_ethics). إنها عملية التحقيق النشط في القضايا الأخلاقية في سياق _الأفعال، المنتجات والعمليات الواقعية_، واتخاذ إجراءات تصحيحية لضمان توافقها مع القيم الأخلاقية المحددة.
**ثقافة الأخلاقيات** تتعلق بـ [_تفعيل_ الأخلاقيات التطبيقية](https://hbr.org/2019/05/how-to-design-an-ethical-organization) لضمان تبني المبادئ والممارسات الأخلاقية بشكل متسق وقابل للتوسع عبر المؤسسة بأكملها. ثقافات الأخلاقيات الناجحة تحدد المبادئ الأخلاقية على مستوى المؤسسة، توفر حوافز ذات معنى للامتثال، وتعزز الأعراف الأخلاقية من خلال تشجيع وتضخيم السلوكيات المرغوبة على كل مستوى من مستويات المؤسسة.
**ثقافة الأخلاقيات** تتعلق بـ [_تفعيل_ الأخلاقيات التطبيقية](https://hbr.org/2019/05/how-to-design-an-ethical-organization) لضمان تبني المبادئ والممارسات الأخلاقية بشكل متسق وقابل للتوسع عبر المؤسسة بأكملها. الثقافات الأخلاقية الناجحة تحدد المبادئ الأخلاقية على مستوى المؤسسة، توفر حوافز ذات معنى للامتثال، وتعزز الأعراف الأخلاقية من خلال تشجيع وتضخيم السلوكيات المرغوبة على كل مستوى من مستويات المؤسسة.
## مفاهيم الأخلاقيات
@ -55,14 +55,14 @@ CO_OP_TRANSLATOR_METADATA:
![الذكاء الاصطناعي المسؤول في Microsoft](https://docs.microsoft.com/en-gb/azure/cognitive-services/personalizer/media/ethics-and-responsible-use/ai-values-future-computed.png)
دعونا نستكشف هذه المبادئ بإيجاز. _الشفافية_ و_المساءلة_ هما قيم أساسية تُبنى عليها المبادئ الأخرى - لذا دعونا نبدأ بهما:
دعونا نستكشف هذه المبادئ باختصار. _الشفافية_ و_المساءلة_ هما قيم أساسية تُبنى عليها المبادئ الأخرى - لذا دعونا نبدأ بهما:
* [**المساءلة**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) تجعل الممارسين _مسؤولين_ عن عملياتهم في البيانات والذكاء الاصطناعي، وعن الامتثال لهذه المبادئ الأخلاقية.
* [**الشفافية**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) تضمن أن تكون الإجراءات المتعلقة بالبيانات والذكاء الاصطناعي _مفهومة_ (قابلة للتفسير) للمستخدمين، مع شرح ما يتم ولماذا.
* [**الإنصاف**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1%3aprimaryr6) - يركز على ضمان أن يعامل الذكاء الاصطناعي _جميع الأشخاص_ بإنصاف، ومعالجة أي تحيزات اجتماعية-تقنية ضمن البيانات والأنظمة.
* [**الشفافية**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) تضمن أن تكون الإجراءات المتعلقة بالبيانات والذكاء الاصطناعي _مفهومة_ (قابلة للتفسير) للمستخدمين، مع شرح ما وراء القرارات.
* [**الإنصاف**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1%3aprimaryr6) - يركز على ضمان أن يعامل الذكاء الاصطناعي _جميع الأشخاص_ بإنصاف، ومعالجة أي تحيزات اجتماعية أو تقنية ضمن البيانات والأنظمة.
* [**الموثوقية والسلامة**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - تضمن أن يتصرف الذكاء الاصطناعي _بشكل متسق_ مع القيم المحددة، مع تقليل الأضرار المحتملة أو العواقب غير المقصودة.
* [**الخصوصية والأمان**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - تتعلق بفهم أصل البيانات، وتوفير _خصوصية البيانات والحماية ذات الصلة_ للمستخدمين.
* [**الشمولية**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - تتعلق بتصميم حلول الذكاء الاصطناعي بنية واضحة، وتكييفها لتلبية _مجموعة واسعة من الاحتياجات والقدرات البشرية_.
* [**الشمولية**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - تتعلق بتصميم حلول الذكاء الاصطناعي بنية واضحة، وتكييفها لتلبية _مجموعة واسعة من احتياجات وقدرات البشر_.
> 🚨 فكر في ما يمكن أن يكون بيان مهمة أخلاقيات البيانات الخاص بك. استكشف أطر عمل الذكاء الاصطناعي الأخلاقي من مؤسسات أخرى - إليك أمثلة من [IBM](https://www.ibm.com/cloud/learn/ai-ethics)، [Google](https://ai.google/principles)، و[Facebook](https://ai.facebook.com/blog/facebooks-five-pillars-of-responsible-ai/). ما هي القيم المشتركة التي لديهم؟ كيف ترتبط هذه المبادئ بمنتج الذكاء الاصطناعي أو الصناعة التي يعملون فيها؟
@ -70,28 +70,28 @@ CO_OP_TRANSLATOR_METADATA:
بمجرد تحديد المبادئ الأخلاقية، الخطوة التالية هي تقييم أفعالنا المتعلقة بالبيانات والذكاء الاصطناعي لمعرفة ما إذا كانت تتماشى مع تلك القيم المشتركة. فكر في أفعالك ضمن فئتين: _جمع البيانات_ و_تصميم الخوارزميات_.
في جمع البيانات، قد تتضمن الأفعال **بيانات شخصية** أو معلومات تعريفية شخصية (PII) لأفراد يمكن التعرف عليهم. يشمل ذلك [عناصر متنوعة من البيانات غير الشخصية](https://ec.europa.eu/info/law/law-topic/data-protection/reform/what-personal-data_en) التي جمع_ لتحديد الفرد. يمكن أن تتعلق التحديات الأخلاقية بـ _خصوصية البيانات_، _ملكية البيانات_، ومواضيع ذات صلة مثل _الموافقة المستنيرة_ و_حقوق الملكية الفكرية_ للمستخدمين.
في جمع البيانات، قد تتضمن الأفعال **بيانات شخصية** أو معلومات تعريفية شخصية (PII) لأفراد يمكن التعرف عليهم. يشمل ذلك [عناصر متنوعة من البيانات غير الشخصية](https://ec.europa.eu/info/law/law-topic/data-protection/reform/what-personal-data_en) التي حدد الفرد بشكل جماعي_. يمكن أن تتعلق التحديات الأخلاقية بـ _خصوصية البيانات_، _ملكية البيانات_، ومواضيع ذات صلة مثل _الموافقة المستنيرة_ و_حقوق الملكية الفكرية_ للمستخدمين.
في تصميم الخوارزميات، تتضمن الأفعال جمع وتنظيم **مجموعات البيانات**، ثم استخدامها لتدريب ونشر **نماذج البيانات** التي تتنبأ بالنتائج أو تؤتمت القرارات في سياقات واقعية. يمكن أن تنشأ التحديات الأخلاقية من _تحيز مجموعات البيانات_، _مشكلات جودة البيانات_، _عدم الإنصاف_، و_التشويه_ في الخوارزميات - بما في ذلك بعض القضايا التي تكون منهجية بطبيعتها.
في تصميم الخوارزميات، تتضمن الأفعال جمع وتنظيم **مجموعات البيانات**، ثم استخدامها لتدريب ونشر **نماذج البيانات** التي تتنبأ بالنتائج أو تؤتمت القرارات في سياقات واقعية. يمكن أن تنشأ التحديات الأخلاقية من _تحيز مجموعة البيانات_، _مشكلات جودة البيانات_، _عدم الإنصاف_، و_التضليل_ في الخوارزميات - بما في ذلك بعض القضايا التي تكون منهجية بطبيعتها.
في كلا الحالتين، تسلط التحديات الأخلاقية الضوء على المناطق التي قد تواجه فيها أفعالنا تعارضًا مع قيمنا المشتركة. للكشف عن هذه المخاوف، تقليلها، أو القضاء عليها - نحتاج إلى طرح أسئلة أخلاقية "نعم/لا" تتعلق بأفعالنا، ثم اتخاذ إجراءات تصحيحية حسب الحاجة. دعونا نلقي نظرة على بعض التحديات الأخلاقية والأسئلة الأخلاقية التي تثيرها:
#### 2.1 ملكية البيانات
جمع البيانات غالبًا ما يتضمن بيانات شخصية يمكن أن تحدد موضوعات البيانات. [ملكية البيانات](https://permission.io/blog/data-ownership) تتعلق بـ _التحكم_ و[_حقوق المستخدمين_](https://permission.io/blog/data-ownership) المتعلقة بإنشاء البيانات، معالجتها، ونشرها.
غالبًا ما يتضمن جمع البيانات بيانات شخصية يمكن أن تحدد موضوعات البيانات. [ملكية البيانات](https://permission.io/blog/data-ownership) تتعلق بـ _التحكم_ و[_حقوق المستخدم_](https://permission.io/blog/data-ownership) المتعلقة بإنشاء، معالجة، ونشر البيانات.
الأسئلة الأخلاقية التي نحتاج إلى طرحها هي:
* من يملك البيانات؟ (المستخدم أم المؤسسة)
* ما هي حقوق موضوعات البيانات؟ (مثل: الوصول، الحذف، النقل)
* ما هي حقوق المؤسسات؟ (مثل: تصحيح المراجعات الضارة للمستخدمين)
* ما هي حقوق المؤسسات؟ (مثل: تصحيح مراجعات المستخدم الضارة)
#### 2.2 الموافقة المستنيرة
[الموافقة المستنيرة](https://legaldictionary.net/informed-consent/) تعني موافقة المستخدمين على إجراء معين (مثل جمع البيانات) مع هم كامل_ للحقائق ذات الصلة بما في ذلك الهدف، المخاطر المحتملة، والبدائل.
[الموافقة المستنيرة](https://legaldictionary.net/informed-consent/) تعني موافقة المستخدمين على إجراء معين (مثل جمع البيانات) مع هم كامل_ للحقائق ذات الصلة بما في ذلك الغرض، المخاطر المحتملة، والبدائل.
الأسئلة التي يجب استكشافها هنا هي:
* هل أعطى المستخدم (موضوع البيانات) الإذن لجمع البيانات واستخدامها؟
* هل فهم المستخدم الهدف من جمع تلك البيانات؟
* هل أعطى المستخدم (موضوع البيانات) الإذن لجمع واستخدام البيانات؟
* هل فهم المستخدم الغرض من جمع تلك البيانات؟
* هل فهم المستخدم المخاطر المحتملة من مشاركته؟
#### 2.3 الملكية الفكرية
@ -99,9 +99,9 @@ CO_OP_TRANSLATOR_METADATA:
[الملكية الفكرية](https://en.wikipedia.org/wiki/Intellectual_property) تشير إلى الإبداعات غير الملموسة الناتجة عن المبادرة البشرية، والتي قد _تكون لها قيمة اقتصادية_ للأفراد أو الشركات.
الأسئلة التي يجب استكشافها هنا هي:
* هل البيانات المجمعة لها قيمة اقتصادية للمستخدم أو الشركة؟
* هل لدى **المستخدم** حقوق ملكية فكرية هنا؟
* هل لدى **المؤسسة** حقوق ملكية فكرية هنا؟
* هل للبيانات المجمعة قيمة اقتصادية للمستخدم أو الشركة؟
* هل يمتلك **المستخدم** حقوق ملكية فكرية هنا؟
* هل تمتلك **المؤسسة** حقوق ملكية فكرية هنا؟
* إذا كانت هذه الحقوق موجودة، كيف نحميها؟
#### 2.4 خصوصية البيانات
@ -111,51 +111,51 @@ CO_OP_TRANSLATOR_METADATA:
الأسئلة التي يجب استكشافها هنا هي:
* هل بيانات المستخدمين (الشخصية) محمية ضد الاختراقات والتسريبات؟
* هل بيانات المستخدمين متاحة فقط للمستخدمين والسياقات المصرح بها؟
* هل يتم الحفاظ على مجهولية المستخدم عند مشاركة البيانات أو نشرها؟
* هل يتم الحفاظ على إخفاء هوية المستخدم عند مشاركة أو نشر البيانات؟
* هل يمكن تحديد هوية المستخدم من مجموعات البيانات المجهولة؟
#### 2.5 الحق في النسيان
[الحق في النسيان](https://en.wikipedia.org/wiki/Right_to_be_forgotten) أو [الحق في الحذف](https://www.gdpreu.org/right-to-be-forgotten/) يوفر حماية إضافية للبيانات الشخصية للمستخدمين. بشكل خاص، يمنح المستخدمين الحق في طلب حذف أو إزالة البيانات الشخصية من عمليات البحث على الإنترنت ومواقع أخرى، _في ظروف محددة_ - مما يسمح لهم ببدء جديد على الإنترنت دون أن تؤثر عليهم أفعالهم السابقة.
[الحق في النسيان](https://en.wikipedia.org/wiki/Right_to_be_forgotten) أو [الحق في الحذف](https://www.gdpreu.org/right-to-be-forgotten/) يوفر حماية إضافية للبيانات الشخصية للمستخدمين. على وجه التحديد، يمنح المستخدمين الحق في طلب حذف أو إزالة البيانات الشخصية من عمليات البحث على الإنترنت ومواقع أخرى، _في ظل ظروف معينة_ - مما يسمح لهم ببدء جديد على الإنترنت دون أن تؤثر عليهم أفعالهم السابقة.
الأسئلة التي يجب استكشافها هنا هي:
* هل النظام يسمح لموضوعات البيانات بطلب الحذف؟
* هل يسمح النظام لموضوعات البيانات بطلب الحذف؟
* هل يجب أن يؤدي سحب موافقة المستخدم إلى الحذف التلقائي؟
* هل تم جمع البيانات بدون موافقة أو بوسائل غير قانونية؟
* هل تم جمع البيانات دون موافقة أو بوسائل غير قانونية؟
* هل نحن ملتزمون باللوائح الحكومية لخصوصية البيانات؟
#### 2.6 تحيز مجموعات البيانات
#### 2.6 تحيز مجموعة البيانات
تحيز مجموعات البيانات أو [تحيز الجمع](http://researcharticles.com/index.php/bias-in-data-collection-in-research/) يتعلق باختيار مجموعة بيانات _غير ممثلة_ لتطوير الخوارزميات، مما يخلق احتمالية لعدم الإنصاف في نتائج المخرجات لمجموعات متنوعة. أنواع التحيز تشمل التحيز في الاختيار أو العينة، التحيز التطوعي، وتحيز الأدوات.
تحيز مجموعة البيانات أو [تحيز الجمع](http://researcharticles.com/index.php/bias-in-data-collection-in-research/) يتعلق باختيار مجموعة بيانات _غير ممثلة_ لتطوير الخوارزميات، مما يخلق احتمالية لعدم الإنصاف في نتائج المخرجات لمجموعات متنوعة. أنواع التحيز تشمل التحيز في الاختيار أو العينة، التحيز التطوعي، وتحيز الأدوات.
الأسئلة التي يجب استكشافها هنا هي:
* هل قمنا بتجنيد مجموعة ممثلة من موضوعات البيانات؟
* هل قمنا باختبار مجموعتنا المجمعة أو المنظمة للكشف عن أنواع مختلفة من التحيز؟
* هل قمنا باختبار مجموعة البيانات المجمعة أو المنظمة للتحيزات المختلفة؟
* هل يمكننا تقليل أو إزالة أي تحيزات مكتشفة؟
#### 2.7 جودة البيانات
[جودة البيانات](https://lakefs.io/data-quality-testing/) تنظر في صلاحية مجموعة البيانات المنظمة المستخدمة لتطوير خوارزمياتنا، للتحقق مما إذا كانت الميزات والسجلات تلبي المتطلبات لمستوى الدقة والاتساق المطلوب لغرض الذكاء الاصطناعي.
[جودة البيانات](https://lakefs.io/data-quality-testing/) تنظر في صلاحية مجموعة البيانات المنظمة المستخدمة لتطوير خوارزمياتنا، للتحقق مما إذا كانت الميزات والسجلات تلبي متطلبات مستوى الدقة والاتساق المطلوب لغرض الذكاء الاصطناعي.
الأسئلة التي يجب استكشافها هنا هي:
* هل قمنا بجمع ميزات صالحة لحالة الاستخدام الخاصة بنا؟
* هل تم جمع البيانات _بشكل متسق_ عبر مصادر بيانات متنوعة؟
* هل المجموعة املة_ لظروف أو سيناريوهات متنوعة؟
* هل مجموعة البيانات املة_ لظروف أو سيناريوهات متنوعة؟
* هل المعلومات المجمعة _دقيقة_ في عكس الواقع؟
#### 2.8 إنصاف الخوارزميات
[Algorithm Fairness](https://towardsdatascience.com/what-is-algorithm-fairness-3182e161cf9f) يتحقق مما إذا كان تصميم الخوارزمية يميز بشكل منهجي ضد مجموعات فرعية محددة من الأفراد، مما يؤدي إلى [أضرار محتملة](https://docs.microsoft.com/en-us/azure/machine-learning/concept-fairness-ml) في _التخصيص_ (حيث يتم حرمان أو حجب الموارد عن تلك المجموعة) و_جودة الخدمة_ (حيث تكون دقة الذكاء الاصطناعي أقل لبعض المجموعات مقارنة بغيرها).
[Algorithm Fairness](https://towardsdatascience.com/what-is-algorithm-fairness-3182e161cf9f) يتحقق مما إذا كان تصميم الخوارزمية يميز بشكل منهجي ضد مجموعات فرعية محددة من الأشخاص، مما يؤدي إلى [أضرار محتملة](https://docs.microsoft.com/en-us/azure/machine-learning/concept-fairness-ml) في _التخصيص_ (حيث يتم رفض أو حجب الموارد عن تلك المجموعة) و_جودة الخدمة_ (حيث تكون دقة الذكاء الاصطناعي أقل لبعض المجموعات مقارنة بغيرها).
الأسئلة التي يمكن استكشافها هنا هي:
* هل قمنا بتقييم دقة النموذج لمجموعات فرعية وظروف متنوعة؟
* هل قمنا بفحص النظام بحثًا عن أضرار محتملة (مثل التنميط النمطي
* هل يمكننا مراجعة البيانات أو إعادة تدريب النماذج لتخفيف الأضرار المحددة؟
* هل قمنا بفحص النظام بحثًا عن أضرار محتملة (مثل التنميط)؟
* هل يمكننا تعديل البيانات أو إعادة تدريب النماذج لتخفيف الأضرار المحددة؟
استكشف موارد مثل [قوائم التحقق للعدالة في الذكاء الاصطناعي](https://query.prod.cms.rt.microsoft.com/cms/api/am/binary/RE4t6dA) لمعرفة المزيد.
استكشف موارد مثل [AI Fairness checklists](https://query.prod.cms.rt.microsoft.com/cms/api/am/binary/RE4t6dA) لمعرفة المزيد.
#### 2.9 التمثيل الخاطئ
#### 2.9 سوء التمثيل
[التمثيل الخاطئ للبيانات](https://www.sciencedirect.com/topics/computer-science/misrepresentation) يتعلق بالتساؤل عما إذا كنا ننقل رؤى من بيانات تم الإبلاغ عنها بصدق بطريقة خادعة لدعم سردية مرغوبة.
[سوء تمثيل البيانات](https://www.sciencedirect.com/topics/computer-science/misrepresentation) يتعلق بالسؤال عما إذا كنا ننقل رؤى من بيانات تم الإبلاغ عنها بصدق بطريقة خادعة لدعم سرد معين.
الأسئلة التي يمكن استكشافها هنا هي:
* هل نقوم بالإبلاغ عن بيانات غير مكتملة أو غير دقيقة؟
@ -164,33 +164,33 @@ CO_OP_TRANSLATOR_METADATA:
* هل هناك تفسيرات بديلة قد تقدم استنتاجًا مختلفًا؟
#### 2.10 حرية الاختيار
[وهم حرية الاختيار](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice) يحدث عندما تستخدم "هندسة الاختيارات" في الأنظمة خوارزميات اتخاذ القرار لدفع الناس نحو اتخاذ نتيجة مفضلة بينما يبدو أنهم يمتلكون خيارات وتحكمًا. يمكن أن تسبب هذه [الأنماط المظلمة](https://www.darkpatterns.org/) أضرارًا اجتماعية واقتصادية للمستخدمين. وبما أن قرارات المستخدم تؤثر على ملفات تعريف السلوك، فإن هذه الإجراءات قد تدفع إلى تضخيم أو تمديد تأثير هذه الأضرار في المستقبل.
[وهم حرية الاختيار](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice) يحدث عندما تستخدم "هندسة الاختيار" في الأنظمة خوارزميات اتخاذ القرار لدفع الناس نحو اتخاذ نتيجة مفضلة بينما يبدو أنهم يمتلكون خيارات وتحكمًا. هذه [الأنماط المظلمة](https://www.darkpatterns.org/) يمكن أن تسبب أضرارًا اجتماعية واقتصادية للمستخدمين. نظرًا لأن قرارات المستخدم تؤثر على ملفات تعريف السلوك، فإن هذه الإجراءات قد تدفع الخيارات المستقبلية التي يمكن أن تضخم أو تمدد تأثير هذه الأضرار.
الأسئلة التي يمكن استكشافها هنا هي:
* هل فهم المستخدم تداعيات اتخاذ هذا القرار؟
* هل فهم المستخدم تبعات اتخاذ هذا القرار؟
* هل كان المستخدم على علم بالخيارات (البديلة) ومزايا وعيوب كل منها؟
* هل يمكن للمستخدم عكس قرار آلي أو متأثر لاحقًا؟
* هل يمكن للمستخدم عكس قرار تلقائي أو متأثر لاحقًا؟
### 3. دراسات حالة
لفهم هذه التحديات الأخلاقية في سياقات العالم الحقيقي، من المفيد النظر في دراسات حالة تسلط الضوء على الأضرار والعواقب المحتملة للأفراد والمجتمع عندما يتم التغاضي عن هذه الانتهاكات الأخلاقية.
لإدخال هذه التحديات الأخلاقية في سياقات العالم الحقيقي، من المفيد النظر في دراسات حالة تسلط الضوء على الأضرار والعواقب المحتملة للأفراد والمجتمع عندما يتم تجاهل هذه الانتهاكات الأخلاقية.
فيما يلي بعض الأمثلة:
إليك بعض الأمثلة:
| التحدي الأخلاقي | دراسة الحالة |
|--- |--- |
| **الموافقة المستنيرة** | 1972 - [دراسة الزهري في توسكيجي](https://en.wikipedia.org/wiki/Tuskegee_Syphilis_Study) - تم وعد الرجال الأمريكيين من أصل أفريقي الذين شاركوا في الدراسة برعاية طبية مجانية _لكن تم خداعهم_ من قبل الباحثين الذين لم يخبروهم بتشخيصهم أو بتوفر العلاج. مات العديد من المشاركين وتأثر شركاؤهم أو أطفالهم؛ استمرت الدراسة 40 عامًا. |
| **خصوصية البيانات** | 2007 - [جائزة بيانات نتفليكس](https://www.wired.com/2007/12/why-anonymous-data-sometimes-isnt/) قدمت للباحثين _10 ملايين تقييم أفلام مجهولة المصدر من 50 ألف عميل_ لتحسين خوارزميات التوصية. ومع ذلك، تمكن الباحثون من ربط البيانات المجهولة ببيانات شخصية قابلة للتحديد في _مجموعات بيانات خارجية_ (مثل تعليقات IMDb) - مما أدى فعليًا إلى "إلغاء إخفاء الهوية" لبعض مشتركي نتفليكس.|
| **تحيز جمع البيانات** | 2013 - طورت مدينة بوسطن [تطبيق Street Bump](https://www.boston.gov/transportation/street-bump)، وهو تطبيق يسمح للمواطنين بالإبلاغ عن الحفر، مما يوفر للمدينة بيانات أفضل عن الطرق لتحديد المشكلات وإصلاحها. ومع ذلك، [كان لدى الأشخاص في المجموعات ذات الدخل المنخفض وصول أقل إلى السيارات والهواتف](https://hbr.org/2013/04/the-hidden-biases-in-big-data)، مما جعل مشكلات الطرق الخاصة بهم غير مرئية في هذا التطبيق. عمل المطورون مع الأكاديميين على قضايا _الوصول العادل والفجوات الرقمية_ لتحقيق العدالة. |
| **عدالة الخوارزميات** | 2018 - [دراسة Gender Shades](http://gendershades.org/overview.html) من معهد MIT قيمت دقة منتجات تصنيف الجنس بالذكاء الاصطناعي، وكشفت عن فجوات في الدقة للنساء والأشخاص الملونين. [بطاقة Apple لعام 2019](https://www.wired.com/story/the-apple-card-didnt-see-genderand-thats-the-problem/) بدت وكأنها تقدم ائتمانًا أقل للنساء مقارنة بالرجال. كلاهما يوضح قضايا التحيز الخوارزمي الذي يؤدي إلى أضرار اجتماعية واقتصادية.|
| **التمثيل الخاطئ للبيانات** | 2020 - [أصدرت إدارة الصحة العامة في جورجيا رسومًا بيانية عن COVID-19](https://www.vox.com/covid-19-coronavirus-us-response-trump/2020/5/18/21262265/georgia-covid-19-cases-declining-reopening) بدت وكأنها تضلل المواطنين بشأن اتجاهات الحالات المؤكدة من خلال ترتيب غير زمني على المحور السيني. يوضح هذا التمثيل الخاطئ من خلال حيل التصور. |
| **وهم حرية الاختيار** | 2020 - دفعت تطبيق التعلم [ABCmouse مبلغ 10 ملايين دولار لتسوية شكوى FTC](https://www.washingtonpost.com/business/2020/09/04/abcmouse-10-million-ftc-settlement/) حيث تم حبس الآباء في دفع اشتراكات لم يتمكنوا من إلغائها. يوضح هذا الأنماط المظلمة في هندسة الاختيارات، حيث تم دفع المستخدمين نحو اختيارات قد تكون ضارة. |
| **خصوصية البيانات وحقوق المستخدم** | 2021 - [اختراق بيانات فيسبوك](https://www.npr.org/2021/04/09/986005820/after-data-breach-exposes-530-million-facebook-says-it-will-not-notify-users) كشف بيانات 530 مليون مستخدم، مما أدى إلى تسوية بقيمة 5 مليارات دولار مع FTC. ومع ذلك، رفضت الشركة إخطار المستخدمين بالاختراق، مما يعد انتهاكًا لحقوق المستخدمين المتعلقة بشفافية البيانات والوصول إليها. |
| **الموافقة المستنيرة** | 1972 - [دراسة مرض الزهري في توسكيجي](https://en.wikipedia.org/wiki/Tuskegee_Syphilis_Study) - تم وعد الرجال الأمريكيين من أصل أفريقي الذين شاركوا في الدراسة بالرعاية الطبية المجانية _لكن تم خداعهم_ من قبل الباحثين الذين لم يبلغوا المشاركين بتشخيصهم أو بتوفر العلاج. مات العديد من المشاركين وتأثر شركاؤهم أو أطفالهم؛ استمرت الدراسة لمدة 40 عامًا. |
| **خصوصية البيانات** | 2007 - [جائزة بيانات نتفليكس](https://www.wired.com/2007/12/why-anonymous-data-sometimes-isnt/) قدمت للباحثين _10 ملايين تقييم أفلام مجهولة من 50 ألف عميل_ لتحسين خوارزميات التوصية. ومع ذلك، تمكن الباحثون من ربط البيانات المجهولة بالبيانات الشخصية في _مجموعات بيانات خارجية_ (مثل تعليقات IMDb) - مما أدى فعليًا إلى "إلغاء إخفاء الهوية" لبعض مشتركي نتفليكس.|
| **تحيز الجمع** | 2013 - طورت مدينة بوسطن [تطبيق Street Bump](https://www.boston.gov/transportation/street-bump)، وهو تطبيق يسمح للمواطنين بالإبلاغ عن الحفر، مما يوفر للمدينة بيانات أفضل عن الطرق لإيجاد وإصلاح المشكلات. ومع ذلك، [كان لدى الأشخاص في المجموعات ذات الدخل المنخفض وصول أقل إلى السيارات والهواتف](https://hbr.org/2013/04/the-hidden-biases-in-big-data)، مما جعل مشكلات الطرق الخاصة بهم غير مرئية في هذا التطبيق. عمل المطورون مع الأكاديميين على _قضايا الوصول العادل والفجوات الرقمية_ لتحقيق العدالة. |
| **عدالة الخوارزميات** | 2018 - [دراسة Gender Shades](http://gendershades.org/overview.html) من MIT قيمت دقة منتجات تصنيف الجنس بالذكاء الاصطناعي، وكشفت عن فجوات في الدقة للنساء والأشخاص ذوي البشرة الملونة. في [2019، بطاقة Apple](https://www.wired.com/story/the-apple-card-didnt-see-genderand-thats-the-problem/) بدت وكأنها تقدم ائتمانًا أقل للنساء مقارنة بالرجال. كلاهما يوضح قضايا التحيز الخوارزمي الذي يؤدي إلى أضرار اجتماعية واقتصادية.|
| **سوء تمثيل البيانات** | 2020 - [وزارة الصحة في جورجيا أصدرت رسوم بيانية عن حالات COVID-19](https://www.vox.com/covid-19-coronavirus-us-response-trump/2020/5/18/21262265/georgia-covid-19-cases-declining-reopening) التي بدت وكأنها تضلل المواطنين بشأن الاتجاهات في الحالات المؤكدة باستخدام ترتيب غير زمني على المحور السيني. هذا يوضح سوء التمثيل من خلال حيل التصور. |
| **وهم حرية الاختيار** | 2020 - تطبيق التعلم [ABCmouse دفع 10 ملايين دولار لتسوية شكوى FTC](https://www.washingtonpost.com/business/2020/09/04/abcmouse-10-million-ftc-settlement/) حيث تم حبس الآباء في دفع اشتراكات لا يمكنهم إلغاؤها. هذا يوضح الأنماط المظلمة في هندسة الاختيار، حيث تم دفع المستخدمين نحو خيارات قد تكون ضارة. |
| **خصوصية البيانات وحقوق المستخدم** | 2021 - [اختراق بيانات فيسبوك](https://www.npr.org/2021/04/09/986005820/after-data-breach-exposes-530-million-facebook-says-it-will-not-notify-users) كشف بيانات 530 مليون مستخدم، مما أدى إلى تسوية بقيمة 5 مليارات دولار مع FTC. ومع ذلك، رفضت الشركة إخطار المستخدمين بالاختراق، مما ينتهك حقوق المستخدمين حول شفافية البيانات والوصول إليها. |
هل تريد استكشاف المزيد من دراسات الحالة؟ تحقق من هذه الموارد:
* [Ethics Unwrapped](https://ethicsunwrapped.utexas.edu/case-studies) - معضلات أخلاقية عبر صناعات متنوعة.
* [دورة أخلاقيات علوم البيانات](https://www.coursera.org/learn/data-science-ethics#syllabus) - دراسات حالة بارزة مستكشفة.
* [أين حدثت الأخطاء](https://deon.drivendata.org/examples/) - قائمة تحقق Deon مع أمثلة.
* [أين حدثت الأخطاء](https://deon.drivendata.org/examples/) - قائمة Deon مع أمثلة.
> 🚨 فكر في دراسات الحالة التي رأيتها - هل واجهت أو تأثرت بتحدٍ أخلاقي مشابه في حياتك؟ هل يمكنك التفكير في دراسة حالة أخرى توضح أحد التحديات الأخلاقية التي ناقشناها في هذا القسم؟
@ -200,66 +200,66 @@ CO_OP_TRANSLATOR_METADATA:
### 1. الأكواد المهنية
تقدم الأكواد المهنية خيارًا للمنظمات "لتحفيز" الأعضاء لدعم مبادئها الأخلاقية وبيان مهمتها. الأكواد هي _إرشادات أخلاقية_ للسلوك المهني، تساعد الموظفين أو الأعضاء على اتخاذ قرارات تتماشى مع مبادئ منظمتهم. تعتمد فعاليتها على الامتثال الطوعي من الأعضاء؛ ومع ذلك، تقدم العديد من المنظمات مكافآت وعقوبات إضافية لتحفيز الامتثال.
توفر الأكواد المهنية خيارًا للمنظمات لـ "تحفيز" الأعضاء لدعم مبادئها الأخلاقية وبيان مهمتها. الأكواد هي _إرشادات أخلاقية_ للسلوك المهني، تساعد الموظفين أو الأعضاء على اتخاذ قرارات تتماشى مع مبادئ المنظمة. وهي جيدة بقدر الامتثال الطوعي من الأعضاء؛ ومع ذلك، تقدم العديد من المنظمات مكافآت وعقوبات إضافية لتحفيز الامتثال.
أمثلة تشمل:
* [Oxford Munich](http://www.code-of-ethics.org/code-of-conduct/) كود الأخلاقيات
* [جمعية علوم البيانات](http://datascienceassn.org/code-of-conduct.html) كود السلوك (تم إنشاؤه عام 2013)
* [كود ACM للأخلاقيات والسلوك المهني](https://www.acm.org/code-of-ethics) (منذ عام 1993)
* [جمعية علوم البيانات](http://datascienceassn.org/code-of-conduct.html) كود السلوك (تم إنشاؤه في 2013)
* [ACM Code of Ethics and Professional Conduct](https://www.acm.org/code-of-ethics) (منذ 1993)
> 🚨 هل تنتمي إلى منظمة مهنية في الهندسة أو علوم البيانات؟ استكشف موقعهم لمعرفة ما إذا كانوا يحددون كودًا مهنيًا للأخلاقيات. ماذا يقول هذا عن مبادئهم الأخلاقية؟ كيف "يحفزون" الأعضاء على اتباع الكود؟
> 🚨 هل تنتمي إلى منظمة مهنية للهندسة أو علوم البيانات؟ استكشف موقعها لمعرفة ما إذا كانت تحدد كودًا مهنيًا للأخلاقيات. ماذا يقول هذا عن مبادئها الأخلاقية؟ كيف "تحفز" الأعضاء على اتباع الكود؟
### 2. قوائم التحقق الأخلاقية
بينما تحدد الأكواد المهنية السلوك الأخلاقي المطلوب من الممارسين، فإنها [لها حدود معروفة](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md) في التنفيذ، خاصة في المشاريع واسعة النطاق. بدلاً من ذلك، يدعو العديد من خبراء علوم البيانات إلى [قوائم التحقق](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md) التي يمكنها **ربط المبادئ بالممارسات** بطرق أكثر تحديدًا وقابلية للتنفيذ.
بينما تحدد الأكواد المهنية السلوك الأخلاقي المطلوب من الممارسين، فإنها [لها قيود معروفة](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md) في التنفيذ، خاصة في المشاريع واسعة النطاق. بدلاً من ذلك، يوصي العديد من خبراء علوم البيانات بـ [قوائم التحقق](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md)، التي يمكنها **ربط المبادئ بالممارسات** بطرق أكثر تحديدًا وقابلية للتنفيذ.
تحول قوائم التحقق الأسئلة إلى مهام "نعم/لا" يمكن تشغيلها، مما يسمح بتتبعها كجزء من سير عمل إصدار المنتج القياسي.
تحول قوائم التحقق الأسئلة إلى مهام "نعم/لا" يمكن تشغيلها، مما يسمح بتتبعها كجزء من سير عمل إطلاق المنتج القياسي.
أمثلة تشمل:
* [Deon](https://deon.drivendata.org/) - قائمة تحقق عامة لأخلاقيات البيانات تم إنشاؤها من [توصيات الصناعة](https://deon.drivendata.org/#checklist-citations) مع أداة سطر أوامر للتكامل السهل.
* [قائمة تدقيق تدقيق الخصوصية](https://cyber.harvard.edu/ecommerce/privacyaudit.html) - تقدم إرشادات عامة لممارسات التعامل مع المعلومات من منظور التعرض القانوني والاجتماعي.
* [قائمة تدقيق عدالة الذكاء الاصطناعي](https://www.microsoft.com/en-us/research/project/ai-fairness-checklist/) - تم إنشاؤها من قبل ممارسي الذكاء الاصطناعي لدعم تبني ودمج فحوصات العدالة في دورات تطوير الذكاء الاصطناعي.
* [22 سؤالًا للأخلاقيات في البيانات والذكاء الاصطناعي](https://medium.com/the-organization/22-questions-for-ethics-in-data-and-ai-efb68fd19429) - إطار عمل أكثر انفتاحًا، منظم لاستكشاف القضايا الأخلاقية في التصميم والتنفيذ والسياقات التنظيمية.
* [قائمة تحقق تدقيق الخصوصية](https://cyber.harvard.edu/ecommerce/privacyaudit.html) - توفر إرشادات عامة لممارسات التعامل مع المعلومات من منظور التعرض القانوني والاجتماعي.
* [قائمة تحقق عدالة الذكاء الاصطناعي](https://www.microsoft.com/en-us/research/project/ai-fairness-checklist/) - تم إنشاؤها بواسطة ممارسي الذكاء الاصطناعي لدعم اعتماد ودمج فحوصات العدالة في دورات تطوير الذكاء الاصطناعي.
* [22 سؤالًا للأخلاقيات في البيانات والذكاء الاصطناعي](https://medium.com/the-organization/22-questions-for-ethics-in-data-and-ai-efb68fd19429) - إطار عمل أكثر انفتاحًا، منظم لاستكشاف أولي للقضايا الأخلاقية في التصميم، التنفيذ، والسياقات التنظيمية.
### 3. اللوائح الأخلاقية
### 3. تنظيم الأخلاقيات
تتعلق الأخلاقيات بتعريف القيم المشتركة وفعل الشيء الصحيح _طوعًا_. **الامتثال** يتعلق بـ _اتباع القانون_ إذا كان محددًا. **الحوكمة** تغطي جميع الطرق التي تعمل بها المنظمات لفرض المبادئ الأخلاقية والامتثال للقوانين المعمول بها.
الأخلاقيات تتعلق بتحديد القيم المشتركة وفعل الشيء الصحيح _طوعًا_. **الامتثال** يتعلق بـ _اتباع القانون_ إذا تم تحديده. **الحوكمة** تغطي بشكل عام جميع الطرق التي تعمل بها المنظمات لفرض المبادئ الأخلاقية والامتثال للقوانين المعمول بها.
اليوم، تأخذ الحوكمة شكلين داخل المنظمات. أولاً، يتعلق الأمر بتعريف مبادئ **الذكاء الاصطناعي الأخلاقي** وإنشاء ممارسات لتشغيل التبني عبر جميع المشاريع المتعلقة بالذكاء الاصطناعي في المنظمة. ثانيًا، يتعلق الأمر بالامتثال لجميع اللوائح الحكومية المتعلقة بحماية البيانات للمناطق التي تعمل فيها.
اليوم، تأخذ الحوكمة شكلين داخل المنظمات. أولاً، يتعلق الأمر بتحديد مبادئ **الذكاء الاصطناعي الأخلاقي** وإنشاء ممارسات لتشغيل اعتمادها عبر جميع المشاريع المتعلقة بالذكاء الاصطناعي في المنظمة. ثانيًا، يتعلق الأمر بالامتثال لجميع **لوائح حماية البيانات** التي تفرضها الحكومة للمناطق التي تعمل فيها.
أمثلة على لوائح حماية البيانات والخصوصية:
* `1974`، [قانون الخصوصية الأمريكي](https://www.justice.gov/opcl/privacy-act-1974) - ينظم _جمع الحكومة الفيدرالية_ للمعلومات الشخصية واستخدامها والإفصاح عنها.
* `1996`، [قانون التأمين الصحي الأمريكي HIPAA](https://www.cdc.gov/phlp/publications/topic/hipaa.html) - يحمي البيانات الصحية الشخصية.
* `1998`، [قانون حماية خصوصية الأطفال على الإنترنت COPPA](https://www.ftc.gov/enforcement/rules/rulemaking-regulatory-reform-proceedings/childrens-online-privacy-protection-rule) - يحمي خصوصية بيانات الأطفال دون سن 13.
* `2018`، [اللائحة العامة لحماية البيانات GDPR](https://gdpr-info.eu/) - توفر حقوق المستخدم، وحماية البيانات، والخصوصية.
* `2018`، [قانون خصوصية المستهلك في كاليفورنيا CCPA](https://www.oag.ca.gov/privacy/ccpa) يمنح المستهلكين المزيد من _الحقوق_ بشأن بياناتهم (الشخصية).
* `2021`، [قانون حماية المعلومات الشخصية في الصين](https://www.reuters.com/world/china/china-passes-new-personal-data-privacy-law-take-effect-nov-1-2021-08-20/) الذي تم تمريره مؤخرًا، مما يخلق واحدة من أقوى لوائح الخصوصية على الإنترنت في العالم.
* `1974`, [قانون الخصوصية الأمريكي](https://www.justice.gov/opcl/privacy-act-1974) - ينظم جمع الحكومة الفيدرالية واستخدامها والإفصاح عن المعلومات الشخصية.
* `1996`, [قانون التأمين الصحي الأمريكي (HIPAA)](https://www.cdc.gov/phlp/publications/topic/hipaa.html) - يحمي البيانات الصحية الشخصية.
* `1998`, [قانون حماية خصوصية الأطفال عبر الإنترنت (COPPA)](https://www.ftc.gov/enforcement/rules/rulemaking-regulatory-reform-proceedings/childrens-online-privacy-protection-rule) - يحمي خصوصية بيانات الأطفال تحت سن 13.
* `2018`, [اللائحة العامة لحماية البيانات (GDPR)](https://gdpr-info.eu/) - توفر حقوق المستخدم، حماية البيانات، والخصوصية.
* `2018`, [قانون خصوصية المستهلك في كاليفورنيا (CCPA)](https://www.oag.ca.gov/privacy/ccpa) يمنح المستهلكين المزيد من _الحقوق_ بشأن بياناتهم الشخصية.
* `2021`, قانون [حماية المعلومات الشخصية في الصين](https://www.reuters.com/world/china/china-passes-new-personal-data-privacy-law-take-effect-nov-1-2021-08-20/) الذي تم تمريره مؤخرًا، مما يخلق واحدة من أقوى لوائح خصوصية البيانات عبر الإنترنت في العالم.
> 🚨 تعرف اللائحة العامة لحماية البيانات GDPR (اللائحة العامة لحماية البيانات) التي حددها الاتحاد الأوروبي بأنها واحدة من أكثر لوائح حماية البيانات تأثيرًا اليوم. هل تعلم أنها تعرف أيضًا [8 حقوق للمستخدم](https://www.freeprivacypolicy.com/blog/8-user-rights-gdpr) لحماية الخصوصية الرقمية والبيانات الشخصية للمواطنين؟ تعرف على ما هي هذه الحقوق ولماذا هي مهمة.
> 🚨 الاتحاد الأوروبي الذي حدد اللائحة العامة لحماية البيانات (GDPR) لا يزال واحدًا من أكثر لوائح خصوصية البيانات تأثيرًا اليوم. هل تعلم أنه يحدد أيضًا [8 حقوق للمستخدم](https://www.freeprivacypolicy.com/blog/8-user-rights-gdpr) لحماية خصوصية المواطنين الرقمية وبياناتهم الشخصية؟ تعرف على ما هي هذه الحقوق ولماذا هي مهمة.
### 4. ثقافة الأخلاقيات
لاحظ أن هناك فجوة غير ملموسة بين _الامتثال_ (القيام بما يكفي لتلبية "نص القانون") ومعالجة [القضايا النظامية](https://www.coursera.org/learn/data-science-ethics/home/week/4) (مثل الجمود، عدم التماثل في المعلومات، وعدم العدالة في التوزيع) التي يمكن أن تسرع من تسليح الذكاء الاصطناعي.
لاحظ أن هناك فجوة غير ملموسة بين _الامتثال_ (القيام بما يكفي لتلبية "نص القانون") ومعالجة [القضايا النظامية](https://www.coursera.org/learn/data-science-ethics/home/week/4) (مثل الجمود، عدم تناسق المعلومات، وعدم العدالة التوزيعية) التي يمكن أن تسرع من تسليح الذكاء الاصطناعي.
يتطلب الأخير [نهجًا تعاونيًا لتعريف ثقافات الأخلاقيات](https://towardsdatascience.com/why-ai-ethics-requires-a-culture-driven-approach-26f451afa29f) التي تبني روابط عاطفية وقيمًا مشتركة متسقة _عبر المنظمات_ في الصناعة. يتطلب هذا المزيد من [ثقافات أخلاقيات البيانات الرسمية](https://www.codeforamerica.org/news/formalizing-an-ethical-data-culture/) في المنظمات - مما يسمح _لأي شخص_ بـ [سحب حبل أندون](https://en.wikipedia.org/wiki/Andon_(manufacturing)) (لإثارة مخاوف أخلاقية مبكرًا في العملية) وجعل _التقييمات الأخلاقية_ (مثل التوظيف) معيارًا أساسيًا لتشكيل الفرق في مشاريع الذكاء الاصطناعي.
يتطلب الأخير [نهجًا تعاونيًا لتحديد ثقافات الأخلاقيات](https://towardsdatascience.com/why-ai-ethics-requires-a-culture-driven-approach-26f451afa29f) التي تبني روابط عاطفية وقيمًا مشتركة متسقة _عبر المنظمات_ في الصناعة. هذا يدعو إلى المزيد من [ثقافات أخلاقيات البيانات الرسمية](https://www.codeforamerica.org/news/formalizing-an-ethical-data-culture/) في المنظمات - مما يسمح _لأي شخص_ بـ [سحب حبل أندون](https://en.wikipedia.org/wiki/Andon_(manufacturing)) (لإثارة مخاوف أخلاقية مبكرًا في العملية) وجعل _التقييمات الأخلاقية_ (مثل التوظيف) معيارًا أساسيًا لتشكيل الفرق في مشاريع الذكاء الاصطناعي.
---
## [اختبار ما بعد المحاضرة](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/3) 🎯
## [اختبار ما بعد المحاضرة](https://ff-quizzes.netlify.app/en/ds/) 🎯
## المراجعة والدراسة الذاتية
تساعد الدورات والكتب على فهم مفاهيم الأخلاقيات الأساسية والتحديات، بينما تساعد دراسات الحالة والأدوات في ممارسات الأخلاقيات التطبيقية في سياقات العالم الحقيقي. إليك بعض الموارد للبدء:
الدورات والكتب تساعد في فهم مفاهيم الأخلاقيات الأساسية والتحديات، بينما تساعد دراسات الحالة والأدوات في ممارسات الأخلاقيات التطبيقية في سياقات العالم الحقيقي. إليك بعض الموارد للبدء.
* [تعلم الآلة للمبتدئين](https://github.com/microsoft/ML-For-Beginners/blob/main/1-Introduction/3-fairness/README.md) - درس حول العدالة، من مايكروسوفت.
* [مبادئ الذكاء الاصطناعي المسؤول](https://docs.microsoft.com/en-us/learn/modules/responsible-ai-principles/) - مسار تعليمي مجاني من Microsoft Learn.
* [الأخلاقيات وعلوم البيانات](https://resources.oreilly.com/examples/0636920203964) - كتاب إلكتروني من O'Reilly (بقلم م. لوكيديس، هـ. ماسون وآخرون).
* [أخلاقيات علوم البيانات](https://www.coursera.org/learn/data-science-ethics#syllabus) - دورة تعليمية عبر الإنترنت من جامعة ميشيغان.
* [الأخلاقيات غير المغلفة](https://ethicsunwrapped.utexas.edu/case-studies) - دراسات حالة من جامعة تكساس.
* [تعلم الآلة للمبتدئين](https://github.com/microsoft/ML-For-Beginners/blob/main/1-Introduction/3-fairness/README.md) - درس عن العدالة، من مايكروسوفت.
* [مبادئ الذكاء الاصطناعي المسؤول](https://docs.microsoft.com/en-us/learn/modules/responsible-ai-principles/) - مسار تعليمي مجاني من Microsoft Learn.
* [الأخلاقيات وعلوم البيانات](https://resources.oreilly.com/examples/0636920203964) - كتاب إلكتروني من O'Reilly (م. لوكيديس، هـ. ماسون وآخرون).
* [أخلاقيات علوم البيانات](https://www.coursera.org/learn/data-science-ethics#syllabus) - دورة عبر الإنترنت من جامعة ميشيغان.
* [الأخلاقيات غير المغلفة](https://ethicsunwrapped.utexas.edu/case-studies) - دراسات حالة من جامعة تكساس.
# الواجب
# المهمة
[كتابة دراسة حالة عن أخلاقيات البيانات](assignment.md)
[كتابة دراسة حالة عن أخلاقيات البيانات](assignment.md)
---

@ -1,8 +1,8 @@
<!--
CO_OP_TRANSLATOR_METADATA:
{
"original_hash": "8796f41f566a0a8ebb72863a83d558ed",
"translation_date": "2025-08-26T15:14:32+00:00",
"original_hash": "3a34157cc63516eba97c89a0b2f8c3e6",
"translation_date": "2025-09-03T21:49:18+00:00",
"source_file": "1-Introduction/02-ethics/README.md",
"language_code": "bg"
}
@ -15,20 +15,17 @@ CO_OP_TRANSLATOR_METADATA:
---
Всички ние сме граждани на данните, живеещи в свят, наситен с данни.
Всички сме граждани на света на данните.
Пазарните тенденции показват, че до 2022 г. 1 от 3 големи организации ще купува и продава своите данни чрез онлайн [пазари и борси](https://www.gartner.com/smarterwithgartner/gartner-top-10-trends-in-data-and-analytics-for-2020/). Като **разработчици на приложения**, ще ни бъде по-лесно и по-евтино да интегрираме прозрения, базирани на данни, и автоматизация, управлявана от алгоритми, в ежедневния потребителски опит. Но с разпространението на изкуствения интелект ще трябва също така да разберем потенциалните вреди, причинени от [оръжието](https://www.youtube.com/watch?v=TQHs8SA1qpk) на такива алгоритми в голям мащаб.
Пазарните тенденции показват, че до 2022 г. 1 от 3 големи организации ще купува и продава своите данни чрез онлайн [пазари и борси](https://www.gartner.com/smarterwithgartner/gartner-top-10-trends-in-data-and-analytics-for-2020/). Като **разработчици на приложения**, ще ни бъде по-лесно и по-евтино да интегрираме прозрения, базирани на данни, и автоматизация, управлявана от алгоритми, в ежедневния потребителски опит. Но с разпространението на AI ще трябва да разберем и потенциалните вреди, причинени от [оръжейната употреба](https://www.youtube.com/watch?v=TQHs8SA1qpk) на такива алгоритми в голям мащаб.
Тенденциите също така показват, че до 2025 г. ще създаваме и консумираме над [180 зетабайта](https://www.statista.com/statistics/871513/worldwide-data-created/) данни. Като **учени в областта на данните**, това ни дава безпрецедентен достъп до лични данни. Това означава, че можем да изграждаме поведенчески профили на потребителите и да влияем върху вземането на решения по начини, които създават [илюзия за свободен избор](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice), като същевременно потенциално насочваме потребителите към предпочитани от нас резултати. Това също така повдига по-широки въпроси за поверителността на данните и защитата на потребителите.
Етиката на данните вече е еобходима защита_ за науката за данни и инженерството, която ни помага да минимизираме потенциалните вреди и непредвидените последици от нашите действия, базирани на данни. [Цикълът на хиперболата на Гартнър за ИИ](https://www.gartner.com/smarterwithgartner/2-megatrends-dominate-the-gartner-hype-cycle-for-artificial-intelligence-2020/) идентифицира релевантни тенденции в дигиталната етика, отговорния ИИ и управлението на ИИ като ключови двигатели за по-големи мегатенденции около емократизацията_ и _индустриализацията_ на ИИ.
![Цикъл на хиперболата на Гартнър за ИИ - 2020](https://images-cdn.newscred.com/Zz1mOWJhNzlkNDA2ZTMxMWViYjRiOGFiM2IyMjQ1YmMwZQ==)
В този урок ще изследваме завладяващата област на етиката на данните - от основни концепции и предизвикателства до казуси и приложни концепции за ИИ като управление - които помагат за установяване на култура на етика в екипи и организации, работещи с данни и ИИ.
Етиката на данните вече е еобходима рамка_ за науката за данни и инженерството, която ни помага да минимизираме потенциалните вреди и непредвидените последици от действията ни, базирани на данни. [Gartner Hype Cycle за AI](https://www.gartner.com/smarterwithgartner/2-megatrends-dominate-the-gartner-hype-cycle-for-artificial-intelligence-2020/) идентифицира релевантни тенденции в дигиталната етика, отговорния AI и управлението на AI като ключови двигатели за по-големи мегатенденции около емократизацията_ и _индустриализацията_ на AI.
![Gartner's Hype Cycle за AI - 2020](https://images-cdn.newscred.com/Zz1mOWJhNzlkNDA2ZTMxMWViYjRiOGFiM2IyMjQ1YmMwZQ==)
В този урок ще разгледаме завладяващата област на етиката на данните - от основни концепции и предизвикателства до казуси и приложни AI концепции като управление, които помагат за създаването на култура на етика в екипи и организации, работещи с данни и AI.
## [Тест преди лекцията](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/2) 🎯
@ -36,16 +33,15 @@ CO_OP_TRANSLATOR_METADATA:
Нека започнем с разбирането на основната терминология.
Думата "етика" произлиза от [гръцката дума "ethikos"](https://en.wikipedia.org/wiki/Ethics) (и нейния корен "ethos"), което означава _характер или морална природа_.
**Етиката** се отнася до споделените ценности и морални принципи, които управляват нашето поведение в обществото. Етиката не се основава на закони, а на широко приети норми за това кое е "правилно срещу грешно". Въпреки това, етичните съображения могат да повлияят на корпоративните управленски инициативи и правителствените регулации, които създават повече стимули за съответствие.
Думата "етика" произлиза от [гръцката дума "ethikos"](https://en.wikipedia.org/wiki/Ethics) (и нейния корен "ethos"), означаваща _характер или морална природа_.
**Етиката на данните** е [нов клон на етиката](https://royalsocietypublishing.org/doi/full/10.1098/rsta.2016.0360#sec-1), който "изучава и оценява моралните проблеми, свързани с анни, алгоритми и съответните практики_". Тук **"данни"** се фокусират върху действия, свързани с генериране, записване, куриране, обработка, разпространение, споделяне и използване, **"алгоритми"** се фокусират върху ИИ, агенти, машинно обучение и роботи, а **"практики"** се фокусират върху теми като отговорни иновации, програмиране, хакерство и етични кодекси.
**Етиката** се отнася до споделените ценности и морални принципи, които управляват нашето поведение в обществото. Етиката не се основава на закони, а на широко приети норми за това кое е "правилно срещу грешно". Въпреки това, етичните съображения могат да влияят върху инициативите за корпоративно управление и правителствените регулации, които създават повече стимули за съответствие.
**Приложната етика** е [практическото приложение на морални съображения](https://en.wikipedia.org/wiki/Applied_ethics). Това е процесът на активно изследване на етични въпроси в контекста на _реални действия, продукти и процеси_ и предприемане на коригиращи мерки, за да се гарантира, че те остават в съответствие с нашите дефинирани етични ценности.
**Етиката на данните** е [нов клон на етиката](https://royalsocietypublishing.org/doi/full/10.1098/rsta.2016.0360#sec-1), който "изучава и оценява морални проблеми, свързани с анни, алгоритми и съответните практики_". Тук **"данни"** се фокусират върху действия, свързани с генериране, записване, обработка, разпространение, споделяне и използване, **"алгоритми"** се фокусират върху AI, агенти, машинно обучение и роботи, а **"практики"** се фокусират върху теми като отговорна иновация, програмиране, хакерство и кодекси на етика.
**Културата на етиката** се отнася до [_операционализирането_ на приложната етика](https://hbr.org/2019/05/how-to-design-an-ethical-organization), за да се гарантира, че нашите етични принципи и практики се приемат последователно и мащабируемо в цялата организация. Успешните култури на етика дефинират етични принципи на ниво организация, предоставят значими стимули за съответствие и укрепват етичните норми, като насърчават и усилват желаните поведения на всяко ниво в организацията.
**Приложна етика** е [практическото приложение на морални съображения](https://en.wikipedia.org/wiki/Applied_ethics). Това е процесът на активно изследване на етични въпроси в контекста на _реални действия, продукти и процеси_ и предприемане на коригиращи мерки, за да се гарантира, че те остават съобразени с нашите определени етични ценности.
**Култура на етика** се отнася до [_операционализиране_ на приложната етика](https://hbr.org/2019/05/how-to-design-an-ethical-organization), за да се гарантира, че нашите етични принципи и практики се приемат последователно и мащабируемо в цялата организация. Успешните култури на етика определят етични принципи на ниво организация, предоставят значими стимули за съответствие и укрепват етичните норми, като насърчават и усилват желаните поведения на всяко ниво в организацията.
## Концепции за етика
@ -53,102 +49,105 @@ CO_OP_TRANSLATOR_METADATA:
### 1. Принципи на етиката
Всяка стратегия за етика на данните започва с дефиниране на _етични принципи_ - "споделените ценности", които описват приемливите поведения и насочват съответните действия в нашите проекти за данни и ИИ. Можете да ги дефинирате на индивидуално или екипно ниво. Въпреки това, повечето големи организации ги очертават в мисия или рамка за _етичен ИИ_, която е дефинирана на корпоративно ниво и се прилага последователно във всички екипи.
Всяка стратегия за етика на данните започва с дефиниране на _етични принципи_ - "споделените ценности", които описват приемливите поведения и насочват съответните действия в нашите проекти за данни и AI. Можете да ги дефинирате на индивидуално или екипно ниво. Въпреки това, повечето големи организации ги очертават в мисия или рамка за _етичен AI_, която е дефинирана на корпоративно ниво и се прилага последователно във всички екипи.
**Пример:** Мисията на Microsoft за [Отговорен ИИ](https://www.microsoft.com/en-us/ai/responsible-ai) гласи: _"Ние сме ангажирани с напредъка на ИИ, ръководен от етични принципи, които поставят хората на първо място"_ - идентифицирайки 6 етични принципа в рамката по-долу:
**Пример:** Мисията на Microsoft за [Отговорен AI](https://www.microsoft.com/en-us/ai/responsible-ai) гласи: _"Ние сме ангажирани с напредъка на AI, воден от етични принципи, които поставят хората на първо място"_ - идентифицирайки 6 етични принципа в рамката по-долу:
![Отговорен ИИ в Microsoft](https://docs.microsoft.com/en-gb/azure/cognitive-services/personalizer/media/ethics-and-responsible-use/ai-values-future-computed.png)
![Отговорен AI в Microsoft](https://docs.microsoft.com/en-gb/azure/cognitive-services/personalizer/media/ethics-and-responsible-use/ai-values-future-computed.png)
Нека разгледаме накратко тези принципи. розрачността_ и _отговорността_ са основни ценности, върху които се изграждат останалите принципи - затова нека започнем с тях:
Нека накратко разгледаме тези принципи. розрачността_ и _отговорността_ са основни ценности, върху които се изграждат останалите принципи - така че нека започнем с тях:
* [**Отговорност**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) прави практикуващите _отговорни_ за своите операции с данни и ИИ и за съответствието с тези етични принципи.
* [**Прозрачност**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) гарантира, че действията с данни и ИИ са _разбираеми_ (интерпретируеми) за потребителите, обяснявайки какво и защо стои зад решенията.
* [**Справедливост**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1%3aprimaryr6) - фокусира се върху гарантирането, че ИИ третира сички хора_ справедливо, адресирайки всякакви системни или имплицитни социално-технически пристрастия в данните и системите.
* [**Надеждност и безопасност**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - гарантира, че ИИ се държи _последователно_ с дефинираните ценности, минимизирайки потенциалните вреди или непредвидените последици.
* [**Отговорност**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) прави практикуващите _отговорни_ за своите операции с данни и AI и за съответствието с тези етични принципи.
* [**Прозрачност**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) гарантира, че действията с данни и AI са _разбираеми_ (интерпретируеми) за потребителите, обяснявайки какво и защо стои зад решенията.
* [**Справедливост**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1%3aprimaryr6) - се фокусира върху гарантирането, че AI третира сички хора_ справедливо, като адресира всякакви системни или имплицитни социално-технически предразсъдъци в данните и системите.
* [**Надеждност и безопасност**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - гарантира, че AI се държи _последователно_ с определените ценности, минимизирайки потенциалните вреди или непредвидените последици.
* [**Поверителност и сигурност**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - се отнася до разбирането на произхода на данните и предоставянето на ащита на поверителността на данните_ на потребителите.
* [**Инклузивност**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - се отнася до проектирането на ИИ решения с намерение, адаптирайки ги, за да отговорят на _широк спектър от човешки нужди_ и способности.
* [**Инклузивност**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - се отнася до проектирането на AI решения с намерение, адаптирайки ги да отговарят на _широк спектър от човешки нужди_ и способности.
> 🚨 Помислете каква би могла да бъде вашата мисия за етика на данните. Разгледайте рамки за етичен ИИ от други организации - ето примери от [IBM](https://www.ibm.com/cloud/learn/ai-ethics), [Google](https://ai.google/principles) и [Facebook](https://ai.facebook.com/blog/facebooks-five-pillars-of-responsible-ai/). Какви споделени ценности имат те? Как тези принципи се отнасят до ИИ продуктите или индустрията, в която оперират?
> 🚨 Помислете каква би могла да бъде вашата мисия за етика на данните. Разгледайте рамките за етичен AI от други организации - ето примери от [IBM](https://www.ibm.com/cloud/learn/ai-ethics), [Google](https://ai.google/principles) и [Facebook](https://ai.facebook.com/blog/facebooks-five-pillars-of-responsible-ai/). Какви споделени ценности имат те? Как тези принципи се отнасят към AI продуктите или индустрията, в която оперират?
### 2. Етични предизвикателства
След като дефинираме етичните принципи, следващата стъпка е да оценим нашите действия с данни и ИИ, за да видим дали те съответстват на тези споделени ценности. Помислете за действията си в две категории: _събиране на данни_ и _проектиране на алгоритми_.
След като сме дефинирали етичните принципи, следващата стъпка е да оценим действията си с данни и AI, за да видим дали те съответстват на тези споделени ценности. Помислете за действията си в две категории: _събиране на данни_ и _проектиране на алгоритми_.
При събирането на данни действията вероятно ще включват **лични данни** или лична идентификационна информация (PII) за идентифицируеми живи лица. Това включва [разнообразни елементи от нелични данни](https://ec.europa.eu/info/law/law-topic/data-protection/reform/what-personal-data_en), които олективно_ идентифицират индивид. Етичните предизвикателства могат да се отнасят до _поверителност на данните_, _собственост на данните_ и свързани теми като _информирано съгласие_ и _права върху интелектуалната собственост_ на потребителите.
При събирането на данни действията вероятно ще включват **лични данни** или информация, която може да идентифицира живи индивиди. Това включва [разнообразни елементи от нелични данни](https://ec.europa.eu/info/law/law-topic/data-protection/reform/what-personal-data_en), които олективно_ идентифицират индивид. Етичните предизвикателства могат да се отнасят до _поверителност на данните_, _собственост на данните_ и свързани теми като _информирано съгласие_ и _права върху интелектуалната собственост_ на потребителите.
При проектирането на алгоритми действията ще включват събиране и куриране на **набори от данни**, след което използването им за обучение и внедряване на **модели на данни**, които предсказват резултати или автоматизират решения в реални контексти. Етичните предизвикателства могат да възникнат от _пристрастия в набора от данни_, _проблеми с качеството на данните_, есправедливост_ и _погрешно представяне_ в алгоритмите - включително някои проблеми, които са системни по природа.
И в двата случая етичните предизвикателства подчертават области, в които нашите действия могат да влязат в конфликт с нашите споделени ценности. За да открием, смекчим, минимизираме или елиминираме тези опасения, трябва да задаваме морални "да/не" въпроси, свързани с нашите действия, и след това да предприемем коригиращи действия, ако е необходимо. Нека разгледаме някои етични предизвикателства и моралните въпроси, които те повдигат:
При проектирането на алгоритми действията ще включват събиране и обработка на **набори от данни**, след което използването им за обучение и внедряване на **модели на данни**, които предсказват резултати или автоматизират решения в реални контексти. Етичните предизвикателства могат да възникнат от _предразсъдъци в набора от данни_, проблеми с ачеството на данните_, есправедливост_ и _погрешно представяне_ в алгоритмите - включително някои проблеми, които са системни по природа.
И в двата случая етичните предизвикателства подчертават области, в които действията ни могат да влязат в конфликт с нашите споделени ценности. За да открием, смекчим, минимизираме или елиминираме тези проблеми, трябва да задаваме морални въпроси с "да/не" относно действията си и да предприемаме коригиращи действия, когато е необходимо. Нека разгледаме някои етични предизвикателства и моралните въпроси, които те повдигат:
#### 2.1 Собственост на данните
Събирането на данни често включва лични данни, които могат да идентифицират субектите на данните. [Собствеността на данните](https://permission.io/blog/data-ownership) се отнася до онтрола_ и [_правата на потребителите_](https://permission.io/blog/data-ownership), свързани със създаването, обработката и разпространението на данни.
Събирането на данни често включва лични данни, които могат да идентифицират субектите на данните. [Собствеността на данните](https://permission.io/blog/data-ownership) се отнася до онтрола_ и [_правата на потребителите_](https://permission.io/blog/data-ownership), свързани със създаването, обработката и разпространението на данни.
Моралните въпроси, които трябва да зададем, са:
* Кой притежава данните? (потребител или организация)
* Какви права имат субектите на данните? (напр. достъп, изтриване, преносимост)
* Какви права имат организациите? (напр. коригиране на злонамерени потребителски отзиви)
Моралните въпроси, които трябва да зададем, са:
* Кой притежава данните? (потребител или организация)
* Какви права имат субектите на данните? (напр. достъп, изтриване, преносимост)
* Какви права имат организациите? (напр. коригиране на злонамерени потребителски отзиви)
#### 2.2 Информирано съгласие
[Информираното съгласие](https://legaldictionary.net/informed-consent/) определя акта на потребителите да се съгласят с дадено действие (като събиране на данни) с _пълно разбиране_ на съответните факти, включително целта, потенциалните рискове и алтернативите.
[Информираното съгласие](https://legaldictionary.net/informed-consent/) определя акта на потребителите да се съгласяват с действие (като събиране на данни) с _пълно разбиране_ на релевантните факти, включително целта, потенциалните рискове и алтернативите.
Въпроси за разглеждане тук са:
* Дал ли е потребителят (субектът на данните) разрешение за събиране и използване на данни?
* Разбрал ли е потребителят целта, за която са събрани данните?
* Разбрал ли е потребителят потенциалните рискове от участието си?
* Дал ли е потребителят (субектът на данните) разрешение за събиране и използване на данни?
* Разбрал ли е потребителят целта, за която са събрани данните?
* Разбрал ли е потребителят потенциалните рискове от участието си?
#### 2.3 Интелектуална собственост
[Интелектуалната собственост](https://en.wikipedia.org/wiki/Intellectual_property) се отнася до нематериални творения, произтичащи от човешка инициатива, които могат да _имат икономическа стойност_ за индивиди или бизнеси.
[Интелектуалната собственост](https://en.wikipedia.org/wiki/Intellectual_property) се отнася до нематериални творения, произтичащи от човешка инициатива, които могат _да имат икономическа стойност_ за индивиди или бизнеси.
Въпроси за разглеждане тук са:
* Имат ли събраните данни икономическа стойност за потребител или бизнес?
* Има ли **потребителят** интелектуална собственост тук?
* Има ли **организацията** интелектуална собственост тук?
* Ако тези права съществуват, как ги защитаваме?
* Имат ли събраните данни икономическа стойност за потребител или бизнес?
* Има ли **потребителят** интелектуална собственост тук?
* Има ли **организацията** интелектуална собственост тук?
* Ако тези права съществуват, как ги защитаваме?
#### 2.4 Поверителност на данните
[Поверителността на данните](https://www.northeastern.edu/graduate/blog/what-is-data-privacy/) или информационната поверителност се отнася до запазването на поверителността на потребителите и защитата на тяхната идентичност по отношение на личната идентификационна информация.
[Поверителността на данните](https://www.northeastern.edu/graduate/blog/what-is-data-privacy/) или информационната поверителност се отнася до запазването на поверителността на потребителите и защитата на тяхната идентичност по отношение на лично идентифицируема информация.
Въпроси за разглеждане тук са:
* Защитени ли са данните на потребителите (лични) от хакове и изтичания?
* Достъпни ли са данните на потребителите само за оторизирани потребители и контексти?
* Запазена ли е анонимността на потребителите, когато данните се споделят или разпространяват?
* Може ли потребител да бъде деидентифициран от анонимизирани набори от данни?
* Защитени ли са личните данни на потребителите от хакове и течове?
* Достъпни ли са данните на потребителите само за упълномощени потребители и контексти?
* Запазена ли е анонимността на потребителите, когато данните се споделят или разпространяват?
* Може ли потребителят да бъде деидентифициран от анонимизирани набори от данни?
#### 2.5 Право да бъдеш забравен
#### 2.5 Правото да бъдеш забравен
[Правото да бъдеш забравен](https://en.wikipedia.org/wiki/Right_to_be_forgotten) или [правото на изтриване](https://www.gdpreu.org/right-to-be-forgotten/) предоставя допълнителна защита на личните данни на потребителите. По-конкретно, то дава право на потребителите да поискат изтриване или премахване на лични данни от интернет търсения и други места, _при определени обстоятелства_ - позволявайки им ново начало онлайн, без минали действия да бъдат използвани срещу тях.
[Правото да бъдеш забравен](https://en.wikipedia.org/wiki/Right_to_be_forgotten) или [Правото на изтриване](https://www.gdpreu.org/right-to-be-forgotten/) предоставя допълнителна защита на личните данни на потребителите. Специално, то дава право на потребителите да поискат изтриване или премахване на лични данни от интернет търсения и други места, _при специфични обстоятелства_ - позволявайки им ново начало онлайн без минали действия да бъдат използвани срещу тях.
Въпроси за разглеждане тук са:
* Позволява ли системата на субектите на данни да поискат изтриване?
* Трябва ли оттеглянето на съгласието на потребителя да задейства автоматично изтриване?
* Събрани ли са данни без съглас
* Позволява ли системата на субектите на данни да поискат изтриване?
* Трябва ли оттеглянето на съгласието на потребителя да задейства автоматично изтриване?
* Събрани ли са данни без съгласие или чрез незаконни средства?
* Съответстваме ли на правителствените регулации за поверителност на данните?
#### 2.6 Предразсъдъци в набора от данни
Предразсъдъците в набора от данни или [предразсъдъци при събиране](http://researcharticles.com/index.php/bias-in-data-collection-in-research/) се
[Algorithm Fairness](https://towardsdatascience.com/what-is-algorithm-fairness-3182e161cf9f) проверява дали дизайнът на алгоритъма систематично дискриминира определени подгрупи от субекти на данни, водейки до [потенциални вреди](https://docs.microsoft.com/en-us/azure/machine-learning/concept-fairness-ml) в _разпределението_ (когато ресурси се отказват или задържат от тази група) и ачеството на услугата_ (когато AI не е толкова точен за някои подгрупи, колкото за други).
Въпроси за разглеждане тук са:
* Оценихме ли точността на модела за различни подгрупи и условия?
* Анализирахме ли системата за потенциални вреди (например, стереотипизиране)?
* Анализирахме ли системата за потенциални вреди (например, стереотипи)?
* Можем ли да преработим данните или да обучим отново моделите, за да смекчим идентифицираните вреди?
Разгледайте ресурси като [AI Fairness checklists](https://query.prod.cms.rt.microsoft.com/cms/api/am/binary/RE4t6dA), за да научите повече.
#### 2.9 Заблуда
[Заблуда в данните](https://www.sciencedirect.com/topics/computer-science/misrepresentation) се отнася до въпроса дали представяме прозрения от честно докладвани данни по подвеждащ начин, за да подкрепим желан разказ.
[Data Misrepresentation](https://www.sciencedirect.com/topics/computer-science/misrepresentation) се отнася до въпроса дали представяме прозрения от честно докладвани данни по подвеждащ начин, за да подкрепим желан разказ.
Въпроси за разглеждане тук са:
* Докладваме ли непълни или неточни данни?
* Визуализираме ли данни по начин, който води до подвеждащи заключения?
* Използваме ли селективни статистически техники за манипулиране на резултатите?
* Съществуват ли алтернативни обяснения, които могат да предложат различно заключение?
* Има ли алтернативни обяснения, които могат да предложат различно заключение?
#### 2.10 Свободен избор
[Илюзията за свободен избор](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice) възниква, когато "архитектурите на избор" в системата използват алгоритми за вземане на решения, за да насочат хората към предпочитан резултат, докато изглежда, че им дават опции и контрол. Тези [тъмни модели](https://www.darkpatterns.org/) могат да причинят социални и икономически вреди на потребителите. Тъй като решенията на потребителите влияят върху профилите на поведение, тези действия потенциално задвижват бъдещи избори, които могат да усилят или разширят въздействието на тези вреди.
[Илюзията за свободен избор](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice) възниква, когато "архитектурите на избор" на системата използват алгоритми за вземане на решения, за да насочат хората към предпочитан резултат, като същевременно създават впечатление, че имат опции и контрол. Тези [тъмни модели](https://www.darkpatterns.org/) могат да причинят социални и икономически вреди на потребителите. Тъй като решенията на потребителите влияят върху профилите на поведение, тези действия потенциално задвижват бъдещи избори, които могат да усилят или разширят въздействието на тези вреди.
Въпроси за разглеждане тук са:
* Разбра ли потребителят последиците от вземането на този избор?
@ -157,24 +156,25 @@ CO_OP_TRANSLATOR_METADATA:
### 3. Казуси
За да поставим тези етични предизвикателства в контекста на реалния свят, е полезно да разгледаме казуси, които подчертават потенциалните вреди и последствия за индивидите и обществото, когато такива етични нарушения се пренебрегват.
За да поставим тези етични предизвикателства в контекста на реалния свят, е полезно да разгледаме казуси, които подчертават потенциалните вреди и последици за индивидите и обществото, когато такива нарушения на етиката се пренебрегват.
Ето няколко примера:
| Етично предизвикателство | Казус |
|--- |--- |
| **Информирано съгласие** | 1972 - [Изследване на сифилис в Тъскиги](https://en.wikipedia.org/wiki/Tuskegee_Syphilis_Study) - Афроамерикански мъже, които участвали в изследването, били обещани безплатна медицинска грижа, о били измамени_ от изследователи, които не информирали субектите за диагнозата им или за наличието на лечение. Много субекти починали, а партньорите или децата им били засегнати; изследването продължило 40 години. |
| **Поверителност на данните** | 2007 - [Награда за данни на Netflix](https://www.wired.com/2007/12/why-anonymous-data-sometimes-isnt/) предоставила на изследователи _10 милиона анонимизирани оценки на филми от 50 хиляди клиенти_, за да помогне за подобряване на алгоритмите за препоръки. Въпреки това, изследователите успели да свържат анонимизирани данни с лични данни в _външни набори от данни_ (например, коментари в IMDb) - ефективно "деанонимизирайки" някои абонати на Netflix.|
| **Пристрастие при събиране на данни** | 2013 - Град Бостън [разработил Street Bump](https://www.boston.gov/transportation/street-bump), приложение, което позволявало на гражданите да докладват за дупки, предоставяйки на града по-добри данни за пътната инфраструктура. Въпреки това, [хората от по-ниски доходни групи имали по-малък достъп до автомобили и телефони](https://hbr.org/2013/04/the-hidden-biases-in-big-data), което правело техните проблеми с пътищата невидими в това приложение. Разработчиците работили с академици за решаване на проблеми с _равен достъп и дигитални разделения_ за справедливост. |
| **Алгоритмична справедливост** | 2018 - MIT [Gender Shades Study](http://gendershades.org/overview.html) оценило точността на AI продукти за класификация на пола, разкривайки пропуски в точността за жени и хора с различен цвят на кожата. [Apple Card от 2019](https://www.wired.com/story/the-apple-card-didnt-see-genderand-thats-the-problem/) изглежда предлагала по-малко кредит на жени, отколкото на мъже. И двата случая илюстрират проблеми с алгоритмичното пристрастие, водещо до социално-икономически вреди.|
| **Заблуда в данните** | 2020 - [Департаментът за обществено здраве на Джорджия публикувал графики за COVID-19](https://www.vox.com/covid-19-coronavirus-us-response-trump/2020/5/18/21262265/georgia-covid-19-cases-declining-reopening), които изглеждали подвеждащи за гражданите относно тенденциите в потвърдените случаи с не-хронологично подреждане на x-оста. Това илюстрира заблуда чрез визуализационни трикове. |
| **Илюзия за свободен избор** | 2020 - Образователното приложение [ABCmouse платило $10 милиона за уреждане на жалба от FTC](https://www.washingtonpost.com/business/2020/09/04/abcmouse-10-million-ftc-settlement/), където родителите били принудени да плащат за абонаменти, които не можели да отменят. Това илюстрира тъмни модели в архитектурите на избор, където потребителите били насочени към потенциално вредни избори. |
| **Поверителност на данните и права на потребителите** | 2021 - Facebook [Изтичане на данни](https://www.npr.org/2021/04/09/986005820/after-data-breach-exposes-530-million-facebook-says-it-will-not-notify-users) разкрило данни от 530 милиона потребители, водейки до уреждане от $5 милиарда с FTC. Въпреки това, компанията отказала да уведоми потребителите за изтичането, нарушавайки правата им за прозрачност и достъп до данни. |
| **Информирано съгласие** | 1972 - [Tuskegee Syphilis Study](https://en.wikipedia.org/wiki/Tuskegee_Syphilis_Study) - Афроамерикански мъже, които участвали в изследването, били обещани безплатна медицинска грижа, о били измамени_ от изследователи, които не информирали субектите за диагнозата им или за наличието на лечение. Много субекти починали, а партньори или деца били засегнати; изследването продължило 40 години. |
| **Поверителност на данните** | 2007 - [Netflix data prize](https://www.wired.com/2007/12/why-anonymous-data-sometimes-isnt/) предоставил на изследователите _10M анонимизирани оценки на филми от 50K клиенти_, за да помогне за подобряване на алгоритмите за препоръки. Въпреки това, изследователите успели да свържат анонимизирани данни с лични данни в _външни набори от данни_ (например, коментари в IMDb) - ефективно "деанонимизирайки" някои абонати на Netflix.|
| **Пристрастие при събиране** | 2013 - Град Бостън [разработил Street Bump](https://www.boston.gov/transportation/street-bump), приложение, което позволявало на гражданите да докладват за дупки, предоставяйки на града по-добри данни за пътната инфраструктура. Въпреки това, [хората от групи с по-ниски доходи имали по-малък достъп до автомобили и телефони](https://hbr.org/2013/04/the-hidden-biases-in-big-data), което правело техните проблеми с пътищата невидими в това приложение. Разработчиците работили с академици за справяне с _въпроси за равен достъп и дигитални разделения_ за справедливост. |
| **Алгоритмична справедливост** | 2018 - MIT [Gender Shades Study](http://gendershades.org/overview.html) оценил точността на AI продукти за класификация на пола, разкривайки пропуски в точността за жени и хора с различен цвят на кожата. [Apple Card от 2019](https://www.wired.com/story/the-apple-card-didnt-see-genderand-thats-the-problem/) изглежда предлагал по-малко кредит на жени, отколкото на мъже. И двата случая илюстрират проблеми с пристрастия в алгоритмите, водещи до социално-икономически вреди.|
| **Заблуда с данни** | 2020 - [Georgia Department of Public Health released COVID-19 charts](https://www.vox.com/covid-19-coronavirus-us-response-trump/2020/5/18/21262265/georgia-covid-19-cases-declining-reopening), които изглеждали подвеждащи за гражданите относно тенденциите в потвърдените случаи с не-хронологично подреждане на x-оста. Това илюстрира заблуда чрез визуализационни трикове. |
| **Илюзия за свободен избор** | 2020 - Образователно приложение [ABCmouse платило $10M за уреждане на жалба от FTC](https://www.washingtonpost.com/business/2020/09/04/abcmouse-10-million-ftc-settlement/), където родителите били принудени да плащат за абонаменти, които не можели да отменят. Това илюстрира тъмни модели в архитектурите на избор, където потребителите били насочени към потенциално вредни избори. |
| **Поверителност на данните и права на потребителите** | 2021 - Facebook [Data Breach](https://www.npr.org/2021/04/09/986005820/after-data-breach-exposes-530-million-facebook-says-it-will-not-notify-users) разкрил данни от 530M потребители, водейки до уреждане от $5B с FTC. Въпреки това, компанията отказала да уведоми потребителите за нарушението, нарушавайки правата им за прозрачност и достъп до данни. |
Искате ли да разгледате още казуси? Вижте тези ресурси:
* [Ethics Unwrapped](https://ethicsunwrapped.utexas.edu/case-studies) - етични дилеми в различни индустрии.
* [Курс по етика в науката за данни](https://www.coursera.org/learn/data-science-ethics#syllabus) - разглеждане на знакови казуси.
* [Къде нещата са се объркали](https://deon.drivendata.org/examples/) - списък Deon с примери.
* [Data Science Ethics course](https://www.coursera.org/learn/data-science-ethics#syllabus) - разглеждане на знакови казуси.
* [Where things have gone wrong](https://deon.drivendata.org/examples/) - Deon чеклист с примери.
> 🚨 Помислете за казусите, които сте видели - изпитвали ли сте или били ли сте засегнати от подобно етично предизвикателство в живота си? Можете ли да се сетите за поне един друг казус, който илюстрира едно от етичните предизвикателства, които обсъдихме в този раздел?
@ -184,60 +184,67 @@ CO_OP_TRANSLATOR_METADATA:
### 1. Професионални кодекси
Професионалните кодекси предлагат една опция за организациите да "стимулират" членовете си да подкрепят техните етични принципи и мисия. Кодексите са орални насоки_ за професионално поведение, помагащи на служителите или членовете да вземат решения, които съответстват на принципите на организацията. Те са толкова добри, колкото доброволното спазване от членовете; въпреки това, много организации предлагат допълнителни награди и наказания, за да мотивират спазването.
Професионалните кодекси предлагат една опция за организациите да "мотивират" членовете си да подкрепят техните етични принципи и мисия. Кодексите са орални насоки_ за професионално поведение, които помагат на служителите или членовете да вземат решения, съответстващи на принципите на организацията. Те са толкова добри, колкото доброволното спазване от членовете; въпреки това, много организации предлагат допълнителни награди и наказания, за да мотивират спазването.
Примери включват:
* [Oxford Munich](http://www.code-of-ethics.org/code-of-conduct/) Кодекс на етиката
* [Data Science Association](http://datascienceassn.org/code-of-conduct.html) Кодекс на поведение (създаден през 2013 г.)
* [ACM Кодекс на етиката и професионалното поведение](https://www.acm.org/code-of-ethics) (от 1993 г.)
* [ACM Code of Ethics and Professional Conduct](https://www.acm.org/code-of-ethics) (от 1993 г.)
> 🚨 Членувате ли в професионална инженерна или организация за наука за данни? Разгледайте техния сайт, за да видите дали дефинират професионален кодекс на етиката. Какво казва това за техните етични принципи? Как стимулират членовете да следват кодекса?
> 🚨 Членувате ли в професионална инженерна или организация за данни? Разгледайте техния сайт, за да видите дали дефинират професионален кодекс на етиката. Какво казва това за техните етични принципи? Как мотивират членовете да следват кодекса?
### 2. Етични списъци за проверка
### 2. Етични чеклисти
Докато професионалните кодекси дефинират изискваното _етично поведение_ от практикуващите, те [имат известни ограничения](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md) в прилагането, особено в мащабни проекти. Вместо това, много експерти в науката за данни [препоръчват списъци за проверка](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md), които могат **да свържат принципите с практиките** по по-определен и приложим начин.
Докато професионалните кодекси дефинират изискваното _етично поведение_ от практикуващите, те [имат известни ограничения](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md) в прилагането, особено в мащабни проекти. Вместо това, много експерти по данни [препоръчват чеклисти](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md), които могат **да свържат принципите с практиките** по по-определен и приложим начин.
Списъците за проверка превръщат въпросите в задачи "да/не", които могат да бъдат операционализирани, позволявайки им да бъдат проследявани като част от стандартните работни потоци за пускане на продукти.
Чеклистите превръщат въпросите в задачи "да/не", които могат да бъдат операционализирани, позволявайки им да бъдат проследявани като част от стандартните работни потоци за пускане на продукти.
Примери включват:
* [Deon](https://deon.drivendata.org/) - общопрактичен етичен списък за проверка, създаден от [препоръки от индустрията](https://deon.drivendata.org/#checklist-citations) с инструмент за команден ред за лесна интеграция.
* [Списък за проверка на поверителността](https://cyber.harvard.edu/ecommerce/privacyaudit.html) - предоставя общи насоки за практики за обработка на информация от правна и социална перспектива.
* [Списък за проверка на справедливостта в AI](https://www.microsoft.com/en-us/research/project/ai-fairness-checklist/) - създаден от AI практици за подкрепа на приемането и интеграцията на проверки за справедливост в цикли за разработка на AI.
* [22 въпроса за етика в данните и AI](https://medium.com/the-organization/22-questions-for-ethics-in-data-and-ai-efb68fd19429) - по-отворена рамка, структурирана за първоначално изследване на етични въпроси в дизайна, изпълнението и организационните контексти.
* [Deon](https://deon.drivendata.org/) - обща етична чеклист за данни, създадена от [препоръки от индустрията](https://deon.drivendata.org/#checklist-citations) с инструмент за команден ред за лесна интеграция.
* [Privacy Audit Checklist](https://cyber.harvard.edu/ecommerce/privacyaudit.html) - предоставя общи насоки за практики за обработка на информация от правна и социална перспектива.
* [AI Fairness Checklist](https://www.microsoft.com/en-us/research/project/ai-fairness-checklist/) - създадена от AI практици за подкрепа на приемането и интеграцията на проверки за справедливост в цикли за разработка на AI.
* [22 questions for ethics in data and AI](https://medium.com/the-organization/22-questions-for-ethics-in-data-and-ai-efb68fd19429) - по-отворена рамка, структурирана за първоначално изследване на етични въпроси в дизайна, изпълнението и организационните контексти.
### 3. Етични регулации
Етиката е за дефиниране на споделени ценности и правене на правилното нещо оброволно_. **Съответствието** е за _спазване на закона_, ако и където е дефиниран. **Управлението** обхваща всички начини, по които организациите работят за прилагане на етични принципи и спазване на установените закони.
Етиката е за дефиниране на споделени ценности и правене на правилното нещо оброволно_. **Съответствие** е за _спазване на закона_, ако и където е дефиниран. **Управление** обхваща всички начини, по които организациите работят за прилагане на етични принципи и спазване на установените закони.
Днес управлението приема две форми в рамките на организациите. Първо, става въпрос за дефиниране на принципи за **етичен AI** и установяване на практики за операционализиране на приемането им във всички AI-свързани проекти в организацията. Второ, става въпрос за спазване на всички правителствено наложени **регулации за защита на данните** за регионите, в които тя оперира.
Днес управлението приема две форми в рамките на организациите. Първо, става въпрос за дефиниране на принципи за **етичен AI** и установяване на практики за операционализиране на приемането във всички AI-свързани проекти в организацията. Второ, става въпрос за спазване на всички правителствено наложени **регулации за защита на данните** за регионите, в които оперира.
Примери за регулации за защита на данните и поверителност:
* `1974`, [US Privacy Act](https://www.justice.gov/opcl/privacy-act-1974) - регулира _събирането, използването и разкриването_ на лична информация от федералното правителство.
* `1996`, [US Health Insurance Portability & Accountability Act (HIPAA)](https://www.cdc.gov/phlp/publications/topic/hipaa.html) - защитава личните здравни данни.
* `1998`, [US Children's Online Privacy Protection Act (COPPA)](https://www.ftc.gov/enforcement/rules/rulemaking-regulatory-reform-proceedings/childrens-online-privacy-protection-rule) - защитава поверителността на данните на деца под 13 години.
* `2018`, [Общ регламент за защита на данните (GDPR)](https://gdpr-info.eu/) - предоставя права на потребителите, защита на данните и поверителност.
* `2018`, [Закон за поверителност на потребителите в Калифорния (CCPA)](https://www.oag.ca.gov/privacy/ccpa) - дава на потребителите повече _права_ върху техните (лични) данни.
* `2021`, Китайският [Закон за защита на личната информация](https://www.reuters.com/world/china/china-passes-new-personal-data-privacy-law-take-effect-nov-1-2021-08-20/) - създава една от най-силните регулации за онлайн поверителност в света.
* `2018`, [General Data Protection Regulation (GDPR)](https://gdpr-info.eu/) - предоставя права на потребителите, защита на данните и поверителност.
* `2018`, [California Consumer Privacy Act (CCPA)](https://www.oag.ca.gov/privacy/ccpa) - дава на потребителите повече _права_ върху техните (лични) данни.
* `2021`, Китайският [Personal Information Protection Law](https://www.reuters.com/world/china/china-passes-new-personal-data-privacy-law-take-effect-nov-1-2021-08-20/) току-що приет, създавайки една от най-силните регулации за онлайн поверителност на данните в света.
> 🚨 Европейският съюз дефинира GDPR (Общ регламент за защита на данните), който остава един от най-влиятелните регулации за поверителност на данните днес. Знаете ли, че той също дефинира [8 права на потребителите](https://www.freeprivacypolicy.com/blog/8-user-rights-gdpr), за да защити цифровата поверителност и личните данни на гражданите? Научете какви са те и защо са важни.
### 4. Етична култура
Имайте предвид, че остава нематериална разлика между _съответствие_ (правене на достатъчно, за да се спази "буквата на закона") и адресиране на [системни проблеми](https://www.coursera.org/learn/data-science-ethics/home/week/4) (като осификация, информационна асиметрия и разпределителна несправедливост), които могат да ускорят оръжейната употреба на AI.
Имайте предвид, че остава нематериална разлика между _съответствие_ (правене на достатъчно, за да се спази "буквата на закона") и справяне със [системни проблеми](https://www.coursera.org/learn/data-science-ethics/home/week/4) (като осификация, информационна асиметрия и разпределителна несправедливост), които могат да ускорят оръжейната употреба на AI.
Последното изисква [съвместни подходи за дефиниране на етични култури](https://towardsdatascience.com/why-ai-ethics-requires-a-culture-driven-approach-26f451afa29f), които изграждат емоционални връзки и последователни споделени ценности _в рамките на организациите_ в индустрията. Това изисква повече [формализирани култури за етика на данните](https://www.codeforamerica.org/news/formalizing-an-ethical-data-culture/) в организациите - позволявайки а всеки_ да [дръпне въжето Andon](https://en.wikipedia.org/wiki/Andon_(manufacturing)) (за да повдигне етични проблеми рано в процеса) и правейки _етичните оценки_ (например, при наемане) основен критерий за формиране на екипи в AI проекти.
---
## [Тест след лекцията](https://ff-quizzes.netlify.app/en/ds/) 🎯
## Преглед и самостоятелно обучение
Последното изисква [съвместни подходи за дефиниране на етични култури](https://towardsdatascience.com/why-ai-ethics-requires-a-culture-driven-approach-26f451afa29f), които изграждат емоционални връзки и последователни споделени ценности _в рамките на организациите_ в индустрията. Това изисква повече [формализирани култури на етика в данните](https://www.codeforamerica.org/news/formalizing-an-ethical-data-culture/) в организациите - позволявайки секи_ да [дръпне въжето на Андон](https://en.wikipedia.org/wiki/Andon_(manufacturing)) (за да повдигне етични проблеми рано в процеса) и правейки _етичните оценки
* [Принципи на отговорния изкуствен интелект](https://docs.microsoft.com/en-us/learn/modules/responsible-ai-principles/) - безплатен учебен курс от Microsoft Learn.
* [Етика и наука за данни](https://resources.oreilly.com/examples/0636920203964) - електронна книга на O'Reilly (М. Лукидес, Х. Мейсън и др.)
* [Етика в науката за данни](https://www.coursera.org/learn/data-science-ethics#syllabus) - онлайн курс от Университета на Мичиган.
* [Етика в действие](https://ethicsunwrapped.utexas.edu/case-studies) - казуси от Университета на Тексас.
Курсовете и книгите помагат за разбирането на основните концепции и предизвикателства на етиката, докато казусите и инструментите помагат за приложни етични практики в контекста на
* [Принципи на отговорния AI](https://docs.microsoft.com/en-us/learn/modules/responsible-ai-principles/) - безплатен учебен курс от Microsoft Learn.
* [Етика и наука за данни](https://resources.oreilly.com/examples/0636920203964) - електронна книга на O'Reilly (М. Лукидес, Х. Мейсън и др.)
* [Етика в науката за данни](https://www.coursera.org/learn/data-science-ethics#syllabus) - онлайн курс от Университета на Мичиган.
* [Етика без граници](https://ethicsunwrapped.utexas.edu/case-studies) - казуси от Университета на Тексас.
# Задача
# Задача
[Напишете казус за етика в данните](assignment.md)
[Напишете казус за етика в данните](assignment.md)
---
**Отказ от отговорност**:
Този документ е преведен с помощта на AI услуга за превод [Co-op Translator](https://github.com/Azure/co-op-translator). Въпреки че се стремим към точност, моля, имайте предвид, че автоматичните преводи може да съдържат грешки или неточности. Оригиналният документ на неговия изходен език трябва да се счита за авторитетен източник. За критична информация се препоръчва професионален превод от човек. Ние не носим отговорност за каквито и да е недоразумения или погрешни интерпретации, произтичащи от използването на този превод.
Този документ е преведен с помощта на AI услуга за превод [Co-op Translator](https://github.com/Azure/co-op-translator). Въпреки че се стремим към точност, моля, имайте предвид, че автоматизираните преводи може да съдържат грешки или неточности. Оригиналният документ на неговия роден език трябва да се счита за авторитетен източник. За критична информация се препоръчва професионален човешки превод. Ние не носим отговорност за недоразумения или погрешни интерпретации, произтичащи от използването на този превод.

@ -1,174 +1,172 @@
<!--
CO_OP_TRANSLATOR_METADATA:
{
"original_hash": "8796f41f566a0a8ebb72863a83d558ed",
"translation_date": "2025-08-27T08:54:10+00:00",
"original_hash": "3a34157cc63516eba97c89a0b2f8c3e6",
"translation_date": "2025-09-03T21:08:43+00:00",
"source_file": "1-Introduction/02-ethics/README.md",
"language_code": "bn"
}
-->
# ডেটা নৈতিকতার পরিচিতি
# ডেটা নীতিশাস্ত্রের পরিচিতি
|![ স্কেচনোট [(@sketchthedocs)](https://sketchthedocs.dev) দ্বারা ](../../sketchnotes/02-Ethics.png)|
|:---:|
| ডেটা সায়েন্স নৈতিকতা - _[@nitya](https://twitter.com/nitya) দ্বারা স্কেচনোট_ |
| ডেটা সায়েন্স নীতিশাস্ত্র - _[@nitya](https://twitter.com/nitya) দ্বারা স্কেচনোট_ |
---
আমরা সবাই ডেটা নাগরিক, যারা একটি ডেটা-নির্ভর বিশ্বে বাস করছি।
আমরা সবাই একটি ডেটা-নির্ভর জগতে ডেটা নাগরিক হিসেবে বসবাস করছি।
বাজারের প্রবণতা আমাদের বলে যে ২০২২ সালের মধ্যে, প্রতি তিনটি বড় প্রতিষ্ঠানের মধ্যে একটি তাদের ডেটা অনলাইনে [মার্কেটপ্লেস এবং এক্সচেঞ্জ](https://www.gartner.com/smarterwithgartner/gartner-top-10-trends-in-data-and-analytics-for-2020/) এর মাধ্যমে ক্রয় এবং বিক্রয় করবে। **অ্যাপ ডেভেলপার** হিসেবে, আমাদের জন্য ডেটা-নির্ভর অন্তর্দৃষ্টি এবং অ্যালগরিদম-নির্ভর অটোমেশনকে দৈনন্দিন ব্যবহারকারীর অভিজ্ঞতায় সংযুক্ত করা আরও সহজ এবং সাশ্রয়ী হবে। তবে, যখন AI সর্বব্যাপী হয়ে উঠছে, তখন আমাদের এই অ্যালগরিদমগুলির [অস্ত্রায়ন](https://www.youtube.com/watch?v=TQHs8SA1qpk) দ্বারা সম্ভাব্য ক্ষতির বিষয়টি বুঝতে হবে।
বাজারের প্রবণতা আমাদের জানায় যে ২০২২ সালের মধ্যে, প্রতি তিনটি বড় প্রতিষ্ঠানের মধ্যে একটি তাদের ডেটা অনলাইনে [মার্কেটপ্লেস এবং এক্সচেঞ্জ](https://www.gartner.com/smarterwithgartner/gartner-top-10-trends-in-data-and-analytics-for-2020/) এর মাধ্যমে ক্রয়-বিক্রয় করবে। **অ্যাপ ডেভেলপার** হিসেবে, আমাদের জন্য ডেটা-চালিত অন্তর্দৃষ্টি এবং অ্যালগরিদম-চালিত স্বয়ংক্রিয়তাকে দৈনন্দিন ব্যবহারকারীর অভিজ্ঞতায় সংহত করা সহজ এবং সাশ্রয়ী হবে। তবে, যখন এআই সর্বব্যাপী হয়ে উঠছে, তখন আমাদের এটাও বুঝতে হবে যে [অস্ত্রায়ন](https://www.youtube.com/watch?v=TQHs8SA1qpk) এর মাধ্যমে বড় পরিসরে এই অ্যালগরিদমগুলো কী ধরনের ক্ষতি করতে পারে।
প্রবণতা আরও নির্দেশ করে যে আমরা ২০২৫ সালের মধ্যে [১৮০ জেটাবাইট](https://www.statista.com/statistics/871513/worldwide-data-created/) ডেটা তৈরি এবং ব্যবহার করব। **ডেটা বিজ্ঞানী** হিসেবে, এটি আমাদের ব্যক্তিগত ডেটার অভূতপূর্ব স্তরে প্রবেশাধিকার দেয়। এর অর্থ হলো আমরা ব্যবহারকারীদের আচরণগত প্রোফাইল তৈরি করতে পারি এবং সিদ্ধান্ত গ্রহণে প্রভাব ফেলতে পারি এমনভাবে যা [মুক্ত পছন্দের বিভ্রম](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice) তৈরি করে, তবে সম্ভাব্যভাবে ব্যবহারকারীদের আমাদের পছন্দের ফলাফলের দিকে ঠেলে দেয়। এটি ডেটা গোপনীয়তা এবং ব্যবহারকারীর সুরক্ষার বিষয়ে আরও বিস্তৃত প্রশ্নও উত্থাপন করে।
প্রবণতা আরও দেখায় যে ২০২৫ সালের মধ্যে আমরা [১৮০ জেটাবাইট](https://www.statista.com/statistics/871513/worldwide-data-created/) এর বেশি ডেটা তৈরি এবং ব্যবহার করব। **ডেটা সায়েন্টিস্ট** হিসেবে, এটি আমাদের ব্যক্তিগত ডেটার অভূতপূর্ব স্তরে প্রবেশাধিকার দেয়। এর মানে আমরা ব্যবহারকারীদের আচরণগত প্রোফাইল তৈরি করতে পারি এবং এমনভাবে সিদ্ধান্ত গ্রহণে প্রভাব ফেলতে পারি যা [মুক্ত পছন্দের ভ্রম](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice) তৈরি করে, তবে ব্যবহারকারীদের আমাদের পছন্দসই ফলাফলের দিকে ঠেলে দেয়। এটি ডেটা গোপনীয়তা এবং ব্যবহারকারীর সুরক্ষার উপর আরও বিস্তৃত প্রশ্নও উত্থাপন করে।
ডেটা নৈতিকতা এখন ডেটা বিজ্ঞান এবং প্রকৌশলের জন্য _প্রয়োজনীয় গার্ডরেল_, যা আমাদের ডেটা-নির্ভর ক্রিয়াকলাপ থেকে সম্ভাব্য ক্ষতি এবং অনিচ্ছাকৃত পরিণতি কমাতে সাহায্য করে। [গার্টনার হাইপ সাইকেল ফর AI](https://www.gartner.com/smarterwithgartner/2-megatrends-dominate-the-gartner-hype-cycle-for-artificial-intelligence-2020/) ডিজিটাল নৈতিকতা, দায়িত্বশীল AI, এবং AI গভর্নেন্সের প্রাসঙ্গিক প্রবণতাগুলিকে চিহ্নিত করে, যা AI-এর _গণতন্ত্রায়ন_ এবং _শিল্পায়ন_ এর বৃহত্তর মেগাট্রেন্ডগুলির মূল চালক
ডেটা নীতিশাস্ত্র এখন ডেটা সায়েন্স এবং প্রকৌশলের জন্য _প্রয়োজনীয় গার্ডরেল_, যা আমাদের ডেটা-চালিত কর্ম থেকে সম্ভাব্য ক্ষতি এবং অনিচ্ছাকৃত পরিণতি হ্রাস করতে সাহায্য করে। [গার্টনার হাইপ সাইকেল ফর এআই](https://www.gartner.com/smarterwithgartner/2-megatrends-dominate-the-gartner-hype-cycle-for-artificial-intelligence-2020/) ডিজিটাল নীতিশাস্ত্র, দায়িত্বশীল এআই এবং এআই গভর্নেন্সের মতো প্রবণতাগুলিকে বড় মেগাট্রেন্ডগুলির মূল চালক হিসাবে চিহ্নিত করে, যেমন এআই-এর _গণতন্ত্রায়ন_ এবং _শিল্পায়ন_
![গার্টনারের AI-এর হাইপ সাইকেল - ২০২০](https://images-cdn.newscred.com/Zz1mOWJhNzlkNDA2ZTMxMWViYjRiOGFiM2IyMjQ1YmMwZQ==)
![গার্টনারের এআই-এর হাইপ সাইকেল - ২০২০](https://images-cdn.newscred.com/Zz1mOWJhNzlkNDA2ZTMxMWViYjRiOGFiM2IyMjQ1YmMwZQ==)
এই পাঠে, আমরা ডেটা নৈতিকতার চমৎকার ক্ষেত্রটি অন্বেষণ করব - মূল ধারণা এবং চ্যালেঞ্জ থেকে শুরু করে কেস স্টাডি এবং গভর্নেন্সের মতো প্রয়োগকৃত AI ধারণা - যা ডেটা এবং AI নিয়ে কাজ করা দল এবং প্রতিষ্ঠানে একটি নৈতিকতার সংস্কৃতি প্রতিষ্ঠায় সাহায্য করে।
এই পাঠে, আমরা ডেটা নীতিশাস্ত্রের চমকপ্রদ ক্ষেত্রটি অন্বেষণ করব - মূল ধারণা এবং চ্যালেঞ্জ থেকে শুরু করে কেস স্টাডি এবং গভর্নেন্সের মতো প্রয়োগকৃত এআই ধারণা পর্যন্ত - যা ডেটা এবং এআই নিয়ে কাজ করা দল এবং প্রতিষ্ঠানে একটি নীতিশাস্ত্র সংস্কৃতি প্রতিষ্ঠায় সাহায্য করে।
## [পূর্ব-লেকচার কুইজ](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/2) 🎯
## [পাঠ-পূর্ব কুইজ](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/2) 🎯
## মৌলিক সংজ্ঞা
চলুন মৌলিক পরিভাষা বোঝা শুরু করি।
চলুন মৌলিক পরিভাষা বোঝা দিয়ে শুরু করি।
"নীতিশাস্ত্র" শব্দটি এসেছে [গ্রিক শব্দ "ethikos"](https://en.wikipedia.org/wiki/Ethics) (এবং এর মূল "ethos") থেকে, যার অর্থ _চরিত্র বা নৈতিক প্রকৃতি_
**নীতিশাস্ত্র** হলো সেই শেয়ার করা মূল্যবোধ এবং নৈতিক নীতিমালা যা সমাজে আমাদের আচরণ নিয়ন্ত্রণ করে। নীতিশাস্ত্র আইন নয়, বরং "সঠিক বনাম ভুল" এর ব্যাপারে সর্বজনীনভাবে গৃহীত মানদণ্ডের উপর ভিত্তি করে। তবে, নৈতিক বিবেচনা কর্পোরেট গভর্নেন্স উদ্যোগ এবং সরকারী নিয়মকানুনকে প্রভাবিত করতে পারে, যা সম্মতির জন্য আরও প্রণোদনা তৈরি করে।
"নৈতিকতা" শব্দটি [গ্রিক শব্দ "ethikos"](https://en.wikipedia.org/wiki/Ethics) (এবং এর মূল "ethos") থেকে এসেছে, যার অর্থ _চরিত্র বা নৈতিক প্রকৃতি_
**ডেটা নীতিশাস্ত্র** হলো নীতিশাস্ত্রের একটি [নতুন শাখা](https://royalsocietypublishing.org/doi/full/10.1098/rsta.2016.0360#sec-1), যা "_ডেটা, অ্যালগরিদম এবং সংশ্লিষ্ট অনুশীলন_" সম্পর্কিত নৈতিক সমস্যাগুলি অধ্যয়ন এবং মূল্যায়ন করে। এখানে, **"ডেটা"** জেনারেশন, রেকর্ডিং, কিউরেশন, প্রসেসিং, প্রচার, শেয়ারিং এবং ব্যবহারের সাথে সম্পর্কিত ক্রিয়াকলাপগুলির উপর দৃষ্টি নিবদ্ধ করে; **"অ্যালগরিদম"** এআই, এজেন্ট, মেশিন লার্নিং এবং রোবটগুলির উপর দৃষ্টি নিবদ্ধ করে; এবং **"অনুশীলন"** দায়িত্বশীল উদ্ভাবন, প্রোগ্রামিং, হ্যাকিং এবং নীতিশাস্ত্র কোডের মতো বিষয়গুলির উপর দৃষ্টি নিবদ্ধ করে
**নৈতিকতা** হলো সমাজে আমাদের আচরণ পরিচালনা করার জন্য ভাগ করা মূল্যবোধ এবং নৈতিক নীতিগুলির বিষয়। নৈতিকতা আইন নয়, বরং "সঠিক বনাম ভুল" সম্পর্কে ব্যাপকভাবে গৃহীত মানদণ্ডের উপর ভিত্তি করে। তবে, নৈতিক বিবেচনা কর্পোরেট গভর্নেন্স উদ্যোগ এবং সরকারী নিয়মকানুনকে প্রভাবিত করতে পারে, যা সম্মতির জন্য আরও প্রণোদনা তৈরি করে।
**প্রয়োগকৃত নীতিশাস্ত্র** হলো [নৈতিক বিবেচনার ব্যবহারিক প্রয়োগ](https://en.wikipedia.org/wiki/Applied_ethics)। এটি হলো _বাস্তব জীবনের কর্ম, পণ্য এবং প্রক্রিয়ার_ প্রেক্ষাপটে নৈতিক বিষয়গুলি সক্রিয়ভাবে তদন্ত করার প্রক্রিয়া এবং আমাদের সংজ্ঞায়িত নৈতিক মূল্যবোধের সাথে এগুলি সামঞ্জস্যপূর্ণ রাখতে সংশোধনমূলক ব্যবস্থা গ্রহণ করা
**ডেটা নৈতিকতা** হলো একটি [নতুন শাখা](https://royalsocietypublishing.org/doi/full/10.1098/rsta.2016.0360#sec-1) যা "_ডেটা, অ্যালগরিদম এবং সংশ্লিষ্ট অনুশীলন_" সম্পর্কিত নৈতিক সমস্যাগুলি অধ্যয়ন এবং মূল্যায়ন করে। এখানে, **"ডেটা"** জেনারেশন, রেকর্ডিং, কিউরেশন, প্রসেসিং, প্রচার, শেয়ারিং এবং ব্যবহারের সাথে সম্পর্কিত ক্রিয়াকলাপগুলির উপর ফোকাস করে, **"অ্যালগরিদম"** AI, এজেন্ট, মেশিন লার্নিং এবং রোবটের উপর ফোকাস করে, এবং **"অনুশীলন"** দায়িত্বশীল উদ্ভাবন, প্রোগ্রামিং, হ্যাকিং এবং নৈতিকতার কোডের মতো বিষয়গুলির উপর ফোকাস করে।
**নীতিশাস্ত্র সংস্কৃতি** হলো [_প্রয়োগকৃত নীতিশাস্ত্রকে_ কার্যকর করা](https://hbr.org/2019/05/how-to-design-an-ethical-organization), যাতে আমাদের নৈতিক নীতিমালা এবং অনুশীলনগুলি পুরো প্রতিষ্ঠানের মধ্যে ধারাবাহিক এবং স্কেলযোগ্যভাবে গৃহীত হয়। সফল নীতিশাস্ত্র সংস্কৃতি প্রতিষ্ঠানের সর্বত্র নৈতিক নীতিমালা সংজ্ঞায়িত করে, সম্মতির জন্য অর্থবহ প্রণোদনা প্রদান করে এবং প্রত্যাশিত আচরণকে উৎসাহিত ও জোরদার করে নীতিশাস্ত্রের মানদণ্ডকে শক্তিশালী করে।
**প্রয়োগকৃত নৈতিকতা** হলো [নৈতিক বিবেচনার বাস্তব প্রয়োগ](https://en.wikipedia.org/wiki/Applied_ethics)। এটি হলো _বাস্তব-জগতের ক্রিয়াকলাপ, পণ্য এবং প্রক্রিয়ার_ প্রসঙ্গে নৈতিক সমস্যাগুলি সক্রিয়ভাবে তদন্ত করার প্রক্রিয়া এবং আমাদের সংজ্ঞায়িত নৈতিক মূল্যবোধের সাথে সামঞ্জস্য বজায় রাখতে সংশোধনমূলক ব্যবস্থা গ্রহণ।
**নৈতিকতার সংস্কৃতি** হলো [_প্রয়োগকৃত নৈতিকতাকে_ কার্যকর করা](https://hbr.org/2019/05/how-to-design-an-ethical-organization) যাতে আমাদের নৈতিক নীতিগুলি এবং অনুশীলনগুলি পুরো প্রতিষ্ঠানের মধ্যে ধারাবাহিক এবং স্কেলযোগ্যভাবে গ্রহণ করা হয়। সফল নৈতিকতার সংস্কৃতি প্রতিষ্ঠানের-ব্যাপী নৈতিক নীতিগুলি সংজ্ঞায়িত করে, সম্মতির জন্য অর্থপূর্ণ প্রণোদনা প্রদান করে এবং প্রতিটি স্তরে পছন্দসই আচরণকে উৎসাহিত এবং প্রসারিত করে নৈতিকতার মানদণ্ডকে শক্তিশালী করে।
## নীতিশাস্ত্রের ধারণা
## নৈতিকতার ধারণা
এই অংশে, আমরা **শেয়ার করা মূল্যবোধ** (নীতিমালা) এবং **নৈতিক চ্যালেঞ্জ** (সমস্যা) নিয়ে আলোচনা করব, এবং **কেস স্টাডি** অন্বেষণ করব যা আপনাকে বাস্তব জীবনের প্রেক্ষাপটে এই ধারণাগুলি বুঝতে সাহায্য করবে।
এই বিভাগে, আমরা **ভাগ করা মূল্যবোধ** (নীতিগুলি) এবং **নৈতিক চ্যালেঞ্জ** (সমস্যাগুলি) নিয়ে আলোচনা করব - এবং **কেস স্টাডি** অন্বেষণ করব যা আপনাকে বাস্তব-জগতের প্রসঙ্গে এই ধারণাগুলি বুঝতে সাহায্য করবে।
### ১. নীতিশাস্ত্রের নীতিমালা
### ১. নৈতিকতার নীতিগুলি
প্রত্যেক ডেটা নীতিশাস্ত্র কৌশল শুরু হয় _নৈতিক নীতিমালা_ সংজ্ঞায়িত করার মাধ্যমে - "শেয়ার করা মূল্যবোধ" যা গ্রহণযোগ্য আচরণ বর্ণনা করে এবং আমাদের ডেটা ও এআই প্রকল্পে সম্মতিমূলক কর্ম পরিচালনা করে। আপনি এগুলি ব্যক্তিগত বা দলীয় স্তরে সংজ্ঞায়িত করতে পারেন। তবে, বেশিরভাগ বড় প্রতিষ্ঠান এগুলি একটি _নৈতিক এআই_ মিশন বিবৃতি বা কাঠামোতে সংজ্ঞায়িত করে, যা কর্পোরেট স্তরে সংজ্ঞায়িত এবং সমস্ত দলের মধ্যে ধারাবাহিকভাবে প্রয়োগ করা হয়।
প্রত্যেক ডেটা নৈতিকতার কৌশল শুরু হয় _নৈতিক নীতিগুলি_ সংজ্ঞায়িত করে - "ভাগ করা মূল্যবোধ" যা গ্রহণযোগ্য আচরণ বর্ণনা করে এবং আমাদের ডেটা এবং AI প্রকল্পে সম্মতিমূলক ক্রিয়াকলাপ পরিচালনা করে। আপনি এগুলি ব্যক্তিগত বা দলীয় স্তরে সংজ্ঞায়িত করতে পারেন। তবে, বেশিরভাগ বড় প্রতিষ্ঠান এগুলি একটি _নৈতিক AI_ মিশন বিবৃতি বা কাঠামোতে সংজ্ঞায়িত করে যা কর্পোরেট স্তরে সংজ্ঞায়িত এবং সমস্ত দলের মধ্যে ধারাবাহিকভাবে প্রয়োগ করা হয়।
**উদাহরণ:** মাইক্রোসফটের [দায়িত্বশীল এআই](https://www.microsoft.com/en-us/ai/responsible-ai) মিশন বিবৃতি বলে: _"আমরা নৈতিক নীতিমালার দ্বারা চালিত এআই-এর অগ্রগতির জন্য প্রতিশ্রুতিবদ্ধ, যা মানুষকে প্রথমে রাখে"_ - যা নিচের কাঠামোতে ৬টি নৈতিক নীতিমালা চিহ্নিত করে:
**উদাহরণ:** Microsoft's [Responsible AI](https://www.microsoft.com/en-us/ai/responsible-ai) মিশন বিবৃতি বলে: _"আমরা AI-এর অগ্রগতির জন্য প্রতিশ্রুতিবদ্ধ, যা নৈতিক নীতিগুলির দ্বারা পরিচালিত হয় যা মানুষকে প্রথমে রাখে"_ - নিচের কাঠামোতে ৬টি নৈতিক নীতিকে চিহ্নিত করে:
![মাইক্রোসফটের দায়িত্বশীল এআই](https://docs.microsoft.com/en-gb/azure/cognitive-services/personalizer/media/ethics-and-responsible-use/ai-values-future-computed.png)
![Microsoft-এ দায়িত্বশীল AI](https://docs.microsoft.com/en-gb/azure/cognitive-services/personalizer/media/ethics-and-responsible-use/ai-values-future-computed.png)
চলুন এই নীতিমালাগুলি সংক্ষেপে অন্বেষণ করি। _স্বচ্ছতা_ এবং _দায়িত্বশীলতা_ হলো মৌলিক মূল্যবোধ, যার উপর অন্যান্য নীতিমালা নির্মিত হয় - তাই এখানে শুরু করা যাক:
চলুন এই নীতিগুলি সংক্ষেপে অন্বেষণ করি। _স্বচ্ছতা_ এবং _দায়িত্বশীলতা_ হলো মৌলিক মূল্যবোধ যা অন্যান্য নীতিগুলির উপর ভিত্তি করে তৈরি - তাই এখানে শুরু করা যাক:
* [**দায়িত্বশীলতা**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) ডেটা ও এআই কার্যক্রম এবং এই নৈতিক নীতিমালার সাথে সম্মতির জন্য অনুশীলনকারীদের _দায়িত্বশীল_ করে তোলে।
* [**স্বচ্ছতা**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) নিশ্চিত করে যে ডেটা এবং এআই কর্মগুলো ব্যবহারকারীদের জন্য _বোধ্য_ (ব্যাখ্যাযোগ্য), যা সিদ্ধান্তের পেছনের কী এবং কেন ব্যাখ্যা করে।
* [**ন্যায্যতা**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1%3aprimaryr6) - নিশ্চিত করে যে এআই _সব মানুষকে_ ন্যায্যভাবে আচরণ করে, ডেটা এবং সিস্টেমে থাকা যেকোনো পদ্ধতিগত বা অন্তর্নিহিত সামাজিক-প্রযুক্তিগত পক্ষপাতিত্ব মোকাবেলা করে।
* [**নির্ভরযোগ্যতা ও নিরাপত্তা**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - নিশ্চিত করে যে এআই _সংজ্ঞায়িত মূল্যবোধের সাথে সামঞ্জস্যপূর্ণ_ আচরণ করে, সম্ভাব্য ক্ষতি বা অনিচ্ছাকৃত পরিণতি হ্রাস করে।
* [**গোপনীয়তা ও সুরক্ষা**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - ডেটার উত্স বোঝা এবং ব্যবহারকারীদের _ডেটা গোপনীয়তা এবং সংশ্লিষ্ট সুরক্ষা_ প্রদান সম্পর্কে।
* [**অন্তর্ভুক্তি**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - উদ্দেশ্য নিয়ে এআই সমাধান ডিজাইন করা, এগুলিকে _বিস্তৃত মানব প্রয়োজন এবং সক্ষমতার_ সাথে মানিয়ে নেওয়া।
* [**দায়িত্বশীলতা**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) অনুশীলনকারীদের তাদের ডেটা এবং AI ক্রিয়াকলাপের জন্য এবং এই নৈতিক নীতিগুলির সাথে সম্মতির জন্য _দায়িত্বশীল_ করে তোলে।
* [**স্বচ্ছতা**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) নিশ্চিত করে যে ডেটা এবং AI ক্রিয়াকলাপগুলি ব্যবহারকারীদের কাছে _বোধ্য_ (ব্যাখ্যাযোগ্য) হয়, সিদ্ধান্তের পেছনের কী এবং কেন ব্যাখ্যা করে।
* [**ন্যায্যতা**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1%3aprimaryr6) - নিশ্চিত করে যে AI _সব মানুষকে_ ন্যায্যভাবে আচরণ করে, ডেটা এবং সিস্টেমে থাকা যেকোনো পদ্ধতিগত বা অন্তর্নিহিত সামাজিক-প্রযুক্তিগত পক্ষপাতিত্ব মোকাবিলা করে।
* [**বিশ্বাসযোগ্যতা এবং নিরাপত্তা**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - নিশ্চিত করে যে AI _ধারাবাহিকভাবে_ সংজ্ঞায়িত মূল্যবোধের সাথে আচরণ করে, সম্ভাব্য ক্ষতি বা অনিচ্ছাকৃত পরিণতি কমিয়ে দেয়।
* [**গোপনীয়তা এবং নিরাপত্তা**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - ডেটার উত্স বোঝা এবং ব্যবহারকারীদের _ডেটা গোপনীয়তা এবং সংশ্লিষ্ট সুরক্ষা_ প্রদান সম্পর্কে।
* [**অন্তর্ভুক্তি**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - উদ্দেশ্য নিয়ে AI সমাধান ডিজাইন করার বিষয়ে, এগুলিকে _বিস্তৃত মানব প্রয়োজন এবং সক্ষমতা_ পূরণের জন্য মানিয়ে নেওয়া।
> 🚨 আপনার ডেটা নীতিশাস্ত্র মিশন বিবৃতি কী হতে পারে তা নিয়ে ভাবুন। অন্যান্য প্রতিষ্ঠানের নৈতিক এআই কাঠামো অন্বেষণ করুন - এখানে [আইবিএম](https://www.ibm.com/cloud/learn/ai-ethics), [গুগল](https://ai.google/principles), এবং [ফেসবুক](https://ai.facebook.com/blog/facebooks-five-pillars-of-responsible-ai/) এর উদাহরণ রয়েছে। তাদের মধ্যে কী শেয়ার করা মূল্যবোধ রয়েছে? এই নীতিমালাগুলি তাদের এআই পণ্য বা শিল্পের সাথে কীভাবে সম্পর্কিত?
> 🚨 আপনার ডেটা নৈতিকতার মিশন বিবৃতি কী হতে পারে তা নিয়ে ভাবুন। অন্যান্য প্রতিষ্ঠানের নৈতিক AI কাঠামো অন্বেষণ করুন - এখানে [IBM](https://www.ibm.com/cloud/learn/ai-ethics), [Google](https://ai.google/principles), এবং [Facebook](https://ai.facebook.com/blog/facebooks-five-pillars-of-responsible-ai/) থেকে উদাহরণ রয়েছে। তাদের মধ্যে কী সাধারণ ভাগ করা মূল্যবোধ রয়েছে? এই নীতিগুলি তারা যে AI পণ্য বা শিল্পে কাজ করে তার সাথে কীভাবে সম্পর্কিত?
### ২. নীতিশাস্ত্রের চ্যালেঞ্জ
### ২. নৈতিক চ্যালেঞ্জ
যখন নৈতিক নীতিমালাগুলি সংজ্ঞায়িত করা হয়, তখন পরবর্তী ধাপ হলো আমাদের ডেটা এবং এআই কর্মগুলো মূল্যায়ন করা, সেগুলি এই শেয়ার করা মূল্যবোধের সাথে সামঞ্জস্যপূর্ণ কিনা তা দেখতে। আপনার কর্মগুলোকে দুটি বিভাগে ভাবুন: _ডেটা সংগ্রহ_ এবং _অ্যালগরিদম ডিজাইন_
যখন আমরা নৈতিক নীতিগুলি সংজ্ঞায়িত করি, তখন পরবর্তী ধাপ হলো আমাদের ডেটা এবং AI ক্রিয়াকলাপগুলি মূল্যায়ন করা যাতে তারা সেই ভাগ করা মূল্যবোধের সাথে সামঞ্জস্যপূর্ণ কিনা তা দেখা যায়। আপনার ক্রিয়াকলাপগুলি দুটি বিভাগে ভাবুন: _ডেটা সংগ্রহ_ এবং _অ্যালগরিদম ডিজাইন_
ডেটা সংগ্রহের ক্ষেত্রে, কর্মগুলো সম্ভবত **ব্যক্তিগত ডেটা** বা ব্যক্তিগতভাবে সনাক্তযোগ্য তথ্য (PII) এর সাথে সম্পর্কিত হবে, যা জীবিত ব্যক্তিদের সনাক্ত করতে পারে। এটি [বিভিন্ন ধরনের অ-ব্যক্তিগত ডেটা](https://ec.europa.eu/info/law/law-topic/data-protection/reform/what-personal-data_en) অন্তর্ভুক্ত করে, যা _সমষ্টিগতভাবে_ একজন ব্যক্তিকে সনাক্ত করে। নৈতিক চ্যালেঞ্জগুলো _ডেটা গোপনীয়তা_, _ডেটার মালিকানা_, এবং _অবগত সম্মতি_ এবং ব্যবহারকারীদের _বুদ্ধিবৃত্তিক সম্পত্তি অধিকার_ এর মতো সম্পর্কিত বিষয়গুলির সাথে সম্পর্কিত হতে পারে
ডেটা সংগ্রহের ক্ষেত্রে, ক্রিয়াকলাপগুলি সম্ভবত **ব্যক্তিগত ডেটা** বা ব্যক্তিগতভাবে শনাক্তযোগ্য তথ্য (PII) অন্তর্ভুক্ত করবে যা জীবিত ব্যক্তিদের শনাক্ত করতে পারে। এটি [বিভিন্ন ধরনের অ-ব্যক্তিগত ডেটা](https://ec.europa.eu/info/law/law-topic/data-protection/reform/what-personal-data_en) অন্তর্ভুক্ত করে যা _সমষ্টিগতভাবে_ একজন ব্যক্তিকে শনাক্ত করে। নৈতিক চ্যালেঞ্জগুলি _ডেটা গোপনীয়তা_, _ডেটা মালিকানা_, এবং _অবগত সম্মতি_ এবং ব্যবহারকারীদের _বৌদ্ধিক সম্পত্তি অধিকার_ এর মতো সম্পর্কিত বিষয়গুলির সাথে সম্পর্কিত হতে পারে।
অ্যালগরিদম ডিজাইনের ক্ষেত্রে, কর্মগুলো **ডেটাসেট** সংগ্রহ এবং কিউরেট করা, তারপর সেগুলো ব্যবহার করে **ডেটা মডেল** প্রশিক্ষণ এবং বাস্তব জীবনের প্রেক্ষাপটে ফলাফল পূর্বাভাস বা সিদ্ধান্ত স্বয়ংক্রিয় করার সাথে সম্পর্কিত হবে। নৈতিক চ্যালেঞ্জগুলো _ডেটাসেট পক্ষপাতিত্ব_, _ডেটার গুণমান_ সমস্যা, _অন্যায্যতা_, এবং অ্যালগরিদমে _ভুল উপস্থাপনা_ থেকে উদ্ভূত হতে পারে - যার মধ্যে কিছু পদ্ধতিগত প্রকৃতির হতে পারে।
অ্যালগরিদম ডিজাইনের ক্ষেত্রে, ক্রিয়াকলাপগুলি **ডেটাসেট** সংগ্রহ এবং কিউরেট করা এবং তারপরে **ডেটা মডেল** প্রশিক্ষণ এবং বাস্তব-জগতের প্রসঙ্গে ফলাফল পূর্বাভাস বা সিদ্ধান্ত অটোমেট করার জন্য ব্যবহার করা অন্তর্ভুক্ত করবে। নৈতিক চ্যালেঞ্জগুলি _ডেটাসেট পক্ষপাতিত্ব_, _ডেটা গুণমান_ সমস্যা, _অন্যায্যতা_, এবং অ্যালগরিদমে _ভুল উপস্থাপনা_ থেকে উদ্ভূত হতে পারে - যার মধ্যে কিছু সমস্যা পদ্ধতিগত প্রকৃতির।
উভয় ক্ষেত্রেই, নীতিশাস্ত্রের চ্যালেঞ্জগুলো এমন ক্ষেত্রগুলো হাইলাইট করে যেখানে আমাদের কর্মগুলো শেয়ার করা মূল্যবোধের সাথে সংঘর্ষে আসতে পারে। এই উদ্বেগগুলো সনাক্ত, প্রশমিত, হ্রাস, বা নির্মূল করতে, আমাদের কর্মগুলোর সাথে সম্পর্কিত নৈতিক "হ্যাঁ/না" প্রশ্ন জিজ্ঞাসা করতে হবে, তারপর প্রয়োজনীয় সংশোধনমূলক ব্যবস্থা নিতে হবে। চলুন কিছু নৈতিক চ্যালেঞ্জ এবং সেগুলো যে নৈতিক প্রশ্ন উত্থাপন করে তা দেখি:
উভয় ক্ষেত্রেই, নৈতিক চ্যালেঞ্জগুলি এমন ক্ষেত্রগুলিকে হাইলাইট করে যেখানে আমাদের ক্রিয়াকলাপগুলি আমাদের ভাগ করা মূল্যবোধের সাথে সংঘর্ষে পড়তে পারে। এই উদ্বেগগুলি সনাক্ত, প্রশমিত, কমানো বা দূর করতে - আমাদের আমাদের ক্রিয়াকলাপ সম্পর্কিত নৈতিক "হ্যাঁ/না" প্রশ্ন জিজ্ঞাসা করতে হবে এবং প্রয়োজন অনুযায়ী সংশোধনমূলক ব্যবস্থা নিতে হবে। চলুন কিছু নৈতিক চ্যালেঞ্জ এবং তারা যে নৈতিক প্রশ্ন উত্থাপন করে তা দেখি:
#### ২.১ ডেটা মালিকানা
#### ২.১ ডেটা মালিকানা
ডেটা সংগ্রহ প্রায়ই ব্যক্তিগত ডেটা অন্তর্ভুক্ত করে যা ডেটা বিষয়গুলিকে শনাক্ত করতে পারে। [ডেটা মালিকানা](https://permission.io/blog/data-ownership) হলো ডেটা তৈরি, প্রক্রিয়াকরণ এবং প্রচারের সাথে সম্পর্কিত _নিয়ন্ত্রণ_ এবং [_ব্যবহারকারীর অধিকার_](https://permission.io/blog/data-ownership)।
ডেটা সংগ্রহ প্রায়ই ব্যক্তিগত ডেটার সাথে সম্পর্কিত, যা ডেটা বিষয়গুলোকে সনাক্ত করতে পারে। [ডেটা মালিকানা](https://permission.io/blog/data-ownership) হলো ডেটার সৃষ্ট, প্রক্রিয়াকরণ এবং প্রচারের সাথে সম্পর্কিত _নিয়ন্ত্রণ_ এবং [_ব্যবহারকারীর অধিকার_](https://permission.io/blog/data-ownership)।
আমাদের জিজ্ঞাসা করা নৈতিক প্রশ্নগুলো হলো:
* ডেটার মালিক কে? (ব্যবহারকারী বা প্রতিষ্ঠান)
* ডেটা বিষয়গুলির কী অধিকার রয়েছে? (যেমন: অ্যাক্সেস, মুছে ফেলা, পোর্টেবিলিটি)
* প্রতিষ্ঠানের কী অধিকার রয়েছে? (যেমন: ক্ষতিকারক ব্যবহারকারীর পর্যালোচনা সংশোধন করা)
আমাদের জিজ্ঞাসা করা নৈতিক প্রশ্নগুলো হলো:
* ডেটার মালিক কে? (ব্যবহারকারী নাকি প্রতিষ্ঠান)
* ডেটা বিষয়গুলর কী অধিকার রয়েছে? (যেমন: অ্যাক্সেস, মুছে ফেলা, পোর্টেবিলিটি)
* প্রতিষ্ঠানের কী অধিকার রয়েছে? (যেমন: ক্ষতিকারক ব্যবহারকারীর পর্যালোচনা সংশোধন)
#### ২.২ অবগত সম্মতি
[অবগত সম্মতি](https://legaldictionary.net/informed-consent/) সংজ্ঞায়িত করে ব্যবহারকারীদের একটি ক্রিয়াকলাপ (যেমন ডেটা সংগ্রহ) সম্মত হওয়ার কাজ, যেখানে তারা প্রাসঙ্গিক তথ্যের _সম্পূর্ণ বোঝাপড়া_ রাখে, যার মধ্যে উদ্দেশ্য, সম্ভাব্য ঝুঁকি এবং বিকল্প রয়েছে।
[অবগত সম্মতি](https://legaldictionary.net/informed-consent/) ব্যবহারকারীদের একটি কর্মে (যেমন ডেটা সংগ্রহ) সম্মতি দেওয়ার কাজকে সংজ্ঞায়িত করে, যেখানে তারা প্রাসঙ্গিক তথ্যের _সম্পূর্ণ বোঝাপড়া_ রাখে, যার মধ্যে উদ্দেশ্য, সম্ভাব্য ঝুঁকি, এবং বিকল্পগুলো অন্তর্ভুক্ত।
এখানে অনুসন্ধানের প্রশ্নগুলো হলো:
* ব্যবহারকারী (ডেটা বিষয়) ডেটা সংগ্রহ এবং ব্যবহারের জন্য অনুমতি দিয়েছেন কি?
* ব্যবহারকারী বুঝেছেন কি কেন সেই ডেটা সংগ্রহ করা হয়েছে?
* ব্যবহারকারী তাদের অংশগ্রহণ থেকে সম্ভাব্য ঝুঁকিগুলি বুঝেছেন কি?
এখানে অন্বেষণ করার প্রশ্নগুলো হলো:
* ব্যবহারকারী (ডেটা বিষয়) কি ডেটা সংগ্রহ এবং ব্যবহারের জন্য অনুমতি দিয়েছে?
* ব্যবহারকারী কি বুঝেছে যে ডেটা কোন উদ্দেশ্যে সংগ্রহ করা হয়েছে?
* ব্যবহারকারী কি তাদের অংশগ্রহণ থেকে সম্ভাব্য ঝুঁকিগুলো বুঝেছে?
#### ২.৩ বৌদ্ধিক সম্পত্তি
#### ২.৩ বুদ্ধিবৃত্তিক সম্পত্তি
[ৌদ্ধিক সম্পত্তি](https://en.wikipedia.org/wiki/Intellectual_property) হলো মানব উদ্যোগ থেকে উদ্ভূত অমূর্ত সৃষ্টি, যা ব্যক্তিদের বা ব্যবসার জন্য _অর্থনৈতিক মূল্য_ থাকতে পারে।
[ুদ্ধিবৃত্তিক সম্পত্তি](https://en.wikipedia.org/wiki/Intellectual_property) হলো মানব উদ্যোগ থেকে উদ্ভূত অমূর্ত সৃষ্টি, যা ব্যক্তিদের বা ব্যবসার জন্য _অর্থনৈতিক মূল্য_ রাখতে পারে।
এখানে অনুসন্ধানের প্রশ্নগুলো হলো:
* সংগৃহীত ডেটার ব্যবহারকারী বা ব্যবসার জন্য অর্থনৈতিক মূল্য ছিল কি?
* এখানে **ব্যবহারকারী** এর বৌদ্ধিক সম্পত্তি রয়েছে কি?
* এখানে **প্রতিষ্ঠান** এর বৌদ্ধিক সম্পত্তি রয়েছে কি?
* যদি এই অধিকারগুলি থাকে, আমরা কীভাবে সেগুলি রক্ষা করছি?
এখানে অন্বেষণ করার প্রশ্নগুলো হলো:
* সংগৃহীত ডেটার কি ব্যবহারকারী বা ব্যবসার জন্য অর্থনৈতিক মূল্য ছিল?
* এখানে ব্যবহারকারীর কি বুদ্ধিবৃত্তিক সম্পত্তি রয়েছে?
* এখানে প্রতিষ্ঠানের কি বুদ্ধিবৃত্তিক সম্পত্তি রয়েছে?
* যদি এই অধিকারগুলো থাকে, আমরা কীভাবে সেগুলো রক্ষা করছি?
#### ২. ডেটা গোপনীয়তা
[ডেটা গোপনীয়তা](https://www.northeastern.edu/graduate/blog/what-is-data-privacy/) বা তথ্য গোপনীয়তা ব্যবহারকারীর গোপনীয়তা সংরক্ষণ এবং ব্যক্তিগতভাবে নাক্তযোগ্য তথ্যের সাথে ব্যবহারকারীর পরিচয় সুরক্ষার বিষয়
[ডেটা গোপনীয়তা](https://www.northeastern.edu/graduate/blog/what-is-data-privacy/) বা তথ্য গোপনীয়তা হলো ব্যবহারকারীর গোপনীয়তা সংরক্ষণ এবং ব্যক্তিগতভাবে নাক্তযোগ্য তথ্যের সাথে ব্যবহারকারীর পরিচয় সুরক্ষার বিষয়।
এখানে অনুসন্ধানের প্রশ্নগুলো হলো:
* ব্যবহারকারীর (ব্যক্তিগত) ডেটা হ্যাক এবং লিকের বিরুদ্ধে সুরক্ষিত কি?
* ব্যবহারকারীর ডেটা শুধুমাত্র অনুমোদিত ব্যবহারকারী এবং প্রসঙ্গে অ্যাক্সেসযোগ্য কি?
* ডেটা শেয়ার বা প্রচার করার সময় ব্যবহারকারীর নাম গোপন রাখা হয়েছে কি?
* ব্যবহারকারীকে বেনামী ডেটাসেট থেকে শনাক্ত করা যেতে পারে কি?
এখানে অন্বেষণ করার প্রশ্নগুলো হলো:
* ব্যবহারকারীর (ব্যক্তিগত) ডেটা কি হ্যাক এবং ফাঁস থেকে সুরক্ষিত?
* ব্যবহারকারীর ডেটা কি শুধুমাত্র অনুমোদিত ব্যবহারকারী এবং প্রেক্ষাপটের জন্য অ্যাক্সেসযোগ্য?
* ডেটা শেয়ার বা প্রচারের সময় ব্যবহারকারীর নাম গোপনীয়তা কি সংরক্ষিত?
* ব্যবহারকারী কি বেনামী ডেটাসেট থেকে সনাক্তযোগ্য হতে পারে?
#### ২.৫ ভুলে যাওয়ার অধিকার
[ভুলে যাওয়ার অধিকার](https://en.wikipedia.org/wiki/Right_to_be_forgotten) বা [মুছে ফেলার অধিকার](https://www.gdpreu.org/right-to-be-forgotten/) ব্যবহারকারীদের অতিরিক্ত ব্যক্তিগত ডেটা সুরক্ষা প্রদান করে। বিশেষ, এটি ব্যবহারকারীদের ইন্টারনেট অনুসন্ধান এবং অন্যান্য স্থানে ব্যক্তিগত ডেটা মুছে ফেলার বা অপসারণের অনুরোধ করার অধিকার দেয়, _নির্দিষ্ট পরিস্থিতিতে_ - তাদের অনলাইনে একটি নতুন সূচনা করার অনুমতি দেয় যাতে অতীতের ক্রিয়াকলাপগুলি তাদের বিরুদ্ধে না থাকে।
[ভুলে যাওয়ার অধিকার](https://en.wikipedia.org/wiki/Right_to_be_forgotten) বা [মুছে ফেলার অধিকার](https://www.gdpreu.org/right-to-be-forgotten/) ব্যবহারকারীদের অতিরিক্ত ব্যক্তিগত ডেটা সুরক্ষা প্রদান করে। বিশেষ করে, এটি ব্যবহারকারীদের নির্দিষ্ট পরিস্থিতিতে ইন্টারনেট অনুসন্ধান এবং অন্যান্য স্থানে ব্যক্তিগত ডেটা মুছে ফেলার বা অপসারণের অনুরোধ করার অধিকার দেয় - তাদের অনলাইনে একটি নতুন সূচনা করার অনুমতি দেয় যাতে অতীত কর্ম তাদের বিরুদ্ধে না থাকে।
এখানে অনুসন্ধানের প্রশ্নগুলো হলো:
* সিস্টেমটি ডেটা বিষয়গুলিকে মুছে ফেলার অনুরোধ করার অনুমতি দেয় কি?
* ব্যবহারকারীর সম্মতি প্রত্যাহার স্বয়ংক্রিয় মুছে ফেলা ট্রিগার করা উচিত কি?
* ডেটা সম্মতি ছাড়া বা অবৈধ উপায়ে সংগ্রহ করা হয়েছিল কি?
* আমরা ডেটা গোপনীয়তার জন্য সরকারী নিয়মকানুনের সাথে সম্মত কি?
এখানে অন্বেষণ করার প্রশ্নগুলো হলো:
* সিস্টেম কি ডেটা বিষয়গুলোকে মুছে ফেলার অনুরোধ করার অনুমতি দেয়?
* ব্যবহারকারীর সম্মতি প্রত্যাহার কি স্বয়ংক্রিয় মুছে ফেলা ট্রিগার করা উচিত?
* ডেটা কি সম্মতি ছাড়া বা অব
[Algorithm Fairness](https://towardsdatascience.com/what-is-algorithm-fairness-3182e161cf9f) পরীক্ষা করে দেখে যে কোনো অ্যালগরিদম ডিজাইন কি নির্দিষ্ট ডেটা সাবগ্রুপের বিরুদ্ধে পক্ষপাতমূলক আচরণ করছে কিনা, যা _বণ্টন_ (যেখানে সেই গ্রুপের কাছে সম্পদ অস্বীকার করা হয় বা আটকে রাখা হয়) এবং _সেবার মান_ (যেখানে AI কিছু সাবগ্রুপের জন্য অন্যদের তুলনায় কম সঠিক) ক্ষেত্রে [সম্ভাব্য ক্ষতি](https://docs.microsoft.com/en-us/azure/machine-learning/concept-fairness-ml) সৃষ্টি করতে পারে।
#### ২.৬ ডেটাসেট পক্ষপাতিত্ব
ডেটাসেট বা [সংগ্রহ পক্ষপাতিত্ব](http://researcharticles.com/index.php/bias-in-data-collection-in-research/) হলো অ্যালগরিদম উন্নয়নের জন্য একটি _অপ্রতিনিধিত্বমূলক_ ডেটার
[Algorithm Fairness](https://towardsdatascience.com/what-is-algorithm-fairness-3182e161cf9f) পরীক্ষা করে দেখে যে কোনো অ্যালগরিদম ডিজাইন কি নির্দিষ্ট ডেটা সাবগ্রুপের বিরুদ্ধে পক্ষপাতমূলক আচরণ করছে কিনা, যা _বণ্টন_ (যেখানে সেই গ্রুপের কাছে সম্পদ পৌঁছানো বা সরবরাহ করা হয় না) এবং _সেবার গুণগত মান_ (যেখানে AI কিছু সাবগ্রুপের জন্য অন্যদের তুলনায় কম সঠিক) ক্ষেত্রে [সম্ভাব্য ক্ষতি](https://docs.microsoft.com/en-us/azure/machine-learning/concept-fairness-ml) সৃষ্টি করতে পারে।
এখানে যে প্রশ্নগুলো বিবেচনা করা যেতে পারে:
এখানে অনুসন্ধানের জন্য কিছু প্রশ্ন:
* আমরা কি বিভিন্ন সাবগ্রুপ এবং শর্তের জন্য মডেলের সঠিকতা মূল্যায়ন করেছি?
* আমরা কি সিস্টেমকে সম্ভাব্য ক্ষতির (যেমন, স্টেরিওটাইপিং) জন্য গভীরভাবে পর্যবেক্ষণ করেছি?
* আমরা কি সম্ভাব্য ক্ষতির জন্য সিস্টেমটি গভীরভাবে পর্যবেক্ষণ করেছি (যেমন, স্টেরিওটাইপিং)?
* আমরা কি চিহ্নিত ক্ষতি কমানোর জন্য ডেটা সংশোধন বা মডেল পুনরায় প্রশিক্ষণ করতে পারি?
আরও জানার জন্য [AI Fairness checklists](https://query.prod.cms.rt.microsoft.com/cms/api/am/binary/RE4t6dA) এর মতো রিসোর্সগুলো অন্বেষণ করুন।
#### 2.9 ভুল উপস্থাপন
[ডেটা ভুল উপস্থাপন](https://www.sciencedirect.com/topics/computer-science/misrepresentation) হলো এই প্রশ্ন করা যে আমরা কি সৎভাবে রিপোর্ট করা ডেটা থেকে প্রাপ্ত অন্তর্দৃষ্টি এমনভাবে উপস্থাপন করছি যা ইচ্ছাকৃতভাবে একটি নির্দিষ্ট বর্ণনার সমর্থনে বিভ্রান্তিকর হতে পারে।
[ডেটা ভুল উপস্থাপন](https://www.sciencedirect.com/topics/computer-science/misrepresentation) হলো এই প্রশ্ন করা যে আমরা কি সৎভাবে রিপোর্ট করা ডেটা থেকে প্রাপ্ত অন্তর্দৃষ্টি এমনভাবে উপস্থাপন করছি যা একটি পছন্দসই বর্ণনার সমর্থনে বিভ্রান্তিকর হতে পারে।
এখানে যে প্রশ্নগুলো বিবেচনা করা যেতে পারে:
এখানে অনুসন্ধানের জন্য কিছু প্রশ্ন:
* আমরা কি অসম্পূর্ণ বা ভুল ডেটা রিপোর্ট করছি?
* আমরা কি ডেটা এমনভাবে ভিজ্যুয়ালাইজ করছি যা বিভ্রান্তিকর সিদ্ধান্তে পৌঁছাতে সাহায্য করে?
* আমরা কি নির্বাচিত পরিসংখ্যানগত কৌশল ব্যবহার করে ফলাফলকে প্রভাবিত করছি?
* এমন কোনো বিকল্প ব্যাখ্যা আছে কি যা ভিন্ন সিদ্ধান্ত দিতে পারে?
#### 2.10 স্বাধীন পছন্দ
[স্বাধীন পছন্দের ভ্রম](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice) ঘটে যখন সিস্টেমের "পছন্দ স্থাপত্য" সিদ্ধান্ত গ্রহণের অ্যালগরিদম ব্যবহার করে মানুষকে একটি পছন্দসই ফলাফলের দিকে ঠেলে দেয়, যদিও তাদের কাছে বিকল্প এবং নিয়ন্ত্রণ থাকার ভান করা হয়। এই [ডার্ক প্যাটার্ন](https://www.darkpatterns.org/) ব্যবহারকারীদের সামাজিক এবং অর্থনৈতিক ক্ষতি করতে পারে। যেহেতু ব্যবহারকারীর সিদ্ধান্ত আচরণগত প্রোফাইলকে প্রভাবিত করে, এই পদক্ষেপগুলো ভবিষ্যতের পছন্দগুলোকে আরও বাড়াতে বা প্রসারিত করতে পারে।
[স্বাধীন পছন্দের বিভ্রম](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice) ঘটে যখন সিস্টেমের "পছন্দ স্থাপত্য" সিদ্ধান্ত গ্রহণের অ্যালগরিদম ব্যবহার করে মানুষকে একটি পছন্দসই ফলাফলের দিকে ঠেলে দেয়, যদিও তাদের বিকল্প এবং নিয়ন্ত্রণ দেওয়ার ভান করা হয়। এই [ডার্ক প্যাটার্ন](https://www.darkpatterns.org/) ব্যবহারকারীদের সামাজিক এবং অর্থনৈতিক ক্ষতি করতে পারে। যেহেতু ব্যবহারকারীর সিদ্ধান্ত আচরণগত প্রোফাইলকে প্রভাবিত করে, এই পদক্ষেপগুলো ভবিষ্যতের পছন্দগুলোকে আরও বাড়াতে বা প্রসারিত করতে পারে।
এখানে যে প্রশ্নগুলো বিবেচনা করা যেতে পারে:
এখানে অনুসন্ধানের জন্য কিছু প্রশ্ন:
* ব্যবহারকারী কি সেই পছন্দ করার প্রভাবগুলো বুঝতে পেরেছে?
* ব্যবহারকারী কি (বিকল্প) পছন্দ এবং প্রতিটির সুবিধা ও অসুবিধা সম্পর্কে সচেতন ছিল?
* ব্যবহারকারী কি একটি স্বয়ংক্রিয় বা প্রভাবিত পছন্দ পরে পরিবর্তন করতে পারে?
* ব্যবহারকারী কি পরে একটি স্বয়ংক্রিয় বা প্রভাবিত পছন্দ পরিবর্তন করতে পারে?
### 3. কেস স্টাডি
এই নৈতিক চ্যালেঞ্জগুলোকে বাস্তব জীবনের প্রেক্ষাপটে রাখার জন্য, এমন কেস স্টাডি দেখা সহায়ক যা নৈতিক লঙ্ঘন উপেক্ষা করার ফলে ব্যক্তি এবং সমাজের পর সম্ভাব্য ক্ষতি এবং পরিণতি তুলে ধরে।
এই নৈতিক চ্যালেঞ্জগুলোকে বাস্তব জীবনের প্রেক্ষাপটে রাখার জন্য, এমন কেস স্টাডি দেখা সহায়ক যা নৈতিক লঙ্ঘন উপেক্ষা করার ফলে ব্যক্তি এবং সমাজের পর সম্ভাব্য ক্ষতি এবং পরিণতি তুলে ধরে।
কিছু উদাহরণ এখানে দেওয়া হলো:
| নৈতিক চ্যালেঞ্জ | কেস স্টাডি |
|--- |--- |
| **সচেতন সম্মতি** | 1972 - [টাস্কিগি সিফিলিস স্টাডি](https://en.wikipedia.org/wiki/Tuskegee_Syphilis_Study) - আফ্রিকান আমেরিকান পুরুষদের বিনামূল্যে চিকিৎসার প্রতিশ্রুতি দেওয়া হয়েছিল, কিন্তু গবেষকরা তাদের রোগ নির্ণয় বা চিকিৎসার প্রাপ্যতা সম্পর্কে জানাতে ব্যর্থ হন। অনেক অংশগ্রহণকারী মারা যান এবং তাদের সঙ্গী বা সন্তান ক্ষতিগ্রস্ত হন; এই গবেষণা বছর ধরে চলে। |
| **ডেটা গোপনীয়তা** | 2007 - [নেটফ্লিক্স ডেটা প্রাইজ](https://www.wired.com/2007/12/why-anonymous-data-sometimes-isnt/) গবেষকদের _৫, গ্রাহকের ১০ মিলিয়ন অ্যানোনিমাইজড মুভি রেটিং_ প্রদান করে সুপারিশ অ্যালগরিদম উন্নত করতে। তবে, গবেষকরা অ্যানোনিমাইজড ডেটাকে _বাহ্যিক ডেটাসেটের_ (যেমন, IMDb মন্তব্য) সঙ্গে সংযুক্ত করে কিছু নেটফ্লিক্স গ্রাহকদের "ডি-অ্যানোনিমাইজ" কর সক্ষম হন।|
| **সংগ্রহ পক্ষপাত** | 2013 - বোস্টন শহর [স্ট্রিট বাম্প](https://www.boston.gov/transportation/street-bump) অ্যাপ তৈরি করে যা নাগরিকদের পটহোল রিপোর্ট করতে দেয়, শহরকে ভালো রাস্তার ডেটা দিয়ে সমস্যা খুঁজে বের করতে এবং ঠিক করতে সাহায্য করে। তবে, [নিম্ন আয়ের গ্রুপের মানুষের গাড়ি এবং ফোনে কম প্রবেশাধিকার ছিল](https://hbr.org/2013/04/the-hidden-biases-in-big-data), যার ফলে তাদের রাস্তার সমস্যাগুলো এই অ্যাপে অদৃশ্য হয়ে যায়। ডেভেলপাররা ন্যায্যতার জন্য _সমান প্রবেশাধিকার এবং ডিজিটাল বিভাজন_ সমস্যাগুলো নিয়ে একাডেমিকদের সঙ্গে কাজ করেন। |
| **অ্যালগরিদমিক ন্যায্যতা** | 2018 - MIT [জেন্ডার শেডস স্টাডি](http://gendershades.org/overview.html) লিঙ্গ শ্রেণীবিন্যাস AI পণ্যের সঠিকতা মূল্যায়ন করে, নারীদের এবং রঙের মানুষের জন্য সঠিকতার ফাঁকগুলো প্রকাশ করে। একটি [2019 অ্যাপল কার্ড](https://www.wired.com/story/the-apple-card-didnt-see-genderand-thats-the-problem/) পুরুষদের তুলনায় নারীদের কম ক্রেডিট অফার করে বলে মনে হয়। উভয়ই অ্যালগরিদমিক পক্ষপাতের সমস্যাগুলো তুলে ধরে যা সামাজিক-অর্থনৈতিক ক্ষতি সৃষ্টি করে।|
| **ডেটা ভুল উপস্থাপন** | 2020 - [জর্জিয়া ডিপার্টমেন্ট অফ পাবলিক হেলথ COVID-19 চার্ট প্রকাশ করে](https://www.vox.com/covid-19-coronavirus-us-response-trump/2020/5/18/21262265/georgia-covid-19-cases-declining-reopening) যা নিশ্চিত কেসের প্রবণতা সম্পর্কে নাগরিকদের বিভ্রান্ত করতে পারে, যেখানে x-অক্ষের অchronological অর্ডারিং ছিল। এটি ভিজ্যুয়ালাইজেশন কৌশলের মাধ্যমে ভুল উপস্থাপনের উদাহরণ। |
| **স্বাধীন পছন্দের ভ্রম** | 2020 - লার্নিং অ্যাপ [ABCmouse $10M জরিমানা দিয়ে FTC অভিযোগ মীমাংসা করে](https://www.washingtonpost.com/business/2020/09/04/abcmouse-10-million-ftc-settlement/) যেখানে অভিভাবকরা এমন সাবস্ক্রিপশন পেমেন্টে আটকা পড়েন যা তারা বাতিল করতে পারেননি। এটি পছন্দ স্থাপত্যে ডার্ক প্যাটার্নের উদাহরণ, যেখানে ব্যবহারকারীদের ক্ষতিকর পছন্দের দিকে ঠেলে দেওয়া হয়। |
| **ডেটা গোপনীয়তা ও ব্যবহারকারীর অধিকার** | 2021 - ফেসবুক [ডেটা ব্রিচ](https://www.npr.org/2021/04/09/986005820/after-data-breach-exposes-530-million-facebook-says-it-will-not-notify-users) ৫৩০ মিলিয়ন ব্যবহারকারীর ডেটা প্রকাশ করে, যার ফলে FTC-কে $5B জরিমানা দিতে হয়। তবে, এটি ব্যবহারকারীদের ব্রিচ সম্পর্কে জানাতে অস্বীকার করে, যা ডেটা স্বচ্ছতা এবং প্রবেশাধিকারের ক্ষেত্রে ব্যবহারকারীর অধিকার লঙ্ঘন করে। |
| **সচেতন সম্মতি** | 1972 - [Tuskegee Syphilis Study](https://en.wikipedia.org/wiki/Tuskegee_Syphilis_Study) - আফ্রিকান আমেরিকান পুরুষদের বিনামূল্যে চিকিৎসার প্রতিশ্রুতি দেওয়া হয়েছিল, কিন্তু গবেষকরা তাদের রোগ নির্ণয় বা চিকিৎসার প্রাপ্যতা সম্পর্কে জানাতে ব্যর্থ হন। অনেক অংশগ্রহণকারী মারা যান এবং তাদের সঙ্গী বা সন্তান ক্ষতিগ্রস্ত হন; গবেষণাটি বছর ধরে চলে। |
| **ডেটা গোপনীয়তা** | 2007 - [Netflix data prize](https://www.wired.com/2007/12/why-anonymous-data-sometimes-isnt/) গবেষকদের _৫, গ্রাহকের ১০ মিলিয়ন অ্যানোনিমাইজড মুভি রেটিং_ প্রদান করেছিল সুপারিশ অ্যালগরিদম উন্নত করতে। তবে, গবেষকরা অ্যানোনিমাইজড ডেটাকে _বাহ্যিক ডেটাসেট_ (যেমন, IMDb মন্তব্য) এর সাথে সংযুক্ত করতে সক্ষম হন - কার্যত কিছু Netflix গ্রাহকদের "ডি-অ্যানোনিমাইজ" করে।|
| **সংগ্রহ পক্ষপাত** | 2013 - বোস্টন শহর [Street Bump](https://www.boston.gov/transportation/street-bump) অ্যাপ তৈরি করেছিল যা নাগরিকদের গর্ত রিপোর্ট করতে দেয়, শহরকে ভালো রাস্তার ডেটা প্রদান করে সমস্যা খুঁজে বের করতে এবং সমাধান করতে। তবে, [নিম্ন আয়ের গ্রুপের মানুষের গাড়ি এবং ফোনে কম প্রবেশাধিকার ছিল](https://hbr.org/2013/04/the-hidden-biases-in-big-data), যার ফলে তাদের রাস্তার সমস্যাগুলো এই অ্যাপে অদৃশ্য ছিল। ডেভেলপাররা ন্যায্যতার জন্য _সমান প্রবেশাধিকার এবং ডিজিটাল বিভাজন_ সমস্যাগুলো নিয়ে একাডেমিকদের সাথে কাজ করেন। |
| **অ্যালগরিদমিক ন্যায্যতা** | 2018 - MIT [Gender Shades Study](http://gendershades.org/overview.html) লিঙ্গ শ্রেণীবিন্যাস AI পণ্যের সঠিকতা মূল্যায়ন করে, নারীদের এবং রঙের ব্যক্তিদের জন্য সঠিকতার ফাঁকগুলো প্রকাশ করে। একটি [2019 Apple Card](https://www.wired.com/story/the-apple-card-didnt-see-genderand-thats-the-problem/) নারীদের তুলনায় পুরুষদের বেশি ক্রেডিট দেওয়ার প্রবণতা দেখায়। উভয়ই অ্যালগরিদমিক পক্ষপাতের সমস্যাগুলো তুলে ধরে যা সামাজিক-অর্থনৈতিক ক্ষতি সৃষ্টি করে।|
| **ডেটা ভুল উপস্থাপন** | 2020 - [Georgia Department of Public Health COVID-19 চার্ট](https://www.vox.com/covid-19-coronavirus-us-response-trump/2020/5/18/21262265/georgia-covid-19-cases-declining-reopening) প্রকাশ করে যা নিশ্চিত কেসের প্রবণতা সম্পর্কে নাগরিকদের বিভ্রান্ত করতে পারে, x-অক্ষের অ-কালানুক্রমিক ক্রমের মাধ্যমে। এটি ভিজ্যুয়ালাইজেশন কৌশলের মাধ্যমে ভুল উপস্থাপনের উদাহরণ। |
| **স্বাধীন পছন্দের বিভ্রম** | 2020 - লার্নিং অ্যাপ [ABCmouse $10M জরিমানা দিয়ে FTC অভিযোগ মীমাংসা করে](https://www.washingtonpost.com/business/2020/09/04/abcmouse-10-million-ftc-settlement/) যেখানে অভিভাবকরা এমন সাবস্ক্রিপশন পেমেন্টে আটকা পড়েন যা তারা বাতিল করতে পারেননি। এটি পছন্দ স্থাপত্যে ডার্ক প্যাটার্নের উদাহরণ, যেখানে ব্যবহারকারীদের ক্ষতিকর পছন্দের দিকে ঠেলে দেওয়া হয়। |
| **ডেটা গোপনীয়তা ও ব্যবহারকারীর অধিকার** | 2021 - Facebook [ডেটা লঙ্ঘন](https://www.npr.org/2021/04/09/986005820/after-data-breach-exposes-530-million-facebook-says-it-will-not-notify-users) ৫৩০ মিলিয়ন ব্যবহারকারীর ডেটা প্রকাশ করে, যার ফলে FTC-কে $5B জরিমানা দিতে হয়। তবে, এটি ব্যবহারকারীদের লঙ্ঘনের বিষয়ে জানাতে অস্বীকার করে, যা ডেটা স্বচ্ছতা এবং প্রবেশাধিকার সম্পর্কে ব্যবহারকারীর অধিকার লঙ্ঘন করে। |
আরও কেস স্টাডি অন্বেষণ করতে চান? এই রিসোর্সগুলো দেখুন:
* [Ethics Unwrapped](https://ethicsunwrapped.utexas.edu/case-studies) - বিভিন্ন শিল্পের নৈতিক দ্বিধা।
@ -177,38 +175,38 @@ CO_OP_TRANSLATOR_METADATA:
> 🚨 আপনি যে কেস স্টাডিগুলো দেখেছেন তা নিয়ে ভাবুন - আপনার জীবনে কি এমন কোনো নৈতিক চ্যালেঞ্জের অভিজ্ঞতা হয়েছে বা আপনি ক্ষতিগ্রস্ত হয়েছেন? আপনি কি এই বিভাগে আলোচনা করা নৈতিক চ্যালেঞ্জগুলোর মধ্যে অন্তত একটি চিত্রিত করে এমন অন্য কোনো কেস স্টাডি ভাবতে পারেন?
## প্রোগকৃত নৈতিকতা
## প্রয়োগকৃত নৈতিকতা
আমরা নৈতিকতার ধারণা, চ্যালেঞ্জ এবং বাস্তব জীবনের প্রেক্ষাপটে কেস স্টাডি নিয়ে আলোচনা করেছি। কিন্তু কীভাবে আমরা আমাদের প্রকল্পগুলোতে নৈতিক নীতিমালা এবং অনুশীলন _প্রোগ_ করতে শুরু করব? এবং কীভাবে আমরা এই অনুশীলনগুলোকে _অপারেশনালাইজ_ করব যাতে ভালো শাসন নিশ্চিত করা যায়? আসুন কিছু বাস্তব সমাধান অন্বেষণ করি:
আমরা নৈতিকতার ধারণা, চ্যালেঞ্জ এবং বাস্তব জীবনের প্রেক্ষাপটে কেস স্টাডি নিয়ে আলোচনা করেছি। কিন্তু কীভাবে আমরা আমাদের প্রকল্পগুলোতে নৈতিক নীতিমালা এবং অনুশীলন _প্রয়োগ_ করতে শুরু করব? এবং কীভাবে আমরা _অপারেশনালাইজ_ করব এই অনুশীলনগুলোকে ভালো শাসনের জন্য? আসুন কিছু বাস্তব সমাধান অন্বেষণ করি:
### 1. পেশাদার কোড
পেশাদার কোডগুলো সংগঠনগুলোর জন্য এটি বিকল্প প্রদান কর যাতে তারা তাদের নৈতিক নীতিমালা এবং মিশন বিবৃতিকে সমর্থন করার জন্য সদস্যদের "উৎসাহিত" করতে পারে। কোডগুলো পেশাদার আচরণের জন্য _নৈতিক নির্দেশিকা_ প্রদান করে, যা কর্মচারী বা সদস্যদের এমন সিদ্ধান্ত নিতে সাহায্য করে যা তাদের সংগঠনের নীতিমালার সঙ্গে সামঞ্জস্যপূর্ণ। এগুলো শুধুমাত্র সদস্যদের স্বেচ্ছাসেবী সম্মতির উপর নির্ভর করে কার্যকর; তবে, অনেক সংগঠন সদস্যদের সম্মতি উৎসাহিত করতে অতিরিক্ত পুরস্কার এবং শাস্তি প্রদান করে।
পেশাদার কোডগুলো সংগঠনগুলোকে তাদের নৈতিক নীতিমালা এবং মিশন বিবৃতিকে সমর্থন করতে সদস্যদের "উৎসাহিত" করার একটি বিকল্প প্রদান করে। কোডগুলো পেশাদার আচরণের জন্য _নৈতিক নির্দেশিকা_ প্রদান করে, যা কর্মচারী বা সদস্যদের সিদ্ধান্ত নিতে সাহায্য করে যা তাদের সংগঠনের নীতিমালার সাথে সামঞ্জস্যপূর্ণ। এগুলো শুধুমাত্র সদস্যদের স্বেচ্ছাসেবী সম্মতির উপর নির্ভর করে কার্যকর; তবে, অনেক সংগঠন সদস্যদের সম্মতি উৎসাহিত করতে অতিরিক্ত পুরস্কার এবং শাস্তি প্রদান করে।
উদাহরণগুলো অন্তর্ভুক্ত:
উদাহরণ:
* [Oxford Munich](http://www.code-of-ethics.org/code-of-conduct/) নৈতিকতার কোড
* [Data Science Association](http://datascienceassn.org/code-of-conduct.html) আচরণবিধি (২০১৩ সালে তৈরি)
* [ACM Code of Ethics and Professional Conduct](https://www.acm.org/code-of-ethics) (১৯৯৩ সাল থেকে)
> 🚨 আপনি কি কোনো পেশাদার ইঞ্জিনিয়ারিং বা ডেটা সায়েন্স সংগঠনের সদস্য? তাদের সাইটটি অন্বেষণ করুন এবং দেখুন তারা কি পেশাদার নৈতিকতার কোড সংজ্ঞায়িত করেছে। এটি তাদের নৈতিক নীতিমালা সম্পর্কে কী বলে? তারা সদস্যদের কোড অনুসরণ করতে কীভাবে "উৎসাহিত" করছে?
> 🚨 আপনি কি কোনো পেশাদার ইঞ্জিনিয়ারিং বা ডেটা সায়েন্স সংগঠনের সদস্য? তাদের সাইটটি অন্বেষণ করুন এবং দেখুন তারা কি একটি পেশাদার নৈতিকতার কোড সংজ্ঞায়িত করেছে। এটি তাদের নৈতিক নীতিমালা সম্পর্কে কী বলে? তারা কীভাবে সদস্যদের কোড অনুসরণ করতে "উৎসাহিত" করছে?
### 2. নৈতিকতার চেকলিস্ট
েখানে পেশাদার কোডগুলো অনুশীলনকারীদের থেকে প্রয়োজনীয় _নৈতিক আচরণ_ সংজ্ঞায়িত করে, সেখানে [পরিচিত সীমাবদ্ধতা](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md) রয়েছে, বিশেষত বৃহৎ প্রকল্পগুলোতে প্রয়োগে। এর পরিবর্তে, অনেক ডেটা সায়েন্স বিশেষজ্ঞ [চেকলিস্টের](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md) পক্ষে যুক্তি দেন, যা নীতিমালাকে আরও নির্ধারক এবং কার্যকর উপায়ে অনুশীলনে সংযুক্ত করতে পারে
দিও পেশাদার কোডগুলো অনুশীলনকারীদের থেকে প্রয়োজনীয় _নৈতিক আচরণ_ সংজ্ঞায়িত করে, তারা [পরিচিত সীমাবদ্ধতা](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md) রাখে, বিশেষত বৃহৎ প্রকল্পগুলোর প্রয়োগে। পরিবর্তে, অনেক ডেটা সায়েন্স বিশেষজ্ঞ [চেকলিস্টের](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md) পক্ষে যুক্তি দেন, যা নীতিমালাকে অনুশীলনের সাথে **সংযুক্ত** করে আরও নির্ধারক এবং কার্যকর উপায়ে।
চেকলিস্টগুলো প্রশ্নগুলোকে "হ্যাঁ/না" কাজগুলোতে রূপান্তর করে যা অপারেশনালাইজ করা যায়, এবং এগুলোকে স্ট্যান্ডার্ড প্রোডাক্ট রিলিজ ওয়ার্কফ্লো হিসেবে ট্র্যাক করা যায়।
চেকলিস্টগুলো প্রশ্নগুলোকে "হ্যাঁ/না" কাজগুলোতে রূপান্তর করে যা অপারেশনালাইজ করা যায়, এবং এগুলোকে স্ট্যান্ডার্ড প্রোডাক্ট রিলিজ ওয়ার্কফ্লোে ট্র্যাক করা যায়।
উদাহরণগুলো অন্তর্ভুক্ত:
* [Deon](https://deon.drivendata.org/) - শিল্পের সুপারিশ থেকে তৈরি একটি সাধারণ উদ্দেশ্য ডেটা নৈতিকতার চেকলিস্ট, যা সহজ ইন্টিগ্রেশনের জন্য কমান্ড-লাইন টুল প্রদান করে
* [Privacy Audit Checklist](https://cyber.harvard.edu/ecommerce/privacyaudit.html) - আইনি এবং সামাজিক এক্সপোজার দৃষ্টিকোণ থেকে তথ্য পরিচালনার অনুশীলনের জন্য সাধারণ নির্দেশিকা প্রদান করে।
* [AI Fairness Checklist](https://www.microsoft.com/en-us/research/project/ai-fairness-checklist/) - AI উন্নয়ন চক্রে ন্যায্যতা চেকগুলোর গ্রহণ এবং ইন্টিগ্রেশন সমর্থন করার জন্য AI অনুশীলনকারীদের দ্বারা তৈরি।
* [22 questions for ethics in data and AI](https://medium.com/the-organization/22-questions-for-ethics-in-data-and-ai-efb68fd19429) - আরও খোলা কাঠামো, নকশা, বাস্তবায়ন এবং সাংগঠনিক প্রেক্ষাপটে নৈতিক সমস্যার প্রাথমিক অনুসন্ধানের জন্য গঠিত
উদাহরণ:
* [Deon](https://deon.drivendata.org/) - শিল্পের সুপারিশ থেকে তৈরি একটি সাধারণ উদ্দেশ্য ডেটা নৈতিকতার চেকলিস্ট।
* [Privacy Audit Checklist](https://cyber.harvard.edu/ecommerce/privacyaudit.html) - আইনি এবং সামাজিক এক্সপোজার দৃষ্টিকোণ থেকে তথ্য পরিচালনার সাধারণ নির্দেশিকা প্রদান করে।
* [AI Fairness Checklist](https://www.microsoft.com/en-us/research/project/ai-fairness-checklist/) - AI উন্নয়ন চক্রে ন্যায্যতা চেকগুলোর গ্রহণ এবং সংহতকরণ সমর্থন করার জন্য তৈরি।
* [22 questions for ethics in data and AI](https://medium.com/the-organization/22-questions-for-ethics-in-data-and-ai-efb68fd19429) - নকশা, বাস্তবায়ন এবং সাংগঠনিক প্রেক্ষাপটে নৈতিক সমস্যার প্রাথমিক অনুসন্ধানের জন্য কাঠামোবদ্ধ
### 3. নৈতিকতার নিয়মকানুন
নৈতিকতা হলো ভাগ করা মূল্যবোধ সংজ্ঞায়িত করা এবং _স্বেচ্ছায়_ সঠিক কাজ করা। **অনুগততা** হলো _আইন অনুসরণ করা_ যেখানে এবং যদি সংজ্ঞায়িত করা হয়**শাসন** ব্যাপকভাবে সংগঠনগুলো কীভাবে নৈতিক নীতিমালা প্রয়োগ এবং প্রতিষ্ঠিত আইন মেনে চলার জন্য পরিচালনা করে তা অন্তর্ভুক্ত করে।
নৈতিকতা হলো ভাগ করা মূল্যবোধ সংজ্ঞায়িত করা এবং _স্বেচ্ছায়_ সঠিক কাজ করা। **অনুবর্তিতা** হলো _আইন মেনে চলা_ যেখানে এবং যেভাবে সংজ্ঞায়িত**শাসন** ব্যাপকভাবে সংগঠনগুলো কীভাবে নৈতিক নীতিমালা প্রয়োগ এবং প্রতিষ্ঠিত আইন মেনে চলার জন্য পরিচালনা করে তা কভার করে।
আজ, শাসন সংগঠনগুলোর মধ্যে দুটি রূপ নেয়। প্রথমত, এটি **নৈতিক AI** নীতিমালা সংজ্ঞায়িত করা এবং সংগঠনের সমস্ত AI-সম্পর্কিত প্রকল্পে গ্রহণের অনুশীলন প্রতিষ্ঠা করা। দ্বিতীয়ত, এটি যে অঞ্চলে এটি পরিচালনা করে তার জন্য সমস্ত সরকার-নির্ধারিত **ডেটা সুরক্ষা নিয়মকানুন** মেনে চলা।
আজ, শাসন সংগঠনগুলোর মধ্যে দুটি রূপ নেয়। প্রথমত, এটি **নৈতিক AI** নীতিমালা সংজ্ঞায়িত করা এবং সংগঠনের সমস্ত AI-সম্পর্কিত প্রকল্পে গ্রহণের অপারেশনালাইজ করার অনুশীলন প্রতিষ্ঠা করা। দ্বিতীয়ত, এটি যে অঞ্চলে এটি পরিচালনা করে তার জন্য সমস্ত সরকার-নির্ধারিত **ডেটা সুরক্ষা নিয়মকানুন** মেনে চলা।
ডেটা সুরক্ষা এবং গোপনীয়তার নিয়মকানুনের উদাহরণ:
@ -223,18 +221,20 @@ CO_OP_TRANSLATOR_METADATA:
### 4. নৈতিকতার সংস্কৃতি
লক্ষ্য করুন যে _অনুগততা_ (আইনের "অক্ষর" পূরণ করার জন্য যথেষ্ট করা) এবং [পদ্ধতিগত সমস্যাগুলো](https://www.coursera.org/learn/data-science-ethics/home/week/4) (যেমন, অস্থিরতা, তথ্যের অসমতা এবং বিতরণগত পক্ষপাত) সমাধান করার মধ্যে একটি অদৃশ্য ফাঁক রয়ে গেছে, যা AI-এর অস্ত্রায়নকে ত্বরান্বিত করতে পারে।
লক্ষ্য করুন যে _অনুবর্তিতা_ (আইনের "অক্ষর" পূরণ করার জন্য যথেষ্ট করা) এবং [পদ্ধতিগত সমস্যাগুলো](https://www.coursera.org/learn/data-science-ethics/home/week/4) (যেমন, অস্থিরতা, তথ্য অসমতা এবং বিতরণগত অন্যায্যতা) সমাধান করার মধ্যে একটি অদৃশ্য ফাঁক রয়ে গেছে যা AI-এর অস্ত্রায়নকে ত্বরান্বিত করতে পারে।
পরবর্তীটি [নৈতিকতার সংস্কৃতি সংজ্ঞায়িত করার জন্য সহযোগিতামূলক পদ্ধতির](https://towardsdatascience.com/why-ai-ethics-requires-a-culture-driven-approach-26f451afa29f) আহ্বান জানায় যা শিল্পের মধ্যে _সংগঠনগুলোর_ মধ্যে আবেগগত সংযোগ এবং ধারাবাহিক ভাগ করা মূল্যবোধ তৈরি করে। এটি সংগঠনগুলোতে আরও [আনুষ্ঠানিক ডেটা নৈতিকতার সংস্কৃতি](https://www.codeforamerica.org/news/formalizing-an-ethical-data-culture/) তৈরি করার আহ্বান জানায় - যা _যেকোনো ব্যক্তিকে_ [অ্যান্ডন কর্ড টানতে](https://en.wikipedia.org/wiki/Andon_(manufacturing)) (প্রক্রিয়ার প্রাথমিক পর্যায়ে নৈতিক উদ্বেগ উত্থাপন করতে) এবং AI প্রকল্পে দল গঠনের জন্য _নৈতিক মূল্যায়ন_ (যেমন, নিয়োগে) একটি মূল মানদণ্ড তৈরি করে।
পরবর্তীটি [নৈতিকতার সংস্কৃতি সংজ্ঞায়িত করার জন্য সহযোগিতামূলক পদ্ধতির](https://towardsdatascience.com/why-ai-ethics-requires-a-culture-driven-approach-26f451afa29f) আহ্বান জানায় যা সংস্থাগুলোর মধ্যে আবেগগত সংযোগ এবং ধারাবাহিক ভাগ করা মূল্যবোধ তৈরি করে। এটি সংগঠনগুলোতে আরও [আনুষ্ঠানিক ডেটা নৈতিকতার সংস্কৃতি](https://www.codeforamerica.org/news/formalizing-an-ethical-data-culture/) তৈরি করার আহ্বান জানায় - যা _যেকোনো ব্যক্তিকে_ [অ্যান্ডন কর্ড টানতে](https://en.wikipedia.org/wiki/Andon_(manufacturing)) (প্রক্রিয়ার প্রাথমিক পর্যায়ে নৈতিক উদ্বেগ উত্থাপন করতে) এবং _নৈতিক মূল্যায়ন_ (যেমন, নিয়োগে) AI প্রকল্পে দল গঠনের একটি মূল মানদণ্ড তৈরি করে।
---
## [পোস্ট-লেকচার কুইজ](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/3) 🎯
## [পোস্ট-লেকচার কুইজ](https://ff-quizzes.netlify.app/en/ds/) 🎯
## পর্যালোচনা ও স্ব-অধ্যয়ন
কোর্স এবং বইগুলো নৈতিকতার মূল ধারণা এবং চ্যালেঞ্জগুলো বুঝতে সাহায্য করে, যখন কেস স্টাডি এবং টুল
কোর্স এবং বইগুলো নৈতিকতার মূল ধারণা এবং চ্যালেঞ্জগুলো বুঝতে সাহায্য করে, যখন কেস স্টাডি এবং টুলগুলো বাস্তব জীবনের প্রেক্ষাপটে প্রয়োগকৃত নৈতিকতার অনুশীলনে সাহায্য করে। শুরু করার জন্য এখানে কিছু রিসোর্স দেওয়া হলো:
* [Machine Learning For Beginners](https://github.com/microsoft/ML-For-Beginners/blob/main/1-Introduction/3-fairness/README.md) - Microsoft থেকে ন্যায্যতা নিয়ে পাঠ।
* [Responsible AI এর নীতিমালা](https://docs.microsoft.com/en-us/learn/modules/responsible-ai-principles/) - Microsoft Learn থেকে বিনামূল্যে শেখার পথ।
* [নৈতিকতা এবং ডেটা বিজ্ঞান](https://resources.oreilly.com/examples/0636920203964) - O'Reilly ইবুক (M. Loukides, H. Mason প্রমুখ)
* [ডেটা বিজ্ঞান নৈতিকতা](https://www.coursera.org/learn/data-science-ethics#syllabus) - মিশিগান বিশ্ববিদ্যালয়ের অনলাইন কোর্স।
* [নৈতিকতা এবং ডেটা সায়েন্স](https://resources.oreilly.com/examples/0636920203964) - O'Reilly ইবুক (M. Loukides, H. Mason প্রমুখ)
* [ডেটা সায়েন্স নৈতিকতা](https://www.coursera.org/learn/data-science-ethics#syllabus) - মিশিগান বিশ্ববিদ্যালয়ের অনলাইন কোর্স।
* [Ethics Unwrapped](https://ethicsunwrapped.utexas.edu/case-studies) - টেক্সাস বিশ্ববিদ্যালয়ের কেস স্টাডি।
# অ্যাসাইনমেন্ট
@ -244,4 +244,4 @@ CO_OP_TRANSLATOR_METADATA:
---
**অস্বীকৃতি**:
এই নথিটি AI অনুবাদ পরিষেবা [Co-op Translator](https://github.com/Azure/co-op-translator) ব্যবহার করে অনুবাদ করা হয়েছে। আমরা যথাসম্ভব সঠিক অনুবাদের চেষ্টা করি, তবে অনুগ্রহ করে মনে রাখবেন যে স্বয়ংক্রিয় অনুবাদে ত্রুটি বা অসঙ্গতি থাকতে পারে। নথিটির মূল ভাষায় রচিত সংস্করণটিকেই প্রামাণিক উৎস হিসেবে বিবেচনা করা উচিত। গুরুত্বপূর্ণ তথ্যের জন্য, পেশাদার মানব অনুবাদ ব্যবহার করার পরামর্শ দেওয়া হয়। এই অনুবাদ ব্যবহারের ফলে সৃষ্ট কোনো ভুল বোঝাবুঝি বা ভুল ব্যাখ্যার জন্য আমরা দায়ী নই
এই নথিটি AI অনুবাদ পরিষেবা [Co-op Translator](https://github.com/Azure/co-op-translator) ব্যবহার করে অনুবাদ করা হয়েছে। আমরা যথাসম্ভব সঠিক অনুবাদ প্রদানের চেষ্টা করি, তবে অনুগ্রহ করে মনে রাখবেন যে স্বয়ংক্রিয় অনুবাদে ত্রুটি বা অসঙ্গতি থাকতে পারে। মূল ভাষায় থাকা নথিটিকে প্রামাণিক উৎস হিসেবে বিবেচনা করা উচিত। গুরুত্বপূর্ণ তথ্যের জন্য, পেশাদার মানব অনুবাদ সুপারিশ করা হয়। এই অনুবাদ ব্যবহারের ফলে কোনো ভুল বোঝাবুঝি বা ভুল ব্যাখ্যা হলে আমরা দায়বদ্ধ থাকব না

@ -1,8 +1,8 @@
<!--
CO_OP_TRANSLATOR_METADATA:
{
"original_hash": "8796f41f566a0a8ebb72863a83d558ed",
"translation_date": "2025-08-27T17:10:40+00:00",
"original_hash": "3a34157cc63516eba97c89a0b2f8c3e6",
"translation_date": "2025-09-03T21:16:56+00:00",
"source_file": "1-Introduction/02-ethics/README.md",
"language_code": "br"
}
@ -17,17 +17,17 @@ CO_OP_TRANSLATOR_METADATA:
Somos todos cidadãos de dados vivendo em um mundo dataficado.
Tendências de mercado indicam que, até 2022, 1 em cada 3 grandes organizações comprará e venderá seus dados por meio de [Mercados e Exchanges](https://www.gartner.com/smarterwithgartner/gartner-top-10-trends-in-data-and-analytics-for-2020/) online. Como **Desenvolvedores de Aplicativos**, será mais fácil e barato integrar insights baseados em dados e automação orientada por algoritmos nas experiências diárias dos usuários. Mas, à medida que a IA se torna onipresente, também precisaremos entender os potenciais danos causados pela [armazenização](https://www.youtube.com/watch?v=TQHs8SA1qpk) desses algoritmos em larga escala.
Tendências de mercado indicam que, até 2022, 1 em cada 3 grandes organizações comprará e venderá seus dados por meio de [Mercados e Exchanges](https://www.gartner.com/smarterwithgartner/gartner-top-10-trends-in-data-and-analytics-for-2020/) online. Como **Desenvolvedores de Aplicativos**, será mais fácil e barato integrar insights baseados em dados e automação orientada por algoritmos nas experiências diárias dos usuários. Mas, à medida que a IA se torna onipresente, também precisaremos entender os possíveis danos causados pela [armação](https://www.youtube.com/watch?v=TQHs8SA1qpk) desses algoritmos em larga escala.
As tendências também indicam que criaremos e consumiremos mais de [180 zettabytes](https://www.statista.com/statistics/871513/worldwide-data-created/) de dados até 2025. Como **Cientistas de Dados**, isso nos dá níveis sem precedentes de acesso a dados pessoais. Isso significa que podemos construir perfis comportamentais de usuários e influenciar a tomada de decisões de maneiras que criam uma [ilusão de livre arbítrio](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice), enquanto potencialmente direcionamos os usuários para resultados que preferimos. Isso também levanta questões mais amplas sobre privacidade de dados e proteção dos usuários.
As tendências também indicam que criaremos e consumiremos mais de [180 zettabytes](https://www.statista.com/statistics/871513/worldwide-data-created/) de dados até 2025. Como **Cientistas de Dados**, isso nos dá níveis sem precedentes de acesso a dados pessoais. Isso significa que podemos construir perfis comportamentais de usuários e influenciar a tomada de decisões de maneiras que criam uma [ilusão de escolha livre](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice), enquanto potencialmente direcionamos os usuários para resultados que preferimos. Isso também levanta questões mais amplas sobre privacidade de dados e proteção dos usuários.
A ética de dados agora é um _guarda-corpo necessário_ para a ciência e engenharia de dados, ajudando-nos a minimizar danos potenciais e consequências não intencionais de nossas ações orientadas por dados. O [Ciclo de Hype da Gartner para IA](https://www.gartner.com/smarterwithgartner/2-megatrends-dominate-the-gartner-hype-cycle-for-artificial-intelligence-2020/) identifica tendências relevantes em ética digital, IA responsável e governança de IA como principais impulsionadores de megatendências maiores em torno da _democratização_ e _industrialização_ da IA.
A ética de dados agora é um _guia necessário_ para ciência e engenharia de dados, ajudando-nos a minimizar possíveis danos e consequências não intencionais de nossas ações orientadas por dados. O [Ciclo de Hype da Gartner para IA](https://www.gartner.com/smarterwithgartner/2-megatrends-dominate-the-gartner-hype-cycle-for-artificial-intelligence-2020/) identifica tendências relevantes em ética digital, IA responsável e governança de IA como impulsionadores-chave de megatendências maiores em torno da _democratização_ e _industrialização_ da IA.
![Ciclo de Hype da Gartner para IA - 2020](https://images-cdn.newscred.com/Zz1mOWJhNzlkNDA2ZTMxMWViYjRiOGFiM2IyMjQ1YmMwZQ==)
Nesta lição, exploraremos a fascinante área da ética de dados - desde conceitos e desafios fundamentais até estudos de caso e conceitos aplicados de IA, como governança - que ajudam a estabelecer uma cultura ética em equipes e organizações que trabalham com dados e IA.
Nesta lição, exploraremos a área fascinante da ética de dados - desde conceitos e desafios fundamentais até estudos de caso e conceitos aplicados de IA, como governança - que ajudam a estabelecer uma cultura ética em equipes e organizações que trabalham com dados e IA.
## [Questionário pré-aula](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/2) 🎯
## [Quiz pré-aula](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/2) 🎯
## Definições Básicas
@ -39,127 +39,127 @@ A palavra "ética" vem da [palavra grega "ethikos"](https://en.wikipedia.org/wik
**Ética de Dados** é um [novo ramo da ética](https://royalsocietypublishing.org/doi/full/10.1098/rsta.2016.0360#sec-1) que "estuda e avalia problemas morais relacionados a _dados, algoritmos e práticas correspondentes_". Aqui, **"dados"** foca em ações relacionadas à geração, registro, curadoria, processamento, disseminação, compartilhamento e uso; **"algoritmos"** foca em IA, agentes, aprendizado de máquina e robôs; e **"práticas"** foca em tópicos como inovação responsável, programação, hacking e códigos de ética.
**Ética Aplicada** é a [aplicação prática de considerações morais](https://en.wikipedia.org/wiki/Applied_ethics). É o processo de investigar ativamente questões éticas no contexto de _ações, produtos e processos do mundo real_ e tomar medidas corretivas para garantir que permaneçam alinhados com nossos valores éticos definidos.
**Ética Aplicada** é a [aplicação prática de considerações morais](https://en.wikipedia.org/wiki/Applied_ethics). É o processo de investigar ativamente questões éticas no contexto de _ações, produtos e processos do mundo real_, e tomar medidas corretivas para garantir que permaneçam alinhados com nossos valores éticos definidos.
**Cultura Ética** trata de [_operacionalizar_ a ética aplicada](https://hbr.org/2019/05/how-to-design-an-ethical-organization) para garantir que nossos princípios e práticas éticos sejam adotados de maneira consistente e escalável em toda a organização. Culturas éticas bem-sucedidas definem princípios éticos em toda a organização, fornecem incentivos significativos para conformidade e reforçam normas éticas, incentivando e amplificando comportamentos desejados em todos os níveis da organização.
**Cultura Ética** trata de [_operacionalizar_ a ética aplicada](https://hbr.org/2019/05/how-to-design-an-ethical-organization) para garantir que nossos princípios e práticas éticas sejam adotados de maneira consistente e escalável em toda a organização. Culturas éticas bem-sucedidas definem princípios éticos em toda a organização, fornecem incentivos significativos para conformidade e reforçam normas éticas incentivando e amplificando comportamentos desejados em todos os níveis da organização.
## Conceitos de Ética
Nesta seção, discutiremos conceitos como **valores compartilhados** (princípios) e **desafios éticos** (problemas) para ética de dados - e exploraremos **estudos de caso** que ajudam a entender esses conceitos em contextos do mundo real.
Nesta seção, discutiremos conceitos como **valores compartilhados** (princípios) e **desafios éticos** (problemas) para ética de dados - e exploraremos **estudos de caso** que ajudam você a entender esses conceitos em contextos do mundo real.
### 1. Princípios Éticos
Toda estratégia de ética de dados começa definindo _princípios éticos_ - os "valores compartilhados" que descrevem comportamentos aceitáveis e orientam ações em conformidade em nossos projetos de dados e IA. Você pode defini-los em nível individual ou de equipe. No entanto, a maioria das grandes organizações os delineia em uma declaração de missão ou estrutura de _IA ética_ definida em níveis corporativos e aplicada consistentemente em todas as equipes.
Toda estratégia de ética de dados começa definindo _princípios éticos_ - os "valores compartilhados" que descrevem comportamentos aceitáveis e orientam ações em conformidade em nossos projetos de dados e IA. Você pode defini-los em nível individual ou de equipe. No entanto, a maioria das grandes organizações os descreve em uma declaração de missão ou estrutura de _IA ética_ definida em níveis corporativos e aplicada consistentemente em todas as equipes.
**Exemplo:** A declaração de missão de [IA Responsável](https://www.microsoft.com/en-us/ai/responsible-ai) da Microsoft diz: _"Estamos comprometidos com o avanço da IA orientada por princípios éticos que colocam as pessoas em primeiro lugar"_ - identificando 6 princípios éticos na estrutura abaixo:
![IA Responsável na Microsoft](https://docs.microsoft.com/en-gb/azure/cognitive-services/personalizer/media/ethics-and-responsible-use/ai-values-future-computed.png)
Vamos explorar brevemente esses princípios. _Transparência_ e _responsabilidade_ são valores fundamentais sobre os quais outros princípios são construídos - então vamos começar por eles:
Vamos explorar brevemente esses princípios. _Transparência_ e _responsabilidade_ são valores fundamentais sobre os quais outros princípios são construídos - então vamos começar por :
* [**Responsabilidade**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) torna os profissionais _responsáveis_ por suas operações de dados e IA e pela conformidade com esses princípios éticos.
* [**Transparência**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) garante que as ações de dados e IA sejam _compreensíveis_ (interpretáveis) para os usuários, explicando o quê e o porquê por trás das decisões.
* [**Justiça**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1%3aprimaryr6) - foca em garantir que a IA trate _todas as pessoas_ de forma justa, abordando quaisquer preconceitos sociotécnicos sistêmicos ou implícitos em dados e sistemas.
* [**Confiabilidade e Segurança**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - garante que a IA se comporte _consistentemente_ com os valores definidos, minimizando danos potenciais ou consequências não intencionais.
* [**Justiça**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1%3aprimaryr6) - foca em garantir que a IA trate _todas as pessoas_ de forma justa, abordando quaisquer preconceitos sociotécnicos sistêmicos ou implícitos nos dados e sistemas.
* [**Confiabilidade e Segurança**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - garante que a IA se comporte de forma _consistente_ com valores definidos, minimizando possíveis danos ou consequências não intencionais.
* [**Privacidade e Segurança**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - trata de entender a linhagem dos dados e fornecer _privacidade de dados e proteções relacionadas_ aos usuários.
* [**Inclusividade**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - trata de projetar soluções de IA com intenção, adaptando-as para atender a uma _ampla gama de necessidades e capacidades humanas_.
* [**Inclusão**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - trata de projetar soluções de IA com intenção, adaptando-as para atender a uma _ampla gama de necessidades e capacidades humanas_.
> 🚨 Pense em qual poderia ser sua declaração de missão de ética de dados. Explore estruturas de IA ética de outras organizações - aqui estão exemplos da [IBM](https://www.ibm.com/cloud/learn/ai-ethics), [Google](https://ai.google/principles) e [Facebook](https://ai.facebook.com/blog/facebooks-five-pillars-of-responsible-ai/). Quais valores compartilhados eles têm em comum? Como esses princípios se relacionam com o produto de IA ou setor em que operam?
> 🚨 Pense sobre qual poderia ser sua declaração de missão de ética de dados. Explore estruturas de IA ética de outras organizações - aqui estão exemplos da [IBM](https://www.ibm.com/cloud/learn/ai-ethics), [Google](https://ai.google/principles) e [Facebook](https://ai.facebook.com/blog/facebooks-five-pillars-of-responsible-ai/). Quais valores compartilhados eles têm em comum? Como esses princípios se relacionam com o produto ou setor de IA em que operam?
### 2. Desafios Éticos
Depois de definir os princípios éticos, o próximo passo é avaliar nossas ações de dados e IA para ver se elas estão alinhadas com esses valores compartilhados. Pense em suas ações em duas categorias: _coleta de dados_ e _design de algoritmos_.
Depois de definir os princípios éticos, o próximo passo é avaliar nossas ações de dados e IA para ver se estão alinhadas com esses valores compartilhados. Pense em suas ações em duas categorias: _coleta de dados_ e _design de algoritmos_.
Na coleta de dados, as ações provavelmente envolverão **dados pessoais** ou informações pessoalmente identificáveis (PII) de indivíduos identificáveis. Isso inclui [diversos itens de dados não pessoais](https://ec.europa.eu/info/law/law-topic/data-protection/reform/what-personal-data_en) que, _coletivamente_, identificam um indivíduo. Os desafios éticos podem estar relacionados à _privacidade de dados_, _propriedade de dados_ e tópicos relacionados, como _consentimento informado_ e _direitos de propriedade intelectual_ dos usuários.
No design de algoritmos, as ações envolverão a coleta e curadoria de **conjuntos de dados**, e o uso deles para treinar e implantar **modelos de dados** que preveem resultados ou automatizam decisões em contextos do mundo real. Os desafios éticos podem surgir de _viés nos conjuntos de dados_, problemas de _qualidade dos dados_, _injustiças_ e _distorções_ nos algoritmos - incluindo algumas questões que são sistêmicas por natureza.
No design de algoritmos, as ações envolverão a coleta e curadoria de **conjuntos de dados**, e o uso deles para treinar e implantar **modelos de dados** que preveem resultados ou automatizam decisões em contextos do mundo real. Os desafios éticos podem surgir de _viés de conjunto de dados_, problemas de _qualidade de dados_, _injustiça_ e _má representação_ em algoritmos - incluindo alguns problemas que são sistêmicos por natureza.
Em ambos os casos, os desafios éticos destacam áreas onde nossas ações podem entrar em conflito com nossos valores compartilhados. Para detectar, mitigar, minimizar ou eliminar essas preocupações, precisamos fazer perguntas morais de "sim/não" relacionadas às nossas ações e, em seguida, tomar medidas corretivas conforme necessário. Vamos dar uma olhada em alguns desafios éticos e nas questões morais que eles levantam:
Em ambos os casos, os desafios éticos destacam áreas onde nossas ações podem entrar em conflito com nossos valores compartilhados. Para detectar, mitigar, minimizar ou eliminar essas preocupações, precisamos fazer perguntas morais "sim/não" relacionadas às nossas ações e tomar medidas corretivas conforme necessário. Vamos dar uma olhada em alguns desafios éticos e nas perguntas morais que eles levantam:
#### 2.1 Propriedade de Dados
A coleta de dados muitas vezes envolve dados pessoais que podem identificar os sujeitos dos dados. [Propriedade de dados](https://permission.io/blog/data-ownership) trata do _controle_ e dos [_direitos dos usuários_](https://permission.io/blog/data-ownership) relacionados à criação, processamento e disseminação de dados.
A coleta de dados frequentemente envolve dados pessoais que podem identificar os sujeitos dos dados. [Propriedade de dados](https://permission.io/blog/data-ownership) trata do _controle_ e [_direitos dos usuários_](https://permission.io/blog/data-ownership) relacionados à criação, processamento e disseminação de dados.
As questões morais que precisamos fazer são:
* Quem é o proprietário dos dados? (usuário ou organização)
* Quais direitos os sujeitos dos dados possuem? (ex: acesso, exclusão, portabilidade)
* Quais direitos as organizações possuem? (ex: retificar avaliações maliciosas de usuários)
As perguntas morais que precisamos fazer são:
* Quem possui os dados? (usuário ou organização)
* Quais direitos os sujeitos dos dados têm? (ex: acesso, exclusão, portabilidade)
* Quais direitos as organizações têm? (ex: retificar avaliações maliciosas de usuários)
#### 2.2 Consentimento Informado
[Consentimento informado](https://legaldictionary.net/informed-consent/) define o ato de os usuários concordarem com uma ação (como coleta de dados) com um _entendimento completo_ dos fatos relevantes, incluindo o propósito, os riscos potenciais e as alternativas.
Questões a explorar aqui são:
* O usuário (sujeito dos dados) deu permissão para a captura e uso dos dados?
* O usuário entendeu o propósito para o qual os dados foram capturados?
* O usuário compreendeu os riscos potenciais de sua participação?
Perguntas a explorar aqui são:
* O usuário (sujeito dos dados) deu permissão para captura e uso de dados?
* O usuário entendeu o propósito para o qual os dados foram capturados?
* O usuário compreendeu os riscos potenciais de sua participação?
#### 2.3 Propriedade Intelectual
[Propriedade intelectual](https://en.wikipedia.org/wiki/Intellectual_property) refere-se a criações intangíveis resultantes da iniciativa humana, que podem _ter valor econômico_ para indivíduos ou empresas.
Questões a explorar aqui são:
* Os dados coletados têm valor econômico para um usuário ou empresa?
* O **usuário** possui propriedade intelectual aqui?
* A **organização** possui propriedade intelectual aqui?
* Se esses direitos existem, como estamos protegendo-os?
Perguntas a explorar aqui são:
* Os dados coletados têm valor econômico para um usuário ou empresa?
* O **usuário** possui propriedade intelectual aqui?
* A **organização** possui propriedade intelectual aqui?
* Se esses direitos existirem, como estamos protegendo-os?
#### 2.4 Privacidade de Dados
[Privacidade de dados](https://www.northeastern.edu/graduate/blog/what-is-data-privacy/) ou privacidade da informação refere-se à preservação da privacidade do usuário e à proteção da identidade do usuário em relação a informações pessoalmente identificáveis.
[Privacidade de dados](https://www.northeastern.edu/graduate/blog/what-is-data-privacy/) ou privacidade da informação refere-se à preservação da privacidade do usuário e proteção da identidade do usuário em relação a informações pessoalmente identificáveis.
Questões a explorar aqui são:
* Os dados (pessoais) dos usuários estão protegidos contra invasões e vazamentos?
* Os dados dos usuários estão acessíveis apenas a usuários e contextos autorizados?
* O anonimato dos usuários é preservado quando os dados são compartilhados ou disseminados?
* Um usuário pode ser desidentificado de conjuntos de dados anonimizados?
Perguntas a explorar aqui são:
* Os dados (pessoais) dos usuários estão protegidos contra invasões e vazamentos?
* Os dados dos usuários são acessíveis apenas a usuários e contextos autorizados?
* A anonimidade dos usuários é preservada quando os dados são compartilhados ou disseminados?
* Um usuário pode ser desidentificado de conjuntos de dados anonimizados?
#### 2.5 Direito ao Esquecimento
O [Direito ao Esquecimento](https://en.wikipedia.org/wiki/Right_to_be_forgotten) ou [Direito à Exclusão](https://www.gdpreu.org/right-to-be-forgotten/) fornece proteção adicional de dados pessoais aos usuários. Especificamente, dá aos usuários o direito de solicitar a exclusão ou remoção de dados pessoais de buscas na Internet e outros locais, _sob circunstâncias específicas_ - permitindo-lhes um novo começo online sem que ações passadas sejam usadas contra eles.
Questões a explorar aqui são:
* O sistema permite que os sujeitos dos dados solicitem a exclusão?
* A retirada do consentimento do usuário deve acionar a exclusão automática?
* Os dados foram coletados sem consentimento ou por meios ilegais?
* Estamos em conformidade com as regulamentações governamentais para privacidade de dados?
Perguntas a explorar aqui são:
* O sistema permite que os sujeitos dos dados solicitem exclusão?
* A retirada do consentimento do usuário deve acionar exclusão automática?
* Os dados foram coletados sem consentimento ou por meios ilegais?
* Estamos em conformidade com regulamentações governamentais de privacidade de dados?
#### 2.6 Viés nos Conjuntos de Dados
#### 2.6 Viés de Conjunto de Dados
Viés nos conjuntos de dados ou [Viés de Coleta](http://researcharticles.com/index.php/bias-in-data-collection-in-research/) trata da seleção de um subconjunto _não representativo_ de dados para o desenvolvimento de algoritmos, criando potencial injustiça nos resultados para grupos diversos. Tipos de viés incluem viés de seleção ou amostragem, viés de voluntariado e viés de instrumento.
Viés de conjunto de dados ou [Viés de Coleta](http://researcharticles.com/index.php/bias-in-data-collection-in-research/) trata da seleção de um subconjunto _não representativo_ de dados para desenvolvimento de algoritmos, criando potencial injustiça nos resultados para grupos diversos. Tipos de viés incluem viés de seleção ou amostragem, viés de voluntariado e viés de instrumento.
Questões a explorar aqui são:
* Recrutamos um conjunto representativo de sujeitos dos dados?
* Testamos nosso conjunto de dados coletado ou curado para diversos vieses?
* Podemos mitigar ou remover quaisquer vieses descobertos?
Perguntas a explorar aqui são:
* Recrutamos um conjunto representativo de sujeitos dos dados?
* Testamos nosso conjunto de dados coletado ou curado para diversos vieses?
* Podemos mitigar ou remover quaisquer vieses descobertos?
#### 2.7 Qualidade dos Dados
#### 2.7 Qualidade de Dados
[Qualidade dos Dados](https://lakefs.io/data-quality-testing/) analisa a validade do conjunto de dados curado usado para desenvolver nossos algoritmos, verificando se os recursos e registros atendem aos requisitos para o nível de precisão e consistência necessários para nosso propósito de IA.
[Qualidade de Dados](https://lakefs.io/data-quality-testing/) analisa a validade do conjunto de dados curado usado para desenvolver nossos algoritmos, verificando se os recursos e registros atendem aos requisitos para o nível de precisão e consistência necessário para nosso propósito de IA.
Questões a explorar aqui são:
* Capturamos _recursos_ válidos para nosso caso de uso?
* Os dados foram capturados _consistentemente_ em diversas fontes de dados?
* O conjunto de dados está _completo_ para condições ou cenários diversos?
* As informações capturadas refletem a realidade com _precisão_?
Perguntas a explorar aqui são:
* Capturamos recursos válidos para nosso caso de uso?
* Os dados foram capturados de forma consistente em diversas fontes de dados?
* O conjunto de dados está completo para condições ou cenários diversos?
* As informações capturadas refletem a realidade com precisão?
#### 2.8 Justiça nos Algoritmos
[Verificação de Justiça Algorítmica](https://towardsdatascience.com/what-is-algorithm-fairness-3182e161cf9f) analisa se o design do algoritmo discrimina sistematicamente subgrupos específicos de sujeitos de dados, levando a [danos potenciais](https://docs.microsoft.com/en-us/azure/machine-learning/concept-fairness-ml) na _alocação_ (onde recursos são negados ou retidos desse grupo) e na _qualidade do serviço_ (onde a IA não é tão precisa para alguns subgrupos quanto é para outros).
#### 2.8 Justiça do Algoritmo
[Verificação de Justiça Algorítmica](https://towardsdatascience.com/what-is-algorithm-fairness-3182e161cf9f) analisa se o design do algoritmo discrimina sistematicamente subgrupos específicos de sujeitos de dados, levando a [potenciais danos](https://docs.microsoft.com/en-us/azure/machine-learning/concept-fairness-ml) na _alocação_ (onde recursos são negados ou retidos desse grupo) e na _qualidade do serviço_ (onde a IA não é tão precisa para alguns subgrupos quanto é para outros).
Perguntas para explorar aqui são:
* Avaliamos a precisão do modelo para diversos subgrupos e condições?
* Examinamos o sistema para identificar possíveis danos (ex.: estereotipagem)?
* Avaliamos a precisão do modelo para subgrupos e condições diversas?
* Examinamos o sistema para identificar possíveis danos (por exemplo, estereótipos)?
* Podemos revisar os dados ou re-treinar os modelos para mitigar os danos identificados?
Explore recursos como [checklists de Justiça em IA](https://query.prod.cms.rt.microsoft.com/cms/api/am/binary/RE4t6dA) para aprender mais.
#### 2.9 Representação Errada
#### 2.9 Deturpação
[Representação Errada de Dados](https://www.sciencedirect.com/topics/computer-science/misrepresentation) trata de questionar se estamos comunicando insights de dados relatados de forma honesta, mas de maneira enganosa, para sustentar uma narrativa desejada.
[Deturpação de Dados](https://www.sciencedirect.com/topics/computer-science/misrepresentation) trata de questionar se estamos comunicando insights de dados relatados de forma honesta de maneira enganosa para sustentar uma narrativa desejada.
Perguntas para explorar aqui são:
* Estamos reportando dados incompletos ou imprecisos?
* Estamos visualizando dados de forma que induza conclusões enganosas?
* Estamos relatando dados incompletos ou imprecisos?
* Estamos visualizando dados de forma que induza a conclusões enganosas?
* Estamos usando técnicas estatísticas seletivas para manipular resultados?
* Existem explicações alternativas que possam oferecer uma conclusão diferente?
@ -168,24 +168,24 @@ A [Ilusão de Livre Escolha](https://www.datasciencecentral.com/profiles/blogs/t
Perguntas para explorar aqui são:
* O usuário compreendeu as implicações de fazer essa escolha?
* O usuário estava ciente das (alternativas) opções e dos prós e contras de cada uma?
* O usuário estava ciente das escolhas (alternativas) e dos prós e contras de cada uma?
* O usuário pode reverter uma escolha automatizada ou influenciada posteriormente?
### 3. Estudos de Caso
Para colocar esses desafios éticos em contextos do mundo real, é útil observar estudos de caso que destacam os danos e consequências potenciais para indivíduos e a sociedade, quando essas violações éticas são ignoradas.
Para colocar esses desafios éticos em contextos do mundo real, é útil analisar estudos de caso que destacam os potenciais danos e consequências para indivíduos e a sociedade, quando essas violações éticas são ignoradas.
Aqui estão alguns exemplos:
| Desafio Ético | Estudo de Caso |
|--- |--- |
| **Consentimento Informado** | 1972 - [Estudo de Sífilis de Tuskegee](https://en.wikipedia.org/wiki/Tuskegee_Syphilis_Study) - Homens afro-americanos que participaram do estudo foram prometidos cuidados médicos gratuitos, _mas foram enganados_ por pesquisadores que não informaram os sujeitos sobre seu diagnóstico ou sobre a disponibilidade de tratamento. Muitos morreram e parceiros ou filhos foram afetados; o estudo durou 40 anos. |
| **Privacidade de Dados** | 2007 - O [prêmio de dados da Netflix](https://www.wired.com/2007/12/why-anonymous-data-sometimes-isnt/) forneceu aos pesquisadores _10 milhões de classificações de filmes anonimizadas de 50 mil clientes_ para ajudar a melhorar algoritmos de recomendação. No entanto, os pesquisadores conseguiram correlacionar dados anonimizados com dados pessoalmente identificáveis em _conjuntos de dados externos_ (ex.: comentários no IMDb), efetivamente "desanonimizando" alguns assinantes da Netflix.|
| **Privacidade de Dados** | 2007 - O [prêmio de dados da Netflix](https://www.wired.com/2007/12/why-anonymous-data-sometimes-isnt/) forneceu aos pesquisadores _10 milhões de classificações de filmes anonimizadas de 50 mil clientes_ para ajudar a melhorar algoritmos de recomendação. No entanto, os pesquisadores conseguiram correlacionar dados anonimizados com dados pessoalmente identificáveis em _conjuntos de dados externos_ (por exemplo, comentários no IMDb), efetivamente "desanonimizando" alguns assinantes da Netflix.|
| **Viés na Coleta** | 2013 - A cidade de Boston [desenvolveu o Street Bump](https://www.boston.gov/transportation/street-bump), um aplicativo que permitia aos cidadãos reportar buracos, fornecendo à cidade melhores dados sobre as vias para encontrar e corrigir problemas. No entanto, [pessoas de grupos de baixa renda tinham menos acesso a carros e telefones](https://hbr.org/2013/04/the-hidden-biases-in-big-data), tornando seus problemas nas vias invisíveis no aplicativo. Os desenvolvedores trabalharam com acadêmicos para abordar questões de _acesso equitativo e divisões digitais_ para garantir justiça. |
| **Justiça Algorítmica** | 2018 - O MIT [Estudo Gender Shades](http://gendershades.org/overview.html) avaliou a precisão de produtos de IA para classificação de gênero, expondo lacunas na precisão para mulheres e pessoas de cor. Um [Apple Card de 2019](https://www.wired.com/story/the-apple-card-didnt-see-genderand-thats-the-problem/) parecia oferecer menos crédito para mulheres do que para homens. Ambos ilustraram problemas de viés algorítmico levando a danos socioeconômicos.|
| **Representação Errada de Dados** | 2020 - O [Departamento de Saúde Pública da Geórgia divulgou gráficos de COVID-19](https://www.vox.com/covid-19-coronavirus-us-response-trump/2020/5/18/21262265/georgia-covid-19-cases-declining-reopening) que pareciam enganar os cidadãos sobre tendências de casos confirmados com ordenação não cronológica no eixo x. Isso ilustra representação errada por meio de truques de visualização. |
| **Ilusão de Livre Escolha** | 2020 - O aplicativo de aprendizado [ABCmouse pagou US$ 10 milhões para resolver uma reclamação da FTC](https://www.washingtonpost.com/business/2020/09/04/abcmouse-10-million-ftc-settlement/) onde pais foram presos em assinaturas que não podiam cancelar. Isso ilustra padrões obscuros em arquiteturas de escolha, onde os usuários foram influenciados a tomar decisões potencialmente prejudiciais. |
| **Privacidade de Dados e Direitos dos Usuários** | 2021 - O [Vazamento de Dados do Facebook](https://www.npr.org/2021/04/09/986005820/after-data-breach-exposes-530-million-facebook-says-it-will-not-notify-users) expôs dados de 530 milhões de usuários, resultando em um acordo de US$ 5 bilhões com a FTC. No entanto, a empresa se recusou a notificar os usuários sobre o vazamento, violando os direitos dos usuários em relação à transparência e acesso aos dados. |
| **Deturpação de Dados** | 2020 - O [Departamento de Saúde Pública da Geórgia divulgou gráficos de COVID-19](https://www.vox.com/covid-19-coronavirus-us-response-trump/2020/5/18/21262265/georgia-covid-19-cases-declining-reopening) que pareciam enganar os cidadãos sobre tendências de casos confirmados com ordenação não cronológica no eixo x. Isso ilustra deturpação por meio de truques de visualização. |
| **Ilusão de Livre Escolha** | 2020 - O aplicativo de aprendizado [ABCmouse pagou $10 milhões para resolver uma reclamação da FTC](https://www.washingtonpost.com/business/2020/09/04/abcmouse-10-million-ftc-settlement/) onde pais foram presos em assinaturas que não podiam cancelar. Isso ilustra padrões obscuros em arquiteturas de escolha, onde os usuários foram influenciados a tomar decisões potencialmente prejudiciais. |
| **Privacidade de Dados e Direitos do Usuário** | 2021 - O [Vazamento de Dados do Facebook](https://www.npr.org/2021/04/09/986005820/after-data-breach-exposes-530-million-facebook-says-it-will-not-notify-users) expôs dados de 530 milhões de usuários, resultando em um acordo de $5 bilhões com a FTC. No entanto, a empresa se recusou a notificar os usuários sobre o vazamento, violando os direitos dos usuários em relação à transparência e acesso aos dados. |
Quer explorar mais estudos de caso? Confira esses recursos:
* [Ethics Unwrapped](https://ethicsunwrapped.utexas.edu/case-studies) - dilemas éticos em diversas indústrias.
@ -200,7 +200,7 @@ Falamos sobre conceitos éticos, desafios e estudos de caso em contextos do mund
### 1. Códigos Profissionais
Códigos Profissionais oferecem uma opção para organizações "incentivarem" membros a apoiar seus princípios éticos e declaração de missão. Códigos são _diretrizes morais_ para o comportamento profissional, ajudando funcionários ou membros a tomarem decisões que estejam alinhadas com os princípios da organização. Eles são tão eficazes quanto a adesão voluntária dos membros; no entanto, muitas organizações oferecem recompensas e penalidades adicionais para motivar a conformidade.
Códigos Profissionais oferecem uma opção para organizações "incentivarem" os membros a apoiar seus princípios éticos e declaração de missão. Códigos são _diretrizes morais_ para o comportamento profissional, ajudando funcionários ou membros a tomarem decisões que estejam alinhadas com os princípios da organização. Eles são tão eficazes quanto a conformidade voluntária dos membros; no entanto, muitas organizações oferecem recompensas e penalidades adicionais para motivar a adesão.
Exemplos incluem:
@ -217,7 +217,7 @@ Enquanto os códigos profissionais definem o _comportamento ético_ exigido dos
Checklists convertem perguntas em tarefas de "sim/não" que podem ser operacionalizadas, permitindo que sejam rastreadas como parte dos fluxos de trabalho padrão de lançamento de produtos.
Exemplos incluem:
* [Deon](https://deon.drivendata.org/) - um checklist de ética em dados de uso geral criado a partir de [recomendações da indústria](https://deon.drivendata.org/#checklist-citations) com uma ferramenta de linha de comando para fácil integração.
* [Deon](https://deon.drivendata.org/) - um checklist de ética em dados de propósito geral criado a partir de [recomendações da indústria](https://deon.drivendata.org/#checklist-citations) com uma ferramenta de linha de comando para fácil integração.
* [Checklist de Auditoria de Privacidade](https://cyber.harvard.edu/ecommerce/privacyaudit.html) - fornece orientações gerais para práticas de manuseio de informações sob perspectivas legais e sociais.
* [Checklist de Justiça em IA](https://www.microsoft.com/en-us/research/project/ai-fairness-checklist/) - criado por profissionais de IA para apoiar a adoção e integração de verificações de justiça nos ciclos de desenvolvimento de IA.
* [22 perguntas para ética em dados e IA](https://medium.com/the-organization/22-questions-for-ethics-in-data-and-ai-efb68fd19429) - estrutura mais aberta, projetada para exploração inicial de questões éticas em design, implementação e contextos organizacionais.
@ -237,29 +237,29 @@ Exemplos de regulamentações de proteção e privacidade de dados:
* `2018`, [Lei de Privacidade do Consumidor da Califórnia (CCPA)](https://www.oag.ca.gov/privacy/ccpa) - dá aos consumidores mais _direitos_ sobre seus dados pessoais.
* `2021`, [Lei de Proteção de Informações Pessoais da China](https://www.reuters.com/world/china/china-passes-new-personal-data-privacy-law-take-effect-nov-1-2021-08-20/) - recentemente aprovada, criando uma das regulamentações de privacidade de dados online mais fortes do mundo.
> 🚨 A União Europeia definiu o GDPR (Regulamento Geral de Proteção de Dados), que continua sendo uma das regulamentações de privacidade de dados mais influentes hoje. Você sabia que ele também define [8 direitos dos usuários](https://www.freeprivacypolicy.com/blog/8-user-rights-gdpr) para proteger a privacidade digital e os dados pessoais dos cidadãos? Aprenda quais são esses direitos e por que eles são importantes.
> 🚨 A União Europeia definiu o GDPR (Regulamento Geral de Proteção de Dados), que permanece uma das regulamentações de privacidade de dados mais influentes hoje. Você sabia que ele também define [8 direitos dos usuários](https://www.freeprivacypolicy.com/blog/8-user-rights-gdpr) para proteger a privacidade digital e os dados pessoais dos cidadãos? Aprenda quais são esses direitos e por que eles são importantes.
### 4. Cultura Ética
Note que ainda existe uma lacuna intangível entre _conformidade_ (fazer o suficiente para atender "à letra da lei") e abordar [questões sistêmicas](https://www.coursera.org/learn/data-science-ethics/home/week/4) (como ossificação, assimetria de informações e injustiça distributiva) que podem acelerar a armação da IA.
O último requer [abordagens colaborativas para definir culturas éticas](https://towardsdatascience.com/why-ai-ethics-requires-a-culture-driven-approach-26f451afa29f) que construam conexões emocionais e valores compartilhados consistentes _entre organizações_ na indústria. Isso exige mais [culturas éticas formalizadas de dados](https://www.codeforamerica.org/news/formalizing-an-ethical-data-culture/) nas organizações - permitindo que _qualquer pessoa_ [puxe o cordão Andon](https://en.wikipedia.org/wiki/Andon_(manufacturing)) (para levantar preocupações éticas cedo no processo) e tornando _avaliações éticas_ (ex.: na contratação) um critério central na formação de equipes em projetos de IA.
O último requer [abordagens colaborativas para definir culturas éticas](https://towardsdatascience.com/why-ai-ethics-requires-a-culture-driven-approach-26f451afa29f) que construam conexões emocionais e valores compartilhados consistentes _entre organizações_ na indústria. Isso exige mais [culturas éticas formalizadas de dados](https://www.codeforamerica.org/news/formalizing-an-ethical-data-culture/) nas organizações - permitindo que _qualquer pessoa_ [puxe o cordão Andon](https://en.wikipedia.org/wiki/Andon_(manufacturing)) (para levantar preocupações éticas cedo no processo) e tornando _avaliações éticas_ (por exemplo, na contratação) um critério central na formação de equipes em projetos de IA.
---
## [Quiz pós-aula](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/3) 🎯
## [Quiz pós-aula](https://ff-quizzes.netlify.app/en/ds/) 🎯
## Revisão e Autoestudo
Cursos e livros ajudam a entender os conceitos e desafios éticos fundamentais, enquanto estudos de caso e ferramentas ajudam com práticas éticas aplicadas em contextos do mundo real. Aqui estão alguns recursos para começar:
Cursos e livros ajudam a entender conceitos éticos fundamentais e desafios, enquanto estudos de caso e ferramentas ajudam com práticas éticas aplicadas em contextos do mundo real. Aqui estão alguns recursos para começar:
* [Machine Learning For Beginners](https://github.com/microsoft/ML-For-Beginners/blob/main/1-Introduction/3-fairness/README.md) - lição sobre Justiça, da Microsoft.
* [Princípios de IA Responsável](https://docs.microsoft.com/en-us/learn/modules/responsible-ai-principles/) - trilha de aprendizado gratuita da Microsoft Learn.
* [Ética e Ciência de Dados](https://resources.oreilly.com/examples/0636920203964) - EBook da O'Reilly (M. Loukides, H. Mason et. al)
* [Ética na Ciência de Dados](https://www.coursera.org/learn/data-science-ethics#syllabus) - curso online da Universidade de Michigan.
* [Ethics Unwrapped](https://ethicsunwrapped.utexas.edu/case-studies) - estudos de caso da Universidade do Texas.
* [Princípios de IA Responsável](https://docs.microsoft.com/en-us/learn/modules/responsible-ai-principles/) - trilha de aprendizado gratuita da Microsoft Learn.
* [Ética e Ciência de Dados](https://resources.oreilly.com/examples/0636920203964) - EBook da O'Reilly (M. Loukides, H. Mason et. al)
* [Ética na Ciência de Dados](https://www.coursera.org/learn/data-science-ethics#syllabus) - curso online da Universidade de Michigan.
* [Ética Desvendada](https://ethicsunwrapped.utexas.edu/case-studies) - estudos de caso da Universidade do Texas.
# Tarefa
# Tarefa
[Escreva um Estudo de Caso sobre Ética em Dados](assignment.md)
[Escreva um Estudo de Caso sobre Ética em Dados](assignment.md)
---

@ -1,8 +1,8 @@
<!--
CO_OP_TRANSLATOR_METADATA:
{
"original_hash": "8796f41f566a0a8ebb72863a83d558ed",
"translation_date": "2025-08-26T15:06:03+00:00",
"original_hash": "3a34157cc63516eba97c89a0b2f8c3e6",
"translation_date": "2025-09-03T21:45:16+00:00",
"source_file": "1-Introduction/02-ethics/README.md",
"language_code": "cs"
}
@ -15,17 +15,20 @@ CO_OP_TRANSLATOR_METADATA:
---
Všichni jsme datoví občané žijící v datovém světě.
Jsme všichni datoví občané žijící v datovém světě.
Tržní trendy naznačují, že do roku 2022 bude 1 z 3 velkých organizací nakupovat a prodávat svá data prostřednictvím online [tržišť a burz](https://www.gartner.com/smarterwithgartner/gartner-top-10-trends-in-data-and-analytics-for-2020/). Jako **vývojáři aplikací** zjistíme, že je snazší a levnější integrovat poznatky založené na datech a automatizaci řízenou algoritmy do každodenních uživatelských zkušeností. Ale jak se AI stává všudypřítomnou, budeme také muset pochopit potenciální škody způsobené [zneužitím](https://www.youtube.com/watch?v=TQHs8SA1qpk) těchto algoritmů ve velkém měřítku.
Trendy také ukazují, že do roku 2025 vytvoříme a spotřebujeme více než [180 zettabajtů](https://www.statista.com/statistics/871513/worldwide-data-created/) dat. Jako **datoví vědci** získáme bezprecedentní přístup k osobním údajům. To znamená, že můžeme vytvářet behaviorální profily uživatelů a ovlivňovat rozhodování způsoby, které vytvářejí [iluzi svobodné volby](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice), přičemž potenciálně směřujeme uživatele k výsledkům, které preferujeme. To také vyvolává širší otázky týkající se ochrany soukromí a práv uživatelů.
Trendy také naznačují, že do roku 2025 vytvoříme a spotřebujeme přes [180 zettabajtů](https://www.statista.com/statistics/871513/worldwide-data-created/) dat. Jako **datoví vědci** získáme bezprecedentní přístup k osobním údajům. To znamená, že můžeme vytvářet behaviorální profily uživatelů a ovlivňovat rozhodování způsoby, které vytvářejí [iluzi svobodné volby](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice), zatímco potenciálně směřujeme uživatele k výsledkům, které preferujeme. To také vyvolává širší otázky týkající se ochrany soukromí a práv uživatelů.
Datová etika je nyní _nezbytným ochranným opatřením_ pro datovou vědu a inženýrství, které nám pomáhá minimalizovat potenciální škody a neúmyslné důsledky našich akcí založených na datech. [Gartnerův Hype Cycle pro AI](https://www.gartner.com/smarterwithgartner/2-megatrends-dominate-the-gartner-hype-cycle-for-artificial-intelligence-2020/) identifikuje relevantní trendy v oblasti digitální etiky, odpovědné AI a správy AI jako klíčové faktory pro větší megatrendy kolem _demokratizace_ a _industrializace_ AI.
Datová etika je nyní _nezbytným ochranným opatřením_ pro datovou vědu a inženýrství, které nám pomáhá minimalizovat potenciální škody a nechtěné důsledky našich akcí založených na datech. [Gartnerův Hype Cycle pro AI](https://www.gartner.com/smarterwithgartner/2-megatrends-dominate-the-gartner-hype-cycle-for-artificial-intelligence-2020/) identifikuje relevantní trendy v digitální etice, odpovědné AI a správě AI jako klíčové faktory pro větší megatrendy kolem _demokratizace_ a _industrializace_ AI.
![Gartnerův Hype Cycle pro AI - 2020](https://images-cdn.newscred.com/Zz1mOWJhNzlkNDA2ZTMxMWViYjRiOGFiM2IyMjQ1YmMwZQ==)
V této lekci prozkoumáme fascinující oblast datové etiky - od základních konceptů a výzev po případové studie a aplikované koncepty AI, jako je správa, které pomáhají vytvářet etickou kulturu v týmech a organizacích pracujících s daty a AI.
V této lekci prozkoumáme fascinující oblast datové etiky - od základních konceptů a výzev, přes případové studie až po aplikované koncepty AI, jako je správa - které pomáhají vytvořit kulturu etiky v týmech a organizacích pracujících s daty a AI.
## [Kvíz před přednáškou](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/2) 🎯
@ -33,113 +36,115 @@ V této lekci prozkoumáme fascinující oblast datové etiky - od základních
Začněme pochopením základní terminologie.
Slovo "etika" pochází z [řeckého slova "ethikos"](https://en.wikipedia.org/wiki/Ethics) (a jeho kořene "ethos"), což znamená _charakter nebo morální povaha_.
Slovo "etika" pochází z [řeckého slova "ethikos"](https://en.wikipedia.org/wiki/Ethics) (a jeho kořene "ethos"), což znamená _charakter nebo morální povaha_.
**Etika** se týká sdílených hodnot a morálních principů, které řídí naše chování ve společnosti. Etika není založena na zákonech, ale na široce přijímaných normách toho, co je "správné vs. špatné". Etické úvahy však mohou ovlivnit iniciativy firemního řízení a vládní regulace, které vytvářejí více pobídek k dodržování pravidel.
**Etika** se týká sdílených hodnot a morálních principů, které řídí naše chování ve společnosti. Etika není založena na zákonech, ale na široce přijímaných normách toho, co je "správné vs. špatné". Etické úvahy však mohou ovlivnit iniciativy v oblasti správy společností a vládní regulace, které vytvářejí větší pobídky k dodržování pravidel.
**Datová etika** je [nová odnož etiky](https://royalsocietypublishing.org/doi/full/10.1098/rsta.2016.0360#sec-1), která "studuje a hodnotí morální problémy související s _daty, algoritmy a odpovídajícími praktikami_". Zde se **"data"** zaměřují na akce související s generováním, zaznamenáváním, kurátorstvím, zpracováním, šířením, sdílením a používáním, **"algoritmy"** se zaměřují na AI, agenty, strojové učení a roboty, a **"praktiky"** se zaměřují na témata jako odpovědné inovace, programování, hacking a etické kodexy.
**Datová etika** je [nová větev etiky](https://royalsocietypublishing.org/doi/full/10.1098/rsta.2016.0360#sec-1), která "studuje a hodnotí morální problémy související s _daty, algoritmy a odpovídajícími praktikami_". Zde se **"data"** zaměřují na akce související s generováním, zaznamenáváním, kurátorstvím, zpracováním, šířením, sdílením a používáním, **"algoritmy"** se zaměřují na AI, agenty, strojové učení a roboty a **"praktiky"** se zaměřují na témata jako odpovědné inovace, programování, hacking a etické kodexy.
**Aplikovaná etika** je [praktická aplikace morálních úvah](https://en.wikipedia.org/wiki/Applied_ethics). Je to proces aktivního zkoumání etických otázek v kontextu _reálných akcí, produktů a procesů_ a přijímání nápravných opatření, aby tyto zůstaly v souladu s našimi definovanými etickými hodnotami.
**Aplikovaná etika** je [praktická aplikace morálních úvah](https://en.wikipedia.org/wiki/Applied_ethics). Jde o proces aktivního zkoumání etických otázek v kontextu _reálných akcí, produktů a procesů_ a přijímání nápravných opatření, aby tyto zůstaly v souladu s našimi definovanými etickými hodnotami.
**Kultura etiky** se týká [_operacionalizace_ aplikované etiky](https://hbr.org/2019/05/how-to-design-an-ethical-organization), aby bylo zajištěno, že naše etické principy a praktiky jsou přijímány konzistentním a škálovatelným způsobem napříč celou organizací. Úspěšné kultury etiky definují celopodnikové etické principy, poskytují smysluplné pobídky k dodržování pravidel a posilují etické normy tím, že podporují a zesilují žádoucí chování na každé úrovni organizace.
**Etická kultura** se týká [_operacionalizace_ aplikované etiky](https://hbr.org/2019/05/how-to-design-an-ethical-organization), aby bylo zajištěno, že naše etické principy a praktiky jsou přijímány konzistentním a škálovatelným způsobem napříč celou organizací. Úspěšné etické kultury definují etické principy na úrovni celé organizace, poskytují smysluplné pobídky k dodržování pravidel a posilují etické normy tím, že podporují a zesilují žádoucí chování na každé úrovni organizace.
## Koncepty etiky
V této sekci se budeme zabývat koncepty jako **sdílené hodnoty** (principy) a **etické výzvy** (problémy) v oblasti datové etiky - a prozkoumáme **případové studie**, které vám pomohou pochopit tyto koncepty v reálných kontextech.
V této sekci budeme diskutovat koncepty jako **sdílené hodnoty** (principy) a **etické výzvy** (problémy) pro datovou etiku - a prozkoumáme **případové studie**, které vám pomohou pochopit tyto koncepty v reálných kontextech.
### 1. Etické principy
### 1. Principy etiky
Každá strategie datové etiky začíná definováním _etických principů_ - "sdílených hodnot", které popisují přijatelné chování a řídí souladné akce v našich datových a AI projektech. Tyto principy můžete definovat na individuální nebo týmové úrovni. Nicméně většina velkých organizací je stanovuje v rámci mise nebo rámce _etické AI_, který je definován na korporátní úrovni a důsledně prosazován napříč všemi týmy.
Každá strategie datové etiky začíná definováním _etických principů_ - "sdílených hodnot", které popisují přijatelné chování a řídí dodržování pravidel v našich projektech týkajících se dat a AI. Tyto principy můžete definovat na individuální nebo týmové úrovni. Nicméně většina velkých organizací je uvádí v _etickém AI_ prohlášení nebo rámci, který je definován na korporátní úrovni a důsledně prosazován napříč všemi týmy.
**Příklad:** Prohlášení o misi [Responsible AI](https://www.microsoft.com/en-us/ai/responsible-ai) společnosti Microsoft zní: _"Jsme odhodláni k rozvoji AI řízené etickými principy, které staví lidi na první místo"_ - identifikující 6 etických principů v níže uvedeném rámci:
**Příklad:** Prohlášení Microsoftu o [odpovědné AI](https://www.microsoft.com/en-us/ai/responsible-ai) zní: _"Jsme odhodláni k rozvoji AI řízené etickými principy, které staví lidi na první místo"_ - identifikující 6 etických principů v níže uvedeném rámci:
![Responsible AI u Microsoftu](https://docs.microsoft.com/en-gb/azure/cognitive-services/personalizer/media/ethics-and-responsible-use/ai-values-future-computed.png)
![Odpovědná AI v Microsoftu](https://docs.microsoft.com/en-gb/azure/cognitive-services/personalizer/media/ethics-and-responsible-use/ai-values-future-computed.png)
Pojďme si tyto principy stručně prozkoumat. _Transparentnost_ a _odpovědnost_ jsou základní hodnoty, na kterých jsou postaveny ostatní principy - začněme tedy u nich:
Pojďme si stručně prozkoumat tyto principy. _Transparentnost_ a _odpovědnost_ jsou základní hodnoty, na kterých jsou postaveny ostatní principy - začněme tedy zde:
* [**Odpovědnost**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) činí praktiky _zodpovědnými_ za jejich datové a AI operace a za dodržování těchto etických principů.
* [**Transparentnost**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) zajišťuje, že akce založené na datech a AI jsou _srozumitelné_ (interpretovatelné) pro uživatele, vysvětlující co a proč za rozhodnutími stojí.
* [**Spravedlnost**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1%3aprimaryr6) se zaměřuje na zajištění, že AI zachází _se všemi lidmi_ spravedlivě, řešící jakékoli systémové nebo implicitní socio-technické předsudky v datech a systémech.
* [**Spolehlivost a bezpečnost**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) zajišťuje, že AI se chová _konzistentně_ s definovanými hodnotami, minimalizující potenciální škody nebo neúmyslné důsledky.
* [**Soukromí a bezpečnost**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) se týká pochopení původu dat a poskytování _ochrany soukromí a souvisejících práv_ uživatelům.
* [**Inkluzivita**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) je o navrhování AI řešení s úmyslem, přizpůsobujících se tak, aby splňovala _širokou škálu lidských potřeb_ a schopností.
* [**Odpovědnost**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) činí praktiky _odpovědnými_ za jejich operace s daty a AI a za dodržování těchto etických principů.
* [**Transparentnost**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) zajišťuje, že akce týkající se dat a AI jsou _srozumitelné_ uživatelům, vysvětlující co a proč za rozhodnutími.
* [**Spravedlnost**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1%3aprimaryr6) - zaměřuje se na zajištění, že AI zachází _se všemi lidmi_ spravedlivě, řešící jakékoli systémové nebo implicitní socio-technické předsudky v datech a systémech.
* [**Spolehlivost a bezpečnost**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - zajišťuje, že AI se chová _konzistentně_ s definovanými hodnotami, minimalizuje potenciální škody nebo nechtěné důsledky.
* [**Soukromí a bezpečnost**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - se týká pochopení původu dat a poskytování _ochrany soukromí a souvisejících práv_ uživatelům.
* [**Inkluzivita**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - se týká navrhování AI řešení s úmyslem, přizpůsobení je tak, aby splňovala _širokou škálu lidských potřeb_ a schopností.
> 🚨 Zamyslete se nad tím, jak by mohlo vypadat vaše prohlášení o misi datové etiky. Prozkoumejte rámce etické AI od jiných organizací - zde jsou příklady od [IBM](https://www.ibm.com/cloud/learn/ai-ethics), [Google](https://ai.google/principles) a [Facebook](https://ai.facebook.com/blog/facebooks-five-pillars-of-responsible-ai/). Jaké sdílené hodnoty mají společné? Jak tyto principy souvisejí s AI produkty nebo průmyslem, ve kterém působí?
> 🚨 Zamyslete se nad tím, jaké by mohlo být vaše prohlášení o datové etice. Prozkoumejte etické AI rámce jiných organizací - zde jsou příklady od [IBM](https://www.ibm.com/cloud/learn/ai-ethics), [Google](https://ai.google/principles) a [Facebook](https://ai.facebook.com/blog/facebooks-five-pillars-of-responsible-ai/). Jaké sdílené hodnoty mají společné? Jak se tyto principy vztahují k AI produktům nebo odvětvím, ve kterých působí?
### 2. Etické výzvy
### 2. Výzvy etiky
Jakmile máme definované etické principy, dalším krokem je vyhodnotit naše datové a AI akce, zda jsou v souladu s těmito sdílenými hodnotami. Zamyslete se nad svými akcemi ve dvou kategoriích: _sběr dat_ a _návrh algoritmů_.
Jakmile máme definované etické principy, dalším krokem je vyhodnotit naše akce týkající se dat a AI, zda jsou v souladu s těmito sdílenými hodnotami. Zamyslete se nad svými akcemi ve dvou kategoriích: _sběr dat_ a _návrh algoritmů_.
Při sběru dat budou akce pravděpodobně zahrnovat **osobní údaje** nebo osobně identifikovatelné informace (PII) pro identifikovatelné živé jednotlivce. To zahrnuje [různé položky neosobních dat](https://ec.europa.eu/info/law/law-topic/data-protection/reform/what-personal-data_en), které _společně_ identifikují jednotlivce. Etické výzvy se mohou týkat _ochrany soukromí_, _vlastnictví dat_ a souvisejících témat, jako je _informovaný souhlas_ a _práva duševního vlastnictví_ uživatelů.
Při návrhu algoritmů budou akce zahrnovat sběr a kurátorství **datových sad**, poté jejich použití k trénování a nasazení **datových modelů**, které předpovídají výsledky nebo automatizují rozhodování v reálných kontextech. Etické výzvy mohou vzniknout z _předsudků v datových sadách_, problémů s _kvalitou dat_, _nespravedlnosti_ a _zkreslení_ v algoritmech - včetně některých problémů, které jsou systémové povahy.
Při návrhu algoritmů budou akce zahrnovat sběr a kurátorství **datových sad**, poté jejich použití k trénování a nasazení **datových modelů**, které předpovídají výsledky nebo automatizují rozhodování v reálných kontextech. Etické výzvy mohou vzniknout z _předsudků v datových sadách_, _problémů s kvalitou dat_, _nespravedlnosti_ a _zkreslení_ v algoritmech - včetně některých problémů, které jsou systémové povahy.
V obou případech etické výzvy zdůrazňují oblasti, kde naše akce mohou narazit na konflikt s našimi sdílenými hodnotami. Abychom tyto obavy odhalili, zmírnili, minimalizovali nebo odstranili, musíme si klást morální otázky typu "ano/ne" týkající se našich akcí a poté přijmout nápravná opatření podle potřeby. Podívejme se na některé etické výzvy a morální otázky, které vyvolávají:
V obou případech etické výzvy zdůrazňují oblasti, kde naše akce mohou narazit na konflikt s našimi sdílenými hodnotami. Abychom tyto obavy odhalili, zmírnili, minimalizovali nebo odstranili, musíme si klást morální otázky typu "ano/ne" týkající se našich akcí a podle potřeby přijmout nápravná opatření. Podívejme se na některé etické výzvy a morální otázky, které vyvolávají:
#### 2.1 Vlastnictví dat
Sběr dat často zahrnuje osobní údaje, které mohou identifikovat subjekty dat. [Vlastnictví dat](https://permission.io/blog/data-ownership) se týká _kontroly_ a [_práv uživatelů_](https://permission.io/blog/data-ownership) souvisejících s vytvářením, zpracováním a šířením dat.
Sběr dat často zahrnuje osobní údaje, které mohou identifikovat subjekty dat. [Vlastnictví dat](https://permission.io/blog/data-ownership) se týká _kontroly_ a [_práv uživatelů_](https://permission.io/blog/data-ownership) souvisejících s vytvářením, zpracováním a šířením dat.
Morální otázky, které je třeba si položit:
Morální otázky, které je třeba si položit, jsou:
* Kdo vlastní data? (uživatel nebo organizace)
* Jaká práva mají subjekty dat? (např. přístup, výmaz, přenositelnost)
* Jaká práva mají subjekty dat? (např. přístup, vymazání, přenositelnost)
* Jaká práva mají organizace? (např. oprava škodlivých uživatelských recenzí)
#### 2.2 Informovaný souhlas
[Informovaný souhlas](https://legaldictionary.net/informed-consent/) definuje akt, kdy uživatelé souhlasí s akcí (např. sběr dat) s _plným pochopením_ relevantních faktů, včetně účelu, potenciálních rizik a alternativ.
[Informovaný souhlas](https://legaldictionary.net/informed-consent/) definuje akt, kdy uživatelé souhlasí s akcí (např. sběrem dat) s _plným pochopením_ relevantních faktů, včetně účelu, potenciálních rizik a alternativ.
Otázky k prozkoumání:
Otázky k prozkoumání zde jsou:
* Dal uživatel (subjekt dat) povolení ke sběru a použití dat?
* Rozuměl uživatel účelu, pro který byla data sbírána?
* Rozuměl uživatel potenciálním rizikům spojeným s jeho účastí?
* Rozuměl uživatel potenciálním rizikům z účasti?
#### 2.3 Duševní vlastnictví
[Duševní vlastnictví](https://en.wikipedia.org/wiki/Intellectual_property) se týká nehmotných výtvorů vzniklých z lidské iniciativy, které mohou mít _ekonomickou hodnotu_ pro jednotlivce nebo podniky.
[Duševní vlastnictví](https://en.wikipedia.org/wiki/Intellectual_property) se týká nehmotných výtvorů vzniklých z lidské iniciativy, které mohou mít _ekonomickou hodnotu_ pro jednotlivce nebo firmy.
Otázky k prozkoumání:
* Měla shromážděná data ekonomickou hodnotu pro uživatele nebo podnik?
Otázky k prozkoumání zde jsou:
* Měla shromážděná data ekonomickou hodnotu pro uživatele nebo firmu?
* Má zde **uživatel** duševní vlastnictví?
* Má zde **organizace** duševní vlastnictví?
* Pokud tato práva existují, jak je chráníme?
#### 2.4 Ochrana soukromí
#### 2.4 Ochrana soukromí dat
[Ochrana soukromí](https://www.northeastern.edu/graduate/blog/what-is-data-privacy/) nebo informační soukromí se týká zachování soukromí uživatelů a ochrany jejich identity ve vztahu k osobně identifikovatelným informacím.
[Ochrana soukromí dat](https://www.northeastern.edu/graduate/blog/what-is-data-privacy/) nebo informační soukromí se týká zachování soukromí uživatelů a ochrany identity uživatelů ve vztahu k osobně identifikovatelným informacím.
Otázky k prozkoumání:
Otázky k prozkoumání zde jsou:
* Jsou data uživatelů (osobní) zabezpečena proti hackům a únikům?
* Jsou data uživatelů přístupná pouze oprávněným uživatelům a kontextům?
* Jsou data uživatelů přístupná pouze autorizovaným uživatelům a kontextům?
* Je anonymita uživatelů zachována při sdílení nebo šíření dat?
* Lze uživatele de-identifikovat z anonymizovaných datových sad?
#### 2.5 Právo být zapomenut
[Právo být zapomenut](https://en.wikipedia.org/wiki/Right_to_be_forgotten) nebo [právo na výmaz](https://www.gdpreu.org/right-to-be-forgotten/) poskytuje uživatelům dodatečnou ochranu osobních údajů. Konkrétně dává uživatelům právo požadovat smazání nebo odstranění osobních údajů z internetových vyhledávání a dalších míst, _za určitých okolností_ - což jim umožňuje nový začátek online bez toho, aby byly jejich minulé činy proti nim použity.
[Právo být zapomenut](https://en.wikipedia.org/wiki/Right_to_be_forgotten) nebo [právo na vymazání](https://www.gdpreu.org/right-to-be-forgotten/) poskytuje uživatelům dodatečnou ochranu osobních údajů. Konkrétně dává uživatelům právo požadovat smazání nebo odstranění osobních údajů z internetových vyhledávání a jiných míst, _za specifických okolností_ - umožňující jim nový začátek online bez toho, aby byly jejich minulé akce proti nim použity.
Otázky k prozkoumání zde jsou:
* Umožňuje systém subjektům dat požádat o vymazání?
* Měl by odvolání souhlasu uživatele automaticky spustit vymazání?
* Byla data sbírána bez souhlasu nebo nezákonnými prostředky?
* Jsme v souladu s vládními regulacemi pro ochranu soukromí dat?
Otázky k prozkoumání:
* Umožňuje systém subjektům dat požadovat výmaz?
* Měl by odvolání souhlasu uživatele automaticky spustit výmaz?
* Byla data shromážděna bez souhlasu nebo nezákonnými prostředky?
* Jsme v souladu s vládními předpisy pro ochranu dat?
#### 2.6 Předsudky v datových sadách
Předsudky v datových sadách nebo [předsudky při sběru dat](http://researcharticles.com/index.php/bias-in-data-collection-in-research/) se týkají výběru _nereprezentativního_ podmnožiny dat pro vývoj algoritmů, což může vést k nespravedlivým výsledkům pro různé skupiny. Typy předsudků zahrnují výběrové nebo vzorkovací předsudky, předsudky dobrovolníků a předsudky nástrojů.
Předsudky v datových sadách nebo [předsudky při sběru](http://researcharticles.com/index.php/bias-in-data-collection-in-research/) se týkají výběru _nereprezentativního_ podmnožiny dat pro vývoj algoritmů, což může vytvářet potenciální nespravedlnost ve výsledcích pro různé skupiny. Typy předsudků zahrnují výběrové nebo vzorkovací předsudky, dobrovolnické předsudky a předsudky nástrojů.
Otázky k prozkoumání:
* Najali jsme reprezentativní soubor subjektů dat?
Otázky k prozkoumání zde jsou:
* Rekrutovali jsme reprezentativní sadu subjektů dat?
* Testovali jsme naši shromážděnou nebo kurátorovanou datovou sadu na různé předsudky?
* Můžeme zmírnit nebo odstranit jakékoli zjištěné předsudky?
* Můžeme zmírnit nebo odstranit jakékoli objevené předsudky?
#### 2.7 Kvalita dat
[Kvalita dat](https://lakefs.io/data-quality-testing/) se zaměřuje na platnost kurátorované datové sady použité k vývoji našich algoritmů, kontroluje, zda funkce a záznamy splňují požadavky na úroveň přesnosti a konzistence potřebné pro náš AI účel.
[Kvalita dat](https://lakefs.io/data-quality-testing/) se zaměřuje na platnost kurátorované datové sady použité k vývoji našich algoritmů, kontroluje, zda funkce a záznamy splňují požadavky na úroveň přesnosti a konzistence potřebnou pro náš AI účel.
Otázky k prozkoumání:
* Zachytili jsme platné _funkce_ pro náš případ použití?
* Byla data zachycena _kon
Otázky k prozk
[Algorithmická spravedlnost](https://towardsdatascience.com/what-is-algorithm-fairness-3182e161cf9f) zkoumá, zda návrh algoritmu systematicky nediskriminuje specifické podskupiny subjektů dat, což může vést k [potenciálním škodám](https://docs.microsoft.com/en-us/azure/machine-learning/concept-fairness-ml) v _alokaci_ (kdy jsou zdroje odepřeny nebo zadrženy této skupině) a _kvalitě služeb_ (kdy AI není tak přesná pro některé podskupiny jako pro jiné).
Otázky k zamyšlení:
@ -160,7 +165,7 @@ Otázky k zamyšlení:
* Existují alternativní vysvětlení, která mohou nabídnout jiný závěr?
#### 2.10 Svobodná volba
[Iluze svobodné volby](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice) nastává, když "architektury volby" systému používají algoritmy rozhodování k ovlivnění lidí, aby přijali preferovaný výsledek, zatímco jim zdánlivě dávají možnosti a kontrolu. Tyto [temné vzory](https://www.darkpatterns.org/) mohou způsobit sociální a ekonomické škody uživatelům. Protože rozhodnutí uživatelů ovlivňují profily chování, tyto akce mohou potenciálně řídit budoucí volby, které mohou zesílit nebo rozšířit dopad těchto škod.
[Iluze svobodné volby](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice) nastává, když "architektury volby" systému používají algoritmy rozhodování k ovlivnění lidí, aby přijali preferovaný výsledek, zatímco se zdá, že jim dávají možnosti a kontrolu. Tyto [temné vzory](https://www.darkpatterns.org/) mohou způsobit sociální a ekonomické škody uživatelům. Protože rozhodnutí uživatelů ovlivňují profily chování, tyto akce mohou potenciálně řídit budoucí volby, které mohou zesílit nebo rozšířit dopad těchto škod.
Otázky k zamyšlení:
* Rozuměl uživatel důsledkům svého rozhodnutí?
@ -175,12 +180,12 @@ Zde je několik příkladů:
| Etická výzva | Případová studie |
|--- |--- |
| **Informovaný souhlas** | 1972 - [Studie syfilis v Tuskegee](https://en.wikipedia.org/wiki/Tuskegee_Syphilis_Study) - Afroameričtí muži, kteří se studie zúčastnili, byli slibováni bezplatnou lékařskou péči, _ale byli podvedeni_ výzkumníky, kteří jim neřekli o jejich diagnóze ani o dostupnosti léčby. Mnoho subjektů zemřelo a jejich partneři nebo děti byli ovlivněni; studie trvala 40 let. |
| **Ochrana dat** | 2007 - [Netflix data prize](https://www.wired.com/2007/12/why-anonymous-data-sometimes-isnt/) poskytla výzkumníkům _10M anonymizovaných hodnocení filmů od 50K zákazníků_, aby pomohla zlepšit doporučovací algoritmy. Výzkumníci však byli schopni propojit anonymizovaná data s osobně identifikovatelnými daty v _externích datových sadách_ (např. komentáře na IMDb) - efektivně "de-anonymizovali" některé předplatitele Netflixu.|
| **Sběr dat s předsudky** | 2013 - Město Boston [vyvinulo Street Bump](https://www.boston.gov/transportation/street-bump), aplikaci, která umožnila občanům hlásit výmoly, čímž město získalo lepší údaje o silnicích pro identifikaci a opravu problémů. Nicméně [lidé z nižších příjmových skupin měli menší přístup k autům a telefonům](https://hbr.org/2013/04/the-hidden-biases-in-big-data), což činilo jejich problémy na silnicích neviditelnými v této aplikaci. Vývojáři spolupracovali s akademiky na _problémech spravedlivého přístupu a digitálních rozdílů_. |
| **Algoritmická spravedlnost** | 2018 - MIT [Gender Shades Study](http://gendershades.org/overview.html) hodnotila přesnost AI produktů pro klasifikaci pohlaví, odhalila mezery v přesnosti pro ženy a osoby jiné barvy pleti. [Apple Card z roku 2019](https://www.wired.com/story/the-apple-card-didnt-see-genderand-thats-the-problem/) se zdála nabízet méně úvěru ženám než mužům. Oba případy ilustrují problémy algoritmické zaujatosti vedoucí k socio-ekonomickým škodám.|
| **Informovaný souhlas** | 1972 - [Studie syfilis v Tuskegee](https://en.wikipedia.org/wiki/Tuskegee_Syphilis_Study) - Afroameričtí muži, kteří se studie zúčastnili, byli slibováni bezplatnou lékařskou péči, _ale byli podvedeni_ výzkumníky, kteří jim neřekli o jejich diagnóze nebo dostupnosti léčby. Mnoho subjektů zemřelo a jejich partneři či děti byli ovlivněni; studie trvala 40 let. |
| **Ochrana dat** | 2007 - [Netflix data prize](https://www.wired.com/2007/12/why-anonymous-data-sometimes-isnt/) poskytla výzkumníkům _10M anonymizovaných hodnocení filmů od 50K zákazníků_, aby pomohla zlepšit doporučovací algoritmy. Výzkumníci však byli schopni propojit anonymizovaná data s osobně identifikovatelnými daty v _externích datových sadách_ (např. komentáře na IMDb) - efektivně "de-anonymizovali" některé předplatitele Netflixu.|
| **Sběr dat s předsudky** | 2013 - Město Boston [vyvinulo Street Bump](https://www.boston.gov/transportation/street-bump), aplikaci, která umožnila občanům hlásit výmoly, čímž město získalo lepší údaje o silnicích pro řešení problémů. Nicméně [lidé z nižších příjmových skupin měli menší přístup k autům a telefonům](https://hbr.org/2013/04/the-hidden-biases-in-big-data), což činilo jejich problémy na silnicích neviditelnými v této aplikaci. Vývojáři spolupracovali s akademiky na _problémech rovného přístupu a digitálních rozdílů_ pro spravedlnost. |
| **Algoritmická spravedlnost** | 2018 - MIT [Gender Shades Study](http://gendershades.org/overview.html) hodnotila přesnost AI produktů pro klasifikaci pohlaví, odhalila mezery v přesnosti pro ženy a osoby jiné barvy pleti. [Apple Card z roku 2019](https://www.wired.com/story/the-apple-card-didnt-see-genderand-thats-the-problem/) se zdála nabízet méně úvěru ženám než mužům. Oba případy ilustrují problémy algoritmické zaujatosti vedoucí k socio-ekonomickým škodám.|
| **Zkreslení dat** | 2020 - [Ministerstvo zdravotnictví státu Georgia zveřejnilo grafy COVID-19](https://www.vox.com/covid-19-coronavirus-us-response-trump/2020/5/18/21262265/georgia-covid-19-cases-declining-reopening), které se zdály zavádět občany ohledně trendů potvrzených případů s nechronologickým uspořádáním na ose x. To ilustruje zkreslení prostřednictvím vizualizačních triků. |
| **Iluze svobodné volby** | 2020 - Vzdělávací aplikace [ABCmouse zaplatila 10M USD za urovnání stížnosti FTC](https://www.washingtonpost.com/business/2020/09/04/abcmouse-10-million-ftc-settlement/), kde rodiče byli uvězněni v placení za předplatné, které nemohli zrušit. To ilustruje temné vzory v architekturách volby, kde byli uživatelé ovlivněni k potenciálně škodlivým rozhodnutím. |
| **Iluze svobodné volby** | 2020 - Vzdělávací aplikace [ABCmouse zaplatila 10M USD za urovnání stížnosti FTC](https://www.washingtonpost.com/business/2020/09/04/abcmouse-10-million-ftc-settlement/), kde rodiče byli uvězněni v platbách za předplatné, které nemohli zrušit. To ilustruje temné vzory v architekturách volby, kde byli uživatelé ovlivněni k potenciálně škodlivým rozhodnutím. |
| **Ochrana dat a práva uživatelů** | 2021 - Facebook [Únik dat](https://www.npr.org/2021/04/09/986005820/after-data-breach-exposes-530-million-facebook-says-it-will-not-notify-users) odhalil data 530M uživatelů, což vedlo k urovnání ve výši 5B USD s FTC. Nicméně odmítl informovat uživatele o úniku, čímž porušil práva uživatelů na transparentnost a přístup k datům. |
Chcete prozkoumat více případových studií? Podívejte se na tyto zdroje:
@ -192,11 +197,11 @@ Chcete prozkoumat více případových studií? Podívejte se na tyto zdroje:
## Aplikovaná etika
Diskutovali jsme o etických konceptech, výzvách a případových studiích v kontextu reálného světa. Ale jak začít _aplikovat_ etické principy a praktiky ve svých projektech? A jak _zavést_ tyto praktiky pro lepší řízení? Pojďme prozkoumat některá řešení z praxe:
Diskutovali jsme o etických konceptech, výzvách a případových studiích v kontextu reálného světa. Ale jak začít _aplikovat_ etické principy a praktiky ve svých projektech? A jak _zavést_ tyto praktiky pro lepší řízení? Pojďme prozkoumat některá řešení z reálného světa:
### 1. Profesní kodexy
Profesní kodexy nabízejí jednu možnost, jak organizace mohou "motivovat" členy k podpoře jejich etických principů a poslání. Kodexy jsou _morálními pokyny_ pro profesionální chování, které pomáhají zaměstnancům nebo členům činit rozhodnutí v souladu s principy jejich organizace. Jsou však účinné pouze tehdy, pokud členové dobrovolně dodržují; mnoho organizací však nabízí další odměny a sankce, aby motivovaly členy k dodržování.
Profesní kodexy nabízejí jednu možnost, jak organizace mohou "motivovat" členy k podpoře svých etických principů a poslání. Kodexy jsou _morálními pokyny_ pro profesní chování, které pomáhají zaměstnancům nebo členům činit rozhodnutí v souladu s principy jejich organizace. Jsou účinné pouze tehdy, pokud členové dobrovolně dodržují; mnoho organizací však nabízí další odměny a sankce, aby motivovaly členy k dodržování.
Příklady zahrnují:
@ -206,58 +211,58 @@ Příklady zahrnují:
> 🚨 Jste členem profesní organizace pro inženýry nebo datové vědce? Prozkoumejte jejich web, zda definují profesní kodex etiky. Co říká o jejich etických principech? Jak motivují členy k dodržování kodexu?
### 2. Etické kontrolní seznamy
### 2. Kontrolní seznamy etiky
Zatímco profesní kodexy definují požadované _etické chování_ od praktikujících, mají [známé limity](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md) v prosazování, zejména u rozsáhlých projektů. Místo toho mnoho odborníků na datovou vědu [doporučuje kontrolní seznamy](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md), které mohou **propojit principy s praxí** deterministickým a akceschopným způsobem.
Zatímco profesní kodexy definují požadované _etické chování_ od praktikujících, mají [známá omezení](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md) v prosazování, zejména u rozsáhlých projektů. Místo toho mnoho odborníků na datovou vědu [doporučuje kontrolní seznamy](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md), které mohou **propojit principy s praxí** deterministickým a akčním způsobem.
Kontrolní seznamy převádějí otázky na úkoly "ano/ne", které lze zavést do standardních pracovních postupů při vydávání produktů.
Kontrolní seznamy převádějí otázky na úkoly "ano/ne", které lze operacionalizovat, což umožňuje jejich sledování jako součást standardních pracovních postupů při vydávání produktů.
Příklady zahrnují:
* [Deon](https://deon.drivendata.org/) - obecný kontrolní seznam etiky dat vytvořený na základě [doporučení z průmyslu](https://deon.drivendata.org/#checklist-citations) s nástrojem příkazového řádku pro snadnou integraci.
* [Kontrolní seznam auditu ochrany soukromí](https://cyber.harvard.edu/ecommerce/privacyaudit.html) - poskytuje obecné pokyny pro nakládání s informacemi z právního a sociálního hlediska.
* [Kontrolní seznam spravedlnosti AI](https://www.microsoft.com/en-us/research/project/ai-fairness-checklist/) - vytvořený odborníky na AI na podporu zavádění a integrace kontrol spravedlnosti do vývojových cyklů AI.
* [22 otázek pro etiku v datech a AI](https://medium.com/the-organization/22-questions-for-ethics-in-data-and-ai-efb68fd19429) - otevřenější rámec, strukturovaný pro počáteční zkoumání etických problémů v návrhu, implementaci a organizačních kontextech.
* [Kontrolní seznam auditu ochrany soukromí](https://cyber.harvard.edu/ecommerce/privacyaudit.html) - poskytuje obecné pokyny pro postupy nakládání s informacemi z právního a sociálního hlediska.
* [Kontrolní seznam spravedlnosti AI](https://www.microsoft.com/en-us/research/project/ai-fairness-checklist/) - vytvořený odborníky na AI na podporu přijetí a integrace kontrol spravedlnosti do vývojových cyklů AI.
* [22 otázek pro etiku v datech a AI](https://medium.com/the-organization/22-questions-for-ethics-in-data-and-ai-efb68fd19429) - otevřenější rámec, strukturovaný pro počáteční zkoumání etických problémů v designu, implementaci a organizačních kontextech.
### 3. Etické regulace
### 3. Regulace etiky
Etika se týká definování sdílených hodnot a dobrovolného dělání správných věcí. **Soulad** se týká _dodržování zákona_, pokud je definován. **Řízení** obecně pokrývá všechny způsoby, jakými organizace fungují, aby prosazovaly etické principy a dodržovaly stanovené zákony.
Etika je o definování sdílených hodnot a dobrovolném dělání správných věcí. **Dodržování předpisů** je o _dodržování zákona_, pokud je definován. **Řízení** obecně pokrývá všechny způsoby, jakými organizace fungují, aby prosazovaly etické principy a dodržovaly stanovené zákony.
Dnes řízení probíhá ve dvou formách v rámci organizací. Za prvé, jde o definování **etických principů AI** a zavádění praktik pro jejich přijetí napříč všemi projekty souvisejícími s AI v organizaci. Za druhé, jde o dodržování všech vládou nařízených **regulací ochrany dat** pro regiony, ve kterých organizace působí.
Dnes řízení nabývá dvou forem v rámci organizací. Za prvé, jde o definování principů **etické AI** a zavedení praktik pro operacionalizaci přijetí napříč všemi projekty souvisejícími s AI v organizaci. Za druhé, jde o dodržování všech vládou nařízených **regulací ochrany dat** pro regiony, ve kterých organizace působí.
Příklady regulací ochrany dat a soukromí:
* `1974`, [US Privacy Act](https://www.justice.gov/opcl/privacy-act-1974) - reguluje _federální vládní_ sběr, použití a zveřejňování osobních informací.
* `1974`, [US Privacy Act](https://www.justice.gov/opcl/privacy-act-1974) - reguluje _federální vládu_ při sběru, používání a zveřejňování osobních informací.
* `1996`, [US Health Insurance Portability & Accountability Act (HIPAA)](https://www.cdc.gov/phlp/publications/topic/hipaa.html) - chrání osobní zdravotní údaje.
* `1998`, [US Children's Online Privacy Protection Act (COPPA)](https://www.ftc.gov/enforcement/rules/rulemaking-regulatory-reform-proceedings/childrens-online-privacy-protection-rule) - chrání soukromí dat dětí mladších 13 let.
* `2018`, [General Data Protection Regulation (GDPR)](https://gdpr-info.eu/) - poskytuje práva uživatelů, ochranu dat a soukromí.
* `2018`, [California Consumer Privacy Act (CCPA)](https://www.oag.ca.gov/privacy/ccpa) dává spotřebitelům více _práv_ nad jejich (osobními) daty.
* `2021`, Čína [Zákon o ochraně osobních údajů](https://www.reuters.com/world/china/china-passes-new-personal-data-privacy-law-take-effect-nov-1-2021-08-20/) právě schválila, čímž vytvořila jednu z nejsilnějších regulací online ochrany soukromí na světě.
* `2018`, [California Consumer Privacy Act (CCPA)](https://www.oag.ca.gov/privacy/ccpa) - dává spotřebitelům více _práv_ nad jejich (osobními) daty.
* `2021`, Čína [Zákon o ochraně osobních údajů](https://www.reuters.com/world/china/china-passes-new-personal-data-privacy-law-take-effect-nov-1-2021-08-20/) právě schválila, čímž vytvořila jednu z nejsilnějších regulací online ochrany dat na světě.
> 🚨 Evropská unie definovala GDPR (General Data Protection Regulation), který zůstává jednou z nejvlivnějších regulací ochrany dat dnes. Věděli jste, že také definuje [8 práv uživatelů](https://www.freeprivacypolicy.com/blog/8-user-rights-gdpr) na ochranu digitálního soukromí a osobních dat občanů? Zjistěte, co to jsou a proč jsou důležitá.
### 4. Etická kultura
Je třeba poznamenat, že stále existuje nehmotná mezera mezi _souladem_ (děláním dostatečného pro splnění "litery zákona") a řešením [systémových problémů](https://www.coursera.org/learn/data-science-ethics/home/week/4) (jako je zkostnatělost, informační asymetrie a distribuční nespravedlnost), které mohou urychlit zneužití AI.
Je třeba poznamenat, že stále existuje nehmotná mezera mezi _dodržováním předpisů_ (děláním dostatečného pro splnění "litery zákona") a řešením [systémových problémů](https://www.coursera.org/learn/data-science-ethics/home/week/4) (jako je zkostnatělost, informační asymetrie a distribuční nespravedlnost), které mohou urychlit zneužití AI.
To druhé vyžaduje [spolupráci na definování etických kultur](https://towardsdatascience.com/why-ai-ethics-requires-a-culture-driven-approach-26f451afa29f), které budují emocionální spojení a konzistentní sdílené hodnoty _napříč organizacemi_ v průmyslu. To volá po více [formalizovaných kulturách etiky dat](https://www.codeforamerica.org/news/formalizing-an-ethical-data-culture/) v organizacích - umožňující _komukoli_ [zatáhnout za Andon šňůru](https://en.wikipedia.org/wiki/Andon_(manufacturing)) (aby včas upozornil na etické problémy) a učinit _etické hodnocení_ (např. při náboru) klíčovým kritériem pro formování týmů v projektech AI.
To druhé vyžaduje [spolupráci na definování etických kultur](https://towardsdatascience.com/why-ai-ethics-requires-a-culture-driven-approach-26f451afa29f), které budují emocionální spojení a konzistentní sdílené hodnoty _napříč organizacemi_ v průmyslu. To volá po více [formalizovaných kulturách etiky dat](https://www.codeforamerica.org/news/formalizing-an-ethical-data-culture/) v organizacích - umožňující _komukoliv_ [zatáhnout za Andon šňůru](https://en.wikipedia.org/wiki/Andon_(manufacturing)) (aby včas upozornil na etické problémy) a učinit _etické hodnocení_ (např. při náboru) klíčovým kritériem pro formování týmů v projektech AI.
---
## [Kvíz po přednášce](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/3) 🎯
## Přehled & Samostudium
## [Kvíz po přednášce](https://ff-quizzes.netlify.app/en/ds/) 🎯
## Přehled a samostudium
Kurzy a knihy pomáhají pochopit základní etické koncepty a výzvy, zatímco případové studie a nástroje pomáhají s aplikovanými etickými praktikami v reálných kontextech. Zde je několik zdrojů, kde začít.
Kurzy a knihy pomáhají pochopit základní etické koncepty a výzvy, zatímco případové studie a nástroje pomáhají s aplikovanými etickými praktikami v reálném světě. Zde je několik zdrojů, se kterými můžete začít.
* [Strojové učení pro začátečníky](https://github.com/microsoft/ML-For-Beginners/blob/main/1-Introduction/3-fairness/README.md) - lekce o spravedlnosti od Microsoftu.
* [Principy odpovědné AI](https://docs.microsoft.com/en-us/learn/modules/responsible-ai-principles/) - bezplatná vzdělávací cesta od Microsoft Learn.
* [Etika a datová věda](https://resources.oreilly.com/examples/0636920203964) - EBook od O'Reilly (M. Loukides, H. Mason a kol.)
* [Etika datové vědy](https://www.coursera.org/learn/data-science-ethics#syllabus) - online kurz od University of Michigan.
* [Etika v praxi](https://ethicsunwrapped.utexas.edu/case-studies) - případové studie od University of Texas.
* [Ethics Unwrapped](https://ethicsunwrapped.utexas.edu/case-studies) - případové studie od University of Texas.
# Zadání
# Úkol
[Vypracujte případovou studii o etice dat](assignment.md)
[Sepsání případové studie o etice dat](assignment.md)
---
**Prohlášení**:
Tento dokument byl přeložen pomocí služby pro automatický překlad [Co-op Translator](https://github.com/Azure/co-op-translator). Ačkoli se snažíme o přesnost, mějte prosím na paměti, že automatické překlady mohou obsahovat chyby nebo nepřesnosti. Původní dokument v jeho původním jazyce by měl být považován za autoritativní zdroj. Pro důležité informace se doporučuje profesionální lidský překlad. Neodpovídáme za žádná nedorozumění nebo nesprávné interpretace vyplývající z použití tohoto překladu.
Tento dokument byl přeložen pomocí služby pro automatický překlad [Co-op Translator](https://github.com/Azure/co-op-translator). Ačkoli se snažíme o přesnost, mějte na paměti, že automatické překlady mohou obsahovat chyby nebo nepřesnosti. Původní dokument v jeho původním jazyce by měl být považován za autoritativní zdroj. Pro důležité informace se doporučuje profesionální lidský překlad. Neodpovídáme za žádné nedorozumění nebo nesprávné interpretace vyplývající z použití tohoto překladu.

@ -1,8 +1,8 @@
<!--
CO_OP_TRANSLATOR_METADATA:
{
"original_hash": "8796f41f566a0a8ebb72863a83d558ed",
"translation_date": "2025-08-26T21:22:22+00:00",
"original_hash": "3a34157cc63516eba97c89a0b2f8c3e6",
"translation_date": "2025-09-03T21:29:08+00:00",
"source_file": "1-Introduction/02-ethics/README.md",
"language_code": "da"
}
@ -15,13 +15,13 @@ CO_OP_TRANSLATOR_METADATA:
---
Vi er alle databorger i en verden præget af data.
Vi er alle databorgere, der lever i en dataficeret verden.
Markedsanalyser viser, at i 2022 vil 1 ud af 3 store organisationer købe og sælge deres data via online [markedspladser og børser](https://www.gartner.com/smarterwithgartner/gartner-top-10-trends-in-data-and-analytics-for-2020/). Som **appudviklere** vil vi opleve, at det bliver lettere og billigere at integrere datadrevne indsigter og algoritmestyret automatisering i daglige brugeroplevelser. Men efterhånden som AI bliver allestedsnærværende, skal vi også forstå de potentielle skader, der kan opstå ved [våbenisering](https://www.youtube.com/watch?v=TQHs8SA1qpk) af sådanne algoritmer i stor skala.
Markedsanalyser viser, at inden 2022 vil 1 ud af 3 store organisationer købe og sælge deres data via online [markedspladser og børser](https://www.gartner.com/smarterwithgartner/gartner-top-10-trends-in-data-and-analytics-for-2020/). Som **appudviklere** vil vi finde det nemmere og billigere at integrere datadrevne indsigter og algoritmebaseret automatisering i daglige brugeroplevelser. Men efterhånden som AI bliver mere udbredt, skal vi også forstå de potentielle skader forårsaget af [våbenisering](https://www.youtube.com/watch?v=TQHs8SA1qpk) af sådanne algoritmer i stor skala.
Tendenser viser også, at vi vil skabe og forbruge over [180 zettabytes](https://www.statista.com/statistics/871513/worldwide-data-created/) data inden 2025. Som **dataspecialister** giver dette os en hidtil uset adgang til personlige data. Det betyder, at vi kan opbygge adfærdsprofiler af brugere og påvirke beslutningstagning på måder, der skaber en [illusion af frit valg](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice), mens vi potentielt skubber brugere mod resultater, vi foretrækker. Det rejser også bredere spørgsmål om databeskyttelse og brugerrettigheder.
Tendenser viser også, at vi vil skabe og forbruge over [180 zettabytes](https://www.statista.com/statistics/871513/worldwide-data-created/) data inden 2025. Som **dataforskere** giver dette os en hidtil uset adgang til personlige data. Det betyder, at vi kan opbygge adfærdsprofiler af brugere og påvirke beslutningstagning på måder, der skaber en [illusion af frit valg](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice), mens vi potentielt skubber brugere mod de resultater, vi foretrækker. Det rejser også bredere spørgsmål om databeskyttelse og brugerrettigheder.
Dataetik er nu _nødvendige retningslinjer_ for datavidenskab og -teknik, der hjælper os med at minimere potentielle skader og utilsigtede konsekvenser af vores datadrevne handlinger. [Gartner Hype Cycle for AI](https://www.gartner.com/smarterwithgartner/2-megatrends-dominate-the-gartner-hype-cycle-for-artificial-intelligence-2020/) identificerer relevante tendenser inden for digital etik, ansvarlig AI og AI-styring som nøglefaktorer for større megatrends omkring _demokratisering_ og _industrialisering_ af AI.
Dataetik er nu _nødvendige retningslinjer_ for dataforskning og -teknik, der hjælper os med at minimere potentielle skader og utilsigtede konsekvenser af vores datadrevne handlinger. [Gartner Hype Cycle for AI](https://www.gartner.com/smarterwithgartner/2-megatrends-dominate-the-gartner-hype-cycle-for-artificial-intelligence-2020/) identificerer relevante tendenser inden for digital etik, ansvarlig AI og AI-styring som nøglefaktorer for større megatrends omkring _demokratisering_ og _industrialisering_ af AI.
![Gartner's Hype Cycle for AI - 2020](https://images-cdn.newscred.com/Zz1mOWJhNzlkNDA2ZTMxMWViYjRiOGFiM2IyMjQ1YmMwZQ==)
@ -33,117 +33,117 @@ I denne lektion vil vi udforske det fascinerende område dataetik - fra kernekon
Lad os starte med at forstå den grundlæggende terminologi.
Ordet "etik" stammer fra det [græske ord "ethikos"](https://en.wikipedia.org/wiki/Ethics) (og dets rod "ethos"), der betyder _karakter eller moralsk natur_.
Ordet "etik" kommer fra det [græske ord "ethikos"](https://en.wikipedia.org/wiki/Ethics) (og dets rod "ethos"), der betyder _karakter eller moralsk natur_.
**Etik** handler om de fælles værdier og moralske principper, der styrer vores adfærd i samfundet. Etik er ikke baseret på love, men på bredt accepterede normer for, hvad der er "rigtigt vs. forkert". Dog kan etiske overvejelser påvirke virksomhedsledelse og regeringsreguleringer, der skaber flere incitamenter til overholdelse.
**Etik** handler om de fælles værdier og moralske principper, der styrer vores adfærd i samfundet. Etik er ikke baseret på love, men på bredt accepterede normer for, hvad der er "rigtigt vs. forkert". Dog kan etiske overvejelser påvirke initiativer inden for virksomhedsledelse og regeringsreguleringer, der skaber flere incitamenter til overholdelse.
**Dataetik** er en [ny gren af etik](https://royalsocietypublishing.org/doi/full/10.1098/rsta.2016.0360#sec-1), der "undersøger og evaluerer moralske problemer relateret til _data, algoritmer og tilsvarende praksis_". Her fokuserer **"data"** på handlinger relateret til generering, registrering, kuratering, behandling, formidling, deling og brug, **"algoritmer"** på AI, agenter, maskinlæring og robotter, og **"praksis"** på emner som ansvarlig innovation, programmering, hacking og etiske kodekser.
**Dataetik** er en [ny gren af etik](https://royalsocietypublishing.org/doi/full/10.1098/rsta.2016.0360#sec-1), der "undersøger og evaluerer moralske problemer relateret til _data, algoritmer og tilsvarende praksis_". Her fokuserer **"data"** på handlinger relateret til generering, registrering, kuratering, behandling, formidling, deling og brug, **"algoritmer"** fokuserer på AI, agenter, maskinlæring og robotter, og **"praksis"** fokuserer på emner som ansvarlig innovation, programmering, hacking og etiske koder.
**Anvendt etik** er den [praktiske anvendelse af moralske overvejelser](https://en.wikipedia.org/wiki/Applied_ethics). Det er processen med aktivt at undersøge etiske spørgsmål i konteksten af _virkelige handlinger, produkter og processer_ og tage korrigerende foranstaltninger for at sikre, at disse forbliver i overensstemmelse med vores definerede etiske værdier.
**Etik-kultur** handler om [_at operationalisere_ anvendt etik](https://hbr.org/2019/05/how-to-design-an-ethical-organization) for at sikre, at vores etiske principper og praksisser bliver vedtaget på en konsekvent og skalerbar måde i hele organisationen. Succesfulde etik-kulturer definerer organisationens etiske principper, giver meningsfulde incitamenter til overholdelse og forstærker etiske normer ved at opmuntre og fremhæve ønsket adfærd på alle niveauer i organisationen.
**Etik-kultur** handler om [_operationelt at anvende_ etik](https://hbr.org/2019/05/how-to-design-an-ethical-organization) for at sikre, at vores etiske principper og praksis bliver vedtaget på en konsekvent og skalerbar måde i hele organisationen. Succesfulde etik-kulturer definerer organisationens etiske principper, giver meningsfulde incitamenter til overholdelse og forstærker etiske normer ved at opmuntre og fremhæve ønsket adfærd på alle niveauer i organisationen.
## Etiske Koncepter
I denne sektion vil vi diskutere koncepter som **fælles værdier** (principper) og **etiske udfordringer** (problemer) for dataetik - og udforske **casestudier**, der hjælper dig med at forstå disse koncepter i virkelige kontekster.
I denne sektion vil vi diskutere koncepter som **fælles værdier** (principper) og **etiske udfordringer** (problemer) inden for dataetik - og udforske **casestudier**, der hjælper dig med at forstå disse koncepter i virkelige kontekster.
### 1. Etiske Principper
Enhver dataetikstrategi begynder med at definere _etiske principper_ - de "fælles værdier", der beskriver acceptabel adfærd og guider overholdelse i vores data- og AI-projekter. Du kan definere disse på individuelt eller teamniveau. Dog skitserer de fleste store organisationer disse i en _etisk AI_-missionserklæring eller ramme, der er defineret på virksomhedsniveau og konsekvent håndhævet på tværs af alle teams.
Enhver dataetik-strategi begynder med at definere _etiske principper_ - de "fælles værdier", der beskriver acceptable adfærdsmønstre og guider overholdelse i vores data- og AI-projekter. Du kan definere disse på individuelt eller teamniveau. Dog beskriver de fleste store organisationer disse i en _etisk AI_-missionserklæring eller rammeværk, der er defineret på virksomhedsniveau og konsekvent håndhævet på tværs af alle teams.
**Eksempel:** Microsofts [Responsible AI](https://www.microsoft.com/en-us/ai/responsible-ai)-missionserklæring lyder: _"Vi er forpligtet til at fremme AI drevet af etiske principper, der sætter mennesker først"_ - og identificerer 6 etiske principper i nedenstående ramme:
**Eksempel:** Microsofts [Ansvarlig AI](https://www.microsoft.com/en-us/ai/responsible-ai)-missionserklæring lyder: _"Vi er forpligtet til at fremme AI drevet af etiske principper, der sætter mennesker først"_ - og identificerer 6 etiske principper i rammeværket nedenfor:
![Responsible AI hos Microsoft](https://docs.microsoft.com/en-gb/azure/cognitive-services/personalizer/media/ethics-and-responsible-use/ai-values-future-computed.png)
![Ansvarlig AI hos Microsoft](https://docs.microsoft.com/en-gb/azure/cognitive-services/personalizer/media/ethics-and-responsible-use/ai-values-future-computed.png)
Lad os kort udforske disse principper. _Gennemsigtighed_ og _ansvarlighed_ er grundlæggende værdier, som de andre principper bygger på - så lad os starte der:
Lad os kort udforske disse principper. _Transparens_ og _ansvarlighed_ er grundlæggende værdier, som de andre principper bygger på - så lad os starte der:
* [**Ansvarlighed**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) gør praktikere _ansvarlige_ for deres data- og AI-operationer og overholdelse af disse etiske principper.
* [**Gennemsigtighed**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) sikrer, at data- og AI-handlinger er _forståelige_ (fortolkelige) for brugere og forklarer hvad og hvorfor bag beslutninger.
* [**Retfærdighed**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1%3aprimaryr6) fokuserer på at sikre, at AI behandler _alle mennesker_ retfærdigt og adresserer eventuelle systemiske eller implicitte socio-tekniske skævheder i data og systemer.
* [**Transparens**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) sikrer, at data- og AI-handlinger er _forståelige_ (fortolkelige) for brugere, og forklarer hvad og hvorfor bag beslutninger.
* [**Retfærdighed**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1%3aprimaryr6) fokuserer på at sikre, at AI behandler _alle mennesker_ retfærdigt og adresserer eventuelle systemiske eller implicitte socio-tekniske bias i data og systemer.
* [**Pålidelighed & Sikkerhed**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) sikrer, at AI opfører sig _konsekvent_ med definerede værdier og minimerer potentielle skader eller utilsigtede konsekvenser.
* [**Privatliv & Sikkerhed**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) handler om at forstå dataens oprindelse og give _databeskyttelse og relaterede rettigheder_ til brugere.
* [**Inklusion**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) handler om at designe AI-løsninger med intention og tilpasse dem til at imødekomme et _bredt spektrum af menneskelige behov_ og evner.
* [**Inklusion**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) handler om at designe AI-løsninger med intention og tilpasse dem til at imødekomme et _bredt spektrum af menneskelige behov_ og kapaciteter.
> 🚨 Overvej, hvad din dataetik-missionserklæring kunne være. Udforsk etiske AI-rammer fra andre organisationer - her er eksempler fra [IBM](https://www.ibm.com/cloud/learn/ai-ethics), [Google](https://ai.google/principles) og [Facebook](https://ai.facebook.com/blog/facebooks-five-pillars-of-responsible-ai/). Hvilke fælles værdier har de? Hvordan relaterer disse principper sig til de AI-produkter eller industrier, de opererer i?
> 🚨 Overvej, hvad din dataetik-missionserklæring kunne være. Udforsk etiske AI-rammer fra andre organisationer - her er eksempler fra [IBM](https://www.ibm.com/cloud/learn/ai-ethics), [Google](https://ai.google/principles) og [Facebook](https://ai.facebook.com/blog/facebooks-five-pillars-of-responsible-ai/). Hvilke fælles værdier har de? Hvordan relaterer disse principper sig til AI-produkterne eller -industrien, de opererer i?
### 2. Etiske Udfordringer
Når vi har defineret etiske principper, er næste skridt at evaluere vores data- og AI-handlinger for at se, om de stemmer overens med disse fælles værdier. Tænk på dine handlinger i to kategorier: _datainnsamling_ og _algoritmedesign_.
Når vi har defineret etiske principper, er næste skridt at evaluere vores data- og AI-handlinger for at se, om de stemmer overens med disse fælles værdier. Tænk på dine handlinger i to kategorier: _datainnsamling_ og _algoritmedesign_.
Ved datainnsamling vil handlinger sandsynligvis involvere **personlige data** eller personligt identificerbare oplysninger (PII) for identificerbare levende individer. Dette inkluderer [forskellige typer ikke-personlige data](https://ec.europa.eu/info/law/law-topic/data-protection/reform/what-personal-data_en), der _samlet set_ kan identificere en person. Etiske udfordringer kan relateres til _databeskyttelse_, _dataejerskab_ og relaterede emner som _informeret samtykke_ og _intellektuelle ejendomsrettigheder_ for brugere.
Ved datainnsamling vil handlinger sandsynligvis involvere **personlige data** eller personligt identificerbare oplysninger (PII) for identificerbare levende individer. Dette inkluderer [forskellige typer af ikke-personlige data](https://ec.europa.eu/info/law/law-topic/data-protection/reform/what-personal-data_en), der _samlet_ identificerer en person. Etiske udfordringer kan relateres til _databeskyttelse_, _dataejerskab_ og relaterede emner som _informeret samtykke_ og _intellektuelle ejendomsrettigheder_ for brugere.
Ved algoritmedesign vil handlinger involvere indsamling og kuratering af **datasæt**, som derefter bruges til at træne og implementere **datamodeller**, der forudsiger resultater eller automatiserer beslutninger i virkelige kontekster. Etiske udfordringer kan opstå fra _datasæt-skævhed_, _datakvalitetsproblemer_, _uretfærdighed_ og _fejlrepræsentation_ i algoritmer - inklusive nogle problemer, der er systemiske af natur.
Ved algoritmedesign vil handlinger involvere indsamling og kuratering af **datasæt**, og derefter bruge dem til at træne og implementere **datamodeller**, der forudsiger resultater eller automatiserer beslutninger i virkelige kontekster. Etiske udfordringer kan opstå fra _datasætbias_, _datakvalitetsproblemer_, _uretfærdighed_ og _fejlrepræsentation_ i algoritmer - inklusive nogle problemer, der er systemiske af natur.
I begge tilfælde fremhæver etiske udfordringer områder, hvor vores handlinger kan komme i konflikt med vores fælles værdier. For at opdage, afbøde, minimere eller eliminere disse bekymringer skal vi stille moralske "ja/nej"-spørgsmål relateret til vores handlinger og derefter tage korrigerende handlinger efter behov. Lad os se på nogle etiske udfordringer og de moralske spørgsmål, de rejser:
#### 2.1 Dataejerskab
Datainnsamling involverer ofte personlige data, der kan identificere datasubjekterne. [Dataejerskab](https://permission.io/blog/data-ownership) handler om _kontrol_ og [_brugernes rettigheder_](https://permission.io/blog/data-ownership) i forhold til oprettelse, behandling og formidling af data.
Datainnsamling involverer ofte personlige data, der kan identificere datasubjekterne. [Dataejerskab](https://permission.io/blog/data-ownership) handler om _kontrol_ og [_brugernes rettigheder_](https://permission.io/blog/data-ownership) relateret til oprettelse, behandling og formidling af data.
De moralske spørgsmål, vi skal stille, er:
* Hvem ejer dataene? (brugeren eller organisationen)
De moralske spørgsmål, vi skal stille, er:
* Hvem ejer dataene? (bruger eller organisation)
* Hvilke rettigheder har datasubjekterne? (fx adgang, sletning, portabilitet)
* Hvilke rettigheder har organisationer? (fx rette ondsindede brugeranmeldelser)
#### 2.2 Informeret Samtykke
[Informeret samtykke](https://legaldictionary.net/informed-consent/) definerer handlingen, hvor brugere accepterer en handling (som datainnsamling) med en _fuld forståelse_ af relevante fakta, herunder formål, potentielle risici og alternativer.
[Informeret samtykke](https://legaldictionary.net/informed-consent/) definerer handlingen, hvor brugere accepterer en handling (som datainnsamling) med en _fuld forståelse_ af relevante fakta, herunder formål, potentielle risici og alternativer.
Spørgsmål at udforske her er:
* Gav brugeren (datasubjektet) tilladelse til dataindsamling og brug?
* Forstod brugeren formålet med, at dataene blev indsamlet?
* Gav brugeren (datasubjektet) tilladelse til datainnsamling og brug?
* Forstod brugeren formålet med, hvorfor dataene blev indsamlet?
* Forstod brugeren de potentielle risici ved deres deltagelse?
#### 2.3 Intellektuel Ejendomsret
#### 2.3 Intellektuel Ejendom
[Intellektuel ejendomsret](https://en.wikipedia.org/wiki/Intellectual_property) refererer til immaterielle skabelser, der kan _have økonomisk værdi_ for individer eller virksomheder.
[Intellektuel ejendom](https://en.wikipedia.org/wiki/Intellectual_property) refererer til immaterielle skabelser, der stammer fra menneskelig initiativ, og som kan _have økonomisk værdi_ for individer eller virksomheder.
Spørgsmål at udforske her er:
* Havde de indsamlede data økonomisk værdi for en bruger eller virksomhed?
* Har **brugeren** intellektuel ejendomsret her?
* Har **organisationen** intellektuel ejendomsret her?
* Har **brugeren** intellektuel ejendom her?
* Har **organisationen** intellektuel ejendom her?
* Hvis disse rettigheder eksisterer, hvordan beskytter vi dem?
#### 2.4 Databeskyttelse
[Databeskyttelse](https://www.northeastern.edu/graduate/blog/what-is-data-privacy/) eller informationsbeskyttelse refererer til bevarelse af brugerens privatliv og beskyttelse af brugerens identitet i forhold til personligt identificerbare oplysninger.
[Databeskyttelse](https://www.northeastern.edu/graduate/blog/what-is-data-privacy/) eller informationsbeskyttelse refererer til bevarelse af brugerens privatliv og beskyttelse af brugerens identitet med hensyn til personligt identificerbare oplysninger.
Spørgsmål at udforske her er:
* Er brugernes (personlige) data sikret mod hacking og lækager?
* Er brugernes (personlige) data sikret mod hacks og lækager?
* Er brugernes data kun tilgængelige for autoriserede brugere og kontekster?
* Bevares brugernes anonymitet, når data deles eller formidles?
* Kan en bruger blive de-identificeret fra anonymiserede datasæt?
* Kan en bruger blive afidentificeret fra anonymiserede datasæt?
#### 2.5 Retten til at Blive Glemt
[Retten til at blive glemt](https://en.wikipedia.org/wiki/Right_to_be_forgotten) eller [retten til sletning](https://www.gdpreu.org/right-to-be-forgotten/) giver yderligere beskyttelse af personlige data til brugere. Specifikt giver det brugere ret til at anmode om sletning eller fjernelse af personlige data fra internetsøgninger og andre steder, _under specifikke omstændigheder_ - hvilket giver dem en ny start online uden tidligere handlinger, der holdes imod dem.
[Retten til at blive glemt](https://en.wikipedia.org/wiki/Right_to_be_forgotten) eller [Retten til Sletning](https://www.gdpreu.org/right-to-be-forgotten/) giver yderligere beskyttelse af personlige data til brugere. Specifikt giver det brugere ret til at anmode om sletning eller fjernelse af personlige data fra internetsøgninger og andre steder, _under specifikke omstændigheder_ - hvilket giver dem en ny start online uden tidligere handlinger, der holdes imod dem.
Spørgsmål at udforske her er:
* Tillader systemet datasubjekter at anmode om sletning?
* Skal tilbagetrækning af brugerens samtykke udløse automatisk sletning?
* Blev data indsamlet uden samtykke eller på ulovlig vis?
* Overholder vi regeringsregler for databeskyttelse?
* Er vi i overensstemmelse med regeringsregler for databeskyttelse?
#### 2.6 Datasæt-skævhed
#### 2.6 Datasætbias
Datasæt- eller [indsamlingsskævhed](http://researcharticles.com/index.php/bias-in-data-collection-in-research/) handler om at vælge et _ikke-repræsentativt_ datasæt til algoritmeudvikling, hvilket skaber potentiel uretfærdighed i resultatet for forskellige grupper. Typer af skævhed inkluderer udvælgelses- eller stikprøveskævhed, frivillighedsskævhed og instrumentel skævhed.
Datasæt eller [indsamlingsbias](http://researcharticles.com/index.php/bias-in-data-collection-in-research/) handler om at vælge et _ikke-repræsentativt_ datasæt til algoritmeudvikling, hvilket skaber potentiel uretfærdighed i resultatet for forskellige grupper. Typer af bias inkluderer udvælgelsesbias, frivillighedsbias og instrumentbias.
Spørgsmål at udforske her er:
* Rekrutterede vi et repræsentativt sæt datasubjekter?
* Testede vi vores indsamlede eller kuraterede datasæt for forskellige skævheder?
* Kan vi afbøde eller fjerne eventuelle opdagede skævheder?
* Testede vi vores indsamlede eller kuraterede datasæt for forskellige bias?
* Kan vi afbøde eller fjerne opdagede bias?
#### 2.7 Datakvalitet
[Datakvalitet](https://lakefs.io/data-quality-testing/) ser på gyldigheden af det kuraterede datasæt, der bruges til at udvikle vores algoritmer, og kontrollerer, om funktioner og poster opfylder kravene til det niveau af nøjagtighed og konsistens, der er nødvendigt for vores AI-formål.
[Datakvalitet](https://lakefs.io/data-quality-testing/) ser på validiteten af det kuraterede datasæt, der bruges til at udvikle vores algoritmer, og kontrollerer, om funktioner og poster opfylder kravene til det niveau af nøjagtighed og konsistens, der er nødvendigt for vores AI-formål.
Spørgsmål at udforske her er:
* Indfangede vi gyldige _funktioner_ til vores brugssag?
* Blev data indsamlet _konsekvent_ på tværs af forskellige datakilder?
* Er datasættet _komplet_ for forskellige forhold eller scenarier?
* Er information indfanget _nøjagtigt_ i forhold til virkeligheden?
* Er informationen indfanget _nøjagtigt_ i forhold til virkeligheden?
#### 2.8 Algoritme-retfærdighed
#### 2.8 Algoritme Retfærdighed
[Algorithmisk retfærdighed](https://towardsdatascience.com/what-is-algorithm-fairness-3182e161cf9f) undersøger, om algoritmedesign systematisk diskriminerer specifikke undergrupper af datasubjekter, hvilket kan føre til [potentielle skader](https://docs.microsoft.com/en-us/azure/machine-learning/concept-fairness-ml) inden for _fordeling_ (hvor ressourcer nægtes eller tilbageholdes fra den gruppe) og _kvaliteten af service_ (hvor AI ikke er lige så præcis for nogle undergrupper som for andre).
Spørgsmål, der kan udforskes her, er:
@ -164,28 +164,28 @@ Spørgsmål, der kan udforskes her, er:
* Er der alternative forklaringer, der kan give en anden konklusion?
#### 2.10 Fri vilje
[Illusionen af fri vilje](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice) opstår, når systemets "valgarkitekturer" bruger beslutningsalgoritmer til at skubbe folk mod at tage et foretrukket resultat, mens det ser ud som om, de har valgmuligheder og kontrol. Disse [mørke mønstre](https://www.darkpatterns.org/) kan forårsage sociale og økonomiske skader for brugere. Fordi brugerbeslutninger påvirker adfærdsprofiler, kan disse handlinger potentielt drive fremtidige valg, der kan forstærke eller udvide virkningen af disse skader.
[Illusionen af fri vilje](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice) opstår, når systemets "valgarkitekturer" bruger beslutningsalgoritmer til at påvirke folk til at tage en foretrukken beslutning, mens det ser ud som om, de har valgmuligheder og kontrol. Disse [mørke mønstre](https://www.darkpatterns.org/) kan forårsage sociale og økonomiske skader for brugerne. Fordi brugerbeslutninger påvirker adfærdsprofiler, kan disse handlinger potentielt drive fremtidige valg, der forstærker eller udvider virkningen af disse skader.
Spørgsmål, der kan udforskes her, er:
* Forstod brugeren konsekvenserne af at træffe det valg?
* Var brugeren opmærksom på (alternative) valg og fordele & ulemper ved hver?
* Var brugeren opmærksom på (alternative) valg og fordele/ulemper ved hver?
* Kan brugeren senere fortryde et automatiseret eller påvirket valg?
### 3. Case-studier
For at sætte disse etiske udfordringer i virkelige kontekster hjælper det at se på case-studier, der fremhæver de potentielle skader og konsekvenser for individer og samfund, når sådanne etiske overtrædelser overses.
For at sætte disse etiske udfordringer i virkelige kontekster kan det være nyttigt at se på case-studier, der fremhæver de potentielle skader og konsekvenser for individer og samfund, når sådanne etiske overtrædelser overses.
Her er nogle eksempler:
| Etisk udfordring | Case-studie |
|--- |--- |
| **Informeret samtykke** | 1972 - [Tuskegee Syphilis Study](https://en.wikipedia.org/wiki/Tuskegee_Syphilis_Study) - Afroamerikanske mænd, der deltog i undersøgelsen, blev lovet gratis lægehjælp _men blev bedraget_ af forskere, der undlod at informere dem om deres diagnose eller om tilgængelig behandling. Mange døde, og partnere eller børn blev påvirket; undersøgelsen varede i 40 år. |
| **Informeret samtykke** | 1972 - [Tuskegee Syphilis Study](https://en.wikipedia.org/wiki/Tuskegee_Syphilis_Study) - Afroamerikanske mænd, der deltog i undersøgelsen, blev lovet gratis medicinsk behandling _men blev bedraget_ af forskere, der undlod at informere dem om deres diagnose eller om tilgængelig behandling. Mange døde, og partnere eller børn blev påvirket; undersøgelsen varede i 40 år. |
| **Databeskyttelse** | 2007 - [Netflix data prize](https://www.wired.com/2007/12/why-anonymous-data-sometimes-isnt/) gav forskere _10M anonymiserede filmvurderinger fra 50K kunder_ for at hjælpe med at forbedre anbefalingsalgoritmer. Forskere kunne dog korrelere anonymiserede data med personligt identificerbare data i _eksterne datasæt_ (f.eks. IMDb-kommentarer) - effektivt "de-anonymiserende" nogle Netflix-abonnenter.|
| **Indsamlingsbias** | 2013 - Boston City [udviklede Street Bump](https://www.boston.gov/transportation/street-bump), en app, der lod borgere rapportere huller i vejen, hvilket gav byen bedre data til at finde og løse problemer. Dog havde [folk i lavindkomstgrupper mindre adgang til biler og telefoner](https://hbr.org/2013/04/the-hidden-biases-in-big-data), hvilket gjorde deres vejproblemer usynlige i denne app. Udviklere arbejdede med akademikere for at løse _lighed i adgang og digitale skel_ for retfærdighed. |
| **Algoritmisk retfærdighed** | 2018 - MIT [Gender Shades Study](http://gendershades.org/overview.html) evaluerede nøjagtigheden af AI-produkter til kønsidentifikation og afslørede mangler i nøjagtighed for kvinder og farvede personer. Et [2019 Apple Card](https://www.wired.com/story/the-apple-card-didnt-see-genderand-thats-the-problem/) syntes at tilbyde mindre kredit til kvinder end mænd. Begge illustrerede problemer med algoritmisk bias, der førte til socioøkonomiske skader.|
| **Indsamlingsbias** | 2013 - Boston by [udviklede Street Bump](https://www.boston.gov/transportation/street-bump), en app, der lod borgere rapportere huller i vejen, hvilket gav byen bedre data til at finde og løse problemer. Dog havde [folk i lavindkomstgrupper mindre adgang til biler og telefoner](https://hbr.org/2013/04/the-hidden-biases-in-big-data), hvilket gjorde deres vejproblemer usynlige i denne app. Udviklere arbejdede med akademikere for at løse _problemer med retfærdig adgang og digitale skel_. |
| **Algoritmisk retfærdighed** | 2018 - MIT [Gender Shades Study](http://gendershades.org/overview.html) evaluerede præcisionen af AI-produkter til kønsidentifikation og afslørede mangler i præcision for kvinder og farvede personer. Et [2019 Apple Card](https://www.wired.com/story/the-apple-card-didnt-see-genderand-thats-the-problem/) syntes at tilbyde mindre kredit til kvinder end mænd. Begge eksempler illustrerer problemer med algoritmisk bias, der fører til socioøkonomiske skader.|
| **Datafejlrepræsentation** | 2020 - [Georgia Department of Public Health udgav COVID-19-diagrammer](https://www.vox.com/covid-19-coronavirus-us-response-trump/2020/5/18/21262265/georgia-covid-19-cases-declining-reopening), der syntes at vildlede borgere om tendenser i bekræftede tilfælde med ikke-kronologisk rækkefølge på x-aksen. Dette illustrerer fejlrepræsentation gennem visualiseringstricks. |
| **Illusionen af fri vilje** | 2020 - Læringsappen [ABCmouse betalte $10M for at løse en FTC-klage](https://www.washingtonpost.com/business/2020/09/04/abcmouse-10-million-ftc-settlement/), hvor forældre blev fanget i at betale for abonnementer, de ikke kunne annullere. Dette illustrerer mørke mønstre i valgarkitekturer, hvor brugere blev skubbet mod potentielt skadelige valg. |
| **Databeskyttelse & brugerrettigheder** | 2021 - Facebook [Data Breach](https://www.npr.org/2021/04/09/986005820/after-data-breach-exposes-530-million-facebook-says-it-will-not-notify-users) afslørede data fra 530M brugere, hvilket resulterede i en $5B forlig med FTC. Det nægtede dog at informere brugere om bruddet og overtrådte brugerrettigheder omkring datatransparens og adgang. |
| **Illusionen af fri vilje** | 2020 - Læringsappen [ABCmouse betalte $10M for at forlige en FTC-klage](https://www.washingtonpost.com/business/2020/09/04/abcmouse-10-million-ftc-settlement/), hvor forældre blev fanget i at betale for abonnementer, de ikke kunne annullere. Dette illustrerer mørke mønstre i valgarkitekturer, hvor brugere blev påvirket til potentielt skadelige valg. |
| **Databeskyttelse & brugerrettigheder** | 2021 - Facebook [Data Breach](https://www.npr.org/2021/04/09/986005820/after-data-breach-exposes-530-million-facebook-says-it-will-not-notify-users) afslørede data fra 530M brugere, hvilket resulterede i en $5B forlig med FTC. Det nægtede dog at informere brugerne om bruddet, hvilket krænker brugerrettigheder omkring datatransparens og adgang. |
Vil du udforske flere case-studier? Tjek disse ressourcer:
* [Ethics Unwrapped](https://ethicsunwrapped.utexas.edu/case-studies) - etiske dilemmaer på tværs af forskellige industrier.
@ -212,7 +212,7 @@ Eksempler inkluderer:
### 2. Etiske tjeklister
Mens professionelle kodekser definerer krævet _etisk adfærd_ fra praktikere, har de [kendte begrænsninger](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md) i håndhævelse, især i storskala projekter. I stedet anbefaler mange data science-eksperter [tjeklister](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md), der kan **forbinde principper med praksis** på mere deterministiske og handlingsorienterede måder.
Mens professionelle kodekser definerer krævet _etisk adfærd_ fra praktikere, [har de kendte begrænsninger](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md) i håndhævelse, især i storskala projekter. I stedet anbefaler mange data science-eksperter [tjeklister](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md), der kan **forbinde principper med praksis** på mere deterministiske og handlingsorienterede måder.
Tjeklister konverterer spørgsmål til "ja/nej"-opgaver, der kan operationaliseres, hvilket gør det muligt at spore dem som en del af standard produktudgivelsesarbejdsgange.
@ -232,7 +232,7 @@ Eksempler på databeskyttelses- og privatlivsreguleringer:
* `1974`, [US Privacy Act](https://www.justice.gov/opcl/privacy-act-1974) - regulerer _føderal regeringens_ indsamling, brug og offentliggørelse af personlige oplysninger.
* `1996`, [US Health Insurance Portability & Accountability Act (HIPAA)](https://www.cdc.gov/phlp/publications/topic/hipaa.html) - beskytter personlige sundhedsdata.
* `1998`, [US Children's Online Privacy Protection Act (COPPA)](https://www.ftc.gov/enforcement/rules/rulemaking-regulatory-reform-proceedings/childrens-online-privacy-protection-rule) - beskytter dataprivacy for børn under 13.
* `1998`, [US Children's Online Privacy Protection Act (COPPA)](https://www.ftc.gov/enforcement/rules/rulemaking-regulatory-reform-proceedings/childrens-online-privacy-protection-rule) - beskytter databeskyttelse for børn under 13.
* `2018`, [General Data Protection Regulation (GDPR)](https://gdpr-info.eu/) - giver brugerrettigheder, databeskyttelse og privatliv.
* `2018`, [California Consumer Privacy Act (CCPA)](https://www.oag.ca.gov/privacy/ccpa) giver forbrugere flere _rettigheder_ over deres (personlige) data.
* `2021`, Kinas [Personal Information Protection Law](https://www.reuters.com/world/china/china-passes-new-personal-data-privacy-law-take-effect-nov-1-2021-08-20/) blev netop vedtaget og skaber en af de stærkeste online databeskyttelsesreguleringer i verden.
@ -241,12 +241,12 @@ Eksempler på databeskyttelses- og privatlivsreguleringer:
### 4. Etisk kultur
Bemærk, at der stadig er en uhåndgribelig kløft mellem _overholdelse_ (at gøre nok for at opfylde "lovens bogstav") og adressering af [systemiske problemer](https://www.coursera.org/learn/data-science-ethics/home/week/4) (som stivhed, informationsasymmetri og fordelingsmæssig uretfærdighed), der kan fremskynde våbeniseringen af AI.
Bemærk, at der stadig er en uhåndgribelig kløft mellem _overholdelse_ (at gøre nok til at opfylde "lovens bogstav") og adressering af [systemiske problemer](https://www.coursera.org/learn/data-science-ethics/home/week/4) (som forstening, informationsasymmetri og fordelingsmæssig uretfærdighed), der kan fremskynde våbeniseringen af AI.
Sidstnævnte kræver [samarbejdsmetoder til at definere etiske kulturer](https://towardsdatascience.com/why-ai-ethics-requires-a-culture-driven-approach-26f451afa29f), der bygger følelsesmæssige forbindelser og konsistente fælles værdier _på tværs af organisationer_ i branchen. Dette kalder på mere [formaliserede dataetiske kulturer](https://www.codeforamerica.org/news/formalizing-an-ethical-data-culture/) i organisationer - hvilket giver _enhver_ mulighed for at [trække Andon-snoren](https://en.wikipedia.org/wiki/Andon_(manufacturing)) (for at rejse etiske bekymringer tidligt i processen) og gøre _etiske vurderinger_ (f.eks. ved ansættelse) til et kernekriterium for teamdannelse i AI-projekter.
Sidstnævnte kræver [samarbejdsmetoder til at definere etiske kulturer](https://towardsdatascience.com/why-ai-ethics-requires-a-culture-driven-approach-26f451afa29f), der bygger følelsesmæssige forbindelser og konsistente fælles værdier _på tværs af organisationer_ i branchen. Dette kræver mere [formaliserede dataetiske kulturer](https://www.codeforamerica.org/news/formalizing-an-ethical-data-culture/) i organisationer - hvilket giver _enhver_ mulighed for at [trække Andon-snoren](https://en.wikipedia.org/wiki/Andon_(manufacturing)) (for at rejse etiske bekymringer tidligt i processen) og gøre _etiske vurderinger_ (f.eks. ved ansættelse) til et kernekriterium for teamdannelse i AI-projekter.
---
## [Quiz efter forelæsning](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/3) 🎯
## [Quiz efter forelæsning](https://ff-quizzes.netlify.app/en/ds/) 🎯
## Gennemgang & Selvstudie
Kurser og bøger hjælper med at forstå kerneetikbegreber og udfordringer, mens case-studier og værktøjer hjælper med anvendte etiske praksisser i virkelige kontekster. Her er nogle ressourcer at starte med.
@ -264,4 +264,4 @@ Kurser og bøger hjælper med at forstå kerneetikbegreber og udfordringer, mens
---
**Ansvarsfraskrivelse**:
Dette dokument er blevet oversat ved hjælp af AI-oversættelsestjenesten [Co-op Translator](https://github.com/Azure/co-op-translator). Selvom vi bestræber os på nøjagtighed, skal du være opmærksom på, at automatiserede oversættelser kan indeholde fejl eller unøjagtigheder. Det originale dokument på dets oprindelige sprog bør betragtes som den autoritative kilde. For kritisk information anbefales professionel menneskelig oversættelse. Vi er ikke ansvarlige for eventuelle misforståelser eller fejltolkninger, der måtte opstå som følge af brugen af denne oversættelse.
Dette dokument er blevet oversat ved hjælp af AI-oversættelsestjenesten [Co-op Translator](https://github.com/Azure/co-op-translator). Selvom vi bestræber os på at sikre nøjagtighed, skal du være opmærksom på, at automatiserede oversættelser kan indeholde fejl eller unøjagtigheder. Det originale dokument på dets oprindelige sprog bør betragtes som den autoritative kilde. For kritisk information anbefales professionel menneskelig oversættelse. Vi er ikke ansvarlige for eventuelle misforståelser eller fejltolkninger, der måtte opstå som følge af brugen af denne oversættelse.

@ -1,8 +1,8 @@
<!--
CO_OP_TRANSLATOR_METADATA:
{
"original_hash": "8796f41f566a0a8ebb72863a83d558ed",
"translation_date": "2025-08-24T21:18:16+00:00",
"original_hash": "3a34157cc63516eba97c89a0b2f8c3e6",
"translation_date": "2025-09-03T20:51:25+00:00",
"source_file": "1-Introduction/02-ethics/README.md",
"language_code": "de"
}
@ -17,9 +17,9 @@ CO_OP_TRANSLATOR_METADATA:
Wir sind alle Datenbürger, die in einer datengetriebenen Welt leben.
Markttrends zeigen, dass bis 2022 jede dritte große Organisation ihre Daten über Online-[Marktplätze und Börsen](https://www.gartner.com/smarterwithgartner/gartner-top-10-trends-in-data-and-analytics-for-2020/) kaufen und verkaufen wird. Als **App-Entwickler** wird es für uns einfacher und günstiger, datengesteuerte Erkenntnisse und algorithmusgesteuerte Automatisierung in den täglichen Nutzererfahrungen zu integrieren. Doch während KI allgegenwärtig wird, müssen wir auch die potenziellen Schäden verstehen, die durch die [Waffenisierung](https://www.youtube.com/watch?v=TQHs8SA1qpk) solcher Algorithmen in großem Maßstab entstehen können.
Markttrends zeigen, dass bis 2022 jede dritte große Organisation ihre Daten über Online-[Marktplätze und Börsen](https://www.gartner.com/smarterwithgartner/gartner-top-10-trends-in-data-and-analytics-for-2020/) kaufen und verkaufen wird. Als **App-Entwickler** wird es für uns einfacher und günstiger, datengesteuerte Erkenntnisse und algorithmusgesteuerte Automatisierung in die täglichen Nutzererfahrungen zu integrieren. Doch während KI allgegenwärtig wird, müssen wir auch die potenziellen Schäden verstehen, die durch die [Waffenisierung](https://www.youtube.com/watch?v=TQHs8SA1qpk) solcher Algorithmen in großem Maßstab entstehen können.
Trends zeigen außerdem, dass wir bis 2025 über [180 Zettabyte](https://www.statista.com/statistics/871513/worldwide-data-created/) an Daten erzeugen und konsumieren werden. Als **Datenwissenschaftler** gibt uns dies beispiellosen Zugang zu persönlichen Daten. Das bedeutet, dass wir Verhaltensprofile von Nutzern erstellen und Entscheidungsprozesse beeinflussen können, die eine [Illusion der freien Wahl](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice) schaffen, während wir Nutzer möglicherweise in von uns bevorzugte Richtungen lenken. Dies wirft auch größere Fragen zu Datenschutz und Nutzerrechten auf.
Trends zeigen auch, dass wir bis 2025 über [180 Zettabyte](https://www.statista.com/statistics/871513/worldwide-data-created/) an Daten erstellen und konsumieren werden. Als **Datenwissenschaftler** gibt uns dies beispiellosen Zugang zu persönlichen Daten. Das bedeutet, dass wir Verhaltensprofile von Nutzern erstellen und Entscheidungsprozesse beeinflussen können, die eine [Illusion der freien Wahl](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice) schaffen, während wir Nutzer möglicherweise in von uns bevorzugte Richtungen lenken. Dies wirft auch größere Fragen zu Datenschutz und Nutzerrechten auf.
Datenethik sind jetzt _notwendige Leitplanken_ für Datenwissenschaft und Ingenieurwesen, die uns helfen, potenzielle Schäden und unbeabsichtigte Konsequenzen unserer datengetriebenen Handlungen zu minimieren. Der [Gartner Hype Cycle für KI](https://www.gartner.com/smarterwithgartner/2-megatrends-dominate-the-gartner-hype-cycle-for-artificial-intelligence-2020/) identifiziert relevante Trends in digitaler Ethik, verantwortungsvoller KI und KI-Governance als Schlüsseltreiber für größere Megatrends rund um die _Demokratisierung_ und _Industrialisierung_ von KI.
@ -33,11 +33,11 @@ In dieser Lektion werden wir den faszinierenden Bereich der Datenethik erkunden
Beginnen wir mit dem Verständnis der grundlegenden Terminologie.
Das Wort "Ethik" stammt aus dem [griechischen Wort "ethikos"](https://en.wikipedia.org/wiki/Ethics) (und dessen Wurzel "ethos"), was _Charakter oder moralische Natur_ bedeutet.
Das Wort "Ethik" stammt aus dem [griechischen Wort "ethikos"](https://en.wikipedia.org/wiki/Ethics) (und seiner Wurzel "ethos"), was _Charakter oder moralische Natur_ bedeutet.
**Ethik** bezieht sich auf die gemeinsamen Werte und moralischen Prinzipien, die unser Verhalten in der Gesellschaft bestimmen. Ethik basiert nicht auf Gesetzen, sondern auf allgemein akzeptierten Normen dessen, was als "richtig vs. falsch" gilt. Dennoch können ethische Überlegungen Initiativen zur Unternehmensführung und staatliche Vorschriften beeinflussen, die mehr Anreize für die Einhaltung schaffen.
**Ethik** bezieht sich auf die gemeinsamen Werte und moralischen Prinzipien, die unser Verhalten in der Gesellschaft bestimmen. Ethik basiert nicht auf Gesetzen, sondern auf allgemein akzeptierten Normen dessen, was "richtig vs. falsch" ist. Dennoch können ethische Überlegungen Initiativen zur Unternehmensführung und staatliche Vorschriften beeinflussen, die mehr Anreize für die Einhaltung schaffen.
**Datenethik** ist ein [neuer Zweig der Ethik](https://royalsocietypublishing.org/doi/full/10.1098/rsta.2016.0360#sec-1), der "moralische Probleme im Zusammenhang mit _Daten, Algorithmen und entsprechenden Praktiken_ untersucht und bewertet". Hierbei konzentriert sich **"Daten"** auf Handlungen im Zusammenhang mit Erzeugung, Aufzeichnung, Pflege, Verarbeitung, Verbreitung, Teilen und Nutzung, **"Algorithmen"** auf KI, Agenten, maschinelles Lernen und Roboter, und **"Praktiken"** auf Themen wie verantwortungsvolle Innovation, Programmierung, Hacking und Ethikkodizes.
**Datenethik** ist ein [neuer Zweig der Ethik](https://royalsocietypublishing.org/doi/full/10.1098/rsta.2016.0360#sec-1), der "moralische Probleme im Zusammenhang mit _Daten, Algorithmen und entsprechenden Praktiken_ untersucht und bewertet". Hierbei konzentriert sich **"Daten"** auf Aktionen im Zusammenhang mit Erzeugung, Aufzeichnung, Pflege, Verarbeitung, Verbreitung, Teilen und Nutzung, **"Algorithmen"** auf KI, Agenten, maschinelles Lernen und Roboter, und **"Praktiken"** auf Themen wie verantwortungsvolle Innovation, Programmierung, Hacking und Ethikkodizes.
**Angewandte Ethik** ist die [praktische Anwendung moralischer Überlegungen](https://en.wikipedia.org/wiki/Applied_ethics). Es ist der Prozess der aktiven Untersuchung ethischer Fragen im Kontext von _realen Handlungen, Produkten und Prozessen_ und der Ergreifung von Korrekturmaßnahmen, um sicherzustellen, dass diese mit unseren definierten ethischen Werten übereinstimmen.
@ -51,16 +51,16 @@ In diesem Abschnitt werden wir Konzepte wie **gemeinsame Werte** (Prinzipien) un
Jede Datenethikstrategie beginnt mit der Definition von _ethischen Prinzipien_ den "gemeinsamen Werten", die akzeptables Verhalten beschreiben und konforme Handlungen in unseren Daten- und KI-Projekten leiten. Sie können diese auf individueller oder Teamebene definieren. Die meisten großen Organisationen legen diese jedoch in einer _ethischen KI-Missionserklärung_ oder einem Rahmenwerk fest, das auf Unternehmensebene definiert und konsistent über alle Teams hinweg durchgesetzt wird.
**Beispiel:** Microsofts [Verantwortungsvolle KI](https://www.microsoft.com/en-us/ai/responsible-ai)-Missionserklärung lautet: _"Wir sind verpflichtet, die Entwicklung von KI voranzutreiben, die von ethischen Prinzipien geleitet wird und den Menschen in den Mittelpunkt stellt"_ und identifiziert 6 ethische Prinzipien im untenstehenden Rahmenwerk:
**Beispiel:** Die [Verantwortungsvolle KI](https://www.microsoft.com/en-us/ai/responsible-ai)-Missionserklärung von Microsoft lautet: _"Wir sind verpflichtet, die Entwicklung von KI voranzutreiben, die von ethischen Prinzipien geleitet wird, die den Menschen in den Mittelpunkt stellen"_ und identifiziert 6 ethische Prinzipien im untenstehenden Rahmenwerk:
![Verantwortungsvolle KI bei Microsoft](https://docs.microsoft.com/en-gb/azure/cognitive-services/personalizer/media/ethics-and-responsible-use/ai-values-future-computed.png)
Lassen Sie uns diese Prinzipien kurz erkunden. _Transparenz_ und _Verantwortlichkeit_ sind grundlegende Werte, auf denen andere Prinzipien aufbauen beginnen wir also damit:
* [**Verantwortlichkeit**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) macht Praktiker _verantwortlich_ für ihre Daten- und KI-Operationen sowie die Einhaltung dieser ethischen Prinzipien.
* [**Transparenz**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) stellt sicher, dass Daten- und KI-Handlungen für Nutzer _verständlich_ (interpretierbar) sind und erklärt, was und warum hinter Entscheidungen steckt.
* [**Fairness**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1%3aprimaryr6) konzentriert sich darauf, sicherzustellen, dass KI _alle Menschen_ fair behandelt und systemische oder implizite sozio-technische Vorurteile in Daten und Systemen angeht.
* [**Zuverlässigkeit & Sicherheit**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) stellt sicher, dass KI sich _konsistent_ mit definierten Werten verhält und potenzielle Schäden oder unbeabsichtigte Konsequenzen minimiert.
* [**Transparenz**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) stellt sicher, dass Daten- und KI-Aktionen für Nutzer _verständlich_ (interpretierbar) sind und erklärt das Was und Warum hinter Entscheidungen.
* [**Fairness**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1%3aprimaryr6) konzentriert sich darauf, sicherzustellen, dass KI _alle Menschen_ fair behandelt und systemische oder implizite sozio-technische Vorurteile in Daten und Systemen anspricht.
* [**Zuverlässigkeit & Sicherheit**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) stellt sicher, dass KI _konsistent_ mit definierten Werten handelt und potenzielle Schäden oder unbeabsichtigte Konsequenzen minimiert.
* [**Privatsphäre & Sicherheit**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) bezieht sich auf das Verständnis der Datenherkunft und die Bereitstellung von _Datenschutz und verwandten Schutzmaßnahmen_ für Nutzer.
* [**Inklusivität**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) bezieht sich darauf, KI-Lösungen mit Absicht zu gestalten und sie so anzupassen, dass sie _eine breite Palette menschlicher Bedürfnisse_ und Fähigkeiten erfüllen.
@ -68,28 +68,28 @@ Lassen Sie uns diese Prinzipien kurz erkunden. _Transparenz_ und _Verantwortlich
### 2. Ethische Herausforderungen
Sobald wir ethische Prinzipien definiert haben, besteht der nächste Schritt darin, unsere Daten- und KI-Handlungen zu bewerten, um festzustellen, ob sie mit diesen gemeinsamen Werten übereinstimmen. Denken Sie über Ihre Handlungen in zwei Kategorien nach: _Datenerfassung_ und _Algorithmendesign_.
Sobald wir ethische Prinzipien definiert haben, besteht der nächste Schritt darin, unsere Daten- und KI-Aktionen zu bewerten, um festzustellen, ob sie mit diesen gemeinsamen Werten übereinstimmen. Denken Sie über Ihre Aktionen in zwei Kategorien nach: _Datenerfassung_ und _Algorithmendesign_.
Bei der Datenerfassung werden die Handlungen wahrscheinlich **persönliche Daten** oder persönlich identifizierbare Informationen (PII) für identifizierbare lebende Personen umfassen. Dazu gehören [verschiedene Arten nicht-personenbezogener Daten](https://ec.europa.eu/info/law/law-topic/data-protection/reform/what-personal-data_en), die _zusammen_ eine Person identifizieren können. Ethische Herausforderungen können sich auf _Datenschutz_, _Datenbesitz_ und verwandte Themen wie _informierte Zustimmung_ und _geistige Eigentumsrechte_ für Nutzer beziehen.
Bei der Datenerfassung werden Aktionen wahrscheinlich **persönliche Daten** oder persönlich identifizierbare Informationen (PII) für identifizierbare lebende Personen umfassen. Dazu gehören [verschiedene Arten nicht-personenbezogener Daten](https://ec.europa.eu/info/law/law-topic/data-protection/reform/what-personal-data_en), die _zusammen_ eine Person identifizieren können. Ethische Herausforderungen können sich auf _Datenschutz_, _Datenbesitz_ und verwandte Themen wie _informierte Zustimmung_ und _geistige Eigentumsrechte_ für Nutzer beziehen.
Beim Algorithmendesign umfassen die Handlungen das Sammeln und Pflegen von **Datensätzen**, die dann verwendet werden, um **Datenmodelle** zu trainieren und einzusetzen, die Ergebnisse vorhersagen oder Entscheidungen in realen Kontexten automatisieren. Ethische Herausforderungen können sich aus _Datensatzverzerrungen_, _Datenqualitätsproblemen_, _Unfairness_ und _Fehldarstellungen_ in Algorithmen ergeben einschließlich einiger systemischer Probleme.
Beim Algorithmendesign umfassen Aktionen das Sammeln und Pflegen von **Datensätzen**, die dann verwendet werden, um **Datenmodelle** zu trainieren und einzusetzen, die Ergebnisse vorhersagen oder Entscheidungen in realen Kontexten automatisieren. Ethische Herausforderungen können sich aus _Datensatzverzerrungen_, _Datenqualitätsproblemen_, _Unfairness_ und _Fehldarstellungen_ in Algorithmen ergeben einschließlich einiger systemischer Probleme.
In beiden Fällen heben ethische Herausforderungen Bereiche hervor, in denen unsere Handlungen möglicherweise mit unseren gemeinsamen Werten in Konflikt geraten. Um diese Bedenken zu erkennen, zu mindern, zu minimieren oder zu beseitigen, müssen wir moralische "Ja/Nein"-Fragen zu unseren Handlungen stellen und gegebenenfalls Korrekturmaßnahmen ergreifen. Schauen wir uns einige ethische Herausforderungen und die moralischen Fragen an, die sie aufwerfen:
In beiden Fällen heben ethische Herausforderungen Bereiche hervor, in denen unsere Aktionen möglicherweise mit unseren gemeinsamen Werten in Konflikt geraten. Um diese Bedenken zu erkennen, zu mindern, zu minimieren oder zu beseitigen, müssen wir moralische "Ja/Nein"-Fragen zu unseren Aktionen stellen und gegebenenfalls Korrekturmaßnahmen ergreifen. Schauen wir uns einige ethische Herausforderungen und die moralischen Fragen an, die sie aufwerfen:
#### 2.1 Datenbesitz
Die Datenerfassung umfasst oft persönliche Daten, die die Datensubjekte identifizieren können. [Datenbesitz](https://permission.io/blog/data-ownership) bezieht sich auf _Kontrolle_ und [_Nutzerrechte_](https://permission.io/blog/data-ownership) im Zusammenhang mit der Erstellung, Verarbeitung und Verbreitung von Daten.
Die moralischen Fragen, die wir stellen müssen, sind:
* Wer besitzt die Daten? (Nutzer oder Organisation)
* Wem gehören die Daten? (Nutzer oder Organisation)
* Welche Rechte haben Datensubjekte? (z. B. Zugriff, Löschung, Übertragbarkeit)
* Welche Rechte haben Organisationen? (z. B. Korrektur böswilliger Nutzerbewertungen)
#### 2.2 Informierte Zustimmung
[Informierte Zustimmung](https://legaldictionary.net/informed-consent/) definiert die Handlung, bei der Nutzer einer Aktion (wie der Datenerfassung) mit einem _vollständigen Verständnis_ relevanter Fakten einschließlich Zweck, potenzieller Risiken und Alternativen zustimmen.
[Informierte Zustimmung](https://legaldictionary.net/informed-consent/) definiert den Akt, bei dem Nutzer einer Aktion (wie der Datenerfassung) mit einem _vollständigen Verständnis_ relevanter Fakten einschließlich Zweck, potenzieller Risiken und Alternativen zustimmen.
Fragen, die hier zu erkunden sind:
Fragen, die hier zu untersuchen sind:
* Hat der Nutzer (Datensubjekt) die Erfassung und Nutzung von Daten erlaubt?
* Hat der Nutzer den Zweck verstanden, für den die Daten erfasst wurden?
* Hat der Nutzer die potenziellen Risiken seiner Teilnahme verstanden?
@ -98,7 +98,7 @@ Fragen, die hier zu erkunden sind:
[Geistiges Eigentum](https://en.wikipedia.org/wiki/Intellectual_property) bezieht sich auf immaterielle Schöpfungen, die aus menschlicher Initiative resultieren und _wirtschaftlichen Wert_ für Einzelpersonen oder Unternehmen haben können.
Fragen, die hier zu erkunden sind:
Fragen, die hier zu untersuchen sind:
* Hatten die gesammelten Daten wirtschaftlichen Wert für einen Nutzer oder ein Unternehmen?
* Hat der **Nutzer** hier geistiges Eigentum?
* Hat die **Organisation** hier geistiges Eigentum?
@ -108,27 +108,27 @@ Fragen, die hier zu erkunden sind:
[Datenschutz](https://www.northeastern.edu/graduate/blog/what-is-data-privacy/) oder Informationsschutz bezieht sich auf die Wahrung der Privatsphäre und den Schutz der Identität von Nutzern in Bezug auf persönlich identifizierbare Informationen.
Fragen, die hier zu erkunden sind:
* Sind die (persönlichen) Daten der Nutzer gegen Hacks und Leaks gesichert?
Fragen, die hier zu untersuchen sind:
* Sind die persönlichen Daten der Nutzer vor Hacks und Lecks geschützt?
* Sind die Daten der Nutzer nur für autorisierte Nutzer und Kontexte zugänglich?
* Wird die Anonymität der Nutzer gewahrt, wenn Daten geteilt oder verbreitet werden?
* Kann ein Nutzer aus anonymisierten Datensätzen de-identifiziert werden?
#### 2.5 Recht auf Vergessenwerden
Das [Recht auf Vergessenwerden](https://en.wikipedia.org/wiki/Right_to_be_forgotten) oder [Recht auf Löschung](https://www.gdpreu.org/right-to-be-forgotten/) bietet Nutzern zusätzlichen Schutz persönlicher Daten. Es gibt ihnen insbesondere das Recht, die Löschung oder Entfernung persönlicher Daten aus Internetsuchen und anderen Orten zu verlangen, _unter bestimmten Umständen_ und ermöglicht ihnen einen Neuanfang online, ohne dass vergangene Handlungen gegen sie verwendet werden.
Das [Recht auf Vergessenwerden](https://en.wikipedia.org/wiki/Right_to_be_forgotten) oder [Recht auf Löschung](https://www.gdpreu.org/right-to-be-forgotten/) bietet Nutzern zusätzlichen Schutz persönlicher Daten. Insbesondere gibt es Nutzern das Recht, die Löschung oder Entfernung persönlicher Daten aus Internetsuchen und anderen Orten zu verlangen, _unter bestimmten Umständen_ und ermöglicht ihnen einen Neuanfang online, ohne dass vergangene Handlungen gegen sie verwendet werden.
Fragen, die hier zu erkunden sind:
Fragen, die hier zu untersuchen sind:
* Ermöglicht das System Datensubjekten, die Löschung zu beantragen?
* Sollte der Widerruf der Nutzerzustimmung eine automatisierte Löschung auslösen?
* Wurden Daten ohne Zustimmung oder auf rechtswidrige Weise erfasst?
* Wurden Daten ohne Zustimmung oder auf rechtswidrige Weise gesammelt?
* Sind wir konform mit staatlichen Vorschriften zum Datenschutz?
#### 2.6 Datensatzverzerrung
Datensatz- oder [Erfassungsverzerrung](http://researcharticles.com/index.php/bias-in-data-collection-in-research/) bezieht sich darauf, eine _nicht repräsentative_ Teilmenge von Daten für die Algorithmusentwicklung auszuwählen, was potenzielle Unfairness in den Ergebnissen für verschiedene Gruppen schaffen kann. Arten von Verzerrungen umfassen Auswahl- oder Stichprobenverzerrung, Freiwilligenverzerrung und Instrumentenverzerrung.
Datensatz- oder [Sammlungsverzerrung](http://researcharticles.com/index.php/bias-in-data-collection-in-research/) bezieht sich auf die Auswahl eines _nicht repräsentativen_ Datensatzes für die Algorithmusentwicklung, was potenzielle Unfairness in den Ergebnissen für verschiedene Gruppen schaffen kann. Arten von Verzerrungen umfassen Auswahl- oder Stichprobenverzerrung, Freiwilligenverzerrung und Instrumentenverzerrung.
Fragen, die hier zu erkunden sind:
Fragen, die hier zu untersuchen sind:
* Haben wir eine repräsentative Gruppe von Datensubjekten rekrutiert?
* Haben wir unseren gesammelten oder gepflegten Datensatz auf verschiedene Verzerrungen getestet?
* Können wir entdeckte Verzerrungen mindern oder entfernen?
@ -137,14 +137,14 @@ Fragen, die hier zu erkunden sind:
[Datenqualität](https://lakefs.io/data-quality-testing/) untersucht die Validität des gepflegten Datensatzes, der zur Entwicklung unserer Algorithmen verwendet wird, und überprüft, ob Merkmale und Datensätze die Anforderungen an die Genauigkeit und Konsistenz für unseren KI-Zweck erfüllen.
Fragen, die hier zu erkunden sind:
Fragen, die hier zu untersuchen sind:
* Haben wir gültige _Merkmale_ für unseren Anwendungsfall erfasst?
* Wurden Daten _konsistent_ über verschiedene Datenquellen hinweg erfasst?
* Ist der Datensatz _vollständig_ für verschiedene Bedingungen oder Szenarien?
* Wurden Informationen _genau_ erfasst und spiegeln die Realität wider?
#### 2.8 Algorithmus-Fairness
[Algorithmische Fairness](https://towardsdatascience.com/what-is-algorithm-fairness-3182e161cf9f) überprüft, ob das Design des Algorithmus systematisch bestimmte Untergruppen von Datensubjekten diskriminiert, was zu [potenziellen Schäden](https://docs.microsoft.com/en-us/azure/machine-learning/concept-fairness-ml) in der _Ressourcenzuweisung_ (bei der Ressourcen verweigert oder zurückgehalten werden) und der _Dienstleistungsqualität_ (bei der KI für einige Untergruppen weniger genau ist als für andere) führen kann.
[Algorithmische Fairness](https://towardsdatascience.com/what-is-algorithm-fairness-3182e161cf9f) überprüft, ob das Design des Algorithmus systematisch bestimmte Untergruppen von Datensubjekten diskriminiert, was zu [potenziellen Schäden](https://docs.microsoft.com/en-us/azure/machine-learning/concept-fairness-ml) in der _Ressourcenverteilung_ (bei der Ressourcen dieser Gruppe verweigert oder vorenthalten werden) und der _Servicequalität_ (bei der KI für einige Untergruppen weniger genau ist als für andere) führen kann.
Fragen, die hier untersucht werden sollten:
* Haben wir die Modellgenauigkeit für verschiedene Untergruppen und Bedingungen bewertet?
@ -164,69 +164,69 @@ Fragen, die hier untersucht werden sollten:
* Gibt es alternative Erklärungen, die zu einer anderen Schlussfolgerung führen könnten?
#### 2.10 Freie Wahl
Die [Illusion der freien Wahl](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice) tritt auf, wenn "Entscheidungsarchitekturen" eines Systems Algorithmen verwenden, um Menschen dazu zu bewegen, ein bevorzugtes Ergebnis zu wählen, während sie scheinbar Optionen und Kontrolle haben. Diese [dunklen Muster](https://www.darkpatterns.org/) können sozialen und wirtschaftlichen Schaden für Nutzer verursachen. Da Nutzerentscheidungen Verhaltensprofile beeinflussen, können diese Aktionen zukünftige Entscheidungen antreiben, die die Auswirkungen dieser Schäden verstärken oder verlängern.
Die [Illusion der freien Wahl](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice) tritt auf, wenn "Entscheidungsarchitekturen" eines Systems Algorithmen verwenden, um Menschen dazu zu bewegen, ein bevorzugtes Ergebnis zu wählen, während sie scheinbar Optionen und Kontrolle haben. Diese [Dark Patterns](https://www.darkpatterns.org/) können sozialen und wirtschaftlichen Schaden für Nutzer verursachen. Da Nutzerentscheidungen Verhaltensprofile beeinflussen, können diese Aktionen zukünftige Entscheidungen antreiben, die die Auswirkungen dieser Schäden verstärken oder verlängern.
Fragen, die hier untersucht werden sollten:
* Hat der Nutzer die Auswirkungen dieser Entscheidung verstanden?
* War sich der Nutzer der (alternativen) Optionen und der Vor- und Nachteile jeder bewusst?
* War der Nutzer sich der (alternativen) Optionen und der Vor- und Nachteile jeder Option bewusst?
* Kann der Nutzer eine automatisierte oder beeinflusste Entscheidung später rückgängig machen?
### 3. Fallstudien
Um diese ethischen Herausforderungen in realen Kontexten zu betrachten, hilft es, Fallstudien zu untersuchen, die die potenziellen Schäden und Konsequenzen für Einzelpersonen und die Gesellschaft aufzeigen, wenn solche ethischen Verstöße übersehen werden.
Um diese ethischen Herausforderungen in realen Kontexten zu verstehen, hilft es, Fallstudien zu betrachten, die die potenziellen Schäden und Konsequenzen für Einzelpersonen und die Gesellschaft aufzeigen, wenn solche ethischen Verstöße übersehen werden.
Hier sind einige Beispiele:
Hier einige Beispiele:
| Ethische Herausforderung | Fallstudie |
|--- |--- |
| **Informierte Zustimmung** | 1972 - [Tuskegee-Syphilis-Studie](https://en.wikipedia.org/wiki/Tuskegee_Syphilis_Study) - Afroamerikanische Männer, die an der Studie teilnahmen, wurden kostenlose medizinische Versorgung versprochen, _aber von Forschern getäuscht_, die die Teilnehmer nicht über ihre Diagnose oder die Verfügbarkeit von Behandlung informierten. Viele Teilnehmer starben, und Partner oder Kinder waren betroffen; die Studie dauerte 40 Jahre. |
| **Datenschutz** | 2007 - Der [Netflix-Datenpreis](https://www.wired.com/2007/12/why-anonymous-data-sometimes-isnt/) stellte Forschern _10 Millionen anonymisierte Filmbewertungen von 50.000 Kunden_ zur Verfügung, um Empfehlungsalgorithmen zu verbessern. Forscher konnten jedoch anonymisierte Daten mit persönlich identifizierbaren Daten in _externen Datensätzen_ (z. B. IMDb-Kommentaren) korrelieren und einige Netflix-Abonnenten effektiv "de-anonymisieren".|
| **Sammlungsbias** | 2013 - Die Stadt Boston [entwickelte Street Bump](https://www.boston.gov/transportation/street-bump), eine App, mit der Bürger Schlaglöcher melden konnten, um der Stadt bessere Straßendaten zur Verfügung zu stellen. Allerdings hatten [Menschen in einkommensschwächeren Gruppen weniger Zugang zu Autos und Telefonen](https://hbr.org/2013/04/the-hidden-biases-in-big-data), wodurch ihre Straßenprobleme in dieser App unsichtbar blieben. Entwickler arbeiteten mit Akademikern zusammen, um _Fragen des gerechten Zugangs und der digitalen Kluft_ für Fairness zu lösen. |
| **Datenschutz** | 2007 - Der [Netflix-Datenpreis](https://www.wired.com/2007/12/why-anonymous-data-sometimes-isnt/) stellte Forschern _10 Millionen anonymisierte Filmbewertungen von 50.000 Kunden_ zur Verfügung, um Empfehlungsalgorithmen zu verbessern. Forscher konnten jedoch anonymisierte Daten mit persönlich identifizierbaren Daten in _externen Datensätzen_ (z. B. IMDb-Kommentaren) korrelieren und so einige Netflix-Abonnenten effektiv "de-anonymisieren".|
| **Erfassungsbias** | 2013 - Die Stadt Boston [entwickelte Street Bump](https://www.boston.gov/transportation/street-bump), eine App, mit der Bürger Schlaglöcher melden konnten, um der Stadt bessere Straßendaten zur Verfügung zu stellen. Allerdings hatten [Menschen in einkommensschwächeren Gruppen weniger Zugang zu Autos und Telefonen](https://hbr.org/2013/04/the-hidden-biases-in-big-data), wodurch ihre Straßenprobleme in dieser App unsichtbar blieben. Entwickler arbeiteten mit Akademikern zusammen, um _Probleme des gerechten Zugangs und der digitalen Kluft_ für mehr Fairness zu lösen. |
| **Algorithmische Fairness** | 2018 - Die MIT-Studie [Gender Shades](http://gendershades.org/overview.html) bewertete die Genauigkeit von KI-Produkten zur Geschlechtsklassifikation und deckte Lücken in der Genauigkeit für Frauen und farbige Personen auf. Eine [2019 Apple Card](https://www.wired.com/story/the-apple-card-didnt-see-genderand-thats-the-problem/) schien Frauen weniger Kredit zu gewähren als Männern. Beide Fälle illustrieren Probleme algorithmischer Verzerrungen, die zu sozioökonomischen Schäden führen.|
| **Fehlrepräsentation von Daten** | 2020 - Das [Georgia Department of Public Health veröffentlichte COVID-19-Diagramme](https://www.vox.com/covid-19-coronavirus-us-response-trump/2020/5/18/21262265/georgia-covid-19-cases-declining-reopening), die Bürger über Trends bei bestätigten Fällen mit nicht-chronologischer Reihenfolge auf der x-Achse zu täuschen schienen. Dies zeigt Fehlrepräsentation durch Visualisierungstricks. |
| **Illusion der freien Wahl** | 2020 - Lern-App [ABCmouse zahlte $10M, um eine FTC-Beschwerde beizulegen](https://www.washingtonpost.com/business/2020/09/04/abcmouse-10-million-ftc-settlement/), bei der Eltern in Abonnements gefangen waren, die sie nicht kündigen konnten. Dies zeigt dunkle Muster in Entscheidungsarchitekturen, bei denen Nutzer zu potenziell schädlichen Entscheidungen gedrängt wurden. |
| **Datenschutz & Nutzerrechte** | 2021 - Facebook [Datenleck](https://www.npr.org/2021/04/09/986005820/after-data-breach-exposes-530-million-facebook-says-it-will-not-notify-users) enthüllte Daten von 530 Millionen Nutzern, was zu einer $5B-Einigung mit der FTC führte. Es weigerte sich jedoch, die Nutzer über das Leck zu informieren, was die Nutzerrechte in Bezug auf Datentransparenz und -zugang verletzte. |
| **Fehlrepräsentation von Daten** | 2020 - Das [Georgia Department of Public Health veröffentlichte COVID-19-Diagramme](https://www.vox.com/covid-19-coronavirus-us-response-trump/2020/5/18/21262265/georgia-covid-19-cases-declining-reopening), die Bürger über Trends bei bestätigten Fällen mit nicht chronologischer Anordnung auf der x-Achse irreführen sollten. Dies zeigt Fehlrepräsentation durch Visualisierungstricks. |
| **Illusion der freien Wahl** | 2020 - Lern-App [ABCmouse zahlte $10M, um eine FTC-Beschwerde beizulegen](https://www.washingtonpost.com/business/2020/09/04/abcmouse-10-million-ftc-settlement/), bei der Eltern in Abonnements gefangen waren, die sie nicht kündigen konnten. Dies zeigt Dark Patterns in Entscheidungsarchitekturen, bei denen Nutzer zu potenziell schädlichen Entscheidungen gedrängt wurden. |
| **Datenschutz & Nutzerrechte** | 2021 - Facebook [Datenleck](https://www.npr.org/2021/04/09/986005820/after-data-breach-exposes-530-million-facebook-says-it-will-not-notify-users) enthüllte Daten von 530 Millionen Nutzern, was zu einer $5B-Einigung mit der FTC führte. Facebook weigerte sich jedoch, die Nutzer über das Leck zu informieren, was die Nutzerrechte in Bezug auf Datentransparenz und Zugriff verletzte. |
Möchten Sie weitere Fallstudien erkunden? Schauen Sie sich diese Ressourcen an:
* [Ethics Unwrapped](https://ethicsunwrapped.utexas.edu/case-studies) - ethische Dilemmata in verschiedenen Branchen.
* [Data Science Ethics course](https://www.coursera.org/learn/data-science-ethics#syllabus) - wegweisende Fallstudien untersucht.
* [Data Science Ethics course](https://www.coursera.org/learn/data-science-ethics#syllabus) - wegweisende Fallstudien.
* [Wo Dinge schiefgelaufen sind](https://deon.drivendata.org/examples/) - Deon-Checkliste mit Beispielen.
> 🚨 Denken Sie über die Fallstudien nach, die Sie gesehen haben haben Sie ähnliche ethische Herausforderungen in Ihrem Leben erlebt oder wurden davon betroffen? Können Sie mindestens eine weitere Fallstudie nennen, die eine der ethischen Herausforderungen illustriert, die wir in diesem Abschnitt besprochen haben?
> 🚨 Denken Sie über die Fallstudien nach, die Sie gesehen haben haben Sie ähnliche ethische Herausforderungen in Ihrem Leben erlebt oder wurden davon betroffen? Können Sie mindestens eine weitere Fallstudie nennen, die eine der ethischen Herausforderungen in diesem Abschnitt illustriert?
## Angewandte Ethik
Wir haben über ethische Konzepte, Herausforderungen und Fallstudien in realen Kontexten gesprochen. Aber wie beginnen wir mit der _Anwendung_ ethischer Prinzipien und Praktiken in unseren Projekten? Und wie _operationalisieren_ wir diese Praktiken für eine bessere Governance? Lassen Sie uns einige Lösungen aus der Praxis erkunden:
### 1. Berufscodes
### 1. Berufliche Kodizes
Berufscodes bieten eine Möglichkeit für Organisationen, Mitglieder zu "motivieren", ihre ethischen Prinzipien und ihre Mission zu unterstützen. Codes sind _moralische Richtlinien_ für berufliches Verhalten, die Mitarbeitern oder Mitgliedern helfen, Entscheidungen zu treffen, die mit den Prinzipien ihrer Organisation übereinstimmen. Sie sind nur so gut wie die freiwillige Einhaltung durch die Mitglieder; viele Organisationen bieten jedoch zusätzliche Belohnungen und Strafen, um die Einhaltung zu fördern.
Berufliche Kodizes bieten eine Möglichkeit für Organisationen, Mitglieder zu "motivieren", ihre ethischen Prinzipien und ihre Mission zu unterstützen. Kodizes sind _moralische Leitlinien_ für berufliches Verhalten, die Mitarbeitern oder Mitgliedern helfen, Entscheidungen zu treffen, die mit den Prinzipien ihrer Organisation übereinstimmen. Sie sind nur so gut wie die freiwillige Einhaltung durch die Mitglieder; viele Organisationen bieten jedoch zusätzliche Belohnungen und Strafen, um die Einhaltung zu fördern.
Beispiele:
* [Oxford Munich](http://www.code-of-ethics.org/code-of-conduct/) Code of Ethics
* [Data Science Association](http://datascienceassn.org/code-of-conduct.html) Code of Conduct (erstellt 2013)
* [Oxford Munich](http://www.code-of-ethics.org/code-of-conduct/) Ethikkodex
* [Data Science Association](http://datascienceassn.org/code-of-conduct.html) Verhaltenskodex (erstellt 2013)
* [ACM Code of Ethics and Professional Conduct](https://www.acm.org/code-of-ethics) (seit 1993)
> 🚨 Gehören Sie einer professionellen Ingenieur- oder Datenwissenschaftsorganisation an? Erkunden Sie deren Website, um zu sehen, ob sie einen Berufskodex definiert. Was sagt dies über ihre ethischen Prinzipien aus? Wie motivieren sie Mitglieder, den Kodex zu befolgen?
> 🚨 Gehören Sie einer professionellen Ingenieur- oder Datenwissenschaftsorganisation an? Erkunden Sie deren Website, um zu sehen, ob sie einen beruflichen Ethikkodex definieren. Was sagt dieser über ihre ethischen Prinzipien aus? Wie motivieren sie Mitglieder, den Kodex zu befolgen?
### 2. Ethik-Checklisten
Während Berufscodes das erforderliche _ethische Verhalten_ von Praktikern definieren, haben sie [bekannte Einschränkungen](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md) bei der Durchsetzung, insbesondere in groß angelegten Projekten. Stattdessen befürworten viele Datenwissenschaftsexperten [Checklisten](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md), die **Prinzipien mit Praktiken** auf deterministische und umsetzbare Weise verbinden können.
Während berufliche Kodizes erforderliches _ethisches Verhalten_ von Praktikern definieren, haben sie [bekannte Einschränkungen](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md) bei der Durchsetzung, insbesondere in groß angelegten Projekten. Stattdessen befürworten viele Datenwissenschaftsexperten [Checklisten](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md), die **Prinzipien mit Praktiken** auf deterministische und umsetzbare Weise verbinden können.
Checklisten wandeln Fragen in "Ja/Nein"-Aufgaben um, die operationalisiert werden können, sodass sie als Teil standardmäßiger Produktfreigabeworkflows verfolgt werden können.
Beispiele:
* [Deon](https://deon.drivendata.org/) - eine allgemeine Datenethik-Checkliste, erstellt aus [Empfehlungen der Branche](https://deon.drivendata.org/#checklist-citations) mit einem Befehlszeilentool für einfache Integration.
* [Privacy Audit Checklist](https://cyber.harvard.edu/ecommerce/privacyaudit.html) - bietet allgemeine Leitlinien für Informationshandhabungspraktiken aus rechtlicher und sozialer Perspektive.
* [AI Fairness Checklist](https://www.microsoft.com/en-us/research/project/ai-fairness-checklist/) - erstellt von KI-Praktikern, um die Integration von Fairness-Checks in KI-Entwicklungszyklen zu unterstützen.
* [AI Fairness Checklist](https://www.microsoft.com/en-us/research/project/ai-fairness-checklist/) - erstellt von KI-Praktikern zur Unterstützung der Integration von Fairness-Checks in KI-Entwicklungszyklen.
* [22 Fragen zur Ethik in Daten und KI](https://medium.com/the-organization/22-questions-for-ethics-in-data-and-ai-efb68fd19429) - ein offeneres Framework, strukturiert für die erste Untersuchung ethischer Fragen in Design-, Implementierungs- und organisatorischen Kontexten.
### 3. Ethik-Regulierungen
Ethik bedeutet, gemeinsame Werte zu definieren und das Richtige _freiwillig_ zu tun. **Compliance** bedeutet, _das Gesetz zu befolgen_, falls und wo es definiert ist. **Governance** umfasst allgemein alle Möglichkeiten, wie Organisationen ethische Prinzipien durchsetzen und festgelegte Gesetze einhalten.
Ethik bedeutet, gemeinsame Werte zu definieren und das Richtige _freiwillig_ zu tun. **Compliance** bedeutet, _das Gesetz zu befolgen_, falls und wo es definiert ist. **Governance** umfasst allgemein alle Möglichkeiten, wie Organisationen ethische Prinzipien durchsetzen und gesetzliche Vorschriften einhalten.
Heute nimmt Governance in Organisationen zwei Formen an. Erstens geht es darum, **ethische KI**-Prinzipien zu definieren und Praktiken zu etablieren, um die Einführung in allen KI-bezogenen Projekten der Organisation zu operationalisieren. Zweitens geht es darum, alle staatlich vorgeschriebenen **Datenschutzbestimmungen** für die Regionen, in denen sie tätig sind, einzuhalten.
Heute nimmt Governance in Organisationen zwei Formen an. Erstens geht es darum, **ethische KI**-Prinzipien zu definieren und Praktiken zu etablieren, um die Einführung in allen KI-bezogenen Projekten der Organisation zu operationalisieren. Zweitens geht es darum, alle staatlich vorgeschriebenen **Datenschutzvorschriften** für die Regionen, in denen sie tätig sind, einzuhalten.
Beispiele für Datenschutz- und Privatsphäre-Regulierungen:
@ -235,31 +235,33 @@ Beispiele für Datenschutz- und Privatsphäre-Regulierungen:
* `1998`, [US Children's Online Privacy Protection Act (COPPA)](https://www.ftc.gov/enforcement/rules/rulemaking-regulatory-reform-proceedings/childrens-online-privacy-protection-rule) - schützt die Datenprivatsphäre von Kindern unter 13 Jahren.
* `2018`, [General Data Protection Regulation (GDPR)](https://gdpr-info.eu/) - bietet Nutzerrechte, Datenschutz und Privatsphäre.
* `2018`, [California Consumer Privacy Act (CCPA)](https://www.oag.ca.gov/privacy/ccpa) gibt Verbrauchern mehr _Rechte_ über ihre (persönlichen) Daten.
* `2021`, Chinas [Gesetz zum Schutz persönlicher Informationen](https://www.reuters.com/world/china/china-passes-new-personal-data-privacy-law-take-effect-nov-1-2021-08-20/) wurde gerade verabschiedet und schafft eine der weltweit stärksten Online-Datenschutzbestimmungen.
* `2021`, Chinas [Gesetz zum Schutz persönlicher Informationen](https://www.reuters.com/world/china/china-passes-new-personal-data-privacy-law-take-effect-nov-1-2021-08-20/) wurde gerade verabschiedet und schafft eine der weltweit stärksten Online-Datenschutzvorschriften.
> 🚨 Die von der Europäischen Union definierte Datenschutz-Grundverordnung (GDPR) bleibt eine der einflussreichsten Datenschutzbestimmungen heute. Wussten Sie, dass sie auch [8 Nutzerrechte](https://www.freeprivacypolicy.com/blog/8-user-rights-gdpr) definiert, um die digitale Privatsphäre und persönlichen Daten der Bürger zu schützen? Erfahren Sie, was diese sind und warum sie wichtig sind.
> 🚨 Die von der Europäischen Union definierte Datenschutz-Grundverordnung (GDPR) bleibt eine der einflussreichsten Datenschutzvorschriften heute. Wussten Sie, dass sie auch [8 Nutzerrechte](https://www.freeprivacypolicy.com/blog/8-user-rights-gdpr) definiert, um die digitale Privatsphäre und persönlichen Daten der Bürger zu schützen? Erfahren Sie, was diese sind und warum sie wichtig sind.
### 4. Ethikkultur
Beachten Sie, dass es eine immaterielle Lücke zwischen _Compliance_ (genug tun, um "den Buchstaben des Gesetzes" zu erfüllen) und der Bewältigung [systemischer Probleme](https://www.coursera.org/learn/data-science-ethics/home/week/4) (wie Versteinerung, Informationsasymmetrie und Verteilungsungerechtigkeit) gibt, die die Waffenfähigkeit von KI beschleunigen können.
Letzteres erfordert [kollaborative Ansätze zur Definition von Ethikkulturen](https://towardsdatascience.com/why-ai-ethics-requires-a-culture-driven-approach-26f451afa29f), die emotionale Verbindungen und konsistente gemeinsame Werte _über Organisationen hinweg_ in der Branche aufbauen. Dies erfordert mehr [formalisierte Datenethikkulturen](https://www.codeforamerica.org/news/formalizing-an-ethical-data-culture/) in Organisationen sodass _jeder_ [die Andon-Schnur ziehen](https://en.wikipedia.org/wiki/Andon_(manufacturing)) kann (um ethische Bedenken frühzeitig zu äußern) und _ethische Bewertungen_ (z. B. bei der Einstellung) zu einem Kernkriterium der Teamzusammenstellung in KI-Projekten macht.
Letzteres erfordert [kollaborative Ansätze zur Definition von Ethikkulturen](https://towardsdatascience.com/why-ai-ethics-requires-a-culture-driven-approach-26f451afa29f), die emotionale Verbindungen und konsistente gemeinsame Werte _über Organisationen hinweg_ in der Branche schaffen. Dies erfordert mehr [formalisierte Datenethikkulturen](https://www.codeforamerica.org/news/formalizing-an-ethical-data-culture/) in Organisationen sodass _jeder_ [die Andon-Schnur ziehen](https://en.wikipedia.org/wiki/Andon_(manufacturing)) kann (um ethische Bedenken frühzeitig zu äußern) und _ethische Bewertungen_ (z. B. bei der Einstellung) ein Kernkriterium für die Teamzusammenstellung in KI-Projekten werden.
---
## [Quiz nach der Vorlesung](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/3) 🎯
## [Quiz nach der Vorlesung](https://ff-quizzes.netlify.app/en/ds/) 🎯
## Überprüfung & Selbststudium
Kurse und Bücher helfen, grundlegende ethische Konzepte und Herausforderungen zu verstehen, während Fallstudien und Tools bei der Anwendung ethischer Praktiken in realen Kontexten helfen. Hier sind einige Ressourcen, um zu beginnen:
Kurse und Bücher helfen, grundlegende Ethikkonzepte und Herausforderungen zu verstehen, während Fallstudien und Tools bei der Anwendung ethischer Praktiken in realen Kontexten helfen. Hier sind einige Ressourcen für den Einstieg:
* [Machine Learning For Beginners](https://github.com/microsoft/ML-For-Beginners/blob/main/1-Introduction/3-fairness/README.md) - Lektion über Fairness, von Microsoft.
* [Prinzipien der verantwortungsvollen KI](https://docs.microsoft.com/en-us/learn/modules/responsible-ai-principles/) - kostenloser Lernpfad von Microsoft Learn.
* [Ethik und Data Science](https://resources.oreilly.com/examples/0636920203964) - O'Reilly EBook (M. Loukides, H. Mason et. al)
* [Ethik in der Datenwissenschaft](https://www.coursera.org/learn/data-science-ethics#syllabus) - Online-Kurs der Universität Michigan.
* [Ethik Entfaltet](https://ethicsunwrapped.utexas.edu/case-studies) - Fallstudien der Universität Texas.
* [Machine Learning For Beginners](https://github.com/microsoft/ML-For-Beginners/blob/main/1-Introduction/3-fairness/README.md) - Lektion über Fairness von Microsoft.
* [Prinzipien der verantwortungsvollen KI](https://docs.microsoft.com/en-us/learn/modules/responsible-ai-principles/) kostenloser Lernpfad von Microsoft Learn.
* [Ethik und Data Science](https://resources.oreilly.com/examples/0636920203964) O'Reilly E-Book (M. Loukides, H. Mason et. al).
* [Ethik in der Datenwissenschaft](https://www.coursera.org/learn/data-science-ethics#syllabus) Online-Kurs der Universität Michigan.
* [Ethics Unwrapped](https://ethicsunwrapped.utexas.edu/case-studies) Fallstudien der Universität Texas.
# Aufgabe
# Aufgabe
[Schreiben Sie eine Fallstudie zur Datenethik](assignment.md)
[Schreiben Sie eine Fallstudie zur Datenethik](assignment.md)
---
**Haftungsausschluss**:
Dieses Dokument wurde mit dem KI-Übersetzungsdienst [Co-op Translator](https://github.com/Azure/co-op-translator) übersetzt. Obwohl wir uns um Genauigkeit bemühen, weisen wir darauf hin, dass automatisierte Übersetzungen Fehler oder Ungenauigkeiten enthalten können. Das Originaldokument in seiner ursprünglichen Sprache sollte als maßgebliche Quelle betrachtet werden. Für kritische Informationen wird eine professionelle menschliche Übersetzung empfohlen. Wir übernehmen keine Haftung für Missverständnisse oder Fehlinterpretationen, die sich aus der Nutzung dieser Übersetzung ergeben.
Dieses Dokument wurde mit dem KI-Übersetzungsdienst [Co-op Translator](https://github.com/Azure/co-op-translator) übersetzt. Obwohl wir uns um Genauigkeit bemühen, beachten Sie bitte, dass automatisierte Übersetzungen Fehler oder Ungenauigkeiten enthalten können. Das Originaldokument in seiner ursprünglichen Sprache sollte als maßgebliche Quelle betrachtet werden. Für kritische Informationen wird eine professionelle menschliche Übersetzung empfohlen. Wir übernehmen keine Haftung für Missverständnisse oder Fehlinterpretationen, die sich aus der Nutzung dieser Übersetzung ergeben.

@ -1,8 +1,8 @@
<!--
CO_OP_TRANSLATOR_METADATA:
{
"original_hash": "8796f41f566a0a8ebb72863a83d558ed",
"translation_date": "2025-08-26T21:16:15+00:00",
"original_hash": "3a34157cc63516eba97c89a0b2f8c3e6",
"translation_date": "2025-09-03T21:23:28+00:00",
"source_file": "1-Introduction/02-ethics/README.md",
"language_code": "el"
}
@ -17,18 +17,15 @@ CO_OP_TRANSLATOR_METADATA:
Είμαστε όλοι πολίτες δεδομένων που ζούμε σε έναν κόσμο γεμάτο δεδομένα.
Οι τάσεις της αγοράς μας λένε ότι μέχρι το 2022, 1 στις 3 μεγάλες οργανώσεις θα αγοράζει και θα πουλά τα δεδομένα της μέσω διαδικτυακών [Αγορών και Ανταλλακτηρίων](https://www.gartner.com/smarterwithgartner/gartner-top-10-trends-in-data-and-analytics-for-2020/). Ως **Προγραμματιστές Εφαρμογών**, θα βρίσκουμε πιο εύκολο και οικονομικό να ενσωματώνουμε πληροφορίες που βασίζονται σε δεδομένα και αυτοματισμούς που βασίζονται σε αλγορίθμους στις καθημερινές εμπειρίες των χρηστών. Αλλά καθώς η Τεχνητή Νοημοσύνη (AI) γίνεται πανταχού παρούσα, θα πρέπει επίσης να κατανοήσουμε τις πιθανές βλάβες που προκαλούνται από τη [χρήση της ως όπλο](https://www.youtube.com/watch?v=TQHs8SA1qpk) σε μεγάλη κλίμακα.
Οι τάσεις της αγοράς δείχνουν ότι μέχρι το 2022, 1 στους 3 μεγάλους οργανισμούς θα αγοράζει και θα πουλάει δεδομένα μέσω διαδικτυακών [Αγορών και Ανταλλακτηρίων](https://www.gartner.com/smarterwithgartner/gartner-top-10-trends-in-data-and-analytics-for-2020/). Ως **Προγραμματιστές Εφαρμογών**, θα βρούμε πιο εύκολο και οικονομικό να ενσωματώσουμε πληροφορίες που βασίζονται σε δεδομένα και αυτοματισμούς που βασίζονται σε αλγόριθμους στις καθημερινές εμπειρίες των χρηστών. Αλλά καθώς η τεχνητή νοημοσύνη γίνεται πανταχού παρούσα, θα πρέπει επίσης να κατανοήσουμε τις πιθανές βλάβες που προκαλούνται από τη [χρήση ως όπλο](https://www.youtube.com/watch?v=TQHs8SA1qpk) τέτοιων αλγορίθμων σε μεγάλη κλίμακα.
Οι τάσεις δείχνουν επίσης ότι θα δημιουργήσουμε και θα καταναλώσουμε πάνω από [180 zettabytes](https://www.statista.com/statistics/871513/worldwide-data-created/) δεδομένων μέχρι το 2025. Ως **Επιστήμονες Δεδομένων**, αυτό μας δίνει πρωτοφανή επίπεδα πρόσβασης σε προσωπικά δεδομένα. Αυτό σημαίνει ότι μπορούμε να δημιουργήσουμε προφίλ συμπεριφοράς χρηστών και να επηρεάσουμε τη λήψη αποφάσεων με τρόπους που δημιουργούν μια [ψευδαίσθηση ελεύθερης επιλογής](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice), ενώ ενδεχομένως κατευθύνουμε τους χρήστες προς αποτελέσματα που προτιμούμε. Αυτό εγείρει επίσης ευρύτερα ερωτήματα σχετικά με την ιδιωτικότητα των δεδομένων και την προστασία των χρηστών.
Η ηθική των δεδομένων είναι πλέον _απαραίτητοι κανόνες ασφαλείας_ για την επιστήμη και τη μηχανική των δεδομένων, βοηθώντας μας να ελαχιστοποιήσουμε τις πιθανές βλάβες και τις ακούσιες συνέπειες από τις ενέργειές μας που βασίζονται σε δεδομένα. Ο [Κύκλος Υπερβολής της Gartner για την AI](https://www.gartner.com/smarterwithgartner/2-megatrends-dominate-the-gartner-hype-cycle-for-artificial-intelligence-2020/) αναγνωρίζει σχετικές τάσεις στην ψηφιακή ηθική, την υπεύθυνη AI και τη διακυβέρνηση της AI ως βασικούς παράγοντες για μεγαλύτερες τάσεις γύρω από τη _δημοκρατικοποίηση_ και τη ιομηχανοποίηση_ της AI.
![Κύκλος Υπερβολής της Gartner για την AI - 2020](https://images-cdn.newscred.com/Zz1mOWJhNzlkNDA2ZTMxMWViYjRiOGFiM2IyMjQ1YmMwZQ==)
Σε αυτό το μάθημα, θα εξερευνήσουμε τον συναρπαστικό τομέα της ηθικής των δεδομένων - από βασικές έννοιες και προκλήσεις, μέχρι μελέτες περιπτώσεων και εφαρμοσμένες έννοιες AI όπως η διακυβέρνηση - που βοηθούν στη δημιουργία μιας κουλτούρας ηθικής στις ομάδες και τους οργανισμούς που εργάζονται με δεδομένα και AI.
Οι τάσεις δείχνουν επίσης ότι θα δημιουργήσουμε και θα καταναλώσουμε πάνω από [180 zettabytes](https://www.statista.com/statistics/871513/worldwide-data-created/) δεδομένων μέχρι το 2025. Ως **Επιστήμονες Δεδομένων**, αυτό μας δίνει πρωτοφανή επίπεδα πρόσβασης σε προσωπικά δεδομένα. Αυτό σημαίνει ότι μπορούμε να δημιουργήσουμε προφίλ συμπεριφοράς χρηστών και να επηρεάσουμε τη λήψη αποφάσεων με τρόπους που δημιουργούν μια [ψευδαίσθηση ελεύθερης επιλογής](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice), ενώ ενδεχομένως καθοδηγούμε τους χρήστες προς αποτελέσματα που προτιμούμε. Αυτό εγείρει επίσης ευρύτερα ερωτήματα σχετικά με την ιδιωτικότητα των δεδομένων και την προστασία των χρηστών.
Η ηθική των δεδομένων είναι πλέον _απαραίτητα προστατευτικά μέτρα_ για την επιστήμη και τη μηχανική δεδομένων, βοηθώντας μας να ελαχιστοποιήσουμε τις πιθανές βλάβες και τις ακούσιες συνέπειες από τις ενέργειές μας που βασίζονται σε δεδομένα. Ο [Κύκλος Υπερβολής της Gartner για την Τεχνητή Νοημοσύνη](https://www.gartner.com/smarterwithgartner/2-megatrends-dominate-the-gartner-hype-cycle-for-artificial-intelligence-2020/) εντοπίζει σχετικές τάσεις στην ψηφιακή ηθική, την υπεύθυνη τεχνητή νοημοσύνη και τη διακυβέρνηση της τεχνητής νοημοσύνης ως βασικούς παράγοντες για μεγαλύτερες τάσεις γύρω από τη _δημοκρατικοποίηση_ και τη ιομηχανοποίηση_ της τεχνητής νοημοσύνης.
![Κύκλος Υπερβολής της Gartner για την Τεχνητή Νοημοσύνη - 2020](https://images-cdn.newscred.com/Zz1mOWJhNzlkNDA2ZTMxMWViYjRiOGFiM2IyMjQ1YmMwZQ==)
Σε αυτό το μάθημα, θα εξερευνήσουμε τον συναρπαστικό τομέα της ηθικής των δεδομένων - από βασικές έννοιες και προκλήσεις, μέχρι μελέτες περιπτώσεων και εφαρμοσμένες έννοιες τεχνητής νοημοσύνης όπως η διακυβέρνηση - που βοηθούν στη δημιουργία μιας κουλτούρας ηθικής σε ομάδες και οργανισμούς που εργάζονται με δεδομένα και τεχνητή νοημοσύνη.
## [Κουίζ πριν το μάθημα](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/2) 🎯
@ -36,16 +33,15 @@ CO_OP_TRANSLATOR_METADATA:
Ας ξεκινήσουμε κατανοώντας τη βασική ορολογία.
Η λέξη "ηθική" προέρχεται από την [ελληνική λέξη "ηθικός"](https://en.wikipedia.org/wiki/Ethics) (και τη ρίζα της "ήθος") που σημαίνει αρακτήρας ή ηθική φύση_.
**Ηθική** αφορά τις κοινές αξίες και ηθικές αρχές που διέπουν τη συμπεριφορά μας στην κοινωνία. Η ηθική δεν βασίζεται σε νόμους αλλά σε ευρέως αποδεκτούς κανόνες για το τι είναι "σωστό έναντι λάθους". Ωστόσο, οι ηθικές εκτιμήσεις μπορούν να επηρεάσουν πρωτοβουλίες εταιρικής διακυβέρνησης και κυβερνητικούς κανονισμούς που δημιουργούν περισσότερα κίνητρα για συμμόρφωση.
Η λέξη "ηθική" προέρχεται από την [ελληνική λέξη "ηθικός"](https://en.wikipedia.org/wiki/Ethics) (και τη ρίζα της "ήθος") που σημαίνει αρακτήρας ή ηθική φύση_.
**Ηθική των Δεδομένων** είναι ένας [νέος κλάδος της ηθικής](https://royalsocietypublishing.org/doi/full/10.1098/rsta.2016.0360#sec-1) που "μελετά και αξιολογεί ηθικά προβλήματα που σχετίζονται με _δεδομένα, αλγορίθμους και αντίστοιχες πρακτικές_". Εδώ, **"δεδομένα"** εστιάζουν σε ενέργειες που σχετίζονται με τη δημιουργία, καταγραφή, επιμέλεια, επεξεργασία, διάδοση, κοινή χρήση και χρήση, **"αλγόριθμοι"** εστιάζουν στην AI, τους πράκτορες, τη μηχανική μάθηση και τα ρομπότ, και **"πρακτικές"** εστιάζουν σε θέματα όπως η υπεύθυνη καινοτομία, ο προγραμματισμός, το hacking και οι κώδικες ηθικής.
**Ηθική** αφορά τις κοινές αξίες και τις ηθικές αρχές που διέπουν τη συμπεριφορά μας στην κοινωνία. Η ηθική βασίζεται όχι σε νόμους αλλά σε ευρέως αποδεκτούς κανόνες για το τι είναι "σωστό έναντι λάθους". Ωστόσο, οι ηθικές σκέψεις μπορούν να επηρεάσουν πρωτοβουλίες εταιρικής διακυβέρνησης και κυβερνητικούς κανονισμούς που δημιουργούν περισσότερα κίνητρα για συμμόρφωση.
**Εφαρμοσμένη Ηθική** είναι η [πρακτική εφαρμογή ηθικών εκτιμήσεων](https://en.wikipedia.org/wiki/Applied_ethics). Είναι η διαδικασία ενεργής διερεύνησης ηθικών ζητημάτων στο πλαίσιο ραγματικών ενεργειών, προϊόντων και διαδικασιών_ και η λήψη διορθωτικών μέτρων για να διασφαλιστεί ότι παραμένουν ευθυγραμμισμένα με τις καθορισμένες ηθικές μας αξίες.
**Ηθική των Δεδομένων** είναι ένας [νέος κλάδος της ηθικής](https://royalsocietypublishing.org/doi/full/10.1098/rsta.2016.0360#sec-1) που "μελετά και αξιολογεί ηθικά προβλήματα που σχετίζονται με _δεδομένα, αλγόριθμους και αντίστοιχες πρακτικές_". Εδώ, **"δεδομένα"** επικεντρώνονται σε ενέργειες που σχετίζονται με τη δημιουργία, την καταγραφή, τη φροντίδα, την επεξεργασία, τη διάδοση, την κοινή χρήση και τη χρήση, **"αλγόριθμοι"** επικεντρώνονται στην τεχνητή νοημοσύνη, τους πράκτορες, τη μηχανική μάθηση και τα ρομπότ, και **"πρακτικές"** επικεντρώνονται σε θέματα όπως η υπεύθυνη καινοτομία, ο προγραμματισμός, το hacking και οι κώδικες ηθικής.
**Κουλτούρα Ηθικής** αφορά την [_επιχειρησιακή εφαρμογή_ της εφαρμοσμένης ηθικής](https://hbr.org/2019/05/how-to-design-an-ethical-organization) για να διασφαλιστεί ότι οι ηθικές μας αρχές και πρακτικές υιοθετούνται με συνέπεια και κλίμακα σε ολόκληρο τον οργανισμό. Οι επιτυχημένες κουλτούρες ηθικής ορίζουν ηθικές αρχές σε επίπεδο οργανισμού, παρέχουν ουσιαστικά κίνητρα για συμμόρφωση και ενισχύουν τους κανόνες ηθικής ενθαρρύνοντας και ενισχύοντας τις επιθυμητές συμπεριφορές σε κάθε επίπεδο του οργανισμού.
**Εφαρμοσμένη Ηθική** είναι η [πρακτική εφαρμογή ηθικών σκέψεων](https://en.wikipedia.org/wiki/Applied_ethics). Είναι η διαδικασία ενεργής διερεύνησης ηθικών ζητημάτων στο πλαίσιο ραγματικών ενεργειών, προϊόντων και διαδικασιών_, και λήψης διορθωτικών μέτρων για να διασφαλιστεί ότι παραμένουν ευθυγραμμισμένα με τις καθορισμένες ηθικές αξίες μας.
**Κουλτούρα Ηθικής** αφορά την [_επιχειρησιακή εφαρμογή_ της εφαρμοσμένης ηθικής](https://hbr.org/2019/05/how-to-design-an-ethical-organization) για να διασφαλιστεί ότι οι ηθικές μας αρχές και πρακτικές υιοθετούνται με συνεπή και επεκτάσιμο τρόπο σε ολόκληρο τον οργανισμό. Οι επιτυχημένες κουλτούρες ηθικής ορίζουν ηθικές αρχές σε επίπεδο οργανισμού, παρέχουν ουσιαστικά κίνητρα για συμμόρφωση και ενισχύουν τους κανόνες ηθικής ενθαρρύνοντας και ενισχύοντας τις επιθυμητές συμπεριφορές σε κάθε επίπεδο του οργανισμού.
## Έννοιες Ηθικής
@ -53,68 +49,57 @@ CO_OP_TRANSLATOR_METADATA:
### 1. Αρχές Ηθικής
Κάθε στρατηγική ηθικής δεδομένων ξεκινά με τον ορισμό των _ηθικών αρχών_ - των "κοινών αξιών" που περιγράφουν αποδεκτές συμπεριφορές και καθοδηγούν συμμορφούμενες ενέργειες στα έργα δεδομένων και AI. Μπορείτε να τις ορίσετε σε ατομικό ή ομαδικό επίπεδο. Ωστόσο, οι περισσότερες μεγάλες οργανώσεις τις περιγράφουν σε μια δήλωση αποστολής ή πλαίσιο _ηθικής AI_ που ορίζεται σε εταιρικό επίπεδο και εφαρμόζεται με συνέπεια σε όλες τις ομάδες.
Κάθε στρατηγική ηθικής δεδομένων ξεκινά με τον ορισμό _ηθικών αρχών_ - των "κοινών αξιών" που περιγράφουν αποδεκτές συμπεριφορές και καθοδηγούν συμμορφούμενες ενέργειες στα έργα δεδομένων και τεχνητής νοημοσύνης μας. Μπορείτε να τις ορίσετε σε ατομικό ή ομαδικό επίπεδο. Ωστόσο, οι περισσότερες μεγάλες οργανώσεις τις περιγράφουν σε μια δήλωση αποστολής ή πλαίσιο _ηθικής τεχνητής νοημοσύνης_ που ορίζεται σε εταιρικό επίπεδο και εφαρμόζεται με συνέπεια σε όλες τις ομάδες.
**Παράδειγμα:** Η δήλωση αποστολής της Microsoft για την [Υπεύθυνη AI](https://www.microsoft.com/en-us/ai/responsible-ai) αναφέρει: _"Δεσμευόμαστε για την προώθηση της AI που καθοδηγείται από ηθικές αρχές που βάζουν τους ανθρώπους πρώτα"_ - προσδιορίζοντας 6 ηθικές αρχές στο παρακάτω πλαίσιο:
**Παράδειγμα:** Η δήλωση αποστολής της Microsoft για την [Υπεύθυνη Τεχνητή Νοημοσύνη](https://www.microsoft.com/en-us/ai/responsible-ai) αναφέρει: _"Δεσμευόμαστε για την προώθηση της τεχνητής νοημοσύνης που καθοδηγείται από ηθικές αρχές που βάζουν τους ανθρώπους πρώτα"_ - προσδιορίζοντας 6 ηθικές αρχές στο παρακάτω πλαίσιο:
![Υπεύθυνη AI στη Microsoft](https://docs.microsoft.com/en-gb/azure/cognitive-services/personalizer/media/ethics-and-responsible-use/ai-values-future-computed.png)
![Υπεύθυνη Τεχνητή Νοημοσύνη στη Microsoft](https://docs.microsoft.com/en-gb/azure/cognitive-services/personalizer/media/ethics-and-responsible-use/ai-values-future-computed.png)
Ας εξερευνήσουμε σύντομα αυτές τις αρχές. _Η διαφάνεια_ και _η λογοδοσία_ είναι θεμελιώδεις αξίες πάνω στις οποίες βασίζονται οι υπόλοιπες αρχές - ας ξεκινήσουμε από εκεί:
Ας εξερευνήσουμε σύντομα αυτές τις αρχές. _Η διαφάνεια_ και _η λογοδοσία_ είναι θεμελιώδεις αξίες πάνω στις οποίες βασίζονται οι άλλες αρχές - ας ξεκινήσουμε από εκεί:
* [**Λογοδοσία**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) καθιστά τους επαγγελματίες _υπεύθυνους_ για τις λειτουργίες δεδομένων και AI τους, καθώς και για τη συμμόρφωση με αυτές τις ηθικές αρχές.
* [**Διαφάνεια**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) διασφαλίζει ότι οι ενέργειες δεδομένων και AI είναι ατανοητές_ (ερμηνεύσιμες) από τους χρήστες, εξηγώντας το τι και το γιατί πίσω από τις αποφάσεις.
* [**Δικαιοσύνη**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1%3aprimaryr6) - εστιάζει στη διασφάλιση ότι η AI αντιμετωπίζει _όλους τους ανθρώπους_ δίκαια, αντιμετωπίζοντας τυχόν συστημικές ή έμφυτες κοινωνικοτεχνικές προκαταλήψεις στα δεδομένα και τα συστήματα.
* [**Αξιοπιστία & Ασφάλεια**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - διασφαλίζει ότι η AI συμπεριφέρεται _συνεπώς_ με καθορισμένες αξίες, ελαχιστοποιώντας πιθανές βλάβες ή ακούσιες συνέπειες.
* [**Λογοδοσία**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) καθιστά τους επαγγελματίες _υπεύθυνους_ για τις λειτουργίες δεδομένων και τεχνητής νοημοσύνης τους και τη συμμόρφωση με αυτές τις ηθικές αρχές.
* [**Διαφάνεια**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) διασφαλίζει ότι οι ενέργειες δεδομένων και τεχνητής νοημοσύνης είναι ατανοητές_ (ερμηνεύσιμες) από τους χρήστες, εξηγώντας το τι και το γιατί πίσω από τις αποφάσεις.
* [**Δικαιοσύνη**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1%3aprimaryr6) - επικεντρώνεται στη διασφάλιση ότι η τεχνητή νοημοσύνη αντιμετωπίζει _όλους τους ανθρώπους_ δίκαια, αντιμετωπίζοντας τυχόν συστημικές ή έμμεσες κοινωνικο-τεχνικές προκαταλήψεις στα δεδομένα και τα συστήματα.
* [**Αξιοπιστία & Ασφάλεια**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - διασφαλίζει ότι η τεχνητή νοημοσύνη συμπεριφέρεται _συνεπώς_ με καθορισμένες αξίες, ελαχιστοποιώντας πιθανές βλάβες ή ακούσιες συνέπειες.
* [**Ιδιωτικότητα & Ασφάλεια**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - αφορά την κατανόηση της προέλευσης των δεδομένων και την παροχή ροστασίας ιδιωτικότητας δεδομένων_ στους χρήστες.
* [**Συμπερίληψη**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - αφορά το σχεδιασμό λύσεων AI με πρόθεση, προσαρμόζοντάς τες ώστε να καλύπτουν ένα υρύ φάσμα ανθρώπινων αναγκών_ και δυνατοτήτων.
* [**Συμπερίληψη**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - αφορά το σχεδιασμό λύσεων τεχνητής νοημοσύνης με πρόθεση, προσαρμόζοντάς τες για να καλύψουν ένα υρύ φάσμα ανθρώπινων αναγκών_ και δυνατοτήτων.
> 🚨 Σκεφτείτε ποια θα μπορούσε να είναι η δήλωση αποστολής σας για την ηθική των δεδομένων. Εξερευνήστε πλαίσια ηθικής AI από άλλους οργανισμούς - εδώ είναι παραδείγματα από [IBM](https://www.ibm.com/cloud/learn/ai-ethics), [Google](https://ai.google/principles), και [Facebook](https://ai.facebook.com/blog/facebooks-five-pillars-of-responsible-ai/). Ποιες κοινές αξίες έχουν; Πώς σχετίζονται αυτές οι αρχές με το προϊόν AI ή τη βιομηχανία στην οποία δραστηριοποιούνται;
> 🚨 Σκεφτείτε ποια θα μπορούσε να είναι η δήλωση αποστολής σας για την ηθική των δεδομένων. Εξερευνήστε πλαίσια ηθικής τεχνητής νοημοσύνης από άλλους οργανισμούς - εδώ είναι παραδείγματα από [IBM](https://www.ibm.com/cloud/learn/ai-ethics), [Google](https://ai.google/principles), και [Facebook](https://ai.facebook.com/blog/facebooks-five-pillars-of-responsible-ai/). Ποιες κοινές αξίες έχουν; Πώς σχετίζονται αυτές οι αρχές με το προϊόν τεχνητής νοημοσύνης ή τη βιομηχανία στην οποία δραστηριοποιούνται;
### 2. Προκλήσεις Ηθικής
Αφού ορίσουμε τις ηθικές αρχές, το επόμενο βήμα είναι να αξιολογήσουμε τις ενέργειες δεδομένων και AI για να δούμε αν ευθυγραμμίζονται με αυτές τις κοινές αξίες. Σκεφτείτε τις ενέργειές σας σε δύο κατηγορίες: _συλλογή δεδομένων_ και _σχεδιασμός αλγορίθμων_.
Αφού ορίσουμε τις ηθικές αρχές, το επόμενο βήμα είναι να αξιολογήσουμε τις ενέργειες μας στα δεδομένα και την τεχνητή νοημοσύνη για να δούμε αν ευθυγραμμίζονται με αυτές τις κοινές αξίες. Σκεφτείτε τις ενέργειές σας σε δύο κατηγορίες: _συλλογή δεδομένων_ και _σχεδιασμός αλγορίθμων_.
Με τη συλλογή δεδομένων, οι ενέργειες πιθανότατα θα περιλαμβάνουν **προσωπικά δεδομένα** ή προσωπικά αναγνωρίσιμες πληροφορίες (PII) για αναγνωρίσιμα ζωντανά άτομα. Αυτό περιλαμβάνει [διάφορα στοιχεία μη προσωπικών δεδομένων](https://ec.europa.eu/info/law/law-topic/data-protection/reform/what-personal-data_en) που _συλλογικά_ αναγνωρίζουν ένα άτομο. Οι ηθικές προκλήσεις μπορεί να σχετίζονται με _ιδιωτικότητα δεδομένων_, _ιδιοκτησία δεδομένων_ και συναφή θέματα όπως η νημερωμένη συγκατάθεση_ και τα ικαιώματα πνευματικής ιδιοκτησίας_ για τους χρήστες.
Με τη συλλογή δεδομένων, οι ενέργειες πιθανότατα θα περιλαμβάνουν **προσωπικά δεδομένα** ή προσωπικά αναγνωρίσιμες πληροφορίες (PII) για αναγνωρίσιμα ζωντανά άτομα. Αυτό περιλαμβάνει [διάφορα στοιχεία μη προσωπικών δεδομένων](https://ec.europa.eu/info/law/law-topic/data-protection/reform/what-personal-data_en) που _συλλογικά_ αναγνωρίζουν ένα άτομο. Οι ηθικές προκλήσεις μπορεί να σχετίζονται με _ιδιωτικότητα δεδομένων_, _ιδιοκτησία δεδομένων_, και συναφή θέματα όπως νημερωμένη συναίνεση_ και ικαιώματα πνευματικής ιδιοκτησίας_ για τους χρήστες.
Με το σχεδιασμό αλγορίθμων, οι ενέργειες θα περιλαμβάνουν τη συλλογή και επιμέλεια **συνόλων δεδομένων**, και στη συνέχεια τη χρήση τους για την εκπαίδευση και ανάπτυξη **μοντέλων δεδομένων** που προβλέπουν αποτελέσματα ή αυτοματοποιούν αποφάσεις σε πραγματικά πλαίσια. Οι ηθικές προκλήσεις μπορεί να προκύψουν από ροκατάληψη συνόλου δεδομένων_, _ζητήματα ποιότητας δεδομένων_, _αδικία_ και αραπλάνηση_ στους αλγορίθμους - συμπεριλαμβανομένων ορισμένων ζητημάτων που είναι συστημικής φύσης.
Σε αμφότερες τις περιπτώσεις, οι προκλήσεις ηθικής αναδεικνύουν περιοχές όπου οι ενέργειές μας ενδέχεται να έρχονται σε σύγκρουση με τις κοινές μας αξίες. Για να ανιχνεύσουμε, να μετριάσουμε, να ελαχιστοποιήσουμε ή να εξαλείψουμε αυτές τις ανησυχίες - πρέπει να κάνουμε ηθικές ερωτήσεις "ναι/όχι" σχετικά με τις ενέργειές μας και στη συνέχεια να λάβουμε διορθωτικές ενέργειες όπως απαιτείται. Ας δούμε μερικές ηθικές προκλήσεις και τις ηθικές ερωτήσεις που εγείρουν:
Με το σχεδιασμό αλγορίθμων, οι ενέργειες θα περιλαμβάνουν τη συλλογή και την επιμέλεια **συνόλων δεδομένων**, και στη συνέχεια τη χρήση τους για την εκπαίδευση και την ανάπτυξη **μοντέλων δεδομένων** που προβλέπουν αποτελέσματα ή αυτοματοποιούν αποφάσεις σε πραγματικά πλαίσια. Οι ηθικές προκλήσεις μπορεί να προκύψουν από ροκατάληψη συνόλου δεδομένων_, ροβλήματα ποιότητας δεδομένων_, _αδικία_ και αραπλάνηση_ στους αλγορίθμους - συμπεριλαμβανομένων ορισμένων ζητημάτων που είναι συστημικά στη φύση τους.
Σε αμφότερες τις περιπτώσεις, οι ηθικές προκλήσεις υπογραμμίζουν περιοχές όπου οι ενέργειές μας μπορεί να έρχονται σε σύγκρουση με τις κοινές αξίες μας. Για να ανιχνεύσουμε, να μετριάσουμε, να ελαχιστοποιήσουμε ή να εξαλείψουμε αυτές τις ανησυχίες - πρέπει να θέσουμε ηθικά "ναι/όχι" ερωτήματα σχετικά με τις ενέργειές μας και να λάβουμε διορθωτικά μέτρα όπως απαιτείται. Ας δούμε μερικές ηθικές προκλήσεις και τα ηθικά ερωτήματα που εγείρουν:
#### 2.1 Ιδιοκτησία Δεδομένων
Η συλλογή δεδομένων συχνά περιλαμβάνει προσωπικά δεδομένα που μπορούν να αναγνωρίσουν τα υποκείμενα των δεδομένων. [Η ιδιοκτησία δεδομένων](https://permission.io/blog/data-ownership) αφορά τον _έλεγχο_ και τα [ικαιώματα χρηστών_](https://permission.io/blog/data-ownership) που σχετίζονται με τη δημιουργία, επεξεργασία και διάδοση δεδομένων.
Η συλλογή δεδομένων συχνά περιλαμβάνει προσωπικά δεδομένα που μπορούν να αναγνωρίσουν τα υποκείμενα των δεδομένων. Η [ιδιοκτησία δεδομένων](https://permission.io/blog/data-ownership) αφορά τον _έλεγχο_ και τα [ικαιώματα χρηστών_](https://permission.io/blog/data-ownership) που σχετίζονται με τη δημιουργία, την επεξεργασία και τη διάδοση δεδομένων.
Οι ηθικές ερωτήσεις που πρέπει να κάνουμε είναι:
* Ποιος κατέχει τα δεδομένα; (χρήστης ή οργανισμός)
* Ποια δικαιώματα έχουν τα υποκείμενα των δεδομένων; (π.χ. πρόσβαση, διαγραφή, φορητότητα)
* Ποια δικαιώματα έχουν οι οργανισμοί; (π.χ. διόρθωση κακόβουλων κριτικών χρηστών)
Τα ηθικά ερωτήματα που πρέπει να θέσουμε είναι:
* Ποιος κατέχει τα δεδομένα; (χρήστης ή οργανισμός)
* Ποια δικαιώματα έχουν τα υποκείμενα των δεδομένων; (π.χ. πρόσβαση, διαγραφή, φορητότητα)
* Ποια δικαιώματα έχουν οι οργανισμοί; (π.χ. διόρθωση κακόβουλων κριτικών χρηστών)
#### 2.2 Ενημερωμένη Συγκατάθεση
#### 2.2 Ενημερωμένη Συναίνεση
[Η ενημερωμένη συγκατάθεση](https://legaldictionary.net/informed-consent/) ορίζει την πράξη των χρηστών να συμφωνούν σε μια ενέργεια (όπως η συλλογή δεδομένων) με _πλήρη κατανόηση_ των σχετικών γεγονότων, συμπεριλαμβανομένου του σκοπού, των πιθανών κινδύνων και των εναλλακτικών.
Η [ενημερωμένη συναίνεση](https://legaldictionary.net/informed-consent/) ορίζει την πράξη των χρηστών να συμφωνούν σε μια ενέργεια (όπως η συλλογή δεδομένων) με _πλήρη κατανόηση_ των σχετικών γεγονότων, συμπεριλαμβανομένου του σκοπού, των πιθανών κινδύνων και των εναλλακτικών.
Ερωτήσεις που πρέπει να εξεταστούν εδώ είναι:
* Έδωσε ο χρήστης (υποκείμενο δεδομένων) άδεια για τη συλλογή και χρήση δεδομένων;
* Κατάλαβε ο χρήστης τον σκοπό για τον οποίο συλλέχθηκαν τα δεδομένα;
* Κατάλαβε ο χρήστης τους πιθανούς κινδύνους από τη συμμετοχή του;
Ερωτήματα προς διερεύνηση εδώ είναι:
* Έδωσε ο χρήστης (υποκείμενο δεδομένων) άδεια για τη συλλογή και χρήση δεδομένων;
* Κατάλαβε ο χρήστης τον σκοπό για τον οποίο συλλέχθηκαν τα δεδομένα;
* Κατάλαβε ο χρήστης τους πιθανούς κινδύνους από τη συμμετοχή του;
#### 2.3 Πνευματική Ιδιοκτησία
[Η πνευματική ιδιοκτησία](https://en.wikipedia.org/wiki/Intellectual_property) αναφέρεται σε άυτες δημιουργίες που προκύπτουν από ανθρώπινη πρωτοβουλία, οι οποίες μπορεί να _έχουν οικονομική αξία_ για άτομα ή επιχειρήσεις.
Ερωτήσεις που πρέπει να εξεταστούν εδώ είναι:
* Είχαν τα συλλεχθέντα δεδομένα οικονομική αξία για έναν χρήστη ή μια επιχείρηση;
* Έχει ο **χρήστης** πνευματική ιδιοκτησία εδώ;
* Έχει ο **οργανισμός** πνευματική ιδιοκτησία εδώ;
* Αν υπάρχουν αυτά τα δικαιώματα, πώς τα προστατεύουμε;
#### 2.4 Ιδιωτικότητα Δεδομένων
[Η ιδιωτικότητα δεδομένων](https://www.northeastern.edu/graduate/blog/what-is-data-privacy/) ή η ιδιωτικότητα πληροφοριών αναφέρεται στη διατήρηση της ιδιωτικότητας των
[Algorithm Fairness](https://towardsdatascience.com/what-is-algorithm-fairness-3182e161cf9f) ελέγχει αν ο σχεδιασμός του αλγορίθμου συστηματικά εισάγει διακρίσεις εναντίον συγκεκριμένων υποομάδων υποκειμένων δεδομένων, οδηγώντας σε [πιθανές βλάβες](https://docs.microsoft.com/en-us/azure/machine-learning/concept-fairness-ml) στην ατανομή_ (όπου πόροι αρνούνται ή παρακρατούνται από αυτήν την ομάδα) και στην οιότητα υπηρεσιών_ (όπου η ακρίβεια της AI δεν είναι ίδια για όλες τις υποομάδες).
Η [πνευματική ιδιοκτησία](https://en.wikipedia.org/wiki/Intellectual_property) αναφέρεται σε άυλες δημιουργίες που προκύπτουν από ανθρώπινη πρωτοβουλία, οι οποίες
[Algorithm Fairness](https://towardsdatascience.com/what-is-algorithm-fairness-3182e161cf9f) εξετάζει αν ο σχεδιασμός του αλγορίθμου συστηματικά εισάγει διακρίσεις εναντίον συγκεκριμένων υποομάδων υποκειμένων δεδομένων, οδηγώντας σε [πιθανές βλάβες](https://docs.microsoft.com/en-us/azure/machine-learning/concept-fairness-ml) στην ατανομή_ (όπου πόροι αρνούνται ή παρακρατούνται από αυτήν την ομάδα) και στην οιότητα υπηρεσιών_ (όπου η ακρίβεια της AI δεν είναι ίδια για όλες τις υποομάδες).
Ερωτήσεις για διερεύνηση εδώ:
Ερωτήματα που πρέπει να εξεταστούν εδώ είναι:
* Αξιολογήσαμε την ακρίβεια του μοντέλου για διαφορετικές υποομάδες και συνθήκες;
* Εξετάσαμε το σύστημα για πιθανές βλάβες (π.χ., στερεότυπα);
* Μπορούμε να αναθεωρήσουμε δεδομένα ή να επανεκπαιδεύσουμε μοντέλα για να μετριάσουμε τις εντοπισμένες βλάβες;
@ -125,7 +110,7 @@ CO_OP_TRANSLATOR_METADATA:
[Παραπλάνηση δεδομένων](https://www.sciencedirect.com/topics/computer-science/misrepresentation) αφορά το ερώτημα αν επικοινωνούμε πληροφορίες από ειλικρινώς αναφερόμενα δεδομένα με τρόπο που παραπλανά για να υποστηρίξουμε μια επιθυμητή αφήγηση.
Ερωτήσεις για διερεύνηση εδώ:
Ερωτήματα που πρέπει να εξεταστούν εδώ είναι:
* Αναφέρουμε ελλιπή ή ανακριβή δεδομένα;
* Οπτικοποιούμε δεδομένα με τρόπο που οδηγεί σε παραπλανητικά συμπεράσματα;
* Χρησιμοποιούμε επιλεκτικές στατιστικές τεχνικές για να χειραγωγήσουμε αποτελέσματα;
@ -134,7 +119,7 @@ CO_OP_TRANSLATOR_METADATA:
#### 2.10 Ελεύθερη Επιλογή
Η [Ψευδαίσθηση της Ελεύθερης Επιλογής](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice) συμβαίνει όταν οι "αρχιτεκτονικές επιλογών" του συστήματος χρησιμοποιούν αλγορίθμους λήψης αποφάσεων για να ωθήσουν τους ανθρώπους προς ένα προτιμώμενο αποτέλεσμα, ενώ φαίνεται ότι τους δίνουν επιλογές και έλεγχο. Αυτά τα [σκοτεινά μοτίβα](https://www.darkpatterns.org/) μπορούν να προκαλέσουν κοινωνική και οικονομική βλάβη στους χρήστες. Επειδή οι αποφάσεις των χρηστών επηρεάζουν τα προφίλ συμπεριφοράς, αυτές οι ενέργειες ενδέχεται να οδηγήσουν σε μελλοντικές επιλογές που μπορούν να ενισχύσουν ή να επεκτείνουν τον αντίκτυπο αυτών των βλαβών.
Ερωτήσεις για διερεύνηση εδώ:
Ερωτήματα που πρέπει να εξεταστούν εδώ είναι:
* Κατάλαβε ο χρήστης τις συνέπειες της επιλογής που έκανε;
* Ήταν ο χρήστης ενήμερος για (εναλλακτικές) επιλογές και τα πλεονεκτήματα & μειονεκτήματα της κάθε μίας;
* Μπορεί ο χρήστης να αναιρέσει μια αυτοματοποιημένη ή επηρεασμένη επιλογή αργότερα;
@ -147,13 +132,13 @@ CO_OP_TRANSLATOR_METADATA:
| Ηθική Πρόκληση | Μελέτη Περίπτωσης |
|--- |--- |
| **Ενημερωμένη Συναίνεση** | 1972 - [Tuskegee Syphilis Study](https://en.wikipedia.org/wiki/Tuskegee_Syphilis_Study) - Αφροαμερικανοί άνδρες που συμμετείχαν στη μελέτη υποσχέθηκαν δωρεάν ιατρική περίθαλψη _αλλά εξαπατήθηκαν_ από ερευνητές που δεν ενημέρωσαν τους συμμετέχοντες για τη διάγνωσή τους ή για τη διαθεσιμότητα θεραπείας. Πολλοί συμμετέχοντες πέθαναν και οι σύντροφοι ή τα παιδιά τους επηρεάστηκαν. Η μελέτη διήρκεσε 40 χρόνια. |
| **Ιδιωτικότητα Δεδομένων** | 2007 - Το [Netflix data prize](https://www.wired.com/2007/12/why-anonymous-data-sometimes-isnt/) παρείχε στους ερευνητές _10 εκατομμύρια ανωνυμοποιημένες βαθμολογίες ταινιών από 50.000 πελάτες_ για να βοηθήσουν στη βελτίωση των αλγορίθμων συστάσεων. Ωστόσο, οι ερευνητές μπόρεσαν να συσχετίσουν ανωνυμοποιημένα δεδομένα με προσωπικά δεδομένα σε _εξωτερικές βάσεις δεδομένων_ (π.χ., σχόλια IMDb), ουσιαστικά "απο-ανωνυμοποιώντας" ορισμένους συνδρομητές του Netflix.|
| **Προκατάληψη Συλλογής Δεδομένων** | 2013 - Η πόλη της Βοστώνης [ανέπτυξε το Street Bump](https://www.boston.gov/transportation/street-bump), μια εφαρμογή που επέτρεπε στους πολίτες να αναφέρουν λακκούβες, παρέχοντας στην πόλη καλύτερα δεδομένα για τους δρόμους. Ωστόσο, [άτομα με χαμηλότερα εισοδήματα είχαν λιγότερη πρόσβαση σε αυτοκίνητα και τηλέφωνα](https://hbr.org/2013/04/the-hidden-biases-in-big-data), καθιστώντας τα προβλήματα των δρόμων τους αόρατα στην εφαρμογή. Οι προγραμματιστές συνεργάστηκαν με ακαδημαϊκούς για να αντιμετωπίσουν ζητήματα _ισότιμης πρόσβασης και ψηφιακών αποκλεισμών_ για δικαιοσύνη. |
| **Δικαιοσύνη Αλγορίθμων** | 2018 - Η MIT [Gender Shades Study](http://gendershades.org/overview.html) αξιολόγησε την ακρίβεια των προϊόντων AI ταξινόμησης φύλου, αποκαλύπτοντας κενά στην ακρίβεια για γυναίκες και άτομα με χρώμα. Μια [2019 Apple Card](https://www.wired.com/story/the-apple-card-didnt-see-genderand-thats-the-problem/) φάνηκε να προσφέρει λιγότερη πίστωση στις γυναίκες από ό,τι στους άνδρες. Και τα δύο παραδείγματα ανέδειξαν ζητήματα προκατάληψης αλγορίθμων που οδηγούν σε κοινωνικοοικονομικές βλάβες.|
| **Παραπλάνηση Δεδομένων** | 2020 - Το [Georgia Department of Public Health κυκλοφόρησε γραφήματα COVID-19](https://www.vox.com/covid-19-coronavirus-us-response-trump/2020/5/18/21262265/georgia-covid-19-cases-declining-reopening) που φαινόταν να παραπλανούν τους πολίτες σχετικά με τις τάσεις των επιβεβαιωμένων κρουσμάτων με μη χρονολογική ταξινόμηση στον άξονα x. Αυτό δείχνει παραπλάνηση μέσω τεχνασμάτων οπτικοποίησης. |
| **Ψευδαίσθηση Ελεύθερης Επιλογής** | 2020 - Η εκπαιδευτική εφαρμογή [ABCmouse πλήρωσε $10M για να διευθετήσει καταγγελία της FTC](https://www.washingtonpost.com/business/2020/09/04/abcmouse-10-million-ftc-settlement/) όπου οι γονείς παγιδεύτηκαν να πληρώνουν για συνδρομές που δεν μπορούσαν να ακυρώσουν. Αυτό δείχνει σκοτεινά μοτίβα στις αρχιτεκτονικές επιλογών, όπου οι χρήστες ωθήθηκαν σε δυνητικά επιβλαβείς επιλογές. |
| **Ιδιωτικότητα Δεδομένων & Δικαιώματα Χρηστών** | 2021 - Η [Διαρροή Δεδομένων του Facebook](https://www.npr.org/2021/04/09/986005820/after-data-breach-exposes-530-million-facebook-says-it-will-not-notify-users) αποκάλυψε δεδομένα από 530 εκατομμύρια χρήστες, οδηγώντας σε διακανονισμό $5B με την FTC. Ωστόσο, αρνήθηκε να ειδοποιήσει τους χρήστες για τη διαρροή, παραβιάζοντας τα δικαιώματα των χρηστών σχετικά με τη διαφάνεια και την πρόσβαση στα δεδομένα. |
| **Ενημερωμένη Συγκατάθεση** | 1972 - [Tuskegee Syphilis Study](https://en.wikipedia.org/wiki/Tuskegee_Syphilis_Study) - Αφροαμερικανοί άνδρες που συμμετείχαν στη μελέτη υποσχέθηκαν δωρεάν ιατρική φροντίδα _αλλά εξαπατήθηκαν_ από ερευνητές που δεν ενημέρωσαν τους συμμετέχοντες για τη διάγνωσή τους ή για τη διαθεσιμότητα θεραπείας. Πολλοί συμμετέχοντες πέθαναν και οι σύντροφοι ή τα παιδιά τους επηρεάστηκαν. Η μελέτη διήρκεσε 40 χρόνια. |
| **Ιδιωτικότητα Δεδομένων** | 2007 - Το [Netflix data prize](https://www.wired.com/2007/12/why-anonymous-data-sometimes-isnt/) παρείχε στους ερευνητές _10 εκατομμύρια ανωνυμοποιημένες βαθμολογίες ταινιών από 50.000 πελάτες_ για να βοηθήσουν στη βελτίωση των αλγορίθμων συστάσεων. Ωστόσο, οι ερευνητές κατάφεραν να συσχετίσουν ανωνυμοποιημένα δεδομένα με προσωπικά δεδομένα σε _εξωτερικά σύνολα δεδομένων_ (π.χ., σχόλια IMDb), ουσιαστικά "απο-ανωνυμοποιώντας" ορισμένους συνδρομητές του Netflix.|
| **Συλλογή Δεδομένων με Προκατάληψη** | 2013 - Η πόλη της Βοστώνης [ανέπτυξε το Street Bump](https://www.boston.gov/transportation/street-bump), μια εφαρμογή που επέτρεπε στους πολίτες να αναφέρουν λακκούβες, παρέχοντας στην πόλη καλύτερα δεδομένα για τους δρόμους. Ωστόσο, [άνθρωποι σε χαμηλότερες εισοδηματικές ομάδες είχαν λιγότερη πρόσβαση σε αυτοκίνητα και τηλέφωνα](https://hbr.org/2013/04/the-hidden-biases-in-big-data), καθιστώντας τα προβλήματα των δρόμων τους αόρατα στην εφαρμογή. Οι προγραμματιστές συνεργάστηκαν με ακαδημαϊκούς για να αντιμετωπίσουν ζητήματα _ισότιμης πρόσβασης και ψηφιακών διαφορών_ για δικαιοσύνη. |
| **Δικαιοσύνη Αλγορίθμων** | 2018 - Η MIT [Gender Shades Study](http://gendershades.org/overview.html) αξιολόγησε την ακρίβεια των προϊόντων AI ταξινόμησης φύλου, αποκαλύπτοντας κενά στην ακρίβεια για γυναίκες και άτομα με χρώμα. Μια [2019 Apple Card](https://www.wired.com/story/the-apple-card-didnt-see-genderand-thats-the-problem/) φαινόταν να προσφέρει λιγότερη πίστωση στις γυναίκες από ό,τι στους άνδρες. Και τα δύο παραδείγματα ανέδειξαν ζητήματα προκατάληψης αλγορίθμων που οδηγούν σε κοινωνικοοικονομικές βλάβες.|
| **Παραπλάνηση Δεδομένων** | 2020 - Το [Georgia Department of Public Health κυκλοφόρησε γραφήματα COVID-19](https://www.vox.com/covid-19-coronavirus-us-response-trump/2020/5/18/21262265/georgia-covid-19-cases-declining-reopening) που φαινόταν να παραπλανούν τους πολίτες σχετικά με τις τάσεις των επιβεβαιωμένων κρουσμάτων με μη χρονολογική σειρά στον άξονα x. Αυτό δείχνει παραπλάνηση μέσω τεχνασμάτων οπτικοποίησης. |
| **Ψευδαίσθηση Ελεύθερης Επιλογής** | 2020 - Η εφαρμογή μάθησης [ABCmouse πλήρωσε $10M για να διευθετήσει μια καταγγελία της FTC](https://www.washingtonpost.com/business/2020/09/04/abcmouse-10-million-ftc-settlement/) όπου οι γονείς παγιδεύτηκαν να πληρώνουν για συνδρομές που δεν μπορούσαν να ακυρώσουν. Αυτό δείχνει σκοτεινά μοτίβα στις αρχιτεκτονικές επιλογών, όπου οι χρήστες ωθήθηκαν σε δυνητικά επιβλαβείς επιλογές. |
| **Ιδιωτικότητα Δεδομένων & Δικαιώματα Χρηστών** | 2021 - Το Facebook [Data Breach](https://www.npr.org/2021/04/09/986005820/after-data-breach-exposes-530-million-facebook-says-it-will-not-notify-users) αποκάλυψε δεδομένα από 530 εκατομμύρια χρήστες, οδηγώντας σε διακανονισμό $5B με την FTC. Ωστόσο, αρνήθηκε να ειδοποιήσει τους χρήστες για την παραβίαση, παραβιάζοντας τα δικαιώματα των χρηστών σχετικά με τη διαφάνεια και την πρόσβαση στα δεδομένα. |
Θέλετε να εξερευνήσετε περισσότερες μελέτες περίπτωσης; Δείτε αυτούς τους πόρους:
* [Ethics Unwrapped](https://ethicsunwrapped.utexas.edu/case-studies) - ηθικά διλήμματα σε διάφορες βιομηχανίες.
@ -169,7 +154,7 @@ CO_OP_TRANSLATOR_METADATA:
### 1. Επαγγελματικοί Κώδικες
Οι Επαγγελματικοί Κώδικες προσφέρουν μια επιλογή για οργανισμούς να "ενθαρρύνουν" τα μέλη να υποστηρίξουν τις ηθικές αρχές και τη δήλωση αποστολής τους. Οι κώδικες είναι _ηθικές κατευθυντήριες γραμμές_ για επαγγελματική συμπεριφορά, βοηθώντας τους υπαλλήλους ή τα μέλη να λαμβάνουν αποφάσεις που ευθυγραμμίζονται με τις αρχές του οργανισμού τους. Είναι τόσο καλοί όσο η εθελοντική συμμόρφωση από τα μέλη. Ωστόσο, πολλοί οργανισμοί προσφέρουν πρόσθετες ανταμοιβές και ποινές για να παρακινήσουν τη συμμόρφωση από τα μέλη.
Οι Επαγγελματικοί Κώδικες προσφέρουν μια επιλογή για οργανισμούς να "ενθαρρύνουν" τα μέλη να υποστηρίξουν τις ηθικές τους αρχές και τη δήλωση αποστολής τους. Οι κώδικες είναι _ηθικές κατευθυντήριες γραμμές_ για επαγγελματική συμπεριφορά, βοηθώντας τους υπαλλήλους ή τα μέλη να λαμβάνουν αποφάσεις που ευθυγραμμίζονται με τις αρχές του οργανισμού τους. Είναι τόσο καλοί όσο η εθελοντική συμμόρφωση από τα μέλη. Ωστόσο, πολλοί οργανισμοί προσφέρουν πρόσθετες ανταμοιβές και ποινές για να παρακινήσουν τη συμμόρφωση από τα μέλη.
Παραδείγματα περιλαμβάνουν:
@ -183,38 +168,38 @@ CO_OP_TRANSLATOR_METADATA:
Ενώ οι επαγγελματικοί κώδικες ορίζουν την απαιτούμενη _ηθική συμπεριφορά_ από τους επαγγελματίες, [έχουν γνωστούς περιορισμούς](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md) στην επιβολή, ιδιαίτερα σε μεγάλης κλίμακας έργα. Αντίθετα, πολλοί ειδικοί στην επιστήμη δεδομένων [υποστηρίζουν λίστες ελέγχου](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md), που μπορούν να **συνδέσουν τις αρχές με τις πρακτικές** με πιο καθοριστικούς και εφαρμόσιμους τρόπους.
Οι λίστες ελέγχου μετατρέπουν ερωτήσεις σε "ναι/όχι" εργασίες που μπορούν να επιχειρησιακοποιηθούν, επιτρέποντάς τους να παρακολουθούνται ως μέρος των τυπικών ροών εργασίας κυκλοφορίας προϊόντων.
Οι λίστες ελέγχου μετατρέπουν ερωτήματα σε "ναι/όχι" εργασίες που μπορούν να επιχειρησιακοποιηθούν, επιτρέποντάς τους να παρακολουθούνται ως μέρος των τυπικών ροών εργασίας κυκλοφορίας προϊόντων.
Παραδείγματα περιλαμβάνουν:
* [Deon](https://deon.drivendata.org/) - μια γενικής χρήσης λίστα ελέγχου ηθικής δεδομένων που δημιουργήθηκε από [συστάσεις της βιομηχανίας](https://deon.drivendata.org/#checklist-citations) με ένα εργαλείο γραμμής εντολών για εύκολη ενσωμάτωση.
* [Privacy Audit Checklist](https://cyber.harvard.edu/ecommerce/privacyaudit.html) - παρέχει γενικές οδηγίες για πρακτικές χειρισμού πληροφοριών από νομικές και κοινωνικές προοπτικές έκθεσης.
* [AI Fairness Checklist](https://www.microsoft.com/en-us/research/project/ai-fairness-checklist/) - δημιουργήθηκε από επαγγελματίες AI για να υποστηρίξει την υιοθέτηση και ενσωμάτωση ελέγχων δικαιοσύνης στους κύκλους ανάπτυξης AI.
* [22 ερωτήσεις για την ηθική στα δεδομένα και την AI](https://medium.com/the-organization/22-questions-for-ethics-in-data-and-ai-efb68fd19429) - πιο ανοιχτό πλαίσιο, δομημένο για αρχική εξερεύνηση ηθικών ζητημάτων στο σχεδιασμό, την υλοποίηση και τα οργανωτικά πλαίσια.
* [22 questions for ethics in data and AI](https://medium.com/the-organization/22-questions-for-ethics-in-data-and-ai-efb68fd19429) - πιο ανοιχτό πλαίσιο, δομημένο για αρχική εξερεύνηση ηθικών ζητημάτων στο σχεδιασμό, την υλοποίηση και τα οργανωτικά πλαίσια.
### 3. Κανονισμοί Ηθικής
Η ηθική αφορά τον ορισμό κοινών αξιών και την εθελοντική σωστή πράξη. **Συμμόρφωση** αφορά την _τήρηση του νόμου_ όπου και αν ορίζεται. **Διακυβέρνηση** καλύπτει γενικά όλους τους τρόπους με τους οποίους οι οργανισμοί λειτουργούν για να επιβάλλουν ηθικές αρχές και να συμμορφώνονται με καθορισμένους νόμους.
Η ηθική αφορά τον ορισμό κοινών αξιών και την εθελοντική σωστή πράξη. **Συμμόρφωση** αφορά την _τήρηση του νόμου_ όπου και αν ορίζεται. **Διακυβέρνηση** καλύπτει ευρύτερα όλους τους τρόπους με τους οποίους οι οργανισμοί λειτουργούν για να επιβάλλουν ηθικές αρχές και να συμμορφώνονται με καθορισμένους νόμους.
Σήμερα, η διακυβέρνηση λαμβάνει δύο μορφές εντός οργανισμών. Πρώτον, αφορά τον ορισμό **ηθικών αρχών AI** και την καθιέρωση πρακτικών για την επιχειρησιακοποίηση της υιοθέτησης σε όλα τα έργα που σχετίζονται με AI στον οργανισμό. Δεύτερον, αφορά τη συμμόρφωση με όλους τους κυβερνητικά καθορισμένους **κανονισμούς προστασίας δεδομένων** για τις περιοχές στις οποίες λειτουργεί.
Σήμερα, η διακυβέρνηση λαμβάνει δύο μορφές εντός οργανισμών. Πρώτον, αφορά τον ορισμό **ηθικών αρχών AI** και τη δημιουργία πρακτικών για την επιχειρησιακοποίηση της υιοθέτησης σε όλα τα έργα AI του οργανισμού. Δεύτερον, αφορά τη συμμόρφωση με όλους τους κυβερνητικά καθορισμένους **κανονισμούς προστασίας δεδομένων** για τις περιοχές στις οποίες λειτουργεί.
Παραδείγματα κανονισμών προστασίας δεδομένων και ιδιωτικότητας:
* `1974`, [US Privacy Act](https://www.justice.gov/opcl/privacy-act-1974) - ρυθμίζει τη _συλλογή, χρήση και αποκάλυψη_ προσωπικών πληροφοριών από την ομοσπονδιακή κυβέρνηση.
* `1974`, [US Privacy Act](https://www.justice.gov/opcl/privacy-act-1974) - ρυθμίζει τη συλλογή, χρήση και αποκάλυψη προσωπικών πληροφοριών από την _ομοσπονδιακή κυβέρνηση_.
* `1996`, [US Health Insurance Portability & Accountability Act (HIPAA)](https://www.cdc.gov/phlp/publications/topic/hipaa.html) - προστατεύει προσωπικά δεδομένα υγείας.
* `1998`, [US Children's Online Privacy Protection Act (COPPA)](https://www.ftc.gov/enforcement/rules/rulemaking-regulatory-reform-proceedings/childrens-online-privacy-protection-rule) - προστατεύει την ιδιωτικότητα δεδομένων παιδιών κάτω των 13 ετών.
* `2018`, [General Data Protection Regulation (GDPR)](https://gdpr-info.eu/) - παρέχει δικαιώματα χρηστών, προστασία δεδομένων και ιδιωτικότητα.
* `2018`, [California Consumer Privacy Act (CCPA)](https://www.oag.ca.gov/privacy/ccpa) δίνει στους καταναλωτές περισσότερα ικαιώματα_ για τα (προσωπικά) δεδομένα τους.
* `2018`, [California Consumer Privacy Act (CCPA)](https://www.oag.ca.gov/privacy/ccpa) δίνει στους καταναλωτές περισσότερα ικαιώματα_ πάνω στα (προσωπικά) δεδομένα τους.
* `2021`, Η Κίνα [Personal Information Protection Law](https://www.reuters.com/world/china/china-passes-new-personal-data-privacy-law-take-effect-nov-1-2021-08-20/) μόλις πέρασε, δημιουργώντας έναν από τους ισχυρότερους κανονισμούς ιδιωτικότητας δεδομένων παγκοσμίως.
> 🚨 Η Ευρωπαϊ
* [Αρχές Υπεύθυνης Τεχνητής Νοημοσύνης](https://docs.microsoft.com/en-us/learn/modules/responsible-ai-principles/) - δωρεάν εκπαιδευτική διαδρομή από το Microsoft Learn.
* [Ηθική και Επιστήμη Δεδομένων](https://resources.oreilly.com/examples/0636920203964) - EBook από την O'Reilly (M. Loukides, H. Mason κ.ά.)
* [Ηθική στην Επιστήμη Δεδομένων](https://www.coursera.org/learn/data-science-ethics#syllabus) - διαδικτυακό μάθημα από το Πανεπιστήμιο του Μίσιγκαν.
* [Ethics Unwrapped](https://ethicsunwrapped.utexas.edu/case-studies) - μελέτες περιπτώσεων από το Πανεπιστήμιο του Τέξας.
> 🚨 Η Ευρωπαϊκή Ένωση όρισε το GDPR (Γενικός
* [Αρχές Υπεύθυνης Τεχνητής Νοημοσύνης](https://docs.microsoft.com/en-us/learn/modules/responsible-ai-principles/) - δωρεάν εκπαιδευτική διαδρομή από το Microsoft Learn.
* [Ηθική και Επιστήμη Δεδομένων](https://resources.oreilly.com/examples/0636920203964) - EBook από την O'Reilly (M. Loukides, H. Mason κ.ά.)
* [Ηθική στην Επιστήμη Δεδομένων](https://www.coursera.org/learn/data-science-ethics#syllabus) - διαδικτυακό μάθημα από το Πανεπιστήμιο του Michigan.
* [Ethics Unwrapped](https://ethicsunwrapped.utexas.edu/case-studies) - μελέτες περιπτώσεων από το Πανεπιστήμιο του Τέξας.
# Εργασία
# Εργασία
[Γράψτε Μια Μελέτη Περίπτωσης Ηθικής Δεδομένων](assignment.md)
[Γράψτε Μια Μελέτη Περίπτωσης Ηθικής Δεδομένων](assignment.md)
---

@ -1,8 +1,8 @@
<!--
CO_OP_TRANSLATOR_METADATA:
{
"original_hash": "8796f41f566a0a8ebb72863a83d558ed",
"translation_date": "2025-08-31T11:10:27+00:00",
"original_hash": "3a34157cc63516eba97c89a0b2f8c3e6",
"translation_date": "2025-09-03T20:48:08+00:00",
"source_file": "1-Introduction/02-ethics/README.md",
"language_code": "en"
}
@ -17,15 +17,15 @@ CO_OP_TRANSLATOR_METADATA:
We are all data citizens living in a world shaped by data.
Market trends suggest that by 2022, 1 in 3 large organizations will buy and sell their data through online [Marketplaces and Exchanges](https://www.gartner.com/smarterwithgartner/gartner-top-10-trends-in-data-and-analytics-for-2020/). As **App Developers**, it will become easier and more affordable to integrate data-driven insights and algorithmic automation into everyday user experiences. However, as AI becomes more widespread, we must also understand the potential harms caused by the [weaponization](https://www.youtube.com/watch?v=TQHs8SA1qpk) of such algorithms on a large scale.
Market trends suggest that by 2022, one in three large organizations will buy and sell their data through online [Marketplaces and Exchanges](https://www.gartner.com/smarterwithgartner/gartner-top-10-trends-in-data-and-analytics-for-2020/). As **App Developers**, it will become easier and more affordable to integrate data-driven insights and algorithm-based automation into everyday user experiences. However, as AI becomes more widespread, we must also understand the potential harms caused by the [weaponization](https://www.youtube.com/watch?v=TQHs8SA1qpk) of such algorithms on a large scale.
Trends also show that by 2025, we will create and consume over [180 zettabytes](https://www.statista.com/statistics/871513/worldwide-data-created/) of data. As **Data Scientists**, this gives us unprecedented access to personal data. This allows us to build behavioral profiles of users and influence decision-making in ways that create an [illusion of free choice](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice), potentially nudging users toward outcomes we prefer. It also raises broader questions about data privacy and user protections.
Trends also show that by 2025, we will create and consume over [180 zettabytes](https://www.statista.com/statistics/871513/worldwide-data-created/) of data. As **Data Scientists**, this provides unprecedented access to personal data, enabling us to build behavioral profiles of users and influence decision-making in ways that create an [illusion of free choice](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice) while potentially nudging users toward outcomes we prefer. This raises broader questions about data privacy and user protections.
Data ethics now serve as _necessary guardrails_ for data science and engineering, helping us minimize potential harms and unintended consequences of our data-driven actions. The [Gartner Hype Cycle for AI](https://www.gartner.com/smarterwithgartner/2-megatrends-dominate-the-gartner-hype-cycle-for-artificial-intelligence-2020/) highlights trends in digital ethics, responsible AI, and AI governance as key drivers for larger megatrends around the _democratization_ and _industrialization_ of AI.
Data ethics now serve as _necessary guardrails_ for data science and engineering, helping us minimize potential harms and unintended consequences from our data-driven actions. The [Gartner Hype Cycle for AI](https://www.gartner.com/smarterwithgartner/2-megatrends-dominate-the-gartner-hype-cycle-for-artificial-intelligence-2020/) highlights trends in digital ethics, responsible AI, and AI governance as key drivers for larger megatrends around the _democratization_ and _industrialization_ of AI.
![Gartner's Hype Cycle for AI - 2020](https://images-cdn.newscred.com/Zz1mOWJhNzlkNDA2ZTMxMWViYjRiOGFiM2IyMjQ1YmMwZQ==)
In this lesson, well explore the fascinating field of data ethics—from core concepts and challenges to case studies and applied AI concepts like governance—that help establish an ethics culture in teams and organizations working with data and AI.
In this lesson, we'll dive into the fascinating field of data ethics—covering core concepts and challenges, case studies, and applied AI concepts like governance—that help establish an ethics culture within teams and organizations working with data and AI.
## [Pre-lecture quiz](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/2) 🎯
@ -33,23 +33,23 @@ In this lesson, well explore the fascinating field of data ethics—from core
Lets begin by understanding some basic terminology.
The word "ethics" comes from the [Greek word "ethikos"](https://en.wikipedia.org/wiki/Ethics) (and its root "ethos"), meaning _character or moral nature_.
The word "ethics" comes from the [Greek word "ethikos"](https://en.wikipedia.org/wiki/Ethics) (and its root "ethos"), meaning _character or moral nature_.
**Ethics** refers to the shared values and moral principles that govern our behavior in society. Ethics are not based on laws but on widely accepted norms of what is "right vs. wrong." However, ethical considerations can influence corporate governance initiatives and government regulations, creating incentives for compliance.
**Ethics** refers to the shared values and moral principles that guide our behavior in society. Ethics are not based on laws but on widely accepted norms of what is "right vs. wrong." However, ethical considerations can influence corporate governance initiatives and government regulations, creating incentives for compliance.
**Data Ethics** is a [new branch of ethics](https://royalsocietypublishing.org/doi/full/10.1098/rsta.2016.0360#sec-1) that "studies and evaluates moral problems related to _data, algorithms, and corresponding practices_." Here, **"data"** focuses on actions like generation, recording, curation, processing, dissemination, sharing, and usage; **"algorithms"** focuses on AI, agents, machine learning, and robots; and **"practices"** focuses on topics like responsible innovation, programming, hacking, and ethics codes.
**Applied Ethics** is the [practical application of moral considerations](https://en.wikipedia.org/wiki/Applied_ethics). It involves actively investigating ethical issues in the context of _real-world actions, products, and processes_ and taking corrective measures to ensure alignment with defined ethical values.
**Ethics Culture** is about [_operationalizing_ applied ethics](https://hbr.org/2019/05/how-to-design-an-ethical-organization) to ensure that ethical principles and practices are adopted consistently and at scale across an organization. Successful ethics cultures define organization-wide ethical principles, provide meaningful incentives for compliance, and reinforce ethical norms by encouraging and amplifying desired behaviors at every level of the organization.
**Ethics Culture** is about [_operationalizing_ applied ethics](https://hbr.org/2019/05/how-to-design-an-ethical-organization) to ensure that ethical principles and practices are consistently and scalably adopted across an organization. Successful ethics cultures define organization-wide ethical principles, provide meaningful incentives for compliance, and reinforce ethical norms by encouraging and amplifying desired behaviors at every level of the organization.
## Ethics Concepts
In this section, well discuss concepts like **shared values** (principles) and **ethical challenges** (problems) for data ethics—and explore **case studies** to help you understand these concepts in real-world contexts.
In this section, well discuss concepts like **shared values** (principles) and **ethical challenges** (problems) in data ethics—and explore **case studies** to understand these concepts in real-world contexts.
### 1. Ethics Principles
Every data ethics strategy begins by defining _ethical principles_—the "shared values" that describe acceptable behaviors and guide compliant actions in our data and AI projects. These can be defined at an individual or team level. However, most large organizations outline these in an _ethical AI_ mission statement or framework, defined at the corporate level and enforced consistently across all teams.
Every data ethics strategy starts by defining _ethical principles_—the "shared values" that describe acceptable behaviors and guide compliant actions in data and AI projects. These can be defined at an individual or team level, but most large organizations outline them in an _ethical AI_ mission statement or framework that is defined at the corporate level and enforced consistently across all teams.
**Example:** Microsoft's [Responsible AI](https://www.microsoft.com/en-us/ai/responsible-ai) mission statement reads: _"We are committed to the advancement of AI driven by ethical principles that put people first"_—identifying six ethical principles in the framework below:
@ -57,28 +57,28 @@ Every data ethics strategy begins by defining _ethical principles_—the "shared
Lets briefly explore these principles. _Transparency_ and _accountability_ are foundational values upon which other principles are built—so lets start there:
* [**Accountability**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) makes practitioners _responsible_ for their data and AI operations and compliance with these ethical principles.
* [**Accountability**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) makes practitioners _responsible_ for their data and AI operations and compliance with ethical principles.
* [**Transparency**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) ensures that data and AI actions are _understandable_ (interpretable) to users, explaining the what and why behind decisions.
* [**Fairness**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1%3aprimaryr6) focuses on ensuring AI treats _all people_ fairly, addressing any systemic or implicit socio-technical biases in data and systems.
* [**Fairness**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1%3aprimaryr6) focuses on ensuring AI treats _all people_ fairly, addressing systemic or implicit socio-technical biases in data and systems.
* [**Reliability & Safety**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) ensures that AI behaves _consistently_ with defined values, minimizing potential harms or unintended consequences.
* [**Privacy & Security**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) is about understanding data lineage and providing _data privacy and related protections_ to users.
* [**Inclusiveness**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) is about designing AI solutions with intention, adapting them to meet a _broad range of human needs_ and capabilities.
* [**Privacy & Security**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) involves understanding data lineage and providing _data privacy and related protections_ to users.
* [**Inclusiveness**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) focuses on designing AI solutions with intention, adapting them to meet a _broad range of human needs_ and capabilities.
> 🚨 Think about what your data ethics mission statement could be. Explore ethical AI frameworks from other organizations—here are examples from [IBM](https://www.ibm.com/cloud/learn/ai-ethics), [Google](https://ai.google/principles), and [Facebook](https://ai.facebook.com/blog/facebooks-five-pillars-of-responsible-ai/). What shared values do they have in common? How do these principles relate to the AI product or industry they operate in?
> 🚨 Think about what your data ethics mission statement could be. Explore ethical AI frameworks from other organizations—examples include [IBM](https://www.ibm.com/cloud/learn/ai-ethics), [Google](https://ai.google/principles), and [Facebook](https://ai.facebook.com/blog/facebooks-five-pillars-of-responsible-ai/). What shared values do they have in common? How do these principles relate to the AI products or industries they operate in?
### 2. Ethics Challenges
Once ethical principles are defined, the next step is to evaluate our data and AI actions to see if they align with those shared values. Consider your actions in two categories: _data collection_ and _algorithm design_.
After defining ethical principles, the next step is to evaluate our data and AI actions to ensure they align with those shared values. Consider your actions in two categories: _data collection_ and _algorithm design_.
For data collection, actions often involve **personal data** or personally identifiable information (PII) for identifiable living individuals. This includes [various types of non-personal data](https://ec.europa.eu/info/law/law-topic/data-protection/reform/what-personal-data_en) that, when combined, can identify an individual. Ethical challenges may relate to _data privacy_, _data ownership_, and topics like _informed consent_ and _intellectual property rights_ for users.
In data collection, actions often involve **personal data** or personally identifiable information (PII) for identifiable living individuals. This includes [various types of non-personal data](https://ec.europa.eu/info/law/law-topic/data-protection/reform/what-personal-data_en) that, when combined, can identify an individual. Ethical challenges may relate to _data privacy_, _data ownership_, and topics like _informed consent_ and _intellectual property rights_ for users.
For algorithm design, actions involve collecting and curating **datasets**, then using them to train and deploy **data models** that predict outcomes or automate decisions in real-world contexts. Ethical challenges may arise from _dataset bias_, _data quality_ issues, _unfairness_, and _misrepresentation_ in algorithms—including systemic issues.
In algorithm design, actions involve collecting and curating **datasets**, then using them to train and deploy **data models** that predict outcomes or automate decisions in real-world contexts. Ethical challenges may arise from _dataset bias_, _data quality_ issues, _unfairness_, and _misrepresentation_ in algorithms—including systemic issues.
In both cases, ethical challenges highlight areas where actions may conflict with shared values. To detect, mitigate, minimize, or eliminate these concerns, we need to ask moral "yes/no" questions about our actions and take corrective measures as needed. Lets examine some ethical challenges and the moral questions they raise:
#### 2.1 Data Ownership
Data collection often involves personal data that can identify individuals. [Data ownership](https://permission.io/blog/data-ownership) is about _control_ and [_user rights_](https://permission.io/blog/data-ownership) related to the creation, processing, and dissemination of data.
Data collection often involves personal data that can identify individuals. [Data ownership](https://permission.io/blog/data-ownership) concerns _control_ and [_user rights_](https://permission.io/blog/data-ownership) related to the creation, processing, and dissemination of data.
Moral questions to consider:
* Who owns the data? (user or organization)
@ -87,11 +87,11 @@ Moral questions to consider:
#### 2.2 Informed Consent
[Informed consent](https://legaldictionary.net/informed-consent/) refers to users agreeing to an action (like data collection) with a _full understanding_ of relevant facts, including the purpose, potential risks, and alternatives.
[Informed consent](https://legaldictionary.net/informed-consent/) involves users agreeing to an action (like data collection) with a _full understanding_ of relevant facts, including the purpose, potential risks, and alternatives.
Questions to explore:
* Did the user (data subject) give permission for data capture and usage?
* Did the user understand the purpose for which the data was captured?
* Did the user understand the purpose of data collection?
* Did the user understand the potential risks of their participation?
#### 2.3 Intellectual Property
@ -100,18 +100,18 @@ Questions to explore:
Questions to explore:
* Did the collected data have economic value to a user or business?
* Does the **user** have intellectual property here?
* Does the **organization** have intellectual property here?
* If these rights exist, how are we protecting them?
* Does the **user** have intellectual property rights here?
* Does the **organization** have intellectual property rights here?
* If these rights exist, how are they being protected?
#### 2.4 Data Privacy
[Data privacy](https://www.northeastern.edu/graduate/blog/what-is-data-privacy/) refers to preserving user privacy and protecting user identity with respect to personally identifiable information.
Questions to explore:
* Is users (personal) data secured against hacks and leaks?
* Is users data accessible only to authorized users and contexts?
* Is users anonymity preserved when data is shared or disseminated?
* Is users' (personal) data secured against hacks and leaks?
* Is users' data accessible only to authorized users and contexts?
* Is users' anonymity preserved when data is shared or disseminated?
* Can a user be de-identified from anonymized datasets?
#### 2.5 Right To Be Forgotten
@ -126,7 +126,7 @@ Questions to explore:
#### 2.6 Dataset Bias
Dataset or [Collection Bias](http://researcharticles.com/index.php/bias-in-data-collection-in-research/) refers to selecting a _non-representative_ subset of data for algorithm development, potentially creating unfair outcomes for diverse groups. Types of bias include selection or sampling bias, volunteer bias, and instrument bias.
Dataset or [Collection Bias](http://researcharticles.com/index.php/bias-in-data-collection-in-research/) involves selecting a _non-representative_ subset of data for algorithm development, potentially creating unfairness in outcomes for diverse groups. Types of bias include selection or sampling bias, volunteer bias, and instrument bias.
Questions to explore:
* Did we recruit a representative set of data subjects?
@ -135,7 +135,7 @@ Questions to explore:
#### 2.7 Data Quality
[Data Quality](https://lakefs.io/data-quality-testing/) examines the validity of the curated dataset used to develop algorithms, ensuring features and records meet the accuracy and consistency requirements for the AIs purpose.
[Data Quality](https://lakefs.io/data-quality-testing/) examines the validity of the curated dataset used to develop algorithms, ensuring features and records meet the required level of accuracy and consistency for the intended AI purpose.
Questions to explore:
* Did we capture valid _features_ for our use case?
@ -144,7 +144,7 @@ Questions to explore:
* Is information captured _accurately_ to reflect reality?
#### 2.8 Algorithm Fairness
[Algorithm Fairness](https://towardsdatascience.com/what-is-algorithm-fairness-3182e161cf9f) examines whether the design of an algorithm systematically discriminates against specific subgroups of individuals, potentially causing [harm](https://docs.microsoft.com/en-us/azure/machine-learning/concept-fairness-ml) in areas like _allocation_ (where resources are denied or withheld from certain groups) and _quality of service_ (where AI performs less accurately for some subgroups compared to others).
[Algorithm Fairness](https://towardsdatascience.com/what-is-algorithm-fairness-3182e161cf9f) examines whether the design of an algorithm systematically discriminates against specific subgroups of individuals, potentially causing [harm](https://docs.microsoft.com/en-us/azure/machine-learning/concept-fairness-ml) in areas such as _allocation_ (where resources are denied or withheld from certain groups) and _quality of service_ (where AI performs less accurately for some subgroups compared to others).
Questions to consider:
* Have we assessed the model's accuracy across diverse subgroups and conditions?
@ -155,16 +155,16 @@ Explore resources like [AI Fairness checklists](https://query.prod.cms.rt.micros
#### 2.9 Misrepresentation
[Data Misrepresentation](https://www.sciencedirect.com/topics/computer-science/misrepresentation) involves questioning whether insights derived from data are being presented in a misleading way to support a specific narrative.
[Data Misrepresentation](https://www.sciencedirect.com/topics/computer-science/misrepresentation) involves questioning whether insights derived from data are being communicated in a misleading way to support a specific narrative.
Questions to consider:
* Are we reporting incomplete or inaccurate data?
* Are we presenting incomplete or inaccurate data?
* Are we visualizing data in ways that lead to false conclusions?
* Are we using selective statistical methods to manipulate outcomes?
* Are we selectively using statistical techniques to manipulate outcomes?
* Are there alternative explanations that could lead to different conclusions?
#### 2.10 Free Choice
The [Illusion of Free Choice](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice) arises when decision-making algorithms in "choice architectures" subtly push users toward a preferred outcome while giving the appearance of options and control. These [dark patterns](https://www.darkpatterns.org/) can result in social and economic harm to users. Since user decisions influence behavior profiles, these choices can amplify or perpetuate the impact of such harms over time.
The [Illusion of Free Choice](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice) arises when decision-making algorithms in "choice architectures" subtly push users toward a preferred outcome while giving the appearance of options and control. These [dark patterns](https://www.darkpatterns.org/) can result in social and economic harm to users. Since user decisions influence behavior profiles, these actions can shape future choices, amplifying the impact of these harms.
Questions to consider:
* Did the user fully understand the consequences of their choice?
@ -173,37 +173,36 @@ Questions to consider:
### 3. Case Studies
To understand these ethical challenges in real-world scenarios, case studies can illustrate the potential harms and societal consequences when ethical principles are ignored.
To understand these ethical challenges in real-world scenarios, case studies can illustrate the potential harms and societal consequences when ethical violations are ignored.
Here are some examples:
| Ethics Challenge | Case Study |
|--- |--- |
| **Informed Consent** | 1972 - [Tuskegee Syphilis Study](https://en.wikipedia.org/wiki/Tuskegee_Syphilis_Study) - African American men were promised free medical care but were deceived by researchers who withheld their diagnosis and treatment options. Many participants died, and their families were affected. The study lasted 40 years. |
| **Data Privacy** | 2007 - The [Netflix data prize](https://www.wired.com/2007/12/why-anonymous-data-sometimes-isnt/) provided researchers with _10M anonymized movie ratings from 50K customers_ to improve recommendation algorithms. However, researchers were able to link anonymized data to personally identifiable information in _external datasets_ (e.g., IMDb comments), effectively "de-anonymizing" some Netflix users.|
| **Collection Bias** | 2013 - The City of Boston [developed Street Bump](https://www.boston.gov/transportation/street-bump), an app for citizens to report potholes, helping the city collect better roadway data. However, [lower-income groups had less access to cars and smartphones](https://hbr.org/2013/04/the-hidden-biases-in-big-data), making their roadway issues invisible in the app. Developers collaborated with academics to address _equitable access and digital divide_ issues for fairness. |
| **Algorithmic Fairness** | 2018 - The MIT [Gender Shades Study](http://gendershades.org/overview.html) revealed accuracy gaps in gender classification AI products for women and people of color. A [2019 Apple Card](https://www.wired.com/story/the-apple-card-didnt-see-genderand-thats-the-problem/) reportedly offered less credit to women than men, highlighting algorithmic bias and its socio-economic impacts.|
| **Informed Consent** | 1972 - [Tuskegee Syphilis Study](https://en.wikipedia.org/wiki/Tuskegee_Syphilis_Study) - African American men were promised free medical care but were deceived by researchers who did not inform them of their diagnosis or available treatment. Many participants died, and their families were affected. The study lasted 40 years. |
| **Data Privacy** | 2007 - The [Netflix data prize](https://www.wired.com/2007/12/why-anonymous-data-sometimes-isnt/) provided researchers with _10M anonymized movie ratings from 50K customers_ to improve recommendation algorithms. However, researchers were able to link anonymized data to personally identifiable information in _external datasets_ (e.g., IMDb comments), effectively "de-anonymizing" some Netflix users. |
| **Collection Bias** | 2013 - The City of Boston [developed Street Bump](https://www.boston.gov/transportation/street-bump), an app for citizens to report potholes, helping the city collect better roadway data. However, [lower-income groups had less access to cars and smartphones](https://hbr.org/2013/04/the-hidden-biases-in-big-data), making their roadway issues invisible in the app. Developers collaborated with academics to address _equitable access and digital divide_ issues for fairness. |
| **Algorithmic Fairness** | 2018 - The MIT [Gender Shades Study](http://gendershades.org/overview.html) evaluated the accuracy of gender classification AI products, revealing disparities in accuracy for women and people of color. A [2019 Apple Card](https://www.wired.com/story/the-apple-card-didnt-see-genderand-thats-the-problem/) appeared to offer less credit to women than men, highlighting algorithmic bias and its socio-economic consequences. |
| **Data Misrepresentation** | 2020 - The [Georgia Department of Public Health released COVID-19 charts](https://www.vox.com/covid-19-coronavirus-us-response-trump/2020/5/18/21262265/georgia-covid-19-cases-declining-reopening) that misled citizens about case trends by using non-chronological ordering on the x-axis. This demonstrates misrepresentation through visualization techniques. |
| **Illusion of free choice** | 2020 - Learning app [ABCmouse paid $10M to settle an FTC complaint](https://www.washingtonpost.com/business/2020/09/04/abcmouse-10-million-ftc-settlement/) where parents were trapped into paying for subscriptions they couldn't cancel. This illustrates dark patterns in choice architectures, nudging users toward harmful decisions. |
| **Data Privacy & User Rights** | 2021 - Facebook [Data Breach](https://www.npr.org/2021/04/09/986005820/after-data-breach-exposes-530-million-facebook-says-it-will-not-notify-users) exposed data from 530M users, resulting in a $5B settlement to the FTC. Facebook refused to notify users of the breach, violating their rights to data transparency and access. |
| **Data Privacy & User Rights** | 2021 - Facebook [Data Breach](https://www.npr.org/2021/04/09/986005820/after-data-breach-exposes-530-million-facebook-says-it-will-not-notify-users) exposed data from 530M users, resulting in a $5B settlement to the FTC. However, Facebook refused to notify users of the breach, violating their rights to data transparency and access. |
Want to explore more case studies? Check out these resources:
* [Ethics Unwrapped](https://ethicsunwrapped.utexas.edu/case-studies) - ethics dilemmas across various industries.
* [Data Science Ethics course](https://www.coursera.org/learn/data-science-ethics#syllabus) - landmark case studies explored.
* [Where things have gone wrong](https://deon.drivendata.org/examples/) - deon checklist with examples.
> 🚨 Reflect on the case studies you've reviewed. Have you experienced or been affected by a similar ethical challenge? Can you think of another case study that illustrates one of the ethical challenges discussed here?
> 🚨 Reflect on the case studies you've encountered—have you experienced or been affected by a similar ethical challenge? Can you think of another case study that illustrates one of the ethical challenges discussed here?
## Applied Ethics
We've explored ethical concepts, challenges, and case studies in real-world contexts. But how can we start _applying_ ethical principles in our projects? And how can we _operationalize_ these practices for better governance? Lets look at some practical solutions:
We've explored ethical concepts, challenges, and case studies in real-world contexts. But how can we start _applying_ ethical principles and practices in our projects? And how can we _operationalize_ these practices for better governance? Lets examine some practical solutions:
### 1. Professional Codes
Professional Codes provide a way for organizations to "encourage" members to align with their ethical principles and mission. These codes act as _moral guidelines_ for professional behavior, helping employees or members make decisions consistent with the organization's values. Their effectiveness depends on voluntary compliance, but many organizations offer rewards or penalties to motivate adherence.
Professional Codes provide a way for organizations to "encourage" members to align with their ethical principles and mission statement. These codes act as _moral guidelines_ for professional behavior, helping employees or members make decisions consistent with their organization's values. Their effectiveness depends on voluntary compliance, but many organizations offer rewards or penalties to motivate adherence.
Examples include:
* [Oxford Munich](http://www.code-of-ethics.org/code-of-conduct/) Code of Ethics
* [Data Science Association](http://datascienceassn.org/code-of-conduct.html) Code of Conduct (created 2013)
* [ACM Code of Ethics and Professional Conduct](https://www.acm.org/code-of-ethics) (since 1993)
@ -212,44 +211,43 @@ Examples include:
### 2. Ethics Checklists
While professional codes outline required _ethical behavior_, they [have limitations](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md) in enforcement, especially for large-scale projects. Many data science experts [recommend checklists](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md) to **translate principles into actionable practices**.
While professional codes define expected _ethical behavior_, they [have limitations](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md) in enforcement, especially in large-scale projects. Many data science experts [recommend checklists](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md) to **translate principles into actionable practices**.
Checklists turn questions into "yes/no" tasks that can be integrated into standard workflows, making them easier to track during product development.
Examples include:
* [Deon](https://deon.drivendata.org/) - a general-purpose data ethics checklist based on [industry recommendations](https://deon.drivendata.org/#checklist-citations), with a command-line tool for easy integration.
* [Privacy Audit Checklist](https://cyber.harvard.edu/ecommerce/privacyaudit.html) - offers general guidance on handling information from legal and social perspectives.
* [Privacy Audit Checklist](https://cyber.harvard.edu/ecommerce/privacyaudit.html) - offers general guidance for handling information from legal and social perspectives.
* [AI Fairness Checklist](https://www.microsoft.com/en-us/research/project/ai-fairness-checklist/) - created by AI practitioners to integrate fairness checks into AI development cycles.
* [22 questions for ethics in data and AI](https://medium.com/the-organization/22-questions-for-ethics-in-data-and-ai-efb68fd19429) - an open-ended framework for exploring ethical issues in design, implementation, and organizational contexts.
### 3. Ethics Regulations
Ethics involves defining shared values and voluntarily doing the right thing. **Compliance** refers to _following the law_ where applicable. **Governance** encompasses all organizational efforts to enforce ethical principles and comply with legal requirements.
Ethics involves defining shared values and voluntarily doing the right thing. **Compliance** focuses on _following the law_ where applicable. **Governance** encompasses all organizational efforts to enforce ethical principles and comply with legal requirements.
Governance in organizations takes two forms. First, it involves defining **ethical AI** principles and implementing practices to ensure adoption across all AI-related projects. Second, it requires compliance with government-mandated **data protection regulations** in the regions where the organization operates.
Governance today has two main aspects. First, it involves defining **ethical AI** principles and implementing practices to ensure adoption across all AI-related projects. Second, it requires compliance with government-mandated **data protection regulations** in the regions where the organization operates.
Examples of data protection and privacy regulations:
* `1974`, [US Privacy Act](https://www.justice.gov/opcl/privacy-act-1974) - regulates _federal government_ collection, use, and disclosure of personal information.
* `1996`, [US Health Insurance Portability & Accountability Act (HIPAA)](https://www.cdc.gov/phlp/publications/topic/hipaa.html) - protects personal health data.
* `1998`, [US Children's Online Privacy Protection Act (COPPA)](https://www.ftc.gov/enforcement/rules/rulemaking-regulatory-reform-proceedings/childrens-online-privacy-protection-rule) - safeguards the data privacy of children under 13.
* `1998`, [US Children's Online Privacy Protection Act (COPPA)](https://www.ftc.gov/enforcement/rules/rulemaking-regulatory-reform-proceedings/childrens-online-privacy-protection-rule) - safeguards the privacy of children under 13.
* `2018`, [General Data Protection Regulation (GDPR)](https://gdpr-info.eu/) - provides user rights, data protection, and privacy.
* `2018`, [California Consumer Privacy Act (CCPA)](https://www.oag.ca.gov/privacy/ccpa) - grants consumers more control over their personal data.
* `2021`, China's [Personal Information Protection Law](https://www.reuters.com/world/china/china-passes-new-personal-data-privacy-law-take-effect-nov-1-2021-08-20/) - one of the strongest online data privacy regulations globally.
> 🚨 The European Union's GDPR (General Data Protection Regulation) is one of the most influential data privacy regulations. Did you know it defines [8 user rights](https://www.freeprivacypolicy.com/blog/8-user-rights-gdpr) to protect citizens' digital privacy and personal data? Learn about these rights and why they matter.
> 🚨 The European Union's GDPR (General Data Protection Regulation) is one of the most influential data privacy regulations today. Did you know it also defines [8 user rights](https://www.freeprivacypolicy.com/blog/8-user-rights-gdpr) to protect citizens' digital privacy and personal data? Learn about these rights and why they matter.
### 4. Ethics Culture
There is often a gap between _compliance_ (meeting legal requirements) and addressing [systemic issues](https://www.coursera.org/learn/data-science-ethics/home/week/4) (like ossification, information asymmetry, and distributional unfairness) that can accelerate the misuse of AI.
There is often a gap between _compliance_ (meeting legal requirements) and addressing [systemic issues](https://www.coursera.org/learn/data-science-ethics/home/week/4) (such as ossification, information asymmetry, and distributional unfairness) that can accelerate the misuse of AI.
Addressing these issues requires [collaborative efforts to build ethics cultures](https://towardsdatascience.com/why-ai-ethics-requires-a-culture-driven-approach-26f451afa29f) that foster emotional connections and shared values across organizations and industries. This involves creating [formalized data ethics cultures](https://www.codeforamerica.org/news/formalizing-an-ethical-data-culture/) within organizations, empowering _anyone_ to [raise concerns early](https://en.wikipedia.org/wiki/Andon_(manufacturing)) and making ethical considerations (e.g., in hiring) a core part of team formation for AI projects.
Addressing these issues requires [collaborative efforts to build ethics cultures](https://towardsdatascience.com/why-ai-ethics-requires-a-culture-driven-approach-26f451afa29f) that foster emotional connections and shared values across organizations and industries. This involves creating [formalized data ethics cultures](https://www.codeforamerica.org/news/formalizing-an-ethical-data-culture/) within organizations, empowering _anyone_ to [raise concerns early](https://en.wikipedia.org/wiki/Andon_(manufacturing)) and making ethical considerations (e.g., in hiring) a core criterion for forming AI project teams.
---
## [Post-lecture quiz](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/3) 🎯
## [Post-lecture quiz](https://ff-quizzes.netlify.app/en/ds/) 🎯
## Review & Self Study
Courses and books help build an understanding of core ethics concepts and challenges, while case studies and tools provide practical insights into applying ethics in real-world scenarios. Here are some resources to get started:
Courses and books help build a foundation in ethics concepts and challenges, while case studies and tools provide practical insights into applying ethics in real-world scenarios. Here are some resources to get started:
* [Machine Learning For Beginners](https://github.com/microsoft/ML-For-Beginners/blob/main/1-Introduction/3-fairness/README.md) - lesson on Fairness, from Microsoft.
* [Principles of Responsible AI](https://docs.microsoft.com/en-us/learn/modules/responsible-ai-principles/) - free learning path from Microsoft Learn.

@ -1,8 +1,8 @@
<!--
CO_OP_TRANSLATOR_METADATA:
{
"original_hash": "8796f41f566a0a8ebb72863a83d558ed",
"translation_date": "2025-08-24T21:16:45+00:00",
"original_hash": "3a34157cc63516eba97c89a0b2f8c3e6",
"translation_date": "2025-09-03T20:50:17+00:00",
"source_file": "1-Introduction/02-ethics/README.md",
"language_code": "es"
}
@ -17,88 +17,88 @@ CO_OP_TRANSLATOR_METADATA:
Todos somos ciudadanos de datos viviendo en un mundo dataficado.
Las tendencias del mercado indican que para 2022, 1 de cada 3 grandes organizaciones comprará y venderá sus datos a través de [mercados y plataformas de intercambio](https://www.gartner.com/smarterwithgartner/gartner-top-10-trends-in-data-and-analytics-for-2020/) en línea. Como **desarrolladores de aplicaciones**, nos resultará más fácil y económico integrar conocimientos basados en datos y automatización impulsada por algoritmos en las experiencias diarias de los usuarios. Pero a medida que la IA se vuelve omnipresente, también necesitaremos comprender los posibles daños causados por la [utilización indebida](https://www.youtube.com/watch?v=TQHs8SA1qpk) de estos algoritmos a gran escala.
Las tendencias del mercado nos indican que para 2022, 1 de cada 3 grandes organizaciones comprará y venderá sus datos a través de [mercados y plataformas de intercambio](https://www.gartner.com/smarterwithgartner/gartner-top-10-trends-in-data-and-analytics-for-2020/) en línea. Como **desarrolladores de aplicaciones**, encontraremos más fácil y económico integrar conocimientos basados en datos y automatización impulsada por algoritmos en las experiencias diarias de los usuarios. Pero a medida que la IA se vuelve omnipresente, también necesitaremos comprender los posibles daños causados por la [utilización indebida](https://www.youtube.com/watch?v=TQHs8SA1qpk) de estos algoritmos a gran escala.
Las tendencias también indican que crearemos y consumiremos más de [180 zettabytes](https://www.statista.com/statistics/871513/worldwide-data-created/) de datos para 2025. Como **científicos de datos**, esto nos da niveles de acceso sin precedentes a datos personales. Esto significa que podemos construir perfiles de comportamiento de los usuarios e influir en la toma de decisiones de maneras que crean una [ilusión de libre elección](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice), mientras potencialmente dirigimos a los usuarios hacia resultados que preferimos. También plantea preguntas más amplias sobre la privacidad de los datos y la protección de los usuarios.
Las tendencias también indican que crearemos y consumiremos más de [180 zettabytes](https://www.statista.com/statistics/871513/worldwide-data-created/) de datos para 2025. Como **científicos de datos**, esto nos da niveles sin precedentes de acceso a datos personales. Esto significa que podemos construir perfiles de comportamiento de los usuarios e influir en la toma de decisiones de maneras que crean una [ilusión de libre elección](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice) mientras potencialmente dirigimos a los usuarios hacia resultados que preferimos. También plantea preguntas más amplias sobre la privacidad de los datos y la protección de los usuarios.
La ética de los datos es ahora un _guardarraíl necesario_ para la ciencia y la ingeniería de datos, ayudándonos a minimizar posibles daños y consecuencias no deseadas de nuestras acciones impulsadas por datos. El [Ciclo de Hype de Gartner para la IA](https://www.gartner.com/smarterwithgartner/2-megatrends-dominate-the-gartner-hype-cycle-for-artificial-intelligence-2020/) identifica tendencias relevantes en ética digital, IA responsable y gobernanza de IA como impulsores clave de megatendencias más amplias en torno a la _democratización_ y _industrialización_ de la IA.
La ética de los datos ahora son _límites necesarios_ para la ciencia y la ingeniería de datos, ayudándonos a minimizar los posibles daños y las consecuencias no deseadas de nuestras acciones impulsadas por datos. El [Ciclo de Hype de Gartner para IA](https://www.gartner.com/smarterwithgartner/2-megatrends-dominate-the-gartner-hype-cycle-for-artificial-intelligence-2020/) identifica tendencias relevantes en ética digital, IA responsable y gobernanza de IA como impulsores clave de megatendencias más amplias en torno a la _democratización_ y _industrialización_ de la IA.
![Ciclo de Hype de Gartner para la IA - 2020](https://images-cdn.newscred.com/Zz1mOWJhNzlkNDA2ZTMxMWViYjRiOGFiM2IyMjQ1YmMwZQ==)
![Ciclo de Hype de Gartner para IA - 2020](https://images-cdn.newscred.com/Zz1mOWJhNzlkNDA2ZTMxMWViYjRiOGFiM2IyMjQ1YmMwZQ==)
En esta lección, exploraremos el fascinante ámbito de la ética de los datos: desde conceptos y desafíos fundamentales, hasta estudios de caso y conceptos aplicados de IA como la gobernanza, que ayudan a establecer una cultura ética en equipos y organizaciones que trabajan con datos e IA.
## [Cuestionario previo a la lección](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/2) 🎯
## [Cuestionario previo a la clase](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/2) 🎯
## Definiciones Básicas
Comencemos entendiendo la terminología básica.
La palabra "ética" proviene de la [palabra griega "ethikos"](https://en.wikipedia.org/wiki/Ethics) (y su raíz "ethos") que significa _carácter o naturaleza moral_.
La palabra "ética" proviene de la [palabra griega "ethikos"](https://en.wikipedia.org/wiki/Ethics) (y su raíz "ethos") que significa _carácter o naturaleza moral_.
**Ética** se refiere a los valores compartidos y principios morales que gobiernan nuestro comportamiento en la sociedad. La ética no se basa en leyes, sino en normas ampliamente aceptadas de lo que es "correcto vs. incorrecto". Sin embargo, las consideraciones éticas pueden influir en iniciativas de gobernanza corporativa y regulaciones gubernamentales que crean más incentivos para el cumplimiento.
**Ética** trata sobre los valores compartidos y los principios morales que gobiernan nuestro comportamiento en la sociedad. La ética no se basa en leyes, sino en normas ampliamente aceptadas de lo que es "correcto vs. incorrecto". Sin embargo, las consideraciones éticas pueden influir en iniciativas de gobernanza corporativa y regulaciones gubernamentales que crean más incentivos para el cumplimiento.
**Ética de los Datos** es una [nueva rama de la ética](https://royalsocietypublishing.org/doi/full/10.1098/rsta.2016.0360#sec-1) que "estudia y evalúa problemas morales relacionados con _datos, algoritmos y prácticas correspondientes_". Aquí, **"datos"** se enfoca en acciones relacionadas con la generación, registro, curación, procesamiento, difusión, intercambio y uso; **"algoritmos"** se enfoca en IA, agentes, aprendizaje automático y robots; y **"prácticas"** se enfoca en temas como innovación responsable, programación, hacking y códigos de ética.
**Ética de los Datos** es una [nueva rama de la ética](https://royalsocietypublishing.org/doi/full/10.1098/rsta.2016.0360#sec-1) que "estudia y evalúa problemas morales relacionados con _datos, algoritmos y prácticas correspondientes_". Aquí, **"datos"** se centra en acciones relacionadas con la generación, registro, curación, procesamiento, difusión, intercambio y uso; **"algoritmos"** se centra en IA, agentes, aprendizaje automático y robots; y **"prácticas"** se centra en temas como innovación responsable, programación, hacking y códigos éticos.
**Ética Aplicada** es la [aplicación práctica de consideraciones morales](https://en.wikipedia.org/wiki/Applied_ethics). Es el proceso de investigar activamente cuestiones éticas en el contexto de _acciones, productos y procesos del mundo real_, y tomar medidas correctivas para garantizar que permanezcan alineados con nuestros valores éticos definidos.
**Ética Aplicada** es la [aplicación práctica de consideraciones morales](https://en.wikipedia.org/wiki/Applied_ethics). Es el proceso de investigar activamente cuestiones éticas en el contexto de _acciones, productos y procesos del mundo real_, y tomar medidas correctivas para garantizar que estos permanezcan alineados con nuestros valores éticos definidos.
**Cultura Ética** se refiere a [_operacionalizar_ la ética aplicada](https://hbr.org/2019/05/how-to-design-an-ethical-organization) para garantizar que nuestros principios y prácticas éticas sean adoptados de manera consistente y escalable en toda la organización. Las culturas éticas exitosas definen principios éticos a nivel organizacional, proporcionan incentivos significativos para el cumplimiento y refuerzan las normas éticas alentando y amplificando los comportamientos deseados en todos los niveles de la organización.
**Cultura Ética** trata sobre [_operacionalizar_ la ética aplicada](https://hbr.org/2019/05/how-to-design-an-ethical-organization) para garantizar que nuestros principios y prácticas éticas sean adoptados de manera consistente y escalable en toda la organización. Las culturas éticas exitosas definen principios éticos a nivel organizacional, proporcionan incentivos significativos para el cumplimiento y refuerzan las normas éticas alentando y amplificando los comportamientos deseados en todos los niveles de la organización.
## Conceptos de Ética
En esta sección, discutiremos conceptos como **valores compartidos** (principios) y **desafíos éticos** (problemas) para la ética de los datos, y exploraremos **estudios de caso** que te ayudarán a comprender estos conceptos en contextos del mundo real.
En esta sección, discutiremos conceptos como **valores compartidos** (principios) y **desafíos éticos** (problemas) para la ética de los datos, y exploraremos **estudios de caso** que te ayudarán a entender estos conceptos en contextos del mundo real.
### 1. Principios Éticos
Toda estrategia de ética de los datos comienza definiendo _principios éticos_: los "valores compartidos" que describen comportamientos aceptables y guían acciones conformes en nuestros proyectos de datos e IA. Puedes definirlos a nivel individual o de equipo. Sin embargo, la mayoría de las grandes organizaciones los describen en una declaración de misión o marco de trabajo de _IA ética_ definido a nivel corporativo y aplicado de manera consistente en todos los equipos.
Toda estrategia de ética de los datos comienza definiendo _principios éticos_ - los "valores compartidos" que describen comportamientos aceptables y guían acciones conformes en nuestros proyectos de datos e IA. Puedes definirlos a nivel individual o de equipo. Sin embargo, la mayoría de las grandes organizaciones los describen en una declaración de misión o marco de _IA ética_ que se define a nivel corporativo y se aplica de manera consistente en todos los equipos.
**Ejemplo:** La declaración de misión de [IA Responsable](https://www.microsoft.com/en-us/ai/responsible-ai) de Microsoft dice: _"Estamos comprometidos con el avance de la IA impulsada por principios éticos que ponen a las personas primero"_, identificando 6 principios éticos en el marco a continuación:
**Ejemplo:** La declaración de misión de [IA Responsable](https://www.microsoft.com/en-us/ai/responsible-ai) de Microsoft dice: _"Estamos comprometidos con el avance de la IA impulsada por principios éticos que ponen a las personas primero"_ - identificando 6 principios éticos en el marco a continuación:
![IA Responsable en Microsoft](https://docs.microsoft.com/en-gb/azure/cognitive-services/personalizer/media/ethics-and-responsible-use/ai-values-future-computed.png)
Exploremos brevemente estos principios. _Transparencia_ y _responsabilidad_ son valores fundamentales sobre los que se construyen otros principios, así que comencemos por ahí:
Exploremos brevemente estos principios. _Transparencia_ y _responsabilidad_ son valores fundamentales sobre los que se construyen otros principios, así que comencemos allí:
* [**Responsabilidad**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) hace que los practicantes sean _responsables_ de sus operaciones de datos e IA, y del cumplimiento de estos principios éticos.
* [**Responsabilidad**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) hace que los practicantes sean _responsables_ de sus operaciones de datos e IA y del cumplimiento de estos principios éticos.
* [**Transparencia**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) asegura que las acciones de datos e IA sean _comprensibles_ (interpretables) para los usuarios, explicando el qué y el porqué detrás de las decisiones.
* [**Equidad**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1%3aprimaryr6) se enfoca en garantizar que la IA trate a _todas las personas_ de manera justa, abordando cualquier sesgo socio-técnico sistémico o implícito en los datos y sistemas.
* [**Confiabilidad y Seguridad**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) asegura que la IA se comporte de manera _consistente_ con los valores definidos, minimizando posibles daños o consecuencias no deseadas.
* [**Privacidad y Seguridad**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) se trata de comprender el linaje de los datos y proporcionar _privacidad de datos y protecciones relacionadas_ a los usuarios.
* [**Inclusión**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) se trata de diseñar soluciones de IA con intención, adaptándolas para satisfacer una _amplia gama de necesidades y capacidades humanas_.
* [**Equidad**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1%3aprimaryr6) - se centra en garantizar que la IA trate a _todas las personas_ de manera justa, abordando cualquier sesgo socio-técnico sistémico o implícito en los datos y sistemas.
* [**Fiabilidad y Seguridad**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - asegura que la IA se comporte de manera _consistente_ con los valores definidos, minimizando posibles daños o consecuencias no deseadas.
* [**Privacidad y Seguridad**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - trata de comprender el linaje de los datos y proporcionar _privacidad de datos y protecciones relacionadas_ a los usuarios.
* [**Inclusión**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - trata de diseñar soluciones de IA con intención, adaptándolas para satisfacer una _amplia gama de necesidades y capacidades humanas_.
> 🚨 Piensa en cuál podría ser tu declaración de misión de ética de los datos. Explora marcos de IA ética de otras organizaciones: aquí tienes ejemplos de [IBM](https://www.ibm.com/cloud/learn/ai-ethics), [Google](https://ai.google/principles) y [Facebook](https://ai.facebook.com/blog/facebooks-five-pillars-of-responsible-ai/). ¿Qué valores compartidos tienen en común? ¿Cómo se relacionan estos principios con el producto o la industria de IA en la que operan?
> 🚨 Piensa en cuál podría ser tu declaración de misión de ética de los datos. Explora marcos de IA ética de otras organizaciones: aquí hay ejemplos de [IBM](https://www.ibm.com/cloud/learn/ai-ethics), [Google](https://ai.google/principles) y [Facebook](https://ai.facebook.com/blog/facebooks-five-pillars-of-responsible-ai/). ¿Qué valores compartidos tienen en común? ¿Cómo se relacionan estos principios con el producto de IA o la industria en la que operan?
### 2. Desafíos Éticos
Una vez que hemos definido los principios éticos, el siguiente paso es evaluar nuestras acciones de datos e IA para ver si se alinean con esos valores compartidos. Piensa en tus acciones en dos categorías: _recolección de datos_ y _diseño de algoritmos_.
Una vez que hemos definido los principios éticos, el siguiente paso es evaluar nuestras acciones de datos e IA para ver si se alinean con esos valores compartidos. Piensa en tus acciones en dos categorías: _recolección de datos_ y _diseño de algoritmos_.
En la recolección de datos, las acciones probablemente involucrarán **datos personales** o información personal identificable (PII) de individuos identificables. Esto incluye [diversos elementos de datos no personales](https://ec.europa.eu/info/law/law-topic/data-protection/reform/what-personal-data_en) que _colectivamente_ identifican a un individuo. Los desafíos éticos pueden relacionarse con _privacidad de datos_, _propiedad de datos_ y temas relacionados como _consentimiento informado_ y _derechos de propiedad intelectual_ de los usuarios.
En la recolección de datos, las acciones probablemente involucrarán **datos personales** o información personalmente identificable (PII) de individuos identificables. Esto incluye [diversos elementos de datos no personales](https://ec.europa.eu/info/law/law-topic/data-protection/reform/what-personal-data_en) que _colectivamente_ identifican a un individuo. Los desafíos éticos pueden relacionarse con _privacidad de datos_, _propiedad de datos_ y temas relacionados como _consentimiento informado_ y _derechos de propiedad intelectual_ para los usuarios.
En el diseño de algoritmos, las acciones involucrarán la recolección y curación de **conjuntos de datos**, y luego usarlos para entrenar y desplegar **modelos de datos** que predicen resultados o automatizan decisiones en contextos del mundo real. Los desafíos éticos pueden surgir de _sesgos en los conjuntos de datos_, problemas de _calidad de datos_, _injusticias_ y _falsas representaciones_ en los algoritmos, incluyendo algunos problemas que son sistémicos por naturaleza.
En el diseño de algoritmos, las acciones involucrarán la recolección y curación de **conjuntos de datos**, luego usarlos para entrenar y desplegar **modelos de datos** que predigan resultados o automaticen decisiones en contextos del mundo real. Los desafíos éticos pueden surgir de _sesgos en los conjuntos de datos_, problemas de _calidad de datos_, _injusticia_ y _representación errónea_ en los algoritmos, incluyendo algunos problemas que son sistémicos por naturaleza.
En ambos casos, los desafíos éticos destacan áreas donde nuestras acciones pueden entrar en conflicto con nuestros valores compartidos. Para detectar, mitigar, minimizar o eliminar estas preocupaciones, necesitamos hacer preguntas morales de "sí/no" relacionadas con nuestras acciones y luego tomar medidas correctivas según sea necesario. Veamos algunos desafíos éticos y las preguntas morales que plantean:
#### 2.1 Propiedad de los Datos
La recolección de datos a menudo involucra datos personales que pueden identificar a los sujetos de los datos. [La propiedad de los datos](https://permission.io/blog/data-ownership) se refiere al _control_ y [_derechos de los usuarios_](https://permission.io/blog/data-ownership) relacionados con la creación, procesamiento y difusión de datos.
La recolección de datos a menudo involucra datos personales que pueden identificar a los sujetos de los datos. [Propiedad de los datos](https://permission.io/blog/data-ownership) trata sobre el _control_ y los [_derechos de los usuarios_](https://permission.io/blog/data-ownership) relacionados con la creación, procesamiento y difusión de datos.
Las preguntas morales que debemos hacernos son:
* ¿Quién es el propietario de los datos? (usuario u organización)
Las preguntas morales que debemos hacer son:
* ¿Quién posee los datos? (usuario u organización)
* ¿Qué derechos tienen los sujetos de los datos? (ej.: acceso, eliminación, portabilidad)
* ¿Qué derechos tienen las organizaciones? (ej.: rectificar reseñas maliciosas de usuarios)
#### 2.2 Consentimiento Informado
[El consentimiento informado](https://legaldictionary.net/informed-consent/) define el acto de que los usuarios acepten una acción (como la recolección de datos) con un _entendimiento completo_ de los hechos relevantes, incluyendo el propósito, los posibles riesgos y las alternativas.
[Consentimiento informado](https://legaldictionary.net/informed-consent/) define el acto de que los usuarios acepten una acción (como la recolección de datos) con un _entendimiento completo_ de los hechos relevantes, incluyendo el propósito, los riesgos potenciales y las alternativas.
Preguntas a explorar aquí son:
Preguntas para explorar aquí son:
* ¿El usuario (sujeto de los datos) dio permiso para la captura y uso de datos?
* ¿El usuario entendió el propósito para el cual se capturaron esos datos?
* ¿El usuario entendió los posibles riesgos de su participación?
* ¿El usuario entendió los riesgos potenciales de su participación?
#### 2.3 Propiedad Intelectual
[La propiedad intelectual](https://en.wikipedia.org/wiki/Intellectual_property) se refiere a creaciones intangibles resultantes de la iniciativa humana, que pueden _tener valor económico_ para individuos o empresas.
[Propiedad intelectual](https://en.wikipedia.org/wiki/Intellectual_property) se refiere a creaciones intangibles resultantes de la iniciativa humana, que pueden _tener valor económico_ para individuos o empresas.
Preguntas a explorar aquí son:
Preguntas para explorar aquí son:
* ¿Los datos recolectados tienen valor económico para un usuario o empresa?
* ¿El **usuario** tiene propiedad intelectual aquí?
* ¿La **organización** tiene propiedad intelectual aquí?
@ -106,9 +106,9 @@ Preguntas a explorar aquí son:
#### 2.4 Privacidad de los Datos
[La privacidad de los datos](https://www.northeastern.edu/graduate/blog/what-is-data-privacy/) o privacidad de la información se refiere a la preservación de la privacidad del usuario y la protección de su identidad con respecto a la información personal identificable.
[Privacidad de los datos](https://www.northeastern.edu/graduate/blog/what-is-data-privacy/) o privacidad de la información se refiere a la preservación de la privacidad del usuario y la protección de su identidad con respecto a información personalmente identificable.
Preguntas a explorar aquí son:
Preguntas para explorar aquí son:
* ¿Los datos (personales) de los usuarios están protegidos contra hackeos y filtraciones?
* ¿Los datos de los usuarios son accesibles solo para usuarios y contextos autorizados?
* ¿Se preserva el anonimato de los usuarios cuando los datos se comparten o difunden?
@ -116,33 +116,33 @@ Preguntas a explorar aquí son:
#### 2.5 Derecho al Olvido
El [Derecho al Olvido](https://en.wikipedia.org/wiki/Right_to_be_forgotten) o [Derecho de Supresión](https://www.gdpreu.org/right-to-be-forgotten/) proporciona protección adicional de datos personales a los usuarios. Específicamente, otorga a los usuarios el derecho a solicitar la eliminación o supresión de datos personales de búsquedas en Internet y otros lugares, _bajo circunstancias específicas_, permitiéndoles un nuevo comienzo en línea sin que se les juzgue por acciones pasadas.
El [Derecho al Olvido](https://en.wikipedia.org/wiki/Right_to_be_forgotten) o [Derecho a la Eliminación](https://www.gdpreu.org/right-to-be-forgotten/) proporciona protección adicional de datos personales a los usuarios. Específicamente, da a los usuarios el derecho a solicitar la eliminación o eliminación de datos personales de búsquedas en Internet y otros lugares, _bajo circunstancias específicas_, permitiéndoles un nuevo comienzo en línea sin que se les juzgue por acciones pasadas.
Preguntas a explorar aquí son:
* ¿El sistema permite a los sujetos de los datos solicitar la supresión?
* ¿Debería el retiro del consentimiento del usuario activar la supresión automática?
Preguntas para explorar aquí son:
* ¿El sistema permite a los sujetos de los datos solicitar la eliminación?
* ¿Debería el retiro del consentimiento del usuario activar la eliminación automática?
* ¿Se recolectaron datos sin consentimiento o por medios ilegales?
* ¿Cumplimos con las regulaciones gubernamentales sobre privacidad de datos?
* ¿Cumplimos con las regulaciones gubernamentales para la privacidad de los datos?
#### 2.6 Sesgo en los Conjuntos de Datos
El sesgo en los conjuntos de datos o [sesgo de recolección](http://researcharticles.com/index.php/bias-in-data-collection-in-research/) se refiere a la selección de un subconjunto _no representativo_ de datos para el desarrollo de algoritmos, creando potenciales injusticias en los resultados para diversos grupos. Los tipos de sesgo incluyen sesgo de selección o muestreo, sesgo de voluntarios y sesgo de instrumentos.
El sesgo en los conjuntos de datos o [sesgo de recolección](http://researcharticles.com/index.php/bias-in-data-collection-in-research/) trata sobre seleccionar un subconjunto _no representativo_ de datos para el desarrollo de algoritmos, creando potencialmente injusticia en los resultados para diversos grupos. Tipos de sesgo incluyen sesgo de selección o muestreo, sesgo de voluntarios y sesgo de instrumentos.
Preguntas a explorar aquí son:
Preguntas para explorar aquí son:
* ¿Reclutamos un conjunto representativo de sujetos de datos?
* ¿Probamos nuestro conjunto de datos recolectado o curado para diversos sesgos?
* ¿Podemos mitigar o eliminar los sesgos descubiertos?
#### 2.7 Calidad de los Datos
[La calidad de los datos](https://lakefs.io/data-quality-testing/) evalúa la validez del conjunto de datos curado utilizado para desarrollar nuestros algoritmos, verificando si las características y registros cumplen con los requisitos de precisión y consistencia necesarios para nuestro propósito de IA.
[Calidad de los datos](https://lakefs.io/data-quality-testing/) analiza la validez del conjunto de datos curado utilizado para desarrollar nuestros algoritmos, verificando si las características y los registros cumplen con los requisitos para el nivel de precisión y consistencia necesario para nuestro propósito de IA.
Preguntas a explorar aquí son:
Preguntas para explorar aquí son:
* ¿Capturamos características válidas para nuestro caso de uso?
* ¿Se capturaron los datos de manera consistente en diversas fuentes?
* ¿El conjunto de datos es completo para diversas condiciones o escenarios?
* ¿La información capturada refleja con precisión la realidad?
[Equidad Algorítmica](https://towardsdatascience.com/what-is-algorithm-fairness-3182e161cf9f) verifica si el diseño del algoritmo discrimina sistemáticamente contra subgrupos específicos de sujetos de datos, lo que puede llevar a [daños potenciales](https://docs.microsoft.com/en-us/azure/machine-learning/concept-fairness-ml) en la _asignación_ (donde se niegan o retienen recursos a ese grupo) y en la _calidad del servicio_ (donde la IA no es tan precisa para algunos subgrupos como lo es para otros).
* ¿Se capturaron datos de manera consistente en diversas fuentes de datos?
* ¿El conjunto de datos es completo para diversas condiciones o escenarios?
* ¿La información capturada refleja la realidad con precisión?
[Algorithm Fairness](https://towardsdatascience.com/what-is-algorithm-fairness-3182e161cf9f) verifica si el diseño del algoritmo discrimina sistemáticamente contra subgrupos específicos de sujetos de datos, lo que puede llevar a [daños potenciales](https://docs.microsoft.com/en-us/azure/machine-learning/concept-fairness-ml) en _asignación_ (donde se niegan o retienen recursos para ese grupo) y _calidad del servicio_ (donde la IA no es tan precisa para algunos subgrupos como lo es para otros).
Preguntas para explorar aquí son:
* ¿Evaluamos la precisión del modelo para diversos subgrupos y condiciones?
@ -153,7 +153,7 @@ Explora recursos como [listas de verificación de equidad en IA](https://query.p
#### 2.9 Representación Errónea
[Representación Errónea de Datos](https://www.sciencedirect.com/topics/computer-science/misrepresentation) se refiere a preguntarnos si estamos comunicando conocimientos de datos reportados de manera honesta, pero de forma engañosa, para respaldar una narrativa deseada.
[Representación errónea de datos](https://www.sciencedirect.com/topics/computer-science/misrepresentation) se trata de preguntarse si estamos comunicando ideas a partir de datos reportados honestamente de manera engañosa para apoyar una narrativa deseada.
Preguntas para explorar aquí son:
* ¿Estamos reportando datos incompletos o inexactos?
@ -162,11 +162,11 @@ Preguntas para explorar aquí son:
* ¿Existen explicaciones alternativas que puedan ofrecer una conclusión diferente?
#### 2.10 Libre Elección
La [Ilusión de Libre Elección](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice) ocurre cuando las "arquitecturas de elección" del sistema utilizan algoritmos de toma de decisiones para influir a las personas hacia un resultado preferido, mientras aparentan darles opciones y control. Estos [patrones oscuros](https://www.darkpatterns.org/) pueden causar daños sociales y económicos a los usuarios. Dado que las decisiones de los usuarios impactan los perfiles de comportamiento, estas acciones pueden potencialmente impulsar elecciones futuras que amplifiquen o extiendan el impacto de estos daños.
La [ilusión de libre elección](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice) ocurre cuando las "arquitecturas de elección" del sistema utilizan algoritmos de toma de decisiones para influir a las personas hacia un resultado preferido mientras aparentan darles opciones y control. Estos [patrones oscuros](https://www.darkpatterns.org/) pueden causar daños sociales y económicos a los usuarios. Dado que las decisiones de los usuarios impactan los perfiles de comportamiento, estas acciones potencialmente impulsan elecciones futuras que pueden amplificar o extender el impacto de estos daños.
Preguntas para explorar aquí son:
* ¿El usuario entendió las implicaciones de tomar esa decisión?
* ¿El usuario estaba al tanto de las opciones (alternativas) y los pros y contras de cada una?
* ¿El usuario estaba consciente de las opciones (alternativas) y los pros y contras de cada una?
* ¿Puede el usuario revertir una decisión automatizada o influenciada más tarde?
### 3. Estudios de Caso
@ -177,20 +177,21 @@ Aquí hay algunos ejemplos:
| Desafío Ético | Estudio de Caso |
|--- |--- |
| **Consentimiento Informado** | 1972 - [Estudio de Sífilis de Tuskegee](https://en.wikipedia.org/wiki/Tuskegee_Syphilis_Study) - A los hombres afroamericanos que participaron en el estudio se les prometió atención médica gratuita, _pero fueron engañados_ por los investigadores, quienes no informaron a los sujetos sobre su diagnóstico ni sobre la disponibilidad de tratamiento. Muchos murieron y sus parejas o hijos se vieron afectados; el estudio duró 40 años. |
| **Privacidad de Datos** | 2007 - El [premio de datos de Netflix](https://www.wired.com/2007/12/why-anonymous-data-sometimes-isnt/) proporcionó a los investigadores _10 millones de clasificaciones de películas anonimizadas de 50,000 clientes_ para mejorar los algoritmos de recomendación. Sin embargo, los investigadores pudieron correlacionar datos anonimizados con datos personales identificables en _conjuntos de datos externos_ (por ejemplo, comentarios en IMDb), "desanonimizando" efectivamente a algunos suscriptores de Netflix.|
| **Sesgo en la Recolección de Datos** | 2013 - La ciudad de Boston [desarrolló Street Bump](https://www.boston.gov/transportation/street-bump), una aplicación que permitía a los ciudadanos reportar baches, proporcionando mejores datos sobre carreteras para encontrar y solucionar problemas. Sin embargo, [las personas de grupos de ingresos más bajos tenían menos acceso a automóviles y teléfonos](https://hbr.org/2013/04/the-hidden-biases-in-big-data), haciendo que sus problemas de carreteras fueran invisibles en esta aplicación. Los desarrolladores trabajaron con académicos para abordar _problemas de acceso equitativo y brechas digitales_ por equidad. |
| **Equidad Algorítmica** | 2018 - El MIT [Estudio Gender Shades](http://gendershades.org/overview.html) evaluó la precisión de productos de IA para clasificación de género, exponiendo brechas en la precisión para mujeres y personas de color. Una [tarjeta de crédito de Apple en 2019](https://www.wired.com/story/the-apple-card-didnt-see-genderand-thats-the-problem/) parecía ofrecer menos crédito a mujeres que a hombres. Ambos casos ilustraron problemas de sesgo algorítmico que llevaron a daños socioeconómicos.|
| **Representación Errónea de Datos** | 2020 - El [Departamento de Salud Pública de Georgia publicó gráficos de COVID-19](https://www.vox.com/covid-19-coronavirus-us-response-trump/2020/5/18/21262265/georgia-covid-19-cases-declining-reopening) que parecían engañar a los ciudadanos sobre las tendencias de casos confirmados con un eje x no cronológico. Esto ilustra la representación errónea a través de trucos de visualización. |
| **Ilusión de Libre Elección** | 2020 - La aplicación educativa [ABCmouse pagó $10 millones para resolver una queja de la FTC](https://www.washingtonpost.com/business/2020/09/04/abcmouse-10-million-ftc-settlement/) donde los padres quedaron atrapados pagando suscripciones que no podían cancelar. Esto ilustra patrones oscuros en arquitecturas de elección, donde los usuarios fueron influenciados hacia decisiones potencialmente dañinas. |
| **Privacidad de Datos y Derechos de los Usuarios** | 2021 - La [violación de datos de Facebook](https://www.npr.org/2021/04/09/986005820/after-data-breach-exposes-530-million-facebook-says-it-will-not-notify-users) expuso datos de 530 millones de usuarios, resultando en un acuerdo de $5 mil millones con la FTC. Sin embargo, se negó a notificar a los usuarios sobre la violación, violando los derechos de los usuarios en torno a la transparencia y el acceso a los datos. |
| **Consentimiento Informado** | 1972 - [Estudio de Sífilis de Tuskegee](https://en.wikipedia.org/wiki/Tuskegee_Syphilis_Study) - A los hombres afroamericanos que participaron en el estudio se les prometió atención médica gratuita _pero fueron engañados_ por investigadores que no informaron a los sujetos sobre su diagnóstico ni sobre la disponibilidad de tratamiento. Muchos sujetos murieron y sus parejas o hijos fueron afectados; el estudio duró 40 años. |
| **Privacidad de Datos** | 2007 - El [premio de datos de Netflix](https://www.wired.com/2007/12/why-anonymous-data-sometimes-isnt/) proporcionó a los investigadores _10M clasificaciones de películas anonimizadas de 50K clientes_ para ayudar a mejorar los algoritmos de recomendación. Sin embargo, los investigadores pudieron correlacionar datos anonimizados con datos personalmente identificables en _conjuntos de datos externos_ (por ejemplo, comentarios de IMDb), efectivamente "desanonimizando" a algunos suscriptores de Netflix.|
| **Sesgo en la Recolección** | 2013 - La ciudad de Boston [desarrolló Street Bump](https://www.boston.gov/transportation/street-bump), una aplicación que permitía a los ciudadanos reportar baches, proporcionando mejores datos sobre carreteras para encontrar y solucionar problemas. Sin embargo, [las personas de grupos de ingresos más bajos tenían menos acceso a autos y teléfonos](https://hbr.org/2013/04/the-hidden-biases-in-big-data), haciendo que sus problemas de carreteras fueran invisibles en esta aplicación. Los desarrolladores trabajaron con académicos para abordar problemas de _acceso equitativo y brechas digitales_ para mayor equidad. |
| **Equidad Algorítmica** | 2018 - El MIT [Estudio Gender Shades](http://gendershades.org/overview.html) evaluó la precisión de productos de clasificación de género por IA, exponiendo brechas en la precisión para mujeres y personas de color. Una [tarjeta de crédito de Apple en 2019](https://www.wired.com/story/the-apple-card-didnt-see-genderand-thats-the-problem/) parecía ofrecer menos crédito a mujeres que a hombres. Ambos casos ilustraron problemas de sesgo algorítmico que llevaron a daños socioeconómicos.|
| **Representación Errónea de Datos** | 2020 - El [Departamento de Salud Pública de Georgia publicó gráficos de COVID-19](https://www.vox.com/covid-19-coronavirus-us-response-trump/2020/5/18/21262265/georgia-covid-19-cases-declining-reopening) que parecían engañar a los ciudadanos sobre las tendencias de casos confirmados con un orden no cronológico en el eje x. Esto ilustra la representación errónea mediante trucos de visualización. |
| **Ilusión de Libre Elección** | 2020 - La aplicación de aprendizaje [ABCmouse pagó $10M para resolver una queja de la FTC](https://www.washingtonpost.com/business/2020/09/04/abcmouse-10-million-ftc-settlement/) donde los padres quedaron atrapados pagando suscripciones que no podían cancelar. Esto ilustra patrones oscuros en arquitecturas de elección, donde los usuarios fueron influenciados hacia decisiones potencialmente dañinas. |
| **Privacidad de Datos y Derechos de Usuarios** | 2021 - La [brecha de datos de Facebook](https://www.npr.org/2021/04/09/986005820/after-data-breach-exposes-530-million-facebook-says-it-will-not-notify-users) expuso datos de 530M usuarios, resultando en un acuerdo de $5B con la FTC. Sin embargo, se negó a notificar a los usuarios sobre la brecha, violando los derechos de los usuarios en torno a la transparencia y el acceso a los datos. |
¿Quieres explorar más estudios de caso? Consulta estos recursos:
* [Ethics Unwrapped](https://ethicsunwrapped.utexas.edu/case-studies) - dilemas éticos en diversas industrias.
* [Curso de Ética en Ciencia de Datos](https://www.coursera.org/learn/data-science-ethics#syllabus) - estudios de caso destacados.
* [Dónde las cosas han salido mal](https://deon.drivendata.org/examples/) - lista de verificación de Deon con ejemplos.
* [Curso de Ética en Ciencia de Datos](https://www.coursera.org/learn/data-science-ethics#syllabus) - estudios de caso emblemáticos explorados.
* [Donde las cosas han salido mal](https://deon.drivendata.org/examples/) - lista de verificación de Deon con ejemplos.
> 🚨 Piensa en los estudios de caso que has visto: ¿has experimentado o te has visto afectado por un desafío ético similar en tu vida? ¿Puedes pensar en al menos un estudio de caso adicional que ilustre uno de los desafíos éticos discutidos en esta sección?
> 🚨 Piensa en los estudios de caso que has visto: ¿has experimentado o te ha afectado un desafío ético similar en tu vida? ¿Puedes pensar en al menos un estudio de caso adicional que ilustre uno de los desafíos éticos que hemos discutido en esta sección?
## Ética Aplicada
@ -198,7 +199,7 @@ Hemos hablado sobre conceptos éticos, desafíos y estudios de caso en contextos
### 1. Códigos Profesionales
Los Códigos Profesionales ofrecen una opción para que las organizaciones "incentiven" a sus miembros a apoyar sus principios éticos y declaración de misión. Los códigos son _directrices morales_ para el comportamiento profesional, ayudando a los empleados o miembros a tomar decisiones que se alineen con los principios de su organización. Solo son efectivos si los miembros cumplen voluntariamente; sin embargo, muchas organizaciones ofrecen recompensas y sanciones adicionales para motivar el cumplimiento.
Los códigos profesionales ofrecen una opción para que las organizaciones "incentiven" a los miembros a apoyar sus principios éticos y declaración de misión. Los códigos son _directrices morales_ para el comportamiento profesional, ayudando a los empleados o miembros a tomar decisiones que se alineen con los principios de su organización. Solo son efectivos si los miembros cumplen voluntariamente; sin embargo, muchas organizaciones ofrecen recompensas y sanciones adicionales para motivar el cumplimiento.
Ejemplos incluyen:
@ -206,7 +207,7 @@ Ejemplos incluyen:
* [Data Science Association](http://datascienceassn.org/code-of-conduct.html) Código de Conducta (creado en 2013)
* [ACM Código de Ética y Conducta Profesional](https://www.acm.org/code-of-ethics) (desde 1993)
> 🚨 ¿Perteneces a una organización profesional de ingeniería o ciencia de datos? Explora su sitio para ver si definen un código profesional de ética. ¿Qué dice esto sobre sus principios éticos? ¿Cómo están "incentivando" a los miembros a seguir el código?
> 🚨 ¿Perteneces a una organización profesional de ingeniería o ciencia de datos? Explora su sitio para ver si definen un código profesional de ética. ¿Qué dice esto sobre sus principios éticos? ¿Cómo están "incentivando" a los miembros para seguir el código?
### 2. Listas de Verificación Éticas
@ -215,49 +216,51 @@ Mientras que los códigos profesionales definen el _comportamiento ético_ reque
Las listas de verificación convierten preguntas en tareas de "sí/no" que pueden ser operacionalizadas, permitiendo que se rastreen como parte de los flujos de trabajo estándar de lanzamiento de productos.
Ejemplos incluyen:
* [Deon](https://deon.drivendata.org/) - una lista de verificación ética de datos de propósito general creada a partir de [recomendaciones de la industria](https://deon.drivendata.org/#checklist-citations) con una herramienta de línea de comandos para fácil integración.
* [Deon](https://deon.drivendata.org/) - una lista de verificación de ética en datos de propósito general creada a partir de [recomendaciones de la industria](https://deon.drivendata.org/#checklist-citations) con una herramienta de línea de comandos para fácil integración.
* [Lista de Verificación de Auditoría de Privacidad](https://cyber.harvard.edu/ecommerce/privacyaudit.html) - proporciona orientación general para prácticas de manejo de información desde perspectivas legales y sociales.
* [Lista de Verificación de Equidad en IA](https://www.microsoft.com/en-us/research/project/ai-fairness-checklist/) - creada por practicantes de IA para apoyar la adopción e integración de verificaciones de equidad en los ciclos de desarrollo de IA.
* [22 preguntas para la ética en datos e IA](https://medium.com/the-organization/22-questions-for-ethics-in-data-and-ai-efb68fd19429) - un marco más abierto, estructurado para la exploración inicial de problemas éticos en diseño, implementación y contextos organizacionales.
* [22 preguntas para ética en datos e IA](https://medium.com/the-organization/22-questions-for-ethics-in-data-and-ai-efb68fd19429) - marco más abierto, estructurado para la exploración inicial de problemas éticos en diseño, implementación y contextos organizacionales.
### 3. Regulaciones Éticas
La ética trata de definir valores compartidos y hacer lo correcto _voluntariamente_. **Cumplimiento** trata de _seguir la ley_ si y donde esté definida. **Gobernanza** abarca todas las formas en que las organizaciones operan para hacer cumplir principios éticos y cumplir con las leyes establecidas.
La ética se trata de definir valores compartidos y hacer lo correcto _voluntariamente_. **Cumplimiento** se trata de _seguir la ley_ si está definida. **Gobernanza** abarca todas las formas en que las organizaciones operan para hacer cumplir principios éticos y cumplir con las leyes establecidas.
Hoy en día, la gobernanza toma dos formas dentro de las organizaciones. Primero, se trata de definir principios de **IA ética** y establecer prácticas para operacionalizar la adopción en todos los proyectos relacionados con IA en la organización. Segundo, se trata de cumplir con todas las **regulaciones de protección de datos** impuestas por el gobierno en las regiones donde opera.
Hoy en día, la gobernanza toma dos formas dentro de las organizaciones. Primero, se trata de definir principios de **IA ética** y establecer prácticas para operacionalizar la adopción en todos los proyectos relacionados con IA en la organización. Segundo, se trata de cumplir con todas las regulaciones de **protección de datos** definidas por el gobierno para las regiones en las que opera.
Ejemplos de regulaciones de protección de datos y privacidad:
* `1974`, [Ley de Privacidad de EE. UU.](https://www.justice.gov/opcl/privacy-act-1974) - regula la recolección, uso y divulgación de información personal por parte del _gobierno federal_.
* `1996`, [Ley de Portabilidad y Responsabilidad de Seguros de Salud de EE. UU. (HIPAA)](https://www.cdc.gov/phlp/publications/topic/hipaa.html) - protege datos personales de salud.
* `1998`, [Ley de Protección de la Privacidad Infantil en Línea de EE. UU. (COPPA)](https://www.ftc.gov/enforcement/rules/rulemaking-regulatory-reform-proceedings/childrens-online-privacy-protection-rule) - protege la privacidad de datos de niños menores de 13 años.
* `1974`, [Ley de Privacidad de EE.UU.](https://www.justice.gov/opcl/privacy-act-1974) - regula la recolección, uso y divulgación de información personal por parte del _gobierno federal_.
* `1996`, [Ley de Portabilidad y Responsabilidad de Seguros de Salud de EE.UU. (HIPAA)](https://www.cdc.gov/phlp/publications/topic/hipaa.html) - protege datos personales de salud.
* `1998`, [Ley de Protección de Privacidad en Línea de los Niños de EE.UU. (COPPA)](https://www.ftc.gov/enforcement/rules/rulemaking-regulatory-reform-proceedings/childrens-online-privacy-protection-rule) - protege la privacidad de datos de niños menores de 13 años.
* `2018`, [Reglamento General de Protección de Datos (GDPR)](https://gdpr-info.eu/) - proporciona derechos de usuario, protección de datos y privacidad.
* `2018`, [Ley de Privacidad del Consumidor de California (CCPA)](https://www.oag.ca.gov/privacy/ccpa) - otorga a los consumidores más _derechos_ sobre sus datos personales.
* `2021`, [Ley de Protección de Información Personal de China](https://www.reuters.com/world/china/china-passes-new-personal-data-privacy-law-take-effect-nov-1-2021-08-20/) - una de las regulaciones de privacidad de datos en línea más estrictas del mundo.
* `2021`, [Ley de Protección de Información Personal de China](https://www.reuters.com/world/china/china-passes-new-personal-data-privacy-law-take-effect-nov-1-2021-08-20/) - una de las regulaciones de privacidad de datos en línea más fuertes a nivel mundial.
> 🚨 El Reglamento General de Protección de Datos (GDPR) definido por la Unión Europea sigue siendo una de las regulaciones de privacidad de datos más influyentes hoy en día. ¿Sabías que también define [8 derechos de usuario](https://www.freeprivacypolicy.com/blog/8-user-rights-gdpr) para proteger la privacidad digital y los datos personales de los ciudadanos? Aprende cuáles son y por qué son importantes.
> 🚨 La Unión Europea definió el GDPR (Reglamento General de Protección de Datos), que sigue siendo una de las regulaciones de privacidad de datos más influyentes hoy en día. ¿Sabías que también define [8 derechos de usuario](https://www.freeprivacypolicy.com/blog/8-user-rights-gdpr) para proteger la privacidad digital y los datos personales de los ciudadanos? Aprende cuáles son y por qué son importantes.
### 4. Cultura Ética
Nota que existe una brecha intangible entre el _cumplimiento_ (hacer lo suficiente para cumplir "la letra de la ley") y abordar [problemas sistémicos](https://www.coursera.org/learn/data-science-ethics/home/week/4) (como la osificación, la asimetría de información y la inequidad distributiva) que pueden acelerar la instrumentalización de la IA.
Nota que existe una brecha intangible entre el _cumplimiento_ (hacer lo suficiente para cumplir "la letra de la ley") y abordar [problemas sistémicos](https://www.coursera.org/learn/data-science-ethics/home/week/4) (como la osificación, la asimetría de información y la desigualdad en la distribución) que pueden acelerar la instrumentalización de la IA.
Esto último requiere [enfoques colaborativos para definir culturas éticas](https://towardsdatascience.com/why-ai-ethics-requires-a-culture-driven-approach-26f451afa29f) que construyan conexiones emocionales y valores compartidos consistentes _a través de las organizaciones_ en la industria. Esto exige más [culturas éticas formalizadas en datos](https://www.codeforamerica.org/news/formalizing-an-ethical-data-culture/) en las organizaciones, permitiendo que _cualquiera_ [tire del cordón Andon](https://en.wikipedia.org/wiki/Andon_(manufacturing)) (para plantear preocupaciones éticas temprano en el proceso) y haciendo que las _evaluaciones éticas_ (por ejemplo, en contrataciones) sean un criterio central en la formación de equipos para proyectos de IA.
Esto último requiere [enfoques colaborativos para definir culturas éticas](https://towardsdatascience.com/why-ai-ethics-requires-a-culture-driven-approach-26f451afa29f) que construyan conexiones emocionales y valores compartidos consistentes _entre organizaciones_ en la industria. Esto exige más [culturas éticas formalizadas en datos](https://www.codeforamerica.org/news/formalizing-an-ethical-data-culture/) en las organizaciones, permitiendo que _cualquiera_ [active el cordón Andon](https://en.wikipedia.org/wiki/Andon_(manufacturing)) (para plantear preocupaciones éticas temprano en el proceso) y haciendo que las _evaluaciones éticas_ (por ejemplo, en la contratación) sean un criterio central en la formación de equipos para proyectos de IA.
---
## [Cuestionario posterior a la clase](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/3) 🎯
## [Cuestionario post-lectura](https://ff-quizzes.netlify.app/en/ds/) 🎯
## Revisión y Autoestudio
Los cursos y libros ayudan a comprender los conceptos éticos fundamentales y los desafíos, mientras que los estudios de caso y herramientas ayudan con las prácticas éticas aplicadas en contextos del mundo real. Aquí hay algunos recursos para comenzar:
Los cursos y libros ayudan a comprender los conceptos éticos fundamentales y los desafíos, mientras que los estudios de caso y herramientas ayudan con las prácticas éticas aplicadas en contextos del mundo real. Aquí hay algunos recursos para comenzar.
* [Machine Learning For Beginners](https://github.com/microsoft/ML-For-Beginners/blob/main/1-Introduction/3-fairness/README.md) - lección sobre Equidad, de Microsoft.
* [Principios de IA Responsable](https://docs.microsoft.com/en-us/learn/modules/responsible-ai-principles/) - ruta de aprendizaje gratuita de Microsoft Learn.
* [Ética y Ciencia de Datos](https://resources.oreilly.com/examples/0636920203964) - EBook de O'Reilly (M. Loukides, H. Mason et. al).
* [Ética en la Ciencia de Datos](https://www.coursera.org/learn/data-science-ethics#syllabus) - curso en línea de la Universidad de Michigan.
* [Ética Desenvuelta](https://ethicsunwrapped.utexas.edu/case-studies) - estudios de caso de la Universidad de Texas.
* [Machine Learning For Beginners](https://github.com/microsoft/ML-For-Beginners/blob/main/1-Introduction/3-fairness/README.md) - lección sobre equidad, de Microsoft.
* [Principios de IA Responsable](https://docs.microsoft.com/en-us/learn/modules/responsible-ai-principles/) - ruta de aprendizaje gratuita de Microsoft Learn.
* [Ética y Ciencia de Datos](https://resources.oreilly.com/examples/0636920203964) - EBook de O'Reilly (M. Loukides, H. Mason et. al)
* [Ética en Ciencia de Datos](https://www.coursera.org/learn/data-science-ethics#syllabus) - curso en línea de la Universidad de Michigan.
* [Ética Desenredada](https://ethicsunwrapped.utexas.edu/case-studies) - estudios de caso de la Universidad de Texas.
# Tarea
# Tarea
[Escribe un Estudio de Caso sobre Ética de Datos](assignment.md)
[Escribe un Estudio de Caso sobre Ética de Datos](assignment.md)
---
**Descargo de responsabilidad**:
Este documento ha sido traducido utilizando el servicio de traducción automática [Co-op Translator](https://github.com/Azure/co-op-translator). Si bien nos esforzamos por lograr precisión, tenga en cuenta que las traducciones automáticas pueden contener errores o imprecisiones. El documento original en su idioma nativo debe considerarse como la fuente autorizada. Para información crítica, se recomienda una traducción profesional realizada por humanos. No nos hacemos responsables de malentendidos o interpretaciones erróneas que puedan surgir del uso de esta traducción.
Este documento ha sido traducido utilizando el servicio de traducción automática [Co-op Translator](https://github.com/Azure/co-op-translator). Aunque nos esforzamos por garantizar la precisión, tenga en cuenta que las traducciones automatizadas pueden contener errores o imprecisiones. El documento original en su idioma nativo debe considerarse como la fuente autorizada. Para información crítica, se recomienda una traducción profesional realizada por humanos. No nos hacemos responsables de malentendidos o interpretaciones erróneas que puedan surgir del uso de esta traducción.

@ -1,31 +1,31 @@
<!--
CO_OP_TRANSLATOR_METADATA:
{
"original_hash": "8796f41f566a0a8ebb72863a83d558ed",
"translation_date": "2025-08-24T21:19:53+00:00",
"original_hash": "3a34157cc63516eba97c89a0b2f8c3e6",
"translation_date": "2025-09-03T20:55:16+00:00",
"source_file": "1-Introduction/02-ethics/README.md",
"language_code": "fa"
}
-->
# مقدمه‌ای بر اخلاق داده‌ها
|![طرح مفهومی توسط [(@sketchthedocs)](https://sketchthedocs.dev) ](../../sketchnotes/02-Ethics.png)|
|![طرح‌نگاری توسط [(@sketchthedocs)](https://sketchthedocs.dev)](../../sketchnotes/02-Ethics.png)|
|:---:|
| اخلاق در علم داده - _طرح مفهومی توسط [@nitya](https://twitter.com/nitya)_ |
| اخلاق داده‌ها - _طرحنگاری توسط [@nitya](https://twitter.com/nitya)_ |
---
ما همه شهروندان دنیای داده‌محور هستیم.
ما همه شهروندان داده‌ای هستیم که در دنیایی داده‌محور زندگی می‌کنیم.
روندهای بازار نشان می‌دهند که تا سال ۲۰۲۲، یک‌سوم از سازمان‌های بزرگ داده‌های خود را از طریق [بازارها و مبادلات آنلاین](https://www.gartner.com/smarterwithgartner/gartner-top-10-trends-in-data-and-analytics-for-2020/) خرید و فروش خواهند کرد. به عنوان **توسعه‌دهندگان اپلیکیشن**، ما راحت‌تر و ارزان‌تر می‌توانیم بینش‌های مبتنی بر داده و اتوماسیون مبتنی بر الگوریتم را در تجربه‌های روزمره کاربران ادغام کنیم. اما با گسترش هوش مصنوعی، باید به آسیب‌های احتمالی ناشی از [سوءاستفاده](https://www.youtube.com/watch?v=TQHs8SA1qpk) از این الگوریتم‌ها در مقیاس بزرگ نیز توجه کنیم.
روندهای بازار نشان می‌دهند که تا سال ۲۰۲۲، یک‌سوم سازمان‌های بزرگ داده‌های خود را از طریق [بازارها و مبادلات آنلاین](https://www.gartner.com/smarterwithgartner/gartner-top-10-trends-in-data-and-analytics-for-2020/) خرید و فروش خواهند کرد. به عنوان **توسعه‌دهندگان اپلیکیشن**، ما راحت‌تر و ارزان‌تر می‌توانیم بینش‌های مبتنی بر داده و اتوماسیون مبتنی بر الگوریتم را در تجربه‌های روزمره کاربران ادغام کنیم. اما با گسترش هوش مصنوعی، باید آسیب‌های احتمالی ناشی از [سلاح‌سازی](https://www.youtube.com/watch?v=TQHs8SA1qpk) این الگوریتم‌ها در مقیاس بزرگ را نیز درک کنیم.
روندها همچنین نشان می‌دهند که تا سال ۲۰۲۵ بیش از [۱۸۰ زتابایت](https://www.statista.com/statistics/871513/worldwide-data-created/) داده تولید و مصرف خواهیم کرد. به عنوان **دانشمندان داده**، این به ما دسترسی بی‌سابقه‌ای به داده‌های شخصی می‌دهد. این بدان معناست که می‌توانیم پروفایل‌های رفتاری کاربران را بسازیم و تصمیم‌گیری‌ها را به گونه‌ای تحت تأثیر قرار دهیم که یک [توهم انتخاب آزاد](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice) ایجاد کند، در حالی که ممکن است کاربران را به سمت نتایج دلخواه ما سوق دهد. این موضوع همچنین سوالات گسترده‌تری در مورد حریم خصوصی داده‌ها و حفاظت از کاربران مطرح می‌کند.
روندها همچنین نشان می‌دهند که تا سال ۲۰۲۵، بیش از [۱۸۰ زتابایت](https://www.statista.com/statistics/871513/worldwide-data-created/) داده تولید و مصرف خواهیم کرد. به عنوان **دانشمندان داده**، این دسترسی بی‌سابقه‌ای به داده‌های شخصی به ما می‌دهد. این به ما امکان می‌دهد پروفایل‌های رفتاری کاربران را بسازیم و تصمیم‌گیری‌ها را به گونه‌ای تحت تأثیر قرار دهیم که [توهم انتخاب آزاد](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice) ایجاد کند، در حالی که ممکن است کاربران را به سمت نتایج دلخواه ما سوق دهد. این موضوع همچنین سوالات گسترده‌تری در مورد حریم خصوصی داده‌ها و حفاظت از کاربران مطرح می‌کند.
اخلاق داده‌ها اکنون به عنوان _محافظهای ضروری_ برای علم داده و مهندسی عمل می‌کنند و به ما کمک می‌کنند تا آسیب‌های احتمالی و پیامدهای ناخواسته ناشی از اقدامات مبتنی بر داده‌های خود را به حداقل برسانیم. [چرخه هیجان گارتنر برای هوش مصنوعی](https://www.gartner.com/smarterwithgartner/2-megatrends-dominate-the-gartner-hype-cycle-for-artificial-intelligence-2020/) روندهای مرتبط با اخلاق دیجیتال، هوش مصنوعی مسئولانه و حاکمیت هوش مصنوعی را به عنوان عوامل کلیدی برای روندهای بزرگ‌تر در زمینه _دموکراتیزهسازی_ و _صنعتیسازی_ هوش مصنوعی شناسایی می‌کند.
اخلاق داده‌ها اکنون به عنوان _محافظهای ضروری_ برای علم داده و مهندسی عمل می‌کنند، و به ما کمک می‌کنند آسیب‌های احتمالی و پیامدهای ناخواسته ناشی از اقدامات مبتنی بر داده‌های خود را به حداقل برسانیم. [چرخه هیجان گارتنر برای هوش مصنوعی](https://www.gartner.com/smarterwithgartner/2-megatrends-dominate-the-gartner-hype-cycle-for-artificial-intelligence-2020/) روندهای مرتبط با اخلاق دیجیتال، هوش مصنوعی مسئولانه، و حاکمیت هوش مصنوعی را به عنوان محرک‌های کلیدی برای روندهای بزرگ‌تر پیرامون _دموکراتیزهسازی_ و _صنعتیسازی_ هوش مصنوعی شناسایی می‌کند.
![چرخه هیجان گارتنر برای هوش مصنوعی - ۲۰۲۰](https://images-cdn.newscred.com/Zz1mOWJhNzlkNDA2ZTMxMWViYjRiOGFiM2IyMjQ1YmMwZQ==)
در این درس، ما به بررسی حوزه جذاب اخلاق داده‌ها خواهیم پرداخت - از مفاهیم و چالش‌های اصلی گرفته تا مطالعات موردی و مفاهیم کاربردی هوش مصنوعی مانند حاکمیت - که به ایجاد فرهنگ اخلاقی در تیم‌ها و سازمان‌هایی که با داده‌ها و هوش مصنوعی کار می‌کنند، کمک می‌کند.
در این درس، به حوزه جذاب اخلاق داده‌ها خواهیم پرداخت - از مفاهیم و چالش‌های اصلی گرفته تا مطالعات موردی و مفاهیم کاربردی هوش مصنوعی مانند حاکمیت - که به ایجاد فرهنگ اخلاقی در تیم‌ها و سازمان‌هایی که با داده‌ها و هوش مصنوعی کار می‌کنند کمک می‌کند.
## [آزمون پیش از درس](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/2) 🎯
@ -35,137 +35,136 @@ CO_OP_TRANSLATOR_METADATA:
کلمه "اخلاق" از [کلمه یونانی "ethikos"](https://en.wikipedia.org/wiki/Ethics) (و ریشه آن "ethos") به معنای _شخصیت یا طبیعت اخلاقی_ گرفته شده است.
**اخلاق** درباره ارزش‌های مشترک و اصول اخلاقی است که رفتار ما را در جامعه هدایت می‌کنند. اخلاق بر اساس قوانین نیست، بلکه بر اساس هنجارهای پذیرفته‌شده عمومی از آنچه "درست در مقابل نادرست" است، استوار است. با این حال، ملاحظات اخلاقی می‌توانند بر ابتکارات حاکمیت شرکتی و مقررات دولتی تأثیر بگذارند که انگیزه‌های بیشتری برای رعایت قوانین ایجاد می‌کنند.
**اخلاق** درباره ارزش‌های مشترک و اصول اخلاقی است که رفتار ما در جامعه را هدایت می‌کنند. اخلاق بر اساس قوانین نیست، بلکه بر اساس هنجارهای پذیرفته‌شده عمومی از آنچه "درست در مقابل غلط" است، بنا شده است. با این حال، ملاحظات اخلاقی می‌توانند بر ابتکارات حاکمیت شرکتی و مقررات دولتی تأثیر بگذارند که انگیزه‌های بیشتری برای رعایت ایجاد می‌کنند.
**اخلاق داده‌ها** یک [شاخه جدید از اخلاق](https://royalsocietypublishing.org/doi/full/10.1098/rsta.2016.0360#sec-1) است که "مشکلات اخلاقی مرتبط با ادهها، الگوریتم‌ها و شیوه‌های مربوطه_ را مطالعه و ارزیابی می‌کند". در اینجا، **"داده‌ها"** بر اقدامات مربوط به تولید، ثبت، مدیریت، پردازش، انتشار، اشتراک‌گذاری و استفاده تمرکز دارد، **"الگوریتم‌ها"** بر هوش مصنوعی، عوامل، یادگیری ماشین و ربات‌ها تمرکز دارد، و **"شیوه‌ها"** بر موضوعاتی مانند نوآوری مسئولانه، برنامه‌نویسی، هک و کدهای اخلاقی تمرکز دارد.
**اخلاق داده‌ها** یک [شاخه جدید از اخلاق](https://royalsocietypublishing.org/doi/full/10.1098/rsta.2016.0360#sec-1) است که "مشکلات اخلاقی مرتبط با ادهها، الگوریتم‌ها و شیوه‌های مربوطه_ را مطالعه و ارزیابی می‌کند". در اینجا، **"داده‌ها"** بر اقدامات مرتبط با تولید، ضبط، مدیریت، پردازش، انتشار، اشتراک‌گذاری و استفاده تمرکز دارد، **"الگوریتم‌ها"** بر هوش مصنوعی، عوامل، یادگیری ماشین و ربات‌ها تمرکز دارد، و **"شیوه‌ها"** بر موضوعاتی مانند نوآوری مسئولانه، برنامه‌نویسی، هک کردن، و کدهای اخلاقی تمرکز دارد.
**اخلاق کاربردی** [کاربرد عملی ملاحظات اخلاقی](https://en.wikipedia.org/wiki/Applied_ethics) است. این فرآیند بررسی فعال مسائل اخلاقی در زمینه _اقدامات، محصولات و فرآیندهای دنیای واقعی_ و اتخاذ اقدامات اصلاحی برای اطمینان از هم‌راستایی آنها با ارزش‌های اخلاقی تعریف‌شده ما است.
**اخلاق کاربردی** [کاربرد عملی ملاحظات اخلاقی](https://en.wikipedia.org/wiki/Applied_ethics) است. این فرآیند بررسی فعالانه مسائل اخلاقی در زمینه _اقدامات، محصولات و فرآیندهای واقعی_ و اتخاذ اقدامات اصلاحی برای اطمینان از هم‌راستایی آنها با ارزش‌های اخلاقی تعریف‌شده ما است.
**فرهنگ اخلاقی** درباره [_عملیاتی کردن_ اخلاق کاربردی](https://hbr.org/2019/05/how-to-design-an-ethical-organization) است تا اطمینان حاصل شود که اصول و شیوه‌های اخلاقی ما به طور مداوم و در مقیاس وسیع در سراسر سازمان پذیرفته می‌شوند. فرهنگ‌های اخلاقی موفق اصول اخلاقی سازمانی را تعریف می‌کنند، انگیزه‌های معناداری برای رعایت قوانین ارائه می‌دهند و هنجارهای اخلاقی را با تشویق و تقویت رفتارهای مطلوب در هر سطح از سازمان تقویت می‌کنند.
**فرهنگ اخلاقی** درباره [_عملیاتی کردن_ اخلاق کاربردی](https://hbr.org/2019/05/how-to-design-an-ethical-organization) است تا اطمینان حاصل شود که اصول و شیوه‌های اخلاقی ما به طور مداوم و مقیاس‌پذیر در سراسر سازمان پذیرفته می‌شوند. فرهنگ‌های اخلاقی موفق اصول اخلاقی سازمانی را تعریف می‌کنند، انگیزه‌های معناداری برای رعایت ارائه می‌دهند، و هنجارهای اخلاقی را با تشویق و تقویت رفتارهای مطلوب در هر سطح سازمان تقویت می‌کنند.
## مفاهیم اخلاقی
در این بخش، مفاهیمی مانند **ارزش‌های مشترک** (اصول) و **چالش‌های اخلاقی** (مشکلات) برای اخلاق داده‌ها را بررسی خواهیم کرد - و به **مطالعات موردی** خواهیم پرداخت که به شما کمک می‌کنند این مفاهیم را در زمینه‌های دنیای واقعی درک کنید.
در این بخش، مفاهیمی مانند **ارزش‌های مشترک** (اصول) و **چالش‌های اخلاقی** (مشکلات) برای اخلاق داده‌ها را بررسی خواهیم کرد - و مطالعات موردی را بررسی می‌کنیم که به شما کمک می‌کنند این مفاهیم را در زمینه‌های واقعی درک کنید.
### 1. اصول اخلاقی
هر استراتژی اخلاق داده‌ها با تعریف _اصول اخلاقی_ آغاز می‌شود - "ارزش‌های مشترکی" که رفتارهای قابل قبول را توصیف می‌کنند و اقدامات مطابق با قوانین را در پروژه‌های داده و هوش مصنوعی ما هدایت می‌کنند. شما می‌توانید این اصول را در سطح فردی یا تیمی تعریف کنید. با این حال، بیشتر سازمان‌های بزرگ این اصول را در قالب یک بیانیه مأموریت یا چارچوب اخلاقی هوش مصنوعی تعریف می‌کنند که در سطح شرکتی تعریف شده و به طور مداوم در تمام تیم‌ها اجرا می‌شود.
هر استراتژی اخلاق داده‌ها با تعریف _اصول اخلاقی_ آغاز می‌شود - "ارزش‌های مشترک" که رفتارهای قابل قبول را توصیف می‌کنند و اقدامات مطابق را در پروژه‌های داده و هوش مصنوعی ما هدایت می‌کنند. شما می‌توانید این اصول را در سطح فردی یا تیمی تعریف کنید. با این حال، بیشتر سازمان‌های بزرگ این اصول را در قالب بیانیه مأموریت یا چارچوب _هوش مصنوعی اخلاقی_ در سطح شرکتی تعریف می‌کنند و به طور مداوم در سراسر تیم‌ها اجرا می‌کنند.
**مثال:** بیانیه مأموریت [هوش مصنوعی مسئولانه](https://www.microsoft.com/en-us/ai/responsible-ai) مایکروسافت می‌گوید: _"ما متعهد به پیشرفت هوش مصنوعی بر اساس اصول اخلاقی هستیم که انسان‌ها را در اولویت قرار می‌دهد"_ - و ۶ اصل اخلاقی را در چارچوب زیر شناسایی می‌کند:
![هوش مصنوعی مسئولانه در مایکروسافت](https://docs.microsoft.com/en-gb/azure/cognitive-services/personalizer/media/ethics-and-responsible-use/ai-values-future-computed.png)
بیایید این اصول را به طور خلاصه بررسی کنیم. _شفافیت_ و اسخگویی_ ارزش‌های بنیادی هستند که سایر اصول بر اساس آنها ساخته شده‌اند - بنابراین از اینجا شروع می‌کنیم:
بیایید این اصول را به طور مختصر بررسی کنیم. _شفافیت_ و اسخگویی_ ارزش‌های بنیادی هستند که سایر اصول بر اساس آنها بنا شده‌اند - بنابراین از اینجا شروع می‌کنیم:
* [**پاسخگویی**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) متخصصان را _مسئول_ عملیات داده و هوش مصنوعی خود و رعایت این اصول اخلاقی می‌کند.
* [**شفافیت**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) اطمینان می‌دهد که اقدامات داده و هوش مصنوعی برای کاربران ابل درک_ هستند و دلیل تصمیمات را توضیح می‌دهند.
* [**عدالت**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1%3aprimaryr6) - بر اطمینان از رفتار عادلانه هوش مصنوعی با _همه افراد_ تمرکز دارد و به تعصبات سیستماتیک یا ضمنی در داده‌ها و سیستم‌ها می‌پردازد.
* [**شفافیت**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) اطمینان می‌دهد که اقدامات داده و هوش مصنوعی برای کاربران ابل فهم_ هستند و توضیح می‌دهند که چه چیزی و چرا پشت تصمیمات قرار دارد.
* [**عدالت**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1%3aprimaryr6) - بر اطمینان از رفتار عادلانه هوش مصنوعی با _همه افراد_ تمرکز دارد و به هرگونه تعصب اجتماعی-فنی سیستماتیک یا ضمنی در داده‌ها و سیستم‌ها می‌پردازد.
* [**قابلیت اطمینان و ایمنی**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - اطمینان می‌دهد که هوش مصنوعی به طور ابت_ با ارزش‌های تعریف‌شده رفتار می‌کند و آسیب‌های احتمالی یا پیامدهای ناخواسته را به حداقل می‌رساند.
* [**حریم خصوصی و امنیت**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - درباره درک منشأ داده‌ها و ارائه فاظت‌های مرتبط با حریم خصوصی دادهها_ به کاربران است.
* [**شمول‌گرایی**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - درباره طراحی راه‌حل‌های هوش مصنوعی با نیت و تطبیق آن‌ها برای پاسخگویی به _نیازها و قابلیت‌های متنوع انسانی_ است.
* [**حریم خصوصی و امنیت**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - درباره درک منشأ داده‌ها و ارائه ریم خصوصی داده و حفاظتهای مرتبط_ به کاربران است.
* [**شمول‌پذیری**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - درباره طراحی راه‌حل‌های هوش مصنوعی با قصد، و تطبیق آنها برای پاسخگویی به _طیف گسترده‌ای از نیازها و قابلیت‌های انسانی_ است.
> 🚨 به این فکر کنید که بیانیه مأموریت اخلاق داده‌های شما چه می‌تواند باشد. چارچوب‌های اخلاقی هوش مصنوعی از سازمان‌های دیگر را بررسی کنید - اینجا مثال‌هایی از [IBM](https://www.ibm.com/cloud/learn/ai-ethics)، [گوگل](https://ai.google/principles)، و [فیسبوک](https://ai.facebook.com/blog/facebooks-five-pillars-of-responsible-ai/) آورده شده است. چه ارزش‌های مشترکی در آن‌ها وجود دارد؟ این اصول چگونه به محصول هوش مصنوعی یا صنعتی که در آن فعالیت می‌کنند مرتبط هستند؟
> 🚨 به این فکر کنید که بیانیه مأموریت اخلاق داده‌های شما چه می‌تواند باشد. چارچوب‌های هوش مصنوعی اخلاقی از سازمان‌های دیگر را بررسی کنید - اینجا نمونه‌هایی از [IBM](https://www.ibm.com/cloud/learn/ai-ethics)، [Google](https://ai.google/principles)، و [Facebook](https://ai.facebook.com/blog/facebooks-five-pillars-of-responsible-ai/) وجود دارد. چه ارزش‌های مشترکی دارند؟ این اصول چگونه به محصول هوش مصنوعی یا صنعتی که در آن فعالیت می‌کنند مرتبط هستند؟
### 2. چالش‌های اخلاقی
پس از تعریف اصول اخلاقی، گام بعدی ارزیابی اقدامات داده و هوش مصنوعی برای بررسی هم‌راستایی آن‌ها با این ارزش‌های مشترک است. اقدامات خود را در دو دسته در نظر بگیرید: _جمعآوری دادهها_ و _طراحی الگوریتم_.
پس از تعریف اصول اخلاقی، گام بعدی ارزیابی اقدامات داده و هوش مصنوعی ما برای بررسی هم‌راستایی آنها با ارزش‌های مشترک است. به اقدامات خود در دو دسته فکر کنید: _جمعآوری دادهها_ و _طراحی الگوریتم_.
در جمع‌آوری داده‌ها، اقدامات احتمالاً شامل **داده‌های شخصی** یا اطلاعات شناسایی شخصی (PII) برای افراد قابل شناسایی خواهد بود. این شامل [موارد متنوعی از داده‌های غیرشخصی](https://ec.europa.eu/info/law/law-topic/data-protection/reform/what-personal-data_en) است که ه طور جمعی_ یک فرد را شناسایی می‌کنند. چالش‌های اخلاقی می‌توانند به موضوعاتی مانند _حریم خصوصی دادهها_، الکیت دادهها_ و موضوعات مرتبط مانند _رضایت آگاهانه_ و _حقوق مالکیت فکری_ برای کاربران مربوط شوند.
در جمع‌آوری داده‌ها، اقدامات احتمالاً شامل **داده‌های شخصی** یا اطلاعات قابل شناسایی شخصی (PII) برای افراد قابل شناسایی خواهد بود. این شامل [موارد متنوعی از داده‌های غیرشخصی](https://ec.europa.eu/info/law/law-topic/data-protection/reform/what-personal-data_en) است که ه طور جمعی_ یک فرد را شناسایی می‌کنند. چالش‌های اخلاقی می‌توانند به موضوعاتی مانند _حریم خصوصی دادهها_، الکیت دادهها_، و موضوعات مرتبط مانند _رضایت آگاهانه_ و _حقوق مالکیت معنوی_ برای کاربران مرتبط باشند.
در طراحی الگوریتم، اقدامات شامل جمع‌آوری و مدیریت **مجموعه داده‌ها** و سپس استفاده از آنها برای آموزش و استقرار **مدل‌های داده** است که نتایج را پیش‌بینی یا تصمیمات را در زمینه‌های واقعی خودکار می‌کنند. چالش‌های اخلاقی می‌توانند از _تعصب در مجموعه دادهها_، مشکلات _کیفیت دادهها_، _بیعدالتی_ و _تحریف_ در الگوریتم‌ها ناشی شوند - از جمله برخی مسائل که ذاتاً سیستماتیک هستند.
در طراحی الگوریتم، اقدامات شامل جمع‌آوری و مدیریت **مجموعه داده‌ها** و سپس استفاده از آنها برای آموزش و استقرار **مدل‌های داده** خواهد بود که نتایج را پیش‌بینی می‌کنند یا تصمیمات را در زمینه‌های واقعی خودکار می‌کنند. چالش‌های اخلاقی می‌توانند از _تعصب مجموعه دادهها_، مشکلات _کیفیت دادهها_، _بیعدالتی_ و _نمایش نادرست_ در الگوریتم‌ها ناشی شوند - از جمله برخی مسائل که ماهیت سیستماتیک دارند.
در هر دو مورد، چالش‌های اخلاقی مناطقی را برجسته می‌کنند که اقدامات ما ممکن است با ارزش‌های مشترک ما در تضاد باشند. برای شناسایی، کاهش، به حداقل رساندن یا حذف این نگرانی‌ها، باید سوالات اخلاقی "بله/خیر" مرتبط با اقدامات خود را بپرسیم و سپس اقدامات اصلاحی لازم را انجام دهیم. بیایید به برخی از چالش‌های اخلاقی و سوالات اخلاقی که مطرح می‌کنند نگاهی بیندازیم:
در هر دو مورد، چالش‌های اخلاقی مناطقی را برجسته می‌کنند که اقدامات ما ممکن است با ارزش‌های مشترک ما در تضاد باشند. برای شناسایی، کاهش، به حداقل رساندن یا حذف این نگرانی‌ها - باید سوالات اخلاقی "بله/خیر" مرتبط با اقدامات خود را بپرسیم و سپس اقدامات اصلاحی لازم را انجام دهیم. بیایید نگاهی به برخی چالش‌های اخلاقی و سوالات اخلاقی مرتبط با آنها بیندازیم:
#### 2.1 مالکیت داده‌ها
جمع‌آوری داده‌ها اغلب شامل داده‌های شخصی است که می‌تواند افراد را شناسایی کند. [مالکیت داده‌ها](https://permission.io/blog/data-ownership) درباره _کنترل_ و [_حقوق کاربران_](https://permission.io/blog/data-ownership) مرتبط با ایجاد، پردازش و انتشار داده‌ها است.
جمع‌آوری داده‌ها اغلب شامل داده‌های شخصی است که می‌تواند افراد داده‌شده را شناسایی کند. [مالکیت داده‌ها](https://permission.io/blog/data-ownership) درباره _کنترل_ و [_حقوق کاربران_](https://permission.io/blog/data-ownership) مرتبط با ایجاد، پردازش، و انتشار داده‌ها است.
سوالات اخلاقی که باید بپرسیم:
سوالات اخلاقی که باید پرسیده شوند:
* چه کسی مالک داده‌ها است؟ (کاربر یا سازمان)
* کاربران چه حقوقی دارند؟ (مثلاً دسترسی، حذف، قابلیت انتقال)
* سازمان‌ها چه حقوقی دارند؟ (مثلاً اصلاح نظرات مخرب کاربران)
* کاربران چه حقوقی دارند؟ (مانند دسترسی، حذف، قابلیت انتقال)
* سازمان‌ها چه حقوقی دارند؟ (مانند اصلاح نظرات مخرب کاربران)
#### 2.2 رضایت آگاهانه
[رضایت آگاهانه](https://legaldictionary.net/informed-consent/) به عمل موافقت کاربران با یک اقدام (مانند جمع‌آوری داده‌ها) با _درک کامل_ حقایق مرتبط از جمله هدف، خطرات احتمالی و جایگزین‌ها اشاره دارد.
[رضایت آگاهانه](https://legaldictionary.net/informed-consent/) به عمل موافقت کاربران با یک اقدام (مانند جمع‌آوری داده‌ها) با _درک کامل_ حقایق مرتبط از جمله هدف، خطرات احتمالی، و جایگزین‌ها اشاره دارد.
سوالاتی که باید بررسی شوند:
سوالات برای بررسی:
* آیا کاربر (موضوع داده) اجازه جمع‌آوری و استفاده از داده‌ها را داده است؟
* آیا کاربر هدف از جمع‌آوری داده‌ها را درک کرده است؟
* آیا کاربر خطرات احتمالی مشارکت خود را درک کرده است؟
#### 2.3 مالکیت فکری
#### 2.3 مالکیت معنوی
[مالکیت فکری](https://en.wikipedia.org/wiki/Intellectual_property) به خلاقیت‌های ناملموسی اشاره دارد که از ابتکار انسانی ناشی می‌شوند و ممکن است _ارزش اقتصادی_ برای افراد یا کسب‌وکارها داشته باشند.
[مالکیت معنوی](https://en.wikipedia.org/wiki/Intellectual_property) به خلقیات غیرملموس ناشی از ابتکار انسانی اشاره دارد که ممکن است _ارزش اقتصادی_ برای افراد یا کسب‌وکارها داشته باشد.
سوالاتی که باید بررسی شوند:
* آیا داده‌های جمع‌آوری‌شده ارزش اقتصادی برای کاربر یا کسب‌وکار داشته‌اند؟
* آیا **کاربر** در اینجا مالکیت فکری دارد؟
* آیا **سازمان** در اینجا مالکیت فکری دارد؟
* اگر این حقوق وجود دارند، چگونه از آنها محافظت می‌کنیم؟
سوالات برای بررسی:
* آیا داده‌های جمع‌آوری‌شده ارزش اقتصادی برای کاربر یا کسب‌وکار دارند؟
* آیا **کاربر** مالکیت معنوی در اینجا دارد؟
* آیا **سازمان** مالکیت معنوی در اینجا دارد؟
* اگر این حقوق وجود دارند، چگونه آنها را محافظت می‌کنیم؟
#### 2.4 حریم خصوصی داده‌ها
[حریم خصوصی داده‌ها](https://www.northeastern.edu/graduate/blog/what-is-data-privacy/) یا حریم اطلاعات به حفظ حریم خصوصی کاربران و حفاظت از هویت آن‌ها در ارتباط با اطلاعات شناسایی شخصی اشاره دارد.
[حریم خصوصی داده‌ها](https://www.northeastern.edu/graduate/blog/what-is-data-privacy/) یا حریم اطلاعات به حفظ حریم کاربران و حفاظت از هویت کاربران در ارتباط با اطلاعات قابل شناسایی شخصی اشاره دارد.
سوالاتی که باید بررسی شوند:
* آیا داده‌های (شخصی) کاربران در برابر هک و نشت محافظت شده‌اند؟
سوالات برای بررسی:
* آیا داده‌های (شخصی) کاربران در برابر هکها و نشت‌ها ایمن هستند؟
* آیا داده‌های کاربران فقط برای کاربران و زمینه‌های مجاز قابل دسترسی هستند؟
* آیا ناشناس بودن کاربران هنگام اشتراک‌گذاری یا انتشار داده‌ها حفظ شده است؟
* آیا می‌توان یک کاربر را از مجموعه داده‌های ناشناس شناسایی کرد؟
* آیا ناشناس بودن کاربران هنگام اشتراک‌گذاری یا انتشار داده‌ها حفظ می‌شود؟
* آیا می‌توان کاربر را از مجموعه داده‌های ناشناس شناسایی کرد؟
#### 2.5 حق فراموش شدن
[حق فراموش شدن](https://en.wikipedia.org/wiki/Right_to_be_forgotten) یا [حق حذف](https://www.gdpreu.org/right-to-be-forgotten/) حفاظت بیشتری از داده‌های شخصی به کاربران ارائه می‌دهد. به طور خاص، این حق به کاربران اجازه می‌دهد درخواست حذف یا حذف داده‌های شخصی خود را از جستجوهای اینترنتی و مکان‌های دیگر، _تحت شرایط خاص_، ارائه دهند - و به آن‌ها اجازه می‌دهد بدون اینکه اقدامات گذشته علیه آنها استفاده شود، یک شروع تازه آنلاین داشته باشند.
[حق فراموش شدن](https://en.wikipedia.org/wiki/Right_to_be_forgotten) یا [حق حذف](https://www.gdpreu.org/right-to-be-forgotten/) حفاظت اضافی از داده‌های شخصی به کاربران ارائه می‌دهد. به طور خاص، این حق به کاربران اجازه می‌دهد درخواست حذف یا حذف داده‌های شخصی از جستجوهای اینترنتی و مکان‌های دیگر را _تحت شرایط خاص_ بدهند - به آنها امکان شروع تازه آنلاین بدون اینکه اقدامات گذشته علیه آنها استفاده شود.
سوالاتی که باید بررسی شوند:
* آیا سیستم اجازه می‌دهد که موضوعات داده درخواست حذف کنند؟
سوالات برای بررسی:
* آیا سیستم اجازه می‌دهد موضوعات داده درخواست حذف کنند؟
* آیا باید لغو رضایت کاربر باعث حذف خودکار شود؟
* آیا داده‌ها بدون رضایت یا به روش‌های غیرقانونی جمع‌آوری شده‌اند؟
* آیا ما با مقررات دولتی برای حریم خصوصی داده‌ها مطابقت داریم؟
#### 2.6 تعصب در مجموعه داده‌ها
#### 2.6 تعصب مجموعه داده‌ها
تعصب در مجموعه داده‌ها یا [تعصب در جمع‌آوری](http://researcharticles.com/index.php/bias-in-data-collection-in-research/) به انتخاب یک زیرمجموعه _غیرنماینده_ از داده‌ها برای توسعه الگوریتم اشاره دارد که ممکن است منجر به نتایج ناعادلانه برای گروه‌های مختلف شود. انواع تعصب شامل تعصب در انتخاب یا نمونه‌گیری، تعصب داوطلبانه و تعصب ابزاری است.
تعصب مجموعه داده‌ها یا [تعصب جمع‌آوری](http://researcharticles.com/index.php/bias-in-data-collection-in-research/) درباره انتخاب یک زیرمجموعه _غیرنماینده_ از داده‌ها برای توسعه الگوریتم است که ممکن است نتایج ناعادلانه‌ای برای گروه‌های مختلف ایجاد کند. انواع تعصب شامل تعصب انتخاب یا نمونه‌گیری، تعصب داوطلبانه، و تعصب ابزار است.
سوالاتی که باید بررسی شوند:
* آیا ما مجموعه‌ای نماینده از موضوعات داده را انتخاب کرده‌ایم؟
* آیا مجموعه داده‌های جمع‌آوری‌شده یا مدیریت‌شده خود را از نظر تعصبات مختلف آزمایش کرده‌ایم؟
* آیا می‌توانیم تعصبات کشف‌شده را کاهش یا حذف کنیم؟
سوالات برای بررسی:
* آیا ما مجموعه نماینده‌ای از موضوعات داده را انتخاب کرده‌ایم؟
* آیا مجموعه داده‌های جمع‌آوری‌شده یا مدیریت‌شده خود را برای انواع مختلف تعصب آزمایش کرده‌ایم؟
* آیا می‌توانیم هرگونه تعصب کشف‌شده را کاهش دهیم یا حذف کنیم؟
#### 2.7 کیفیت داده‌ها
[کیفیت داده‌ها](https://lakefs.io/data-quality-testing/) به اعتبار مجموعه داده مدیریت‌شده برای توسعه الگوریتم‌های ما اشاره دارد و بررسی می‌کند که آیا ویژگی‌ها و رکوردها الزامات سطح دقت و سازگاری مورد نیاز برای هدف هوش مصنوعی ما را برآورده می‌کنند یا خیر.
[کیفیت داده‌ها](https://lakefs.io/data-quality-testing/) به اعتبار مجموعه داده‌های مدیریت‌شده برای توسعه الگوریتم‌های ما اشاره دارد، بررسی اینکه آیا ویژگی‌ها و رکوردها الزامات سطح دقت و سازگاری مورد نیاز برای هدف هوش مصنوعی ما را برآورده می‌کنند.
سوالاتی که باید بررسی شوند:
سوالات برای بررسی:
* آیا ما ویژگی‌های معتبر برای مورد استفاده خود را جمع‌آوری کرده‌ایم؟
* آیا داده‌ها به طور ازگار_ از منابع داده متنوع جمع‌آوری شده‌اند؟
* آیا مجموعه داده برای شرایط یا سناریوهای متنوع امل_ است؟
* آیا اطلاعات به طور _دقیق_ واقعیت را منعکس می‌کنند؟
* آیا داده‌ها به طور ازگار_ از منابع مختلف داده جمع‌آوری شده‌اند؟
* آیا مجموعه داده برای شرایط یا سناریوهای مختلف امل_ است؟
* آیا اطلاعات جمع‌آوری‌شده _دقیقاً_ واقعیت را منعکس می‌کند؟
#### 2.8 عدالت الگوریتمی
[بررسی عدالت الگوریتمی](https://towardsdatascience.com/what-is-algorithm-fairness-3182e161cf9f) به این موضوع می‌پردازد که آیا طراحی الگوریتم به طور سیستماتیک علیه گروه‌های خاصی از افراد تبعیض قائل می‌شود و منجر به [آسیب‌های احتمالی](https://docs.microsoft.com/en-us/azure/machine-learning/concept-fairness-ml) در _تخصیص منابع_ (جایی که منابع از آن گروه محروم یا دریغ می‌شوند) و _کیفیت خدمات_ (جایی که دقت هوش مصنوعی برای برخی گروه‌ها کمتر از دیگران است) می‌شود.
#### 2.8 عدالت الگوریتم
[بررسی عدالت الگوریتمی](https://towardsdatascience.com/what-is-algorithm-fairness-3182e161cf9f) به این موضوع می‌پردازد که آیا طراحی الگوریتم به طور سیستماتیک علیه گروه‌های خاصی از افراد تبعیض قائل می‌شود و منجر به [آسیب‌های احتمالی](https://docs.microsoft.com/en-us/azure/machine-learning/concept-fairness-ml) در _تخصیص منابع_ (جایی که منابع از آن گروه دریغ می‌شود) و _کیفیت خدمات_ (جایی که دقت هوش مصنوعی برای برخی گروه‌ها کمتر از دیگران است) می‌شود.
سؤالاتی که باید در اینجا بررسی شوند:
* آیا دقت مدل را برای گروه‌ها و شرایط متنوع ارزیابی کرده‌ایم؟
* آیا سیستم را برای آسیب‌های احتمالی (مانند کلیشه‌سازی) بررسی کرده‌ایم؟
* آیا می‌توانیم داده‌ها را اصلاح کنیم یا مدل‌ها را دوباره آموزش دهیم تا آسیب‌های شناسایی‌شده را کاهش دهیم؟
* آیا می‌توانیم داده‌ها را اصلاح کنیم یا مدل‌ها را دوباره آموزش دهیم تا آسیب‌های شناسایی‌شده کاهش یابد؟
منابعی مانند [چک‌لیست‌های عدالت هوش مصنوعی](https://query.prod.cms.rt.microsoft.com/cms/api/am/binary/RE4t6dA) را بررسی کنید تا اطلاعات بیشتری کسب کنید.
#### 2.9 تحریف داده‌ها
[تحریف داده‌ها](https://www.sciencedirect.com/topics/computer-science/misrepresentation) به این موضوع می‌پردازد که آیا ما بینش‌های حاصل از داده‌های گزارش‌شده را به صورت صادقانه اما به شکلی فریبنده برای حمایت از یک روایت مطلوب ارائه می‌دهیم.
[تحریف داده‌ها](https://www.sciencedirect.com/topics/computer-science/misrepresentation) به این موضوع می‌پردازد که آیا ما بینش‌های حاصل از داده‌های گزارش‌شده را به شکلی فریبنده برای حمایت از یک روایت مطلوب ارائه می‌دهیم.
سؤالاتی که باید در اینجا بررسی شوند:
* آیا داده‌های ناقص یا نادرست را گزارش می‌دهیم؟
* آیا داده‌ها را به شکلی تجسم می‌کنیم که منجر به نتیجه‌گیری‌های گمراه‌کننده شود؟
* آیا داده‌های ناقص یا نادرست گزارش می‌دهیم؟
* آیا داده‌ها را به شکلی بصری ارائه می‌دهیم که منجر به نتیجه‌گیری‌های گمراه‌کننده شود؟
* آیا از تکنیک‌های آماری انتخابی برای دستکاری نتایج استفاده می‌کنیم؟
* آیا توضیحات جایگزینی وجود دارد که ممکن است نتیجه متفاوتی ارائه دهد؟
#### 2.10 انتخاب آزاد
[توهم انتخاب آزاد](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice) زمانی رخ می‌دهد که "معماری انتخاب" سیستم از الگوریتم‌های تصمیم‌گیری برای هدایت افراد به سمت یک نتیجه ترجیحی استفاده می‌کند، در حالی که به نظر می‌رسد به آن‌ها گزینه‌ها و کنترل داده شده است. این [الگوهای تاریک](https://www.darkpatterns.org/) می‌توانند به کاربران آسیب‌های اجتماعی و اقتصادی وارد کنند. از آنجا که تصمیمات کاربران بر پروفایل‌های رفتاری تأثیر می‌گذارد، این اقدامات ممکن است انتخاب‌های آینده را تقویت یا گسترش دهد و تأثیر این آسیب‌ها را افزایش دهد.
[توهم انتخاب آزاد](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice) زمانی رخ می‌دهد که "معماری انتخاب" سیستم از الگوریتم‌های تصمیم‌گیری برای هدایت افراد به سمت یک نتیجه مطلوب استفاده می‌کند، در حالی که به نظر می‌رسد به آن‌ها گزینه‌ها و کنترل داده شده است. این [الگوهای تاریک](https://www.darkpatterns.org/) می‌توانند به کاربران آسیب‌های اجتماعی و اقتصادی وارد کنند. از آنجا که تصمیمات کاربران بر پروفایل‌های رفتاری تأثیر می‌گذارد، این اقدامات ممکن است انتخاب‌های آینده را تقویت یا گسترش دهد و تأثیر این آسیب‌ها را افزایش دهد.
سؤالاتی که باید در اینجا بررسی شوند:
* آیا کاربر پیامدهای انتخاب خود را درک کرده است؟
@ -174,24 +173,24 @@ CO_OP_TRANSLATOR_METADATA:
### 3. مطالعات موردی
برای قرار دادن این چالش‌های اخلاقی در زمینه‌های واقعی، بررسی مطالعات موردی که آسیب‌ها و پیامدهای احتمالی برای افراد و جامعه را نشان می‌دهند، زمانی که چنین نقض‌های اخلاقی نادیده گرفته می‌شوند، مفید است.
برای قرار دادن این چالش‌های اخلاقی در زمینه‌های واقعی، بررسی مطالعات موردی که آسیب‌ها و پیامدهای احتمالی برای افراد و جامعه را نشان می‌دهند، زمانی که این نقض‌های اخلاقی نادیده گرفته شوند، مفید است.
در اینجا چند مثال آورده شده است:
در اینجا چند نمونه آورده شده است:
| چالش اخلاقی | مطالعه موردی |
|--- |--- |
| **رضایت آگاهانه** | 1972 - [مطالعه سیفلیس توسکیگی](https://en.wikipedia.org/wiki/Tuskegee_Syphilis_Study) - مردان آفریقایی-آمریکایی که در این مطالعه شرکت کردند وعده مراقبت پزشکی رایگان داده شد _اما توسط محققان فریب داده شدند_ که به آن‌ها در مورد تشخیص بیماری یا در دسترس بودن درمان اطلاع ندادند. بسیاری از شرکت‌کنندگان جان خود را از دست دادند و شرکا یا فرزندان آن‌ها تحت تأثیر قرار گرفتند؛ این مطالعه 40 سال طول کشید. |
| **حریم خصوصی داده‌ها** | 2007 - [جایزه داده‌های نتفلیکس](https://www.wired.com/2007/12/why-anonymous-data-sometimes-isnt/) به محققان _10 میلیون رتبه‌بندی فیلم ناشناس از 50 هزار مشتری_ ارائه شد تا به بهبود الگوریتم‌های توصیه کمک کند. با این حال، محققان توانستند داده‌های ناشناس را با داده‌های قابل شناسایی شخصی در _مجموعههای داده خارجی_ (مانند نظرات IMDb) مرتبط کنند - به طور مؤثر برخی از مشترکان نتفلیکس را "غیرناشناس" کردند.|
| **رضایت آگاهانه** | 1972 - [مطالعه سیفلیس توسکیگی](https://en.wikipedia.org/wiki/Tuskegee_Syphilis_Study) - مردان آفریقایی-آمریکایی که در این مطالعه شرکت کردند وعده مراقبت پزشکی رایگان داده شد، _اما توسط محققان فریب داده شدند_ که به آن‌ها در مورد تشخیص بیماری یا در دسترس بودن درمان اطلاع ندادند. بسیاری از شرکت‌کنندگان جان خود را از دست دادند و شرکا یا فرزندان آن‌ها تحت تأثیر قرار گرفتند؛ این مطالعه 40 سال طول کشید. |
| **حریم خصوصی داده‌ها** | 2007 - [جایزه داده‌های نتفلیکس](https://www.wired.com/2007/12/why-anonymous-data-sometimes-isnt/) به محققان _10 میلیون رتبه‌بندی فیلم ناشناس از 50 هزار مشتری_ ارائه شد تا الگوریتم‌های توصیه را بهبود دهند. با این حال، محققان توانستند داده‌های ناشناس را با داده‌های قابل شناسایی شخصی در _مجموعههای داده خارجی_ (مانند نظرات IMDb) مرتبط کنند - به طور مؤثر برخی از مشترکان نتفلیکس را "غیرناشناس" کردند.|
| **تعصب در جمع‌آوری داده‌ها** | 2013 - شهر بوستون [اپلیکیشن Street Bump](https://www.boston.gov/transportation/street-bump) را توسعه داد که به شهروندان اجازه می‌داد چاله‌ها را گزارش دهند و به شهر داده‌های بهتر جاده‌ای برای یافتن و رفع مشکلات ارائه دهد. با این حال، [افراد در گروه‌های کم‌درآمد دسترسی کمتری به خودروها و تلفن‌ها داشتند](https://hbr.org/2013/04/the-hidden-biases-in-big-data)، که مشکلات جاده‌ای آن‌ها را در این اپلیکیشن نامرئی می‌کرد. توسعه‌دهندگان با دانشگاهیان همکاری کردند تا مسائل مربوط به _دسترسی عادلانه و شکاف‌های دیجیتال_ را برای عدالت حل کنند. |
| **عدالت الگوریتمی** | 2018 - مطالعه [Gender Shades](http://gendershades.org/overview.html) MIT دقت محصولات هوش مصنوعی در طبقه‌بندی جنسیت را ارزیابی کرد و شکاف‌های دقت برای زنان و افراد رنگین‌پوست را آشکار کرد. یک [کارت اپل 2019](https://www.wired.com/story/the-apple-card-didnt-see-genderand-thats-the-problem/) به نظر می‌رسید که اعتبار کمتری به زنان نسبت به مردان ارائه می‌دهد. هر دو مسائل مربوط به تعصب الگوریتمی را نشان دادند که منجر به آسیب‌های اجتماعی-اقتصادی شد.|
| **تحریف داده‌ها** | 2020 - [وزارت بهداشت جورجیا نمودارهای COVID-19](https://www.vox.com/covid-19-coronavirus-us-response-trump/2020/5/18/21262265/georgia-covid-19-cases-declining-reopening) را منتشر کرد که به نظر می‌رسید شهروندان را در مورد روند موارد تأییدشده با ترتیب غیرزمانی در محور x گمراه کند. این مثال تحریف از طریق ترفندهای تجسم را نشان می‌دهد. |
| **توهم انتخاب آزاد** | 2020 - اپلیکیشن یادگیری [ABCmouse مبلغ 10 میلیون دلار برای حل شکایت FTC پرداخت کرد](https://www.washingtonpost.com/business/2020/09/04/abcmouse-10-million-ftc-settlement/) که والدین را مجبور به پرداخت اشتراک‌هایی کرد که نمی‌توانستند لغو کنند. این مثال الگوهای تاریک در معماری انتخاب را نشان می‌دهد، جایی که کاربران به سمت انتخاب‌های بالقوه مضر هدایت شدند. |
| **عدالت الگوریتمی** | 2018 - مطالعه [Gender Shades](http://gendershades.org/overview.html) MIT دقت محصولات طبقه‌بندی جنسیت هوش مصنوعی را ارزیابی کرد و شکاف‌های دقت برای زنان و افراد رنگین‌پوست را آشکار کرد. یک [کارت اپل 2019](https://www.wired.com/story/the-apple-card-didnt-see-genderand-thats-the-problem/) به نظر می‌رسید که اعتبار کمتری به زنان نسبت به مردان ارائه می‌دهد. هر دو مسائل مربوط به تعصب الگوریتمی را نشان دادند که منجر به آسیب‌های اجتماعی-اقتصادی شد.|
| **تحریف داده‌ها** | 2020 - [وزارت بهداشت جورجیا نمودارهای COVID-19](https://www.vox.com/covid-19-coronavirus-us-response-trump/2020/5/18/21262265/georgia-covid-19-cases-declining-reopening) منتشر کرد که به نظر می‌رسید شهروندان را در مورد روند موارد تأییدشده با ترتیب غیرزمانی در محور x گمراه کند. این مثال تحریف از طریق ترفندهای بصری را نشان می‌دهد. |
| **توهم انتخاب آزاد** | 2020 - اپلیکیشن آموزشی [ABCmouse برای حل شکایت FTC مبلغ 10 میلیون دلار پرداخت کرد](https://www.washingtonpost.com/business/2020/09/04/abcmouse-10-million-ftc-settlement/) که والدین را مجبور به پرداخت اشتراک‌هایی کرد که نمی‌توانستند لغو کنند. این مثال الگوهای تاریک در معماری انتخاب را نشان می‌دهد، جایی که کاربران به سمت انتخاب‌های بالقوه مضر هدایت شدند. |
| **حریم خصوصی داده‌ها و حقوق کاربران** | 2021 - [نشت داده‌های فیسبوک](https://www.npr.org/2021/04/09/986005820/after-data-breach-exposes-530-million-facebook-says-it-will-not-notify-users) داده‌های 530 میلیون کاربر را افشا کرد و منجر به تسویه 5 میلیارد دلاری با FTC شد. با این حال، فیسبوک از اطلاع‌رسانی به کاربران در مورد این نشت خودداری کرد و حقوق کاربران در مورد شفافیت داده‌ها و دسترسی را نقض کرد. |
آیا می‌خواهید مطالعات موردی بیشتری را بررسی کنید؟ این منابع را بررسی کنید:
* [Ethics Unwrapped](https://ethicsunwrapped.utexas.edu/case-studies) - معضلات اخلاقی در صنایع مختلف.
* [دوره اخلاق در علم داده](https://www.coursera.org/learn/data-science-ethics#syllabus) - مطالعات موردی برجسته بررسی شده.
* [جایی که اشتباه رخ داده است](https://deon.drivendata.org/examples/) - چک‌لیست Deon با مثال‌ها.
* [جایی که مسائل اشتباه پیش رفته‌اند](https://deon.drivendata.org/examples/) - چک‌لیست Deon با مثال‌ها.
> 🚨 به مطالعات موردی که دیده‌اید فکر کنید - آیا شما تجربه یا تحت تأثیر چالش اخلاقی مشابهی در زندگی خود قرار گرفته‌اید؟ آیا می‌توانید حداقل یک مطالعه موردی دیگر را که یکی از چالش‌های اخلاقی مورد بحث در این بخش را نشان می‌دهد، به یاد بیاورید؟
@ -201,10 +200,9 @@ CO_OP_TRANSLATOR_METADATA:
### 1. کدهای حرفه‌ای
کدهای حرفه‌ای یک گزینه برای سازمان‌ها ارائه می‌دهند تا اعضا را "تشویق" کنند که از اصول اخلاقی و بیانیه مأموریت آن‌ها حمایت کنند. کدها اهنمای اخلاقی_ برای رفتار حرفه‌ای هستند و به کارکنان یا اعضا کمک می‌کنند تصمیماتی بگیرند که با اصول سازمانشان همسو باشد. آن‌ها تنها به اندازه پایبندی داوطلبانه اعضا مؤثر هستند؛ با این حال، بسیاری از سازمان‌ها پاداش‌ها و مجازات‌های اضافی برای انگیزه دادن به اعضا برای پایبندی ارائه می‌دهند.
نمونه‌ها شامل موارد زیر هستند:
کدهای حرفه‌ای یک گزینه برای سازمان‌ها ارائه می‌دهند تا اعضا را "تشویق" کنند که از اصول اخلاقی و بیانیه مأموریت آن‌ها حمایت کنند. کدها اهنمای اخلاقی_ برای رفتار حرفه‌ای هستند که به کارکنان یا اعضا کمک می‌کنند تصمیماتی بگیرند که با اصول سازمانشان همسو باشد. آن‌ها تنها به اندازه پایبندی داوطلبانه اعضا مؤثر هستند؛ با این حال، بسیاری از سازمان‌ها پاداش‌ها و مجازات‌های اضافی برای انگیزه دادن به اعضا برای پایبندی ارائه می‌دهند.
نمونه‌ها شامل:
* [کد اخلاق آکسفورد مونیخ](http://www.code-of-ethics.org/code-of-conduct/)
* [کد رفتار انجمن علم داده](http://datascienceassn.org/code-of-conduct.html) (ایجاد شده در 2013)
* [کد اخلاق و رفتار حرفه‌ای ACM](https://www.acm.org/code-of-ethics) (از سال 1993)
@ -213,11 +211,11 @@ CO_OP_TRANSLATOR_METADATA:
### 2. چک‌لیست‌های اخلاقی
در حالی که کدهای حرفه‌ای رفتار اخلاقی مورد نیاز را از متخصصان تعریف می‌کنند، آن‌ها [محدودیت‌های شناخته‌شده‌ای](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md) در اجرا دارند، به ویژه در پروژه‌های بزرگ‌مقیاس. در عوض، بسیاری از متخصصان علم داده [از چک‌لیست‌ها حمایت می‌کنند](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md) که می‌توانند **اصول را به شیوه‌ها** به صورت قطعی‌تر و قابل اجرا تبدیل کنند.
در حالی که کدهای حرفه‌ای رفتار اخلاقی مورد نیاز را از متخصصان تعریف می‌کنند، آن‌ها [محدودیت‌های شناخته‌شده‌ای](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md) در اجرا دارند، به ویژه در پروژه‌های بزرگ‌مقیاس. در عوض، بسیاری از متخصصان علم داده [از چک‌لیست‌ها حمایت می‌کنند](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md) که می‌توانند **اصول را به شیوه‌ها** به شکلی قطعی‌تر و قابل اجرا متصل کنند.
چک‌لیست‌ها سؤالات را به وظایف "بله/خیر" تبدیل می‌کنند که می‌توانند عملیاتی شوند و به عنوان بخشی از جریان‌های کاری استاندارد انتشار محصول پیگیری شوند.
چک‌لیست‌ها سؤالات را به وظایف "بله/خیر" تبدیل می‌کنند که می‌توانند عملیاتی شوند و به عنوان بخشی از جریان‌های کاری استاندارد انتشار محصول ردیابی شوند.
نمونه‌ها شامل موارد زیر هستند:
نمونه‌ها شامل:
* [Deon](https://deon.drivendata.org/) - یک چک‌لیست اخلاق داده عمومی که از [توصیه‌های صنعتی](https://deon.drivendata.org/#checklist-citations) ایجاد شده و دارای ابزار خط فرمان برای یکپارچه‌سازی آسان است.
* [چک‌لیست ممیزی حریم خصوصی](https://cyber.harvard.edu/ecommerce/privacyaudit.html) - راهنمایی کلی برای شیوه‌های مدیریت اطلاعات از دیدگاه‌های قانونی و اجتماعی ارائه می‌دهد.
* [چک‌لیست عدالت هوش مصنوعی](https://www.microsoft.com/en-us/research/project/ai-fairness-checklist/) - توسط متخصصان هوش مصنوعی ایجاد شده تا از پذیرش و یکپارچه‌سازی بررسی‌های عدالت در چرخه‌های توسعه هوش مصنوعی حمایت کند.
@ -230,7 +228,6 @@ CO_OP_TRANSLATOR_METADATA:
امروزه، حکمرانی در سازمان‌ها دو شکل دارد. اول، تعریف اصول **هوش مصنوعی اخلاقی** و ایجاد شیوه‌هایی برای عملیاتی کردن پذیرش در تمام پروژه‌های مرتبط با هوش مصنوعی در سازمان. دوم، پایبندی به تمام مقررات حفاظت از داده‌های دولتی برای مناطقی که در آن فعالیت می‌کنند.
نمونه‌هایی از مقررات حفاظت از داده‌ها و حریم خصوصی:
* `1974`، [قانون حریم خصوصی ایالات متحده](https://www.justice.gov/opcl/privacy-act-1974) - جمع‌آوری، استفاده و افشای اطلاعات شخصی توسط _دولت فدرال_ را تنظیم می‌کند.
* `1996`، [قانون قابلیت حمل و حفاظت از بیمه سلامت ایالات متحده (HIPAA)](https://www.cdc.gov/phlp/publications/topic/hipaa.html) - از داده‌های سلامت شخصی محافظت می‌کند.
* `1998`، [قانون حفاظت از حریم خصوصی آنلاین کودکان ایالات متحده (COPPA)](https://www.ftc.gov/enforcement/rules/rulemaking-regulatory-reform-proceedings/childrens-online-privacy-protection-rule) - از حریم خصوصی داده‌های کودکان زیر 13 سال محافظت می‌کند.
@ -238,29 +235,31 @@ CO_OP_TRANSLATOR_METADATA:
* `2018`، [قانون حریم خصوصی مصرف‌کننده کالیفرنیا (CCPA)](https://www.oag.ca.gov/privacy/ccpa) به مصرف‌کنندگان حقوق بیشتری بر داده‌های (شخصی) خود می‌دهد.
* `2021`، [قانون حفاظت از اطلاعات شخصی چین](https://www.reuters.com/world/china/china-passes-new-personal-data-privacy-law-take-effect-nov-1-2021-08-20/) که به تازگی تصویب شده و یکی از قوی‌ترین مقررات حریم خصوصی داده‌های آنلاین در جهان را ایجاد کرده است.
> 🚨 اتحادیه اروپا GDPR (مقررات عمومی حفاظت از داده‌ها) را تعریف کرده است که یکی از تأثیرگذارترین مقررات حریم خصوصی داده‌ها امروز است. آیا می‌دانستید که این مقررات همچنین [8 حق کاربر](https://www.freeprivacypolicy.com/blog/8-user-rights-gdpr) را برای حفاظت از حریم خصوصی دیجیتال و داده‌های شخصی شهروندان تعریف می‌کند؟ درباره این حقوق و اهمیت آن‌ها اطلاعات کسب کنید.
> 🚨 اتحادیه اروپا مقررات GDPR (مقررات عمومی حفاظت از داده‌ها) را تعریف کرده است که یکی از تأثیرگذارترین مقررات حریم خصوصی داده‌ها امروز است. آیا می‌دانستید که این مقررات همچنین [8 حق کاربر](https://www.freeprivacypolicy.com/blog/8-user-rights-gdpr) را برای حفاظت از حریم خصوصی دیجیتال و داده‌های شخصی شهروندان تعریف می‌کند؟ درباره این حقوق و اهمیت آن‌ها اطلاعات کسب کنید.
### 4. فرهنگ اخلاقی
توجه داشته باشید که شکاف ناملموسی بین ایبندی_ (انجام کافی برای رعایت "متن قانون") و پرداختن به [مسائل سیستماتیک](https://www.coursera.org/learn/data-science-ethics/home/week/4) (مانند سخت‌شدگی، عدم تقارن اطلاعات و نابرابری توزیعی) وجود دارد که می‌تواند تسریع در تسلیح هوش مصنوعی را سرعت بخشد.
توجه داشته باشید که شکاف ناملموسی بین ایبندی_ (انجام کافی برای رعایت "متن قانون") و پرداختن به [مسائل سیستماتیک](https://www.coursera.org/learn/data-science-ethics/home/week/4) (مانند سخت‌شدگی، عدم تقارن اطلاعات و نابرابری توزیعی) وجود دارد که می‌تواند تسریع در تسلیحاتی شدن هوش مصنوعی را سرعت بخشد.
دومی نیاز به [رویکردهای همکاری برای تعریف فرهنگ‌های اخلاقی](https://towardsdatascience.com/why-ai-ethics-requires-a-culture-driven-approach-26f451afa29f) دارد که ارتباطات احساسی و ارزش‌های مشترک سازگار را _در سراسر سازمانها_ در صنعت ایجاد می‌کند. این نیاز به [فرهنگ‌های اخلاقی داده رسمی‌تر](https://www.codeforamerica.org/news/formalizing-an-ethical-data-culture/) در سازمان‌ها دارد - اجازه دادن به _هر کسی_ برای [کشیدن طناب Andon](https://en.wikipedia.org/wiki/Andon_(manufacturing)) (برای مطرح کردن نگرانی‌های اخلاقی در اوایل فرآیند) و قرار دادن _ارزیابیهای اخلاقی_ (مانند در استخدام) به عنوان معیار اصلی تشکیل تیم در پروژه‌های هوش مصنوعی.
دومی نیازمند [رویکردهای همکاری برای تعریف فرهنگ‌های اخلاقی](https://towardsdatascience.com/why-ai-ethics-requires-a-culture-driven-approach-26f451afa29f) است که ارتباطات احساسی و ارزش‌های مشترک سازگار را _در سراسر سازمانها_ در صنعت ایجاد می‌کند. این نیازمند [فرهنگ‌های اخلاق داده رسمی‌تر](https://www.codeforamerica.org/news/formalizing-an-ethical-data-culture/) در سازمان‌ها است - به طوری که _هر کسی_ بتواند [طناب آندون](https://en.wikipedia.org/wiki/Andon_(manufacturing)) را بکشد (برای مطرح کردن نگرانی‌های اخلاقی در اوایل فرآیند) و ارزیابی‌های اخلاقی انجام دهد (مانند استخدام) به عنوان معیار اصلی تشکیل تیم در پروژه‌های هوش مصنوعی.
---
## [آزمون پس از سخنرانی](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/3) 🎯
## مرور و مطالعه شخصی
## [آزمون پس از سخنرانی](https://ff-quizzes.netlify.app/en/ds/) 🎯
## مرور و مطالعه خودآموز
دوره‌ها و کتاب‌ها به درک مفاهیم اصلی اخلاق و چالش‌ها کمک می‌کنند، در حالی که مطالعات موردی و ابزارها به شیوه‌های اخلاقی کاربردی در زمینه‌های واقعی کمک می‌کنند. در اینجا چند منبع برای شروع آورده شده است:
دوره‌ها و کتاب‌ها به درک مفاهیم اصلی اخلاق و چالش‌ها کمک می‌کنند، در حالی که مطالعات موردی و ابزارها به شیوه‌های اخلاق کاربردی در زمینه‌های واقعی کمک می‌کنند. در اینجا چند منبع برای شروع آورده شده است:
* [یادگیری ماشین برای مبتدیان](https://github.com/microsoft/ML-For-Beginners/blob/main/1-Introduction/3-fairness/README.md) - درس عدالت، از مایکروسافت.
* [اصول هوش مصنوعی مسئولانه](https://docs.microsoft.com/en-us/learn/modules/responsible-ai-principles/) - مسیر یادگیری رایگان از Microsoft Learn.
* [اخلاق و علم داده](https://resources.oreilly.com/examples/0636920203964) - کتاب الکترونیکی از O'Reilly (نوشته M. Loukides, H. Mason و دیگران)
* [اخلاق در علم داده](https://www.coursera.org/learn/data-science-ethics#syllabus) - دوره آنلاین از دانشگاه میشیگان.
* [اخلاق بازگشایی‌شده](https://ethicsunwrapped.utexas.edu/case-studies) - مطالعات موردی از دانشگاه تگزاس.
* [اصول هوش مصنوعی مسئولانه](https://docs.microsoft.com/en-us/learn/modules/responsible-ai-principles/) - مسیر یادگیری رایگان از Microsoft Learn.
* [اخلاق و علم داده](https://resources.oreilly.com/examples/0636920203964) - کتاب الکترونیکی O'Reilly (نوشته M. Loukides، H. Mason و دیگران)
* [اخلاق علم داده](https://www.coursera.org/learn/data-science-ethics#syllabus) - دوره آنلاین از دانشگاه میشیگان.
* [اخلاق باز نشده](https://ethicsunwrapped.utexas.edu/case-studies) - مطالعات موردی از دانشگاه تگزاس.
# تکلیف
# تکلیف
[نوشتن یک مطالعه موردی در اخلاق داده](assignment.md)
[نوشتن یک مطالعه موردی در اخلاق داده](assignment.md)
---
**سلب مسئولیت**:
این سند با استفاده از سرویس ترجمه هوش مصنوعی [Co-op Translator](https://github.com/Azure/co-op-translator) ترجمه شده است. در حالی که ما تلاش می‌کنیم دقت را حفظ کنیم، لطفاً توجه داشته باشید که ترجمه‌های خودکار ممکن است شامل خطاها یا نادرستی‌ها باشند. سند اصلی به زبان اصلی آن باید به عنوان منبع معتبر در نظر گرفته شود. برای اطلاعات حساس، توصیه می‌شود از ترجمه حرفه‌ای انسانی استفاده کنید. ما مسئولیتی در قبال سوء تفاهم‌ها یا تفسیرهای نادرست ناشی از استفاده از این ترجمه نداریم.

@ -1,8 +1,8 @@
<!--
CO_OP_TRANSLATOR_METADATA:
{
"original_hash": "8796f41f566a0a8ebb72863a83d558ed",
"translation_date": "2025-08-26T21:25:18+00:00",
"original_hash": "3a34157cc63516eba97c89a0b2f8c3e6",
"translation_date": "2025-09-03T21:31:43+00:00",
"source_file": "1-Introduction/02-ethics/README.md",
"language_code": "fi"
}
@ -15,21 +15,21 @@ CO_OP_TRANSLATOR_METADATA:
---
Me kaikki olemme datan kansalaisia, jotka elävät dataistuneessa maailmassa.
Me kaikki olemme datan kansalaisia, jotka elävät datan täyttämässä maailmassa.
Markkinatrendit kertovat, että vuoteen 2022 mennessä yksi kolmesta suuresta organisaatiosta ostaa ja myy dataansa verkossa [markkinapaikkojen ja pörssien](https://www.gartner.com/smarterwithgartner/gartner-top-10-trends-in-data-and-analytics-for-2020/) kautta. **Sovelluskehittäjinä** meidän on helpompaa ja edullisempaa integroida dataan perustuvia oivalluksia ja algoritmeihin perustuvaa automaatiota päivittäisiin käyttäjäkokemuksiin. Mutta kun tekoälystä tulee yhä yleisempää, meidän on myös ymmärrettävä mahdolliset haitat, joita syntyy tällaisten algoritmien [aseistamisesta](https://www.youtube.com/watch?v=TQHs8SA1qpk) suuressa mittakaavassa.
Markkinatrendit kertovat, että vuoteen 2022 mennessä yksi kolmesta suuresta organisaatiosta ostaa ja myy dataansa verkossa [markkinapaikkojen ja vaihtojen](https://www.gartner.com/smarterwithgartner/gartner-top-10-trends-in-data-and-analytics-for-2020/) kautta. **Sovelluskehittäjinä** meidän on helpompaa ja edullisempaa integroida dataan perustuvia oivalluksia ja algoritmeihin perustuvaa automaatiota päivittäisiin käyttäjäkokemuksiin. Mutta kun tekoälystä tulee yhä yleisempää, meidän on myös ymmärrettävä mahdolliset haitat, joita syntyy tällaisten algoritmien [aseistamisesta](https://www.youtube.com/watch?v=TQHs8SA1qpk) suuressa mittakaavassa.
Trendit osoittavat myös, että vuoteen 2025 mennessä tuotamme ja kulutamme yli [180 zettatavua](https://www.statista.com/statistics/871513/worldwide-data-created/) dataa. **Data-analyytikkoina** tämä antaa meille ennennäkemättömän pääsyn henkilökohtaisiin tietoihin. Tämä tarkoittaa, että voimme rakentaa käyttäjien käyttäytymisprofiileja ja vaikuttaa päätöksentekoon tavoilla, jotka luovat [illuusion vapaasta valinnasta](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice), samalla kun saatamme ohjata käyttäjiä kohti meille suotuisia lopputuloksia. Tämä herättää myös laajempia kysymyksiä datan yksityisyydestä ja käyttäjien suojelusta.
Trendit osoittavat myös, että vuoteen 2025 mennessä luomme ja kulutamme yli [180 zettatavua](https://www.statista.com/statistics/871513/worldwide-data-created/) dataa. **Data-analyytikoina** tämä antaa meille ennennäkemättömän pääsyn henkilökohtaisiin tietoihin. Tämä tarkoittaa, että voimme rakentaa käyttäjien käyttäytymisprofiileja ja vaikuttaa päätöksentekoon tavoilla, jotka luovat [illuusion vapaasta valinnasta](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice), samalla kun ohjaamme käyttäjiä kohti meille mieluisia lopputuloksia. Tämä herättää myös laajempia kysymyksiä datan yksityisyydestä ja käyttäjien suojelusta.
Datan etiikka on nyt _välttämätön suojakaide_ data-analytiikassa ja -insinöörityössä, auttaen meitä minimoimaan mahdolliset haitat ja tahattomat seuraukset datalähtöisistä toimistamme. [Gartnerin tekoälyn hypekäyrä](https://www.gartner.com/smarterwithgartner/2-megatrends-dominate-the-gartner-hype-cycle-for-artificial-intelligence-2020/) tunnistaa digietiikan, vastuullisen tekoälyn ja tekoälyn hallinnan keskeisiksi trendeiksi, jotka ohjaavat suurempia megatrendejä, kuten tekoälyn _demokratisointia_ ja _teollistamista_.
Datan etiikka toimii nyt _välttämättöminä suojakaiteina_ data-analytiikassa ja -insinöörityössä, auttaen meitä minimoimaan mahdolliset haitat ja tahattomat seuraukset datan ohjaamista toimista. [Gartnerin Hype Cycle tekoälylle](https://www.gartner.com/smarterwithgartner/2-megatrends-dominate-the-gartner-hype-cycle-for-artificial-intelligence-2020/) tunnistaa digitaaliset eettiset trendit, vastuullisen tekoälyn ja tekoälyn hallinnan keskeisiksi tekijöiksi suuremmille megatrendeille, kuten tekoälyn _demokratisointi_ ja _teollistaminen_.
![Gartnerin tekoälyn hypekäyrä - 2020](https://images-cdn.newscred.com/Zz1mOWJhNzlkNDA2ZTMxMWViYjRiOGFiM2IyMjQ1YmMwZQ==)
![Gartnerin Hype Cycle tekoälylle - 2020](https://images-cdn.newscred.com/Zz1mOWJhNzlkNDA2ZTMxMWViYjRiOGFiM2IyMjQ1YmMwZQ==)
Tässä oppitunnissa tutkimme kiehtovaa datan etiikan aluetta - peruskäsitteistä ja haasteista tapaustutkimuksiin ja soveltaviin tekoälykonsepteihin, kuten hallintoon, jotka auttavat luomaan eettisen kulttuurin dataa ja tekoälyä käsittelevissä tiimeissä ja organisaatioissa.
Tässä oppitunnissa tutustumme kiehtovaan datan etiikan alueeseen - peruskäsitteistä ja haasteista tapaustutkimuksiin ja sovellettuihin tekoälykonsepteihin, kuten hallintaan - jotka auttavat luomaan eettisen kulttuurin tiimeissä ja organisaatioissa, jotka työskentelevät datan ja tekoälyn parissa.
## [Esiluentavisa](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/2) 🎯
## [Ennakkokysely](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/2) 🎯
## Perusmääritelmät
## Peruskäsitteet
Aloitetaan ymmärtämällä peruskäsitteet.
@ -37,68 +37,68 @@ Sana "etiikka" tulee [kreikan sanasta "ethikos"](https://en.wikipedia.org/wiki/E
**Etiikka** käsittelee yhteisiä arvoja ja moraalisia periaatteita, jotka ohjaavat käyttäytymistämme yhteiskunnassa. Etiikka ei perustu lakeihin, vaan yleisesti hyväksyttyihin normeihin siitä, mikä on "oikein vs. väärin". Kuitenkin eettiset näkökohdat voivat vaikuttaa yritysten hallintokäytäntöihin ja hallituksen säädöksiin, jotka luovat enemmän kannustimia noudattamiselle.
**Datan etiikka** on [uusi etiikan haara](https://royalsocietypublishing.org/doi/full/10.1098/rsta.2016.0360#sec-1), joka "tutkii ja arvioi moraalisia ongelmia, jotka liittyvät _dataan, algoritmeihin ja vastaaviin käytäntöihin_". Tässä **"data"** keskittyy toimiin, jotka liittyvät datan luomiseen, tallentamiseen, kuratointiin, käsittelyyn, levittämiseen, jakamiseen ja käyttöön, **"algoritmit"** keskittyvät tekoälyyn, agenteihin, koneoppimiseen ja robotteihin, ja **"käytännöt"** keskittyvät aiheisiin, kuten vastuulliseen innovointiin, ohjelmointiin, hakkerointiin ja eettisiin koodeihin.
**Datan etiikka** on [uusi etiikan haara](https://royalsocietypublishing.org/doi/full/10.1098/rsta.2016.0360#sec-1), joka "tutkii ja arvioi moraalisia ongelmia, jotka liittyvät _dataan, algoritmeihin ja vastaaviin käytäntöihin_". Tässä **"data"** keskittyy toimiin, jotka liittyvät datan luomiseen, tallentamiseen, kuratointiin, käsittelyyn, levittämiseen, jakamiseen ja käyttöön, **"algoritmit"** keskittyvät tekoälyyn, agentteihin, koneoppimiseen ja robotteihin, ja **"käytännöt"** keskittyvät aiheisiin, kuten vastuullinen innovaatio, ohjelmointi, hakkerointi ja eettiset koodit.
**Soveltava etiikka** on [moraalisten näkökohtien käytännön soveltamista](https://en.wikipedia.org/wiki/Applied_ethics). Se on prosessi, jossa aktiivisesti tutkitaan eettisiä kysymyksiä _todellisen maailman toimien, tuotteiden ja prosessien_ yhteydessä ja toteutetaan korjaavia toimenpiteitä, jotta nämä pysyvät linjassa määriteltyjen eettisten arvojemme kanssa.
**Sovellettu etiikka** on [moraalisten näkökohtien käytännön soveltamista](https://en.wikipedia.org/wiki/Applied_ethics). Se on prosessi, jossa aktiivisesti tutkitaan eettisiä kysymyksiä _todellisten toimien, tuotteiden ja prosessien_ yhteydessä ja toteutetaan korjaavia toimenpiteitä, jotta ne pysyvät määriteltyjen eettisten arvojen mukaisina.
**Eettinen kulttuuri** tarkoittaa [_soveltavan etiikan operationalisointia_](https://hbr.org/2019/05/how-to-design-an-ethical-organization) varmistaakseen, että eettiset periaatteemme ja käytäntömme otetaan käyttöön johdonmukaisesti ja skaalautuvasti koko organisaatiossa. Onnistuneet eettiset kulttuurit määrittelevät organisaation laajuiset eettiset periaatteet, tarjoavat merkityksellisiä kannustimia noudattamiselle ja vahvistavat eettisiä normeja rohkaisemalla ja korostamalla toivottuja käyttäytymismalleja organisaation kaikilla tasoilla.
**Eettinen kulttuuri** tarkoittaa [_soveltavan etiikan operationalisointia_](https://hbr.org/2019/05/how-to-design-an-ethical-organization) varmistaakseen, että eettiset periaatteemme ja käytäntömme otetaan käyttöön johdonmukaisesti ja skaalautuvasti koko organisaatiossa. Menestyvät eettiset kulttuurit määrittelevät organisaation laajuiset eettiset periaatteet, tarjoavat merkityksellisiä kannustimia noudattamiselle ja vahvistavat eettisiä normeja rohkaisemalla ja vahvistamalla toivottuja käyttäytymismalleja organisaation kaikilla tasoilla.
## Etiikan käsitteet
Tässä osiossa käsittelemme käsitteitä, kuten **yhteiset arvot** (periaatteet) ja **eettiset haasteet** (ongelmat) datan etiikassa - ja tutkimme **tapaustutkimuksia**, jotka auttavat ymmärtämään näitä käsitteitä todellisissa konteksteissa.
Tässä osiossa käsittelemme käsitteitä, kuten **yhteiset arvot** (periaatteet) ja **eettiset haasteet** (ongelmat) datan etiikassa - ja tutkimme **tapaustutkimuksia**, jotka auttavat ymmärtämään näitä käsitteitä todellisissa yhteyksissä.
### 1. Etiikan periaatteet
Jokainen datan etiikkastrategia alkaa määrittelemällä _eettiset periaatteet_ - "yhteiset arvot", jotka kuvaavat hyväksyttäviä käyttäytymismalleja ja ohjaavat noudattavia toimia data- ja tekoälyprojekteissamme. Voit määritellä nämä yksilö- tai tiimitasolla. Useimmat suuret organisaatiot kuitenkin laativat nämä _eettisen tekoälyn_ missiolausekkeessa tai viitekehyksessä, joka määritellään yritystasolla ja jota sovelletaan johdonmukaisesti kaikissa tiimeissä.
Jokainen datan etiikkastrategia alkaa määrittelemällä _eettiset periaatteet_ - "yhteiset arvot", jotka kuvaavat hyväksyttäviä käyttäytymismalleja ja ohjaavat noudattavia toimia datan ja tekoälyn projekteissamme. Voit määritellä nämä yksilö- tai tiimitasolla. Useimmat suuret organisaatiot kuitenkin hahmottelevat nämä _eettisen tekoälyn_ missiolausekkeessa tai kehyksessä, joka määritellään yritystasolla ja pannaan täytäntöön johdonmukaisesti kaikissa tiimeissä.
**Esimerkki:** Microsoftin [Vastuullisen tekoälyn](https://www.microsoft.com/en-us/ai/responsible-ai) missiolauseke kuuluu: _"Olemme sitoutuneet edistämään tekoälyä eettisten periaatteiden pohjalta, jotka asettavat ihmiset etusijalle"_ - tunnistaen kuusi eettistä periaatetta alla olevassa viitekehyksessä:
**Esimerkki:** Microsoftin [Vastuullinen tekoäly](https://www.microsoft.com/en-us/ai/responsible-ai) -missiolauseke kuuluu: _"Olemme sitoutuneet tekoälyn edistämiseen eettisten periaatteiden pohjalta, jotka asettavat ihmiset etusijalle"_ - ja siinä tunnistetaan 6 eettistä periaatetta alla olevassa kehyksessä:
![Vastuullinen tekoäly Microsoftilla](https://docs.microsoft.com/en-gb/azure/cognitive-services/personalizer/media/ethics-and-responsible-use/ai-values-future-computed.png)
Tutkitaan lyhyesti näitä periaatteita. _Läpinäkyvyys_ ja _vastuullisuus_ ovat perustavanlaatuisia arvoja, joiden päälle muut periaatteet rakentuvat - aloitetaan siis niistä:
Tutkitaan lyhyesti näitä periaatteita. _Läpinäkyvyys_ ja _vastuullisuus_ ovat perustavanlaatuisia arvoja, joiden päälle muut periaatteet rakentuvat - aloitetaan niistä:
* [**Vastuullisuus**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) tekee käytännön toteuttajista _vastuullisia_ data- ja tekoälytoiminnoistaan sekä näiden eettisten periaatteiden noudattamisesta.
* [**Läpinäkyvyys**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) varmistaa, että data- ja tekoälytoimet ovat _ymmärrettäviä_ (tulkittavia) käyttäjille, selittäen päätösten taustalla olevat syyt ja tarkoitukset.
* [**Reiluus**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1%3aprimaryr6) keskittyy varmistamaan, että tekoäly kohtelee _kaikkia ihmisiä_ oikeudenmukaisesti, käsitellen mahdollisia järjestelmällisiä tai piileviä sosio-teknisiä vinoumia datassa ja järjestelmissä.
* [**Vastuullisuus**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) tekee käytännön toteuttajista _vastuullisia_ datan ja tekoälyn toiminnastaan sekä näiden eettisten periaatteiden noudattamisesta.
* [**Läpinäkyvyys**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) varmistaa, että datan ja tekoälyn toimet ovat _ymmärrettäviä_ (tulkittavia) käyttäjille, selittäen päätösten taustalla olevan mitä ja miksi.
* [**Reiluus**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1%3aprimaryr6) keskittyy varmistamaan, että tekoäly kohtelee _kaikkia ihmisiä_ reilusti, käsitellen mahdollisia järjestelmällisiä tai implisiittisiä sosio-teknisiä vinoumia datassa ja järjestelmissä.
* [**Luotettavuus ja turvallisuus**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) varmistaa, että tekoäly toimii _johdonmukaisesti_ määriteltyjen arvojen mukaisesti, minimoiden mahdolliset haitat tai tahattomat seuraukset.
* [**Yksityisyys ja turvallisuus**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) liittyy datan alkuperän ymmärtämiseen ja _datan yksityisyyden ja siihen liittyvien suojatoimien_ tarjoamiseen käyttäjille.
* [**Osallistavuus**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) tarkoittaa tekoälyratkaisujen suunnittelua tarkoituksella, mukauttamalla ne vastaamaan _laajaa joukkoa ihmisten tarpeita_ ja kykyjä.
* [**Yksityisyys ja turvallisuus**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) liittyy datan alkuperän ymmärtämiseen ja käyttäjien _datan yksityisyyden ja siihen liittyvien suojien_ tarjoamiseen.
* [**Osallisuus**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) tarkoittaa tekoälyratkaisujen suunnittelua tarkoituksella, mukauttamalla niitä vastaamaan _laajaa valikoimaa ihmisten tarpeita_ ja kykyjä.
> 🚨 Mieti, mikä voisi olla sinun datan etiikan missiolausekkeesi. Tutki muiden organisaatioiden eettisiä tekoälyviitekehyksiä - tässä esimerkkejä [IBM:ltä](https://www.ibm.com/cloud/learn/ai-ethics), [Googlelta](https://ai.google/principles) ja [Facebookilta](https://ai.facebook.com/blog/facebooks-five-pillars-of-responsible-ai/). Mitä yhteisiä arvoja niillä on? Miten nämä periaatteet liittyvät tekoälytuotteeseen tai -alaan, jolla ne toimivat?
> 🚨 Mieti, mikä voisi olla datan etiikan missiolausekkeesi. Tutki muiden organisaatioiden eettisiä tekoälykehyksiä - tässä esimerkkejä [IBM:ltä](https://www.ibm.com/cloud/learn/ai-ethics), [Googlelta](https://ai.google/principles) ja [Facebookilta](https://ai.facebook.com/blog/facebooks-five-pillars-of-responsible-ai/). Mitä yhteisiä arvoja niillä on? Miten nämä periaatteet liittyvät tekoälytuotteeseen tai -alaan, jossa ne toimivat?
### 2. Etiikan haasteet
Kun eettiset periaatteet on määritelty, seuraava askel on arvioida data- ja tekoälytoimiamme nähdäksemme, ovatko ne linjassa näiden yhteisten arvojen kanssa. Mieti toimiasi kahdessa kategoriassa: _datan kerääminen_ ja _algoritmien suunnittelu_.
Kun eettiset periaatteet on määritelty, seuraava askel on arvioida datan ja tekoälyn toimia nähdäksemme, ovatko ne linjassa näiden yhteisten arvojen kanssa. Mieti toimiasi kahdessa kategoriassa: _datan kerääminen_ ja _algoritmien suunnittelu_.
Datan keräämisessä toimet liittyvät todennäköisesti **henkilökohtaisiin tietoihin** tai henkilön tunnistettaviin tietoihin (PII), jotka koskevat tunnistettavissa olevia eläviä yksilöitä. Tämä sisältää [monenlaisia ei-henkilökohtaisia tietoja](https://ec.europa.eu/info/law/law-topic/data-protection/reform/what-personal-data_en), jotka _yhdessä_ voivat tunnistaa yksilön. Eettiset haasteet voivat liittyä _datan yksityisyyteen_, _datan omistajuuteen_ ja aiheisiin, kuten _tietoinen suostumus_ ja _käyttäjien immateriaalioikeudet_.
Datan keräämisessä toimet liittyvät todennäköisesti **henkilökohtaisiin tietoihin** tai henkilön tunnistettaviin tietoihin (PII), jotka koskevat tunnistettavia eläviä yksilöitä. Tämä sisältää [monenlaisia ei-henkilökohtaisia tietoja](https://ec.europa.eu/info/law/law-topic/data-protection/reform/what-personal-data_en), jotka _yhdessä_ tunnistavat yksilön. Eettiset haasteet voivat liittyä _datan yksityisyyteen_, _datan omistajuuteen_ ja aiheisiin, kuten _tietoinen suostumus_ ja _käyttäjien immateriaalioikeudet_.
Algoritmien suunnittelussa toimet liittyvät **datan keräämiseen ja kuratointiin**, ja niiden käyttämiseen **datamallien** kouluttamiseen ja käyttöönottoon, jotka ennustavat tuloksia tai automatisoivat päätöksiä todellisissa konteksteissa. Eettisiä haasteita voi syntyä _datan vinoumista_, _datan laadun_ ongelmista, _epäreiluudesta_ ja _vääristymistä_ algoritmeissa - mukaan lukien joitakin järjestelmällisiä ongelmia.
Algoritmien suunnittelussa toimet liittyvät **datan keräämiseen ja kuratointiin**, ja niiden käyttämiseen **datamallien** kouluttamiseen ja käyttöönottoon, jotka ennustavat tuloksia tai automatisoivat päätöksiä todellisissa yhteyksissä. Eettiset haasteet voivat liittyä _datan vinoumiin_, _datan laatuun_, _epäreiluuteen_ ja _vääristelyyn_ algoritmeissa - mukaan lukien jotkut järjestelmälliset ongelmat.
Molemmissa tapauksissa eettiset haasteet korostavat alueita, joissa toimintamme saattaa olla ristiriidassa yhteisten arvojemme kanssa. Näiden huolenaiheiden havaitsemiseksi, lieventämiseksi, minimoimiseksi tai poistamiseksi meidän on esitettävä moraalisia "kyllä/ei"-kysymyksiä toimistamme ja toteutettava tarvittavat korjaavat toimenpiteet. Katsotaanpa joitakin eettisiä haasteita ja niihin liittyviä moraalisia kysymyksiä:
Molemmissa tapauksissa eettiset haasteet korostavat alueita, joissa toimemme voivat olla ristiriidassa yhteisten arvojemme kanssa. Näiden huolenaiheiden havaitsemiseksi, lieventämiseksi, minimoimiseksi tai poistamiseksi meidän on esitettävä moraalisia "kyllä/ei"-kysymyksiä toimistamme ja toteutettava korjaavia toimenpiteitä tarpeen mukaan. Katsotaanpa joitakin eettisiä haasteita ja moraalisia kysymyksiä, joita ne herättävät:
#### 2.1 Datan omistajuus
Datan kerääminen sisältää usein henkilökohtaisia tietoja, jotka voivat tunnistaa datan kohteet. [Datan omistajuus](https://permission.io/blog/data-ownership) koskee _kontrollia_ ja [_käyttäjien oikeuksia_](https://permission.io/blog/data-ownership) liittyen datan luomiseen, käsittelyyn ja levittämiseen.
Datan kerääminen liittyy usein henkilökohtaisiin tietoihin, jotka voivat tunnistaa datan kohteet. [Datan omistajuus](https://permission.io/blog/data-ownership) koskee _kontrollia_ ja [_käyttäjän oikeuksia_](https://permission.io/blog/data-ownership) datan luomiseen, käsittelyyn ja levittämiseen liittyen.
Moraalisia kysymyksiä, joita meidän on esitettävä:
Moraaliset kysymykset, joita meidän on esitettävä:
* Kuka omistaa datan? (käyttäjä vai organisaatio)
* Mitä oikeuksia datan kohteilla on? (esim. pääsy, poistaminen, siirrettävyys)
* Mitä oikeuksia organisaatioilla on? (esim. korjata haitallisia käyttäjäarvioita)
* Mitä oikeuksia datan kohteilla on? (esim. pääsy, poisto, siirrettävyys)
* Mitä oikeuksia organisaatioilla on? (esim. haitallisten käyttäjäarvostelujen korjaaminen)
#### 2.2 Tietoinen suostumus
[Tietoinen suostumus](https://legaldictionary.net/informed-consent/) määrittelee käyttäjien toiminnan (kuten datan keräämisen) hyväksymisen _täydellä ymmärryksellä_ asiaankuuluvista faktoista, mukaan lukien tarkoitus, mahdolliset riskit ja vaihtoehdot.
[Tietoinen suostumus](https://legaldictionary.net/informed-consent/) määrittelee käyttäjien suostumuksen toimintaan (kuten datan keräämiseen) _täydellä ymmärryksellä_ asiaankuuluvista faktoista, mukaan lukien tarkoitus, mahdolliset riskit ja vaihtoehdot.
Kysymyksiä, joita on tutkittava:
Kysymyksiä, joita tässä kannattaa pohtia:
* Antoiko käyttäjä (datan kohde) luvan datan keräämiseen ja käyttöön?
* Ymmärsikö käyttäjä, mihin tarkoitukseen data kerättiin?
* Ymmärsikö käyttäjä datan keräämisen tarkoituksen?
* Ymmärsikö käyttäjä osallistumisensa mahdolliset riskit?
#### 2.3 Immateriaalioikeudet
[Immateriaalioikeudet](https://en.wikipedia.org/wiki/Intellectual_property) viittaavat aineettomiin luomuksiin, jotka ovat ihmisen aloitteellisuuden tulosta ja joilla voi olla _taloudellista arvoa_ yksilöille tai yrityksille.
[Immateriaalioikeudet](https://en.wikipedia.org/wiki/Intellectual_property) viittaavat aineettomiin luomuksiin, jotka syntyvät ihmisen aloitteesta ja joilla voi _olla taloudellista arvoa_ yksilöille tai yrityksille.
Kysymyksiä, joita on tutkittava:
Kysymyksiä, joita tässä kannattaa pohtia:
* Sisältääkö kerätty data taloudellista arvoa käyttäjälle tai yritykselle?
* Onko **käyttäjällä** immateriaalioikeuksia tässä?
* Onko **organisaatiolla** immateriaalioikeuksia tässä?
@ -106,48 +106,46 @@ Kysymyksiä, joita on tutkittava:
#### 2.4 Datan yksityisyys
[Datan yksityisyys](https://www.northeastern.edu/graduate/blog/what-is-data-privacy/) tai tietosuoja viittaa käyttäjän yksityisyyden säilyttämiseen ja käyttäjän identiteetin suojaamiseen henkilön tunnistettavien tietojen osalta.
[Datan yksityisyys](https://www.northeastern.edu/graduate/blog/what-is-data-privacy/) tai informaation yksityisyys viittaa käyttäjän yksityisyyden säilyttämiseen ja käyttäjän identiteetin suojaamiseen henkilön tunnistettavien tietojen osalta.
Kysymyksiä, joita on tutkittava:
Kysymyksiä, joita tässä kannattaa pohtia:
* Onko käyttäjien (henkilökohtainen) data suojattu hakkereilta ja vuodoilta?
* Onko käyttäjien data vain valtuutettujen käyttäjien ja kontekstien saatavilla?
* Onko käyttäjien data saatavilla vain valtuutetuille käyttäjille ja konteksteille?
* Säilytetäänkö käyttäjien anonymiteetti, kun dataa jaetaan tai levitetään?
* Voidaanko käyttäjä tunnistaa uudelleen anonymisoiduista datasetistä?
* Voidaanko käyttäjä tunnistaa anonymisoiduista datakokonaisuuksista?
#### 2.5 Oikeus tulla unohdetuksi
[Oikeus tulla unohdetuksi](https://en.wikipedia.org/wiki/Right_to_be_forgotten) tai [oikeus tietojen poistamiseen](https://www.gdpreu.org/right-to-be-forgotten/) tarjoaa käyttäjille lisäsuojaa henkilökohtaisille tiedoille. Se antaa käyttäjille oikeuden pyytää henkilökohtaisten tietojen poistamista Internet-hauista ja muista sijainneista _tietyissä olosuhteissa_ - mahdollistaen uuden alun verkossa ilman, että menneitä toimia pidetään heitä vastaan.
[Oikeus tulla unohdetuksi](https://en.wikipedia.org/wiki/Right_to_be_forgotten) tai [oikeus poistamiseen](https://www.gdpreu.org/right-to-be-forgotten/) tarjoaa käyttäjille lisäsuojaa henkilökohtaisille tiedoille. Se antaa käyttäjille oikeuden pyytää henkilökohtaisten tietojen poistamista tai poistamista Internet-hauista ja muista sijainneista, _tietyissä olosuhteissa_ - mahdollistaen heille uuden alun verkossa ilman, että menneitä toimia pidetään heitä vastaan.
Kysymyksiä, joita on tutkittava:
Kysymyksiä, joita tässä kannattaa pohtia:
* Salliko järjestelmä datan kohteiden pyytää tietojen poistamista?
* Pitäisikö käyttäjän suostumuksen peruuttamisen laukaista automaattinen poistaminen?
* Kerättiinkö data ilman suostumusta tai laittomin keinoin?
* Pitäisikö käyttäjän suostumuksen peruuttamisen laukaista automaattinen poisto?
* Kerättiinkö data ilman suostumusta tai laittomilla keinoilla?
* Olemmeko noudattaneet hallituksen säädöksiä datan yksityisyydestä?
#### 2.6 Datasetin vinoumat
#### 2.6 Datakokonaisuuden vinoumat
Datasetin tai [keräysvinouman](http://researcharticles.com/index.php/bias-in-data-collection-in-research/) ongelma liittyy _epäedustavan_ datan alijoukon valintaan algoritmien kehittämiseen, mikä voi johtaa mahdolliseen epäoikeudenmukaisuuteen tuloksissa eri ryhmille. Vinoumat voivat olla esimerkiksi valinta- tai otantavinoumia, vapaaehtoisuusvinoumia ja instrumenttivinoumia.
Datakokonaisuuden tai [keräysvinouman](http://researcharticles.com/index.php/bias-in-data-collection-in-research/) kohdalla valitaan _ei-edustava_ datan alijoukko algoritmien kehittämiseen, mikä voi luoda mahdollisia epäreiluuksia tuloksissa eri ryhmille. Vinoumat voivat olla esimerkiksi valinta- tai otantavinoumia, vapaaehtoisuusvinoumia ja instrumenttivinoumia.
Kysymyksiä, joita on tutkittava:
Kysymyksiä, joita tässä kannattaa pohtia:
* Rekrytoimmeko edustavan joukon datan kohteita?
* Testasimmeko kerättyä tai kuratoitua datasettiä eri vinoumien varalta?
* Testasimmeko kerättyä tai kuratoitua datakokonaisuutta eri vinoumien osalta?
* Voimmeko lieventää tai poistaa havaittuja vinoumia?
#### 2.7 Datan laatu
#### 2.7 Datan la
[Algorithminen oikeudenmukaisuus](https://towardsdatascience.com/what-is-algorithm-fairness-3182e161cf9f) tarkastelee, syrjiikö algoritmin suunnittelu systemaattisesti tiettyjä datan kohderyhmiä, mikä voi johtaa [mahdollisiin haittoihin](https://docs.microsoft.com/en-us/azure/machine-learning/concept-fairness-ml) _resurssien jakamisessa_ (kun resursseja evätään tai pidätetään kyseiseltä ryhmältä) ja _palvelun laadussa_ (kun tekoäly ei ole yhtä tarkka joillekin alaryhmille kuin muille).
Kysymyksiä, joita tässä kannattaa pohtia:
* Arvioimmeko mallin tarkkuutta eri alaryhmien ja olosuhteiden osalta?
* Tutkimmeko järjestelmää mahdollisten haittojen (esim. stereotypioiden) osalta?
* Tutkimmeko järjestelmää mahdollisten haittojen (esim. stereotypioiden) varalta?
* Voimmeko muokata dataa tai kouluttaa malleja uudelleen haittojen vähentämiseksi?
Tutustu resursseihin, kuten [AI Fairness -tarkistuslistoihin](https://query.prod.cms.rt.microsoft.com/cms/api/am/binary/RE4t6dA), oppiaksesi lisää.
Tutustu resursseihin, kuten [AI Fairness -tarkistuslistoihin](https://query.prod.cms.rt.microsoft.com/cms/api/am/binary/RE4t6dA), saadaksesi lisätietoa.
#### 2.9 Vääristely
[Datavääristely](https://www.sciencedirect.com/topics/computer-science/misrepresentation) tarkoittaa sitä, että kysytään, viestimmekö rehellisesti raportoidusta datasta saadut oivallukset harhaanjohtavalla tavalla tukemaan haluttua narratiivia.
[Datavääristely](https://www.sciencedirect.com/topics/computer-science/misrepresentation) tarkoittaa sitä, että kysytään, viestimmekö rehellisesti raportoituja datan havaintoja harhaanjohtavalla tavalla tukemaan haluttua narratiivia.
Kysymyksiä, joita tässä kannattaa pohtia:
* Raportoimmeko puutteellista tai epätarkkaa dataa?
@ -156,7 +154,7 @@ Kysymyksiä, joita tässä kannattaa pohtia:
* Onko olemassa vaihtoehtoisia selityksiä, jotka voivat tarjota erilaisen johtopäätöksen?
#### 2.10 Vapaa valinta
[Vapaan valinnan illuusio](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice) syntyy, kun järjestelmän "valinta-arkkitehtuurit" käyttävät päätöksentekoalgoritmeja ohjaamaan ihmisiä kohti haluttua lopputulosta samalla, kun heille näennäisesti annetaan vaihtoehtoja ja kontrollia. Nämä [pimeät kuviot](https://www.darkpatterns.org/) voivat aiheuttaa sosiaalisia ja taloudellisia haittoja käyttäjille. Koska käyttäjien päätökset vaikuttavat käyttäytymisprofiileihin, nämä toimet voivat mahdollisesti ohjata tulevia valintoja ja vahvistaa tai laajentaa haittojen vaikutusta.
[Vapaan valinnan illuusio](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice) syntyy, kun järjestelmän "valinta-arkkitehtuurit" käyttävät päätöksentekoalgoritmeja ohjaamaan ihmisiä kohti haluttua lopputulosta samalla, kun heille näennäisesti annetaan vaihtoehtoja ja kontrollia. Nämä [dark patterns](https://www.darkpatterns.org/) voivat aiheuttaa sosiaalisia ja taloudellisia haittoja käyttäjille. Koska käyttäjien päätökset vaikuttavat käyttäytymisprofiileihin, nämä toimet voivat mahdollisesti ohjata tulevia valintoja ja vahvistaa tai laajentaa haittojen vaikutusta.
Kysymyksiä, joita tässä kannattaa pohtia:
* Ymmärsikö käyttäjä valinnan tekemisen seuraukset?
@ -165,26 +163,26 @@ Kysymyksiä, joita tässä kannattaa pohtia:
### 3. Tapaustutkimukset
Eettisten haasteiden asettaminen todellisiin konteksteihin auttaa ymmärtämään mahdollisia haittoja ja seurauksia yksilöille ja yhteiskunnalle, kun eettisiä rikkomuksia ei huomioida.
Jotta nämä eettiset haasteet saadaan sijoitettua todellisiin konteksteihin, on hyödyllistä tarkastella tapaustutkimuksia, jotka korostavat mahdollisia haittoja ja seurauksia yksilöille ja yhteiskunnalle, kun eettisiä rikkomuksia ei huomioida.
Tässä muutamia esimerkkejä:
| Eettinen haaste | Tapaustutkimus |
| Eettinen haaste | Tapaustutkimus |
|--- |--- |
| **Tietoinen suostumus** | 1972 - [Tuskegeen kuppatutkimus](https://en.wikipedia.org/wiki/Tuskegee_Syphilis_Study) - Afrikkalaisamerikkalaisille miehille luvattiin ilmainen lääkärinhoito, _mutta heitä petettiin_ tutkijoiden toimesta, jotka eivät kertoneet diagnoosista tai hoidon saatavuudesta. Monet kuolivat, ja heidän kumppaninsa tai lapsensa kärsivät; tutkimus kesti 40 vuotta. |
| **Dataprivaatisuus** | 2007 - [Netflixin datapalkinto](https://www.wired.com/2007/12/why-anonymous-data-sometimes-isnt/) tarjosi tutkijoille _10 miljoonaa anonymisoitua elokuva-arvostelua 50 000 asiakkaalta_ parantaakseen suositusalgoritmeja. Tutkijat pystyivät kuitenkin yhdistämään anonymisoidun datan henkilökohtaisesti tunnistettavaan dataan _ulkoisista tietokannoista_ (esim. IMDb-kommentit), mikä käytännössä "de-anonymisoi" joitakin Netflixin tilaajia.|
| **Keräysbias** | 2013 - Bostonin kaupunki [kehitti Street Bump -sovelluksen](https://www.boston.gov/transportation/street-bump), joka antoi kansalaisille mahdollisuuden raportoida kuoppia, tarjoten kaupungille parempaa tietoa teiden korjaamiseksi. Kuitenkin [alemman tulotason ryhmillä oli vähemmän pääsyä autoihin ja puhelimiin](https://hbr.org/2013/04/the-hidden-biases-in-big-data), mikä teki heidän tieongelmansa näkymättömiksi sovelluksessa. Kehittäjät tekivät yhteistyötä akateemikkojen kanssa _tasapuolisen pääsyn ja digitaalisten kuilujen_ ratkaisemiseksi oikeudenmukaisuuden nimissä. |
| **Algoritminen oikeudenmukaisuus** | 2018 - MIT:n [Gender Shades -tutkimus](http://gendershades.org/overview.html) arvioi sukupuolen luokitteluun tarkoitettujen tekoälytuotteiden tarkkuutta, paljastaen puutteita naisten ja värillisten henkilöiden osalta. [2019 Apple Card](https://www.wired.com/story/the-apple-card-didnt-see-genderand-thats-the-problem/) näytti tarjoavan vähemmän luottoa naisille kuin miehille. Molemmat osoittivat algoritmisen biasin aiheuttamia sosioekonomisia haittoja.|
| **Tietoinen suostumus** | 1972 - [Tuskegeen kuppatutkimus](https://en.wikipedia.org/wiki/Tuskegee_Syphilis_Study) - Afrikkalaisamerikkalaisille miehille, jotka osallistuivat tutkimukseen, luvattiin ilmainen lääkärinhoito, _mutta heitä petettiin_ tutkijoiden toimesta, jotka eivät kertoneet heille diagnoosista tai hoidon saatavuudesta. Monet osallistujat kuolivat, ja heidän kumppaninsa tai lapsensa kärsivät; tutkimus kesti 40 vuotta. |
| **Dataprivaatisuus** | 2007 - [Netflixin datapalkinto](https://www.wired.com/2007/12/why-anonymous-data-sometimes-isnt/) tarjosi tutkijoille _10 miljoonaa anonymisoitua elokuva-arvostelua 50 000 asiakkaalta_ parantaakseen suositusalgoritmeja. Tutkijat pystyivät kuitenkin yhdistämään anonymisoidun datan henkilökohtaisesti tunnistettavaan dataan _ulkopuolisissa tietokannoissa_ (esim. IMDb-kommentit) - käytännössä "de-anonymisoiden" joitakin Netflixin tilaajia.|
| **Keräysbias** | 2013 - Bostonin kaupunki [kehitti Street Bump -sovelluksen](https://www.boston.gov/transportation/street-bump), joka antoi kansalaisille mahdollisuuden raportoida kuoppia, tarjoten kaupungille parempaa tietoa teiden kunnosta. Kuitenkin [alhaisemman tulotason ryhmillä oli vähemmän pääsyä autoihin ja puhelimiin](https://hbr.org/2013/04/the-hidden-biases-in-big-data), mikä teki heidän tieongelmansa näkymättömiksi sovelluksessa. Kehittäjät tekivät yhteistyötä akateemikkojen kanssa _tasapuolisen pääsyn ja digitaalisten erojen_ ratkaisemiseksi oikeudenmukaisuuden nimissä. |
| **Algoritminen oikeudenmukaisuus** | 2018 - MIT:n [Gender Shades -tutkimus](http://gendershades.org/overview.html) arvioi sukupuolen luokitteluun tarkoitettujen tekoälytuotteiden tarkkuutta, paljastaen puutteita naisten ja värillisten henkilöiden osalta. [2019 Apple Card](https://www.wired.com/story/the-apple-card-didnt-see-genderand-thats-the-problem/) näytti tarjoavan vähemmän luottoa naisille kuin miehille. Molemmat havainnollistivat algoritmisen biasin aiheuttamia sosioekonomisia haittoja.|
| **Datavääristely** | 2020 - Georgian [terveysosasto julkaisi COVID-19-kaavioita](https://www.vox.com/covid-19-coronavirus-us-response-trump/2020/5/18/21262265/georgia-covid-19-cases-declining-reopening), jotka näyttivät harhaanjohtavan kansalaisia vahvistettujen tapausten trendeistä käyttämällä ei-kronologista järjestystä x-akselilla. Tämä havainnollistaa vääristelyä visualisointikikkojen avulla. |
| **Vapaan valinnan illuusio** | 2020 - Oppimissovellus [ABCmouse maksoi 10 miljoonaa dollaria FTC:n valituksen sovittelusta](https://www.washingtonpost.com/business/2020/09/04/abcmouse-10-million-ftc-settlement/), jossa vanhemmat joutuivat maksamaan tilauksista, joita he eivät voineet peruuttaa. Tämä havainnollistaa pimeitä kuvioita valinta-arkkitehtuureissa, joissa käyttäjiä ohjattiin mahdollisesti haitallisiin valintoihin. |
| **Vapaan valinnan illuusio** | 2020 - Oppimissovellus [ABCmouse maksoi 10 miljoonaa dollaria ratkaistakseen FTC:n valituksen](https://www.washingtonpost.com/business/2020/09/04/abcmouse-10-million-ftc-settlement/), jossa vanhemmat joutuivat maksamaan tilauksista, joita he eivät voineet peruuttaa. Tämä havainnollistaa dark patterns -valinta-arkkitehtuureissa, joissa käyttäjiä ohjattiin mahdollisesti haitallisiin valintoihin. |
| **Dataprivaatisuus ja käyttäjän oikeudet** | 2021 - Facebookin [datavuoto](https://www.npr.org/2021/04/09/986005820/after-data-breach-exposes-530-million-facebook-says-it-will-not-notify-users) paljasti 530 miljoonan käyttäjän tiedot, mikä johti 5 miljardin dollarin sovitteluun FTC:n kanssa. Se kuitenkin kieltäytyi ilmoittamasta käyttäjille vuodosta, mikä rikkoi käyttäjän oikeuksia datan läpinäkyvyyden ja saatavuuden osalta. |
Haluatko tutkia lisää tapaustutkimuksia? Tutustu näihin resursseihin:
* [Ethics Unwrapped](https://ethicsunwrapped.utexas.edu/case-studies) - eettisiä dilemmoja eri toimialoilla.
* [Data Science Ethics -kurssi](https://www.coursera.org/learn/data-science-ethics#syllabus) - merkittäviä tapaustutkimuksia.
* [Missä asiat ovat menneet pieleen](https://deon.drivendata.org/examples/) - Deon-tarkistuslista esimerkkien kanssa.
* [Missä asiat ovat menneet pieleen](https://deon.drivendata.org/examples/) - Deon-tarkistuslista esimerkkien kera.
> 🚨 Mieti tapaustutkimuksia, joita olet nähnyt oletko kokenut tai ollut osallisena vastaavassa eettisessä haasteessa elämässäsi? Voitko keksiä ainakin yhden muun tapaustutkimuksen, joka havainnollistaa jotakin tässä osiossa käsitellyistä eettisistä haasteista?
> 🚨 Mieti tapaustutkimuksia, joita olet nähnyt - oletko kokenut tai ollut vastaavan eettisen haasteen vaikutuksen alaisena elämässäsi? Voitko keksiä ainakin yhden muun tapaustutkimuksen, joka havainnollistaa jotakin tässä osiossa käsitellyistä eettisistä haasteista?
## Soveltava etiikka
@ -192,7 +190,7 @@ Olemme puhuneet etiikan käsitteistä, haasteista ja tapaustutkimuksista todelli
### 1. Ammattikoodit
Ammattikoodit tarjoavat yhden vaihtoehdon organisaatioille "kannustaa" jäseniä tukemaan eettisiä periaatteitaan ja missiotaan. Koodit ovat _moraalisia ohjeita_ ammatilliselle käyttäytymiselle, jotka auttavat työntekijöitä tai jäseniä tekemään päätöksiä, jotka ovat linjassa organisaation periaatteiden kanssa. Ne ovat vain niin hyviä kuin jäsenten vapaaehtoinen noudattaminen; monet organisaatiot tarjoavat kuitenkin lisäpalkintoja ja -rangaistuksia motivoidakseen jäseniä noudattamaan koodia.
Ammattikoodit tarjoavat yhden vaihtoehdon organisaatioille "kannustaa" jäseniä tukemaan eettisiä periaatteitaan ja missiolauseitaan. Koodit ovat _moraalisia ohjeita_ ammatilliselle käyttäytymiselle, jotka auttavat työntekijöitä tai jäseniä tekemään päätöksiä, jotka ovat linjassa organisaation periaatteiden kanssa. Ne ovat vain niin hyviä kuin jäsenten vapaaehtoinen noudattaminen; monet organisaatiot tarjoavat kuitenkin lisäpalkintoja ja -rangaistuksia motivoidakseen jäseniä noudattamaan koodia.
Esimerkkejä:
* [Oxford Munich](http://www.code-of-ethics.org/code-of-conduct/) Code of Ethics
@ -203,7 +201,7 @@ Esimerkkejä:
### 2. Etiikan tarkistuslistat
Vaikka ammattikoodit määrittelevät vaaditun _eettisen käyttäytymisen_ ammattilaisilta, niillä [on tunnettuja rajoituksia](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md) täytäntöönpanossa, erityisesti suurissa projekteissa. Sen sijaan monet data science -asiantuntijat [suosittelevat tarkistuslistoja](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md), jotka voivat **yhdistää periaatteet käytäntöihin** määrätietoisemmilla ja toiminnallisemmilla tavoilla.
Vaikka ammattikoodit määrittelevät vaaditun _eettisen käyttäytymisen_ ammattilaisilta, niillä [on tunnettuja rajoituksia](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md) valvonnassa, erityisesti suurissa projekteissa. Sen sijaan monet data science -asiantuntijat [suosittelevat tarkistuslistoja](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md), jotka voivat **yhdistää periaatteet käytäntöihin** deterministisemmillä ja toiminnallisemmilla tavoilla.
Tarkistuslistat muuttavat kysymykset "kyllä/ei"-tehtäviksi, jotka voidaan operationalisoida, jolloin niitä voidaan seurata osana standardeja tuotteen julkaisutyönkulkuja.
@ -211,39 +209,39 @@ Esimerkkejä:
* [Deon](https://deon.drivendata.org/) - yleiskäyttöinen dataetiikan tarkistuslista, joka on luotu [teollisuuden suosituksista](https://deon.drivendata.org/#checklist-citations) ja sisältää komentorivityökalun helppoa integrointia varten.
* [Privacy Audit Checklist](https://cyber.harvard.edu/ecommerce/privacyaudit.html) - tarjoaa yleistä ohjeistusta tietojen käsittelykäytännöistä oikeudellisista ja sosiaalisista näkökulmista.
* [AI Fairness Checklist](https://www.microsoft.com/en-us/research/project/ai-fairness-checklist/) - tekoälyasiantuntijoiden luoma tukemaan oikeudenmukaisuustarkistusten käyttöönottoa ja integrointia tekoälyn kehityssykleihin.
* [22 kysymystä datan ja tekoälyn etiikasta](https://medium.com/the-organization/22-questions-for-ethics-in-data-and-ai-efb68fd19429) - avoimempi kehys, joka on suunniteltu eettisten kysymysten alustavaan tutkimiseen suunnittelussa, toteutuksessa ja organisaatiokonteksteissa.
* [22 kysymystä etiikasta datassa ja tekoälyssä](https://medium.com/the-organization/22-questions-for-ethics-in-data-and-ai-efb68fd19429) - avoimempi kehys, joka on suunniteltu eettisten kysymysten alkuperäiseen tutkimiseen suunnittelussa, toteutuksessa ja organisaatiokonteksteissa.
### 3. Etiikan sääntely
Etiikka tarkoittaa yhteisten arvojen määrittämistä ja oikean tekemistä _vapaaehtoisesti_. **Noudattaminen** tarkoittaa _lain seuraamista_ silloin ja siellä, missä se on määritelty. **Hallinto** kattaa laajemmin kaikki tavat, joilla organisaatiot toimivat eettisten periaatteiden täytäntöönpanemiseksi ja määriteltyjen lakien noudattamiseksi.
Etiikka tarkoittaa yhteisten arvojen määrittämistä ja oikean tekemistä _vapaaehtoisesti_. **Noudattaminen** tarkoittaa _lain noudattamista_ silloin ja siellä, missä se on määritelty. **Hallinto** kattaa laajemmin kaikki tavat, joilla organisaatiot toimivat eettisten periaatteiden täytäntöönpanemiseksi ja määriteltyjen lakien noudattamiseksi.
Nykyään hallinto ilmenee organisaatioissa kahdella tavalla. Ensinnäkin kyse on **eettisten tekoälyperiaatteiden** määrittämisestä ja käytäntöjen luomisesta niiden käyttöönoton operationalisoimiseksi kaikissa organisaation tekoälyyn liittyvissä projekteissa. Toiseksi kyse on kaikkien hallituksen määrittelemien **datansuojelusäädösten** noudattamisesta niillä alueilla, joilla organisaatio toimii.
Nykyään hallinto ilmenee organisaatioissa kahdella tavalla. Ensinnäkin kyse on **eettisten tekoälyperiaatteiden** määrittämisestä ja käytäntöjen luomisesta niiden käyttöönoton operatiiviseksi toteuttamiseksi kaikissa organisaation tekoälyyn liittyvissä projekteissa. Toiseksi kyse on kaikkien hallituksen määrittelemien **tietosuojamääräysten** noudattamisesta niillä alueilla, joilla organisaatio toimii.
Esimerkkejä datansuojelusta ja yksityisyyden sääntelystä:
Esimerkkejä tietosuoja- ja yksityisyysmääryksistä:
* `1974`, [Yhdysvaltain Privacy Act](https://www.justice.gov/opcl/privacy-act-1974) - säätelee _liittovaltion hallituksen_ henkilökohtaisen tiedon keräämistä, käyttöä ja julkistamista.
* `1996`, [Yhdysvaltain Health Insurance Portability & Accountability Act (HIPAA)](https://www.cdc.gov/phlp/publications/topic/hipaa.html) - suojaa henkilökohtaisia terveystietoja.
* `1998`, [Yhdysvaltain Children's Online Privacy Protection Act (COPPA)](https://www.ftc.gov/enforcement/rules/rulemaking-regulatory-reform-proceedings/childrens-online-privacy-protection-rule) - suojaa alle 13-vuotiaiden lasten tietosuojaa.
* `2018`, [General Data Protection Regulation (GDPR)](https://gdpr-info.eu/) - tarjoaa käyttäjän oikeuksia, datansuojaa ja yksityisyyttä.
* `1974`, [US Privacy Act](https://www.justice.gov/opcl/privacy-act-1974) - säätelee _liittovaltion hallituksen_ henkilökohtaisen tiedon keräämistä, käyttöä ja paljastamista.
* `1996`, [US Health Insurance Portability & Accountability Act (HIPAA)](https://www.cdc.gov/phlp/publications/topic/hipaa.html) - suojaa henkilökohtaisia terveystietoja.
* `1998`, [US Children's Online Privacy Protection Act (COPPA)](https://www.ftc.gov/enforcement/rules/rulemaking-regulatory-reform-proceedings/childrens-online-privacy-protection-rule) - suojaa alle 13-vuotiaiden lasten tietosuojaa.
* `2018`, [General Data Protection Regulation (GDPR)](https://gdpr-info.eu/) - tarjoaa käyttäjän oikeuksia, tietosuojaa ja yksityisyyttä.
* `2018`, [California Consumer Privacy Act (CCPA)](https://www.oag.ca.gov/privacy/ccpa) antaa kuluttajille enemmän _oikeuksia_ heidän (henkilökohtaisiin) tietoihinsa.
* `2021`, Kiinan [Personal Information Protection Law](https://www.reuters.com/world/china/china-passes-new-personal-data-privacy-law-take-effect-nov-1-2021-08-20/) juuri hyväksytty, luoden yhden maailman vahvimmista verkkotietosuojelusäädöksistä.
* `2021`, Kiinan [Personal Information Protection Law](https://www.reuters.com/world/china/china-passes-new-personal-data-privacy-law-take-effect-nov-1-2021-08-20/) juuri hyväksytty, luoden yhden maailman vahvimmista verkkotietosuojamääräyksistä.
> 🚨 Euroopan unionin määrittelemä GDPR (General Data Protection Regulation) on edelleen yksi vaikutusvaltaisimmista datan yksityisyyden sääntelyistä. Tiesitkö, että se myös määrittelee [8 käyttäjän oikeutta](https://www.freeprivacypolicy.com/blog/8-user-rights-gdpr) suojaamaan kansalaisten digitaalista yksityisyyttä ja henkilökohtaisia tietoja? Opi, mitä nämä ovat ja miksi ne ovat tärkeitä.
> 🚨 Euroopan unionin määrittelemä GDPR (General Data Protection Regulation) on edelleen yksi vaikutusvaltaisimmista tietosuojamääräyksistä. Tiesitkö, että se myös määrittelee [8 käyttäjän oikeutta](https://www.freeprivacypolicy.com/blog/8-user-rights-gdpr) kansalaisten digitaalisen yksityisyyden ja henkilökohtaisten tietojen suojaamiseksi? Opi, mitä nämä ovat ja miksi ne ovat tärkeitä.
### 4. Etiikan kulttuuri
Huomaa, että _lain noudattamisen_ (tehdä tarpeeksi täyttääkseen "lain kirjaimen") ja [systeemisten ongelmien](https://www.coursera.org/learn/data-science-ethics/home/week/4) (kuten jäykistyminen, tiedon epäsymmetria ja jakautumisen epäoikeudenmukaisuus) käsittelyn välillä on edelleen aineeton kuilu, joka voi nopeuttaa tekoälyn aseistamista.
Huomaa, että _lain noudattamisen_ (tehdä tarpeeksi täyttääkseen "lain kirjaimen") ja [systeemisten ongelmien](https://www.coursera.org/learn/data-science-ethics/home/week/4) (kuten jäykistyminen, tiedon epäsymmetria ja jakautumisen epäreiluus) käsittelyn välillä on edelleen aineeton kuilu, joka voi nopeuttaa tekoälyn aseistamista.
Jälkimmäinen vaatii [yhteistyöhön perustuvia lähestymistapoja etiikan kulttuurien määrittämiseen](https://towardsdatascience.com/why-ai-ethics-requires-a-culture-driven-approach-26f451afa29f), jotka rakentavat emotionaalisia yhteyksiä ja johdonmukaisia yhteisiä arvoja _organisaatioiden välillä_ teollisuudessa. Tämä vaatii enemmän [formalisoituja dataetiikan kulttuureja](https://www.codeforamerica.org/news/formalizing-an-ethical-data-culture/) organisaatioissa mahdollistaen _kenelle tahansa_ [vetää Andon-köyttä](https://en.wikipedia.org/wiki/Andon_(manufacturing)) (nostaa eettisiä huolenaiheita prosessin alkuvaiheessa) ja tehden _eettisistä arvioinneista_ (esim. rekrytoinnissa) keskeisen kriteerin tiimien muodostamisessa tekoälyprojekteissa.
Jälkimmäinen vaatii [yhteistyöhön perustuvia lähestymistapoja etiikan kulttuurien määrittämiseksi](https://towardsdatascience.com/why-ai-ethics-requires-a-culture-driven-approach-26f451afa29f), jotka rakentavat emotionaalisia yhteyksiä ja johdonmukaisia yhteisiä arvoja _organisaatioiden_ välillä teollisuudessa. Tämä vaatii enemmän [muodollisia dataetiikan kulttuureja](https://www.codeforamerica.org/news/formalizing-an-ethical-data-culture/) organisaatioissa - mahdollistaen _kenelle tahansa_ [vetää Andon-johto](https://en.wikipedia.org/wiki/Andon_(manufacturing)) (nostaa eettisiä huolenaiheita prosessin alkuvaiheessa) ja tehden _eettisistä arvioinneista_ (esim. rekrytoinnissa) keskeisen kriteerin tiimien muodostamisessa tekoälyprojekteissa.
---
## [Luennon jälkeinen kysely](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/3) 🎯
## [Luennon jälkeinen kysely](https://ff-quizzes.netlify.app/en/ds/) 🎯
## Kertaus ja itseopiskelu
Kurssit ja kirjat auttavat ymmärtämään keskeisiä etiikan käsitteitä ja haasteita, kun taas tapaustutkimukset ja työkalut auttavat soveltamaan eettisiä käytäntöjä todellisissa konteksteissa. Tässä muutamia resursseja, joista voit aloittaa.
Kurssit ja kirjat auttavat ymmärtämään keskeisiä etiikan käsitteitä ja haasteita, kun taas tapaustutkimukset ja työkalut auttavat soveltamaan eettisiä käytäntöjä todellisissa konteksteissa. Tässä muutamia resursseja aloitukseen.
* [Machine Learning For
* [Vastuullisen tekoälyn periaatteet](https://docs.microsoft.com/en-us/learn/modules/responsible-ai-principles/) - ilmainen oppimispolku Microsoft Learnista.
* [Vastuullisen tekoälyn periaatteet](https://docs.microsoft.com/en-us/learn/modules/responsible-ai-principles/) - maksuton oppimispolku Microsoft Learnista.
* [Etiikka ja datatiede](https://resources.oreilly.com/examples/0636920203964) - O'Reillyn e-kirja (M. Loukides, H. Mason ym.)
* [Datatieteen etiikka](https://www.coursera.org/learn/data-science-ethics#syllabus) - verkkokurssi Michiganin yliopistosta.
* [Ethics Unwrapped](https://ethicsunwrapped.utexas.edu/case-studies) - tapaustutkimuksia Texasin yliopistosta.

@ -1,8 +1,8 @@
<!--
CO_OP_TRANSLATOR_METADATA:
{
"original_hash": "8796f41f566a0a8ebb72863a83d558ed",
"translation_date": "2025-08-25T16:42:43+00:00",
"original_hash": "3a34157cc63516eba97c89a0b2f8c3e6",
"translation_date": "2025-09-03T20:49:05+00:00",
"source_file": "1-Introduction/02-ethics/README.md",
"language_code": "fr"
}
@ -11,23 +11,23 @@ CO_OP_TRANSLATOR_METADATA:
|![ Sketchnote par [(@sketchthedocs)](https://sketchthedocs.dev) ](../../sketchnotes/02-Ethics.png)|
|:---:|
| Éthique des sciences des données - _Sketchnote par [@nitya](https://twitter.com/nitya)_ |
| Éthique des données - _Sketchnote par [@nitya](https://twitter.com/nitya)_ |
---
Nous sommes tous des citoyens des données vivant dans un monde axé sur les données.
Les tendances du marché indiquent que d'ici 2022, 1 grande organisation sur 3 achètera et vendra ses données via des [places de marché et des échanges](https://www.gartner.com/smarterwithgartner/gartner-top-10-trends-in-data-and-analytics-for-2020/) en ligne. En tant que **développeurs d'applications**, il sera plus facile et moins coûteux d'intégrer des informations basées sur les données et des automatisations pilotées par des algorithmes dans les expériences utilisateur quotidiennes. Mais à mesure que l'IA devient omniprésente, nous devrons également comprendre les dommages potentiels causés par la [militarisation](https://www.youtube.com/watch?v=TQHs8SA1qpk) de ces algorithmes à grande échelle.
Les tendances du marché indiquent qu'en 2022, une grande organisation sur trois achètera et vendra ses données via des [places de marché et des échanges](https://www.gartner.com/smarterwithgartner/gartner-top-10-trends-in-data-and-analytics-for-2020/) en ligne. En tant que **développeurs d'applications**, il sera plus facile et moins coûteux d'intégrer des analyses basées sur les données et des automatisations pilotées par des algorithmes dans les expériences quotidiennes des utilisateurs. Mais à mesure que l'IA devient omniprésente, nous devrons également comprendre les dommages potentiels causés par la [militarisation](https://www.youtube.com/watch?v=TQHs8SA1qpk) de ces algorithmes à grande échelle.
Les tendances montrent également que nous créerons et consommerons plus de [180 zettaoctets](https://www.statista.com/statistics/871513/worldwide-data-created/) de données d'ici 2025. En tant que **scientifiques des données**, cela nous donne un accès sans précédent à des données personnelles. Cela signifie que nous pouvons construire des profils comportementaux des utilisateurs et influencer la prise de décision de manière à créer une [illusion de libre arbitre](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice), tout en orientant potentiellement les utilisateurs vers des résultats que nous préférons. Cela soulève également des questions plus larges sur la confidentialité des données et la protection des utilisateurs.
Les tendances montrent également que nous créerons et consommerons plus de [180 zettaoctets](https://www.statista.com/statistics/871513/worldwide-data-created/) de données d'ici 2025. En tant que **scientifiques des données**, cela nous donne un accès sans précédent aux données personnelles. Cela signifie que nous pouvons construire des profils comportementaux des utilisateurs et influencer la prise de décision de manière à créer une [illusion de libre choix](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice), tout en orientant potentiellement les utilisateurs vers des résultats que nous préférons. Cela soulève également des questions plus larges sur la confidentialité des données et la protection des utilisateurs.
L'éthique des données est désormais un _garde-fou nécessaire_ pour la science et l'ingénierie des données, nous aidant à minimiser les dommages potentiels et les conséquences involontaires de nos actions basées sur les données. Le [cycle de battage médiatique de Gartner pour l'IA](https://www.gartner.com/smarterwithgartner/2-megatrends-dominate-the-gartner-hype-cycle-for-artificial-intelligence-2020/) identifie des tendances pertinentes en matière d'éthique numérique, d'IA responsable et de gouvernance de l'IA comme des moteurs clés des mégatendances plus larges autour de la _démocratisation_ et de l'_industrialisation_ de l'IA.
L'éthique des données est désormais une _barrière nécessaire_ pour la science et l'ingénierie des données, nous aidant à minimiser les dommages potentiels et les conséquences involontaires de nos actions basées sur les données. Le [cycle de vie des tendances de Gartner pour l'IA](https://www.gartner.com/smarterwithgartner/2-megatrends-dominate-the-gartner-hype-cycle-for-artificial-intelligence-2020/) identifie des tendances pertinentes en matière d'éthique numérique, d'IA responsable et de gouvernance de l'IA comme des moteurs clés des mégatendances plus larges autour de la _démocratisation_ et de l'_industrialisation_ de l'IA.
![Cycle de battage médiatique de Gartner pour l'IA - 2020](https://images-cdn.newscred.com/Zz1mOWJhNzlkNDA2ZTMxMWViYjRiOGFiM2IyMjQ1YmMwZQ==)
![Cycle de vie des tendances de Gartner pour l'IA - 2020](https://images-cdn.newscred.com/Zz1mOWJhNzlkNDA2ZTMxMWViYjRiOGFiM2IyMjQ1YmMwZQ==)
Dans cette leçon, nous explorerons le domaine fascinant de l'éthique des données - des concepts et défis fondamentaux aux études de cas et aux concepts appliqués de l'IA comme la gouvernance - qui aident à établir une culture éthique dans les équipes et organisations travaillant avec les données et l'IA.
Dans cette leçon, nous explorerons le domaine fascinant de l'éthique des données - des concepts et défis fondamentaux aux études de cas et aux concepts appliqués de l'IA comme la gouvernance - qui aident à établir une culture éthique dans les équipes et les organisations travaillant avec les données et l'IA.
## [Quiz pré-lecture](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/2) 🎯
## [Quiz avant la leçon](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/2) 🎯
## Définitions de base
@ -35,63 +35,63 @@ Commençons par comprendre la terminologie de base.
Le mot "éthique" vient du [mot grec "ethikos"](https://en.wikipedia.org/wiki/Ethics) (et de sa racine "ethos") signifiant _caractère ou nature morale_.
**L'éthique** concerne les valeurs partagées et les principes moraux qui régissent notre comportement en société. L'éthique ne repose pas sur des lois, mais sur des normes largement acceptées de ce qui est "bien ou mal". Cependant, les considérations éthiques peuvent influencer les initiatives de gouvernance d'entreprise et les réglementations gouvernementales qui créent davantage d'incitations à la conformité.
**L'éthique** concerne les valeurs partagées et les principes moraux qui régissent notre comportement en société. L'éthique ne repose pas sur des lois mais sur des normes largement acceptées de ce qui est "bien contre mal". Cependant, les considérations éthiques peuvent influencer les initiatives de gouvernance d'entreprise et les réglementations gouvernementales qui créent davantage d'incitations à la conformité.
**L'éthique des données** est une [nouvelle branche de l'éthique](https://royalsocietypublishing.org/doi/full/10.1098/rsta.2016.0360#sec-1) qui "étudie et évalue les problèmes moraux liés aux _données, algorithmes et pratiques correspondantes_". Ici, **"données"** se concentre sur les actions liées à la génération, l'enregistrement, la curation, le traitement, la diffusion, le partage et l'utilisation, **"algorithmes"** se concentre sur l'IA, les agents, l'apprentissage automatique et les robots, et **"pratiques"** se concentre sur des sujets comme l'innovation responsable, la programmation, le piratage et les codes d'éthique.
**L'éthique des données** est une [nouvelle branche de l'éthique](https://royalsocietypublishing.org/doi/full/10.1098/rsta.2016.0360#sec-1) qui "étudie et évalue les problèmes moraux liés aux _données, algorithmes et pratiques correspondantes_". Ici, **"données"** se concentre sur les actions liées à la génération, l'enregistrement, la conservation, le traitement, la diffusion, le partage et l'utilisation, **"algorithmes"** se concentre sur l'IA, les agents, l'apprentissage automatique et les robots, et **"pratiques"** se concentre sur des sujets comme l'innovation responsable, la programmation, le piratage et les codes d'éthique.
**L'éthique appliquée** est [l'application pratique des considérations morales](https://en.wikipedia.org/wiki/Applied_ethics). C'est le processus d'examen actif des questions éthiques dans le contexte des _actions, produits et processus du monde réel_, et de prise de mesures correctives pour s'assurer qu'ils restent alignés avec nos valeurs éthiques définies.
**L'éthique appliquée** est l'[application pratique des considérations morales](https://en.wikipedia.org/wiki/Applied_ethics). C'est le processus d'examen actif des questions éthiques dans le contexte des _actions, produits et processus du monde réel_, et de prise de mesures correctives pour s'assurer qu'ils restent alignés avec nos valeurs éthiques définies.
**La culture éthique** consiste à [_opérationnaliser_ l'éthique appliquée](https://hbr.org/2019/05/how-to-design-an-ethical-organization) pour s'assurer que nos principes et pratiques éthiques sont adoptés de manière cohérente et évolutive dans toute l'organisation. Les cultures éthiques réussies définissent des principes éthiques à l'échelle de l'organisation, offrent des incitations significatives à la conformité et renforcent les normes éthiques en encourageant et en amplifiant les comportements souhaités à tous les niveaux de l'organisation.
## Concepts éthiques
## Concepts d'éthique
Dans cette section, nous discuterons des concepts tels que les **valeurs partagées** (principes) et les **défis éthiques** (problèmes) pour l'éthique des données - et explorerons des **études de cas** qui vous aident à comprendre ces concepts dans des contextes réels.
### 1. Principes éthiques
Toute stratégie d'éthique des données commence par la définition de _principes éthiques_ - les "valeurs partagées" qui décrivent les comportements acceptables et guident les actions conformes dans nos projets de données et d'IA. Vous pouvez les définir au niveau individuel ou de l'équipe. Cependant, la plupart des grandes organisations les décrivent dans une déclaration de mission ou un cadre d'IA éthique défini au niveau de l'entreprise et appliqué de manière cohérente à toutes les équipes.
Toute stratégie d'éthique des données commence par définir des _principes éthiques_ - les "valeurs partagées" qui décrivent les comportements acceptables et guident les actions conformes dans nos projets de données et d'IA. Vous pouvez les définir au niveau individuel ou de l'équipe. Cependant, la plupart des grandes organisations les décrivent dans une déclaration de mission ou un cadre d'_IA éthique_ défini au niveau de l'entreprise et appliqué de manière cohérente dans toutes les équipes.
**Exemple :** La déclaration de mission [IA responsable](https://www.microsoft.com/en-us/ai/responsible-ai) de Microsoft se lit comme suit : _"Nous nous engageons à faire progresser l'IA guidée par des principes éthiques qui placent les personnes au premier plan"_ - identifiant 6 principes éthiques dans le cadre ci-dessous :
**Exemple :** La déclaration de mission de [Microsoft sur l'IA responsable](https://www.microsoft.com/en-us/ai/responsible-ai) indique : _"Nous nous engageons à faire progresser l'IA guidée par des principes éthiques qui placent les personnes au premier plan"_ - en identifiant 6 principes éthiques dans le cadre ci-dessous :
![IA responsable chez Microsoft](https://docs.microsoft.com/en-gb/azure/cognitive-services/personalizer/media/ethics-and-responsible-use/ai-values-future-computed.png)
Explorons brièvement ces principes. _Transparence_ et _responsabilité_ sont des valeurs fondamentales sur lesquelles les autres principes se construisent - commençons donc par là :
Explorons brièvement ces principes. _La transparence_ et _la responsabilité_ sont des valeurs fondamentales sur lesquelles les autres principes se construisent - commençons donc par là :
* [**Responsabilité**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) rend les praticiens _responsables_ de leurs opérations de données et d'IA, et de leur conformité à ces principes éthiques.
* [**Transparence**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) garantit que les actions liées aux données et à l'IA sont _compréhensibles_ (interprétables) pour les utilisateurs, en expliquant le quoi et le pourquoi des décisions.
* [**Équité**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1%3aprimaryr6) - se concentre sur le fait de s'assurer que l'IA traite _toutes les personnes_ équitablement, en abordant les biais socio-techniques systémiques ou implicites dans les données et les systèmes.
* [**Transparence**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) garantit que les actions de données et d'IA sont _compréhensibles_ (interprétables) pour les utilisateurs, en expliquant le quoi et le pourquoi derrière les décisions.
* [**Équité**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1%3aprimaryr6) - se concentre sur le fait de garantir que l'IA traite _toutes les personnes_ de manière équitable, en abordant les biais sociotechniques systémiques ou implicites dans les données et les systèmes.
* [**Fiabilité et sécurité**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - garantit que l'IA se comporte de manière _cohérente_ avec les valeurs définies, en minimisant les dommages potentiels ou les conséquences involontaires.
* [**Confidentialité et sécurité**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - concerne la compréhension de la traçabilité des données et la fourniture de _protection de la confidentialité des données_ aux utilisateurs.
* [**Inclusivité**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - consiste à concevoir des solutions d'IA avec intention, en les adaptant pour répondre à un _large éventail de besoins et de capacités humains_.
* [**Confidentialité et sécurité**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - concerne la compréhension de la provenance des données et la fourniture de _protection de la confidentialité des données_ aux utilisateurs.
* [**Inclusivité**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - consiste à concevoir des solutions d'IA avec intention, en les adaptant pour répondre à un _large éventail de besoins et de capacités humaines_.
> 🚨 Réfléchissez à ce que pourrait être votre déclaration de mission en matière d'éthique des données. Explorez les cadres d'IA éthique d'autres organisations - voici des exemples de [IBM](https://www.ibm.com/cloud/learn/ai-ethics), [Google](https://ai.google/principles), et [Facebook](https://ai.facebook.com/blog/facebooks-five-pillars-of-responsible-ai/). Quelles valeurs partagées ont-ils en commun ? Comment ces principes se rapportent-ils au produit ou à l'industrie de l'IA dans lesquels ils opèrent ?
> 🚨 Réfléchissez à ce que pourrait être votre déclaration de mission sur l'éthique des données. Explorez les cadres d'IA éthique d'autres organisations - voici des exemples de [IBM](https://www.ibm.com/cloud/learn/ai-ethics), [Google](https://ai.google/principles), et [Facebook](https://ai.facebook.com/blog/facebooks-five-pillars-of-responsible-ai/). Quelles valeurs partagées ont-ils en commun ? Comment ces principes se rapportent-ils au produit ou à l'industrie de l'IA dans laquelle ils opèrent ?
### 2. Défis éthiques
Une fois que nous avons défini des principes éthiques, l'étape suivante consiste à évaluer nos actions en matière de données et d'IA pour voir si elles s'alignent sur ces valeurs partagées. Réfléchissez à vos actions dans deux catégories : _collecte de données_ et _conception d'algorithmes_.
Une fois que nous avons défini des principes éthiques, l'étape suivante consiste à évaluer nos actions en matière de données et d'IA pour voir si elles s'alignent sur ces valeurs partagées. Pensez à vos actions dans deux catégories : _collecte de données_ et _conception d'algorithmes_.
Avec la collecte de données, les actions impliqueront probablement des **données personnelles** ou des informations personnellement identifiables (PII) pour des individus identifiables. Cela inclut [divers éléments de données non personnelles](https://ec.europa.eu/info/law/law-topic/data-protection/reform/what-personal-data_en) qui, _collectivement_, identifient un individu. Les défis éthiques peuvent concerner la _confidentialité des données_, la _propriété des données_ et des sujets connexes tels que le _consentement éclairé_ et les _droits de propriété intellectuelle_ des utilisateurs.
Avec la collecte de données, les actions impliqueront probablement des **données personnelles** ou des informations personnellement identifiables (PII) pour des individus identifiables. Cela inclut [divers éléments de données non personnelles](https://ec.europa.eu/info/law/law-topic/data-protection/reform/what-personal-data_en) qui _identifient collectivement_ un individu. Les défis éthiques peuvent concerner la _confidentialité des données_, la _propriété des données_, et des sujets connexes tels que le _consentement éclairé_ et les _droits de propriété intellectuelle_ des utilisateurs.
Avec la conception d'algorithmes, les actions impliqueront la collecte et la curation de **jeux de données**, puis leur utilisation pour entraîner et déployer des **modèles de données** qui prédisent des résultats ou automatisent des décisions dans des contextes réels. Les défis éthiques peuvent découler de _biais dans les jeux de données_, de problèmes de _qualité des données_, d'_injustice_ et de _mauvaise représentation_ dans les algorithmes - y compris certains problèmes systémiques.
Avec la conception d'algorithmes, les actions impliqueront la collecte et la conservation de **ensembles de données**, puis leur utilisation pour entraîner et déployer des **modèles de données** qui prédisent des résultats ou automatisent des décisions dans des contextes réels. Les défis éthiques peuvent découler de _biais dans les ensembles de données_, de problèmes de _qualité des données_, de _manque d'équité_, et de _mauvaise représentation_ dans les algorithmes - y compris certains problèmes qui sont systémiques par nature.
Dans les deux cas, les défis éthiques mettent en évidence les domaines où nos actions peuvent entrer en conflit avec nos valeurs partagées. Pour détecter, atténuer, minimiser ou éliminer ces préoccupations, nous devons poser des questions morales "oui/non" liées à nos actions, puis prendre des mesures correctives si nécessaire. Examinons quelques défis éthiques et les questions morales qu'ils soulèvent :
#### 2.1 Propriété des données
La collecte de données implique souvent des données personnelles pouvant identifier les sujets des données. La [propriété des données](https://permission.io/blog/data-ownership) concerne le _contrôle_ et les [_droits des utilisateurs_](https://permission.io/blog/data-ownership) liés à la création, au traitement et à la diffusion des données.
La collecte de données implique souvent des données personnelles qui peuvent identifier les sujets des données. La [propriété des données](https://permission.io/blog/data-ownership) concerne le _contrôle_ et les [_droits des utilisateurs_](https://permission.io/blog/data-ownership) liés à la création, au traitement et à la diffusion des données.
Les questions morales à poser sont :
* Qui possède les données ? (utilisateur ou organisation)
* Quels droits les sujets des données ont-ils ? (ex : accès, effacement, portabilité)
* Quels droits les organisations ont-elles ? (ex : rectifier des avis malveillants d'utilisateurs)
* Quels droits les organisations ont-elles ? (ex : rectifier des avis malveillants des utilisateurs)
#### 2.2 Consentement éclairé
Le [consentement éclairé](https://legaldictionary.net/informed-consent/) définit l'acte pour les utilisateurs d'accepter une action (comme la collecte de données) avec une _compréhension complète_ des faits pertinents, y compris l'objectif, les risques potentiels et les alternatives.
Le [consentement éclairé](https://legaldictionary.net/informed-consent/) définit l'acte des utilisateurs acceptant une action (comme la collecte de données) avec une _compréhension complète_ des faits pertinents, y compris le but, les risques potentiels et les alternatives.
Questions à explorer ici :
* L'utilisateur (sujet des données) a-t-il donné son autorisation pour la capture et l'utilisation des données ?
* L'utilisateur a-t-il compris l'objectif pour lequel ces données ont été capturées ?
* L'utilisateur a-t-il compris le but pour lequel ces données ont été capturées ?
* L'utilisateur a-t-il compris les risques potentiels liés à sa participation ?
#### 2.3 Propriété intellectuelle
@ -109,39 +109,39 @@ Questions à explorer ici :
La [confidentialité des données](https://www.northeastern.edu/graduate/blog/what-is-data-privacy/) ou confidentialité des informations fait référence à la préservation de la vie privée des utilisateurs et à la protection de leur identité en ce qui concerne les informations personnellement identifiables.
Questions à explorer ici :
* Les données (personnelles) des utilisateurs sont-elles sécurisées contre les piratages et les fuites ?
* Les données personnelles des utilisateurs sont-elles sécurisées contre les piratages et les fuites ?
* Les données des utilisateurs sont-elles accessibles uniquement aux utilisateurs et contextes autorisés ?
* L'anonymat des utilisateurs est-il préservé lorsque les données sont partagées ou diffusées ?
* Un utilisateur peut-il être désidentifié à partir de jeux de données anonymisés ?
* Un utilisateur peut-il être désidentifié à partir d'ensembles de données anonymisés ?
#### 2.5 Droit à l'oubli
Le [droit à l'oubli](https://en.wikipedia.org/wiki/Right_to_be_forgotten) ou [droit à l'effacement](https://www.gdpreu.org/right-to-be-forgotten/) offre une protection supplémentaire des données personnelles aux utilisateurs. En particulier, il donne aux utilisateurs le droit de demander la suppression ou le retrait de données personnelles des recherches Internet et d'autres emplacements, _dans des circonstances spécifiques_ - leur permettant un nouveau départ en ligne sans que leurs actions passées ne soient retenues contre eux.
Le [droit à l'oubli](https://en.wikipedia.org/wiki/Right_to_be_forgotten) ou [droit à l'effacement](https://www.gdpreu.org/right-to-be-forgotten/) offre une protection supplémentaire des données personnelles aux utilisateurs. En particulier, il donne aux utilisateurs le droit de demander la suppression ou le retrait de données personnelles des recherches sur Internet et d'autres emplacements, _dans des circonstances spécifiques_ - leur permettant de repartir à zéro en ligne sans que leurs actions passées ne soient retenues contre eux.
Questions à explorer ici :
* Le système permet-il aux sujets des données de demander l'effacement ?
* Le retrait du consentement de l'utilisateur devrait-il déclencher un effacement automatique ?
* Le retrait du consentement de l'utilisateur devrait-il déclencher un effacement automati ?
* Les données ont-elles été collectées sans consentement ou par des moyens illégaux ?
* Sommes-nous conformes aux réglementations gouvernementales en matière de confidentialité des données ?
* Sommes-nous conformes aux réglementations gouvernementales sur la confidentialité des données ?
#### 2.6 Biais dans les jeux de données
#### 2.6 Biais dans les ensembles de données
Le biais dans les jeux de données ou [biais de collecte](http://researcharticles.com/index.php/bias-in-data-collection-in-research/) concerne la sélection d'un sous-ensemble _non représentatif_ de données pour le développement d'algorithmes, créant une potentielle injustice dans les résultats pour divers groupes. Les types de biais incluent le biais de sélection ou d'échantillonnage, le biais de volontariat et le biais d'instrument.
Le biais dans les ensembles de données ou [biais de collecte](http://researcharticles.com/index.php/bias-in-data-collection-in-research/) concerne la sélection d'un sous-ensemble de données _non représentatif_ pour le développement d'algorithmes, créant une potentielle injustice dans les résultats pour divers groupes. Les types de biais incluent le biais de sélection ou d'échantillonnage, le biais de volontaire et le biais d'instrument.
Questions à explorer ici :
* Avons-nous recruté un ensemble représentatif de sujets de données ?
* Avons-nous testé notre jeu de données collecté ou organisé pour divers biais ?
* Avons-nous recruté un ensemble représentatif de sujets des données ?
* Avons-nous testé notre ensemble de données collecté ou conservé pour divers biais ?
* Pouvons-nous atténuer ou supprimer les biais découverts ?
#### 2.7 Qualité des données
La [qualité des données](https://lakefs.io/data-quality-testing/) examine la validité du jeu de données organisé utilisé pour développer nos algorithmes, en vérifiant si les caractéristiques et les enregistrements répondent aux exigences pour le niveau de précision et de cohérence nécessaire à notre objectif d'IA.
La [qualité des données](https://lakefs.io/data-quality-testing/) examine la validité de l'ensemble de données conservé utilisé pour développer nos algorithmes, vérifiant si les caractéristiques et les enregistrements répondent aux exigences pour le niveau de précision et de cohérence nécessaire à notre objectif d'IA.
Questions à explorer ici :
* Avons-nous capturé des _caractéristiques_ valides pour notre cas d'utilisation ?
* Les données ont-elles été capturées de manière _cohérente_ à partir de diverses sources de données ?
* Le jeu de données est-il _complet_ pour diverses conditions ou scénarios ?
* Les informations capturées sont-elles _précises_ et reflètent-elles la réalité ?
* Les données ont-elles été capturées de manière _cohérente_ à travers diverses sources de données ?
* L'ensemble de données est-il _complet_ pour diverses conditions ou scénarios ?
* Les informations capturées sont-elles _précises_ en reflétant la réalité ?
#### 2.8 Équité des algorithmes
[Algorithm Fairness](https://towardsdatascience.com/what-is-algorithm-fairness-3182e161cf9f) vérifie si la conception de l'algorithme discrimine systématiquement certains sous-groupes de sujets de données, entraînant des [préjudices potentiels](https://docs.microsoft.com/en-us/azure/machine-learning/concept-fairness-ml) dans l'_allocation_ (où des ressources sont refusées ou retenues pour ce groupe) et la _qualité du service_ (où l'IA est moins précise pour certains sous-groupes par rapport à d'autres).
@ -159,12 +159,12 @@ La [fausse représentation des données](https://www.sciencedirect.com/topics/co
Questions à explorer ici :
* Rapportons-nous des données incomplètes ou inexactes ?
* Visualisons-nous les données d'une manière qui induit des conclusions trompeuses ?
* Visualisons-nous les données d'une manière qui conduit à des conclusions trompeuses ?
* Utilisons-nous des techniques statistiques sélectives pour manipuler les résultats ?
* Existe-t-il des explications alternatives qui pourraient offrir une conclusion différente ?
#### 2.10 Libre choix
L'[illusion du libre choix](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice) se produit lorsque les "architectures de choix" des systèmes utilisent des algorithmes de prise de décision pour inciter les gens à adopter un résultat préféré tout en leur donnant l'impression d'avoir des options et du contrôle. Ces [modèles trompeurs](https://www.darkpatterns.org/) peuvent causer des préjudices sociaux et économiques aux utilisateurs. Étant donné que les décisions des utilisateurs influencent les profils de comportement, ces actions peuvent potentiellement orienter les choix futurs et amplifier ou prolonger l'impact de ces préjudices.
L'[illusion du libre choix](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice) se produit lorsque les "architectures de choix" des systèmes utilisent des algorithmes de prise de décision pour inciter les gens à adopter un résultat préféré tout en leur donnant l'impression d'avoir des options et du contrôle. Ces [dark patterns](https://www.darkpatterns.org/) peuvent causer des préjudices sociaux et économiques aux utilisateurs. Étant donné que les décisions des utilisateurs influencent les profils de comportement, ces actions peuvent potentiellement orienter les choix futurs et amplifier ou prolonger l'impact de ces préjudices.
Questions à explorer ici :
* L'utilisateur a-t-il compris les implications de son choix ?
@ -173,23 +173,23 @@ Questions à explorer ici :
### 3. Études de cas
Pour mettre ces défis éthiques en contexte réel, il est utile d'examiner des études de cas qui mettent en lumière les préjudices et conséquences potentiels pour les individus et la société lorsque ces violations éthiques sont ignorées.
Pour mettre ces défis éthiques dans des contextes réels, il est utile d'examiner des études de cas qui mettent en lumière les préjudices et conséquences potentiels pour les individus et la société lorsque ces violations éthiques sont ignorées.
Voici quelques exemples :
| Défi éthique | Étude de cas |
|--- |--- |
| **Consentement éclairé** | 1972 - [Étude sur la syphilis de Tuskegee](https://en.wikipedia.org/wiki/Tuskegee_Syphilis_Study) - Les hommes afro-américains qui ont participé à l'étude ont été promis des soins médicaux gratuits _mais trompés_ par des chercheurs qui n'ont pas informé les sujets de leur diagnostic ou de la disponibilité d'un traitement. De nombreux sujets sont décédés et leurs partenaires ou enfants ont été affectés ; l'étude a duré 40 ans. |
| **Consentement éclairé** | 1972 - [Étude sur la syphilis de Tuskegee](https://en.wikipedia.org/wiki/Tuskegee_Syphilis_Study) - Les hommes afro-américains qui ont participé à l'étude ont été promis des soins médicaux gratuits _mais trompés_ par des chercheurs qui n'ont pas informé les sujets de leur diagnostic ou de la disponibilité d'un traitement. De nombreux sujets sont morts et leurs partenaires ou enfants ont été affectés ; l'étude a duré 40 ans. |
| **Confidentialité des données** | 2007 - Le [concours de données Netflix](https://www.wired.com/2007/12/why-anonymous-data-sometimes-isnt/) a fourni aux chercheurs _10M de classements de films anonymisés de 50K clients_ pour améliorer les algorithmes de recommandation. Cependant, les chercheurs ont pu corréler les données anonymisées avec des données personnellement identifiables dans des _ensembles de données externes_ (par exemple, des commentaires IMDb), "désanonymisant" ainsi certains abonnés Netflix.|
| **Biais de collecte** | 2013 - La ville de Boston a [développé Street Bump](https://www.boston.gov/transportation/street-bump), une application permettant aux citoyens de signaler les nids-de-poule, offrant à la ville de meilleures données sur les routes pour identifier et résoudre les problèmes. Cependant, [les personnes des groupes à faible revenu avaient moins accès aux voitures et aux téléphones](https://hbr.org/2013/04/the-hidden-biases-in-big-data), rendant leurs problèmes de routes invisibles dans cette application. Les développeurs ont travaillé avec des universitaires pour résoudre les problèmes d'_accès équitable et de fractures numériques_ pour plus d'équité. |
| **Équité algorithmique** | 2018 - L'étude MIT [Gender Shades](http://gendershades.org/overview.html) a évalué la précision des produits d'IA de classification de genre, révélant des écarts de précision pour les femmes et les personnes de couleur. Une [carte Apple de 2019](https://www.wired.com/story/the-apple-card-didnt-see-genderand-thats-the-problem/) semblait offrir moins de crédit aux femmes qu'aux hommes. Les deux cas ont illustré des problèmes de biais algorithmique entraînant des préjudices socio-économiques.|
| **Biais de collecte** | 2013 - La ville de Boston a [développé Street Bump](https://www.boston.gov/transportation/street-bump), une application permettant aux citoyens de signaler les nids-de-poule, offrant à la ville de meilleures données sur les routes pour identifier et résoudre les problèmes. Cependant, [les personnes des groupes à faible revenu avaient moins accès aux voitures et aux téléphones](https://hbr.org/2013/04/the-hidden-biases-in-big-data), rendant leurs problèmes de voirie invisibles dans cette application. Les développeurs ont travaillé avec des universitaires pour résoudre les problèmes d'_accès équitable et de fractures numériques_ pour plus d'équité. |
| **Équité algorithmique** | 2018 - L'étude MIT [Gender Shades](http://gendershades.org/overview.html) a évalué la précision des produits d'IA de classification de genre, exposant des écarts de précision pour les femmes et les personnes de couleur. Une [carte Apple de 2019](https://www.wired.com/story/the-apple-card-didnt-see-genderand-thats-the-problem/) semblait offrir moins de crédit aux femmes qu'aux hommes. Les deux cas ont illustré des problèmes de biais algorithmique entraînant des préjudices socio-économiques.|
| **Fausse représentation des données** | 2020 - Le [Département de la santé publique de Géorgie a publié des graphiques COVID-19](https://www.vox.com/covid-19-coronavirus-us-response-trump/2020/5/18/21262265/georgia-covid-19-cases-declining-reopening) qui semblaient induire les citoyens en erreur sur les tendances des cas confirmés avec un ordre non chronologique sur l'axe des x. Cela illustre la fausse représentation par des astuces de visualisation. |
| **Illusion du libre choix** | 2020 - L'application éducative [ABCmouse a payé 10M$ pour régler une plainte de la FTC](https://www.washingtonpost.com/business/2020/09/04/abcmouse-10-million-ftc-settlement/) où les parents étaient piégés dans des abonnements qu'ils ne pouvaient pas annuler. Cela illustre des modèles trompeurs dans les architectures de choix, où les utilisateurs étaient incités à faire des choix potentiellement nuisibles. |
| **Illusion du libre choix** | 2020 - L'application éducative [ABCmouse a payé 10M$ pour régler une plainte de la FTC](https://www.washingtonpost.com/business/2020/09/04/abcmouse-10-million-ftc-settlement/) où les parents étaient piégés dans des abonnements qu'ils ne pouvaient pas annuler. Cela illustre les dark patterns dans les architectures de choix, où les utilisateurs étaient incités à faire des choix potentiellement nuisibles. |
| **Confidentialité des données et droits des utilisateurs** | 2021 - La [violation de données Facebook](https://www.npr.org/2021/04/09/986005820/after-data-breach-exposes-530-million-facebook-says-it-will-not-notify-users) a exposé les données de 530M d'utilisateurs, entraînant un règlement de 5B$ avec la FTC. Cependant, Facebook a refusé de notifier les utilisateurs de la violation, violant les droits des utilisateurs en matière de transparence et d'accès aux données. |
Vous voulez explorer plus d'études de cas ? Consultez ces ressources :
Vous voulez explorer davantage d'études de cas ? Consultez ces ressources :
* [Ethics Unwrapped](https://ethicsunwrapped.utexas.edu/case-studies) - dilemmes éthiques dans divers secteurs.
* [Cours sur l'éthique des sciences des données](https://www.coursera.org/learn/data-science-ethics#syllabus) - études de cas emblématiques explorées.
* [Cours sur l'éthique en science des données](https://www.coursera.org/learn/data-science-ethics#syllabus) - études de cas emblématiques explorées.
* [Où les choses ont mal tourné](https://deon.drivendata.org/examples/) - checklist Deon avec des exemples.
> 🚨 Pensez aux études de cas que vous avez vues - avez-vous vécu ou été affecté par un défi éthique similaire dans votre vie ? Pouvez-vous penser à au moins une autre étude de cas qui illustre l'un des défis éthiques discutés dans cette section ?
@ -207,57 +207,59 @@ Exemples :
* [Data Science Association](http://datascienceassn.org/code-of-conduct.html) Code de conduite (créé en 2013)
* [ACM Code of Ethics and Professional Conduct](https://www.acm.org/code-of-ethics) (depuis 1993)
> 🚨 Faites-vous partie d'une organisation professionnelle d'ingénierie ou de science des données ? Explorez leur site pour voir s'ils définissent un code d'éthique professionnel. Que dit-il sur leurs principes éthiques ? Comment incitent-ils leurs membres à suivre le code ?
> 🚨 Faites-vous partie d'une organisation professionnelle en ingénierie ou science des données ? Explorez leur site pour voir s'ils définissent un code d'éthique professionnel. Que dit-il sur leurs principes éthiques ? Comment incitent-ils leurs membres à suivre le code ?
### 2. Checklists éthiques
Alors que les codes professionnels définissent le comportement _éthique requis_ des praticiens, ils [ont des limites connues](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md) en matière d'application, en particulier dans les projets à grande échelle. Au lieu de cela, de nombreux experts en science des données [préconisent des checklists](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md), qui peuvent **connecter les principes aux pratiques** de manière plus déterministe et actionnable.
Alors que les codes professionnels définissent le comportement _éthique requis_ des praticiens, ils [ont des limites connues](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md) en matière d'application, en particulier dans les projets à grande échelle. À la place, de nombreux experts en science des données [préconisent des checklists](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md), qui peuvent **connecter les principes aux pratiques** de manière plus déterministe et actionnable.
Les checklists transforment les questions en tâches "oui/non" qui peuvent être opérationnalisées, permettant de les suivre dans le cadre des workflows standard de lancement de produit.
Les checklists transforment les questions en tâches "oui/non" qui peuvent être opérationnalisées, permettant leur suivi dans les workflows standard de lancement de produit.
Exemples :
* [Deon](https://deon.drivendata.org/) - une checklist éthique générale créée à partir de [recommandations de l'industrie](https://deon.drivendata.org/#checklist-citations) avec un outil en ligne de commande pour une intégration facile.
* [Deon](https://deon.drivendata.org/) - une checklist éthique généraliste créée à partir de [recommandations de l'industrie](https://deon.drivendata.org/#checklist-citations) avec un outil en ligne de commande pour une intégration facile.
* [Checklist d'audit de confidentialité](https://cyber.harvard.edu/ecommerce/privacyaudit.html) - fournit des conseils généraux sur les pratiques de gestion de l'information du point de vue juridique et social.
* [Checklist sur l'équité de l'IA](https://www.microsoft.com/en-us/research/project/ai-fairness-checklist/) - créée par des praticiens de l'IA pour soutenir l'adoption et l'intégration des vérifications d'équité dans les cycles de développement de l'IA.
* [22 questions pour l'éthique dans les données et l'IA](https://medium.com/the-organization/22-questions-for-ethics-in-data-and-ai-efb68fd19429) - cadre plus ouvert, structuré pour une exploration initiale des problèmes éthiques dans la conception, la mise en œuvre et les contextes organisationnels.
### 3. Réglementations éthiques
L'éthique consiste à définir des valeurs partagées et à faire ce qui est juste _volontairement_. **La conformité** consiste à _respecter la loi_ là où elle est définie. **La gouvernance** couvre de manière générale toutes les façons dont les organisations opèrent pour appliquer des principes éthiques et se conformer aux lois établies.
L'éthique consiste à définir des valeurs partagées et à faire ce qui est juste _volontairement_. **La conformité** consiste à _respecter la loi_ là où elle est définie. **La gouvernance** couvre globalement toutes les façons dont les organisations fonctionnent pour appliquer des principes éthiques et se conformer aux lois établies.
Aujourd'hui, la gouvernance prend deux formes au sein des organisations. Premièrement, il s'agit de définir des principes d'**IA éthique** et d'établir des pratiques pour opérationnaliser leur adoption dans tous les projets liés à l'IA de l'organisation. Deuxièmement, il s'agit de se conformer à toutes les **réglementations sur la protection des données** imposées par le gouvernement dans les régions où elle opère.
Aujourd'hui, la gouvernance prend deux formes au sein des organisations. Premièrement, il s'agit de définir des principes d'**IA éthique** et d'établir des pratiques pour opérationnaliser leur adoption dans tous les projets liés à l'IA de l'organisation. Deuxièmement, il s'agit de se conformer à toutes les **réglementations sur la protection des données** imposées par les gouvernements des régions où elle opère.
Exemples de réglementations sur la protection des données et la confidentialité :
* `1974`, [US Privacy Act](https://www.justice.gov/opcl/privacy-act-1974) - régule la collecte, l'utilisation et la divulgation des informations personnelles par le _gouvernement fédéral_.
* `1996`, [US Health Insurance Portability & Accountability Act (HIPAA)](https://www.cdc.gov/phlp/publications/topic/hipaa.html) - protège les données personnelles de santé.
* `1998`, [US Children's Online Privacy Protection Act (COPPA)](https://www.ftc.gov/enforcement/rules/rulemaking-regulatory-reform-proceedings/childrens-online-privacy-protection-rule) - protège la confidentialité des données des enfants de moins de 13 ans.
* `2018`, [Règlement général sur la protection des données (RGPD)](https://gdpr-info.eu/) - fournit des droits aux utilisateurs, protège les données et la confidentialité.
* `2018`, [Règlement général sur la protection des données (RGPD)](https://gdpr-info.eu/) - fournit des droits aux utilisateurs, protège les données et la vie privée.
* `2018`, [California Consumer Privacy Act (CCPA)](https://www.oag.ca.gov/privacy/ccpa) donne aux consommateurs plus de _droits_ sur leurs données personnelles.
* `2021`, La Chine a adopté la [Loi sur la protection des informations personnelles](https://www.reuters.com/world/china/china-passes-new-personal-data-privacy-law-take-effect-nov-1-2021-08-20/), créant l'une des réglementations les plus strictes sur la confidentialité des données en ligne dans le monde.
* `2021`, La [Loi sur la protection des informations personnelles de la Chine](https://www.reuters.com/world/china/china-passes-new-personal-data-privacy-law-take-effect-nov-1-2021-08-20/) vient d'être adoptée, créant l'une des réglementations les plus strictes sur la confidentialité des données en ligne dans le monde.
> 🚨 L'Union européenne a défini le RGPD (Règlement général sur la protection des données), qui reste l'une des réglementations les plus influentes sur la confidentialité des données aujourd'hui. Saviez-vous qu'il définit également [8 droits des utilisateurs](https://www.freeprivacypolicy.com/blog/8-user-rights-gdpr) pour protéger la confidentialité numérique et les données personnelles des citoyens ? Découvrez quels sont ces droits et pourquoi ils sont importants.
> 🚨 L'Union européenne a défini le RGPD (Règlement général sur la protection des données), qui reste l'une des réglementations les plus influentes sur la confidentialité des données aujourd'hui. Saviez-vous qu'il définit également [8 droits des utilisateurs](https://www.freeprivacypolicy.com/blog/8-user-rights-gdpr) pour protéger la vie privée numérique et les données personnelles des citoyens ? Découvrez quels sont ces droits et pourquoi ils sont importants.
### 4. Culture éthique
Notez qu'il existe un écart intangible entre la _conformité_ (faire juste assez pour respecter "la lettre de la loi") et le traitement des [problèmes systémiques](https://www.coursera.org/learn/data-science-ethics/home/week/4) (comme l'ossification, l'asymétrie de l'information et l'injustice dans la distribution) qui peuvent accélérer la transformation de l'IA en arme.
Notez qu'il existe un écart intangible entre la _conformité_ (faire juste assez pour respecter "la lettre de la loi") et le traitement des [problèmes systémiques](https://www.coursera.org/learn/data-science-ethics/home/week/4) (comme l'ossification, l'asymétrie de l'information et l'injustice dans la distribution) qui peuvent accélérer la militarisation de l'IA.
Ce dernier nécessite [des approches collaboratives pour définir des cultures éthiques](https://towardsdatascience.com/why-ai-ethics-requires-a-culture-driven-approach-26f451afa29f) qui construisent des connexions émotionnelles et des valeurs partagées cohérentes _entre les organisations_ de l'industrie. Cela appelle à des [cultures éthiques formalisées](https://www.codeforamerica.org/news/formalizing-an-ethical-data-culture/) dans les organisations - permettant à _n'importe qui_ de [tirer le cordon Andon](https://en.wikipedia.org/wiki/Andon_(manufacturing)) (pour soulever des préoccupations éthiques tôt dans le processus) et faisant des _évaluations éthiques_ (par exemple, dans le recrutement) un critère central pour la formation des équipes dans les projets d'IA.
Ce dernier nécessite des [approches collaboratives pour définir des cultures éthiques](https://towardsdatascience.com/why-ai-ethics-requires-a-culture-driven-approach-26f451afa29f) qui construisent des connexions émotionnelles et des valeurs partagées cohérentes _entre les organisations_ de l'industrie. Cela appelle à des [cultures éthiques formalisées](https://www.codeforamerica.org/news/formalizing-an-ethical-data-culture/) dans les organisations - permettant à _n'importe qui_ de [tirer le cordon Andon](https://en.wikipedia.org/wiki/Andon_(manufacturing)) (pour soulever des préoccupations éthiques tôt dans le processus) et faisant des _évaluations éthiques_ (par exemple, dans le recrutement) un critère central pour la formation des équipes dans les projets d'IA.
---
## [Quiz post-conférence](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/3) 🎯
## [Quiz post-conférence](https://ff-quizzes.netlify.app/en/ds/) 🎯
## Révision et auto-apprentissage
Les cours et les livres aident à comprendre les concepts et défis éthiques fondamentaux, tandis que les études de cas et les outils aident à appliquer les pratiques éthiques dans des contextes réels. Voici quelques ressources pour commencer.
Les cours et les livres aident à comprendre les concepts éthiques fondamentaux et les défis, tandis que les études de cas et les outils aident à appliquer les pratiques éthiques dans des contextes réels. Voici quelques ressources pour commencer.
* [Machine Learning For Beginners](https://github.com/microsoft/ML-For-Beginners/blob/main/1-Introduction/3-fairness/README.md) - leçon sur l'équité, de Microsoft.
* [Principes de l'IA responsable](https://docs.microsoft.com/en-us/learn/modules/responsible-ai-principles/) - parcours d'apprentissage gratuit de Microsoft Learn.
* [Éthique et science des données](https://resources.oreilly.com/examples/0636920203964) - EBook O'Reilly (M. Loukides, H. Mason et al.)
* [Éthique de la science des données](https://www.coursera.org/learn/data-science-ethics#syllabus) - cours en ligne de l'Université du Michigan.
* [Éthique en science des données](https://www.coursera.org/learn/data-science-ethics#syllabus) - cours en ligne de l'Université du Michigan.
* [Ethics Unwrapped](https://ethicsunwrapped.utexas.edu/case-studies) - études de cas de l'Université du Texas.
# Devoir
[Écrire une étude de cas sur l'éthique des données](assignment.md)
---
**Avertissement** :
Ce document a été traduit à l'aide du service de traduction automatique [Co-op Translator](https://github.com/Azure/co-op-translator). Bien que nous nous efforcions d'assurer l'exactitude, veuillez noter que les traductions automatisées peuvent contenir des erreurs ou des inexactitudes. Le document original dans sa langue d'origine doit être considéré comme la source faisant autorité. Pour des informations critiques, il est recommandé de faire appel à une traduction humaine professionnelle. Nous déclinons toute responsabilité en cas de malentendus ou d'interprétations erronées résultant de l'utilisation de cette traduction.
Ce document a été traduit à l'aide du service de traduction automatique [Co-op Translator](https://github.com/Azure/co-op-translator). Bien que nous nous efforcions d'assurer l'exactitude, veuillez noter que les traductions automatisées peuvent contenir des erreurs ou des inexactitudes. Le document original dans sa langue d'origine doit être considéré comme la source faisant autorité. Pour des informations critiques, il est recommandé de recourir à une traduction professionnelle réalisée par un humain. Nous déclinons toute responsabilité en cas de malentendus ou d'interprétations erronées résultant de l'utilisation de cette traduction.

@ -1,8 +1,8 @@
<!--
CO_OP_TRANSLATOR_METADATA:
{
"original_hash": "8796f41f566a0a8ebb72863a83d558ed",
"translation_date": "2025-08-28T15:55:18+00:00",
"original_hash": "3a34157cc63516eba97c89a0b2f8c3e6",
"translation_date": "2025-09-03T21:34:30+00:00",
"source_file": "1-Introduction/02-ethics/README.md",
"language_code": "he"
}
@ -17,15 +17,15 @@ CO_OP_TRANSLATOR_METADATA:
כולנו אזרחים של נתונים החיים בעולם מבוסס נתונים.
מגמות השוק מראות שעד שנת 2022, אחת מתוך שלוש ארגונים גדולים תקנה ותמכור את הנתונים שלה דרך [שווקים ומרכזי מסחר](https://www.gartner.com/smarterwithgartner/gartner-top-10-trends-in-data-and-analytics-for-2020/) מקוונים. בתור **מפתחי אפליקציות**, יהיה לנו קל וזול יותר לשלב תובנות מבוססות נתונים ואוטומציה מבוססת אלגוריתמים בחוויות היומיום של המשתמשים. אך ככל שהבינה המלאכותית הופכת לנפוצה, נצטרך גם להבין את הנזקים הפוטנציאליים הנגרמים מ[שימוש לרעה](https://www.youtube.com/watch?v=TQHs8SA1qpk) באלגוריתמים כאלה בקנה מידה רחב.
מגמות השוק מראות שעד שנת 2022, אחת מתוך שלוש ארגונים גדולים תקנה ותמכור את הנתונים שלה דרך [שווקים ומרכזי מסחר](https://www.gartner.com/smarterwithgartner/gartner-top-10-trends-in-data-and-analytics-for-2020/) מקוונים. בתור **מפתחי אפליקציות**, יהיה לנו קל וזול יותר לשלב תובנות מבוססות נתונים ואוטומציה מבוססת אלגוריתמים בחוויות היומיומיות של המשתמשים. אך ככל שהבינה המלאכותית הופכת לנפוצה, נצטרך גם להבין את הנזקים הפוטנציאליים הנגרמים מ[שימוש לרעה](https://www.youtube.com/watch?v=TQHs8SA1qpk) באלגוריתמים כאלה בקנה מידה רחב.
מגמות נוספות מצביעות על כך שניצור ונצרוך מעל [180 זטה-בייטים](https://www.statista.com/statistics/871513/worldwide-data-created/) של נתונים עד שנת 2025. בתור **מדעני נתונים**, זה מעניק לנו רמות חסרות תקדים של גישה לנתונים אישיים. המשמעות היא שנוכל לבנות פרופילים התנהגותיים של משתמשים ולהשפיע על קבלת ההחלטות בדרכים שיוצרות [אשליה של בחירה חופשית](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice), תוך כדי דחיפת המשתמשים לתוצאות שאנחנו מעדיפים. זה גם מעלה שאלות רחבות יותר על פרטיות נתונים והגנה על משתמשים.
אתיקה של נתונים היא כיום סגרת הכרחית_ למדעי הנתונים וההנדסה, המסייעת לנו למזער נזקים פוטנציאליים ותוצאות בלתי צפויות מפעולותינו מבוססות הנתונים. [מחזור ההייפ של גרטנר עבור AI](https://www.gartner.com/smarterwithgartner/2-megatrends-dominate-the-gartner-hype-cycle-for-artificial-intelligence-2020/) מזהה מגמות רלוונטיות באתיקה דיגיטלית, AI אחראי, וממשל AI כגורמים מרכזיים למגמות רחבות יותר סביב _דמוקרטיזציה_ ויעוש_ של AI.
אתיקה של נתונים היא כיום סגרת הכרחית_ למדעי הנתונים וההנדסה, המסייעת לנו למזער נזקים פוטנציאליים ותוצאות בלתי צפויות מפעולותינו המבוססות על נתונים. [מעגל ההייפ של גרטנר עבור AI](https://www.gartner.com/smarterwithgartner/2-megatrends-dominate-the-gartner-hype-cycle-for-artificial-intelligence-2020/) מזהה מגמות רלוונטיות באתיקה דיגיטלית, AI אחראי, וממשל AI כגורמים מרכזיים למגמות רחבות יותר סביב _דמוקרטיזציה_ ויעוש_ של AI.
![מחזור ההייפ של גרטנר עבור AI - 2020](https://images-cdn.newscred.com/Zz1mOWJhNzlkNDA2ZTMxMWViYjRiOGFiM2IyMjQ1YmMwZQ==)
![מעגל ההייפ של גרטנר עבור AI - 2020](https://images-cdn.newscred.com/Zz1mOWJhNzlkNDA2ZTMxMWViYjRiOGFiM2IyMjQ1YmMwZQ==)
בשיעור זה, נחקור את התחום המרתק של אתיקה של נתונים - החל ממושגים ואתגרים מרכזיים, דרך מחקרי מקרה ועד מושגים יישומיים כמו ממשל AI - המסייעים לבסס תרבות אתית בצוותים ובארגונים העובדים עם נתונים ו-AI.
בשיעור זה, נחקור את התחום המרתק של אתיקה של נתונים - החל ממושגים ואתגרים מרכזיים, דרך מחקרי מקרה ועד מושגים יישומיים של AI כמו ממשל - המסייעים לבסס תרבות אתית בצוותים ובארגונים העובדים עם נתונים ו-AI.
## [שאלון לפני השיעור](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/2) 🎯
@ -33,15 +33,15 @@ CO_OP_TRANSLATOR_METADATA:
נתחיל בהבנת המונחים הבסיסיים.
המילה "אתיקה" מגיעה מהמילה היוונית [ethikos](https://en.wikipedia.org/wiki/Ethics) (ושורשה "ethos") שמשמעותה ופי או טבע מוסרי_.
המילה "אתיקה" מגיעה מ[המילה היוונית "ethikos"](https://en.wikipedia.org/wiki/Ethics) (ושורשה "ethos") שמשמעותה ופי או טבע מוסרי_.
**אתיקה** עוסקת בערכים משותפים ועקרונות מוסריים שמנחים את התנהגותנו בחברה. אתיקה מבוססת לא על חוקים אלא על נורמות מקובלות של מה "נכון מול לא נכון". עם זאת, שיקולים אתיים יכולים להשפיע על יוזמות ממשל תאגידי ורגולציות ממשלתיות שיוצרות תמריצים נוספים לציות.
**אתיקה של נתונים** היא [ענף חדש של אתיקה](https://royalsocietypublishing.org/doi/full/10.1098/rsta.2016.0360#sec-1) שחוקר ומעריך בעיות מוסריות הקשורות ל_נתונים, אלגוריתמים ופרקטיקות נלוות_. כאן, **"נתונים"** מתמקדים בפעולות הקשורות ליצירה, רישום, אצירה, עיבוד, הפצה, שיתוף ושימוש; **"אלגוריתמים"** מתמקדים ב-AI, סוכנים, למידת מכונה ורובוטים; ו**"פרקטיקות"** מתמקדות בנושאים כמו חדשנות אחראית, תכנות, פריצה וקודי אתיקה.
**אתיקה של נתונים** היא [ענף חדש של אתיקה](https://royalsocietypublishing.org/doi/full/10.1098/rsta.2016.0360#sec-1) שחוקר ומעריך בעיות מוסריות הקשורות ל_נתונים, אלגוריתמים ופרקטיקות תואמות_. כאן, **"נתונים"** מתמקדים בפעולות הקשורות ליצירה, הקלטה, אצירה, עיבוד, הפצה, שיתוף ושימוש; **"אלגוריתמים"** מתמקדים ב-AI, סוכנים, למידת מכונה ורובוטים; ו**"פרקטיקות"** מתמקדות בנושאים כמו חדשנות אחראית, תכנות, פריצה וקודי אתיקה.
**אתיקה יישומית** היא [יישום מעשי של שיקולים מוסריים](https://en.wikipedia.org/wiki/Applied_ethics). זהו תהליך של חקירה פעילה של סוגיות אתיות בהקשר של _פעולות, מוצרים ותהליכים בעולם האמיתי_, ולקיחת צעדים מתקנים כדי להבטיח שהם נשארים מיושרים עם הערכים האתיים שהוגדרו.
**אתיקה יישומית** היא [היישום המעשי של שיקולים מוסריים](https://en.wikipedia.org/wiki/Applied_ethics). זהו תהליך של חקירה פעילה של סוגיות אתיות בהקשר של _פעולות, מוצרים ותהליכים בעולם האמיתי_, ולקיחת צעדים מתקנים כדי להבטיח שהם נשארים מיושרים עם הערכים האתיים שהוגדרו.
**תרבות אתית** עוסקת ב[_הפעלה_ של אתיקה יישומית](https://hbr.org/2019/05/how-to-design-an-ethical-organization) כדי להבטיח שהעקרונות והפרקטיקות האתיים שלנו מאומצים באופן עקבי וניתן להרחבה בכל רחבי הארגון. תרבויות אתיות מצליחות מגדירות עקרונות אתיים ברמת הארגון, מספקות תמריצים משמעותיים לציות, ומחזקות נורמות אתיות על ידי עידוד והגברת התנהגויות רצויות בכל רמות הארגון.
**תרבות אתית** עוסקת ב[_הפעלה_ של אתיקה יישומית](https://hbr.org/2019/05/how-to-design-an-ethical-organization) כדי להבטיח שהעקרונות והפרקטיקות האתיים שלנו יאומצו באופן עקבי ובר-קיימא בכל רחבי הארגון. תרבויות אתיות מצליחות מגדירות עקרונות אתיים ברמת הארגון, מספקות תמריצים משמעותיים לציות, ומחזקות נורמות אתיות על ידי עידוד והגברת התנהגויות רצויות בכל רמות הארגון.
## מושגי אתיקה
@ -49,32 +49,32 @@ CO_OP_TRANSLATOR_METADATA:
### 1. עקרונות אתיים
כל אסטרטגיה של אתיקה של נתונים מתחילה בהגדרת _עקרונות אתיים_ - "ערכים משותפים" שמתארים התנהגויות מקובלות ומנחים פעולות תואמות בפרויקטים של נתונים ו-AI שלנו. ניתן להגדיר אותם ברמה האישית או הצוותית. עם זאת, רוב הארגונים הגדולים מגדירים אותם בהצהרת משימה או מסגרת של _AI אתי_ ברמת הארגון, ומיישמים אותם באופן עקבי בכל הצוותים.
כל אסטרטגיה של אתיקה של נתונים מתחילה בהגדרת _עקרונות אתיים_ - "הערכים המשותפים" שמתארים התנהגויות מקובלות ומנחים פעולות תואמות בפרויקטים שלנו של נתונים ו-AI. ניתן להגדיר אותם ברמה אישית או צוותית. עם זאת, רוב הארגונים הגדולים מגדירים אותם בהצהרת משימה או מסגרת של _AI אתי_ ברמת הארגון, ומיישמים אותם באופן עקבי בכל הצוותים.
**דוגמה:** הצהרת המשימה של [AI אחראי](https://www.microsoft.com/en-us/ai/responsible-ai) של מיקרוסופט אומרת: _"אנחנו מחויבים לקידום AI מונחה עקרונות אתיים שמעמידים את האנשים במרכז"_ - ומזהה 6 עקרונות אתיים במסגרת הבאה:
**דוגמה:** הצהרת המשימה של [Microsoft Responsible AI](https://www.microsoft.com/en-us/ai/responsible-ai) אומרת: _"אנחנו מחויבים לקידום AI מונחה עקרונות אתיים שמעמידים את האדם במרכז"_ - ומזהה 6 עקרונות אתיים במסגרת הבאה:
![AI אחראי במיקרוסופט](https://docs.microsoft.com/en-gb/azure/cognitive-services/personalizer/media/ethics-and-responsible-use/ai-values-future-computed.png)
בואו נחקור בקצרה את העקרונות הללו. _שקיפות_ ו_אחריות_ הם ערכים יסודיים שעליהם נבנים עקרונות אחרים - אז נתחיל שם:
* [**אחריות**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) הופכת את העוסקים בתחום ל_אחראים_ על פעולותיהם בתחום הנתונים וה-AI, ועל הציות לעקרונות האתיים הללו.
* [**שקיפות**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) מבטיחה שפעולות הנתונים וה-AI יהיו ובנות_ (ניתנות לפרשנות) למשתמשים, תוך הסבר על מה ולמה מאחורי ההחלטות.
* [**שקיפות**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) מבטיחה שפעולות הנתונים וה-AI יהיו ובנות_ (ניתנות לפרשנות) למשתמשים, ומסבירה את ה"מה" וה"למה" מאחורי ההחלטות.
* [**הוגנות**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1%3aprimaryr6) - מתמקדת בהבטחת יחס וגן_ לכל האנשים, תוך התמודדות עם הטיות חברתיות-טכניות מערכתיות או סמיות בנתונים ובמערכות.
* [**אמינות ובטיחות**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - מבטיחה ש-AI מתנהג _בעקביות_ עם ערכים מוגדרים, תוך מזעור נזקים פוטנציאליים או תוצאות בלתי צפויות.
* [**פרטיות ואבטחה**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - עוסקת בהבנת שושלת הנתונים ובמתן _הגנה על פרטיות נתונים_ למשתמשים.
* [**אמינות ובטיחות**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - מבטיחה ש-AI מתנהג _בעקביות_ עם ערכים מוגדרים, וממזערת נזקים פוטנציאליים או תוצאות בלתי צפויות.
* [**פרטיות ואבטחה**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - עוסקת בהבנת מקור הנתונים ובמתן _הגנה על פרטיות נתונים_ למשתמשים.
* [**הכללה**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - עוסקת בעיצוב פתרונות AI מתוך כוונה, והתאמתם למגוון רחב של _צרכים ויכולות אנושיות_.
> 🚨 חשבו על מה יכולה להיות הצהרת המשימה של אתיקה של נתונים שלכם. חקרו מסגרות AI אתיות מארגונים אחרים - הנה דוגמאות מ-[IBM](https://www.ibm.com/cloud/learn/ai-ethics), [Google](https://ai.google/principles), ו-[Facebook](https://ai.facebook.com/blog/facebooks-five-pillars-of-responsible-ai/). אילו ערכים משותפים יש להם במשותף? כיצד עקרונות אלה קשורים למוצרי AI או לתעשייה שבה הם פועלים?
> 🚨 חשבו על מה יכולה להיות הצהרת המשימה של אתיקה של נתונים שלכם. חקרו מסגרות AI אתיות מארגונים אחרים - הנה דוגמאות מ-[IBM](https://www.ibm.com/cloud/learn/ai-ethics), [Google](https://ai.google/principles), ו-[Facebook](https://ai.facebook.com/blog/facebooks-five-pillars-of-responsible-ai/). אילו ערכים משותפים יש להם? כיצד עקרונות אלה קשורים למוצרי AI או לתעשייה שבה הם פועלים?
### 2. אתגרים אתיים
לאחר שהגדרנו עקרונות אתיים, השלב הבא הוא להעריך את פעולות הנתונים וה-AI שלנו כדי לראות אם הן מתיישרות עם הערכים המשותפים הללו. חשבו על הפעולות שלכם בשתי קטגוריות: יסוף נתונים_ ויצוב אלגוריתמים_.
באיסוף נתונים, הפעולות יכללו ככל הנראה **נתונים אישיים** או מידע אישי מזהה (PII) עבור אנשים מזוהים. זה כולל [פריטים מגוונים של נתונים לא אישיים](https://ec.europa.eu/info/law/law-topic/data-protection/reform/what-personal-data_en) שמזהים יחד_ אדם. אתגרים אתיים יכולים להיות קשורים ל_פרטיות נתונים_, _בעלות על נתונים_, ונושאים קשורים כמו סכמה מדעת_ ו_זכויות קניין רוחני_ של משתמשים.
באיסוף נתונים, הפעולות יכללו ככל הנראה **נתונים אישיים** או מידע אישי מזהה (PII) עבור אנשים מזוהים. זה כולל [פריטים מגוונים של נתונים לא אישיים](https://ec.europa.eu/info/law/law-topic/data-protection/reform/what-personal-data_en) שמזהים יחד_ אדם. אתגרים אתיים יכולים להיות קשורים ל_פרטיות נתונים_, _בעלות על נתונים_, ונושאים קשורים כמו סכמה מדעת_ ו_זכויות קניין רוחני_ למשתמשים.
בעיצוב אלגוריתמים, הפעולות יכללו איסוף ואצירה של **מאגרי נתונים**, ואז שימוש בהם לאימון ופריסה של **מודלים נתונים** שמנבאים תוצאות או מבצעים אוטומציה של החלטות בהקשרים של העולם האמיתי. אתגרים אתיים יכולים לנבוע מ_הטיות במאגרי נתונים_, _בעיות איכות נתונים_, וסר הוגנות_, ו_ייצוג שגוי_ באלגוריתמים - כולל כמה נושאים שהם מערכתיים בטבעם.
בעיצוב אלגוריתמים, הפעולות יכללו איסוף ואצירה של **מאגרי נתונים**, ואז שימוש בהם לאימון ופריסה של **מודלים נתונים** שמנבאים תוצאות או מבצעים אוטומציה של החלטות בהקשרים של העולם האמיתי. אתגרים אתיים יכולים לנבוע מ_הטיות במאגרי נתונים_, _בעיות איכות נתונים_, וסר הוגנות_, ו_ייצוג שגוי_ באלגוריתמים - כולל כמה בעיות שהן מערכתיות בטבען.
בשני המקרים, אתגרים אתיים מדגישים אזורים שבהם הפעולות שלנו עשויות להיתקל בקונפליקט עם הערכים המשותפים שלנו. כדי לזהות, למזער, למנוע או לבטל את החששות הללו - עלינו לשאול שאלות מוסריות "כן/לא" הקשורות לפעולותינו, ואז לנקוט צעדים מתקנים לפי הצורך. בואו נבחן כמה אתגרים אתיים והשאלות המוסריות שהם מעלים:
בשני המקרים, אתגרים אתיים מדגישים תחומים שבהם הפעולות שלנו עשויות להתנגש עם הערכים המשותפים שלנו. כדי לזהות, למזער, למנוע או לבטל את החששות הללו - עלינו לשאול שאלות מוסריות "כן/לא" הקשורות לפעולותינו, ואז לנקוט צעדים מתקנים לפי הצורך. בואו נבחן כמה אתגרים אתיים והשאלות המוסריות שהם מעלים:
#### 2.1 בעלות על נתונים
@ -87,11 +87,11 @@ CO_OP_TRANSLATOR_METADATA:
#### 2.2 הסכמה מדעת
[הסכמה מדעת](https://legaldictionary.net/informed-consent/) מגדירה את פעולת המשתמשים בהסכמה לפעולה (כמו איסוף נתונים) עם _הבנה מלאה_ של עובדות רלוונטיות כולל המטרה, הסיכונים הפוטנציאליים והחלופות.
[הסכמה מדעת](https://legaldictionary.net/informed-consent/) מגדירה את פעולת המשתמשים בהסכמה לפעולה (כמו איסוף נתונים) עם _הבנה מלאה_ של העובדות הרלוונטיות כולל המטרה, הסיכונים הפוטנציאליים והחלופות.
שאלות לחקור כאן הן:
* האם המשתמש (נושא הנתונים) נתן רשות לאיסוף ושימוש בנתונים?
* האם המשתמש הבין את המטרה שלשמה נאספו הנתונים?
* האם המשתמש (נושא הנתונים) נתן רשות ללכידת נתונים ושימוש בהם?
* האם המשתמש הבין את המטרה שלשמה הנתונים נלכדו?
* האם המשתמש הבין את הסיכונים הפוטנציאליים מהשתתפותו?
#### 2.3 קניין רוחני
@ -99,7 +99,7 @@ CO_OP_TRANSLATOR_METADATA:
[קניין רוחני](https://en.wikipedia.org/wiki/Intellectual_property) מתייחס ליצירות בלתי מוחשיות הנובעות מיוזמה אנושית, שעשויות _להיות בעלות ערך כלכלי_ לאנשים או עסקים.
שאלות לחקור כאן הן:
* האם לנתונים שנאספו יש ערך כלכלי למשתמש או לעסק?
* האם הנתונים שנאספו היו בעלי ערך כלכלי למשתמש או לעסק?
* האם ל**משתמש** יש קניין רוחני כאן?
* האם ל**ארגון** יש קניין רוחני כאן?
* אם זכויות אלו קיימות, כיצד אנו מגנים עליהן?
@ -110,9 +110,9 @@ CO_OP_TRANSLATOR_METADATA:
שאלות לחקור כאן הן:
* האם הנתונים האישיים של המשתמשים מוגנים מפני פריצות ודליפות?
* האם הנתונים של המשתמשים נגישים רק למשתמשים מורשים והקשרים מורשים?
* האם הנתונים של המשתמשים נגישים רק למשתמשים מורשים ולהקשרים מורשים?
* האם האנונימיות של המשתמשים נשמרת כאשר הנתונים משותפים או מופצים?
* האם ניתן לזהות משתמש מתוך מאגרי נתונים אנונימיים?
* האם ניתן להסיר זיהוי של משתמש ממאגרי נתונים אנונימיים?
#### 2.5 הזכות להישכח
@ -122,11 +122,11 @@ CO_OP_TRANSLATOR_METADATA:
* האם המערכת מאפשרת לנושאי נתונים לבקש מחיקה?
* האם ביטול הסכמת המשתמש צריך להפעיל מחיקה אוטומטית?
* האם נתונים נאספו ללא הסכמה או באמצעים בלתי חוקיים?
* האם אנו עומדים ברגולציות ממשלתיות לפרטיות נתונים?
* האם אנו עומדים בתקנות ממשלתיות לפרטיות נתונים?
#### 2.6 הטיות במאגרי נתונים
הטיות במאגרי נתונים או [הטיות באיסוף](http://researcharticles.com/index.php/bias-in-data-collection-in-research/) עוסקות בבחירת תת-קבוצה _לא מייצגת_ של נתונים לפיתוח אלגוריתמים, מה שיוצר פוטנציאל לחוסר הוגנות בתוצאות עבור קבוצות מגוונות. סוגי הטיות כוללים הטיית בחירה או דגימה, הטיית מתנדבים והטיית מכשירים.
הטיות במאגרי נתונים או [הטיות באיסוף](http://researcharticles.com/index.php/bias-in-data-collection-in-research/) עוסקות בבחירת תת-קבוצה _לא מייצגת_ של נתונים לפיתוח אלגוריתמים, מה שיוצר פוטנציאל לחוסר הוגנות בתוצאות עבור קבוצות מגוונות. סוגי הטיות כוללים הטיית בחירה או דגימה, הטיית מתנדבים, והטיית מכשירים.
שאלות לחקור כאן הן:
* האם גייסנו קבוצה מייצגת של נושאי נתונים?
@ -135,27 +135,25 @@ CO_OP_TRANSLATOR_METADATA:
#### 2.7 איכות נתונים
[איכות נתונים](https://lakefs.io/data-quality-testing/) בוחנת את תקפות מאגר הנתונים שנאצר לפיתוח האלגוריתמים שלנו, ובודקת אם התכונות והרשומות עומדות בדרישות לרמת דיוק ועקביות הנדרשת למטרת ה-AI שלנו.
[איכות נתונים](https://lakefs.io/data-quality-testing/) בוחנת את תקפות מאגר הנתונים שנאצר לשם פיתוח האלגוריתמים שלנו, ובודקת אם התכונות והרשומות עומדות בדרישות לרמת דיוק ועקביות הנדרשת למטרת ה-AI שלנו.
שאלות לחקור כאן הן:
* האם אספנו תכונות _תקפות_ למקרה השימוש שלנו?
* האם הנתונים נאספו _בעקביות_ ממקורות נתונים מגוונים?
* האם לכדנו תכונות _תקפות_ למקרה השימוש שלנו?
* האם נתונים נלכדו _בעקביות_ ממקורות נתונים מגוונים?
* האם מאגר הנתונים _שלם_ עבור תנאים או תרחישים מגוונים?
* האם המידע שנאסף _מדויק_ ומשקף את המציאות?
#### 2.8 הוגנות אלגוריתמים
* האם מידע שנלכד _מדויק_ ומשקף את המציאות?
[Algorithm Fairness](https://towardsdatascience.com/what-is-algorithm-fairness-3182e161cf9f) בודק האם עיצוב האלגוריתם מפלה באופן שיטתי נגד קבוצות משנה מסוימות של נבדקים, מה שמוביל ל[נזקים פוטנציאליים](https://docs.microsoft.com/en-us/azure/machine-learning/concept-fairness-ml) ב_הקצאה_ (כאשר משאבים נשללים או נמנעים מאותה קבוצה) וב_איכות השירות_ (כאשר הבינה המלאכותית אינה מדויקת באותה מידה עבור קבוצות משנה מסוימות כמו שהיא עבור אחרות).
שאלות שכדאי לבחון כאן:
* האם הערכנו את דיוק המודל עבור קבוצות משנה ותנאים מגוונים?
* האם בדקנו את המערכת לנזקים פוטנציאליים (לדוגמה, סטריאוטיפים)?
* האם ניתן לשנות נתונים או לאמן מחדש מודלים כדי להפחית נזקים שזוהו?
* האם בחנו את המערכת לנזקים פוטנציאליים (לדוגמה, סטריאוטיפים)?
* האם ניתן לשנות נתונים או לאמן מחדש מודלים כדי לצמצם נזקים שזוהו?
חקור משאבים כמו [AI Fairness checklists](https://query.prod.cms.rt.microsoft.com/cms/api/am/binary/RE4t6dA) כדי ללמוד עוד.
#### 2.9 ייצוג שגוי
[ייצוג שגוי של נתונים](https://www.sciencedirect.com/topics/computer-science/misrepresentation) עוסק בשאלה האם אנו מתקשרים תובנות מנתונים שדווחו בכנות באופן מטעה כדי לתמוך בנרטיב רצוי.
[ייצוג שגוי של נתונים](https://www.sciencedirect.com/topics/computer-science/misrepresentation) עוסק בשאלה האם אנו מעבירים תובנות מנתונים שדווחו בכנות באופן מטעה כדי לתמוך בנרטיב רצוי.
שאלות שכדאי לבחון כאן:
* האם אנו מדווחים נתונים לא שלמים או לא מדויקים?
@ -164,33 +162,33 @@ CO_OP_TRANSLATOR_METADATA:
* האם קיימות הסברים חלופיים שיכולים להציע מסקנה שונה?
#### 2.10 בחירה חופשית
[אשליית הבחירה החופשית](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice) מתרחשת כאשר "ארכיטקטורות בחירה" של מערכת משתמשות באלגוריתמים לקבלת החלטות כדי להניע אנשים לקחת תוצאה מועדפת תוך יצירת רושם שיש להם אפשרויות ושליטה. [דפוסים אפלים](https://www.darkpatterns.org/) אלו יכולים לגרום לנזקים חברתיים וכלכליים למשתמשים. מכיוון שהחלטות משתמש משפיעות על פרופילי התנהגות, פעולות אלו עשויות להניע בחירות עתידיות שיכולות להעצים או להרחיב את השפעת הנזקים הללו.
[אשליית הבחירה החופשית](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice) מתרחשת כאשר "ארכיטקטורות בחירה" של מערכות משתמשות באלגוריתמים לקבלת החלטות כדי להניע אנשים לקחת תוצאה מועדפת תוך יצירת רושם שיש להם אפשרויות ושליטה. [דפוסים אפלים](https://www.darkpatterns.org/) אלו יכולים לגרום לנזקים חברתיים וכלכליים למשתמשים. מכיוון שהחלטות משתמש משפיעות על פרופילי התנהגות, פעולות אלו עשויות להניע בחירות עתידיות שיכולות להעצים או להרחיב את השפעת הנזקים הללו.
שאלות שכדאי לבחון כאן:
* האם המשתמש הבין את ההשלכות של קבלת הבחירה הזו?
* האם המשתמש היה מודע לבחירות (חלופיות) וליתרונות וחסרונות של כל אחת?
* האם המשתמש היה מודע לבחירות (חלופיות) וליתרונות והחסרונות של כל אחת?
* האם המשתמש יכול להפוך בחירה אוטומטית או מושפעת מאוחר יותר?
### 3. מחקרי מקרה
כדי לשים את האתגרים האתיים הללו בהקשרים של העולם האמיתי, כדאי להסתכל על מחקרי מקרה שמדגישים את הנזקים וההשלכות הפוטנציאליים על יחידים וחברה, כאשר הפרות אתיות כאלה מתעלמים מהן.
כדי לשים את האתגרים האתיים הללו בהקשרים של העולם האמיתי, כדאי לבחון מחקרי מקרה שמדגישים את הנזקים וההשלכות הפוטנציאליים על יחידים וחברה, כאשר הפרות אתיות כאלה נעלמות מעינינו.
הנה כמה דוגמאות:
להלן כמה דוגמאות:
| אתגר אתי | מחקר מקרה |
|--- |--- |
| **הסכמה מדעת** | 1972 - [מחקר העגבת בטסקיגי](https://en.wikipedia.org/wiki/Tuskegee_Syphilis_Study) - גברים אפרו-אמריקאים שהשתתפו במחקר הובטחה להם טיפול רפואי חינם _אך הוטעו_ על ידי חוקרים שלא יידעו את הנבדקים על האבחנה שלהם או על זמינות הטיפול. רבים מהנבדקים מתו, ושותפים או ילדים הושפעו; המחקר נמשך 40 שנה. |
| **פרטיות נתונים** | 2007 - [פרס נתוני נטפליקס](https://www.wired.com/2007/12/why-anonymous-data-sometimes-isnt/) סיפק לחוקרים _10 מיליון דירוגי סרטים אנונימיים מ-50 אלף לקוחות_ כדי לעזור לשפר אלגוריתמי המלצות. עם זאת, חוקרים הצליחו לקשר נתונים אנונימיים לנתונים מזהים אישית ב_מאגרי נתונים חיצוניים_ (לדוגמה, תגובות IMDb) - למעשה "דה-אנונימיזציה" של חלק ממנויי נטפליקס.|
| **הטיה באיסוף נתונים** | 2013 - עיריית בוסטון [פיתחה את Street Bump](https://www.boston.gov/transportation/street-bump), אפליקציה שאפשרה לאזרחים לדווח על בורות, מה שנתן לעיר נתוני כבישים טובים יותר כדי למצוא ולתקן בעיות. עם זאת, [לאנשים בקבוצות הכנסה נמוכה הייתה פחות גישה למכוניות וטלפונים](https://hbr.org/2013/04/the-hidden-biases-in-big-data), מה שהפך את בעיות הכבישים שלהם לבלתי נראות באפליקציה זו. מפתחים עבדו עם אקדמאים כדי לטפל ב_נושאי גישה שוויונית ופערים דיגיטליים_ למען הוגנות. |
| **הוגנות אלגוריתמית** | 2018 - מחקר [Gender Shades של MIT](http://gendershades.org/overview.html) העריך את דיוק מוצרי AI לסיווג מגדר, וחשף פערים בדיוק עבור נשים ואנשים בעלי צבע עור כהה. [כרטיס האשראי של אפל](https://www.wired.com/story/the-apple-card-didnt-see-genderand-thats-the-problem/) משנת 2019 נראה שהציע פחות אשראי לנשים מאשר לגברים. שניהם הדגימו בעיות בהטיה אלגוריתמית שהובילה לנזקים חברתיים-כלכליים.|
| **ייצוג שגוי של נתונים** | 2020 - [משרד הבריאות של ג'ורג'יה פרסם גרפים של מקרי COVID-19](https://www.vox.com/covid-19-coronavirus-us-response-trump/2020/5/18/21262265/georgia-covid-19-cases-declining-reopening) שנראה כי הטעו אזרחים לגבי מגמות במקרים מאושרים עם סדר לא כרונולוגי על ציר ה-x. זה מדגים ייצוג שגוי באמצעות טריקים ויזואליים. |
| **אשליית הבחירה החופשית** | 2020 - אפליקציית הלמידה [ABCmouse שילמה 10 מיליון דולר כדי ליישב תלונה של ה-FTC](https://www.washingtonpost.com/business/2020/09/04/abcmouse-10-million-ftc-settlement/) שבה הורים נלכדו בתשלום עבור מנויים שהם לא יכלו לבטל. זה מדגים דפוסים אפלים בארכיטקטורות בחירה, שבהן משתמשים הונעו לעבר בחירות שעלולות להזיק. |
| **הסכמה מדעת** | 1972 - [מחקר העגבת בטסקיגי](https://en.wikipedia.org/wiki/Tuskegee_Syphilis_Study) - גברים אפרו-אמריקאים שהשתתפו במחקר הובטחה להם טיפול רפואי חינם _אך הוטעו_ על ידי חוקרים שלא יידעו את הנבדקים על האבחנה שלהם או על זמינות הטיפול. רבים מהנבדקים מתו, ושותפים או ילדים נפגעו; המחקר נמשך 40 שנה. |
| **פרטיות נתונים** | 2007 - [פרס נתוני נטפליקס](https://www.wired.com/2007/12/why-anonymous-data-sometimes-isnt/) סיפק לחוקרים _10 מיליון דירוגי סרטים אנונימיים מ-50 אלף לקוחות_ כדי לעזור לשפר אלגוריתמי המלצות. עם זאת, החוקרים הצליחו לקשר נתונים אנונימיים לנתונים מזהים אישית ב_מאגרי נתונים חיצוניים_ (לדוגמה, תגובות IMDb) - למעשה "דה-אנונימיזציה" של חלק ממנויי נטפליקס.|
| **הטיה באיסוף נתונים** | 2013 - עיריית בוסטון [פיתחה את Street Bump](https://www.boston.gov/transportation/street-bump), אפליקציה שאפשרה לתושבים לדווח על בורות, מה שנתן לעיר נתוני כבישים טובים יותר כדי למצוא ולתקן בעיות. עם זאת, [לאנשים בקבוצות הכנסה נמוכה הייתה פחות גישה למכוניות וטלפונים](https://hbr.org/2013/04/the-hidden-biases-in-big-data), מה שהפך את בעיות הכבישים שלהם לבלתי נראות באפליקציה זו. המפתחים עבדו עם אקדמאים כדי לטפל ב_נושאי גישה שוויונית ופערים דיגיטליים_ למען הוגנות. |
| **הוגנות אלגוריתמית** | 2018 - מחקר [Gender Shades של MIT](http://gendershades.org/overview.html) העריך את דיוק מוצרי AI לסיווג מגדר, וחשף פערים בדיוק עבור נשים ואנשים בעלי צבע עור כהה. [כרטיס האשראי של אפל ב-2019](https://www.wired.com/story/the-apple-card-didnt-see-genderand-thats-the-problem/) נראה שהציע פחות אשראי לנשים מאשר לגברים. שניהם הדגימו בעיות בהטיה אלגוריתמית שהובילה לנזקים חברתיים-כלכליים.|
| **ייצוג שגוי של נתונים** | 2020 - [משרד הבריאות של ג'ורג'יה פרסם גרפים של מקרי COVID-19](https://www.vox.com/covid-19-coronavirus-us-response-trump/2020/5/18/21262265/georgia-covid-19-cases-declining-reopening) שנראה כי הטעו את האזרחים לגבי מגמות במקרים מאושרים עם סדר לא כרונולוגי על ציר ה-x. זה מדגים ייצוג שגוי באמצעות טריקים ויזואליים. |
| **אשליית הבחירה החופשית** | 2020 - אפליקציית הלמידה [ABCmouse שילמה 10 מיליון דולר כדי ליישב תלונה של ה-FTC](https://www.washingtonpost.com/business/2020/09/04/abcmouse-10-million-ftc-settlement/) שבה הורים נלכדו בתשלום עבור מנויים שלא יכלו לבטל. זה מדגים דפוסים אפלים בארכיטקטורות בחירה, שבהן משתמשים הונעו לעבר בחירות שעלולות להזיק. |
| **פרטיות נתונים וזכויות משתמש** | 2021 - [פרצת נתונים בפייסבוק](https://www.npr.org/2021/04/09/986005820/after-data-breach-exposes-530-million-facebook-says-it-will-not-notify-users) חשפה נתונים מ-530 מיליון משתמשים, מה שהוביל להסדר של 5 מיליארד דולר עם ה-FTC. עם זאת, החברה סירבה להודיע למשתמשים על הפרצה, מה שהפר את זכויות המשתמשים בנוגע לשקיפות נתונים וגישה. |
רוצה לחקור עוד מחקרי מקרה? בדוק את המשאבים הבאים:
* [Ethics Unwrapped](https://ethicsunwrapped.utexas.edu/case-studies) - דילמות אתיות בתעשיות מגוונות.
* [קורס אתיקה במדעי הנתונים](https://www.coursera.org/learn/data-science-ethics#syllabus) - מחקרי מקרה מרכזיים נבחנים.
* [מקרים שבהם דברים השתבשו](https://deon.drivendata.org/examples/) - רשימת בדיקות של דיאון עם דוגמאות.
* [מקרים שבהם דברים השתבשו](https://deon.drivendata.org/examples/) - רשימת בדיקה של Deon עם דוגמאות.
> 🚨 חשבו על מחקרי המקרה שראיתם - האם חוויתם או הושפעתם מאתגר אתי דומה בחייכם? האם אתם יכולים לחשוב על לפחות מחקר מקרה אחד נוסף שממחיש אחד מהאתגרים האתיים שדנו בהם בסעיף זה?
@ -200,7 +198,7 @@ CO_OP_TRANSLATOR_METADATA:
### 1. קודים מקצועיים
קודים מקצועיים מציעים אפשרות אחת לארגונים "לתמרץ" חברים לתמוך בעקרונות האתיים שלהם ובהצהרת המשימה. קודים הם _הנחיות מוסריות_ להתנהגות מקצועית, שעוזרות לעובדים או חברים לקבל החלטות שמתיישרות עם עקרונות הארגון שלהם. הם טובים רק כמו הציות מרצון מצד החברים; עם זאת, ארגונים רבים מציעים תגמולים ועונשים נוספים כדי להניע ציות מצד החברים.
קודים מקצועיים מציעים אפשרות אחת לארגונים "לתמרץ" חברים לתמוך בעקרונות האתיים שלהם ובהצהרת המשימה. קודים הם _הנחיות מוסריות_ להתנהגות מקצועית, המסייעים לעובדים או חברים לקבל החלטות שמתיישרות עם עקרונות הארגון שלהם. הם טובים רק כמו הציות מרצון מצד החברים; עם זאת, ארגונים רבים מציעים תגמולים ועונשים נוספים כדי להניע ציות מצד החברים.
דוגמאות כוללות:
@ -212,12 +210,12 @@ CO_OP_TRANSLATOR_METADATA:
### 2. רשימות בדיקה אתיות
בעוד שקודים מקצועיים מגדירים _התנהגות אתית_ נדרשת מצד העוסקים בתחום, הם [מוגבלים ידועים](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md) באכיפה, במיוחד בפרויקטים רחבי היקף. במקום זאת, מומחי מדעי הנתונים רבים [ממליצים על רשימות בדיקה](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md), שיכולות **לחבר עקרונות לשיטות** בדרכים יותר דטרמיניסטיות וניתנות לפעולה.
בעוד שקודים מקצועיים מגדירים _התנהגות אתית נדרשת_ מצד העוסקים בתחום, הם [מוגבלים ידועים](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md) באכיפה, במיוחד בפרויקטים רחבי היקף. במקום זאת, מומחי מדעי הנתונים רבים [ממליצים על רשימות בדיקה](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md), שיכולות **לחבר עקרונות לשיטות** בדרכים יותר דטרמיניסטיות וניתנות לפעולה.
רשימות בדיקה ממירות שאלות למשימות "כן/לא" שניתן להפעיל, ומאפשרות לעקוב אחריהן כחלק מזרימות עבודה סטנדרטיות לשחרור מוצרים.
דוגמאות כוללות:
* [Deon](https://deon.drivendata.org/) - רשימת בדיקה כללית לאתיקה במדעי הנתונים שנוצרה מ[המלצות תעשייה](https://deon.drivendata.org/#checklist-citations) עם כלי שורת פקודה לשילוב קל.
* [Deon](https://deon.drivendata.org/) - רשימת בדיקה כללית לאתיקה במדעי הנתונים שנוצרה מתוך [המלצות תעשייה](https://deon.drivendata.org/#checklist-citations) עם כלי שורת פקודה לשילוב קל.
* [Privacy Audit Checklist](https://cyber.harvard.edu/ecommerce/privacyaudit.html) - מספקת הנחיות כלליות לשיטות טיפול במידע מנקודות מבט משפטיות וחברתיות.
* [AI Fairness Checklist](https://www.microsoft.com/en-us/research/project/ai-fairness-checklist/) - נוצרה על ידי מומחי AI כדי לתמוך באימוץ ושילוב בדיקות הוגנות במחזורי פיתוח AI.
* [22 שאלות לאתיקה במדעי הנתונים ובינה מלאכותית](https://medium.com/the-organization/22-questions-for-ethics-in-data-and-ai-efb68fd19429) - מסגרת פתוחה יותר, מובנית לחקירה ראשונית של סוגיות אתיות בעיצוב, יישום והקשרים ארגוניים.
@ -229,27 +227,26 @@ CO_OP_TRANSLATOR_METADATA:
כיום, ממשל לובש שתי צורות בתוך ארגונים. ראשית, מדובר בהגדרת עקרונות **AI אתיים** וביסוס שיטות להפעלת אימוץ בכל הפרויקטים הקשורים ל-AI בארגון. שנית, מדובר בעמידה בכל **רגולציות הגנת נתונים** שהממשלה מחייבת עבור האזורים שבהם היא פועלת.
דוגמאות לרגולציות הגנת נתונים ופרטיות:
* `1974`, [חוק הפרטיות בארה"ב](https://www.justice.gov/opcl/privacy-act-1974) - מסדיר את איסוף, השימוש והגילוי של מידע אישי על ידי _הממשלה הפדרלית_.
* `1996`, [חוק הניידות והאחריות של ביטוח בריאות בארה"ב (HIPAA)](https://www.cdc.gov/phlp/publications/topic/hipaa.html) - מגן על נתוני בריאות אישיים.
* `1998`, [חוק הגנת פרטיות ילדים באינטרנט בארה"ב (COPPA)](https://www.ftc.gov/enforcement/rules/rulemaking-regulatory-reform-proceedings/childrens-online-privacy-protection-rule) - מגן על פרטיות נתונים של ילדים מתחת לגיל 13.
* `2018`, [רגולציית הגנת נתונים כללית (GDPR)](https://gdpr-info.eu/) - מספקת זכויות משתמש, הגנת נתונים ופרטיות.
* `2018`, [חוק פרטיות הצרכן של קליפורניה (CCPA)](https://www.oag.ca.gov/privacy/ccpa) מעניק לצרכנים יותר _זכויות_ על הנתונים האישיים שלהם.
* `2021`, חוק [הגנת מידע אישי של סין](https://www.reuters.com/world/china/china-passes-new-personal-data-privacy-law-take-effect-nov-1-2021-08-20/) שנחקק לאחרונה, יוצר אחת הרגולציות החזקות ביותר לפרטיות נתונים באינטרנט בעולם.
* `2021`, חוק [הגנת מידע אישי של סין](https://www.reuters.com/world/china/china-passes-new-personal-data-privacy-law-take-effect-nov-1-2021-08-20/) עבר זה עתה, ויוצר אחת הרגולציות החזקות ביותר לפרטיות נתונים באינטרנט בעולם.
> 🚨 האיחוד האירופי הגדיר את GDPR (רגולציית הגנת נתונים כללית) שנשארת אחת הרגולציות המשפיעות ביותר לפרטיות נתונים כיום. האם ידעתם שהיא גם מגדירה [8 זכויות משתמש](https://www.freeprivacypolicy.com/blog/8-user-rights-gdpr) כדי להגן על פרטיות דיגיטלית ונתונים אישיים של אזרחים? למדו על מה הן, ולמה הן חשובות.
> 🚨 האיחוד האירופי הגדיר את GDPR (רגולציית הגנת נתונים כללית) שנשארת אחת הרגולציות המשפיעות ביותר לפרטיות נתונים כיום. האם ידעתם שהיא גם מגדירה [8 זכויות משתמש](https://www.freeprivacypolicy.com/blog/8-user-rights-gdpr) כדי להגן על פרטיות דיגיטלית ומידע אישי של אזרחים? למדו על מה הן, ולמה הן חשובות.
### 4. תרבות אתית
שימו לב שקיים פער בלתי מוחשי בין יות_ (עשיית מספיק כדי לעמוד "באות החוק") לבין טיפול ב[בעיות מערכתיות](https://www.coursera.org/learn/data-science-ethics/home/week/4) (כמו אוסיפיקציה, אסימטריה מידעית ואי-צדק חלוקתי) שיכולות להאיץ את השימוש לרעה ב-AI.
שימו לב שעדיין קיים פער בלתי מוחשי בין יות_ (עשיית מספיק כדי לעמוד "באות החוק") לבין טיפול ב[בעיות מערכתיות](https://www.coursera.org/learn/data-science-ethics/home/week/4) (כמו אוסיפיקציה, אסימטריה מידעית ואי-שוויון חלוקתי) שיכולות להאיץ את חימוש ה-AI.
האחרון דורש [גישות שיתופיות להגדרת תרבויות אתיות](https://towardsdatascience.com/why-ai-ethics-requires-a-culture-driven-approach-26f451afa29f) שבונות קשרים רגשיים וערכים משותפים עקביים ין ארגונים_ בתעשייה. זה קורא ליותר [תרבויות אתיות פורמליות](https://www.codeforamerica.org/news/formalizing-an-ethical-data-culture/) בארגונים - שמאפשרות _לכל אחד_ [למשוך את חוט אנדון](https://en.wikipedia.org/wiki/Andon_(manufacturing)) (כדי להעלות חששות אתיים מוקדם בתהליך) ועושות _הערכות אתיות_ (לדוגמה, בגיוס עובדים) קריטריון מרכזי להרכבת צוותים בפרויקטים של AI.
האחרון דורש [גישות שיתופיות להגדרת תרבויות אתיות](https://towardsdatascience.com/why-ai-ethics-requires-a-culture-driven-approach-26f451afa29f) שבונות קשרים רגשיים וערכים משותפים עקביים ין ארגונים_ בתעשייה. זה קורא ליותר [תרבויות אתיות פורמליות במדעי הנתונים](https://www.codeforamerica.org/news/formalizing-an-ethical-data-culture/) בארגונים - שמאפשרות _לכל אחד_ [למשוך את חוט האנדון](https://en.wikipedia.org/wiki/Andon_(manufacturing)) (כדי להעלות חששות אתיים מוקדם בתהליך) והופכות _הערכות אתיות_ (לדוגמה, בגיוס עובדים) לקריטריון מרכזי בהרכבת צוותים בפרויקטים של AI.
---
## [שאלון לאחר ההרצאה](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/3) 🎯
## סקירה ולימוד עצמי
## [שאלון לאחר ההרצאה](https://ff-quizzes.netlify.app/en/ds/) 🎯
## סקירה ולימוד עצמי
קורסים וספרים עוזרים להבין מושגי אתיקה מרכזיים ואתגרים, בעוד שמחקרי מקרה וכלים עוזרים עם שיטות אתיקה יישומיות בהקשרים של העולם האמיתי. הנה כמה משאבים להתחיל איתם.
קורסים וספרים עוזרים בהבנת מושגי אתיקה מרכזיים ואתגרים, בעוד שמחקרי מקרה וכלים עוזרים בשיטות אתיקה יישומיות בהקשרים של העולם האמיתי. הנה כמה משאבים להתחיל איתם:
* [Machine Learning For Beginners](https://github.com/microsoft/ML-For-Beginners/blob/main/1-Introduction/3-fairness/README.md) - שיעור על הוגנות, ממיקרוסופט.
* [עקרונות הבינה המלאכותית האחראית](https://docs.microsoft.com/en-us/learn/modules/responsible-ai-principles/) - מסלול לימוד חינמי מ-Microsoft Learn.
@ -264,4 +261,4 @@ CO_OP_TRANSLATOR_METADATA:
---
**כתב ויתור**:
מסמך זה תורגם באמצעות שירות תרגום מבוסס בינה מלאכותית [Co-op Translator](https://github.com/Azure/co-op-translator). בעוד שאנו שואפים לדיוק, יש לקחת בחשבון שתרגומים אוטומטיים עשויים להכיל שגיאות או אי-דיוקים. המסמך המקורי בשפתו המקורית נחשב למקור הסמכותי. למידע קריטי, מומלץ להשתמש בתרגום מקצועי על ידי מתרגם אנושי. איננו נושאים באחריות לכל אי-הבנה או פרשנות שגויה הנובעת משימוש בתרגום זה.
מסמך זה תורגם באמצעות שירות תרגום מבוסס בינה מלאכותית [Co-op Translator](https://github.com/Azure/co-op-translator). למרות שאנו שואפים לדיוק, יש לקחת בחשבון שתרגומים אוטומטיים עשויים להכיל שגיאות או אי דיוקים. המסמך המקורי בשפתו המקורית צריך להיחשב כמקור סמכותי. עבור מידע קריטי, מומלץ להשתמש בתרגום מקצועי על ידי אדם. איננו נושאים באחריות לאי הבנות או לפרשנויות שגויות הנובעות משימוש בתרגום זה.

@ -1,8 +1,8 @@
<!--
CO_OP_TRANSLATOR_METADATA:
{
"original_hash": "8796f41f566a0a8ebb72863a83d558ed",
"translation_date": "2025-08-24T21:23:04+00:00",
"original_hash": "3a34157cc63516eba97c89a0b2f8c3e6",
"translation_date": "2025-09-03T21:05:44+00:00",
"source_file": "1-Introduction/02-ethics/README.md",
"language_code": "hi"
}
@ -15,250 +15,253 @@ CO_OP_TRANSLATOR_METADATA:
---
हम सभी एक डेटा-प्रधान दुनिया में डेटा नागरिक हैं।
हम सभी डेटा नागरिक हैं जो एक डेटा-प्रधान दुनिया में रहते हैं।
बाजार के रुझान बताते हैं कि 2022 तक, हर 3 में से 1 बड़ी कंपनी अपना डेटा ऑनलाइन [मार्केटप्लेस और एक्सचेंज](https://www.gartner.com/smarterwithgartner/gartner-top-10-trends-in-data-and-analytics-for-2020/) के माध्यम से खरीदेगी और बेचेगी। एक **ऐप डेवलपर** के रूप में, हमारे लिए डेटा-आधारित अंतर्दृष्टि और एल्गोरिदम-आधारित स्वचालन को दैनिक उपयोगकर्ता अनुभवों में एकीकृत करना आसान और सस्ता हो जाएगा। लेकिन जैसे-जैसे एआई सर्वव्यापी होता जा रहा है, हमें यह भी समझने की आवश्यकता होगी कि बड़े पैमाने पर ऐसे एल्गोरिदम के [हथियारकरण](https://www.youtube.com/watch?v=TQHs8SA1qpk) से क्या संभावित नुकसान हो सकते हैं।
बाजार के रुझान बताते हैं कि 2022 तक, हर तीन में से एक बड़ी संस्था अपने डेटा को ऑनलाइन [मार्केटप्लेस और एक्सचेंज](https://www.gartner.com/smarterwithgartner/gartner-top-10-trends-in-data-and-analytics-for-2020/) के माध्यम से खरीद और बेच रही होगी। **ऐप डेवलपर्स** के रूप में, हमारे लिए डेटा-आधारित अंतर्दृष्टि और एल्गोरिदम-आधारित स्वचालन को दैनिक उपयोगकर्ता अनुभवों में एकीकृत करना आसान और सस्ता हो जाएगा। लेकिन जैसे-जैसे AI व्यापक होता जाएगा, हमें यह भी समझना होगा कि बड़े पैमाने पर ऐसे एल्गोरिदम के [हथियारकरण](https://www.youtube.com/watch?v=TQHs8SA1qpk) से संभावित नुकसान क्या हो सकते हैं।
रुझान यह भी बताते हैं कि हम 2025 तक [180 ज़ेटाबाइट्स](https://www.statista.com/statistics/871513/worldwide-data-created/) से अधिक डेटा बनाएंगे और उपभोग करेंगे। एक **डेटा वैज्ञानिक** के रूप में, यह हमें व्यक्तिगत डेटा तक अभूतपूर्व स्तर की पहुंच प्रदान करता है। इसका मतलब है कि हम उपयोगकर्ताओं क व्यवहारिक प्रोफाइल बना सकते हैं और निर्णय लेने को इस तरह प्रभावित कर सकते हैं कि यह [मुक्त चुनाव का भ्रम](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice) पैदा करे, जबकि उपयोगकर्ताओं को उन परिणामों की ओर धकेल सकता है जो हमें पसंद हैं। यह डेटा गोपनीयता और उपयोगकर्ता सुरक्षा पर व्यापक सवाल भी उठाता है।
रुझान यह भी संकेत देते हैं कि हम 2025 तक [180 ज़ेटाबाइट्स](https://www.statista.com/statistics/871513/worldwide-data-created/) से अधिक डेटा बनाएंगे और उपयोग करेंगे। **डेटा वैज्ञानिकों** के रूप में, यह हमें व्यक्तिगत डेटा तक अभूतपूर्व स्तर की पहुंच प्रदान करता है। इसका मतलब है कि हम उपयोगकर्ताओं क व्यवहारिक प्रोफाइल बना सकते हैं और निर्णय लेने को इस तरह प्रभावित कर सकते हैं कि यह [मुक्त िकल्प का भ्रम](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice) पैदा करे, जबकि उपयोगकर्ताओं को उन परिणामों की ओर धकेल सकता है जो हमें पसंद हैं। यह डेटा गोपनीयता और उपयोगकर्ता सुरक्षा पर व्यापक सवाल भी उठाता है।
डेटा नैतिकता अब डेटा विज्ञान और इंजीनियरिंग के लिए _आवश्यक सुरक्षा उपाय_ बन गई है, जो हमारे डेटा-आधारित कार्यों से संभावित नुकसान और अनपेक्षित परिणामों को कम करने में मदद करती है। [गार्टनर हाइप साइकिल फॉर एआई](https://www.gartner.com/smarterwithgartner/2-megatrends-dominate-the-gartner-hype-cycle-for-artificial-intelligence-2020/) डिजिटल नैतिकता, जिम्मेदार एआई, और एआई गवर्नेंस में प्रासंगिक रुझानों की पहचान करता है, जो एआई के _लोकतंत्रीकरण_ और _औद्योगिकीकरण_ जैसे बड़े मेगाट्रेंड्स के प्रमुख चालक हैं।
डेटा नैतिकता अब डेटा विज्ञान और इंजीनियरिंग के लिए _आवश्यक सुरक्षा उपाय_ बन गई है, जो हमारे डेटा-आधारित कार्यों से संभावित नुकसान और अनपेक्षित परिणामों को कम करने में मदद करती है। [गार्टनर हाइप साइकिल फॉर AI](https://www.gartner.com/smarterwithgartner/2-megatrends-dominate-the-gartner-hype-cycle-for-artificial-intelligence-2020/) डिजिटल नैतिकता, जिम्मेदार AI, और AI गवर्नेंस में प्रासंगिक रुझानों की पहचान करता है, जो AI के _लोकतंत्रीकरण_ और _औद्योगिकीकरण_ े बड़े मेगाट्रेंड्स के प्रमुख चालक हैं।
![गार्टनर का एआई के लिए हाइप साइकिल - 2020](https://images-cdn.newscred.com/Zz1mOWJhNzlkNDA2ZTMxMWViYjRiOGFiM2IyMjQ1YmMwZQ==)
![गार्टनर का AI के लिए हाइप साइकिल - 2020](https://images-cdn.newscred.com/Zz1mOWJhNzlkNDA2ZTMxMWViYjRiOGFiM2IyMjQ1YmMwZQ==)
इस पाठ में, हम डेटा नैतिकता के आकर्षक क्षेत्र का अन्वेषण करेंगे - मुख्य अवधारणाओं और चुनौतियों से लेकर केस स्टडी और एआई अवधारणाओं जैसे गवर्नेंस तक - जो डेटा और एआई के साथ काम करने वाली टीमों और संगठनों में नैतिकता की संस्कृति स्थापित करने में मदद करती हैं।
इस पाठ में, हम डेटा नैतिकता के आकर्षक क्षेत्र का अन्वेषण करेंगे - मुख्य अवधारणाओं और चुनौतियों से लेकर केस स्टडी और लागू AI अवधारणाओं जैसे गवर्नेंस तक - जो डेटा और AI के साथ काम करने वाली टीमों और संगठनों में नैतिकता की संस्कृति स्थापित करने में मदद करती हैं।
## [ाठ-पूर्व क्विज़](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/2) 🎯
## [्री-लेक्चर क्विज़](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/2) 🎯
## बुनियादी परिभाषाएँ
आइए बुनियादी शब्दावली को समझने से शुरू करें।
"नैतिकता" शब्द [ग्रीक शब्द "एथिकोस"](https://en.wikipedia.org/wiki/Ethics) (और इसकी जड़ "एथोस") से आया है, जिसका अर्थ है _चरित्र या नैतिक प्रकृति_
"नैतिकता" शब्द [ग्रीक शब्द "एथिकोस"](https://en.wikipedia.org/wiki/Ethics) (और इसका मूल "एथोस") से आया है, जिसका अर्थ है _चरित्र या नैतिक प्रकृति_
**नैतिकता** उन साझा मूल्यों और नैतिक सिद्धांतों के बारे में है जो समाज में हमारे व्यवहार को नियंत्रित करते हैं। नैतिकता कानूनों पर आधारित नहीं है, बल्कि इस बात पर आधारित है कि "सही बनाम गलत" क्या है, इसके व्यापक रूप से स्वीकृत मानदंड क्या हैं। हालांकि, नैतिक विचार कॉर्पोरेट गवर्नेंस पहलों और सरकारी नियमों को प्रभावित कर सकते हैं, जो अनुपालन के लिए अधिक प्रोत्साहन पैदा करते हैं।
**नैतिकता** हमारे समाज में व्यवहार को नियंत्रित करने वाले साझा मूल्यों और नैतिक सिद्धांतों के बारे में है। नैतिकता कानूनों पर आधारित नहीं है, बल्कि "सही बनाम गलत" के व्यापक रूप से स्वीकार किए गए मानदंडों पर आधारित है। हालांकि, नैतिक विचार कॉर्पोरेट गवर्नेंस पहलों और सरकारी नियमों को प्रभावित कर सकते हैं, जो अनुपालन के लिए अधिक प्रोत्साहन पैदा करते हैं।
**डेटा नैतिकता** नैतिकता की एक [नई शाखा](https://royalsocietypublishing.org/doi/full/10.1098/rsta.2016.0360#sec-1) है जो "_डेटा, एल्गोरिदम और संबंधित प्रथाओं_" से संबंधित नैतिक समस्याओं का अध्ययन और मूल्यांकन करती है। यहां, **"डेटा"** डेटा के निर्माण, रिकॉर्डिंग, क्यूरेशन, प्रोसेसिंग, प्रसार, साझाकरण और उपयोग से संबंधित कार्यों पर केंद्रित है, **"एल्गोरिदम"** एआई, एजेंट, मशीन लर्निंग और रोबोट पर केंद्रित है, और **"प्रथाएं"** जिम्मेदार नवाचार, प्रोग्रामिंग, हैकिंग और नैतिकता कोड जैसे विषयों पर केंद्रित हैं।
**डेटा नैतिकता** नैतिकता की एक [नई शाखा](https://royalsocietypublishing.org/doi/full/10.1098/rsta.2016.0360#sec-1) है जो "_डेटा, एल्गोरिदम और संबंधित प्रथाओं_" से संबंधित नैतिक समस्याओं का अध्ययन और मूल्यांकन करती है। यहां, **"डेटा"** डेटा के निर्माण, रिकॉर्डिंग, क्यूरेशन, प्रसंस्करण, प्रसार, साझाकरण और उपयोग से संबंधित क्रियाओं पर केंद्रित है, **"एल्गोरिदम"** AI, एजेंट, मशीन लर्निंग और रोबोट पर केंद्रित है, और **"प्रथाएं"** जिम्मेदार नवाचार, प्रोग्रामिंग, हैकिंग और नैतिकता कोड जैसे विषयों पर केंद्रित हैं।
**लागू नैतिकता** नैतिक विचारों का [व्यावहारिक अनुप्रयोग](https://en.wikipedia.org/wiki/Applied_ethics) है। यह _वास्तविक दुनिया के कार्यों, उत्पादों और प्रक्रियाओं_ के संदर्भ में नैतिक मुद्दों की सक्रिय रूप से जांच करने और यह सुनिश्चित करने के लिए सुधारात्मक उपाय करने की प्रक्रिया है कि ये हमारे परिभाषित नैतिक मूल्यों के साथ संरेखित रहें।
**लागू नैतिकता** नैतिक विचारों का [व्यावहारिक अनुप्रयोग](https://en.wikipedia.org/wiki/Applied_ethics) है। यह _वास्तविक दुनिया की क्रियाओं, उत्पादों और प्रक्रियाओं_ के संदर्भ में नैतिक मुद्दों की सक्रिय रूप से जांच करने और सुधारात्मक उपाय करने की प्रक्रिया है ताकि यह सुनिश्चित किया जा सके कि ये हमारे परिभाषित नैतिक मूल्यों के साथ संरेखित रहें।
**नैतिकता संस्कृति** [_लागू नैतिकता_ को लागू करने](https://hbr.org/2019/05/how-to-design-an-ethical-organization) के बारे में है ताकि यह सुनिश्चित किया जा सके कि हमारे नैतिक सिद्धांत और प्रथाएं पूरे संगठन में लगातार और मापनीय तरीके से अपनाई जाएं। सफल नैतिकता संस्कृतियां संगठन-व्यापी नैतिक सिद्धांतों को परिभाषित करती हैं, अनुपालन के लिए सार्थक प्रोत्साहन प्रदान करती हैं, और संगठन के हर स्तर पर वांछित व्यवहार को प्रोत्साहित और बढ़ावा देकर नैतिकता के मानदंडों को सुदृढ़ करती हैं।
**नैतिकता संस्कृति** [_लागू नैतिकता_ को लागू करने](https://hbr.org/2019/05/how-to-design-an-ethical-organization) के बारे में है ताकि यह सुनिश्चित किया जा सके कि हमारे नैतिक सिद्धांत और प्रथाएं पूरे संगठन में लगातार और स्केलेबल तरीके से अपनाई जाएं। सफल नैतिकता संस्कृतियां संगठन-व्यापी नैतिक सिद्धांतों को परिभाषित करती हैं, अनुपालन के लिए सार्थक प्रोत्साहन प्रदान करती हैं, और हर स्तर पर वांछित व्यवहार को प्रोत्साहित और बढ़ावा देकर नैतिकता मानदंडों को सुदृढ़ करती हैं।
## नैतिकता की अवधारणाएँ
इस खंड में, हम **साझा मूल्य** (सिद्धांत) और **नैतिक चुनौतियों** (समस्याओं) जैसी अवधारणाओं पर चर्चा करेंगे, और **केस स्टडी** का अन्वेषण करेंगे जो आपको वास्तविक दुनिया के संदर्भों में इन अवधारणाओं को समझने में मदद करत हैं।
इस खंड में, हम **साझा मूल्य** (सिद्धांत) और **नैतिक चुनौतियों** (समस्याएं) जैसे डेटा नैतिकता के लिए अवधारणाओं पर चर्चा करेंगे - और **केस स्टडी** का अन्वेषण करेंगे जो आपको वास्तविक दुनिया के संदर्भों में इन अवधारणाओं को समझने में मदद करत हैं।
### 1. नैतिकता के सिद्धांत
### 1. नैतिकता सिद्धांत
हर डेटा नैतिकता रणनीति _नैतिक सिद्धांतों_ को परिभाषित करने से शुरू होती है - "साझा मूल्य" जो स्वीकार्य व्यवहारों का वर्णन करते हैं और हमारे डेटा और एआई परियोजनाओं में अनुपालन कार्यों का मार्गदर्शन करते हैं। आप इन्हें व्यक्तिगत या टीम स्तर पर परिभाषित कर सकते हैं। हालांकि, अधिकांश बड़े संगठन इन्हें एक _नैतिक एआई_ मिशन स्टेटमेंट या ढांचे में परिभाषित करते हैं, जो कॉर्पोरेट स्तरों पर परिभाषित और सभी टीमों में लगातार लागू किया जाता है।
हर डेटा नैतिकता रणनीति _नैतिक सिद्धांतों_ को परिभाषित करने से शुरू होती है - "साझा मूल्य" जो स्वीकार्य व्यवहारों का वर्णन करते हैं और हमारे डेटा और AI परियोजनाओं में अनुपालन क्रियाओं का मार्गदर्शन करते हैं। आप इन्हें व्यक्तिगत या टीम स्तर पर परिभाषित कर सकते हैं। हालांकि, अधिकांश बड़े संगठन इन्हें एक _नैतिक AI_ मिशन स्टेटमेंट या फ्रेमवर्क में परिभाषित करते हैं, जो कॉर्पोरेट स्तरों पर परिभाषित होता है और सभी टीमों में लगातार लागू किया जाता है।
**उदाहरण:** माइक्रोसॉफ्ट का [जिम्मेदार एआई](https://www.microsoft.com/en-us/ai/responsible-ai) मिशन स्टेटमेंट कहता है: _"हम एआई के विकास के लिए प्रतिबद्ध हैं, जो नैतिक सिद्धांतों द्वारा संचालित है जो लोगों को प्राथमिकता देता है"_ - जो नीचे दिए गए ढांचे में 6 नैतिक सिद्धांतों की पहचान करता है:
**उदाहरण:** Microsoft का [जिम्मेदार AI](https://www.microsoft.com/en-us/ai/responsible-ai) मिशन स्टेटमेंट कहता है: _"हम AI के विकास के लिए प्रतिबद्ध हैं जो नैतिक सिद्धांतों द्वारा संचालित हो, जो लोगों को प्राथमिकता देता है"_ - नीचे दिए गए फ्रेमवर्क में 6 नैतिक सिद्धांतों की पहचान करता है:
![माइक्रोसॉफ्ट में जिम्मेदार एआई](https://docs.microsoft.com/en-gb/azure/cognitive-services/personalizer/media/ethics-and-responsible-use/ai-values-future-computed.png)
![Microsoft में जिम्मेदार AI](https://docs.microsoft.com/en-gb/azure/cognitive-services/personalizer/media/ethics-and-responsible-use/ai-values-future-computed.png)
आइए इन सिद्धांतों का संक्षेप में अन्वेषण करें। _पारदर्शिता_ और _जवाबदेही_ वे बुनियादी मूल्य हैं जिन पर अन्य सिद्धांत आधारित हैं - तो चलिए वहीं से शुरू करते हैं:
आइए इन सिद्धांतों का संक्षेप में अन्वेषण करें। _पारदर्शिता_ और _जवाबदेही_ वे मूलभूत मूल्य हैं जिन पर अन्य सिद्धांत आधारित हैं - तो आइए वहीं से शुरू करें:
* [**जवाबदेही**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) यह सुनिश्चित करती है कि डेटा और एआई संचालन के लिए अभ्यासकर्ता _जिम्मेदार_ हों और इन नैतिक सिद्धांतों का अनुपालन करें
* [**पारदर्शिता**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) यह सुनिश्चित करती है कि डेटा और एआई कार्य _समझने योग्य_ (व्याख्यात्मक) हों, उपयोगकर्ताओं को निर्णयों के पीछे "क्या और क्यों" समझाने में सक्षम बनाएं
* [**निष्पक्षता**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1%3aprimaryr6) - यह सुनिश्चित करने पर केंद्रित है कि एआई _सभी लोगों_ के साथ निष्पक्ष व्यवहार करे, डेटा और प्रणालियों में किसी भी प्रणालीगत या निहित सामाजिक-तकनीकी पूर्वाग्रह को संबोधित करे।
* [**विश्वसनीयता और सुरक्षा**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - यह सुनिश्चित करती है कि एआई _परिभाषित मूल्यों_ के साथ लगातार व्यवहार करे, संभावित नुकसान या अनपेक्षित परिणामों को कम करे।
* [**जवाबदेही**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) डेटा और AI संचालन के लिए चिकित्सकों को _जिम्मेदार_ बनाती है, और इन नैतिक सिद्धांतों के अनुपालन के लिए
* [**पारदर्शिता**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) सुनिश्चित करती है कि डेटा और AI क्रियाएं उपयोगकर्ताओं के लिए _समझने योग्य_ (व्याख्यात्मक) हों, निर्णयों के पीछे क्या और क्यों को समझाते हुए
* [**निष्पक्षता**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1%3aprimaryr6) - सुनिश्चित करती है कि AI सभी लोगों के साथ _निष्पक्षता_ से व्यवहार करे, डेटा और सिस्टम में किसी भी प्रणालीगत या निहित सामाजिक-तकनीकी पूर्वाग्रहों को संबोधित कर हुए
* [**विश्वसनीयता और सुरक्षा**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - सुनिश्चित करती है कि AI परिभाषित मूल्यों के साथ _संगतता_ से व्यवहार करे, संभावित नुकसान या अनपेक्षित परिणामों को कम कर हुए
* [**गोपनीयता और सुरक्षा**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - डेटा की उत्पत्ति को समझने और उपयोगकर्ताओं को _डेटा गोपनीयता और संबंधित सुरक्षा_ प्रदान करने के बारे में है।
* [**समावेशिता**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - यह इरादे के साथ एआई समाधान डिजाइन करने के बारे में है, उन्हें _मानव आवश्यकताओं और क्षमताओं की एक विस्तृत श्रृंखला_ को पूरा करने के लिए अनुकूलित करना
* [**समावेशिता**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - AI समाधानों को उद्देश्यपूर्ण तरीके से डिजाइन करने के बारे में है, उन्हें _व्यापक मानव आवश्यकताओं और क्षमताओं_ को पूरा करने के लिए अनुकूलित करते हुए
> 🚨 सोचें कि आपका डेटा नैतिकता मिशन स्टेटमेंट क्या हो सकता है। अन्य संगठनों के नैतिक एआई ढांचे का अन्वेषण करें - यहां [आईबीएम](https://www.ibm.com/cloud/learn/ai-ethics), [गूगल](https://ai.google/principles), और [फेसबुक](https://ai.facebook.com/blog/facebooks-five-pillars-of-responsible-ai/) के उदाहरण हैं। उनके साझा मूल्यों में क्या समानता है? ये सिद्धांत उनके एआई उत्पाद या उद्योग से कैसे संबंधित हैं?
> 🚨 सोचें कि आपका डेटा नैतिकता मिशन स्टेटमेंट क्या हो सकता है। अन्य संगठनों के नैतिक AI फ्रेमवर्क का अन्वेषण करें - यहां [IBM](https://www.ibm.com/cloud/learn/ai-ethics), [Google](https://ai.google/principles), और [Facebook](https://ai.facebook.com/blog/facebooks-five-pillars-of-responsible-ai/) के उदाहरण हैं। उनके साझा मूल्यों में क्या समानता है? ये सिद्धांत उनके AI उत्पाद या उद्योग से कैसे संबंधित हैं जिसमें वे काम करते हैं?
### 2. नैतिकता की चुनौतियाँ
### 2. नैतिकता चुनौतियाँ
एक बार जब हमने नैतिक सिद्धांतों को परिभाषित कर लिया, तो अगला कदम यह मूल्यांकन करना है कि क्या हमारे डेटा और एआई कार्य उन साझा मूल्यों के साथ संरेखित हैं। अपने कार्यों को दो श्रेणियों में सोचें: _डेटा संग्रह_ और _एल्गोरिदम डिज़ाइन_
एक बार जब हम नैतिक सिद्धांतों को परिभाषित कर लेते हैं, तो अगला कदम हमारे डेटा और AI क्रियाओं का मूल्यांकन करना है कि क्या वे उन साझा मूल्यों के साथ संरेखित हैं। अपने कार्यों को दो श्रेणियों में सोचें: _डेटा संग्रह_ और _एल्गोरिदम डिज़ाइन_
डेटा संग्रह के साथ, कार्यों में संभवतः **व्यक्तिगत डेटा** या व्यक्तिगत रूप से पहचान योग्य जानकारी (PII) शामिल होगी जो जीवित व्यक्तियों की पहचान करती है। इसमें [गैर-व्यक्तिगत डेटा की विविध वस्तुएं](https://ec.europa.eu/info/law/law-topic/data-protection/reform/what-personal-data_en) शामिल हैं जो _सामूहिक रूप से_ किसी व्यक्ति की पहचान करती हैं। नैतिक चुनौतिया _डेटा गोपनीयता_, _डेटा स्वामित्व_, और _सहमति_ और _बौद्धिक संपदा अधिकार_ जैसे संबंधित विषयों से संबंधित हो सकती हैं।
डेटा संग्रह के साथ, क्रियाएं संभवतः **व्यक्तिगत डेटा** या व्यक्तिगत रूप से पहचान योग्य जानकारी (PII) से संबंधित होंगी जो जीवित व्यक्तियों की पहचान करती है। इसमें [गैर-व्यक्तिगत डेटा की विविध वस्तुएं](https://ec.europa.eu/info/law/law-topic/data-protection/reform/what-personal-data_en) शामिल हैं जो _सामूहिक रूप से_ किसी व्यक्ति की पहचान करती हैं। नैतिक चुनौतिया _डेटा गोपनीयता_, _डेटा स्वामित्व_, और संबंधित विषयों जैसे _सूचित सहमति_ और उपयोगकर्ताओं के लिए _बौद्धिक संपदा अधिकार_ से संबंधित हो सकती हैं।
एल्गोरिदम डिज़ाइन के साथ, कार्यों में **डेटासेट** एकत्र करना और क्यूरेट करना, फिर उन्हें वास्तविक दुनिया के संदर्भों में परिणामों की भविष्यवाणी करने या निर्णयों को स्वचालित करने के लिए **डेटा मॉडल** को प्रशिक्षित और तैनात करना शामिल होगा। नैतिक चुनौतियाँ _डेटासेट पूर्वाग्रह_, _डेटा गुणवत्ता_ मुद्दों, _अन्याय_, और एल्गोरिदम में _गलत प्रस्तुति_ से उत्पन्न हो सकती हैं - जिनमें से कुछ मुद्दे प्रणालीगत प्रकृति के हो सकते हैं।
एल्गोरिदम डिज़ाइन के साथ, क्रियाएं **डेटासेट** को एकत्रित और क्यूरेट करने, फिर उन्हें **डेटा मॉडल** को प्रशिक्षित और तैनात करने के लिए उपयोग करने से संबंधित होंगी जो वास्तविक दुनिया के संदर्भों में परिणामों की भविष्यवाणी करते हैं या निर्णयों को स्वचालित करते हैं। नैतिक चुनौतियां _डेटासेट पूर्वाग्रह_, _डेटा गुणवत्ता_ मुद्दों, _असमानता_, और एल्गोरिदम में _गलत प्रस्तुति_ से उत्पन्न हो सकती हैं - जिनमें से कुछ मुद्दे प्रणालीगत प्रकृति के हो सकते हैं।
दोनों मामलों में, नैतिकता की चुनौतियाँ उन क्षेत्रों को उजागर करती हैं जहाँ हमारे कार्य हमारे साझा मूल्यों के साथ संघर्ष कर सकते हैं। इन चिंताओं का पता लगाने, कम करने, न्यूनतम करने, या समाप्त करने के लिए - हमें अपने कार्यों से संबंधित नैतिक "हां/नहीं" प्रश्न पूछने की आवश्यकता है, फिर आवश्यकतानुसार सुधारात्मक कार्रवाई करें। आइए कुछ नैतिक चुनौतियों और उनके द्वारा उठाए गए नैतिक प्रश्नों पर एक नज़र डालें:
दोनों मामलों में, नैतिकता चुनौतियां उन क्षेत्रों को उजागर करती हैं जहां हमारे कार्य हमारे साझा मूल्यों के साथ संघर्ष कर सकते हैं। इन चिंताओं का पता लगाने, कम करने, न्यूनतम करने, या समाप्त करने के लिए - हमें अपने कार्यों से संबंधित नैतिक "हां/नहीं" प्रश्न पूछने की आवश्यकता है, फिर आवश्यकतानुसार सुधारात्मक कार्रवाई करें। आइए कुछ नैतिक चुनौतियों और उनके द्वारा उठाए गए नैतिक प्रश्नों पर एक नज़र डालें:
#### 2.1 डेटा स्वामित्व
डेटा संग्रह में अक्सर व्यक्तिगत डेटा शामिल होता है जो डेटा विषयों की पहचान कर सकता है। [डेटा स्वामित्व](https://permission.io/blog/data-ownership) डेटा के निर्माण, प्रोसेसिंग, और प्रसार से संबंधित _नियंत्रण_ और [_उपयोगकर्ता अधिकारों_](https://permission.io/blog/data-ownership) के बारे में है।
डेटा संग्रह अक्सर व्यक्तिगत डेटा से संबंधित होता है जो डेटा विषयों की पहचान कर सकता है। [डेटा स्वामित्व](https://permission.io/blog/data-ownership) डेटा के निर्माण, प्रसंस्करण, और प्रसार से संबंधित _नियंत्रण_ और [_उपयोगकर्ता अधिकारों_](https://permission.io/blog/data-ownership) के बारे में है।
पूछे जाने वाले नैतिक प्रश्न:
* डेटा का स्वामी कौन है? (उपयोगकर्ता या संगठन)
हमें पूछने की नैतिक प्रश्न हैं:
* डेटा का मालिक कौन है? (उपयोगकर्ता या संगठन)
* डेटा विषयों के क्या अधिकार हैं? (जैसे: पहुंच, मिटाना, पोर्टेबिलिटी)
* संगठनों के क्या अधिकार हैं? (जैसे: दुर्भावनापूर्ण उपयोगकर्ता समीक्षाओं को सुधारना)
#### 2.2 सूचित सहमति
[सूचित सहमति](https://legaldictionary.net/informed-consent/) उपयोगकर्ताओं द्वारा किसी कार्रवाई (जैसे डेटा संग्रह) के लिए _संपूर्ण समझ_ के साथ सहमति देने की प्रक्रिया को परिभाषित करती है, जिसमें उद्देश्य, संभावित जोखिम, और विकल्प शामिल हैं।
[सूचित सहमति](https://legaldictionary.net/informed-consent/) उपयोगकर्ताओं द्वारा किसी क्रिया (जैसे डेटा संग्रह) के लिए _सभी प्रासंगिक तथ्यों_ को समझने के साथ सहमति देने की प्रक्रिया को परिभाषित करती है, जिसमें उद्देश्य, संभावित जोखिम, और विकल्प शामिल हैं।
यहाँ पूछे जाने वाले प्रश्न:
यहां पूछने के प्रश्न हैं:
* क्या उपयोगकर्ता (डेटा विषय) ने डेटा कैप्चर और उपयोग के लिए अनुमति दी?
* क्या उपयोगकर्ता ने समझा कि डेटा किस उद्देश्य से कैप्चर किया गया था?
* क्या उपयोगकर्ता ने समझा कि डेटा किस उद्देश्य के लिए कैप्चर किया गया था?
* क्या उपयोगकर्ता ने अपनी भागीदारी से संभावित जोखिमों को समझा?
#### 2.3 बौद्धिक संपदा
[बौद्धिक संपदा](https://en.wikipedia.org/wiki/Intellectual_property) मानव पहल से उत्पन्न अमूर्त रचनाओं को संदर्भित करती है, जिनका _आर्थिक मूल्य_ व्यक्तियों या व्यवसायों के लिए हो सकता है
[बौद्धिक संपदा](https://en.wikipedia.org/wiki/Intellectual_property) मानव पहल से उत्पन्न अमूर्त निर्माणों को संदर्भित करती है, जो व्यक्तियों या व्यवसायों के लिए _आर्थिक मूल्य_ रख सकते हैं
यहाँ पूछे जाने वाले प्रश्न:
यहां पूछने के प्रश्न हैं:
* क्या एकत्रित डेटा का उपयोगकर्ता या व्यवसाय के लिए आर्थिक मूल्य था?
* क्या उपयोगकर्ता के पास यहाँ बौद्धिक संपदा है?
* क्या संगठन के पास यहाँ बौद्धिक संपदा है?
* क्या यहां उपयोगकर्ता की बौद्धिक संपदा है?
* क्या यहां संगठन की बौद्धिक संपदा है?
* यदि ये अधिकार मौजूद हैं, तो हम उन्हें कैसे सुरक्षित कर रहे हैं?
#### 2.4 डेटा गोपनीयता
[डेटा गोपनीयता](https://www.northeastern.edu/graduate/blog/what-is-data-privacy/) या सूचना गोपनीयता उपयोगकर्ता गोपनीयता और व्यक्तिगत रूप से पहचान योग्य जानकारी के संबंध में उपयोगकर्ता पहचान की सुरक्षा को संदर्भित करती है।
[डेटा गोपनीयता](https://www.northeastern.edu/graduate/blog/what-is-data-privacy/) या सूचना गोपनीयता व्यक्तिगत रूप से पहचान योग्य जानकारी के संबंध में उपयोगकर्ता गोपनीयता और पहचान की सुरक्षा को संदर्भित करती है।
यहाँ पूछे जाने वाले प्रश्न:
यहां पूछने के प्रश्न हैं:
* क्या उपयोगकर्ताओं का (व्यक्तिगत) डेटा हैक और लीक से सुरक्षित है?
* क्या उपयोगकर्ताओं का डेटा केवल अधिकृत उपयोगकर्ताओं और संदर्भों तक ही सुलभ है?
* क्या उपयोगकर्ताओं का डेटा केवल अधिकृत उपयोगकर्ताओं और संदर्भों तक पहुंच योग्य है?
* क्या डेटा साझा या प्रसारित करते समय उपयोगकर्ताओं की गुमनामी संरक्षित है?
* क्या उपयोगकर्ता को गुमनाम डेटासेट से पुनः पहचाना जा सकता है?
* क्या उपयोगकर्ता को अनाम डेटासेट से पहचान से बाहर किया जा सकता है?
#### 2.5 भुलाए जाने का अधिकार
#### 2.5 भूल जाने का अधिकार
[ुलाए जाने का अधिकार](https://en.wikipedia.org/wiki/Right_to_be_forgotten) या [मिटाने का अधिकार](https://www.gdpreu.org/right-to-be-forgotten/) उपयोगकर्ताओं को अतिरिक्त व्यक्तिगत डेटा सुरक्षा प्रदान करता है। विशेष रूप से, यह उपयोगकर्ताओं को इंटरनेट खोजों और अन्य स्थानों से व्यक्तिगत डेटा को हटाने या हटाने का अनुरोध करने का अधिकार देता है, _विशिष्ट परिस्थितियों_ के तहत - उन्हें ऑनलाइन एक नई शुरुआत करने की अनुमति देता है।
[ूल जाने का अधिकार](https://en.wikipedia.org/wiki/Right_to_be_forgotten) या [मिटाने का अधिकार](https://www.gdpreu.org/right-to-be-forgotten/) उपयोगकर्ताओं को अतिरिक्त व्यक्तिगत डेटा सुरक्षा प्रदान करता है। विशेष रूप से, यह उपयोगकर्ताओं को इंटरनेट खोजों और अन्य स्थानों से व्यक्तिगत डेटा को हटाने या हटाने का अनुरोध करने का अधिकार देता है, _विशिष्ट परिस्थितियों_ के तहत - उन्हें ऑनलाइन एक नई शुरुआत की अनुमति देता है बिना उनके पिछले कार्यों को उनके खिलाफ रखा जाए
यहाँ पूछे जाने वाले प्रश्न:
यहां पूछने के प्रश्न हैं:
* क्या सिस्टम डेटा विषयों को मिटाने का अनुरोध करने की अनुमति देता है?
* क्या उपयोगकर्ता की सहमति की वापसी स्वचालित मिटाने को ट्रिगर करनी चाहिए?
* क्या उपयोगकर्ता सहमति की वापसी स्वचालित मिटाने को ट्रिगर करनी चाहिए?
* क्या डेटा बिना सहमति या अवैध तरीकों से एकत्र किया गया था?
* क्या हम डेटा गोपनीयता के लिए सरकारी नियमों का पालन कर रहे हैं?
#### 2.6 डेटासेट पूर्वाग्रह
डेटासेट या [संग्रह पूर्वाग्रह](http://researcharticles.com/index.php/bias-in-data-collection-in-research/) एक _गैर-प्रतिनिधि_ डेटा उपसमुच्चय का चयन करने के बारे में है, जो विविध समूहों के लिए परिणामों में संभावित अन्याय पैदा करता है। पूर्वाग्रह के प्रकारों में चयन या सैंपलिंग पूर्वाग्रह, स्वयंसेवक पूर्वाग्रह, और उपकरण पूर्वाग्रह शामिल हैं।
डेटासेट या [संग्रह पूर्वाग्रह](http://researcharticles.com/index.php/bias-in-data-collection-in-research/) एक _गैर-प्रतिनिधि_ डेटा उपसमुच्चय का चयन करने के बारे में है जो एल्गोरिदम विकास के लिए उपयोग किया जाता है, विविध समूहों के लिए संभावित परिणामों में असमानता पैदा करता है। पूर्वाग्रह के प्रकारों में चयन या नमूना पूर्वाग्रह, स्वयंसेवक पूर्वाग्रह, और उपकरण पूर्वाग्रह शामिल हैं।
यहाँ पूछे जाने वाले प्रश्न:
* क्या हमने डेटा विषयों का एक प्रतिनिधि सेट भर्ती किया?
* क्या हमने विभिन्न पूर्वाग्रहों के लिए अपने एकत्रित या क्यूरेटेड डेटासेट का परीक्षण किया?
* क्या हम किसी भी खोजे गए पूर्वाग्रहों को कम या हटा सकते हैं?
यहां पूछने के प्रश्न हैं:
* क्या हमने डेटा विषयों का प्रतिनिधि सेट भर्ती किया?
* क्या हमने अपने एकत्रित या क्यूरेट किए गए डेटासेट को विभिन्न पूर्वाग्रहों के लिए परीक्षण किया?
* क्या हम खोजे गए पूर्वाग्रहों को कम या हटाने में सक्षम हैं?
#### 2.7 डेटा गुणवत्ता
[डेटा गुणवत्ता](https://lakefs.io/data-quality-testing/) हमारे एल्गोरिदम को विकसित करने के लिए उपयोग किए गए क्यूरेटेड डेटासेट की वैधता को देखती है, यह जांचते हुए कि क्या विशेषताएँ और रिकॉर्ड हमारे एआई उद्देश्य के लिए आवश्यक सटीकता और स्थिरता के स्तर को पूरा करते हैं।
[डेटा गुणवत्ता](https://lakefs.io/data-quality-testing/) उस क्यूरेट किए गए डेटासेट की वैधता को देखती है जिसका उपयोग हमारे एल्गोरिदम विकसित करने के लिए किया जाता है, यह जांचते हुए कि क्या विशेषताएं और रिकॉर्ड हमारे AI उद्देश्य के लिए आवश्यक सटीकता और स्थिरता के स्तर को पूरा करते हैं।
यहाँ पूछे जाने वाले प्रश्न:
* क्या हमने अपने उपयोग के मामले के लिए वैध _विशेषताए_ कैप्चर कीं?
* क्या डेटा को विभिन्न डेटा स्रोतों में _संगत रूप से_ कैप्चर किया गया था?
यहां पूछने के प्रश्न हैं:
* क्या हमने अपने उपयोग मामले के लिए वैध _विशेषताए_ कैप्चर कीं?
* क्या डेटा विभिन्न डेटा स्रोतों में _संगतता_ से कैप्चर किया गया था?
* क्या डेटासेट विविध परिस्थितियों या परिदृश्यों के लिए _पूर्ण_ है?
* क्या जानकारी वास्तविकता को दर्शाने में _सटीक_ रूप से कैप्चर की गई है?
* क्या जानकारी वास्तविकता को दर्शाने में _सटीकता_ से कैप्चर की गई है?
#### 2.8 एल्गोरिदम निष्पक्षता
[Algorithm Fairness](https://towardsdatascience.com/what-is-algorithm-fairness-3182e161cf9f) यह जांचता है कि क्या एल्गोरिदम डिज़ाइन किसी विशेष डेटा समूह के खिलाफ व्यवस्थित रूप से भेदभाव करता है, जिससे _संसाधन आवंटन_ (जहां संसाधन उस समूह से वंचित या रोके जाते हैं) और _सेवा की गुणवत्ता_ (जहां एआई कुछ समूहों के लिए उतना सटीक नहीं है जितना कि दूसरों के लिए है) में [संभावित नुकसान](https://docs.microsoft.com/en-us/azure/machine-learning/concept-fairness-ml) हो सकते हैं।
[Algorithm Fairness](https://towardsdatascience.com/what-is-algorithm-fairness-3182e161cf9f) यह जांचता है कि क्या एल्गोरिदम डिज़ाइन व्यवस्थित रूप से डेटा विषयों के विशिष्ट उपसमूहों के खिलाफ भेदभाव करता है, जिससे _संसाधन आवंटन_ (जहां संसाधन उस समूह से इनकार या रोके जाते हैं) और _सेवा की गुणवत्ता_ (जहां एआई कुछ उपसमूहों के लिए उतना सटीक नहीं है जितना कि दूसरों के लिए) में [संभावित नुकसान](https://docs.microsoft.com/en-us/azure/machine-learning/concept-fairness-ml) हो सकते हैं।
यहां विचार करने वाले प्रश्न हैं:
* क्या हमने विभिन्न समूहों और परिस्थितियों के लिए मॉडल की सटीकता का मूल्यांकन किया?
* क्या हमने प्रणाली में संभावित नुकसान (जैसे, रूढ़िवादिता) की जांच की?
* क्या हमने विविध उपसमूहों और परिस्थितियों के लिए मॉडल की सटीकता का मूल्यांकन किया?
* क्या हमने संभावित नुकसान (जैसे, रूढ़िवादिता) के लिए सिस्टम की जांच की?
* क्या हम पहचाने गए नुकसान को कम करने के लिए डेटा को संशोधित या मॉडल को पुनः प्रशिक्षित कर सकते हैं?
[AI Fairness चेकलिस्ट्स](https://query.prod.cms.rt.microsoft.com/cms/api/am/binary/RE4t6dA) जैसे संसाधनों का अन्वेषण करें और अधिक जानें।
[AI Fairness checklists](https://query.prod.cms.rt.microsoft.com/cms/api/am/binary/RE4t6dA) जैसे संसाधनों का पता लगाएं और अधिक जानें।
#### 2.9 गलत प्रस्तुति
[डेटा की गलत प्रस्तुति](https://www.sciencedirect.com/topics/computer-science/misrepresentation) यह पूछने के बारे में है कि क्या हम ईमानदारी से रिपोर्ट किए गए डेटा से अंतर्दृष्टि को एक वांछित कथा का समर्थन करने के लिए भ्रामक तरीके से प्रस्तुत कर रहे हैं।
[Data Misrepresentation](https://www.sciencedirect.com/topics/computer-science/misrepresentation) यह पूछने के बारे में है कि क्या हम ईमानदारी से रिपोर्ट किए गए डेटा से अंतर्दृष्टि को एक वांछित कथा का समर्थन करने के लिए धोखाधड़ी तरीके से प्रस्तुत कर रहे हैं।
यहां विचार करने वाले प्रश्न हैं:
* क्या हम अधूरे या गलत डेटा की रिपोर्ट कर रहे हैं?
* क्या हम डेटा को इस तरह से विज़ुअलाइज़ कर रहे हैं जो भ्रामक निष्कर्षों की ओर ले जाता है?
* क्या हम अधूरी या गलत डेटा रिपोर्ट कर रहे हैं?
* क्या हम डेटा को इस तरह से विज़ुअलाइज़ कर रहे हैं जो भ्रामक निष्कर्षों को प्रेरित करता है?
* क्या हम परिणामों में हेरफेर करने के लिए चयनात्मक सांख्यिकीय तकनीकों का उपयोग कर रहे हैं?
* क्या वैकल्पिक व्याख्याएं हैं जो एक अलग निष्कर्ष प्रदान कर सकती हैं?
#### 2.10 स्वतंत्र विकल्प
[स्वतंत्र विकल्प का भ्रम](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice) तब होता है जब सिस्टम "चॉइस आर्किटेक्चर" निर्णय लेने वाले एल्गोरिदम का उपयोग करके लोगों को एक पसंदीदा परिणाम की ओर प्रेरित करते हैं, जबकि उन्हें विकल्प और नियंत्रण देने का आभास देते हैं। ये [डार्क पैटर्न्स](https://www.darkpatterns.org/) उपयोगकर्ताओं को सामाजिक और आर्थिक नुकसान पहुंचा सकते हैं। क्योंकि उपयोगकर्ता के निर्णय व्यवहार प्रोफाइल को प्रभावित करते हैं, ये क्रियाएं संभावित रूप से भविष्य के विकल्पों को बढ़ा सकती हैं या उनके प्रभाव को बढ़ा सकती हैं।
[स्वतंत्र विकल्प का भ्रम](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice) तब होता है जब सिस्टम "चॉइस आर्किटेक्चर" निर्णय लेने वाले एल्गोरिदम का उपयोग करके लोगों को एक पसंदीदा परिणाम लेने के लिए प्रेरित करता है, जबकि उन्हें विकल्प और नियंत्रण देने का दिखावा करता है। ये [डार्क पैटर्न्स](https://www.darkpatterns.org/) उपयोगकर्ताओं को सामाजिक और आर्थिक नुकसान पहुंचा सकते हैं। क्योंकि उपयोगकर्ता के निर्णय व्यवहार प्रोफाइल को प्रभावित करते हैं, ये क्रियाएं संभावित रूप से भविष्य के विकल्पों को चला सकती हैं जो इन नुकसानों के प्रभाव को बढ़ा या विस्तारित कर सकती हैं।
यहां विचार करने वाले प्रश्न हैं:
* क्या उपयोगकर्ता ने उस विकल्प को चुनने के परिणामों को समझा?
* क्या उपयोगकर्ता (वैकल्पिक) विकल्पों और उनके फायदे और नुकसान से अवगत था?
* क्या उपयोगकर्ता बाद में एक स्वचालित या प्रभावित विकल्प को उलट सकता है?
* क्या उपयोगकर्ता ने उस विकल्प को चुनने के निहितार्थ को समझा?
* क्या उपयोगकर्ता (वैकल्पिक) विकल्पों और प्रत्येक के फायदे और नुकसान से अवगत था?
* क्या उपयोगकर्ता स्वचालित या प्रभावित विकल्प को बाद में उलट सकता है?
### 3. केस स्टडीज
इन नैतिक चुनौतियों को वास्तविक दुनिया के संदर्भों में समझने के लिए, उन केस स्टडीज को देखना उपयोगी होता है जो व्यक्तियों और समाज पर संभावित नुकसान और परिणामों को उजागर करते हैं, जब इन नैतिक उल्लंघनों को नजरअंदाज किया जाता है।
इन नैतिक चुनौतियों को वास्तविक दुनिया के संदर्भों में रखने के लिए, यह देखना मददगार होता है कि जब इन नैतिक उल्लंघनों को नजरअंदाज किया जाता है तो व्यक्तियों और समाज पर संभावित नुकसान और परिणाम कैसे होते हैं।
यहां कुछ उदाहरण दिए गए हैं:
| नैतिक चुनौती | केस स्टडी |
|--- |--- |
| **सूचित सहमति** | 1972 - [टस्केगी सिफलिस अध्ययन](https://en.wikipedia.org/wiki/Tuskegee_Syphilis_Study) - अफ्रीकी अमेरिकी पुरुषों को अध्ययन में भाग लेने के लिए मुफ्त चिकित्सा देखभाल का वादा किया गया था, _लेकिन शोधकर्ताओं ने उन्हें उनके निदान या उपचार की उपलब्धता के बारे में सूचित नहीं किया।_ कई प्रतिभागियों की मृत्यु हो गई और उनके साथी या बच्चे प्रभावित हुए; अध्ययन 40 वर्षों तक चला। |
| **डेटा गोपनीयता** | 2007 - [नेटफ्लिक्स डेटा पुरस्कार](https://www.wired.com/2007/12/why-anonymous-data-sometimes-isnt/) ने शोधकर्ताओं को _50K ग्राहकों की 10M गुमनाम मूवी रेटिंग्स_ प्रदान कीं ताकि सिफारिश एल्गोरिदम में सुधार हो सके। हालांकि, शोधकर्ता बाहरी डेटासेट्स (जैसे IMDb टिप्पणियां) में व्यक्तिगत रूप से पहचान योग्य डेटा के साथ गुमनाम डेटा को सहसंबंधित करने में सक्षम थे - प्रभावी रूप से कुछ नेटफ्लिक्स ग्राहकों को "डी-गुमनाम" कर दिया।|
| **संग्रह पूर्वाग्रह** | 2013 - बोस्टन शहर ने [स्ट्रीट बंप](https://www.boston.gov/transportation/street-bump) विकसित किया, एक ऐप जिसने नागरिकों को गड्ढों की रिपोर्ट करने दी, जिससे शहर को बेहतर सड़क डेटा मिला। हालांकि, [कम आय वाले समूहों के लोगों के पास कारों और फोन तक कम पहुंच थी](https://hbr.org/2013/04/the-hidden-biases-in-big-data), जिससे उनके सड़क मुद्दे इस ऐप में अदृश्य हो गए। डेवलपर्स ने निष्पक्षता के लिए _समान पहुंच और डिजिटल विभाजन_ मुद्दों पर अकादमिकों के साथ काम किया। |
| **एल्गोरिदम निष्पक्षता** | 2018 - एमआईटी [जेंडर शेड्स अध्ययन](http://gendershades.org/overview.html) ने जेंडर वर्गीकरण एआई उत्पादों की सटीकता का मूल्यांकन किया, महिलाओं और रंग के लोगों के लिए सटीकता में अंतर को उजागर किया। एक [2019 एप्पल कार्ड](https://www.wired.com/story/the-apple-card-didnt-see-genderand-thats-the-problem/) ने महिलाओं को पुरुषों की तुलना में कम क्रेडिट की पेशकश की। दोनों ने सामाजिक-आर्थिक नुकसान की ओर ले जाने वाले एल्गोरिदम पूर्वाग्रह के मुद्दों को दर्शाया।|
| **डेटा की गलत प्रस्तुति** | 2020 - [जॉर्जिया डिपार्टमेंट ऑफ पब्लिक हेल्थ ने COVID-19 चार्ट जारी किए](https://www.vox.com/covid-19-coronavirus-us-response-trump/2020/5/18/21262265/georgia-covid-19-cases-declining-reopening) जो नागरिकों को पुष्टि किए गए मामलों में रुझानों के बारे में गुमराह करते हुए प्रतीत हुए, जिसमें x-अक्ष पर गैर-कालानुक्रमिक क्रम था। यह विज़ुअलाइज़ेशन ट्रिक्स के माध्यम से गलत प्रस्तुति को दर्शाता है। |
| **स्वतंत्र विकल्प का भ्रम** | 2020 - लर्निंग ऐप [ABCmouse ने FTC शिकायत को निपटाने के लिए $10M का भुगतान किया](https://www.washingtonpost.com/business/2020/09/04/abcmouse-10-million-ftc-settlement/) जहां माता-पिता को ऐसी सदस्यताओं के लिए भुगतान करने के लिए फंसा दिया गया जिसे वे रद्द नहीं कर सकते थे। यह चॉइस आर्किटेक्चर में डार्क पैटर्न्स को दर्शाता है, जहां उपयोगकर्ताओं को संभावित हानिकारक विकल्पों की ओर प्रेरित किया गया। |
| **डेटा गोपनीयता और उपयोगकर्ता अधिकार** | 2021 - फेसबुक [डेटा उल्लंघन](https://www.npr.org/2021/04/09/986005820/after-data-breach-exposes-530-million-facebook-says-it-will-not-notify-users) ने 530M उपयोगकर्ताओं का डेटा उजागर किया, जिसके परिणामस्वरूप FTC को $5B का निपटान करना पड़ा। हालांकि, इसने उपयोगकर्ताओं को उल्लंघन के बारे में सूचित करने से इनकार कर दिया, जिससे डेटा पारदर्शिता और पहुंच के आसपास उपयोगकर्ता अधिकारों का उल्लंघन हुआ। |
अधिक केस स्टडीज का अन्वेषण करना चाहते हैं? इन संसाधनों को देखें:
| **सूचित सहमति** | 1972 - [Tuskegee Syphilis Study](https://en.wikipedia.org/wiki/Tuskegee_Syphilis_Study) - अध्ययन में भाग लेने वाले अफ्रीकी अमेरिकी पुरुषों को मुफ्त चिकित्सा देखभाल का वादा किया गया था _लेकिन शोधकर्ताओं द्वारा धोखा दिया गया_, जिन्होंने विषयों को उनके निदान या उपचार की उपलब्धता के बारे में सूचित करने में विफलता की। कई विषयों की मृत्यु हो गई और उनके साथी या बच्चे प्रभावित हुए; अध्ययन 40 वर्षों तक चला। |
| **डेटा गोपनीयता** | 2007 - [Netflix data prize](https://www.wired.com/2007/12/why-anonymous-data-sometimes-isnt/) ने शोधकर्ताओं को _50K ग्राहकों से 10M गुमनाम मूवी रैंकिंग_ प्रदान की ताकि सिफारिश एल्गोरिदम में सुधार किया जा सके। हालांकि, शोधकर्ता गुमनाम डेटा को _बाहरी डेटासेट_ (जैसे, IMDb टिप्पणियां) में व्यक्तिगत पहचान योग्य डेटा के साथ सहसंबंधित करने में सक्षम थे - प्रभावी रूप से कुछ Netflix ग्राहकों को "डी-गुमनाम" कर दिया।|
| **संग्रह पूर्वाग्रह** | 2013 - बोस्टन शहर ने [Street Bump](https://www.boston.gov/transportation/street-bump) विकसित किया, एक ऐप जिसने नागरिकों को गड्ढों की रिपोर्ट करने दी, जिससे शहर को बेहतर सड़क डेटा प्राप्त हुआ। हालांकि, [कम आय वाले समूहों के लोगों के पास कारों और फोन तक कम पहुंच थी](https://hbr.org/2013/04/the-hidden-biases-in-big-data), जिससे उनके सड़क मुद्दे इस ऐप में अदृश्य हो गए। डेवलपर्स ने निष्पक्षता के लिए _समान पहुंच और डिजिटल विभाजन_ मुद्दों पर काम किया। |
| **एल्गोरिदम निष्पक्षता** | 2018 - MIT [Gender Shades Study](http://gendershades.org/overview.html) ने लिंग वर्गीकरण एआई उत्पादों की सटीकता का मूल्यांकन किया, महिलाओं और रंग के व्यक्तियों के लिए सटीकता में अंतर को उजागर किया। एक [2019 Apple Card](https://www.wired.com/story/the-apple-card-didnt-see-genderand-thats-the-problem/) ने पुरुषों की तुलना में महिलाओं को कम क्रेडिट की पेशकश की। दोनों ने एल्गोरिदम पूर्वाग्रह में मुद्दों को उजागर किया जिससे सामाजिक-आर्थिक नुकसान हुआ।|
| **डेटा गलत प्रस्तुति** | 2020 - [Georgia Department of Public Health ने COVID-19 चार्ट जारी किए](https://www.vox.com/covid-19-coronavirus-us-response-trump/2020/5/18/21262265/georgia-covid-19-cases-declining-reopening) जो पुष्टि किए गए मामलों में रुझानों के बारे में नागरिकों को गुमराह करने के लिए x-अक्ष पर गैर-कालानुक्रमिक क्रम का उपयोग करते हुए दिखाई दिए। यह विज़ुअलाइज़ेशन ट्रिक्स के माध्यम से गलत प्रस्तुति को दर्शाता है। |
| **स्वतंत्र विकल्प का भ्रम** | 2020 - लर्निंग ऐप [ABCmouse ने FTC शिकायत को निपटाने के लिए $10M का भुगतान किया](https://www.washingtonpost.com/business/2020/09/04/abcmouse-10-million-ftc-settlement/) जहां माता-पिता को ऐसी सदस्यताओं के लिए भुगतान करने के लिए मजबूर किया गया जिन्हें वे रद्द नहीं कर सकते थे। यह चॉइस आर्किटेक्चर में डार्क पैटर्न को दर्शाता है, जहां उपयोगकर्ताओं को संभावित रूप से हानिकारक विकल्पों की ओर प्रेरित किया गया। |
| **डेटा गोपनीयता और उपयोगकर्ता अधिकार** | 2021 - Facebook [Data Breach](https://www.npr.org/2021/04/09/986005820/after-data-breach-exposes-530-million-facebook-says-it-will-not-notify-users) ने 530M उपयोगकर्ताओं से डेटा उजागर किया, जिसके परिणामस्वरूप FTC को $5B का निपटान हुआ। हालांकि, इसने उपयोगकर्ताओं को उल्लंघन के बारे में सूचित करने से इनकार कर दिया, उपयोगकर्ता अधिकारों का उल्लंघन किया। |
अधिक केस स्टडीज का पता लगाना चाहते हैं? इन संसाधनों को देखें:
* [Ethics Unwrapped](https://ethicsunwrapped.utexas.edu/case-studies) - विभिन्न उद्योगों में नैतिक दुविधाएं।
* [डेटा साइंस एथिक्स कोर्स](https://www.coursera.org/learn/data-science-ethics#syllabus) - प्रमुख केस स्टडीज का अन्वेषण।
* [जहां चीजें गलत हुईं](https://deon.drivendata.org/examples/) - डिऑन चेकलिस्ट के साथ उदाहरण।
* [Data Science Ethics course](https://www.coursera.org/learn/data-science-ethics#syllabus) - प्रमुख केस स्टडीज का अन्वेषण।
* [Where things have gone wrong](https://deon.drivendata.org/examples/) - डिऑन चेकलिस्ट के साथ उदाहरण।
> 🚨 उन केस स्टडीज के बारे में सोचें जो आपने देखी हैं - क्या आपने अपने जीवन में इसी तरह की नैतिक चुनौती का अनुभव किया है या ससे प्रभावित हुए हैं? क्या आप एक और केस स्टडी के बारे में सोच सकते हैं जो इस खंड में चर्चा की गई नैतिक चुनौतियों में से एक को दर्शाता है?
> 🚨 उन केस स्टडीज के बारे में सोचें जिन्हें आपने देखा है - क्या आपने अपने जीवन में इसी तरह की नैतिक चुनौती का अनुभव किया है या ससे प्रभावित हुए हैं? क्या आप इस खंड में चर्चा की गई नैतिक चुनौतियों में से किसी एक को दर्शाने वाली कम से कम एक अन्य केस स्टडी के बारे में सोच सकते हैं?
## व्यावहारिक नैतिकता
हमने नैतिकता की अवधारणाओं, चुनौतियों और वास्तविक दुनिया के संदर्भों में केस स्टडीज के बारे में बात की। लेकिन हम अपने प्रोजेक्ट्स में नैतिक सिद्धांतों और प्रथाओं को _लागू_ करना कैसे शुरू करें? और बेहतर शासन के लिए इन प्रथाओं को _संचालित_ कैसे करें? आइए कुछ वास्तविक दुनिया के समाधानों का अन्वेषण करें:
हमने नैतिकता की अवधारणाओं, चुनौतियों और वास्तविक दुनिया के संदर्भों में केस स्टडीज के बारे में बात की। लेकिन हम अपने प्रोजेक्ट्स में नैतिक सिद्धांतों और प्रथाओं को लागू करना कैसे शुरू करें? और बेहतर शासन के लिए इन प्रथाओं को कैसे _संचालित_ करें? आइए कुछ वास्तविक दुनिया के समाधान तलाशें:
### 1. पेशेवर कोड
पेशेवर कोड संगठनों को अपने नैतिक सिद्धांतों और मिशन स्टेटमेंट का समर्थन करने के लिए सदस्यों को "प्रेरित" करने का एक विकल्प प्रदान करते हैं। कोड पेशेवर व्यवहार के लिए _नैतिक दिशानिर्देश_ हैं, जो कर्मचारियों या सदस्यों को निर्णय लेने में मदद करते हैं जो उनके संगठन के सिद्धांतों के साथ मेल खाते हैं। ये केवल सदस्यों की स्वैच्छिक अनुपालन पर निर्भर होते हैं; हालांकि, कई संगठन सदस्यों से अनुपालन को प्रेरित करने के लिए अतिरिक्त पुरस्कार और दंड प्रदान करते हैं।
पेशेवर कोड संगठनों को अपने नैतिक सिद्धांतों और मिशन स्टेटमेंट का समर्थन करने के लिए सदस्यों को "प्रोत्साहित" करने का एक विकल्प प्रदान करते हैं। कोड पेशेवर व्यवहार के लिए _नैतिक दिशानिर्देश_ हैं, जो कर्मचारियों या सदस्यों को निर्णय लेने में मदद करते हैं जो उनके संगठन के सिद्धांतों के साथ मेल खाते हैं। वे केवल सदस्यों की स्वैच्छिक अनुपालन के रूप में अच्छे हैं; हालांकि, कई संगठन सदस्यों से अनुपालन को प्रेरित करने के लिए अतिरिक्त पुरस्कार और दंड प्रदान करते हैं।
उदाहरण:
* [ऑक्सफोर्ड म्यूनिख](http://www.code-of-ethics.org/code-of-conduct/) कोड ऑफ एथिक्स
* [डेटा साइंस एसोसिएशन](http://datascienceassn.org/code-of-conduct.html) आचार संहिता (2013 में बनाया गया)
* [ACM कोड ऑफ एथिक्स एंड प्रोफेशनल कंडक्ट](https://www.acm.org/code-of-ethics) (1993 से)
उदाहरणों में शामिल हैं:
> 🚨 क्या आप किसी पेशेवर इंजीनियरिंग या डेटा साइंस संगठन के सदस्य हैं? उनके साइट का अन्वेषण करें और देखें कि क्या वे एक पेशेवर नैतिकता कोड को परिभाषित करते हैं। यह उनके नैतिक सिद्धांतों के बारे में क्या कहता है? वे सदस्यों को कोड का पालन करने के लिए कैसे "प्रेरित" कर रहे हैं?
* [Oxford Munich](http://www.code-of-ethics.org/code-of-conduct/) Code of Ethics
* [Data Science Association](http://datascienceassn.org/code-of-conduct.html) Code of Conduct (2013 में बनाया गया)
* [ACM Code of Ethics and Professional Conduct](https://www.acm.org/code-of-ethics) (1993 से)
### 2. नैतिकता चेकलिस्ट्स
> 🚨 क्या आप किसी पेशेवर इंजीनियरिंग या डेटा साइंस संगठन के सदस्य हैं? उनकी साइट का अन्वेषण करें और देखें कि क्या वे पेशेवर नैतिकता का कोड परिभाषित करते हैं। यह उनके नैतिक सिद्धांतों के बारे में क्या कहता है? वे सदस्यों को कोड का पालन करने के लिए कैसे "प्रोत्साहित" कर रहे हैं?
जबकि पेशेवर कोड चिकित्सकों से अपेक्षित _नैतिक व्यवहार_ को परिभाषित करते हैं, वे [प्रवर्तन में ज्ञात सीमाएं](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md) रखते हैं, विशेष रूप से बड़े पैमाने पर प्रोजेक्ट्स में। इसके बजाय, कई डेटा साइंस विशेषज्ञ [चेकलिस्ट्स की वकालत करते हैं](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md), जो **सिद्धांतों को प्रथाओं से जोड़ सकते हैं** अधिक निर्णायक और क्रियाशील तरीकों से।
### 2. नैतिकता चेकलिस्ट
चेकलिस्ट्स प्रश्नों को "हां/नहीं" कार्यों में परिवर्तित करते हैं जिन्हें संचालित किया जा सकता है, जिससे उन्हें मानक उत्पाद रिलीज़ वर्कफ़्लो का हिस्सा बनाया जा सकता है
जबकि पेशेवर कोड चिकित्सकों से आवश्यक _नैतिक व्यवहार_ को परिभाषित करते हैं, वे [ज्ञात सीमाएं](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md) बड़े पैमाने पर परियोजनाओं में प्रवर्तन में रखते हैं। इसके बजाय, कई डेटा साइंस विशेषज्ञ [चेकलिस्ट की वकालत करते हैं](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md), जो **सिद्धांतों को प्रथाओं से जोड़ सकते हैं** अधिक निर्धारक और क्रियाशील तरीकों से
उदाहरण:
* [डिऑन](https://deon.drivendata.org/) - [उद्योग सिफारिशों](https://deon.drivendata.org/#checklist-citations) से बनाया गया एक सामान्य-उद्देश्य डेटा नैतिकता चेकलिस्ट, जिसमें आसान एकीकरण के लिए एक कमांड-लाइन टूल है।
* [गोपनीयता ऑडिट चेकलिस्ट](https://cyber.harvard.edu/ecommerce/privacyaudit.html) - कानूनी और सामाजिक जोखिम दृष्टिकोण से सूचना प्रबंधन प्रथाओं के लिए सामान्य मार्गदर्शन प्रदान करता है।
* [एआई निष्पक्षता चेकलिस्ट](https://www.microsoft.com/en-us/research/project/ai-fairness-checklist/) - एआई विकास चक्रों में निष्पक्षता जांच को अपनाने और एकीकृत करने के लिए एआई चिकित्सकों द्वारा बनाया गया।
* [डेटा और एआई में नैतिकता के लिए 22 प्रश्न](https://medium.com/the-organization/22-questions-for-ethics-in-data-and-ai-efb68fd19429) - डिजाइन, कार्यान्वयन, और संगठनात्मक संदर्भों में नैतिक मुद्दों की प्रारंभिक खोज के लिए संरचित एक अधिक खुला ढांचा।
चेकलिस्ट प्रश्नों को "हां/नहीं" कार्यों में बदल देती हैं जिन्हें संचालित किया जा सकता है, जिससे उन्हें मानक उत्पाद रिलीज़ वर्कफ़्लो के हिस्से के रूप में ट्रैक किया जा सकता है।
उदाहरणों में शामिल हैं:
* [Deon](https://deon.drivendata.org/) - उद्योग सिफारिशों से [सामान्य-उद्देश्य डेटा नैतिकता चेकलिस्ट](https://deon.drivendata.org/#checklist-citations) एक कमांड-लाइन टूल के साथ आसान एकीकरण के लिए।
* [Privacy Audit Checklist](https://cyber.harvard.edu/ecommerce/privacyaudit.html) - कानूनी और सामाजिक जोखिम परिप्रेक्ष्य से सूचना प्रबंधन प्रथाओं के लिए सामान्य मार्गदर्शन प्रदान करता है।
* [AI Fairness Checklist](https://www.microsoft.com/en-us/research/project/ai-fairness-checklist/) - एआई विकास चक्रों में निष्पक्षता जांच को अपनाने और एकीकृत करने के लिए एआई चिकित्सकों द्वारा बनाया गया।
* [22 questions for ethics in data and AI](https://medium.com/the-organization/22-questions-for-ethics-in-data-and-ai-efb68fd19429) - अधिक खुले-समाप्त ढांचा, डिजाइन, कार्यान्वयन, और संगठनात्मक संदर्भों में नैतिक मुद्दों की प्रारंभिक खोज के लिए संरचित।
### 3. नैतिकता नियम
नैतिकता साझा मूल्यों को परिभाषित करने और _स्वेच्छा से_ सही काम करने के बारे में है। **अनुपालन** उन कानूनों का पालन करने के बारे में है जो परिभाषित किए गए हैं**शासन** व्यापक रूप से उन सभी तरीकों को कवर करता है जिनमें संगठन नैतिक सिद्धांतों को लागू करने और स्थापित कानूनों का पालन करने के लिए काम करते हैं।
नैतिकता साझा मूल्यों को परिभाषित करने और _स्वेच्छा से_ सही काम करने के बारे में है। **अनुपालन** परिभाषित कानूनों का पालन करने के बारे में है। **शासन** व्यापक रूप से उन सभी तरीकों को कवर करता है जिनमें संगठन नैतिक सिद्धांतों को लागू करने और स्थापित कानूनों का पालन करने के लिए काम करते हैं।
आज, संगठनों के भीतर शासन दो रूप लेता है। पहला, यह **नैतिक एआई** सिद्धांतों को परिभाषित करने और संगठन में सभी एआई-संबंधित परियोजनाओं में अपनाने को संचालित करने के लिए प्रथाओं को स्थापित करने के बारे में है। दूसरा, यह उन सभी सरकारी-निर्दिष्ट **डेटा संरक्षण नियमों** का पालन करने के बारे में है जिन क्षेत्रों में यह संचालित होता है।
आज, संगठनों के भीतर शासन दो रूप लेता है। पहला, यह **नैतिक एआई** सिद्धांतों को परिभाषित करने और संगठन में सभी एआई-संबंधित परियोजनाओं में अपनाने को संचालित करने क प्रथाओं को स्थापित करने के बारे में है। दूसरा, यह उन क्षेत्रों के लिए सभी सरकारी-अनिवार्य **डेटा संरक्षण नियमों** का पालन करने के बारे में है जिनमें यह संचालित होता है।
डेटा संरक्षण और गोपनीयता नियमों के उदाहरण:
* `1974`, [यूएस प्राइवेसी एक्ट](https://www.justice.gov/opcl/privacy-act-1974) - _संघीय सरकार_ द्वारा व्यक्तिगत जानकारी के संग्रह, उपयोग और प्रकटीकरण को नियंत्रित करता है।
* `1996`, [यूएस हेल्थ इंश्योरेंस पोर्टेबिलिटी एंड अकाउंटेबिलिटी एक्ट (HIPAA)](https://www.cdc.gov/phlp/publications/topic/hipaa.html) - व्यक्तिगत स्वास्थ्य डेटा की सुरक्षा करता है।
* `1998`, [यूएस चिल्ड्रन्स ऑनलाइन प्राइवेसी प्रोटेक्शन एक्ट (COPPA)](https://www.ftc.gov/enforcement/rules/rulemaking-regulatory-reform-proceedings/childrens-online-privacy-protection-rule) - 13 वर्ष से कम उम्र के बच्चों के डेटा गोपनीयता की रक्षा करता है।
* `2018`, [जनरल डेटा प्रोटेक्शन रेगुलेशन (GDPR)](https://gdpr-info.eu/) - उपयोगकर्ता अधिकार, डेटा संरक्षण और गोपनीयता प्रदान करता है।
* `2018`, [कैलिफोर्निया कंज्यूमर प्राइवेसी एक्ट (CCPA)](https://www.oag.ca.gov/privacy/ccpa) उपभोक्ताओं को उनके (व्यक्तिगत) डेटा पर अधिक _अधिकार_ देता है।
* `2021`, चीन का [पर्सनल इंफॉर्मेशन प्रोटेक्शन लॉ](https://www.reuters.com/world/china/china-passes-new-personal-data-privacy-law-take-effect-nov-1-2021-08-20/) हाल ही में पारित हुआ, जो दुनिया में सबसे मजबूत ऑनलाइन डेटा गोपनीयता नियमों में से एक है।
* `1974`, [US Privacy Act](https://www.justice.gov/opcl/privacy-act-1974) - _संघीय सरकार_ द्वारा व्यक्तिगत जानकारी के संग्रह, उपयोग और प्रकटीकरण को नियंत्रित करता है।
* `1996`, [US Health Insurance Portability & Accountability Act (HIPAA)](https://www.cdc.gov/phlp/publications/topic/hipaa.html) - व्यक्तिगत स्वास्थ्य डेटा की सुरक्षा करता है।
* `1998`, [US Children's Online Privacy Protection Act (COPPA)](https://www.ftc.gov/enforcement/rules/rulemaking-regulatory-reform-proceedings/childrens-online-privacy-protection-rule) - 13 वर्ष से कम उम्र के बच्चों के डेटा गोपनीयता की सुरक्षा करता है।
* `2018`, [General Data Protection Regulation (GDPR)](https://gdpr-info.eu/) - उपयोगकर्ता अधिकार, डेटा संरक्षण और गोपनीयता प्रदान करता है।
* `2018`, [California Consumer Privacy Act (CCPA)](https://www.oag.ca.gov/privacy/ccpa) उपभोक्ताओं को उनके (व्यक्तिगत) डेटा पर अधिक _अधिकार_ देता है।
* `2021`, चीन का [Personal Information Protection Law](https://www.reuters.com/world/china/china-passes-new-personal-data-privacy-law-take-effect-nov-1-2021-08-20/) अभी पारित हुआ, जो दुनिया में सबसे मजबूत ऑनलाइन डेटा गोपनीयता नियमों में से एक बनाता है।
> 🚨 यूरोपीय संघ द्वारा परिभाषित GDPR (जनरल डेटा प्रोटेक्शन रेगुलेशन) आज सबसे प्रभावशाली डेटा गोपनीयता नियमों में से एक है। क्या आप जानते हैं कि यह [8 उपयोगकर्ता अधिकारों](https://www.freeprivacypolicy.com/blog/8-user-rights-gdpr) को भी परिभाषित करता है ताकि नागरिकों की डिजिटल गोपनीयता और व्यक्तिगत डेटा की रक्षा की जा सके? जानें कि ये क्या हैं और क्यों महत्वपूर्ण हैं।
> 🚨 यूरोपीय संघ द्वारा परिभाषित GDPR (General Data Protection Regulation) आज सबसे प्रभावशाली डेटा गोपनीयता नियमों में से एक बना हुआ है। क्या आप जानते हैं कि यह नागरिकों की डिजिटल गोपनीयता और व्यक्तिगत डेटा की सुरक्षा के लिए [8 उपयोगकर्ता अधिकार](https://www.freeprivacypolicy.com/blog/8-user-rights-gdpr) भी परिभाषित करता है? जानें कि ये क्या हैं और क्यों महत्वपूर्ण हैं।
### 4. नैतिकता संस्कृति
ध्यान दें कि _अनुपालन_ (कानून के "शब्द" को पूरा करने के लिए पर्याप्त करना) और [सिस्टमेटिक मुद्दों](https://www.coursera.org/learn/data-science-ethics/home/week/4) (जैसे जड़ता, सूचना विषमता, और वितरणीय अन्याय) को संबोधित करने के बीच एक अमूर्त अंतर बना रहता है, जो एआई के हथियारकरण को तेज कर सकता है।
ध्यान दें कि _अनुपालन_ (कानून के "अक्षर" को पूरा करने के लिए पर्याप्त करना) और [प्रणालीगत मुद्दों](https://www.coursera.org/learn/data-science-ethics/home/week/4) (जैसे, जड़ता, सूचना विषमता, और वितरणीय अन्याय) को संबोधित करने के बीच एक अमूर्त अंतर बना हुआ है जो एआई के हथियारकरण को तेज कर सकता है।
उत्तरार्द्ध के लिए [नैतिकता संस्कृतियों को परिभाषित करने के लिए सहयोगात्मक दृष्टिकोण](https://towardsdatascience.com/why-ai-ethics-requires-a-culture-driven-approach-26f451afa29f) की आवश्यकता होती है जो उद्योग में _संगठनों_ के बीच भावनात्मक संबंध और सुसंगत साझा मूल्य बनाते हैं। यह संगठनों में अधिक [औपचारिक डेटा नैतिकता संस्कृतियों](https://www.codeforamerica.org/news/formalizing-an-ethical-data-culture/) के लिए कता है - जिससे _कोई भी_ [एंडन कॉर्ड खींच सक](https://en.wikipedia.org/wiki/Andon_(manufacturing)) (प्रक्रिया में जल्दी नैतिक चिंताओं को उठाने के लिए) और _नैतिक आकलन_ (जैसे, भर्ती में) एआई परियोजनाओं में टीम गठन का एक मुख्य मानदंड बना सके
उत्तरार्द्ध क [नैतिकता संस्कृतियों को परिभाषित करने के लिए सहयोगात्मक दृष्टिकोण](https://towardsdatascience.com/why-ai-ethics-requires-a-culture-driven-approach-26f451afa29f) की आवश्यकता होती है जो उद्योग में _संगठनों_ के बीच भावनात्मक संबंध और लगातार साझा मूल्य बनाते हैं। यह संगठनों में अधिक [औपचारिक डेटा नैतिकता संस्कृतियों](https://www.codeforamerica.org/news/formalizing-an-ethical-data-culture/) के लिए कॉल करता है - जिससे _कोई भी_ [एंडन कॉर्ड खींच सकता है](https://en.wikipedia.org/wiki/Andon_(manufacturing)) (प्रक्रिया में जल्दी नैतिक चिंताओं को उठाने के लिए) और _नैतिक आकलन_ (जैसे, भर्ती में) एआई परियोजनाओं में टीम गठन के लिए एक मुख्य मानदंड बनाता है
---
## [पोस्ट-लेक्चर क्विज़](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/3) 🎯
## [पोस्ट-व्याख्यान क्विज़](https://ff-quizzes.netlify.app/en/ds/) 🎯
## समीक्षा और स्व-अध्ययन
पाठ्यक्रम और पुस्तकें मुख्य नैतिकता अवधारणाओं और चुनौतियों को समझने में मदद करती हैं, जबकि केस स्टडीज और उपकरण वास्तविक दुनिया के संदर्भों में व्यावहारिक नैतिकता प्रथाओं में मदद करते हैं। यहां शुरू करने के लिए कुछ संसाधन दिए गए हैं:
पाठ्यक्रम और पुस्तकें मुख्य नैतिकता अवधारणाओं और चुनौतियों को समझने में मदद करती हैं, जबकि केस स्टडीज और उपकरण वास्तविक दुनिया के संदर्भों में व्यावहारिक नैतिकता प्रथाओं में मदद करते हैं। यहां शुरू करने के लिए कुछ संसाधन दिए गए हैं
* [शुरुआती के लिए मशीन लर्निंग](https://github.com/microsoft/ML-For-Beginners/blob/main/1-Introduction/
* [जिम्मेदार AI के सिद्धांत](https://docs.microsoft.com/en-us/learn/modules/responsible-ai-principles/) - Microsoft Learn से मुफ्त लर्निंग पाथ।
* [एथिक्स और डेटा साइंस](https://resources.oreilly.com/examples/0636920203964) - ओ'रेली ईबुक (एम. लुकाइड्स, एच. मेसन आदि)
* [डेटा साइंस एथिक्स](https://www.coursera.org/learn/data-science-ethics#syllabus) - मिशिगन विश्वविद्यालय का ऑनलाइन कोर्स।
* [एथिक्स अनरैप्ड](https://ethicsunwrapped.utexas.edu/case-studies) - टेक्सास विश्वविद्यालय से केस स्टडी
* [Machine Learning For Beginners](https://github.com/microsoft/ML-For-Beginners/blob/main/1-Introduction/3-fairness/README.md) - Microsoft से निष्पक्षता पर पाठ।
* [जिम्मेदार AI के सिद्धांत](https://docs.microsoft.com/en-us/learn/modules/responsible-ai-principles/) - Microsoft Learn से मुफ्त शिक्षण पथ।
* [नैतिकता और डेटा विज्ञान](https://resources.oreilly.com/examples/0636920203964) - ओ'रेली ईबुक (एम. लुकाइड्स, एच. मेसन आदि)
* [डेटा विज्ञान नैतिकता](https://www.coursera.org/learn/data-science-ethics#syllabus) - मिशिगन विश्वविद्यालय का ऑनलाइन कोर्स।
* [एथिक्स अनरैप्ड](https://ethicsunwrapped.utexas.edu/case-studies) - टेक्सास विश्वविद्यालय से केस स्टडी।
# असाइनमेंट
[डेटा एथिक्स केस स्टडी लिखें](assignment.md)
[डेटा नैतिकता पर केस स्टडी लिखें](assignment.md)
---
**अस्वीकरण**:
यह दस्तावेज़ AI अनुवाद सेवा [Co-op Translator](https://github.com/Azure/co-op-translator) का उपयोग करके अनुवादित किया गया है। जबकि हम सटीकता सुनिश्चित करने का प्रयास करते हैं, कृपया ध्यान दें कि स्वचालित अनुवाद में त्रुटियां या अशुद्धियां हो सकती हैं। मूल भाषा में उपलब्ध मूल दस्तावेज़ को आधिकारिक स्रोत माना जाना चाहिए। महत्वपूर्ण जानकारी के लिए, पेशेवर मानव अनुवाद की सिफारिश की जाती है। इस अनुवाद के उपयोग से उत्पन्न किसी भी गलतफहमी या गलत व्याख्या के लिए हम जिम्मेदार नहीं हैं।
यह दस्तावेज़ AI अनुवाद सेवा [Co-op Translator](https://github.com/Azure/co-op-translator) का उपयोग करके अनुवादित किया गया है। जबकि हम सटीकता सुनिश्चित करने का प्रयास करते हैं, कृपया ध्यान दें कि स्वचालित अनुवाद में त्रुटियां या अशुद्धियां हो सकती हैं। मूल भाषा में उपलब्ध मूल दस्तावेज़ को प्रामाणिक स्रोत माना जाना चाहिए। महत्वपूर्ण जानकारी के लिए, पेशेवर मानव अनुवाद की सिफारिश की जाती है। इस अनुवाद के उपयोग से उत्पन्न किसी भी गलतफहमी या गलत व्याख्या के लिए हम जिम्मेदार नहीं हैं।

@ -1,97 +1,97 @@
<!--
CO_OP_TRANSLATOR_METADATA:
{
"original_hash": "8796f41f566a0a8ebb72863a83d558ed",
"translation_date": "2025-08-25T16:41:17+00:00",
"original_hash": "3a34157cc63516eba97c89a0b2f8c3e6",
"translation_date": "2025-09-03T21:00:18+00:00",
"source_file": "1-Introduction/02-ethics/README.md",
"language_code": "hk"
}
-->
# 數據倫理簡介
|![ Sketchnote by [(@sketchthedocs)](https://sketchthedocs.dev) ](../../sketchnotes/02-Ethics.png)|
|![ [(@sketchthedocs)](https://sketchthedocs.dev) 繪製的手繪筆記 ](../../sketchnotes/02-Ethics.png)|
|:---:|
| 數據科學倫理 - _Sketchnote by [@nitya](https://twitter.com/nitya)_ |
| 數據科學倫理 - _由 [@nitya](https://twitter.com/nitya) 繪製的手繪筆記_ |
---
我們都是生活在數據化世界中的數據公民。
市場趨勢顯示到2022年每三家大型組織中就有一家會通過線上[市場和交易所](https://www.gartner.com/smarterwithgartner/gartner-top-10-trends-in-data-and-analytics-for-2020/)購買和出售數據。作為**應用程式開發者**,我們會發現將數據驅動的洞察力和算法驅動的自動化整合到日常用戶體驗中變得更加容易和便宜。然而,隨著人工智能的普及,我們也需要了解這些算法在大規模應用中可能引發的[武器化](https://www.youtube.com/watch?v=TQHs8SA1qpk)危害。
市場趨勢顯示到2022年每三家大型機構中就有一家會通過線上[市場和交易所](https://www.gartner.com/smarterwithgartner/gartner-top-10-trends-in-data-and-analytics-for-2020/)買賣數據。作為**應用程式開發者**,我們會發現將數據驅動的洞察力和算法驅動的自動化整合到日常用戶體驗中變得更容易且更便宜。但隨著人工智能的普及,我們也需要了解這些算法在大規模應用中可能帶來的[武器化](https://www.youtube.com/watch?v=TQHs8SA1qpk)危害。
趨勢還顯示到2025年我們將創造和消耗超過[180澤字節](https://www.statista.com/statistics/871513/worldwide-data-created/)的數據。作為**數據科學家**,這讓我們能夠前所未有地接觸到個人數據。這意味著我們可以建立用戶的行為檔案,並以某些方式影響決策,從而創造一種[自由選擇的幻覺](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice),同時可能引導用戶朝向我們偏好的結果。這也引發了關於數據隱私和用戶保護的更廣泛問題。
趨勢還顯示到2025年我們將創建和消費超過[180澤字節](https://www.statista.com/statistics/871513/worldwide-data-created/)的數據。作為**數據科學家**,這讓我們能夠以前所未有的程度訪問個人數據。這意味著我們可以建立用戶的行為檔案,並以某種方式影響決策,從而創造一種[自由選擇的假象](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice),同時可能將用戶推向我們偏好的結果。這也引發了關於數據隱私和用戶保護的更廣泛問題。
數據倫理現在是數據科學和工程的_必要防護措施_幫助我們減少數據驅動行動可能帶來的潛在危害和意外後果。[Gartner人工智能技術成熟度曲線](https://www.gartner.com/smarterwithgartner/2-megatrends-dominate-the-gartner-hype-cycle-for-artificial-intelligence-2020/)指出數字倫理、負責任的人工智能和人工智能治理是推動人工智能_民主化_和_工業化_的主要趨勢
數據倫理現在是數據科學和工程的_必要防護欄_幫助我們最大限度地減少數據驅動行為可能帶來的潛在危害和意外後果。[Gartner人工智能技術成熟度曲線](https://www.gartner.com/smarterwithgartner/2-megatrends-dominate-the-gartner-hype-cycle-for-artificial-intelligence-2020/)將數字倫理、負責任的人工智能和人工智能治理的相關趨勢確定為推動人工智能_民主化_和_工業化_這些更大趨勢的關鍵因素
![Gartner人工智能技術成熟度曲線 - 2020](https://images-cdn.newscred.com/Zz1mOWJhNzlkNDA2ZTMxMWViYjRiOGFiM2IyMjQ1YmMwZQ==)
![Gartner人工智能技術成熟度曲線 - 2020](https://images-cdn.newscred.com/Zz1mOWJhNzlkNDA2ZTMxMWViYjRiOGFiM2IyMjQ1YmMwZQ==)
在本課程中,我們將探索數據倫理這迷人的領域——從核心概念和挑戰,到案例研究和應用人工智能概念(如治理),幫助在處理數據和人工智能的團隊和組織中建立倫理文化。
在本課程中,我們將探索數據倫理這迷人的領域——從核心概念和挑戰,到案例研究和應用人工智能概念(如治理),幫助在處理數據和人工智能的團隊和組織中建立倫理文化。
## [課前測驗](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/2) 🎯
## 基本定義
讓我們先了解一些基本術語
讓我們從理解基本術語開始
「倫理」一詞源自[希臘詞「ethikos」](https://en.wikipedia.org/wiki/Ethics)及其根詞「ethos」意為_品格或道德本質_。
"倫理"一詞來自[希臘詞 "ethikos"](https://en.wikipedia.org/wiki/Ethics)(及其詞根 "ethos"意為_品格或道德本質_。
**倫理**是指在社會中指導我們行為的共同價值觀和道德原則。倫理不是基於法律,而是基於廣泛接受的「對與錯」的規範。然而,倫理考量可以影響企業治理倡議和政府法規,從而創造更多遵守的激勵措施
**倫理**是指在社會中規範我們行為的共同價值觀和道德原則。倫理不是基於法律,而是基於廣泛接受的"對與錯"的標準。然而,倫理考量可以影響公司治理舉措和政府法規,從而創造更多的合規激勵
**數據倫理**是一個[新的倫理分支](https://royalsocietypublishing.org/doi/full/10.1098/rsta.2016.0360#sec-1)研究和評估與_數據、算法及相關實踐_相關的道德問題。在這裡,**「數據」**聚焦於生成、記錄、策劃、處理、傳播、共享和使用的行動,**「算法」**聚焦於人工智能、代理、機器學習和機器人,**「實踐」**聚焦於負責任的創新、編程、黑客行為和倫理守則等主題。
**數據倫理**是一個[新的倫理分支](https://royalsocietypublishing.org/doi/full/10.1098/rsta.2016.0360#sec-1)它"研究和評估與_數據、算法及相關實踐_相關的道德問題"。其中,**"數據"**側重於與生成、記錄、管理、處理、傳播、共享和使用相關的行為,**"算法"**側重於人工智能、代理、機器學習和機器人,**"實踐"**則側重於負責任的創新、編程、黑客行為和倫理守則等主題。
**應用倫理**是[道德考量的實際應用](https://en.wikipedia.org/wiki/Applied_ethics)。它是積極調查_現實世界行動、產品和流程_中的倫理問題並採取糾正措施以確保這些行動與我們定義的倫理價值保持一致
**應用倫理**是[道德考量的實際應用](https://en.wikipedia.org/wiki/Applied_ethics)。它是積極調查_現實世界行動、產品和流程_中的倫理問題並採取糾正措施以確保這些行為與我們定義的倫理價值保持一致的過程
**倫理文化**是關於[將應用倫理_付諸實踐_](https://hbr.org/2019/05/how-to-design-an-ethical-organization),確保我們的倫理原則和實踐在整個組織中以一致且可擴展的方式被採用。成功的倫理文化會定義全組織的倫理原則,提供有意義的遵守激勵措施,並通過鼓勵和放大期望的行為來加強倫理規範。
**倫理文化**是關於[將應用倫理_付諸實踐_](https://hbr.org/2019/05/how-to-design-an-ethical-organization)確保我們的倫理原則和實踐在整個組織中以一致且可擴展的方式被採納。成功的倫理文化會定義全組織範圍內的倫理原則,提供有意義的合規激勵,並通過在組織各層級鼓勵和放大期望的行為來強化倫理規範。
## 倫理概念
在本節中,我們將討論數據倫理中的**共同價值觀**(原則)和**倫理挑戰**(問題),並探索**案例研究**,幫助你在現實世界的背景中理解這些概念。
在本節中,我們將討論**共同價值觀**(原則)和**倫理挑戰**(問題)等數據倫理概念,並通過**案例研究**幫助您在現實世界的背景中理解這些概念。
### 1. 倫理原則
每個數據倫理策略都始於定義_倫理原則_——描述可接受行為並指導數據和人工智能項目中合規行動的「共同價值觀」。你可以在個人或團隊層面定義這些原則。然而大多數大型組織會在企業層面定義並一致執行的_倫理人工智能_使命聲明或框架中概述這些原則
每個數據倫理策略都始於定義_倫理原則_——這些"共同價值觀"描述了可接受的行為並指導我們在數據和人工智能項目中的合規行動。您可以在個人或團隊層面定義這些原則。然而大多數大型組織會在公司層面定義這些原則並在所有團隊中一致執行通常以_倫理人工智能_使命聲明或框架的形式呈現
**例** 微軟的[負責任人工智能](https://www.microsoft.com/en-us/ai/responsible-ai)使命聲明寫道_「我們致力於推動以倫理原則為基礎的人工智能發展將人放在首位」_——並在以下框架中確定了六個倫理原則:
**例:** 微軟的[負責任人工智能](https://www.microsoft.com/en-us/ai/responsible-ai)使命聲明寫道_"我們致力於推動以將人放在首位的倫理原則為基礎的人工智能發展"_並在以下框架中確定了6個倫理原則:
![微軟的負責任人工智能](https://docs.microsoft.com/en-gb/azure/cognitive-services/personalizer/media/ethics-and-responsible-use/ai-values-future-computed.png)
讓我們簡要探討這些原則。_透明性_和_問責性_是其他原則的基礎價值觀,因此我們從這裡開始:
讓我們簡要探討這些原則。_透明性_和_問責性_是其他原則的基,因此我們從這裡開始:
* [**問責性**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6)使實踐者對其數據和人工智能操作以及遵守這些倫理原則負責。
* [**透明性**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6)確保數據和人工智能行動對用戶是_可理解的_可解釋的解釋決策背後的原因和內容。
* [**公平性**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1%3aprimaryr6)——確保人工智能公平_所有人_解決數據和系統中的系統性或隱性社會技術偏見。
* [**可靠性與安全性**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6)——確保人工智能以_一致性_的方式行事減少潛在危害或意外後果。
* [**隱私與安全**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6)——關注數據來源並為用戶提供_數據隱私及相關保護_。
* [**包容性**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6)——旨在有意設計人工智能解決方案並使其適應_廣泛的人類需求_和能力。
* [**問責性**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6)使從業者對其數據和人工智能操作以及對這些倫理原則的合規性負責。
* [**透明性**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6)確保數據和人工智能行為對用戶是_可理解的_可解釋的解釋決策背後的原因和內容。
* [**公平性**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1%3aprimaryr6)——確保人工智能對_所有人_公平對待,解決數據和系統中的任何系統性或隱性社會技術偏見。
* [**可靠性與安全性**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6)——確保人工智能行為與定義的價值觀_一致_最大限度地減少潛在危害或意外後果。
* [**隱私與安全**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6)——關注數據來源的理解並為用戶提供_數據隱私及相關保護_。
* [**包容性**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6)——有意設計人工智能解決方案並使其適應_廣泛的人類需求_和能力。
> 🚨 想想你的數據倫理使命聲明可能是什麼。探索其他組織的倫理人工智能框架——以下是[IBM](https://www.ibm.com/cloud/learn/ai-ethics)、[Google](https://ai.google/principles)和[Facebook](https://ai.facebook.com/blog/facebooks-five-pillars-of-responsible-ai/)的例子。他們有哪些共同的價值觀?這些原則如何與他們所運營的人工智能產品或行業相關
> 🚨 想一想您的數據倫理使命聲明可能是什麼。探索其他組織的倫理人工智能框架——這裡有來自[IBM](https://www.ibm.com/cloud/learn/ai-ethics)、[Google](https://ai.google/principles)和[Facebook](https://ai.facebook.com/blog/facebooks-five-pillars-of-responsible-ai/)的示例。它們有哪些共同的價值觀?這些原則與它們運營的人工智能產品或行業有何關聯
### 2. 倫理挑戰
一旦我們定義了倫理原則,下一步就是評估我們的數據和人工智能行動是否符合這些共同價值觀。思考你的行動可以分為兩類_數據收集_和_算法設計_。
一旦我們定義了倫理原則,下一步就是評估我們的數據和人工智能行為是否與這些共同價值觀一致。考慮您的行為可以分為兩類_數據收集_和_算法設計_。
在數據收集方面,行可能涉及**個人數據**或可識別的個人信息PII這些信息可以識別活著的個人。這包括[多樣化的非個人數據項目](https://ec.europa.eu/info/law/law-topic/data-protection/reform/what-personal-data_en)這些數據_共同_識別一個人。倫理挑戰可能涉及_數據隱私_、_數據所有權_以及相關主題如_知情同意_和_用戶的知識產權_。
在數據收集方面,行可能涉及**個人數據**或可識別的個人信息PII這些信息可以識別活著的個體,包括[多種非個人數據項目](https://ec.europa.eu/info/law/law-topic/data-protection/reform/what-personal-data_en)這些數據_集體_可以識別一個人。倫理挑戰可能涉及_數據隱私_、_數據所有權_以及相關主題如_知情同意_和_用戶的知識產權_。
在算法設計方面,行動將涉及收集和策劃**數據集**,然後使用它們來訓練和部署**數據模型**以在現實世界的背景中預測結果或自動化決策。倫理挑戰可能來自_數據集偏見_、_數據質量_問題、_不公平性_和算法中的_誤導性_包括一些系統性問題。
在算法設計方面,行為將涉及收集和管理**數據集**,然後使用它們來訓練和部署**數據模型**以在現實世界的背景中預測結果或自動化決策。倫理挑戰可能來自_數據集偏見_、_數據質量_問題、_不公平性_以及算法中的_誤導性_——包括一些系統性問題。
在這兩種情況下,倫理挑戰突出了我們的行可能與共同價值觀發生衝突的領域。為了檢測、減輕、最小化或消除這些問題,我們需要針對行動提出道德「是/否」問題,然後根據需要採取糾正措施。讓我們看看一些倫理挑戰及其引發的道德問題:
在這兩種情況下,倫理挑戰突出了我們的行可能與共同價值觀發生衝突的領域。為了檢測、減輕、最小化或消除這些問題,我們需要針對我們的行為提出道德上的"是/否"問題,然後根據需要採取糾正措施。讓我們看看一些倫理挑戰及其引發的道德問題:
#### 2.1 數據所有權
數據收集通常涉及可識別數據主體的個人數據。[數據所有權](https://permission.io/blog/data-ownership)是關於與數據的創建、處理和傳播相關的_控制_和[用戶權利](https://permission.io/blog/data-ownership)。
數據收集通常涉及可識別數據主體的個人數據。[數據所有權](https://permission.io/blog/data-ownership)關注與數據創建、處理和傳播相關的_控制_和[用戶權利](https://permission.io/blog/data-ownership)。
需要提出的道德問題包括:
* 誰擁有數據?(用戶組織)
我們需要提出的道德問題包括:
* 誰擁有數據?(用戶還是組織)
* 數據主體擁有哪些權利?(例如:訪問、刪除、可攜性)
* 組織擁有哪些權利?(例如:糾正惡意用戶評論)
#### 2.2 知情同意
[知情同意](https://legaldictionary.net/informed-consent/)指用戶在充分了解相關事實(包括目的、潛在風險和替代方案)的情況下同意某項行動(如數據收集)。
[知情同意](https://legaldictionary.net/informed-consent/)指用戶在充分了解相關事實(包括目的、潛在風險和替代方案)的情況下,同意某一行為(如數據收集)。
需要探討的問題包括:
* 用戶(數據主體)是否授權數據捕獲和使用?
* 用戶是否理解捕獲數據的目的?
* 用戶(數據主體)是否同意數據的收集和使用?
* 用戶是否理解數據收集的目的?
* 用戶是否理解參與可能帶來的潛在風險?
#### 2.3 知識產權
@ -100,159 +100,159 @@ CO_OP_TRANSLATOR_METADATA:
需要探討的問題包括:
* 收集的數據是否對用戶或企業具有經濟價值?
* **用戶**是否擁有知識產權?
* **組織**是否擁有知識產權?
* 如果存在這些權利,我們如何保護它們?
* **用戶**是否擁有這裡的知識產權?
* **組織**是否擁有這裡的知識產權?
* 如果這些權利存在,我們如何保護它們?
#### 2.4 數據隱私
[數據隱私](https://www.northeastern.edu/graduate/blog/what-is-data-privacy/)或信息隱私指保護用戶隱私和身份,尤其是與可識別個人信息相關的部分
[數據隱私](https://www.northeastern.edu/graduate/blog/what-is-data-privacy/)或信息隱私指保護用戶隱私和身份,特別是與可識別個人信息相關的隱私
需要探討的問題包括:
* 用戶的(個人)數據是否防止黑客攻擊和洩漏
* 用戶的數據是否僅限授權用戶和情境訪問?
* 用戶的匿名性是否在數據共享或傳播時得到保護?
* 用戶的(個人)數據是否安全,防止黑客攻擊和洩露
* 用戶的數據是否僅限於授權用戶和上下文訪問?
* 在數據共享或傳播時,用戶的匿名性是否得到保護?
* 用戶是否可以從匿名數據集中被重新識別?
#### 2.5 被遺忘
#### 2.5 被遺忘權
[被遺忘](https://en.wikipedia.org/wiki/Right_to_be_forgotten)或[刪除權](https://www.gdpreu.org/right-to-be-forgotten/)為用戶提供額外的個人數據保護。具體而言,它賦予用戶在特定情況下要求刪除或移除個人數據的權利,允許他們在網上重新開始,而不受過去行為的影響。
[被遺忘權](https://en.wikipedia.org/wiki/Right_to_be_forgotten)或[刪除權](https://www.gdpreu.org/right-to-be-forgotten/)為用戶提供額外的個人數據保護。具體來說它允許用戶在_特定情況下_請求從互聯網搜索和其他位置刪除或移除個人數據讓他們能夠在線上重新開始而不會因過去的行為受到影響。
需要探討的問題包括:
* 系統是否允許數據主體請求刪除?
* 系統是否允許數據主體請求刪除數據
* 用戶撤回同意是否應觸發自動刪除?
* 是否在未經同意或非法手段收集的數據
* 數據是否在未經同意或非法手段收集?
* 我們是否符合政府對數據隱私的法規?
#### 2.6 數據集偏見
數據集或[收集偏見](http://researcharticles.com/index.php/bias-in-data-collection-in-research/)指選擇_非代表性_的數據子集進行算法開發,可能導致不同群體結果不公平。偏見類型包括選擇或抽樣偏見、志願者偏見和工具偏見。
數據集或[收集偏見](http://researcharticles.com/index.php/bias-in-data-collection-in-research/)指為算法開發選擇_非代表性_的數據子集可能導致不同群體結果不公平。偏見類型包括選擇或抽樣偏見、志願者偏見和工具偏見。
需要探討的問題包括:
* 我們是否招募了代表性數據主體?
* 我們是否測試了收集或策劃的數據集以檢測各種偏見?
* 我們是否能減輕或消除發現的偏見?
* 我們是否招募了具有代表性的一組數據主體?
* 我們是否測試了收集或管理的數據集中的各種偏見?
* 我們是否可以減輕或消除發現的任何偏見?
#### 2.7 數據質量
[數據質量](https://lakefs.io/data-quality-testing/)檢查用於開發算法的策劃數據集的有效性,確保特徵和記錄符合人工智能目的所需的準確性和一致性要求。
[數據質量](https://lakefs.io/data-quality-testing/)檢查用於開發算法的數據集的有效性,確保特徵和記錄符合我們人工智能目的所需的準確性和一致性要求。
需要探討的問題包括:
* 我們是否捕獲了適合我們用例的有效_特徵_
* 數據是否在不同數據源中_一致地_捕獲
* 數據集是否_完整_涵蓋多樣化的條件或場景?
* 捕獲的信息是否_準確_反映了現實
* 數據是否在不同數據源中_一致地_捕獲
* 數據集是否_完整_涵蓋不同條件或場景?
* 捕獲的信息是否_準確_反映了現實?
#### 2.8 算法公平性
[算法公平性](https://towardsdatascience.com/what-is-algorithm-fairness-3182e161cf9f) 是檢查算法設計是否系統性地對特定數據群體進行歧視從而導致在資源分配_allocation_即資源被拒絕或剝奪和服務質量_quality of service_即人工智能對某些群體的準確性不如對其他群體)方面的[潛在傷害](https://docs.microsoft.com/en-us/azure/machine-learning/concept-fairness-ml)。
[算法公平性](https://towardsdatascience.com/what-is-algorithm-fairness-3182e161cf9f)旨在檢查算法設計是否系統性地對特定數據主體的子群體造成歧視,導致在資源分配(即資源被拒絕或扣留)和服務質量(即人工智能對某些子群體的準確性低於其他群體)方面的[潛在傷害](https://docs.microsoft.com/en-us/azure/machine-learning/concept-fairness-ml)。
需要探討的問題包括
* 我們是否評估了模型在不同群體和條件下的準確性?
* 我們是否仔細檢查了系統可能帶來的傷害(例如,刻板印象)?
以下是需要探討的問題:
* 我們是否評估了模型在不同群體和條件下的準確性?
* 我們是否仔細檢查了系統可能造成的傷害(例如刻板印象)?
* 我們是否可以修正數據或重新訓練模型以減輕已識別的傷害?
探索像 [AI 公平性檢查清單](https://query.prod.cms.rt.microsoft.com/cms/api/am/binary/RE4t6dA) 這樣的資源以了解更多。
探索像[人工智能公平性檢查清單](https://query.prod.cms.rt.microsoft.com/cms/api/am/binary/RE4t6dA)這樣的資源以了解更多。
#### 2.9 錯誤呈現
[數據錯誤呈現](https://www.sciencedirect.com/topics/computer-science/misrepresentation) 是指我們是否以欺騙性的方式傳達來自誠實報告數據的洞察,以支持某種期望的敘述。
[數據錯誤呈現](https://www.sciencedirect.com/topics/computer-science/misrepresentation)是指我們是否以欺騙的方式傳達從誠實報告的數據中得出的洞察,以支持某種期望的敘述。
需要探討的問題包括
以下是需要探討的問題:
* 我們是否報告了不完整或不準確的數據?
* 我們是否以誤導性的方式可視化數據,從而得出錯誤結論
* 我們是否使用選擇性的統計技術來操結果?
* 是否存在其他可能提供不同結論的解釋?
* 我們是否以誤導性結論的方式可視化數據?
* 我們是否使用選擇性的統計技術來操結果?
* 是否存在可能提供不同結論的替代解釋?
#### 2.10 自由選擇
[自由選擇的假象](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice) 是指系統的“選擇架構”使用決策算法來引導人們選擇某種偏好的結果,同時表面上給予他們選擇和控制的權利。這些[黑暗模式](https://www.darkpatterns.org/)可能對用戶造成社會和經濟上的傷害。由於用戶的決策會影響行為檔案,這些行為可能進一步驅動未來的選擇,從而放大或延續這些傷害的影響。
[自由選擇的假象](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice)發生在系統的“選擇架構”使用決策算法引導人們選擇偏好的結果,同時看似給予他們選擇和控制的權利。這些[黑暗模式](https://www.darkpatterns.org/)可能對用戶造成社會和經濟上的傷害。由於用戶的決策會影響行為檔案,這些行動可能驅動未來的選擇,進一步放大或延伸這些傷害的影響。
需要探討的問題包括
以下是需要探討的問題:
* 用戶是否理解做出該選擇的影響?
* 用戶是否了解(替代)選擇及其各自的優缺點
* 用戶是否可以在事後撤銷自動化或受影響的選擇?
* 用戶是否了解(替代)選擇及其各自的利弊
* 用戶是否可以在後期逆轉自動化或受影響的選擇?
### 3. 案例研究
將這些倫理挑戰放在現實世界的背景中,研究案例有助於了解當忽視這些倫理問題時,對個人和社會可能造成的傷害和後果。
為了將這些倫理挑戰放在現實世界的背景中,我們可以查看一些案例研究,這些研究突出了當忽視這些倫理問題時,對個人和社會可能造成的傷害和後果。
以下是一些例子:
| 倫理挑戰 | 案例研究 |
|--- |--- |
| **知情同意** | 1972年 - [塔斯基吉梅毒研究](https://en.wikipedia.org/wiki/Tuskegee_Syphilis_Study) - 參與研究的非裔美國男性被承諾提供免費醫療服務,但研究人員欺騙他們,未告知其診斷或治療的可用性。許多受試者因此死亡,其伴侶或子女受到影響;研究持續了40年。 |
| **數據隱私** | 2007年 - [Netflix數據獎](https://www.wired.com/2007/12/why-anonymous-data-sometimes-isnt/) 向研究人員提供了_50000名用戶的1000萬條匿名電影評分_改進推薦算法。然而研究人員能夠將匿名數據與外部數據集例如IMDb評論中的個人身份數據相關聯實際上“去匿名化”了一些Netflix用戶。|
| **數據收集偏差** | 2013年 - 波士頓市[開發了Street Bump](https://www.boston.gov/transportation/street-bump),一款讓市民報告坑洞的應用,幫助城市獲取更好的道路數據以解決問題。然而,[低收入群體的人更少擁有汽車和手機](https://hbr.org/2013/04/the-hidden-biases-in-big-data),使得他們的道路問題在該應用中不可見。開發者與學者合作解決_公平性和數字鴻溝_問題 |
| **算法公平性** | 2018年 - MIT [Gender Shades研究](http://gendershades.org/overview.html) 評估了性別分類AI產品的準確性,揭示了對女性和有色人種準確性不足的問題。一個[2019年Apple Card](https://www.wired.com/story/the-apple-card-didnt-see-genderand-thats-the-problem/) 似乎給女性提供的信用額度低於男性。這兩個案例都說明了算法偏差導致的社會經濟傷害問題。|
| **數據錯誤呈現** | 2020年 - [喬治亞州公共衛生部發布COVID-19圖表](https://www.vox.com/covid-19-coronavirus-us-response-trump/2020/5/18/21262265/georgia-covid-19-cases-declining-reopening) 似乎通過非時間順序的x軸排序誤導公眾對確診病例趨勢的理解。這說明了通過可視化技巧進行錯誤呈現。 |
| **自由選擇的假象** | 2020年 - 學習應用[ABCmouse支付了1000萬美元以解決FTC投訴](https://www.washingtonpost.com/business/2020/09/04/abcmouse-10-million-ftc-settlement/),家長被迫支付無法取消的訂閱費用。這說明了選擇架構中的黑暗模式,導致用戶做出潛在有害的選擇。 |
| **數據隱私與用戶權利** | 2021年 - Facebook [數據洩露](https://www.npr.org/2021/04/09/986005820/after-data-breach-exposes-530-million-facebook-says-it-will-not-notify-users) 導致5.3億用戶數據洩露最終支付了50億美元的和解金給FTC。然而它拒絕通知用戶洩露事件違反了用戶對數據透明性和訪問的權利。 |
了解更多案例研究?查看以下資源:
* [Ethics Unwrapped](https://ethicsunwrapped.utexas.edu/case-studies) - 涵蓋多個行業的倫理困境。
| **知情同意** | 1972年 - [塔斯基吉梅毒研究](https://en.wikipedia.org/wiki/Tuskegee_Syphilis_Study) - 參與研究的非裔美國男性被承諾提供免費醫療服務,但研究人員欺騙他們未告知其診斷或治療的可用性。許多受試者死亡其伴侶或子女受到影響研究持續了40年。 |
| **數據隱私** | 2007年 - [Netflix數據獎](https://www.wired.com/2007/12/why-anonymous-data-sometimes-isnt/)向研究人員提供了_50,000名客戶的1,000萬匿名電影評分_以幫助改進推薦算法。然而研究人員能夠將匿名數據與外部數據集例如IMDb評論中的個人身份數據相關聯實際上“去匿名化”了一些Netflix訂閱者。|
| **收集偏差** | 2013年 - 波士頓市[開發了Street Bump](https://www.boston.gov/transportation/street-bump),一款讓市民報告路面坑洞的應用程序,幫助城市獲得更好的道路數據以發現和修復問題。然而,[低收入群體的人們較少擁有汽車和手機](https://hbr.org/2013/04/the-hidden-biases-in-big-data),使得他們的道路問題在該應用中不可見。開發者與學者合作解決公平性問題例如_公平訪問和數字鴻溝_。|
| **算法公平性** | 2018年 - MIT [Gender Shades研究](http://gendershades.org/overview.html)評估了性別分類人工智能產品的準確性,揭示了對女性和有色人種準確性不足的問題。一個[2019年Apple Card](https://www.wired.com/story/the-apple-card-didnt-see-genderand-thats-the-problem/)似乎給女性提供的信用額度低於男性。這兩個案例都說明了算法偏差導致的社會經濟傷害問題。|
| **數據錯誤呈現** | 2020年 - [喬治亞州公共衛生部發布COVID-19圖表](https://www.vox.com/covid-19-coronavirus-us-response-trump/2020/5/18/21262265/georgia-covid-19-cases-declining-reopening)圖表似乎通過非時間順序的x軸誤導公民關於確診病例趨勢的理解。這說明了通過可視化技巧進行錯誤呈現的問題。|
| **自由選擇的假象** | 2020年 - 學習應用程序[ABCmouse支付了1000萬美元以解決FTC投訴](https://www.washingtonpost.com/business/2020/09/04/abcmouse-10-million-ftc-settlement/),家長被困於無法取消的訂閱中。這說明了選擇架構中的黑暗模式,導致用戶被引導做出可能有害的選擇。|
| **數據隱私與用戶權利** | 2021年 - Facebook [數據洩露](https://www.npr.org/2021/04/09/986005820/after-data-breach-exposes-530-million-facebook-says-it-will-not-notify-users)洩露了5.3億用戶的數據導致向FTC支付了50億美元的和解金。然而它拒絕通知用戶洩露事件違反了用戶關於數據透明性和訪問的權利。|
探索更多案例研究?查看以下資源:
* [Ethics Unwrapped](https://ethicsunwrapped.utexas.edu/case-studies) - 涉及多個行業的倫理困境。
* [數據科學倫理課程](https://www.coursera.org/learn/data-science-ethics#syllabus) - 探討標誌性案例研究。
* [問題出在哪裡](https://deon.drivendata.org/examples/) - Deon清單中的案例示例。
* [問題出在哪裡](https://deon.drivendata.org/examples/) - Deon清單中的示例。
> 🚨 想想你見過的案例研究——你是否曾經遇到過或受到過類似倫理挑戰的影響?你能想到至少一個其他案例來說明我們在本節中討論的倫理挑戰嗎?
> 🚨 回想你看到的案例研究——你是否曾經遇到或受到類似倫理挑戰的影響?你能想到至少一個其他案例研究來說明我們在本節中討論的倫理挑戰嗎?
## 應用倫理
我們已經討論了倫理概念、挑戰以及現實世界中的案例研究。但我們如何開始在項目中_應用_倫理原則和實踐我們又如何_實現_這些實踐以改進治理讓我們來探討一些現實世界的解決方案:
我們已經討論了倫理概念、挑戰以及現實世界中的案例研究。但我們如何開始在項目中_應用_倫理原則和實踐以及如何_實現_這些實踐以改善治理讓我們探索一些現實世界的解決方案:
### 1. 專業守則
專業守則為組織提供了一種選擇通過“激勵”成員支持其倫理原則和使命聲明。守則是專業行為的_道德指導方針_幫助員工或成員做出符合組織原則的決策。它的有效性取決於成員的自願遵守然而許多組織提供額外的獎勵和懲罰來激勵成員遵守。
專業守則為組織提供了一種選擇通過“激勵”成員支持其倫理原則和使命聲明。守則是專業行為的_道德指南_幫助員工或成員做出符合其組織原則的決策。守則的效力取決於成員的自願遵守然而許多組織提供額外的獎勵和懲罰以激勵成員遵守。
示例包括:
* [Oxford Munich](http://www.code-of-ethics.org/code-of-conduct/) 倫理守則
* [數據科學協會](http://datascienceassn.org/code-of-conduct.html) 行為守則創建於2013年
* [ACM倫理與專業行為守則](https://www.acm.org/code-of-ethics)自1993年起
* [Oxford Munich](http://www.code-of-ethics.org/code-of-conduct/)倫理守則
* [數據科學協會](http://datascienceassn.org/code-of-conduct.html)行為守則創建於2013年
* [ACM倫理守則與專業行為守則](https://www.acm.org/code-of-ethics)自1993年起
> 🚨 你是否屬於某個專業工程或數據科學組織?探索他們的網站,看看是否定義了專業倫理守則。這些守則說明了他們的倫理原則嗎?他們如何“激勵”成員遵守守則?
> 🚨 你是否屬於某個專業工程或數據科學組織?探索其網站,看看是否定義了專業倫理守則。這些守則說明了哪些倫理原則?他們如何“激勵”成員遵守守則?
### 2. 倫理檢查清單
雖然專業守則定義了從業者所需的_倫理行為_但它們在執行方面[存在已知的局限性](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md),特別是在大規模項目中。因此,許多數據科學專家[提倡使用檢查清單](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md)這些清單可以將原則與實踐**聯繫起來**,以更具決定性和可操作的方式
雖然專業守則定義了從業者所需的_倫理行為_但它們在執行方面[存在已知的局限性](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md),特別是在大規模項目中。因此,許多數據科學專家[提倡使用檢查清單](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md)以**將原則與實踐**更具決定性和可操作性地聯繫起來
檢查清單將問題轉化為“是/否”任務,可以被操作化,並作為標準產品發布工作流程的一部分進行跟蹤。
檢查清單將問題轉化為“是/否”任務,可以實現操作化,並允許它們作為標準產品發布工作流程的一部分進行跟蹤。
示例包括:
* [Deon](https://deon.drivendata.org/) - 一個通用的數據倫理檢查清單,基於[行業建議](https://deon.drivendata.org/#checklist-citations)創建,並提供命令行工具以便於集成。
* [隱私審核清單](https://cyber.harvard.edu/ecommerce/privacyaudit.html) - 從法律和社會曝光的角度提供信息處理實踐的一般指導。
* [AI公平性檢查清單](https://www.microsoft.com/en-us/research/project/ai-fairness-checklist/) - 由AI從業者創建用於支持公平性檢查的採用和集成到AI開發週期中。
* [數據與AI倫理的22個問題](https://medium.com/the-organization/22-questions-for-ethics-in-data-and-ai-efb68fd19429) - 更開放的框架,結構化用於設計、實施和組織背景下倫理問題初步探索。
* [Deon](https://deon.drivendata.org/) - 一個通用數據倫理檢查清單,由[行業建議](https://deon.drivendata.org/#checklist-citations)創建,並提供命令行工具以便於集成。
* [隱私審核檢查清單](https://cyber.harvard.edu/ecommerce/privacyaudit.html) - 從法律和社會暴露的角度提供信息處理實踐的一般指導。
* [人工智能公平性檢查清單](https://www.microsoft.com/en-us/research/project/ai-fairness-checklist/) - 由人工智能從業者創建,以支持公平性檢查的採用和集成到人工智能開發周期中。
* [數據與人工智能倫理的22個問題](https://medium.com/the-organization/22-questions-for-ethics-in-data-and-ai-efb68fd19429) - 更開放的框架,結構化用於設計、實施和組織背景下倫理問題初步探索。
### 3. 倫理法規
倫理是關於定義共同價值觀並_自願_做正確的事情。**合規**是指在法律規定的情況下_遵守法律_。**治理**則廣泛涵蓋了組織運營中執行倫理原則和遵守既定法律的所有方式。
倫理是關於定義共享價值並自願做正確的事情。**合規**是指在有法律規定的情況下_遵守法律_。**治理**則涵蓋了組織為執行倫理原則和遵守既定法律所採取的所有方式。
今,治理在組織內部有兩種形式。首先,它是關於定義**倫理AI**原則並建立實踐以在組織內的所有AI相關項目中實現採用。其次它是關於遵守其運營地區的所有政府規定的**數據保護法規**
,治理在組織內部有兩種形式。首先,它是關於定義**倫理人工智能**原則並建立實踐以實現所有與人工智能相關的項目中的採用。其次,它是關於遵守所有政府規定的**數據保護法規**,以適應其運營的地區
數據保護和隱私法規的示例:
* `1974年`[美國隱私法案](https://www.justice.gov/opcl/privacy-act-1974) - 規範_聯邦政府_對個人信息的收集、使用和披露。
* `1996年`[美國健康保險攜帶與責任法案HIPAA](https://www.cdc.gov/phlp/publications/topic/hipaa.html) - 保護個人健康數據。
* `1974年`[美國隱私法案](https://www.justice.gov/opcl/privacy-act-1974) - 規範_聯邦政府_收集、使用和披露個人信息
* `1996年`[美國健康保險流通與責任法案HIPAA](https://www.cdc.gov/phlp/publications/topic/hipaa.html) - 保護個人健康數據。
* `1998年`[美國兒童在線隱私保護法案COPPA](https://www.ftc.gov/enforcement/rules/rulemaking-regulatory-reform-proceedings/childrens-online-privacy-protection-rule) - 保護13歲以下兒童的數據隱私。
* `2018年`[通用數據保護條例GDPR](https://gdpr-info.eu/) - 提供用戶權利、數據保護和隱私。
* `2018年`[通用數據保護法規GDPR](https://gdpr-info.eu/) - 提供用戶權利、數據保護和隱私。
* `2018年`[加州消費者隱私法案CCPA](https://www.oag.ca.gov/privacy/ccpa) - 賦予消費者更多對其個人數據的_權利_。
* `2021年`,中國[個人信息保護法](https://www.reuters.com/world/china/china-passes-new-personal-data-privacy-law-take-effect-nov-1-2021-08-20/) 剛剛通過,成為全球最強的在線數據隱私法規之一。
* `2021年`,中國[個人信息保護法](https://www.reuters.com/world/china/china-passes-new-personal-data-privacy-law-take-effect-nov-1-2021-08-20/)剛剛通過,創造了全球最強的在線數據隱私法規之一。
> 🚨 歐盟定義的GDPR通用數據保護條例)仍然是當今最具影響力的數據隱私法規之一。你知道它還定義了[8項用戶權利](https://www.freeprivacypolicy.com/blog/8-user-rights-gdpr)保護公民的數字隱私和個人數據嗎?了解這些權利是什麼以及它們為什麼重要。
> 🚨 歐盟定義的GDPR通用數據保護法規)仍然是今天最具影響力的數據隱私法規之一。你知道它還定義了[8項用戶權利](https://www.freeprivacypolicy.com/blog/8-user-rights-gdpr)保護公民的數字隱私和個人數據嗎?了解這些權利是什麼以及它們為什麼重要。
### 4. 倫理文化
需要注意的是_合規_僅僅滿足“法律條文”的要求)與解決[系統性問題](https://www.coursera.org/learn/data-science-ethics/home/week/4)(如僵化、信息不對稱和分配不公平)之間仍然存在無形的差距,而這些問題可能加速AI的武器化。
注意_合規_僅僅滿足“法律的字面要求)與解決[系統性問題](https://www.coursera.org/learn/data-science-ethics/home/week/4)如僵化、信息不對稱和分配不公平)之間仍然存在無形的差距,這些問題可能加速人工智能的武器化。
後者需要[協作方式來定義倫理文化](https://towardsdatascience.com/why-ai-ethics-requires-a-culture-driven-approach-26f451afa29f),以在行業內部建立情感聯繫和一致的共同價值觀。這需要在組織內部[正式化數據倫理文化](https://www.codeforamerica.org/news/formalizing-an-ethical-data-culture/)——允許_任何人_ [拉動安燈繩](https://en.wikipedia.org/wiki/Andon_(manufacturing))在過程早期提出倫理問題並將_倫理評估_例如在招聘中作為AI項目團隊組建的核心標準。
後者需要[協作方式來定義倫理文化](https://towardsdatascience.com/why-ai-ethics-requires-a-culture-driven-approach-26f451afa29f),以在行業內建立情感聯繫和一致的共享價值。這需要在組織內部建立更[正式化的數據倫理文化](https://www.codeforamerica.org/news/formalizing-an-ethical-data-culture)允許_任何人_在過程早期[拉動Andon繩](https://en.wikipedia.org/wiki/Andon_(manufacturing))提出倫理問題並將_倫理評估_例如在招聘中)作為人工智能項目團隊組建的核心標準。
---
## [課後測驗](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/3) 🎯
## 回顧與自學
## [課後測驗](https://ff-quizzes.netlify.app/en/ds/) 🎯
## 回顧與自學
課程和書籍有助於理解核心倫理概念和挑戰,而案例研究和工具則有助於在現實世界中應用倫理實踐。以下是一些入門資源
課程和書籍有助於理解核心倫理概念和挑戰,而案例研究和工具則有助於在現實世界中應用倫理實踐。以下是一些入門資源
* [機器學習初學者](https://github.com/microsoft/ML-For-Beginners/blob/main/1-Introduction/3-fairness/README.md) - 來自Microsoft的公平性課程。
* [機器學習入門](https://github.com/microsoft/ML-For-Beginners/blob/main/1-Introduction/3-fairness/README.md) - 來自Microsoft的公平性課程。
* [負責任人工智能的原則](https://docs.microsoft.com/en-us/learn/modules/responsible-ai-principles/) - Microsoft Learn 提供的免費學習路徑。
* [倫理與數據科學](https://resources.oreilly.com/examples/0636920203964) - O'Reilly 電子書 (M. Loukides, H. Mason 等人著)
* [數據科學倫理](https://www.coursera.org/learn/data-science-ethics#syllabus) - 密歇根大學提供的線上課程。
@ -260,7 +260,9 @@ CO_OP_TRANSLATOR_METADATA:
# 作業
[撰寫一個數據倫理案例研究](assignment.md)
[撰寫一篇數據倫理案例研究](assignment.md)
---
**免責聲明**
本文件已使用人工智能翻譯服務 [Co-op Translator](https://github.com/Azure/co-op-translator) 進行翻譯。儘管我們致力於提供準確的翻譯,請注意自動翻譯可能包含錯誤或不準確之處。原始文件的母語版本應被視為權威來源。對於重要信息,建議使用專業人工翻譯。我們對因使用此翻譯而引起的任何誤解或錯誤解釋概不負責。
本文件已使用人工智能翻譯服務 [Co-op Translator](https://github.com/Azure/co-op-translator) 進行翻譯。儘管我們致力於提供準確的翻譯,請注意自動翻譯可能包含錯誤或不準確之處。原始語言的文件應被視為權威來源。對於重要信息,建議使用專業人工翻譯。我們對因使用此翻譯而引起的任何誤解或錯誤解釋概不負責。

@ -1,31 +1,31 @@
<!--
CO_OP_TRANSLATOR_METADATA:
{
"original_hash": "8796f41f566a0a8ebb72863a83d558ed",
"translation_date": "2025-08-30T19:40:18+00:00",
"original_hash": "3a34157cc63516eba97c89a0b2f8c3e6",
"translation_date": "2025-09-03T21:53:36+00:00",
"source_file": "1-Introduction/02-ethics/README.md",
"language_code": "hr"
}
-->
# Uvod u etiku podataka
|![ Sketchnote od [(@sketchthedocs)](https://sketchthedocs.dev) ](../../sketchnotes/02-Ethics.png)|
|![ Sketchnote by [(@sketchthedocs)](https://sketchthedocs.dev) ](../../sketchnotes/02-Ethics.png)|
|:---:|
| Etika znanosti o podacima - _Sketchnote od [@nitya](https://twitter.com/nitya)_ |
| Etika u znanosti o podacima - _Sketchnote by [@nitya](https://twitter.com/nitya)_ |
---
Svi smo mi građani podataka koji živimo u svijetu prepunom podataka.
Tržišni trendovi pokazuju da će do 2022. godine 1 od 3 velike organizacije kupovati i prodavati svoje podatke putem online [tržnica i razmjena](https://www.gartner.com/smarterwithgartner/gartner-top-10-trends-in-data-and-analytics-for-2020/). Kao **razvijatelji aplikacija**, lakše ćemo i jeftinije integrirati uvide temeljene na podacima i automatizaciju vođenu algoritmima u svakodnevna korisnička iskustva. No, kako umjetna inteligencija (AI) postaje sveprisutna, morat ćemo razumjeti i potencijalne štete uzrokovane [oružavanjem](https://www.youtube.com/watch?v=TQHs8SA1qpk) takvih algoritama u velikim razmjerima.
Tržišni trendovi pokazuju da će do 2022. godine jedna od tri velike organizacije kupovati i prodavati svoje podatke putem online [tržnica i burzi](https://www.gartner.com/smarterwithgartner/gartner-top-10-trends-in-data-and-analytics-for-2020/). Kao **razvijatelji aplikacija**, bit će nam lakše i jeftinije integrirati uvide temeljene na podacima i automatizaciju vođenu algoritmima u svakodnevna korisnička iskustva. No, kako umjetna inteligencija postaje sveprisutna, morat ćemo razumjeti i potencijalne štete koje može prouzročiti [oružavanje](https://www.youtube.com/watch?v=TQHs8SA1qpk) takvih algoritama u velikim razmjerima.
Trendovi također pokazuju da ćemo do 2025. godine stvoriti i konzumirati preko [180 zettabajta](https://www.statista.com/statistics/871513/worldwide-data-created/) podataka. Kao **znanstvenici o podacima**, to nam daje neviđenu razinu pristupa osobnim podacima. To znači da možemo graditi profile ponašanja korisnika i utjecati na donošenje odluka na načine koji stvaraju [iluziju slobodnog izbora](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice), dok potencijalno usmjeravamo korisnike prema ishodima koji nama odgovaraju. To također otvara šira pitanja o privatnosti podataka i zaštiti korisnika.
Trendovi također pokazuju da ćemo do 2025. godine stvoriti i konzumirati preko [180 zettabajta](https://www.statista.com/statistics/871513/worldwide-data-created/) podataka. Kao **znanstvenici podataka**, to nam daje neviđenu razinu pristupa osobnim podacima. To znači da možemo izgraditi profile ponašanja korisnika i utjecati na donošenje odluka na načine koji stvaraju [iluziju slobodnog izbora](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice), dok potencijalno usmjeravamo korisnike prema ishodima koji nama odgovaraju. Također se postavljaju šira pitanja o privatnosti podataka i zaštiti korisnika.
Etika podataka sada su _nužne smjernice_ za znanost o podacima i inženjering, pomažući nam da minimiziramo potencijalne štete i nenamjerne posljedice naših akcija temeljenih na podacima. [Gartnerov Hype Cycle za AI](https://www.gartner.com/smarterwithgartner/2-megatrends-dominate-the-gartner-hype-cycle-for-artificial-intelligence-2020/) identificira relevantne trendove u digitalnoj etici, odgovornoj AI i upravljanju AI-jem kao ključne pokretače većih megatrendova oko _demokratizacije_ i _industrijalizacije_ AI-ja.
Etika podataka sada su _nužne zaštitne mjere_ za znanost o podacima i inženjering, pomažući nam da minimiziramo potencijalne štete i nenamjerne posljedice naših radnji vođenih podacima. [Gartnerov Hype Cycle za AI](https://www.gartner.com/smarterwithgartner/2-megatrends-dominate-the-gartner-hype-cycle-for-artificial-intelligence-2020/) identificira relevantne trendove u digitalnoj etici, odgovornoj AI i upravljanju AI-jem kao ključne pokretače većih megatrendova oko _demokratizacije_ i _industrijalizacije_ AI-ja.
![Gartnerov Hype Cycle za AI - 2020](https://images-cdn.newscred.com/Zz1mOWJhNzlkNDA2ZTMxMWViYjRiOGFiM2IyMjQ1YmMwZQ==)
U ovoj lekciji istražit ćemo fascinantno područje etike podataka - od osnovnih koncepata i izazova, do studija slučaja i primijenjenih AI koncepata poput upravljanja - koji pomažu uspostaviti kulturu etike u timovima i organizacijama koje rade s podacima i AI-jem.
U ovoj lekciji istražit ćemo fascinantno područje etike podataka - od osnovnih pojmova i izazova, do studija slučaja i primijenjenih AI koncepata poput upravljanja - koji pomažu uspostaviti kulturu etike u timovima i organizacijama koje rade s podacima i AI-jem.
## [Kviz prije predavanja](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/2) 🎯
@ -37,48 +37,48 @@ Riječ "etika" dolazi od [grčke riječi "ethikos"](https://en.wikipedia.org/wik
**Etika** se odnosi na zajedničke vrijednosti i moralna načela koja upravljaju našim ponašanjem u društvu. Etika se ne temelji na zakonima, već na široko prihvaćenim normama o tome što je "ispravno naspram pogrešnog". Međutim, etička razmatranja mogu utjecati na inicijative korporativnog upravljanja i vladine regulative koje stvaraju više poticaja za usklađenost.
**Etika podataka** je [nova grana etike](https://royalsocietypublishing.org/doi/full/10.1098/rsta.2016.0360#sec-1) koja "proučava i procjenjuje moralne probleme povezane s _podacima, algoritmima i odgovarajućim praksama_". Ovdje se **"podaci"** fokusiraju na radnje povezane s generiranjem, bilježenjem, kuriranjem, obradom, širenjem, dijeljenjem i korištenjem, **"algoritmi"** na AI, agente, strojno učenje i robote, a **"prakse"** na teme poput odgovorne inovacije, programiranja, hakiranja i etičkih kodeksa.
**Etika podataka** je [nova grana etike](https://royalsocietypublishing.org/doi/full/10.1098/rsta.2016.0360#sec-1) koja "proučava i procjenjuje moralne probleme povezane s _podacima, algoritmima i odgovarajućim praksama_". Ovdje se **"podaci"** fokusiraju na radnje povezane s generiranjem, snimanjem, kuriranjem, obradom, širenjem, dijeljenjem i korištenjem, **"algoritmi"** se fokusiraju na AI, agente, strojno učenje i robote, a **"prakse"** se fokusiraju na teme poput odgovorne inovacije, programiranja, hakiranja i etičkih kodeksa.
**Primijenjena etika** je [praktična primjena moralnih razmatranja](https://en.wikipedia.org/wiki/Applied_ethics). To je proces aktivnog istraživanja etičkih pitanja u kontekstu _stvarnih radnji, proizvoda i procesa_ te poduzimanja korektivnih mjera kako bi se osiguralo da ostanu usklađeni s našim definiranim etičkim vrijednostima.
**Primijenjena etika** je [praktična primjena moralnih razmatranja](https://en.wikipedia.org/wiki/Applied_ethics). To je proces aktivnog istraživanja etičkih pitanja u kontekstu _stvarnih radnji, proizvoda i procesa_, te poduzimanja korektivnih mjera kako bi se osiguralo da ostanu usklađeni s našim definiranim etičkim vrijednostima.
**Kultura etike** odnosi se na [_operacionalizaciju_ primijenjene etike](https://hbr.org/2019/05/how-to-design-an-ethical-organization) kako bi se osiguralo da se naši etički principi i prakse dosljedno i skalabilno usvajaju u cijeloj organizaciji. Uspješne kulture etike definiraju etičke principe na razini organizacije, pružaju značajne poticaje za usklađenost i jačaju norme etike poticanjem i pojačavanjem željenih ponašanja na svakoj razini organizacije.
**Kultura etike** odnosi se na [_operacionalizaciju_ primijenjene etike](https://hbr.org/2019/05/how-to-design-an-ethical-organization) kako bi se osiguralo da se naši etički principi i prakse dosljedno i skalabilno usvajaju u cijeloj organizaciji. Uspješne kulture etike definiraju etičke principe na razini organizacije, pružaju značajne poticaje za usklađenost i jačaju norme etike poticanjem i amplifikacijom željenih ponašanja na svakoj razini organizacije.
## Koncepti etike
U ovom ćemo odjeljku raspraviti koncepte poput **zajedničkih vrijednosti** (principa) i **etičkih izazova** (problema) za etiku podataka - te istražiti **studije slučaja** koje vam pomažu razumjeti te koncepte u stvarnim kontekstima.
U ovom dijelu raspravljat ćemo o konceptima poput **zajedničkih vrijednosti** (principa) i **etičkih izazova** (problema) za etiku podataka - te istražiti **studije slučaja** koje vam pomažu razumjeti ove koncepte u stvarnim kontekstima.
### 1. Etički principi
### 1. Principi etike
Svaka strategija etike podataka započinje definiranjem _etičkih principa_ - "zajedničkih vrijednosti" koje opisuju prihvatljiva ponašanja i vode usklađene radnje u našim projektima s podacima i AI-jem. Možete ih definirati na individualnoj ili timskoj razini. Međutim, većina velikih organizacija ih navodi u misiji ili okviru _etičkog AI-ja_ koji je definiran na korporativnoj razini i dosljedno proveden u svim timovima.
Svaka strategija etike podataka počinje definiranjem _etičkih principa_ - "zajedničkih vrijednosti" koje opisuju prihvatljiva ponašanja i vode usklađene radnje u našim projektima vezanim uz podatke i AI. Možete ih definirati na individualnoj ili timskoj razini. Međutim, većina velikih organizacija ih navodi u _misiji etičkog AI-ja_ ili okviru koji je definiran na korporativnoj razini i dosljedno proveden u svim timovima.
**Primjer:** Microsoftova [Misija odgovornog AI-ja](https://www.microsoft.com/en-us/ai/responsible-ai) glasi: _"Predani smo razvoju AI-ja vođenog etičkim principima koji stavljaju ljude na prvo mjesto"_ - identificirajući 6 etičkih principa u okviru ispod:
**Primjer:** Microsoftova [Odgovorna AI](https://www.microsoft.com/en-us/ai/responsible-ai) misija glasi: _"Posvećeni smo razvoju AI-ja vođenog etičkim principima koji stavljaju ljude na prvo mjesto"_ - identificirajući 6 etičkih principa u okviru ispod:
![Odgovorni AI u Microsoftu](https://docs.microsoft.com/en-gb/azure/cognitive-services/personalizer/media/ethics-and-responsible-use/ai-values-future-computed.png)
![Odgovorna AI u Microsoftu](https://docs.microsoft.com/en-gb/azure/cognitive-services/personalizer/media/ethics-and-responsible-use/ai-values-future-computed.png)
Pogledajmo ukratko ove principe. _Transparentnost_ i _odgovornost_ su temeljne vrijednosti na kojima se grade ostali principi - pa krenimo od njih:
Kratko ćemo istražiti ove principe. _Transparentnost_ i _odgovornost_ su temeljne vrijednosti na kojima se grade ostali principi - pa krenimo od njih:
* [**Odgovornost**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) čini praktičare _odgovornima_ za njihove operacije s podacima i AI-jem te usklađenost s ovim etičkim principima.
* [**Transparentnost**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) osigurava da su radnje s podacima i AI-jem _razumljive_ (interpretabilne) korisnicima, objašnjavajući što i zašto iza odluka.
* [**Pravednost**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1%3aprimaryr6) - fokusira se na osiguravanje da AI tretira _sve ljude_ pravedno, rješavajući bilo kakve sustavne ili implicitne socio-tehničke pristranosti u podacima i sustavima.
* [**Pouzdanost i sigurnost**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - osigurava da se AI ponaša _dosljedno_ s definiranim vrijednostima, minimizirajući potencijalne štete ili nenamjerne posljedice.
* [**Privatnost i sigurnost**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - odnosi se na razumijevanje porijekla podataka i pružanje _privatnosti podataka i povezanih zaštita_ korisnicima.
* [**Odgovornost**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) čini praktičare _odgovornima_ za njihove operacije s podacima i AI-jem, te usklađenost s ovim etičkim principima.
* [**Transparentnost**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) osigurava da su radnje vezane uz podatke i AI _razumljive_ korisnicima, objašnjavajući što i zašto iza odluka.
* [**Pravednost**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1%3aprimaryr6) - fokusira se na osiguranje da AI _sve ljude_ tretira pravedno, rješavajući bilo kakve sustavne ili implicitne socio-tehničke pristranosti u podacima i sustavima.
* [**Pouzdanost i sigurnost**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - osigurava da AI djeluje _dosljedno_ s definiranim vrijednostima, minimizirajući potencijalne štete ili nenamjerne posljedice.
* [**Privatnost i sigurnost**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - odnosi se na razumijevanje podrijetla podataka i pružanje _privatnosti podataka i povezanih zaštita_ korisnicima.
* [**Uključivost**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - odnosi se na dizajniranje AI rješenja s namjerom, prilagođavajući ih kako bi zadovoljila _širok raspon ljudskih potreba_ i sposobnosti.
> 🚨 Razmislite o tome kakva bi mogla biti vaša misija etike podataka. Istražite okvire etičkog AI-ja drugih organizacija - ovdje su primjeri iz [IBM-a](https://www.ibm.com/cloud/learn/ai-ethics), [Googlea](https://ai.google/principles) i [Facebooka](https://ai.facebook.com/blog/facebooks-five-pillars-of-responsible-ai/). Koje zajedničke vrijednosti dijele? Kako se ti principi odnose na AI proizvod ili industriju u kojoj djeluju?
> 🚨 Razmislite o tome što bi mogla biti vaša misija etike podataka. Istražite okvire etičkog AI-ja drugih organizacija - ovdje su primjeri iz [IBM-a](https://www.ibm.com/cloud/learn/ai-ethics), [Googlea](https://ai.google/principles) i [Facebooka](https://ai.facebook.com/blog/facebooks-five-pillars-of-responsible-ai/). Koje zajedničke vrijednosti imaju? Kako se ti principi odnose na AI proizvod ili industriju u kojoj djeluju?
### 2. Etički izazovi
Nakon što definiramo etičke principe, sljedeći korak je procijeniti naše radnje s podacima i AI-jem kako bismo vidjeli jesu li usklađene s tim zajedničkim vrijednostima. Razmislite o svojim radnjama u dvije kategorije: _prikupljanje podataka_ i _dizajn algoritama_.
Nakon što definiramo etičke principe, sljedeći korak je procijeniti naše radnje vezane uz podatke i AI kako bismo vidjeli jesu li usklađene s tim zajedničkim vrijednostima. Razmislite o svojim radnjama u dvije kategorije: _prikupljanje podataka_ i _dizajn algoritama_.
Kod prikupljanja podataka, radnje će vjerojatno uključivati **osobne podatke** ili osobno prepoznatljive informacije (PII) za identificirane žive pojedince. To uključuje [različite stavke neosobnih podataka](https://ec.europa.eu/info/law/law-topic/data-protection/reform/what-personal-data_en) koje _zajedno_ identificiraju pojedinca. Etički izazovi mogu se odnositi na _privatnost podataka_, _vlasništvo nad podacima_ i povezane teme poput _informiranog pristanka_ i _prava intelektualnog vlasništva_ korisnika.
Kod prikupljanja podataka, radnje će vjerojatno uključivati **osobne podatke** ili osobno prepoznatljive informacije (PII) za identificirane žive pojedince. To uključuje [različite stavke neosobnih podataka](https://ec.europa.eu/info/law/law-topic/data-protection/reform/what-personal-data_en) koje _zajedno_ identificiraju pojedinca. Etički izazovi mogu se odnositi na _privatnost podataka_, _vlasništvo podataka_ i povezane teme poput _informiranog pristanka_ i _prava intelektualnog vlasništva_ za korisnike.
Kod dizajna algoritama, radnje će uključivati prikupljanje i kuriranje **skupova podataka**, a zatim njihovo korištenje za treniranje i implementaciju **modela podataka** koji predviđaju ishode ili automatiziraju odluke u stvarnim kontekstima. Etički izazovi mogu proizaći iz _pristranosti skupa podataka_, problema s _kvalitetom podataka_, _nepravednosti_ i _pogrešnog predstavljanja_ u algoritmima - uključujući neke probleme koji su sustavne prirode.
Kod dizajna algoritama, radnje će uključivati prikupljanje i kuriranje **skupova podataka**, a zatim njihovo korištenje za treniranje i implementaciju **modela podataka** koji predviđaju ishode ili automatiziraju odluke u stvarnim kontekstima. Etički izazovi mogu proizaći iz _pristranosti skupa podataka_, problema _kvalitete podataka_, _nepravednosti_ i _pogrešnog predstavljanja_ u algoritmima - uključujući neke probleme koji su sustavne prirode.
U oba slučaja, etički izazovi ističu područja gdje naše radnje mogu doći u sukob s našim zajedničkim vrijednostima. Kako bismo otkrili, ublažili, minimizirali ili eliminirali te zabrinutosti, trebamo postavljati moralna "da/ne" pitanja vezana uz naše radnje, a zatim poduzeti korektivne mjere prema potrebi. Pogledajmo neke etičke izazove i moralna pitanja koja postavljaju:
U oba slučaja, etički izazovi ističu područja gdje naše radnje mogu biti u sukobu s našim zajedničkim vrijednostima. Kako bismo otkrili, ublažili, minimizirali ili eliminirali ove zabrinutosti - trebamo postavljati moralna "da/ne" pitanja vezana uz naše radnje, a zatim poduzeti korektivne mjere prema potrebi. Pogledajmo neke etičke izazove i moralna pitanja koja postavljaju:
#### 2.1 Vlasništvo nad podacima
#### 2.1 Vlasništvo podataka
Prikupljanje podataka često uključuje osobne podatke koji mogu identificirati subjekte podataka. [Vlasništvo nad podacima](https://permission.io/blog/data-ownership) odnosi se na _kontrolu_ i [_prava korisnika_](https://permission.io/blog/data-ownership) vezana uz stvaranje, obradu i širenje podataka.
Prikupljanje podataka često uključuje osobne podatke koji mogu identificirati subjekte podataka. [Vlasništvo podataka](https://permission.io/blog/data-ownership) odnosi se na _kontrolu_ i [_prava korisnika_](https://permission.io/blog/data-ownership) vezana uz stvaranje, obradu i širenje podataka.
Moralna pitanja koja trebamo postaviti su:
* Tko posjeduje podatke? (korisnik ili organizacija)
@ -92,7 +92,7 @@ Moralna pitanja koja trebamo postaviti su:
Pitanja za istraživanje ovdje su:
* Je li korisnik (subjekt podataka) dao dopuštenje za prikupljanje i korištenje podataka?
* Je li korisnik razumio svrhu za koju su ti podaci prikupljeni?
* Je li korisnik razumio potencijalne rizike od svog sudjelovanja?
* Je li korisnik razumio potencijalne rizike od sudjelovanja?
#### 2.3 Intelektualno vlasništvo
@ -112,14 +112,14 @@ Pitanja za istraživanje ovdje su:
* Jesu li korisnički (osobni) podaci zaštićeni od hakiranja i curenja?
* Jesu li korisnički podaci dostupni samo ovlaštenim korisnicima i kontekstima?
* Je li anonimnost korisnika očuvana kada se podaci dijele ili šire?
* Može li se korisnik deidentificirati iz anonimiziranih skupova podataka?
* Može li se korisnik de-identificirati iz anonimiziranih skupova podataka?
#### 2.5 Pravo na zaborav
[Pravo na zaborav](https://en.wikipedia.org/wiki/Right_to_be_forgotten) ili [Pravo na brisanje](https://www.gdpreu.org/right-to-be-forgotten/) pruža dodatnu zaštitu osobnih podataka korisnicima. Konkretno, daje korisnicima pravo da zatraže brisanje ili uklanjanje osobnih podataka iz internetskih pretraživanja i drugih lokacija, _pod određenim okolnostima_ - omogućujući im novi početak online bez da ih prošle radnje opterećuju.
[Pravo na zaborav](https://en.wikipedia.org/wiki/Right_to_be_forgotten) ili [Pravo na brisanje](https://www.gdpreu.org/right-to-be-forgotten/) pruža dodatnu zaštitu osobnih podataka korisnicima. Konkretno, daje korisnicima pravo da zatraže brisanje ili uklanjanje osobnih podataka iz internetskih pretraživanja i drugih lokacija, _pod određenim okolnostima_ - omogućujući im novi početak online bez da se prošle radnje drže protiv njih.
Pitanja za istraživanje ovdje su:
* Omogućuje li sustav subjektima podataka da zatraže brisanje?
* Omogućava li sustav subjektima podataka da zatraže brisanje?
* Treba li povlačenje korisničkog pristanka automatski pokrenuti brisanje?
* Jesu li podaci prikupljeni bez pristanka ili nezakonitim sredstvima?
* Jesmo li usklađeni s vladinim regulativama za privatnost podataka?
@ -129,22 +129,20 @@ Pitanja za istraživanje ovdje su:
Pristranost skupa podataka ili [pristranost prikupljanja](http://researcharticles.com/index.php/bias-in-data-collection-in-research/) odnosi se na odabir _nereprezentativnog_ podskupa podataka za razvoj algoritama, stvarajući potencijalnu nepravednost u ishodima za različite skupine. Vrste pristranosti uključuju pristranost odabira ili uzorkovanja, pristranost volontera i pristranost instrumenata.
Pitanja za istraživanje ovdje su:
* Jesmo li regrutirali reprezentativan skup subjekata podataka?
* Jesmo li regrutirali reprezentativni skup subjekata podataka?
* Jesmo li testirali naš prikupljeni ili kurirani skup podataka na razne pristranosti?
* Možemo li ublažiti ili ukloniti otkrivene pristranosti?
#### 2.7 Kvaliteta podataka
[Kvaliteta podataka](https://lakefs.io/data-quality-testing/) odnosi se na valjanost kuriranog skupa podataka korištenog za razvoj naših algoritama, provjeravajući zadovoljavaju li značajke i zapisi zahtjeve za razinom točnosti i dosljednosti potrebnom za našu AI svrhu.
[Kvaliteta podataka](https://lakefs.io/data-quality-testing/) ispituje valjanost kuriranog skupa podataka korištenog za razvoj naših algoritama, provjeravajući jesu li značajke i zapisi u skladu s zahtjevima za razinu točnosti i dosljednosti potrebnu za naš AI cilj.
Pitanja za istraživanje ovdje su:
* Jesmo li uhvatili valjane _značajke_ za naš slučaj upotrebe?
* Jesmo li uhvatili valjane _značajke_ za našu svrhu?
* Jesu li podaci dosljedno prikupljeni iz različitih izvora podataka?
* Je li skup podataka _potpun_ za različite uvjete ili scenarije?
* Jesu li informacije točno zabilježene u odražavanju stvarnosti?
#### 2.8 Pravednost algoritama
[Algorithm Fairness](https://towardsdatascience.com/what-is-algorithm-fairness-3182e161cf9f) provjerava dizajn algoritma kako bi se utvrdilo diskriminira li sustavno određene podskupine ispitanika, što može dovesti do [potencijalnih šteta](https://docs.microsoft.com/en-us/azure/machine-learning/concept-fairness-ml) u _raspodjeli_ (kada se resursi uskraćuju ili odbijaju toj skupini) i _kvaliteti usluge_ (kada AI nije jednako precizan za neke podskupine kao za druge).
* Jesu li informacije točno uhvaćene u odražavanju stvarnosti?
[Algorithm Fairness](https://towardsdatascience.com/what-is-algorithm-fairness-3182e161cf9f) provjerava dizajn algoritma kako bi se utvrdilo diskriminira li sustavno određene podskupine subjekata podataka, što može dovesti do [potencijalnih šteta](https://docs.microsoft.com/en-us/azure/machine-learning/concept-fairness-ml) u _dodjeli_ (gdje se resursi uskraćuju ili odbijaju toj skupini) i _kvaliteti usluge_ (gdje AI nije jednako precizan za neke podskupine kao za druge).
Pitanja za istraživanje:
* Jesmo li procijenili točnost modela za različite podskupine i uvjete?
@ -164,7 +162,7 @@ Pitanja za istraživanje:
* Postoje li alternativna objašnjenja koja mogu ponuditi drugačiji zaključak?
#### 2.10 Slobodan izbor
[Iluzija slobodnog izbora](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice) događa se kada sustavi "arhitekture izbora" koriste algoritme za donošenje odluka kako bi usmjerili ljude prema preferiranom ishodu, dok im se pritom čini da imaju opcije i kontrolu. Ovi [tamni obrasci](https://www.darkpatterns.org/) mogu uzrokovati društvene i ekonomske štete korisnicima. Budući da odluke korisnika utječu na profile ponašanja, te radnje potencijalno oblikuju buduće izbore, što može pojačati ili proširiti utjecaj tih šteta.
[Iluzija slobodnog izbora](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice) događa se kada sustavi "arhitekture izbora" koriste algoritme za donošenje odluka kako bi potaknuli ljude na odabir preferiranog ishoda, dok im se istovremeno čini da imaju opcije i kontrolu. Ovi [tamni obrasci](https://www.darkpatterns.org/) mogu uzrokovati društvene i ekonomske štete korisnicima. Budući da odluke korisnika utječu na profile ponašanja, te radnje potencijalno oblikuju buduće izbore koji mogu pojačati ili proširiti utjecaj tih šteta.
Pitanja za istraživanje:
* Je li korisnik razumio implikacije donošenja tog izbora?
@ -177,91 +175,92 @@ Kako bismo ove etičke izazove stavili u kontekst stvarnog svijeta, korisno je p
Evo nekoliko primjera:
| Etički izazov | Studija slučaja |
| Etički izazov | Studija slučaja |
|--- |--- |
| **Informirani pristanak** | 1972 - [Tuskegee Syphilis Study](https://en.wikipedia.org/wiki/Tuskegee_Syphilis_Study) - Afroameričkim muškarcima koji su sudjelovali u studiji obećana je besplatna medicinska skrb _ali su ih istraživači obmanuli_ ne informirajući ih o dijagnozi ili dostupnosti liječenja. Mnogi su umrli, a partneri i djeca su bili pogođeni; studija je trajala 40 godina. |
| **Privatnost podataka** | 2007 - [Netflix data prize](https://www.wired.com/2007/12/why-anonymous-data-sometimes-isnt/) omogućio je istraživačima pristup _10M anonimnih ocjena filmova od 50K korisnika_ kako bi poboljšali algoritme preporuka. Međutim, istraživači su uspjeli povezati anonimne podatke s osobno identificirajućim podacima u _vanjskim skupovima podataka_ (npr. IMDb komentari) - učinkovito "deanonimizirajući" neke Netflix pretplatnike.|
| **Pristranost u prikupljanju podataka** | 2013 - Grad Boston [razvio Street Bump](https://www.boston.gov/transportation/street-bump), aplikaciju koja je omogućila građanima da prijave rupe na cestama, dajući gradu bolje podatke o cestama za pronalaženje i popravak problema. Međutim, [ljudi s nižim prihodima imali su manje pristupa automobilima i telefonima](https://hbr.org/2013/04/the-hidden-biases-in-big-data), čineći njihove probleme s cestama nevidljivima u ovoj aplikaciji. Programeri su surađivali s akademicima na pitanjima _pravednog pristupa i digitalnih podjela_ radi pravednosti. |
| **Pravednost algoritma** | 2018 - MIT [Gender Shades Study](http://gendershades.org/overview.html) procijenio je točnost AI proizvoda za klasifikaciju spola, otkrivajući nedostatke u točnosti za žene i osobe tamnije boje kože. [Apple Card iz 2019.](https://www.wired.com/story/the-apple-card-didnt-see-genderand-thats-the-problem/) činilo se da nudi manje kredita ženama nego muškarcima. Oba primjera ilustriraju probleme pristranosti algoritma koji dovode do socio-ekonomskih šteta.|
| **Pogrešno predstavljanje podataka** | 2020 - [Odjel za javno zdravstvo Georgije objavio COVID-19 grafikone](https://www.vox.com/covid-19-coronavirus-us-response-trump/2020/5/18/21262265/georgia-covid-19-cases-declining-reopening) koji su izgledali kao da obmanjuju građane o trendovima potvrđenih slučajeva s ne-kronološkim redoslijedom na x-osi. Ovo ilustrira pogrešno predstavljanje kroz trikove vizualizacije. |
| **Iluzija slobodnog izbora** | 2020 - Edukacijska aplikacija [ABCmouse platila je $10M za nagodbu s FTC-om](https://www.washingtonpost.com/business/2020/09/04/abcmouse-10-million-ftc-settlement/) gdje su roditelji bili zarobljeni u plaćanju pretplata koje nisu mogli otkazati. Ovo ilustrira tamne obrasce u arhitekturi izbora, gdje su korisnici bili usmjereni prema potencijalno štetnim izborima. |
| **Privatnost podataka i prava korisnika** | 2021 - Facebook [curenje podataka](https://www.npr.org/2021/04/09/986005820/after-data-breach-exposes-530-million-facebook-says-it-will-not-notify-users) otkrilo je podatke 530M korisnika, što je rezultiralo nagodbom od $5B s FTC-om. Međutim, odbili su obavijestiti korisnike o curenju, kršeći prava korisnika na transparentnost i pristup podacima. |
| **Privatnost podataka** | 2007 - [Netflix data prize](https://www.wired.com/2007/12/why-anonymous-data-sometimes-isnt/) pružio je istraživačima _10M anonimiziranih ocjena filmova od 50K korisnika_ kako bi se poboljšali algoritmi preporuka. Međutim, istraživači su uspjeli povezati anonimizirane podatke s osobno identificiranim podacima u _vanjskim skupovima podataka_ (npr. IMDb komentari) - učinkovito "deanonimizirajući" neke Netflix pretplatnike.|
| **Pristranost u prikupljanju podataka** | 2013 - Grad Boston [razvio Street Bump](https://www.boston.gov/transportation/street-bump), aplikaciju koja je omogućila građanima da prijave rupe na cestama, dajući gradu bolje podatke o cestama za pronalaženje i popravak problema. Međutim, [ljudi s nižim prihodima imali su manje pristupa automobilima i telefonima](https://hbr.org/2013/04/the-hidden-biases-in-big-data), čineći njihove probleme s cestama nevidljivima u ovoj aplikaciji. Programeri su surađivali s akademicima na _pristupu i digitalnim podjelama_ radi pravednosti. |
| **Pravednost algoritma** | 2018 - MIT [Gender Shades Study](http://gendershades.org/overview.html) procijenila je točnost AI proizvoda za klasifikaciju spola, otkrivajući nedostatke u točnosti za žene i osobe tamnije boje kože. [Apple Card iz 2019.](https://www.wired.com/story/the-apple-card-didnt-see-genderand-thats-the-problem/) činilo se da nudi manje kredita ženama nego muškarcima. Oba primjera ilustriraju probleme pristranosti algoritma koji dovode do socio-ekonomskih šteta.|
| **Pogrešno predstavljanje podataka** | 2020 - [Georgia Department of Public Health objavio COVID-19 grafikone](https://www.vox.com/covid-19-coronavirus-us-response-trump/2020/5/18/21262265/georgia-covid-19-cases-declining-reopening) koji su izgledali kao da obmanjuju građane o trendovima potvrđenih slučajeva s ne-kronološkim redoslijedom na x-osi. Ovo ilustrira pogrešno predstavljanje kroz trikove vizualizacije. |
| **Iluzija slobodnog izbora** | 2020 - Edukativna aplikacija [ABCmouse platila $10M za nagodbu s FTC-om](https://www.washingtonpost.com/business/2020/09/04/abcmouse-10-million-ftc-settlement/) gdje su roditelji bili zarobljeni u plaćanju pretplata koje nisu mogli otkazati. Ovo ilustrira tamne obrasce u arhitekturama izbora, gdje su korisnici bili potaknuti na potencijalno štetne odluke. |
| **Privatnost podataka i prava korisnika** | 2021 - Facebook [Data Breach](https://www.npr.org/2021/04/09/986005820/after-data-breach-exposes-530-million-facebook-says-it-will-not-notify-users) otkrio podatke 530M korisnika, što je rezultiralo nagodbom od $5B s FTC-om. Međutim, odbio je obavijestiti korisnike o povredi, kršeći prava korisnika na transparentnost i pristup podacima. |
Želite istražiti više studija slučaja? Pogledajte ove resurse:
* [Ethics Unwrapped](https://ethicsunwrapped.utexas.edu/case-studies) - etičke dileme u raznim industrijama.
* [Tečaj o etici u znanosti o podacima](https://www.coursera.org/learn/data-science-ethics#syllabus) - ključne studije slučaja.
* [Primjeri gdje su stvari krenule po zlu](https://deon.drivendata.org/examples/) - Deon popis s primjerima.
* [Data Science Ethics course](https://www.coursera.org/learn/data-science-ethics#syllabus) - studije slučaja u fokusu.
* [Where things have gone wrong](https://deon.drivendata.org/examples/) - Deon popis s primjerima.
> 🚨 Razmislite o studijama slučaja koje ste vidjeli - jeste li doživjeli ili bili pogođeni sličnim etičkim izazovom u svom životu? Možete li se sjetiti barem jedne druge studije slučaja koja ilustrira jedan od etičkih izazova koje smo raspravili u ovom odjeljku?
## Primijenjena etika
Razgovarali smo o konceptima etike, izazovima i studijama slučaja u kontekstu stvarnog svijeta. No kako započeti _primjenu_ etičkih načela i praksi u našim projektima? I kako _operacionalizirati_ ove prakse za bolju upravu? Istražimo neka rješenja iz stvarnog svijeta:
Razgovarali smo o konceptima etike, izazovima i studijama slučaja u kontekstu stvarnog svijeta. No, kako započeti _primjenu_ etičkih načela i praksi u našim projektima? I kako _operacionalizirati_ ove prakse za bolju upravu? Istražimo neka rješenja iz stvarnog svijeta:
### 1. Profesionalni kodeksi
Profesionalni kodeksi nude jednu opciju za organizacije da "potaknu" članove na podršku njihovim etičkim načelima i misiji. Kodeksi su _moralne smjernice_ za profesionalno ponašanje, pomažući zaposlenicima ili članovima da donose odluke koje su u skladu s načelima njihove organizacije. Oni su učinkoviti koliko i dobrovoljna usklađenost članova; međutim, mnoge organizacije nude dodatne nagrade i kazne kako bi motivirale članove na usklađenost.
Profesionalni kodeksi nude jednu opciju za organizacije da "potaknu" članove na podršku njihovim etičkim načelima i misiji. Kodeksi su _moralne smjernice_ za profesionalno ponašanje, pomažući zaposlenicima ili članovima da donose odluke koje su u skladu s načelima njihove organizacije. Oni su učinkoviti koliko i dobrovoljna usklađenost članova; međutim, mnoge organizacije nude dodatne nagrade i kazne kako bi motivirale usklađenost.
Primjeri uključuju:
* [Oxford Munich](http://www.code-of-ethics.org/code-of-conduct/) Kodeks etike
* [Data Science Association](http://datascienceassn.org/code-of-conduct.html) Kodeks ponašanja (kreiran 2013.)
* [ACM Kodeks etike i profesionalnog ponašanja](https://www.acm.org/code-of-ethics) (od 1993.)
* [ACM Code of Ethics and Professional Conduct](https://www.acm.org/code-of-ethics) (od 1993.)
> 🚨 Pripadate li profesionalnoj organizaciji za inženjering ili znanost o podacima? Istražite njihovu stranicu kako biste vidjeli definiraju li profesionalni kodeks etike. Što to govori o njihovim etičkim načelima? Kako "potiču" članove na pridržavanje kodeksa?
> 🚨 Pripadate li profesionalnoj inženjerskoj ili organizaciji za podatkovnu znanost? Istražite njihovu stranicu kako biste vidjeli definiraju li profesionalni kodeks etike. Što to govori o njihovim etičkim načelima? Kako "potiču" članove da slijede kodeks?
### 2. Etički popisi za provjeru
### 2. Etičke kontrolne liste
Dok profesionalni kodeksi definiraju potrebna _etička ponašanja_ od praktičara, oni [imaju poznata ograničenja](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md) u provedbi, posebno u projektima velikih razmjera. Umjesto toga, mnogi stručnjaci za znanost o podacima [zagovaraju popise za provjeru](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md), koji mogu **povezati načela s praksama** na deterministički i provediv način.
Dok profesionalni kodeksi definiraju potrebna _etička ponašanja_ od praktičara, oni [imaju poznata ograničenja](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md) u provedbi, posebno u projektima velikih razmjera. Umjesto toga, mnogi stručnjaci za podatkovnu znanost [zagovaraju kontrolne liste](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md), koje mogu **povezati načela s praksama** na deterministički i provediv način.
Popisi za provjeru pretvaraju pitanja u zadatke "da/ne" koji se mogu operacionalizirati, omogućujući njihovo praćenje kao dio standardnih tijekova rada za izdavanje proizvoda.
Kontrolne liste pretvaraju pitanja u zadatke "da/ne" koji se mogu operacionalizirati, omogućujući njihovo praćenje kao dio standardnih tijekova rada za izdavanje proizvoda.
Primjeri uključuju:
* [Deon](https://deon.drivendata.org/) - opći popis za provjeru etike podataka kreiran prema [preporukama industrije](https://deon.drivendata.org/#checklist-citations) s alatom naredbenog retka za jednostavnu integraciju.
* [Popis za provjeru privatnosti](https://cyber.harvard.edu/ecommerce/privacyaudit.html) - pruža opće smjernice za praksu rukovanja informacijama iz pravne i društvene perspektive.
* [Popis za provjeru pravednosti AI-a](https://www.microsoft.com/en-us/research/project/ai-fairness-checklist/) - kreiran od strane AI praktičara za podršku usvajanju i integraciji provjera pravednosti u razvojne cikluse AI-a.
* [22 pitanja za etiku u podacima i AI-u](https://medium.com/the-organization/22-questions-for-ethics-in-data-and-ai-efb68fd19429) - otvoreniji okvir, strukturiran za početno istraživanje etičkih pitanja u dizajnu, implementaciji i organizacijskim kontekstima.
* [Deon](https://deon.drivendata.org/) - opća kontrolna lista za etiku podataka kreirana iz [preporuka industrije](https://deon.drivendata.org/#checklist-citations) s alatom naredbenog retka za jednostavnu integraciju.
* [Privacy Audit Checklist](https://cyber.harvard.edu/ecommerce/privacyaudit.html) - pruža opće smjernice za praksu rukovanja informacijama iz pravne i društvene perspektive.
* [AI Fairness Checklist](https://www.microsoft.com/en-us/research/project/ai-fairness-checklist/) - kreirana od strane AI praktičara za podršku usvajanju i integraciji provjera pravednosti u AI razvojne cikluse.
* [22 pitanja za etiku u podacima i AI](https://medium.com/the-organization/22-questions-for-ethics-in-data-and-ai-efb68fd19429) - otvoreniji okvir, strukturiran za početno istraživanje etičkih pitanja u dizajnu, implementaciji i organizacijskim kontekstima.
### 3. Etičke regulative
Etika se odnosi na definiranje zajedničkih vrijednosti i činjenje ispravnih stvari _dobrovoljno_. **Usklađenost** se odnosi na _poštivanje zakona_ ako i gdje je definiran. **Upravljanje** općenito pokriva sve načine na koje organizacije djeluju kako bi provele etička načela i uskladile se s utvrđenim zakonima.
Danas upravljanje ima dva oblika unutar organizacija. Prvo, radi se o definiranju načela **etičkog AI-a** i uspostavljanju praksi za operacionalizaciju usvajanja u svim AI projektima organizacije. Drugo, radi se o usklađivanju sa svim vladinim propisima o **zaštiti podataka** za regije u kojima djeluje.
Danas upravljanje ima dva oblika unutar organizacija. Prvo, radi se o definiranju **etičkih AI** načela i uspostavljanju praksi za operacionalizaciju usvajanja u svim AI projektima organizacije. Drugo, radi se o usklađivanju sa svim vladinim propisima o zaštiti podataka za regije u kojima djeluje.
Primjeri propisa o zaštiti podataka i privatnosti:
* `1974`, [US Privacy Act](https://www.justice.gov/opcl/privacy-act-1974) - regulira _saveznu vladu_ u prikupljanju, korištenju i otkrivanju osobnih podataka.
* `1996`, [US Health Insurance Portability & Accountability Act (HIPAA)](https://www.cdc.gov/phlp/publications/topic/hipaa.html) - štiti osobne zdravstvene podatke.
* `1998`, [US Children's Online Privacy Protection Act (COPPA)](https://www.ftc.gov/enforcement/rules/rulemaking-regulatory-reform-proceedings/childrens-online-privacy-protection-rule) - štiti privatnost podataka djece mlađe od 13 godina.
* `2018`, [General Data Protection Regulation (GDPR)](https://gdpr-info.eu/) - pruža prava korisnicima, zaštitu podataka i privatnost.
* `2018`, [General Data Protection Regulation (GDPR)](https://gdpr-info.eu/) - pruža prava korisnika, zaštitu podataka i privatnost.
* `2018`, [California Consumer Privacy Act (CCPA)](https://www.oag.ca.gov/privacy/ccpa) daje potrošačima više _prava_ nad njihovim (osobnim) podacima.
* `2021`, Kineski [Zakon o zaštiti osobnih podataka](https://www.reuters.com/world/china/china-passes-new-personal-data-privacy-law-take-effect-nov-1-2021-08-20/) upravo je usvojen, stvarajući jedan od najjačih propisa o privatnosti podataka na internetu u svijetu.
* `2021`, Kineski [Zakon o zaštiti osobnih podataka](https://www.reuters.com/world/china/china-passes-new-personal-data-privacy-law-take-effect-nov-1-2021-08-20/) upravo je donesen, stvarajući jedan od najjačih propisa o privatnosti podataka na internetu u svijetu.
> 🚨 Europska unija definirala je GDPR (Opća uredba o zaštiti podataka), koji ostaje jedan od najutjecajnijih propisa o privatnosti podataka danas. Jeste li znali da također definira [8 prava korisnika](https://www.freeprivacypolicy.com/blog/8-user-rights-gdpr) za zaštitu digitalne privatnosti i osobnih podataka građana? Saznajte koja su to prava i zašto su važna.
> 🚨 Europska unija definirala je GDPR (Opća uredba o zaštiti podataka) koji ostaje jedan od najutjecajnijih propisa o privatnosti podataka danas. Jeste li znali da također definira [8 prava korisnika](https://www.freeprivacypolicy.com/blog/8-user-rights-gdpr) za zaštitu digitalne privatnosti i osobnih podataka građana? Saznajte koja su to prava i zašto su važna.
### 4. Kultura etike
Napominjemo da i dalje postoji nematerijalni jaz između _usklađenosti_ (činjenja dovoljno da se zadovolji "slovo zakona") i rješavanja [sustavnih problema](https://www.coursera.org/learn/data-science-ethics/home/week/4) (poput osifikacije, asimetrije informacija i distribucijske nepravednosti) koji mogu ubrzati upotrebu AI-a u štetne svrhe.
Napominjemo da i dalje postoji nematerijalni jaz između _usklađenosti_ (činjenja dovoljno da se zadovolji "slovo zakona") i rješavanja [sustavnih problema](https://www.coursera.org/learn/data-science-ethics/home/week/4) (poput osifikacije, asimetrije informacija i distribucijske nepravednosti) koji mogu ubrzati "oružavanje" AI-a.
Potonje zahtijeva [suradničke pristupe za definiranje kultura etike](https://towardsdatascience.com/why-ai-ethics-requires-a-culture-driven-approach-26f451afa29f) koje grade emocionalne veze i dosljedne zajedničke vrijednosti _među organizacijama_ u industriji. To poziva na više [formaliziranih kultura etike podataka](https://www.codeforamerica.org/news/formalizing-an-ethical-data-culture/) u organizacijama - omogućujući _svima_ da [povuku Andon kabel](https://en.wikipedia.org/wiki/Andon_(manufacturing)) (kako bi rano ukazali na etičke probleme) i čineći _etičke procjene_ (npr. pri zapošljavanju) ključnim kriterijem za formiranje timova u AI projektima.
Ovo drugo zahtijeva [suradničke pristupe za definiranje kultura etike](https://towardsdatascience.com/why-ai-ethics-requires-a-culture-driven-approach-26f451afa29f) koje grade emocionalne veze i dosljedne zajedničke vrijednosti _među organizacijama_ u industriji. To poziva na više [formaliziranih kultura etike podataka](https://www.codeforamerica.org/news/formalizing-an-ethical-data-culture/) u organizacijama - omogućujući _svima_ da [povuku Andon konopac](https://en.wikipedia.org/wiki/Andon_(manufacturing)) (kako bi rano ukazali na etičke probleme) i čineći _etičke procjene_ (npr. pri zapošljavanju) ključnim kriterijem za formiranje timova u AI projektima.
---
## [Post-lecture quiz](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/3) 🎯
## [Post-lecture quiz](https://ff-quizzes.netlify.app/en/ds/) 🎯
## Pregled i samostalno učenje
Tečajevi i knjige pomažu u razumijevanju osnovnih etičkih koncepata i izazova, dok studije slučaja i alati pomažu u primjeni etičkih praksi u stvarnim kontekstima. Evo nekoliko resursa za početak.
* [Machine Learning For Beginners](https://github.com/microsoft/ML-For-Beginners/blob/main/1-Introduction/3-fairness/README.md) - lekcija o pravednosti, od Microsofta.
* [Principi odgovorne umjetne inteligencije](https://docs.microsoft.com/en-us/learn/modules/responsible-ai-principles/) - besplatni obrazovni put na Microsoft Learn platformi.
* [Etika i znanost o podacima](https://resources.oreilly.com/examples/0636920203964) - O'Reilly e-knjiga (M. Loukides, H. Mason i dr.)
* [Etika u znanosti o podacima](https://www.coursera.org/learn/data-science-ethics#syllabus) - online tečaj Sveučilišta Michigan.
* [Etika razotkrivena](https://ethicsunwrapped.utexas.edu/case-studies) - studije slučaja sa Sveučilišta Texas.
* [Principi odgovorne umjetne inteligencije](https://docs.microsoft.com/en-us/learn/modules/responsible-ai-principles/) - besplatni obrazovni program od Microsoft Learn.
* [Etika i znanost o podacima](https://resources.oreilly.com/examples/0636920203964) - O'Reilly EBook (M. Loukides, H. Mason i dr.)
* [Etika u znanosti o podacima](https://www.coursera.org/learn/data-science-ethics#syllabus) - online tečaj Sveučilišta Michigan.
* [Etika razotkrivena](https://ethicsunwrapped.utexas.edu/case-studies) - studije slučaja Sveučilišta Texas.
# Zadatak
# Zadatak
[Napišite studiju slučaja o etici podataka](assignment.md)
[Napišite studiju slučaja o etici podataka](assignment.md)
---
**Odricanje od odgovornosti**:
Ovaj dokument je preveden korištenjem AI usluge za prevođenje [Co-op Translator](https://github.com/Azure/co-op-translator). Iako nastojimo osigurati točnost, imajte na umu da automatski prijevodi mogu sadržavati pogreške ili netočnosti. Izvorni dokument na izvornom jeziku treba smatrati mjerodavnim izvorom. Za ključne informacije preporučuje se profesionalni prijevod od strane stručnjaka. Ne preuzimamo odgovornost za bilo kakve nesporazume ili pogrešne interpretacije proizašle iz korištenja ovog prijevoda.
Ovaj dokument je preveden pomoću AI usluge za prevođenje [Co-op Translator](https://github.com/Azure/co-op-translator). Iako nastojimo osigurati točnost, imajte na umu da automatski prijevodi mogu sadržavati pogreške ili netočnosti. Izvorni dokument na izvornom jeziku treba smatrati autoritativnim izvorom. Za ključne informacije preporučuje se profesionalni prijevod od strane ljudskog prevoditelja. Ne preuzimamo odgovornost za nesporazume ili pogrešne interpretacije koje mogu proizaći iz korištenja ovog prijevoda.

@ -1,105 +1,105 @@
<!--
CO_OP_TRANSLATOR_METADATA:
{
"original_hash": "8796f41f566a0a8ebb72863a83d558ed",
"translation_date": "2025-08-26T15:04:07+00:00",
"original_hash": "3a34157cc63516eba97c89a0b2f8c3e6",
"translation_date": "2025-09-03T21:43:48+00:00",
"source_file": "1-Introduction/02-ethics/README.md",
"language_code": "hu"
}
-->
# Bevezetés az adatetika világába
# Bevezetés az adatetikai kérdésekbe
|![ Sketchnote készítette: [(@sketchthedocs)](https://sketchthedocs.dev) ](../../sketchnotes/02-Ethics.png)|
|:---:|
| Adattudományi etika - _Sketchnote készítette: [@nitya](https://twitter.com/nitya)_ |
| Adatelemzési etika - _Sketchnote készítette: [@nitya](https://twitter.com/nitya)_ |
---
Mindannyian adatpolgárok vagyunk egy adatokkal átszőtt világban.
Mindannyian adatpolgárok vagyunk egy adatközpontú világban.
A piaci trendek azt mutatják, hogy 2022-re minden harmadik nagy szervezet online [piactereken és tőzsdéken](https://www.gartner.com/smarterwithgartner/gartner-top-10-trends-in-data-and-analytics-for-2020/) keresztül fog adatokat vásárolni és eladni. **Alkalmazásfejlesztőként** egyre könnyebb és olcsóbb lesz adatvezérelt betekintéseket és algoritmusvezérelt automatizációt integrálni a mindennapi felhasználói élményekbe. Azonban, ahogy a mesterséges intelligencia (MI) mindent áthatóvá válik, meg kell értenünk azokat a potenciális károkat is, amelyeket az ilyen algoritmusok [fegyverként való alkalmazása](https://www.youtube.com/watch?v=TQHs8SA1qpk) okozhat nagy léptékben.
A piaci trendek azt mutatják, hogy 2022-re minden harmadik nagy szervezet online [piactereken és csereplatformokon](https://www.gartner.com/smarterwithgartner/gartner-top-10-trends-in-data-and-analytics-for-2020/) keresztül fog adatokat vásárolni és eladni. **Alkalmazásfejlesztőként** könnyebb és olcsóbb lesz adatvezérelt betekintéseket és algoritmusvezérelt automatizációt integrálni a mindennapi felhasználói élményekbe. Azonban ahogy az AI egyre elterjedtebbé válik, meg kell értenünk azokat a potenciális károkat is, amelyeket az ilyen algoritmusok [fegyveres alkalmazása](https://www.youtube.com/watch?v=TQHs8SA1qpk) okozhat nagy léptékben.
A trendek azt is jelzik, hogy 2025-re több mint [180 zettabájtnyi](https://www.statista.com/statistics/871513/worldwide-data-created/) adatot fogunk létrehozni és fogyasztani. **Adattudósként** ez példátlan szintű hozzáférést biztosít számunkra a személyes adatokhoz. Ez lehetővé teszi, hogy felhasználói viselkedési profilokat építsünk, és olyan döntéshozatalt befolyásoljunk, amely [a szabad választás illúzióját](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice) kelti, miközben esetleg a számunkra kedvező eredmények felé tereljük a felhasználókat. Ez szélesebb körű kérdéseket is felvet az adatvédelemről és a felhasználói jogok védelméről.
A trendek azt is mutatják, hogy 2025-re több mint [180 zettabájtnyi](https://www.statista.com/statistics/871513/worldwide-data-created/) adatot fogunk létrehozni és fogyasztani. **Adattudósként** ez példátlan szintű hozzáférést biztosít számunkra személyes adatokhoz. Ez lehetővé teszi, hogy viselkedési profilokat építsünk fel a felhasználókról, és befolyásoljuk döntéseiket olyan módon, amely [a szabad választás illúzióját](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice) kelti, miközben esetlegesen a számunkra kedvező eredmények felé tereljük őket. Ez szélesebb körű kérdéseket vet fel az adatvédelemről és a felhasználói jogok védelméről.
Az adatetika ma már _elengedhetetlen irányelv_ az adattudomány és a mérnöki munka számára, amely segít minimalizálni az adatvezérelt cselekedeteinkből eredő potenciális károkat és nem szándékos következményeket. A [Gartner MI Hype Cycle](https://www.gartner.com/smarterwithgartner/2-megatrends-dominate-the-gartner-hype-cycle-for-artificial-intelligence-2020/) azonosítja a digitális etika, a felelős MI és az MI irányítás releváns trendjeit, mint kulcsfontosságú hajtóerőket az MI _demokratizálása_ és _iparosítása_ körüli nagyobb megatrendekhez.
Az adatetika mostanra _szükséges védőkorlát_ az adatelemzés és mérnöki munka számára, segítve a potenciális károk és nem szándékos következmények minimalizálását az adatvezérelt cselekvéseinkből. A [Gartner AI Hype Cycle](https://www.gartner.com/smarterwithgartner/2-megatrends-dominate-the-gartner-hype-cycle-for-artificial-intelligence-2020/) az adatetika, a felelős AI és az AI irányítás releváns trendjeit az AI _demokratizációja_ és _iparosítása_ körüli nagyobb megatrendek kulcsfontosságú hajtóerejeként azonosítja.
![Gartner MI Hype Cycle - 2020](https://images-cdn.newscred.com/Zz1mOWJhNzlkNDA2ZTMxMWViYjRiOGFiM2IyMjQ1YmMwZQ==)
![Gartner AI Hype Cycle - 2020](https://images-cdn.newscred.com/Zz1mOWJhNzlkNDA2ZTMxMWViYjRiOGFiM2IyMjQ1YmMwZQ==)
Ebben a leckében az adatetika lenyűgöző területét fogjuk felfedezni - az alapfogalmaktól és kihívásoktól kezdve az esettanulmányokon át az alkalmazott MI fogalmakig, mint például az irányítás -, amelyek segítenek az etikai kultúra kialakításában az adatokkal és MI-vel dolgozó csapatokban és szervezetekben.
Ebben a leckében az adatetika lenyűgöző területét fogjuk felfedezni - az alapfogalmaktól és kihívásoktól kezdve az esettanulmányokon és alkalmazott AI koncepciókon át, mint például az irányítás -, amelyek segítenek az etikai kultúra kialakításában az adatokat és AI-t használó csapatokban és szervezetekben.
## [Előadás előtti kvíz](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/2) 🎯
## Alapvető meghatározások
## Alapvető definíciók
Kezdjük az alapvető terminológia megértésével.
Az "etika" szó a [görög "ethikos"](https://en.wikipedia.org/wiki/Ethics) (és annak gyökere, az "ethos") szóból származik, amely _jellemet vagy erkölcsi természetet_ jelent.
Az "etika" szó a [görög "ethikos"](https://en.wikipedia.org/wiki/Ethics) (és annak "ethos" gyökere) szóból származik, amely _jellemet vagy erkölcsi természetet_ jelent.
**Etika** azokról a közös értékekről és erkölcsi elvekről szól, amelyek irányítják viselkedésünket a társadalomban. Az etika nem törvényeken alapul, hanem azon a széles körben elfogadott normán, hogy mi a "helyes és helytelen". Azonban az etikai megfontolások befolyásolhatják a vállalatirányítási kezdeményezéseket és a kormányzati szabályozásokat, amelyek több ösztönzőt teremtenek a megfelelésre.
**Etika** azokról a közös értékekről és erkölcsi elvekről szól, amelyek irányítják viselkedésünket a társadalomban. Az etika nem törvényeken alapul, hanem széles körben elfogadott normákon arról, hogy mi a "helyes és helytelen". Az etikai megfontolások azonban befolyásolhatják a vállalati irányítási kezdeményezéseket és a kormányzati szabályozásokat, amelyek több ösztönzőt teremtenek a megfelelésre.
**Adatetika** egy [új etikai ág](https://royalsocietypublishing.org/doi/full/10.1098/rsta.2016.0360#sec-1), amely "az _adatokkal, algoritmusokkal és a hozzájuk kapcsolódó gyakorlatokkal_ kapcsolatos erkölcsi problémákat tanulmányozza és értékeli". Itt az **"adatok"** az adatok generálásával, rögzítésével, kurálásával, feldolgozásával, terjesztésével, megosztásával és felhasználásával kapcsolatos cselekvésekre összpontosítanak, az **"algoritmusok"** az MI-re, ügynökökre, gépi tanulásra és robotokra, míg a **"gyakorlatok"** olyan témákra, mint a felelős innováció, programozás, hackelés és etikai kódexek.
**Adatetika** egy [új etikai ág](https://royalsocietypublishing.org/doi/full/10.1098/rsta.2016.0360#sec-1), amely "tanulmányozza és értékeli az _adatokkal, algoritmusokkal és kapcsolódó gyakorlatokkal_ kapcsolatos erkölcsi problémákat". Itt az **"adatok"** az adatok létrehozásával, rögzítésével, gondozásával, feldolgozásával, terjesztésével, megosztásával és felhasználásával kapcsolatos cselekvésekre összpontosítanak, az **"algoritmusok"** az AI-ra, ügynökökre, gépi tanulásra és robotokra, míg a **"gyakorlatok"** olyan témákra, mint a felelős innováció, programozás, hackelés és etikai kódexek.
**Alkalmazott etika** az [erkölcsi megfontolások gyakorlati alkalmazása](https://en.wikipedia.org/wiki/Applied_ethics). Ez az a folyamat, amely során aktívan vizsgáljuk az etikai kérdéseket a _valós cselekvések, termékek és folyamatok_ kontextusában, és korrekciós intézkedéseket teszünk annak érdekében, hogy ezek összhangban maradjanak a meghatározott etikai értékeinkkel.
**Alkalmazott etika** az [erkölcsi megfontolások gyakorlati alkalmazása](https://en.wikipedia.org/wiki/Applied_ethics). Ez az etikai kérdések aktív vizsgálatának folyamata a _valós cselekvések, termékek és folyamatok_ kontextusában, és korrekciós intézkedések megtétele annak érdekében, hogy ezek összhangban maradjanak a meghatározott etikai értékeinkkel.
**Etikai kultúra** az [_alkalmazott etika operacionalizálásáról_](https://hbr.org/2019/05/how-to-design-an-ethical-organization) szól, hogy biztosítsuk, hogy etikai elveinket és gyakorlatainkat következetesen és skálázható módon alkalmazzák a szervezet egészében. A sikeres etikai kultúrák szervezet-szintű etikai elveket határoznak meg, jelentős ösztönzőket biztosítanak a megfeleléshez, és megerősítik az etikai normákat azáltal, hogy minden szinten ösztönzik és erősítik a kívánt viselkedéseket.
**Etikai kultúra** az [_alkalmazott etika működőképessé tétele_](https://hbr.org/2019/05/how-to-design-an-ethical-organization), hogy biztosítsuk, hogy etikai elveink és gyakorlataink következetesen és skálázható módon kerüljenek alkalmazásra az egész szervezetben. A sikeres etikai kultúrák szervezet-szintű etikai elveket határoznak meg, jelentős ösztönzőket biztosítanak a megfeleléshez, és megerősítik az etikai normákat azáltal, hogy minden szinten ösztönzik és erősítik a kívánt viselkedéseket.
## Etikai fogalmak
Ebben a részben olyan fogalmakat tárgyalunk, mint a **közös értékek** (elvek) és az **etikai kihívások** (problémák) az adatetika területén - valamint **esettanulmányokat** vizsgálunk, amelyek segítenek megérteni ezeket a fogalmakat a valós kontextusokban.
Ebben a szakaszban olyan fogalmakat fogunk megvitatni, mint a **közös értékek** (elvek) és **etikai kihívások** (problémák) az adatetika területén - valamint **esettanulmányokat** fogunk vizsgálni, amelyek segítenek megérteni ezeket a fogalmakat valós kontextusban.
### 1. Etikai elvek
Minden adatetikai stratégia az _etikai elvek_ meghatározásával kezdődik - azokkal a "közös értékekkel", amelyek leírják az elfogadható viselkedéseket, és irányítják a megfelelőségi cselekvéseket az adat- és MI-projektjeinkben. Ezeket egyéni vagy csapatszinten is meghatározhatjuk. Azonban a legtöbb nagy szervezet ezeket egy _etikus MI_ küldetésnyilatkozatban vagy keretrendszerben foglalja össze, amelyet vállalati szinten határoznak meg, és következetesen érvényesítenek minden csapatban.
Minden adatetikai stratégia az _etikai elvek_ meghatározásával kezdődik - azokkal a "közös értékekkel", amelyek leírják az elfogadható viselkedéseket, és irányítják a megfelelési cselekvéseket adat- és AI-projektjeinkben. Ezeket egyéni vagy csapatszinten is meghatározhatjuk. Azonban a legtöbb nagy szervezet ezeket egy _etikus AI_ küldetésnyilatkozatban vagy keretrendszerben határozza meg, amelyet vállalati szinten definiálnak és következetesen érvényesítenek minden csapatban.
**Példa:** A Microsoft [Felelős MI](https://www.microsoft.com/en-us/ai/responsible-ai) küldetésnyilatkozata így szól: _"Elkötelezettek vagyunk az MI fejlődése iránt, amelyet olyan etikai elvek vezérelnek, amelyek az embereket helyezik előtérbe"_ - az alábbi keretrendszerben 6 etikai elvet azonosítva:
**Példa:** A Microsoft [Felelős AI](https://www.microsoft.com/en-us/ai/responsible-ai) küldetésnyilatkozata így szól: _"Elkötelezettek vagyunk az AI fejlődése iránt, amelyet etikai elvek vezérelnek, amelyek az embereket helyezik előtérbe"_ - az alábbi keretrendszerben 6 etikai elvet azonosítva:
![Felelős MI a Microsoftnál](https://docs.microsoft.com/en-gb/azure/cognitive-services/personalizer/media/ethics-and-responsible-use/ai-values-future-computed.png)
![Felelős AI a Microsoftnál](https://docs.microsoft.com/en-gb/azure/cognitive-services/personalizer/media/ethics-and-responsible-use/ai-values-future-computed.png)
Vizsgáljuk meg röviden ezeket az elveket. A _transzparencia_ és az _elszámoltathatóság_ alapvető értékek, amelyekre a többi elv épül - kezdjük ezekkel:
Nézzük meg röviden ezeket az elveket. A _transzparencia_ és _felelősségvállalás_ alapvető értékek, amelyekre a többi elv épül - kezdjük ezekkel:
* [**Elszámoltathatóság**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) biztosítja, hogy a szakemberek _felelősséget vállaljanak_ adat- és MI-műveleteikért, valamint az etikai elvek betartásáért.
* [**Transzparencia**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) biztosítja, hogy az adat- és MI-műveletek _érthetőek_ legyenek a felhasználók számára, megmagyarázva a döntések mögötti mit és miért.
* [**Méltányosság**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1%3aprimaryr6) - biztosítja, hogy az MI _minden embert_ méltányosan kezeljen, kezelve az adat- és rendszerszintű implicit társadalmi-technikai torzításokat.
* [**Megbízhatóság és biztonság**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - biztosítja, hogy az MI _következetesen_ viselkedjen a meghatározott értékekkel összhangban, minimalizálva a potenciális károkat vagy nem szándékos következményeket.
* [**Adatvédelem és biztonság**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - az adatok eredetének megértéséről és a felhasználók számára _adatvédelem és kapcsolódó védelem_ biztosításáról szól.
* [**Befogadás**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - az MI-megoldások szándékos tervezéséről szól, hogy azok _széles körű emberi igényekhez_ és képességekhez alkalmazkodjanak.
* [**Felelősségvállalás**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) arra ösztönzi a szakembereket, hogy _felelősséget vállaljanak_ adat- és AI-műveleteikért, valamint az etikai elvek betartásáért.
* [**Transzparencia**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) biztosítja, hogy az adat- és AI-cselekvések _érthetőek_ legyenek a felhasználók számára, megmagyarázva a döntések mögötti mit és miért.
* [**Méltányosság**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1%3aprimaryr6) - arra összpontosít, hogy az AI _minden embert_ méltányosan kezeljen, foglalkozva az adatokban és rendszerekben lévő szisztematikus vagy implicit szociotechnikai torzításokkal.
* [**Megbízhatóság és biztonság**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - biztosítja, hogy az AI _következetesen_ viselkedjen a meghatározott értékekkel összhangban, minimalizálva a potenciális károkat vagy nem szándékos következményeket.
* [**Adatvédelem és biztonság**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - az adatvonal megértéséről és a felhasználók számára _adatvédelem és kapcsolódó védelem_ biztosításáról szól.
* [**Befogadás**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - az AI-megoldások szándékos tervezéséről szól, hogy azok _széles körű emberi igényekhez_ és képességekhez alkalmazkodjanak.
> 🚨 Gondolkodj el azon, hogy mi lehetne a te adatetikai küldetésnyilatkozatod. Fedezd fel más szervezetek etikus MI-keretrendszereit - itt van néhány példa: [IBM](https://www.ibm.com/cloud/learn/ai-ethics), [Google](https://ai.google/principles), és [Facebook](https://ai.facebook.com/blog/facebooks-five-pillars-of-responsible-ai/). Milyen közös értékeket találsz bennük? Hogyan kapcsolódnak ezek az elvek az általuk működtetett MI-termékekhez vagy iparágakhoz?
> 🚨 Gondolkodj el azon, hogy mi lehetne az adatetikai küldetésnyilatkozatod. Fedezd fel más szervezetek etikus AI keretrendszereit - itt van néhány példa: [IBM](https://www.ibm.com/cloud/learn/ai-ethics), [Google](https://ai.google/principles), és [Facebook](https://ai.facebook.com/blog/facebooks-five-pillars-of-responsible-ai/). Milyen közös értékekkel rendelkeznek? Hogyan kapcsolódnak ezek az elvek az általuk működtetett AI-termékhez vagy iparághoz?
### 2. Etikai kihívások
Miután meghatároztuk az etikai elveket, a következő lépés az adat- és MI-műveleteink értékelése annak érdekében, hogy azok összhangban állnak-e ezekkel a közös értékekkel. Gondolj a cselekedeteidre két kategóriában: _adatgyűjtés_ és _algoritmus tervezés_.
Miután meghatároztuk az etikai elveket, a következő lépés az adat- és AI-cselekvéseink értékelése annak érdekében, hogy azok összhangban állnak-e ezekkel a közös értékekkel. Gondolj a cselekvéseidre két kategóriában: _adatgyűjtés_ és _algoritmus tervezés_.
Az adatok gyűjtése során a műveletek valószínűleg **személyes adatokat** vagy személyesen azonosítható információkat (PII) érintenek, amelyek azonosítható élő személyekre vonatkoznak. Ez magában foglalja a [különféle nem személyes adatokat](https://ec.europa.eu/info/law/law-topic/data-protection/reform/what-personal-data_en), amelyek _együttesen_ azonosítanak egy személyt. Az etikai kihívások kapcsolódhatnak az _adatvédelemhez_, _adatbirtokláshoz_ és kapcsolódó témákhoz, mint például a _tájékozott beleegyezés_ és a _felhasználói szellemi tulajdonjogok_.
Az adatgyűjtés során a cselekvések valószínűleg **személyes adatokat** vagy személyesen azonosítható információkat (PII) érintenek az azonosítható élő egyének számára. Ez magában foglalja a [különféle nem személyes adatokat](https://ec.europa.eu/info/law/law-topic/data-protection/reform/what-personal-data_en), amelyek _együttesen_ azonosítanak egy egyént. Az etikai kihívások az _adatvédelem_, _adatbirtoklás_ és kapcsolódó témák, mint például _tájékozott beleegyezés_ és _szellemi tulajdonjogok_ köré összpontosulhatnak.
Az algoritmus tervezése során a műveletek magukban foglalják a **adatkészletek** gyűjtését és kurálását, majd ezek felhasználását **adatmodellek** betanítására és telepítésére, amelyek valós környezetben jósolnak eredményeket vagy automatizálnak döntéseket. Az etikai kihívások felmerülhetnek az _adatkészlet torzításából_, _adatminőségi_ problémákból, _méltánytalanságból_ és _félrevezetésből_ az algoritmusokban - beleértve néhány rendszerszintű problémát is.
Az algoritmus tervezés során a cselekvések magukban foglalják **adatkészletek** gyűjtését és gondozását, majd ezek felhasználását **adatmodellek** képzésére és telepítésére, amelyek valós kontextusban előrejelzéseket készítenek vagy automatizált döntéseket hoznak. Az etikai kihívások a _adatkészlet torzítás_, _adatminőség_ problémák, _méltánytalanság_ és _félrevezetés_ köré összpontosulhatnak az algoritmusokban - beleértve néhány szisztematikus jellegű problémát.
Mindkét esetben az etikai kihívások olyan területeket emelnek ki, ahol cselekedeteink konfliktusba kerülhetnek közös értékeinkkel. Az ilyen aggályok észleléséhez, enyhítéséhez, minimalizálásához vagy megszüntetéséhez erkölcsi "igen/nem" kérdéseket kell feltennünk a cselekedeteinkkel kapcsolatban, majd szükség esetén korrekciós intézkedéseket kell tennünk. Nézzünk meg néhány etikai kihívást és az általuk felvetett erkölcsi kérdéseket:
Mindkét esetben az etikai kihívások olyan területeket emelnek ki, ahol cselekvéseink konfliktusba kerülhetnek közös értékeinkkel. Az ilyen aggályok észleléséhez, enyhítéséhez, minimalizálásához vagy megszüntetéséhez erkölcsi "igen/nem" kérdéseket kell feltennünk cselekvéseinkkel kapcsolatban, majd szükség esetén korrekciós intézkedéseket kell tennünk. Nézzünk meg néhány etikai kihívást és az általuk felvetett erkölcsi kérdéseket:
#### 2.1 Adatbirtoklás
Az adatok gyűjtése gyakran személyes adatokat érint, amelyek az adat alanyait azonosíthatják. Az [adatbirtoklás](https://permission.io/blog/data-ownership) az adatok létrehozásával, feldolgozásával és terjesztésével kapcsolatos _ellenőrzésről_ és [_felhasználói jogokról_](https://permission.io/blog/data-ownership) szól.
Az adatgyűjtés gyakran személyes adatokat érint, amelyek az adat alanyait azonosíthatják. Az [adatbirtoklás](https://permission.io/blog/data-ownership) az adatok létrehozásával, feldolgozásával és terjesztésével kapcsolatos _ellenőrzésről_ és [_felhasználói jogokról_](https://permission.io/blog/data-ownership) szól.
Az erkölcsi kérdések, amelyeket fel kell tennünk:
* Ki birtokolja az adatokat? (felhasználó vagy szervezet)
* Milyen jogai vannak az adat alanyainak? (pl. hozzáférés, törlés, hordozhatóság)
* Milyen jogai vannak a szervezeteknek? (pl. rosszindulatú felhasználói vélemények helyesbítése)
* Milyen jogai vannak a szervezeteknek? (pl. rosszindulatú felhasználói vélemények helyreállítása)
#### 2.2 Tájékozott beleegyezés
A [tájékozott beleegyezés](https://legaldictionary.net/informed-consent/) azt jelenti, hogy a felhasználók egy cselekvéshez (például adatgyűjtéshez) _teljes körű megértéssel_ járulnak hozzá, beleértve a célokat, a lehetséges kockázatokat és az alternatívákat.
A [tájékozott beleegyezés](https://legaldictionary.net/informed-consent/) azt jelenti, hogy a felhasználók egy cselekvéshez (például adatgyűjtéshez) _teljes körű megértéssel_ járulnak hozzá, beleértve a célt, a potenciális kockázatokat és az alternatívákat.
Itt feltett kérdések:
Itt felmerülő kérdések:
* A felhasználó (adat alanya) engedélyt adott az adatok rögzítésére és felhasználására?
* A felhasználó megértette, hogy mi célból gyűjtötték az adatokat?
* A felhasználó megértette a részvételéből eredő lehetséges kockázatokat?
* A felhasználó megértette, hogy miért gyűjtötték az adatokat?
* A felhasználó megértette a részvételéből eredő potenciális kockázatokat?
#### 2.3 Szellemi tulajdon
A [szellemi tulajdon](https://en.wikipedia.org/wiki/Intellectual_property) az emberi kezdeményezésből származó immateriális alkotásokra utal, amelyek _gazdasági értékkel_ bírhatnak egyének vagy vállalkozások számára.
Itt feltett kérdések:
* Az összegyűjtött adatok gazdasági értékkel bírnak-e egy felhasználó vagy vállalkozás számára?
Itt felmerülő kérdések:
* A gyűjtött adatok gazdasági értékkel bírnak-e egy felhasználó vagy vállalkozás számára?
* Van-e a **felhasználónak** szellemi tulajdona itt?
* Van-e a **szervezetnek** szellemi tulajdona itt?
* Ha ezek a jogok léteznek, hogyan védjük őket?
@ -108,60 +108,65 @@ Itt feltett kérdések:
Az [adatvédelem](https://www.northeastern.edu/graduate/blog/what-is-data-privacy/) vagy információs magánélet a felhasználói magánélet megőrzésére és a felhasználói identitás védelmére vonatkozik a személyesen azonosítható információk tekintetében.
Itt feltett kérdések:
* A felhasználók (személyes) adatai védettek-e a hackelésekkel és szivárgásokkal szemben?
* A felhasználók adatai csak jogosult felhasználók és kontextusok számára érhetők el?
* A felhasználók anonimitása megmarad-e, amikor az adatokat megosztják vagy terjesztik?
* Egy felhasználó
[Algorithmusok méltányossága](https://towardsdatascience.com/what-is-algorithm-fairness-3182e161cf9f) azt vizsgálja, hogy az algoritmus tervezése szisztematikusan diszkriminálja-e az adatközösségek bizonyos alcsoportjait, ami [potenciális károkat](https://docs.microsoft.com/en-us/azure/machine-learning/concept-fairness-ml) okozhat az _erőforrások elosztásában_ (amikor az erőforrásokat megtagadják vagy visszatartják az adott csoporttól) és a _szolgáltatás minőségében_ (amikor az AI nem olyan pontos bizonyos alcsoportok esetében, mint másoknál).
Itt felmerülő kérdések:
* A felhasználók (személyes) adatai védettek-e a hackelés és szivárgás ellen?
* A felhasználók adatai csak jogosult felhasználók és kontextusok számára hozzáférhetők-e?
* A felhasználók anonimitása megőrzött-e, amikor az adatokat megosztják vagy terjesztik?
* Lehet-e egy felhasználót azonosítani anonimizált adatállományokból?
#### 2.5 Az elfeledtetés joga
Az [elfeledtet
[Algorithmusok méltányossága](https://towardsdatascience.com/what-is-algorithm-fairness-3182e161cf9f) azt vizsgálja, hogy az algoritmus tervezése szisztematikusan diszkriminál-e bizonyos adatcsoportok ellen, ami [potenciális károkat](https://docs.microsoft.com/en-us/azure/machine-learning/concept-fairness-ml) okozhat az _elosztásban_ (ahol erőforrásokat tagadnak meg vagy vonnak vissza az adott csoporttól) és a _szolgáltatás minőségében_ (ahol az AI nem olyan pontos bizonyos csoportok esetében, mint másoknál).
Kérdések, amelyeket érdemes megvizsgálni:
* Értékeltük-e a modell pontosságát különböző alcsoportok és körülmények között?
* Vizsgáltuk-e a rendszert potenciális károk (pl. sztereotípiák) szempontjából?
* Értékeltük-e a modell pontosságát különböző csoportok és feltételek esetében?
* Vizsgáltuk-e a rendszert potenciális károk (pl. sztereotipizálás) szempontjából?
* Tudjuk-e módosítani az adatokat vagy újratanítani a modelleket az azonosított károk enyhítése érdekében?
Fedezz fel olyan forrásokat, mint az [AI méltányossági ellenőrzőlisták](https://query.prod.cms.rt.microsoft.com/cms/api/am/binary/RE4t6dA), hogy többet megtudj.
#### 2.9 Félrevezetés
[Adataz félrevezetése](https://www.sciencedirect.com/topics/computer-science/misrepresentation) arra vonatkozik, hogy vajon őszintén jelentett adatokból származó betekintéseket megtévesztő módon kommunikálunk-e, hogy támogassunk egy kívánt narratívát.
[Adataz félrevezetése](https://www.sciencedirect.com/topics/computer-science/misrepresentation) arról szól, hogy vajon őszintén közölt adatokból származó betekintéseket megtévesztő módon kommunikálunk-e egy kívánt narratíva támogatása érdekében.
Kérdések, amelyeket érdemes megvizsgálni:
* Jelentünk-e hiányos vagy pontatlan adatokat?
* Úgy vizualizáljuk-e az adatokat, hogy félrevezető következtetéseket vonjanak le belőlük?
* Úgy vizualizáljuk-e az adatokat, hogy az félrevezető következtetéseket eredményezzen?
* Használunk-e szelektív statisztikai technikákat az eredmények manipulálására?
* Vannak-e alternatív magyarázatok, amelyek más következtetést kínálhatnak?
#### 2.10 Szabad választás
A [szabad választás illúziója](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice) akkor fordul elő, amikor a rendszer "választási architektúrái" döntéshozó algoritmusokat használnak arra, hogy az embereket egy preferált eredmény felé tereljék, miközben úgy tűnik, hogy lehetőségeket és kontrollt adnak nekik. Ezek a [sötét minták](https://www.darkpatterns.org/) társadalmi és gazdasági károkat okozhatnak a felhasználóknak. Mivel a felhasználói döntések befolyásolják a viselkedési profilokat, ezek a cselekvések potenciálisan meghatározhatják a jövőbeli választásokat, amelyek felerősíthetik vagy kiterjeszthetik a károk hatását.
A [szabad választás illúziója](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice) akkor fordul elő, amikor a rendszer „választási architektúrái” döntéshozó algoritmusokat használnak arra, hogy az embereket egy preferált eredmény felé tereljék, miközben látszólag lehetőségeket és kontrollt kínálnak nekik. Ezek a [sötét minták](https://www.darkpatterns.org/) társadalmi és gazdasági károkat okozhatnak a felhasználóknak. Mivel a felhasználói döntések hatással vannak a viselkedési profilokra, ezek a cselekvések potenciálisan befolyásolják a jövőbeli választásokat, amelyek felerősíthetik vagy kiterjeszthetik ezen károk hatását.
Kérdések, amelyeket érdemes megvizsgálni:
* Értette-e a felhasználó annak a választásnak a következményeit?
* Tudott-e a felhasználó az (alternatív) választási lehetőségekről és azok előnyeiről és hátrányairól?
* Tudott-e a felhasználó (alternatív) választási lehetőségekről és azok előnyeiről és hátrányairól?
* Visszafordíthatja-e a felhasználó egy automatizált vagy befolyásolt döntést később?
### 3. Esettanulmányok
Ahhoz, hogy ezeket az etikai kihívásokat valós kontextusba helyezzük, érdemes olyan esettanulmányokat megvizsgálni, amelyek kiemelik az egyénekre és a társadalomra gyakorolt potenciális károkat és következményeket, amikor az ilyen etikai vétségeket figyelmen kívül hagyják.
Ahhoz, hogy ezeket az etikai kihívásokat valós kontextusba helyezzük, érdemes olyan esettanulmányokat megvizsgálni, amelyek rávilágítanak az egyénekre és a társadalomra gyakorolt potenciális károkra és következményekre, amikor az ilyen etikai vétségeket figyelmen kívül hagyják.
Íme néhány példa:
| Etikai kihívás | Esettanulmány |
|--- |--- |
| **Tájékozott beleegyezés** | 1972 - [Tuskegee szifilisz tanulmány](https://en.wikipedia.org/wiki/Tuskegee_Syphilis_Study) - Az afrikai-amerikai férfiak, akik részt vettek a tanulmányban, ingyenes orvosi ellátást ígértek, _de megtévesztették_ őket a kutatók, akik nem tájékoztatták őket a diagnózisukról vagy a kezelés elérhetőségéről. Sok alany meghalt, és partnereik vagy gyermekeik is érintettek voltak; a tanulmány 40 évig tartott. |
| **Adatvédelem** | 2007 - A [Netflix adatdíj](https://www.wired.com/2007/12/why-anonymous-data-sometimes-isnt/) kutatóknak _10M anonimizált filmértékelést 50K ügyféltől_ biztosított, hogy javítsák az ajánlási algoritmusokat. Azonban a kutatók képesek voltak az anonimizált adatokat személyazonosító adatokkal összekapcsolni _külső adatbázisokban_ (pl. IMDb kommentek), hatékonyan "deanonimizálva" néhány Netflix előfizetőt.|
| **Gyűjtési torzítás** | 2013 - Boston városa [kifejlesztette a Street Bump](https://www.boston.gov/transportation/street-bump) alkalmazást, amely lehetővé tette a polgárok számára, hogy kátyúkat jelentsenek, jobb úthálózati adatokat biztosítva a városnak a problémák megtalálásához és javításához. Azonban [az alacsonyabb jövedelmű csoportoknak kevesebb hozzáférésük volt autókhoz és telefonokhoz](https://hbr.org/2013/04/the-hidden-biases-in-big-data), így az ő úthálózati problémáik láthatatlanok maradtak az alkalmazásban. A fejlesztők akadémikusokkal dolgoztak együtt, hogy _méltányos hozzáférést és digitális szakadékokat_ kezeljenek a méltányosság érdekében. |
| **Algoritmusok méltányossága** | 2018 - Az MIT [Gender Shades Study](http://gendershades.org/overview.html) értékelte a nemek osztályozására szolgáló AI termékek pontosságát, feltárva a pontossági hiányosságokat a nők és színes bőrűek esetében. Egy [2019-es Apple Card](https://www.wired.com/story/the-apple-card-didnt-see-genderand-thats-the-problem/) látszólag kevesebb hitelt kínált a nőknek, mint a férfiaknak. Mindkettő az algoritmikus torzítás problémáit illusztrálta, amelyek társadalmi-gazdasági károkat okoztak.|
| **Adatok félrevezetése** | 2020 - A [Georgia Egészségügyi Minisztérium COVID-19 grafikonokat](https://www.vox.com/covid-19-coronavirus-us-response-trump/2020/5/18/21262265/georgia-covid-19-cases-declining-reopening) tett közzé, amelyek látszólag félrevezették a polgárokat az igazolt esetek trendjeiről, nem kronológiai sorrendben az x-tengelyen. Ez a vizualizációs trükkök általi félrevezetést illusztrálja. |
| **Szabad választás illúziója** | 2020 - A tanulási alkalmazás [ABCmouse 10M dollárt fizetett az FTC panasz rendezésére](https://www.washingtonpost.com/business/2020/09/04/abcmouse-10-million-ftc-settlement/), ahol a szülők nem tudták lemondani az előfizetéseket, amelyekbe belecsúsztak. Ez a választási architektúrák sötét mintáit illusztrálja, ahol a felhasználókat potenciálisan káros döntések felé terelték. |
| **Adatvédelem és felhasználói jogok** | 2021 - A Facebook [adatvédelmi incidens](https://www.npr.org/2021/04/09/986005820/after-data-breach-exposes-530-million-facebook-says-it-will-not-notify-users) 530M felhasználó adatait tette ki, ami 5B dolláros egyezséget eredményezett az FTC-vel. Azonban megtagadta a felhasználók értesítését az incidensről, megsértve a felhasználói jogokat az adatátláthatóság és hozzáférés terén. |
| **Tájékozott beleegyezés** | 1972 - [Tuskegee szifilisz tanulmány](https://en.wikipedia.org/wiki/Tuskegee_Syphilis_Study) - Az afrikai-amerikai férfiak, akik részt vettek a tanulmányban, ingyenes orvosi ellátást ígértek, _de megtévesztették őket_ a kutatók, akik nem tájékoztatták őket a diagnózisukról vagy a kezelés elérhetőségéről. Sok alany meghalt, és partnereik vagy gyermekeik is érintettek voltak; a tanulmány 40 évig tartott. |
| **Adatvédelem** | 2007 - A [Netflix adatdíj](https://www.wired.com/2007/12/why-anonymous-data-sometimes-isnt/) kutatóknak _10M anonimizált filmértékelést_ biztosított 50K ügyféltől az ajánlási algoritmusok javítása érdekében. Azonban a kutatók képesek voltak az anonimizált adatokat személyazonosító adatokkal összekapcsolni _külső adatbázisokban_ (pl. IMDb kommentek), hatékonyan „deanonimizálva” néhány Netflix előfizetőt.|
| **Gyűjtési torzítás** | 2013 - Boston városa [kifejlesztette a Street Bump](https://www.boston.gov/transportation/street-bump) nevű alkalmazást, amely lehetővé tette a polgárok számára, hogy kátyúkat jelentsenek, jobb úthálózati adatokat biztosítva a városnak a problémák megtalálásához és javításához. Azonban [az alacsonyabb jövedelmű csoportoknak kevesebb hozzáférésük volt autókhoz és telefonokhoz](https://hbr.org/2013/04/the-hidden-biases-in-big-data), így az ő úthálózati problémáik láthatatlanok maradtak az alkalmazásban. A fejlesztők akadémikusokkal dolgoztak együtt az _egyenlő hozzáférés és digitális szakadék_ kérdéseinek megoldása érdekében. |
| **Algoritmusok méltányossága** | 2018 - Az MIT [Gender Shades Study](http://gendershades.org/overview.html) értékelte a nemek osztályozására szolgáló AI termékek pontosságát, feltárva a pontossági hiányosságokat a nők és színes bőrűek esetében. Egy [2019-es Apple Card](https://www.wired.com/story/the-apple-card-didnt-see-genderand-thats-the-problem/) látszólag kevesebb hitelt kínált a nőknek, mint a férfiaknak. Mindkettő rávilágított az algoritmikus torzítás problémáira, amelyek társadalmi-gazdasági károkat okoztak.|
| **Adatok félrevezetése** | 2020 - A [Georgia Egészségügyi Minisztérium COVID-19 grafikonokat](https://www.vox.com/covid-19-coronavirus-us-response-trump/2020/5/18/21262265/georgia-covid-19-cases-declining-reopening) tett közzé, amelyek látszólag félrevezették a polgárokat az igazolt esetek trendjeiről a nem kronológiai sorrendben elhelyezett x-tengely miatt. Ez a vizualizációs trükkök általi félrevezetést illusztrálja. |
| **Szabad választás illúziója** | 2020 - A tanulási alkalmazás [ABCmouse 10M dollárt fizetett az FTC panasz rendezésére](https://www.washingtonpost.com/business/2020/09/04/abcmouse-10-million-ftc-settlement/), ahol a szülők nem tudták lemondani az előfizetéseket, amelyekbe „csapdába estek”. Ez a választási architektúrák sötét mintáit illusztrálja, ahol a felhasználókat potenciálisan káros döntések felé terelték. |
| **Adatvédelem és felhasználói jogok** | 2021 - A Facebook [adatvédelmi incidens](https://www.npr.org/2021/04/09/986005820/after-data-breach-exposes-530-million-facebook-says-it-will-not-notify-users) 530M felhasználó adatait tette ki, ami 5B dolláros egyezséget eredményezett az FTC-vel. Azonban megtagadta a felhasználók értesítését az incidensről, megsértve a felhasználói jogokat az adatok átláthatóságával és hozzáférésével kapcsolatban. |
Szeretnél további esettanulmányokat felfedezni? Nézd meg ezeket a forrásokat:
* [Ethics Unwrapped](https://ethicsunwrapped.utexas.edu/case-studies) - etikai dilemmák különböző iparágakban.
* [Data Science Ethics course](https://www.coursera.org/learn/data-science-ethics#syllabus) - mérföldkőnek számító esettanulmányok.
* [Where things have gone wrong](https://deon.drivendata.org/examples/) - deon ellenőrzőlista példákkal.
> 🚨 Gondolj azokra az esettanulmányokra, amelyeket láttál - tapasztaltál vagy érintett-e hasonló etikai kihívást az életedben? Tudsz legalább egy másik esettanulmányt, amely illusztrálja az ebben a szakaszban tárgyalt etikai kihívások egyikét?
> 🚨 Gondolj az általad látott esettanulmányokra - tapasztaltál vagy érintett voltál hasonló etikai kihívásban az életedben? Tudsz legalább egy másik esettanulmányt, amely illusztrálja az ebben a szakaszban tárgyalt etikai kihívások egyikét?
## Alkalmazott etika
@ -169,51 +174,55 @@ Beszéltünk az etikai fogalmakról, kihívásokról és esettanulmányokról va
### 1. Szakmai kódexek
A szakmai kódexek egy lehetőséget kínálnak a szervezetek számára, hogy "ösztönözzék" tagjaikat az etikai elveik és küldetésük támogatására. A kódexek _erkölcsi iránymutatások_ a szakmai viselkedéshez, segítve az alkalmazottakat vagy tagokat olyan döntések meghozatalában, amelyek összhangban vannak a szervezet elveivel. Csak annyira hatékonyak, amennyire a tagok önkéntes megfelelése; azonban sok szervezet további jutalmakat és büntetéseket kínál, hogy motiválja a tagokat a megfelelésre.
A szakmai kódexek egy lehetőséget kínálnak a szervezetek számára, hogy „ösztönözzék” tagjaikat az etikai elvek és küldetésnyilatkozat támogatására. A kódexek _erkölcsi iránymutatások_ a szakmai viselkedéshez, segítve az alkalmazottakat vagy tagokat olyan döntések meghozatalában, amelyek összhangban vannak a szervezet elveivel. Csak annyira hatékonyak, amennyire a tagok önkéntes megfelelése; azonban sok szervezet további jutalmakat és büntetéseket kínál a megfelelés ösztönzésére.
Példák:
* [Oxford Munich](http://www.code-of-ethics.org/code-of-conduct/) Etikai Kódex
* [Data Science Association](http://datascienceassn.org/code-of-conduct.html) Magatartási Kódex (2013-ban létrehozva)
* [ACM Code of Ethics and Professional Conduct](https://www.acm.org/code-of-ethics) (1993 óta)
> 🚨 Tagja vagy valamilyen szakmai mérnöki vagy adatkutatási szervezetnek? Nézd meg a weboldalukat, hogy meghatároznak-e szakmai etikai kódexet. Mit mond ez az etikai elveikről? Hogyan "ösztönzik" a tagokat a kódex követésére?
> 🚨 Tagja vagy valamilyen szakmai mérnöki vagy adatkutatási szervezetnek? Nézd meg a weboldalukat, hogy meghatároznak-e szakmai etikai kódexet. Mit mond ez az etikai elveikről? Hogyan „ösztönzik” a tagokat a kódex követésére?
### 2. Etikai ellenőrzőlisták
Míg a szakmai kódexek meghatározzák a szakemberek _etikai viselkedését_, [ismert korlátokkal](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md) rendelkeznek a végrehajtásban, különösen nagyszabású projektek esetében. Ehelyett sok adatkutatási szakértő [ellenőrzőlistákat javasol](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md), amelyek **összekapcsolják az elveket a gyakorlatokkal** determinisztikusabb és cselekvőképesebb módon.
Az ellenőrzőlisták a kérdéseket "igen/nem" feladatokká alakítják, amelyek operacionalizálhatók, lehetővé téve, hogy nyomon kövessék őket a szokásos termékkiadási munkafolyamatok részeként.
Az ellenőrzőlisták a kérdéseket „igen/nem” feladatokká alakítják, amelyek operacionalizálhatók, lehetővé téve, hogy nyomon kövessék őket a szokásos termékkiadási munkafolyamatok részeként.
Példák:
* [Deon](https://deon.drivendata.org/) - általános célú adatetikai ellenőrzőlista, amelyet [iparági ajánlások](https://deon.drivendata.org/#checklist-citations) alapján hoztak létre, parancssori eszközzel a könnyű integráció érdekében.
* [Adatvédelmi audit ellenőrzőlista](https://cyber.harvard.edu/ecommerce/privacyaudit.html) - általános iránymutatást nyújt az információkezelési gyakorlatokhoz jogi és társadalmi kitettség szempontjából.
* [AI méltányossági ellenőrzőlista](https://www.microsoft.com/en-us/research/project/ai-fairness-checklist/) - AI szakemberek által létrehozva, hogy támogassák a méltányossági ellenőrzések bevezetését és integrációját az AI fejlesztési ciklusokba.
* [22 kérdés az adatok és AI etikájáról](https://medium.com/the-organization/22-questions-for-ethics-in-data-and-ai-efb68fd19429) - nyitottabb keretrendszer, amelyet az etikai kérdések kezdeti feltárására strukturáltak a tervezés, megvalósítás és szervezeti kontextusokban.
* [AI méltányossági ellenőrzőlista](https://www.microsoft.com/en-us/research/project/ai-fairness-checklist/) - AI szakemberek által létrehozva, hogy támogassa a méltányossági ellenőrzések bevezetését és integrációját az AI fejlesztési ciklusokba.
* [22 kérdés az adatok és AI etikájáról](https://medium.com/the-organization/22-questions-for-ethics-in-data-and-ai-efb68fd19429) - nyitottabb keretrendszer, amelyet az etikai kérdések kezdeti feltárására terveztek a tervezés, megvalósítás és szervezeti kontextusokban.
### 3. Etikai szabályozások
Az etika közös értékek meghatározásáról és a helyes cselekvésről szól _önkéntesen_. **Megfelelés** arról szól, hogy _követjük a törvényt_, ha és ahol meghatározták. **Irányítás** szélesebb értelemben magában foglalja az összes módot, ahogyan a szervezetek működnek az etikai elvek érvényesítése és a meghatározott törvények betartása érdekében.
Az etika közös értékek meghatározásáról és a helyes cselekvésről szól _önkéntesen_. **Megfelelés** a _törvények betartásáról_ szól, ha és ahol meghatározták. **Irányítás** szélesebb értelemben magában foglalja az összes olyan módot, ahogyan a szervezetek működnek az etikai elvek érvényesítése és a meghatározott törvények betartása érdekében.
Ma az irányítás két formát ölt a szervezeteken belül. Először is, az **etikus AI** elvek meghatározásáról és a gyakorlatok létrehozásáról szól, hogy operacionalizálják az elfogadást az összes AI-val kapcsolatos projektben a szervezeten belül. Másodszor, arról szól, hogy megfeleljenek az összes kormány által előírt **adatvédelmi szabályozásnak** azokban a régiókban, ahol működnek.
Ma az irányítás két formát ölt a szervezeteken belül. Először is, az **etikus AI** elvek meghatározásáról és a gyakorlatok létrehozásáról szól, amelyek operacionalizálják az elfogadást az összes AI-val kapcsolatos projektben a szervezeten belül. Másodszor, az összes kormány által előírt **adatvédelmi szabályozásnak** való megfelelésről szól azokban a régiókban, ahol működik.
Adatvédelmi és adatvédelmi szabályozások példái:
* `1974`, [US Privacy Act](https://www.justice.gov/opcl/privacy-act-1974) - szabályozza a _szövetségi kormány_ személyes információk gyűjtését, használatát és közzétételét.
* `1974`, [US Privacy Act](https://www.justice.gov/opcl/privacy-act-1974) - szabályozza a _szövetségi kormány_ személyes adatok gyűjtését, használatát és közzétételét.
* `1996`, [US Health Insurance Portability & Accountability Act (HIPAA)](https://www.cdc.gov/phlp/publications/topic/hipaa.html) - védi a személyes egészségügyi adatokat.
* `1998`, [US Children's Online Privacy Protection Act (COPPA)](https://www.ftc.gov/enforcement/rules/rulemaking-regulatory-reform-proceedings/childrens-online-privacy-protection-rule) - védi a 13 év alatti gyermekek adatvédelmét.
* `2018`, [General Data Protection Regulation (GDPR)](https://gdpr-info.eu/) - felhasználói jogokat, adatvédelmet és adatbiztonságot biztosít.
* `2018`, [California Consumer Privacy Act (CCPA)](https://www.oag.ca.gov/privacy/ccpa) több _jogot_ biztosít a fogyasztóknak a (személyes) adataik felett.
* `2021`, Kína [Személyes Információk Védelmi Törvénye](https://www.reuters.com/world/china/china-passes-new-personal-data-privacy-law-take-effect-nov-1-2021-08-20/) éppen elfogadva, létrehozva az egyik legerősebb online adatvédelmi szabályozást világszerte.
* `2018`, [California Consumer Privacy Act (CCPA)](https://www.oag.ca.gov/privacy/ccpa) több _jogot_ biztosít a fogyasztóknak a személyes adataik felett.
* `2021`, Kína [Személyes Adatvédelmi Törvénye](https://www.reuters.com/world/china/china-passes-new-personal-data-privacy-law-take-effect-nov-1-2021-08-20/) éppen elfogadva, létrehozva az egyik legerősebb online adatvédelmi szabályozást világszerte.
> 🚨 Az Európai Unió által meghatározott GDPR (General Data Protection Regulation) ma az egyik legbefolyásosabb adatvédelmi szabályozás. Tudtad, hogy [8 felhasználói jogot](https://www.freeprivacypolicy.com/blog/8-user-rights-gdpr) is meghatároz a polgárok digitális adatvédelmének és személyes adatainak védelmére? Ismerd meg, mik ezek, és miért fontosak.
### 4. Etikai kultúra
> 🚨 Az Európai Unió által meghatározott GDPR (Általános Adatvédelmi Rendelet) ma az egyik legbefolyásosabb adatvédelmi szabályozás. Tudtad, hogy [8 felhasználói jogot](https://www.freeprivacypolicy.com/blog/8-user-rights-gdpr) is meghatároz a digitális adatvédelem és személyes adatok védelme érdek
Fontos meg
* [A felelős mesterséges intelligencia alapelvei](https://docs.microsoft.com/en-us/learn/modules/responsible-ai-principles/) - ingyenes tanulási útvonal a Microsoft Learn-től.
* [Etika és adattudomány](https://resources.oreilly.com/examples/0636920203964) - O'Reilly EBook (M. Loukides, H. Mason és mások)
* [Etika és adat tudomány](https://resources.oreilly.com/examples/0636920203964) - O'Reilly EBook (M. Loukides, H. Mason és mások)
* [Adattudományi etika](https://www.coursera.org/learn/data-science-ethics#syllabus) - online kurzus a Michigani Egyetemtől.
* [Etika kibontva](https://ethicsunwrapped.utexas.edu/case-studies) - esettanulmányok a Texasi Egyetemtől.
# Feladat
[Írj egy esettanulmányt az adatetikáról](assignment.md)
[Írj egy adatetikai esettanulmányt](assignment.md)
---

@ -1,8 +1,8 @@
<!--
CO_OP_TRANSLATOR_METADATA:
{
"original_hash": "8796f41f566a0a8ebb72863a83d558ed",
"translation_date": "2025-08-28T19:02:20+00:00",
"original_hash": "3a34157cc63516eba97c89a0b2f8c3e6",
"translation_date": "2025-09-03T21:37:18+00:00",
"source_file": "1-Introduction/02-ethics/README.md",
"language_code": "id"
}
@ -17,13 +17,13 @@ CO_OP_TRANSLATOR_METADATA:
Kita semua adalah warga data yang hidup di dunia yang dipenuhi data.
Tren pasar menunjukkan bahwa pada tahun 2022, 1 dari 3 organisasi besar akan membeli dan menjual data mereka melalui [Pasar dan Bursa Online](https://www.gartner.com/smarterwithgartner/gartner-top-10-trends-in-data-and-analytics-for-2020/). Sebagai **Pengembang Aplikasi**, kita akan menemukan bahwa semakin mudah dan murah untuk mengintegrasikan wawasan berbasis data dan otomatisasi berbasis algoritma ke dalam pengalaman pengguna sehari-hari. Namun, seiring dengan semakin meluasnya penggunaan AI, kita juga perlu memahami potensi bahaya yang disebabkan oleh [senjataisasi](https://www.youtube.com/watch?v=TQHs8SA1qpk) algoritma semacam itu dalam skala besar.
Tren pasar menunjukkan bahwa pada tahun 2022, 1 dari 3 organisasi besar akan membeli dan menjual data mereka melalui [Marketplace dan Exchange](https://www.gartner.com/smarterwithgartner/gartner-top-10-trends-in-data-and-analytics-for-2020/) online. Sebagai **Pengembang Aplikasi**, kita akan menemukan bahwa semakin mudah dan murah untuk mengintegrasikan wawasan berbasis data dan otomatisasi berbasis algoritma ke dalam pengalaman pengguna sehari-hari. Namun, seiring dengan semakin meluasnya AI, kita juga perlu memahami potensi bahaya yang disebabkan oleh [weaponisasi](https://www.youtube.com/watch?v=TQHs8SA1qpk) algoritma semacam itu dalam skala besar.
Tren juga menunjukkan bahwa kita akan menciptakan dan mengonsumsi lebih dari [180 zettabyte](https://www.statista.com/statistics/871513/worldwide-data-created/) data pada tahun 2025. Sebagai **Ilmuwan Data**, ini memberi kita akses yang belum pernah terjadi sebelumnya ke data pribadi. Ini berarti kita dapat membangun profil perilaku pengguna dan memengaruhi pengambilan keputusan dengan cara yang menciptakan [ilusi pilihan bebas](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice) sambil secara potensial mendorong pengguna ke arah hasil yang kita inginkan. Hal ini juga menimbulkan pertanyaan yang lebih luas tentang privasi data dan perlindungan pengguna.
Tren juga menunjukkan bahwa kita akan menciptakan dan mengonsumsi lebih dari [180 zettabyte](https://www.statista.com/statistics/871513/worldwide-data-created/) data pada tahun 2025. Sebagai **Ilmuwan Data**, ini memberi kita akses yang belum pernah terjadi sebelumnya ke data pribadi. Ini berarti kita dapat membangun profil perilaku pengguna dan memengaruhi pengambilan keputusan dengan cara yang menciptakan [ilusi pilihan bebas](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice) sambil secara potensial mendorong pengguna menuju hasil yang kita inginkan. Hal ini juga menimbulkan pertanyaan yang lebih luas tentang privasi data dan perlindungan pengguna.
Etika data kini menjadi _pagar pembatas yang diperlukan_ untuk ilmu data dan rekayasa, membantu kita meminimalkan potensi bahaya dan konsekuensi yang tidak diinginkan dari tindakan berbasis data kita. [Gartner Hype Cycle for AI](https://www.gartner.com/smarterwithgartner/2-megatrends-dominate-the-gartner-hype-cycle-for-artificial-intelligence-2020/) mengidentifikasi tren relevan dalam etika digital, AI yang bertanggung jawab, dan tata kelola AI sebagai pendorong utama untuk megatren yang lebih besar seputar _demokratisasi_ dan _industrialisasi_ AI.
Etika data kini menjadi _pagar pengaman yang diperlukan_ untuk ilmu data dan rekayasa, membantu kita meminimalkan potensi bahaya dan konsekuensi yang tidak diinginkan dari tindakan berbasis data kita. [Gartner Hype Cycle untuk AI](https://www.gartner.com/smarterwithgartner/2-megatrends-dominate-the-gartner-hype-cycle-for-artificial-intelligence-2020/) mengidentifikasi tren relevan dalam etika digital, AI yang bertanggung jawab, dan tata kelola AI sebagai pendorong utama untuk megatren yang lebih besar seputar _demokratisasi_ dan _industrialisasi_ AI.
![Gartner's Hype Cycle for AI - 2020](https://images-cdn.newscred.com/Zz1mOWJhNzlkNDA2ZTMxMWViYjRiOGFiM2IyMjQ1YmMwZQ==)
![Gartner's Hype Cycle untuk AI - 2020](https://images-cdn.newscred.com/Zz1mOWJhNzlkNDA2ZTMxMWViYjRiOGFiM2IyMjQ1YmMwZQ==)
Dalam pelajaran ini, kita akan menjelajahi area menarik dari etika data - mulai dari konsep inti dan tantangan, hingga studi kasus dan konsep AI terapan seperti tata kelola - yang membantu membangun budaya etika dalam tim dan organisasi yang bekerja dengan data dan AI.
@ -35,13 +35,13 @@ Mari kita mulai dengan memahami terminologi dasar.
Kata "etika" berasal dari [kata Yunani "ethikos"](https://en.wikipedia.org/wiki/Ethics) (dan akar katanya "ethos") yang berarti _karakter atau sifat moral_.
**Etika** adalah tentang nilai-nilai bersama dan prinsip moral yang mengatur perilaku kita dalam masyarakat. Etika tidak didasarkan pada hukum tetapi pada norma yang diterima secara luas tentang apa yang "benar vs. salah". Namun, pertimbangan etis dapat memengaruhi inisiatif tata kelola perusahaan dan peraturan pemerintah yang menciptakan lebih banyak insentif untuk kepatuhan.
**Etika** adalah tentang nilai-nilai bersama dan prinsip moral yang mengatur perilaku kita dalam masyarakat. Etika tidak didasarkan pada hukum tetapi pada norma yang diterima secara luas tentang apa yang "benar vs. salah". Namun, pertimbangan etika dapat memengaruhi inisiatif tata kelola perusahaan dan regulasi pemerintah yang menciptakan lebih banyak insentif untuk kepatuhan.
**Etika Data** adalah [cabang baru dari etika](https://royalsocietypublishing.org/doi/full/10.1098/rsta.2016.0360#sec-1) yang "mempelajari dan mengevaluasi masalah moral yang terkait dengan _data, algoritma, dan praktik terkait_". Di sini, **"data"** berfokus pada tindakan yang terkait dengan pembuatan, pencatatan, kurasi, pemrosesan, penyebaran, berbagi, dan penggunaan, **"algoritma"** berfokus pada AI, agen, pembelajaran mesin, dan robot, dan **"praktik"** berfokus pada topik seperti inovasi yang bertanggung jawab, pemrograman, peretasan, dan kode etik.
**Etika Data** adalah [cabang baru dari etika](https://royalsocietypublishing.org/doi/full/10.1098/rsta.2016.0360#sec-1) yang "mempelajari dan mengevaluasi masalah moral terkait _data, algoritma, dan praktik terkait_". Di sini, **"data"** berfokus pada tindakan terkait pembuatan, pencatatan, kurasi, pemrosesan, penyebaran, berbagi, dan penggunaan, **"algoritma"** berfokus pada AI, agen, pembelajaran mesin, dan robot, dan **"praktik"** berfokus pada topik seperti inovasi yang bertanggung jawab, pemrograman, peretasan, dan kode etika.
**Etika Terapan** adalah [penerapan praktis dari pertimbangan moral](https://en.wikipedia.org/wiki/Applied_ethics). Ini adalah proses menyelidiki secara aktif masalah etika dalam konteks _tindakan, produk, dan proses dunia nyata_, serta mengambil langkah korektif untuk memastikan bahwa hal-hal tersebut tetap selaras dengan nilai-nilai etika yang telah kita tetapkan.
**Etika Terapan** adalah [penerapan praktis dari pertimbangan moral](https://en.wikipedia.org/wiki/Applied_ethics). Ini adalah proses aktif menyelidiki masalah etika dalam konteks _tindakan, produk, dan proses dunia nyata_, serta mengambil langkah-langkah korektif untuk memastikan bahwa tindakan tersebut tetap selaras dengan nilai-nilai etika yang telah ditentukan.
**Budaya Etika** adalah tentang [_mengoperasionalkan_ etika terapan](https://hbr.org/2019/05/how-to-design-an-ethical-organization) untuk memastikan bahwa prinsip dan praktik etika kita diadopsi secara konsisten dan dapat diskalakan di seluruh organisasi. Budaya etika yang sukses mendefinisikan prinsip etika di seluruh organisasi, memberikan insentif yang bermakna untuk kepatuhan, dan memperkuat norma etika dengan mendorong dan memperkuat perilaku yang diinginkan di setiap tingkat organisasi.
**Budaya Etika** adalah tentang [_mengoperasionalkan_ etika terapan](https://hbr.org/2019/05/how-to-design-an-ethical-organization) untuk memastikan bahwa prinsip dan praktik etika kita diadopsi secara konsisten dan dapat diskalakan di seluruh organisasi. Budaya etika yang sukses mendefinisikan prinsip etika di seluruh organisasi, memberikan insentif yang berarti untuk kepatuhan, dan memperkuat norma etika dengan mendorong dan memperkuat perilaku yang diinginkan di setiap tingkat organisasi.
## Konsep Etika
@ -49,45 +49,45 @@ Dalam bagian ini, kita akan membahas konsep seperti **nilai bersama** (prinsip)
### 1. Prinsip Etika
Setiap strategi etika data dimulai dengan mendefinisikan _prinsip etika_ - "nilai bersama" yang menggambarkan perilaku yang dapat diterima, dan memandu tindakan yang sesuai, dalam proyek data & AI kita. Anda dapat mendefinisikan ini di tingkat individu atau tim. Namun, sebagian besar organisasi besar menguraikannya dalam pernyataan misi atau kerangka kerja _AI etis_ yang didefinisikan di tingkat perusahaan dan ditegakkan secara konsisten di semua tim.
Setiap strategi etika data dimulai dengan mendefinisikan _prinsip etika_ - "nilai bersama" yang menggambarkan perilaku yang dapat diterima, dan membimbing tindakan yang sesuai, dalam proyek data & AI kita. Anda dapat mendefinisikan ini di tingkat individu atau tim. Namun, sebagian besar organisasi besar merumuskan ini dalam pernyataan misi atau kerangka kerja _AI etis_ yang ditentukan di tingkat korporat dan ditegakkan secara konsisten di semua tim.
**Contoh:** Pernyataan misi [AI yang Bertanggung Jawab](https://www.microsoft.com/en-us/ai/responsible-ai) Microsoft berbunyi: _"Kami berkomitmen untuk kemajuan AI yang didorong oleh prinsip-prinsip etika yang menempatkan manusia sebagai prioritas utama"_ - mengidentifikasi 6 prinsip etika dalam kerangka kerja berikut:
**Contoh:** Pernyataan misi [AI yang Bertanggung Jawab](https://www.microsoft.com/en-us/ai/responsible-ai) Microsoft berbunyi: _"Kami berkomitmen untuk kemajuan AI yang didorong oleh prinsip etika yang mengutamakan manusia"_ - mengidentifikasi 6 prinsip etika dalam kerangka kerja berikut:
![AI yang Bertanggung Jawab di Microsoft](https://docs.microsoft.com/en-gb/azure/cognitive-services/personalizer/media/ethics-and-responsible-use/ai-values-future-computed.png)
Mari kita jelajahi prinsip-prinsip ini secara singkat. _Transparansi_ dan _akuntabilitas_ adalah nilai-nilai dasar yang menjadi fondasi prinsip lainnya - jadi mari kita mulai dari sana:
Mari kita jelajahi prinsip-prinsip ini secara singkat. _Transparansi_ dan _akuntabilitas_ adalah nilai-nilai dasar yang menjadi landasan prinsip lainnya - jadi mari kita mulai dari sana:
* [**Akuntabilitas**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) membuat praktisi _bertanggung jawab_ atas operasi data & AI mereka, serta kepatuhan terhadap prinsip etika ini.
* [**Transparansi**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) memastikan bahwa tindakan data dan AI _dapat dipahami_ (dapat diinterpretasikan) oleh pengguna, menjelaskan apa dan mengapa di balik keputusan.
* [**Keadilan**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1%3aprimaryr6) - berfokus pada memastikan AI memperlakukan _semua orang_ secara adil, mengatasi bias sosial-teknis sistemik atau implisit dalam data dan sistem.
* [**Keandalan & Keamanan**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - memastikan bahwa AI berperilaku _konsisten_ dengan nilai-nilai yang telah ditentukan, meminimalkan potensi bahaya atau konsekuensi yang tidak diinginkan.
* [**Privasi & Keamanan**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - adalah tentang memahami asal-usul data, dan memberikan _privasi data serta perlindungan terkait_ kepada pengguna.
* [**Inklusivitas**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - adalah tentang merancang solusi AI dengan niat, menyesuaikannya untuk memenuhi _beragam kebutuhan_ dan kemampuan manusia.
* [**Keandalan & Keamanan**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - memastikan bahwa AI berperilaku _konsisten_ dengan nilai-nilai yang ditentukan, meminimalkan potensi bahaya atau konsekuensi yang tidak diinginkan.
* [**Privasi & Keamanan**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - tentang memahami asal-usul data, dan memberikan _privasi data serta perlindungan terkait_ kepada pengguna.
* [**Inklusivitas**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - tentang merancang solusi AI dengan niat, menyesuaikannya untuk memenuhi _beragam kebutuhan_ & kemampuan manusia.
> 🚨 Pikirkan tentang apa pernyataan misi etika data Anda. Jelajahi kerangka kerja AI etis dari organisasi lain - berikut adalah contoh dari [IBM](https://www.ibm.com/cloud/learn/ai-ethics), [Google](https://ai.google/principles), dan [Facebook](https://ai.facebook.com/blog/facebooks-five-pillars-of-responsible-ai/). Nilai bersama apa yang mereka miliki? Bagaimana prinsip-prinsip ini terkait dengan produk AI atau industri tempat mereka beroperasi?
### 2. Tantangan Etika
Setelah kita mendefinisikan prinsip etika, langkah berikutnya adalah mengevaluasi tindakan data dan AI kita untuk melihat apakah tindakan tersebut selaras dengan nilai bersama tersebut. Pikirkan tindakan Anda dalam dua kategori: _pengumpulan data_ dan _desain algoritma_.
Setelah kita mendefinisikan prinsip etika, langkah berikutnya adalah mengevaluasi tindakan data dan AI kita untuk melihat apakah tindakan tersebut selaras dengan nilai-nilai bersama tersebut. Pikirkan tindakan Anda dalam dua kategori: _pengumpulan data_ dan _desain algoritma_.
Dalam pengumpulan data, tindakan kemungkinan besar akan melibatkan **data pribadi** atau informasi yang dapat diidentifikasi secara pribadi (PII) untuk individu yang dapat diidentifikasi. Ini mencakup [berbagai item data non-pribadi](https://ec.europa.eu/info/law/law-topic/data-protection/reform/what-personal-data_en) yang _secara kolektif_ mengidentifikasi individu. Tantangan etika dapat berkaitan dengan _privasi data_, _kepemilikan data_, dan topik terkait seperti _persetujuan yang diinformasikan_ dan _hak kekayaan intelektual_ untuk pengguna.
Dalam pengumpulan data, tindakan kemungkinan melibatkan **data pribadi** atau informasi yang dapat diidentifikasi secara pribadi (PII) untuk individu yang dapat diidentifikasi. Ini mencakup [beragam item data non-pribadi](https://ec.europa.eu/info/law/law-topic/data-protection/reform/what-personal-data_en) yang _secara kolektif_ mengidentifikasi individu. Tantangan etika dapat berkaitan dengan _privasi data_, _kepemilikan data_, dan topik terkait seperti _persetujuan yang diinformasikan_ dan _hak kekayaan intelektual_ untuk pengguna.
Dalam desain algoritma, tindakan akan melibatkan pengumpulan & kurasi **dataset**, lalu menggunakannya untuk melatih & menerapkan **model data** yang memprediksi hasil atau mengotomatisasi keputusan dalam konteks dunia nyata. Tantangan etika dapat muncul dari _bias dataset_, _masalah kualitas data_, _ketidakadilan_, dan _kesalahan representasi_ dalam algoritma - termasuk beberapa masalah yang bersifat sistemik.
Dalam desain algoritma, tindakan akan melibatkan pengumpulan & kurasi **dataset**, lalu menggunakannya untuk melatih & menerapkan **model data** yang memprediksi hasil atau mengotomatisasi keputusan dalam konteks dunia nyata. Tantangan etika dapat muncul dari _bias dataset_, masalah _kualitas data_, _ketidakadilan_, dan _kesalahan representasi_ dalam algoritma - termasuk beberapa masalah yang bersifat sistemik.
Dalam kedua kasus, tantangan etika menyoroti area di mana tindakan kita mungkin bertentangan dengan nilai bersama kita. Untuk mendeteksi, mengurangi, meminimalkan, atau menghilangkan kekhawatiran ini - kita perlu mengajukan pertanyaan moral "ya/tidak" terkait tindakan kita, lalu mengambil tindakan korektif sesuai kebutuhan. Mari kita lihat beberapa tantangan etika dan pertanyaan moral yang mereka timbulkan:
Dalam kedua kasus, tantangan etika menyoroti area di mana tindakan kita mungkin bertentangan dengan nilai-nilai bersama kita. Untuk mendeteksi, mengurangi, meminimalkan, atau menghilangkan kekhawatiran ini - kita perlu mengajukan pertanyaan moral "ya/tidak" terkait tindakan kita, lalu mengambil tindakan korektif sesuai kebutuhan. Mari kita lihat beberapa tantangan etika dan pertanyaan moral yang mereka timbulkan:
#### 2.1 Kepemilikan Data
Pengumpulan data sering kali melibatkan data pribadi yang dapat mengidentifikasi subjek data. [Kepemilikan data](https://permission.io/blog/data-ownership) adalah tentang _kontrol_ dan [_hak pengguna_](https://permission.io/blog/data-ownership) terkait pembuatan, pemrosesan, dan penyebaran data.
Pengumpulan data sering kali melibatkan data pribadi yang dapat mengidentifikasi subjek data. [Kepemilikan data](https://permission.io/blog/data-ownership) adalah tentang _kontrol_ dan [_hak pengguna_](https://permission.io/blog/data-ownership) terkait pembuatan, pemrosesan, dan penyebaran data.
Pertanyaan moral yang perlu kita ajukan adalah:
Pertanyaan moral yang perlu kita ajukan adalah:
* Siapa yang memiliki data? (pengguna atau organisasi)
* Hak apa yang dimiliki subjek data? (misalnya: akses, penghapusan, portabilitas)
* Hak apa yang dimiliki organisasi? (misalnya: memperbaiki ulasan pengguna yang merugikan)
* Hak apa yang dimiliki organisasi? (misalnya: memperbaiki ulasan pengguna yang berbahaya)
#### 2.2 Persetujuan yang Diinformasikan
[Persetujuan yang diinformasikan](https://legaldictionary.net/informed-consent/) mendefinisikan tindakan pengguna yang menyetujui suatu tindakan (seperti pengumpulan data) dengan _pemahaman penuh_ tentang fakta relevan termasuk tujuan, potensi risiko, dan alternatif.
[Persetujuan yang diinformasikan](https://legaldictionary.net/informed-consent/) mendefinisikan tindakan pengguna yang menyetujui suatu tindakan (seperti pengumpulan data) dengan _pemahaman penuh_ tentang fakta relevan termasuk tujuan, potensi risiko, dan alternatif.
Pertanyaan yang perlu dieksplorasi di sini adalah:
* Apakah pengguna (subjek data) memberikan izin untuk pengambilan dan penggunaan data?
@ -96,40 +96,40 @@ Pertanyaan yang perlu dieksplorasi di sini adalah:
#### 2.3 Kekayaan Intelektual
[Kekayaan intelektual](https://en.wikipedia.org/wiki/Intellectual_property) mengacu pada kreasi tidak berwujud yang dihasilkan dari inisiatif manusia, yang mungkin _memiliki nilai ekonomi_ bagi individu atau bisnis.
[Kekayaan intelektual](https://en.wikipedia.org/wiki/Intellectual_property) mengacu pada kreasi tak berwujud yang dihasilkan dari inisiatif manusia, yang mungkin _memiliki nilai ekonomi_ bagi individu atau bisnis.
Pertanyaan yang perlu dieksplorasi di sini adalah:
* Apakah data yang dikumpulkan memiliki nilai ekonomi bagi pengguna atau bisnis?
* Apakah **pengguna** memiliki kekayaan intelektual di sini?
* Apakah **organisasi** memiliki kekayaan intelektual di sini?
* Jika hak ini ada, bagaimana kita melindunginya?
* Jika hak-hak ini ada, bagaimana kita melindunginya?
#### 2.4 Privasi Data
[Privasi data](https://www.northeastern.edu/graduate/blog/what-is-data-privacy/) atau privasi informasi mengacu pada pelestarian privasi pengguna dan perlindungan identitas pengguna sehubungan dengan informasi yang dapat diidentifikasi secara pribadi.
[Privasi data](https://www.northeastern.edu/graduate/blog/what-is-data-privacy/) atau privasi informasi mengacu pada pelestarian privasi pengguna dan perlindungan identitas pengguna terkait informasi yang dapat diidentifikasi secara pribadi.
Pertanyaan yang perlu dieksplorasi di sini adalah:
* Apakah data (pribadi) pengguna diamankan dari peretasan dan kebocoran?
* Apakah data (pribadi) pengguna aman dari peretasan dan kebocoran?
* Apakah data pengguna hanya dapat diakses oleh pengguna dan konteks yang berwenang?
* Apakah anonimitas pengguna terjaga saat data dibagikan atau disebarluaskan?
* Bisakah pengguna diidentifikasi dari dataset yang dianonimkan?
#### 2.5 Hak untuk Dilupakan
[Hak untuk Dilupakan](https://en.wikipedia.org/wiki/Right_to_be_forgotten) atau [Hak untuk Penghapusan](https://www.gdpreu.org/right-to-be-forgotten/) memberikan perlindungan data pribadi tambahan kepada pengguna. Secara khusus, ini memberi pengguna hak untuk meminta penghapusan atau penghapusan data pribadi dari pencarian Internet dan lokasi lainnya, _dalam keadaan tertentu_ - memungkinkan mereka memulai kembali secara online tanpa tindakan masa lalu yang membebani mereka.
[Hak untuk Dilupakan](https://en.wikipedia.org/wiki/Right_to_be_forgotten) atau [Hak untuk Penghapusan](https://www.gdpreu.org/right-to-be-forgotten/) memberikan perlindungan data pribadi tambahan kepada pengguna. Secara khusus, ini memberikan hak kepada pengguna untuk meminta penghapusan atau penghapusan data pribadi dari pencarian Internet dan lokasi lainnya, _dalam keadaan tertentu_ - memungkinkan mereka memulai kembali secara online tanpa tindakan masa lalu yang membebani mereka.
Pertanyaan yang perlu dieksplorasi di sini adalah:
* Apakah sistem memungkinkan subjek data untuk meminta penghapusan?
* Haruskah penarikan persetujuan pengguna memicu penghapusan otomatis?
* Apakah data dikumpulkan tanpa persetujuan atau dengan cara yang melanggar hukum?
* Apakah kita mematuhi peraturan pemerintah tentang privasi data?
* Apakah kita mematuhi peraturan pemerintah untuk privasi data?
#### 2.6 Bias Dataset
Bias dataset atau [Bias Pengumpulan](http://researcharticles.com/index.php/bias-in-data-collection-in-research/) adalah tentang memilih subset data yang _tidak representatif_ untuk pengembangan algoritma, menciptakan potensi ketidakadilan dalam hasil untuk kelompok yang beragam. Jenis bias termasuk bias seleksi atau sampling, bias sukarelawan, dan bias instrumen.
Bias Dataset atau [Bias Pengumpulan](http://researcharticles.com/index.php/bias-in-data-collection-in-research/) adalah tentang memilih subset data yang _tidak representatif_ untuk pengembangan algoritma, menciptakan potensi ketidakadilan dalam hasil untuk kelompok yang beragam. Jenis bias termasuk bias seleksi atau sampling, bias sukarelawan, dan bias instrumen.
Pertanyaan yang perlu dieksplorasi di sini adalah:
* Apakah kita merekrut kumpulan subjek data yang representatif?
* Apakah kita merekrut set subjek data yang representatif?
* Apakah kita menguji dataset yang dikumpulkan atau dikurasi untuk berbagai bias?
* Bisakah kita mengurangi atau menghilangkan bias yang ditemukan?
@ -140,10 +140,8 @@ Pertanyaan yang perlu dieksplorasi di sini adalah:
Pertanyaan yang perlu dieksplorasi di sini adalah:
* Apakah kita menangkap _fitur_ yang valid untuk kasus penggunaan kita?
* Apakah data ditangkap _secara konsisten_ di berbagai sumber data?
* Apakah dataset _lengkap_ untuk berbagai kondisi atau skenario?
* Apakah informasi yang ditangkap _akurat_ dalam mencerminkan realitas?
#### 2.8 Keadilan Algoritma
* Apakah dataset _lengkap_ untuk kondisi atau skenario yang beragam?
* Apakah informasi yang ditangkap _akurat_ dalam mencerminkan kenyataan?
[Algorithm Fairness](https://towardsdatascience.com/what-is-algorithm-fairness-3182e161cf9f) memeriksa apakah desain algoritma secara sistematis mendiskriminasi kelompok tertentu dari subjek data, yang dapat menyebabkan [potensi kerugian](https://docs.microsoft.com/en-us/azure/machine-learning/concept-fairness-ml) dalam _alokasi_ (di mana sumber daya ditolak atau ditahan dari kelompok tersebut) dan _kualitas layanan_ (di mana AI tidak seakurat untuk beberapa kelompok dibandingkan dengan yang lain).
Pertanyaan yang dapat dieksplorasi di sini adalah:
@ -153,80 +151,80 @@ Pertanyaan yang dapat dieksplorasi di sini adalah:
Jelajahi sumber daya seperti [AI Fairness checklists](https://query.prod.cms.rt.microsoft.com/cms/api/am/binary/RE4t6dA) untuk mempelajari lebih lanjut.
#### 2.9 Representasi yang Salah
#### 2.9 Misrepresentasi
[Representasi Data yang Salah](https://www.sciencedirect.com/topics/computer-science/misrepresentation) berkaitan dengan pertanyaan apakah kita menyampaikan wawasan dari data yang dilaporkan secara jujur dengan cara yang menyesatkan untuk mendukung narasi yang diinginkan.
[Misrepresentasi Data](https://www.sciencedirect.com/topics/computer-science/misrepresentation) berkaitan dengan apakah kita menyampaikan wawasan dari data yang dilaporkan secara jujur dengan cara yang menyesatkan untuk mendukung narasi yang diinginkan.
Pertanyaan yang dapat dieksplorasi di sini adalah:
* Apakah kita melaporkan data yang tidak lengkap atau tidak akurat?
* Apakah kita memvisualisasikan data dengan cara yang mendorong kesimpulan yang menyesatkan?
* Apakah kita memvisualisasikan data dengan cara yang menghasilkan kesimpulan yang menyesatkan?
* Apakah kita menggunakan teknik statistik selektif untuk memanipulasi hasil?
* Apakah ada penjelasan alternatif yang mungkin menawarkan kesimpulan berbeda?
#### 2.10 Pilihan Bebas
[Ilusi Pilihan Bebas](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice) terjadi ketika "arsitektur pilihan" sistem menggunakan algoritma pengambilan keputusan untuk mendorong orang mengambil hasil yang diinginkan sambil tampak memberikan mereka opsi dan kendali. Pola-pola gelap ini ([dark patterns](https://www.darkpatterns.org/)) dapat menyebabkan kerugian sosial dan ekonomi bagi pengguna. Karena keputusan pengguna memengaruhi profil perilaku, tindakan ini berpotensi mendorong pilihan di masa depan yang dapat memperbesar atau memperpanjang dampak kerugian tersebut.
[Ilusi Pilihan Bebas](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice) terjadi ketika "arsitektur pilihan" sistem menggunakan algoritma pengambilan keputusan untuk mendorong orang mengambil hasil yang diinginkan sambil tampak memberikan mereka opsi dan kendali. [Pola gelap](https://www.darkpatterns.org/) ini dapat menyebabkan kerugian sosial dan ekonomi bagi pengguna. Karena keputusan pengguna memengaruhi profil perilaku, tindakan ini berpotensi mendorong pilihan di masa depan yang dapat memperkuat atau memperluas dampak kerugian ini.
Pertanyaan yang dapat dieksplorasi di sini adalah:
* Apakah pengguna memahami implikasi dari pilihan yang dibuat?
* Apakah pengguna memahami implikasi dari membuat pilihan tersebut?
* Apakah pengguna menyadari pilihan (alternatif) dan pro & kontra dari masing-masing?
* Bisakah pengguna membatalkan pilihan yang otomatis atau dipengaruhi di kemudian hari?
### 3. Studi Kasus
Untuk menempatkan tantangan etika ini dalam konteks dunia nyata, membantu untuk melihat studi kasus yang menyoroti potensi kerugian dan konsekuensi bagi individu dan masyarakat ketika pelanggaran etika seperti ini diabaikan.
Untuk menempatkan tantangan etika ini dalam konteks dunia nyata, penting untuk melihat studi kasus yang menyoroti potensi kerugian dan konsekuensi bagi individu dan masyarakat ketika pelanggaran etika seperti ini diabaikan.
Berikut beberapa contohnya:
| Tantangan Etika | Studi Kasus |
|--- |--- |
| **Persetujuan yang Diberikan dengan Informasi** | 1972 - [Studi Sifilis Tuskegee](https://en.wikipedia.org/wiki/Tuskegee_Syphilis_Study) - Pria Afrika-Amerika yang berpartisipasi dalam studi ini dijanjikan perawatan medis gratis _tetapi ditipu_ oleh peneliti yang gagal memberi tahu subjek tentang diagnosis mereka atau tentang ketersediaan pengobatan. Banyak subjek meninggal & pasangan atau anak-anak mereka terkena dampaknya; studi ini berlangsung selama 40 tahun. |
| **Privasi Data** | 2007 - [Hadiah data Netflix](https://www.wired.com/2007/12/why-anonymous-data-sometimes-isnt/) memberikan peneliti _10 juta peringkat film anonim dari 50 ribu pelanggan_ untuk membantu meningkatkan algoritma rekomendasi. Namun, peneliti dapat menghubungkan data anonim dengan data yang dapat diidentifikasi secara pribadi di _dataset eksternal_ (misalnya, komentar IMDb) - secara efektif "membuka anonimitas" beberapa pelanggan Netflix.|
| **Bias Pengumpulan Data** | 2013 - Kota Boston [mengembangkan Street Bump](https://www.boston.gov/transportation/street-bump), sebuah aplikasi yang memungkinkan warga melaporkan lubang jalan, memberikan data jalan yang lebih baik kepada kota untuk menemukan dan memperbaiki masalah. Namun, [orang-orang dari kelompok berpenghasilan rendah memiliki akses yang lebih sedikit ke mobil dan ponsel](https://hbr.org/2013/04/the-hidden-biases-in-big-data), membuat masalah jalan mereka tidak terlihat dalam aplikasi ini. Pengembang bekerja dengan akademisi untuk mengatasi masalah _akses yang adil dan kesenjangan digital_ demi keadilan. |
| **Keadilan Algoritmik** | 2018 - Studi MIT [Gender Shades](http://gendershades.org/overview.html) mengevaluasi akurasi produk AI klasifikasi gender, mengungkapkan kesenjangan akurasi untuk perempuan dan orang kulit berwarna. Sebuah [Kartu Kredit Apple 2019](https://www.wired.com/story/the-apple-card-didnt-see-genderand-thats-the-problem/) tampaknya menawarkan kredit lebih rendah kepada perempuan dibandingkan laki-laki. Keduanya menggambarkan masalah bias algoritmik yang menyebabkan kerugian sosial-ekonomi.|
| **Representasi Data yang Salah** | 2020 - [Departemen Kesehatan Publik Georgia merilis grafik COVID-19](https://www.vox.com/covid-19-coronavirus-us-response-trump/2020/5/18/21262265/georgia-covid-19-cases-declining-reopening) yang tampaknya menyesatkan warga tentang tren kasus yang dikonfirmasi dengan pengurutan non-kronologis pada sumbu x. Ini menggambarkan representasi yang salah melalui trik visualisasi. |
| **Ilusi Pilihan Bebas** | 2020 - Aplikasi pembelajaran [ABCmouse membayar $10 juta untuk menyelesaikan keluhan FTC](https://www.washingtonpost.com/business/2020/09/04/abcmouse-10-million-ftc-settlement/) di mana orang tua terjebak membayar langganan yang tidak dapat mereka batalkan. Ini menggambarkan pola gelap dalam arsitektur pilihan, di mana pengguna didorong ke arah pilihan yang berpotensi merugikan. |
| **Privasi Data & Hak Pengguna** | 2021 - [Kebocoran Data Facebook](https://www.npr.org/2021/04/09/986005820/after-data-breach-exposes-530-million-facebook-says-it-will-not-notify-users) mengekspos data dari 530 juta pengguna, menghasilkan penyelesaian $5 miliar dengan FTC. Namun, Facebook menolak memberi tahu pengguna tentang pelanggaran tersebut, melanggar hak pengguna terkait transparansi dan akses data. |
| **Persetujuan Informasi** | 1972 - [Tuskegee Syphilis Study](https://en.wikipedia.org/wiki/Tuskegee_Syphilis_Study) - Pria Afrika-Amerika yang berpartisipasi dalam studi dijanjikan perawatan medis gratis _tetapi ditipu_ oleh peneliti yang gagal memberi tahu subjek tentang diagnosis mereka atau tentang ketersediaan pengobatan. Banyak subjek meninggal & pasangan atau anak-anak mereka terpengaruh; studi berlangsung selama 40 tahun. |
| **Privasi Data** | 2007 - [Netflix data prize](https://www.wired.com/2007/12/why-anonymous-data-sometimes-isnt/) memberikan peneliti _10 juta peringkat film anonim dari 50 ribu pelanggan_ untuk membantu meningkatkan algoritma rekomendasi. Namun, peneliti dapat menghubungkan data anonim dengan data yang dapat diidentifikasi secara pribadi dalam _dataset eksternal_ (misalnya, komentar IMDb) - secara efektif "mendeanonimkan" beberapa pelanggan Netflix.|
| **Bias Pengumpulan** | 2013 - Kota Boston [mengembangkan Street Bump](https://www.boston.gov/transportation/street-bump), sebuah aplikasi yang memungkinkan warga melaporkan lubang jalan, memberikan data jalan yang lebih baik kepada kota untuk menemukan dan memperbaiki masalah. Namun, [orang-orang dalam kelompok berpenghasilan rendah memiliki akses lebih sedikit ke mobil dan ponsel](https://hbr.org/2013/04/the-hidden-biases-in-big-data), membuat masalah jalan mereka tidak terlihat dalam aplikasi ini. Pengembang bekerja dengan akademisi untuk mengatasi masalah _akses yang adil dan kesenjangan digital_ demi keadilan. |
| **Keadilan Algoritmik** | 2018 - Studi MIT [Gender Shades Study](http://gendershades.org/overview.html) mengevaluasi akurasi produk AI klasifikasi gender, mengungkapkan kesenjangan akurasi untuk wanita dan orang kulit berwarna. Sebuah [Apple Card 2019](https://www.wired.com/story/the-apple-card-didnt-see-genderand-thats-the-problem/) tampaknya menawarkan kredit lebih sedikit kepada wanita dibandingkan pria. Keduanya menggambarkan masalah bias algoritmik yang menyebabkan kerugian sosial-ekonomi.|
| **Misrepresentasi Data** | 2020 - [Departemen Kesehatan Georgia merilis grafik COVID-19](https://www.vox.com/covid-19-coronavirus-us-response-trump/2020/5/18/21262265/georgia-covid-19-cases-declining-reopening) yang tampaknya menyesatkan warga tentang tren kasus yang dikonfirmasi dengan pengurutan non-kronologis pada sumbu x. Ini menggambarkan misrepresentasi melalui trik visualisasi. |
| **Ilusi pilihan bebas** | 2020 - Aplikasi pembelajaran [ABCmouse membayar $10 juta untuk menyelesaikan keluhan FTC](https://www.washingtonpost.com/business/2020/09/04/abcmouse-10-million-ftc-settlement/) di mana orang tua terjebak membayar langganan yang tidak dapat mereka batalkan. Ini menggambarkan pola gelap dalam arsitektur pilihan, di mana pengguna didorong menuju pilihan yang berpotensi merugikan. |
| **Privasi Data & Hak Pengguna** | 2021 - [Kebocoran Data Facebook](https://www.npr.org/2021/04/09/986005820/after-data-breach-exposes-530-million-facebook-says-it-will-not-notify-users) mengekspos data dari 530 juta pengguna, menghasilkan penyelesaian $5 miliar kepada FTC. Namun, Facebook menolak memberi tahu pengguna tentang pelanggaran tersebut, melanggar hak pengguna terkait transparansi data dan akses. |
Ingin menjelajahi lebih banyak studi kasus? Lihat sumber daya berikut:
* [Ethics Unwrapped](https://ethicsunwrapped.utexas.edu/case-studies) - dilema etika di berbagai industri.
* [Kursus Etika Data Science](https://www.coursera.org/learn/data-science-ethics#syllabus) - studi kasus penting yang dieksplorasi.
* [Di mana hal-hal menjadi salah](https://deon.drivendata.org/examples/) - daftar periksa deon dengan contoh.
* [Di mana hal-hal telah salah](https://deon.drivendata.org/examples/) - daftar periksa deon dengan contoh-contoh.
> 🚨 Pikirkan tentang studi kasus yang telah Anda lihat - apakah Anda pernah mengalami, atau terpengaruh oleh, tantangan etika serupa dalam hidup Anda? Bisakah Anda memikirkan setidaknya satu studi kasus lain yang menggambarkan salah satu tantangan etika yang telah kita bahas di bagian ini?
## Etika Terapan
Kita telah membahas konsep etika, tantangan, dan studi kasus dalam konteks dunia nyata. Tetapi bagaimana kita memulai _menerapkan_ prinsip dan praktik etika dalam proyek kita? Dan bagaimana kita _mengoperasionalkan_ praktik ini untuk tata kelola yang lebih baik? Mari kita jelajahi beberapa solusi dunia nyata:
Kita telah membahas konsep etika, tantangan, dan studi kasus dalam konteks dunia nyata. Tetapi bagaimana kita memulai _menerapkan_ prinsip dan praktik etika dalam proyek kita? Dan bagaimana kita _mengoperasionalkan_ praktik ini untuk tata kelola yang lebih baik? Mari kita eksplorasi beberapa solusi dunia nyata:
### 1. Kode Profesional
Kode Profesional menawarkan salah satu opsi bagi organisasi untuk "mendorong" anggota mendukung prinsip etika dan pernyataan misi mereka. Kode ini adalah _panduan moral_ untuk perilaku profesional, membantu karyawan atau anggota membuat keputusan yang selaras dengan prinsip organisasi mereka. Kode ini hanya seefektif kepatuhan sukarela dari anggota; namun, banyak organisasi menawarkan penghargaan dan hukuman tambahan untuk memotivasi kepatuhan.
Kode Profesional menawarkan satu opsi bagi organisasi untuk "mendorong" anggota mendukung prinsip etika mereka dan pernyataan misi. Kode adalah _panduan moral_ untuk perilaku profesional, membantu karyawan atau anggota membuat keputusan yang selaras dengan prinsip organisasi mereka. Kode ini hanya sebaik kepatuhan sukarela dari anggota; namun, banyak organisasi menawarkan penghargaan dan hukuman tambahan untuk memotivasi kepatuhan dari anggota.
Contoh termasuk:
Contoh meliputi:
* [Oxford Munich](http://www.code-of-ethics.org/code-of-conduct/) Kode Etika
* [Data Science Association](http://datascienceassn.org/code-of-conduct.html) Kode Perilaku (dibuat 2013)
* [Kode Etika dan Perilaku Profesional ACM](https://www.acm.org/code-of-ethics) (sejak 1993)
* [ACM Code of Ethics and Professional Conduct](https://www.acm.org/code-of-ethics) (sejak 1993)
> 🚨 Apakah Anda tergabung dalam organisasi profesional teknik atau data science? Jelajahi situs mereka untuk melihat apakah mereka mendefinisikan kode etika profesional. Apa yang dikatakan ini tentang prinsip etika mereka? Bagaimana mereka "mendorong" anggota untuk mengikuti kode tersebut?
> 🚨 Apakah Anda tergabung dalam organisasi profesional teknik atau data science? Jelajahi situs mereka untuk melihat apakah mereka mendefinisikan kode etika profesional. Apa yang dikatakan tentang prinsip etika mereka? Bagaimana mereka "mendorong" anggota untuk mengikuti kode tersebut?
### 2. Daftar Periksa Etika
Sementara kode profesional mendefinisikan _perilaku etis_ yang diperlukan dari praktisi, mereka [memiliki keterbatasan yang diketahui](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md) dalam penegakan, terutama dalam proyek skala besar. Sebagai gantinya, banyak ahli data science [menganjurkan daftar periksa](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md), yang dapat **menghubungkan prinsip dengan praktik** dengan cara yang lebih deterministik dan dapat ditindaklanjuti.
Daftar periksa mengubah pertanyaan menjadi tugas "ya/tidak" yang dapat dioperasionalkan, memungkinkan mereka dilacak sebagai bagian dari alur kerja rilis produk standar.
Daftar periksa mengubah pertanyaan menjadi tugas "ya/tidak" yang dapat dioperasionalkan, memungkinkan mereka untuk dilacak sebagai bagian dari alur kerja rilis produk standar.
Contoh termasuk:
Contoh meliputi:
* [Deon](https://deon.drivendata.org/) - daftar periksa etika data umum yang dibuat dari [rekomendasi industri](https://deon.drivendata.org/#checklist-citations) dengan alat baris perintah untuk integrasi yang mudah.
* [Daftar Periksa Audit Privasi](https://cyber.harvard.edu/ecommerce/privacyaudit.html) - memberikan panduan umum untuk praktik penanganan informasi dari perspektif eksposur hukum dan sosial.
* [Daftar Periksa Keadilan AI](https://www.microsoft.com/en-us/research/project/ai-fairness-checklist/) - dibuat oleh praktisi AI untuk mendukung adopsi dan integrasi pemeriksaan keadilan dalam siklus pengembangan AI.
* [Privacy Audit Checklist](https://cyber.harvard.edu/ecommerce/privacyaudit.html) - memberikan panduan umum untuk praktik penanganan informasi dari perspektif eksposur hukum dan sosial.
* [AI Fairness Checklist](https://www.microsoft.com/en-us/research/project/ai-fairness-checklist/) - dibuat oleh praktisi AI untuk mendukung adopsi dan integrasi pemeriksaan keadilan dalam siklus pengembangan AI.
* [22 pertanyaan untuk etika dalam data dan AI](https://medium.com/the-organization/22-questions-for-ethics-in-data-and-ai-efb68fd19429) - kerangka kerja yang lebih terbuka, terstruktur untuk eksplorasi awal masalah etika dalam desain, implementasi, dan konteks organisasi.
### 3. Regulasi Etika
Etika adalah tentang mendefinisikan nilai-nilai bersama dan melakukan hal yang benar _secara sukarela_. **Kepatuhan** adalah tentang _mematuhi hukum_ jika dan di mana didefinisikan. **Tata kelola** secara luas mencakup semua cara organisasi beroperasi untuk menegakkan prinsip etika dan mematuhi hukum yang telah ditetapkan.
Etika adalah tentang mendefinisikan nilai-nilai bersama dan melakukan hal yang benar _secara sukarela_. **Kepatuhan** adalah tentang _mematuhi hukum_ jika dan di mana ditentukan. **Tata kelola** secara luas mencakup semua cara di mana organisasi beroperasi untuk menegakkan prinsip etika dan mematuhi hukum yang telah ditetapkan.
Saat ini, tata kelola mengambil dua bentuk dalam organisasi. Pertama, ini tentang mendefinisikan prinsip **AI etis** dan menetapkan praktik untuk mengoperasionalkan adopsi di semua proyek terkait AI dalam organisasi. Kedua, ini tentang mematuhi semua regulasi perlindungan data yang diwajibkan pemerintah untuk wilayah tempat organisasi beroperasi.
Saat ini, tata kelola mengambil dua bentuk dalam organisasi. Pertama, ini tentang mendefinisikan prinsip **AI etis** dan menetapkan praktik untuk mengoperasionalkan adopsi di semua proyek terkait AI dalam organisasi. Kedua, ini tentang mematuhi semua **regulasi perlindungan data** yang diwajibkan pemerintah untuk wilayah tempat organisasi beroperasi.
Contoh regulasi perlindungan data dan privasi:
@ -234,22 +232,22 @@ Contoh regulasi perlindungan data dan privasi:
* `1996`, [US Health Insurance Portability & Accountability Act (HIPAA)](https://www.cdc.gov/phlp/publications/topic/hipaa.html) - melindungi data kesehatan pribadi.
* `1998`, [US Children's Online Privacy Protection Act (COPPA)](https://www.ftc.gov/enforcement/rules/rulemaking-regulatory-reform-proceedings/childrens-online-privacy-protection-rule) - melindungi privasi data anak-anak di bawah 13 tahun.
* `2018`, [General Data Protection Regulation (GDPR)](https://gdpr-info.eu/) - memberikan hak pengguna, perlindungan data, dan privasi.
* `2018`, [California Consumer Privacy Act (CCPA)](https://www.oag.ca.gov/privacy/ccpa) memberikan lebih banyak _hak_ kepada konsumen atas data (pribadi) mereka.
* `2018`, [California Consumer Privacy Act (CCPA)](https://www.oag.ca.gov/privacy/ccpa) memberikan konsumen lebih banyak _hak_ atas data (pribadi) mereka.
* `2021`, [Undang-Undang Perlindungan Informasi Pribadi China](https://www.reuters.com/world/china/china-passes-new-personal-data-privacy-law-take-effect-nov-1-2021-08-20/) baru saja disahkan, menciptakan salah satu regulasi privasi data online terkuat di dunia.
> 🚨 Uni Eropa mendefinisikan GDPR (General Data Protection Regulation) yang tetap menjadi salah satu regulasi privasi data paling berpengaruh saat ini. Tahukah Anda bahwa GDPR juga mendefinisikan [8 hak pengguna](https://www.freeprivacypolicy.com/blog/8-user-rights-gdpr) untuk melindungi privasi digital dan data pribadi warga negara? Pelajari apa saja hak ini, dan mengapa itu penting.
> 🚨 Uni Eropa mendefinisikan GDPR (General Data Protection Regulation) yang tetap menjadi salah satu regulasi privasi data paling berpengaruh saat ini. Tahukah Anda bahwa GDPR juga mendefinisikan [8 hak pengguna](https://www.freeprivacypolicy.com/blog/8-user-rights-gdpr) untuk melindungi privasi digital dan data pribadi warga? Pelajari tentang apa saja hak tersebut, dan mengapa itu penting.
### 4. Budaya Etika
Perlu dicatat bahwa masih ada kesenjangan tak berwujud antara _kepatuhan_ (melakukan cukup untuk memenuhi "huruf hukum") dan mengatasi [masalah sistemik](https://www.coursera.org/learn/data-science-ethics/home/week/4) (seperti ossifikasi, asimetri informasi, dan ketidakadilan distribusi) yang dapat mempercepat senjata AI.
Perlu dicatat bahwa masih ada kesenjangan tak berwujud antara _kepatuhan_ (melakukan cukup untuk memenuhi "huruf hukum") dan mengatasi [masalah sistemik](https://www.coursera.org/learn/data-science-ethics/home/week/4) (seperti osifikasi, asimetri informasi, dan ketidakadilan distribusi) yang dapat mempercepat penggunaan AI sebagai senjata.
Yang terakhir membutuhkan [pendekatan kolaboratif untuk mendefinisikan budaya etika](https://towardsdatascience.com/why-ai-ethics-requires-a-culture-driven-approach-26f451afa29f) yang membangun koneksi emosional dan nilai-nilai bersama yang konsisten _di seluruh organisasi_ dalam industri. Ini menyerukan lebih banyak [budaya etika data yang diformalkan](https://www.codeforamerica.org/news/formalizing-an-ethical-data-culture/) dalam organisasi - memungkinkan _siapa pun_ untuk [menarik tali Andon](https://en.wikipedia.org/wiki/Andon_(manufacturing)) (untuk mengangkat kekhawatiran etika sejak awal proses) dan menjadikan _penilaian etika_ (misalnya, dalam perekrutan) sebagai kriteria inti pembentukan tim dalam proyek AI.
Yang terakhir membutuhkan [pendekatan kolaboratif untuk mendefinisikan budaya etika](https://towardsdatascience.com/why-ai-ethics-requires-a-culture-driven-approach-26f451afa29f) yang membangun koneksi emosional dan nilai-nilai bersama yang konsisten _di seluruh organisasi_ dalam industri. Ini menyerukan lebih banyak [budaya etika data yang diformalkan](https://www.codeforamerica.org/news/formalizing-an-ethical-data-culture/) dalam organisasi - memungkinkan _siapa pun_ untuk [menarik tali Andon](https://en.wikipedia.org/wiki/Andon_(manufacturing)) (untuk mengangkat kekhawatiran etika lebih awal dalam proses) dan menjadikan _penilaian etika_ (misalnya, dalam perekrutan) sebagai kriteria inti pembentukan tim dalam proyek AI.
---
## [Kuis pasca-ceramah](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/3) 🎯
## [Kuis pasca-kuliah](https://ff-quizzes.netlify.app/en/ds/) 🎯
## Tinjauan & Studi Mandiri
Kursus dan buku membantu memahami konsep dan tantangan etika inti, sementara studi kasus dan alat membantu praktik etika terapan dalam konteks dunia nyata. Berikut beberapa sumber daya untuk memulai.
Kursus dan buku membantu memahami konsep etika inti dan tantangan, sementara studi kasus dan alat membantu dengan praktik etika terapan dalam konteks dunia nyata. Berikut beberapa sumber daya untuk memulai.
* [Machine Learning For Beginners](https://github.com/microsoft/ML-For-Beginners/blob/main/1-Introduction/3-fairness/README.md) - pelajaran tentang Keadilan, dari Microsoft.
* [Prinsip AI yang Bertanggung Jawab](https://docs.microsoft.com/en-us/learn/modules/responsible-ai-principles/) - jalur pembelajaran gratis dari Microsoft Learn.
@ -264,4 +262,4 @@ Kursus dan buku membantu memahami konsep dan tantangan etika inti, sementara stu
---
**Penafian**:
Dokumen ini telah diterjemahkan menggunakan layanan penerjemahan AI [Co-op Translator](https://github.com/Azure/co-op-translator). Meskipun kami berupaya untuk memberikan hasil yang akurat, harap diketahui bahwa terjemahan otomatis mungkin mengandung kesalahan atau ketidakakuratan. Dokumen asli dalam bahasa aslinya harus dianggap sebagai sumber yang otoritatif. Untuk informasi yang bersifat kritis, disarankan menggunakan jasa penerjemahan profesional oleh manusia. Kami tidak bertanggung jawab atas kesalahpahaman atau penafsiran yang keliru yang timbul dari penggunaan terjemahan ini.
Dokumen ini telah diterjemahkan menggunakan layanan penerjemahan AI [Co-op Translator](https://github.com/Azure/co-op-translator). Meskipun kami berusaha untuk memberikan hasil yang akurat, harap diingat bahwa terjemahan otomatis mungkin mengandung kesalahan atau ketidakakuratan. Dokumen asli dalam bahasa aslinya harus dianggap sebagai sumber yang otoritatif. Untuk informasi yang bersifat kritis, disarankan menggunakan jasa penerjemahan profesional oleh manusia. Kami tidak bertanggung jawab atas kesalahpahaman atau penafsiran yang keliru yang timbul dari penggunaan terjemahan ini.

@ -1,8 +1,8 @@
<!--
CO_OP_TRANSLATOR_METADATA:
{
"original_hash": "8796f41f566a0a8ebb72863a83d558ed",
"translation_date": "2025-08-28T11:26:22+00:00",
"original_hash": "3a34157cc63516eba97c89a0b2f8c3e6",
"translation_date": "2025-09-03T21:18:02+00:00",
"source_file": "1-Introduction/02-ethics/README.md",
"language_code": "it"
}
@ -19,13 +19,13 @@ Siamo tutti cittadini dei dati che vivono in un mondo dataficato.
Le tendenze di mercato ci dicono che entro il 2022, 1 organizzazione su 3 di grandi dimensioni comprerà e venderà i propri dati attraverso [Marketplace e Exchange](https://www.gartner.com/smarterwithgartner/gartner-top-10-trends-in-data-and-analytics-for-2020/) online. Come **sviluppatori di app**, sarà più facile ed economico integrare intuizioni basate sui dati e automazione guidata da algoritmi nelle esperienze quotidiane degli utenti. Ma con l'AI che diventa sempre più pervasiva, sarà anche necessario comprendere i potenziali danni causati dalla [strumentalizzazione](https://www.youtube.com/watch?v=TQHs8SA1qpk) di tali algoritmi su larga scala.
Le tendenze indicano inoltre che creeremo e consumeremo oltre [180 zettabyte](https://www.statista.com/statistics/871513/worldwide-data-created/) di dati entro il 2025. Come **data scientist**, questo ci offre livelli senza precedenti di accesso ai dati personali. Ciò significa che possiamo costruire profili comportamentali degli utenti e influenzare il processo decisionale in modi che creano un'[illusione di scelta libera](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice), indirizzando potenzialmente gli utenti verso risultati che preferiamo. Questo solleva anche questioni più ampie sulla privacy dei dati e sulla protezione degli utenti.
Le tendenze indicano inoltre che entro il 2025 creeremo e consumeremo oltre [180 zettabyte](https://www.statista.com/statistics/871513/worldwide-data-created/) di dati. Come **data scientist**, questo ci offre livelli senza precedenti di accesso ai dati personali. Ciò significa che possiamo costruire profili comportamentali degli utenti e influenzare il processo decisionale in modi che creano un'[illusione di scelta libera](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice), spingendo potenzialmente gli utenti verso risultati che preferiamo. Questo solleva anche questioni più ampie sulla privacy dei dati e sulla protezione degli utenti.
L'etica dei dati è ora _un binario necessario_ per la scienza e l'ingegneria dei dati, aiutandoci a minimizzare i potenziali danni e le conseguenze indesiderate delle nostre azioni guidate dai dati. Il [Gartner Hype Cycle per l'AI](https://www.gartner.com/smarterwithgartner/2-megatrends-dominate-the-gartner-hype-cycle-for-artificial-intelligence-2020/) identifica tendenze rilevanti nell'etica digitale, nell'AI responsabile e nella governance dell'AI come fattori chiave per megatrend più ampi legati alla _democratizzazione_ e _industrializzazione_ dell'AI.
L'etica dei dati è ora _un binario necessario_ per la scienza e l'ingegneria dei dati, aiutandoci a minimizzare i potenziali danni e le conseguenze indesiderate delle nostre azioni guidate dai dati. Il [Gartner Hype Cycle per l'AI](https://www.gartner.com/smarterwithgartner/2-megatrends-dominate-the-gartner-hype-cycle-for-artificial-intelligence-2020/) identifica tendenze rilevanti in etica digitale, AI responsabile e governance dell'AI come fattori chiave per megatrend più ampi legati alla _democratizzazione_ e _industrializzazione_ dell'AI.
![Gartner's Hype Cycle for AI - 2020](https://images-cdn.newscred.com/Zz1mOWJhNzlkNDA2ZTMxMWViYjRiOGFiM2IyMjQ1YmMwZQ==)
![Gartner's Hype Cycle per l'AI - 2020](https://images-cdn.newscred.com/Zz1mOWJhNzlkNDA2ZTMxMWViYjRiOGFiM2IyMjQ1YmMwZQ==)
In questa lezione, esploreremo l'affascinante area dell'etica dei dati - dai concetti fondamentali e le sfide, agli studi di caso e ai concetti applicati di AI come la governance - che aiutano a stabilire una cultura etica nei team e nelle organizzazioni che lavorano con dati e AI.
In questa lezione, esploreremo l'affascinante area dell'etica dei dati - dai concetti fondamentali e sfide, agli studi di caso e ai concetti applicati di AI come la governance - che aiutano a stabilire una cultura etica nei team e nelle organizzazioni che lavorano con dati e AI.
## [Quiz pre-lezione](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/2) 🎯
@ -39,7 +39,7 @@ La parola "etica" deriva dalla [parola greca "ethikos"](https://en.wikipedia.org
**Etica dei dati** è un [nuovo ramo dell'etica](https://royalsocietypublishing.org/doi/full/10.1098/rsta.2016.0360#sec-1) che "studia e valuta i problemi morali legati a _dati, algoritmi e pratiche corrispondenti_". Qui, **"dati"** si concentra sulle azioni relative alla generazione, registrazione, cura, elaborazione, diffusione, condivisione e utilizzo, **"algoritmi"** si concentra su AI, agenti, machine learning e robot, e **"pratiche"** si concentra su argomenti come innovazione responsabile, programmazione, hacking e codici etici.
**Etica applicata** è l'[applicazione pratica delle considerazioni morali](https://en.wikipedia.org/wiki/Applied_ethics). È il processo di investigare attivamente le questioni etiche nel contesto di _azioni, prodotti e processi reali_, e di adottare misure correttive per garantire che rimangano allineati ai nostri valori etici definiti.
**Etica applicata** è l'[applicazione pratica delle considerazioni morali](https://en.wikipedia.org/wiki/Applied_ethics). È il processo di indagare attivamente le questioni etiche nel contesto di _azioni, prodotti e processi reali_, e di adottare misure correttive per garantire che rimangano allineati ai nostri valori etici definiti.
**Cultura etica** riguarda [_operazionalizzare_ l'etica applicata](https://hbr.org/2019/05/how-to-design-an-ethical-organization) per garantire che i nostri principi e pratiche etiche siano adottati in modo coerente e scalabile in tutta l'organizzazione. Le culture etiche di successo definiscono principi etici a livello organizzativo, forniscono incentivi significativi per la conformità e rafforzano le norme etiche incoraggiando e amplificando i comportamenti desiderati a ogni livello dell'organizzazione.
@ -51,7 +51,7 @@ In questa sezione, discuteremo concetti come **valori condivisi** (principi) e *
Ogni strategia di etica dei dati inizia definendo _principi etici_ - i "valori condivisi" che descrivono comportamenti accettabili e guidano azioni conformi nei nostri progetti di dati e AI. Puoi definirli a livello individuale o di team. Tuttavia, la maggior parte delle grandi organizzazioni li delinea in una dichiarazione di missione o quadro di _AI etica_ definita a livello aziendale e applicata in modo coerente in tutti i team.
**Esempio:** La dichiarazione di missione di [AI responsabile](https://www.microsoft.com/en-us/ai/responsible-ai) di Microsoft recita: _"Siamo impegnati nel progresso dell'AI guidato da principi etici che mettono le persone al primo posto"_ - identificando 6 principi etici nel quadro seguente:
**Esempio:** La dichiarazione di missione di [AI responsabile](https://www.microsoft.com/en-us/ai/responsible-ai) di Microsoft recita: _"Siamo impegnati nell'avanzamento dell'AI guidata da principi etici che mettono le persone al primo posto"_ - identificando 6 principi etici nel quadro seguente:
![AI responsabile in Microsoft](https://docs.microsoft.com/en-gb/azure/cognitive-services/personalizer/media/ethics-and-responsible-use/ai-values-future-computed.png)
@ -59,7 +59,7 @@ Esploriamo brevemente questi principi. _Trasparenza_ e _responsabilità_ sono va
* [**Responsabilità**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) rende i professionisti _responsabili_ delle loro operazioni di dati e AI e della conformità a questi principi etici.
* [**Trasparenza**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) garantisce che le azioni di dati e AI siano _comprensibili_ (interpretabili) per gli utenti, spiegando il cosa e il perché delle decisioni.
* [**Equità**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1%3aprimaryr6) - si concentra sull'assicurare che l'AI tratti _tutte le persone_ equamente, affrontando eventuali pregiudizi socio-tecnici sistemici o impliciti nei dati e nei sistemi.
* [**Equità**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1%3aprimaryr6) - si concentra sull'assicurare che l'AI tratti _tutte le persone_ in modo equo, affrontando eventuali pregiudizi socio-tecnici sistemici o impliciti nei dati e nei sistemi.
* [**Affidabilità e sicurezza**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - garantisce che l'AI si comporti _coerentemente_ con i valori definiti, minimizzando i potenziali danni o conseguenze indesiderate.
* [**Privacy e sicurezza**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - riguarda la comprensione della provenienza dei dati e la fornitura di _privacy dei dati e protezioni correlate_ agli utenti.
* [**Inclusività**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - riguarda la progettazione di soluzioni AI con intenzione, adattandole per soddisfare una _ampia gamma di esigenze e capacità umane_.
@ -72,7 +72,7 @@ Una volta definiti i principi etici, il passo successivo è valutare le nostre a
Con la raccolta dati, le azioni probabilmente coinvolgeranno **dati personali** o informazioni personali identificabili (PII) per individui identificabili. Questo include [diversi elementi di dati non personali](https://ec.europa.eu/info/law/law-topic/data-protection/reform/what-personal-data_en) che _collettivamente_ identificano un individuo. Le sfide etiche possono riguardare _privacy dei dati_, _proprietà dei dati_ e argomenti correlati come _consenso informato_ e _diritti di proprietà intellettuale_ per gli utenti.
Con la progettazione algoritmica, le azioni coinvolgeranno la raccolta e la cura di **dataset**, quindi il loro utilizzo per addestrare e distribuire **modelli di dati** che prevedono risultati o automatizzano decisioni in contesti reali. Le sfide etiche possono derivare da _pregiudizi nei dataset_, problemi di _qualità dei dati_, _iniquità_ e _rappresentazione errata_ negli algoritmi - inclusi alcuni problemi di natura sistemica.
Con la progettazione algoritmica, le azioni coinvolgeranno la raccolta e la cura di **dataset**, quindi il loro utilizzo per addestrare e distribuire **modelli di dati** che prevedono risultati o automatizzano decisioni in contesti reali. Le sfide etiche possono derivare da _pregiudizi nei dataset_, problemi di _qualità dei dati_, _iniquità_ e _rappresentazione errata_ negli algoritmi - inclusi alcuni problemi che sono sistemici.
In entrambi i casi, le sfide etiche evidenziano aree in cui le nostre azioni possono entrare in conflitto con i nostri valori condivisi. Per rilevare, mitigare, minimizzare o eliminare queste preoccupazioni, dobbiamo porci domande morali "sì/no" relative alle nostre azioni, quindi adottare misure correttive secondo necessità. Esaminiamo alcune sfide etiche e le domande morali che sollevano:
@ -89,7 +89,7 @@ Le domande morali da porsi sono:
Il [consenso informato](https://legaldictionary.net/informed-consent/) definisce l'atto degli utenti di accettare un'azione (come la raccolta dati) con una _piena comprensione_ dei fatti rilevanti, inclusi lo scopo, i rischi potenziali e le alternative.
Le domande da esplorare qui sono:
Domande da esplorare qui sono:
* L'utente (soggetto dei dati) ha dato il permesso per la cattura e l'uso dei dati?
* L'utente ha compreso lo scopo per cui quei dati sono stati catturati?
* L'utente ha compreso i rischi potenziali derivanti dalla sua partecipazione?
@ -98,7 +98,7 @@ Le domande da esplorare qui sono:
La [proprietà intellettuale](https://en.wikipedia.org/wiki/Intellectual_property) si riferisce a creazioni intangibili derivanti dall'iniziativa umana, che possono _avere valore economico_ per individui o aziende.
Le domande da esplorare qui sono:
Domande da esplorare qui sono:
* I dati raccolti avevano valore economico per un utente o un'azienda?
* L'**utente** ha proprietà intellettuale qui?
* L'**organizzazione** ha proprietà intellettuale qui?
@ -108,17 +108,17 @@ Le domande da esplorare qui sono:
La [privacy dei dati](https://www.northeastern.edu/graduate/blog/what-is-data-privacy/) o privacy delle informazioni si riferisce alla preservazione della privacy degli utenti e alla protezione dell'identità degli utenti rispetto alle informazioni personali identificabili.
Le domande da esplorare qui sono:
* I dati (personali) degli utenti sono protetti contro hack e fughe di informazioni?
Domande da esplorare qui sono:
* I dati (personali) degli utenti sono protetti contro hack e fughe di dati?
* I dati degli utenti sono accessibili solo a utenti e contesti autorizzati?
* L'anonimato degli utenti è preservato quando i dati vengono condivisi o diffusi?
* È possibile de-identificare un utente da dataset anonimizzati?
#### 2.5 Diritto all'oblio
Il [Diritto all'oblio](https://en.wikipedia.org/wiki/Right_to_be_forgotten) o [Diritto alla cancellazione](https://www.gdpreu.org/right-to-be-forgotten/) offre una protezione aggiuntiva dei dati personali agli utenti. In particolare, dà agli utenti il diritto di richiedere la cancellazione o la rimozione dei dati personali dalle ricerche su Internet e da altre posizioni, _in circostanze specifiche_ - permettendo loro un nuovo inizio online senza che le azioni passate vengano loro imputate.
Il [Diritto all'oblio](https://en.wikipedia.org/wiki/Right_to_be_forgotten) o [Diritto alla cancellazione](https://www.gdpreu.org/right-to-be-forgotten/) offre ulteriore protezione dei dati personali agli utenti. In particolare, dà agli utenti il diritto di richiedere la cancellazione o la rimozione dei dati personali da ricerche su Internet e altre posizioni, _in circostanze specifiche_ - permettendo loro un nuovo inizio online senza che le azioni passate vengano usate contro di loro.
Le domande da esplorare qui sono:
Domande da esplorare qui sono:
* Il sistema consente ai soggetti dei dati di richiedere la cancellazione?
* Il ritiro del consenso dell'utente dovrebbe innescare una cancellazione automatica?
* I dati sono stati raccolti senza consenso o con mezzi illeciti?
@ -126,9 +126,9 @@ Le domande da esplorare qui sono:
#### 2.6 Pregiudizi nei dataset
Il pregiudizio nei dataset o [pregiudizio nella raccolta](http://researcharticles.com/index.php/bias-in-data-collection-in-research/) riguarda la selezione di un sottoinsieme _non rappresentativo_ di dati per lo sviluppo degli algoritmi, creando potenziale iniquità nei risultati per gruppi diversi. Tipi di pregiudizio includono pregiudizio di selezione o campionamento, pregiudizio volontario e pregiudizio strumentale.
Il pregiudizio nei dataset o [pregiudizio nella raccolta](http://researcharticles.com/index.php/bias-in-data-collection-in-research/) riguarda la selezione di un sottoinsieme _non rappresentativo_ di dati per lo sviluppo di algoritmi, creando potenziale iniquità nei risultati per gruppi diversi. Tipi di pregiudizio includono pregiudizio di selezione o campionamento, pregiudizio volontario e pregiudizio strumentale.
Le domande da esplorare qui sono:
Domande da esplorare qui sono:
* Abbiamo reclutato un set rappresentativo di soggetti dei dati?
* Abbiamo testato il nostro dataset raccolto o curato per vari pregiudizi?
* Possiamo mitigare o rimuovere eventuali pregiudizi scoperti?
@ -137,14 +137,14 @@ Le domande da esplorare qui sono:
La [qualità dei dati](https://lakefs.io/data-quality-testing/) esamina la validità del dataset curato utilizzato per sviluppare i nostri algoritmi, verificando se le caratteristiche e i record soddisfano i requisiti per il livello di accuratezza e coerenza necessario per il nostro scopo AI.
Le domande da esplorare qui sono:
Domande da esplorare qui sono:
* Abbiamo catturato caratteristiche valide per il nostro caso d'uso?
* I dati sono stati catturati in modo coerente tra diverse fonti di dati?
* Il dataset è completo per condizioni o scenari diversi?
* Le informazioni catturate riflettono accuratamente la realtà?
#### 2.8 Equità degli algoritmi
[Algorithm Fairness](https://towardsdatascience.com/what-is-algorithm-fairness-3182e161cf9f) verifica se la progettazione dell'algoritmo discrimina sistematicamente contro specifici sottogruppi di soggetti, portando a [potenziali danni](https://docs.microsoft.com/en-us/azure/machine-learning/concept-fairness-ml) nella _distribuzione_ (dove le risorse vengono negate o trattenute per quel gruppo) e nella _qualità del servizio_ (dove l'IA non è altrettanto accurata per alcuni sottogruppi rispetto ad altri).
[Algorithm Fairness](https://towardsdatascience.com/what-is-algorithm-fairness-3182e161cf9f) verifica se il design dell'algoritmo discrimina sistematicamente contro specifici sottogruppi di soggetti, portando a [potenziali danni](https://docs.microsoft.com/en-us/azure/machine-learning/concept-fairness-ml) nella _distribuzione_ (dove le risorse vengono negate o trattenute per quel gruppo) e nella _qualità del servizio_ (dove l'IA non è altrettanto accurata per alcuni sottogruppi rispetto ad altri).
Domande da esplorare qui sono:
* Abbiamo valutato l'accuratezza del modello per sottogruppi e condizioni diverse?
@ -164,7 +164,7 @@ Domande da esplorare qui sono:
* Ci sono spiegazioni alternative che potrebbero offrire una conclusione diversa?
#### 2.10 Libera Scelta
L'[Illusione della Libera Scelta](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice) si verifica quando le "architetture di scelta" del sistema utilizzano algoritmi decisionali per spingere le persone verso un risultato preferito, pur dando l'impressione di offrire opzioni e controllo. Questi [dark patterns](https://www.darkpatterns.org/) possono causare danni sociali ed economici agli utenti. Poiché le decisioni degli utenti influenzano i profili comportamentali, queste azioni possono potenzialmente guidare scelte future che amplificano o estendono l'impatto di tali danni.
L'[Illusione della Libera Scelta](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice) si verifica quando le "architetture di scelta" del sistema utilizzano algoritmi decisionali per spingere le persone verso un risultato preferito, pur dando l'impressione di offrire opzioni e controllo. Questi [dark patterns](https://www.darkpatterns.org/) possono causare danni sociali ed economici agli utenti. Poiché le decisioni degli utenti influenzano i profili comportamentali, queste azioni possono potenzialmente guidare scelte future che amplificano o estendono l'impatto di questi danni.
Domande da esplorare qui sono:
* L'utente ha compreso le implicazioni di quella scelta?
@ -180,19 +180,18 @@ Ecco alcuni esempi:
| Sfida Etica | Studio di Caso |
|--- |--- |
| **Consenso Informato** | 1972 - [Tuskegee Syphilis Study](https://en.wikipedia.org/wiki/Tuskegee_Syphilis_Study) - Gli uomini afroamericani che parteciparono allo studio furono promessi cure mediche gratuite _ma ingannati_ dai ricercatori che non informarono i soggetti della loro diagnosi o della disponibilità di trattamenti. Molti soggetti morirono e partner o figli furono colpiti; lo studio durò 40 anni. |
| **Privacy dei Dati** | 2007 - Il [Netflix data prize](https://www.wired.com/2007/12/why-anonymous-data-sometimes-isnt/) fornì ai ricercatori _10M di valutazioni di film anonimizzate da 50K clienti_ per migliorare gli algoritmi di raccomandazione. Tuttavia, i ricercatori furono in grado di correlare i dati anonimizzati con dati identificabili personalmente in _dataset esterni_ (ad esempio, commenti su IMDb), "de-anonimizzando" efficacemente alcuni abbonati Netflix.|
| **Bias nella Raccolta** | 2013 - La città di Boston [sviluppò Street Bump](https://www.boston.gov/transportation/street-bump), un'app che permetteva ai cittadini di segnalare buche, fornendo alla città dati migliori sulle strade per trovare e risolvere i problemi. Tuttavia, [le persone nei gruppi a basso reddito avevano meno accesso a auto e telefoni](https://hbr.org/2013/04/the-hidden-biases-in-big-data), rendendo invisibili i loro problemi stradali in questa app. Gli sviluppatori lavorarono con accademici per affrontare _problemi di accesso equo e divari digitali_ per garantire equità. |
| **Privacy dei Dati** | 2007 - Il [Netflix data prize](https://www.wired.com/2007/12/why-anonymous-data-sometimes-isnt/) fornì ai ricercatori _10M di valutazioni di film anonimizzate da 50K clienti_ per migliorare gli algoritmi di raccomandazione. Tuttavia, i ricercatori riuscirono a correlare i dati anonimizzati con dati identificabili personalmente in _dataset esterni_ (ad esempio, commenti su IMDb), "de-anonimizzando" di fatto alcuni abbonati Netflix.|
| **Bias nella Raccolta** | 2013 - La città di Boston [sviluppò Street Bump](https://www.boston.gov/transportation/street-bump), un'app che permetteva ai cittadini di segnalare buche, fornendo alla città dati migliori sulle strade per individuare e risolvere i problemi. Tuttavia, [le persone con redditi più bassi avevano meno accesso a auto e telefoni](https://hbr.org/2013/04/the-hidden-biases-in-big-data), rendendo invisibili i loro problemi stradali in questa app. Gli sviluppatori collaborarono con accademici per affrontare _problemi di accesso equo e divari digitali_ per garantire equità. |
| **Equità Algoritmica** | 2018 - Lo studio MIT [Gender Shades Study](http://gendershades.org/overview.html) valutò l'accuratezza dei prodotti di classificazione di genere basati su IA, evidenziando lacune nell'accuratezza per donne e persone di colore. Una [Apple Card del 2019](https://www.wired.com/story/the-apple-card-didnt-see-genderand-thats-the-problem/) sembrava offrire meno credito alle donne rispetto agli uomini. Entrambi illustrarono problemi di bias algoritmico che portano a danni socio-economici.|
| **Falsificazione dei Dati** | 2020 - Il [Dipartimento della Salute della Georgia pubblicò grafici COVID-19](https://www.vox.com/covid-19-coronavirus-us-response-trump/2020/5/18/21262265/georgia-covid-19-cases-declining-reopening) che sembravano fuorviare i cittadini sulle tendenze dei casi confermati con un ordinamento non cronologico sull'asse x. Questo illustra la falsificazione attraverso trucchi di visualizzazione. |
| **Illusione della libera scelta** | 2020 - L'app educativa [ABCmouse pagò $10M per risolvere una denuncia FTC](https://www.washingtonpost.com/business/2020/09/04/abcmouse-10-million-ftc-settlement/) in cui i genitori erano intrappolati nel pagamento di abbonamenti che non potevano cancellare. Questo illustra i dark patterns nelle architetture di scelta, dove gli utenti erano spinti verso scelte potenzialmente dannose. |
| **Privacy dei Dati e Diritti degli Utenti** | 2021 - La [violazione dei dati di Facebook](https://www.npr.org/2021/04/09/986005820/after-data-breach-exposes-530-million-facebook-says-it-will-not-notify-users) espose dati di 530M di utenti, portando a un accordo di $5B con la FTC. Tuttavia, si rifiutò di notificare agli utenti la violazione, violando i diritti degli utenti sulla trasparenza e l'accesso ai dati. |
| **Privacy dei Dati e Diritti degli Utenti** | 2021 - La [violazione dei dati di Facebook](https://www.npr.org/2021/04/09/986005820/after-data-breach-exposes-530-million-facebook-says-it-will-not-notify-users) espose dati di 530M di utenti, portando a un accordo da $5B con la FTC. Tuttavia, si rifiutò di notificare agli utenti la violazione, violando i diritti degli utenti sulla trasparenza e l'accesso ai dati. |
Vuoi esplorare più studi di caso? Dai un'occhiata a queste risorse:
* [Ethics Unwrapped](https://ethicsunwrapped.utexas.edu/case-studies) - dilemmi etici in diversi settori.
* [Corso di Etica della Data Science](https://www.coursera.org/learn/data-science-ethics#syllabus) - studi di caso fondamentali esplorati.
* [Dove le cose sono andate male](https://deon.drivendata.org/examples/) - checklist Deon con esempi.
> 🚨 Pensa agli studi di caso che hai visto: hai vissuto o sei stato colpito da una sfida etica simile nella tua vita? Riesci a pensare ad almeno un altro studio di caso che illustri una delle sfide etiche discusse in questa sezione?
## Etica Applicata
@ -213,41 +212,41 @@ Esempi includono:
### 2. Checklist Etiche
Mentre i codici professionali definiscono il comportamento _etico richiesto_ dai professionisti, [hanno limitazioni note](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md) nell'applicazione, in particolare nei progetti su larga scala. Invece, molti esperti di data science [sostengono le checklist](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md), che possono **collegare i principi alle pratiche** in modi più deterministici e attuabili.
Mentre i codici professionali definiscono il comportamento _etico richiesto_ dai professionisti, [hanno limiti noti](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md) nell'applicazione, in particolare nei progetti su larga scala. Invece, molti esperti di data science [sostengono le checklist](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md), che possono **collegare i principi alle pratiche** in modi più deterministici e attuabili.
Le checklist convertono le domande in compiti "sì/no" che possono essere operazionalizzati, permettendo loro di essere tracciati come parte dei flussi di lavoro standard di rilascio del prodotto.
Esempi includono:
* [Deon](https://deon.drivendata.org/) - una checklist etica generale per i dati creata da [raccomandazioni del settore](https://deon.drivendata.org/#checklist-citations) con uno strumento da riga di comando per una facile integrazione.
* [Privacy Audit Checklist](https://cyber.harvard.edu/ecommerce/privacyaudit.html) - fornisce linee guida generali per le pratiche di gestione delle informazioni da prospettive legali e sociali.
* [Deon](https://deon.drivendata.org/) - una checklist etica generica per i dati creata da [raccomandazioni del settore](https://deon.drivendata.org/#checklist-citations) con uno strumento da riga di comando per una facile integrazione.
* [Privacy Audit Checklist](https://cyber.harvard.edu/ecommerce/privacyaudit.html) - fornisce indicazioni generali per le pratiche di gestione delle informazioni da prospettive legali e sociali.
* [AI Fairness Checklist](https://www.microsoft.com/en-us/research/project/ai-fairness-checklist/) - creata da professionisti dell'IA per supportare l'adozione e l'integrazione di controlli di equità nei cicli di sviluppo dell'IA.
* [22 domande per l'etica nei dati e nell'IA](https://medium.com/the-organization/22-questions-for-ethics-in-data-and-ai-efb68fd19429) - quadro più aperto, strutturato per l'esplorazione iniziale delle questioni etiche nel design, implementazione e contesti organizzativi.
* [22 domande per l'etica nei dati e nell'IA](https://medium.com/the-organization/22-questions-for-ethics-in-data-and-ai-efb68fd19429) - framework più aperto, strutturato per l'esplorazione iniziale delle questioni etiche nel design, implementazione e contesti organizzativi.
### 3. Regolamenti Etici
L'etica riguarda la definizione di valori condivisi e il fare la cosa giusta _volontariamente_. **Conformità** riguarda il _rispetto della legge_ se e dove definita. **Governance** copre in generale tutti i modi in cui le organizzazioni operano per applicare principi etici e rispettare le leggi stabilite.
Oggi, la governance assume due forme all'interno delle organizzazioni. In primo luogo, riguarda la definizione di principi di **IA etica** e l'istituzione di pratiche per operazionalizzare l'adozione in tutti i progetti legati all'IA nell'organizzazione. In secondo luogo, riguarda il rispetto di tutti i regolamenti governativi di **protezione dei dati** per le regioni in cui opera.
Oggi, la governance assume due forme all'interno delle organizzazioni. Innanzitutto, riguarda la definizione di principi di **IA etica** e l'istituzione di pratiche per operazionalizzare l'adozione in tutti i progetti legati all'IA nell'organizzazione. In secondo luogo, riguarda il rispetto di tutti i regolamenti governativi di **protezione dei dati** per le regioni in cui opera.
Esempi di regolamenti sulla protezione e privacy dei dati:
Esempi di regolamenti sulla protezione dei dati e sulla privacy:
* `1974`, [US Privacy Act](https://www.justice.gov/opcl/privacy-act-1974) - regola la raccolta, l'uso e la divulgazione di informazioni personali da parte del _governo federale_.
* `1996`, [US Health Insurance Portability & Accountability Act (HIPAA)](https://www.cdc.gov/phlp/publications/topic/hipaa.html) - protegge i dati sanitari personali.
* `1998`, [US Children's Online Privacy Protection Act (COPPA)](https://www.ftc.gov/enforcement/rules/rulemaking-regulatory-reform-proceedings/childrens-online-privacy-protection-rule) - protegge la privacy dei dati dei bambini sotto i 13 anni.
* `2018`, [General Data Protection Regulation (GDPR)](https://gdpr-info.eu/) - fornisce diritti agli utenti, protezione dei dati e privacy.
* `2018`, [California Consumer Privacy Act (CCPA)](https://www.oag.ca.gov/privacy/ccpa) - offre ai consumatori più _diritti_ sui loro dati personali.
* `2021`, La [Legge sulla Protezione delle Informazioni Personali della Cina](https://www.reuters.com/world/china/china-passes-new-personal-data-privacy-law-take-effect-nov-1-2021-08-20/) appena approvata, crea una delle regolamentazioni sulla privacy online più forti al mondo.
* `2021`, La [Legge sulla Protezione delle Informazioni Personali della Cina](https://www.reuters.com/world/china/china-passes-new-personal-data-privacy-law-take-effect-nov-1-2021-08-20/) appena approvata, crea una delle normative sulla privacy online più forti al mondo.
> 🚨 L'Unione Europea ha definito il GDPR (Regolamento Generale sulla Protezione dei Dati), che rimane una delle regolamentazioni sulla privacy dei dati più influenti oggi. Sapevi che definisce anche [8 diritti degli utenti](https://www.freeprivacypolicy.com/blog/8-user-rights-gdpr) per proteggere la privacy digitale e i dati personali dei cittadini? Scopri quali sono e perché sono importanti.
> 🚨 L'Unione Europea ha definito il GDPR (Regolamento Generale sulla Protezione dei Dati), che rimane una delle normative sulla privacy dei dati più influenti oggi. Sapevi che definisce anche [8 diritti degli utenti](https://www.freeprivacypolicy.com/blog/8-user-rights-gdpr) per proteggere la privacy digitale e i dati personali dei cittadini? Scopri quali sono e perché sono importanti.
### 4. Cultura Etica
Nota che rimane un divario intangibile tra _conformità_ (fare abbastanza per soddisfare "la lettera della legge") e affrontare [problemi sistemici](https://www.coursera.org/learn/data-science-ethics/home/week/4) (come ossificazione, asimmetria informativa e ingiustizia distributiva) che possono accelerare la strumentalizzazione dell'IA.
Quest'ultimo richiede [approcci collaborativi per definire culture etiche](https://towardsdatascience.com/why-ai-ethics-requires-a-culture-driven-approach-26f451afa29f) che costruiscano connessioni emotive e valori condivisi coerenti _tra le organizzazioni_ nel settore. Questo richiede più [culture etiche formalizzate](https://www.codeforamerica.org/news/formalizing-an-ethical-data-culture/) nelle organizzazioni - permettendo a _chiunque_ di [tirare la corda Andon](https://en.wikipedia.org/wiki/Andon_(manufacturing)) (per sollevare preoccupazioni etiche presto nel processo) e rendendo _le valutazioni etiche_ (ad esempio, nell'assunzione) un criterio centrale per la formazione del team nei progetti di IA.
Quest'ultimo richiede [approcci collaborativi per definire culture etiche](https://towardsdatascience.com/why-ai-ethics-requires-a-culture-driven-approach-26f451afa29f) che costruiscano connessioni emotive e valori condivisi coerenti _tra organizzazioni_ nel settore. Questo richiede più [culture etiche formalizzate](https://www.codeforamerica.org/news/formalizing-an-ethical-data-culture/) nelle organizzazioni - permettendo a _chiunque_ di [tirare la corda Andon](https://en.wikipedia.org/wiki/Andon_(manufacturing)) (per sollevare preoccupazioni etiche presto nel processo) e rendendo _le valutazioni etiche_ (ad esempio, nell'assunzione) un criterio centrale per la formazione dei team nei progetti di IA.
---
## [Quiz post-lezione](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/3) 🎯
## [Quiz post-lezione](https://ff-quizzes.netlify.app/en/ds/) 🎯
## Revisione e Studio Autonomo
Corsi e libri aiutano a comprendere i concetti etici fondamentali e le sfide, mentre studi di caso e strumenti aiutano con le pratiche etiche applicate in contesti reali. Ecco alcune risorse per iniziare.
@ -264,5 +263,5 @@ Corsi e libri aiutano a comprendere i concetti etici fondamentali e le sfide, me
---
**Disclaimer (Avvertenza)**:
Questo documento è stato tradotto utilizzando il servizio di traduzione automatica [Co-op Translator](https://github.com/Azure/co-op-translator). Sebbene ci impegniamo per garantire l'accuratezza, si prega di tenere presente che le traduzioni automatiche possono contenere errori o imprecisioni. Il documento originale nella sua lingua nativa dovrebbe essere considerato la fonte autorevole. Per informazioni critiche, si raccomanda una traduzione professionale effettuata da un traduttore umano. Non siamo responsabili per eventuali malintesi o interpretazioni errate derivanti dall'uso di questa traduzione.
**Disclaimer**:
Questo documento è stato tradotto utilizzando il servizio di traduzione automatica [Co-op Translator](https://github.com/Azure/co-op-translator). Sebbene ci impegniamo per garantire l'accuratezza, si prega di notare che le traduzioni automatiche possono contenere errori o imprecisioni. Il documento originale nella sua lingua nativa dovrebbe essere considerato la fonte autorevole. Per informazioni critiche, si raccomanda una traduzione professionale effettuata da un traduttore umano. Non siamo responsabili per eventuali incomprensioni o interpretazioni errate derivanti dall'uso di questa traduzione.

@ -1,29 +1,29 @@
<!--
CO_OP_TRANSLATOR_METADATA:
{
"original_hash": "8796f41f566a0a8ebb72863a83d558ed",
"translation_date": "2025-08-25T16:45:45+00:00",
"original_hash": "3a34157cc63516eba97c89a0b2f8c3e6",
"translation_date": "2025-09-03T21:02:54+00:00",
"source_file": "1-Introduction/02-ethics/README.md",
"language_code": "ja"
}
-->
# データ倫理の導入
|![ Sketchnote by [(@sketchthedocs)](https://sketchthedocs.dev) ](../../sketchnotes/02-Ethics.png)|
|![ [(@sketchthedocs)](https://sketchthedocs.dev) によるスケッチノート ](../../sketchnotes/02-Ethics.png)|
|:---:|
| データサイエンス倫理 - _スケッチノート by [@nitya](https://twitter.com/nitya)_ |
| データサイエンス倫理 - _[@nitya](https://twitter.com/nitya) によるスケッチノート_ |
---
私たちはデータ化された世界に生きるデータ市民です。
市場の動向によると、2022年までに大企業の3分の1がオンラインの[マーケットプレイスや取引所](https://www.gartner.com/smarterwithgartner/gartner-top-10-trends-in-data-and-analytics-for-2020/)を通じてデータを売買するようになると言われています。**アプリ開発者**として、データ駆動型の洞察やアルゴリズム駆動型の自動化を日常のユーザー体験に統合することが、より簡単安価になります。しかし、AIが広く普及するにつれて、そのようなアルゴリズムが大規模に[武器化](https://www.youtube.com/watch?v=TQHs8SA1qpk)されることで生じる潜在的な害についても理解する必要があります。
市場の動向によると、2022年までに大規模な組織の3分の1がオンラインの[マーケットプレイスや取引所](https://www.gartner.com/smarterwithgartner/gartner-top-10-trends-in-data-and-analytics-for-2020/)を通じてデータを売買するようになると言われています。**アプリ開発者**として、データ駆動型の洞察やアルゴリズム駆動型の自動化を日常のユーザー体験に統合することが、より簡単かつ安価になります。しかし、AIが広く普及するにつれて、そのようなアルゴリズムが大規模に[武器化](https://www.youtube.com/watch?v=TQHs8SA1qpk)されることで生じる潜在的な害についても理解する必要があります。
また、2025年までに[180ゼタバイト](https://www.statista.com/statistics/871513/worldwide-data-created/)以上のデータを生成・消費するという予測もあります。**データサイエンティスト**として、これにより個人データへのアクセスがかつてないほど容易になります。これにより、ユーザーの行動プロファイルを構築し、自由選択の[幻想](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice)を作り出しながら、私たちが望む結果にユーザーを誘導することが可能になります。しかし、これによりデータプライバシーやユーザー保護に関する広範な問題も浮上します。
また、2025年までに[180ゼタバイト](https://www.statista.com/statistics/871513/worldwide-data-created/)以上のデータを生成・消費するという予測もあります。**データサイエンティスト**として、これにより個人データへのアクセスがかつてないほど容易になります。これにより、ユーザーの行動プロファイルを構築し、[自由選択の錯覚](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice)を作り出しながら、ユーザーを私たちが望む結果に誘導することが可能になります。しかし、これによりデータプライバシーやユーザー保護に関する広範な問題も浮上します。
データ倫理は、データサイエンスやエンジニアリングにおける潜在的な害や意図しない結果を最小限に抑えるための_必要なガードレール_となります。[ガートナーのAIハイプサイクル](https://www.gartner.com/smarterwithgartner/2-megatrends-dominate-the-gartner-hype-cycle-for-artificial-intelligence-2020/)は、デジタル倫理、責任あるAI、AIガバナンスに関連するトレンドを、AIの_民主化_と_産業化_を推進する主要なメガトレンドとして特定しています。
データ倫理は、データサイエンスやエンジニアリングにおける潜在的な害や意図しない結果を最小限に抑えるための_必要なガードレール_です。[GartnerのAIハイプサイクル](https://www.gartner.com/smarterwithgartner/2-megatrends-dominate-the-gartner-hype-cycle-for-artificial-intelligence-2020/)は、デジタル倫理、責任あるAI、AIガバナンスに関連するトレンドを、AIの_民主化_と_産業化_を推進する主要なメガトレンドとして特定しています。
![ガートナーのAIハイプサイクル - 2020](https://images-cdn.newscred.com/Zz1mOWJhNzlkNDA2ZTMxMWViYjRiOGFiM2IyMjQ1YmMwZQ==)
![GartnerのAIハイプサイクル - 2020](https://images-cdn.newscred.com/Zz1mOWJhNzlkNDA2ZTMxMWViYjRiOGFiM2IyMjQ1YmMwZQ==)
このレッスンでは、データ倫理の魅力的な分野を探求します。基本的な概念や課題から、ケーススタディやガバナンスのような応用AIの概念まで、データやAIを扱うチームや組織に倫理文化を確立する方法を学びます。
@ -35,27 +35,27 @@ CO_OP_TRANSLATOR_METADATA:
「倫理」という言葉は、[ギリシャ語の「ethikos」](https://en.wikipedia.org/wiki/Ethics)その語源である「ethos」に由来し、_性格や道徳的性質_を意味します。
**倫理**とは、社会における行動を支配する共有価値観や道徳的原則のことです。倫理は法律ではなく、「正しい vs. 間違っている」という広く受け入れられた規範に基づいています。しかし、倫理的な考慮事項は、企業統治の取り組みや政府規制に影響を与え、コンプライアンスのためのインセンティブを増やすことがあります。
**倫理**とは、社会における行動を支配する共有価値観や道徳的原則のことです。倫理は法律ではなく、「正しい vs. 間違っている」という広く受け入れられた規範に基づいています。しかし、倫理的な考慮事項は、企業統治の取り組みや政府規制に影響を与え、コンプライアンスのインセンティブを増やすことがあります。
**データ倫理**は、_データ、アルゴリズム、およびそれに関連する実践_に関する道徳的問題を「研究し評価する」[新しい倫理の分野](https://royalsocietypublishing.org/doi/full/10.1098/rsta.2016.0360#sec-1)です。ここで、**「データ」**は生成、記録、キュレーション、処理、普及、共有、使用に関連する行動に焦点を当て、**「アルゴリズム」**はAI、エージェント、機械学習、ロボットに焦点を当て、**「実践」**は責任あるイノベーション、プログラミング、ハッキング、倫理コードなどのトピックに焦点を当てます。
**データ倫理**は、_データ、アルゴリズム、対応する実践_に関連する道徳的問題を「研究し評価する」[新しい倫理の分野](https://royalsocietypublishing.org/doi/full/10.1098/rsta.2016.0360#sec-1)です。ここで、**「データ」**は生成、記録、キュレーション、処理、普及、共有、使用に関連する行動に焦点を当て、**「アルゴリズム」**はAI、エージェント、機械学習、ロボットに焦点を当て、**「実践」**は責任あるイノベーション、プログラミング、ハッキング、倫理コードなどのトピックに焦点を当てます。
**応用倫理**は、_現実世界の行動、製品、プロセス_の文脈で倫理的問題を積極的に調査し、定義された倫理的価値観に沿った状態を維持するために是正措置を講じる[道徳的考慮事項の実践的応用](https://en.wikipedia.org/wiki/Applied_ethics)です。
**応用倫理**は、_現実世界の行動、製品、プロセス_の文脈で倫理的問題を積極的に調査し、定義された倫理的価値観に一致するように是正措置を講じる[道徳的考慮事項の実践的応用](https://en.wikipedia.org/wiki/Applied_ethics)です。
**倫理文化**は、組織全体で倫理的原則と実践が一貫してスケーラブルに採用されるようにするために、応用倫理を[_運用化_](https://hbr.org/2019/05/how-to-design-an-ethical-organization)することです。成功する倫理文化は、組織全体の倫理的原則を定義し、コンプライアンスのための意味のあるインセンティブを提供し、望ましい行動を奨励し増幅することで、組織のあらゆるレベルで倫理規範を強化します。
**倫理文化**は、組織全体で倫理的原則と実践が一貫して拡張可能な方法で採用されるようにするために、応用倫理を[_運用化_](https://hbr.org/2019/05/how-to-design-an-ethical-organization)することです。成功する倫理文化は、組織全体の倫理的原則を定義し、コンプライアンスに対する意味のあるインセンティブを提供し、望ましい行動を奨励し増幅することで、組織のあらゆるレベルで倫理規範を強化します。
## 倫理の概念
このセクションでは、データ倫理における**共有価値観**(原則)や**倫理的課題**(問題)について議論し、これらの概念を現実世界の文脈で理解するための**ケーススタディ**を探ます。
このセクションでは、データ倫理における**共有価値観**(原則)や**倫理的課題**(問題)について議論し、これらの概念を現実世界の文脈で理解するための**ケーススタディ**を探求します。
### 1. 倫理原則
すべてのデータ倫理戦略は、_倫理原則_を定義することから始まります。これは、データとAIプロジェクトにおける許容される行動を記述し、コンプライアンス行動を導く「共有価値観」です。これらは個人やチームレベルで定義することができます。しかし、ほとんどの大企業は、企業レベルで定義され、すべてのチームに一貫して適用される_倫理的AI_ミッションステートメントやフレームワークにこれをまとめています。
すべてのデータ倫理戦略は、_倫理原則_を定義することから始まります。これは、データとAIプロジェクトにおける許容される行動を記述し、コンプライアンス行動を導く「共有価値観」です。これらは個人やチームレベルで定義することができます。しかし、ほとんどの大規模な組織では、これらを企業レベルで定義され、すべてのチームで一貫して施行される_倫理的AI_ミッションステートメントやフレームワークにまとめています。
**例:** Microsoftの[責任あるAI](https://www.microsoft.com/en-us/ai/responsible-ai)ミッションステートメントは、_「私たちは、人々を第一に考える倫理原則によって推進されるAIの進歩にコミットしています」_と述べ、以下の6つの倫理原則を特定しています
**例:** Microsoftの[責任あるAI](https://www.microsoft.com/en-us/ai/responsible-ai)ミッションステートメントは、_「人々を第一に考える倫理原則によって推進されるAIの進歩にコミットしています」_と述べており、以下の6つの倫理原則を特定しています
![Microsoftの責任あるAI](https://docs.microsoft.com/en-gb/azure/cognitive-services/personalizer/media/ethics-and-responsible-use/ai-values-future-computed.png)
これらの原則を簡単に探ってみましょう。_透明性_と_責任_は他の原則の基盤となる価値観であるため、まずそこから始めます
これらの原則を簡単にてみましょう。_透明性_と_責任_は他の原則の基盤となる価値観であるため、まずそこから始めます
* [**責任**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6)は、実践者がデータとAIの運用に対して_責任_を持ち、これらの倫理原則に準拠することを保証します。
* [**透明性**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6)は、データとAIの行動がユーザーにとって_理解可能_解釈可能であり、決定の背後にある内容と理由を説明することを保証します。
@ -64,21 +64,21 @@ CO_OP_TRANSLATOR_METADATA:
* [**プライバシーとセキュリティ**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6)は、データの系譜を理解し、ユーザーに_データプライバシーと関連する保護_を提供することに焦点を当てます。
* [**包括性**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6)は、AIソリューションを意図的に設計し、_幅広い人間のニーズ_と能力に対応するように適応させることに焦点を当てます。
> 🚨 あなたのデータ倫理ミッションステートメントはどのようなものになるでしょうか。他の組織の倫理的AIフレームワークを探ってみましょう。ここには[IBM](https://www.ibm.com/cloud/learn/ai-ethics)、[Google](https://ai.google/principles)、[Facebook](https://ai.facebook.com/blog/facebooks-five-pillars-of-responsible-ai/)の例があります。これらの共有価値観にはどのような共通点がありますかこれらの原則は、それぞれのAI製品や業界にどのように関連していますか
> 🚨 あなたのデータ倫理ミッションステートメントはどのようなものになるでしょうか。他の組織の倫理的AIフレームワークを探求してみましょう。例えば、[IBM](https://www.ibm.com/cloud/learn/ai-ethics)、[Google](https://ai.google/principles)、[Facebook](https://ai.facebook.com/blog/facebooks-five-pillars-of-responsible-ai/)の例があります。これらの共有価値観にはどのような共通点がありますかこれらの原則は、それぞれのAI製品や業界にどのように関連していますか
### 2. 倫理的課題
倫理原則を定義した後、次のステップは、データとAIの行動がこれらの共有価値観一致しているかどうかを評価することです。あなたの行動を_データ収集_と_アルゴリズム設計_の2つのカテゴリで考えてみてください
倫理原則を定義した後、次のステップは、データとAIの行動がこれらの共有価値観一致しているかどうかを評価することです。行動を_データ収集_と_アルゴリズム設計_の2つのカテゴリーで考えてみましょう
データ収集では、行動は**個人データ**や個人を特定できる情報PIIに関わる可能性があります。これには、個人を_集合的に_特定する[多様な非個人データ](https://ec.europa.eu/info/law/law-topic/data-protection/reform/what-personal-data_en)が含まれます。倫理的課題は、_データプライバシー_、_データ所有権_、および_インフォームドコンセント_や_知的財産権_などの関連トピックに関するものです。
データ収集では、行動は**個人データ**や個人を特定できる情報PIIを含む可能性があります。これには、個人を_集合的に_特定する[多様な非個人データ](https://ec.europa.eu/info/law/law-topic/data-protection/reform/what-personal-data_en)が含まれます。倫理的課題は、_データプライバシー_、_データ所有権_、および_インフォームドコンセント_や_知的財産権_などの関連トピックに関連する可能性があります。
アルゴリズム設計では、行動は**データセット**を収集・キュレーションし、それを使用して**データモデル**をトレーニング・展開し、現実世界の文脈で結果を予測したり意思決定を自動化したりします。倫理的課題は、_データセットのバイアス_、_データ品質_の問題、_不公平性_、およびアルゴリズムの_誤表現_に関連する可能性があります。これには、体系的な問題も含まれます。
アルゴリズム設計では、行動は**データセット**を収集・キュレーションし、それを使用して**データモデル**をトレーニング・展開し、現実世界の文脈で結果を予測したり意思決定を自動化したりすることに関連します。倫理的課題は、_データセットのバイアス_、_データ品質_の問題、_不公平性_、およびアルゴリズムの_誤表現_に関連する可能性があります。これには、体系的な問題も含まれることがあります。
どちらの場合も、倫理的課題は、行動が共有価値観と衝突する可能性のある領域を強調します。これらの懸念を検出、軽減、最小化、または排除するためには、行動に関連する道徳的な「はい/いいえ」の質問を行い、必要に応じて是正措置を講じる必要があります。倫理的課題とそれが提起する道徳的質問をいくつか見てみましょう
どちらの場合も、倫理的課題は、行動が共有価値観と衝突する可能性のある領域を強調します。これらの懸念を検出、緩和、最小化、または排除するためには、行動に関連する道徳的な「はい/いいえ」の質問を行い、必要に応じて是正措置を講じる必要があります。倫理的課題とそれが提起する道徳的質問をいくつか見てみましょう
#### 2.1 データ所有権
データ収集は、データ主体を特定できる個人データを含むことがよくあります。[データ所有権](https://permission.io/blog/data-ownership)は、データの成、処理、普及に関連する_コントロール_と[_ユーザー権利_](https://permission.io/blog/data-ownership)に関するものです。
データ収集は、データ主体を特定できる個人データを含むことがよくあります。[データ所有権](https://permission.io/blog/data-ownership)は、データの成、処理、普及に関連する_コントロール_と[_ユーザー権利_](https://permission.io/blog/data-ownership)に関するものです。
道徳的な質問は以下の通りです:
* データの所有者は誰ですか?(ユーザーまたは組織)
@ -87,38 +87,38 @@ CO_OP_TRANSLATOR_METADATA:
#### 2.2 インフォームドコンセント
[インフォームドコンセント](https://legaldictionary.net/informed-consent/)は、ユーザーが目的、潜在的リスク、代替案を含む関連事実を_完全に理解_した上で、行動データ収集に同意する行為を定義します。
[インフォームドコンセント](https://legaldictionary.net/informed-consent/)は、ユーザーが目的、潜在的リスク、代替案を含む関連事実を_完全に理解_した上で、行動データ収集に同意する行為を定義します。
ここで探るべき質問は:
ここで探求する質問は:
* ユーザー(データ主体)はデータの収集と使用に許可を与えましたか?
* ユーザーはそのデータが収集された目的を理解しましたか?
* ユーザーは参加による潜在的リスクを理解しましたか?
* ユーザーは参加による潜在的リスクを理解しましたか?
#### 2.3 知的財産
[知的財産](https://en.wikipedia.org/wiki/Intellectual_property)は、人間のイニシアチブから生じる無形の創造物であり、個人や企業にとって_経済的価値_を持つ可能性があります。
[知的財産](https://en.wikipedia.org/wiki/Intellectual_property)は、人間の創意工夫から生まれた無形の創造物であり、個人や企業にとって_経済的価値_を持つ可能性があります。
ここで探るべき質問は:
ここで探求する質問は:
* 収集されたデータはユーザーや企業にとって経済的価値を持っていましたか?
* **ユーザー**には知的財産がありますか?
* **組織**には知的財産がありますか?
* これらの権利が存在する場合、どのように保護していますか?
* これらの権利が存在する場合、それらをどのように保護していますか?
#### 2.4 データプライバシー
[データプライバシー](https://www.northeastern.edu/graduate/blog/what-is-data-privacy/)または情報プライバシーは、個人を特定できる情報に関して、ユーザーのプライバシーを維持し、ユーザーの身元を保護することを指します。
ここで探るべき質問は:
ここで探求する質問は:
* ユーザーの(個人)データはハッキングや漏洩から保護されていますか?
* ユーザーのデータは許可されたユーザーやコンテキストにのみアクセス可能ですか?
* ユーザーのデータは許可されたユーザーや文脈にのみアクセス可能ですか?
* データが共有または普及される際にユーザーの匿名性は維持されていますか?
* 匿名化されたデータセットからユーザーを特定することは可能ですか?
#### 2.5 忘れられる権利
[忘れられる権利](https://en.wikipedia.org/wiki/Right_to_be_forgotten)または[消去権](https://www.gdpreu.org/right-to-be-forgotten/)は、ユーザーに追加の個人データ保護を提供します。具体的には、特定の状況下でインターネット検索やその他の場所から個人データの削除を要求する権利をユーザーに与え、過去の行動が将来にわたって不利に働かないようにします。
[忘れられる権利](https://en.wikipedia.org/wiki/Right_to_be_forgotten)または[消去権](https://www.gdpreu.org/right-to-be-forgotten/)は、ユーザーに追加の個人データ保護を提供します。具体的には、特定の状況下でインターネット検索やその他の場所から個人データの削除または除去を要求する権利をユーザーに与え、過去の行動がユーザーに不利に働かないようにします。
ここで探るべき質問は:
ここで探求する質問は:
* システムはデータ主体が消去を要求することを許可していますか?
* ユーザーの同意の撤回が自動消去を引き起こすべきですか?
* データは同意なしまたは違法な手段で収集されましたか?
@ -126,124 +126,124 @@ CO_OP_TRANSLATOR_METADATA:
#### 2.6 データセットのバイアス
データセットまたは[収集バイアス](http://researcharticles.com/index.php/bias-in-data-collection-in-research/)は、アルゴリズム開発のために_非代表的な_データのサブセットを選択することで、多様なグループに対して結果の不公平性を生じさせることを指します。バイアスの種類には、選択またはサンプリングバイアス、ボランティアバイアス、機器バイアスがあります。
データセットまたは[収集バイアス](http://researcharticles.com/index.php/bias-in-data-collection-in-research/)は、アルゴリズム開発のために_非代表的な_データのサブセットを選択することで、さまざまなグループに対する結果の公平性に潜在的な影響を与えることを指します。バイアスの種類には、選択またはサンプリングバイアス、ボランティアバイアス、機器バイアスがあります。
ここで探るべき質問は:
ここで探求する質問は:
* 代表的なデータ主体のセットを募集しましたか?
* 収集またはキュレーションされたデータセットをさまざまなバイアスについてテストしましたか?
* 発見されたバイアスを軽減または除去することは可能ですか?
* 発見されたバイアスを緩和または除去することは可能ですか?
#### 2.7 データ品質
[データ品質](https://lake
[Algorithm Fairness](https://towardsdatascience.com/what-is-algorithm-fairness-3182e161cf9f) は、アルゴリズムの設計が特定のデータ主体のサブグループに対して体系的に差別を行い、_配分_そのグループにリソースが拒否または提供されないや_サービスの質_AIがあるサブグループに対して他のグループほど正確でないにおける[潜在的な被害](https://docs.microsoft.com/en-us/azure/machine-learning/concept-fairness-ml)を引き起こしていないかを確認するものです。
####
[Algorithm Fairness](https://towardsdatascience.com/what-is-algorithm-fairness-3182e161cf9f) は、アルゴリズム設計が特定のデータ主体のサブグループに対して体系的に差別を行い、_資源配分_そのグループに対して資源が拒否または保留される場合や_サービスの質_AIが特定のサブグループに対して他のグループほど正確でない場合における[潜在的な害](https://docs.microsoft.com/en-us/azure/machine-learning/concept-fairness-ml)を引き起こすかどうかを確認するものです。
ここで検討すべき質問は以下の通りです:
* 多様なサブグループや条件に対してモデルの精度を評価しましたか?
* 潜在的な被害(例:ステレオタイプ化)についてシステムを精査しましたか?
* 特定された害を軽減するためにデータを修正したり、モデルを再学習させたりできますか?
* ステレオタイプ化などの潜在的な害についてシステムを精査しましたか?
* 特定された害を軽減するためにデータを修正したりモデルを再学習させることは可能ですか?
[AI Fairness チェックリスト](https://query.prod.cms.rt.microsoft.com/cms/api/am/binary/RE4t6dA)のようなリソースを活用して、さらに学びましょう。
[AI Fairness チェックリスト](https://query.prod.cms.rt.microsoft.com/cms/api/am/binary/RE4t6dA)などのリソースを探求して、さらに学びましょう。
#### 2.9 誤った表現
#### 2.9 誤表現
[データの誤表現](https://www.sciencedirect.com/topics/computer-science/misrepresentation)とは、正直に報告されたデータから得られた洞察を、望ましいストーリーを支持するために欺瞞的に伝えていないかを問うことです。
[データの誤表現](https://www.sciencedirect.com/topics/computer-science/misrepresentation)とは、正直に報告されたデータから得られた洞察を、望ましいストーリーを支持するために欺瞞的に伝えていないかどうかを問うことです。
ここで検討すべき質問は以下の通りです:
* 不完全または不正確なデータを報告していませんか?
* 誤解を招く結論を導くような方法でデータを視化していませんか?
* 誤解を招く結論を導くような方法でデータを視化していませんか?
* 結果を操作するために選択的な統計手法を使用していませんか?
* 別の結論を導く可能性のある代替説明はありませんか?
* 別の結論を提供する可能性のある代替説明はありませんか?
#### 2.10 自由選択
[自由選択の錯覚](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice)は、システムの「選択アーキテクチャ」が意思決定アルゴリズムを使用して、人々を好ましい結果に誘導しつつ、選択肢やコントロールを与えているように見せかける場合に発生します。これらの[ダークパターン](https://www.darkpatterns.org/)は、ユーザーに社会的および経済的な被害をもたらす可能性があります。ユーザーの意思決定が行動プロファイルに影響を与えるため、これらの行動は将来の選択に影響を与え、被害の影響を拡大または延長する可能性があります。
[自由選択の錯覚](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice)は、システムの「選択アーキテクチャ」が意思決定アルゴリズムを使用して、ユーザーに選択肢やコントロールを与えているように見せながら、好ましい結果を取るよう促す場合に発生します。これらの[ダークパターン](https://www.darkpatterns.org/)は、ユーザーに社会的および経済的な害を引き起こす可能性があります。ユーザーの意思決定は行動プロファイルに影響を与えるため、これらの行動は将来の選択を促進または拡大する可能性があります。
ここで検討すべき質問は以下の通りです:
* ユーザーはその選択を行うことの影響を理解していましたか?
* ユーザーはその選択をすることの影響を理解していましたか?
* ユーザーは(代替の)選択肢とそれぞれの利点と欠点を認識していましたか?
* ユーザーは自動化された選択や影響を受けた選択を後から取り消すことができますか?
* ユーザーは自動化された選択や影響を受けた選択を後取り消すことができますか?
### 3. ケーススタディ
これらの倫理的課題を現実世界の文脈で考えるには、倫理違反が見過ごされた場合に個人や社会に与える潜在的な害や結果を強調するケーススタディを検討することが役立ちます。
これらの倫理的課題を現実世界の文脈で考えるには、倫理違反が見過ごされた場合に個人や社会に与える潜在的な害や結果を強調するケーススタディを検討することが役立ちます。
以下はいくつかの例です:
| 倫理的課題 | ケーススタディ |
|--- |--- |
| **インフォームドコンセント** | 1972年 - [タスキー梅毒研究](https://en.wikipedia.org/wiki/Tuskegee_Syphilis_Study) - 研究に参加したアフリカ系アメリカ人男性は無料の医療ケアを約束されましたが、研究者は被験者に診断や治療の利用可能性を知らせずに欺きました。多くの被験者が死亡し、パートナーや子供にも影響が及びました。この研究は40年間続きました。 |
| **データプライバシー** | 2007年 - [Netflixデータ賞](https://www.wired.com/2007/12/why-anonymous-data-sometimes-isnt/)では、研究者に_50,000人の顧客からの1,000万件の匿名化された映画評価_が提供され、推薦アルゴリズムの改善が試みられました。しかし、研究者は匿名化されたデータを外部データセットIMDbのコメントと照合することで、Netflixの一部の加入者を「再識別」することができました。|
| **収集バイアス** | 2013年 - ボストン市は[Street Bump](https://www.boston.gov/transportation/street-bump)というアプリを開発し、市民が道路の穴を報告できるようにしました。これにより、市は道路データを改善し、問題を特定して修正することができました。しかし、[低所得層の人々は車や携帯電話へのアクセスが少ない](https://hbr.org/2013/04/the-hidden-biases-in-big-data)ため、彼らの道路問題はこのアプリでは見えなくなりました。開発者は公平性のために_アクセスの平等性とデジタル格差_の問題に取り組むため、学術関係者と協力しました。 |
| **アルゴリズムの公平性** | 2018年 - MITの[Gender Shades Study](http://gendershades.org/overview.html)は、性別分類AI製品の精度を評価し、女性や有色人種に対する精度のギャップを明らかにしました。[2019年のApple Card](https://www.wired.com/story/the-apple-card-didnt-see-genderand-thats-the-problem/)では、男性よりも女性に対してクレジットが少なく提供されるように見えました。これらは、アルゴリズムバイアスが社会経済的な被害を引き起こす例を示しています。|
| **データの誤表現** | 2020年 - [ジョージア州公衆衛生局が発表したCOVID-19チャート](https://www.vox.com/covid-19-coronavirus-us-response-trump/2020/5/18/21262265/georgia-covid-19-cases-declining-reopening)は、x軸の非時系列順序によって、確認された症例の傾向について市民を誤解させるように見えました。これは、視覚化トリックによる誤表現を示しています。 |
| **自由選択の錯覚** | 2020年 - 学習アプリ[ABCmouseがFTCの苦情を解決するために1,000万ドルを支払った](https://www.washingtonpost.com/business/2020/09/04/abcmouse-10-million-ftc-settlement/)ケースでは、親がキャンセルできないサブスクリプションを支払うように追い込まれました。これは、ユーザーが潜在的に有害な選択に誘導される選択アーキテクチャにおけるダークパターンを示しています。 |
| **データプライバシーとユーザーの権利** | 2021年 - Facebookの[データ漏洩](https://www.npr.org/2021/04/09/986005820/after-data-breach-exposes-530-million-facebook-says-it-will-not-notify-users)では、5億3,000万人のユーザーのデータが漏洩し、FTCに50億ドルの和解金を支払う結果となりました。しかし、Facebookは漏洩についてユーザーに通知することを拒否し、データの透明性とアクセスに関するユーザーの権利を侵害しました。|
さらにケーススタディを探したいですか?以下のリソースをチェックしてください:
| **インフォームドコンセント** | 1972年 - [タスキ梅毒研究](https://en.wikipedia.org/wiki/Tuskegee_Syphilis_Study) - 研究に参加したアフリカ系アメリカ人男性は無料の医療を約束されましたが、研究者によって診断や治療の利用可能性について知らされずに欺かれました。多くの被験者が死亡し、パートナーや子供にも影響が及びました。この研究は40年間続きました。 |
| **データプライバシー** | 2007年 - [Netflixデータ賞](https://www.wired.com/2007/12/why-anonymous-data-sometimes-isnt/)は、研究者に_50Kの顧客からの10Mの匿名化された映画ランキング_を提供し、推薦アルゴリズムを改善することを目的としていました。しかし、研究者は匿名化されたデータを外部データセットIMDbコメントと関連付けることで、一部のNetflix加入者を「匿名解除」することができました。|
| **収集バイアス** | 2013年 - ボストン市は[Street Bump](https://www.boston.gov/transportation/street-bump)というアプリを開発し、市民が道路の穴を報告できるようにし、市が問題を特定して修正するためのより良い道路データを提供しました。しかし、[低所得層の人々は車や電話へのアクセスが少ない](https://hbr.org/2013/04/the-hidden-biases-in-big-data)ため、このアプリでは彼らの道路問題が見えなくなっていました。開発者は公平性のために_公平なアクセスとデジタル格差_の問題に取り組むために学者と協力しました。 |
| **アルゴリズムの公平性** | 2018年 - MITの[Gender Shades Study](http://gendershades.org/overview.html)は、性別分類AI製品の精度を評価し、女性や有色人種に対する精度のギャップを明らかにしました。[2019年のApple Card](https://www.wired.com/story/the-apple-card-didnt-see-genderand-thats-the-problem/)は、男性よりも女性に少ないクレジットを提供しているように見えました。どちらもアルゴリズムバイアスが社会経済的な害を引き起こす問題を示しています。|
| **データの誤表現** | 2020年 - [ジョージア州公衆衛生局はCOVID-19のチャートを公開](https://www.vox.com/covid-19-coronavirus-us-response-trump/2020/5/18/21262265/georgia-covid-19-cases-declining-reopening)し、確認されたケースの傾向について市民を誤解させるような非時系列のx軸を使用しました。これは視覚化トリックによる誤表現を示しています。 |
| **自由選択の錯覚** | 2020年 - 学習アプリ[ABCmouseはFTCの苦情を解決するために$10Mを支払った](https://www.washingtonpost.com/business/2020/09/04/abcmouse-10-million-ftc-settlement/)ケースでは、親がキャンセルできないサブスクリプションを支払うように追い込まれました。これは、ユーザーが潜在的に有害な選択に誘導されるダークパターンを示しています。 |
| **データプライバシーとユーザーの権利** | 2021年 - Facebookの[データ漏洩](https://www.npr.org/2021/04/09/986005820/after-data-breach-exposes-530-million-facebook-says-it-will-not-notify-users)では、530Mのユーザーのデータが漏洩し、FTCに$5Bの和解金を支払う結果となりました。しかし、漏洩についてユーザーに通知することを拒否し、データの透明性とアクセスに関するユーザーの権利を侵害しました。 |
さらにケーススタディを探したいですか?以下のリソースをチェックしてください:
* [Ethics Unwrapped](https://ethicsunwrapped.utexas.edu/case-studies) - 多様な業界における倫理的ジレンマ。
* [Data Science Ethics course](https://www.coursera.org/learn/data-science-ethics#syllabus) - 代表的なケーススタディを探求。
* [Where things have gone wrong](https://deon.drivendata.org/examples/) - Deonチェックリスト例。
* [Data Science Ethics course](https://www.coursera.org/learn/data-science-ethics#syllabus) - 重要なケーススタディを探求。
* [Where things have gone wrong](https://deon.drivendata.org/examples/) - Deonチェックリスト例。
> 🚨 あなたが見たケーススタディについて考えてみてください。これまでに似たような倫理的課題を経験したり、影響を受けたりしたことがありますかこのセクションで議論した倫理的課題の1つを示す別のケーススタディを少なくとも1つ考えることができますか?
> 🚨 あなたが見たケーススタディについて考えてみてください。あなたの人生で似たような倫理的課題を経験したり影響を受けたりしたことはありますかこのセクションで議論した倫理的課題を示す少なくとも1つの別のケーススタディを思いつくことができますか?
## 応用倫理
これまでに倫理の概念、課題、そして現実世界の文脈でのケーススタディについて話してきました。しかし、プロジェクトで倫理的な原則や実践をどのように_適用_するのでしょうかまた、これらの実践をどのように_運用化_してより良いガバナンスを実現するのでしょうか?いくつかの現実的な解決策を探ってみましょう:
倫理の概念、課題、そして現実世界の文脈でのケーススタディについて話しました。しかし、プロジェクトで倫理的な原則や実践を_適用_するにはどうすればよいでしょうかまた、これらの実践をより良いガバナンスのために_運用化_するにはどうすればよいでしょうか?いくつかの現実的な解決策を探ってみましょう:
### 1. プロフェッショナルコード
プロフェッショナルコードは、組織が倫理的原則やミッションステートメントを支持するようメンバーを「奨励」するための1つの選択肢を提供します。コードはプロフェッショナルな行動のための_道徳的ガイドライン_であり、従業員やメンバーが組織の原則に沿った意思決定を行うのを助けます。これらはメンバーの自主的な遵守に依存しますが、多くの組織は遵守を促すために追加の報酬や罰則を提供しています。
プロフェッショナルコードは、組織がメンバーに倫理的原則やミッションステートメントを支持するよう「奨励」するための選択肢を提供します。コードはプロフェッショナルな行動のための_道徳的ガイドライン_であり、従業員やメンバーが組織の原則に沿った意思決定を行うのを助けます。これらはメンバーの自主的な遵守に依存しますが、多くの組織はメンバーの遵守を促ために追加の報酬や罰則を提供しています。
例:
* [Oxford Munich](http://www.code-of-ethics.org/code-of-conduct/) 倫理規範
* [Oxford Munich](http://www.code-of-ethics.org/code-of-conduct/) 倫理コード
* [Data Science Association](http://datascienceassn.org/code-of-conduct.html) 行動規範2013年作成
* [ACM Code of Ethics and Professional Conduct](https://www.acm.org/code-of-ethics)1993年以降
> 🚨 あなたはプロフェッショナルなエンジニアリングまたはデータサイエンス組織に所属していますか?そのサイトを調べて、プロフェッショナルコードが定義されているか確認してください。それはどのような倫理的原則を示していますか?メンバーがコードを遵守するようにどのように「奨励」しているのでしょうか?
> 🚨 あなたはプロフェッショナルなエンジニアリングやデータサイエンスの組織に所属していますか?そのサイトを探して、プロフェッショナルな倫理コードを定義しているかどうかを確認してください。それは彼らの倫理的原則について何を示していますか?メンバーにコードを遵守させるためにどのように「奨励」しているのでしょうか?
### 2. 倫理チェックリスト
プロフェッショナルコードは実践者に求められる_倫理的行動_を定義しますが、大規模プロジェクトにおける[実施の限界](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md)が知られています。その代わりに、多くのデータサイエンスの専門家は[チェックリスト](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md)を推奨しています。これにより、原則を実践に結び付け、より決定論的で実行可能な方法を提供します。
プロフェッショナルコードは実践者に必要な_倫理的行動_を定義しますが、大規模プロジェクトにおける[既知の制限](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md)があります。その代わりに、多くのデータサイエンスの専門家は[チェックリスト](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md)を提唱しており、これにより**原則を実践に結び付ける**ことがより決定論的かつ実行可能になります。
チェックリストは質問を「はい/いいえ」のタスクに変換し、標準的な製品リリースワークフローの一部として追跡可能にます。
チェックリストは質問を「はい/いいえ」のタスクに変換し、運用化することができ、標準的な製品リリースワークフローの一部として追跡可能になります。
例:
* [Deon](https://deon.drivendata.org/) - [業界の推奨事項](https://deon.drivendata.org/#checklist-citations)に基づいて作成された汎用データ倫理チェックリストで、コマンドラインツールを使用して簡単に統合可能。
* [プライバシー監査チェックリスト](https://cyber.harvard.edu/ecommerce/privacyaudit.html) - 法的および社会的な観点から情報取り扱いの一般的なガイダンスを提供。
* [AI Fairness チェックリスト](https://www.microsoft.com/en-us/research/project/ai-fairness-checklist/) - AI開発サイクルに公平性チェックを統合するためにAI実践者によって作成。
* [データとAIにおける倫理のための22の質問](https://medium.com/the-organization/22-questions-for-ethics-in-data-and-ai-efb68fd19429) - 設計、実装、組織的文脈における倫理的問題の初期探求のためのよりオープンなフレームワーク。
* [Deon](https://deon.drivendata.org/) - [業界の推奨事項](https://deon.drivendata.org/#checklist-citations)から作成された汎用データ倫理チェックリストで、コマンドラインツールを使用して簡単に統合可能。
* [Privacy Audit Checklist](https://cyber.harvard.edu/ecommerce/privacyaudit.html) - 法的および社会的な露出の観点から情報処理の一般的なガイダンスを提供。
* [AI Fairness Checklist](https://www.microsoft.com/en-us/research/project/ai-fairness-checklist/) - AI開発サイクルに公平性チェックを統合するためにAI実践者によって作成。
* [データとAIの倫理に関する22の質問](https://medium.com/the-organization/22-questions-for-ethics-in-data-and-ai-efb68fd19429) - 設計、実装、組織的な文脈での倫理的問題の初期探求のために構造化されたよりオープンなフレームワーク。
### 3. 倫理規制
倫理は共有価値を定義し、自発的に正しいことを行うことに関するものです。一方、**コンプライアンス**は、定義された法律を_遵守する_ことに関するものです。**ガバナンス**は、組織が倫理的原則を実施し、確立された法律を遵守するために運営するすべての方法を広くカバーします。
倫理は共有価値を定義し、自発的に正しいことを行うことに関するものです。**コンプライアンス**は、定義されている場合に法律を遵守することに関するものです。**ガバナンス**は、組織が倫理的原則を強制し、確立された法律を遵守するために運営するすべての方法を広くカバーします。
今日、ガバナンスは組織内で2つの形を取ります。1つ目は、**倫理的AI**の原則を定義し、組織内のすべてのAI関連プロジェクトで採用を運用化するための実践を確立することです。2つ目は、組織が運営する地域での政府が義務付けた**データ保護規制**を遵守することです。
今日、ガバナンスは組織内で2つの形態を取ります。まず、**倫理的AI**原則を定義し、組織内のすべてのAI関連プロジェクトにわたって採用を運用化する実践を確立することです。次に、組織が運営する地域のすべての政府が定めた**データ保護規制**を遵守することです。
データ保護およびプライバシー規制の例:
データ保護プライバシー規制の例:
* `1974年`、[米国プライバシー法](https://www.justice.gov/opcl/privacy-act-1974) - _連邦政府_による個人情報の収集、使用、開示を規制。
* `1996年`、[米国医療保険の携行性と責任に関する法律HIPAA](https://www.cdc.gov/phlp/publications/topic/hipaa.html) - 個人の健康データを保護。
* `1998年`、[米国児童オンラインプライバシー保護法COPPA](https://www.ftc.gov/enforcement/rules/rulemaking-regulatory-reform-proceedings/childrens-online-privacy-protection-rule) - 13歳未満の子供のデータプライバシーを保護。
* `2018年`、[一般データ保護規則GDPR](https://gdpr-info.eu/) - ユーザーの権利、データ保護、プライバシーを提供。
* `2018年`、[カリフォルニア消費者プライバシー法CCPA](https://www.oag.ca.gov/privacy/ccpa) - 消費者に個人データに関するより多くの_権利_を付与
* `2021年`、中国の[個人情報保護法](https://www.reuters.com/world/china/china-passes-new-personal-data-privacy-law-take-effect-nov-1-2021-08-20/) - 世界で最も強力なオンラインデータプライバシー規制の1つを制定
* `2018年`、[カリフォルニア消費者プライバシー法CCPA](https://www.oag.ca.gov/privacy/ccpa) - 消費者に個人データに関するより多くの_権利_を提供
* `2021年`、中国の[個人情報保護法](https://www.reuters.com/world/china/china-passes-new-personal-data-privacy-law-take-effect-nov-1-2021-08-20/) - 世界で最も強力なオンラインデータプライバシー規制の1つを作成
> 🚨 欧州連合が定義したGDPR一般データ保護規則は、今日最も影響力のあるデータプライバシー規制の1つです。GDPRは市民のデジタルプライバシーと個人データを保護するための[8つのユーザー権利](https://www.freeprivacypolicy.com/blog/8-user-rights-gdpr)も定義していることをご存知ですか?これらが何であるか、そしてなぜ重要なのかを学びましょう。
> 🚨 欧州連合が定義したGDPR一般データ保護規則は、今日最も影響力のあるデータプライバシー規制の1つです。これが市民のデジタルプライバシーと個人データを保護するために[8つのユーザー権利](https://www.freeprivacypolicy.com/blog/8-user-rights-gdpr)を定義していることを知っていましたか?これらが何であるか、そしてなぜ重要なのかを学びましょう。
### 4. 倫理文化
_コンプライアンス_「法律の文言」を満たすために十分なことを行うと、AIの武器化を加速させる可能性のある[システム的な問題](https://www.coursera.org/learn/data-science-ethics/home/week/4)(硬直化、情報の非対称性、分配の不公平性など)に対処することの間には、依然として無形のギャップがあります。
_コンプライアンス_「法律の文言」を満たすために十分なことを行うこと)と[体系的な問題](https://www.coursera.org/learn/data-science-ethics/home/week/4)(硬直化、情報の非対称性、分配の不公平性など)に対処することの間には、依然として無形のギャップがあります。これらの問題はAIの武器化を加速させる可能性があります。
後者には、業界全体で一貫した共有価値と感情的なつながりを構築する[倫理文化を定義するための協力的アプローチ](https://towardsdatascience.com/why-ai-ethics-requires-a-culture-driven-approach-26f451afa29f)が必要です。これには、組織内でより[正式化されたデータ倫理文化](https://www.codeforamerica.org/news/formalizing-an-ethical-data-culture/)を構築することが求められます。これにより、_誰でも_プロセスの早い段階で倫理的
* [責任あるAIの原則](https://docs.microsoft.com/en-us/learn/modules/responsible-ai-principles/) - Microsoft Learn無料学習パス。
後者には、業界内で_組織全体_で一貫した共有価値と感情的なつながりを構築する[倫理文化を定義するための協力的アプローチ](https://towardsdatascience.com/why-ai-ethics-requires-a-culture-driven-approach-26f451afa29f)が必要です。これには、組織内でより[正式化されたデータ倫理文化](https://www.codeforamerica.org/news/formalizing-an-ethical-data-culture/)を構築することが求められます。これにより、_誰でも_プロセスの早い段階で倫理的懸念を提起するために)[アンドンコードを引く](https://en.wikipedia.org/wiki/Andon_(manufacturing))ことができ、AIプロジェクトのチーム形成において_倫理的評価_採用時が重要な基準とな
* [責任あるAIの原則](https://docs.microsoft.com/en-us/learn/modules/responsible-ai-principles/) - Microsoft Learnによる無料学習パス。
* [倫理とデータサイエンス](https://resources.oreilly.com/examples/0636920203964) - O'Reillyの電子書籍 (M. Loukides, H. Mason 他)
* [データサイエンス倫理](https://www.coursera.org/learn/data-science-ethics#syllabus) - ミシガン大学オンラインコース。
* [Ethics Unwrapped](https://ethicsunwrapped.utexas.edu/case-studies) - テキサス大学ケーススタディ。
* [データサイエンス倫理](https://www.coursera.org/learn/data-science-ethics#syllabus) - ミシガン大学によるオンラインコース。
* [Ethics Unwrapped](https://ethicsunwrapped.utexas.edu/case-studies) - テキサス大学によるケーススタディ。
# 課題
[データ倫理のケーススタディを書く](assignment.md)
---
**免責事項**:
この文書は、AI翻訳サービス [Co-op Translator](https://github.com/Azure/co-op-translator) を使用して翻訳されています。正確性を追求しておりますが、自動翻訳には誤りや不正確さが含まれる可能性があります。元の言語で記載された原文が正式な情報源と見なされるべきです。重要な情報については、専門の人間による翻訳を推奨します。この翻訳の使用に起因する誤解や誤訳について、当社は一切の責任を負いません。
この文書は、AI翻訳サービス [Co-op Translator](https://github.com/Azure/co-op-translator) を使用して翻訳されています。正確性を追求しておりますが、自動翻訳には誤りや不正確な部分が含まれる可能性があることをご承知ください。元の言語で記載された文書が正式な情報源とみなされるべきです。重要な情報については、専門の人間による翻訳を推奨します。この翻訳の使用に起因する誤解や誤解釈について、当方は一切の責任を負いません。

@ -1,8 +1,8 @@
<!--
CO_OP_TRANSLATOR_METADATA:
{
"original_hash": "8796f41f566a0a8ebb72863a83d558ed",
"translation_date": "2025-08-25T16:47:36+00:00",
"original_hash": "3a34157cc63516eba97c89a0b2f8c3e6",
"translation_date": "2025-09-03T21:04:24+00:00",
"source_file": "1-Introduction/02-ethics/README.md",
"language_code": "ko"
}
@ -17,147 +17,147 @@ CO_OP_TRANSLATOR_METADATA:
우리는 모두 데이터화된 세상에서 살아가는 데이터 시민입니다.
시장 동향에 따르면 2022년까지 대규모 조직 3곳 중 1곳이 온라인 [마켓플레이스 및 거래소](https://www.gartner.com/smarterwithgartner/gartner-top-10-trends-in-data-and-analytics-for-2020/)를 통해 데이터를 사고팔게 될 것이라고 합니다. **앱 개발자**로서 우리는 데이터 기반 통찰력과 알고리즘 기반 자동화를 일상적인 사용자 경험에 통합하는 것이 더 쉽고 저렴해질 것입니다. 그러나 AI가 보편화됨에 따라, 이러한 알고리즘이 대규모로 [무기화](https://www.youtube.com/watch?v=TQHs8SA1qpk)될 때 발생할 수 있는 잠재적 피해를 이해해야 할 필요성도 커지고 있습니다.
시장 동향에 따르면 2022년까지 대규모 조직의 3분의 1이 온라인 [마켓플레이스와 거래소](https://www.gartner.com/smarterwithgartner/gartner-top-10-trends-in-data-and-analytics-for-2020/)를 통해 데이터를 사고팔게 될 것이라고 합니다. **앱 개발자**로서 우리는 데이터 기반 통찰력과 알고리즘 기반 자동화를 일상적인 사용자 경험에 통합하는 것이 더 쉽고 저렴해질 것입니다. 그러나 AI가 널리 퍼지면서, 대규모로 이러한 알고리즘이 [무기화](https://www.youtube.com/watch?v=TQHs8SA1qpk)될 때 발생할 수 있는 잠재적 피해를 이해해야 할 필요도 생깁니다.
또한, 2025년까지 [180제타바이트](https://www.statista.com/statistics/871513/worldwide-data-created/) 이상의 데이터를 생성하고 소비할 것이라는 전망도 있습니다. **데이터 과학자**로서 이는 개인 데이터에 대한 전례 없는 접근을 가능하게 합니다. 이를 통해 사용자 행동 프로파일을 구축하고, 사용자가 자유롭게 선택하는 것처럼 보이게 하면서도 실제로는 우리가 선호하는 결과로 유도하는 방식으로 의사 결정을 영향을 미칠 수 있습니다. 이는 데이터 프라이버시와 사용자 보호에 대한 더 넓은 질문을 제기합니다.
또한, 2025년까지 [180제타바이트](https://www.statista.com/statistics/871513/worldwide-data-created/) 이상의 데이터를 생성하고 소비할 것이라는 전망도 있습니다. **데이터 과학자**로서 이는 개인 데이터에 대한 전례 없는 접근을 가능하게 합니다. 이를 통해 사용자 행동 프로파일을 구축하고, 사용자가 자유롭게 선택하는 것처럼 보이게 하면서도 우리가 선호하는 결과로 유도할 수 있습니다. 이는 데이터 프라이버시와 사용자 보호에 대한 더 넓은 질문을 제기합니다.
데이터 윤리는 데이터 과학 및 엔지니어링의 _필수적인 가드레일_로, 데이터 기반 행동에서 발생할 수 있는 잠재적 피해와 의도치 않은 결과를 최소화하도록 돕습니다. [가트너 AI 하이프 사이클](https://www.gartner.com/smarterwithgartner/2-megatrends-dominate-the-gartner-hype-cycle-for-artificial-intelligence-2020/)은 디지털 윤리, 책임 있는 AI, AI 거버넌스와 같은 관련 트렌드를 AI의 _민주화__산업화_라는 더 큰 메가트렌드의 주요 동력으로 식별합니다.
데이터 윤리는 데이터 과학과 엔지니어링의 _필수적인 가드레일_로, 데이터 기반 행동으로 인해 발생할 수 있는 잠재적 피해와 의도치 않은 결과를 최소화하는 데 도움을 줍니다. [Gartner의 AI 하이프 사이클](https://www.gartner.com/smarterwithgartner/2-megatrends-dominate-the-gartner-hype-cycle-for-artificial-intelligence-2020/)은 디지털 윤리, 책임 있는 AI, AI 거버넌스와 같은 관련 트렌드를 AI의 _민주화__산업화_라는 더 큰 메가트렌드의 주요 동력으로 식별합니다.
![가트너 AI 하이프 사이클 - 2020](https://images-cdn.newscred.com/Zz1mOWJhNzlkNDA2ZTMxMWViYjRiOGFiM2IyMjQ1YmMwZQ==)
![Gartner의 AI 하이프 사이클 - 2020](https://images-cdn.newscred.com/Zz1mOWJhNzlkNDA2ZTMxMWViYjRiOGFiM2IyMjQ1YmMwZQ==)
강의에서는 데이터 윤리의 핵심 개념과 도전 과제부터 사례 연구 및 거버넌스와 같은 응용 AI 개념까지 탐구하며, 데이터와 AI를 다루는 팀과 조직에서 윤리 문화를 구축하는 방법을 배웁니다.
이 강의에서는 데이터 윤리의 핵심 개념과 도전 과제, 사례 연구, 거버넌스와 같은 적용된 AI 개념을 탐구하여 데이터와 AI를 다루는 팀과 조직에서 윤리 문화를 구축하는 방법을 알아볼 것입니다.
## [강의 전 퀴즈](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/2) 🎯
## 기본 정의
먼저 기본 용어를 이해하는 것부터 시작해 봅시다.
먼저 기본 용어를 이해해 봅시다.
"윤리"라는 단어는 [그리스어 "ethikos"](https://en.wikipedia.org/wiki/Ethics) (그리고 그 어원인 "ethos")에서 유래했으며, 이는 _성격 또는 도덕적 본성_을 의미합니다.
"윤리"라는 단어는 [그리스어 "ethikos"](https://en.wikipedia.org/wiki/Ethics) (그리고 그 뿌리인 "ethos")에서 유래했으며, 이는 _성격 또는 도덕적 본질_을 의미합니다.
**윤리**는 사회에서 우리의 행동을 지배하는 공유된 가치와 도덕적 원칙에 관한 것입니다. 윤리는 법이 아니라 "옳고 그름"에 대한 널리 받아들여 규범에 기반을 둡니다. 그러나 윤리적 고려는 기업 거버넌스 이니셔티브와 정부 규정을 통해 준수를 위한 더 많은 인센티브를 창출할 수 있습니다.
**윤리**는 사회에서 우리의 행동을 지배하는 공유된 가치와 도덕적 원칙에 관한 것입니다. 윤리는 법이 아니라 "옳고 그름"에 대한 널리 받아들여지는 규범에 기반을 둡니다. 그러나 윤리적 고려는 기업 거버넌스 이니셔티브와 정부 규정을 통해 준수를 위한 더 많은 인센티브를 창출할 수 있습니다.
**데이터 윤리**는 "_데이터, 알고리즘 및 관련 관행_"과 관련된 도덕적 문제를 "연구하고 평가"하는 [새로운 윤리 분야](https://royalsocietypublishing.org/doi/full/10.1098/rsta.2016.0360#sec-1)입니다. 여기서 **"데이터"**는 생성, 기록, 큐레이션, 처리, 배포, 공유 및 사용과 관련된 행동에 초점을 맞추고, **"알고리즘"**은 AI, 에이전트, 머신러닝 및 로봇에 초점을 맞추며, **"관행"**은 책임 있는 혁신, 프로그래밍, 해킹 및 윤리 강령과 같은 주제에 초점을 맞춥니다.
**데이터 윤리**는 "_데이터, 알고리즘 및 관련 관행_"과 관련된 도덕적 문제를 "연구하고 평가"하는 [윤리의 새로운 분야](https://royalsocietypublishing.org/doi/full/10.1098/rsta.2016.0360#sec-1)입니다. 여기서 **"데이터"**는 생성, 기록, 큐레이션, 처리, 배포, 공유 및 사용과 관련된 행동에 초점을 맞추고, **"알고리즘"**은 AI, 에이전트, 머신러닝 및 로봇에 초점을 맞추며, **"관행"**은 책임 있는 혁신, 프로그래밍, 해킹 및 윤리 코드와 같은 주제에 초점을 맞춥니다.
**응용 윤리**는 [도덕적 고려의 실질적 적용](https://en.wikipedia.org/wiki/Applied_ethics)을 의미합니다. 이는 _현실 세계의 행동, 제품 및 프로세스_와 관련된 윤리적 문제를 적극적으로 조사하고, 이를 정의된 윤리적 가치와 일치하도록 수정하는 과정입니다.
**응용 윤리**는 [도덕적 고려의 실질적 적용](https://en.wikipedia.org/wiki/Applied_ethics)을 의미합니다. 이는 _현실 세계의 행동, 제품 및 프로세스_와 관련된 윤리적 문제를 적극적으로 조사하고, 정의된 윤리적 가치와 일치하도록 유지하기 위해 수정 조치를 취하는 과정입니다.
**윤리 문화**는 [_응용 윤리를 운영화_](https://hbr.org/2019/05/how-to-design-an-ethical-organization)하여 조직 전체에서 윤리적 원칙과 관행이 일관되고 확장 가능하게 채택되도록 보장하는 것입니다. 성공적인 윤리 문화는 조직 전체의 윤리적 원칙을 정의하고, 준수를 위한 의미 있는 인센티브를 제공하며, 조직의 모든 수준에서 원하는 행동을 장려하고 강화함으로써 윤리적 규범을 확립합니다.
**윤리 문화**는 [_응용 윤리를 운영화_](https://hbr.org/2019/05/how-to-design-an-ethical-organization)하여 윤리적 원칙과 관행이 조직 전체에서 일관되고 확장 가능하게 채택되도록 하는 것입니다. 성공적인 윤리 문화는 조직 전체의 윤리적 원칙을 정의하고, 준수를 위한 의미 있는 인센티브를 제공하며, 조직의 모든 수준에서 원하는 행동을 장려하고 증폭함으로써 윤리적 규범을 강화합니다.
## 윤리 개념
이 섹션에서는 데이터 윤리를 위한 **공유된 가치**(원칙)와 **윤리적 도전 과제**(문제)와 같은 개념을 논의하고, 이러한 개념을 현실 세계의 맥락에서 이해할 수 있도록 돕는 **사례 연구**를 탐구니다.
이 섹션에서는 데이터 윤리를 위한 **공유된 가치**(원칙)와 **윤리적 도전 과제**(문제)와 같은 개념을 논의하고, 이러한 개념을 현실 세계의 맥락에서 이해할 수 있도록 돕는 **사례 연구**를 탐구할 것입니다.
### 1. 윤리 원칙
모든 데이터 윤리 전략은 _윤리 원칙_을 정의하는 것에서 시작됩니다. 이는 데이터 및 AI 프로젝트에서 허용 가능한 행동을 설명하고, 준수 가능한 행동을 안내하는 "공유된 가치"입니다. 이를 개인 또는 팀 수준에서 정의할 수 있습니다. 그러나 대부분의 대규모 조직은 이를 _윤리적 AI_ 미션 선언문 또는 프레임워크로 정의하며, 이를 모든 팀에 일관되게 적용합니다.
모든 데이터 윤리 전략은 _윤리적 원칙_을 정의하는 것으로 시작됩니다. 이는 데이터 및 AI 프로젝트에서 허용 가능한 행동을 설명하고, 준수 행동을 안내하는 "공유된 가치"입니다. 개인 또는 팀 수준에서 이를 정의할 수 있습니다. 그러나 대부분의 대규모 조직은 이를 기업 수준에서 정의하고 모든 팀에 일관되게 시행되는 _윤리적 AI_ 미션 선언문 또는 프레임워크에 포함시킵니다.
**예:** Microsoft의 [책임 있는 AI](https://www.microsoft.com/en-us/ai/responsible-ai) 미션 선언문은 다음과 같이 명시합니다: _"우리는 사람을 우선으로 하는 윤리적 원칙에 의해 추진되는 AI의 발전에 전념합니다"_ - 아래 프레임워크에서 6가지 윤리 원칙을 식별합니다:
**예:** Microsoft의 [책임 있는 AI](https://www.microsoft.com/en-us/ai/responsible-ai) 미션 선언문은 _"우리는 사람을 우선으로 하는 윤리적 원칙에 의해 추진되는 AI 발전에 전념합니다"_라고 읽으며, 아래 프레임워크에서 6가지 윤리적 원칙을 식별합니다:
![Microsoft의 책임 있는 AI](https://docs.microsoft.com/en-gb/azure/cognitive-services/personalizer/media/ethics-and-responsible-use/ai-values-future-computed.png)
이 원칙들을 간히 살펴보겠습니다. _투명성__책임성_은 다른 원칙들이 기반을 두는 기 가치입니다. 따라서 여기서부터 시작해 봅시다:
이 원칙들을 간히 살펴보겠습니다. _투명성__책임성_은 다른 원칙들이 기반을 두는 기초적인 가치입니다. 따라서 여기서부터 시작해 봅시다:
* [**책임성**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6)은 실무자가 데이터 및 AI 작업과 이러한 윤리 원칙 준수에 대해 _책임을 지도록_ 합니다.
* [**투명성**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6)은 데이터 및 AI 작업이 사용자에게 _이해 가능_하도록 하여, 결정의 이유와 과정을 설명합니다.
* [**책임성**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6)은 실무자가 데이터 및 AI 운영과 이러한 윤리적 원칙 준수에 대해 _책임을 지도록_ 합니다.
* [**투명성**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6)은 데이터와 AI 행동이 사용자에게 _이해 가능_하도록 하여 결정의 이유와 과정을 설명합니다.
* [**공정성**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1%3aprimaryr6)은 AI가 _모든 사람_을 공정하게 대우하도록 하며, 데이터와 시스템에서 발생할 수 있는 체계적 또는 암묵적 사회-기술적 편향을 해결합니다.
* [**신뢰성 및 안전성**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6)은 AI가 정의된 가치_일관되게_동하며, 잠재적 피해나 의도치 않은 결과를 최소화하도록 보장합니다.
* [**프라이버시 및 보안**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6)은 데이터 계보를 이해하고, 사용자에게 _데이터 프라이버시 및 관련 보호_를 제공니다.
* [**포용성**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6)은 AI 솔루션을 의도적으로 설계하여, _다양한 인간의 필요와 능력_을 충족하도록 적응시키는 것입니다.
* [**신뢰성 및 안전성**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6)은 AI가 정의된 가치에 따라 _일관되게_동하며, 잠재적 피해나 의도치 않은 결과를 최소화합니다.
* [**프라이버시 및 보안**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6)은 데이터 계보를 이해하고 사용자에게 _데이터 프라이버시 및 관련 보호_를 제공하는 것입니다.
* [**포용성**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6)은 AI 솔루션을 의도적으로 설계하여 _다양한 인간의 필요와 능력_을 충족하도록 적응시키는 것입니다.
> 🚨 여러분의 데이터 윤리 미션 선언문은 무엇일 수 있을지 생각해 보세요. 다른 조직의 윤리적 AI 프레임워크를 탐구해 보세요 - 여기에는 [IBM](https://www.ibm.com/cloud/learn/ai-ethics), [Google](https://ai.google/principles), [Facebook](https://ai.facebook.com/blog/facebooks-five-pillars-of-responsible-ai/)의 예가 있습니다. 이들이 공통적으로 가지고 있는 공유된 가치는 무엇인가요? 이러한 원칙 그들이 운영하는 AI 제품 또는 산업과 어떻게 관련이 있나요?
> 🚨 여러분의 데이터 윤리 미션 선언문은 무엇일 수 있을지 생각해 보세요. 다른 조직의 윤리적 AI 프레임워크를 탐구해 보세요. 여기에는 [IBM](https://www.ibm.com/cloud/learn/ai-ethics), [Google](https://ai.google/principles), [Facebook](https://ai.facebook.com/blog/facebooks-five-pillars-of-responsible-ai/)의 예시가 포함됩니다. 이들이 공통적으로 가지고 있는 공유된 가치는 무엇인가요? 이러한 원칙 그들이 운영하는 AI 제품 또는 산업과 어떻게 관련이 있나요?
### 2. 윤리적 도전 과제
윤리 원칙이 정의되면, 다음 단계는 데이터 및 AI 작업이 이러한 공유된 가치와 일치하는지 평가하는 것입니다. 여러분의 행동을 _데이터 수집__알고리즘 설계_라는 두 가지 범주로 생각해 보세요.
윤리적 원칙을 정의한 후에는 데이터와 AI 행동이 이러한 공유된 가치와 일치하는지 평가하는 것이 다음 단계입니다. 여러분의 행동을 _데이터 수집__알고리즘 설계_라는 두 가지 범주로 생각해 보세요.
데이터 수집의 경우, 행동은 식별 가능한 개인에 대한 **개인 데이터** 또는 개인 식별 가능 정보(PII)를 포함할 가능성이 높습니다. 여기에는 _집합적으로_ 개인을 식별할 수 있는 [다양한 비개인 데이터 항목](https://ec.europa.eu/info/law/law-topic/data-protection/reform/what-personal-data_en)이 포함됩니다. 윤리적 도전 과제는 _데이터 프라이버시_, _데이터 소유권_, 그리고 _정보 제공 동의__지적 재산권_과 같은 관련 주제와 관련될 수 있습니다.
데이터 수집의 경우, 행동은 **개인 데이터** 또는 살아 있는 개인을 식별할 수 있는 개인 식별 정보(PII)를 포함할 가능성이 높습니다. 여기에는 _집합적으로_ 개인을 식별할 수 있는 [다양한 비개인 데이터 항목](https://ec.europa.eu/info/law/law-topic/data-protection/reform/what-personal-data_en)이 포함됩니다. 윤리적 도전 과제는 _데이터 프라이버시_, _데이터 소유권_, 그리고 _정보 제공 동의_ 사용자에 대한 _지적 재산권_과 같은 관련 주제와 관련될 수 있습니다.
알고리즘 설계의 경우, 행동은 **데이터셋**을 수집 및 큐레이션한 다음, 이를 사용하여 현실 세계의 맥락에서 결과를 예측하거나 결정을 자동화하는 **데이터 모델**을 훈련 및 배포하는 것을 포함합니다. 윤리적 도전 과제는 _데이터셋 편향_, _데이터 품질_ 문제, _불공정성_, _오해의 소지_와 같은 알고리즘의 문제에서 발생할 수 있으며, 일부 문제는 체계적일 수 있습니다.
알고리즘 설계의 경우, 행동은 **데이터셋**을 수집 및 큐레이션한 후 이를 사용하여 **데이터 모델**을 훈련 및 배포하여 현실 세계의 맥락에서 결과를 예측하거나 결정을 자동화하는 것을 포함합니다. 윤리적 도전 과제는 _데이터셋 편향_, _데이터 품질_ 문제, _불공정성_, 그리고 알고리즘에서의 _오해_와 관련될 수 있으며, 일부 문제는 체계적일 수 있습니다.
두 경우 모두, 윤리적 도전 과제는 우리의 행동이 공유된 가치와 충돌할 수 있는 영역을 강조합니다. 이러한 문제를 탐지, 완화, 최소화 또는 제거하려면, 우리의 행동과 관련된 도덕적 "예/아니오" 질문을 하고, 필요한 경우 수정 조치를 취해야 합니다. 몇 가지 윤리적 도전 과제와 그로 인해 제기되는 도덕적 질문을 살펴보겠습니다:
두 경우 모두 윤리적 도전 과제는 우리의 행동이 공유된 가치와 충돌할 수 있는 영역을 강조합니다. 이러한 문제를 감지, 완화, 최소화 또는 제거하기 위해서는 우리의 행동과 관련된 도덕적 "예/아니오" 질문을 던지고 필요한 수정 조치를 취해야 합니다. 이제 윤리적 도전 과제와 그들이 제기하는 도덕적 질문을 살펴보겠습니다:
#### 2.1 데이터 소유권
데이터 수집은 종종 데이터 주체를 식별할 수 있는 개인 데이터를 포함합니다. [데이터 소유권](https://permission.io/blog/data-ownership)은 데이터 생성, 처리 및 배포와 관련된 _통제_와 [_사용자 권리_](https://permission.io/blog/data-ownership)에 관한 것입니다.
우리가 물어야 할 도덕적 질문은 다음과 같습니다:
우리가 물어야 할 도덕적 질문은 다음과 같습니다:
* 데이터를 소유하는 사람은 누구인가요? (사용자 또는 조직)
* 데이터 주체는 어떤 권리를 가지고 있나요? (예: 접근, 삭제, 이동성)
* 조직은 어떤 권리를 가지고 있나요? (예: 악의적인 사용자 리뷰 수정)
#### 2.2 정보 제공 동의
[정보 제공 동의](https://legaldictionary.net/informed-consent/)는 사용자 _관련 사실_을 완전히 이해한 상태에서 데이터 수집과 같은 행동에 동의하는 행위를 정의합니다.
[정보 제공 동의](https://legaldictionary.net/informed-consent/)는 사용자들이 데이터 수집과 같은 행동에 대해 _관련 사실_을 완전히 이해한 상태에서 동의하는 행위를 정의합니다. 여기에는 목적, 잠재적 위험, 대안이 포함됩니다.
여기서 탐구해야 할 질문은 다음과 같습니다:
* 사용자가 데이터 캡처 및 사용에 대해 동의했나요?
* 사용자가 데이터 캡처 및 사용에 대한 허가를 제공했나요?
* 사용자가 데이터가 캡처된 목적을 이해했나요?
* 사용자가 참여로 인해 발생할 수 있는 잠재적 위험을 이해했나요?
#### 2.3 지적 재산권
[지적 재산권](https://en.wikipedia.org/wiki/Intellectual_property)은 인간의 창의적 활동에서 비롯된 무형의 창작물로, 개인이나 기업에 _경제적 가치_를 가질 수 있습니다.
[지적 재산권](https://en.wikipedia.org/wiki/Intellectual_property)은 인간의 창의적 활동에서 발생한 무형의 창작물로, 개인이나 기업에게 _경제적 가치_를 가질 수 있습니다.
여기서 탐구해야 할 질문은 다음과 같습니다:
* 수집된 데이터가 사용자나 기업에 경제적 가치를 가지고 있나요?
* 수집된 데이터가 사용자나 기업에 경제적 가치를 가지고 있나요?
* **사용자**가 여기서 지적 재산권을 가지고 있나요?
* **조직**이 여기서 지적 재산권을 가지고 있나요?
* 이러한 권리가 존재한다면, 이를 어떻게 보호하고 있나요?
* 이러한 권리가 존재한다면, 우리는 이를 어떻게 보호하고 있나요?
#### 2.4 데이터 프라이버시
[데이터 프라이버시](https://www.northeastern.edu/graduate/blog/what-is-data-privacy/) 또는 정보 프라이버시는 개인 식별 가능 정보와 관련하여 사용자 프라이버시를 보존하고 사용자 신원을 보호하는 것을 의미합니다.
[데이터 프라이버시](https://www.northeastern.edu/graduate/blog/what-is-data-privacy/) 또는 정보 프라이버시는 개인 식별 정보를 포함한 사용자 프라이버시를 보존하고 사용자 신원을 보호하는 것을 의미합니다.
여기서 탐구해야 할 질문은 다음과 같습니다:
* 사용자의 (개인) 데이터가 해킹 및 유출로부터 안전한가요?
* 사용자의 데이터가 권한이 있는 사용자와 맥락에서만 접근 가능한가요?
* 데이터가 공유되거나 배포될 때 사용자의 익명성이 보되나요?
* 사용자의 데이터가 승인된 사용자와 맥락에서만 접근 가능한가요?
* 데이터가 공유되거나 배포될 때 사용자의 익명성이 보되나요?
* 익명화된 데이터셋에서 사용자를 재식별할 수 있나요?
#### 2.5 잊혀질 권리
#### 2.5 잊 권리
[혀질 권리](https://en.wikipedia.org/wiki/Right_to_be_forgotten) 또는 [삭제 요청 권리](https://www.gdpreu.org/right-to-be-forgotten/)는 사용자에게 추가적인 개인 데이터 보호를 제공합니다. 특히, 특정 상황에서 인터넷 검색 및 기타 위치에서 개인 데이터를 삭제하거나 제거하도록 요청할 권리를 사용자에게 부여하여, 과거 행동이 온라인에서 그들에게 불리하게 작용하지 않도록 합니다.
[ 권리](https://en.wikipedia.org/wiki/Right_to_be_forgotten) 또는 [삭제 요청 권리](https://www.gdpreu.org/right-to-be-forgotten/)는 사용자에게 추가적인 개인 데이터 보호를 제공합니다. 특히, 특정 상황에서 인터넷 검색 및 기타 위치에서 개인 데이터를 삭제하거나 제거할 수 있는 권리를 사용자에게 부여하여, 과거 행동이 사용자에게 불리하게 작용하지 않도록 온라인에서 새 출발을 할 수 있게 합니다.
여기서 탐구해야 할 질문은 다음과 같습니다:
* 시스템이 데이터 주체가 삭제를 요청할 수 있도록 허용하나요?
* 사용자의 동의 철회가 자동 삭제를 유발해야 하나요?
* 데이터가 동의 없이 또는 불법적인 수단으로 수집되었나요?
* 데이터가 동의 없이 또는 불법적으로 수집되었나요?
* 데이터 프라이버시에 대한 정부 규정을 준수하고 있나요?
#### 2.6 데이터셋 편향
데이터셋 또는 [수집 편향](http://researcharticles.com/index.php/bias-in-data-collection-in-research/)은 알고리즘 개발을 위해 _대표성이 없는_ 데이터 하위 집합을 선택하는 것으로, 다양한 그룹에 대해 결과가 불공정하게 나올 가능성을 만듭니다. 편향의 유형에는 선택 또는 샘플링 편향, 자발적 편향, 도구 편향이 포함됩니다.
데이터셋 또는 [수집 편향](http://researcharticles.com/index.php/bias-in-data-collection-in-research/)은 알고리즘 개발을 위해 _대표성이 없는_ 데이터 하위 집합을 선택하는 것으로, 다양한 그룹에 대해 결과의 공정성을 저해할 수 있습니다. 편향의 유형에는 선택 또는 샘플링 편향, 자발적 편향, 도구 편향이 포함됩니다.
여기서 탐구해야 할 질문은 다음과 같습니다:
* 대표성 있는 데이터 주체 집합을 모집했나요?
* 수집하거나 큐레이션한 데이터셋을 다양한 편향에 대해 테스트했나요?
* 대표적인 데이터 주체 집합을 모집했나요?
* 수집하거나 큐레이션한 데이터셋에서 다양한 편향을 테스트했나요?
* 발견된 편향을 완화하거나 제거할 수 있나요?
#### 2.7 데이터 품질
[데이터 품질](https://lakefs.io/data-quality-testing/)은 알고리즘 개발에 사용된 큐레이션된 데이터셋의 유효성을 확인하며, AI 목적에 필요한 정확성과 일관성 수준을 충족하는지 확인합니다.
[데이터 품질](https://lakefs.io/data-quality-testing/)은 알고리즘 개발에 사용된 큐레이션된 데이터셋의 유효성을 살펴보며, AI 목적에 필요한 정확성과 일관성 수준을 충족하는지 확인합니다.
여기서 탐구해야 할 질문은 다음과 같습니다:
* 우리의 사용 사례에 유효한 _특징_을 캡처했나요?
* 다양한 데이터 소스에서 데이터를 _일관되게_ 캡처했나요?
* 다양한 조건이나 시나리오에 대해 데이터셋이 _완전_한가요?
* 현실을 반영하는 데 있어 정보가 _정확_하게 캡처되었나요?
* 현실을 반영하는 정보가 _정확하게_ 캡처되었나요?
#### 2.8 알고리즘 공정성
[Algorithm Fairness](https://towardsdatascience.com/what-is-algorithm-fairness-3182e161cf9f)는 알고리즘 설계가 특정 데이터 주체 하위 그룹에 대해 체계적으로 차별을 일으켜 _자원 배분_ (해당 그룹에 자원이 거부되거나 보류됨) 및 _서비스 품질_ (AI가 일부 하위 그룹에 대해 다른 그룹만큼 정확하지 않음)에서 [잠재적 피해](https://docs.microsoft.com/en-us/azure/machine-learning/concept-fairness-ml)를 초래하는지 확인합니다.
[Algorithm Fairness](https://towardsdatascience.com/what-is-algorithm-fairness-3182e161cf9f)는 알고리즘 설계가 특정 데이터 주체 하위 그룹에 대해 체계적으로 차별을 일으켜 _자원 배분_ (그 그룹에 자원이 거부되거나 보류되는 경우) 및 _서비스 품질_ (AI가 일부 하위 그룹에 대해 다른 그룹보다 덜 정확한 경우)에서 [잠재적 피해](https://docs.microsoft.com/en-us/azure/machine-learning/concept-fairness-ml)를 초래하는지 확인합니다.
여기서 탐구할 질문은 다음과 같습니다:
여기서 탐구해야 할 질문은 다음과 같습니다:
* 다양한 하위 그룹과 조건에 대해 모델 정확도를 평가했는가?
* 잠재적 피해(예: 고정관념)를 시스템에서 면밀히 검토했는가?
* 확인된 피해를 완화하기 위해 데이터를 수정하거나 모델을 재훈련할 수 있는가?
* 잠재적 피해(예: 고정관념)를 시스템에서 면밀히 조사했는가?
* 확인된 피해를 완화하기 위해 데이터를 수정하거나 모델을 재학습할 수 있는가?
[AI 공정성 체크리스트](https://query.prod.cms.rt.microsoft.com/cms/api/am/binary/RE4t6dA)와 같은 리소스를 탐색하여 더 알아보세요.
#### 2.9 오해의 소지
[데이터 오해의 소지](https://www.sciencedirect.com/topics/computer-science/misrepresentation)는 정직하게 보고된 데이터에서 통찰을 전달하면서 원하는 서사를 지하기 위해 기만적인 방식으로 전달하고 있는지 묻는 것입니다.
[데이터 오해의 소지](https://www.sciencedirect.com/topics/computer-science/misrepresentation)는 정직하게 보고된 데이터에서 통찰을 전달하면서 원하는 서사를 지하기 위해 기만적인 방식으로 전달하고 있는지 묻는 것입니다.
여기서 탐구할 질문은 다음과 같습니다:
여기서 탐구해야 할 질문은 다음과 같습니다:
* 불완전하거나 부정확한 데이터를 보고하고 있는가?
* 오해를 불러일으킬 수 있는 방식으로 데이터를 시각화하고 있는가?
* 결과를 조작하기 위해 선택적인 통계 기법을 사용하고 있는가?
@ -165,91 +165,90 @@ CO_OP_TRANSLATOR_METADATA:
#### 2.10 자유 선택
[자유 선택의 환상](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice)은 시스템의 "선택 아키텍처"가 의사결정 알고리즘을 사용하여 사람들이 선호하는 결과를 선택하도록 유도하면서도 옵션과 통제권을 제공하는 것처럼 보일 때 발생합니다. 이러한 [다크 패턴](https://www.darkpatterns.org/)은 사용자에게 사회적, 경제적 피해를 초래할 수 있습니다. 사용자 결정이 행동 프로파일에 영향을 미치기 때문에, 이러한 행동은 잠재적으로 미래의 선택에 영향을 미쳐 이러한 피해의 영향을 증폭하거나 확장할 수 있습니다.
[자유 선택의 환상](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice)은 시스템의 "선택 아키텍처"가 사람들이 옵션과 통제권을 제공받는 것처럼 보이게 하면서 선호하는 결과를 선택하도록 유도하는 의사 결정 알고리즘을 사용할 때 발생합니다. 이러한 [다크 패턴](https://www.darkpatterns.org/)은 사용자에게 사회적, 경제적 피해를 줄 수 있습니다. 사용자 결정은 행동 프로파일에 영향을 미치므로 이러한 행동은 잠재적으로 미래 선택을 주도하여 피해의 영향을 확대하거나 연장할 수 있습니다.
여기서 탐구할 질문은 다음과 같습니다:
* 사용자가 해당 선택을 했을 때의 함의를 이해했는가?
* 사용자가 (대안적) 선택과 각 선택의 장단점을 알고 있었는가?
여기서 탐구해야 할 질문은 다음과 같습니다:
* 사용자가 선택을 했을 때의 함의를 이해했는가?
* 사용자가 (대안적) 선택과 각의 장단점을 알고 있었는가?
* 사용자가 자동화되거나 영향을 받은 선택을 나중에 되돌릴 수 있는가?
### 3. 사례 연구
이러한 윤리적 도전 과제를 실제 세계의 맥락에서 이해하려면, 윤리 위반이 간과될 때 개인과 사회에 미칠 수 있는 잠재적 피해와 결과를 강조하는 사례 연구를 살펴보는 것이 도움이 됩니다.
이러한 윤리적 도전 실제 세계의 맥락에서 이해하려면, 윤리 위반이 간과될 때 개인과 사회에 미칠 수 있는 잠재적 피해와 결과를 강조하는 사례 연구를 살펴보는 것이 도움이 됩니다.
다음은 몇 가지 예입니다:
| 윤리적 도전 과제 | 사례 연구 |
| 윤리적 도전 | 사례 연구 |
|--- |--- |
| **정보 제공 동의** | 1972년 - [터스키기 매독 연구](https://en.wikipedia.org/wiki/Tuskegee_Syphilis_Study) - 연구에 참여한 아프리카계 미국인 남성들은 무료 의료 서비스를 약속받았으나, 연구자들은 피험자들에게 진단 결과나 치료 가능성에 대해 알리지 않았습니다. 많은 피험자가 사망했고, 배우자나 자녀도 영향을 받았습니다. 이 연구는 40년 동안 지속되었습니다. |
| **데이터 프라이버시** | 2007년 - [넷플릭스 데이터 상](https://www.wired.com/2007/12/why-anonymous-data-sometimes-isnt/)은 연구자들에게 _50,000명의 고객으로부터 수집된 1,000만 개의 익명화된 영화 평가_ 데이터를 제공하여 추천 알고리즘을 개선하도록 했습니다. 그러나 연구자들은 익명화된 데이터를 외부 데이터셋(예: IMDb 댓글)과 연관시켜 일부 넷플릭스 구독자를 사실상 "비익명화"할 수 있었습니다.|
| **수집 편향** | 2013년 - 보스턴시는 [Street Bump](https://www.boston.gov/transportation/street-bump)이라는 앱을 개발하여 시민들이 도로의 포트홀을 신고할 수 있도록 했습니다. 이를 통해 도로 데이터를 개선하고 문제를 해결할 수 있었습니다. 그러나 [저소득층은 자동차와 휴대폰 접근성이 낮아](https://hbr.org/2013/04/the-hidden-biases-in-big-data) 이들의 도로 문제가 이 앱에서 보이지 않게 되었습니다. 개발자들은 공정성을 위해 _공평한 접근성과 디지털 격차_ 문제를 해결하기 위해 학계와 협력했습니다. |
| **알고리즘 공정성** | 2018년 - MIT [Gender Shades Study](http://gendershades.org/overview.html)는 성별 분류 AI 제품의 정확성을 평가하여 여성과 유색인종에 대한 정확도 격차를 드러냈습니다. [2019년 애플 카드](https://www.wired.com/story/the-apple-card-didnt-see-genderand-thats-the-problem/)는 남성보다 여성에게 적은 신용을 제공하는 것으로 보였습니다. 두 사례 모두 알고리즘 편향이 사회경제적 피해를 초래할 수 있음을 보여줍니다.|
| **데이터 오해의 소지** | 2020년 - [조지아 보건부는 COVID-19 차트를 발표](https://www.vox.com/covid-19-coronavirus-us-response-trump/2020/5/18/21262265/georgia-covid-19-cases-declining-reopening)했는데, x축의 비연대적 순서를 사용하여 확진자 수 추세에 대해 시민들을 오도하는 것으로 보였습니다. 이는 시각화 트릭을 통한 오해의 소지를 보여줍니다. |
| **자유 선택의 환상** | 2020년 - 학습 앱 [ABCmouse는 FTC 불만 해결을 위해 1,000만 달러를 지불](https://www.washingtonpost.com/business/2020/09/04/abcmouse-10-million-ftc-settlement/)했으며, 부모들이 취소할 수 없는 구독료를 지불하도록 유도했습니다. 이는 사용자가 잠재적으로 해로운 선택을 하도록 유도하는 선택 아키텍처의 다크 패턴을 보여줍니다. |
| **데이터 프라이버시 및 사용자 권리** | 2021년 - 페이스북 [데이터 유출](https://www.npr.org/2021/04/09/986005820/after-data-breach-exposes-530-million-facebook-says-it-will-not-notify-users)로 5억 3천만 명의 사용자 데이터가 노출되었으며, FTC에 50억 달러의 합의금을 지불했습니다. 그러나 데이터 유출에 대해 사용자에게 알리지 않아 데이터 투명성과 접근성에 대한 사용자 권리를 위반했습니다. |
더 많은 사례 연구를 탐구하고 싶으신가요? 다음 리소스를 확인해보세요:
| **정보 제공 동의** | 1972년 - [터스키기 매독 연구](https://en.wikipedia.org/wiki/Tuskegee_Syphilis_Study) - 연구에 참여한 아프리카계 미국인 남성들은 무료 의료 서비스를 약속받았으나, 연구자들은 진단이나 치료 가능성에 대해 피험자들에게 알리지 않아 _기만당했습니다_. 많은 피험자가 사망했고, 배우자나 자녀에게도 영향을 미쳤으며, 연구는 40년 동안 지속되었습니다. |
| **데이터 프라이버시** | 2007년 - [넷플릭스 데이터 상](https://www.wired.com/2007/12/why-anonymous-data-sometimes-isnt/)은 연구자들에게 _50K 고객의 10M 익명화된 영화 평점_을 제공하여 추천 알고리즘을 개선하도록 했습니다. 그러나 연구자들은 익명화된 데이터를 _외부 데이터셋_ (예: IMDb 댓글)과 연관시켜 일부 넷플릭스 구독자를 사실상 "익명 해제"할 수 있었습니다.|
| **수집 편향** | 2013년 - 보스턴시는 [Street Bump](https://www.boston.gov/transportation/street-bump)이라는 앱을 개발하여 시민들이 도로의 움푹 팬 곳을 보고하도록 하여 도시가 문제를 파악하고 해결할 수 있도록 더 나은 도로 데이터를 제공했습니다. 그러나 [저소득층은 자동차와 휴대폰 접근성이 낮아](https://hbr.org/2013/04/the-hidden-biases-in-big-data) 이 앱에서 그들의 도로 문제가 보이지 않게 되었습니다. 개발자들은 공정성을 위해 _공평한 접근성과 디지털 격차_ 문제를 해결하기 위해 학계와 협력했습니다. |
| **알고리즘 공정성** | 2018년 - MIT [Gender Shades Study](http://gendershades.org/overview.html)는 성별 분류 AI 제품의 정확성을 평가하여 여성과 유색 인종에 대한 정확성 격차를 드러냈습니다. [2019년 애플 카드](https://www.wired.com/story/the-apple-card-didnt-see-genderand-thats-the-problem/)는 남성보다 여성에게 적은 신용을 제공하는 것으로 보였습니다. 두 사례 모두 알고리즘 편향이 사회경제적 피해를 초래하는 문제를 보여줍니다.|
| **데이터 오해의 소지** | 2020년 - [조지아 공중보건부는 COVID-19 차트를 발표](https://www.vox.com/covid-19-coronavirus-us-response-trump/2020/5/18/21262265/georgia-covid-19-cases-declining-reopening)했는데, x축의 비연대적 순서로 시민들에게 확진 사례의 추세에 대해 오해를 불러일으키는 것으로 보였습니다. 이는 시각화 트릭을 통한 오해의 소지를 보여줍니다. |
| **자유 선택의 환상** | 2020년 - 학습 앱 [ABCmouse는 FTC 불만을 해결하기 위해 $10M을 지불](https://www.washingtonpost.com/business/2020/09/04/abcmouse-10-million-ftc-settlement/)했는데, 부모들이 취소할 수 없는 구독료를 지불하도록 유도되었습니다. 이는 사용자들이 잠재적으로 해로운 선택을 하도록 유도하는 선택 아키텍처의 다크 패턴을 보여줍니다. |
| **데이터 프라이버시 및 사용자 권리** | 2021년 - 페이스북 [데이터 유출](https://www.npr.org/2021/04/09/986005820/after-data-breach-exposes-530-million-facebook-says-it-will-not-notify-users)은 5억 3천만 명의 사용자 데이터를 유출시켜 FTC에 $5B의 합의를 초래했습니다. 그러나 사용자들에게 유출 사실을 알리지 않아 데이터 투명성과 접근성에 대한 사용자 권리를 위반했습니다. |
더 많은 사례 연구를 탐구하고 싶으신가요? 다음 리소스를 확인세요:
* [Ethics Unwrapped](https://ethicsunwrapped.utexas.edu/case-studies) - 다양한 산업의 윤리적 딜레마.
* [데이터 과학 윤리 강좌](https://www.coursera.org/learn/data-science-ethics#syllabus) - 주요 사례 연구 탐구.
* [문제가 발생한 사례](https://deon.drivendata.org/examples/) - 예제를 포함한 Deon 체크리스트.
* [데이터 과학 윤리 과정](https://www.coursera.org/learn/data-science-ethics#syllabus) - 주요 사례 연구 탐구.
* [문제가 발생한 사례](https://deon.drivendata.org/examples/) - Deon 체크리스트와 예시.
> 🚨 여러분이 본 사례 연구를 생각해보세요 - 여러분의 삶에서 비슷한 윤리적 도전에 직면하거나 영향을 받은 적이 있나요? 이 섹션에서 논의한 윤리적 도전 중 하나를 보여주는 또 다른 사례를 생각해볼 수 있나요?
> 🚨 여러분이 본 사례 연구를 생각해보세요 - 여러분의 삶에서 비슷한 윤리적 도전에 영향을 받거나 경험한 적이 있나요? 이 섹션에서 논의한 윤리적 도전 중 하나를 보여주는 또 다른 사례 연구를 생각해볼 수 있나요?
## 응용 윤리
우리는 윤리 개념, 도전 과제, 그리고 실제 세계의 맥락에서 사례 연구에 대해 논의했습니다. 하지만 프로젝트에서 윤리적 원칙과 관행을 _적용_하려면 어떻게 시작해야 할까요? 그리고 이러한 관행을 더 나은 거버넌스를 위해 _운영화_하려면 어떻게 해야 할까요? 몇 가지 실제 솔루션을 살펴보겠습니다:
윤리 개념, 도전 과제, 그리고 실제 사례 연구에 대해 이야기했습니다. 하지만 프로젝트에서 윤리적 원칙과 관행을 _적용_하려면 어떻게 시작해야 할까요? 그리고 더 나은 거버넌스를 위해 이러한 관행을 _운영화_하려면 어떻게 해야 할까요? 몇 가지 실제 솔루션을 탐구해봅시다:
### 1. 전문 윤리 강령
### 1. 전문 코드
전문 윤리 강령은 조직이 윤리적 원칙과 사명 선언문을 지원하도록 구성원을 "장려"하는 한 가지 옵션을 제공합니다. 강령은 전문적 행동에 대한 _도덕적 지침_으로, 직원이나 구성원이 조직의 원칙에 부합하는 결정을 내릴 수 있도록 돕습니다. 이는 구성원의 자발적 준수에 따라 달라지지만, 많은 조직은 구성원의 준수를 동기화하기 위해 추가적인 보상과 처벌을 제공합니다.
전문 코드는 조직이 윤리적 원칙과 사명 선언을 지원하도록 구성원을 "장려"하는 한 가지 옵션을 제공합니다. 코드는 전문적 행동에 대한 _도덕적 지침_으로, 직원이나 구성원이 조직의 원칙에 부합하는 결정을 내릴 수 있도록 돕습니다. 이는 구성원의 자발적 준수에 따라 달라지지만, 많은 조직은 구성원의 준수를 동기화하기 위해 추가적인 보상과 처벌을 제공합니다.
예시:
* [옥스퍼드 뮌헨](http://www.code-of-ethics.org/code-of-conduct/) 윤리 강령
* [데이터 과학 협회](http://datascienceassn.org/code-of-conduct.html) 행동 강령 (2013년 제정)
* [Oxford Munich](http://www.code-of-ethics.org/code-of-conduct/) 윤리 강령
* [데이터 과학 협회](http://datascienceassn.org/code-of-conduct.html) 행동 강령 (2013년 생성)
* [ACM 윤리 및 전문 행동 강령](https://www.acm.org/code-of-ethics) (1993년부터)
> 🚨 여러분은 전문 엔지니어링 또는 데이터 과학 조직에 속해 있나요? 그들의 웹사이트를 탐색하여 전문 윤리 강령을 정의하고 있는지 확인해보세요. 그들의 윤리적 원칙에 대해 무엇을 말하고 있나요? 구성원이 강령을 따르도록 어떻게 "장려"하고 있나요?
> 🚨 여러분은 전문 엔지니어링 또는 데이터 과학 조직에 속해 있나요? 그들의 웹사이트를 탐색하여 전문 윤리 강령을 정의하고 있는지 확인세요. 그들의 윤리적 원칙에 대해 무엇을 말하고 있나요? 구성원이 강령을 따르도록 어떻게 "장려"하고 있나요?
### 2. 윤리 체크리스트
전문 윤리 강령이 실무자의 _윤리적 행동_을 정의하는 반면, 이는 특히 대규모 프로젝트에서 [집행의 한계](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md)가 있는 것으로 알려져 있습니다. 대신, 많은 데이터 과학 전문가들은 [체크리스트를 옹호](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md)하며, 이는 **원칙을 실천으로 연결**하는 보다 결정적이고 실행 가능한 방법을 제공합니다.
전문 코드는 실무자에게 요구되는 _윤리적 행동_을 정의하지만, [대규모 프로젝트에서의 한계](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md)가 알려져 있습니다. 대신, 많은 데이터 과학 전문가들은 [체크리스트](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md)**원칙을 실천으로 연결**하는 더 결정적이고 실행 가능한 방법으로 권장합니다.
체크리스트는 질문을 "예/아니오" 작업으로 변환하여 운영화할 수 있으며, 이를 표준 제품 출시 워크플로의 일부로 추적할 수 있습니다.
예시:
* [Deon](https://deon.drivendata.org/) - [업계 권장 사항](https://deon.drivendata.org/#checklist-citations)에서 생성된 범용 데이터 윤리 체크리스트로, 명령줄 도구를 통해 쉽게 통합 가능.
* [Deon](https://deon.drivendata.org/) - [업계 추천](https://deon.drivendata.org/#checklist-citations)에서 생성된 일반 목적 데이터 윤리 체크리스트로, 명령줄 도구를 통해 쉽게 통합 가능.
* [프라이버시 감사 체크리스트](https://cyber.harvard.edu/ecommerce/privacyaudit.html) - 법적 및 사회적 노출 관점에서 정보 처리 관행에 대한 일반적인 지침 제공.
* [AI 공정성 체크리스트](https://www.microsoft.com/en-us/research/project/ai-fairness-checklist/) - AI 개발 주기에 공정성 검사를 채택하고 통합하도록 지원하기 위해 AI 실무자들이 생성.
* [데이터 AI 윤리를 위한 22가지 질문](https://medium.com/the-organization/22-questions-for-ethics-in-data-and-ai-efb68fd19429) - 설계, 구현, 조직적 맥락에서 윤리적 문제를 초기 탐구하기 위한 보다 개방적인 프레임워크.
* [AI 공정성 체크리스트](https://www.microsoft.com/en-us/research/project/ai-fairness-checklist/) - AI 개발 주기에 공정성 검사를 채택하고 통합하도록 지원하기 위해 AI 실무자 생성.
* [데이터 AI 윤리를 위한 22가지 질문](https://medium.com/the-organization/22-questions-for-ethics-in-data-and-ai-efb68fd19429) - 설계, 구현, 조직적 맥락에서 윤리적 문제를 초기 탐구하기 위한 개방적인 프레임워크.
### 3. 윤리 규제
윤리는 공유 가치를 정의하고 _자발적으로_ 올바른 일을 하는 것입니다. **준수**는 정의된 경우 _법을 따르는 것_입니다. **거버넌스**는 조직이 윤리적 원칙을 시행하고 확립된 법을 준수하는 모든 방식을 포괄합니다.
윤리는 공유 가치를 정의하고 _자발적으로_ 올바른 일을 하는 것입니다. **준수**는 정의된 법을 _따르는 것_입니다. **거버넌스**는 조직이 윤리적 원칙을 시행하고 확립된 법을 준수하기 위해 운영하는 모든 방법을 포괄합니다.
오늘날 거버넌스는 조직 내에서 두 가지 형태를 취합니다. 첫째, **윤리적 AI** 원칙을 정의하고 조직 모든 AI 관련 프로젝트에서 채택을 운영화하는 관행을 수립하는 것입니다. 둘째, 조직이 운영하는 지역의 모든 정부가 규정한 **데이터 보호 규정**을 준수하는 것입니다.
오늘날 거버넌스는 조직 내에서 두 가지 형태를 취합니다. 첫째, **윤리적 AI** 원칙을 정의하고 조직 모든 AI 관련 프로젝트에서 채택을 운영화하는 관행을 수립하는 것입니다. 둘째, 조직이 운영하는 지역의 모든 정부가 규정한 **데이터 보호 규정**을 준수하는 것입니다.
데이터 보호 및 프라이버시 규제의 예:
* `1974년`, [미국 프라이버시법](https://www.justice.gov/opcl/privacy-act-1974) - _연방 정부_의 개인 정보 수집, 사용 및 공개를 규제.
* `1996년`, [미국 건강보험 이동성 및 책임법 (HIPAA)](https://www.cdc.gov/phlp/publications/topic/hipaa.html) - 개인 건강 데이터를 보호.
* `1998년`, [미국 아동 온라인 프라이버시 보호법 (COPPA)](https://www.ftc.gov/enforcement/rules/rulemaking-regulatory-reform-proceedings/childrens-online-privacy-protection-rule) - 13세 미만 아동의 데이터 프라이버시를 보호.
* `2018년`, [일반 데이터 보호 규정 (GDPR)](https://gdpr-info.eu/) - 사용자 권리, 데이터 보호 및 프라이버시 제공.
* `2018년`, [캘리포니아 소비자 프라이버시법 (CCPA)](https://www.oag.ca.gov/privacy/ccpa) - 소비자에게 (개인) 데이터에 대한 더 많은 _권리_ 제공.
* `2021년`, 중국 [개인 정보 보호법](https://www.reuters.com/world/china/china-passes-new-personal-data-privacy-law-take-effect-nov-1-2021-08-20/)이 통과되어 세계에서 가장 강력한 온라인 데이터 프라이버시 규정을 만듦.
* `2021년`, 중국 [개인 정보 보호법](https://www.reuters.com/world/china/china-passes-new-personal-data-privacy-law-take-effect-nov-1-2021-08-20/) - 세계에서 가장 강력한 온라인 데이터 프라이버시 규제 중 하나를 새로 통과.
> 🚨 유럽 연합이 정의한 GDPR(일반 데이터 보호 규정)은 오늘날 가장 영향력 있는 데이터 프라이버시 규 중 하나로 남아 있습니다. 이 규정이 시민의 디지털 프라이버시와 개인 데이터를 보호하기 위해 [8가지 사용자 권리](https://www.freeprivacypolicy.com/blog/8-user-rights-gdpr)를 정의하고 있다는 것을 알고 계셨나요? 이 권리가 무엇인지, 왜 중요한지 알아보세요.
> 🚨 유럽 연합이 정의한 GDPR(일반 데이터 보호 규정)은 오늘날 가장 영향력 있는 데이터 프라이버시 규 중 하나로 남아 있습니다. 이 규정이 시민의 디지털 프라이버시와 개인 데이터를 보호하기 위해 [8가지 사용자 권리](https://www.freeprivacypolicy.com/blog/8-user-rights-gdpr)를 정의다는 것을 알고 계셨나요? 이 권리가 무엇인지, 왜 중요한지 알아보세요.
### 4. 윤리 문화
_법의 문구_를 충족하기 위해 충분히 행동하는 **준수**와 AI의 무기화를 가속화할 수 있는 [체계적 문제](https://www.coursera.org/learn/data-science-ethics/home/week/4)를 해결하는 것 사이에는 여전히 무형의 격차가 존재합니다.
_준수_ (법의 "문자"를 충족하기 위해 충분히 하는 것)와 [체계적 문제](https://www.coursera.org/learn/data-science-ethics/home/week/4) (예: 경직화, 정보 비대칭, 분배적 불공정성)를 해결하는 것 사이에는 여전히 무형의 격차가 있습니다. 후자는 AI의 무기화를 가속화할 수 있습니다.
후자는 [윤리 문화를 정의하기 위한 협력적 접근 방식](https://towardsdatascience.com/why-ai-ethics-requires-a-culture-driven-approach-26f451afa29f)을 요구하며, 이는 조직 전반에 걸쳐 감정적 연결과 일관된 공유 가치를 구축합니다. 이는 조직 내에서 보다 [공식화된 데이터 윤리 문화](https://www.codeforamerica.org/news/formalizing-an-ethical-data-culture/)를 요구하며, _누구나_ [안돈 코드](https://en.wikipedia.org/wiki/Andon_(manufacturing))를 당겨(프로세스 초기에 윤리적 문제를 제기) 윤리적 평가(예: 채용 시)를 AI 프로젝트 팀 구성의 핵심 기준으로 삼을 수 있도록 합니다.
후자는 [윤리 문화를 정의하기 위한 협력적 접근](https://towardsdatascience.com/why-ai-ethics-requires-a-culture-driven-approach-26f451afa29f)을 요구하며, 산업 내 조직 간에 감정적 연결과 일관된 공유 가치를 구축합니다. 이는 조직 내에서 더 [공식화된 데이터 윤리 문화](https://www.codeforamerica.org/news/formalizing-an-ethical-data-culture)를 요구하며, _누구나_ [안돈 코드](https://en.wikipedia.org/wiki/Andon_(manufacturing))를 당겨 (윤리적 문제를 초기 단계에서 제기) AI 프로젝트 팀 구성에서 _윤리적 평가_ 핵심 기준으로 삼을 수 있도록 합니다.
---
## [강의 후 퀴즈](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/3) 🎯
## [강의 후 퀴즈](https://ff-quizzes.netlify.app/en/ds/) 🎯
## 복습 및 자기 학습
좌와 책은 핵심 윤리 개념과 도전을 이해하는 데 도움을 주며, 사례 연구와 도구는 실제 세계의 맥락에서 응용 윤리 관행에 도움을 줍니다. 시작할 수 있는 몇 가지 리소스는 다음과 같습니다.
의와 책은 핵심 윤리 개념과 도전 과제를 이해하는 데 도움을 주며, 사례 연구와 도구는 실제 세계의 맥락에서 응용 윤리 관행을 돕습니다. 시작할 몇 가지 리소스를 소개합니다.
* [초보자를 위한 머신 러닝](https://github.com/microsoft/ML-For-Beginners/blob/main/1-Introduction/3-fairness/README.md) - Microsoft의 공정성에 대한 강의.
* [책임 있는 AI의 원칙](https://docs.microsoft.com/en-us/learn/modules/responsible-ai-principles/) - Microsoft Learn에서 제공하는 무료 학습 경로.
@ -257,9 +256,11 @@ _법의 문구_를 충족하기 위해 충분히 행동하는 **준수**와 AI
* [데이터 과학 윤리](https://www.coursera.org/learn/data-science-ethics#syllabus) - 미시간 대학교의 온라인 강좌.
* [윤리 해설](https://ethicsunwrapped.utexas.edu/case-studies) - 텍사스 대학교의 사례 연구.
# 과제
# 과제
[데이터 윤리 사례 연구 작성하기](assignment.md)
---
**면책 조항**:
이 문서는 AI 번역 서비스 [Co-op Translator](https://github.com/Azure/co-op-translator)를 사용하여 번역되었습니다. 정확성을 위해 최선을 다하고 있으나, 자동 번역에는 오류나 부정확성이 포함될 수 있습니다. 원본 문서의 원어 버전을 권위 있는 출처로 간주해야 합니다. 중요한 정보의 경우, 전문적인 인간 번역을 권장합니다. 이 번역 사용으로 인해 발생하는 오해나 잘못된 해석에 대해 당사는 책임을 지지 않습니다.
이 문서는 AI 번역 서비스 [Co-op Translator](https://github.com/Azure/co-op-translator)를 사용하여 번역되었습니다. 정확성을 위해 최선을 다하고 있으나, 자동 번역에는 오류나 부정확성이 포함될 수 있습니다. 원본 문서의 원어 버전을 권위 있는 출처로 간주해야 합니다. 중요한 정보의 경우, 전문적인 인간 번역을 권장합니다. 이 번역 사용으로 인해 발생하는 오해나 잘못된 해석에 대해 책임을 지지 않습니다.

@ -1,13 +1,13 @@
<!--
CO_OP_TRANSLATOR_METADATA:
{
"original_hash": "8796f41f566a0a8ebb72863a83d558ed",
"translation_date": "2025-08-31T06:00:08+00:00",
"original_hash": "3a34157cc63516eba97c89a0b2f8c3e6",
"translation_date": "2025-09-03T22:02:26+00:00",
"source_file": "1-Introduction/02-ethics/README.md",
"language_code": "lt"
}
-->
# Duomenų etikos įvadas
# Įvadas į duomenų etiką
|![ Sketchnote by [(@sketchthedocs)](https://sketchthedocs.dev) ](../../sketchnotes/02-Ethics.png)|
|:---:|
@ -17,117 +17,117 @@ CO_OP_TRANSLATOR_METADATA:
Mes visi esame duomenų piliečiai, gyvenantys duomenų pasaulyje.
Rinkos tendencijos rodo, kad iki 2022 m. 1 iš 3 didelių organizacijų pirks ir parduos savo duomenis per internetines [turgavietes ir mainų platformas](https://www.gartner.com/smarterwithgartner/gartner-top-10-trends-in-data-and-analytics-for-2020/). Kaip **programėlių kūrėjai**, mes pastebėsime, kad duomenimis pagrįstų įžvalgų ir algoritmais pagrįstos automatizacijos integravimas į kasdienes vartotojų patirtis taps lengvesnis ir pigesnis. Tačiau, kai dirbtinis intelektas tampa visur paplitęs, turėsime suprasti ir galimą žalą, kurią gali sukelti tokių algoritmų [ginklavimas](https://www.youtube.com/watch?v=TQHs8SA1qpk) dideliu mastu.
Rinkos tendencijos rodo, kad iki 2022 m. 1 iš 3 didelių organizacijų pirks ir parduos savo duomenis per internetines [rinkas ir mainų platformas](https://www.gartner.com/smarterwithgartner/gartner-top-10-trends-in-data-and-analytics-for-2020/). Kaip **programėlių kūrėjai**, mes galėsime lengviau ir pigiau integruoti duomenimis pagrįstas įžvalgas ir algoritmais valdomą automatizaciją į kasdienes vartotojų patirtis. Tačiau, kai dirbtinis intelektas tampa visur paplitęs, turėsime suprasti galimą žalą, kurią gali sukelti tokių algoritmų [ginklavimas](https://www.youtube.com/watch?v=TQHs8SA1qpk) dideliu mastu.
Tendencijos taip pat rodo, kad iki 2025 m. sukursime ir suvartosime daugiau nei [180 zettabaitų](https://www.statista.com/statistics/871513/worldwide-data-created/) duomenų. Kaip **duomenų mokslininkai**, mes turėsime precedento neturintį prieigą prie asmeninių duomenų. Tai reiškia, kad galėsime kurti vartotojų elgsenos profilius ir daryti įtaką sprendimų priėmimui taip, kad sukurtume [laisvo pasirinkimo iliuziją](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice), tuo pačiu galimai nukreipdami vartotojus link mums pageidaujamų rezultatų. Tai taip pat kelia platesnius klausimus apie duomenų privatumą ir vartotojų apsaugą.
Tendencijos taip pat rodo, kad iki 2025 m. sukursime ir suvartosime daugiau nei [180 zettabaitų](https://www.statista.com/statistics/871513/worldwide-data-created/) duomenų. Kaip **duomenų mokslininkai**, turėsime precedento neturintį prieigą prie asmeninių duomenų. Tai reiškia, kad galėsime kurti vartotojų elgsenos profilius ir daryti įtaką sprendimų priėmimui taip, kad sukurtume [laisvo pasirinkimo iliuziją](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice), tuo pačiu galimai nukreipdami vartotojus link mums pageidaujamų rezultatų. Tai taip pat kelia platesnius klausimus apie duomenų privatumą ir vartotojų apsaugą.
Duomenų etika dabar yra _būtinos gairės_ duomenų mokslui ir inžinerijai, padedančios sumažinti galimą žalą ir netyčines pasekmes, kylančias iš mūsų veiksmų, pagrįstų duomenimis. [Gartner Hype Cycle for AI](https://www.gartner.com/smarterwithgartner/2-megatrends-dominate-the-gartner-hype-cycle-for-artificial-intelligence-2020/) identifikuoja skaitmeninės etikos, atsakingo DI ir DI valdymo tendencijas kaip pagrindinius veiksnius, skatinančius didesnes megatendencijas, susijusias su DI _demokratizacija_ ir _industrializacija_.
Duomenų etika dabar yra _būtinos gairės_ duomenų mokslui ir inžinerijai, padedančios sumažinti galimą žalą ir netyčines pasekmes, kylančias iš mūsų veiksmų, pagrįstų duomenimis. [Gartner Hype Cycle for AI](https://www.gartner.com/smarterwithgartner/2-megatrends-dominate-the-gartner-hype-cycle-for-artificial-intelligence-2020/) identifikuoja aktualias tendencijas skaitmeninėje etikoje, atsakingame dirbtiniame intelekte ir AI valdyme kaip pagrindinius veiksnius didesnėms megatendencijoms, susijusioms su _demokratizacija_ ir _industrializacija_ AI.
![Gartner's Hype Cycle for AI - 2020](https://images-cdn.newscred.com/Zz1mOWJhNzlkNDA2ZTMxMWViYjRiOGFiM2IyMjQ1YmMwZQ==)
Šioje pamokoje mes nagrinėsime įdomią duomenų etikos sritį nuo pagrindinių sąvokų ir iššūkių iki atvejų analizių ir taikomų DI koncepcijų, tokių kaip valdymas, kurios padeda sukurti etikos kultūrą komandose ir organizacijose, dirbančiose su duomenimis ir DI.
Šioje pamokoje nagrinėsime įdomią duomenų etikos sritį nuo pagrindinių sąvokų ir iššūkių iki atvejų analizės ir taikomų AI koncepcijų, tokių kaip valdymas, kurios padeda sukurti etikos kultūrą komandose ir organizacijose, dirbančiose su duomenimis ir AI.
## [Prieš paskaitą vykdomas testas](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/2) 🎯
## [Prieš paskaitos testas](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/2) 🎯
## Pagrindinės sąvokos
Pradėkime nuo pagrindinių terminų supratimo.
Žodis „etika“ kilęs iš [graikiško žodžio „ethikos“](https://en.wikipedia.org/wiki/Ethics) (ir jo šaknies „ethos“), reiškiančio _charakterį arba moralinę prigimtį_.
Žodis „etika“ kilęs iš [graikiško žodžio „ethikos“](https://en.wikipedia.org/wiki/Ethics) (ir jo šaknies „ethos“), reiškiančio _charakterį ar moralinę prigimtį_.
**Etika** tai bendros vertybės ir moraliniai principai, kurie reguliuoja mūsų elgesį visuomenėje. Etika grindžiama ne įstatymais, o plačiai priimtomis normomis, kas yra „teisinga prieš neteisinga“. Tačiau etiniai svarstymai gali turėti įtakos įmonių valdymo iniciatyvoms ir vyriausybės reglamentams, kurie sukuria daugiau paskatų laikytis taisyklių.
**Etika** tai bendros vertybės ir moraliniai principai, kurie reguliuoja mūsų elgesį visuomenėje. Etika grindžiama ne įstatymais, o plačiai priimtomis normomis, kas yra „teisinga vs. neteisinga“. Tačiau etiniai svarstymai gali turėti įtakos įmonių valdymo iniciatyvoms ir vyriausybės reglamentams, kurie sukuria daugiau paskatų laikytis taisyklių.
**Duomenų etika** yra [nauja etikos šaka](https://royalsocietypublishing.org/doi/full/10.1098/rsta.2016.0360#sec-1), kuri „tiria ir vertina moralines problemas, susijusias su _duomenimis, algoritmais ir atitinkama praktika_“. Čia **„duomenys“** apima veiksmus, susijusius su duomenų generavimu, įrašymu, tvarkymu, apdorojimu, platinimu, dalijimusi ir naudojimu, **„algoritmai“** apima DI, agentus, mašininį mokymąsi ir robotus, o **„praktika“** apima tokias temas kaip atsakingos inovacijos, programavimas, įsilaužimai ir etikos kodeksai.
**Duomenų etika** yra [nauja etikos šaka](https://royalsocietypublishing.org/doi/full/10.1098/rsta.2016.0360#sec-1), kuri „tiria ir vertina moralines problemas, susijusias su _duomenimis, algoritmais ir atitinkama praktika_“. Čia **„duomenys“** apima veiksmus, susijusius su generavimu, įrašymu, kuravimu, apdorojimu, sklaida, dalijimusi ir naudojimu, **„algoritmai“** apima AI, agentus, mašininį mokymąsi ir robotus, o **„praktika“** apima temas, tokias kaip atsakinga inovacija, programavimas, įsilaužimas ir etikos kodeksai.
**Taikomoji etika** yra [moralinių svarstymų praktinis taikymas](https://en.wikipedia.org/wiki/Applied_ethics). Tai procesas, kai aktyviai tiriamos etinės problemos realių veiksmų, produktų ir procesų kontekste, ir imamasi korekcinių veiksmų, kad jie išliktų suderinti su mūsų apibrėžtomis etinėmis vertybėmis.
**Taikomoji etika** yra [moralinių svarstymų praktinis taikymas](https://en.wikipedia.org/wiki/Applied_ethics). Tai procesas, kai aktyviai tiriamos etinės problemos realių veiksmų, produktų ir procesų kontekste, ir imamasi korekcinių veiksmų, kad jie išliktų suderinti su apibrėžtomis etinėmis vertybėmis.
**Etikos kultūra** yra apie [_taikomosios etikos įgyvendinimą_](https://hbr.org/2019/05/how-to-design-an-ethical-organization), siekiant užtikrinti, kad mūsų etikos principai ir praktika būtų nuosekliai ir masteliškai taikomi visoje organizacijoje. Sėkmingos etikos kultūros apibrėžia organizacijos mastu taikomus etikos principus, suteikia prasmingas paskatas laikytis taisyklių ir stiprina etikos normas, skatindamos ir amplifikuodamos pageidaujamą elgesį kiekviename organizacijos lygmenyje.
**Etikos kultūra** tai [_taikomosios etikos operatyvinimas_](https://hbr.org/2019/05/how-to-design-an-ethical-organization), siekiant užtikrinti, kad mūsų etiniai principai ir praktika būtų nuosekliai ir masto požiūriu pritaikyti visoje organizacijoje. Sėkmingos etikos kultūros apibrėžia organizacijos mastu etinius principus, suteikia prasmingas paskatas laikytis taisyklių ir skatina bei stiprina pageidaujamą elgesį kiekviename organizacijos lygyje.
## Etikos sąvokos
Šioje dalyje aptarsime tokias sąvokas kaip **bendros vertybės** (principai) ir **etikos iššūkiai** (problemos) duomenų etikoje ir nagrinėsime **atvejų analizes**, kurios padės suprasti šias sąvokas realiame kontekste.
Šiame skyriuje aptarsime tokias sąvokas kaip **bendros vertybės** (principai) ir **etikos iššūkiai** (problemos) duomenų etikoje ir nagrinėsime **atvejų analizes**, kurios padės suprasti šias sąvokas realiame kontekste.
### 1. Etikos principai
Kiekviena duomenų etikos strategija prasideda nuo _etinių principų_ apibrėžimo „bendrų vertybių“, kurios apibūdina priimtiną elgesį ir vadovauja atitinkamiems veiksmams mūsų duomenų ir DI projektuose. Juos galima apibrėžti individualiu ar komandos lygmeniu. Tačiau dauguma didelių organizacijų šiuos principus apibrėžia _etinio DI_ misijos pareiškime arba sistemoje, kuri yra nustatyta korporaciniu lygmeniu ir nuosekliai taikoma visose komandose.
Kiekviena duomenų etikos strategija prasideda nuo _etinių principų_ apibrėžimo „bendrų vertybių“, kurios apibūdina priimtiną elgesį ir vadovauja veiksmams, atitinkantiems taisykles, mūsų duomenų ir AI projektuose. Juos galite apibrėžti individualiu ar komandos lygiu. Tačiau dauguma didelių organizacijų apibrėžia juos _etinio AI_ misijos pareiškime ar sistemoje, kuri yra apibrėžta korporatyviniu lygiu ir nuosekliai taikoma visose komandose.
**Pavyzdys:** „Microsoft“ [atsakingo DI](https://www.microsoft.com/en-us/ai/responsible-ai) misijos pareiškimas skamba taip: _„Mes esame įsipareigoję skatinti DI, vadovaujantis etikos principais, kurie pirmiausia rūpinasi žmonėmis“_ identifikuojant 6 etikos principus žemiau pateiktoje sistemoje:
**Pavyzdys:** Microsoft [Atsakingo AI](https://www.microsoft.com/en-us/ai/responsible-ai) misijos pareiškimas skamba: _„Mes esame įsipareigoję AI pažangai, kurią skatina etiniai principai, pirmiausia orientuoti į žmones“_ identifikuojant 6 etinius principus žemiau pateiktoje sistemoje:
![Atsakingas DI „Microsoft“](https://docs.microsoft.com/en-gb/azure/cognitive-services/personalizer/media/ethics-and-responsible-use/ai-values-future-computed.png)
![Atsakingas AI Microsoft](https://docs.microsoft.com/en-gb/azure/cognitive-services/personalizer/media/ethics-and-responsible-use/ai-values-future-computed.png)
Trumpai aptarkime šiuos principus. _Skaidrumas_ ir _atsakomybė_ yra pagrindinės vertybės, ant kurių statomi kiti principai todėl pradėkime nuo jų:
* [**Atsakomybė**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) užtikrina, kad specialistai būtų _atsakingi_ už savo duomenų ir DI veiksmus bei atitiktį šiems etikos principams.
* [**Skaidrumas**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) užtikrina, kad duomenų ir DI veiksmai būtų _suprantami_ vartotojams, paaiškinant, kas ir kodėl buvo nuspręsta.
* [**Teisingumas**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1%3aprimaryr6) siekia užtikrinti, kad DI elgtųsi _teisingai su visais žmonėmis_, sprendžiant bet kokias sistemines ar implicitines šališkumo problemas duomenyse ir sistemose.
* [**Patikimumas ir saugumas**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) užtikrina, kad DI elgtųsi _nuosekliai_ su apibrėžtomis vertybėmis, sumažinant galimą žalą ar netyčines pasekmes.
* [**Privatumas ir saugumas**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) tai duomenų kilmės supratimas ir _duomenų privatumo bei susijusių apsaugų_ teikimas vartotojams.
* [**Įtrauktis**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) tai DI sprendimų kūrimas su intencija, pritaikant juos, kad jie atitiktų _platų žmonių poreikių ir gebėjimų spektrą_.
* [**Atsakomybė**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) užtikrina, kad praktikai būtų _atsakingi_ už savo duomenų ir AI operacijas bei laikymąsi šių etinių principų.
* [**Skaidrumas**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) užtikrina, kad duomenų ir AI veiksmai būtų _suprantami_ vartotojams, paaiškinant, kas ir kodėl priimami sprendimai.
* [**Teisingumas**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1%3aprimaryr6) orientuojasi į tai, kad AI elgtųsi _teisingai su visais žmonėmis_, sprendžiant bet kokius sisteminius ar implicitinius socio-techninius šališkumus duomenyse ir sistemose.
* [**Patikimumas ir saugumas**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) užtikrina, kad AI elgtųsi _nuosekliai_ su apibrėžtomis vertybėmis, sumažinant galimą žalą ar netyčines pasekmes.
* [**Privatumas ir saugumas**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) tai duomenų kilmės supratimas ir _duomenų privatumo bei susijusių apsaugų_ suteikimas vartotojams.
* [**Įtrauktis**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) tai AI sprendimų kūrimas su ketinimu, pritaikant juos _plačiam žmonių poreikių ir gebėjimų spektrui_.
> 🚨 Pagalvokite, kokia galėtų būti jūsų duomenų etikos misijos pareiškimas. Išnagrinėkite kitų organizacijų etinio DI sistemas čia pateikiami pavyzdžiai iš [IBM](https://www.ibm.com/cloud/learn/ai-ethics), [Google](https://ai.google/principles) ir [Facebook](https://ai.facebook.com/blog/facebooks-five-pillars-of-responsible-ai/). Kokias bendras vertybes jie turi? Kaip šie principai susiję su DI produktu ar pramone, kurioje jie veikia?
> 🚨 Pagalvokite, kokia galėtų būti jūsų duomenų etikos misijos pareiškimas. Išnagrinėkite kitų organizacijų etinio AI sistemas čia pateikiami pavyzdžiai iš [IBM](https://www.ibm.com/cloud/learn/ai-ethics), [Google](https://ai.google/principles) ir [Facebook](https://ai.facebook.com/blog/facebooks-five-pillars-of-responsible-ai/). Kokias bendras vertybes jie turi? Kaip šie principai susiję su AI produktu ar pramone, kurioje jie veikia?
### 2. Etikos iššūkiai
Kai turime apibrėžtus etikos principus, kitas žingsnis yra įvertinti mūsų duomenų ir DI veiksmus, siekiant nustatyti, ar jie atitinka šias bendras vertybes. Pagalvokite apie savo veiksmus dviejose kategorijose: _duomenų rinkimas_ ir _algoritmų kūrimas_.
Kai turime apibrėžtus etinius principus, kitas žingsnis yra įvertinti mūsų duomenų ir AI veiksmus, kad pamatytume, ar jie atitinka tas bendras vertybes. Pagalvokite apie savo veiksmus dviejose kategorijose: _duomenų rinkimas_ ir _algoritmų kūrimas_.
Renkant duomenis, veiksmai greičiausiai apims **asmeninius duomenis** arba asmeniškai identifikuojamą informaciją (PII), susijusią su atpažįstamais gyvais asmenimis. Tai apima [įvairius neasmeninių duomenų elementus](https://ec.europa.eu/info/law/law-topic/data-protection/reform/what-personal-data_en), kurie _kartu_ gali identifikuoti asmenį. Etikos iššūkiai gali būti susiję su _duomenų privatumu_, _duomenų nuosavybe_ ir susijusiomis temomis, tokiomis kaip _informuotas sutikimas_ ir _intelektinės nuosavybės teisės_ vartotojams.
Renkant duomenis, veiksmai greičiausiai apims **asmeninius duomenis** arba asmeniškai identifikuojamą informaciją (PII), susijusią su identifikuojamais gyvais asmenimis. Tai apima [įvairius neasmeninių duomenų elementus](https://ec.europa.eu/info/law/law-topic/data-protection/reform/what-personal-data_en), kurie _kolektyviai_ identifikuoja asmenį. Etikos iššūkiai gali būti susiję su _duomenų privatumu_, _duomenų nuosavybe_ ir susijusiomis temomis, tokiomis kaip _informuotas sutikimas_ ir _intelektinės nuosavybės teisės_ vartotojams.
Kuriant algoritmus, veiksmai apims **duomenų rinkinių** rinkimą ir tvarkymą, o tada jų naudojimą **duomenų modeliams** mokyti ir diegti, siekiant prognozuoti rezultatus arba automatizuoti sprendimus realiame kontekste. Etikos iššūkiai gali kilti dėl _rinkinio šališkumo_, _duomenų kokybės_ problemų, _neteisingumo_ ir _klaidingo atvaizdavimo_ algoritmuose įskaitant kai kurias sistemines problemas.
Kuriant algoritmus, veiksmai apims **duomenų rinkinių** rinkimą ir kuravimą, o vėliau jų naudojimą **duomenų modelių** mokymui ir diegimui, kurie prognozuoja rezultatus arba automatizuoja sprendimus realiame kontekste. Etikos iššūkiai gali kilti dėl _duomenų rinkinio šališkumo_, _duomenų kokybės_ problemų, _neteisingumo_ ir _klaidingo atvaizdavimo_ algoritmuose įskaitant kai kurias sistemines problemas.
Abiem atvejais etikos iššūkiai pabrėžia sritis, kuriose mūsų veiksmai gali prieštarauti mūsų bendroms vertybėms. Norėdami aptikti, sumažinti, sušvelninti ar pašalinti šias problemas, turime užduoti moralinius „taip/ne“ klausimus, susijusius su mūsų veiksmais, ir prireikus imtis korekcinių veiksmų. Pažvelkime į kai kuriuos etikos iššūkius ir moralinius klausimus, kuriuos jie kelia:
Abiem atvejais etikos iššūkiai pabrėžia sritis, kuriose mūsų veiksmai gali susidurti su konfliktu su bendromis vertybėmis. Norėdami aptikti, sumažinti, minimizuoti ar pašalinti šias problemas, turime užduoti moralinius „taip/ne“ klausimus, susijusius su mūsų veiksmais, ir prireikus imtis korekcinių veiksmų. Pažvelkime į kai kuriuos etikos iššūkius ir moralinius klausimus, kuriuos jie kelia:
#### 2.1 Duomenų nuosavybė
Duomenų rinkimas dažnai apima asmeninius duomenis, kurie gali identifikuoti duomenų subjektus. [Duomenų nuosavybė](https://permission.io/blog/data-ownership) yra apie _kontrolę_ ir [_vartotojų teises_](https://permission.io/blog/data-ownership), susijusias su duomenų kūrimu, apdorojimu ir platinimu.
Duomenų rinkimas dažnai apima asmeninius duomenis, kurie gali identifikuoti duomenų subjektus. [Duomenų nuosavybė](https://permission.io/blog/data-ownership) yra apie _kontrolę_ ir [_vartotojų teises_](https://permission.io/blog/data-ownership), susijusias su duomenų kūrimu, apdorojimu ir sklaida.
Moraliniai klausimai, kuriuos turime užduoti:
* Kas valdo duomenis? (vartotojas ar organizacija)
* Kokias teises turi duomenų subjektai? (pvz., prieiga, ištrynimas, perkeliamumas)
* Kokias teises turi organizacijos? (pvz., taisyti kenksmingas vartotojų apžvalgas)
Moraliniai klausimai, kuriuos reikia užduoti:
* Kas valdo duomenis? (vartotojas ar organizacija)
* Kokias teises turi duomenų subjektai? (pvz., prieiga, ištrynimas, perkeliamumas)
* Kokias teises turi organizacijos? (pvz., taisyti kenksmingas vartotojų apžvalgas)
#### 2.2 Informuotas sutikimas
[Informuotas sutikimas](https://legaldictionary.net/informed-consent/) apibrėžia veiksmą, kai vartotojai sutinka su veiksmu (pvz., duomenų rinkimu), turėdami _pilną supratimą_ apie svarbius faktus, įskaitant tikslą, galimą riziką ir alternatyvas.
[Informuotas sutikimas](https://legaldictionary.net/informed-consent/) apibrėžia vartotojų sutikimą veiksmui (pvz., duomenų rinkimui) su _pilnu supratimu_ apie svarbius faktus, įskaitant tikslą, galimas rizikas ir alternatyvas.
Klausimai, kuriuos reikia nagrinėti:
* Ar vartotojas (duomenų subjektas) davė leidimą rinkti ir naudoti duomenis?
* Ar vartotojas suprato tikslą, dėl kurio buvo renkami duomenys?
* Ar vartotojas suprato galimą riziką, susijusią su jų dalyvavimu?
* Ar vartotojas (duomenų subjektas) davė leidimą duomenų rinkimui ir naudojimui?
* Ar vartotojas suprato tikslą, dėl kurio buvo surinkti duomenys?
* Ar vartotojas suprato galimas rizikas, susijusias su jų dalyvavimu?
#### 2.3 Intelektinė nuosavybė
[Intelektinė nuosavybė](https://en.wikipedia.org/wiki/Intellectual_property) reiškia nematerialius kūrinius, atsiradusius dėl žmogaus iniciatyvos, kurie gali _turėti ekonominę vertę_ asmenims ar verslui.
[Intelektinė nuosavybė](https://en.wikipedia.org/wiki/Intellectual_property) reiškia nematerialius kūrinius, atsiradusius žmogaus iniciatyvos, kurie gali _turėti ekonominę vertę_ asmenims ar verslui.
Klausimai, kuriuos reikia nagrinėti:
* Ar surinkti duomenys turėjo ekonominę vertę vartotojui ar verslui?
* Ar **vartotojas** turi intelektinę nuosavybę čia?
* Ar **organizacija** turi intelektinę nuosavybę čia?
* Jei šios teisės egzistuoja, kaip mes jas saugome?
* Ar surinkti duomenys turėjo ekonominę vertę vartotojui ar verslui?
* Ar **vartotojas** turi intelektinę nuosavybę čia?
* Ar **organizacija** turi intelektinę nuosavybę čia?
* Jei šios teisės egzistuoja, kaip jas saugome?
#### 2.4 Duomenų privatumas
[Duomenų privatumas](https://www.northeastern.edu/graduate/blog/what-is-data-privacy/) arba informacijos privatumas reiškia vartotojų privatumo išsaugojimą ir jų tapatybės apsaugą, susijusią su asmeniškai identifikuojama informacija.
[Duomenų privatumas](https://www.northeastern.edu/graduate/blog/what-is-data-privacy/) arba informacijos privatumas reiškia vartotojų privatumo išsaugojimą ir vartotojų tapatybės apsaugą, susijusią su asmeniškai identifikuojama informacija.
Klausimai, kuriuos reikia nagrinėti:
* Ar vartotojų (asmeniniai) duomenys yra apsaugoti nuo įsilaužimų ir nutekėjimų?
* Ar vartotojų duomenys yra prieinami tik įgaliotiems vartotojams ir kontekstams?
* Ar vartotojų anonimiškumas išsaugomas, kai duomenys yra dalijami ar platinami?
* Ar vartotojas gali būti deanonimizuotas iš anonimizuotų duomenų rinkinių?
* Ar vartotojų (asmeniniai) duomenys yra apsaugoti nuo įsilaužimų ir nutekėjimų?
* Ar vartotojų duomenys yra prieinami tik įgaliotiems vartotojams ir kontekstams?
* Ar vartotojų anonimiškumas išsaugomas, kai duomenys yra dalijami ar skleidžiami?
* Ar vartotojas gali būti deidentifikuotas iš anonimizuotų duomenų rinkinių?
#### 2.5 Teisė būti pamirštam
[Teisė būti pamirštam](https://en.wikipedia.org/wiki/Right_to_be_forgotten) arba [teisė į ištrynimą](https://www.gdpreu.org/right-to-be-forgotten/) suteikia papildomą asmeninių duomenų apsaugą vartotojams. Konkrečiai, ji suteikia vartotojams teisę prašyti asmeninių duomenų ištrynimo ar pašalinimo iš interneto paieškų ir kitų vietų, _tam tikromis aplinkybėmis_ leidžiant jiems pradėti iš naujo internete, nes jų praeities veiksmai nebūtų laikomi prieš juos.
[Teisė būti pamirštam](https://en.wikipedia.org/wiki/Right_to_be_forgotten) arba [Teisė į ištrynimą](https://www.gdpreu.org/right-to-be-forgotten/) suteikia papildomą asmeninių duomenų apsaugą vartotojams. Konkrečiai, tai suteikia vartotojams teisę prašyti asmeninių duomenų ištrynimo ar pašalinimo iš interneto paieškų ir kitų vietų, _tam tikromis aplinkybėmis_ leidžiant jiems naują pradžią internete be praeities veiksmų, kurie galėtų būti laikomi prieš juos.
Klausimai, kuriuos reikia nagrinėti:
* Ar sistema leidžia duomenų subjektams prašyti ištrynimo?
* Ar vartotojo sutikimo atšaukimas turėtų automatiškai sukelti ištrynimą?
* Ar duomenys buvo surinkti be sutikimo ar neteisėtomis priemonėmis?
* Ar mes laikomės vyriausybės reglamentų dėl duomenų privatumo?
* Ar sistema leidžia duomenų subjektams prašyti ištrynimo?
* Ar vartotojo sutikimo atšaukimas turėtų automatiškai sukelti ištrynimą?
* Ar duomenys buvo surinkti be sutikimo ar neteisėtais būdais?
* Ar mes laikomės vyriausybės reglamentų dėl duomenų privatumo?
#### 2.6 Duomenų rinkinio šališkumas
Duomenų rinkinys arba [rinkimo š
[Algoritmų sąžiningumas](https://towardsdatascience.com/what-is-algorithm-fairness-3182e161cf9f) tikrina, ar algoritmų kūrimas sistemingai nediskriminuoja tam tikrų duomenų subjektų grupių, sukeldamas [galimą žalą](https://docs.microsoft.com/en-us/azure/machine-learning/concept-fairness-ml) _paskirstymo_ (kai ištekliai atimami arba nesuteikiami tai grupei) ir _paslaugų kokybės_ (kai dirbtinis intelektas nėra toks tikslus kai kurioms grupėms kaip kitoms) srityse.
Duomenų rinkinio arba [rinkimo šališkumas](http://researcharticles.com/index.php/bias-in-data-collection-in-research/) yra apie _nereprezentatyvaus_ du
[Algoritmų sąžiningumas](https://towardsdatascience.com/what-is-algorithm-fairness-3182e161cf9f) tikrina, ar algoritmų dizainas sistemingai nediskriminuoja tam tikrų duomenų subjektų grupių, sukeldamas [galimą žalą](https://docs.microsoft.com/en-us/azure/machine-learning/concept-fairness-ml) _paskirstymo_ (kai ištekliai atimami arba nesuteikiami tai grupei) ir _paslaugų kokybės_ (kai AI nėra toks tikslus tam tikroms grupėms kaip kitoms) srityse.
Klausimai, kuriuos verta apsvarstyti:
* Ar įvertinome modelio tikslumą įvairioms grupėms ir sąlygoms?
@ -144,7 +144,7 @@ Klausimai, kuriuos verta apsvarstyti:
* Ar pateikiame neišsamius ar netikslius duomenis?
* Ar vizualizuojame duomenis taip, kad sukeltume klaidingas išvadas?
* Ar naudojame selektyvius statistinius metodus rezultatams manipuliuoti?
* Ar yra alternatyvių paaiškinimų, kurie galėtų pateikti kitokią išvadą?
* Ar yra alternatyvių paaiškinimų, kurie galėtų pasiūlyti kitokią išvadą?
#### 2.10 Laisvo pasirinkimo iliuzija
@ -153,25 +153,25 @@ Klausimai, kuriuos verta apsvarstyti:
Klausimai, kuriuos verta apsvarstyti:
* Ar vartotojas suprato, kokias pasekmes turi jo pasirinkimas?
* Ar vartotojas buvo informuotas apie (alternatyvius) pasirinkimus ir jų privalumus bei trūkumus?
* Ar vartotojas gali vėliau atšaukti automatizuotą ar įtakotą pasirinkimą?
* Ar vartotojas gali vėliau pakeisti automatizuotą ar įtakotą pasirinkimą?
### 3. Atvejų analizės
Norint suprasti šiuos etikos iššūkius realiame pasaulyje, verta peržiūrėti atvejų analizes, kurios parodo galimą žalą ir pasekmes asmenims bei visuomenei, kai tokie etikos pažeidimai yra ignoruojami.
Norint suprasti šiuos etikos iššūkius realiame pasaulyje, verta pažvelgti į atvejų analizes, kurios parodo galimą žalą ir pasekmes asmenims bei visuomenei, kai tokie etikos pažeidimai yra ignoruojami.
Štai keletas pavyzdžių:
| Etikos iššūkis | Atvejo analizė |
|--- |--- |
| **Informuotas sutikimas** | 1972 m. - [Tuskegee sifilio tyrimas](https://en.wikipedia.org/wiki/Tuskegee_Syphilis_Study) - Afroamerikiečiai vyrai, dalyvavę tyrime, buvo pažadėti nemokama medicininė priežiūra, _bet buvo apgauti_ tyrėjų, kurie neinformavo jų apie diagnozę ar gydymo galimybes. Daugelis dalyvių mirė, o jų partneriai ar vaikai buvo paveikti; tyrimas truko 40 metų. |
| **Duomenų privatumas** | 2007 m. - [Netflix duomenų prizas](https://www.wired.com/2007/12/why-anonymous-data-sometimes-isnt/) pateikė tyrėjams _10 mln. anonimizuotų filmų įvertinimų iš 50 tūkst. klientų_, siekiant pagerinti rekomendacijų algoritmus. Tačiau tyrėjai sugebėjo susieti anonimizuotus duomenis su asmeniškai identifikuojamais duomenimis _išorinių duomenų rinkinių_ (pvz., IMDb komentarų), efektyviai „deanonimizuodami“ kai kuriuos Netflix abonentus.|
| **Duomenų rinkimo šališkumas** | 2013 m. - Bostono miestas [sukūrė Street Bump](https://www.boston.gov/transportation/street-bump), programėlę, leidžiančią piliečiams pranešti apie duobes, suteikiant miestui geresnius duomenis apie kelių būklę. Tačiau [žmonės iš mažesnių pajamų grupių turėjo mažiau prieigos prie automobilių ir telefonų](https://hbr.org/2013/04/the-hidden-biases-in-big-data), todėl jų kelių problemos tapo nematomos šioje programėlėje. Kūrėjai bendradarbiavo su akademikais, kad spręstų _teisingos prieigos ir skaitmeninės atskirties_ klausimus. |
| **Algoritmų sąžiningumas** | 2018 m. - MIT [Gender Shades tyrimas](http://gendershades.org/overview.html) įvertino AI produktų tikslumą pagal lytį, atskleisdamas tikslumo spragas moterims ir spalvotiems žmonėms. [2019 m. Apple kortelė](https://www.wired.com/story/the-apple-card-didnt-see-genderand-thats-the-problem/) atrodė, kad siūlo mažiau kredito moterims nei vyrams. Abu atvejai parodė algoritminio šališkumo problemas, sukeliančias socialinę ir ekonominę žalą.|
| **Netinkamas duomenų pateikimas** | 2020 m. - [Džordžijos sveikatos departamentas paskelbė COVID-19 diagramas](https://www.vox.com/covid-19-coronavirus-us-response-trump/2020/5/18/21262265/georgia-covid-19-cases-declining-reopening), kurios atrodė klaidinančios piliečius apie patvirtintų atvejų tendencijas, pateikdamos nechronologinę x ašies tvarką. Tai iliustruoja netinkamą pateikimą naudojant vizualizacijos triukus. |
| **Laisvo pasirinkimo iliuzija** | 2020 m. - Mokymosi programėlė [ABCmouse sumokėjo 10 mln. dolerių, kad išspręstų FTC skundą](https://www.washingtonpost.com/business/2020/09/04/abcmouse-10-million-ftc-settlement/), kai tėvai buvo priversti mokėti už prenumeratas, kurių negalėjo atšaukti. Tai iliustruoja tamsiuosius modelius pasirinkimo architektūrose, kur vartotojai buvo paskatinti priimti potencialiai žalingus sprendimus. |
| **Duomenų privatumas ir vartotojų teisės** | 2021 m. - Facebook [duomenų nutekėjimas](https://www.npr.org/2021/04/09/986005820/after-data-breach-exposes-530-million-facebook-says-it-will-not-notify-users) atskleidė 530 mln. vartotojų duomenis, dėl ko buvo skirta 5 mlrd. dolerių bauda FTC. Tačiau Facebook atsisakė informuoti vartotojus apie nutekėjimą, pažeisdama vartotojų teises į duomenų skaidrumą ir prieigą. |
Norite sužinoti daugiau atvejų analizių? Peržiūrėkite šiuos šaltinius:
| **Duomenų privatumas** | 2007 m. - [Netflix duomenų prizas](https://www.wired.com/2007/12/why-anonymous-data-sometimes-isnt/) pateikė tyrėjams _10 mln. anonimizuotų filmų įvertinimų iš 50 tūkst. klientų_, siekiant pagerinti rekomendacijų algoritmus. Tačiau tyrėjai sugebėjo susieti anonimizuotus duomenis su asmeniškai identifikuojamais duomenimis _išoriniuose duomenų rinkiniuose_ (pvz., IMDb komentarais), efektyviai „deanonimizuodami“ kai kuriuos Netflix abonentus.|
| **Duomenų rinkimo šališkumas** | 2013 m. - Bostono miestas [sukūrė Street Bump](https://www.boston.gov/transportation/street-bump), programėlę, leidžiančią piliečiams pranešti apie duobes, suteikiant miestui geresnius duomenis apie kelių būklę. Tačiau [žmonės iš mažesnių pajamų grupių turėjo mažiau prieigos prie automobilių ir telefonų](https://hbr.org/2013/04/the-hidden-biases-in-big-data), todėl jų kelių problemos tapo nematomos šioje programėlėje. Kūrėjai dirbo su akademikais, kad spręstų _teisingos prieigos ir skaitmeninės atskirties_ klausimus. |
| **Algoritmų sąžiningumas** | 2018 m. - MIT [Gender Shades tyrimas](http://gendershades.org/overview.html) įvertino AI produktų tikslumą pagal lytį, atskleidžiant netikslumus moterų ir spalvotų žmonių atžvilgiu. [2019 m. Apple kortelė](https://www.wired.com/story/the-apple-card-didnt-see-genderand-thats-the-problem/) atrodė, kad siūlo mažiau kredito moterims nei vyrams. Abu atvejai parodė algoritminio šališkumo problemas, sukeliančias socialinę ir ekonominę žalą.|
| **Netinkamas duomenų pateikimas** | 2020 m. - [Džordžijos sveikatos departamentas paskelbė COVID-19 diagramas](https://www.vox.com/covid-19-coronavirus-us-response-trump/2020/5/18/21262265/georgia-covid-19-cases-declining-reopening), kurios klaidino piliečius apie patvirtintų atvejų tendencijas, naudodamas nechronologinę x ašies tvarką. Tai iliustruoja netinkamą pateikimą per vizualizacijos triukus. |
| **Laisvo pasirinkimo iliuzija** | 2020 m. - Mokymosi programėlė [ABCmouse sumokėjo 10 mln. dolerių, kad išspręstų FTC skundą](https://www.washingtonpost.com/business/2020/09/04/abcmouse-10-million-ftc-settlement/), kai tėvai buvo priversti mokėti už prenumeratas, kurių negalėjo atšaukti. Tai iliustruoja tamsiuosius modelius pasirinkimo architektūrose, kur vartotojai buvo nukreipti link galimai žalingų pasirinkimų. |
| **Duomenų privatumas ir vartotojų teisės** | 2021 m. - Facebook [duomenų nutekėjimas](https://www.npr.org/2021/04/09/986005820/after-data-breach-exposes-530-million-facebook-says-it-will-not-notify-users) atskleidė 530 mln. vartotojų duomenis, dėl ko buvo skirta 5 mlrd. dolerių bauda FTC. Tačiau Facebook atsisakė informuoti vartotojus apie nutekėjimą, pažeisdamas vartotojų teises į duomenų skaidrumą ir prieigą. |
Norite daugiau atvejų analizių? Peržiūrėkite šiuos šaltinius:
* [Ethics Unwrapped](https://ethicsunwrapped.utexas.edu/case-studies) - etikos dilemos įvairiose pramonės šakose.
* [Duomenų mokslo etikos kursas](https://www.coursera.org/learn/data-science-ethics#syllabus) - svarbiausių atvejų analizės.
* [Kur viskas nepavyko](https://deon.drivendata.org/examples/) - Deon kontrolinis sąrašas su pavyzdžiais.
@ -184,32 +184,32 @@ Mes aptarėme etikos sąvokas, iššūkius ir atvejų analizes realiame pasaulyj
### 1. Profesiniai kodeksai
Profesiniai kodeksai siūlo vieną iš būdų organizacijoms „skatinti“ narius palaikyti jų etikos principus ir misiją. Kodeksai yra _moralinės gairės_ profesiniam elgesiui, padedančios darbuotojams ar nariams priimti sprendimus, atitinkančius organizacijos principus. Jie yra veiksmingi tiek, kiek nariai savanoriškai jų laikosi; tačiau daugelis organizacijų siūlo papildomas paskatas ir bausmes, kad motyvuotų narius laikytis kodekso.
Profesiniai kodeksai siūlo vieną iš būdų organizacijoms „skatinti“ narius palaikyti jų etikos principus ir misiją. Kodeksai yra _moralinės gairės_ profesiniam elgesiui, padedančios darbuotojams ar nariams priimti sprendimus, atitinkančius organizacijos principus. Jie yra veiksmingi tiek, kiek nariai savanoriškai jų laikosi; tačiau daugelis organizacijų siūlo papildomas paskatas ir bausmes, kad motyvuotų narius laikytis kodekso.
Pavyzdžiai:
* [Oksfordo Miuncheno](http://www.code-of-ethics.org/code-of-conduct/) etikos kodeksas
* [Duomenų mokslo asociacijos](http://datascienceassn.org/code-of-conduct.html) elgesio kodeksas (sukurtas 2013 m.)
* [ACM etikos ir profesinio elgesio kodeksas](https://www.acm.org/code-of-ethics) (nuo 1993 m.)
> 🚨 Ar priklausote profesinei inžinerijos ar duomenų mokslo organizacijai? Peržiūrėkite jų svetainę, kad pamatytumėte, ar jie apibrėžia profesinį etikos kodeksą. Ką tai sako apie jų etikos principus? Kaip jie „skatina“ narius laikytis kodekso?
> 🚨 Ar priklausote profesinei inžinerijos ar duomenų mokslo organizacijai? Peržiūrėkite jų svetainę, kad sužinotumėte, ar jie apibrėžia profesinį etikos kodeksą. Ką tai sako apie jų etikos principus? Kaip jie „skatina“ narius laikytis kodekso?
### 2. Etikos kontroliniai sąrašai
Nors profesiniai kodeksai apibrėžia reikalaujamą _etišką elgesį_ specialistams, jie [turi žinomų apribojimų](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md) vykdymo užtikrinime, ypač didelio masto projektuose. Vietoj to, daugelis duomenų mokslo ekspertų [rekomenduoja kontrolinius sąrašus](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md), kurie gali **susieti principus su praktikomis** labiau apibrėžtais ir veiksmais pagrįstais būdais.
Nors profesiniai kodeksai apibrėžia reikalaujamą _etikos elgesį_ specialistams, jie [turi žinomų apribojimų](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md) vykdymo užtikrinime, ypač didelio masto projektuose. Vietoj to, daugelis duomenų mokslo ekspertų [rekomenduoja kontrolinius sąrašus](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md), kurie gali **susieti principus su praktikomis** labiau apibrėžtais ir veiksmais pagrįstais būdais.
Kontroliniai sąrašai paverčia klausimus „taip/ne“ užduotimis, kurias galima įgyvendinti, leidžiant jas stebėti kaip standartinių produktų išleidimo darbo eigų dalį.
Kontroliniai sąrašai paverčia klausimus „taip/ne“ užduotimis, kurias galima įgyvendinti, leidžiant juos stebėti kaip standartinių produktų išleidimo darbo eigų dalį.
Pavyzdžiai:
* [Deon](https://deon.drivendata.org/) - bendros paskirties duomenų etikos kontrolinis sąrašas, sukurtas remiantis [pramonės rekomendacijomis](https://deon.drivendata.org/#checklist-citations) su komandinės eilutės įrankiu lengvam integravimui.
* [Privatumo audito kontrolinis sąrašas](https://cyber.harvard.edu/ecommerce/privacyaudit.html) - pateikia bendras gaires informacijos tvarkymo praktikoms iš teisinės ir socialinės perspektyvos.
* [AI sąžiningumo kontrolinis sąrašas](https://www.microsoft.com/en-us/research/project/ai-fairness-checklist/) - sukurtas AI specialistų, siekiant palaikyti sąžiningumo patikrinimų integravimą į AI kūrimo ciklus.
* [AI sąžiningumo kontrolinis sąrašas](https://www.microsoft.com/en-us/research/project/ai-fairness-checklist/) - sukurtas AI specialistų, siekiant palaikyti sąžiningumo patikrinimų integraciją į AI kūrimo ciklus.
* [22 klausimai apie etiką duomenyse ir AI](https://medium.com/the-organization/22-questions-for-ethics-in-data-and-ai-efb68fd19429) - atviresnė sistema, skirta pradinei etikos klausimų analizei dizaino, įgyvendinimo ir organizaciniuose kontekstuose.
### 3. Etikos reguliavimas
Etika yra apie bendrų vertybių apibrėžimą ir teisingų veiksmų atlikimą _savanoriškai_. **Atitiktis** yra apie _įstatymų laikymąsi_, jei jie yra apibrėžti. **Valdymas** apima visas organizacijų veiklos formas, skirtas etikos principų įgyvendinimui ir nustatytų įstatymų laikymuisi.
Etika yra apie bendrų vertybių apibrėžimą ir teisingų veiksmų atlikimą _savanoriškai_. **Atitiktis** yra apie _įstatymų laikymąsi_, jei jie yra apibrėžti. **Valdymas** apima visas organizacijų veiklos formas, skirtas etikos principams įgyvendinti ir laikytis nustatytų įstatymų.
Šiandien valdymas organizacijose vyksta dviem formomis. Pirma, tai yra apie **etiško AI** principų apibrėžimą ir praktikų įgyvendinimą, siekiant užtikrinti jų taikymą visuose organizacijos AI projektuose. Antra, tai yra apie visų vyriausybės nustatytų **duomenų apsaugos reguliavimų** laikymąsi regionuose, kuriuose organizacija veikia.
Šiandien valdymas organizacijose vyksta dviem formomis. Pirma, tai yra apie **etinių AI** principų apibrėžimą ir praktikų nustatymą, siekiant užtikrinti jų taikymą visiems su AI susijusiems projektams organizacijoje. Antra, tai yra apie visų vyriausybės nustatytų **duomenų apsaugos reguliavimų** laikymąsi regionuose, kuriuose organizacija veikia.
Duomenų apsaugos ir privatumo reguliavimo pavyzdžiai:
@ -220,23 +220,23 @@ Duomenų apsaugos ir privatumo reguliavimo pavyzdžiai:
* `2018`, [Kalifornijos vartotojų privatumo aktas (CCPA)](https://www.oag.ca.gov/privacy/ccpa) suteikia vartotojams daugiau _teisių_ į jų (asmeninius) duomenis.
* `2021`, Kinijos [Asmeninės informacijos apsaugos įstatymas](https://www.reuters.com/world/china/china-passes-new-personal-data-privacy-law-take-effect-nov-1-2021-08-20/) ką tik priimtas, sukuriantis vieną iš stipriausių internetinių duomenų privatumo reguliavimų pasaulyje.
> 🚨 Europos Sąjungos apibrėžtas GDPR (Bendrasis duomenų apsaugos reglamentas) išlieka vienu įtakingiausių duomenų privatumo reguliavimų šiandien. Ar žinojote, kad jis taip pat apibrėžia [8 vartotojų teises](https://www.freeprivacypolicy.com/blog/8-user-rights-gdpr), skirtas apsaugoti piliečių skaitmeninį privatumą ir asmens duomenis? Sužinokite, kokios jos yra ir kodėl jos svarbios.
> 🚨 Europos Sąjungos apibrėžtas GDPR (Bendrasis duomenų apsaugos reglamentas) išlieka vienu įtakingiausių duomenų privatumo reguliavimų šiandien. Ar žinojote, kad jis taip pat apibrėžia [8 vartotojų teises](https://www.freeprivacypolicy.com/blog/8-user-rights-gdpr), skirtas apsaugoti piliečių skaitmeninį privatumą ir asmens duomenis? Sužinokite, kokios jos yra ir kodėl jos svarbios.
### 4. Etikos kultūra
Atkreipkite dėmesį, kad vis dar egzistuoja nematomas atotrūkis tarp _atitikties_ (pakankamo veikimo pagal „įstatymo raidę“) ir [sisteminių problemų](https://www.coursera.org/learn/data-science-ethics/home/week/4) sprendimo (pvz., informacijos asimetrijos ir paskirstymo neteisingumo), kurios gali paspartinti AI ginklavimą.
Atkreipkite dėmesį, kad vis dar egzistuoja nematomas atotrūkis tarp _atitikties_ (pakankamo veikimo pagal „įstatymo raidę“) ir [sisteminių problemų](https://www.coursera.org/learn/data-science-ethics/home/week/4) sprendimo (pvz., ossifikacijos, informacijos asimetrijos ir paskirstymo neteisingumo), kurios gali paspartinti AI ginklavimą.
Pastarasis reikalauja [bendradarbiavimo metodų etikos kultūrų kūrimui](https://towardsdatascience.com/why-ai-ethics-requires-a-culture-driven-approach-26f451afa29f), kurie užtikrina emocinius ryšius ir nuoseklias bendras vertybes _visose organizacijose_ pramonėje. Tai reikalauja daugiau [formalizuotų duomenų etikos kultūrų](https://www.codeforamerica.org/news/formalizing-an-ethical-data-culture/) organizacijose leidžiant _bet kam_ [traukti Andon virvę](https://en.wikipedia.org/wiki/Andon_(manufacturing))
* [Atsakingo dirbtinio intelekto principai](https://docs.microsoft.com/en-us/learn/modules/responsible-ai-principles/) - nemokamas mokymosi kelias iš Microsoft Learn.
* [Etika ir duomenų mokslas](https://resources.oreilly.com/examples/0636920203964) - O'Reilly elektroninė knyga (M. Loukides, H. Mason ir kt.)
* [Duomenų mokslo etika](https://www.coursera.org/learn/data-science-ethics#syllabus) - internetinis kursas iš Mičigano universiteto.
* [Etika atskleista](https://ethicsunwrapped.utexas.edu/case-studies) - atvejų analizės iš Teksaso universiteto.
Pastarasis reikalauja [bendradarbiavimo metodų etikos kultūrų apibrėžimui](https://towardsdatascience.com/why-ai-ethics-requires-a-culture-driven-approach-26f451afa29f), kurie kuria emocinius ryšius ir nuoseklias bendras vertybes _visose organizacijose_ pramonėje. Tai reikalauja daugiau [formalizuotų duomenų etikos kultūrų](https://www.codeforamerica.org/news/formalizing-an-ethical-data-culture/) organizacijose leidžiant _bet kam_ [traukti Andon virvę](https://en.wikipedia.org/wiki/Andon_(manufacturing)) (kad anksti iškeltų
* [Atsakingo dirbtinio intelekto principai](https://docs.microsoft.com/en-us/learn/modules/responsible-ai-principles/) - nemokamas mokymosi kelias iš Microsoft Learn.
* [Etika ir duomenų mokslas](https://resources.oreilly.com/examples/0636920203964) - O'Reilly elektroninė knyga (M. Loukides, H. Mason ir kt.)
* [Duomenų mokslo etika](https://www.coursera.org/learn/data-science-ethics#syllabus) - internetinis kursas iš Mičigano universiteto.
* [Etika be užuolankų](https://ethicsunwrapped.utexas.edu/case-studies) - atvejų analizės iš Teksaso universiteto.
# Užduotis
# Užduotis
[Parašykite duomenų etikos atvejo analizę](assignment.md)
[Parašykite duomenų etikos atvejo analizę](assignment.md)
---
**Atsakomybės apribojimas**:
Šis dokumentas buvo išverstas naudojant AI vertimo paslaugą [Co-op Translator](https://github.com/Azure/co-op-translator). Nors siekiame tikslumo, prašome atkreipti dėmesį, kad automatiniai vertimai gali turėti klaidų ar netikslumų. Originalus dokumentas jo gimtąja kalba turėtų būti laikomas autoritetingu šaltiniu. Kritinei informacijai rekomenduojama naudoti profesionalų žmogaus vertimą. Mes neprisiimame atsakomybės už nesusipratimus ar klaidingus interpretavimus, atsiradusius dėl šio vertimo naudojimo.
Šis dokumentas buvo išverstas naudojant AI vertimo paslaugą [Co-op Translator](https://github.com/Azure/co-op-translator). Nors siekiame tikslumo, prašome atkreipti dėmesį, kad automatiniai vertimai gali turėti klaidų ar netikslumų. Originalus dokumentas jo gimtąja kalba turėtų būti laikomas autoritetingu šaltiniu. Kritinei informacijai rekomenduojama profesionali žmogaus vertimo paslauga. Mes neprisiimame atsakomybės už nesusipratimus ar klaidingus interpretavimus, atsiradusius naudojant šį vertimą.

@ -1,31 +1,31 @@
<!--
CO_OP_TRANSLATOR_METADATA:
{
"original_hash": "8796f41f566a0a8ebb72863a83d558ed",
"translation_date": "2025-08-27T08:50:53+00:00",
"original_hash": "3a34157cc63516eba97c89a0b2f8c3e6",
"translation_date": "2025-09-03T20:59:01+00:00",
"source_file": "1-Introduction/02-ethics/README.md",
"language_code": "mo"
}
-->
# 資料倫理簡介
|![ 由 [(@sketchthedocs)](https://sketchthedocs.dev) 繪製的手繪筆記 ](../../sketchnotes/02-Ethics.png)|
|![由 [(@sketchthedocs)](https://sketchthedocs.dev) 繪製的速寫筆記](../../sketchnotes/02-Ethics.png)|
|:---:|
| 資料科學倫理 - _由 [@nitya](https://twitter.com/nitya) 繪製的手繪筆記_ |
| 資料科學倫理 - _由 [@nitya](https://twitter.com/nitya) 繪製的速寫筆記_ |
---
我們都是生活在數據化世界中的資料公民。
我們都是生活在數據化世界中的數據公民。
市場趨勢顯示到2022年三分之一的大型組織將通過線上[市場和交易所](https://www.gartner.com/smarterwithgartner/gartner-top-10-trends-in-data-and-analytics-for-2020/)買賣數據。作為**應用程式開發者**,我們將更容易且更便宜地將數據驅動的洞察力和算法驅動的自動化整合到日常用戶體驗中。但隨著人工智慧AI的普及,我們也需要了解這些算法在大規模應用時可能帶來的[武器化](https://www.youtube.com/watch?v=TQHs8SA1qpk)危害。
市場趨勢顯示到2022年每三家大型組織中就有一家會通過線上[市場和交易所](https://www.gartner.com/smarterwithgartner/gartner-top-10-trends-in-data-and-analytics-for-2020/)購買和出售數據。作為**應用程式開發者**,我們會發現將數據驅動的洞察力和算法驅動的自動化整合到日常用戶體驗中變得更加容易和便宜。但隨著人工智慧的普及,我們也需要了解這些算法在大規模應用中可能造成的[武器化](https://www.youtube.com/watch?v=TQHs8SA1qpk)潛在危害。
趨勢還顯示到2025年我們將創造消耗超過[180澤字節](https://www.statista.com/statistics/871513/worldwide-data-created/)的數據。作為**資料科學家**,這讓我們能夠前所未有地接觸到個人數據。這意味著我們可以建立用戶的行為檔案,並以某種方式影響決策,從而創造一種[自由選擇的假象](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice),同時可能將用戶推向我們偏好的結果。這也引發了關於數據隱私和用戶保護的更廣泛問題。
趨勢還顯示到2025年我們將創造消耗超過[180澤字節](https://www.statista.com/statistics/871513/worldwide-data-created/)的數據。作為**數據科學家**,這使我們能夠前所未有地接觸到個人數據。這意味著我們可以建立用戶的行為檔案,並以某些方式影響決策,創造一種[自由選擇的幻覺](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice),同時可能引導用戶朝向我們偏好的結果。這也引發了關於數據隱私和用戶保護的更廣泛問題。
資料倫理現在是資料科學與工程的_必要防護措施_幫助我們減少數據驅動行動可能帶來的潛在危害和意外後果。[Gartner AI 技術成熟度曲線](https://www.gartner.com/smarterwithgartner/2-megatrends-dominate-the-gartner-hype-cycle-for-artificial-intelligence-2020/)將數字倫理、負責任的AI和AI治理列為推動AI_民主化_和_工業化_這兩大趨勢的關鍵驅動因素。
數據倫理現在是數據科學和工程的_必要防護措施_幫助我們減少數據驅動行動可能帶來的潛在危害和意外後果。[Gartner人工智慧技術成熟度曲線](https://www.gartner.com/smarterwithgartner/2-megatrends-dominate-the-gartner-hype-cycle-for-artificial-intelligence-2020/)指出數字倫理、負責任的人工智慧和人工智慧治理是推動人工智慧_民主化_和_工業化_等更大趨勢的關鍵驅動因素。
![Gartner 2020年的AI技術成熟度曲線](https://images-cdn.newscred.com/Zz1mOWJhNzlkNDA2ZTMxMWViYjRiOGFiM2IyMjQ1YmMwZQ==)
![Gartner 2020年人工智慧技術成熟度曲線](https://images-cdn.newscred.com/Zz1mOWJhNzlkNDA2ZTMxMWViYjRiOGFiM2IyMjQ1YmMwZQ==)
這節課中我們將探索資料倫理這個迷人的領域——從核心概念和挑戰到案例研究和應用AI概念如治理幫助在處理數據和AI的團隊和組織中建立倫理文化。
本課程中,我們將探索數據倫理的迷人領域——從核心概念和挑戰,到案例研究和應用人工智慧概念(如治理),幫助在處理數據和人工智慧的團隊和組織中建立倫理文化。
## [課前測驗](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/2) 🎯
@ -33,236 +33,236 @@ CO_OP_TRANSLATOR_METADATA:
讓我們先了解一些基本術語。
「倫理」一詞來自[希臘語 "ethikos"](https://en.wikipedia.org/wiki/Ethics)(及其根 "ethos"意為_品格或道德本質_。
"倫理"一詞源自[希臘語 "ethikos"](https://en.wikipedia.org/wiki/Ethics)(及其根 "ethos"意為_品格或道德本質_。
**倫理**是指在社會中規範我們行為的共同價值觀和道德原則。倫理並非基於法律,而是基於廣泛接受的「對與錯」的標準。然而,倫理考量可以影響企業治理舉措和政府法規,從而創造更多遵從的激勵措施。
**倫理**是指在社會中指導我們行為的共同價值觀和道德原則。倫理不是基於法律,而是基於廣泛接受的"對與錯"的規範。然而,倫理考量可以影響企業治理倡議和政府法規,從而創造更多遵守的激勵措施。
**資料倫理**是一個[新的倫理分支](https://royalsocietypublishing.org/doi/full/10.1098/rsta.2016.0360#sec-1)研究和評估與_數據、算法及相關實踐_相關的道德問題。在這裡**「數據」**側重於生成、記錄、管理、處理、傳播、共享和使用的行為,**「算法」**側重於AI、代理、機器學習和機器人**「實踐」**則側重於負責任的創新、編程、駭客行為和倫理守則等主題。
**數據倫理**是一個[新興的倫理分支](https://royalsocietypublishing.org/doi/full/10.1098/rsta.2016.0360#sec-1)研究和評估與_數據、算法及相關實踐_相關的道德問題。在這裡**"數據"**專注於生成、記錄、策劃、處理、傳播、共享和使用的行動,**"算法"**專注於人工智慧、代理、機器學習和機器人,**"實踐"**專注於負責任的創新、編程、駭客行為和倫理守則等主題。
**應用倫理**是[道德考量的實際應用](https://en.wikipedia.org/wiki/Applied_ethics)。它是積極調查_現實世界行動、產品和流程_中的倫理問題並採取糾正措施以確保這些行與我們定義的倫理價值保持一致的過程。
**應用倫理**是[道德考量的實際應用](https://en.wikipedia.org/wiki/Applied_ethics)。它是積極調查_現實世界行動、產品和流程_中的倫理問題並採取糾正措施以確保這些行與我們定義的倫理價值保持一致的過程。
**倫理文化**是關於[將應用倫理_操作化_](https://hbr.org/2019/05/how-to-design-an-ethical-organization)確保我們的倫理原則和實踐在整個組織中以一致且可擴展的方式被採用。成功的倫理文化會定義全組織的倫理原則,提供有意義的遵從激勵,並通過鼓勵和放大組織各層級的期望行為來強化倫理規範。
**倫理文化**是關於[_操作化_應用倫理](https://hbr.org/2019/05/how-to-design-an-ethical-organization),確保我們的倫理原則和實踐在整個組織中以一致且可擴展的方式被採用。成功的倫理文化定義了全組織範圍的倫理原則,提供有意義的遵守激勵措施,並通過鼓勵和放大每個層級的期望行為來加強倫理規範。
## 倫理概念
在本節中,我們將討論**共同價值觀**(原則)和**倫理挑戰**(問題)等資料倫理概念,並通過**案例研究**幫助您在現實世界的背景中理解這些概念。
在本節中,我們將討論**共同價值觀**(原則)和**倫理挑戰**(問題)等數據倫理概念,並探索**案例研究**幫助您在現實世界的背景中理解這些概念。
### 1. 倫理原則
每個資料倫理策略都始於定義_倫理原則_——描述可接受行為並指導我們在數據和AI項目中的合規行動的「共同價值觀」。您可以在個人或團隊層面定義這些原則。然而大多數大型組織會在公司層面定義這些原則並在所有團隊中一致執行通常以_倫理AI_使命聲明或框架的形式呈現
每個數據倫理策略都始於定義_倫理原則_——描述可接受行為並指導數據和人工智慧項目中合規行動的"共同價值觀"。您可以在個人或團隊層面定義這些原則。然而大多數大型組織會在企業層面定義一個_倫理人工智慧_使命聲明或框架並在所有團隊中一致執行
**範例:** 微軟的[負責任AI](https://www.microsoft.com/en-us/ai/responsible-ai)使命聲明寫道_「我們致力於推動以將人放在首位的倫理原則為基礎的AI發展」_並在以下框架中確定了6個倫理原則:
**範例:** 微軟的[負責任人工智慧](https://www.microsoft.com/en-us/ai/responsible-ai)使命聲明寫道_"我們致力於推動以倫理原則為基礎的人工智慧,將人放在首位"_並在以下框架中確定了六個倫理原則:
![微軟的負責任AI框架](https://docs.microsoft.com/en-gb/azure/cognitive-services/personalizer/media/ethics-and-responsible-use/ai-values-future-computed.png)
![微軟的負責任人工智慧](https://docs.microsoft.com/en-gb/azure/cognitive-services/personalizer/media/ethics-and-responsible-use/ai-values-future-computed.png)
讓我們簡要探討這些原則。_透明性_和_問責性_是其他原則的基,因此我們從這裡開始:
讓我們簡要探討這些原則。_透明性_和_問責性_是其他原則的基礎價值觀,因此我們從這裡開始:
* [**問責性**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6)使從業者對其數據和AI操作以及對這些倫理原則的遵守負責。
* [**透明性**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6)確保數據和AI行動對用戶是_可理解的_可解釋的解釋決策背後的原因和內容。
* [**公平性**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1%3aprimaryr6)——確保AI對_所有人_公平對待解決數據和系統中的任何系統性或隱性社會技術偏見。
* [**可靠性與安全性**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6)——確保AI行為與定義的價值觀_一致_最大限度地減少潛在危害或意外後果。
* [**問責性**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6)使實踐者對其數據和人工智慧操作以及遵守這些倫理原則負責。
* [**透明性**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6)確保數據和人工智慧行動對用戶是_可理解的_可解釋的解釋決策背後的內容和原因
* [**公平性**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1%3aprimaryr6)——專注於確保人工智慧公平對待_所有人_解決數據和系統中的系統性或隱性社會技術偏見。
* [**可靠性與安全性**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6)——確保人工智慧以_一致性_的方式行事減少潛在危害或意外後果。
* [**隱私與安全**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6)——關注數據來源的理解並為用戶提供_數據隱私及相關保護_。
* [**包容性**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6)——有意設計AI解決方案適應_廣泛的人類需求_和能力。
* [**包容性**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6)——專注於有意設計人工智慧解決方案,並使其適應_廣泛的人類需求_和能力。
> 🚨 想一想您的資料倫理使命聲明可能是什麼。探索其他組織的倫理AI框架——這裡有來自[IBM](https://www.ibm.com/cloud/learn/ai-ethics)、[Google](https://ai.google/principles)和[Facebook](https://ai.facebook.com/blog/facebooks-five-pillars-of-responsible-ai/)的範例。它們有哪些共同的價值觀這些原則如何與它們所處的AI產品或行業相關?
> 🚨 思考您的數據倫理使命聲明可能是什麼。探索其他組織的倫理人工智慧框架——以下是[IBM](https://www.ibm.com/cloud/learn/ai-ethics)、[Google](https://ai.google/principles)和[Facebook](https://ai.facebook.com/blog/facebooks-five-pillars-of-responsible-ai/)的範例。他們有哪些共同的價值觀?這些原則如何與他們所運營的人工智慧產品或行業相關?
### 2. 倫理挑戰
一旦我們定義了倫理原則,下一步就是評估我們的數據和AI行動是否與這些共同價值觀一致。考慮您的行動可以分為兩類_數據收集_和_算法設計_。
一旦我們定義了倫理原則,下一步就是評估我們的數據和人工智慧行動是否符合這些共同價值觀。思考您的行動可以分為兩類_數據收集_和_算法設計_。
在數據收集方面,行動可能涉及**個人數據**或可識別的個人信息PII這些信息可以識別特定的活人個體。這包括[多樣的非個人數據項目](https://ec.europa.eu/info/law/law-topic/data-protection/reform/what-personal-data_en)這些數據_集合起來_可以識別一個人。倫理挑戰可能涉及_數據隱私_、_數據所有權_以及相關主題如_知情同意_和_用戶的知識產權_。
在數據收集方面,行動可能涉及**個人數據**或可識別的個人信息PII這些信息可以識別活著的個人。這包括[多樣化的非個人數據項目](https://ec.europa.eu/info/law/law-topic/data-protection/reform/what-personal-data_en)這些數據_共同_識別一個人。倫理挑戰可能涉及_數據隱私_、_數據所有權_以及相關主題如_知情同意_和用戶的_知識產權權利_。
在算法設計方面,行動將涉及收集和管理**數據集**,然後使用它們來訓練和部署**數據模型**,以在現實世界的背景中預測結果或自動化決策。倫理挑戰可能來自_數據集偏見_、_數據質量_問題、_不公平性_和算法中的_誤導性_包括一些系統性問題。
在算法設計方面,行動將涉及收集和策劃**數據集**,然後使用它們來訓練和部署**數據模型**,以在現實世界的背景中預測結果或自動化決策。倫理挑戰可能源於_數據集偏見_、_數據質量_問題、_不公平性_和算法中的_誤導性_包括一些系統性問題。
在這兩種情況下,倫理挑戰突出了我們的行動可能與共同價值觀發生衝突的領域。為了檢測、減輕、最小化或消除這些問題,我們需要針對我們的行動提出道德上的「是/否」問題,然後根據需要採取糾正措施。讓我們看看一些倫理挑戰及其引發的道德問題:
在這兩種情況下,倫理挑戰突出了我們的行動可能與共同價值觀發生衝突的領域。為了檢測、減輕、最小化或消除這些問題,我們需要針對行動提出道德的"是/否"問題,然後根據需要採取糾正措施。讓我們看看一些倫理挑戰及其引發的道德問題:
#### 2.1 數據所有權
數據收集通常涉及可識別數據主體的個人數據。[數據所有權](https://permission.io/blog/data-ownership)關注與數據創建、處理和傳播相關的_控制權_和[用戶權利](https://permission.io/blog/data-ownership)。
數據收集通常涉及可識別數據主體的個人數據。[數據所有權](https://permission.io/blog/data-ownership)是關於與數據的創建、處理和傳播相關的_控制_和[_用戶權利_](https://permission.io/blog/data-ownership)。
需要提出的道德問題包括:
* 誰擁有數據?(用戶還是組織)
* 數據主體擁有哪些權利?(例如:訪問、刪除、可攜性)
* 組織擁有哪些權利?(例如:糾正惡意用戶評論)
* 誰擁有數據?(用戶或組織)
* 數據主體擁有哪些權利?(例如:訪問、刪除、可攜性)
* 組織擁有哪些權利?(例如:糾正惡意用戶評論)
#### 2.2 知情同意
[知情同意](https://legaldictionary.net/informed-consent/)指用戶在充分了解相關事實(包括目的、潛在風險和替代方案)的情況下同意某項行動(如數據收集)。
[知情同意](https://legaldictionary.net/informed-consent/)指用戶在充分了解相關事實(包括目的、潛在風險和替代方案)的情況下同意某項行動(如數據收集)。
需要探討的問題包括:
* 用戶(數據主體)是否同意數據的收集和使用?
* 用戶是否了解數據收集的目的?
* 用戶是否了解參與可能帶來的潛在風險?
* 用戶(數據主體)是否允許數據的捕獲和使用?
* 用戶是否理解捕獲數據的目的?
* 用戶是否理解參與可能帶來的潛在風險?
#### 2.3 知識產權
[知識產權](https://en.wikipedia.org/wiki/Intellectual_property)指由人類創造的無形產物可能對個人或企業具有_經濟價值_。
需要探討的問題包括:
* 收集的數據是否對用戶或企業具有經濟價值?
* **用戶**是否擁有這裡的知識產權?
* **組織**是否擁有這裡的知識產權?
* 如果這些權利存在,我們如何保護它們?
* 收集的數據是否對用戶或企業具有經濟價值?
* **用戶**是否擁有知識產權?
* **組織**是否擁有知識產權?
* 如果存在這些權利,我們如何保護它們?
#### 2.4 數據隱私
[數據隱私](https://www.northeastern.edu/graduate/blog/what-is-data-privacy/)或信息隱私指保護用戶隱私和身份,特別是與可識別個人信息相關的保護
[數據隱私](https://www.northeastern.edu/graduate/blog/what-is-data-privacy/)或信息隱私指保護用戶隱私和身份,特別是與可識別個人信息相關的部分
需要探討的問題包括:
* 用戶的(個人)數據是否安全,防止駭客攻擊和洩露
* 用戶的數據是否僅限於授權用戶和上下文訪問?
* 在數據共享或傳播時,用戶的匿名性是否得到保護?
* 用戶是否可以從匿名數據集中被重新識別?
* 用戶的(個人)數據是否防止駭客攻擊和洩漏
* 用戶的數據是否僅在授權的用戶和情境中可訪問?
* 用戶的匿名性是否在數據共享或傳播時得到保護?
* 用戶是否可以從匿名數據集中被去識別?
#### 2.5 被遺忘權
#### 2.5 被遺忘
[被遺忘權](https://en.wikipedia.org/wiki/Right_to_be_forgotten)或[刪除權](https://www.gdpreu.org/right-to-be-forgotten/)為用戶提供額外的個人數據保護。具體來說,它賦予用戶在特定情況下請求刪除或移除個人數據的權利,允許他們在網上獲得一個新的開始,而不會因過去的行為受到影響。
[被遺忘](https://en.wikipedia.org/wiki/Right_to_be_forgotten)或[刪除權](https://www.gdpreu.org/right-to-be-forgotten/)為用戶提供額外的個人數據保護。具體而言,它賦予用戶在特定情況下要求刪除或移除個人數據的權利,允許他們在網上重新開始,而不受過去行動的影響。
需要探討的問題包括:
* 系統是否允許數據主體請求刪除?
* 用戶撤回同意是否應觸發自動刪除?
* 數據是否在未經同意或非法手段收集?
* 我們是否符合政府對數據隱私的法規?
* 系統是否允許數據主體請求刪除?
* 用戶撤回同意是否應觸發自動刪除?
* 是否在未經同意或非法手段收集的數據
* 我們是否符合政府對數據隱私的法規?
#### 2.6 數據集偏見
數據集或[收集偏見](http://researcharticles.com/index.php/bias-in-data-collection-in-research/)指為算法開發選擇了一個_非代表性_的數據子集可能導致對不同群體的結果不公平。偏見類型包括選擇或抽樣偏見、志願者偏見和工具偏見。
數據集或[收集偏見](http://researcharticles.com/index.php/bias-in-data-collection-in-research/)指選擇_非代表性_的數據子集進行算法開發,可能導致對不同群體的結果不公平。偏見類型包括選擇或抽樣偏見、志願者偏見和工具偏見。
需要探討的問題包括:
* 我們是否招募了一個具有代表性數據主體集合
* 我們是否測試了收集或管理的數據集中的各種偏見?
* 我們是否可以減輕或消除發現的偏見?
* 我們是否招募了代表性數據主體?
* 我們是否測試了收集或策劃的數據集以檢測各種偏見?
* 我們是否能減輕或消除發現的偏見?
#### 2.7 數據質量
[數據質量](https://lakefs.io/data-quality-testing/)檢查用於開發算法的數據集的有效性,確保特徵和記錄符合我們AI目的所需的準確性和一致性要求。
[數據質量](https://lakefs.io/data-quality-testing/)檢查用於開發算法的策劃數據集的有效性,確保特徵和記錄符合人工智慧目的所需的準確性和一致性要求。
需要探討的問題包括:
* 我們是否捕獲了適合我們用例的有效_特徵_
* 數據是否在不同數據來源中_一致_地捕獲
* 數據集是否_完整_涵蓋多樣條件或場景?
* 捕獲的信息是否_準確_地反映了現實
* 我們是否捕獲了適合我們用例的有效_特徵_
* 數據是否在不同數據來源中_一致_地捕獲
* 數據集是否_完整_涵蓋不同條件或場景?
* 捕獲的信息是否_準確_地反映了現實
#### 2.8 算法公平性
[演算法公平性](https://towardsdatascience.com/what-is-algorithm-fairness-3182e161cf9f) 是檢查演算法設計是否系統性地對特定數據主體的子群體造成歧視,進而導致在資源分配_allocation_如資源被拒絕或扣留和服務質_quality of service_如 AI 對某些子群體的準確性不如其他群體)方面的[潛在傷害](https://docs.microsoft.com/en-us/azure/machine-learning/concept-fairness-ml)。
[演算法公平性](https://towardsdatascience.com/what-is-algorithm-fairness-3182e161cf9f) 是檢查演算法設計是否系統性地對特定數據主體的子群體造成歧視導致在資源分配_allocation_如資源被拒絕或扣留)和服務_quality of service_如 AI 對某些子群體的準確性不如其他群體)方面的[潛在傷害](https://docs.microsoft.com/en-us/azure/machine-learning/concept-fairness-ml)。
需要探討的問題包括:
* 我們是否評估了模型在不同子群體和條件下的準確性?
* 我們是否仔細檢查了系統可能帶來的傷害(例如,刻板印象)?
* 我們是否仔細檢查了系統可能造成的傷害(例如刻板印象)?
* 我們是否可以修正數據或重新訓練模型以減輕已識別的傷害?
探索像 [AI 公平性檢查清單](https://query.prod.cms.rt.microsoft.com/cms/api/am/binary/RE4t6dA) 這樣的資源以了解更多。
#### 2.9 錯誤呈現
[數據錯誤呈現](https://www.sciencedirect.com/topics/computer-science/misrepresentation) 是指我們是否以欺騙的方式傳達來自誠實報告數據的洞,以支持某種期望的敘述。
[數據錯誤呈現](https://www.sciencedirect.com/topics/computer-science/misrepresentation) 是指我們是否以欺騙的方式傳達來自誠實報告數據的洞,以支持某種期望的敘述。
需要探討的問題包括:
* 我們是否報告了不完整或不準確的數據?
* 我們是否以誤導結論的方式可視化數據?
* 我們是否使用選擇性的統計技術來操結果?
* 是否存在可能提供不同結論的替代解釋?
* 我們是否以誤導結論的方式可視化數據?
* 我們是否使用選擇性的統計技術來操結果?
* 是否存在其他可能提供不同結論的解釋?
#### 2.10 自由選擇
[自由選擇的假象](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice) 發生在系統的「選擇架構」使用決策演算法來引導人們選擇某種偏好的結果,同時表面上給予他們選擇和控制的權利。這些[黑暗模式](https://www.darkpatterns.org/)可能對用戶造成社會和經濟上的傷害。由於用戶的決策會影響行為檔案,這些行動可能會驅動未來的選擇,進一步放大或延續這些傷害的影響。
[自由選擇的假象](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice) 是指系統的「選擇架構」使用決策演算法來引導人們選擇偏好的結果,同時看似給予他們選擇和控制的自由。這些[黑暗模式](https://www.darkpatterns.org/)可能對用戶造成社會和經濟上的傷害。由於用戶的決策會影響行為檔案,這些行動可能驅動未來的選擇,進一步放大或延伸這些傷害的影響。
需要探討的問題包括:
* 用戶是否理解做出該選擇的影響?
* 用戶是否了解(替代)選擇及其各自的優缺點?
* 用戶是否可以在之後撤銷自動化或受影響的選擇?
* 用戶是否能夠在事後逆轉自動化或受影響的選擇?
### 3. 案例研究
將這些倫理挑戰放在現實世界的背景中,幫助我們了解當忽視這些倫理問題時,對個人和社會可能造成的潛在傷害和後果。
為了將這些倫理挑戰放在真實世界的背景中,研究案例有助於了解當忽視這些倫理問題時,可能對個人和社會造成的傷害和後果。
以下是一些例子:
| 倫理挑戰 | 案例研究 |
|--- |--- |
| **知情同意** | 1972 - [塔斯基吉梅毒研究](https://en.wikipedia.org/wiki/Tuskegee_Syphilis_Study) - 參與研究的非裔美國男性被承諾提供免費醫療服務,但研究人員欺騙他們,未告知診斷或治療的可用性。許多受試者因此死亡,伴侶或子女也受到影響;該研究持續了 40 年。 |
| **數據隱私** | 2007 - [Netflix 數據獎](https://www.wired.com/2007/12/why-anonymous-data-sometimes-isnt/) 向研究人員提供了 _10M 來自 50K 客戶的匿名電影評分_以改進推薦演算法。然而,研究人員能夠將匿名數據與外部數據集(如 IMDb 評論)中的個人身份數據相關聯,實際上「去匿名化」了一些 Netflix 訂閱者。|
| **收集偏差** | 2013 - 波士頓市[開發了 Street Bump](https://www.boston.gov/transportation/street-bump),一款讓市民報告坑洞的應用程式,幫助城市獲取更好的道路數據以解決問題。然而,[低收入群體的人們較少擁有汽車和手機](https://hbr.org/2013/04/the-hidden-biases-in-big-data),使得他們的道路問題在該應用程式中不可見。開發者與學者合作解決公平性問題,如數位鴻溝和公平訪問。 |
| **演算法公平性** | 2018 - MIT [Gender Shades 研究](http://gendershades.org/overview.html) 評估了性別分類 AI 產品的準確性,揭示了對女性和有色人種準確性不足的問題。一個 [2019 年 Apple Card](https://www.wired.com/story/the-apple-card-didnt-see-genderand-thats-the-problem/) 似乎給女性提供的信用額度低於男性。這兩個例子都說明了演算法偏差導致的社會經濟傷害問題。|
| **數據錯誤呈現** | 2020 - [喬治亞州公共衛生部發布COVID-19 圖表](https://www.vox.com/covid-19-coronavirus-us-response-trump/2020/5/18/21262265/georgia-covid-19-cases-declining-reopening) 似乎通過非時間順序的 x 軸排序誤導公民關於確診病例趨勢的理解。這說明了通過可視化技巧進行的錯誤呈現。 |
| **自由選擇的假象** | 2020 年 - 學習應用程式 [ABCmouse 支付 1000 萬美元解決 FTC 投訴](https://www.washingtonpost.com/business/2020/09/04/abcmouse-10-million-ftc-settlement/),家長被困於無法取消的訂閱中。這說明了選擇架構中的黑暗模式,導致用戶被引導做出可能有害的選擇。 |
| **數據隱私與用戶權利** | 2021 年 - Facebook [數據洩露](https://www.npr.org/2021/04/09/986005820/after-data-breach-exposes-530-million-facebook-says-it-will-not-notify-users) 暴露了 5.3 億用戶的數據,導致向 FTC 支付 50 億美元的和解金。然而,它拒絕通知用戶洩露事件,違反了用戶關於數據透明性和訪問的權利。 |
| **知情同意** | 1972 - [塔斯基吉梅毒研究](https://en.wikipedia.org/wiki/Tuskegee_Syphilis_Study) - 參與研究的非裔美國男性被承諾提供免費醫療服務,但研究人員欺騙了受試者未告知他們的診斷或治療的可用性。許多受試者死亡伴侶或子女受到影響研究持續了40年。 |
| **數據隱私** | 2007 - [Netflix數據獎](https://www.wired.com/2007/12/why-anonymous-data-sometimes-isnt/) 向研究人員提供了_50K客戶的10M匿名電影評分_以改進推薦演算法。然而研究人員能夠將匿名數據與外部數據集如IMDb評論中的個人身份數據相關聯實際上「去匿名化」了一些Netflix訂閱者。|
| **收集偏差** | 2013 - 波士頓市[開發了Street Bump](https://www.boston.gov/transportation/street-bump),一款讓市民報告路面坑洞的應用程式,幫助城市獲得更好的道路數據以發現和修復問題。然而,[低收入群體的人們較少擁有汽車和手機](https://hbr.org/2013/04/the-hidden-biases-in-big-data),使得他們的道路問題在此應用程式中不可見。開發者與學者合作解決_公平性和數字鴻溝_問題。 |
| **演算法公平性** | 2018 - MIT [Gender Shades研究](http://gendershades.org/overview.html) 評估了性別分類AI產品的準確性揭示了對女性和有色人種準確性上的差距。一個[2019 Apple Card](https://www.wired.com/story/the-apple-card-didnt-see-genderand-thats-the-problem/) 似乎給女性的信用額度低於男性。這兩者都說明了演算法偏差導致的社會經濟傷害問題。|
| **數據錯誤呈現** | 2020 - [喬治亞州公共衛生部發布COVID-19圖表](https://www.vox.com/covid-19-coronavirus-us-response-trump/2020/5/18/21262265/georgia-covid-19-cases-declining-reopening)圖表似乎通過非時間順序的x軸排列誤導公民關於確診病例趨勢的理解。這說明了通過可視化技巧進行的錯誤呈現。 |
| **自由選擇的假象** | 2020 - 學習應用程式[ABCmouse支付了$10M以解決FTC投訴](https://www.washingtonpost.com/business/2020/09/04/abcmouse-10-million-ftc-settlement/),家長被困於無法取消的訂閱付款中。這說明了選擇架構中的黑暗模式,導致用戶被引導做出可能有害的選擇。 |
| **數據隱私與用戶權利** | 2021 - Facebook [數據洩漏](https://www.npr.org/2021/04/09/986005820/after-data-breach-exposes-530-million-facebook-says-it-will-not-notify-users) 暴露了530M用戶的數據導致向FTC支付了$5B的和解金。然而它拒絕通知用戶洩漏事件,違反了用戶關於數據透明性和訪問的權利。 |
想探索更多案例研究?查看以下資源:
* [Ethics Unwrapped](https://ethicsunwrapped.utexas.edu/case-studies) - 涵蓋多個行業的倫理困境。
* [數據科學倫理課程](https://www.coursera.org/learn/data-science-ethics#syllabus) - 探討標誌性案例研究。
* [問題出在哪裡](https://deon.drivendata.org/examples/) - Deon 清單中的示例。
* [問題出在哪裡](https://deon.drivendata.org/examples/) - Deon清單中的案例示例。
> 🚨 想想你見過的案例研究——你是否曾經歷過或受到類似倫理挑戰的影響?你能想到至少一個其他案例來說明我們在本節中討論的倫理挑戰嗎
> 🚨 思考你所見過的案例研究——你是否曾經經歷過或受到類似倫理挑戰的影響?你能否想到至少一個其他案例研究來說明我們在本節中討論的倫理挑戰之一
## 應用倫理
我們已經討論了倫理概念、挑戰以及現實世界中的案例研究。但我們如何開始在項目中_應用_倫理原則和實踐我們又如何_實現_這些實踐以改進治理讓我們來探索一些現實世界的解決方案:
我們已經討論了倫理概念、挑戰以及真實世界背景中的案例研究。但我們如何開始在項目中_應用_倫理原則和實踐以及如何_實現_這些實踐以改善治理讓我們探索一些真實世界的解決方案:
### 1. 專業守則
專業守則為組織提供了一種選擇,通過「激勵」成員支持其倫理原則和使命聲明。守則是專業行為的_道德指導方針_幫助員工或成員做出符合組織原則的決策。它的效力取決於成員的自願遵守然而許多組織提供額外的獎勵和懲罰來激勵成員遵守。
專業守則為組織提供了一種選擇,用於「激勵」成員支持其倫理原則和使命聲明。守則是專業行為的_道德指南_幫助員工或成員做出符合組織原則的決策。它的效果取決於成員的自願遵守然而許多組織提供額外的獎勵和懲罰以激勵成員遵守。
示例包括:
* [Oxford Munich](http://www.code-of-ethics.org/code-of-conduct/) 倫理守則
* [數據科學協會](http://datascienceassn.org/code-of-conduct.html) 行為守則2013 創建
* [ACM 倫理與專業行為守則](https://www.acm.org/code-of-ethics)(自 1993 年起)
* [數據科學協會](http://datascienceassn.org/code-of-conduct.html) 行為守則(創建於2013年
* [ACM倫理守則與專業行為守則](https://www.acm.org/code-of-ethics)自1993年起
> 🚨 你是否屬於某個專業工程或數據科學組織?探索他們的網站,看看是否定義了專業倫理守則。這些守則說明了哪些倫理原則?他們如何「激勵」成員遵守守則?
### 2. 倫理清單
### 2. 倫理檢查清單
雖然專業守則定義了從業者所需的_倫理行為_但它在執行方面[存在已知的局限性](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md),特別是在大規模項目中。因此,許多數據科學專家[提倡使用清單](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md),這些清單可以將原則與實踐**聯繫起來**,以更具決定性和可操作的方式
雖然專業守則定義了從業者所需的_倫理行為_但它在執行方面[存在已知的局限性](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md),特別是在大項目中。因此,許多數據科學專家[提倡使用檢查清單](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md),這些清單可以**將原則與實踐**更具決定性地聯繫起來
清單將問題轉化為「是/否」任務,可以操作化,並作為標準產品發布工作流程的一部分進行跟蹤。
檢查清單將問題轉化為「是/否」任務,可以操作化,並允許它們作為標準產品發布工作流程的一部分進行跟蹤。
示例包括:
* [Deon](https://deon.drivendata.org/) - 一個通用數據倫理清單,由[行業建議](https://deon.drivendata.org/#checklist-citations)創建,並提供命令行工具以便於整合
* [隱私審核清單](https://cyber.harvard.edu/ecommerce/privacyaudit.html) - 從法律和社會曝光的角度提供信息處理實踐的一般指導。
* [AI 公平性清單](https://www.microsoft.com/en-us/research/project/ai-fairness-checklist/) - 由 AI 從業者創建,用於支持公平性檢查的採用和整合到 AI 開發週期中。
* [數據與 AI 倫理的 22 個問題](https://medium.com/the-organization/22-questions-for-ethics-in-data-and-ai-efb68fd19429) - 更開放的框架,結構化用於設計、實施和組織背景下倫理問題的初步探索。
* [Deon](https://deon.drivendata.org/) - 一個通用數據倫理檢查清單,由[行業建議](https://deon.drivendata.org/#checklist-citations)創建,並提供命令行工具以便於集成
* [隱私審核檢查清單](https://cyber.harvard.edu/ecommerce/privacyaudit.html) - 從法律和社會暴露的角度提供信息處理實踐的一般指導。
* [AI公平性檢查清單](https://www.microsoft.com/en-us/research/project/ai-fairness-checklist/) - 由AI從業者創建用於支持公平性檢查的採用和集成到AI開發週期中。
* [數據與AI倫理的22個問題](https://medium.com/the-organization/22-questions-for-ethics-in-data-and-ai-efb68fd19429) - 更開放的框架,結構化用於設計、實施和組織背景中的倫理問題初步探索。
### 3. 倫理法規
倫理是關於定義共同價值觀並_自願_做正確的事情。**合規**是指在有法律規定的情況下_遵守法律_。**治理**則廣泛涵蓋了組織運營以執行倫理原則並遵守既定法律的所有方式。
倫理是關於定義共享價值並自願做正確的事情。**合規**是指在法律定義的情況下_遵守法律_。**治理**則涵蓋了組織運作以執行倫理原則並遵守既定法律的所有方式。
今,治理在組織內有兩種形式。首先,它是關於定義**倫理 AI** 原則並建立實踐,以在組織內的所有 AI 相關項目中實現採用。其次,它是關於遵守其運營地區的所有政府規定的**數據保護法規**
,治理在組織內有兩種形式。首先,它是關於定義**倫理AI**原則並建立實踐以操作化採用涵蓋組織內所有與AI相關的項目。其次它是關於遵守所有政府規定的**數據保護法規**,適用於其運營的地區
數據保護和隱私法規的示例:
* `1974`[美國隱私法案](https://www.justice.gov/opcl/privacy-act-1974) - 規範_聯邦政府_對個人信息的收集、使用和披露。
* `1996`[美國健康保險攜帶與責任法案 (HIPAA)](https://www.cdc.gov/phlp/publications/topic/hipaa.html) - 保護個人健康數據。
* `1998`[美國兒童在線隱私保護法案 (COPPA)](https://www.ftc.gov/enforcement/rules/rulemaking-regulatory-reform-proceedings/childrens-online-privacy-protection-rule) - 保護 13 歲以下兒童的數據隱私。
* `2018`[通用數據保護條例 (GDPR)](https://gdpr-info.eu/) - 提供用戶權利、數據保護和隱私。
* `2018`[加州消費者隱私法案 (CCPA)](https://www.oag.ca.gov/privacy/ccpa) - 賦予消費者更多對個人數據的_權利_。
* `1974`[美國隱私法案](https://www.justice.gov/opcl/privacy-act-1974) - 規範_聯邦政府_收集、使用和披露個人信息
* `1996`[美國健康保險攜帶與責任法案HIPAA](https://www.cdc.gov/phlp/publications/topic/hipaa.html) - 保護個人健康數據。
* `1998`[美國兒童在線隱私保護法案COPPA](https://www.ftc.gov/enforcement/rules/rulemaking-regulatory-reform-proceedings/childrens-online-privacy-protection-rule) - 保護13歲以下兒童的數據隱私。
* `2018`[通用數據保護法規GDPR](https://gdpr-info.eu/) - 提供用戶權利、數據保護和隱私。
* `2018`[加州消費者隱私法案CCPA](https://www.oag.ca.gov/privacy/ccpa) - 賦予消費者更多關於個人數據的_權利_。
* `2021`,中國[個人信息保護法](https://www.reuters.com/world/china/china-passes-new-personal-data-privacy-law-take-effect-nov-1-2021-08-20/) 剛剛通過,創造了全球最強的在線數據隱私法規之一。
> 🚨 歐盟定義的 GDPR通用數據保護條例仍然是當今最具影響力的數據隱私法規之一。你知道它還定義了[8 項用戶權利](https://www.freeprivacypolicy.com/blog/8-user-rights-gdpr)保護公民的數字隱私和個人數據嗎?了解這些權利是什麼以及它們為什麼重要。
> 🚨 歐盟定義的GDPR通用數據保護法規仍然是今天最具影響力的數據隱私法規之一。你知道它還定義了[8項用戶權利](https://www.freeprivacypolicy.com/blog/8-user-rights-gdpr)保護公民的數字隱私和個人數據嗎?了解這些權利是什麼以及它們為什麼重要。
### 4. 倫理文化
需要注意的是_合規_做到足以滿足「法律條文」)與解決[系統性問題](https://www.coursera.org/learn/data-science-ethics/home/week/4)(如僵化、信息不對稱和分配不公平)之間仍然存在無形的差距,這些問題可能加速 AI 的武器化。
注意_合規_僅僅滿足「法律條文」的要求)與解決[系統性問題](https://www.coursera.org/learn/data-science-ethics/home/week/4)如僵化、信息不對稱和分配不公平之間仍然存在無形的差距這些問題可能加速AI的武器化。
後者需要[協作方式來定義倫理文化](https://towardsdatascience.com/why-ai-ethics-requires-a-culture-driven-approach-26f451afa29f)以在行業內建立情感聯繫和一致的共同價值觀。這需要在組織內建立更多[正式化的數據倫理文化](https://www.codeforamerica.org/news/formalizing-an-ethical-data-culture/)——允許_任何人_ [拉動安燈繩](https://en.wikipedia.org/wiki/Andon_(manufacturing))在過程早期提出倫理問題並將_倫理評估_例如在招聘中)作為 AI 項目團隊組建的核心標準。
後者需要[協作方式來定義倫理文化](https://towardsdatascience.com/why-ai-ethics-requires-a-culture-driven-approach-26f451afa29f)在行業內建立情感聯繫和一致的共享價值。這需要在組織內[正式化數據倫理文化](https://www.codeforamerica.org/news/formalizing-an-ethical-data-culture/)——允許_任何人_ [拉動安燈繩](https://en.wikipedia.org/wiki/Andon_(manufacturing))在過程早期提出倫理問題並將_倫理評估_例如在招聘中作為AI項目團隊組建的核心標準。
---
## [課後測驗](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/3) 🎯
## 回顧與自學
## [課後測驗](https://ff-quizzes.netlify.app/en/ds/) 🎯
## 回顧與自學
課程和書籍有助於理解核心倫理概念和挑戰,而案例研究和工具則有助於在現實世界中應用倫理實踐。以下是一些入門資源:
課程和書籍有助於理解核心倫理概念和挑戰,而案例研究和工具有助於在真實世界背景中應用倫理實踐。以下是一些入門資源。
* [機器學習初學者](https://github.com/microsoft/ML-For-Beginners/blob/main/1-Introduction/3-fairness/README.md) - 來自 Microsoft 的公平性課程。
* [負責任 AI 的原則](https://docs.microsoft.com/en-us/learn/modules/responsible-ai-principles/) - Microsoft Learn 提供的免費學習路徑。
* [初學者的機器學習](https://github.com/microsoft/ML-For-Beginners/blob/main/1-Introduction/3-fairness/README.md) - 來自Microsoft的公平性課程。
* [負責任人工智慧的原則](https://docs.microsoft.com/en-us/learn/modules/responsible-ai-principles/) - Microsoft Learn 提供的免費學習路徑。
* [倫理與數據科學](https://resources.oreilly.com/examples/0636920203964) - O'Reilly 電子書 (M. Loukides, H. Mason 等人著)
* [數據科學倫理](https://www.coursera.org/learn/data-science-ethics#syllabus) - 密西根大學提供的線上課程。
* [倫理解](https://ethicsunwrapped.utexas.edu/case-studies) - 德州大學的案例研究。
* [倫理解](https://ethicsunwrapped.utexas.edu/case-studies) - 德州大學的案例研究。
# 作業
[撰寫一篇數據倫理案例研究](assignment.md)
[撰寫數據倫理案例研究](assignment.md)
---
**免責聲明**
本文件已使用 AI 翻譯服務 [Co-op Translator](https://github.com/Azure/co-op-translator) 進行翻譯。我們致力於提供準確的翻譯,但請注意,自動翻譯可能包含錯誤或不準確之處。應以原始語言的文件作為權威來源。對於關鍵資訊,建議尋求專業人工翻譯。我們對因使用此翻譯而引起的任何誤解或錯誤解讀概不負責
本文件已使用 AI 翻譯服務 [Co-op Translator](https://github.com/Azure/co-op-translator) 進行翻譯。雖然我們致力於提供準確的翻譯,但請注意,自動翻譯可能包含錯誤或不準確之處。原始文件的母語版本應被視為權威來源。對於關鍵資訊,建議使用專業人工翻譯。我們對因使用此翻譯而引起的任何誤解或誤釋不承擔責任

@ -1,241 +1,258 @@
<!--
CO_OP_TRANSLATOR_METADATA:
{
"original_hash": "8796f41f566a0a8ebb72863a83d558ed",
"translation_date": "2025-08-27T17:04:33+00:00",
"original_hash": "3a34157cc63516eba97c89a0b2f8c3e6",
"translation_date": "2025-09-03T21:10:11+00:00",
"source_file": "1-Introduction/02-ethics/README.md",
"language_code": "mr"
}
-->
# डेटा नीतिशास्त्राची ओळख
# डेटा नैतिकतेची ओळख
|![ Sketchnote by [(@sketchthedocs)](https://sketchthedocs.dev) ](../../sketchnotes/02-Ethics.png)|
|:---:|
| डेटा सायन्स नीतिशास्त्र - _[@nitya](https://twitter.com/nitya) यांचे स्केच_ |
| डेटा सायन्स नैतिकता - _Sketchnote by [@nitya](https://twitter.com/nitya)_ |
---
आपण सर्वजण डेटा-आधारित जगात राहणारे डेटा नागरिक आहोत.
आपण सर्वजण डेटा-आधारित जगात डेटा नागरिक म्हणून राहतो.
मार्केट ट्रेंड्स सांगतात की 2022 पर्यंत, प्रत्येक 3 मोठ्या संस्थांपैकी 1 संस्था आपला डेटा ऑनलाइन [Marketplaces आणि Exchanges](https://www.gartner.com/smarterwithgartner/gartner-top-10-trends-in-data-and-analytics-for-2020/) द्वारे खरेदी आणि विक्री करेल. **अ‍ॅप डेव्हलपर्स** म्हणून, डेटा-आधारित अंतर्दृष्टी आणि अल्गोरिदम-आधारित ऑटोमेशन आपल्या दैनंदिन वापरकर्ता अनुभवांमध्ये समाविष्ट करणे सोपे आणि स्वस्त होईल. परंतु जेव्हा AI सर्वव्यापी होतो, तेव्हा आपल्याला अशा अल्गोरिदमच्या [weaponization](https://www.youtube.com/watch?v=TQHs8SA1qpk) मुळे होणाऱ्या संभाव्य हानींचेही आकलन करणे आवश्यक आहे.
बाजारातील ट्रेंड्स सांगतात की 2022 पर्यंत, प्रत्येक तीन मोठ्या संस्थांपैकी एक आपला डेटा ऑनलाइन [Marketplaces and Exchanges](https://www.gartner.com/smarterwithgartner/gartner-top-10-trends-in-data-and-analytics-for-2020/) च्या माध्यमातून खरेदी आणि विक्री करेल. **अ‍ॅप डेव्हलपर्स** म्हणून, आपल्याला डेटा-आधारित अंतर्दृष्टी आणि अल्गोरिदम-आधारित ऑटोमेशन आपल्या दैनंदिन वापरकर्ता अनुभवांमध्ये समाविष्ट करणे सोपे आणि स्वस्त होईल. परंतु जेव्हा AI सर्वत्र पसरते, तेव्हा आपल्याला अशा अल्गोरिदमच्या [weaponization](https://www.youtube.com/watch?v=TQHs8SA1qpk) मुळे होणाऱ्या संभाव्य हानींचा मोठ्या प्रमाणावर विचार करावा लागेल.
ट्रेंड्स असेही सूचित करतात की 2025 पर्यंत आपण [180 zettabytes](https://www.statista.com/statistics/871513/worldwide-data-created/) पेक्षा जास्त डेटा तयार करू आणि वापरू. **डेटा सायंटिस्ट्स** म्हणून, यामुळे आपल्याला वैयक्तिक डेटावर अभूतपूर्व प्रवेश मिळतो. याचा अर्थ असा की आपण वापरकर्त्यांचे वर्तनात्मक प्रोफाइल तयार करू शकतो आणि निर्णय घेण्यावर प्रभाव टाकू शकतो, ज्यामुळे [स्वतंत्र निवडीचा आभास](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice) निर्माण होतो, परंतु वापरकर्त्यांना आपल्या पसंतीच्या परिणामांकडे ढकलले जाऊ शकते. यामुळे डेटा गोपनीयता आणि वापरकर्ता संरक्षण यासारख्या व्यापक प्रश्नांनाही वाचा फोडली जाते.
ट्रेंड्स असेही सूचित करतात की 2025 पर्यंत आपण [180 zettabytes](https://www.statista.com/statistics/871513/worldwide-data-created/) डेटा तयार आणि वापर करू. **डेटा सायंटिस्ट्स** म्हणून, यामुळे आपल्याला वैयक्तिक डेटावर अभूतपूर्व स्तरावर प्रवेश मिळतो. याचा अर्थ असा की आपण वापरकर्त्यांचे वर्तनात्मक प्रोफाइल तयार करू शकतो आणि निर्णय घेण्यावर प्रभाव टाकू शकतो ज्यामुळे [मुक्त निवडीचा भ्रम](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice) निर्माण होतो, तर वापरकर्त्यांना आपल्याला हवे असलेले परिणाम मिळविण्यासाठी प्रेरित करू शकतो. यामुळे डेटा गोपनीयता आणि वापरकर्त्यांच्या संरक्षणावर व्यापक प्रश्न निर्माण होतात.
डेटा नीतिशास्त्र आता डेटा सायन्स आणि अभियांत्रिकीसाठी _आवश्यक मार्गदर्शक_ बनल आहे, ज्यामुळे आपल्या डेटा-आधारित कृतींमुळे होणाऱ्या संभाव्य हानी आणि अनपेक्षित परिणाम कमी होतात. [Gartner Hype Cycle for AI](https://www.gartner.com/smarterwithgartner/2-megatrends-dominate-the-gartner-hype-cycle-for-artificial-intelligence-2020/) डिजिटल नीतिशास्त्र, जबाबदार AI, आणि AI गव्हर्नन्समधील संबंधित ट्रेंड्स ओळखतो, जे AI च्या _लोकशाहीकरण_ आणि _औद्योगिकीकरण_ यासारख्या मोठ्या प्रवाहांना चालना देतात.
डेटा नैतिकता आता डेटा सायन्स आणि अभियांत्रिकीसाठी _आवश्यक मार्गदर्शक_ बनल आहे, ज्यामुळे आपल्याला आपल्या डेटा-आधारित कृतींमुळे होणाऱ्या संभाव्य हानी आणि अनपेक्षित परिणाम कमी करण्यास मदत होते. [Gartner Hype Cycle for AI](https://www.gartner.com/smarterwithgartner/2-megatrends-dominate-the-gartner-hype-cycle-for-artificial-intelligence-2020/) डिजिटल नैतिकता, जबाबदार AI, आणि AI गव्हर्नन्समधील संबंधित ट्रेंड्स ओळखतो, जे AI च्या _लोकशाहीकरण_ आणि _औद्योगिकीकरण_ यासारख्या मोठ्या प्रवृत्तींना चालना देतात.
![Gartner's Hype Cycle for AI - 2020](https://images-cdn.newscred.com/Zz1mOWJhNzlkNDA2ZTMxMWViYjRiOGFiM2IyMjQ1YmMwZQ==)
या धड्यात, आपण डेटा नीतिशास्त्राच्या आकर्षक क्षेत्राचा अभ्यास करू - मूलभूत संकल्पना आणि आव्हानांपासून ते केस स्टडीज आणि गव्हर्नन्ससारख्या लागू AI संकल्पनांपर्यंत - ज्यामुळे डेटा आणि AI सह काम करणाऱ्या संघ आणि संस्थांमध्ये नीतिशास्त्र संस्कृती प्रस्थापित होण्यास मदत होते.
या धड्यात, आपण डेटा नैतिकतेच्या आकर्षक क्षेत्राचा अभ्यास करू - मूलभूत संकल्पना आणि आव्हाने, केस स्टडीज आणि गव्हर्नन्ससारख्या लागू केलेल्या AI संकल्पनांपर्यंत - ज्यामुळे डेटा आणि AI सह काम करणाऱ्या संघ आणि संस्थांमध्ये नैतिकतेची संस्कृती निर्माण होण्यास मदत होते.
## [पूर्व-व्याख्यान क्विझ](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/2) 🎯
## [पूर्व-व्याख्यान प्रश्नमंजुषा](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/2) 🎯
## मूलभूत परिभाष
## मूलभूत संज्ञ
चला, मूलभूत परिभाषा समजून घेऊन सुरुवात करूया.
चला मूलभूत शब्दसंग्रह समजून घेण्यापासून सुरुवात करूया.
"नीतिशास्त्र" हा शब्द [ग्रीक शब्द "ethikos"](https://en.wikipedia.org/wiki/Ethics) (आणि त्याचा मूळ "ethos") पासून आला आहे, ज्याचा अर्थ _स्वभाव किंवा नैतिक स्वरूप_ असा होतो.
"नैतिकता" हा शब्द [ग्रीक शब्द "ethikos"](https://en.wikipedia.org/wiki/Ethics) (आणि त्याचा मूळ "ethos") पासून आला आहे, ज्याचा अर्थ _स्वभाव किंवा नैतिक स्वरूप_ असा आहे.
**नीतिशास्त्र** म्हणजे समाजातील आपल्या वर्तनावर नियंत्रण ठेवणाऱ्या सामायिक मूल्ये आणि नैतिक तत्त्वे. नीतिशास्त्र कायद्यांवर आधारित नसून "योग्य विरुद्ध अयोग्य" याबद्दलच्या व्यापकपणे स्वीकारल्या गेलेल्या मानकांवर आधारित आहे. तथापि, नैतिक विचार कॉर्पोरेट गव्हर्नन्स उपक्रमांवर आणि अनुपालनासाठी अधिक प्रोत्साहन निर्माण करणाऱ्या सरकारी नियमांवर प्रभाव टाकू शकतात.
**नैतिकता** म्हणजे समाजात आपल्या वर्तनाचे नियमन करणाऱ्या सामायिक मूल्ये आणि नैतिक तत्त्वे. नैतिकता कायद्यांवर आधारित नसून "योग्य विरुद्ध अयोग्य" याबद्दलच्या व्यापकपणे स्वीकारलेल्या मानदंडांवर आधारित असते. तथापि, नैतिक विचार कॉर्पोरेट गव्हर्नन्स उपक्रम आणि सरकारी नियमांवर प्रभाव टाकू शकतात, जे अनुपालनासाठी अधिक प्रोत्साहन निर्माण करतात.
**डेटा नीतिशास्त्र** हे एक [नवीन नीतिशास्त्र शाखा](https://royalsocietypublishing.org/doi/full/10.1098/rsta.2016.0360#sec-1) आहे, जे "_डेटा, अल्गोरिदम आणि संबंधित पद्धती_" यांच्याशी संबंधित नैतिक समस्यांचा अभ्यास आणि मूल्यांकन करते. येथे, **"डेटा"** म्हणजे निर्मिती, नोंद, व्यवस्थापन, प्रक्रिया, प्रसार, सामायिकरण आणि वापराशी संबंधित क्रिया, **"अल्गोरिदम"** म्हणजे AI, एजंट्स, मशीन लर्निंग आणि रोबोट्स, आणि **"पद्धती"** म्हणजे जबाबदार नवकल्पना, प्रोग्रामिंग, हॅकिंग आणि नीतिशास्त्र कोड्स यासारख्या विषयांवर लक्ष केंद्रित करते.
**डेटा नैतिकता** ही नैतिकतेची [नवीन शाखा](https://royalsocietypublishing.org/doi/full/10.1098/rsta.2016.0360#sec-1) आहे जी "_डेटा, अल्गोरिदम आणि संबंधित पद्धती_" यांच्याशी संबंधित नैतिक समस्यांचा अभ्यास आणि मूल्यांकन करते. येथे, **"डेटा"** निर्मिती, नोंदणी, व्यवस्थापन, प्रक्रिया, प्रसार, सामायिकरण आणि वापराशी संबंधित क्रियांवर लक्ष केंद्रित करते, **"अल्गोरिदम"** AI, एजंट्स, मशीन लर्निंग आणि रोबोट्सवर लक्ष केंद्रित करते, आणि **"पद्धती"** जबाबदार नवकल्पना, प्रोग्रामिंग, हॅकिंग आणि नैतिकता कोड्स यासारख्या विषयांवर लक्ष केंद्रित करते.
**लागू नीतिशास्त्र** म्हणजे [नैतिक विचारांचा व्यावहारिक उपयोग](https://en.wikipedia.org/wiki/Applied_ethics). हे _वास्तविक-जगातील कृती, उत्पादने आणि प्रक्रिया_ यांच्या संदर्भात नैतिक मुद्द्यांचा सक्रियपणे तपास करण्याची प्रक्रिया आहे आणि आपल्या परिभाषित नैतिक मूल्यांशी सुसंगत राहण्यासाठी सुधारात्मक उपाययोजना करणे.
**लागू केलेली नैतिकता** म्हणजे नैतिक विचारांचा [व्यावहारिक उपयोग](https://en.wikipedia.org/wiki/Applied_ethics). हे _वास्तविक जगातील कृती, उत्पादने आणि प्रक्रिया_ यांच्या संदर्भात नैतिक समस्यांचा सक्रियपणे तपास करण्याची प्रक्रिया आहे आणि परिभाषित नैतिक मूल्यांशी सुसंगत राहण्यासाठी सुधारात्मक उपाययोजना करणे.
**नीतिशास्त्र संस्कृती** म्हणजे [_लागू नीतिशास्त्राचे_ कार्यान्वयन](https://hbr.org/2019/05/how-to-design-an-ethical-organization) सुनिश्चित करणे, जेणेकरून आपल्या नैतिक तत्त्वे आणि पद्धती संपूर्ण संस्थेमध्ये सातत्यपूर्ण आणि स्केलेबल पद्धतीने स्वीकारल्या जातील. यशस्वी नीतिशास्त्र संस्कृती संस्थात्मक स्तरावर नैतिक तत्त्वे परिभाषित करतात, अनुपालनासाठी अर्थपूर्ण प्रोत्साहन प्रदान करतात आणि प्रत्येक स्तरावर इच्छित वर्तन प्रोत्साहित करून आणि वाढवून नीतिशास्त्र मानकांना बळकट करतात.
**नैतिकता संस्कृती** म्हणजे [_लागू केलेल्या नैतिकतेचे_ कार्यान्वयन](https://hbr.org/2019/05/how-to-design-an-ethical-organization) जेणेकरून आपल्या नैतिक तत्त्वे आणि पद्धती संपूर्ण संस्थे सातत्यपूर्ण आणि स्केलेबल पद्धतीने स्वीकारल्या जातील. यशस्वी नैतिकता संस्कृती संस्थात्मक स्तरावर नैतिक तत्त्वे परिभाषित करतात, अनुपालनासाठी अर्थपूर्ण प्रोत्साहन प्रदान करतात आणि संस्थेच्या प्रत्येक स्तरावर इच्छित वर्तन प्रोत्साहित करून आणि वाढवून नैतिकता मानदंड मजबूत करतात.
## नीतिशास्त्र संकल्पना
## नैतिकतेच्या संकल्पना
या विभागात, आपण **सामायिक मूल्ये** (तत्त्वे) आणि **तिक आव्हाने** (समस्या) यासारख्या संकल्पनांवर चर्चा करू - आणि **केस स्टडीज**चा अभ्यास करू, ज्यामुळे तुम्हाला या संकल्पना वास्तविक-जगातील संदर्भात समजण्यास मदत होईल.
या विभागात, आपण **सामायिक मूल्ये** (तत्त्वे) आणि **तिक आव्हाने** (समस्या) यासारख्या संकल्पनांवर चर्चा करू - आणि **केस स्टडीज** एक्सप्लोर करू जे तुम्हाला वास्तविक जगातील संदर्भात या संकल्पना समजून घेण्यास मदत करतात.
### 1. नीतिशास्त्र तत्त्वे
### 1. नैतिक तत्त्वे
प्रत्येक डेटा नीतिशास्त्र धोरणाची सुरुवात _नीतिक तत्त्वे_ परिभाषित करून होते - "सामायिक मूल्ये" जी स्वीकारार्ह वर्तनाचे वर्णन करतात आणि आपल्या डेटा आणि AI प्रकल्पांमध्ये अनुपालन कृतींना मार्गदर्शन करतात. तुम्ही ही तत्त्वे वैयक्तिक किंवा संघ स्तरावर परिभाषित करू शकता. तथापि, बहुतेक मोठ्या संस्था कॉर्पोरेट स्तरावर परिभाषित आणि सर्व संघांमध्ये सातत्याने लागू केलेल्या _नतिक AI_ मिशन स्टेटमेंट किंवा फ्रेमवर्कमध्ये ही तत्त्वे रेखाटतात.
प्रत्येक डेटा नैतिकता धोरणाची सुरुवात _नैतिक तत्त्वे_ परिभाषित करण्यापासून होते - "सामायिक मूल्ये" जी स्वीकारार्ह वर्तनाचे वर्णन करतात आणि आपल्या डेटा आणि AI प्रकल्पांमध्ये अनुपालन कृतींना मार्गदर्शन करतात. तुम्ही ही तत्त्वे वैयक्तिक किंवा संघ स्तरावर परिभाषित करू शकता. तथापि, बहुतेक मोठ्या संस्था कॉर्पोरेट स्तरावर परिभाषित केलेल्या आणि सर्व संघांमध्ये सातत्याने लागू केलेल्या _नतिक AI_ मिशन स्टेटमेंट किंवा फ्रेमवर्कमध्ये याची रूपरेषा तयार करतात.
**उदाहरण:** Microsoft च्या [Responsible AI](https://www.microsoft.com/en-us/ai/responsible-ai) मिशन स्टेटमेंटमध्ये असे म्हटले आहे: _"आम्ही अशा नैतिक तत्त्वांनी प्रेरित AI च्या प्रगतीसाठी वचनबद्ध आहोत जी लोकांना प्रथम स्थान देतात"_ - खालील फ्रेमवर्कमध्ये 6 नैतिक तत्त्वे ओळखली आहेत:
**उदाहरण:** Microsoft च्या [Responsible AI](https://www.microsoft.com/en-us/ai/responsible-ai) मिशन स्टेटमेंटमध्ये असे म्हटले आहे: _"आम्ही AI च्या प्रगतीसाठी वचनबद्ध आहोत जी नैतिक तत्त्वांद्वारे चालवली जाते जी लोकांना प्रथम स्थान देत"_ - खालील फ्रेमवर्कमध्ये 6 नैतिक तत्त्वे ओळखली आहेत:
![Responsible AI at Microsoft](https://docs.microsoft.com/en-gb/azure/cognitive-services/personalizer/media/ethics-and-responsible-use/ai-values-future-computed.png)
चला या तत्त्वांचा थोडक्यात अभ्यास करूया. _पारदर्शकता_ आणि _जबाबदारी_ ही मूलभूत मूल्ये आहेत ज्यावर इतर तत्त्वे आधारित आहेत - त्यामुळे तिथून सुरुवात करूया:
चला या तत्त्वांचा थोडक्यात अभ्यास करूया. _पारदर्शकता_ आणि _जबाबदारी_ ही मूलभूत मूल्ये आहेत ज्यावर इतर तत्त्वे तयार केली जातात - त्यामुळे तिथून सुरुवात करूया:
* [**जबाबदारी**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) डेटा आणि AI ऑपरेशन्ससाठी, तसेच या नैतिक तत्त्वांचे पालन करण्यासाठी व्यावसायिकांना _जबाबदार_ बनवते.
* [**पारदर्शकता**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) सुनिश्चित करते की डेटा आणि AI क्रिया वापरकर्त्यांसाठी _समजण्यासारख्या_ (स्पष्ट) असतील, निर्णयांच्या मागील काय आणि का याचे स्पष्टीकरण देते.
* [**न्याय**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1%3aprimaryr6) - AI सर्व लोकांशी _न्यायाने_ वागे याची खात्री करण्यावर लक्ष केंद्रित करते, डेटा आणि प्रणालींमधील कोणत्याही प्रणालीगत किंवा अप्रत्यक्ष सामाजिक-तांत्रिक पूर्वग्रहांना संबोधित करते.
* [**जबाबदारी**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) डेटा आणि AI ऑपरेशन्ससाठी, तसेच नैतिक तत्त्वांचे अनुपालन सुनिश्चित करण्यासाठी व्यावसायिकांना _जबाबदार_ बनवते.
* [**पारदर्शकता**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) डेटा आणि AI कृती वापरकर्त्यांसाठी _समजण्यासारख्या_ (interpretative) बनवते, निर्णयांमागील काय आणि का स्पष्ट करते.
* [**न्याय**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1%3aprimaryr6) - AI सर्व लोकांशी _न्यायाने_ वागे याची खात्री करण्यावर लक्ष केंद्रित करते, डेटा आणि प्रणालींमधील कोणत्याही प्रणालीगत किंवा अप्रत्यक्ष सामाजिक-तांत्रिक पक्षपातांना संबोधित करते.
* [**विश्वसनीयता आणि सुरक्षा**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - AI _सुसंगतपणे_ परिभाषित मूल्यांसह वागते याची खात्री करते, संभाव्य हानी किंवा अनपेक्षित परिणाम कमी करते.
* [**गोपनीयता आणि सुरक्षा**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - डेटा वंशावळ समजून घेणे आणि वापरकर्त्यांना _डेटा गोपनीयता आणि संबंधित संरक्षण_ प्रदान करणे याबद्दल आहे.
* [**समावेशकता**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - हेतूपूर्वक AI सोल्यूशन्स डिझाइन करण्याबद्दल आहे, त्यांना _विविध मानवी गरजा_ आणि क्षमता पूर्ण करण्यासाठी अनुकूल बनवणे.
* [**समावेशकता**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - AI सोल्यूशन्स _विविध मानवी गरजा आणि क्षमता_ पूर्ण करण्यासाठी डिझाइन करण्याच्या हेतूने तयार करणे.
> 🚨 तुमचे डेटा नीतिशास्त्र मिशन स्टेटमेंट काय असू शकते याचा विचार करा. इतर संस्थांकडून नैतिक AI फ्रेमवर्क एक्सप्लोर करा - येथे [IBM](https://www.ibm.com/cloud/learn/ai-ethics), [Google](https://ai.google/principles), आणि [Facebook](https://ai.facebook.com/blog/facebooks-five-pillars-of-responsible-ai/) यांचे उदाहरणे आहेत. त्यांच्यात कोणती सामायिक मूल्ये आहेत? ही त्त्व त्यांच्या AI उत्पादन किंवा उद्योगाशी कशी संबंधित आहेत?
> 🚨 तुमचे डेटा नैतिकता मिशन स्टेटमेंट काय असू शकते याचा विचार करा. इतर संस्थांकडून नैतिक AI फ्रेमवर्क एक्सप्लोर करा - येथे [IBM](https://www.ibm.com/cloud/learn/ai-ethics), [Google](https://ai.google/principles), आणि [Facebook](https://ai.facebook.com/blog/facebooks-five-pillars-of-responsible-ai/) चे उदाहरणे आहेत. त्यांच्यात कोणती सामायिक मूल्ये आहेत? ते AI उत्पादन किंवा उद्योगाशी कसे संबंधित आहेत ज्यामध्ये ते कार्य करतात?
### 2. नीतिशास्त्र आव्हाने
### 2. नैतिक आव्हाने
एकदा नैतिक तत्त्वे परिभाषित झाल्यानंतर, पुढील पाऊल म्हणजे आपल्या डेटा आणि AI कृतींचे मूल्यांकन करणे, त्या सामायिक मूल्यांशी सुसंगत आहेत का हे पाहणे. तुमच्या कृतींचा विचार दोन श्रेणींमध्ये करा: _डेटा संकलन_ आणि _अल्गोरिदम डिझाइन_.
एकदा नैतिक तत्त्वे परिभाषित झाल्यानंतर, पुढील पायरी म्हणजे आपल्या डेटा आणि AI कृतींचे मूल्यांकन करणे की त्या सामायिक मूल्यांशी जुळतात का. तुमच्या कृतींचा विचार दोन श्रेणींमध्ये करा: _डेटा संकलन_ आणि _अल्गोरिदम डिझाइन_.
डेटा संकलनासह, कृतींमध्ये **वैयक्तिक डेटा** किंवा ओळखण्यायोग्य जिवंत व्यक्तींसाठी वैयक्तिक ओळखण्यायोग्य माहिती (PII) समाविष्ट असण्याची शक्या आहे. यामध्ये [विविध प्रकारचे गैर-वैयक्तिक डेटा](https://ec.europa.eu/info/law/law-topic/data-protection/reform/what-personal-data_en) समाविष्ट आहेत जे _एकत्रितपणे_ एखाद्या व्यक्तीला ओळखतात. नैतिक आव्हाने _डेटा गोपनीयता_, _डेटा मालकी_, आणि _माहितीपूर्ण संमती_ आणि _बौद्धिक मालमत्ता हक्क_ यासारख्या संबंधित विषयांशी संबंधित असू शकतात.
डेटा संकलनासह, कृतींमध्ये **वैयक्तिक डेटा** किंवा ओळखण्यायोग्य जिवंत व्यक्तींसाठी वैयक्तिक ओळखण्यायोग्य माहिती (PII) समाविष्ट असते. यामध्ये [विविध प्रकारचे गैर-वैयक्तिक डेटा](https://ec.europa.eu/info/law/law-topic/data-protection/reform/what-personal-data_en) समाविष्ट असते जे _एकत्रितपणे_ व्यक्तीला ओळखतात. नैतिक आव्हाने _डेटा गोपनीयता_, _डेटा मालकी_, आणि संबंधित विषय जसे की _सहमती_ आणि _बौद्धिक मालमत्तेचे अधिकार_ यासंबंधित असू शकतात.
अल्गोरिदम डिझाइनसह, कृतींमध्ये **डेटासेट्स** गोळा करणे आणि व्यवस्थापित करणे, नंतर त्यांचा वापर करून **डेटा मॉडेल्स** तयार करणे आणि तैनात करणे समाविष्ट असेल, जे वास्तविक-जगातील संदर्भांमध्ये परिणामांची भविष्यवाणी करतात किंवा निर्णय स्वयंचलित करतात. नैतिक आव्हाने _डेटासेट पूर्वग्रह_, _डेटा गुणवत्ता_ समस्या, _अन्याय_ आणि अल्गोरिदममधील _चुकीचे प्रतिनिधित्व_ यामुळे उद्भवू शकतात - ज्यामध्ये काही समस्या प्रणालीगत असू शकतात.
अल्गोरिदम डिझाइनसह, कृतींमध्ये **डेटासेट्स** गोळा करणे आणि व्यवस्थापित करणे, त्यांचा वापर करून **डेटा मॉडेल्स** तयार करणे आणि तैनात करणे, जे वास्तविक जगातील संदर्भात परिणामांची भविष्यवाणी करतात किंवा निर्णय स्वयंचलित करतात. नैतिक आव्हाने _डेटासेट पक्षपात_, _डेटा गुणवत्ता_ समस्या, _अन्याय_, आणि अल्गोरिदममध्ये _चुकीचे प्रतिनिधित्व_ यामुळे उद्भवू शकतात - ज्यामध्ये काही समस्या प्रणालीगत असू शकतात.
दोन्ही प्रकरणांमध्ये, नीतिशास्त्र आव्हाने अशा क्षेत्रांना अधोरेखित करतात जिथे आपल्या कृतींना सामायिक मूल्यांशी संघर्ष होण्याची शक्यता असते. या चिंतांचा शोध घेण्यासाठी, कमी करण्यासाठी, कमी करण्यासाठी किंवा दूर करण्यासाठी - आपल्याला आपल्या कृतींशी संबंधित नैतिक "होय/नाही" प्रश्न विचारण्याची आवश्यकता आहे आणि नंतर आवश्यकतेनुसार सुधारात्मक कृती करणे आवश्यक आहे. चला काही नैतिक आव्हाने आणि त्यांनी उपस्थित केलेल्या नैतिक प्रश्नांचा अभ्यास करूया:
दोन्ही बाबतीत, नैतिक आव्हाने अशा क्षेत्रांवर प्रकाश टाकतात जिथे आपल्या कृती सामायिक मूल्यांशी संघर्ष करू शकतात. या चिंतेचा शोध घेण्यासाठी, कमी करण्यासाठी, कमी करण्यासाठी किंवा दूर करण्यासाठी - आपल्याला आपल्या कृतींशी संबंधित नैतिक "होय/नाही" प्रश्न विचारावे लागतील आणि आवश्यकतेनुसार सुधारात्मक उपाययोजना करावी लागेल. चला काही नैतिक आव्हाने आणि त्यांनी उपस्थित केलेल्या नैतिक प्रश्नांचा अभ्यास करूया:
#### 2.1 डेटा मालकी
डेटा संकलना अनेकदा डेटा विषयांना ओळखणारा वैयक्तिक डेटा समाविष्ट असतो. [डेटा मालकी](https://permission.io/blog/data-ownership) म्हणजे डेटा निर्मिती, प्रक्रिया आणि प्रसाराशी संबंधित _नियंत्रण_ आणि [_वापरकर्ता हक्क_](https://permission.io/blog/data-ownership).
डेटा संकलनामध्ये अनेकदा डेटा विषयांना ओळखणारा वैयक्तिक डेटा समाविष्ट असतो. [डेटा मालकी](https://permission.io/blog/data-ownership) म्हणजे डेटा निर्मिती, प्रक्रिया आणि प्रसाराशी संबंधित _नियंत्रण_ आणि [_वापरकर्त्याचे अधिकार_](https://permission.io/blog/data-ownership).
आपल्याला विचारायचे नैतिक प्रश्न:
* डेटा कोणाचा आहे? (वापरकर्ता क संस्था)
* डेटा विषयांना कोणते हक्क आहेत? (उदा: प्रवेश, विलोपन, पोर्टेबिलिटी)
* संस्थांना कोणते हक्क आहेत? (उदा: खोट्या वापरकर्ता पुनरावलोकनांचे सुधारणा)
* डेटा कोणाचा आहे? (वापरकर्ता किंवा संस्था)
* डेटा विषयांना कोणते अधिकार आहेत? (उदा: प्रवेश, विलोपन, पोर्टेबिलिटी)
* संस्थांना कोणते अधिकार आहेत? (उदा: दुर्भावनायुक्त वापरकर्ता पुनरावलोकने सुधारित करणे)
#### 2.2 माहितीपूर्ण समती
#### 2.2 माहितीपूर्ण समती
[माहितीपूर्ण समती](https://legaldictionary.net/informed-consent/) म्हणजे वापरकर्त्यांनी (डेटा विषयांनी) कृतीसाठी (जसे की डेटा संकलन) _संपूर्ण समज_ सह परवानगी देणे, ज्यामध्ये उद्देश, संभाव्य धोके आणि पर्याय यांचा समावेश आहे.
[माहितीपूर्ण समती](https://legaldictionary.net/informed-consent/) म्हणजे वापरकर्त्यांनी (डेटा विषयांनी) कृतीसाठी (जसे की डेटा संकलन) _संपूर्ण समज_ सह परवानगी दिली आहे.
येथे विचारायचे प्रश्न:
* वापरकर्त्याने (डेटा विषयाने) डेटा कॅप्चर आणि वापरासाठी परवानगी दिली का?
* वापरकर्त्याला डेटा कॅप्चर करण्याचा उद्देश समजला का?
* वापरकर्त्याला त्यांच्या सहभागामुळे होणाऱ्या संभाव्य धोके समजले का?
* वापरकर्त्याने डेटा कॅप्चर आणि वापरासाठी परवानगी दिली आहे का?
* वापरकर्त्याला डेटा कॅप्चर करण्याचा हेतू समजला आहे का?
* वापरकर्त्याला त्यांच्या सहभागामुळे संभाव्य धोके समजले आहेत का?
#### 2.3 बौद्धिक मालमत्ता
[बौद्धिक मालमत्ता](https://en.wikipedia.org/wiki/Intellectual_property) म्हणजे मानवी उपक्रमातून निर्माण झालेली अमूर्त निर्मिती, ज्याला व्यक्ती किंवा व्यवसायांसाठी _आर्थिक मूल्य_ असू शकते.
येथे विचारायचे प्रश्न:
* गोळा केलेल्या डेटाला वापरकर्ता किंवा व्यवसायासाठी आर्थिक मूल्य होते का?
* गोळा केलेल्या डेटाला वापरकर्ता किंवा व्यवसायासाठी आर्थिक मूल्य हे का?
* येथे **वापरकर्त्याला** बौद्धिक मालमत्ता आहे का?
* येथे **संस्थेला** बौद्धिक मालमत्ता आहे का?
* जर हे हक्क अस्तित्वात असतील, तर आपण त्यांचे संरक्षण कसे करत आहत?
* जर हे अधिकार अस्तित्वात असतील, तर आपण त्यांचे संरक्षण कसे करत आहत?
#### 2.4 डेटा गोपनीयता
[डेटा गोपनीयता](https://www.northeastern.edu/graduate/blog/what-is-data-privacy/) किंवा माहिती गोपनीयता म्हणजे वैयक्तिक ओळखण्यायोग्य माहितीच्या संदर्भात वापरकर्त्याच्या गोपनीयतेचे जतन आणि ओळख संरक्षित कर.
[डेटा गोपनीयता](https://www.northeastern.edu/graduate/blog/what-is-data-privacy/) किंवा माहिती गोपनीयता म्हणजे वैयक्तिक ओळखण्यायोग्य माहितीच्या संदर्भात वापरकर्त्याच्या गोपनीयतेचे जतन आणि ओळख संरक्षण.
येथे विचारायचे प्रश्न:
* वापरकर्त्यांचा (वैयक्तिक) डेटा हॅक आणि गळतीपासून सुरक्षित आहे का?
* वापरकर्त्यांचा डेटा फक्त अधिकृत वापरकर्त्यांना आणि संदर्भांना उपलब्ध आहे का?
* डेटा सामायिक किंवा प्रसारित केल्यावर वापरकर्त्यांची अज्ञातता जपली जाते का?
* अज्ञात डेटासेट्समधून वापरकर्त्याला पुन्हा ओळखता येऊ शकते का?
* वापरकर्त्यांचा (वैयक्तिक) डेटा हॅक आणि लीकपासून सुरक्षित आहे का?
* वापरकर्त्यांचा डेटा केवळ अधिकृत वापरकर्त्यांना आणि संदर्भांना उपलब्ध आहे का?
* डेटा सामायिक किंवा प्रसारित करताना वापरकर्त्यांची अनामिकता जतन केली जाते का?
* अनामिक डेटासेट्समधून वापरकर्त्याला ओळखले जाऊ शकते का?
#### 2.5 विस्मरणाचा अधिकार
[विस्मरणाचा अधिकार](https://en.wikipedia.org/wiki/Right_to_be_forgotten) किंवा [विलोपनाचा अधिकार](https://www.gdpreu.org/right-to-be-forgotten/) वापरकर्त्यांना अतिरिक्त वैयक्तिक डेटा संरक्षण प्रदान करतो. विशेषतः, हे वापरकर्त्यांना इंटरनेट शोधांमधून आणि इतर ठिकाणांहून वैयक्तिक डेटा हटविण्याची किंवा काढून टाकण्याची विनंती करण्याचा अधिकार देते, _विशिष्ट परिस्थितीत_ - त्यांना ऑनलाइन नवीन सुरुवात करण्याची परवानगी देते, त्यांच्या भूतकाळातील कृती त्यांच्याविरुद्ध धरल्या जात नाहीत.
[विस्मरणाचा अधिकार](https://en.wikipedia.org/wiki/Right_to_be_forgotten) किंवा [विलोपनाचा अधिकार](https://www.gdpreu.org/right-to-be-forgotten/) वापरकर्त्यांना अतिरिक्त वैयक्तिक डेटा संरक्षण प्रदान करतो. विशेषतः, हे वापरकर्त्यांना इंटरनेट शोध आणि इतर ठिकाणांवरून वैयक्तिक डेटा हटविण्याची किंवा काढून टाकण्याची विनंती करण्याचा अधिकार देते, _विशिष्ट परिस्थितीत_ - त्यांना ऑनलाइन नवीन सुरुवात करण्याची परवानगी देते.
येथे विचारायचे प्रश्न:
* प्रणाली डेटा विषयांना विलोपनाची विनंती करण्याची परवानगी देते का?
* वापरकर्त्याच्या समतीच्या माघारीने स्वयंचलित विलोपन ट्रिगर करावे का?
* डेटा समतीशिवाय किंवा बेकायदेशीर मार्गाने गोळा केला गेला होता का?
* वापरकर्त्याच्या समतीच्या माघारीने स्वयंचलित विलोपन ट्रिगर करावे का?
* डेटा समतीशिवाय किंवा बेकायदेशीर मार्गाने गोळा केला गेला होता का?
* डेटा गोपनीयतेसाठी सरकारी नियमांचे पालन केले आहे का?
#### 2.6 डेटासेट पूर्वग्रह
#### 2.6 डेटासेट पक्षपात
डेटासेट किंवा [संकलन पूर्वग्रह](http://researcharticles.com/index.php/bias-in-data-collection-in-research/) म्हणजे अल्गोरिदम विकासासाठी _अप्रतिनिधिक_ डेटाचा उपसमुच्चय
[Algorithm Fairness](https://towardsdatascience.com/what-is-algorithm-fairness-3182e161cf9f) तपासते की अल्गोरिदम डिझाइन विशिष्ट उपसमूहांवर प्रणालीगत भेदभाव करते का, ज्यामुळे _वाटप_ (जिथे संसाधने त्या गटाला नाकारली जातात किंवा रोखली जातात) आणि _सेवेची गुणवत्ता_ (जिथे काही उपसमूहांसाठी AI इतरांइतकी अचूक नसते) यामध्ये [संभाव्य हानी](https://docs.microsoft.com/en-us/azure/machine-learning/concept-fairness-ml) होऊ शकते.
डेटासेट किंवा [संकलन पक्षपात](http://researcharticles.com/index.php/bias-in-data-collection-in-research/) म्हणजे अल्गोरिदम विकासासाठी _अप्रतिनिधिक_ डेटा उपसंच निवडणे, विविध गटांसाठी संभाव्य अन्याय निर्माण करणे.
येथे विचारायचे प्रश्न:
* आपण डेटा विषयांचा प्रतिनिधिक संच भरती केला आहे का?
* आपण विविध पक्षपातांसाठी गोळा केलेला किंवा व्यवस्थापित केलेला डेटासेट चाचणी केला आहे का?
* आपण शोधलेल्या पक्षपातांना कमी किंवा दूर करू शकतो का?
#### 2.7 डेटा गुणवत्ता
[डेटा गुणवत्ता](https://lakefs.io/data-quality-testing/) म्हणजे अल्गोरिदम विकसित करण्यासाठी वापरलेल्या व्यवस्थापित डेटासेटची वैधता तपासणे, वैशिष्ट्ये आणि र
[Algorithm Fairness](https://towardsdatascience.com/what-is-algorithm-fairness-3182e161cf9f) तपासते की अल्गोरिदम डिझाइन विशिष्ट उपसमूहांवर अन्यायकारकपणे परिणाम करत आहे का, ज्यामुळे _वाटप_ (जिथे संसाधने नाकारली जातात किंवा त्या गटापासून रोखली जातात) आणि _सेवेची गुणवत्ता_ (जिथे AI काही उपसमूहांसाठी इतरांइतकी अचूक नसते) यामध्ये [संभाव्य नुकसान](https://docs.microsoft.com/en-us/azure/machine-learning/concept-fairness-ml) होऊ शकते.
येथे विचार करण्यासाठी काही प्रश्न:
* विविध उपसमूह आणि परिस्थितींसाठी मॉडेल अचूकतेचे मूल्यांकन केले का?
* संभाव्य हानींसाठी (उदा., स्टीरिओटायपिंग) प्रणालीचे बारकाईने परीक्षण केले का?
* ओळखलेल्या हानी कमी करण्यासाठी डेटा सुधारित किंवा मॉडेल पुन्हा प्रशिक्षित करू शकतो का?
* संभाव्य नुकसान (उदा., पूर्वग्रह) तपासले का?
* ओळखलेल्या नुकसानीस कमी करण्यासाठी डेटा सुधारित किंवा मॉडेल पुन्हा प्रशिक्षण दिले जाऊ शकते का?
[AI Fairness checklists](https://query.prod.cms.rt.microsoft.com/cms/api/am/binary/RE4t6dA) सारख्या संसाधनांचा अभ्यास करा.
#### 2.9 चुकीचे प्रतिनिधित्व
[Data Misrepresentation](https://www.sciencedirect.com/topics/computer-science/misrepresentation) म्हणजे आपण प्रामाणिकपणे नोंदवलेल्या डेटामधून मिळालेल्या अंतर्दृष्टींचा वापर करून इच्छित कथानकाला पाठिंबा देण्यासाठी फसवणूक करत आहोत का, हे विचारणे.
[Data Misrepresentation](https://www.sciencedirect.com/topics/computer-science/misrepresentation) म्हणजे विचार करणे की आपण प्रामाणिकपणे नोंदवलेल्या डेटामधून अंतर्दृष्टी अशा प्रकारे सादर करत आहोत का ज्यामुळे इच्छित कथानकाला पाठिंबा मिळतो.
येथे विचार करण्यासाठी काही प्रश्न:
* आपण अपूर्ण किंवा अचूक नसलेला डेटा नोंदवत आहोत का?
* आपण डेटा अशा प्रकारे व्हिज्युअलाइज करत आहोत का ज्यामुळे चुकीचे निष्कर्ष काढले जातात?
* आपण निवडक सांख्यिकीय तंत्रांचा वापर करून परिणामांमध्ये फेरफार करत आहोत का?
* वेगळे निष्कर्ष देऊ शकणाऱ्या पर्यायी स्पष्टीकरणांचा विचार केला आहे का?
* आम्ही अपूर्ण किंवा अचूक नसलेला डेटा नोंदवत आहोत का?
* आम्ही डेटा अशा प्रकारे व्हिज्युअलाइज करत आहोत का ज्यामुळे चुकीचे निष्कर्ष निघतात?
* आम्ही निवडक सांख्यिकी तंत्र वापरून परिणामांमध्ये फेरफार करत आहोत का?
* वेगळ्या निष्कर्षासाठी पर्यायी स्पष्टीकरणे असू शकतात का?
#### 2.10 स्वातंत्र्याची निवड
[Illusion of Free Choice](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice) तेव्हा होते जेव्हा प्रणाली "निवड आर्किटेक्चर" निर्णय घेणाऱ्या अल्गोरिदमचा वापर करून लोकांना प्राधान्य दिलेल्या परिणामाकडे वळवते, परंतु त्यांना पर्याय आणि नियंत्रण असल्याचे भासवते. हे [dark patterns](https://www.darkpatterns.org/) वापरकर्त्यांना सामाजिक आणि आर्थिक हानी पोहोचवू शकतात. कारण वापरकर्त्यांच्या निर्णयांचा वर्तन प्रोफाइलवर परिणाम होतो, त्यामुळे हे कृती भविष्यातील निवडींवर प्रभाव टाकू शकतात आणि हानी वाढवू शकतात.
[Illusion of Free Choice](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice) तेव्हा होते जेव्हा प्रणाली "निवड आर्किटेक्चर" निर्णय घेण्याच्या अल्गोरिदमचा वापर लोकांना इच्छित परिणामाकडे वळवण्यासाठी करते, त्यांना पर्याय आणि नियंत्रण असल्याचे भासवते. हे [dark patterns](https://www.darkpatterns.org/) वापरकर्त्यांना सामाजिक आणि आर्थिक नुकसान पोहोचवू शकतात. कारण वापरकर्त्याचे निर्णय वर्तन प्रोफाइलवर परिणाम करतात, हे कृती भविष्यातील निवडींवर परिणाम करू शकतात आणि या नुकसानीचा प्रभाव वाढवू शकतात.
येथे विचार करण्यासाठी काही प्रश्न:
* वापरकर्त्याला त्या निवडीचे परिणाम समजले का?
* वापरकर्त्याला (पर्यायी) निवडी आणि त्यांचे फायदे व तोटे माहीत होते का?
* वापरकर्ता नंतर स्वयंचलित किंवा प्रभावित निवड उलटवू शकतो का?
* वापरकर्त्याला ती निवड करण्याचे परिणाम समजले का?
* वापरकर्त्याला (पर्यायी) पर्याय आणि प्रत्येकाचे फायदे व तोटे माहित होते का?
* वापरकर्ता स्वयंचलित किंवा प्रभावित निवड नंतर उलट करू शकतो का?
### 3. केस स्टडीज
या नैतिक आव्हानांना वास्तव जीवनातील संदर्भात समजून घेण्यासाठी, अशा केस स्टडीजकडे पाहणे उपयुक्त ठरते ज्या व्यक्ती आणि समाजावर होणाऱ्या संभाव्य हानी आणि परिणाम दाखवतात, जेव्हा अशा नैतिक उल्लंघनांकडे दुर्लक्ष केले जाते.
या नैतिक आव्हानांना वास्तविक जीवनातील संदर्भात ठेवण्यासाठी, अशा केस स्टडीजकडे पाहणे उपयुक्त ठरते ज्यामुळे व्यक्ती आणि समाजावर होणारे संभाव्य नुकसान आणि परिणाम स्पष्ट होतात, जेव्हा अशा नैतिक उल्लंघनांकडे दुर्लक्ष केले जाते.
उदाहरणे खाली दिली आहेत:
येथे काही उदाहरणे आहेत:
| नैतिक आव्हान | केस स्टडी |
|--- |--- |
| **जग संमती** | 1972 - [Tuskegee Syphilis Study](https://en.wikipedia.org/wiki/Tuskegee_Syphilis_Study) - आफ्रिकन अमेरिकन पुरुषांना मोफत वैद्यकीय उपचार देण्याचे आश्वासन दिले गेले _पण फसवले गेले_, संशोधकांनी त्यांना त्यांच्या निदानाबद्दल किंवा उपचारांच्या उपलब्धतेबद्दल माहिती दिली नाही. अनेकांचा मृत्यू झाला आणि त्यांच्या जोडीदारांवर किंवा मुलांवर परिणाम झाला; हा अभ्यास 40 वर्षे चालला. |
| **डेटा गोपनीयता** | 2007 - [Netflix data prize](https://www.wired.com/2007/12/why-anonymous-data-sometimes-isnt/) संशोधकांना _50K ग्राहकांच्या 10M अज्ञात चित्रपट रेटिंग_ प्रदान केले गेले, परंतु संशोधकांनी बाह्य डेटासेट्स (उदा., IMDb टिप्पण्या) मध्ये वैयक्तिकरित्या ओळखण्यायोग्य डेटा जोडून काही Netflix सदस्यांना "डीनॉनिमाइझ" केले.|
| **संकलन पूर्वग्रह** | 2013 - बोस्टन शहराने [Street Bump](https://www.boston.gov/transportation/street-bump) नावाचे अॅप विकसित केले, ज्यामुळे नागरिकांना खड्ड्यांची माहिती देण्याची परवानगी मिळाली. परंतु [कमी उत्पन्न गटातील लोकांना कार आणि फोनचा कमी प्रवेश होता](https://hbr.org/2013/04/the-hidden-biases-in-big-data), ज्यामुळे त्यांच्या रस्त्याच्या समस्या या अॅपमध्ये अदृश्य झाल्या. विकसकांनी न्याय्यतेसाठी _समान प्रवेश आणि डिजिटल विभाग_ समस्यांवर काम केले. |
| **अल्गोरिदम निष्पक्षता** | 2018 - MIT [Gender Shades Study](http://gendershades.org/overview.html) ने लिंग वर्गीकरण AI उत्पादनांच्या अचूकतेचे मूल्यांकन केले, महिलांसाठी आणि रंगाच्या व्यक्तींसाठी अचूकतेतील अंतर उघड केले. [2019 Apple Card](https://www.wired.com/story/the-apple-card-didnt-see-genderand-thats-the-problem/) ने पुरुषांपेक्षा महिलांना कमी क्रेडिट दिले. दोन्ही उदाहरणे अल्गोरिदम पूर्वग्रहांमुळे सामाजिक-आर्थिक हानी दर्शवतात.|
| **डेटा चुकीचे प्रतिनिधित्व** | 2020 - [Georgia Department of Public Health ने COVID-19 चार्ट्स](https://www.vox.com/covid-19-coronavirus-us-response-trump/2020/5/18/21262265/georgia-covid-19-cases-declining-reopening) प्रसिद्ध केले ज्यामुळे नागरिकांना प्रकरणांतील ट्रेंडबद्दल चुकीचे दिशाभूल होईल असे वाटले. हे व्हिज्युअलायझेशन युक्त्यांद्वारे चुकीचे प्रतिनिधित्व दाखवते. |
| **स्वातंत्र्याची निवड** | 2020 - शिक्षण अॅप [ABCmouse ने FTC तक्रारीचे $10M देऊन सेटलमेंट केले](https://www.washingtonpost.com/business/2020/09/04/abcmouse-10-million-ftc-settlement/) जिथे पालकांना सदस्यता रद्द करता येत नव्हती. हे निवड आर्किटेक्चरमधील dark patterns दाखवते, जिथे वापरकर्त्यांना संभाव्य हानिकारक निवडींकडे वळवले गेले. |
| **डेटा गोपनीयता आणि वापरकर्ता हक्क** | 2021 - Facebook [डेटा उल्लंघन](https://www.npr.org/2021/04/09/986005820/after-data-breach-exposes-530-million-facebook-says-it-will-not-notify-users) ज्यामुळे 530M वापरकर्त्यांचा डेटा उघड झाला, ज्यामुळे FTC ला $5B सेटलमेंट मिळाले. परंतु वापरकर्त्यांना उल्लंघनाबद्दल सूचित करण्यास नकार दिला, डेटा पारदर्शकता आणि प्रवेशाबाबत वापरकर्त्यांच्या हक्कांचे उल्लंघन केले. |
अधिक केस स्टडीज शोधायच्या आहेत? या संसाधनांचा अभ्यास करा:
* [Ethics Unwrapped](https://ethicsunwrapped.utexas.edu/case-studies) - विविध उद्योगांतील नैतिक दुविधा.
| **हमतीची माहिती** | 1972 - [Tuskegee Syphilis Study](https://en.wikipedia.org/wiki/Tuskegee_Syphilis_Study) - अभ्यासात सहभागी झालेल्या आफ्रिकन अमेरिकन पुरुषांना मोफत वैद्यकीय सेवा देण्याचे आश्वासन दिले गेले _पण फसवले गेले_ संशोधकांनी विषयांना त्यांच्या निदानाबद्दल किंवा उपचार उपलब्धतेबद्दल माहिती देण्यास अपयश आले. अनेक विषयांचा मृत्यू झाला आणि भागीदार किंवा मुलांवर परिणाम झाला; अभ्यास 40 वर्षे चालला. |
| **डेटा गोपनीयता** | 2007 - [Netflix data prize](https://www.wired.com/2007/12/why-anonymous-data-sometimes-isnt/) संशोधकांना _50K ग्राहकांकडून 10M अनामित चित्रपट रेटिंग_ प्रदान केले गेले जेणेकरून शिफारस अल्गोरिदम सुधारता येईल. तथापि, संशोधक बाह्य डेटासेट्स (उदा., IMDb टिप्पण्या) मध्ये वैयक्तिकरित्या ओळखण्यायोग्य डेटा सह correlating करून काही Netflix सदस्यांना "de-anonymize" करण्यात सक्षम होते.|
| **संकलन पूर्वग्रह** | 2013 - बोस्टन शहराने [Street Bump](https://www.boston.gov/transportation/street-bump) विकसित केले, एक अॅप ज्यामुळे नागरिकांना खड्ड्यांची माहिती देण्याची परवानगी मिळाली, ज्यामुळे शहराला समस्या शोधण्यासाठी आणि दुरुस्त करण्यासाठी चांगला रस्त्याचा डेटा मिळाला. तथापि, [कमी उत्पन्न गटातील लोकांना कार आणि फोनचा कमी प्रवेश होता](https://hbr.org/2013/04/the-hidden-biases-in-big-data), ज्यामुळे त्यांच्या रस्त्याच्या समस्या या अॅपमध्ये अदृश्य झाल्या. विकसकांनी न्याय्य प्रवेश आणि डिजिटल विभागांच्या समस्यांसाठी शैक्षणिक संस्थांशी काम केले. |
| **अल्गोरिदम न्याय** | 2018 - MIT [Gender Shades Study](http://gendershades.org/overview.html) ने लिंग वर्गीकरण AI उत्पादनांची अचूकता मूल्यांकन केली, महिलांसाठी आणि रंगाच्या व्यक्तींसाठी अचूकतेतील अंतर उघड केले. [2019 Apple Card](https://www.wired.com/story/the-apple-card-didnt-see-genderand-thats-the-problem/) पुरुषांपेक्षा महिलांना कमी क्रेडिट देत असल्याचे दिसून आले. दोन्ही अल्गोरिदम पूर्वग्रहांमधील समस्या स्पष्ट करतात ज्यामुळे सामाजिक-आर्थिक नुकसान होते.|
| **डेटा चुकीचे प्रतिनिधित्व** | 2020 - [Georgia Department of Public Health released COVID-19 charts](https://www.vox.com/covid-19-coronavirus-us-response-trump/2020/5/18/21262265/georgia-covid-19-cases-declining-reopening) ज्यामुळे नागरिकांना पुष्टी झालेल्या प्रकरणांतील ट्रेंडबद्दल चुकीचे मार्गदर्शन करण्याचा प्रयत्न केला गेला, x-axis वर गैर-कालक्रमिक क्रमवारीसह. हे व्हिज्युअलायझेशन युक्त्यांद्वारे चुकीचे प्रतिनिधित्व स्पष्ट करते. |
| **स्वातंत्र्याची निवडीचा भ्रम** | 2020 - शिक्षण अॅप [ABCmouse paid $10M to settle an FTC complaint](https://www.washingtonpost.com/business/2020/09/04/abcmouse-10-million-ftc-settlement/) जिथे पालकांना सदस्यता रद्द करता येत नसल्यामुळे पैसे देण्यास अडकवले गेले. हे निवड आर्किटेक्चरमधील dark patterns स्पष्ट करते, जिथे वापरकर्त्यांना संभाव्य हानिकारक निवडींकडे वळवले गेले. |
| **डेटा गोपनीयता आणि वापरकर्त्याचे अधिकार** | 2021 - Facebook [Data Breach](https://www.npr.org/2021/04/09/986005820/after-data-breach-exposes-530-million-facebook-says-it-will-not-notify-users) 530M वापरकर्त्यांचा डेटा उघड केला, ज्यामुळे FTC ला $5B सेटलमेंट मिळाली. तथापि, वापरकर्त्यांना उल्लंघनाची सूचना देण्यास नकार दिला, डेटा पारदर्शकता आणि प्रवेशाबद्दल वापरकर्त्याच्या अधिकारांचे उल्लंघन केले. |
अधिक केस स्टडीज एक्सप्लोर करू इच्छिता? या संसाधनांकडे पहा:
* [Ethics Unwrapped](https://ethicsunwrapped.utexas.edu/case-studies) - विविध उद्योगांमधील नैतिक समस्यांचे विश्लेषण.
* [Data Science Ethics course](https://www.coursera.org/learn/data-science-ethics#syllabus) - महत्त्वाच्या केस स्टडीजचा अभ्यास.
* [Where things have gone wrong](https://deon.drivendata.org/examples/) - Deon चेकलिस्टसह उदाहरणे.
* [Where things have gone wrong](https://deon.drivendata.org/examples/) - deon चेकलिस्टसह उदाहरणे.
> 🚨 तुम्ही पाहिलेल्या केस स्टडीजबद्दल विचार करा - तुम्हाला तुमच्या जीवनात अशाच प्रकारच्या नैतिक आव्हानाचा अनुभव आला आहे का? आपण चर्चा केलेल्या नैतिक आव्हानांपैकी एकाचे उदाहरण देणारी आणखी एक केस स्टडी तुम्हाला आठवते का?
> 🚨 तुम्ही पाहिलेल्या केस स्टडीजचा विचार करा - तुमच्या आयुष्यात तुम्हाला अशाच प्रकारच्या नैतिक आव्हानाचा अनुभव आला आहे का? तुम्ही या विभागात चर्चा केलेल्या नैतिक आव्हानांपैकी एकाचे उदाहरण देणारी किमान एक केस स्टडी विचार करू शकता का?
## लागू नैतिकता
आम्ही नैतिकतेच्या संकल्पना, आव्हाने आणि वास्तव जीवनातील संदर्भातील केस स्टडीजबद्दल चर्चा केली. पण प्रकल्पांमध्ये नैतिक तत्त्वे आणि पद्धती _लागू_ करण्यास कसे सुरुवात करायची? आणि चांगल्या प्रशासनासाठी या पद्धती _ऑपरेशनलाइज_ कशा करायच्या? चला काही वास्तव उपाय शोधूया:
आम्ही नैतिकता संकल्पना, आव्हाने आणि वास्तविक जीवनातील संदर्भातील केस स्टडीजबद्दल चर्चा केली आहे. पण आपल्या प्रकल्पांमध्ये नैतिक तत्त्वे आणि पद्धती _लागू_ करण्यास कसे सुरुवात कराी? आणि चांगल्या प्रशासनासाठी या पद्धती _ऑपरेशनलाइज_ कशा कराव्यात? चला काही वास्तविक उपाय एक्सप्लोर करूया:
### 1. व्यावसायिक कोड्
### 1. व्यावसायिक संहिता
व्यावसायिक कोड्स हे सदस्यांना त्यांच्या नैतिक तत्त्वांचे पालन करण्यासाठी "प्रोत्साहन" देण्यासाठी संस्थांसाठी एक पर्याय प्रदान करतात. कोड्स हे व्यावसायिक वर्तनासाठी _नैतिक मार्गदर्शक_ आहेत, ज्यामुळे कर्मचारी किंवा सदस्य त्यांच्या संस्थेच्या तत्त्वांशी सुसंगत निर्णय घेऊ शकतात.
व्यावसायिक संहिता संस्थांना त्यांच्या नैतिक तत्त्वांना आणि मिशन स्टेटमेंटला पाठिंबा देण्यासाठी सदस्यांना "प्रोत्साहन" देण्याचा एक पर्याय देते. संहिता व्यावसायिक वर्तनासाठी _नैतिक मार्गदर्शक तत्त्वे_ आहेत, ज्यामुळे कर्मचारी किंवा सदस्य त्यांच्या संस्थेच्या तत्त्वांशी जुळणारे निर्णय घेऊ शकतात. सदस्यांकडून स्वेच्छेने अनुपालन केल्यास ते चांगले असते; तथापि, अनेक संस्था सदस्यांकडून अनुपालन करण्यासाठी अतिरिक्त बक्षिसे आणि दंड देतात.
उदाहरणे:
* [Oxford Munich](http://www.code-of-ethics.org/code-of-conduct/) Code of Ethics
* [Data Science Association](http://datascienceassn.org/code-of-conduct.html) Code of Conduct (2013 मध्ये तयार)
* [Data Science Association](http://datascienceassn.org/code-of-conduct.html) Code of Conduct (2013 मध्ये तयार केले)
* [ACM Code of Ethics and Professional Conduct](https://www.acm.org/code-of-ethics) (1993 पासून)
> 🚨 तुम्ही व्यावसायिक अभियांत्रिकी किंवा डेटा सायन्स संस्थेचे सदस्य आहात का? त्यांच्या साइटवर शोधा की त्यांनी व्यावसायिक नैतिकतेचा कोड परिभाषित केला आहे का. यामध्ये त्यांच्या नैतिक तत्त्वांबद्दल काय म्हटले आहे? ते सदस्यांना कोडचे पालन करण्यासाठी कसे "प्रोत्साहित" करत आहेत?
> 🚨 तुम्ही व्यावसायिक अभियांत्रिकी किंवा डेटा सायन्स संस्थेचे सदस्य आहात का? त्यांच्या साइटवर जा आणि त्यांनी व्यावसायिक नैतिकतेची संहिता परिभाषित केली आहे का ते पहा. त्यांच्या नैतिक तत्त्वांबद्दल काय सांगते? ते सदस्यांना संहितेचे पालन करण्यासाठी कसे "प्रोत्साहन" देत आहेत?
### 2. नैतिकता चेकलिस्ट
व्यावसायिक कोड्स व्यावसायिकांकडून अपेक्षित _नैतिक वर्तन_ परिभाषित करतात, परंतु त्यांना मोठ्या प्रमाणावर प्रकल्पांमध्ये अंमलबजावणीसाठी [मर्यादा आहेत](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md). त्याऐवजी, अनेक डेटा सायन्स तज्ञ [चेकलिस्टसाठी वकिली करतात](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md), ज्यामुळे तत्त्वे पद्धतींशी जोडता येतात.
व्यावसायिक संहिता व्यावसायिकांकडून आवश्यक _नैतिक वर्तन_ परिभाषित करतात, परंतु मोठ्या प्रमाणातील प्रकल्पांमध्ये अंमलबजावणीमध्ये [मर्यादा आहेत](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md). त्याऐवजी, अनेक डेटा सायन्स तज्ञ [चेकलिस्ट](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md) ची शिफारस करतात, ज्यामुळे तत्त्वे अधिक ठोस आणि कृतीक्षम पद्धतींमध्ये जोडली जाऊ शकतात.
चेकलिस्ट प्रश्नांना "होय/नाही" कार्यांमध्ये रूपांतरित करतात ज्यांना ऑपरेशनलाइज करता येते, ज्यामुळे त्यांना मानक उत्पादन रिलीज वर्कफ्लोचा भाग म्हणून ट्रॅक करता येते.
उदाहरणे:
* [Deon](https://deon.drivendata.org/) - उद्योगाच्या शिफारशींवर आधारित सामान्य-उद्देश डेटा नैतिकता चेकलिस्ट.
* [Privacy Audit Checklist](https://cyber.harvard.edu/ecommerce/privacyaudit.html) - माहिती हाताळणी पद्धतींसाठी मार्गदर्शन.
* [AI Fairness Checklist](https://www.microsoft.com/en-us/research/project/ai-fairness-checklist/) - AI विकास चक्रांमध्ये न्याय्यतेच्या तपासणीसाठी तयार.
* [22 questions for ethics in data and AI](https://medium.com/the-organization/22-questions-for-ethics-in-data-and-ai-efb68fd19429) - नैतिक मुद्द्यांच्या प्राथमिक अन्वेषणासाठी फ्रेमवर्क.
* [Deon](https://deon.drivendata.org/) - [उद्योगाच्या शिफारसीं](https://deon.drivendata.org/#checklist-citations) वरून तयार केलेली सामान्य-उद्देश डेटा नैतिकता चेकलिस्ट, सोपी एकत्रीकरणासाठी कमांड-लाइन टूलसह.
* [Privacy Audit Checklist](https://cyber.harvard.edu/ecommerce/privacyaudit.html) - कायदेशीर आणि सामाजिक प्रदर्शनाच्या दृष्टिकोनातून माहिती हाताळण्याच्या पद्धतींसाठी सामान्य मार्गदर्शन प्रदान करते.
* [AI Fairness Checklist](https://www.microsoft.com/en-us/research/project/ai-fairness-checklist/) - AI विकास चक्रांमध्ये न्याय्यतेच्या तपासणीचा अवलंब आणि समाकलन समर्थन करण्यासाठी AI तज्ञांनी तयार केले.
* [22 questions for ethics in data and AI](https://medium.com/the-organization/22-questions-for-ethics-in-data-and-ai-efb68fd19429) - अधिक खुले फ्रेमवर्क, डिझाइन, अंमलबजावणी आणि संस्थात्मक संदर्भांमध्ये नैतिक समस्यांच्या प्रारंभिक अन्वेषणासाठी संरचित.
### 3. नैतिकता नियम
नैतिकता म्हणजे सामायिक मूल्ये परिभाषित करणे आणि _स्वेच्छेने_ योग्य गोष्ट करणे. **अनुपालन** म्हणजे _कायद्याचे पालन करणे_ जिथे परिभाषित केले आहे. **प्रशासन** म्हणजे संस्थांमध्ये नैतिक तत्त्वे अंमलात आणण्यासाठी आणि कायद्याचे पालन करण्यासाठी सर्व मार्ग.
नैतिकता म्हणजे सामायिक मूल्ये परिभाषित करणे आणि _स्वेच्छेने_ योग्य गोष्ट करणे. **अनुपालन** म्हणजे _कायदा पाळणे_ जेथे परिभाषित केले आहे. **प्रशासन** म्हणजे संस्थांमध्ये नैतिक तत्त्वे अंमलात आणण्यासाठी आणि स्थापित कायद्याचे पालन करण्यासाठी ऑपरेट करण्याच्या सर्व मार्गांचा समावेश.
उदाहरणे:
* `1974`, [US Privacy Act](https://www.justice.gov/opcl/privacy-act-1974) - वैयक्तिक माहितीच्या वापरावर नियंत्रण.
आज, संस्थांमध्ये प्रशासन दोन प्रकारे घेतले जाते. प्रथम, हे **नैतिक AI** तत्त्वे परिभाषित करण्याबद्दल आहे आणि संस्थेतील सर्व AI-संबंधित प्रकल्पांमध्ये अवलंबन अंमलात आणण्यासाठी पद्धती स्थापित करण्याबद्दल आहे. दुसरे म्हणजे, ते कार्यरत असलेल्या प्रदेशांसाठी सर्व सरकारी-मंडेटेड **डेटा संरक्षण नियमांचे** पालन करण्याबद्दल आहे.
डेटा संरक्षण आणि गोपनीयता नियमांची उदाहरणे:
* `1974`, [US Privacy Act](https://www.justice.gov/opcl/privacy-act-1974) - _फेडरल सरकार_ वैयक्तिक माहितीचे संकलन, वापर आणि प्रकटीकरण नियंत्रित करते.
* `1996`, [US Health Insurance Portability & Accountability Act (HIPAA)](https://www.cdc.gov/phlp/publications/topic/hipaa.html) - वैयक्तिक आरोग्य डेटा संरक्षित करते.
* `2018`, [General Data Protection Regulation (GDPR)](https://gdpr-info.eu/) - वापरकर्ता हक्क, डेटा संरक्षण आणि गोपनीयता प्रदान करते.
* `1998`, [US Children's Online Privacy Protection Act (COPPA)](https://www.ftc.gov/enforcement/rules/rulemaking-regulatory-reform-proceedings/childrens-online-privacy-protection-rule) - 13 वर्षांखालील मुलांच्या डेटा गोपनीयतेचे संरक्षण करते.
* `2018`, [General Data Protection Regulation (GDPR)](https://gdpr-info.eu/) - वापरकर्त्याचे अधिकार, डेटा संरक्षण आणि गोपनीयता प्रदान करते.
* `2018`, [California Consumer Privacy Act (CCPA)](https://www.oag.ca.gov/privacy/ccpa) ग्राहकांना त्यांच्या (वैयक्तिक) डेटावर अधिक _अधिकार_ देते.
* `2021`, चीनचे [Personal Information Protection Law](https://www.reuters.com/world/china/china-passes-new-personal-data-privacy-law-take-effect-nov-1-2021-08-20/) नुकतेच पास झाले, जगातील सर्वात मजबूत ऑनलाइन डेटा गोपनीयता नियम तयार करत आहे.
> 🚨 युरोपियन युनियनने परिभाषित केलेले GDPR (General Data Protection Regulation) आज सर्वात प्रभावी डेटा गोपनीयता नियमांपैकी एक आहे. तुम्हाला माहित आहे का की ते नागरिकांच्या डिजिटल गोपनीयता आणि वैयक्तिक डेटाचे संरक्षण करण्यासाठी [8 वापरकर्ता हक्क](https://www.freeprivacypolicy.com/blog/8-user-rights-gdpr) देखील परिभाषित करते?
> 🚨 युरोपियन युनियनने परिभाषित केलेले GDPR (General Data Protection Regulation) आज सर्वात प्रभावी डेटा गोपनीयता नियमांपैकी एक आहे. तुम्हाला माहित आहे का की ते नागरिकांच्या डिजिटल गोपनीयता आणि वैयक्तिक डेटाचे संरक्षण करण्यासाठी [8 वापरकर्त्याचे अधिकार](https://www.freeprivacypolicy.com/blog/8-user-rights-gdpr) देखील परिभाषित करते? हे काय आहेत आणि ते का महत्त्वाचे आहेत ते जाणून घ्या.
### 4. नैतिकता संस्कृती
_अनुपालन_ (कायद्याचे पालन करणे) आणि [प्रणालीगत मुद्द्यांना](https://www.coursera.org/learn/data-science-ethics/home/week/4) संबोधित करणे यामध्ये एक अमूर्त अंतर आहे.
लक्षात घ्या की _अनुपालन_ (कायद्याच्या "अक्षर" पूर्ण करण्यासाठी पुरेसे करणे) आणि [सिस्टममधील समस्या](https://www.coursera.org/learn/data-science-ethics/home/week/4) (जसे की ऑसिफिकेशन, माहिती विषमता आणि वितरणात्मक अन्याय) यावर लक्ष केंद्रित करणे यामध्ये एक अमूर्त अंतर आहे जे AI च्या शस्त्रीकरणाला गती देऊ शकते.
हे [नैतिकता संस्कृती परिभाषित करण्यासाठी सहकार्यात्मक दृष्टिकोन](https://towardsdatascience.com/why-ai-ethics-requires-a-culture-driven-approach-26f451afa29f) आवश्यक आहे, जे भावनिक कनेक्शन आणि उद्योगातील _सुसंगत सामायिक मूल्ये_ तयार करतात.
उत्तरार्धासाठी [नैतिकता संस्कृती परिभाषित करण्यासाठी सहोगात्मक दृष्टिकोन](https://towardsdatascience.com/why-ai-ethics-requires-a-culture-driven-approach-26f451afa29f) आवश्यक आहे जे भावनिक कनेक्शन आणि उद्योगातील _संघटनांमध्ये_ सातत्यपूर्ण सामायिक मूल्ये तयार करतात. यासाठी संस्थांमध्ये अधिक [औपचारिक डेटा नैतिकता संस्कृती](https://www.codeforamerica.org/news/formalizing-an-ethical-data-culture/) आवश्यक आहे - _कोणालाही_ [Andon cord खेचण्याची](https://en.wikipedia.org/wiki/Andon_(manufacturing)) परवानगी देणे (प्रक्रियेत लवकर नैतिक चिंता वाढवण्यासाठी) आणि AI प्रकल्पांमध्ये टीम तयार करण्यासाठी _नैतिक मूल्यांकन_ (उदा., भरतीमध्ये) एक मुख्य निकष बनवणे.
---
## [पाठानंतरचा क्विझ](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/3) 🎯
## [Post-lecture quiz](https://ff-quizzes.netlify.app/en/ds/) 🎯
## पुनरावलोकन आणि स्व-अभ्यास
कोर्सेस आणि पुस्तके नैतिकतेच्य मुख्य संकल्पना आणि आव्हान समजून घेण्यास मदत करतात, तर केस स्टडीज आणि साधने वास्तव जीवनातील नैतिकता पद्धतींमध्ये मदत करतात.
कोर्सेस आणि पुस्तके मुख्य नैतिकता संकल्पना आणि आव्हान समजून घेण्यास मदत करतात, तर केस स्टडीज आणि साधने वास्तविक जीवनातील संदर्भात लागू नैतिकता पद्धतींमध्ये मदत करतात. येथे सुरुवात करण्यासाठी काही संसाधने आहेत.
* [Machine Learning For Beginners](https://github.com/microsoft/ML-For-Beginners/blob/main/1-Introduction/3-fairness/README.md) - Microsoft कडून न्याय्यतेवर धडा.
* [जवाबदार AI चे तत्त्वे](https://docs.microsoft.com/en-us/learn/modules/responsible-ai-principles/) - Microsoft Learn कडून मोफत शिकण्याचा मार्ग.
* [नैतिकता आणि डेटा सायन्स](https://resources.oreilly.com/examples/0636920203964) - O'Reilly ईबुक (M. Loukides, H. Mason इ.)
* [डेटा सायन्स नैतिकता](https://www.coursera.org/learn/data-science-ethics#syllabus) - मिशिगन विद्यापीठाचा ऑनलाइन कोर्स.
* [एथिक्स अनरॅप्ड](https://ethicsunwrapped.utexas.edu/case-studies) - टेक्सास विद्यापीठातील केस स्टडीज.
* [Responsible AI चे तत्त्वे](https://docs.microsoft.com/en-us/learn/modules/responsible-ai-principles/) - Microsoft Learn कडून मोफत शिकण्याचा मार्ग.
* [नैतिकता आणि डेटा विज्ञान](https://resources.oreilly.com/examples/0636920203964) - ओ'रेली ईबुक (M. Loukides, H. Mason इ.)
* [डेटा विज्ञान नैतिकता](https://www.coursera.org/learn/data-science-ethics#syllabus) - मिशिगन विद्यापीठाचा ऑनलाइन कोर्स.
* [Ethics Unwrapped](https://ethicsunwrapped.utexas.edu/case-studies) - टेक्सास विद्यापीठाकडून केस स्टडीज.
# असाइनमेंट
[डेटा नैतिकतेवरील केस स्टडी लिहा](assignment.md)
[डेटा नैतिकतेसंबंधी केस स्टडी लिहा](assignment.md)
---
**अस्वीकरण**:
हा दस्तऐवज AI भाषांतर सेवा [Co-op Translator](https://github.com/Azure/co-op-translator) वापरून भाषांतरित करण्यात आला आहे. आम्ही अचूकतेसाठी प्रयत्नशील असलो तरी, कृपया लक्षात ठेवा की स्वयंचलित भाषांतरे त्रुटी किंवा अचूकतेच्या अभावाने युक्त असू शकतात. मूळ भाषेतील दस्तऐवज हा अधिकृत स्रोत मानला जावा. महत्त्वाच्या माहितीसाठी, व्यावसायिक मानवी भाषांतराची शिफारस केली जाते. या भाषांतराचा वापर करून उद्भवलेल्या कोणत्याही गैरसमज किंवा चुकीच्या अर्थासाठी आम्ही जबाबदार राहणार नाही.
हा दस्तऐवज AI भाषांतर सेवा [Co-op Translator](https://github.com/Azure/co-op-translator) चा वापर करून भाषांतरित करण्यात आला आहे. आम्ही अचूकतेसाठी प्रयत्नशील असलो तरी कृपया लक्षात ठेवा की स्वयंचलित भाषांतरे त्रुटी किंवा अचूकतेच्या अभावाने युक्त असू शकतात. मूळ भाषेतील दस्तऐवज हा अधिकृत स्रोत मानला जावा. महत्त्वाच्या माहितीसाठी व्यावसायिक मानवी भाषांतराची शिफारस केली जाते. या भाषांतराचा वापर करून उद्भवलेल्या कोणत्याही गैरसमज किंवा चुकीच्या अर्थासाठी आम्ही जबाबदार राहणार नाही.

@ -1,8 +1,8 @@
<!--
CO_OP_TRANSLATOR_METADATA:
{
"original_hash": "8796f41f566a0a8ebb72863a83d558ed",
"translation_date": "2025-08-28T19:03:48+00:00",
"original_hash": "3a34157cc63516eba97c89a0b2f8c3e6",
"translation_date": "2025-09-03T21:38:29+00:00",
"source_file": "1-Introduction/02-ethics/README.md",
"language_code": "ms"
}
@ -17,86 +17,91 @@ CO_OP_TRANSLATOR_METADATA:
Kita semua adalah warganegara data yang hidup dalam dunia yang dipenuhi data.
Trend pasaran menunjukkan bahawa menjelang 2022, 1-dalam-3 organisasi besar akan membeli dan menjual data mereka melalui [Pasaran dan Pertukaran](https://www.gartner.com/smarterwithgartner/gartner-top-10-trends-in-data-and-analytics-for-2020/) dalam talian. Sebagai **Pembangun Aplikasi**, kita akan mendapati lebih mudah dan murah untuk mengintegrasikan pandangan berasaskan data dan automasi berasaskan algoritma ke dalam pengalaman pengguna harian. Tetapi apabila AI menjadi semakin meluas, kita juga perlu memahami potensi bahaya yang disebabkan oleh [penggunaan algoritma secara salah](https://www.youtube.com/watch?v=TQHs8SA1qpk) pada skala besar.
Trend pasaran menunjukkan bahawa menjelang 2022, 1-dalam-3 organisasi besar akan membeli dan menjual data mereka melalui [Pasaran dan Pertukaran](https://www.gartner.com/smarterwithgartner/gartner-top-10-trends-in-data-and-analytics-for-2020/) dalam talian. Sebagai **Pembangun Aplikasi**, kita akan mendapati lebih mudah dan murah untuk mengintegrasikan pandangan berasaskan data dan automasi berasaskan algoritma ke dalam pengalaman pengguna harian. Tetapi apabila AI menjadi semakin meluas, kita juga perlu memahami potensi bahaya yang disebabkan oleh [penggunaan algoritma secara senjata](https://www.youtube.com/watch?v=TQHs8SA1qpk) pada skala besar.
Trend juga menunjukkan bahawa kita akan mencipta dan menggunakan lebih daripada [180 zettabait](https://www.statista.com/statistics/871513/worldwide-data-created/) data menjelang 2025. Sebagai **Saintis Data**, ini memberikan kita tahap akses yang belum pernah terjadi sebelumnya kepada data peribadi. Ini bermakna kita boleh membina profil tingkah laku pengguna dan mempengaruhi pengambilan keputusan dengan cara yang mencipta [ilusi pilihan bebas](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice) sambil berpotensi mendorong pengguna ke arah hasil yang kita kehendaki. Ia juga menimbulkan persoalan yang lebih luas mengenai privasi data dan perlindungan pengguna.
Trend juga menunjukkan bahawa kita akan mencipta dan menggunakan lebih daripada [180 zettabyte](https://www.statista.com/statistics/871513/worldwide-data-created/) data menjelang 2025. Sebagai **Saintis Data**, ini memberikan kita tahap akses yang belum pernah terjadi sebelumnya kepada data peribadi. Ini bermakna kita boleh membina profil tingkah laku pengguna dan mempengaruhi pengambilan keputusan dengan cara yang mencipta [ilusi pilihan bebas](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice) sambil berpotensi mendorong pengguna ke arah hasil yang kita pilih. Ia juga menimbulkan persoalan yang lebih luas mengenai privasi data dan perlindungan pengguna.
Etika data kini menjadi _pengawal selia yang diperlukan_ untuk sains data dan kejuruteraan, membantu kita meminimumkan potensi bahaya dan akibat yang tidak diingini daripada tindakan berasaskan data kita. [Gartner Hype Cycle untuk AI](https://www.gartner.com/smarterwithgartner/2-megatrends-dominate-the-gartner-hype-cycle-for-artificial-intelligence-2020/) mengenal pasti trend berkaitan dalam etika digital, AI yang bertanggungjawab, dan tadbir urus AI sebagai pemacu utama untuk megatrend yang lebih besar seperti _pendemokrasian_ dan _perindustrian_ AI.
Etika data kini menjadi _panduan yang diperlukan_ untuk sains data dan kejuruteraan, membantu kita meminimumkan potensi bahaya dan akibat yang tidak diingini daripada tindakan berasaskan data kita. [Gartner Hype Cycle untuk AI](https://www.gartner.com/smarterwithgartner/2-megatrends-dominate-the-gartner-hype-cycle-for-artificial-intelligence-2020/) mengenal pasti trend yang relevan dalam etika digital, AI yang bertanggungjawab, dan tadbir urus AI sebagai pemacu utama untuk trend besar seperti _demokratisasi_ dan _perindustrian_ AI.
![Gartner's Hype Cycle untuk AI - 2020](https://images-cdn.newscred.com/Zz1mOWJhNzlkNDA2ZTMxMWViYjRiOGFiM2IyMjQ1YmMwZQ==)
Dalam pelajaran ini, kita akan meneroka bidang etika data yang menarik - daripada konsep asas dan cabaran, kepada kajian kes dan konsep AI yang diterapkan seperti tadbir urus - yang membantu mewujudkan budaya etika dalam pasukan dan organisasi yang bekerja dengan data dan AI.
Dalam pelajaran ini, kita akan meneroka bidang menarik etika data - daripada konsep asas dan cabaran, kepada kajian kes dan konsep AI yang diterapkan seperti tadbir urus - yang membantu mewujudkan budaya etika dalam pasukan dan organisasi yang bekerja dengan data dan AI.
## [Kuiz Pra-Kuliah](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/2) 🎯
## [Kuiz pra-kuliah](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/2) 🎯
## Definisi Asas
Mari kita mulakan dengan memahami istilah asas.
Perkataan "etika" berasal daripada [perkataan Yunani "ethikos"](https://en.wikipedia.org/wiki/Ethics) (dan akarnya "ethos") yang bermaksud _sifat watak atau moral_.
Perkataan "etika" berasal daripada [perkataan Yunani "ethikos"](https://en.wikipedia.org/wiki/Ethics) (dan akarnya "ethos") yang bermaksud _watak atau sifat moral_.
**Etika** adalah tentang nilai bersama dan prinsip moral yang mengawal tingkah laku kita dalam masyarakat. Etika tidak berdasarkan undang-undang tetapi pada norma yang diterima secara meluas tentang apa yang "betul vs. salah". Walau bagaimanapun, pertimbangan etika boleh mempengaruhi inisiatif tadbir urus korporat dan peraturan kerajaan yang mencipta lebih banyak insentif untuk pematuhan.
**Etika** adalah tentang nilai-nilai bersama dan prinsip moral yang mengawal tingkah laku kita dalam masyarakat. Etika tidak berdasarkan undang-undang tetapi pada norma yang diterima secara meluas tentang apa yang "betul vs. salah". Walau bagaimanapun, pertimbangan etika boleh mempengaruhi inisiatif tadbir urus korporat dan peraturan kerajaan yang mencipta lebih banyak insentif untuk pematuhan.
**Etika Data** adalah [cabang baru etika](https://royalsocietypublishing.org/doi/full/10.1098/rsta.2016.0360#sec-1) yang "mengkaji dan menilai masalah moral yang berkaitan dengan _data, algoritma dan amalan yang berkaitan_". Di sini, **"data"** memberi tumpuan kepada tindakan yang berkaitan dengan penjanaan, rakaman, kurasi, pemprosesan, penyebaran, perkongsian, dan penggunaan, **"algoritma"** memberi tumpuan kepada AI, agen, pembelajaran mesin, dan robot, dan **"amalan"** memberi tumpuan kepada topik seperti inovasi yang bertanggungjawab, pengaturcaraan, penggodaman, dan kod etika.
**Etika Data** adalah [cabang baru etika](https://royalsocietypublishing.org/doi/full/10.1098/rsta.2016.0360#sec-1) yang "mengaji dan menilai masalah moral yang berkaitan dengan _data, algoritma dan amalan yang berkaitan_". Di sini, **"data"** memberi tumpuan kepada tindakan yang berkaitan dengan penjanaan, rakaman, kurasi, pemprosesan, penyebaran, perkongsian, dan penggunaan, **"algoritma"** memberi tumpuan kepada AI, agen, pembelajaran mesin, dan robot, dan **"amalan"** memberi tumpuan kepada topik seperti inovasi yang bertanggungjawab, pengaturcaraan, penggodaman, dan kod etika.
**Etika Terapan** adalah [aplikasi praktikal pertimbangan moral](https://en.wikipedia.org/wiki/Applied_ethics). Ia adalah proses menyiasat secara aktif isu etika dalam konteks _tindakan, produk, dan proses dunia nyata_, dan mengambil langkah pembetulan untuk memastikan bahawa ini kekal selaras dengan nilai etika yang telah ditentukan.
**Etika Terapan** adalah [aplikasi praktikal pertimbangan moral](https://en.wikipedia.org/wiki/Applied_ethics). Ia adalah proses menyiasat secara aktif isu etika dalam konteks _tindakan dunia nyata, produk dan proses_, dan mengambil langkah pembetulan untuk memastikan ia kekal selaras dengan nilai etika yang telah ditentukan.
**Budaya Etika** adalah tentang [_mengoperasikan_ etika terapan](https://hbr.org/2019/05/how-to-design-an-ethical-organization) untuk memastikan bahawa prinsip dan amalan etika kita diterima pakai secara konsisten dan boleh diskalakan di seluruh organisasi. Budaya etika yang berjaya mentakrifkan prinsip etika di seluruh organisasi, menyediakan insentif yang bermakna untuk pematuhan, dan mengukuhkan norma etika dengan menggalakkan dan memperkuat tingkah laku yang diingini di setiap peringkat organisasi.
## Konsep Etika
Dalam bahagian ini, kita akan membincangkan konsep seperti **nilai bersama** (prinsip) dan **cabaran etika** (masalah) untuk etika data - dan meneroka **kajian kes** yang membantu anda memahami konsep ini dalam konteks dunia nyata.
### 1. Prinsip Etika
Setiap strategi etika data bermula dengan mentakrifkan _prinsip etika_ - "nilai bersama" yang menerangkan tingkah laku yang boleh diterima, dan membimbing tindakan yang mematuhi, dalam projek data & AI kita. Anda boleh mentakrifkan ini di peringkat individu atau pasukan. Walau bagaimanapun, kebanyakan organisasi besar menggariskan ini dalam pernyataan misi atau rangka kerja _AI yang beretika_ yang ditakrifkan di peringkat korporat dan dikuatkuasakan secara konsisten di semua pasukan.
Setiap strategi etika data bermula dengan mentakrifkan _prinsip etika_ - "nilai bersama" yang menerangkan tingkah laku yang boleh diterima, dan membimbing tindakan yang mematuhi, dalam projek data & AI kita. Anda boleh mentakrifkan ini di peringkat individu atau pasukan. Walau bagaimanapun, kebanyakan organisasi besar menggariskan ini dalam kenyataan misi AI etika atau rangka kerja yang ditakrifkan di peringkat korporat dan dikuatkuasakan secara konsisten di semua pasukan.
**Contoh:** Pernyataan misi [AI Bertanggungjawab](https://www.microsoft.com/en-us/ai/responsible-ai) Microsoft berbunyi: _"Kami komited kepada kemajuan AI yang didorong oleh prinsip etika yang meletakkan manusia di tempat pertama"_ - mengenal pasti 6 prinsip etika dalam rangka kerja di bawah:
**Contoh:** Kenyataan misi [AI Bertanggungjawab](https://www.microsoft.com/en-us/ai/responsible-ai) Microsoft berbunyi: _"Kami komited kepada kemajuan AI yang didorong oleh prinsip etika yang mengutamakan manusia"_ - mengenal pasti 6 prinsip etika dalam rangka kerja di bawah:
![AI Bertanggungjawab di Microsoft](https://docs.microsoft.com/en-gb/azure/cognitive-services/personalizer/media/ethics-and-responsible-use/ai-values-future-computed.png)
Mari kita terokai prinsip-prinsip ini secara ringkas. _Ketelusan_ dan _akauntabiliti_ adalah nilai asas yang menjadi asas kepada prinsip lain - jadi mari kita mulakan di sana:
Mari kita terokai prinsip-prinsip ini secara ringkas. _Ketelusan_ dan _akauntabiliti_ adalah nilai asas yang membina prinsip lain - jadi mari kita mulakan di sana:
* [**Akauntabiliti**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) menjadikan pengamal _bertanggungjawab_ untuk operasi data & AI mereka, dan pematuhan kepada prinsip etika ini.
* [**Ketelusan**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) memastikan bahawa tindakan data dan AI _difahami_ (boleh ditafsirkan) oleh pengguna, menjelaskan apa dan mengapa di sebalik keputusan.
* [**Ketelusan**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) memastikan tindakan data dan AI _difahami_ (boleh ditafsirkan) oleh pengguna, menerangkan apa dan mengapa di sebalik keputusan.
* [**Keadilan**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1%3aprimaryr6) - memberi tumpuan kepada memastikan AI melayan _semua orang_ secara adil, menangani sebarang bias sosio-teknikal sistemik atau tersirat dalam data dan sistem.
* [**Kebolehpercayaan & Keselamatan**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - memastikan bahawa AI berkelakuan _konsisten_ dengan nilai yang ditentukan, meminimumkan potensi bahaya atau akibat yang tidak diingini.
* [**Privasi & Keselamatan**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - adalah tentang memahami asal-usul data, dan menyediakan _privasi data dan perlindungan berkaitan_ kepada pengguna.
* [**Keterangkuman**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - adalah tentang mereka bentuk penyelesaian AI dengan niat, menyesuaikannya untuk memenuhi _pelbagai keperluan_ dan keupayaan manusia.
* [**Kebolehpercayaan & Keselamatan**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - memastikan AI berkelakuan _konsisten_ dengan nilai yang ditentukan, meminimumkan potensi bahaya atau akibat yang tidak diingini.
* [**Privasi & Keselamatan**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - adalah tentang memahami asal usul data, dan menyediakan _privasi data dan perlindungan berkaitan_ kepada pengguna.
* [**Keterangkuman**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - adalah tentang mereka bentuk penyelesaian AI dengan niat, menyesuaikannya untuk memenuhi _pelbagai keperluan & keupayaan manusia_.
> 🚨 Fikirkan tentang apa yang boleh menjadi pernyataan misi etika data anda. Terokai rangka kerja AI beretika daripada organisasi lain - berikut adalah contoh daripada [IBM](https://www.ibm.com/cloud/learn/ai-ethics), [Google](https://ai.google/principles), dan [Facebook](https://ai.facebook.com/blog/facebooks-five-pillars-of-responsible-ai/). Apakah nilai bersama yang mereka miliki? Bagaimana prinsip-prinsip ini berkaitan dengan produk AI atau industri yang mereka ceburi?
> 🚨 Fikirkan tentang apa yang boleh menjadi kenyataan misi etika data anda. Terokai rangka kerja AI etika daripada organisasi lain - berikut adalah contoh daripada [IBM](https://www.ibm.com/cloud/learn/ai-ethics), [Google](https://ai.google/principles), dan [Facebook](https://ai.facebook.com/blog/facebooks-five-pillars-of-responsible-ai/). Apakah nilai bersama yang mereka ada? Bagaimana prinsip ini berkaitan dengan produk AI atau industri yang mereka beroperasi?
### 2. Cabaran Etika
Setelah kita mentakrifkan prinsip etika, langkah seterusnya adalah menilai tindakan data dan AI kita untuk melihat sama ada ia selaras dengan nilai bersama tersebut. Fikirkan tentang tindakan anda dalam dua kategori: _pengumpulan data_ dan _reka bentuk algoritma_.
Setelah kita mentakrifkan prinsip etika, langkah seterusnya adalah menilai tindakan data dan AI kita untuk melihat sama ada ia selaras dengan nilai bersama tersebut. Fikirkan tentang tindakan anda dalam dua kategori: _pengumpulan data_ dan _reka bentuk algoritma_.
Dalam pengumpulan data, tindakan mungkin melibatkan **data peribadi** atau maklumat peribadi yang boleh dikenal pasti (PII) untuk individu yang boleh dikenal pasti. Ini termasuk [pelbagai item data bukan peribadi](https://ec.europa.eu/info/law/law-topic/data-protection/reform/what-personal-data_en) yang _secara kolektif_ mengenal pasti individu. Cabaran etika boleh berkaitan dengan _privasi data_, _pemilikan data_, dan topik berkaitan seperti _persetujuan yang dimaklumkan_ dan _hak harta intelek_ untuk pengguna.
Dengan pengumpulan data, tindakan mungkin melibatkan **data peribadi** atau maklumat yang boleh dikenal pasti secara peribadi (PII) untuk individu yang boleh dikenal pasti. Ini termasuk [pelbagai item data bukan peribadi](https://ec.europa.eu/info/law/law-topic/data-protection/reform/what-personal-data_en) yang _secara kolektif_ mengenal pasti individu. Cabaran etika boleh berkaitan dengan _privasi data_, _pemilikan data_, dan topik berkaitan seperti _persetujuan yang dimaklumkan_ dan _hak harta intelek_ untuk pengguna.
Dalam reka bentuk algoritma, tindakan akan melibatkan pengumpulan & kurasi **set data**, kemudian menggunakannya untuk melatih & menggunakan **model data** yang meramalkan hasil atau mengautomasikan keputusan dalam konteks dunia nyata. Cabaran etika boleh timbul daripada _bias set data_, isu _kualiti data_, _ketidakadilan_, dan _salah tafsir_ dalam algoritma - termasuk beberapa isu yang bersifat sistemik.
Dengan reka bentuk algoritma, tindakan akan melibatkan pengumpulan & kurasi **set data**, kemudian menggunakannya untuk melatih & menggunakan **model data** yang meramalkan hasil atau mengautomasikan keputusan dalam konteks dunia nyata. Cabaran etika boleh timbul daripada _bias set data_, isu _kualiti data_, _ketidakadilan_, dan _salah tafsir_ dalam algoritma - termasuk beberapa isu yang bersifat sistemik.
Dalam kedua-dua kes, cabaran etika menonjolkan kawasan di mana tindakan kita mungkin bertentangan dengan nilai bersama kita. Untuk mengesan, mengurangkan, meminimumkan, atau menghapuskan kebimbangan ini - kita perlu bertanya soalan moral "ya/tidak" berkaitan dengan tindakan kita, kemudian mengambil tindakan pembetulan seperti yang diperlukan. Mari kita lihat beberapa cabaran etika dan soalan moral yang mereka timbulkan:
Dalam kedua-dua kes, cabaran etika menyerlahkan kawasan di mana tindakan kita mungkin bertentangan dengan nilai bersama kita. Untuk mengesan, mengurangkan, meminimumkan, atau menghapuskan kebimbangan ini - kita perlu bertanya soalan moral "ya/tidak" berkaitan dengan tindakan kita, kemudian mengambil tindakan pembetulan yang diperlukan. Mari kita lihat beberapa cabaran etika dan soalan moral yang mereka timbulkan:
#### 2.1 Pemilikan Data
Pengumpulan data sering melibatkan data peribadi yang boleh mengenal pasti subjek data. [Pemilikan data](https://permission.io/blog/data-ownership) adalah tentang _kawalan_ dan [_hak pengguna_](https://permission.io/blog/data-ownership) berkaitan dengan penciptaan, pemprosesan, dan penyebaran data.
Pengumpulan data sering melibatkan data peribadi yang boleh mengenal pasti subjek data. [Pemilikan data](https://permission.io/blog/data-ownership) adalah tentang _kawalan_ dan [_hak pengguna_](https://permission.io/blog/data-ownership) berkaitan dengan penciptaan, pemprosesan, dan penyebaran data.
Soalan moral yang perlu kita tanya ialah:
Soalan moral yang perlu kita tanya ialah:
* Siapa yang memiliki data? (pengguna atau organisasi)
* Hak apa yang dimiliki oleh subjek data? (contoh: akses, pemadaman, kebolehangkutan)
* Hak apa yang dimiliki oleh organisasi? (contoh: membetulkan ulasan pengguna yang berniat jahat)
* Apakah hak yang dimiliki subjek data? (contoh: akses, pemadaman, kebolehangkutan)
* Apakah hak yang dimiliki organisasi? (contoh: membetulkan ulasan pengguna yang berniat jahat)
#### 2.2 Persetujuan yang Dimaklumkan
[Persetujuan yang dimaklumkan](https://legaldictionary.net/informed-consent/) mentakrifkan tindakan pengguna bersetuju dengan tindakan (seperti pengumpulan data) dengan _pemahaman penuh_ tentang fakta yang relevan termasuk tujuan, risiko yang berpotensi, dan alternatif.
[Persetujuan yang dimaklumkan](https://legaldictionary.net/informed-consent/) mentakrifkan tindakan pengguna bersetuju dengan tindakan (seperti pengumpulan data) dengan _pemahaman penuh_ tentang fakta yang relevan termasuk tujuan, risiko yang berpotensi, dan alternatif.
Soalan untuk diterokai di sini ialah:
* Adakah pengguna (subjek data) memberikan kebenaran untuk pengambilan dan penggunaan data?
* Adakah pengguna memahami tujuan data itu dikumpulkan?
* Adakah pengguna memahami tujuan data itu diambil?
* Adakah pengguna memahami risiko yang berpotensi daripada penyertaan mereka?
#### 2.3 Harta Intelek
[Harta intelek](https://en.wikipedia.org/wiki/Intellectual_property) merujuk kepada ciptaan tidak ketara yang terhasil daripada inisiatif manusia, yang mungkin _mempunyai nilai ekonomi_ kepada individu atau perniagaan.
[Harta intelek](https://en.wikipedia.org/wiki/Intellectual_property) merujuk kepada ciptaan tidak ketara yang dihasilkan daripada inisiatif manusia, yang mungkin _mempunyai nilai ekonomi_ kepada individu atau perniagaan.
Soalan untuk diterokai di sini ialah:
* Adakah data yang dikumpulkan mempunyai nilai ekonomi kepada pengguna atau perniagaan?
@ -106,17 +111,18 @@ Soalan untuk diterokai di sini ialah:
#### 2.4 Privasi Data
[Privasi data](https://www.northeastern.edu/graduate/blog/what-is-data-privacy/) atau privasi maklumat merujuk kepada pemeliharaan privasi pengguna dan perlindungan identiti pengguna berkaitan dengan maklumat yang boleh dikenal pasti secara peribadi.
[Privasi data](https://www.northeastern.edu/graduate/blog/what-is-data-privacy/) atau privasi maklumat merujuk kepada pemeliharaan privasi pengguna dan perlindungan identiti pengguna berkaitan dengan maklumat yang boleh dikenal pasti secara peribadi.
Soalan untuk diterokai di sini ialah:
* Adakah data (peribadi) pengguna dilindungi daripada penggodaman dan kebocoran?
* Adakah data pengguna hanya boleh diakses oleh pengguna dan konteks yang dibenarkan?
* Adakah data pengguna hanya boleh diakses oleh pengguna dan konteks yang diberi kuasa?
* Adakah anonimiti pengguna dipelihara apabila data dikongsi atau disebarkan?
* Bolehkah pengguna dinyahkenal pasti daripada set data yang dianonimkan?
* Bolehkah pengguna tidak dikenali daripada set data yang dianonimkan?
#### 2.5 Hak Untuk Dilupakan
[Hak Untuk Dilupakan](https://en.wikipedia.org/wiki/Right_to_be_forgotten) atau [Hak untuk Pemadaman](https://www.gdpreu.org/right-to-be-forgotten/) memberikan perlindungan tambahan kepada data peribadi pengguna. Secara khusus, ia memberikan hak kepada pengguna untuk meminta pemadaman atau penghapusan data peribadi daripada carian Internet dan lokasi lain, _dalam keadaan tertentu_ - membolehkan mereka memulakan semula dalam talian tanpa tindakan masa lalu dipegang terhadap mereka.
[Hak Untuk Dilupakan](https://en.wikipedia.org/wiki/Right_to_be_forgotten) atau [Hak untuk Pemadaman](https://www.gdpreu.org/right-to-be-forgotten/) memberikan perlindungan data peribadi tambahan kepada pengguna. Khususnya, ia memberikan pengguna hak untuk meminta pemadaman atau penghapusan data peribadi daripada carian Internet dan lokasi lain, _dalam keadaan tertentu_ - membolehkan mereka memulakan semula dalam talian tanpa tindakan lalu dipegang terhadap mereka.
Soalan untuk diterokai di sini ialah:
* Adakah sistem membenarkan subjek data meminta pemadaman?
@ -124,9 +130,10 @@ Soalan untuk diterokai di sini ialah:
* Adakah data dikumpulkan tanpa persetujuan atau dengan cara yang tidak sah?
* Adakah kita mematuhi peraturan kerajaan untuk privasi data?
#### 2.6 Bias Set Data
Bias set data atau [Bias Pengumpulan](http://researcharticles.com/index.php/bias-in-data-collection-in-research/) adalah tentang memilih subset data yang _tidak mewakili_ untuk pembangunan algoritma, mencipta potensi ketidakadilan dalam hasil keputusan untuk kumpulan yang pelbagai. Jenis bias termasuk bias pemilihan atau pensampelan, bias sukarela, dan bias instrumen.
Bias set data atau [Bias Pengumpulan](http://researcharticles.com/index.php/bias-in-data-collection-in-research/) adalah tentang memilih subset data yang _tidak mewakili_ untuk pembangunan algoritma, mencipta potensi ketidakadilan dalam hasil keputusan untuk kumpulan yang pelbagai. Jenis bias termasuk bias pemilihan atau pensampelan, bias sukarelawan, dan bias instrumen.
Soalan untuk diterokai di sini ialah:
* Adakah kita merekrut set subjek data yang mewakili?
@ -138,24 +145,24 @@ Soalan untuk diterokai di sini ialah:
[Kualiti Data](https://lakefs.io/data-quality-testing/) melihat kesahihan set data yang dikurasi yang digunakan untuk membangunkan algoritma kita, memeriksa untuk melihat sama ada ciri dan rekod memenuhi keperluan untuk tahap ketepatan dan konsistensi yang diperlukan untuk tujuan AI kita.
Soalan untuk diterokai di sini ialah:
* Adakah kita menangkap ciri _sah_ untuk kes penggunaan kita?
* Adakah data ditangkap _secara konsisten_ merentasi pelbagai sumber data?
* Adakah set data _lengkap_ untuk pelbagai keadaan atau senario?
* Adakah maklumat yang ditangkap _tepat_ dalam mencerminkan realiti?
* Adakah kita menangkap ciri yang sah untuk kes penggunaan kita?
* Adakah data ditangkap secara konsisten di seluruh sumber data yang pelbagai?
* Adakah set data lengkap untuk pelbagai keadaan atau senario?
* Adakah maklumat yang ditangkap tepat dalam mencerminkan realiti?
#### 2.8 Keadilan Algoritma
[Algorithm Fairness](https://towardsdatascience.com/what-is-algorithm-fairness-3182e161cf9f) memeriksa sama ada reka bentuk algoritma secara sistematik mendiskriminasi kumpulan subjek data tertentu, yang membawa kepada [kemungkinan bahaya](https://docs.microsoft.com/en-us/azure/machine-learning/concept-fairness-ml) dalam _pengagihan_ (di mana sumber dinafikan atau ditahan daripada kumpulan tersebut) dan _kualiti perkhidmatan_ (di mana AI kurang tepat untuk beberapa kumpulan berbanding yang lain).
[Algorithm Fairness](https://towardsdatascience.com/what-is-algorithm-fairness-3182e161cf9f) memeriksa sama ada reka bentuk algoritma secara sistematik mendiskriminasi kumpulan subjek data tertentu, yang membawa kepada [kemudaratan berpotensi](https://docs.microsoft.com/en-us/azure/machine-learning/concept-fairness-ml) dalam _pengagihan_ (di mana sumber ditolak atau tidak diberikan kepada kumpulan tersebut) dan _kualiti perkhidmatan_ (di mana AI kurang tepat untuk sesetengah kumpulan berbanding yang lain).
Soalan untuk diterokai di sini adalah:
* Adakah kita menilai ketepatan model untuk pelbagai kumpulan dan keadaan?
* Adakah kita menyemak sistem untuk kemungkinan bahaya (contohnya, stereotaip)?
* Bolehkah kita menyemak semula data atau melatih semula model untuk mengurangkan bahaya yang dikenal pasti?
* Adakah kita menilai ketepatan model untuk kumpulan dan keadaan yang pelbagai?
* Adakah kita meneliti sistem untuk kemudaratan berpotensi (contohnya, stereotaip)?
* Bolehkah kita menyemak semula data atau melatih semula model untuk mengurangkan kemudaratan yang dikenal pasti?
Terokai sumber seperti [AI Fairness checklists](https://query.prod.cms.rt.microsoft.com/cms/api/am/binary/RE4t6dA) untuk mengetahui lebih lanjut.
#### 2.9 Salah Representasi
[Salah Representasi Data](https://www.sciencedirect.com/topics/computer-science/misrepresentation) adalah tentang bertanya sama ada kita menyampaikan pandangan daripada data yang dilaporkan dengan jujur secara menipu untuk menyokong naratif yang diingini.
[Salah Representasi Data](https://www.sciencedirect.com/topics/computer-science/misrepresentation) berkaitan dengan persoalan sama ada kita menyampaikan pandangan daripada data yang dilaporkan secara jujur dengan cara yang mengelirukan untuk menyokong naratif yang diinginkan.
Soalan untuk diterokai di sini adalah:
* Adakah kita melaporkan data yang tidak lengkap atau tidak tepat?
@ -164,102 +171,102 @@ Soalan untuk diterokai di sini adalah:
* Adakah terdapat penjelasan alternatif yang mungkin menawarkan kesimpulan yang berbeza?
#### 2.10 Pilihan Bebas
[Ilusi Pilihan Bebas](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice) berlaku apabila "senibina pilihan" sistem menggunakan algoritma membuat keputusan untuk mendorong orang ke arah hasil yang diingini sambil kelihatan memberi mereka pilihan dan kawalan. [Corak gelap](https://www.darkpatterns.org/) ini boleh menyebabkan bahaya sosial dan ekonomi kepada pengguna. Oleh kerana keputusan pengguna mempengaruhi profil tingkah laku, tindakan ini berpotensi mendorong pilihan masa depan yang boleh memperkuat atau memperluaskan kesan bahaya ini.
[Ilusi Pilihan Bebas](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice) berlaku apabila "senibina pilihan" sistem menggunakan algoritma membuat keputusan untuk mendorong orang ke arah hasil yang diinginkan sambil kelihatan memberi mereka pilihan dan kawalan. [Corak gelap](https://www.darkpatterns.org/) ini boleh menyebabkan kemudaratan sosial dan ekonomi kepada pengguna. Oleh kerana keputusan pengguna mempengaruhi profil tingkah laku, tindakan ini berpotensi mendorong pilihan masa depan yang boleh memperkuat atau memperluaskan kesan kemudaratan ini.
Soalan untuk diterokai di sini adalah:
* Adakah pengguna memahami implikasi membuat pilihan itu?
* Adakah pengguna memahami implikasi membuat pilihan tersebut?
* Adakah pengguna sedar tentang pilihan (alternatif) dan kebaikan & keburukan setiap satu?
* Bolehkah pengguna membatalkan pilihan automatik atau yang dipengaruhi kemudian?
* Bolehkah pengguna membatalkan pilihan yang diotomasi atau dipengaruhi kemudian?
### 3. Kajian Kes
Untuk meletakkan cabaran etika ini dalam konteks dunia sebenar, ia membantu untuk melihat kajian kes yang menonjolkan potensi bahaya dan akibat kepada individu dan masyarakat apabila pelanggaran etika ini diabaikan.
Untuk meletakkan cabaran etika ini dalam konteks dunia nyata, adalah berguna untuk melihat kajian kes yang menonjolkan kemudaratan dan akibat yang berpotensi kepada individu dan masyarakat apabila pelanggaran etika seperti ini diabaikan.
Berikut adalah beberapa contoh:
| Cabaran Etika | Kajian Kes |
|--- |--- |
| **Persetujuan Maklum** | 1972 - [Kajian Sifilis Tuskegee](https://en.wikipedia.org/wiki/Tuskegee_Syphilis_Study) - Lelaki Afrika-Amerika yang menyertai kajian ini dijanjikan rawatan perubatan percuma _tetapi ditipu_ oleh penyelidik yang gagal memaklumkan subjek tentang diagnosis mereka atau tentang ketersediaan rawatan. Ramai subjek meninggal dunia & pasangan atau anak-anak mereka terjejas; kajian ini berlangsung selama 40 tahun. |
| **Privasi Data** | 2007 - [Hadiah data Netflix](https://www.wired.com/2007/12/why-anonymous-data-sometimes-isnt/) memberikan penyelidik _10 juta penilaian filem tanpa nama daripada 50 ribu pelanggan_ untuk membantu meningkatkan algoritma cadangan. Walau bagaimanapun, penyelidik dapat mengaitkan data tanpa nama dengan data yang boleh dikenal pasti secara peribadi dalam _set data luaran_ (contohnya, komen IMDb) - secara efektif "membatalkan tanpa nama" beberapa pelanggan Netflix.|
| **Bias Pengumpulan** | 2013 - Bandar Boston [membangunkan Street Bump](https://www.boston.gov/transportation/street-bump), sebuah aplikasi yang membolehkan warga melaporkan lubang jalan, memberikan data jalan raya yang lebih baik kepada bandar untuk mencari dan membaiki isu. Walau bagaimanapun, [orang dalam kumpulan berpendapatan rendah mempunyai akses yang kurang kepada kereta dan telefon](https://hbr.org/2013/04/the-hidden-biases-in-big-data), menjadikan isu jalan raya mereka tidak kelihatan dalam aplikasi ini. Pembangun bekerjasama dengan ahli akademik untuk menangani isu _akses saksama dan jurang digital_ demi keadilan. |
| **Keadilan Algoritma** | 2018 - Kajian MIT [Gender Shades](http://gendershades.org/overview.html) menilai ketepatan produk AI klasifikasi jantina, mendedahkan jurang ketepatan untuk wanita dan orang berwarna. [Kad Apple 2019](https://www.wired.com/story/the-apple-card-didnt-see-genderand-thats-the-problem/) kelihatan menawarkan kredit yang lebih rendah kepada wanita berbanding lelaki. Kedua-duanya menggambarkan isu bias algoritma yang membawa kepada bahaya sosio-ekonomi.|
| **Salah Representasi Data** | 2020 - [Jabatan Kesihatan Awam Georgia mengeluarkan carta COVID-19](https://www.vox.com/covid-19-coronavirus-us-response-trump/2020/5/18/21262265/georgia-covid-19-cases-declining-reopening) yang kelihatan mengelirukan warga tentang trend kes yang disahkan dengan susunan tidak kronologi pada paksi-x. Ini menggambarkan salah representasi melalui helah visualisasi. |
| **Ilusi pilihan bebas** | 2020 - Aplikasi pembelajaran [ABCmouse membayar $10 juta untuk menyelesaikan aduan FTC](https://www.washingtonpost.com/business/2020/09/04/abcmouse-10-million-ftc-settlement/) di mana ibu bapa terperangkap membayar langganan yang mereka tidak dapat batalkan. Ini menggambarkan corak gelap dalam senibina pilihan, di mana pengguna didorong ke arah pilihan yang berpotensi berbahaya. |
| **Privasi Data & Hak Pengguna** | 2021 - [Kebocoran Data Facebook](https://www.npr.org/2021/04/09/986005820/after-data-breach-exposes-530-million-facebook-says-it-will-not-notify-users) mendedahkan data daripada 530 juta pengguna, mengakibatkan penyelesaian $5 bilion kepada FTC. Walau bagaimanapun, ia enggan memberitahu pengguna tentang kebocoran tersebut, melanggar hak pengguna berkaitan ketelusan data dan akses. |
Ingin meneroka lebih banyak kajian kes? Lihat sumber ini:
| **Persetujuan Maklum** | 1972 - [Kajian Sifilis Tuskegee](https://en.wikipedia.org/wiki/Tuskegee_Syphilis_Study) - Lelaki Afrika Amerika yang mengambil bahagian dalam kajian ini dijanjikan rawatan perubatan percuma _tetapi ditipu_ oleh penyelidik yang gagal memaklumkan subjek tentang diagnosis mereka atau tentang ketersediaan rawatan. Ramai subjek meninggal dunia & pasangan atau anak-anak mereka terjejas; kajian ini berlangsung selama 40 tahun. |
| **Privasi Data** | 2007 - [Hadiah data Netflix](https://www.wired.com/2007/12/why-anonymous-data-sometimes-isnt/) memberikan penyelidik _10 juta penilaian filem tanpa nama daripada 50 ribu pelanggan_ untuk membantu meningkatkan algoritma cadangan. Walau bagaimanapun, penyelidik dapat mengaitkan data tanpa nama dengan data yang boleh dikenal pasti secara peribadi dalam _set data luaran_ (contohnya, komen IMDb) - secara efektif "membuka nama" beberapa pelanggan Netflix.|
| **Bias Pengumpulan** | 2013 - Bandar Boston [membangunkan Street Bump](https://www.boston.gov/transportation/street-bump), sebuah aplikasi yang membolehkan warga melaporkan lubang jalan, memberikan data jalan raya yang lebih baik kepada bandar untuk mencari dan membaiki masalah. Walau bagaimanapun, [orang dalam kumpulan berpendapatan rendah mempunyai akses yang kurang kepada kereta dan telefon](https://hbr.org/2013/04/the-hidden-biases-in-big-data), menjadikan isu jalan raya mereka tidak kelihatan dalam aplikasi ini. Pembangun bekerjasama dengan akademik untuk menangani isu _akses yang adil dan jurang digital_ demi keadilan. |
| **Keadilan Algoritma** | 2018 - Kajian MIT [Gender Shades](http://gendershades.org/overview.html) menilai ketepatan produk AI pengelasan jantina, mendedahkan jurang ketepatan untuk wanita dan orang berwarna. Kad [Apple 2019](https://www.wired.com/story/the-apple-card-didnt-see-genderand-thats-the-problem/) kelihatan menawarkan kredit yang kurang kepada wanita berbanding lelaki. Kedua-duanya menggambarkan isu bias algoritma yang membawa kepada kemudaratan sosio-ekonomi.|
| **Salah Representasi Data** | 2020 - Jabatan Kesihatan Awam Georgia [mengeluarkan carta COVID-19](https://www.vox.com/covid-19-coronavirus-us-response-trump/2020/5/18/21262265/georgia-covid-19-cases-declining-reopening) yang kelihatan mengelirukan rakyat tentang trend kes yang disahkan dengan susunan tidak kronologi pada paksi-x. Ini menggambarkan salah representasi melalui helah visualisasi. |
| **Ilusi pilihan bebas** | 2020 - Aplikasi pembelajaran [ABCmouse membayar $10 juta untuk menyelesaikan aduan FTC](https://www.washingtonpost.com/business/2020/09/04/abcmouse-10-million-ftc-settlement/) di mana ibu bapa terperangkap untuk membayar langganan yang mereka tidak dapat batalkan. Ini menggambarkan corak gelap dalam senibina pilihan, di mana pengguna didorong ke arah pilihan yang berpotensi merugikan. |
| **Privasi Data & Hak Pengguna** | 2021 - [Kebocoran Data Facebook](https://www.npr.org/2021/04/09/986005820/after-data-breach-exposes-530-million-facebook-says-it-will-not-notify-users) mendedahkan data daripada 530 juta pengguna, mengakibatkan penyelesaian $5 bilion kepada FTC. Walau bagaimanapun, ia enggan memaklumkan pengguna tentang kebocoran tersebut, melanggar hak pengguna berkaitan ketelusan data dan akses. |
Ingin meneroka lebih banyak kajian kes? Lihat sumber berikut:
* [Ethics Unwrapped](https://ethicsunwrapped.utexas.edu/case-studies) - dilema etika merentasi pelbagai industri.
* [Kursus Etika Data Sains](https://www.coursera.org/learn/data-science-ethics#syllabus) - kajian kes penting diterokai.
* [Di mana perkara menjadi salah](https://deon.drivendata.org/examples/) - senarai semak deon dengan contoh.
* [Kursus Etika Sains Data](https://www.coursera.org/learn/data-science-ethics#syllabus) - kajian kes penting diterokai.
* [Di mana perkara menjadi salah](https://deon.drivendata.org/examples/) - senarai semak deon dengan contoh-contoh.
> 🚨 Fikirkan tentang kajian kes yang anda lihat - adakah anda pernah mengalami, atau terjejas oleh, cabaran etika yang serupa dalam hidup anda? Bolehkah anda memikirkan sekurang-kurangnya satu lagi kajian kes yang menggambarkan salah satu cabaran etika yang telah kita bincangkan dalam bahagian ini?
> 🚨 Fikirkan tentang kajian kes yang telah anda lihat - adakah anda pernah mengalami, atau terjejas oleh, cabaran etika yang serupa dalam hidup anda? Bolehkah anda memikirkan sekurang-kurangnya satu lagi kajian kes yang menggambarkan salah satu cabaran etika yang telah kita bincangkan dalam bahagian ini?
## Etika Terapan
Kita telah bercakap tentang konsep etika, cabaran, dan kajian kes dalam konteks dunia sebenar. Tetapi bagaimana kita memulakan _menerapkan_ prinsip dan amalan etika dalam projek kita? Dan bagaimana kita _mengoperasikan_ amalan ini untuk tadbir urus yang lebih baik? Mari kita terokai beberapa penyelesaian dunia sebenar:
Kita telah membincangkan konsep etika, cabaran, dan kajian kes dalam konteks dunia nyata. Tetapi bagaimana kita memulakan _mengaplikasikan_ prinsip dan amalan etika dalam projek kita? Dan bagaimana kita _mengoperasikan_ amalan ini untuk tadbir urus yang lebih baik? Mari kita terokai beberapa penyelesaian dunia nyata:
### 1. Kod Profesional
Kod Profesional menawarkan satu pilihan untuk organisasi "mendorong" ahli untuk menyokong prinsip etika dan pernyataan misi mereka. Kod adalah _panduan moral_ untuk tingkah laku profesional, membantu pekerja atau ahli membuat keputusan yang selaras dengan prinsip organisasi mereka. Ia hanya sebaik pematuhan sukarela daripada ahli; walau bagaimanapun, banyak organisasi menawarkan ganjaran dan penalti tambahan untuk memotivasi pematuhan daripada ahli.
Kod Profesional menawarkan satu pilihan untuk organisasi "mendorong" ahli mereka menyokong prinsip etika dan pernyataan misi mereka. Kod adalah _panduan moral_ untuk tingkah laku profesional, membantu pekerja atau ahli membuat keputusan yang selaras dengan prinsip organisasi mereka. Ia hanya sebaik pematuhan sukarela daripada ahli; walau bagaimanapun, banyak organisasi menawarkan ganjaran dan penalti tambahan untuk memotivasi pematuhan daripada ahli.
Contoh termasuk:
* [Oxford Munich](http://www.code-of-ethics.org/code-of-conduct/) Kod Etika
* [Persatuan Data Sains](http://datascienceassn.org/code-of-conduct.html) Kod Tingkah Laku (dicipta 2013)
* [Kod Etika dan Tingkah Laku Profesional ACM](https://www.acm.org/code-of-ethics) (sejak 1993)
* [Data Science Association](http://datascienceassn.org/code-of-conduct.html) Kod Tingkah Laku (dibuat pada 2013)
* [ACM Code of Ethics and Professional Conduct](https://www.acm.org/code-of-ethics) (sejak 1993)
> 🚨 Adakah anda tergolong dalam organisasi kejuruteraan atau data sains profesional? Terokai laman web mereka untuk melihat sama ada mereka mentakrifkan kod etika profesional. Apa yang dikatakan tentang prinsip etika mereka? Bagaimana mereka "mendorong" ahli untuk mengikuti kod tersebut?
> 🚨 Adakah anda tergolong dalam organisasi profesional kejuruteraan atau sains data? Terokai laman web mereka untuk melihat sama ada mereka mentakrifkan kod etika profesional. Apa yang dikatakan tentang prinsip etika mereka? Bagaimana mereka "mendorong" ahli untuk mengikuti kod tersebut?
### 2. Senarai Semak Etika
Walaupun kod profesional mentakrifkan _tingkah laku etika_ yang diperlukan daripada pengamal, ia [mempunyai batasan yang diketahui](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md) dalam penguatkuasaan, terutamanya dalam projek berskala besar. Sebaliknya, ramai pakar data sains [menganjurkan senarai semak](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md), yang boleh **menghubungkan prinsip kepada amalan** dengan cara yang lebih deterministik dan boleh diambil tindakan.
Walaupun kod profesional mentakrifkan _tingkah laku etika_ yang diperlukan daripada pengamal, ia [mempunyai batasan yang diketahui](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md) dalam penguatkuasaan, terutamanya dalam projek berskala besar. Sebaliknya, ramai pakar sains data [menganjurkan senarai semak](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md), yang boleh **menghubungkan prinsip kepada amalan** dengan cara yang lebih deterministik dan boleh dilaksanakan.
Senarai semak menukar soalan kepada tugas "ya/tidak" yang boleh dioperasikan, membolehkan ia dijejaki sebagai sebahagian daripada aliran kerja pelepasan produk standard.
Senarai semak menukar soalan kepada tugas "ya/tidak" yang boleh dioperasikan, membolehkan ia dijejak sebagai sebahagian daripada aliran kerja pelepasan produk standard.
Contoh termasuk:
* [Deon](https://deon.drivendata.org/) - senarai semak etika data tujuan umum yang dicipta daripada [cadangan industri](https://deon.drivendata.org/#checklist-citations) dengan alat baris arahan untuk integrasi mudah.
* [Deon](https://deon.drivendata.org/) - senarai semak etika data tujuan umum yang dibuat daripada [cadangan industri](https://deon.drivendata.org/#checklist-citations) dengan alat baris perintah untuk integrasi mudah.
* [Senarai Semak Audit Privasi](https://cyber.harvard.edu/ecommerce/privacyaudit.html) - memberikan panduan umum untuk amalan pengendalian maklumat dari perspektif pendedahan undang-undang dan sosial.
* [Senarai Semak Keadilan AI](https://www.microsoft.com/en-us/research/project/ai-fairness-checklist/) - dicipta oleh pengamal AI untuk menyokong penerapan dan integrasi pemeriksaan keadilan ke dalam kitaran pembangunan AI.
* [Senarai Semak Keadilan AI](https://www.microsoft.com/en-us/research/project/ai-fairness-checklist/) - dibuat oleh pengamal AI untuk menyokong penerimaan dan integrasi pemeriksaan keadilan ke dalam kitaran pembangunan AI.
* [22 soalan untuk etika dalam data dan AI](https://medium.com/the-organization/22-questions-for-ethics-in-data-and-ai-efb68fd19429) - rangka kerja yang lebih terbuka, berstruktur untuk penerokaan awal isu etika dalam reka bentuk, pelaksanaan, dan konteks organisasi.
### 3. Peraturan Etika
Etika adalah tentang mentakrifkan nilai bersama dan melakukan perkara yang betul secara _sukarela_. **Pematuhan** adalah tentang _mengikuti undang-undang_ jika dan di mana ia ditakrifkan. **Tadbir urus** secara amnya merangkumi semua cara organisasi beroperasi untuk menguatkuasakan prinsip etika dan mematuhi undang-undang yang ditetapkan.
Etika adalah tentang mentakrifkan nilai bersama dan melakukan perkara yang betul _secara sukarela_. **Pematuhan** adalah tentang _mengikuti undang-undang_ jika dan di mana ia ditakrifkan. **Tadbir urus** secara umum merangkumi semua cara organisasi beroperasi untuk menguatkuasakan prinsip etika dan mematuhi undang-undang yang ditetapkan.
Hari ini, tadbir urus mengambil dua bentuk dalam organisasi. Pertama, ia adalah tentang mentakrifkan prinsip **AI etika** dan mewujudkan amalan untuk mengoperasikan penerapan merentasi semua projek berkaitan AI dalam organisasi. Kedua, ia adalah tentang mematuhi semua peraturan perlindungan data yang diwajibkan oleh kerajaan untuk wilayah yang ia beroperasi.
Hari ini, tadbir urus mengambil dua bentuk dalam organisasi. Pertama, ia adalah tentang mentakrifkan prinsip **AI etika** dan mewujudkan amalan untuk mengoperasikan penerimaan merentasi semua projek berkaitan AI dalam organisasi. Kedua, ia adalah tentang mematuhi semua peraturan perlindungan data yang diwajibkan oleh kerajaan untuk wilayah ia beroperasi.
Contoh peraturan perlindungan dan privasi data:
Contoh peraturan perlindungan data dan privasi:
* `1974`, [Akta Privasi AS](https://www.justice.gov/opcl/privacy-act-1974) - mengawal selia pengumpulan, penggunaan, dan pendedahan maklumat peribadi oleh _kerajaan persekutuan_.
* `1996`, [Akta Kebolehpasaran dan Akauntabiliti Insurans Kesihatan AS (HIPAA)](https://www.cdc.gov/phlp/publications/topic/hipaa.html) - melindungi data kesihatan peribadi.
* `1998`, [Akta Perlindungan Privasi Dalam Talian Kanak-kanak AS (COPPA)](https://www.ftc.gov/enforcement/rules/rulemaking-regulatory-reform-proceedings/childrens-online-privacy-protection-rule) - melindungi privasi data kanak-kanak di bawah umur 13 tahun.
* `2018`, [Peraturan Perlindungan Data Umum (GDPR)](https://gdpr-info.eu/) - menyediakan hak pengguna, perlindungan data, dan privasi.
* `1996`, [Akta Portabiliti & Akauntabiliti Insurans Kesihatan AS (HIPAA)](https://www.cdc.gov/phlp/publications/topic/hipaa.html) - melindungi data kesihatan peribadi.
* `1998`, [Akta Perlindungan Privasi Dalam Talian Kanak-Kanak AS (COPPA)](https://www.ftc.gov/enforcement/rules/rulemaking-regulatory-reform-proceedings/childrens-online-privacy-protection-rule) - melindungi privasi data kanak-kanak di bawah umur 13 tahun.
* `2018`, [Peraturan Perlindungan Data Umum (GDPR)](https://gdpr-info.eu/) - memberikan hak pengguna, perlindungan data, dan privasi.
* `2018`, [Akta Privasi Pengguna California (CCPA)](https://www.oag.ca.gov/privacy/ccpa) memberikan pengguna lebih banyak _hak_ ke atas data (peribadi) mereka.
* `2021`, [Undang-undang Perlindungan Maklumat Peribadi China](https://www.reuters.com/world/china/china-passes-new-personal-data-privacy-law-take-effect-nov-1-2021-08-20/) baru sahaja diluluskan, mewujudkan salah satu peraturan privasi data dalam talian terkuat di dunia.
* `2021`, China [Undang-undang Perlindungan Maklumat Peribadi](https://www.reuters.com/world/china/china-passes-new-personal-data-privacy-law-take-effect-nov-1-2021-08-20/) baru sahaja diluluskan, mewujudkan salah satu peraturan privasi data dalam talian yang paling kuat di dunia.
> 🚨 Kesatuan Eropah mentakrifkan GDPR (Peraturan Perlindungan Data Umum) kekal sebagai salah satu peraturan privasi data yang paling berpengaruh hari ini. Adakah anda tahu ia juga mentakrifkan [8 hak pengguna](https://www.freeprivacypolicy.com/blog/8-user-rights-gdpr) untuk melindungi privasi digital dan data peribadi warganegara? Ketahui tentang apa hak ini, dan mengapa ia penting.
### 4. Budaya Etika
Perhatikan bahawa masih terdapat jurang tidak ketara antara _pematuhan_ (melakukan cukup untuk memenuhi "huruf undang-undang") dan menangani [isu sistemik](https://www.coursera.org/learn/data-science-ethics/home/week/4) (seperti pengukuhan, asimetri maklumat, dan ketidakadilan pengagihan) yang boleh mempercepatkan penggunaan AI untuk tujuan yang salah.
Perlu diingat bahawa terdapat jurang tidak ketara antara _pematuhan_ (melakukan cukup untuk memenuhi "huruf undang-undang") dan menangani [isu sistemik](https://www.coursera.org/learn/data-science-ethics/home/week/4) (seperti pengukuhan, asimetri maklumat, dan ketidakadilan pengagihan) yang boleh mempercepatkan penggunaan AI sebagai senjata.
Yang terakhir memerlukan [pendekatan kolaboratif untuk mentakrifkan budaya etika](https://towardsdatascience.com/why-ai-ethics-requires-a-culture-driven-approach-26f451afa29f) yang membina hubungan emosi dan nilai bersama yang konsisten _merentasi organisasi_ dalam industri. Ini memerlukan lebih banyak [budaya etika data yang diformalkan](https://www.codeforamerica.org/news/formalizing-an-ethical-data-culture/) dalam organisasi - membolehkan _sesiapa sahaja_ untuk [menarik tali Andon](https://en.wikipedia.org/wiki/Andon_(manufacturing)) (untuk membangkitkan kebimbangan etika lebih awal dalam proses) dan menjadikan _penilaian etika_ (contohnya, dalam pengambilan pekerja) sebagai kriteria teras pembentukan pasukan dalam projek AI.
Yang terakhir memerlukan [pendekatan kolaboratif untuk mentakrifkan budaya etika](https://towardsdatascience.com/why-ai-ethics-requires-a-culture-driven-approach-26f451afa29f) yang membina hubungan emosi dan nilai bersama yang konsisten _merentasi organisasi_ dalam industri. Ini memerlukan lebih banyak [budaya etika data yang formal](https://www.codeforamerica.org/news/formalizing-an-ethical-data-culture/) dalam organisasi - membolehkan _sesiapa sahaja_ [menarik tali Andon](https://en.wikipedia.org/wiki/Andon_(manufacturing)) (untuk membangkitkan kebimbangan etika lebih awal dalam proses) dan menjadikan _penilaian etika_ (contohnya, dalam pengambilan pekerja) sebagai kriteria teras pembentukan pasukan dalam projek AI.
---
## [Kuiz selepas kuliah](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/3) 🎯
## [Kuiz selepas kuliah](https://ff-quizzes.netlify.app/en/ds/) 🎯
## Ulasan & Kajian Kendiri
Kursus dan buku membantu memahami konsep dan cabaran etika teras, manakala kajian kes dan alat membantu dengan amalan etika terapan dalam konteks dunia sebenar. Berikut adalah beberapa sumber untuk bermula.
Kursus dan buku membantu memahami konsep etika teras dan cabaran, manakala kajian kes dan alat membantu dengan amalan etika terapan dalam konteks dunia nyata. Berikut adalah beberapa sumber untuk bermula.
* [Pembelajaran Mesin Untuk Pemula](https://github.com/microsoft/ML-For-Beginners/blob/main/1-Introduction/3-fairness/README.md) - pelajaran tentang Keadilan, daripada Microsoft.
* [Prinsip AI Bertanggungjawab](https://docs.microsoft.com/en-us/learn/modules/responsible-ai-principles/) - laluan pembelajaran percuma dari Microsoft Learn.
* [Etika dan Sains Data](https://resources.oreilly.com/examples/0636920203964) - EBook O'Reilly (M. Loukides, H. Mason et. al)
* [Etika Sains Data](https://www.coursera.org/learn/data-science-ethics#syllabus) - kursus dalam talian dari Universiti Michigan.
* [Ethics Unwrapped](https://ethicsunwrapped.utexas.edu/case-studies) - kajian kes dari Universiti Texas.
* [Prinsip AI Bertanggungjawab](https://docs.microsoft.com/en-us/learn/modules/responsible-ai-principles/) - laluan pembelajaran percuma dari Microsoft Learn.
* [Etika dan Sains Data](https://resources.oreilly.com/examples/0636920203964) - EBook O'Reilly (M. Loukides, H. Mason et. al)
* [Etika Sains Data](https://www.coursera.org/learn/data-science-ethics#syllabus) - kursus dalam talian dari Universiti Michigan.
* [Etika Tidak Terbungkus](https://ethicsunwrapped.utexas.edu/case-studies) - kajian kes dari Universiti Texas.
# Tugasan
# Tugasan
[Tulis Kajian Kes Etika Data](assignment.md)
[Tulis Kajian Kes Etika Data](assignment.md)
---

@ -1,171 +1,180 @@
<!--
CO_OP_TRANSLATOR_METADATA:
{
"original_hash": "8796f41f566a0a8ebb72863a83d558ed",
"translation_date": "2025-08-30T19:47:19+00:00",
"original_hash": "3a34157cc63516eba97c89a0b2f8c3e6",
"translation_date": "2025-09-03T21:57:49+00:00",
"source_file": "1-Introduction/02-ethics/README.md",
"language_code": "my"
}
-->
# ဒေတာအကျင့်သိက္ခာအကျဉ်းချုပ်
# ဒေတာသိက္တစ်ဆိုင်ရာကျင့်ဝတ်များကိုမိတ်ဆက်ခြင်း
|![ Sketchnote by [(@sketchthedocs)](https://sketchthedocs.dev) ](../../sketchnotes/02-Ethics.png)|
|:---:|
| ဒေတာသိပ္ပံအကျင့်သိက္ခာ - _Sketchnote by [@nitya](https://twitter.com/nitya)_ |
| ဒေတာသိပ္ပံကျင့်ဝတ်များ - _Sketchnote by [@nitya](https://twitter.com/nitya)_ |
---
ကျွန်ုပ်တို့အားလုံးသည် ဒေတာဖြင့်ပြည့်နှက်နေသောကမ္ဘာတွင် နေထိုင်နေသော ဒေတာပြည်သူများဖြစ်ပါသည်။
ကျွန်တော်တို့အားလုံးသည် ဒေတာဖြင့်ပြည့်နှက်နေသောကမ္ဘာတစ်ခုတွင် နေထိုင်နေကြသည်။
စျေးကွက်လမ်းကြောင်းများအရ ၂၀၂၂ ခုနှစ်တွင် ၁-၃ အကြီးစားအဖွဲ့အစည်းများသည် [Marketplaces and Exchanges](https://www.gartner.com/smarterwithgartner/gartner-top-10-trends-in-data-and-analytics-for-2020/) မှတဆင့် သူတို့၏ဒေတာကို ဝယ်ယူရောင်းချမည်ဖြစ်သည်ဟု ပြောကြားထားသည်။ **App Developers** အနေဖြင့် ဒေတာအခြေခံသုံးသပ်မှုများနှင့် algorithm အခြေခံအလိုအလျောက်လုပ်ဆောင်မှုများကို နေ့စဉ်အသုံးပြုသူအတွေ့အကြုံများတွင် ပေါင်းစပ်ရန် ပိုမိုလွယ်ကူပြီး စျေးနှုန်းသက်သာလာမည်ဖြစ်သည်။ သို့သော် AI သည် ပျံ့နှံ့လာသည့်အခါတွင် [weaponization](https://www.youtube.com/watch?v=TQHs8SA1qpk) အကြီးအကျယ်ဖြင့် algorithm များကို အသုံးချခြင်းကြောင့် ဖြစ်ပေါ်နိုင်သော နစ်နာမှုများကိုလည်း နားလည်ရန်လိုအပ်ပါသည်။
ဈေးကွက်လမ်းညွှန်များအရ ၂၀၂၂ ခုနှစ်တွင် ကြီးမားသောအဖွဲ့အစည်းများ၏ သုံးပုံတစ်ပုံသည် [ဈေးကွက်နှင့်အလဲအလှယ်စင်တာများ](https://www.gartner.com/smarterwithgartner/gartner-top-10-trends-in-data-and-analytics-for-2020/)မှတစ်ဆင့် ဒေတာကို ဝယ်ယူရောင်းချလိမ့်မည်ဟု ခန့်မှန်းထားသည်။ **အက်ပ်ဖွံ့ဖြိုးသူများ**အနေဖြင့် ဒေတာအခြေပြုသိမြင်မှုများနှင့် အယ်လဂိုရီသမ်အခြေပြု အလိုအလျောက်လုပ်ဆောင်မှုများကို နေ့စဉ်အသုံးပြုသူအတွေ့အကြုံများထဲသို့ ပိုမိုလွယ်ကူစွာ ထည့်သွင်းနိုင်မည်ဖြစ်သည်။ သို့သော် AI သည် ပိုမိုကျယ်ပြန့်လာသည့်အခါ၌၊ [အယ်လဂိုရီသမ်များ၏လက်နက်ပြုလုပ်မှု](https://www.youtube.com/watch?v=TQHs8SA1qpk)ကြောင့် ဖြစ်ပေါ်နိုင်သည့် နောက်ဆက်တွဲအန္တရာယ်များကိုလည်း နားလည်ရန်လိုအပ်လာမည်ဖြစ်သည်။
လမ်းကြောင်းများအရ ၂၀၂၅ ခုနှစ်တွင် [၁၈၀ zettabytes](https://www.statista.com/statistics/871513/worldwide-data-created/) ကျော်သော ဒေတာကို ဖန်တီးပြီး သုံးစွဲမည်ဖြစ်သည်ဟု ပြောကြားထားသည်။ **Data Scientists** အနေဖြင့် ဒါသည် ကိုယ်ရေးအချက်အလက်များကို များစွာရရှိနိုင်စေသည်။ ဒါသည် အသုံးပြုသူများ၏ အပြုအမူကို ပုံဖော်ပြီး [illusion of free choice](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice) ဖန်တီးခြင်းဖြင့် အသုံးပြုသူများကို ကျွန်ုပ်တို့နှစ်သက်သော ရလဒ်များသို့ ညွှန်ကြားနိုင်စေသည်။ ဒါဟာ ဒေတာကိုယ်ရေးအချက်အလက်နှင့် အသုံးပြုသူကာကွယ်မှုများနှင့် ပတ်သက်သော ကျယ်ပြန့်သောမေးခွန်းများကိုလည်း ရှုမြင်စေပါသည်။
ထို့အပြင် ၂၀၂၅ ခုနှစ်တွင် [၁၈၀ ဇက်တာဘိုက်](https://www.statista.com/statistics/871513/worldwide-data-created/) ကျော်သော ဒေတာကို ဖန်တီးသုံးစွဲမည်ဟု ခန့်မှန်းထားသည်။ **ဒေတာသိပ္ပံပညာရှင်များ**အနေဖြင့်၊ ၎င်းသည် ကိုယ်ရေးကိုယ်တာဒေတာများကို များစွာရရှိစေမည်ဖြစ်သည်။ ၎င်းသည် အသုံးပြုသူများ၏ အပြုအမူကို ပရိုဖိုင်ဖွဲ့နိုင်စေပြီး၊ [ရွေးချယ်ခွင့်၏အလွှာအမြှောက်](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice)ကို ဖန်တီးသည့်နည်းလမ်းများဖြင့် ဆုံးဖြတ်မှုများကို သက်ရောက်မှုရှိစေမည်ဖြစ်သည်။ ဒါ့အပြင် ဒေတာကိုယ်ရေးကိုယ်တာနှင့် အသုံးပြုသူကာကွယ်မှုဆိုင်ရာ ကျယ်ပြန့်သောမေးခွန်းများကိုလည်း ထွက်ပေါ်စေသည်။
ဒေတာအကျင့်သိက္ခာသည် ဒေတာသိပ္ပံနှင့် အင်ဂျင်နီယာလုပ်ငန်းများအတွက် _လိုအပ်သောလမ်းညွှန်များ_ ဖြစ်လာပြီး ဒေတာအခြေခံလုပ်ဆောင်မှုများမှ ဖြစ်ပေါ်နိုင်သော နစ်နာမှုများနှင့် မတော်တဆဖြစ်ရပ်များကို လျှော့ချရန် ကူညီပေးပါသည်။ [Gartner Hype Cycle for AI](https://www.gartner.com/smarterwithgartner/2-megatrends-dominate-the-gartner-hype-cycle-for-artificial-intelligence-2020/) သည် ဒစ်ဂျစ်တယ်အကျင့်သိက္ခာ၊ တာဝန်ရှိသော AI နှင့် AI အုပ်ချုပ်မှုတို့ကို _AI ရှေးဉီးတန်း_ နှင့် _စက်မှုလုပ်ငန်း_ အဖြစ် ပိုမိုကျယ်ပြန့်လာစေရန် အရေးပါသောအချက်များအဖြစ် ဖော်ပြထားသည်။
ဒေတာကျင့်ဝတ်များသည် ဒေတာသိပ္ပံနှင့် အင်ဂျင်နီယာလုပ်ငန်းများအတွက် _လိုအပ်သောလမ်းညွှန်များ_ ဖြစ်လာပြီး၊ ဒေတာအခြေပြုလုပ်ဆောင်မှုများမှ ဖြစ်ပေါ်နိုင်သည့် အန္တရာယ်များနှင့် မတော်တဆဖြစ်ရပ်များကို လျှော့ချရန် ကူညီပေးသည်။ [Gartner Hype Cycle for AI](https://www.gartner.com/smarterwithgartner/2-megatrends-dominate-the-gartner-hype-cycle-for-artificial-intelligence-2020/) သည် ဒစ်ဂျစ်တယ်ကျင့်ဝတ်များ၊ တာဝန်ရှိသော AI နှင့် AI အုပ်ချုပ်မှုဆိုင်ရာ လမ်းကြောင်းများကို အဓိကအချက်အဖြစ် ဖော်ပြထားပြီး၊ AI ၏ _ဒီမိုကရေတိုက်ရေး_ နှင့် _စက်မှုလုပ်ငန်းရေးရာ_ ဆိုင်ရာအကြီးမားဆုံးလမ်းကြောင်းများကို ဦးဆောင်ပေးသည်။
![Gartner's Hype Cycle for AI - 2020](https://images-cdn.newscred.com/Zz1mOWJhNzlkNDA2ZTMxMWViYjRiOGFiM2IyMjQ1YmMwZQ==)
ဒီသင်ခန်းစာတွင် ဒေတာအကျင့်သိက္ခာ၏ စိတ်ဝင်စားဖွယ်ရာနယ်ပယ်ကို လေ့လာမည်ဖြစ်ပြီး အခြေခံအယူအဆများနှင့် စိန်ခေါ်မှုများ၊ ကိစ္စလေ့လာမှုများနှင့် အကျင့်သိက္ခာအခြေခံ AI အယူအဆများကို လေ့လာမည်ဖြစ်သည်။ ဒါဟာ ဒေတာနှင့် AI ကို အသုံးပြုသောအဖွဲ့အစည်းများတွင် အကျင့်သိက္ခာယဉ်ကျေးမှုတည်ဆောက်ရန် ကူညီပေးပါသည်။
ဒီသင်ခန်းစာတွင်၊ ဒေတာကျင့်ဝတ်ဆိုင်ရာ အခြေခံအယူအဆများနှင့် စိန်ခေါ်မှုများမှစ၍ အဖွဲ့အစည်းများနှင့် အဖွဲ့များတွင် ကျင့်ဝတ်ယဉ်ကျေးမှုကို တည်ဆောက်ရန် အထောက်အကူပြုသော အုပ်ချုပ်မှုလိုက်နာမှုများအထိ စိတ်ဝင်စားဖွယ်ရာ ဒေတာကျင့်ဝတ်နယ်ပယ်ကို လေ့လာသွားမည်ဖြစ်သည်။
## [Pre-lecture quiz](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/2) 🎯
## အခြေခံအဓိပ္ပါယ်များ
ဓိပ္ပါယ်အခြေခံစကားလုံးများကို နားလည်ခြင်းဖြင့် စတင်ကြပါစို့
ရင်ဆုံး ကျင့်ဝတ်ဆိုင်ရာ အခြေခံအဓိပ္ပါယ်များကို နားလည်ကြည့်ပါ
"Ethics" ဆိုသောစကားလုံးသည် [ဂရိစကားလုံး "ethikos"](https://en.wikipedia.org/wiki/Ethics) (နှင့် "ethos" ဟူသောအမြစ်) မှ ဆင်းသက်လာပြီး _စရိုက်သဘောသဘာ_ ကို ဆိုလိုသည်။
"Ethics" ဆိုသောစကားလုံးသည် [ဂရိစကားလုံး "ethikos"](https://en.wikipedia.org/wiki/Ethics) (နှင့် ၎င်း၏အရင်းခံ "ethos") မှ ဆင်းသက်လာပြီး _အကျင့်စရိုက် သို့မဟုတ် သဘာကျင့်တ်_ ဟု အဓိပ္ပါယ်ရသည်။
**Ethics** သည် လူမှုအဖွဲ့အစည်းတွင် ကျွန်ုပ်တို့၏အပြုအမူကို စီမံခန့်ခွဲသော အတူတူမျှဝေသောတန်ဖိုးများနှင့် သီလတရားများအကြောင်းဖြစ်သည်။ Ethics သည် ဥပဒေများအပေါ်မူတည်ခြင်းမဟုတ်ဘဲ "မှန်/မှား" ဟု ကျယ်ကျယ်ပြန့်ပြန့်လက်ခံထားသောစံနှုန်းများအပေါ်မူတည်သည်။ သို့သော် အကျင့်သိက္ခာဆိုင်ရာစဉ်းစားမှုများသည် ကော်ပိုရိတ်အုပ်ချုပ်မှုနှင့် အစိုးရစည်းမျဉ်းများကို လွှမ်းမိုးနိုင်ပြီး လိုက်နာမှုအတွက် ပိုမိုအကျိုးခံစားမှုများဖန်တီးနိုင်သည်။
**ကျင့်ဝတ်များ**ဆိုသည်မှာ လူ့အသိုင်းအဝိုင်းတွင် ကျင့်သုံးသည့် အကျင့်စရိုက်နှင့် ကျင့်ဝတ်များကို အခြေခံထားသော ပုံမှန်များနှင့် တန်းတူဖြစ်သည်။ ၎င်းသည် ဥပဒေများအပေါ်မူတည်ခြင်းမဟုတ်ဘဲ၊ "မှန်/မှား" ကို သတ်မှတ်သည့် လူမှုအသိအမြင်များအပေါ် အခြေခံထားသည်။ သို့သော် ကျင့်ဝတ်ဆိုင်ရာစဉ်းစားမှုများသည် ကော်ပိုရေးရှင်းအုပ်ချုပ်မှုနှင့် အစိုးရစည်းမျဉ်းများကို သက်ရောက်မှုရှိစေပြီး၊ လိုက်နာမှုအတွက် အားပေးမှုများကို ဖန်တီးပေးနိုင်သည်။
**Data Ethics** သည် [Ethics ၏အသစ်သောခွဲခြားမှု](https://royalsocietypublishing.org/doi/full/10.1098/rsta.2016.0360#sec-1) ဖြစ်ပြီး "ဒေတာ၊ algorithm နှင့် ဆက်စပ်သောအလေ့အကျင့်များနှင့်ပတ်သက်သော သီလတရားဆိုင်ရာပြဿနာများကို လေ့လာပြီး အကဲဖြတ်သည်"။ ဒီမှာ **"ဒေတာ"** သည် ဖန်တီးခြင်း၊ မှတ်တမ်းတင်ခြင်း၊ စုစည်းခြင်း၊ အလုပ်လုပ်ခြင်း၊ ဖြန့်ဝေခြင်း၊ မျှဝေခြင်းနှင့် အသုံးပြုခြင်းဆိုင်ရာ လုပ်ဆောင်မှုများကို အဓိကထားပြီး **"algorithm"** သည် AI၊ agents၊ machine learning နှင့် robots ကို အဓိကထားပြီး **"practices"** သည် တာဝန်ရှိသောဆန်းသစ်မှု၊ programming၊ hacking နှင့် ethics codes စသည်တို့ကို အဓိကထားသည်။
**ဒေတာကျင့်ဝတ်များ**သည် [ကျင့်ဝတ်၏အသစ်တစ်မျိုးသောအခွဲ](https://royalsocietypublishing.org/doi/full/10.1098/rsta.2016.0360#sec-1) ဖြစ်ပြီး၊ "ဒေတာ၊ အယ်လဂိုရီသမ်များနှင့် ၎င်းတို့နှင့်ဆိုင်သော လုပ်ဆောင်မှုများနှင့်ပတ်သက်သော ကျင့်ဝတ်ပြဿနာများကို လေ့လာသုံးသပ်သည်"။ ဤတွင် **"ဒေတာ"** ဆိုသည်မှာ ဖန်တီးခြင်း၊ မှတ်တမ်းတင်ခြင်း၊ စီမံခြင်း၊ လုပ်ငန်းစဉ်များနှင့် အသုံးပြုခြင်းတို့နှင့်ဆိုင်သော လုပ်ဆောင်မှုများကို အဓိကထားသည်။ **"အယ်လဂိုရီသမ်များ"** ဆိုသည်မှာ AI၊ အေးဂျင့်များ၊ စက်လေ့လာမှုနှင့် ရိုဘော့များကို အဓိကထားသည်။ **"လုပ်ဆောင်မှုများ"** ဆိုသည်မှာ တာဝန်ရှိသောဆန်းသစ်မှု၊ ပရိုဂရမ်ရေးခြင်း၊ ဟက်ကင်းလုပ်ခြင်းနှင့် ကျင့်ဝတ်ကုဒ်များကို အဓိကထားသည်။
**Applied Ethics** သည် [သီလတရားဆိုင်ရာစဉ်းစားမှုများ၏ လက်တွေ့အသုံးချမှု](https://en.wikipedia.org/wiki/Applied_ethics) ဖြစ်သည်။ ၎င်းသည် _လက်တွေ့လုပ်ဆောင်မှုများ၊ ထုတ်ကုန်များနှင့် လုပ်ငန်းစဉ်များ_ အတွင်း သီလတရားဆိုင်ရာပြဿနာများကို တက်ကြွစွာလေ့လာပြီး သတ်မှတ်ထားသောအကျင့်သိက္ခာတန်ဖိုးများနှင့်အညီရှိနေစေရန် ပြင်ဆင်မှုများလုပ်ဆောင်ခြင်းဖြစ်သည်။
**ကျင့်ဝတ်ဆိုင်ရာလက်တွေ့ကျင့်သုံးမှု** (Applied Ethics) ဆိုသည်မှာ [ကျင့်ဝတ်ဆိုင်ရာစဉ်းစားမှုများကို လက်တွေ့အသုံးချခြင်း](https://en.wikipedia.org/wiki/Applied_ethics) ဖြစ်သည်။ ၎င်းသည် _လက်တွေ့လုပ်ဆောင်မှုများ၊ ထုတ်ကုန်များနှင့် လုပ်ငန်းစဉ်များ_ တွင် ကျင့်ဝတ်ပြဿနာများကို လေ့လာပြီး၊ ၎င်းတို့ကို သတ်မှတ်ထားသော ကျင့်ဝတ်တန်ဖိုးများနှင့် ကိုက်ညီစေရန် ပြင်ဆင်မှုများကို လုပ်ဆောင်ခြင်းဖြစ်သည်။
**Ethics Culture** သည် [_Applied Ethics ကို လက်တွေ့ကျကျလုပ်ဆောင်ခြင်း_](https://hbr.org/2019/05/how-to-design-an-ethical-organization) အကြောင်းဖြစ်ပြီး ကျွန်ုပ်တို့၏အကျင့်သိက္ခာဆိုင်ရာအယူအဆများနှင့် လုပ်ဆောင်မှုများကို အဖွဲ့အစည်းတစ်ခုလုံးအတွင်းတွင် တစ်စည်းတစ်လုံးနှင့် အကျိုးရှိစွာ လက်ခံအသုံးပြုစေရန် သေချာစေရန်ဖြစ်သည်။ အောင်မြင်သော ethics culture များသည် အဖွဲ့အစည်းအတိုင်းအတာအကျင့်သိက္ခာဆိုင်ရာအယူအဆများကို သတ်မှတ်ပြီး လိုက်နာမှုအတွက် အဓိပ္ပါယ်ရှိသောအကျိုးခံစားမှုများပေးပြီး အဖွဲ့အစည်းအဆင့်တိုင်းတွင် လိုအပ်သောအပြုအမူများကို အားပေးပြီး တိုးတက်စေသည်။
**ကျင့်ဝတ်ယဉ်ကျေးမှု** (Ethics Culture) ဆိုသည်မှာ [_ကျင့်တ်ဆိုင်ရာလက်တွေ့ကျင့်သုံးမှုများကို လုပ်ငန်းအတွင်းသို့ ပေါင်းစည်းခြင်း_](https://hbr.org/2019/05/how-to-design-an-ethical-organization) ဖြစ်ပြီး၊ ကျင့်ဝတ်ဆိုင်ရာစံနှုန်းများနှင့် လုပ်ဆောင်မှုများကို အဖွဲ့အစည်းတစ်ခုလုံးတွင် တစ်ပြိုင်တည်းနှင့် အကျိုးရှိစွာ လက်ခံအသုံးပြုစေရန် ရည်ရွယ်သည်။ အောင်မြင်သောကျင့်ဝတ်ယဉ်ကျေးမှုများသည် အဖွဲ့အစည်းအတွင်း ကျင့်ဝတ်ဆိုင်ရာစံနှုန်းများကို သတ်မှတ်ပြီး လိုက်နာမှုအတွက် အားပေးမှုများကို ပံ့ပိုးပေးပြီး၊ အဖွဲ့အစည်းအဆင့်တိုင်းတွင် လိုအပ်သောအပြုအမူများကို အားပေးနှင့် တိုးချဲ့ပေးသည်။
## Ethics အယူအဆများ
## ကျင့်ဝတ်ဆိုင်ရာအယူအဆများ
ဒီအပိုင်းတွင် **မျှဝေသောတန်ဖိုးများ** (principles) နှင့် **အကျင့်သိက္ခာဆိုင်ရာစိန်ခေါ်မှုများ** (problems) ကို ဆွေးနွေးပြီး **ကိစ္စလေ့လာမှုများ** ကို လေ့လာမည်ဖြစ်သည်။ ၎င်းတို့သည် လက်တွေ့ကမ္ဘာတွင် အကျင့်သိက္ခာအယူအဆများကို နားလည်စေရန် ကူညီပေးသည်။
အပိုင်းတွင် **မျှဝေသောတန်ဖိုးများ** (principles) နှင့် **ကျင့်ဝတ်ပြဿနာများ** (problems) ကို ဆွေးနွေးပြီး၊ **လက်တွေ့လေ့လာမှုများ** (case studies) ကို လေ့လာသွားမည်ဖြစ်သည်။ ၎င်းတို့သည် ကျင့်ဝတ်ဆိုင်ရာအယူအဆများကို လက်တွေ့ကမ္ဘာတွင် နားလည်ရန် အထောက်အကူပြုသည်။
### 1. Ethics Principles
### 1. ကျင့်ဝတ်ဆိုင်ရာစံနှုန်းများ
ဒေတာအကျင့်သိက္ခာမဟာဗျူဟာတိုင်းသည် _Ethics Principles_ သတ်မှတ်ခြင်းဖြင့် စတင်သည် - ဒါဟာ "မျှဝေသောတန်ဖိုးများ" ဖြစ်ပြီး ဒေတာနှင့် AI ပရောဂျက်များတွင် လက်ခံနိုင်သောအပြုအမူများကို ဖော်ပြပြီး လိုက်နာမှုလုပ်ဆောင်မှုများကို လမ်းညွှန်သည်။ ၎င်းတို့ကို တစ်ဦးချင်းအဆင့်တွင် သို့မဟုတ် အဖွဲ့အဆင့်တွင် သတ်မှတ်နိုင်သည်။ သို့သော် အကြီးစားအဖွဲ့အစည်းများအများစုသည် ၎င်းတို့၏ _Ethical AI_ မဟာဗျူဟာ သို့မဟုတ် Framework ကို ကော်ပိုရိတ်အဆင့်တွင် သတ်မှတ်ပြီး အဖွဲ့အစည်းတစ်ခုလုံးတွင် တစ်စည်းတစ်လုံးနှင့် အကျိုးရှိစွာ လိုက်နာမှုလုပ်ဆောင်မှုများကို အတည်ပြုသည်။
ဒေတာကျင့်ဝတ်မဟာဗျူဟာတိုင်းသည် _ကျင့်တ်ဆိုင်ရာစံနှုန်းများ_ ကို သတ်မှတ်ခြင်းဖြင့် စတင်သည် - ၎င်းသည် ဒေတာနှင့် AI ပရောဂျက်များတွင် လိုက်နာရမည့် လုပ်ဆောင်မှုများကို ဖော်ပြသည့် "မျှဝေသောတန်ဖိုးများ" ဖြစ်သည်။ ၎င်းတို့ကို တစ်ဦးချင်း သို့မဟုတ် အဖွဲ့အဆင့်တွင် သတ်မှတ်နိုင်သည်။ သို့သော် အများစုသောကြီးမားသောအဖွဲ့အစည်းများသည် ၎င်းတို့၏ _ကျင့်တ် AI_ မဟာဗျူဟာ သို့မဟုတ် ဖွဲ့စည်းမှုတွင် သတ်မှတ်ထားပြီး၊ အဖွဲ့အစည်းရှိ အဖွဲ့အားလုံးတွင် တစ်ပြိုင်တည်းနှင့် လိုက်နာမှုရှိစေရန် အတည်ပြုထားသည်။
**ဥပမာ:** Microsoft's [Responsible AI](https://www.microsoft.com/en-us/ai/responsible-ai) မဟာဗျူဟာသည် _"AI ကို လူသားများကို ဦးစားပေးသော အကျင့်သိက္ခာဆိုင်ရာအယူအဆများဖြင့် တိုးတက်စေရန် ကျွန်ုပ်တို့ကတိပြုထားသည်"_ ဟုဖော်ပြထားပြီး အောက်ပါ Framework တွင် ၆ ခုသော အကျင့်သိက္ခာအယူအဆများကို ဖော်ပြထားသည်။
**ဥပမာ:** Microsoft ၏ [တာဝန်ရှိသော AI](https://www.microsoft.com/en-us/ai/responsible-ai) မဟာဗျူဟာသည် _"ကျနော်တို့သည် လူသားများကို ဦးစားပေးသော ကျင့်ဝတ်ဆိုင်ရာစံနှုန်းများဖြင့် AI ကို တိုးတက်စေရန် ကတိပြုထားသည်"_ ဟု ဖော်ပြထားပြီး၊ အောက်ပါဖွဲ့စည်းမှုတွင် ကျင့်ဝတ်ဆိုင်ရာစံနှုန်း ၆ ခုကို ဖော်ပြထားသည်။
![Responsible AI at Microsoft](https://docs.microsoft.com/en-gb/azure/cognitive-services/personalizer/media/ethics-and-responsible-use/ai-values-future-computed.png)
![Microsoft ၏ တာဝန်ရှိသော AI](https://docs.microsoft.com/en-gb/azure/cognitive-services/personalizer/media/ethics-and-responsible-use/ai-values-future-computed.png)
ဒီအယူအဆများကို အနည်းငယ်လေ့လာကြပါစို့။ _Transparency_ နှင့် _Accountability_ သည် အခြေခံတန်ဖိုးများဖြစ်ပြီး အခြားအယူအဆများကို အခြေခံထားသည် - ဒါကြောင့် အဲဒီနေရာမှ စတင်ပါစို့။
ဤစံနှုန်းများကို အနည်းငယ်လေ့လာကြည့်ပါ။ _တင်ပြမှု_ (Transparency) နှင့် _တာန်ရှိမှု_ (Accountability) သည် အခြေခံတန်ဖိုးများဖြစ်ပြီး၊ အခြားစံနှုန်းများသည် ၎င်းတို့အပေါ် အခြေခံထားသည် - ထို့ကြောင့် ၎င်းတို့မှ စတင်ကြည့်ပါ:
* [**Accountability**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) သည် ဒေတာနှင့် AI လုပ်ဆောင်မှုများအတွက် လုပ်ဆောင်သူများကို _တာန်ရှိ_ စေပြီး အကျင့်သိက္ခာအယူအဆများနှင့် လိုက်နာမှုလုပ်ဆောင်မှုများကို အတည်ပြုစေသည်။
* [**Transparency**](https://www.microsoft.com/en-us/ai/res
[Algorithm Fairness](https://towardsdatascience.com/what-is-algorithm-fairness-3182e161cf9f) သည် အယ်လဂိုရီသမ်ဒီဇိုင်းသည် အချက်အလက်အုပ်စုတစ်ခုခုကို စနစ်တကျ ခွဲခြားဆက်ဆံမှုရှိမရှိ စစ်ဆေးရာတွင် အသုံးပြုသည်။ ၎င်းသည် _အရင်းအမြစ်များခွဲေမှု_ (အုပ်စုတစ်ခုကို အရင်းအမြစ်များ ပိတ်ပင်ခြင်း သို့မဟုတ် ငြင်းပယ်ခြင်း) နှင့် _န်ဆောင်မှုအရည်အသွေး_ (AI သည် အုပ်စုတစ်ခုအတွက် တိကျမှုနည်းပြီး အခြားအုပ်စုများအတွက် ပိုမိုတိကျမှုရှိခြင်း) တို့တွင် [အန္တရာယ်ဖြစ်နိုင်မှုများ](https://docs.microsoft.com/en-us/azure/machine-learning/concept-fairness-ml) ဖြစ်ပေါ်စေသည်။
* [**တာဝန်ရှိမှု**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) သည် ဒေတာနှင့် AI လုပ်ငန်းစဉ်များအတွက် လုပ်ဆောင်သူများကို _တာန်ရှိ_ စေသည်။
* [**တင်ပြမှု**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) သည် ဒေတာနှင့် AI လုပ်ဆောင်မှုများကို အသုံးပြုသူများအတွက် _နားလည်နိုင်စေ_ (ရှင်းလင်းစေ) သည်။
* [**တရားမျှတမှု**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1%3aprimaryr6) - AI သည် လူတိုင်းကို _တရားမျှတစွာ_ ဆက်ဆံစေရန် အာရုံစိုက်သည်။
* [**ယုံကြည်စိတ်ချမှုနှင့် လုံခြုံမှု**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - AI သည် သတ်မှတ်ထားသောတန်ဖိုးများနှင့် _အညီ_ လုပ်ဆောင်စေရန် အာရုံစိုက်သည်။
* [**ကိုယ်ရေးကိုယ်တာနှင့် လုံခြုံရေး**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - ဒေတာ၏လမ်းကြောင်းကို နားလည်ပြီး၊ အသုံးပြုသူများအား _ကိုယ်ရေးကိုယ်တာနှင့်ဆိုင်သော ကာကွယ်မှုများ_ ပေးသည်။
* [**ပါဝင်မှု**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - AI ဖြေရှင်းချက်များကို လူသားအများစု၏ _လိုအပ်ချက်များနှင့် စွမ်းရည်များ_ ကို ဖြည့်ဆည်းစေရန် ရည်ရွယ်သည်။
ဤနေရာတွင် စဉ်းစားရန်မေးခွန်းများမှာ-
* မျိုးစုံသောအုပ်စုများနှင့် အခြေအနေများအတွက် မော်ဒယ်တိကျမှုကို သုံးသပ်ပြီးပါသလား။
* စနစ်ကို အန္တရာယ်ဖြစ်နိုင်မှုများ (ဥပမာ- စံနှုန်းချမှတ်မှု) အတွက် စိစစ်ပြီးပါသလား။
* ရှာဖွေတွေ့ရှိထားသော အန္တရာယ်များကို လျှော့ချရန် အချက်အလက်များကို ပြင်ဆင်ခြင်း သို့မဟုတ် မော်ဒယ်များကို ပြန်လေ့ကျင့်ခြင်းဖြင့် ပြုပြင်နိုင်ပါသလား။
> 🚨 သင်၏ ဒေတာကျင့်ဝတ်မဟာဗျူဟာသည် ဘယ်လိုဖြစ်သင့်မလဲဆိုတာ စဉ်းစားကြည့်ပါ။ အခြားအဖွဲ့အစည်းများ၏ ကျင့်ဝတ် AI ဖွဲ့စည်းမှုများကို လေ့လာပါ - ဤနေရာတွင် [IBM](https://www.ibm.com/cloud/learn/ai-ethics)၊ [Google](https://ai.google/principles) နှင့် [Facebook](https://ai.facebook.com/blog/facebooks-five-pillars-of-responsible-ai/) ၏ ဥပမာများကို တွေ့နိုင်သည်။ ၎င်းတို့တွင် မျှဝေသောတန်ဖိုးများ ဘယ်လိုတူညီသလဲ။ ၎င်းတို့၏စံနှုန်းများသည် ၎င်းတို့၏ AI ထုတ်ကုန် သို့မဟုတ် စက်မှုလုပ်ငန်းနှင့် ဘယ်လိုဆက်စပ်နေသလဲ?
[Algorithm Fairness](https://towardsdatascience.com/what-is-algorithm-fairness-3182e161cf9f) သည် အယ်လဂိုရီသမ်ဒီဇိုင်းသည် အချက်အလက်အုပ်စုတစ်ခုခုကို စနစ်တကျ ခွဲခြားဆက်ဆံမှုရှိမရှိ စစ်ဆေးရာတွင် အသုံးပြုသည်။ ၎င်းသည် _allocation_ (အရင်းအမြစ်များကို အုပ်စုတစ်ခုမှ ပယ်ချခြင်း သို့မဟုတ် ဖယ်ရှားထားခြင်း) နှင့် _quality of service_ (AI သည် အချို့သောအုပ်စုများအတွက် အခြားအုပ်စုများနှင့် တန်းတူ တိကျမှုမရှိခြင်း) တို့တွင် [အန္တရာယ်ဖြစ်နိုင်မှုများ](https://docs.microsoft.com/en-us/azure/machine-learning/concept-fairness-ml) ဖြစ်ပေါ်စေနိုင်သည်။
ဤအပိုင်းတွင် စဉ်းစားရန်မေးခွန်းများမှာ -
* မျိုးစုံသောအုပ်စုများနှင့် အခြေအနေများအတွက် မော်ဒယ်တိကျမှုကို သုံးသပ်ပြီးပြီလား။
* စနစ်ကို အန္တရာယ်ဖြစ်နိုင်မှုများ (ဥပမာ- စံပုံဖော်ခြင်း) အတွက် စိစစ်ပြီးပြီလား။
* တွေ့ရှိထားသော အန္တရာယ်များကို လျော့ပါးစေရန် အချက်အလက်များကို ပြင်ဆင်ခြင်း သို့မဟုတ် မော်ဒယ်များကို ပြန်လည်လေ့ကျင့်ခြင်း ပြုလုပ်နိုင်ပါသလား။
[AI Fairness checklists](https://query.prod.cms.rt.microsoft.com/cms/api/am/binary/RE4t6dA) ကဲ့သို့သော အရင်းအမြစ်များကို လေ့လာပါ။
#### 2.9 အချက်အလက်မှားယွင်းမှု
#### 2.9 အချက်အလက်မှားဖော်ပြမှု
[Data Misrepresentation](https://www.sciencedirect.com/topics/computer-science/misrepresentation) သည် အချက်အလက်များကို မှန်မှန်ကန်ကန် တင်ပြခြင်းမှ မဟုတ်ဘဲ တစ်ဖက်သတ်အကြောင်းပြချက်များကို ထောက်ခံရန် လှည့်ဖြားတင်ပြခြင်း ဖြစ်နိုင်သည်။
[Data Misrepresentation](https://www.sciencedirect.com/topics/computer-science/misrepresentation) သည် အချက်အလက်မှန်များမှ အချက်အလက်အမြင်များကို မတရားဖော်ပြခြင်းဖြင့် လိုချင်သော အကြောင်းပြချက်ကို ထောက်ခံရန် အသုံးပြုနေမရှိကြောင်း စစ်ဆေးခြင်းနှင့် ဆိုင်သည်။
နေရာတွင် စဉ်းစားရန်မေးခွန်းများမှာ-
* မပြည့်စုံသော သို့မဟုတ် မမှန်ကန်သော အချက်အလက်များကို တင်ပြနေပါသလား။
* အချက်အလက်များကို လှည့်ဖြားသော အနိမ့်ဆုံးသဘောထားများကို ဖော်ဆောင်ရန် ရည်ရွယ်၍ ရှုထောင့်ပြသနေပါသလား။
* ရလဒ်များကို လှည့်ဖြားရန် ရွေးချယ်ထားသော သင်္ချာနည်းလမ်းများကို အသုံးပြုနေပါသလား။
* အခြားသော ရှင်းလင်းချက်များဖြင့် ကွဲပြားသော သဘောတရားများကို ဖော်ပြနိုင်ပါသလား။
အပိုင်းတွင် စဉ်းစားရန်မေးခွန်းများမှာ -
* မပြည့်စုံသော သို့မဟုတ် မတိကျသော အချက်အလက်များကို ဖော်ပြနေပါသလား။
* အချက်အလက်များကို အလွဲသုံးစားဆောင်ရန် ခေါင်းဆောင်မှုများကို ဖြစ်ပေါ်စေသော ပုံဖော်မှုများကို အသုံးပြုနေပါသလား။
* ရလဒ်များကို လှည့်စားရန် ရွေးချယ်ထားသော စာရင်းအင်းနည်းလမ်းများကို အသုံးပြုနေပါသလား။
* အခြားသော အကြောင်းပြချက်များက အခြားသော သတ်မှတ်ချက်များကို ပေးနိုင်မည်ဖြစ်ပါသလား။
#### 2.10 လွတ်လပ်စွာရွေးချယ်မှု
[Illusion of Free Choice](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice) သည် စနစ် "ရွေးချယ်မှုဖွဲ့စည်းမှုများ" သည် လူများကို ရွေးချယ်မှုများနှင့် ထိန်းချုပ်မှုရှိသည်ဟု ထင်ရစေပြီး သတ်မှတ်ထားသော ရလဒ်တစ်ခုသို့ ဦးတည်စေသော အခြေအနေဖြစ်သည်။ ဤ [dark patterns](https://www.darkpatterns.org/) များသည် အသုံးပြုသူများအတွက် လူမှုရေးနှင့် စီးပွားရေးဆိုင်ရာ အန္တရာယ်များ ဖြစ်စေသည်။ အသုံးပြုသူ၏ ဆုံးဖြတ်ချက်များသည် အပြုအမူပရိုဖိုင်များကို သက်ရောက်စေပြီး အန္တရာယ်များကို ပိုမိုကြီးထွားစေသည်။
[Illusion of Free Choice](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice) သည် စနစ် "ရွေးချယ်မှုဖွဲ့စည်းမှုများ" သည် လူများကို ရွေးချယ်မှုများနှင့် ထိန်းချုပ်မှုရှိသည်ဟု ထင်ရစေသော်လည်း သတ်မှတ်ထားသော ရလဒ်တစ်ခုကို ရောက်ရန် အားပေးသော အခြေအနေဖြစ်သည်။ ဤ [dark patterns](https://www.darkpatterns.org/) များသည် အသုံးပြုသူများအတွက် လူမှုရေးနှင့် စီးပွားရေးအန္တရာယ်များ ဖြစ်ပေါ်စေနိုင်သည်။ အသုံးပြုသူ၏ ဆုံးဖြတ်ချက်များသည် အပြုအမူပရိုဖိုင်များကို သက်ရောက်စေနိုင်ပြီး၊ ဤအန္တရာယ်များ၏ သက်ရောက်မှုကို တိုးမြှင့်စေနိုင်သည်။
နေရာတွင် စဉ်းစားရန်မေးခွန်းများမှာ-
* အသုံးပြုသူသည် ရွေးချယ်မှု၏ သက်ရောက်မှုများကို နားလည်ခဲ့ပါသလား။
* အသုံးပြုသူသည် (အခြားရွေးချယ်မှုများ) နှင့် ၎င်းတို့၏ အားသာချက်/အားနည်းချက်များကို သိရှိခဲ့ပါသလား။
* အသုံးပြုသူသည် အလိုအလျောက် သို့မဟုတ် သက်ရောက်မှုရှိသော ရွေးချယ်မှုကို နောက်ပိုင်း ပြန်လည်ပြောင်းလဲနိုင်ပါသလား။
အပိုင်းတွင် စဉ်းစားရန်မေးခွန်းများမှာ -
* အသုံးပြုသူသည် ၎င်းရွေးချယ်မှု၏ သက်ရောက်မှုများကို နားလည်ခဲ့ပါသလား။
* အသုံးပြုသူသည် (အခြားရွေးချယ်မှုများ) နှင့် ၎င်းတို့၏ အားသာချက်များနှင့် အားနည်းချက်များကို သိရှိခဲ့ပါသလား။
* အသုံးပြုသူသည် အလိုအလျောက် သို့မဟုတ် သက်ရောက်မှုရှိသော ရွေးချယ်မှုကို နောက်ပိုင်း ပြန်လည်ဖျက်သိမ်းနိုင်ပါသလား။
### 3. လေ့လာမှုများ
ဤကျင့်ဝတ်ဆိုင်ရာ စိန်ခေါ်မှုများကို အမှန်တကယ်ဖြစ်ပျက်သော အခြေအနေများတွင် နားလည်ရန်၊ ကျင့်ဝတ်ချိုးဖောက်မှုများကို မျက်လုံးပိတ်ထားခြင်းကြောင့် လူပုဂ္ဂိုလ်များနှင့် လူ့အဖွဲ့အစည်းအပေါ် ဖြစ်ပေါ်လာသော အန္တရာယ်များနှင့် ရလဒ်များကို ဖော်ပြသည့် လေ့လာမှုများကို ကြည့်ရှုပါ
ဤကျင့်ဝတ်စိစစ်မှုများကို အမှန်တကယ်ကမ္ဘာကြီးတွင် သက်ရောက်မှုများနှင့် အကျိုးဆက်များကို နားလည်ရန်၊ ကျင့်ဝတ်ချိုးဖောက်မှုများကို မသတိထားမိသောအခါ လူများနှင့် လူ့အဖွဲ့အစည်းအပေါ် ဖြစ်ပေါ်နိုင်သော အန္တရာယ်များကို ဖော်ပြသည့် လေ့လာမှုများကို ကြည့်ရှုရန် အထောက်အကူဖြစ်သည်
နေရာတွင် ဥပမာအချို့ကို ဖော်ပြထားသည်-
အချို့သော ဥပမာများကို ကြည့်ပါ -
| ကျင့်ဝတ်ဆိုင်ရာ စိန်ခေါ်မှု | လေ့လာမှု |
| ကျင့်ဝတ်စိစစ်မှု | လေ့လာမှု |
|--- |--- |
| **သဘောတူညီမှု** | 1972 - [Tuskegee Syphilis Study](https://en.wikipedia.org/wiki/Tuskegee_Syphilis_Study) - အာဖရိကန်-အမေရိကန်လူမျိုးများကို အခမဲ့ဆေးကုသမှုပေးမည်ဟု ကတိပြုခဲ့သော်လည်း၊ ၎င်းတို့၏ ရောဂါအခြေအနေ သို့မဟုတ် ကုသမှုရရှိနိုင်မှုအကြောင်း မသိစေဘဲ လှည့်ဖြားခဲ့သည်။ ၄၀ နှစ်ကြာခဲ့သည်။ |
| **အချက်အလက်ကိုယ်ရေးအချက်အလက်** | 2007 - [Netflix data prize](https://www.wired.com/2007/12/why-anonymous-data-sometimes-isnt/) - ၁၀ သန်းအမည်မဖော်ထားသော ရုပ်ရှင်အဆင့်သတ်မှတ်ချက်များကို ထုတ်ပြန်ခဲ့ပြီး၊ အခြားအချက်အလက်များနှင့် ဆက်စပ်၍ Netflix အသုံးပြုသူများကို "အမည်ဖော်" လုပ်နိုင်ခဲ့သည်။ |
| **စုဆောင်းမှုဘက်လိုက်မှု** | 2013 - [Street Bump](https://www.boston.gov/transportation/street-bump) - အနည်းငွေဝင်သူများ၏ လမ်းပြဿနာများကို မဖော်ပြနိုင်ခဲ့သည့် Boston ၏ app တစ်ခု။ |
| **Algorithmic Fairness** | 2018 - [Gender Shades Study](http://gendershades.org/overview.html) - AI များတွင် အမျိုးသမီးများနှင့် အရောင်အသားမတူသူများအတွက် တိကျမှုနည်းပါးမှုကို ဖော်ပြခဲ့သည်။ |
| **အချက်အလက်မှားယွင်းမှု** | 2020 - [Georgia COVID-19 charts](https://www.vox.com/covid-19-coronavirus-us-response-trump/2020/5/18/21262265/georgia-covid-19-cases-declining-reopening) - အချိန်လိုက်မဟုတ်သော x-axis ဖြင့် ပြည်သူများကို လှည့်ဖြားခဲ့သည်။ |
| **လွတ်လပ်စွာရွေးချယ်မှု၏ မျက်လှည့်** | 2020 - [ABCmouse](https://www.washingtonpost.com/business/2020/09/04/abcmouse-10-million-ftc-settlement/) - မိဘများကို စာရင်းပယ်ဖျက်ရန် မဖြစ်နိုင်စေသော dark patterns ကို အသုံးပြုခဲ့သည်။ |
| **ကိုယ်ရေးအချက်အလက်နှင့် အသုံးပြုသူအခွင့်အရေးများ** | 2021 - [Facebook Data Breach](https://www.npr.org/2021/04/09/986005820/after-data-breach-exposes-530-million-facebook-says-it-will-not-notify-users) - အသုံးပြုသူများကို အသိပေးရန် ငြင်းဆန်ခဲ့သည်။ |
| **သတင်းပေးသဘောတူညီမှု** | 1972 - [Tuskegee Syphilis Study](https://en.wikipedia.org/wiki/Tuskegee_Syphilis_Study) - အာဖရိကန်-အမေရိကန်လူမျိုးသားများကို အခမဲ့ဆေးကုသမှုပေးမည်ဟု ကတိပေးခဲ့သော်လည်း၊ ၎င်းတို့၏ ရောဂါအခြေအနေ သို့မဟုတ် ကုသမှုရရှိနိုင်မှုအကြောင်း မသတိပေးခဲ့သော သုတေသနမှူးများက လှည့်စားခဲ့သည်။ |
| **ဒေတာကိုယ်ရေးအချက်အလက်လုံခြုံမှု** | 2007 - [Netflix data prize](https://www.wired.com/2007/12/why-anonymous-data-sometimes-isnt/) - 50,000 ဖောက်သည်များ၏ 10M အမည်မဖော်ထားသော ရုပ်ရှင်အဆင့်သတ်မှတ်မှုများကို ထုတ်ပြန်ခဲ့သည်။ သို့သော် အခြားဒေတာများနှင့် ဆက်စပ်၍ Netflix အသုံးပြုသူများကို "အမည်ဖော်" လုပ်နိုင်ခဲ့သည်။ |
| **အချက်အလက်စုဆောင်းမှုအလွဲအချော်** | 2013 - [Street Bump](https://www.boston.gov/transportation/street-bump) - အနိမ့်ဝင်ငွေအုပ်စုများတွင် ကားနှင့်ဖုန်းများကို အသုံးပြုနိုင်မှုနည်းပါးသောကြောင့်၊ ၎င်းတို့၏ လမ်းမပြဿနာများကို မမြင်နိုင်ခဲ့ပါ။ |
| **Algorithmic Fairness** | 2018 - MIT [Gender Shades Study](http://gendershades.org/overview.html) - AI များတွင် အမျိုးသမီးများနှင့် အရောင်သားများအတွက် တိကျမှုနည်းပါးမှုကို ဖော်ထုတ်ခဲ့သည်။ |
| **ဒေတာမှားဖော်ပြမှု** | 2020 - [Georgia COVID-19 charts](https://www.vox.com/covid-19-coronavirus-us-response-trump/2020/5/18/21262265/georgia-covid-19-cases-declining-reopening) - အချိန်အစီအစဉ်မမှန်သော x-axis ဖြင့် ပြည်သူများကို လွှဲမှားစေသော visualization များကို အသုံးပြုခဲ့သည်။ |
| **လွတ်လပ်စွာရွေးချယ်မှု၏ မျှော်မှန်းမှု** | 2020 - [ABCmouse](https://www.washingtonpost.com/business/2020/09/04/abcmouse-10-million-ftc-settlement/) - မိဘများကို မရပ်တန့်နိုင်သော subscription များအတွက် ပိတ်မိစေခဲ့သည်။ |
| **ဒေတာလုံခြုံမှုနှင့် အသုံးပြုသူအခွင့်အရေးများ** | 2021 - Facebook [Data Breach](https://www.npr.org/2021/04/09/986005820/after-data-breach-exposes-530-million-facebook-says-it-will-not-notify-users) - အသုံးပြုသူ 530M ၏ ဒေတာကို ဖော်ထုတ်ခဲ့သည်။ |
ပိုမိုလေ့လာလိုပါသလား? ဤအရင်းအမြစ်များကို ကြည့်ပါ -
* [Ethics Unwrapped](https://ethicsunwrapped.utexas.edu/case-studies)
* [Data Science Ethics course](https://www.coursera.org/learn/data-science-ethics#syllabus)
* [Where things have gone wrong](https://deon.drivendata.org/examples/)
ပိုမိုလေ့လာလိုပါသလား? ဤအရင်းအမြစ်များကို ကြည့်ပါ-
* [Ethics Unwrapped](https://ethicsunwrapped.utexas.edu/case-studies) - စက်မှုလုပ်ငန်းများအနှံ့ ကျင့်ဝတ်ဆိုင်ရာ စိန်ခေါ်မှုများ။
* [Data Science Ethics course](https://www.coursera.org/learn/data-science-ethics#syllabus) - ကျင့်ဝတ်ဆိုင်ရာ landmark လေ့လာမှုများ။
* [Where things have gone wrong](https://deon.drivendata.org/examples/) - deon checklist နှင့် ဥပမာများ။
> 🚨 သင်ကြားခဲ့သော လေ့လာမှုများကို စဉ်းစားပါ - သင်သည် ဤကျင့်ဝတ်စိစစ်မှုတစ်ခုနှင့် ဆင်တူသော အခက်အခဲတစ်ခုကို သက်ရောက်ခံဖူးပါသလား။
> 🚨 သင်ကြည့်ရှုခဲ့သော လေ့လာမှုများအပေါ်တွင် စဉ်းစားပါ - သင်၏ဘဝတွင် အလားတူကျင့်ဝတ်ဆိုင်ရာ စိန်ခေါ်မှုတစ်ခုကို ကြုံတွေ့ဖူးပါသလား? ဤအပိုင်းတွင် ဆွေးနွေးထားသော ကျင့်ဝတ်ဆိုင်ရာ စိန်ခေါ်မှုတစ်ခုကို ဖော်ပြသည့် အခြားလေ့လာမှုတစ်ခုကို စဉ်းစားနိုင်ပါသလား?
## ကျင့်ဝတ်ကျင့်သုံးမှု
## ကျင့်ဝတ်ဆိုင်ရာ လက်တွေ့ကျင့်သုံးမှု
ကျင့်ဝတ်အကြောင်းအရာများ၊ စိစစ်မှုများနှင့် အမှန်တကယ်ကမ္ဘာကြီးတွင် ဖြစ်ပေါ်သော လေ့လာမှုများကို ဆွေးနွေးခဲ့ပါသည်။ ၎င်းတို့ကို သင်၏ပရောဂျက်များတွင် ကျင့်သုံးရန် စတင်ရန်အတွက် အချို့သောဖြေရှင်းနည်းများကို လေ့လာကြည့်ပါ -
ကျင့်ဝတ်ဆိုင်ရာ အယူအဆများ၊ စိန်ခေါ်မှုများနှင့် အမှန်တကယ်ဖြစ်ပျက်သော အခြေအနေများကို ဆွေးနွေးပြီးပါပြီ။ ဒါပေမယ့် ကျင့်ဝတ်ဆိုင်ရာ မူဝါဒများနှင့် လုပ်ဆောင်မှုများကို သင်၏ပရောဂျက်များတွင် ဘယ်လိုစတင်အသုံးချရမလဲ? ၎င်းတို့ကို အုပ်ချုပ်မှုအတွက် ဘယ်လို စနစ်တကျလုပ်ဆောင်ရမလဲ?
### 1. Professional Codes
### 1. ပရော်ဖက်ရှင်နယ် စံပြများ
Professional Codes သည် အဖွဲ့အစည်းများအတွက် ၎င်းတို့၏ ကျင့်ဝတ်စည်းမျဉ်းများနှင့် မစ်ရှင်ကို ထောက်ခံရန် အဖွဲ့ဝင်များကို "အားပေး" ရန် ရွေးချယ်မှုတစ်ခုဖြစ်သည်။
ပရော်ဖက်ရှင်နယ် စံပြများသည် အဖွဲ့အစည်းများအတွက် ၎င်းတို့၏ ကျင့်ဝတ်ဆိုင်ရာ မူဝါဒများနှင့် မစ်ရှင်ကို ထောက်ခံရန် အဖွဲ့ဝင်များကို "အားပေး" ရန် ရွေးချယ်မှုတစ်ခုဖြစ်သည်။
ဥပမာများ -
* [Oxford Munich](http://www.code-of-ethics.org/code-of-conduct/) Code of Ethics
* [Data Science Association](http://datascienceassn.org/code-of-conduct.html) Code of Conduct
* [ACM Code of Ethics and Professional Conduct](https://www.acm.org/code-of-ethics)
ဥပမာများ-
* [Oxford Munich](http://www.code-of-ethics.org/code-of-conduct/) Code of Ethics
* [Data Science Association](http://datascienceassn.org/code-of-conduct.html) Code of Conduct
* [ACM Code of Ethics and Professional Conduct](https://www.acm.org/code-of-ethics)
> 🚨 သင်သည် ပရော်ဖက်ရှင်နယ်အဖွဲ့အစည်းတစ်ခု၏ အဖွဲ့ဝင်ဖြစ်ပါသလား? ၎င်းတို့၏ ကျင့်ဝတ်စည်းမျဉ်းများကို စူးစမ်းကြည့်ပါ။
> 🚨 သင်သည် ပရော်ဖက်ရှင်နယ် အင်ဂျင်နီယာ သို့မဟုတ် ဒေတာသိပ္ပံအဖွဲ့အစည်းတစ်ခု၏ အဖွဲ့ဝင်ဖြစ်ပါသလား? ၎င်းတို့၏ ကျင့်ဝတ်ဆိုင်ရာ မူဝါဒများကို လေ့လာပါ။
### 2. Ethics Checklists
### 2. ကျင့်ဝတ် စစ်ဆေးစာရင်းများ
Checklists များသည် ကျင့်ဝတ်စည်းမျဉ်းများကို လုပ်ဆောင်နိုင်သော နည်းလမ်းများအဖြစ် ပြောင်းလဲပေးသည်။
ကျင့်ဝတ် စစ်ဆေးစာရင်းများသည် ကျင့်ဝတ်ဆိုင်ရာ မူဝါဒများကို လုပ်ဆောင်နိုင်သော နည်းလမ်းများဖြင့် ချိတ်ဆက်ရန် အထောက်အကူပြုသည်။
ဥပမာများ -
* [Deon](https://deon.drivendata.org/)
* [Privacy Audit Checklist](https://cyber.harvard.edu/ecommerce/privacyaudit.html)
* [AI Fairness Checklist](https://www.microsoft.com/en-us/research/project/ai-fairness-checklist/)
* [22 questions for ethics in data and AI](https://medium.com/the-organization/22-questions-for-ethics-in-data-and-ai-efb68fd19429)
ဥပမာများ-
* [Deon](https://deon.drivendata.org/) - ဒေတာကျင့်ဝတ် စစ်ဆေးစာရင်း။
* [Privacy Audit Checklist](https://cyber.harvard.edu/ecommerce/privacyaudit.html) - ကိုယ်ရေးအချက်အလက်ဆိုင်ရာ လမ်းညွှန်ချက်များ။
* [AI Fairness Checklist](https://www.microsoft.com/en-us/research/project/ai-fairness-checklist/) - AI ဖွံ့ဖြိုးမှုတွင် တရားမျှတမှု စစ်ဆေးမှုများ။
* [22 questions for ethics in data and AI](https://medium.com/the-organization/22-questions-for-ethics-in-data-and-ai-efb68fd19429) - ကျင့်ဝတ်ဆိုင်ရာ အခြေခံမေးခွန်းများ။
### 3. Ethics Regulations
### 3. ကျင့်ဝတ်ဆိုင်ရာ စည်းမျဉ်းများ
Governance သည် ကျင့်ဝတ်စည်းမျဉ်းများနှင့် တရားဥပဒေများကို လိုက်နာရန် အဖွဲ့အစည်းများ၏ လုပ်ဆောင်မှုများကို ဖော်ပြသည်။
ကျင့်ဝတ်သည် အတူတူမျှဝေသော တန်ဖိုးများကို သတ်မှတ်ခြင်းနှင့် စိတ်ကြိုက်လုပ်ဆောင်ခြင်းဖြစ်သည်။ **အညီအဖွဲ့** သည် သတ်မှတ်ထားသော ဥပဒေများကို လိုက်နာခြင်းဖြစ်သည်။
ဥပမာများ -
* `1974`, [US Privacy Act](https://www.justice.gov/opcl/privacy-act-1974)
* `1996`, [HIPAA](https://www.cdc.gov/phlp/publications/topic/hipaa.html)
* `2018`, [GDPR](https://gdpr-info.eu/)
* `2021`, [China's Personal Information Protection Law](https://www.reuters.com/world/china/china-passes-new-personal-data-privacy-law-take-effect-nov-1-2021-08-20/)
ဥပမာများ-
* `1974`, [US Privacy Act](https://www.justice.gov/opcl/privacy-act-1974)
* `1996`, [US Health Insurance Portability & Accountability Act (HIPAA)](https://www.cdc.gov/phlp/publications/topic/hipaa.html)
* `2018`, [General Data Protection Regulation (GDPR)](https://gdpr-info.eu/)
> 🚨 GDPR သည် ယနေ့အထိ အရေးကြီးသော ဒေတာလုံခြုံမှုဥပဒေတစ်ခုဖြစ်သည်။
> 🚨 GDPR သည် ယနေ့အထိ အရေးကြီးသော ဒေတာကိုယ်ရေးအချက်အလက်ဆိုင်ရာ စည်းမျဉ်းများထဲမှ တစ်ခုဖြစ်သည်။ ၎င်းသည် [အသုံးပြုသူ၏ ၈ ချက်အခွင့်အရေးများ](https://www.freeprivacypolicy.com/blog/8-user-rights-gdpr) ကိုလည်း သတ်မှတ်ထားသည်။
### 4. Ethics Culture
### 4. ကျင့်ဝတ်ယဉ်ကျေးမှု
ကျင့်ဝတ်စည်းမျဉ်းများကို အဖွဲ့အစည်းများတွင် ပိုမိုတည်ငြိမ်သော ယဉ်ကျေးမှုအဖြစ် ဖော်ဆောင်ရန် လိုအပ်သည်။
**အညီအဖွဲ့** နှင့် [စနစ်ဆိုင်ရာပြဿနာများ](https://www.coursera.org/learn/data-science-ethics/home/week/4) ကို ဖြေရှင်းရန် အဖွဲ့အစည်းများအတွင်း ကျင့်ဝတ်ယဉ်ကျေးမှုများကို တည်ဆောက်ရန် လိုအပ်သည်။
> 🚨 Ethics Culture သည် အဖွဲ့အစည်းများအတွင်း သက်ရောက်မှုရှိသော ကျင့်ဝတ်စည်းမျဉ်းများကို တည်ဆောက်ရန် အရေးကြီးသည်။
---
## [Post-lecture quiz](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/3) 🎯
## ပြန်လည်သုံးသပ်ခြင်းနှင့် ကိုယ်တိုင်လေ့လာမှု
သင်ယူရန် အရင်းအမြစ်များ-
* [Machine Learning For Beginners](https://github.com/microsoft/ML-For-Beginners/blob/main/1-Introduction/3-fairness/README.md) - Microsoft မှ Fairness သင်ခန်းစာ။
* [AI တာဝန်ယူမှုဆိုင်ရာ မူဝါဒများ](https://docs.microsoft.com/en-us/learn/modules/responsible-ai-principles/) - Microsoft Learn မှ အခမဲ့ သင်ကြားမှုလမ်းကြောင်း။
* [Ethics and Data Science](https://resources.oreilly.com/examples/0636920203964) - O'Reilly EBook (M. Loukides, H. Mason et. al)
* [Data Science Ethics](https://www.coursera.org/learn/data-science-ethics#syllabus) - မီချီဂန်တက္ကသိုလ်မှ အွန်လိုင်းသင်တန်း။
## [Post-lecture quiz](https://ff-quizzes.netlify.app/en/ds/) 🎯
## Review & Self Study
သင်ယူရန် အရင်းအမြစ်များ -
* [Machine Learning For Beginners](https://github.com/microsoft/ML-For-Beginners/blob/main/1-Introduction/3-fairness/README.md)
* [AI တာဝန်ယူမှုဆိုင်ရာ မူဝါဒများ](https://docs.microsoft.com/en-us/learn/modules/responsible-ai-principles/) - Microsoft Learn မှ အခမဲ့ သင်ကြားမှု လမ်းကြောင်း။
* [Ethics and Data Science](https://resources.oreilly.com/examples/0636920203964) - O'Reilly EBook (M. Loukides, H. Mason စသည်တို့)
* [Data Science Ethics](https://www.coursera.org/learn/data-science-ethics#syllabus) - မီချီဂန်တက္ကသိုလ်မှ အွန်လိုင်း သင်တန်း။
* [Ethics Unwrapped](https://ethicsunwrapped.utexas.edu/case-studies) - တက္ကဆက်တက္ကသိုလ်မှ ကိစ္စလေ့လာမှုများ။
# လုပ်ငန်း
# လုပ်ငန်းတာဝန်
[Data Ethics Case Study ရေးရန်](assignment.md)
[ဒေတာကျင့်ဝတ်ဆိုင်ရာ ကိစ္စလေ့လာမှုရေးသားရန်](assignment.md)
---
**ဝက်ဘ်ဆိုက်မှတ်ချက်**:
ဤစာရွက်စာတမ်းကို AI ဘာသာပြန်ဝန်ဆောင်မှု [Co-op Translator](https://github.com/Azure/co-op-translator) ကို အသုံးပြု၍ ဘာသာပြန်ထားပါသည်။ ကျွန်ုပ်တို့သည် တိကျမှန်ကန်မှုအတွက် ကြိုးစားနေပါသော်လည်း၊ အလိုအလျောက်ဘာသာပြန်မှုများတွင် အမှားများ သို့မဟုတ် မမှန်ကန်မှုများ ပါဝင်နိုင်သည်ကို ကျေးဇူးပြု၍ သတိပြုပါ။ မူရင်းစာရွက်စာတမ်းကို ၎င်း၏ မူလဘာသာစကားဖြင့် အာဏာတည်သောရင်းမြစ်အဖြစ် သတ်မှတ်ရန် လိုအပ်ပါသည်။ အရေးကြီးသော အချက်အလက်များအတွက် လူ့ဘာသာပြန်ပညာရှင်များမှ အတည်ပြုထားသော ဘာသာပြန်မှုကို အသုံးပြုရန် အကြံပြုပါသည်။ ဤဘာသာပြန်မှုကို အသုံးပြုခြင်းမှ ဖြစ်ပေါ်လာသော နားလည်မှုမှားမှုများ သို့မဟုတ် အဓိပ္ပာယ်မှားမှုများအတွက် ကျွန်ုပ်တို့သည် တာဝန်မယူပါ။
**အကြောင်းကြားချက်**:
ဤစာရွက်စာတမ်းကို AI ဘာသာပြန်ဝန်ဆောင်မှု [Co-op Translator](https://github.com/Azure/co-op-translator) ကို အသုံးပြု၍ ဘာသာပြန်ထားပါသည်။ ကျွန်ုပ်တို့သည် တိကျမှုအတွက် ကြိုးစားနေသော်လည်း၊ အလိုအလျောက် ဘာသာပြန်ခြင်းတွင် အမှားများ သို့မဟုတ် မတိကျမှုများ ပါဝင်နိုင်သည်ကို သတိပြုပါ။ မူရင်းဘာသာစကားဖြင့် ရေးသားထားသော စာရွက်စာတမ်းကို အာဏာတရ အရင်းအမြစ်အဖြစ် ရှုလို့ရပါသည်။ အရေးကြီးသော အချက်အလက်များအတွက် လူက ဘာသာပြန်ခြင်းကို အကြံပြုပါသည်။ ဤဘာသာပြန်ကို အသုံးပြုခြင်းမှ ဖြစ်ပေါ်လာသော အလွဲအမှားများ သို့မဟုတ် အနားလွဲမှုများအတွက် ကျွန်ုပ်တို့သည် တာဝန်မယူပါ။

@ -1,8 +1,8 @@
<!--
CO_OP_TRANSLATOR_METADATA:
{
"original_hash": "8796f41f566a0a8ebb72863a83d558ed",
"translation_date": "2025-08-27T17:06:12+00:00",
"original_hash": "3a34157cc63516eba97c89a0b2f8c3e6",
"translation_date": "2025-09-03T21:11:41+00:00",
"source_file": "1-Introduction/02-ethics/README.md",
"language_code": "ne"
}
@ -15,66 +15,69 @@ CO_OP_TRANSLATOR_METADATA:
---
हामी सबै डाटा नागरिक हौं, जो डाटाको संसारमा बाँचिरहेका छौं।
हामी सबै डाटाको संसारमा बस्ने डाटा नागरिक हौं।
बजार प्रवृत्तिहरूले देखाउँछन् कि २०२२ सम्ममा, ३ मध्ये १ ठूला संस्थाहरूले आफ्नो डाटा अनलाइन [बजार र एक्सचेन्जहरू](https://www.gartner.com/smarterwithgartner/gartner-top-10-trends-in-data-and-analytics-for-2020/) मार्फत किनबेच गर्नेछन्। **एप डेभलपरहरू**को रूपमा, हामीलाई डाटा-आधारित अन्तर्दृष्टि र एल्गोरिदम-आधारित स्वचालनलाई दैनिक प्रयोगकर्ता अनुभवमा समाहित गर्न सजिलो र सस्तो हुनेछ। तर, जब एआई व्यापक हुन्छ, हामीले यस्तो एल्गोरिदमको [हथियारकरण](https://www.youtube.com/watch?v=TQHs8SA1qpk)ले ठूलो स्तरमा निम्त्याउन सक्ने सम्भावित हानिहरूलाई पनि बुझ्न आवश्यक छ।
बजार प्रवृत्तिहरूले बताउँछन् कि २०२२ सम्ममा, ३ मध्ये १ ठूला संस्थाहरूले आफ्नो डाटा अनलाइन [बजार र एक्सचेन्ज](https://www.gartner.com/smarterwithgartner/gartner-top-10-trends-in-data-and-analytics-for-2020/) मार्फत किनबेच गर्नेछन्। **एप डेभलपरहरू**को रूपमा, हामीलाई डाटा-आधारित अन्तर्दृष्टि र एल्गोरिदम-आधारित स्वचालनलाई दैनिक प्रयोगकर्ता अनुभवमा समाहित गर्न सजिलो र सस्तो हुनेछ। तर, जब एआई व्यापक हुन्छ, हामीले यस्तो एल्गोरिदमको [हथियारकरण](https://www.youtube.com/watch?v=TQHs8SA1qpk)ले ठूलो स्तरमा निम्त्याउन सक्ने सम्भावित हानिहरूलाई पनि बुझ्न आवश्यक छ।
प्रवृत्तिहरूले यो पनि देखाउँछन् कि हामीले २०२५ सम्ममा [१८० जेटाबाइट्स](https://www.statista.com/statistics/871513/worldwide-data-created/) भन्दा बढी डाटा सिर्जना र उपभोग गर्नेछौं। **डाटा वैज्ञानिकहरू**को रूपमा, यसले हामीलाई व्यक्तिगत डाटामा अभूतपूर्व पहुँच दिन्छ। यसको अर्थ हामी प्रयोगकर्ताहरूको व्यवहारिक प्रोफाइल निर्माण गर्न सक्छौं र निर्णय-निर्माणलाई प्रभाव पार्न सक्छौं जसले [स्वतन्त्र छनोटको भ्रम](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice) सिर्जना गर्न सक्छ, जबकि सम्भावित रूपमा प्रयोगकर्ताहरूलाई हामीले चाहेको परिणामतर्फ धकेल्न सक्छ। यसले डाटा गोपनीयता र प्रयोगकर्ता सुरक्षाको व्यापक प्रश्नहरू पनि उठाउँछ।
प्रवृत्तिहरूले यो पनि संकेत गर्छन् कि हामीले २०२५ सम्ममा [१८० जेटाबाइट्स](https://www.statista.com/statistics/871513/worldwide-data-created/) भन्दा बढी डाटा सिर्जना र उपभोग गर्नेछौं। **डाटा वैज्ञानिकहरू**को रूपमा, यसले हामीलाई व्यक्तिगत डाटामा अभूतपूर्व पहुँच दिन्छ। यसको मतलब हामी प्रयोगकर्ताहरूको व्यवहारिक प्रोफाइल निर्माण गर्न सक्छौं र निर्णय-निर्माणलाई प्रभाव पार्न सक्छौं जसले [स्वतन्त्र छनोटको भ्रम](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice) सिर्जना गर्न सक्छ, जबकि सम्भावित रूपमा प्रयोगकर्ताहरूलाई हामीले चाहेको परिणामतर्फ धकेल्न सक्छ। यसले डाटा गोपनीयता र प्रयोगकर्ता सुरक्षाको व्यापक प्रश्नहरू पनि उठाउँछ।
डाटा नैतिकता अब डाटा विज्ञान र इन्जिनियरिङका लागि _आवश्यक सुरक्षा उपायहरू_ हुन्, जसले डाटा-आधारित कार्यहरूबाट सम्भावित हानिहरू र अनपेक्षित परिणामहरूलाई न्यूनतम गर्न मद्दत गर्दछ। [गार्टनरको एआईको हाइप साइकल](https://www.gartner.com/smarterwithgartner/2-megatrends-dominate-the-gartner-hype-cycle-for-artificial-intelligence-2020/)ले डिजिटल नैतिकता, जिम्मेवार एआई, र एआई शासनमा प्रवृत्तिहरूलाई _एआईको लोकतान्त्रीकरण__औद्योगिकीकरण_ वरिपरि ठूला प्रवृत्तिहरूका प्रमुख चालकहरूका रूपमा पहिचान गर्दछ।
डाटा नैतिकता अब डाटा विज्ञान र इन्जिनियरिङका लागि _आवश्यक सुरक्षा उपायहरू_ हुन्, जसले डाटा-आधारित कार्यहरूबाट सम्भावित हानिहरू र अनपेक्षित परिणामहरूलाई न्यूनतम गर्न मद्दत गर्दछ। [गार्टनरको एआई हाइप साइकल](https://www.gartner.com/smarterwithgartner/2-megatrends-dominate-the-gartner-hype-cycle-for-artificial-intelligence-2020/)ले डिजिटल नैतिकता, जिम्मेवार एआई, र एआई शासनमा सम्बन्धित प्रवृत्तिहरूलाई _एआईको लोकतान्त्रीकरण__औद्योगिकीकरण_ वरिपरि ठूला प्रवृत्तिहरूका प्रमुख चालकको रूपमा पहिचान गर्दछ।
![गार्टनरको एआईको हाइप साइकल - २०२०](https://images-cdn.newscred.com/Zz1mOWJhNzlkNDA2ZTMxMWViYjRiOGFiM2IyMjQ1YmMwZQ==)
![गार्टनरको एआई हाइप साइकल - २०२०](https://images-cdn.newscred.com/Zz1mOWJhNzlkNDA2ZTMxMWViYjRiOGFiM2IyMjQ1YmMwZQ==)
यस पाठमा, हामी डाटा नैतिकताको रोचक क्षेत्र अन्वेषण गर्नेछौं - मूल अवधारणाहरू र चुनौतीहरूदेखि लिएर केस स्टडीहरू र एआई अवधारणाहरू जस्तै शासन - जसले डाटा र एआईसँग काम गर्ने टोलीहरू र संस्थाहरूमा नैतिकताको संस्कृति स्थापना गर्न मद्दत गर्दछ।
यस पाठमा, हामी डाटा नैतिकताको रोचक क्षेत्र अन्वेषण गर्नेछौं - मूल अवधारणाहरू र चुनौतीहरूदेखि लिएर केस स्टडीहरू र लागू गरिएको एआई अवधारणाहरू जस्तै शासन - जसले डाटा र एआईसँग काम गर्ने टोलीहरू र संस्थाहरूमा नैतिकताको संस्कृति स्थापना गर्न मद्दत गर्दछ।
## [पाठ अघिको क्विज](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/2) 🎯
## आधारभूत परिभाषाहरू
आउनुहोस्, आधारभूत शब्दावली बुझ्न सुरु गरौं।
आउनुहोस्, आधारभूत शब्दावली बुझेर सुरु गरौं।
"नैतिकता" शब्द [ग्रीक शब्द "ethikos"](https://en.wikipedia.org/wiki/Ethics) (र यसको मूल "ethos") बाट आएको हो, जसको अर्थ _चरित्र वा नैतिक प्रकृति_ हो।
**नैतिकता** भनेको समाजमा हाम्रो व्यवहारलाई शासित गर्ने साझा मूल्यहरू र नैतिक सिद्धान्तहरू हो। नैतिकता कानूनमा आधारित छैन तर "सही बनाम गलत" के हो भन्ने व्यापक रूपमा स्वीकार गरिएका मानदण्डहरूमा आधारित छ। यद्यपि, नैतिक विचारहरूले कर्पोरेट शासन पहलहरू र सरकारका नियमहरूलाई प्रभाव पार्न सक्छन्, जसले अनुपालनका लागि थप प्रोत्साहनहरू सिर्जना गर्दछ।
**नैतिकता** भनेको समाजमा हाम्रो व्यवहारलाई शासित गर्ने साझा मूल्यहरू र नैतिक सिद्धान्तहरू हो। नैतिकता कानूनमा आधारित छैन तर "सही बनाम गलत" के हो भन्ने व्यापक रूपमा स्वीकार गरिएका मानदण्डहरूमा आधारित छ। यद्यपि, नैतिक विचारहरूले कर्पोरेट शासन पहलहरू र सरकार नियमहरूलाई प्रभाव पार्न सक्छ जसले अनुपालनका लागि थप प्रोत्साहनहरू सिर्जना गर्दछ।
**डाटा नैतिकता** भनेको "_डाटा, एल्गोरिदम र सम्बन्धित अभ्यासहरू_"सँग सम्बन्धित नैतिक समस्याहरूको अध्ययन र मूल्यांकन गर्ने [नैतिकताको नयाँ शाखा](https://royalsocietypublishing.org/doi/full/10.1098/rsta.2016.0360#sec-1) हो। यहाँ, **"डाटा"**ले उत्पादन, रेकर्डिङ, क्युरेसन, प्रशोधन, प्रसार, साझेदारी, र प्रयोगसँग सम्बन्धित कार्यहरूमा ध्यान केन्द्रित गर्दछ, **"एल्गोरिदम"**ले एआई, एजेन्टहरू, मेशिन लर्निङ, र रोबोटहरूमा ध्यान केन्द्रित गर्दछ, र **"अभ्यासहरू"**ले जिम्मेवार नवप्रवर्तन, प्रोग्रामिङ, ह्याकिङ, र नैतिकता कोडहरू जस्ता विषयहरूमा ध्यान केन्द्रित गर्दछ।
**लागू गरिएको नैतिकता** भनेको [नैतिक विचारहरूको व्यावहारिक प्रयोग](https://en.wikipedia.org/wiki/Applied_ethics) हो। यो _वास्तविक-विश्व कार्यहरू, उत्पादनहरू र प्रक्रियाहरू_को सन्दर्भमा नैतिक मुद्दाहरू सक्रिय रूपमा अनुसन्धान गर्ने प्रक्रिया हो, र परिभाषित नैतिक मूल्यहरूसँग मिल्न सुनिश्चित गर्न सुधारात्मक उपायहरू लिने प्रक्रिया हो।
**लागू नैतिकता** भनेको [नैतिक विचारहरूको व्यावहारिक प्रयोग](https://en.wikipedia.org/wiki/Applied_ethics) हो। यो _वास्तविक-विश्व कार्यहरू, उत्पादनहरू र प्रक्रियाहरू_को सन्दर्भमा नैतिक मुद्दाहरूलाई सक्रिय रूपमा अनुसन्धान गर्ने प्रक्रिया हो, र परिभाषित नैतिक मूल्यहरूसँग मिल्न सुनिश्चित गर्न सुधारात्मक उपायहरू लिने प्रक्रिया हो।
**नैतिकता संस्कृति** भनेको [_लागू नैतिकतालाई_ सञ्चालनमा ल्याउने](https://hbr.org/2019/05/how-to-design-an-ethical-organization) कुरा हो ताकि हाम्रो नैतिक सिद्धान्तहरू र अभ्यासहरू संगठनभरि निरन्तर र मापनयोग्य रूपमा अपनाइन्छ। सफल नैतिकता संस्कृतिले संगठन-व्यापी नैतिक सिद्धान्तहरू परिभाषित गर्दछ, अनुपालनका लागि अर्थपूर्ण प्रोत्साहनहरू प्रदान गर्दछ, र प्रत्येक स्तरमा वाञ्छित व्यवहारलाई प्रोत्साहित र प्रवर्द्धन गरेर नैतिकता मानदण्डहरूलाई सुदृढ गर्दछ।
**नैतिकता संस्कृति** भनेको [_लागू गरिएको नैतिकतालाई_ सञ्चालनमा ल्याउने](https://hbr.org/2019/05/how-to-design-an-ethical-organization) कुरा हो, जसले सुनिश्चित गर्दछ कि हाम्रो नैतिक सिद्धान्तहरू र अभ्यासहरू संस्थाको सम्पूर्ण स्तरमा निरन्तर र मापनयोग्य रूपमा अपनाइन्छ। सफल नैतिकता संस्कृतिले संस्थागत स्तरमा नैतिक सिद्धान्तहरू परिभाषित गर्दछ, अनुपालनका लागि अर्थपूर्ण प्रोत्साहनहरू प्रदान गर्दछ, र प्रत्येक स्तरमा इच्छित व्यवहारलाई प्रोत्साहित र प्रवर्द्धन गरेर नैतिकता मानदण्डहरूलाई सुदृढ गर्दछ।
## नैतिकता अवधारणाहरू
यस खण्डमा, हामी **साझा मूल्यहरू** (सिद्धान्तहरू) र **नैतिक चुनौतीहरू** (समस्याहरू) जस्ता अवधारणाहरूको चर्चा गर्नेछौं - र **केस स्टडीहरू** अन्वेषण गर्नेछौं जसले तपाईंलाई वास्तविक-विश्व सन्दर्भहरूमा यी अवधारणाहरू बुझ्न मद्दत गर्दछ।
यस खण्डमा, हामी **साझा मूल्यहरू** (सिद्धान्तहरू) र **नैतिक चुनौतीहरू** (समस्याहरू) जस्ता डाटा नैतिकता अवधारणाहरूको चर्चा गर्नेछौं - र **केस स्टडीहरू** अन्वेषण गर्नेछौं जसले तपाईंलाई वास्तविक-विश्व सन्दर्भहरूमा यी अवधारणाहरू बुझ्न मद्दत गर्दछ।
### १. नैतिकता सिद्धान्तहरू
प्रत्येक डाटा नैतिकता रणनीति _नैतिक सिद्धान्तहरू_ परिभाषित गरेर सुरु हुन्छ - "साझा मूल्यहरू" जसले स्वीकार्य व्यवहारहरू वर्णन गर्दछ, र हाम्रो डाटा र एआई परियोजनाहरूमा अनुपालन कार्यहरूलाई मार्गदर्शन गर्दछ। तपाईंले यी व्यक्तिगत वा टोली स्तरमा परिभाषित गर्न सक्नुहुन्छ। यद्यपि, अधिकांश ठूला संस्थाहरूले यीलाई _नैतिक एआई_ मिशन वक्तव्य वा रूपरेखामा परिभाषित गर्छन्, जुन संस्थागत स्तरमा परिभाषित गरिन्छ र सबै टोलीहरूमा निरन्तर लागू गरिन्छ।
प्रत्येक डाटा नैतिकता रणनीति _नैतिक सिद्धान्तहरू_ परिभाषित गरेर सुरु हुन्छ - "साझा मूल्यहरू" जसले स्वीकार्य व्यवहारहरू वर्णन गर्दछ, र हाम्रो डाटा र एआई परियोजनाहरूमा अनुपालन कार्यहरूलाई मार्गदर्शन गर्दछ। तपाईंले यी व्यक्तिगत वा टोली स्तरमा परिभाषित गर्न सक्नुहुन्छ। यद्यपि, अधिकांश ठूला संस्थाहरूले यीलाई _नैतिक एआई_ मिशन वक्तव्य वा रूपरेखामा परिभाषित गर्छन् जुन कर्पोरेट स्तरमा परिभाषित गरिन्छ र सबै टोलीहरूमा निरन्तर लागू गरिन्छ।
**उदाहरण:** माइक्रोसफ्टको [जिम्मेवार एआई](https://www.microsoft.com/en-us/ai/responsible-ai) मिशन वक्तव्य भन्छ: _"हामी एआईको उन्नतिमा प्रतिबद्ध छौं, जसले मानिसहरूलाई प्राथमिकतामा राख्ने नैतिक सिद्धान्तहरूद्वारा निर्देशित छ"_ - तलको रूपरेखामा ६ नैतिक सिद्धान्तहरू पहिचान गर्दै:
**उदाहरण:** माइक्रोसफ्टको [जिम्मेवार एआई](https://www.microsoft.com/en-us/ai/responsible-ai) मिशन वक्तव्य भन्छ: _"हामी एआईको उन्नतिमा प्रतिबद्ध छौं जसले मानिसहरूलाई प्राथमिकता दिने नैतिक सिद्धान्तहरूद्वारा निर्देशित छ"_ - तलको रूपरेखामा ६ नैतिक सिद्धान्तहरू पहिचान गर्दै:
![माइक्रोसफ्टमा जिम्मेवार एआई](https://docs.microsoft.com/en-gb/azure/cognitive-services/personalizer/media/ethics-and-responsible-use/ai-values-future-computed.png)
आउनुहोस्, यी सिद्धान्तहरूलाई संक्षेपमा अन्वेषण गरौं। _पारदर्शिता__जवाफदेहिता_ आधारभूत मूल्यहरू हुन्, जसमा अन्य सिद्धान्तहरू निर्माण गरिन्छ - त्यसैले त्यहाँबाट सुरु गरौं:
आउनुहोस्, यी सिद्धान्तहरूलाई संक्षेपमा अन्वेषण गरौं। _पारदर्शिता__जवाफदेहिता_ आधारभूत मूल्यहरू हुन् जसमा अन्य सिद्धान्तहरू निर्माण गरिन्छ - त्यसैले त्यहाँबाट सुरु गरौं:
* [**जवाफदेहिता**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6)ले अभ्यासकर्ताहरूलाई आफ्नो डाटा र एआई कार्यहरू, र यी नैतिक सिद्धान्तहरूसँग अनुपालनको लागि _जिम्मेवार_ बनाउँछ।
* [**पारदर्शिता**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6)ले सुनिश्चित गर्दछ कि डाटा र एआई कार्यहरू प्रयोगकर्ताहरूका लागि _बुझ्न सकिने_ (व्याख्यायोग्य) छन्, निर्णयहरूको पछाडि के र किन भन्ने कुरा स्पष्ट र्दै।
* [**न्याय**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1%3aprimaryr6) - सुनिश्चित गर्नमा केन्द्रित छ कि एआईले _सबै मानिसहरूलाई_ न्यायसंगत व्यवहार गर्छ, डाटा र प्रणालीमा कुनै पनि प्रणालीगत वा निहित सामाजिक-प्राविधिक पूर्वाग्रहहरूलाई सम्बोधन गर्दै।
* [**विश्वसनीयता र सुरक्षा**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - सुनिश्चित गर्दछ कि एआईले परिभाषित मूल्यहरूसँग _लगातार_ व्यवहार गर्छ, सम्भावित हानिहरू वा अनपेक्षित परिणामहरूलाई न्यूनतम गर्दै।
* [**गोपनीयता र सुरक्षा**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - डाटा वंशावली बुझ्न र प्रयोगकर्ताहरूलाई _डाटा गोपनीयता र सम्बन्धित सुरक्षा_ प्रदान गर्नमा केन्द्रित छ।
* [**समावेशिता**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - उद्देश्यका साथ एआई समाधानहरू डिजाइन गर्ने, तिनीहरूलाई _व्यापक मानव आवश्यकताहरू_ र क्षमताहरू पूरा गर्न अनुकूल बनाउने बारे हो।
* [**पारदर्शिता**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6)ले डाटा र एआई कार्यहरूलाई प्रयोगकर्ताहरूका लागि _बुझ्न सकिने_ (व्याख्यात्मक) बनाउँछ, निर्णयहरूको पछाडि के र किन भन्ने कुरा स्पष्ट पार्दै।
* [**न्याय**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1%3aprimaryr6) - एआईले _सबै मानिसहरूलाई_ न्यायसंगत व्यवहार गर्ने सुनिश्चित गर्न ध्यान केन्द्रित गर्दछ, डाटा र प्रणालीमा कुनै पनि प्रणालीगत वा निहित सामाजिक-प्राविधिक पूर्वाग्रहहरूलाई सम्बोधन गर्दै।
* [**विश्वसनीयता र सुरक्षा**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - एआईले परिभाषित मूल्यहरूसँग _लगातार_ व्यवहार गर्ने सुनिश्चित गर्दछ, सम्भावित हानिहरू वा अनपेक्षित परिणामहरूलाई न्यूनतम गर्दै।
* [**गोपनीयता र सुरक्षा**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - डाटा वंशावली बुझ्न र प्रयोगकर्ताहरूलाई _डाटा गोपनीयता र सम्बन्धित सुरक्षा_ प्रदान गर्न ध्यान केन्द्रित गर्दछ।
* [**समावेशिता**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - एआई समाधानहरूलाई उद्देश्यका साथ डिजाइन गर्ने, तिनीहरूलाई _व्यापक मानव आवश्यकताहरू_ र क्षमताहरू पूरा गर्न अनुकूल बनाउने बारे हो।
> 🚨 आफ्नो डाटा नैतिकता मिशन वक्तव्य के हुन सक्छ भनेर सोच्नुहोस्। अन्य संस्थाहरूबाट नैतिक एआई रूपरेखाहरू अन्वेषण गर्नुहोस् - यहाँ [आईबीएम](https://www.ibm.com/cloud/learn/ai-ethics), [गुगल](https://ai.google/principles), र [फेसबुक](https://ai.facebook.com/blog/facebooks-five-pillars-of-responsible-ai/)का उदाहरणहरू छन्। तिनीहरूमा साझा मूल्यहरू के छन्? यी सिद्धान्तहरू उनीहरूको एआई उत्पादन वा उद्योगसँग कसरी सम्बन्धित छन्?
> 🚨 आफ्नो डाटा नैतिकता मिशन वक्तव्य के हुन सक्छ भनेर सोच्नुहोस्। अन्य संस्थाहरूका नैतिक एआई रूपरेखाहरू अन्वेषण गर्नुहोस् - यहाँ [आईबीएम](https://www.ibm.com/cloud/learn/ai-ethics), [गुगल](https://ai.google/principles), र [फेसबुक](https://ai.facebook.com/blog/facebooks-five-pillars-of-responsible-ai/)का उदाहरणहरू छन्। तिनीहरूमा साझा मूल्यहरू के छन्? यी सिद्धान्तहरू उनीहरूको एआई उत्पादन वा उद्योगसँग कसरी सम्बन्धित छन्?
### २. नैतिकता चुनौतीहरू
एक पटक हामीले नैतिक सिद्धान्तहरू परिभाषित गरेपछि, अर्को चरण भनेको हाम्रो डाटा र एआई कार्यहरूलाई मूल्याङ्कन गर्नु हो कि तिनीहरू ती साझा मूल्यहरूसँग मेल खान्छन्। आफ्नो कार्यहरूलाई दुई श्रेणीमा सोच्नुहोस्: _डाटा सङ्कलन__एल्गोरिदम डिजाइन_
डाटा सङ्कलनसँग, कार्यहरू सम्भवतः **व्यक्तिगत डाटा** वा पहिचानयोग्य जीवित व्यक्तिहरूको व्यक्तिगत रूपमा पहिचानयोग्य जानकारी (PII) समावेश गर्नेछन्। यसमा [गैर-व्यक्तिगत डाटाका विविध वस्तुहरू](https://ec.europa.eu/info/law/law-topic/data-protection/reform/what-personal-data_en) समावेश छन्, जसले _सामूहिक रूपमा_ व्यक्तिलाई पहिचान गर्दछ। नैतिक चुनौतीहरू _डाटा गोपनीयता_, _डाटा स्वामित्व_, र _जानकारी सहमति_ र प्रयोगकर्ताहरूका लागि _बौद्धिक सम्पत्ति अधिकार_ जस्ता सम्बन्धित विषयहरूसँग सम्बन्धित हुन सक्छ।
डाटा सङ्कलनसँग, कार्यहरू सम्भवतः **व्यक्तिगत डाटा** वा पहिचानयोग्य जीवित व्यक्तिहरूको व्यक्तिगत रूपमा पहिचानयोग्य जानकारी (PII) समावेश गर्नेछन्। यसमा [विविध गैर-व्यक्तिगत डाटा](https://ec.europa.eu/info/law/law-topic/data-protection/reform/what-personal-data_en) समावेश छ जसले _सामूहिक रूपमा_ व्यक्तिलाई पहिचान गर्दछ। नैतिक चुनौतीहरू _डाटा गोपनीयता_, _डाटा स्वामित्व_, र _जानकारी सहमति_ र प्रयोगकर्ताहरूका लागि _बौद्धिक सम्पत्ति अधिकार_ जस्ता सम्बन्धित विषयहरूमा सम्बन्धित हुन सक्छ।
एल्गोरिदम डिजाइनसँग, कार्यहरू **डाटासेटहरू** सङ्कलन र क्युरेट गर्ने, त्यसपछि तिनीहरूलाई **डाटा मोडेलहरू**लाई प्रशिक्षण र तैनाथ गर्न प्रयोग गर्ने जसले वास्तविक-विश्व सन्दर्भहरूमा परिणामहरूको भविष्यवाणी गर्दछ वा निर्णयहरू स्वचालित बनाउँछ। नैतिक चुनौतीहरू _डाटासेट पूर्वाग्रह_, _डाटा गुणस्तर_ समस्याहरू, _अन्याय_, र एल्गोरिदममा _गलत प्रतिनिधित्व_बाट उत्पन्न हुन सक्छ - जसमा केही मुद्दाहरू प्रणालीगत प्रकृतिका छन्।
एल्गोरिदम डिजाइनसँग, कार्यहरू **डाटासेटहरू** सङ्कलन र क्युरेट गर्ने, त्यसपछि तिनीहरूलाई **डाटा मोडेलहरू**लाई प्रशिक्षण र तैनाथ गर्न प्रयोग गर्ने, जसले वास्तविक-विश्व सन्दर्भहरूमा परिणामहरूको भविष्यवाणी वा निर्णयहरू स्वचालित बनाउँछ। नैतिक चुनौतीहरू _डाटासेट पूर्वाग्रह_, _डाटा गुणस्तर_ समस्याहरू, _अन्याय_, र एल्गोरिदममा _गलत प्रतिनिधित्व_बाट उत्पन्न हुन सक्छ - जसमा केही मुद्दाहरू प्रणालीगत प्रकृतिका छन्।
दुवै अवस्थामा, नैतिक चुनौतीहरूले हाम्रो कार्यहरू साझा मूल्यहरूसँग द्वन्द्वमा आउन सक्ने क्षेत्रहरूलाई हाइलाइट गर्दछ। यी चिन्ताहरू पत्ता लगाउन, कम गर्न, न्यूनतम गर्न, वा हटाउन - हामीले हाम्रो कार्यहरूसँग सम्बन्धित नैतिक "हो/होइन" प्रश्नहरू सोध्न आवश्यक छ, त्यसपछि आवश्यक सुधारात्मक कार्यहरू लिनुपर्छ। आउनुहोस्, केही नैतिक चुनौतीहरू र तिनीहरूले उठाउने नैतिक प्रश्नहरूलाई हेरौं:
दुवै अवस्थामा, नैतिक चुनौतीहरूले हाम्रो कार्यहरू साझा मूल्यहरूसँग द्वन्द्वमा आउन सक्ने क्षेत्रहरूलाई उजागर गर्छ। यी चिन्ताहरू पत्ता लगाउन, कम गर्न, न्यूनतम गर्न, वा हटाउन - हामीले हाम्रो कार्यहरूसँग सम्बन्धित नैतिक "हो/होइन" प्रश्नहरू सोध्न आवश्यक छ, त्यसपछि आवश्यक सुधारात्मक कार्यहरू लिनुपर्छ। आउनुहोस्, केही नैतिक चुनौतीहरू र तिनीहरूले उठाउने नैतिक प्रश्नहरूलाई हेरौं:
#### २.१ डाटा स्वामित्व
@ -90,13 +93,13 @@ CO_OP_TRANSLATOR_METADATA:
[जानकारी सहमति](https://legaldictionary.net/informed-consent/)ले प्रयोगकर्ताहरूले (जस्तै डाटा सङ्कलन) कार्यमा सहमति जनाउने कार्यलाई परिभाषित गर्दछ, _सम्बन्धित तथ्यहरूको पूर्ण समझ_ सहित उद्देश्य, सम्भावित जोखिमहरू, र विकल्पहरू।
यहाँ अन्वेषण गर्नुपर्ने प्रश्नहरू:
* के प्रयोगकर्ताले (डाटा विषय) डाटा सङ्कलन र प्रयोगको लागि अनुमति दिए?
* के प्रयोगकर्ताले डाटा सङ्कलनको उद्देश्य बुझ्यो?
* के प्रयोगकर्ताले (डाटा विषय) डाटा कब्जा र प्रयोगको लागि अनुमति दिए?
* के प्रयोगकर्ताले डाटा कब्जा गरिएको उद्देश्यलाई बुझ्यो?
* के प्रयोगकर्ताले आफ्नो सहभागिताबाट उत्पन्न सम्भावित जोखिमहरू बुझ्यो?
#### २.३ बौद्धिक सम्पत्ति
[बौद्धिक सम्पत्ति](https://en.wikipedia.org/wiki/Intellectual_property)ले मानव पहलबाट उत्पन्न हुने अमूर्त सिर्जनाहरूलाई जनाउँछ, जसले व्यक्तिहरू वा व्यवसायहरूलाई _आर्थिक मूल्य_ दिन सक्छ।
[बौद्धिक सम्पत्ति](https://en.wikipedia.org/wiki/Intellectual_property)ले मानव पहलबाट उत्पन्न अमूर्त सिर्जनाहरूलाई जनाउँछ, जसले व्यक्तिहरू वा व्यवसायहरूलाई _आर्थिक मूल्य_ दिन सक्छ।
यहाँ अन्वेषण गर्नुपर्ने प्रश्नहरू:
* के सङ्कलित डाटाले प्रयोगकर्ता वा व्यवसायलाई आर्थिक मूल्य दिएको थियो?
@ -106,144 +109,145 @@ CO_OP_TRANSLATOR_METADATA:
#### २.४ डाटा गोपनीयता
[डाटा गोपनीयता](https://www.northeastern.edu/graduate/blog/what-is-data-privacy/) वा जानकारी गोपनीयता व्यक्तिगत रूपमा पहिचानयोग्य जानकारीको सन्दर्भमा प्रयोगकर्ताको गोपनीयता संरक्षण र पहिचानको संरक्षणलाई जनाउँछ।
[डाटा गोपनीयता](https://www.northeastern.edu/graduate/blog/what-is-data-privacy/) वा जानकारी गोपनीयता व्यक्तिगत रूपमा पहिचानयोग्य जानकारीको सन्दर्भमा प्रयोगकर्ता गोपनीयताको संरक्षण र प्रयोगकर्ता पहिचानको संरक्षणलाई जनाउँछ।
यहाँ अन्वेषण गर्नुपर्ने प्रश्नहरू:
* के प्रयोगकर्ताहरूको (व्यक्तिगत) डाटा ह्याक र चुहावटबाट सुरक्षित छ?
* के प्रयोगकर्ताहरूको डाटा केवल अधिकृत प्रयोगकर्ताहरू र सन्दर्भहरूमा पहुँचयोग्य छ?
* के डाटा साझा वा प्रसारित गर्दा प्रयोगकर्ताहरूको गुमनामता सुरक्षित छ?
* के प्रयोगकर्ताहरूको गुमनामता डाटा साझा वा प्रसार गर्दा सुरक्षित छ?
* के प्रयोगकर्तालाई गुमनाम डाटासेटहरूबाट पहिचान गर्न सकिन्छ?
#### २.५ बिर्सिने अधिकार
[बिर्सिने अधिकार](https://en.wikipedia.org/wiki/Right_to_be_forgotten) वा [मेटाउने अधिकार](https://www.gdpreu.org/right-to-be-forgotten/)ले प्रयोगकर्ताहरूलाई थप व्यक्तिगत डाटा सुरक्षा प्रदान गर्दछ। विशेष रूपमा, यसले प्रयोगकर्ताहरूलाई इन्टरनेट खोजहरू र अन्य स्थानहरूबाट व्यक्तिगत डाटाको मेटाउने वा हटाउने अनुरोध गर्ने अधिकार दिन्छ, _विशिष्ट परिस्थितिहरू अन्तर्गत_ - तिनीहरूलाई अनलाइन नयाँ सुरुवातको अनुमति दिँदै, विगतका कार्यहरूलाई उनीहरूविरुद्ध राख्न नदिई
[बिर्सिने अधिकार](https://en.wikipedia.org/wiki/Right_to_be_forgotten) वा [मेटाउने अधिकार](https://www.gdpreu.org/right-to-be-forgotten/)ले प्रयोगकर्ताहरूलाई थप व्यक्तिगत डाटा सुरक्षा प्रदान गर्दछ। विशेष रूपमा, यसले प्रयोगकर्ताहरूलाई इन्टरनेट खोजहरू र अन्य स्थानहरूबाट व्यक्तिगत डाटाको मेटाउने वा हटाउने अनुरोध गर्ने अधिकार दिन्छ, _विशिष्ट परिस्थितिहरू अन्तर्गत_ - तिनीहरूलाई अनलाइन नयाँ सुरुवातको अनुमति दिँदै बिना अघिल्लो कार्यहरू उनीहरूविरुद्ध राखिएको
यहाँ अन्वेषण गर्नुपर्ने प्रश्नहरू:
* के प्रणालीले डाटा विषयहरूलाई मेटाउने अनुरोध गर्न अनुमति दिन्छ?
* के प्रयोगकर्ताको सहमति फिर्ता लिनुले स्वचालित मेटाउने ट्रिगर गर्नुपर्छ?
* के डाटा सहमति बिना वा गैरकानुनी माध्यमबाट सङ्कलन गरिएको थियो?
* के हामी डाटा गोपनीयताका लागि सरकारका नियमहरूसँग अनुपालनमा छौं?
* के हामी डाटा गोपनीयताका लागि सरकार नियमहरूसँग अनुपालन गर्दैछौं?
#### २.६ डाटासेट पूर्वाग्रह
डाटासेट वा [सङ्कलन पूर्वाग्रह](http://researcharticles.com/index.php/bias-in-data-collection-in-research/)ले एल्गोरिदम विकासको लागि _गैर-प्रतिनिधित्व_ डाटाको उपसमुच्चय चयन गर्ने कुरा हो, जसले विविध समूहहरूको लागि परिणामहरूमा सम्भावित अन्याय सिर्जना गर्दछ। पूर्वाग्रहका प्रकारहरूमा चयन वा नमूना पूर्वाग्रह, स्वयंसेवक पूर्वाग्रह, र उपकरण पूर्वाग्रह समावेश छन्।
डाटासेट वा [सङ्कलन पूर्वाग्रह](http://researcharticles.com/index.php/bias-in-data-collection-in-research/) भनेको एल्गोरिदम विकासको लागि _गैर-प्रतिनिधित्व_ डाटाको उपसमूह चयन गर्ने कुरा हो, जसले विविध समूहहरूको लागि परिणाम परिणामहरूमा सम्भावित अन्याय सिर्जना गर्दछ। पूर्वाग्रहका प्रकारहरूमा चयन वा नमूना पूर्वाग्रह, स्वयंसेवक पूर्वाग्रह, र उपकरण पूर्वाग्रह समावेश छन्।
यहाँ अन्वेषण गर्नुपर्ने प्रश्नहरू:
* के हामीले डाटा विषयहरूको प्रतिनिधित्व गर्ने सेट भर्ती गरेका थियौं?
* के हामीले विभिन्न पूर्वाग्रहहरूको लागि सङ्कलित वा क्युरेट गरिएको डाटासेट परीक्षण गरेका थियौं?
* के
[Algorithm Fairness](https://towardsdatascience.com/what-is-algorithm-fairness-3182e161cf9f) ले जाँच गर्छ कि एल्गोरिथम डिजाइनले डेटा विषयहरूको विशिष्ट उपसमूहहरूलाई प्रणालीगत रूपमा भेदभाव गर्छ कि गर्दैन, जसले _स्रोतको वितरण_ (जहाँ स्रोतहरू उक्त समूहबाट अस्वीकृत वा रोकिएको हुन्छ) र _सेवाको गुणस्तर_ (जहाँ AI केही उपसमूहहरूको लागि अन्यको तुलनामा कम सटीक हुन्छ) मा [संभावित हानि](https://docs.microsoft.com/en-us/azure/machine-learning/concept-fairness-ml) निम्त्याउँछ।
* के हामीले विभिन्न पूर्वाग्रहहरूको लागि हाम्रो सङ्कलित वा क्युरेट गरिएको डाटासेट परीक्षण गरेका थियौं?
* के हामीले पत्ता लगाइएका पूर्वाग्रहहरूलाई कम गर्न वा हटाउन सक्छौं?
#### २.७ डाटा गुणस्त
[Algorithm Fairness](https://towardsdatascience.com/what-is-algorithm-fairness-3182e161cf9f) ले जाँच गर्छ कि एल्गोरिदम डिजाइनले डाटा विषयहरूको विशिष्ट उपसमूहहरूलाई प्रणालीगत रूपमा भेदभाव गर्छ कि गर्दैन, जसले _स्रोतको वितरण_ (जहाँ स्रोतहरू उक्त समूहबाट अस्वीकृत वा रोकिएको हुन्छ) र _सेवाको गुणस्तर_ (जहाँ AI केही उपसमूहहरूको लागि अन्यको तुलनामा कम सटीक हुन्छ) मा [संभावित हानि](https://docs.microsoft.com/en-us/azure/machine-learning/concept-fairness-ml) निम्त्याउन सक्छ।
यहाँ अन्वेषण गर्नुपर्ने प्रश्नहरू:
* के हामीले विविध उपसमूहहरू र अवस्थाहरूको लागि मोडेल सटीकता मूल्यांकन गरेका छौं?
* के हामीले प्रणालीलाई सम्भावित हानिहरू (जस्तै, रूढ़िवादिता) को लागि गहिरो रूपमा जाँच गरेका छौं?
* के हामीले पहिचान गरिएका हानिहरूलाई कम गर्न डटा परिमार्जन वा मोडेल पुनःप्रशिक्षण गर्न सक्छौं?
* के हामीले प्रणालीलाई सम्भावित हानिहरू (जस्तै, रूढिवादी सोच) को लागि गहिरो जाँच गरेका छौं?
* के हामीले पहिचान गरिएका हानिहरूलाई कम गर्न डटा परिमार्जन वा मोडेल पुनःप्रशिक्षण गर्न सक्छौं?
थप जान्नका लागि [AI Fairness checklists](https://query.prod.cms.rt.microsoft.com/cms/api/am/binary/RE4t6dA) जस्ता स्रोतहरू अन्वेषण गर्नुहोस्।
#### 2.9 गलत प्रतिनिधित्व
#### 2.9 गलत व्याख्या
[Data Misrepresentation](https://www.sciencedirect.com/topics/computer-science/misrepresentation) ले सोध्छ कि के हामीले इमानदारीपूर्वक रिपोर्ट गरिएको डेटा बाट प्राप्त गरिएको जानकारीलाई धोखापूर्ण तरिकाले प्रस्तुत गरेर इच्छित कथालाई समर्थन गरिरहेका छौं
[डाटा गलत व्याख्या](https://www.sciencedirect.com/topics/computer-science/misrepresentation) भनेको हामीले इमानदारीपूर्वक रिपोर्ट गरिएको डाटाबाट प्राप्त गरिएको जानकारीलाई इच्छित कथालाई समर्थन गर्न धोखापूर्ण तरिकाले प्रस्तुत गरिरहेका छौं कि छैन भन्ने प्रश्न हो
यहाँ अन्वेषण गर्नुपर्ने प्रश्नहरू:
* के हामी अपूर्ण वा गलत डटा रिपोर्ट गरिरहेका छौं?
* के हामी डेटा यसरी देखाइरहेका छौं कि यसले भ्रामक निष्कर्षहरू निम्त्याउँछ?
* के हामी चयनात्मक सांख्यिकीय प्रविधिहरू प्रयोग गरेर परिणामहरू हेरफेर गरिरहेका छौं?
* के हामी अपूर्ण वा गलत डटा रिपोर्ट गरिरहेका छौं?
* के हामी डाटालाई यस्तो तरिकाले देखाइरहेका छौं जसले भ्रामक निष्कर्षहरू उत्पन्न गर्छ?
* के हामी चयनात्मक सांख्यिकीय प्रविधिहरू प्रयोग गरेर परिणामहरूलाई हेरफेर गरिरहेका छौं?
* के त्यहाँ वैकल्पिक व्याख्याहरू छन् जसले फरक निष्कर्ष दिन सक्छ?
#### 2.10 स्वतन्त्र छनोट
[Illusion of Free Choice](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice) तब हुन्छ जब प्रणाली "छनोट संरचना" ले निर्णय-प्रक्रिया एल्गोरिथम प्रयोग गरेर मानिसहरूलाई इच्छित परिणामतर्फ धकेल्छ, जबकि उनीहरूलाई विकल्प र नियन्त्रण दिएको जस्तो देखिन्छ। यी [dark patterns](https://www.darkpatterns.org/) ले प्रयोगकर्ताहरूलाई सामाजिक र आर्थिक हानि पुर्‍याउन सक्छ। प्रयोगकर्ताको निर्णयले व्यवहार प्रोफाइलहरूलाई असर गर्छ, जसले भविष्यका छनोटहरूलाई ती हानिहरूको प्रभावलाई बढाउन वा विस्तार गर्न प्रेरित गर्न सक्छ।
[स्वतन्त्र छनोटको भ्रम](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice) तब हुन्छ जब प्रणाली "छनोट संरचना" ले निर्णय गर्ने एल्गोरिदम प्रयोग गरेर मानिसहरूलाई इच्छित परिणामतर्फ धकेल्छ, तर उनीहरूलाई विकल्प र नियन्त्रण दिएको जस्तो देखिन्छ। यी [डार्क पाटर्नहरू](https://www.darkpatterns.org/) ले प्रयोगकर्ताहरूलाई सामाजिक र आर्थिक हानि पुर्‍याउन सक्छ। प्रयोगकर्ताको निर्णयले व्यवहार प्रोफाइलहरूलाई असर गर्छ, जसले भविष्यका छनोटहरूलाई ती हानिहरूको प्रभावलाई बढाउन वा विस्तार गर्न प्रेरित गर्न सक्छ।
यहाँ अन्वेषण गर्नुपर्ने प्रश्नहरू:
* के प्रयोगकर्ताले उक्त छनोटको प्रभाव बुझ्न सकेका थिए?
* के प्रयोगकर्ताले (वैकल्पिक) विकल्पहरू र प्रत्येकको फाइदा र बेफाइदा थाहा पाएका थिए?
* के प्रयोगकर्ताले उक्त छनोटको प्रभाव बुझ्यो?
* के प्रयोगकर्ताले (वैकल्पिक) विकल्पहरू र प्रत्येकको फाइदा र बेफाइदा थाहा पाए?
* के प्रयोगकर्ताले स्वचालित वा प्रभावित छनोटलाई पछि उल्टाउन सक्छ?
### 3. केस अध्ययनहरू
यी नैतिक चुनौतीहरूलाई वास्तविक संसारको सन्दर्भमा राख्न, जब यस्ता नैतिक उल्लघनहरूलाई बेवास्ता गरिन्छ, व्यक्तिहरू र समाजमा सम्भावित हानि र परिणामहरूलाई उजागर गर्ने केस अध्ययनहरू हेर्न मद्दत गर्दछ।
यी नैतिक चुनौतीहरूलाई वास्तविक संसारको सन्दर्भमा राख्न, जब यस्ता नैतिक उल्लङ्घनहरूलाई बेवास्ता गरिन्छ, व्यक्तिहरू र समाजमा सम्भावित हानिहरू र परिणामहरूलाई उजागर गर्ने केस अध्ययनहरू हेर्न मद्दत गर्दछ।
यहाँ केही उदाहरणहरू छन्:
| नैतिक चुनौती | केस अध्ययन |
|--- |--- |
| **जानकारीयुक्त सहमति** | 1972 - [Tuskegee Syphilis Study](https://en.wikipedia.org/wiki/Tuskegee_Syphilis_Study) - अध्ययनमा सहभागी भएका अफ्रिकी अमेरिकी पुरुषहरूलाई निःशुल्क चिकित्सा सेवाको वाचा गरिएको थियो _तर धोखा दिइएको थियो_। अनुसन्धानकर्ताहरूले विषयहरूलाई उनीहरूको निदान वा उपचारको उपलब्धताबारे जानकारी दिन असफल भए। धेरै विषयहरू मरे र पार्टनर वा बच्चाहरू प्रभावित भए; अध्ययन 40 वर्षसम्म चल्यो। |
| **टा गोपनीयता** | 2007 - [Netflix data prize](https://www.wired.com/2007/12/why-anonymous-data-sometimes-isnt/) ले अनुसन्धानकर्ताहरूलाई _50K ग्राहकहरूको 10M अनामित फिल्म रेटिङहरू_ प्रदान गर्‍यो। तर, अनुसन्धानकर्ताहरूले अनामित डेटा बाह्य डेटासेटहरू (जस्तै, IMDb टिप्पणीहरू) सँग सम्बन्धित गर्न सक्षम भए - प्रभावकारी रूपमा केही Netflix ग्राहकहरूको "अनामिकरण"।|
| **जानकारीमूलक सहमति** | 1972 - [Tuskegee Syphilis Study](https://en.wikipedia.org/wiki/Tuskegee_Syphilis_Study) - अध्ययनमा सहभागी भएका अफ्रिकी अमेरिकी पुरुषहरूलाई निःशुल्क चिकित्सा सेवाको वाचा गरिएको थियो _तर धोखा दिइयो_। अनुसन्धानकर्ताहरूले विषयहरूलाई उनीहरूको रोगको निदान वा उपचारको उपलब्धताबारे जानकारी दिन असफल भए। धेरै विषयहरू मरे र पार्टनर वा बच्चाहरू प्रभावित भए; अध्ययन 40 वर्षसम्म चल्यो। |
| **टा गोपनीयता** | 2007 - [Netflix data prize](https://www.wired.com/2007/12/why-anonymous-data-sometimes-isnt/) ले अनुसन्धानकर्ताहरूलाई _50K ग्राहकहरूको 10M अनामित फिल्म रेटिङहरू_ प्रदान गर्‍यो। तर, अनुसन्धानकर्ताहरूले अनामित डाटालाई _बाह्य डेटासेटहरू_ (जस्तै, IMDb टिप्पणीहरू) सँग जोड्न सक्षम भए - प्रभावकारी रूपमा केही Netflix ग्राहकहरूको "डि-अनोनिमाइजेशन"।|
| **सङ्कलन पूर्वाग्रह** | 2013 - बोस्टन सहरले [Street Bump](https://www.boston.gov/transportation/street-bump) विकास गर्‍यो, एउटा एप जसले नागरिकहरूलाई खाल्डाहरू रिपोर्ट गर्न अनुमति दियो। तर, [कम आय समूहका मानिसहरूलाई कार र फोनको पहुँच कम थियो](https://hbr.org/2013/04/the-hidden-biases-in-big-data), जसले उनीहरूको सडक समस्याहरूलाई एपमा अदृश्य बनायो। विकासकर्ताहरूले निष्पक्षताको लागि _समान पहुँच र डिजिटल विभाजन_ मुद्दाहरूमा काम गरे। |
| **एल्गोरिम निष्पक्षता** | 2018 - MIT [Gender Shades Study](http://gendershades.org/overview.html) ले लिङ्ग वर्गीकरण AI उत्पादनहरूको सटीकता मूल्यांकन गर्‍यो, महिलाहरू र रंगीन व्यक्तिहरूको लागि सटीकतामा अन्तरलाई उजागर गर्‍यो। [2019 Apple Card](https://www.wired.com/story/the-apple-card-didnt-see-genderand-thats-the-problem/) ले महिलाहरूलाई पुरुषहरूको तुलनामा कम क्रेडिट प्रस्ताव गरेको देखियो। दुवैले एल्गोरिम पूर्वाग्रहमा सामाजिक-आर्थिक हानिहरूको मुद्दा देखाए।|
| **ेटा गलत प्रतिनिधित्व** | 2020 - [Georgia Department of Public Health ले COVID-19 चार्टहरू जारी गर्‍यो](https://www.vox.com/covid-19-coronavirus-us-response-trump/2020/5/18/21262265/georgia-covid-19-cases-declining-reopening) जसले पुष्टि गरिएका केसहरूको प्रवृत्तिबारे नागरिकहरूलाई भ्रामक बनाउने प्रयास गर्‍यो। यो भिजुअलाइजेसन ट्रिक्स मार्फत गलत प्रतिनिधित्वलाई चित्रित गर्दछ। |
| **स्वतन्त्र छनोटको भ्रम** | 2020 - सिक्ने एप [ABCmouse ले FTC उजुरी समाधान गर्न $10M तिरेको](https://www.washingtonpost.com/business/2020/09/04/abcmouse-10-million-ftc-settlement/) जहाँ अभिभावकहरूलाई सदस्यता रद्द गर्न नसक्ने अवस्थामा फसाइएको थियो। यसले छनोट संरचनामा dark patterns लाई चित्रित गर्दछ। |
| **टा गोपनीयता र प्रयोगकर्ता अधिकारहरू** | 2021 - Facebook [Data Breach](https://www.npr.org/2021/04/09/986005820/after-data-breach-exposes-530-million-facebook-says-it-will-not-notify-users) ले 530M प्रयोगकर्ताहरूको डटा उजागर गर्‍यो, जसले FTC लाई $5B को समाधान गर्‍यो। तर, यसले प्रयोगकर्ताहरूलाई उल्लङ्घनबारे सूचित गर्न अस्वीकार गर्‍यो। |
| **एल्गोरिम निष्पक्षता** | 2018 - MIT [Gender Shades Study](http://gendershades.org/overview.html) ले लिङ्ग वर्गीकरण AI उत्पादनहरूको सटीकता मूल्यांकन गर्‍यो, महिलाहरू र रंगीन व्यक्तिहरूको लागि सटीकतामा अन्तर उजागर गर्‍यो। [2019 Apple Card](https://www.wired.com/story/the-apple-card-didnt-see-genderand-thats-the-problem/) ले महिलाहरूलाई पुरुषहरूको तुलनामा कम क्रेडिट प्रस्ताव गरेको देखियो। दुवैले एल्गोरिम पूर्वाग्रहमा सामाजिक-आर्थिक हानिहरूको मुद्दा देखाए।|
| **ाटा गलत व्याख्या** | 2020 - [Georgia Department of Public Health ले COVID-19 चार्टहरू जारी गर्‍यो](https://www.vox.com/covid-19-coronavirus-us-response-trump/2020/5/18/21262265/georgia-covid-19-cases-declining-reopening) जसले पुष्टि गरिएका केसहरूको प्रवृत्तिबारे नागरिकहरूलाई भ्रामक बनाउने प्रयास गर्‍यो। यो भिजुअलाइजेसन ट्रिक्स मार्फत गलत व्याख्या देखाउँछ। |
| **स्वतन्त्र छनोटको भ्रम** | 2020 - सिकाइ एप [ABCmouse ले FTC गुनासो समाधान गर्न $10M तिरेको](https://www.washingtonpost.com/business/2020/09/04/abcmouse-10-million-ftc-settlement/) जहाँ अभिभावकहरूलाई सदस्यता रद्द गर्न असमर्थ बनाइयो। यो छनोट संरचनामा डार्क पाटर्नहरू देखाउँछ, जहाँ प्रयोगकर्ताहरूलाई सम्भावित हानिकारक छनोटतर्फ धकेलियो। |
| **टा गोपनीयता र प्रयोगकर्ता अधिकारहरू** | 2021 - Facebook [डाटा ब्रिच](https://www.npr.org/2021/04/09/986005820/after-data-breach-exposes-530-million-facebook-says-it-will-not-notify-users) ले 530M प्रयोगकर्ताहरूको डटा उजागर गर्‍यो, जसले FTC लाई $5B समाधान गर्‍यो। तर, यसले प्रयोगकर्ताहरूलाई ब्रिचको बारेमा सूचित गर्न अस्वीकार गर्‍यो, प्रयोगकर्ता अधिकारहरूको उल्लङ्घन गर्दै। |
थप केस अध्ययनहरू अन्वेषण गर्न चाहनुहुन्छ? यी स्रोतहरू हेर्नुहोस्:
* [Ethics Unwrapped](https://ethicsunwrapped.utexas.edu/case-studies) - विभिन्न उद्योगहरूमा नैतिक दुविधाहरू।
* [Data Science Ethics course](https://www.coursera.org/learn/data-science-ethics#syllabus) - प्रमुख केस अध्ययनहरू अन्वेषण गरियो।
* [Where things have gone wrong](https://deon.drivendata.org/examples/) - deon चेकलिस्टसँग उदाहरणहरू।
* [Data Science Ethics course](https://www.coursera.org/learn/data-science-ethics#syllabus) - प्रमुख केस अध्ययनहरू अन्वेषण गरियो।
* [Where things have gone wrong](https://deon.drivendata.org/examples/) - Deon चेकलिस्टसँग उदाहरणहरू।
> 🚨 तपाईंले देखेका केस अध्ययनहरूबारे सोच्नुहोस् - के तपाईंले आफ्नो जीवनमा यस्तै नैतिक चुनौतीको अनुभव गर्नुभएको छ वा प्रभावित हुनुभएको छ? के तपाईंले यस खण्डमा छलफल गरिएका नैतिक चुनौतीहरू मध्ये कुनै एकलाई चित्रित गर्ने कम्तीमा एउटा अन्य केस अध्ययन सोच्न सक्नुहुन्छ?
> 🚨 तपाईंले देखेका केस अध्ययनहरूबारे सोच्नुहोस् - के तपाईंले आफ्नो जीवनमा यस्तै नैतिक चुनौतीको अनुभव गर्नुभएको छ वा प्रभावित हुनुभएको छ? के तपाईंले यस खण्डमा छलफल गरिएका नैतिक चुनौतीहरू मध्ये कुनै एकलाई चित्र गर्ने कम्तीमा एउटा अन्य केस अध्ययन सोच्न सक्नुहुन्छ?
## लागू नैतिकता
हामीले नैतिकता अवधारणाहरू, चुनौतीहरू, र वास्तविक संसारको सन्दर्भमा केस अध्ययनहरूबारे कुरा गर्‍यौं। तर, हामी कसरी आफ्ना परियोजनाहरूमा नैतिक सिद्धान्तहरू र अभ्यासहरू _लागू_ गर्न सुरु गर्ने? र हामी कसरी _सञ्चालन_ गर्न अभ्यासहूलाई राम्रो शासनका लागि लागू गर्ने? केही वास्तविक समाधानहरू अन्वेषण गरौं:
हामीले नैतिकता अवधारणाहरू, चुनौतीहरू, र वास्तविक संसारको सन्दर्भमा केस अध्ययनहरूबारे कुरा गर्‍यौं। तर, हामी कसरी आफ्ना परियोजनाहरूमा नैतिक सिद्धान्तहरू र अभ्यासहरू _लागू_ गर्न सुरु गर्ने? र हामी कसरी यी अभ्यासहरूलाई _सञ्चालन_ गरेर राम्रो शासनका लागि तयार गर्ने? केही वास्तविक समाधानहरू अन्वेषण गरौं:
### 1. व्यावसायिक कोडहरू
व्यावसायिक कोडहरूले सदस्यहरूलाई आफ्नो नैतिक सिद्धान्तहरू र मिशन कथनलाई समर्थन गर्न "प्रेरित" गर्न एक विकल्प प्रदान गर्दछ। कोडहरू व्यावसायिक व्यवहारका लागि _नैतिक दिशानिर्देशहरू_ हुन्, जसले कर्मचारीहरू वा सदस्यहरूलाई आफ्नो संगठनका सिद्धान्तहरूसँग मेल खाने निर्णयहरू गर्न मद्दत गर्दछ। तिनीहरू सदस्यहरूको स्वेच्छिक अनुपालन जत्तिकै मात्र प्रभावकारी हुन्छन्; यद्यपि, धेरै संगठनहरूले सदस्यहरूको अनुपालनलाई प्रेरित गर्न थप पुरस्कार र सजायहरू प्रदान गर्छन्।
उदाहरणहरू समावेश छन्:
व्यावसायिक कोडहरूले सदस्यहरूलाई आफ्नो नैतिक सिद्धान्तहरू र मिशन वक्तव्यलाई समर्थन गर्न "प्रेरित" गर्न एक विकल्प प्रदान गर्छ। कोडहरू व्यावसायिक व्यवहारका लागि _नैतिक दिशानिर्देशहरू_ हुन्, जसले कर्मचारीहरू वा सदस्यहरूलाई आफ्नो संगठनका सिद्धान्तहरूसँग मेल खाने निर्णयहरू गर्न मद्दत गर्दछ। तिनीहरू सदस्यहरूको स्वेच्छिक अनुपालन जत्तिकै मात्र प्रभावकारी हुन्छन्; यद्यपि, धेरै संगठनहरूले सदस्यहरूको अनुपालनलाई प्रेरित गर्न थप पुरस्कार र सजायहरू प्रदान गर्छन्।
उदाहरणहरू:
* [Oxford Munich](http://www.code-of-ethics.org/code-of-conduct/) कोड अफ एथिक्स
* [Data Science Association](http://datascienceassn.org/code-of-conduct.html) आचार संहिता (2013 मा सिर्जना गरिएको)
* [ACM Code of Ethics and Professional Conduct](https://www.acm.org/code-of-ethics) (1993 देखि)
> 🚨 के तपाईं व्यावसायिक इन्जिनियरिङ वा डेटा विज्ञान संगठनको सदस्य हुनुहुन्छ? उनीहरूको साइट अन्वेषण गर्नुहोस् कि उनीहरूले व्यावसायिक नैतिकता कोड परिभाषित गर्छन् कि गर्दैनन्। यसले उनीहरूको नैतिक सिद्धान्तहरूबारे के भन्छ? उनीहरूले सदस्यहरूलाई कोड पालना गर्न कसरी "प्रेरित" गरिरहेका छन्?
> 🚨 के तपाईं कुनै व्यावसायिक इन्जिनियरिङ वा डाटा विज्ञान संगठनमा सदस्य हुनुहुन्छ? उनीहरूको साइट अन्वेषण गर्नुहोस् कि उनीहरूले व्यावसायिक नैतिकता कोड परिभाषित गरेका छन् कि छैन। यसले उनीहरूको नैतिक सिद्धान्तहरूबारे के भन्छ? उनीहरूले सदस्यहरूलाई कोड पालना गर्न कसरी "प्रेरित" गरिरहेका छन्?
### 2. नैतिकता चेकलिस्टहरू
जबकि व्यावसायिक कोडहरूले व्यवसायीहरूबाट आवश्यक _नैतिक व्यवहार_ परिभाषित गर्छन्, तिनीहरूले [ज्ञात सीमाहरू](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md) लाई लागू गर्न, विशेष गरी ठूला परियोजनाहरूमा। यसको सट्टा, धेरै डटा विज्ञान विशेषज्ञहरूले [चेकलिस्टहरूको वकालत](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md) गर्छन्, जसले **सिद्धान्तहरूलाई अभ्यासहरूसँग जोड्न** अधिक निर्धारणात्मक र कार्यात्मक तरिकामा मद्दत गर्दछ।
जबकि व्यावसायिक कोडहरूले व्यवसायीहरूबाट आवश्यक _नैतिक व्यवहार_ परिभाषित गर्छन्, तिनीहरूले [ज्ञात सीमाहरू](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md) लाई लागू गर्न, विशेष गरी ठूला परियोजनाहरूमा। यसको सट्टा, धेरै डटा विज्ञान विशेषज्ञहरूले [चेकलिस्टहरूको वकालत](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md) गर्छन्, जसले **सिद्धान्तहरूलाई अभ्यासहरूसँग जोड्न** थप निर्धारणात्मक र कार्यान्वयन योग्य तरिकामा मद्दत गर्दछ।
चेकलिस्टहरूले प्रश्नहरूलाई "हो/होइन" कार्यहरूमा रूपान्तरण गर्छन् जसलाई सञ्चालन गर्न सकिन्छ, जसले तिनीहरूलाई मानक उत्पादन रिलीज वर्कफ्लोको भागको रूपमा ट्र्याक गर्न अनुमति दिन्छ।
चेकलिस्टहरूले प्रश्नहरूलाई "हो/होइन" कार्यहरूमा रूपान्तरण गर्छन्, जसलाई सञ्चालन गर्न सकिन्छ, तिनीहरूलाई मानक उत्पादन रिलीज वर्कफ्लोको भागको रूपमा ट्र्याक गर्न अनुमति दिन्छ।
उदाहरणहरू समावेश छन्:
* [Deon](https://deon.drivendata.org/) - उद्योग सिफारिसहरूबाट सिर्जना गरिएको सामान्य उद्देश्य डटा नैतिकता चेकलिस्ट [सन्दर्भहरू](https://deon.drivendata.org/#checklist-citations) सहित
* [Privacy Audit Checklist](https://cyber.harvard.edu/ecommerce/privacyaudit.html) - कानुनी र सामाजिक जोखिम दृष्टिकोणबाट जानकारी ह्यान्डलिङ अभ्यासहरूको सामान्य मार्गदर्शन प्रदान गर्दछ।
* [AI Fairness Checklist](https://www.microsoft.com/en-us/research/project/ai-fairness-checklist/) - AI विकास चक्रहरूमा निष्पक्षता जाँचको अपनत्व र एकीकरणलाई समर्थन गर्न AI व्यवसायीहरूद्वारा सिर्जना गरिएको।
* [22 questions for ethics in data and AI](https://medium.com/the-organization/22-questions-for-ethics-in-data-and-ai-efb68fd19429) - डिजाइन, कार्यान्वयन, र संगठनात्मक सन्दर्भहरूमा नैतिक मुद्दाहरूको प्रारम्भिक अन्वेषणको लागि संरचित।
उदाहरणहरू:
* [Deon](https://deon.drivendata.org/) - उद्योग सिफारिसहरूबाट सिर्जना गरिएको [सामान्य उद्देश्य डटा नैतिकता चेकलिस्ट](https://deon.drivendata.org/#checklist-citations) एक कमाण्ड-लाइन उपकरणको साथ सजिलो एकीकरणको लागि
* [Privacy Audit Checklist](https://cyber.harvard.edu/ecommerce/privacyaudit.html) - कानुनी र सामाजिक जोखिम परिप्रेक्ष्यबाट जानकारी ह्यान्डलिङ अभ्यासहरूको लागि सामान्य मार्गदर्शन प्रदान गर्दछ।
* [AI Fairness Checklist](https://www.microsoft.com/en-us/research/project/ai-fairness-checklist/) - AI विकास चक्रहरूमा निष्पक्षता जाँचको अपनत्व र एकीकरणलाई समर्थन गर्न AI व्यवसायीहरूले सिर्जना गरेको।
* [22 questions for ethics in data and AI](https://medium.com/the-organization/22-questions-for-ethics-in-data-and-ai-efb68fd19429) - डिजाइन, कार्यान्वयन, र संगठनात्मक सन्दर्भहरूमा नैतिक मुद्दाहरूको प्रारम्भिक अन्वेषणको लागि संरचित अधिक खुला फ्रेमवर्क
### 3. नैतिकता नियमहरू
नैतिकता साझा मूल्यहरू परिभाषित गर्ने र _स्वेच्छाले_ सही काम गर्ने बारे हो। **अनुपालन** भनेको _कानुन पालना_ गर्ने हो यदि र जहाँ परिभाषित गरिएको छ। **शासन** व्यापक रूपमा सबै तरिकाहरू समेट्छ जसमा संगठनहरूले नैतिक सिद्धान्तहरू लागू गर्न र स्थापित कानुनहरूको पालना गर्न सञ्चालन गर्न्।
नैतिकता भनेको साझा मूल्यहरू परिभाषित गर्ने र _स्वेच्छाले_ सही काम गर्ने कुरा हो। **अनुपालन** भनेको _कानुन पालना_ गर्ने कुरा हो यदि र जहाँ परिभाषित गरिएको छ। **शासन** व्यापक रूपमा संगठनहरूले नैतिक सिद्धान्तहरू लागू गर्न र स्थापित कानुनहरूको पालना गर्न सञ्चालन गर्ने सबै तरिकाहरूलाई समेट
आज, संगठनहरूमा शासन दुई रूपमा हुन्छ। पहिलो, यो **नैतिक AI** सिद्धान्तहरू परिभाषित गर्ने र संगठनका सबै AI-सम्बन्धित परियोजनाहरूमा अपनत्वलाई सञ्चालन गर्ने अभ्यासहरू स्थापना गर्ने बारे हो। दोस्रो, यो सरकार-म्यान्डेटेड **टा संरक्षण नियमहरू** पालना गर्ने बारे हो जुन क्षेत्रहरूमा यो सञ्चालन हुन्छ।
आज, शासनले संगठनहरू भित्र दुई रूप लिन्छ। पहिलो, यो **नैतिक AI** सिद्धान्तहरू परिभाषित गर्ने र संगठनका सबै AI-सम्बन्धित परियोजनाहरूमा अपनत्वलाई सञ्चालन गर्ने अभ्यासहरू स्थापना गर्ने बारे हो। दोस्रो, यो सरकार-म्यान्डेटेड **टा संरक्षण नियमहरू** को पालना गर्ने बारे हो जुन क्षेत्रहरूमा यो सञ्चालन गर्दछ।
टा संरक्षण र गोपनीयता नियमहरूको उदाहरणहरू:
टा संरक्षण र गोपनीयता नियमहरूको उदाहरणहरू:
* `1974`, [US Privacy Act](https://www.justice.gov/opcl/privacy-act-1974) - _संघीय सरकार_ द्वारा व्यक्तिगत जानकारीको सङ्कलन, प्रयोग, र प्रकटीकरणलाई नियमन गर्छ।
* `1996`, [US Health Insurance Portability & Accountability Act (HIPAA)](https://www.cdc.gov/phlp/publications/topic/hipaa.html) - व्यक्तिगत स्वास्थ्य डेटा सुरक्षित गर्छ।
* `1998`, [US Children's Online Privacy Protection Act (COPPA)](https://www.ftc.gov/enforcement/rules/rulemaking-regulatory-reform-proceedings/childrens-online-privacy-protection-rule) - 13 वर्षभन्दा कम उमेरका बालबालिकाको डेटा गोपनीयता सुरक्षित गर्छ।
* `2018`, [General Data Protection Regulation (GDPR)](https://gdpr-info.eu/) - प्रयोगकर्ता अधिकारहरू, डटा संरक्षण, र गोपनीयता प्रदान गर्छ।
* `2018`, [California Consumer Privacy Act (CCPA)](https://www.oag.ca.gov/privacy/ccpa) उपभोक्ताहरूलाई उनीहरूको (व्यक्तिगत) डेटा माथि थप _अधिकारहरू_ दिन्छ।
* `2021`, चीनको [Personal Information Protection Law](https://www.reuters.com/world/china/china-passes-new-personal-data-privacy-law-take-effect-nov-1-2021-08-20/) हालै पारित भयो, जसले विश्वव्यापी रूपमा सबैभन्दा बलियो अनलाइन डटा गोपनीयता नियमहरू सिर्जना गर्‍यो।
* `1996`, [US Health Insurance Portability & Accountability Act (HIPAA)](https://www.cdc.gov/phlp/publications/topic/hipaa.html) - व्यक्तिगत स्वास्थ्य डाटाको सुरक्षा गर्छ।
* `1998`, [US Children's Online Privacy Protection Act (COPPA)](https://www.ftc.gov/enforcement/rules/rulemaking-regulatory-reform-proceedings/childrens-online-privacy-protection-rule) - 13 वर्षभन्दा कम उमेरका बालबालिकाको डाटा गोपनीयताको सुरक्षा गर्छ।
* `2018`, [General Data Protection Regulation (GDPR)](https://gdpr-info.eu/) - प्रयोगकर्ता अधिकारहरू, डटा संरक्षण, र गोपनीयता प्रदान गर्छ।
* `2018`, [California Consumer Privacy Act (CCPA)](https://www.oag.ca.gov/privacy/ccpa) - उपभोक्ताहरूलाई उनीहरूको (व्यक्तिगत) डाटामा थप _अधिकारहरू_ दिन्छ।
* `2021`, चीनको [Personal Information Protection Law](https://www.reuters.com/world/china/china-passes-new-personal-data-privacy-law-take-effect-nov-1-2021-08-20/) हालै पारित भयो, जसले विश्वव्यापी रूपमा सबैभन्दा बलियो अनलाइन डटा गोपनीयता नियमहरू सिर्जना गर्‍यो।
> 🚨 युरोपेली संघले परिभाषित गरेको GDPR (General Data Protection Regulation) आजको दिनमा सबैभन्दा प्रभावशाली डटा गोपनीयता नियमहरू मध्ये एक हो। के तपाईंलाई थाहा छ यसले नागरिकहरूको डिजिटल गोपनीयता र व्यक्तिगत डेटा सुरक्षित गर्न [8 प्रयोगकर्ता अधिकारहरू](https://www.freeprivacypolicy.com/blog/8-user-rights-gdpr) पनि परिभाषित गर्छ? यी के हुन् र किन महत्त्वपूर्ण छन् भनेर जान्नुहोस्।
> 🚨 युरोपेली संघले परिभाषित गरेको GDPR (General Data Protection Regulation) आज सबैभन्दा प्रभावशाली डटा गोपनीयता नियमहरू मध्ये एक हो। के तपाईंलाई थाहा छ यसले नागरिकहरूको डिजिटल गोपनीयता र व्यक्तिगत डाटाको सुरक्षा गर्न [8 प्रयोगकर्ता अधिकारहरू](https://www.freeprivacypolicy.com/blog/8-user-rights-gdpr) पनि परिभाषित गर्छ? यी के हुन् र किन महत्त्वपूर्ण छन् भनेर जान्नुहोस्।
### 4. नैतिकता संस्कृति
ध्यान दिनुहोस् कि _अनुपालन_ (कानुनको "अक्षर" पूरा गर्न पर्याप्त काम गर्ने) र [प्रणालीगत मुद्दाहरू](https://www.coursera.org/learn/data-science-ethics/home/week/4) (जस्तै, कठोरता, जानकारी असमानता, र वितरणीय अन्याय) लाई सम्बोधन गर्ने बीचमा एक अमूर्त अन्तर रहन्छ।
पछिल्लोले [नैतिकता संस्कृतिहरू परिभाषित गर्न सहयोगात्मक दृष्टिकोणहरू](https://towardsdatascience.com/why-ai-ethics-requires-a-culture-driven-approach-26f451afa29f) आवश्यक छ जसले उद्योगमा _संगठनहरू_ बीच भावनात्मक सम्बन्ध र साझा मूल्यहरू निर्माण गर्छ। यसले संगठनहरूमा [औपचारिक डटा नैतिकता संस्कृतिहरू](https://www.codeforamerica.org/news/formalizing-an-ethical-data-culture/) को लागि आह्वान गर्दछ - जसले _कसैलाई पनि_ [Andon cord तान्न](https://en.wikipedia.org/wiki/Andon_(manufacturing)) अनुमति दिन्छ (प्रक्रियाको सुरुवातमा नैतिक चिन्ताहरू उठाउन) र _नैतिक मूल्याङ्कनहरू_ (जस्तै, भर्तीमा) AI परियोजनाहरूमा टोली गठनको मुख्य मापदण्ड बनाउँछ।
पछिल्लोले [नैतिकता संस्कृतिहरू परिभाषित गर्न सहयोगात्मक दृष्टिकोणहरू](https://towardsdatascience.com/why-ai-ethics-requires-a-culture-driven-approach-26f451afa29f) आवश्यक छ जसले उद्योगमा _संगठनहरू_ बीच भावनात्मक सम्बन्ध र साझा मूल्यहरू निर्माण गर्छ। यसले संगठनहरूमा [औपचारिक डटा नैतिकता संस्कृतिहरू](https://www.codeforamerica.org/news/formalizing-an-ethical-data-culture/) को लागि आह्वान गर्दछ - जसले _कसैलाई पनि_ [Andon cord तान्न](https://en.wikipedia.org/wiki/Andon_(manufacturing)) (प्रक्रियाको सुरुवातमा नैतिक चिन्ताहरू उठाउन) अनुमति दिन्छ_नैतिक मूल्याङ्कनहरू_ (जस्तै, भर्तीमा) AI परियोजनाहरूमा टोली गठनको मुख्य मापदण्ड बनाउँछ।
---
## [Post-lecture quiz](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/3) 🎯
## [पोस्ट-व्याख्यान क्विज](https://ff-quizzes.netlify.app/en/ds/) 🎯
## समीक्षा र आत्म अध्ययन
पाठ्यक्रमहरू र पुस्तकहरूले मुख्य नैतिकता अवधारणाहरू र चुनौतीहरू बुझ्न मद्दत गर्छन्, जबकि केस अध्ययनहरू र उपकरणहरूले वास्तविक संसारको सन्दर्भमा लागू नैतिकता अभ्यासहरूमा मद्दत गर्छन्। यहाँ सुरु गर्नका लागि केही स्रोतहरू छन्।
पाठ्यक्रमहरू र पुस्तकहरूले मुख्य नैतिकता अवधारणाहरू र चुनौतीहरू बुझ्न मद्दत गर्छन्, जबकि केस अध्ययनहरू र उपकरणहरूले वास्तविक संसारको सन्दर्भमा लागू नैतिकता अभ्यासहरूमा मद्दत गर्छन्। यहाँ सुरु गर्न केही स्रोतहरू छन्।
* [Machine Learning For Beginners](https://github.com/microsoft/ML-For-Beginners/blob/main/1-Introduction/3-fairness/README.md) - Microsoft बाट निष्पक्षतामा पाठ।
* [उत्तरदायी एआईका सिद्धान्तहरू](https://docs.microsoft.com/en-us/learn/modules/responsible-ai-principles/) - माइक्रोसफ्ट लर्नबाट निःशुल्क सिकाइ मार्ग।
* [नैतिकता र डाटा विज्ञान](https://resources.oreilly.com/examples/0636920203964) - ओ'राइली ईबुक (एम. लुकाइड्स, एच. मेसन आदि)
* [जिम्मेवार AI का सिद्धान्तहरू](https://docs.microsoft.com/en-us/learn/modules/responsible-ai-principles/) - Microsoft Learn बाट निःशुल्क सिकाइ मार्ग।
* [नैतिकता र डाटा विज्ञान](https://resources.oreilly.com/examples/0636920203964) - ओ'रेली ईबुक (M. Loukides, H. Mason आदि)
* [डाटा विज्ञान नैतिकता](https://www.coursera.org/learn/data-science-ethics#syllabus) - मिशिगन विश्वविद्यालयबाट अनलाइन पाठ्यक्रम।
* [नैतिकता अनावरण](https://ethicsunwrapped.utexas.edu/case-studies) - टेक्सास विश्वविद्यालयका केस अध्ययनहरू।
* [नैतिकता अनर्‍याप्ड](https://ethicsunwrapped.utexas.edu/case-studies) - टेक्सास विश्वविद्यालयबाट केस अध्ययनहरू।
# असाइनमेन्ट
@ -252,4 +256,4 @@ CO_OP_TRANSLATOR_METADATA:
---
**अस्वीकरण**:
यो दस्तावेज़ AI अनुवाद सेवा [Co-op Translator](https://github.com/Azure/co-op-translator) प्रयोग गरेर अनुवाद गरिएको छ। हामी शुद्धताको लागि प्रयास गर्छौं, तर कृपया ध्यान दिनुहोस् कि स्वचालित अनुवादमा त्रुटिहरू वा अशुद्धताहरू हुन सक्छ। यसको मूल भाषा मा रहेको मूल दस्तावेज़लाई आधिकारिक स्रोत मानिनुपर्छ। महत्वपूर्ण जानकारीको लागि, व्यावसायिक मानव अनुवाद सिफारिस गरिन्छ। यस अनुवादको प्रयोगबाट उत्पन्न हुने कुनै पनि गलतफहमी वा गलत व्याख्याको लागि हामी जिम्मेवार हुने छैनौं।
यो दस्तावेज़ AI अनुवाद सेवा [Co-op Translator](https://github.com/Azure/co-op-translator) प्रयोग गरेर अनुवाद गरिएको हो। हामी यथार्थताको लागि प्रयास गर्छौं, तर कृपया ध्यान दिनुहोस् कि स्वचालित अनुवादहरूमा त्रुटिहरू वा अशुद्धताहरू हुन सक्छ। यसको मूल भाषा मा रहेको मूल दस्तावेज़लाई आधिकारिक स्रोत मानिनुपर्छ। महत्वपूर्ण जानकारीको लागि, व्यावसायिक मानव अनुवाद सिफारिस गरिन्छ। यस अनुवादको प्रयोगबाट उत्पन्न हुने कुनै पनि गलतफहमी वा गलत व्याख्याको लागि हामी जिम्मेवार हुने छैनौं।

@ -1,8 +1,8 @@
<!--
CO_OP_TRANSLATOR_METADATA:
{
"original_hash": "8796f41f566a0a8ebb72863a83d558ed",
"translation_date": "2025-08-28T15:53:53+00:00",
"original_hash": "3a34157cc63516eba97c89a0b2f8c3e6",
"translation_date": "2025-09-03T21:33:09+00:00",
"source_file": "1-Introduction/02-ethics/README.md",
"language_code": "nl"
}
@ -11,13 +11,13 @@ CO_OP_TRANSLATOR_METADATA:
|![ Sketchnote door [(@sketchthedocs)](https://sketchthedocs.dev) ](../../sketchnotes/02-Ethics.png)|
|:---:|
| Data Science Ethiek - _Sketchnote door [@nitya](https://twitter.com/nitya)_ |
| Data Science Ethics - _Sketchnote door [@nitya](https://twitter.com/nitya)_ |
---
We zijn allemaal databurgers die leven in een wereld vol data.
Markttrends voorspellen dat tegen 2022, 1 op de 3 grote organisaties hun data zal kopen en verkopen via online [marktplaatsen en beurzen](https://www.gartner.com/smarterwithgartner/gartner-top-10-trends-in-data-and-analytics-for-2020/). Als **app-ontwikkelaars** wordt het voor ons eenvoudiger en goedkoper om datagestuurde inzichten en algoritmegestuurde automatisering te integreren in dagelijkse gebruikerservaringen. Maar naarmate AI alomtegenwoordig wordt, moeten we ook de potentiële schade begrijpen die kan worden veroorzaakt door de [bewapening](https://www.youtube.com/watch?v=TQHs8SA1qpk) van dergelijke algoritmen op grote schaal.
Markttrends laten zien dat tegen 2022, 1 op de 3 grote organisaties hun data zullen kopen en verkopen via online [marktplaatsen en beurzen](https://www.gartner.com/smarterwithgartner/gartner-top-10-trends-in-data-and-analytics-for-2020/). Als **app-ontwikkelaars** zullen we merken dat het eenvoudiger en goedkoper wordt om datagestuurde inzichten en algoritmegestuurde automatisering te integreren in dagelijkse gebruikerservaringen. Maar naarmate AI alomtegenwoordig wordt, moeten we ook de potentiële schade begrijpen die kan worden veroorzaakt door de [bewapening](https://www.youtube.com/watch?v=TQHs8SA1qpk) van dergelijke algoritmen op grote schaal.
Trends geven ook aan dat we tegen 2025 meer dan [180 zettabytes](https://www.statista.com/statistics/871513/worldwide-data-created/) aan data zullen creëren en consumeren. Als **datawetenschappers** geeft dit ons ongekende toegang tot persoonlijke gegevens. Dit betekent dat we gedragsprofielen van gebruikers kunnen opstellen en besluitvorming kunnen beïnvloeden op manieren die een [illusie van vrije keuze](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice) creëren, terwijl we gebruikers mogelijk naar door ons gewenste uitkomsten sturen. Dit roept ook bredere vragen op over gegevensprivacy en gebruikersbescherming.
@ -25,7 +25,7 @@ Data-ethiek is nu een _noodzakelijke leidraad_ voor datawetenschap en engineerin
![Gartner's Hype Cycle voor AI - 2020](https://images-cdn.newscred.com/Zz1mOWJhNzlkNDA2ZTMxMWViYjRiOGFiM2IyMjQ1YmMwZQ==)
In deze les verkennen we het fascinerende gebied van data-ethiek - van kernconcepten en uitdagingen tot casestudies en toegepaste AI-concepten zoals governance - die helpen een ethische cultuur te vestigen in teams en organisaties die met data en AI werken.
In deze les verkennen we het fascinerende gebied van data-ethiek - van kernconcepten en uitdagingen tot casestudies en toegepaste AI-concepten zoals governance - die helpen een ethische cultuur te vestigen in teams en organisaties die werken met data en AI.
## [Pre-lecture quiz](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/2) 🎯
@ -35,13 +35,13 @@ Laten we beginnen met het begrijpen van de basisterminologie.
Het woord "ethiek" komt van het [Griekse woord "ethikos"](https://en.wikipedia.org/wiki/Ethics) (en de wortel "ethos") wat _karakter of morele aard_ betekent.
**Ethiek** gaat over de gedeelde waarden en morele principes die ons gedrag in de samenleving sturen. Ethiek is niet gebaseerd op wetten, maar op algemeen geaccepteerde normen van wat "goed versus fout" is. Echter, ethische overwegingen kunnen invloed hebben op initiatieven voor corporate governance en overheidsreguleringen die meer prikkels creëren voor naleving.
**Ethiek** gaat over de gedeelde waarden en morele principes die ons gedrag in de samenleving sturen. Ethiek is niet gebaseerd op wetten, maar op algemeen geaccepteerde normen van wat "goed versus fout" is. Ethische overwegingen kunnen echter invloed hebben op initiatieven voor corporate governance en overheidsreguleringen die meer prikkels voor naleving creëren.
**Data-ethiek** is een [nieuwe tak van ethiek](https://royalsocietypublishing.org/doi/full/10.1098/rsta.2016.0360#sec-1) die "morele problemen bestudeert en evalueert met betrekking tot _data, algoritmen en bijbehorende praktijken_". Hier richt **"data"** zich op acties zoals generatie, registratie, curatie, verwerking, verspreiding, delen en gebruik; **"algoritmen"** op AI, agenten, machine learning en robots; en **"praktijken"** op onderwerpen zoals verantwoord innoveren, programmeren, hacken en ethische codes.
**Data-ethiek** is een [nieuwe tak van ethiek](https://royalsocietypublishing.org/doi/full/10.1098/rsta.2016.0360#sec-1) die "morele problemen bestudeert en evalueert met betrekking tot _data, algoritmen en bijbehorende praktijken_". Hier richt **"data"** zich op acties zoals generatie, registratie, curatie, verwerking, verspreiding, delen en gebruik, **"algoritmen"** op AI, agenten, machine learning en robots, en **"praktijken"** op onderwerpen zoals verantwoordelijke innovatie, programmeren, hacken en ethische codes.
**Toegepaste ethiek** is de [praktische toepassing van morele overwegingen](https://en.wikipedia.org/wiki/Applied_ethics). Het is het proces van actief onderzoeken van ethische kwesties in de context van _real-world acties, producten en processen_, en het nemen van corrigerende maatregelen om ervoor te zorgen dat deze in lijn blijven met onze gedefinieerde ethische waarden.
**Ethiekcultuur** gaat over het [_operationeel maken_ van toegepaste ethiek](https://hbr.org/2019/05/how-to-design-an-ethical-organization) om ervoor te zorgen dat onze ethische principes en praktijken consistent en schaalbaar worden toegepast in de hele organisatie. Succesvolle ethiekculturen definiëren organisatiebrede ethische principes, bieden zinvolle prikkels voor naleving en versterken ethische normen door gewenst gedrag op elk niveau van de organisatie aan te moedigen en te versterken.
**Ethiekcultuur** gaat over [_het operationaliseren_ van toegepaste ethiek](https://hbr.org/2019/05/how-to-design-an-ethical-organization) om ervoor te zorgen dat onze ethische principes en praktijken op een consistente en schaalbare manier worden aangenomen in de hele organisatie. Succesvolle ethiekculturen definiëren organisatiebrede ethische principes, bieden zinvolle prikkels voor naleving en versterken ethische normen door gewenst gedrag op elk niveau van de organisatie aan te moedigen en te versterken.
## Ethiekconcepten
@ -49,102 +49,102 @@ In deze sectie bespreken we concepten zoals **gedeelde waarden** (principes) en
### 1. Ethiekprincipes
Elke data-ethiekstrategie begint met het definiëren van _ethische principes_ - de "gedeelde waarden" die acceptabel gedrag beschrijven en compliant acties sturen in onze data- en AI-projecten. Je kunt deze definiëren op individueel of teamniveau. Echter, de meeste grote organisaties schetsen deze in een _ethische AI_-missieverklaring of raamwerk dat op bedrijfsniveau wordt gedefinieerd en consistent wordt gehandhaafd in alle teams.
Elke data-ethiekstrategie begint met het definiëren van _ethische principes_ - de "gedeelde waarden" die acceptabel gedrag beschrijven en compliant acties sturen in onze data- en AI-projecten. Je kunt deze op individueel of teamniveau definiëren. De meeste grote organisaties schetsen deze echter in een _ethische AI_-missieverklaring of raamwerk dat op bedrijfsniveau wordt gedefinieerd en consistent wordt gehandhaafd in alle teams.
**Voorbeeld:** De [Responsible AI](https://www.microsoft.com/en-us/ai/responsible-ai)-missieverklaring van Microsoft luidt: _"We zijn toegewijd aan de vooruitgang van AI, gedreven door ethische principes die mensen op de eerste plaats zetten"_ - met daarin 6 ethische principes zoals hieronder weergegeven:
**Voorbeeld:** Microsoft's [Responsible AI](https://www.microsoft.com/en-us/ai/responsible-ai) missieverklaring luidt: _"We zijn toegewijd aan de vooruitgang van AI, gedreven door ethische principes die mensen centraal stellen"_ - en identificeert 6 ethische principes in het onderstaande raamwerk:
![Responsible AI bij Microsoft](https://docs.microsoft.com/en-gb/azure/cognitive-services/personalizer/media/ethics-and-responsible-use/ai-values-future-computed.png)
Laten we deze principes kort verkennen. _Transparantie_ en _verantwoordelijkheid_ zijn fundamentele waarden waarop andere principes zijn gebaseerd - dus laten we daar beginnen:
Laten we deze principes kort verkennen. _Transparantie_ en _verantwoordelijkheid_ zijn fundamentele waarden waarop andere principes zijn gebouwd - dus laten we daar beginnen:
* [**Verantwoordelijkheid**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) maakt beoefenaars _verantwoordelijk_ voor hun data- en AI-operaties en naleving van deze ethische principes.
* [**Transparantie**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) zorgt ervoor dat data- en AI-acties _begrijpelijk_ (interpreteerbaar) zijn voor gebruikers, waarbij wordt uitgelegd wat en waarom beslissingen worden genomen.
* [**Transparantie**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) zorgt ervoor dat data- en AI-acties _begrijpelijk_ (interpreteerbaar) zijn voor gebruikers, waarbij wordt uitgelegd wat en waarom achter beslissingen.
* [**Eerlijkheid**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1%3aprimaryr6) richt zich op het waarborgen dat AI _alle mensen_ eerlijk behandelt, en eventuele systemische of impliciete sociaal-technische vooroordelen in data en systemen aanpakt.
* [**Betrouwbaarheid & Veiligheid**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) zorgt ervoor dat AI zich _consistent_ gedraagt met gedefinieerde waarden, en potentiële schade of onbedoelde gevolgen minimaliseert.
* [**Betrouwbaarheid & Veiligheid**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) zorgt ervoor dat AI _consistent_ handelt met gedefinieerde waarden, en potentiële schade of onbedoelde gevolgen minimaliseert.
* [**Privacy & Beveiliging**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) gaat over het begrijpen van de herkomst van data en het bieden van _gegevensprivacy en gerelateerde bescherming_ aan gebruikers.
* [**Inclusiviteit**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) gaat over het intentioneel ontwerpen van AI-oplossingen en deze aanpassen om te voldoen aan een _breed scala aan menselijke behoeften_ en capaciteiten.
* [**Inclusiviteit**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) gaat over het ontwerpen van AI-oplossingen met intentie, en ze aanpassen om te voldoen aan een _breed scala aan menselijke behoeften_ en capaciteiten.
> 🚨 Denk na over wat jouw data-ethiek missieverklaring zou kunnen zijn. Verken ethische AI-raamwerken van andere organisaties - hier zijn voorbeelden van [IBM](https://www.ibm.com/cloud/learn/ai-ethics), [Google](https://ai.google/principles), en [Facebook](https://ai.facebook.com/blog/facebooks-five-pillars-of-responsible-ai/). Welke gedeelde waarden hebben ze gemeen? Hoe relateren deze principes aan het AI-product of de industrie waarin ze opereren?
> 🚨 Denk na over wat jouw data-ethiek missieverklaring zou kunnen zijn. Verken ethische AI-raamwerken van andere organisaties - hier zijn voorbeelden van [IBM](https://www.ibm.com/cloud/learn/ai-ethics), [Google](https://ai.google/principles), en [Facebook](https://ai.facebook.com/blog/facebooks-five-pillars-of-responsible-ai/). Welke gedeelde waarden hebben ze gemeen? Hoe verhouden deze principes zich tot het AI-product of de industrie waarin ze opereren?
### 2. Ethiekuitdagingen
Zodra we ethische principes hebben gedefinieerd, is de volgende stap om onze data- en AI-acties te evalueren om te zien of ze in lijn zijn met die gedeelde waarden. Denk aan je acties in twee categorieën: _dataverzameling_ en _algoritmeontwerp_.
Bij dataverzameling zullen acties waarschijnlijk betrekking hebben op **persoonlijke gegevens** of persoonlijk identificeerbare informatie (PII) van identificeerbare levende individuen. Dit omvat [diverse items van niet-persoonlijke gegevens](https://ec.europa.eu/info/law/law-topic/data-protection/reform/what-personal-data_en) die _gezamenlijk_ een individu identificeren. Ethische uitdagingen kunnen betrekking hebben op _gegevensprivacy_, _gegevensbezit_ en gerelateerde onderwerpen zoals _geïnformeerde toestemming_ en _intellectuele eigendomsrechten_ voor gebruikers.
Bij dataverzameling zullen acties waarschijnlijk betrekking hebben op **persoonlijke gegevens** of persoonlijk identificeerbare informatie (PII) van identificeerbare levende individuen. Dit omvat [diverse items van niet-persoonlijke gegevens](https://ec.europa.eu/info/law/law-topic/data-protection/reform/what-personal-data_en) die _gezamenlijk_ een individu identificeren. Ethische uitdagingen kunnen betrekking hebben op _gegevensprivacy_, _gegevensbezit_, en gerelateerde onderwerpen zoals _geïnformeerde toestemming_ en _intellectuele eigendomsrechten_ voor gebruikers.
Bij algoritmeontwerp zullen acties betrekking hebben op het verzamelen en samenstellen van **datasets**, en deze vervolgens gebruiken om **datamodellen** te trainen en in te zetten die uitkomsten voorspellen of beslissingen automatiseren in real-world contexten. Ethische uitdagingen kunnen voortkomen uit _datasetbias_, _gegevenskwaliteit_ problemen, _oneerlijkheid_ en _verkeerde voorstelling_ in algoritmen - inclusief enkele problemen die systemisch van aard zijn.
Bij algoritmeontwerp zullen acties betrekking hebben op het verzamelen en samenstellen van **datasets**, en deze vervolgens gebruiken om **datamodellen** te trainen en in te zetten die uitkomsten voorspellen of beslissingen automatiseren in real-world contexten. Ethische uitdagingen kunnen voortkomen uit _datasetbias_, _gegevenskwaliteit_ problemen, _oneerlijkheid_, en _verkeerde voorstelling_ in algoritmen - inclusief enkele problemen die systemisch van aard zijn.
In beide gevallen benadrukken ethische uitdagingen gebieden waar onze acties mogelijk in conflict komen met onze gedeelde waarden. Om deze zorgen te detecteren, te beperken, te minimaliseren of te elimineren, moeten we morele "ja/nee"-vragen stellen met betrekking tot onze acties en vervolgens corrigerende maatregelen nemen indien nodig. Laten we enkele ethische uitdagingen en de morele vragen die ze oproepen bekijken:
In beide gevallen benadrukken ethische uitdagingen gebieden waar onze acties mogelijk in conflict komen met onze gedeelde waarden. Om deze zorgen te detecteren, te verminderen, te minimaliseren of te elimineren, moeten we morele "ja/nee"-vragen stellen met betrekking tot onze acties en vervolgens corrigerende maatregelen nemen indien nodig. Laten we enkele ethische uitdagingen en de morele vragen die ze oproepen bekijken:
#### 2.1 Gegevensbezit
Dataverzameling omvat vaak persoonlijke gegevens die de betrokkenen kunnen identificeren. [Gegevensbezit](https://permission.io/blog/data-ownership) gaat over _controle_ en [_gebruikersrechten_](https://permission.io/blog/data-ownership) met betrekking tot de creatie, verwerking en verspreiding van gegevens.
Dataverzameling omvat vaak persoonlijke gegevens die de gegevenssubjecten kunnen identificeren. [Gegevensbezit](https://permission.io/blog/data-ownership) gaat over _controle_ en [_gebruikersrechten_](https://permission.io/blog/data-ownership) met betrekking tot de creatie, verwerking en verspreiding van gegevens.
De morele vragen die we moeten stellen zijn:
* Wie bezit de gegevens? (gebruiker of organisatie)
* Welke rechten hebben betrokkenen? (bijv. toegang, verwijdering, overdraagbaarheid)
* Welke rechten hebben organisaties? (bijv. rectificatie van schadelijke gebruikersbeoordelingen)
De morele vragen die we moeten stellen zijn:
* Wie bezit de gegevens? (gebruiker of organisatie)
* Welke rechten hebben gegevenssubjecten? (bijv. toegang, verwijdering, overdraagbaarheid)
* Welke rechten hebben organisaties? (bijv. rectificatie van schadelijke gebruikersbeoordelingen)
#### 2.2 Geïnformeerde Toestemming
[Geïnformeerde toestemming](https://legaldictionary.net/informed-consent/) definieert de handeling waarbij gebruikers instemmen met een actie (zoals dataverzameling) met een _volledig begrip_ van relevante feiten, inclusief het doel, de potentiële risico's en alternatieven.
[Geïnformeerde toestemming](https://legaldictionary.net/informed-consent/) definieert de handeling waarbij gebruikers akkoord gaan met een actie (zoals dataverzameling) met een _volledig begrip_ van relevante feiten, inclusief het doel, potentiële risico's en alternatieven.
Vragen om hier te onderzoeken zijn:
* Heeft de gebruiker (betrokkene) toestemming gegeven voor gegevensverzameling en -gebruik?
* Begrijpt de gebruiker het doel waarvoor die gegevens zijn verzameld?
* Begrijpt de gebruiker de potentiële risico's van hun deelname?
Vragen om hier te verkennen zijn:
* Heeft de gebruiker (gegevenssubject) toestemming gegeven voor gegevensverzameling en -gebruik?
* Begrijpt de gebruiker het doel waarvoor die gegevens zijn verzameld?
* Begrijpt de gebruiker de potentiële risico's van hun deelname?
#### 2.3 Intellectuele Eigendom
[Intellectuele eigendom](https://en.wikipedia.org/wiki/Intellectual_property) verwijst naar immateriële creaties die voortkomen uit menselijke initiatieven en mogelijk _economische waarde_ hebben voor individuen of bedrijven.
Vragen om hier te onderzoeken zijn:
* Hadden de verzamelde gegevens economische waarde voor een gebruiker of bedrijf?
* Heeft de **gebruiker** hier intellectuele eigendom?
* Heeft de **organisatie** hier intellectuele eigendom?
* Als deze rechten bestaan, hoe beschermen we ze?
Vragen om hier te verkennen zijn:
* Hadden de verzamelde gegevens economische waarde voor een gebruiker of bedrijf?
* Heeft de **gebruiker** hier intellectuele eigendom?
* Heeft de **organisatie** hier intellectuele eigendom?
* Als deze rechten bestaan, hoe beschermen we ze?
#### 2.4 Gegevensprivacy
[Gegevensprivacy](https://www.northeastern.edu/graduate/blog/what-is-data-privacy/) of informatieprivacy verwijst naar het behoud van gebruikersprivacy en de bescherming van gebruikersidentiteit met betrekking tot persoonlijk identificeerbare informatie.
[Gegevensprivacy](https://www.northeastern.edu/graduate/blog/what-is-data-privacy/) of informatieprivacy verwijst naar het behoud van gebruikersprivacy en bescherming van gebruikersidentiteit met betrekking tot persoonlijk identificeerbare informatie.
Vragen om hier te onderzoeken zijn:
* Zijn de (persoonlijke) gegevens van gebruikers beveiligd tegen hacks en lekken?
* Zijn de gegevens van gebruikers alleen toegankelijk voor geautoriseerde gebruikers en contexten?
* Wordt de anonimiteit van gebruikers behouden wanneer gegevens worden gedeeld of verspreid?
* Kan een gebruiker worden gedeïdentificeerd uit geanonimiseerde datasets?
Vragen om hier te verkennen zijn:
* Zijn de (persoonlijke) gegevens van gebruikers beveiligd tegen hacks en lekken?
* Zijn de gegevens van gebruikers alleen toegankelijk voor geautoriseerde gebruikers en contexten?
* Wordt de anonimiteit van gebruikers behouden wanneer gegevens worden gedeeld of verspreid?
* Kan een gebruiker worden gedeïdentificeerd uit geanonimiseerde datasets?
#### 2.5 Recht Om Vergeten Te Worden
#### 2.5 Recht om Vergeten te Worden
Het [Recht Om Vergeten Te Worden](https://en.wikipedia.org/wiki/Right_to_be_forgotten) of [Recht op Verwijdering](https://www.gdpreu.org/right-to-be-forgotten/) biedt extra bescherming van persoonlijke gegevens aan gebruikers. Het geeft gebruikers specifiek het recht om verwijdering of verwijdering van persoonlijke gegevens te verzoeken uit internetzoekopdrachten en andere locaties, _onder specifieke omstandigheden_ - zodat ze een nieuwe start online kunnen maken zonder dat eerdere acties tegen hen worden gebruikt.
Het [Recht om Vergeten te Worden](https://en.wikipedia.org/wiki/Right_to_be_forgotten) of [Recht op Verwijdering](https://www.gdpreu.org/right-to-be-forgotten/) biedt aanvullende bescherming van persoonlijke gegevens aan gebruikers. Het geeft gebruikers specifiek het recht om verwijdering of verwijdering van persoonlijke gegevens van internetzoekopdrachten en andere locaties te verzoeken, _onder specifieke omstandigheden_ - waardoor ze een nieuwe start online krijgen zonder dat eerdere acties tegen hen worden gebruikt.
Vragen om hier te onderzoeken zijn:
* Staat het systeem toe dat betrokkenen verwijdering aanvragen?
* Moet het intrekken van gebruikersinstemming automatische verwijdering activeren?
* Zijn gegevens verzameld zonder toestemming of op onwettige wijze?
* Voldoen we aan overheidsvoorschriften voor gegevensprivacy?
Vragen om hier te verkennen zijn:
* Staat het systeem gegevenssubjecten toe om verwijdering te verzoeken?
* Moet het intrekken van gebruikers toestemming automatische verwijdering activeren?
* Zijn gegevens verzameld zonder toestemming of op onwettige wijze?
* Zijn we compliant met overheidsreguleringen voor gegevensprivacy?
#### 2.6 Datasetbias
Dataset- of [verzamelbias](http://researcharticles.com/index.php/bias-in-data-collection-in-research/) gaat over het selecteren van een _niet-representatieve_ subset van gegevens voor algoritmeontwikkeling, wat mogelijk oneerlijkheid creëert in uitkomsten voor diverse groepen. Soorten bias omvatten selectie- of steekproefbias, vrijwillige bias en instrumentbias.
Dataset of [verzamelingsbias](http://researcharticles.com/index.php/bias-in-data-collection-in-research/) gaat over het selecteren van een _niet-representatieve_ subset van gegevens voor algoritmeontwikkeling, wat potentiële oneerlijkheid in resultaatuitkomsten voor diverse groepen kan creëren. Soorten bias omvatten selectie- of steekproefbias, vrijwillige bias en instrumentbias.
Vragen om hier te onderzoeken zijn:
* Hebben we een representatieve set betrokkenen geworven?
* Hebben we onze verzamelde of samengestelde dataset getest op verschillende vormen van bias?
* Kunnen we ontdekte bias beperken of verwijderen?
Vragen om hier te verkennen zijn:
* Hebben we een representatieve set gegevenssubjecten gerekruteerd?
* Hebben we onze verzamelde of samengestelde dataset getest op verschillende vormen van bias?
* Kunnen we ontdekte bias verminderen of verwijderen?
#### 2.7 Gegevenskwaliteit
[Gegevenskwaliteit](https://lakefs.io/data-quality-testing/) kijkt naar de geldigheid van de samengestelde dataset die wordt gebruikt om onze algoritmen te ontwikkelen, en controleert of kenmerken en records voldoen aan de vereisten voor het niveau van nauwkeurigheid en consistentie dat nodig is voor ons AI-doel.
Vragen om hier te onderzoeken zijn:
* Hebben we geldige _kenmerken_ vastgelegd voor ons gebruiksscenario?
* Zijn gegevens _consistent_ vastgelegd over diverse gegevensbronnen?
* Is de dataset _volledig_ voor diverse omstandigheden of scenario's?
* Is informatie _nauwkeurig_ vastgelegd in het weergeven van de werkelijkheid?
Vragen om hier te verkennen zijn:
* Hebben we geldige _kenmerken_ vastgelegd voor ons gebruiksscenario?
* Zijn gegevens _consistent_ vastgelegd over diverse gegevensbronnen?
* Is de dataset _volledig_ voor diverse omstandigheden of scenario's?
* Is informatie _nauwkeurig_ vastgelegd in het weerspiegelen van de werkelijkheid?
#### 2.8 Algoritmische Eerlijkheid
[Algorithmische Eerlijkheid](https://towardsdatascience.com/what-is-algorithm-fairness-3182e161cf9f) onderzoekt of het ontwerp van een algoritme systematisch discrimineert tegen specifieke subgroepen van betrokkenen, wat kan leiden tot [potentiële schade](https://docs.microsoft.com/en-us/azure/machine-learning/concept-fairness-ml) in _toewijzing_ (waar middelen worden geweigerd of onthouden aan die groep) en _kwaliteit van dienstverlening_ (waar AI minder nauwkeurig is voor sommige subgroepen dan voor anderen).
#### 2.8 Algoritme Eerlijkheid
[Algorithmische Eerlijkheid](https://towardsdatascience.com/what-is-algorithm-fairness-3182e161cf9f) onderzoekt of het ontwerp van een algoritme systematisch discrimineert tegen specifieke subgroepen van betrokkenen, wat kan leiden tot [potentiële schade](https://docs.microsoft.com/en-us/azure/machine-learning/concept-fairness-ml) in _toewijzing_ (waar middelen worden geweigerd of onthouden aan die groep) en _kwaliteit van dienstverlening_ (waar AI minder nauwkeurig is voor sommige subgroepen dan voor andere).
Vragen om hier te onderzoeken zijn:
* Hebben we de nauwkeurigheid van het model geëvalueerd voor diverse subgroepen en omstandigheden?
@ -155,7 +155,7 @@ Verken bronnen zoals [AI Fairness checklists](https://query.prod.cms.rt.microsof
#### 2.9 Misrepresentatie
[Data Misrepresentatie](https://www.sciencedirect.com/topics/computer-science/misrepresentation) gaat over de vraag of we inzichten uit eerlijk gerapporteerde gegevens op een misleidende manier communiceren om een gewenst narratief te ondersteunen.
[Misrepresentatie van gegevens](https://www.sciencedirect.com/topics/computer-science/misrepresentation) gaat over de vraag of we inzichten uit eerlijk gerapporteerde gegevens op een misleidende manier communiceren om een gewenst narratief te ondersteunen.
Vragen om hier te onderzoeken zijn:
* Rapporteren we onvolledige of onnauwkeurige gegevens?
@ -164,44 +164,43 @@ Vragen om hier te onderzoeken zijn:
* Zijn er alternatieve verklaringen die een andere conclusie kunnen bieden?
#### 2.10 Vrije Keuze
De [Illusie van Vrije Keuze](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice) ontstaat wanneer "keuze-architecturen" van systemen besluitvormingsalgoritmen gebruiken om mensen subtiel te sturen naar een voorkeursuitkomst, terwijl ze hen opties en controle lijken te geven. Deze [dark patterns](https://www.darkpatterns.org/) kunnen sociale en economische schade veroorzaken voor gebruikers. Omdat gebruikersbeslissingen gedragspatronen beïnvloeden, kunnen deze acties toekomstige keuzes sturen en de impact van deze schade versterken of verlengen.
De [Illusie van Vrije Keuze](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice) ontstaat wanneer "keuze-architecturen" van systemen besluitvormingsalgoritmen gebruiken om mensen subtiel te sturen naar een gewenste uitkomst, terwijl ze lijken opties en controle te bieden. Deze [dark patterns](https://www.darkpatterns.org/) kunnen sociale en economische schade veroorzaken voor gebruikers. Omdat gebruikersbeslissingen gedragspatronen beïnvloeden, kunnen deze acties toekomstige keuzes sturen en de impact van deze schade versterken of verlengen.
Vragen om hier te onderzoeken zijn:
* Begrijpt de gebruiker de implicaties van het maken van die keuze?
* Is de gebruiker zich bewust van (alternatieve) keuzes en de voor- en nadelen van elke keuze?
* Is de gebruiker zich bewust van (alternatieve) keuzes en de voor- en nadelen van elke optie?
* Kan de gebruiker een geautomatiseerde of beïnvloede keuze later terugdraaien?
### 3. Casestudies
Om deze ethische uitdagingen in een realistische context te plaatsen, helpt het om casestudies te bekijken die de potentiële schade en gevolgen voor individuen en de samenleving benadrukken wanneer dergelijke ethische schendingen over het hoofd worden gezien.
Om deze ethische uitdagingen in een realistische context te plaatsen, helpt het om casestudies te bekijken die de potentiële schade en gevolgen voor individuen en de samenleving benadrukken wanneer dergelijke ethische schendingen worden genegeerd.
Hier zijn enkele voorbeelden:
| Ethische Uitdaging | Casestudy |
|--- |--- |
| **Informed Consent** | 1972 - [Tuskegee Syphilis Study](https://en.wikipedia.org/wiki/Tuskegee_Syphilis_Study) - Afro-Amerikaanse mannen die deelnamen aan de studie kregen gratis medische zorg beloofd _maar werden misleid_ door onderzoekers die hen niet informeerden over hun diagnose of de beschikbaarheid van behandeling. Veel deelnemers stierven en hun partners of kinderen werden getroffen; de studie duurde 40 jaar. |
| **Informed Consent** | 1972 - [Tuskegee Syphilis Study](https://en.wikipedia.org/wiki/Tuskegee_Syphilis_Study) - Afro-Amerikaanse mannen die deelnamen aan de studie kregen gratis medische zorg beloofd _maar werden misleid_ door onderzoekers die hen niet informeerden over hun diagnose of de beschikbaarheid van behandeling. Veel deelnemers stierven en partners of kinderen werden getroffen; de studie duurde 40 jaar. |
| **Data Privacy** | 2007 - De [Netflix data prize](https://www.wired.com/2007/12/why-anonymous-data-sometimes-isnt/) bood onderzoekers _10M geanonimiseerde filmbeoordelingen van 50K klanten_ om aanbevelingsalgoritmen te verbeteren. Onderzoekers konden echter geanonimiseerde gegevens correleren met persoonlijk identificeerbare gegevens in _externe datasets_ (bijv. IMDb-commentaren), waardoor sommige Netflix-abonnees effectief "gedeanonimiseerd" werden.|
| **Collection Bias** | 2013 - De stad Boston [ontwikkelde Street Bump](https://www.boston.gov/transportation/street-bump), een app waarmee burgers kuilen konden melden, zodat de stad betere gegevens kreeg om problemen op de weg te vinden en op te lossen. Echter, [mensen in lagere inkomensgroepen hadden minder toegang tot auto's en telefoons](https://hbr.org/2013/04/the-hidden-biases-in-big-data), waardoor hun wegproblemen onzichtbaar werden in deze app. Ontwikkelaars werkten samen met academici om _gelijke toegang en digitale kloof_ kwesties aan te pakken voor eerlijkheid. |
| **Collection Bias** | 2013 - De stad Boston [ontwikkelde Street Bump](https://www.boston.gov/transportation/street-bump), een app waarmee burgers kuilen konden melden, zodat de stad betere gegevens kreeg om problemen op wegen te vinden en op te lossen. Echter, [mensen in lagere inkomensgroepen hadden minder toegang tot auto's en telefoons](https://hbr.org/2013/04/the-hidden-biases-in-big-data), waardoor hun wegproblemen onzichtbaar werden in deze app. Ontwikkelaars werkten samen met academici om _gelijke toegang en digitale kloof_ kwesties aan te pakken voor eerlijkheid. |
| **Algorithmische Eerlijkheid** | 2018 - De MIT [Gender Shades Study](http://gendershades.org/overview.html) evalueerde de nauwkeurigheid van AI-producten voor geslachtsclassificatie en onthulde hiaten in nauwkeurigheid voor vrouwen en mensen van kleur. Een [2019 Apple Card](https://www.wired.com/story/the-apple-card-didnt-see-genderand-thats-the-problem/) leek minder krediet te bieden aan vrouwen dan aan mannen. Beide illustreerden problemen in algoritmische bias die socio-economische schade veroorzaakten.|
| **Data Misrepresentatie** | 2020 - Het [Georgia Department of Public Health publiceerde COVID-19 grafieken](https://www.vox.com/covid-19-coronavirus-us-response-trump/2020/5/18/21262265/georgia-covid-19-cases-declining-reopening) die burgers leken te misleiden over trends in bevestigde gevallen met niet-chronologische ordening op de x-as. Dit illustreert misrepresentatie door visualisatietrucs. |
| **Misrepresentatie van gegevens** | 2020 - Het [Georgia Department of Public Health publiceerde COVID-19 grafieken](https://www.vox.com/covid-19-coronavirus-us-response-trump/2020/5/18/21262265/georgia-covid-19-cases-declining-reopening) die burgers leken te misleiden over trends in bevestigde gevallen met niet-chronologische ordening op de x-as. Dit illustreert misrepresentatie door visualisatietrucs. |
| **Illusie van vrije keuze** | 2020 - Leerapp [ABCmouse betaalde $10M om een FTC-klacht te schikken](https://www.washingtonpost.com/business/2020/09/04/abcmouse-10-million-ftc-settlement/) waarbij ouders werden vastgezet in abonnementen die ze niet konden annuleren. Dit illustreert dark patterns in keuze-architecturen, waarbij gebruikers werden gestuurd naar potentieel schadelijke keuzes. |
| **Data Privacy & Gebruikersrechten** | 2021 - Facebook [Data Breach](https://www.npr.org/2021/04/09/986005820/after-data-breach-exposes-530-million-facebook-says-it-will-not-notify-users) onthulde gegevens van 530M gebruikers, wat resulteerde in een $5B schikking met de FTC. Het weigerde echter gebruikers te informeren over de schending, wat inbreuk maakte op gebruikersrechten rond gegevens transparantie en toegang. |
Wil je meer casestudies verkennen? Bekijk deze bronnen:
* [Ethics Unwrapped](https://ethicsunwrapped.utexas.edu/case-studies) - ethische dilemma's in diverse industrieën.
* [Data Science Ethics course](https://www.coursera.org/learn/data-science-ethics#syllabus) - landmark casestudies onderzocht.
* [Waar dingen fout zijn gegaan](https://deon.drivendata.org/examples/) - deon checklist met voorbeelden.
* [Waar het misging](https://deon.drivendata.org/examples/) - deon checklist met voorbeelden.
> 🚨 Denk na over de casestudies die je hebt gezien - heb je een soortgelijke ethische uitdaging in je leven ervaren of ondervonden? Kun je minstens één andere casestudy bedenken die een van de ethische uitdagingen illustreert die we in deze sectie hebben besproken?
## Toegepaste Ethiek
We hebben gesproken over ethische concepten, uitdagingen en casestudies in realistische contexten. Maar hoe beginnen we met het _toepassen_ van ethische principes en praktijken in onze projecten? En hoe _operationeel maken_ we deze praktijken voor betere governance? Laten we enkele praktische oplossingen verkennen:
We hebben gesproken over ethische concepten, uitdagingen en casestudies in realistische contexten. Maar hoe beginnen we met het _toepassen_ van ethische principes en praktijken in onze projecten? En hoe _operationeel maken_ we deze praktijken voor betere governance? Laten we enkele praktische oplossingen verkennen:
### 1. Professionele Codes
Professionele codes bieden een optie voor organisaties om leden te "stimuleren" om hun ethische principes en missieverklaring te ondersteunen. Codes zijn _morele richtlijnen_ voor professioneel gedrag, die werknemers of leden helpen beslissingen te nemen die in lijn zijn met de principes van hun organisatie. Ze zijn alleen zo goed als de vrijwillige naleving door leden; veel organisaties bieden echter aanvullende beloningen en straffen om naleving te motiveren.
Professionele codes bieden een optie voor organisaties om leden te "stimuleren" om hun ethische principes en missieverklaring te ondersteunen. Codes zijn _morele richtlijnen_ voor professioneel gedrag, die werknemers of leden helpen beslissingen te nemen die in lijn zijn met de principes van hun organisatie. Ze zijn alleen zo goed als de vrijwillige naleving door leden; echter, veel organisaties bieden aanvullende beloningen en straffen om naleving te motiveren.
Voorbeelden zijn:
@ -209,13 +208,13 @@ Voorbeelden zijn:
* [Data Science Association](http://datascienceassn.org/code-of-conduct.html) Code of Conduct (gemaakt in 2013)
* [ACM Code of Ethics and Professional Conduct](https://www.acm.org/code-of-ethics) (sinds 1993)
> 🚨 Behoor je tot een professionele ingenieurs- of data science-organisatie? Verken hun site om te zien of ze een professionele ethische code definiëren. Wat zegt dit over hun ethische principes? Hoe stimuleren ze leden om de code te volgen?
> 🚨 Behoor je tot een professionele ingenieurs- of data science-organisatie? Verken hun website om te zien of ze een professionele ethische code definiëren. Wat zegt dit over hun ethische principes? Hoe stimuleren ze leden om de code te volgen?
### 2. Ethiek Checklists
Hoewel professionele codes vereist _ethisch gedrag_ van beoefenaars definiëren, hebben ze [bekende beperkingen](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md) in handhaving, vooral in grootschalige projecten. In plaats daarvan pleiten veel data science-experts [voor checklists](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md), die **principes verbinden met praktijken** op meer deterministische en actiegerichte manieren.
Hoewel professionele codes vereist _ethisch gedrag_ van beoefenaars definiëren, hebben ze [bekende beperkingen](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md) in handhaving, vooral in grootschalige projecten. In plaats daarvan pleiten veel data science-experts [voor checklists](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md), die **principes verbinden met praktijken** op meer deterministische en actiegerichte manieren.
Checklists zetten vragen om in "ja/nee"-taken die operationeel kunnen worden gemaakt, waardoor ze kunnen worden gevolgd als onderdeel van standaard productrelease-workflows.
Checklists zetten vragen om in "ja/nee"-taken die operationeel kunnen worden gemaakt, waardoor ze kunnen worden gevolgd als onderdeel van standaard productrelease-workflows.
Voorbeelden zijn:
* [Deon](https://deon.drivendata.org/) - een algemene data ethiek checklist gemaakt op basis van [industrie aanbevelingen](https://deon.drivendata.org/#checklist-citations) met een command-line tool voor eenvoudige integratie.
@ -227,28 +226,27 @@ Voorbeelden zijn:
Ethiek gaat over het definiëren van gedeelde waarden en vrijwillig het juiste doen. **Naleving** gaat over _het volgen van de wet_ waar en indien gedefinieerd. **Governance** omvat in brede zin alle manieren waarop organisaties opereren om ethische principes te handhaven en te voldoen aan vastgestelde wetten.
Vandaag de dag neemt governance twee vormen aan binnen organisaties. Ten eerste gaat het om het definiëren van **ethische AI**-principes en het vaststellen van praktijken om adoptie te operationaliseren in alle AI-gerelateerde projecten binnen de organisatie. Ten tweede gaat het om naleving van alle door de overheid opgelegde **gegevensbeschermingsregels** voor regio's waarin het opereert.
Vandaag de dag neemt governance twee vormen aan binnen organisaties. Ten eerste gaat het om het definiëren van **ethische AI**-principes en het vaststellen van praktijken om adoptie operationeel te maken in alle AI-gerelateerde projecten binnen de organisatie. Ten tweede gaat het om naleving van alle door de overheid opgelegde **gegevensbeschermingsregels** voor regio's waarin het opereert.
Voorbeelden van gegevensbeschermings- en privacyregels:
* `1974`, [US Privacy Act](https://www.justice.gov/opcl/privacy-act-1974) - reguleert _federale overheid_ verzameling, gebruik en openbaarmaking van persoonlijke informatie.
* `1996`, [US Health Insurance Portability & Accountability Act (HIPAA)](https://www.cdc.gov/phlp/publications/topic/hipaa.html) - beschermt persoonlijke gezondheidsgegevens.
* `1998`, [US Children's Online Privacy Protection Act (COPPA)](https://www.ftc.gov/enforcement/rules/rulemaking-regulatory-reform-proceedings/childrens-online-privacy-protection-rule) - beschermt gegevensprivacy van kinderen onder de 13.
* `1998`, [US Children's Online Privacy Protection Act (COPPA)](https://www.ftc.gov/enforcement/rules/rulemaking-regulatory-reform-proceedings/childrens-online-privacy-protection-rule) - beschermt gegevensprivacy van kinderen onder 13 jaar.
* `2018`, [General Data Protection Regulation (GDPR)](https://gdpr-info.eu/) - biedt gebruikersrechten, gegevensbescherming en privacy.
* `2018`, [California Consumer Privacy Act (CCPA)](https://www.oag.ca.gov/privacy/ccpa) geeft consumenten meer _rechten_ over hun (persoonlijke) gegevens.
* `2021`, China's [Personal Information Protection Law](https://www.reuters.com/world/china/china-passes-new-personal-data-privacy-law-take-effect-nov-1-2021-08-20/) net aangenomen, een van de sterkste online gegevensprivacyregels wereldwijd.
* `2021`, China's [Personal Information Protection Law](https://www.reuters.com/world/china/china-passes-new-personal-data-privacy-law-take-effect-nov-1-2021-08-20/) net aangenomen, creëert een van de sterkste online gegevensprivacyregels wereldwijd.
> 🚨 De Europese Unie definieerde GDPR (General Data Protection Regulation) blijft een van de meest invloedrijke gegevensprivacyregels vandaag. Wist je dat het ook [8 gebruikersrechten](https://www.freeprivacypolicy.com/blog/8-user-rights-gdpr) definieert om de digitale privacy en persoonlijke gegevens van burgers te beschermen? Leer wat deze zijn en waarom ze belangrijk zijn.
### 4. Ethiek Cultuur
Let op dat er een ontastbare kloof blijft tussen _naleving_ (genoeg doen om "de letter van de wet" te volgen) en het aanpakken van [systemische problemen](https://www.coursera.org/learn/data-science-ethics/home/week/4) (zoals verstening, informatie-asymmetrie en distributionele oneerlijkheid) die de wapenisering van AI kunnen versnellen.
Let op dat er een ontastbare kloof blijft tussen _naleving_ (genoeg doen om "de letter van de wet" te volgen) en het aanpakken van [systemische problemen](https://www.coursera.org/learn/data-science-ethics/home/week/4) (zoals verstening, informatie-asymmetrie en distributionele oneerlijkheid) die de wapenisering van AI kunnen versnellen.
Het laatste vereist [samenwerkingsbenaderingen om ethiekculturen te definiëren](https://towardsdatascience.com/why-ai-ethics-requires-a-culture-driven-approach-26f451afa29f) die emotionele verbindingen en consistente gedeelde waarden _tussen organisaties_ in de industrie opbouwen. Dit vraagt om meer [geformaliseerde data ethiek culturen](https://www.codeforamerica.org/news/formalizing-an-ethical-data-culture/) in organisaties - waardoor _iedereen_ [de Andon-kabel kan trekken](https://en.wikipedia.org/wiki/Andon_(manufacturing)) (om ethische zorgen vroeg in het proces aan te kaarten) en _ethische beoordelingen_ (bijv. bij werving) een kerncriterium maken voor teamvorming in AI-projecten.
Het laatste vereist [samenwerkingsbenaderingen om ethiekculturen te definiëren](https://towardsdatascience.com/why-ai-ethics-requires-a-culture-driven-approach-26f451afa29f) die emotionele verbindingen en consistente gedeelde waarden _binnen organisaties_ in de industrie opbouwen. Dit vraagt om meer [geformaliseerde data ethiek culturen](https://www.codeforamerica.org/news/formalizing-an-ethical-data-culture/) in organisaties - waardoor _iedereen_ [de Andon-kabel kan trekken](https://en.wikipedia.org/wiki/Andon_(manufacturing)) (om ethische zorgen vroeg in het proces aan te kaarten) en _ethische beoordelingen_ (bijv. bij werving) een kerncriterium maken voor teamvorming in AI-projecten.
---
## [Post-lecture quiz](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/3) 🎯
## [Post-lecture quiz](https://ff-quizzes.netlify.app/en/ds/) 🎯
## Review & Zelfstudie
Cursussen en boeken helpen bij het begrijpen van kernconcepten en uitdagingen in ethiek, terwijl casestudies en tools helpen bij toegepaste ethiekpraktijken in realistische contexten. Hier zijn enkele bronnen om mee te beginnen.
@ -259,11 +257,11 @@ Cursussen en boeken helpen bij het begrijpen van kernconcepten en uitdagingen in
* [Ethiek in Datawetenschap](https://www.coursera.org/learn/data-science-ethics#syllabus) - online cursus van de Universiteit van Michigan.
* [Ethiek Ontrafeld](https://ethicsunwrapped.utexas.edu/case-studies) - casestudies van de Universiteit van Texas.
# Opdracht
# Opdracht
[Schrijf Een Casestudy Over Data-Ethiek](assignment.md)
---
**Disclaimer**:
Dit document is vertaald met behulp van de AI-vertalingsservice [Co-op Translator](https://github.com/Azure/co-op-translator). Hoewel we streven naar nauwkeurigheid, willen we u erop wijzen dat geautomatiseerde vertalingen fouten of onnauwkeurigheden kunnen bevatten. Het originele document in de oorspronkelijke taal moet worden beschouwd als de gezaghebbende bron. Voor kritieke informatie wordt professionele menselijke vertaling aanbevolen. Wij zijn niet aansprakelijk voor misverstanden of verkeerde interpretaties die voortvloeien uit het gebruik van deze vertaling.
Dit document is vertaald met behulp van de AI-vertalingsservice [Co-op Translator](https://github.com/Azure/co-op-translator). Hoewel we streven naar nauwkeurigheid, dient u zich ervan bewust te zijn dat geautomatiseerde vertalingen fouten of onnauwkeurigheden kunnen bevatten. Het originele document in zijn oorspronkelijke taal moet worden beschouwd als de gezaghebbende bron. Voor cruciale informatie wordt professionele menselijke vertaling aanbevolen. Wij zijn niet aansprakelijk voor misverstanden of verkeerde interpretaties die voortvloeien uit het gebruik van deze vertaling.

@ -1,8 +1,8 @@
<!--
CO_OP_TRANSLATOR_METADATA:
{
"original_hash": "8796f41f566a0a8ebb72863a83d558ed",
"translation_date": "2025-08-26T21:23:49+00:00",
"original_hash": "3a34157cc63516eba97c89a0b2f8c3e6",
"translation_date": "2025-09-03T21:30:27+00:00",
"source_file": "1-Introduction/02-ethics/README.md",
"language_code": "no"
}
@ -15,17 +15,17 @@ CO_OP_TRANSLATOR_METADATA:
---
Vi er alle databorgerne som lever i en datafisert verden.
Vi er alle databorgere som lever i en verden preget av data.
Markedsanalyser viser at innen 2022 vil 1 av 3 store organisasjoner kjøpe og selge dataene sine gjennom nettbaserte [markedsplasser og børser](https://www.gartner.com/smarterwithgartner/gartner-top-10-trends-in-data-and-analytics-for-2020/). Som **apputviklere** vil vi oppleve at det blir enklere og billigere å integrere datadrevne innsikter og algoritmestyrt automatisering i daglige brukeropplevelser. Men etter hvert som AI blir mer utbredt, må vi også forstå de potensielle skadene som kan oppstå ved [våpenisering](https://www.youtube.com/watch?v=TQHs8SA1qpk) av slike algoritmer i stor skala.
Markedsanalyser viser at innen 2022 vil 1 av 3 store organisasjoner kjøpe og selge data gjennom online [markedsplasser og utvekslinger](https://www.gartner.com/smarterwithgartner/gartner-top-10-trends-in-data-and-analytics-for-2020/). Som **apputviklere** vil vi oppleve at det blir enklere og billigere å integrere datadrevne innsikter og algoritmestyrt automatisering i daglige brukeropplevelser. Men etter hvert som AI blir mer utbredt, må vi også forstå de potensielle skadene som kan oppstå ved [våpenisering](https://www.youtube.com/watch?v=TQHs8SA1qpk) av slike algoritmer i stor skala.
Trender viser også at vi innen 2025 vil skape og konsumere over [180 zettabyte](https://www.statista.com/statistics/871513/worldwide-data-created/) med data. Som **datascientists** gir dette oss enestående tilgang til personopplysninger. Dette betyr at vi kan bygge atferdsprofiler av brukere og påvirke beslutningstaking på måter som skaper en [illusjon av fritt valg](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice), samtidig som vi potensielt dytter brukere mot utfall vi foretrekker. Det reiser også større spørsmål om databeskyttelse og brukerrettigheter.
Trender viser også at vi vil skape og konsumere over [180 zettabyte](https://www.statista.com/statistics/871513/worldwide-data-created/) med data innen 2025. Som **dataforskere** gir dette oss enestående tilgang til personlig data. Dette betyr at vi kan bygge atferdsprofiler av brukere og påvirke beslutningstaking på måter som skaper en [illusjon av fri vilje](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice), samtidig som vi potensielt dytter brukere mot utfall vi foretrekker. Det reiser også bredere spørsmål om databeskyttelse og brukerrettigheter.
Dataetikk er nå _nødvendige retningslinjer_ for datavitenskap og ingeniørarbeid, som hjelper oss med å minimere potensielle skader og utilsiktede konsekvenser av våre datadrevne handlinger. [Gartner Hype Cycle for AI](https://www.gartner.com/smarterwithgartner/2-megatrends-dominate-the-gartner-hype-cycle-for-artificial-intelligence-2020/) identifiserer relevante trender innen digital etikk, ansvarlig AI og AI-styring som nøkkeldrivere for større megatrender rundt _demokratisering_ og _industrialisering_ av AI.
Dataetikk er nå _nødvendige retningslinjer_ for dataforskning og ingeniørarbeid, som hjelper oss med å minimere potensielle skader og utilsiktede konsekvenser av våre datadrevne handlinger. [Gartner Hype Cycle for AI](https://www.gartner.com/smarterwithgartner/2-megatrends-dominate-the-gartner-hype-cycle-for-artificial-intelligence-2020/) identifiserer relevante trender innen digital etikk, ansvarlig AI og AI-styring som nøkkeldrivere for større megatrender rundt _demokratisering_ og _industrialisering_ av AI.
![Gartner's Hype Cycle for AI - 2020](https://images-cdn.newscred.com/Zz1mOWJhNzlkNDA2ZTMxMWViYjRiOGFiM2IyMjQ1YmMwZQ==)
I denne leksjonen skal vi utforske det fascinerende området dataetikk - fra kjernebegreper og utfordringer til casestudier og anvendte AI-konsepter som styring - som bidrar til å etablere en etikkultur i team og organisasjoner som jobber med data og AI.
I denne leksjonen skal vi utforske det fascinerende området dataetikk - fra grunnleggende konsepter og utfordringer til casestudier og anvendte AI-konsepter som styring - som hjelper med å etablere en etikkultur i team og organisasjoner som jobber med data og AI.
## [Quiz før forelesning](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/2) 🎯
@ -35,88 +35,88 @@ La oss starte med å forstå grunnleggende terminologi.
Ordet "etikk" kommer fra det [greske ordet "ethikos"](https://en.wikipedia.org/wiki/Ethics) (og roten "ethos") som betyr _karakter eller moralsk natur_.
**Etikk** handler om de delte verdiene og moralske prinsippene som styrer vår oppførsel i samfunnet. Etikk er ikke basert på lover, men på allment aksepterte normer for hva som er "riktig vs. galt". Likevel kan etiske vurderinger påvirke initiativer for selskapsstyring og myndighetsreguleringer som skaper flere insentiver for samsvar.
**Etikk** handler om de delte verdiene og moralske prinsippene som styrer vår oppførsel i samfunnet. Etikk er ikke basert på lover, men på bredt aksepterte normer for hva som er "riktig vs. galt". Etiske hensyn kan imidlertid påvirke initiativer for selskapsstyring og myndighetsreguleringer som skaper flere insentiver for samsvar.
**Dataetikk** er en [ny gren av etikk](https://royalsocietypublishing.org/doi/full/10.1098/rsta.2016.0360#sec-1) som "studerer og evaluerer moralske problemer knyttet til _data, algoritmer og tilhørende praksiser_". Her fokuserer **"data"** på handlinger knyttet til generering, registrering, kuratering, behandling, spredning, deling og bruk, **"algoritmer"** på AI, agenter, maskinlæring og roboter, og **"praksiser"** på temaer som ansvarlig innovasjon, programmering, hacking og etiske koder.
**Dataetikk** er en [ny gren av etikk](https://royalsocietypublishing.org/doi/full/10.1098/rsta.2016.0360#sec-1) som "studerer og evaluerer moralske problemer knyttet til _data, algoritmer og tilhørende praksis_". Her fokuserer **"data"** på handlinger relatert til generering, registrering, kuratering, behandling, spredning, deling og bruk, **"algoritmer"** fokuserer på AI, agenter, maskinlæring og roboter, og **"praksis"** fokuserer på temaer som ansvarlig innovasjon, programmering, hacking og etiske retningslinjer.
**Anvendt etikk** er den [praktiske anvendelsen av moralske vurderinger](https://en.wikipedia.org/wiki/Applied_ethics). Det er prosessen med aktivt å undersøke etiske spørsmål i konteksten av _virkelige handlinger, produkter og prosesser_, og ta korrigerende tiltak for å sikre at disse forblir i tråd med våre definerte etiske verdier.
**Anvendt etikk** er den [praktiske anvendelsen av moralske hensyn](https://en.wikipedia.org/wiki/Applied_ethics). Det er prosessen med aktivt å undersøke etiske spørsmål i konteksten av _virkelige handlinger, produkter og prosesser_, og ta korrigerende tiltak for å sikre at disse forblir i tråd med våre definerte etiske verdier.
**Etikkultur** handler om [_operasjonalisering_ av anvendt etikk](https://hbr.org/2019/05/how-to-design-an-ethical-organization) for å sikre at våre etiske prinsipper og praksiser blir vedtatt på en konsekvent og skalerbar måte i hele organisasjonen. Vellykkede etikkulturer definerer organisasjonsomfattende etiske prinsipper, gir meningsfulle insentiver for samsvar og forsterker etiske normer ved å oppmuntre og forsterke ønsket atferd på alle nivåer i organisasjonen.
**Etikkultur** handler om [_operasjonalisering_ av anvendt etikk](https://hbr.org/2019/05/how-to-design-an-ethical-organization) for å sikre at våre etiske prinsipper og praksiser blir vedtatt på en konsekvent og skalerbar måte i hele organisasjonen. Vellykkede etikkulturer definerer organisasjonsomfattende etiske prinsipper, gir meningsfulle insentiver for samsvar, og forsterker etiske normer ved å oppmuntre og forsterke ønsket atferd på alle nivåer i organisasjonen.
## Etiske konsepter
I denne delen skal vi diskutere konsepter som **delte verdier** (prinsipper) og **etiske utfordringer** (problemer) for dataetikk - og utforske **casestudier** som hjelper deg med å forstå disse konseptene i virkelige sammenhenger.
I denne delen skal vi diskutere konsepter som **delte verdier** (prinsipper) og **etiske utfordringer** (problemer) for dataetikk - og utforske **casestudier** som hjelper deg med å forstå disse konseptene i virkelige kontekster.
### 1. Etiske prinsipper
Hver dataetikkstrategi begynner med å definere _etiske prinsipper_ - de "delte verdiene" som beskriver akseptabel atferd og veileder samsvarende handlinger i våre data- og AI-prosjekter. Du kan definere disse på individ- eller teamnivå. Imidlertid skisserer de fleste store organisasjoner disse i en _etisk AI_-misjonserklæring eller rammeverk som er definert på bedriftsnivå og håndheves konsekvent på tvers av alle team.
Hver dataetikkstrategi begynner med å definere _etiske prinsipper_ - de "delte verdiene" som beskriver akseptabel oppførsel og veileder samsvarende handlinger i våre data- og AI-prosjekter. Du kan definere disse på individ- eller teamnivå. Imidlertid skisserer de fleste store organisasjoner disse i en _etisk AI_-misjonserklæring eller rammeverk som er definert på selskapsnivå og håndhevet konsekvent på tvers av alle team.
**Eksempel:** Microsofts [Responsible AI](https://www.microsoft.com/en-us/ai/responsible-ai)-misjonserklæring lyder: _"Vi er forpliktet til å fremme AI drevet av etiske prinsipper som setter mennesker først"_ - og identifiserer 6 etiske prinsipper i rammeverket nedenfor:
**Eksempel:** Microsofts [Ansvarlig AI](https://www.microsoft.com/en-us/ai/responsible-ai)-misjonserklæring lyder: _"Vi er forpliktet til å fremme AI drevet av etiske prinsipper som setter mennesker først"_ - og identifiserer 6 etiske prinsipper i rammeverket nedenfor:
![Responsible AI hos Microsoft](https://docs.microsoft.com/en-gb/azure/cognitive-services/personalizer/media/ethics-and-responsible-use/ai-values-future-computed.png)
![Ansvarlig AI hos Microsoft](https://docs.microsoft.com/en-gb/azure/cognitive-services/personalizer/media/ethics-and-responsible-use/ai-values-future-computed.png)
La oss kort utforske disse prinsippene. _Åpenhet_ og _ansvarlighet_ er grunnleggende verdier som de andre prinsippene bygger på - så la oss starte der:
La oss kort utforske disse prinsippene. _Åpenhet_ og _ansvarlighet_ er grunnleggende verdier som andre prinsipper bygger på - så la oss begynne der:
* [**Ansvarlighet**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) gjør utøvere _ansvarlige_ for sine data- og AI-operasjoner og samsvar med disse etiske prinsippene.
* [**Ansvarlighet**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) gjør utøvere _ansvarlige_ for sine data- og AI-operasjoner, og samsvar med disse etiske prinsippene.
* [**Åpenhet**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) sikrer at data- og AI-handlinger er _forståelige_ (tolkbare) for brukere, og forklarer hva og hvorfor bak beslutninger.
* [**Rettferdighet**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1%3aprimaryr6) fokuserer på å sikre at AI behandler _alle mennesker_ rettferdig, og adresserer eventuelle systemiske eller implisitte sosio-tekniske skjevheter i data og systemer.
* [**Pålitelighet og sikkerhet**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) sikrer at AI oppfører seg _konsekvent_ med definerte verdier, og minimerer potensielle skader eller utilsiktede konsekvenser.
* [**Personvern og sikkerhet**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) handler om å forstå dataenes opprinnelse og gi _personvern og relaterte beskyttelser_ til brukere.
* [**Inkludering**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) handler om å designe AI-løsninger med intensjon, og tilpasse dem for å møte et _bredt spekter av menneskelige behov_ og evner.
* [**Rettferdighet**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1%3aprimaryr6) - fokuserer på å sikre at AI behandler _alle mennesker_ rettferdig, og adresserer eventuelle systemiske eller implisitte sosio-tekniske skjevheter i data og systemer.
* [**Pålitelighet og sikkerhet**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - sikrer at AI oppfører seg _konsekvent_ med definerte verdier, og minimerer potensielle skader eller utilsiktede konsekvenser.
* [**Personvern og sikkerhet**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - handler om å forstå dataopprinnelse og gi _databeskyttelse og relaterte rettigheter_ til brukere.
* [**Inkludering**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - handler om å designe AI-løsninger med intensjon, og tilpasse dem for å møte et _bredt spekter av menneskelige behov_ og evner.
> 🚨 Tenk på hva din dataetikk-misjonserklæring kunne vært. Utforsk etiske AI-rammeverk fra andre organisasjoner - her er eksempler fra [IBM](https://www.ibm.com/cloud/learn/ai-ethics), [Google](https://ai.google/principles) og [Facebook](https://ai.facebook.com/blog/facebooks-five-pillars-of-responsible-ai/). Hvilke delte verdier har de til felles? Hvordan relaterer disse prinsippene seg til AI-produktet eller bransjen de opererer i?
> 🚨 Tenk på hva din dataetikk-misjonserklæring kunne vært. Utforsk etiske AI-rammeverk fra andre organisasjoner - her er eksempler fra [IBM](https://www.ibm.com/cloud/learn/ai-ethics), [Google](https://ai.google/principles), og [Facebook](https://ai.facebook.com/blog/facebooks-five-pillars-of-responsible-ai/). Hvilke delte verdier har de til felles? Hvordan relaterer disse prinsippene seg til AI-produktet eller industrien de opererer i?
### 2. Etiske utfordringer
Når vi har definert etiske prinsipper, er neste steg å evaluere våre data- og AI-handlinger for å se om de er i tråd med disse delte verdiene. Tenk på handlingene dine i to kategorier: _datainnsamling_ og _algoritmedesign_.
Når vi har definert etiske prinsipper, er neste steg å evaluere våre data- og AI-handlinger for å se om de samsvarer med disse delte verdiene. Tenk på handlingene dine i to kategorier: _datainnsamling_ og _algoritmedesign_.
Ved datainnsamling vil handlinger sannsynligvis involvere **personopplysninger** eller personlig identifiserbar informasjon (PII) for identifiserbare levende individer. Dette inkluderer [mangfoldige elementer av ikke-personlige data](https://ec.europa.eu/info/law/law-topic/data-protection/reform/what-personal-data_en) som _samlet sett_ identifiserer en person. Etiske utfordringer kan relatere seg til _personvern_, _dataeierskap_ og relaterte temaer som _informert samtykke_ og _immaterielle rettigheter_ for brukere.
Ved datainnsamling vil handlingene sannsynligvis involvere **personlig data** eller personlig identifiserbar informasjon (PII) for identifiserbare levende individer. Dette inkluderer [mangfoldige elementer av ikke-personlig data](https://ec.europa.eu/info/law/law-topic/data-protection/reform/what-personal-data_en) som _samlet sett_ identifiserer en person. Etiske utfordringer kan relatere seg til _databeskyttelse_, _dataeierskap_, og relaterte temaer som _informert samtykke_ og _immaterielle rettigheter_ for brukere.
Ved algoritmedesign vil handlinger involvere innsamling og kuratering av **datasett**, og deretter bruke dem til å trene og distribuere **datamodeller** som forutsier utfall eller automatiserer beslutninger i virkelige sammenhenger. Etiske utfordringer kan oppstå fra _datasett-skjevhet_, _datakvalitetsproblemer_, _urettferdighet_ og _feilrepresentasjon_ i algoritmer - inkludert noen problemer som er systemiske i natur.
Ved algoritmedesign vil handlingene involvere innsamling og kuratering av **datasett**, og deretter bruke dem til å trene og distribuere **datamodeller** som forutsier utfall eller automatiserer beslutninger i virkelige kontekster. Etiske utfordringer kan oppstå fra _datasettbias_, _datakvalitetsproblemer_, _urettferdighet_, og _feilrepresentasjon_ i algoritmer - inkludert noen problemer som er systemiske i natur.
I begge tilfeller fremhever etiske utfordringer områder der våre handlinger kan komme i konflikt med våre delte verdier. For å oppdage, redusere, minimere eller eliminere disse bekymringene må vi stille moralske "ja/nei"-spørsmål knyttet til våre handlinger, og deretter ta korrigerende tiltak etter behov. La oss se på noen etiske utfordringer og de moralske spørsmålene de reiser:
I begge tilfeller fremhever etiske utfordringer områder der våre handlinger kan komme i konflikt med våre delte verdier. For å oppdage, redusere, minimere eller eliminere disse bekymringene - må vi stille moralske "ja/nei"-spørsmål relatert til våre handlinger, og deretter ta korrigerende tiltak etter behov. La oss se på noen etiske utfordringer og de moralske spørsmålene de reiser:
#### 2.1 Dataeierskap
Datainnsamling involverer ofte personopplysninger som kan identifisere datasubjektene. [Dataeierskap](https://permission.io/blog/data-ownership) handler om _kontroll_ og [_brukerrettigheter_](https://permission.io/blog/data-ownership) knyttet til opprettelse, behandling og spredning av data.
Datainnsamling involverer ofte personlig data som kan identifisere datasubjektene. [Dataeierskap](https://permission.io/blog/data-ownership) handler om _kontroll_ og [_brukerrettigheter_](https://permission.io/blog/data-ownership) relatert til opprettelse, behandling og spredning av data.
De moralske spørsmålene vi må stille er:
* Hvem eier dataene? (bruker eller organisasjon)
* Hvilke rettigheter har datasubjektene? (f.eks. tilgang, sletting, portabilitet)
* Hvilke rettigheter har organisasjoner? (f.eks. rette opp ondsinnede brukeranmeldelser)
* Hvilke rettigheter har datasubjektene? (eks: tilgang, sletting, portabilitet)
* Hvilke rettigheter har organisasjoner? (eks: rette opp skadelige brukeranmeldelser)
#### 2.2 Informert samtykke
[Informert samtykke](https://legaldictionary.net/informed-consent/) definerer handlingen der brukere gir tillatelse til en handling (som datainnsamling) med en _full forståelse_ av relevante fakta, inkludert formål, potensielle risikoer og alternativer.
[Informert samtykke](https://legaldictionary.net/informed-consent/) definerer handlingen der brukere samtykker til en handling (som datainnsamling) med en _full forståelse_ av relevante fakta, inkludert formål, potensielle risikoer og alternativer.
Spørsmål å utforske her er:
* Ga brukeren (datasubjektet) tillatelse til datainnsamling og bruk?
* Forsto brukeren formålet med at dataene ble samlet inn?
* Forsto brukeren de potensielle risikoene ved deres deltakelse?
* Forsto brukeren formålet med datainnsamlingen?
* Forsto brukeren de potensielle risikoene ved deltakelsen?
#### 2.3 Immaterielle rettigheter
[Immaterielle rettigheter](https://en.wikipedia.org/wiki/Intellectual_property) refererer til immaterielle skapelser som følge av menneskelig initiativ, som kan _ha økonomisk verdi_ for enkeltpersoner eller virksomheter.
[Immaterielle rettigheter](https://en.wikipedia.org/wiki/Intellectual_property) refererer til immaterielle skapelser som resultat av menneskelig initiativ, som kan _ha økonomisk verdi_ for individer eller bedrifter.
Spørsmål å utforske her er:
* Hadde de innsamlede dataene økonomisk verdi for en bruker eller virksomhet?
* Hadde de innsamlede dataene økonomisk verdi for en bruker eller bedrift?
* Har **brukeren** immaterielle rettigheter her?
* Har **organisasjonen** immaterielle rettigheter her?
* Hvis disse rettighetene eksisterer, hvordan beskytter vi dem?
#### 2.4 Datapersonvern
#### 2.4 Databeskyttelse
[Datapersonvern](https://www.northeastern.edu/graduate/blog/what-is-data-privacy/) eller informasjonsvern refererer til bevaring av brukerens personvern og beskyttelse av brukerens identitet med hensyn til personlig identifiserbar informasjon.
[Databeskyttelse](https://www.northeastern.edu/graduate/blog/what-is-data-privacy/) eller informasjonsbeskyttelse refererer til bevaring av brukerens personvern og beskyttelse av brukerens identitet med hensyn til personlig identifiserbar informasjon.
Spørsmål å utforske her er:
* Er brukernes (personlige) data sikret mot hacking og lekkasjer?
* Er brukernes data kun tilgjengelig for autoriserte brukere og kontekster?
* Bevares brukernes anonymitet når data deles eller spres?
* Er brukernes anonymitet bevart når data deles eller spres?
* Kan en bruker bli avidentifisert fra anonymiserte datasett?
#### 2.5 Rett til å bli glemt
[Rett til å bli glemt](https://en.wikipedia.org/wiki/Right_to_be_forgotten) eller [rett til sletting](https://www.gdpreu.org/right-to-be-forgotten/) gir ekstra beskyttelse av personopplysninger til brukere. Spesielt gir det brukere rett til å be om sletting eller fjerning av personopplysninger fra internett og andre steder, _under spesifikke omstendigheter_ - slik at de kan starte på nytt uten at tidligere handlinger holdes mot dem.
[Rett til å bli glemt](https://en.wikipedia.org/wiki/Right_to_be_forgotten) eller [rett til sletting](https://www.gdpreu.org/right-to-be-forgotten/) gir ekstra beskyttelse av personlig data til brukere. Spesielt gir det brukere rett til å be om sletting eller fjerning av personlig data fra Internett-søk og andre steder, _under spesifikke omstendigheter_ - slik at de kan få en ny start online uten at tidligere handlinger holdes mot dem.
Spørsmål å utforske her er:
* Tillater systemet datasubjekter å be om sletting?
@ -124,27 +124,27 @@ Spørsmål å utforske her er:
* Ble data samlet inn uten samtykke eller på ulovlig vis?
* Er vi i samsvar med myndighetsreguleringer for databeskyttelse?
#### 2.6 Datasett-skjevhet
#### 2.6 Datasettbias
Datasett- eller [innsamlingsskjevhet](http://researcharticles.com/index.php/bias-in-data-collection-in-research/) handler om å velge et _ikke-representativt_ datasett for algoritmeutvikling, noe som kan skape potensielle urettferdigheter i resultatene for ulike grupper. Typer skjevhet inkluderer utvalgs- eller prøvetakingsskjevhet, frivillighetsskjevhet og instrumentell skjevhet.
Datasett eller [innsamlingsbias](http://researcharticles.com/index.php/bias-in-data-collection-in-research/) handler om å velge et _ikke-representativt_ datasett for algoritmeutvikling, noe som kan skape potensielle urettferdigheter i resultatene for ulike grupper. Typer bias inkluderer utvalgsbias, frivillighetsbias og instrumentbias.
Spørsmål å utforske her er:
* Rekrutterte vi et representativt sett med datasubjekter?
* Testet vi vårt innsamlede eller kuraterte datasett for ulike skjevheter?
* Kan vi redusere eller fjerne oppdagede skjevheter?
* Testet vi vårt innsamlede eller kuraterte datasett for ulike typer bias?
* Kan vi redusere eller fjerne oppdagede bias?
#### 2.7 Datakvalitet
[Datakvalitet](https://lakefs.io/data-quality-testing/) ser på gyldigheten av det kuraterte datasettet som brukes til å utvikle algoritmene våre, og sjekker om funksjoner og poster oppfyller kravene til nøyaktighet og konsistens som trengs for vårt AI-formål.
[Datakvalitet](https://lakefs.io/data-quality-testing/) ser på gyldigheten av det kuraterte datasettet som brukes til å utvikle våre algoritmer, og sjekker om funksjoner og poster oppfyller kravene til nivået av nøyaktighet og konsistens som trengs for vårt AI-formål.
Spørsmål å utforske her er:
* Fanget vi gyldige _funksjoner_ for vårt brukstilfelle?
* Fanget vi gyldige _funksjoner_ for vår brukssak?
* Ble data fanget _konsistent_ på tvers av ulike datakilder?
* Er datasettet _komplett_ for ulike forhold eller scenarier?
* Er informasjonen fanget _nøyaktig_ i å gjenspeile virkeligheten?
* Er informasjonen fanget _nøyaktig_ i å reflektere virkeligheten?
#### 2.8 Algoritme-rettferdighet
[Algorithmisk rettferdighet](https://towardsdatascience.com/what-is-algorithm-fairness-3182e161cf9f) undersøker om algoritmedesign systematisk diskriminerer spesifikke undergrupper av datasubjekter, noe som kan føre til [potensielle skader](https://docs.microsoft.com/en-us/azure/machine-learning/concept-fairness-ml) innen _fordeling_ (der ressurser nektes eller holdes tilbake fra en gruppe) og _tjenestekvalitet_ (der AI ikke er like nøyaktig for noen undergrupper som for andre).
[Algorithmisk rettferdighet](https://towardsdatascience.com/what-is-algorithm-fairness-3182e161cf9f) undersøker om algoritmedesign systematisk diskriminerer spesifikke undergrupper av datasubjekter, noe som kan føre til [potensielle skader](https://docs.microsoft.com/en-us/azure/machine-learning/concept-fairness-ml) innen _fordeling_ (der ressurser nektes eller holdes tilbake fra den gruppen) og _tjenestekvalitet_ (der AI ikke er like nøyaktig for noen undergrupper som for andre).
Spørsmål å utforske her er:
* Evaluerte vi modellens nøyaktighet for ulike undergrupper og forhold?
@ -164,43 +164,44 @@ Spørsmål å utforske her er:
* Finnes det alternative forklaringer som kan gi en annen konklusjon?
#### 2.10 Fri vilje
[Illusjonen av fri vilje](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice) oppstår når systemets "valgarkitekturer" bruker beslutningsalgoritmer for å dytte folk mot et foretrukket utfall, samtidig som det ser ut som om de har alternativer og kontroll. Disse [mørke mønstrene](https://www.darkpatterns.org/) kan forårsake sosial og økonomisk skade for brukere. Fordi brukerbeslutninger påvirker atferdsprofiler, kan disse handlingene potensielt drive fremtidige valg som forsterker eller utvider skaden.
[Illusjonen av fri vilje](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice) oppstår når systemets "valgarkitekturer" bruker beslutningsalgoritmer for å påvirke folk til å ta et foretrukket utfall, samtidig som det ser ut som de har alternativer og kontroll. Disse [mørke mønstrene](https://www.darkpatterns.org/) kan forårsake sosial og økonomisk skade for brukere. Fordi brukerbeslutninger påvirker atferdsprofiler, kan disse handlingene potensielt drive fremtidige valg som forsterker eller utvider virkningen av disse skadene.
Spørsmål å utforske her er:
* Forsto brukeren konsekvensene av å ta det valget?
* Var brukeren klar over (alternative) valg og fordeler og ulemper ved hvert av dem?
* Kan brukeren omgjøre et automatisert eller påvirket valg senere?
* Var brukeren klar over (alternative) valg og fordeler og ulemper ved hvert?
* Kan brukeren reversere et automatisert eller påvirket valg senere?
### 3. Case-studier
### 3. Casestudier
For å sette disse etiske utfordringene i en virkelighetsnær kontekst, kan det være nyttig å se på case-studier som fremhever potensielle skader og konsekvenser for enkeltpersoner og samfunnet når slike etiske brudd overses.
For å sette disse etiske utfordringene i virkelige kontekster, hjelper det å se på casestudier som fremhever potensielle skader og konsekvenser for enkeltpersoner og samfunn når slike etikkbrudd blir oversett.
Her er noen eksempler:
| Etisk utfordring | Case-studie |
| Etisk utfordring | Casestudie |
|--- |--- |
| **Informert samtykke** | 1972 - [Tuskegee-syfilisstudien](https://en.wikipedia.org/wiki/Tuskegee_Syphilis_Study) - Afroamerikanske menn som deltok i studien ble lovet gratis medisinsk behandling, _men ble lurt_ av forskere som ikke informerte dem om diagnosen eller tilgjengelig behandling. Mange døde, og partnere eller barn ble påvirket; studien varte i 40 år. |
| **Datapersonvern** | 2007 - [Netflix data-prisen](https://www.wired.com/2007/12/why-anonymous-data-sometimes-isnt/) ga forskere _10M anonymiserte filmvurderinger fra 50K kunder_ for å forbedre anbefalingsalgoritmer. Forskere klarte imidlertid å korrelere anonymiserte data med personlig identifiserbare data i _eksterne datasett_ (f.eks. IMDb-kommentarer), og "de-anonymiserte" dermed noen Netflix-abonnenter.|
| **Innsamlingsskjevhet** | 2013 - Byen Boston [utviklet Street Bump](https://www.boston.gov/transportation/street-bump), en app som lot innbyggere rapportere hull i veien, og ga byen bedre data for å finne og fikse problemer. Men [folk i lavinntektsgrupper hadde mindre tilgang til biler og telefoner](https://hbr.org/2013/04/the-hidden-biases-in-big-data), noe som gjorde deres veiutfordringer usynlige i appen. Utviklerne samarbeidet med akademikere for å løse _rettferdig tilgang og digitale skiller_. |
| **Algoritmisk rettferdighet** | 2018 - MITs [Gender Shades-studie](http://gendershades.org/overview.html) evaluerte nøyaktigheten til AI-produkter for kjønnsidentifikasjon og avdekket forskjeller i nøyaktighet for kvinner og personer med mørk hud. Et [2019 Apple Card](https://www.wired.com/story/the-apple-card-didnt-see-genderand-thats-the-problem/) så ut til å tilby mindre kreditt til kvinner enn menn. Begge eksemplene illustrerer problemer med algoritmisk skjevhet som fører til sosioøkonomiske skader.|
| **Feilrepresentasjon av data** | 2020 - [Georgia Department of Public Health publiserte COVID-19-diagrammer](https://www.vox.com/covid-19-coronavirus-us-response-trump/2020/5/18/21262265/georgia-covid-19-cases-declining-reopening) som så ut til å villede innbyggerne om trender i bekreftede tilfeller ved å bruke ikke-kronologisk rekkefølge på x-aksen. Dette illustrerer feilrepresentasjon gjennom visualiseringstriks. |
| **Illusjon av fri vilje** | 2020 - Læringsappen [ABCmouse betalte $10M for å løse en FTC-klage](https://www.washingtonpost.com/business/2020/09/04/abcmouse-10-million-ftc-settlement/) der foreldre ble fanget i å betale for abonnementer de ikke kunne kansellere. Dette illustrerer mørke mønstre i valgarkitekturer, der brukere ble dyttet mot potensielt skadelige valg. |
| **Datapersonvern og brukerrettigheter** | 2021 - Facebook [datainnbrudd](https://www.npr.org/2021/04/09/986005820/after-data-breach-exposes-530-million-facebook-says-it-will-not-notify-users) eksponerte data fra 530M brukere, noe som resulterte i et forlik på $5B med FTC. Facebook nektet imidlertid å varsle brukerne om bruddet, noe som krenket brukernes rettigheter til datatransparens og tilgang. |
Vil du utforske flere case-studier? Sjekk ut disse ressursene:
| **Informert samtykke** | 1972 - [Tuskegee Syphilis Study](https://en.wikipedia.org/wiki/Tuskegee_Syphilis_Study) - Afroamerikanske menn som deltok i studien ble lovet gratis medisinsk behandling _men ble lurt_ av forskere som unnlot å informere deltakerne om diagnosen eller tilgjengelig behandling. Mange døde, og partnere eller barn ble påvirket; studien varte i 40 år. |
| **Datapersonvern** | 2007 - [Netflix data prize](https://www.wired.com/2007/12/why-anonymous-data-sometimes-isnt/) ga forskere _10M anonymiserte filmrangeringer fra 50K kunder_ for å forbedre anbefalingsalgoritmer. Imidlertid klarte forskere å korrelere anonymiserte data med personlig identifiserbare data i _eksterne datasett_ (f.eks. IMDb-kommentarer) - effektivt "de-anonymiserte" noen Netflix-abonnenter.|
| **Innsamlingsskjevhet** | 2013 - Boston by [utviklet Street Bump](https://www.boston.gov/transportation/street-bump), en app som lot innbyggere rapportere hull i veien, og ga byen bedre data for å finne og fikse problemer. Imidlertid hadde [folk i lavinntektsgrupper mindre tilgang til biler og telefoner](https://hbr.org/2013/04/the-hidden-biases-in-big-data), noe som gjorde deres veiproblemer usynlige i denne appen. Utviklere samarbeidet med akademikere for å adressere _rettferdig tilgang og digitale skiller_. |
| **Algoritmisk rettferdighet** | 2018 - MIT [Gender Shades Study](http://gendershades.org/overview.html) evaluerte nøyaktigheten til AI-produkter for kjønnsidentifikasjon, og avdekket mangler i nøyaktighet for kvinner og personer med mørk hud. Et [2019 Apple Card](https://www.wired.com/story/the-apple-card-didnt-see-genderand-thats-the-problem/) syntes å tilby mindre kreditt til kvinner enn menn. Begge illustrerte problemer med algoritmisk skjevhet som førte til sosioøkonomiske skader.|
| **Feilrepresentasjon av data** | 2020 - [Georgia Department of Public Health publiserte COVID-19-diagrammer](https://www.vox.com/covid-19-coronavirus-us-response-trump/2020/5/18/21262265/georgia-covid-19-cases-declining-reopening) som syntes å villede innbyggere om trender i bekreftede tilfeller med ikke-kronologisk rekkefølge på x-aksen. Dette illustrerer feilrepresentasjon gjennom visualiseringstriks. |
| **Illusjonen av fri vilje** | 2020 - Læringsappen [ABCmouse betalte $10M for å løse en FTC-klage](https://www.washingtonpost.com/business/2020/09/04/abcmouse-10-million-ftc-settlement/) der foreldre ble fanget i abonnementer de ikke kunne kansellere. Dette illustrerer mørke mønstre i valgarkitekturer, der brukere ble påvirket til potensielt skadelige valg. |
| **Datapersonvern og brukerrettigheter** | 2021 - Facebook [Data Breach](https://www.npr.org/2021/04/09/986005820/after-data-breach-exposes-530-million-facebook-says-it-will-not-notify-users) eksponerte data fra 530M brukere, noe som resulterte i et forlik på $5B med FTC. Det nektet imidlertid å varsle brukere om bruddet, og brøt brukerrettigheter rundt datatransparens og tilgang. |
Vil du utforske flere casestudier? Sjekk ut disse ressursene:
* [Ethics Unwrapped](https://ethicsunwrapped.utexas.edu/case-studies) - etiske dilemmaer på tvers av ulike bransjer.
* [Data Science Ethics-kurs](https://www.coursera.org/learn/data-science-ethics#syllabus) - utforsker viktige case-studier.
* [Hvor ting har gått galt](https://deon.drivendata.org/examples/) - deon-sjekkliste med eksempler.
* [Data Science Ethics course](https://www.coursera.org/learn/data-science-ethics#syllabus) - casestudier utforsket.
* [Where things have gone wrong](https://deon.drivendata.org/examples/) - deon-sjekkliste med eksempler.
> 🚨 Tenk på case-studiene du har sett har du opplevd, eller blitt påvirket av, en lignende etisk utfordring i ditt liv? Kan du komme på minst én annen case-studie som illustrerer en av de etiske utfordringene vi har diskutert i denne delen?
> 🚨 Tenk på casestudiene du har sett - har du opplevd, eller blitt påvirket av, en lignende etisk utfordring i ditt liv? Kan du komme på minst én annen casestudie som illustrerer en av de etiske utfordringene vi har diskutert i denne seksjonen?
## Anvendt etikk
Vi har snakket om etiske konsepter, utfordringer og case-studier i virkelighetsnære kontekster. Men hvordan kommer vi i gang med å _anvende_ etiske prinsipper og praksiser i prosjektene våre? Og hvordan kan vi _operasjonalisere_ disse praksisene for bedre styring? La oss utforske noen løsninger fra virkeligheten:
Vi har snakket om etiske konsepter, utfordringer og casestudier i virkelige kontekster. Men hvordan kommer vi i gang med å _anvende_ etiske prinsipper og praksiser i våre prosjekter? Og hvordan _operasjonaliserer_ vi disse praksisene for bedre styring? La oss utforske noen løsninger fra virkeligheten:
### 1. Profesjonelle retningslinjer
### 1. Profesjonelle koder
Profesjonelle retningslinjer tilbyr en måte for organisasjoner å "incentivere" medlemmer til å støtte deres etiske prinsipper og misjonserklæring. Retningslinjer er _moralske veiledninger_ for profesjonell atferd, som hjelper ansatte eller medlemmer med å ta beslutninger som samsvarer med organisasjonens prinsipper. De er kun effektive dersom medlemmene frivillig følger dem; mange organisasjoner tilbyr imidlertid belønninger og sanksjoner for å motivere etterlevelse.
Profesjonelle koder tilbyr en mulighet for organisasjoner til å "incentivere" medlemmer til å støtte deres etiske prinsipper og misjonserklæring. Koder er _moralske retningslinjer_ for profesjonell oppførsel, som hjelper ansatte eller medlemmer med å ta beslutninger som samsvarer med organisasjonens prinsipper. De er kun så gode som den frivillige etterlevelsen fra medlemmene; imidlertid tilbyr mange organisasjoner belønninger og straffer for å motivere etterlevelse.
Eksempler inkluderer:
@ -208,48 +209,49 @@ Eksempler inkluderer:
* [Data Science Association](http://datascienceassn.org/code-of-conduct.html) Code of Conduct (opprettet 2013)
* [ACM Code of Ethics and Professional Conduct](https://www.acm.org/code-of-ethics) (siden 1993)
> 🚨 Tilhører du en profesjonell ingeniør- eller dataorganisasjon? Utforsk nettsiden deres for å se om de definerer en profesjonell etikkodeks. Hva sier dette om deres etiske prinsipper? Hvordan "incentiverer" de medlemmene til å følge kodeksen?
> 🚨 Tilhører du en profesjonell ingeniør- eller dataorganisasjon? Utforsk deres nettsted for å se om de definerer en profesjonell etisk kode. Hva sier dette om deres etiske prinsipper? Hvordan "incentiverer" de medlemmene til å følge koden?
### 2. Etiske sjekklister
Mens profesjonelle retningslinjer definerer nødvendig _etisk atferd_ fra utøvere, har de [kjente begrensninger](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md) i håndhevelse, spesielt i storskala prosjekter. Mange eksperter innen datafag [foreslår sjekklister](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md) som kan **koble prinsipper til praksis** på mer deterministiske og handlingsrettede måter.
Mens profesjonelle koder definerer nødvendig _etisk oppførsel_ fra utøvere, har de [kjente begrensninger](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md) i håndheving, spesielt i storskala prosjekter. I stedet anbefaler mange dataeksperter [sjekklister](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md), som kan **koble prinsipper til praksis** på mer deterministiske og handlingsrettede måter.
Sjekklister omgjør spørsmål til "ja/nei"-oppgaver som kan operasjonaliseres, slik at de kan spores som en del av standard arbeidsflyter for produktlansering.
Sjekklister konverterer spørsmål til "ja/nei"-oppgaver som kan operasjonaliseres, slik at de kan spores som en del av standard produktutgivelsesarbeidsflyter.
Eksempler inkluderer:
* [Deon](https://deon.drivendata.org/) - en generell sjekkliste for dataetikk laget fra [bransjeanbefalinger](https://deon.drivendata.org/#checklist-citations) med et kommandolinjeverktøy for enkel integrasjon.
* [Privacy Audit Checklist](https://cyber.harvard.edu/ecommerce/privacyaudit.html) - gir generell veiledning for informasjonsbehandling fra juridiske og sosiale eksponeringsperspektiver.
* [AI Fairness Checklist](https://www.microsoft.com/en-us/research/project/ai-fairness-checklist/) - laget av AI-utøvere for å støtte adopsjon og integrasjon av rettferdighetssjekker i AI-utviklingssykluser.
* [22 spørsmål for etikk i data og AI](https://medium.com/the-organization/22-questions-for-ethics-in-data-and-ai-efb68fd19429) - en mer åpen ramme, strukturert for innledende utforskning av etiske problemstillinger i design, implementering og organisatoriske kontekster.
* [Deon](https://deon.drivendata.org/) - en generell sjekkliste for dataetikk opprettet fra [industrianbefalinger](https://deon.drivendata.org/#checklist-citations) med et kommandolinjeverktøy for enkel integrering.
* [Privacy Audit Checklist](https://cyber.harvard.edu/ecommerce/privacyaudit.html) - gir generell veiledning for informasjonsbehandlingspraksis fra juridiske og sosiale eksponeringsperspektiver.
* [AI Fairness Checklist](https://www.microsoft.com/en-us/research/project/ai-fairness-checklist/) - opprettet av AI-utøvere for å støtte adopsjon og integrering av rettferdighetssjekker i AI-utviklingssykluser.
* [22 spørsmål for etikk i data og AI](https://medium.com/the-organization/22-questions-for-ethics-in-data-and-ai-efb68fd19429) - en mer åpen rammeverk, strukturert for innledende utforskning av etiske spørsmål i design, implementering og organisatoriske kontekster.
### 3. Etiske reguleringer
Etikk handler om å definere felles verdier og gjøre det rette _frivillig_. **Etterlevelse** handler om _å følge loven_ der den er definert. **Styring** dekker bredt alle måtene organisasjoner opererer på for å håndheve etiske prinsipper og overholde etablerte lover.
Etikk handler om å definere felles verdier og gjøre det rette _frivillig_. **Etterlevelse** handler om _å følge loven_ der den er definert. **Styring** dekker bredt alle måter organisasjoner opererer for å håndheve etiske prinsipper og overholde etablerte lover.
I dag tar styring to former i organisasjoner. For det første handler det om å definere **etiske AI-prinsipper** og etablere praksiser for å operasjonalisere adopsjon på tvers av alle AI-relaterte prosjekter i organisasjonen. For det andre handler det om å overholde alle myndighetspålagte **databeskyttelsesreguleringer** for regionene de opererer i.
I dag tar styring to former innen organisasjoner. For det første handler det om å definere **etiske AI**-prinsipper og etablere praksiser for å operasjonalisere adopsjon på tvers av alle AI-relaterte prosjekter i organisasjonen. For det andre handler det om å overholde alle myndighetsmandaterte **databeskyttelsesreguleringer** for regionene de opererer i.
Eksempler på databeskyttelses- og personvernreguleringer:
Eksempler på databeskyttelse og personvernreguleringer:
* `1974`, [US Privacy Act](https://www.justice.gov/opcl/privacy-act-1974) - regulerer _føderal regjering_ sin innsamling, bruk og deling av personlig informasjon.
* `1974`, [US Privacy Act](https://www.justice.gov/opcl/privacy-act-1974) - regulerer _føderal regjering_ sin innsamling, bruk og offentliggjøring av personlig informasjon.
* `1996`, [US Health Insurance Portability & Accountability Act (HIPAA)](https://www.cdc.gov/phlp/publications/topic/hipaa.html) - beskytter personlig helsedata.
* `1998`, [US Children's Online Privacy Protection Act (COPPA)](https://www.ftc.gov/enforcement/rules/rulemaking-regulatory-reform-proceedings/childrens-online-privacy-protection-rule) - beskytter barns personvern under 13 år.
* `2018`, [General Data Protection Regulation (GDPR)](https://gdpr-info.eu/) - gir brukere rettigheter, databeskyttelse og personvern.
* `1998`, [US Children's Online Privacy Protection Act (COPPA)](https://www.ftc.gov/enforcement/rules/rulemaking-regulatory-reform-proceedings/childrens-online-privacy-protection-rule) - beskytter dataprivacy for barn under 13 år.
* `2018`, [General Data Protection Regulation (GDPR)](https://gdpr-info.eu/) - gir brukerrettigheter, databeskyttelse og personvern.
* `2018`, [California Consumer Privacy Act (CCPA)](https://www.oag.ca.gov/privacy/ccpa) gir forbrukere flere _rettigheter_ over deres (personlige) data.
* `2021`, Kinas [Personopplysningslov](https://www.reuters.com/world/china/china-passes-new-personal-data-privacy-law-take-effect-nov-1-2021-08-20/) ble nylig vedtatt og skaper en av verdens sterkeste personvernreguleringer på nett.
* `2021`, Kinas [Personal Information Protection Law](https://www.reuters.com/world/china/china-passes-new-personal-data-privacy-law-take-effect-nov-1-2021-08-20/) ble nettopp vedtatt, og skaper en av de sterkeste online dataprivacy-reguleringene i verden.
> 🚨 Den europeiske unionens GDPR (General Data Protection Regulation) forblir en av de mest innflytelsesrike dataprivacy-reguleringene i dag. Visste du at den også definerer [8 brukerrettigheter](https://www.freeprivacypolicy.com/blog/8-user-rights-gdpr) for å beskytte borgernes digitale personvern og personlige data? Lær om hva disse er, og hvorfor de er viktige.
> 🚨 Den europeiske unionens GDPR (General Data Protection Regulation) er fortsatt en av de mest innflytelsesrike personvernreguleringene i dag. Visste du at den også definerer [8 brukerrettigheter](https://www.freeprivacypolicy.com/blog/8-user-rights-gdpr) for å beskytte borgernes digitale personvern og personopplysninger? Lær om hva disse er, og hvorfor de er viktige.
### 4. Etisk kultur
Merk at det fortsatt er et immaterielt gap mellom _etterlevelse_ (å gjøre nok for å oppfylle "lovens bokstav") og å adressere [systemiske problemer](https://www.coursera.org/learn/data-science-ethics/home/week/4) (som fastlåsthet, informasjonsasymmetri og fordelingsmessig urettferdighet) som kan akselerere våpeniseringen av AI.
Merk at det fortsatt er et immaterielt gap mellom _etterlevelse_ (å gjøre nok for å møte "lovens bokstav") og å adressere [systemiske problemer](https://www.coursera.org/learn/data-science-ethics/home/week/4) (som ossifikasjon, informasjonsasymmetri og distribusjonsurettferdighet) som kan akselerere våpeniseringen av AI.
Det sistnevnte krever [samarbeidende tilnærminger for å definere etiske kulturer](https://towardsdatascience.com/why-ai-ethics-requires-a-culture-driven-approach-26f451afa29f) som bygger emosjonelle forbindelser og konsistente felles verdier _på tvers av organisasjoner_ i bransjen. Dette krever mer [formaliserte dataetiske kulturer](https://www.codeforamerica.org/news/formalizing-an-ethical-data-culture/) i organisasjoner som lar _hvem som helst_ [trekke Andon-snoren](https://en.wikipedia.org/wiki/Andon_(manufacturing)) (for å reise etiske bekymringer tidlig i prosessen) og gjør _etiske vurderinger_ (f.eks. i ansettelser) til et kjernekrav for teamdannelse i AI-prosjekter.
Det sistnevnte krever [samarbeidende tilnærminger for å definere etiske kulturer](https://towardsdatascience.com/why-ai-ethics-requires-a-culture-driven-approach-26f451afa29f) som bygger emosjonelle forbindelser og konsistente felles verdier _på tvers av organisasjoner_ i bransjen. Dette krever mer [formaliserte dataetiske kulturer](https://www.codeforamerica.org/news/formalizing-an-ethical-data-culture/) i organisasjoner - som lar _hvem som helst_ [trekke Andon-snoren](https://en.wikipedia.org/wiki/Andon_(manufacturing)) (for å reise etiske bekymringer tidlig i prosessen) og gjøre _etiske vurderinger_ (f.eks. ved ansettelser) til et kjernekrav for teamdannelse i AI-prosjekter.
---
## [Etterforelesningsquiz](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/3) 🎯
## [Quiz etter forelesning](https://ff-quizzes.netlify.app/en/ds/) 🎯
## Gjennomgang og selvstudium
Kurs og bøker hjelper med å forstå kjernebegreper og utfordringer innen etikk, mens case-studier og verktøy hjelper med anvendt etikk i virkelige kontekster. Her er noen ressurser for å komme i gang:
Kurs og bøker hjelper med å forstå kjernebegreper og utfordringer innen etikk, mens casestudier og verktøy hjelper med anvendt etikk i virkelige kontekster. Her er noen ressurser for å komme i gang.
* [Machine Learning For Beginners](https://github.com/microsoft/ML-For-Beginners/blob/main/1-Introduction/3-fairness/README.md) - leksjon om rettferdighet, fra Microsoft.
* [Prinsipper for ansvarlig AI](https://docs.microsoft.com/en-us/learn/modules/responsible-ai-principles/) - gratis læringssti fra Microsoft Learn.
@ -264,4 +266,4 @@ Kurs og bøker hjelper med å forstå kjernebegreper og utfordringer innen etikk
---
**Ansvarsfraskrivelse**:
Dette dokumentet er oversatt ved hjelp av AI-oversettelsestjenesten [Co-op Translator](https://github.com/Azure/co-op-translator). Selv om vi streber etter nøyaktighet, vær oppmerksom på at automatiske oversettelser kan inneholde feil eller unøyaktigheter. Det originale dokumentet på sitt opprinnelige språk bør anses som den autoritative kilden. For kritisk informasjon anbefales profesjonell menneskelig oversettelse. Vi er ikke ansvarlige for misforståelser eller feiltolkninger som oppstår ved bruk av denne oversettelsen.
Dette dokumentet er oversatt ved hjelp av AI-oversettelsestjenesten [Co-op Translator](https://github.com/Azure/co-op-translator). Selv om vi streber etter nøyaktighet, vær oppmerksom på at automatiserte oversettelser kan inneholde feil eller unøyaktigheter. Det originale dokumentet på sitt opprinnelige språk bør anses som den autoritative kilden. For kritisk informasjon anbefales profesjonell menneskelig oversettelse. Vi er ikke ansvarlige for misforståelser eller feiltolkninger som oppstår ved bruk av denne oversettelsen.

@ -1,13 +1,13 @@
<!--
CO_OP_TRANSLATOR_METADATA:
{
"original_hash": "8796f41f566a0a8ebb72863a83d558ed",
"translation_date": "2025-08-27T17:09:06+00:00",
"original_hash": "3a34157cc63516eba97c89a0b2f8c3e6",
"translation_date": "2025-09-03T21:14:37+00:00",
"source_file": "1-Introduction/02-ethics/README.md",
"language_code": "pa"
}
-->
# ਡਾਟਾ ਨੈਤਿਕਤਾ ਦਾ ਪਰਚੇ
# ਡਾਟਾ ਨੈਤਿਕਤਾ ਦਾ ਪਰਿਚਯ
|![ [(@sketchthedocs)](https://sketchthedocs.dev) ਦੁਆਰਾ ਬਣਾਈ ਗਈ ਸਕੈਚਨੋਟ ](../../sketchnotes/02-Ethics.png)|
|:---:|
@ -15,65 +15,40 @@ CO_OP_TRANSLATOR_METADATA:
---
ਅਸੀਂ ਸਾਰੇ ਡਾਟਾ ਦੇ ਨਾਗਰਿਕ ਹਾਂ ਜੋ ਇੱਕ ਡਾਟਾ-ਕੇਂਦ੍ਰਿਤ ਦੁਨੀਆ ਵਿੱਚ ਰਹਿੰਦੇ ਹਾਂ।
ਅਸੀਂ ਸਾਰੇ ਡਾਟਾ ਦੇ ਨਾਗਰਿਕ ਹਾਂ ਜੋ ਇੱਕ ਡਾਟਾ-ਕੇਂਦਰਤ ਦੁਨੀਆ ਵਿੱਚ ਰਹਿ ਰਹੇ ਹਾਂ।
ਬਾਜ਼ਾਰ ਦੇ ਰੁਝਾਨ ਦੱਸਦੇ ਹਨ ਕਿ 2022 ਤੱਕ, 1-ਵਿੱਚ-3 ਵੱਡੇ ਸੰਗਠਨ ਆਪਣਾ ਡਾਟਾ ਆਨਲਾਈਨ [ਬਾਜ਼ਾਰਾਂ ਅਤੇ ਐਕਸਚੇਂਜ](https://www.gartner.com/smarterwithgartner/gartner-top-10-trends-in-data-and-analytics-for-2020/) ਰਾਹੀਂ ਖਰੀਦਣ ਅਤੇ ਵੇਚਣਗ**ਐਪ ਡਿਵੈਲਪਰਾਂ** ਵਜੋਂ, ਸਾਨੂੰ ਡਾਟਾ-ਚਲਿਤ ਅੰਤਰਦ੍ਰਿਸ਼ਟੀ ਅਤੇ ਐਲਗੋਰਿਦਮ-ਚਲਿਤ ਆਟੋਮੇਸ਼ਨ ਨੂੰ ਰੋਜ਼ਾਨਾ ਉਪਭੋਗਤਾ ਅਨੁਭਵਾਂ ਵਿੱਚ ਸ਼ਾਮਲ ਕਰਨਾ ਆਸਾਨ ਅਤੇ ਸਸਤਾ ਲੱਗੇਗਾ। ਪਰ ਜਿਵੇਂ ਕਿ AI ਹਰ ਜਗ੍ਹਾ ਹੋ ਰਿਹਾ ਹੈ, ਸਾਨੂੰ ਇਹ ਵੀ ਸਮਝਣ ਦੀ ਲੋੜ ਹੋਵੇਗੀ ਕਿ [ਇਨ੍ਹਾਂ ਐਲਗੋਰਿਦਮਾਂ](https://www.youtube.com/watch?v=TQHs8SA1qpk) ਦੇ ਵੱਡੇ ਪੱਧਰ 'ਤੇ ਹਥਿਆਰਕਰਨ ਨਾਲ ਕੀ ਸੰਭਾਵਿਤ ਨੁਕਸਾਨ ਹੋ ਸਕਦੇ ਹਨ।
ਬਾਜ਼ਾਰ ਦੇ ਰੁਝਾਨ ਦੱਸਦੇ ਹਨ ਕਿ 2022 ਤੱਕ, 1-ਵਿੱਚ-3 ਵੱਡੀਆਂ ਸੰਸਥਾਵਾਂ ਆਪਣਾ ਡਾਟਾ ਆਨਲਾਈਨ [ਬਾਜ਼ਾਰਾਂ ਅਤੇ ਐਕਸਚੇਂਜਾਂ](https://www.gartner.com/smarterwithgartner/gartner-top-10-trends-in-data-and-analytics-for-2020/) ਰਾਹੀਂ ਖਰੀਦਣ ਅਤੇ ਵੇਚਣਗੀਆਂ**ਐਪ ਡਿਵੈਲਪਰਾਂ** ਵਜੋਂ, ਸਾਨੂੰ ਡਾਟਾ-ਚਲਿਤ ਅੰਦਰੂਨੀ ਜਾਣਕਾਰੀ ਅਤੇ ਐਲਗੋਰਿਦਮ-ਚਲਿਤ ਆਟੋਮੇਸ਼ਨ ਨੂੰ ਰੋਜ਼ਾਨਾ ਉਪਭੋਗਤਾ ਅਨੁਭਵਾਂ ਵਿੱਚ ਸ਼ਾਮਲ ਕਰਨਾ ਆਸਾਨ ਅਤੇ ਸਸਤਾ ਲੱਗੇਗਾ। ਪਰ ਜਿਵੇਂ ਜਿਵੇਂ AI ਹਰ ਜਗ੍ਹਾ ਫੈਲ ਰਿਹਾ ਹੈ, ਸਾਨੂੰ ਇਹ ਵੀ ਸਮਝਣ ਦੀ ਲੋੜ ਹੋਵੇਗੀ ਕਿ ਇਸ ਤਰ੍ਹਾਂ ਦੇ ਐਲਗੋਰਿਦਮਾਂ ਦੇ ਵੱਡੇ ਪੱਧਰ 'ਤੇ [ਹਥਿਆਰਕਰਨ](https://www.youtube.com/watch?v=TQHs8SA1qpk) ਨਾਲ ਕੀ ਸੰਭਾਵਿਤ ਨੁਕਸਾਨ ਹੋ ਸਕਦੇ ਹਨ।
ਰੁਝਾਨ ਇਹ ਵੀ ਦਰਸਾਉਂਦੇ ਹਨ ਕਿ 2025 ਤੱਕ ਅਸੀਂ [180 ਜੈਟਾਬਾਈਟ](https://www.statista.com/statistics/871513/worldwide-data-created/) ਤੋਂ ਵੱਧ ਡਾਟਾ ਬਣਾਉਣ ਅਤੇ ਖਪਤ ਕਰਨਗੇ। **ਡਾਟਾ ਸਾਇੰਟਿਸਟਾਂ** ਵਜੋਂ, ਇਹ ਸਾਨੂੰ ਵਿਅਕਤੀਗਤ ਡਾਟਾ ਤੱਕ ਬੇਮਿਸਾਲ ਪਹੁੰਚ ਦਿੰਦਾ ਹੈ। ਇਸਦਾ ਮਤਲਬ ਹੈ ਕਿ ਅਸੀਂ ਉਪਭੋਗਤਾਵਾਂ ਦੇ ਵਿਵਹਾਰਕ ਪ੍ਰੋਫਾਈਲ ਬਣਾਉਣ ਅਤੇ ਫੈਸਲੇ ਕਰਨ ਵਿੱਚ ਪ੍ਰਭਾਵ ਪਾਉਣ ਦੇ ਯੋਗ ਹੋ ਸਕਦੇ ਹਾਂ, ਜਿਸ ਨਾਲ [ਮੁਕਤ ਚੋਣ ਦਾ ਭਰਮ](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice) ਬਣ ਸਕਦਾ ਹੈ, ਜਦੋਂ ਕਿ ਸੰਭਾਵਿਤ ਤੌਰ 'ਤੇ ਉਪਭੋਗਤਾਵਾਂ ਨੂੰ ਉਹਨਾਂ ਨਤੀਜਿਆਂ ਵੱਲ ਧੱਕਿਆ ਜਾ ਸਕਦਾ ਹੈ ਜੋ ਅਸੀਂ ਪਸੰਦ ਕਰਦੇ ਹਾਂ। ਇਹ ਡਾਟਾ ਗੋਪਨੀਯਤਾ ਅਤੇ ਉਪਭੋਗਤਾ ਸੁਰੱਖਿਆ ਦੇ ਵਿਆਪਕ ਸਵਾਲ ਵੀ ਖੜ੍ਹੇ ਕਰਦਾ ਹੈ।
ਰੁਝਾਨ ਇਹ ਵੀ ਦਰਸਾਉਂਦੇ ਹਨ ਕਿ 2025 ਤੱਕ ਅਸੀਂ [180 ਜੈਟਾਬਾਈਟ](https://www.statista.com/statistics/871513/worldwide-data-created/) ਤੋਂ ਵੱਧ ਡਾਟਾ ਬਣਾਉਣ ਅਤੇ ਖਪਤ ਕਰਨਗੇ। **ਡਾਟਾ ਸਾਇੰਸਦਾਨਾਂ** ਵਜੋਂ, ਇਹ ਸਾਨੂੰ ਨਿੱਜੀ ਡਾਟਾ ਤੱਕ ਬੇਮਿਸਾਲ ਪਹੁੰਚ ਦਿੰਦਾ ਹੈ। ਇਸਦਾ ਮਤਲਬ ਹੈ ਕਿ ਅਸੀਂ ਉਪਭੋਗਤਾਵਾਂ ਦੇ ਵਿਵਹਾਰਕ ਪ੍ਰੋਫਾਈਲ ਬਣਾਉਣ ਅਤੇ ਫੈਸਲੇ ਕਰਨ ਵਿੱਚ ਪ੍ਰਭਾਵ ਪਾਉਣ ਦੇ ਯੋਗ ਹੋ ਸਕਦੇ ਹਾਂ, ਜਿਸ ਨਾਲ ਇੱਕ [ਮੁਕੰਮਲ ਚੋਣ ਦਾ ਭਰਮ](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice) ਬਣ ਸਕਦਾ ਹੈ, ਜਦੋਂਕਿ ਸੰਭਾਵਿਤ ਤੌਰ 'ਤੇ ਉਪਭੋਗਤਾਵਾਂ ਨੂੰ ਸਾਡੇ ਪਸੰਦੀਦਾ ਨਤੀਜਿਆਂ ਵੱਲ ਧੱਕਿਆ ਜਾ ਸਕਦਾ ਹੈ। ਇਹ ਡਾਟਾ ਗੋਪਨੀਯਤਾ ਅਤੇ ਉਪਭੋਗਤਾ ਸੁਰੱਖਿਆ ਬਾਰੇ ਵੱਡੇ ਸਵਾਲ ਵੀ ਖੜ੍ਹੇ ਕਰਦਾ ਹੈ।
ਡਾਟਾ ਨੈਤਿਕਤਾ ਹੁਣ ਡਾਟਾ ਸਾਇੰਸ ਅਤੇ ਇੰਜੀਨੀਅਰਿੰਗ ਲਈ _ਜ਼ਰੂਰੀ ਰੱਖਵਾਲ_ ਹਨ, ਜੋ ਸਾਡੇ ਡਾਟਾ-ਚਲਿਤ ਕਾਰਵਾਈਆਂ ਤੋਂ ਸੰਭਾਵਿਤ ਨੁਕਸਾਨ ਅਤੇ ਅਣਜਾਣੇ ਨਤੀਜਿਆਂ ਨੂੰ ਘਟਾਉਣ ਵਿੱਚ ਸਹਾਇਕ ਹਨ। [ਗਾਰਟਨਰ ਹਾਈਪ ਸਾਈਕਲ ਫਾਰ AI](https://www.gartner.com/smarterwithgartner/2-megatrends-dominate-the-gartner-hype-cycle-for-artificial-intelligence-2020/) ਡਿਜ਼ੀਟਲ ਨੈਤਿਕਤਾ, ਜ਼ਿੰਮੇਵਾਰ AI, ਅਤੇ AI ਗਵਰਨੈਂਸ ਵਿੱਚ ਸਬੰਧਤ ਰੁਝਾਨਾਂ ਨੂੰ ਵੱਡੇ ਮੈਗਾਟ੍ਰੈਂਡਸ ਲਈ ਮੁੱਖ ਚਾਲਕ ਵਜੋਂ ਪਛਾਣਦਾ ਹੈ, ਜਿਵੇਂ ਕਿ AI ਦੀ _ਲੋਕਤੰਤਰਤਾ_ ਅਤੇ _ਉਦਯੋਗੀਕਰਨ_
ਡਾਟਾ ਨੈਤਿਕਤਾ ਹੁਣ ਡਾਟਾ ਸਾਇੰਸ ਅਤੇ ਇੰਜੀਨੀਅਰਿੰਗ ਲਈ _ਲਾਜ਼ਮੀ ਸੁਰੱਖਿਆ ਰੇਲਾਂ_ ਹਨ, ਜੋ ਸਾਡੇ ਡਾਟਾ-ਚਲਿਤ ਕਾਰਵਾਈਆਂ ਤੋਂ ਸੰਭਾਵਿਤ ਨੁਕਸਾਨ ਅਤੇ ਅਣਚਾਹੇ ਨਤੀਜਿਆਂ ਨੂੰ ਘਟਾਉਣ ਵਿੱਚ ਸਹਾਇਕ ਹਨ। [ਗਾਰਟਨਰ ਹਾਈਪ ਸਾਈਕਲ ਫਾਰ AI](https://www.gartner.com/smarterwithgartner/2-megatrends-dominate-the-gartner-hype-cycle-for-artificial-intelligence-2020/) ਡਿਜ਼ੀਟਲ ਨੈਤਿਕਤਾ, ਜ਼ਿੰਮੇਵਾਰ AI, ਅਤੇ AI ਗਵਰਨੈਂਸ ਵਿੱਚ ਮਹੱਤਵਪੂਰਨ ਰੁਝਾਨਾਂ ਦੀ ਪਛਾਣ ਕਰਦਾ ਹੈ, ਜੋ AI ਦੀ _ਲੋਕਤੰਤਰਿਕਤਾ_ ਅਤੇ _ਉਦਯੋਗੀਕਰਨ_ ਦੇ ਵੱਡੇ ਰੁਝਾਨਾਂ ਲਈ ਮੁੱਖ ਚਾਲਕ ਹਨ
![ਗਾਰਟਨਰ ਦਾ AI ਲਈ ਹਾਈਪ ਸਾਈਕਲ - 2020](https://images-cdn.newscred.com/Zz1mOWJhNzlkNDA2ZTMxMWViYjRiOGFiM2IyMjQ1YmMwZQ==)
ਇਸ ਪਾਠ ਵਿੱਚ, ਅਸੀਂ ਡਾਟਾ ਨੈਤਿਕਤਾ ਦੇ ਦਿਲਚਸਪ ਖੇਤਰ ਦੀ ਪੜਚੋਲ ਕਰਾਂਗੇ - ਮੁੱਖ ਧਾਰਨਾਵਾਂ ਅਤੇ ਚੁਣੌਤੀਆਂ ਤੋਂ ਲੈ ਕੇ ਕੇਸ ਸਟੱਡੀਜ਼ ਅਤੇ ਲਾਗੂ ਕੀਤੇ AI ਧਾਰਨਾਵਾਂ ਜਿਵੇਂ ਕਿ ਗਵਰਨੈਂਸ - ਜੋ ਡਾਟਾ ਅਤੇ AI ਨਾਲ ਕੰਮ ਕਰਨ ਵਾਲੀਆਂ ਟੀਮਾਂ ਅਤੇ ਸੰਗਠਨਾਂ ਵਿੱਚ ਨੈਤਿਕਤਾ ਦੀ ਸੰਸਕ੍ਰਿਤੀ ਸਥਾਪਤ ਕਰਨ ਵਿੱਚ ਸਹਾਇਕ ਹਨ।
ਇਸ ਪਾਠ ਵਿੱਚ, ਅਸੀਂ ਡਾਟਾ ਨੈਤਿਕਤਾ ਦੇ ਰੋਮਾਂਚਕ ਖੇਤਰ ਦੀ ਪੜਚੋਲ ਕਰਾਂਗੇ - ਮੁੱਖ ਧਾਰਨਾਵਾਂ ਅਤੇ ਚੁਣੌਤੀਆਂ ਤੋਂ ਲੈ ਕੇ ਕੇਸ ਅਧਿਐਨ ਅਤੇ ਲਾਗੂ ਕੀਤੇ ਗਏ AI ਸੰਕਲਪਾਂ ਤੱਕ ਜਿਵੇਂ ਕਿ ਗਵਰਨੈਂਸ - ਜੋ ਡਾਟਾ ਅਤੇ AI ਨਾਲ ਕੰਮ ਕਰਨ ਵਾਲੀਆਂ ਟੀਮਾਂ ਅਤੇ ਸੰਸਥਾਵਾਂ ਵਿੱਚ ਨੈਤਿਕਤਾ ਦੀ ਸੰਸਕ੍ਰਿਤੀ ਸਥਾਪਿਤ ਕਰਨ ਵਿੱਚ ਸਹਾਇਕ ਹਨ।
## [ਪ੍ਰੀ-ਲੈਕਚਰ ਕਵਿਜ਼](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/2) 🎯
## ਮੁੱਢਲੀ ਪਰਿਭਾਸ਼ਾਵਾਂ
ਆਓ ਮੁੱਢਲੀ ਸ਼ਬਦਾਵਲੀ ਨੂੰ ਸਮਝਣ ਨਾਲ ਸ਼ੁਰੂ ਕਰੀਏ।
"ਨੈਤਿਕਤਾ" ਸ਼ਬਦ [ਯੂਨਾਨੀ ਸ਼ਬਦ "ethikos"](https://en.wikipedia.org/wiki/Ethics) (ਅਤੇ ਇਸਦੀ ਜੜ "ethos") ਤੋਂ ਆਉਂਦਾ ਹੈ, ਜਿਸਦਾ ਅਰਥ ਹੈ _ਚਰਿੱਤਰ ਜਾਂ ਨੈਤਿਕ ਪ੍ਰਕਿਰਤੀ_
**ਨੈਤਿਕਤਾ** ਉਹ ਸਾਂਝੇ ਮੁੱਲ ਅਤੇ ਨੈਤਿਕ ਸਿਧਾਂਤ ਹਨ ਜੋ ਸਮਾਜ ਵਿੱਚ ਸਾਡੇ ਵਿਵਹਾਰ ਨੂੰ ਨਿਰਧਾਰਤ ਕਰਦੇ ਹਨ। ਨੈਤਿਕਤਾ ਕਾਨੂੰਨਾਂ 'ਤੇ ਨਹੀਂ, ਸਗੋਂ ਇਸ ਗੱਲ 'ਤੇ ਆਧਾਰਿਤ ਹੈ ਕਿ ਕੀ "ਸਹੀ ਵਿਰੁੱਧ ਗਲਤ" ਹੈ। ਹਾਲਾਂਕਿ, ਨੈਤਿਕ ਵਿਚਾਰ ਕਾਰਪੋਰੇਟ ਗਵਰਨੈਂਸ ਪਹਲਾਂ ਅਤੇ ਸਰਕਾਰੀ ਨਿਯਮਾਂ ਨੂੰ ਪ੍ਰਭਾਵਿਤ ਕਰ ਸਕਦੇ ਹਨ ਜੋ ਅਧਿਕਤਮ ਪਾਲਣਾ ਲਈ ਹੋਰ ਪ੍ਰੇਰਨਾ ਪੈਦਾ ਕਰਦੇ ਹਨ।
**ਡਾਟਾ ਨੈਤਿਕਤਾ** ਇੱਕ [ਨਵਾਂ ਨੈਤਿਕਤਾ ਦਾ ਸ਼ਾਖਾ](https://royalsocietypublishing.org/doi/full/10.1098/rsta.2016.0360#sec-1) ਹੈ ਜੋ "_ਡਾਟਾ, ਐਲਗੋਰਿਦਮ ਅਤੇ ਸੰਬੰਧਿਤ ਅਭਿਆਸਾਂ_" ਨਾਲ ਸੰਬੰਧਿਤ ਨੈਤਿਕ ਸਮੱਸਿਆਵਾਂ ਦਾ ਅਧਿਐਨ ਅਤੇ ਮੁਲਾਂਕਣ ਕਰਦਾ ਹੈ। ਇੱਥੇ, **"ਡਾਟਾ"** ਜਨਰੇਸ਼ਨ, ਰਿਕਾਰਡਿੰਗ, ਕਿਊਰੇਸ਼ਨ, ਪ੍ਰੋਸੈਸਿੰਗ, ਪ੍ਰਸਾਰਣ, ਸਾਂਝਾ ਕਰਨ ਅਤੇ ਵਰਤਣ ਨਾਲ ਸੰਬੰਧਿਤ ਕਾਰਵਾਈਆਂ 'ਤੇ ਧਿਆਨ ਦਿੰਦਾ ਹੈ, **"ਐਲਗੋਰਿਦਮ"** AI, ਏਜੰਟ, ਮਸ਼ੀਨ ਲਰਨਿੰਗ ਅਤੇ ਰੋਬੋਟ 'ਤੇ ਧਿਆਨ ਦਿੰਦਾ ਹੈ, ਅਤੇ **"ਅਭਿਆਸ"** ਜ਼ਿੰਮੇਵਾਰ ਨਵੀਨਤਾ, ਪ੍ਰੋਗਰਾਮਿੰਗ, ਹੈਕਿੰਗ ਅਤੇ ਨੈਤਿਕਤਾ ਕੋਡ ਜਿਵੇਂ ਵਿਸ਼ਿਆਂ 'ਤੇ ਧਿਆਨ ਦਿੰਦਾ ਹੈ।
**ਲਾਗੂ ਨੈਤਿਕਤਾ** [ਨੈਤਿਕ ਵਿਚਾਰਾਂ ਦੀ ਵਿਵਹਾਰਕ ਲਾਗੂ](https://en.wikipedia.org/wiki/Applied_ethics) ਹੈ। ਇਹ _ਅਸਲ ਦੁਨੀਆ ਦੇ ਕਾਰਵਾਈਆਂ, ਉਤਪਾਦ ਅਤੇ ਪ੍ਰਕਿਰਿਆਵਾਂ_ ਦੇ ਸੰਦਰਭ ਵਿੱਚ ਨੈਤਿਕ ਸਮੱਸਿਆਵਾਂ ਦੀ ਸਰਗਰਮ ਜਾਂਚ ਕਰਨ ਦੀ ਪ੍ਰਕਿਰਿਆ ਹੈ, ਅਤੇ ਇਹ ਯਕੀਨੀ ਬਣਾਉਣ ਲਈ ਸਹੀ ਕਦਮ ਲੈਣ ਦੀ ਪ੍ਰਕਿਰਿਆ ਹੈ ਕਿ ਇਹ ਸਾਡੇ ਨਿਰਧਾਰਤ ਨੈਤਿਕ ਮੁੱਲਾਂ ਨਾਲ ਸੰਗਤ ਰਹੇ।
**ਨੈਤਿਕਤਾ ਦੀ ਸੰਸਕ੍ਰਿਤੀ** [_ਲਾਗੂ ਨੈਤਿਕਤਾ ਨੂੰ ਕਾਰਗਰ ਬਣਾਉਣ](https://hbr.org/2019/05/how-to-design-an-ethical-organization) ਬਾਰੇ ਹੈ, ਇਹ ਯਕੀਨੀ ਬਣਾਉਣ ਲਈ ਕਿ ਸਾਡੇ ਨੈਤਿਕ ਸਿਧਾਂਤ ਅਤੇ ਅਭਿਆਸ ਸੰਗਠਨ ਦੇ ਹਰ ਪੱਧਰ 'ਤੇ ਲਗਾਤਾਰ ਅਤੇ ਵਿਆਪਕ ਤਰੀਕੇ ਨਾਲ ਅਪਨਾਏ ਜਾਂਦੇ ਹਨ। ਸਫਲ ਨੈਤਿਕਤਾ ਦੀਆਂ ਸੰਸਕ੍ਰਿਤੀਆਂ ਸੰਗਠਨ-ਵਿਆਪਕ ਨੈਤਿਕ ਸਿਧਾਂਤਾਂ ਨੂੰ ਨਿਰਧਾਰਤ ਕਰਦੀਆਂ ਹਨ, ਪਾਲਣਾ ਲਈ ਅਰਥਪੂਰਨ ਪ੍ਰੇਰਨਾ ਪ੍ਰਦਾਨ ਕਰਦੀਆਂ ਹਨ, ਅਤੇ ਹਰ ਪੱਧਰ 'ਤੇ ਚਾਹੀਦੇ ਵਿਵਹਾਰਾਂ ਨੂੰ ਉਤਸ਼ਾਹਿਤ ਅਤੇ ਵਧਾ ਕੇ ਨੈਤਿਕ ਨਿਯਮਾਂ ਨੂੰ ਮਜ਼ਬੂਤ ਕਰਦੀਆਂ ਹਨ।
## ਨੈਤਿਕਤਾ ਦੇ ਧਾਰਨਾਵਾਂ
ਇਸ ਭਾਗ ਵਿੱਚ, ਅਸੀਂ **ਸਾਂਝੇ ਮੁੱਲ** (ਸਿਧਾਂਤ) ਅਤੇ **ਨੈਤਿਕ ਚੁਣੌਤੀਆਂ** (ਸਮੱਸਿਆਵਾਂ) ਜਿਵੇਂ ਡਾਟਾ ਨੈਤਿਕਤਾ ਦੇ ਧਾਰਨਾਵਾਂ 'ਤੇ ਚਰਚਾ ਕਰਾਂਗੇ - ਅਤੇ **ਕੇਸ ਸਟੱਡੀਜ਼** ਦੀ ਪੜਚੋਲ ਕਰਾਂਗੇ ਜੋ ਤੁਹਾਨੂੰ ਅਸਲ ਦੁਨੀਆ ਦੇ ਸੰਦਰਭਾਂ ਵਿੱਚ ਇਹ ਧਾਰਨਾਵਾਂ ਸਮਝਣ ਵਿੱਚ ਮਦਦ ਕਰਦੀਆਂ ਹਨ।
### 1. ਨੈਤਿਕ ਸਿਧਾਂਤ
## [ਪ੍ਰੀ-ਲੈਕਚਰ ਕਵਿਜ਼](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/2) 🎯
ਹਰ ਡਾਟਾ ਨੈਤਿਕਤਾ ਰਣਨੀਤੀ ਦੀ ਸ਼ੁਰੂਆਤ _ਨੈਤਿਕ ਸਿਧਾਂਤਾਂ_ ਨੂੰ ਨਿਰਧਾਰਤ ਕਰਨ ਨਾਲ ਹੁੰਦੀ ਹੈ - "ਸਾਂਝੇ ਮੁੱਲ" ਜੋ ਸਵੀਕਾਰਯੋਗ ਵਿਵਹਾਰਾਂ ਦਾ ਵਰਣਨ ਕਰਦੇ ਹਨ, ਅਤੇ ਸਾਡੇ ਡਾਟਾ ਅਤੇ AI ਪ੍ਰਾਜੈਕਟਾਂ ਵਿੱਚ ਪਾਲਣਾ ਕਰਨ ਵਾਲੇ ਕਾਰਵਾਈਆਂ ਨੂੰ ਮਾਰਗਦਰਸ਼ਨ ਦਿੰਦੇ ਹਨ। ਤੁਸੀਂ ਇਹਨਾਂ ਨੂੰ ਵਿਅਕਤੀਗਤ ਜਾਂ ਟੀਮ ਪੱਧਰ 'ਤੇ ਨਿਰਧਾਰਤ ਕਰ ਸਕਦੇ ਹੋ। ਹਾਲਾਂਕਿ, ਜ਼ਿਆਦਾਤਰ ਵੱਡੇ ਸੰਗਠਨ ਇਹਨਾਂ ਨੂੰ ਇੱਕ _ਨੈਤਿਕ AI_ ਮਿਸ਼ਨ ਸਟੇਟਮੈਂਟ ਜਾਂ ਫਰੇਮਵਰਕ ਵਿੱਚ ਰੂਪਾਂਤਰਿਤ ਕਰਦੇ ਹਨ ਜੋ ਕਾਰਪੋਰੇਟ ਪੱਧਰ 'ਤੇ ਨਿਰਧਾਰਤ ਹੁੰਦਾ ਹੈ ਅਤੇ ਸਾਰੀਆਂ ਟੀਮਾਂ ਵਿੱਚ ਲਗਾਤਾਰ ਲਾਗੂ ਕੀਤਾ ਜਾਂਦਾ ਹੈ।
## ਮੁੱਢਲੇ ਪਰਿਭਾਸ਼ਾਵਾਂ
**ਉਦਾਹਰਨ:** ਮਾਈਕਰੋਸਾਫਟ ਦਾ [ਜ਼ਿੰਮੇਵਾਰ AI](https://www.microsoft.com/en-us/ai/responsible-ai) ਮਿਸ਼ਨ ਸਟੇਟਮੈਂਟ ਕਹਿੰਦਾ ਹੈ: _"ਅਸੀਂ AI ਦੇ ਅਗਾਂਹ ਵਧਾਉਣ ਲਈ ਵਚਨਬੱਧ ਹਾਂ ਜੋ ਨੈਤਿਕ ਸਿਧਾਂਤਾਂ ਦੁਆਰਾ ਚਲਾਇਆ ਜਾਂਦਾ ਹੈ ਜੋ ਲੋਕਾਂ ਨੂੰ ਪਹਿਲਾਂ ਰੱਖਦਾ ਹੈ"_ - ਹੇਠਾਂ ਦਿੱਤੇ ਫਰੇਮਵਰਕ ਵਿੱਚ 6 ਨੈਤਿਕ ਸਿਧਾਂਤਾਂ ਦੀ ਪਛਾਣ ਕਰਦਾ ਹੈ:
ਆਓ ਮੁੱਢਲੇ ਸ਼ਬਦਾਵਲੀ ਨੂੰ ਸਮਝਣ ਨਾਲ ਸ਼ੁਰੂ ਕਰੀਏ।
![ਮਾਈਕਰੋਸਾਫਟ ਵਿੱਚ ਜ਼ਿੰਮੇਵਾਰ AI](https://docs.microsoft.com/en-gb/azure/cognitive-services/personalizer/media/ethics-and-responsible-use/ai-values-future-computed.png)
"ਨੈਤਿਕਤਾ" ਸ਼ਬਦ [ਯੂਨਾਨੀ ਸ਼ਬਦ "ਐਥਿਕੋਸ"](https://en.wikipedia.org/wiki/Ethics) (ਅਤੇ ਇਸਦੀ ਜੜ੍ਹ "ਐਥੋਸ") ਤੋਂ ਆਉਂਦਾ ਹੈ, ਜਿਸਦਾ ਅਰਥ ਹੈ _ਚਰਿੱਤਰ ਜਾਂ ਨੈਤਿਕ ਪ੍ਰਕਿਰਤੀ_
ਆਓ ਇਨ੍ਹਾਂ ਸਿਧਾਂਤਾਂ ਦੀ ਸੰਖੇਪ ਵਿੱਚ ਪੜਚੋਲ ਕਰੀਏ। _ਪਾਰਦਰਸ਼ਤਾ_ ਅਤੇ _ਜਵਾਬਦੇਹੀ_ ਮੁੱਢਲੇ ਮੁੱਲ ਹਨ ਜਿਨ੍ਹਾਂ 'ਤੇ ਹੋਰ ਸਿਧਾਂਤ ਬਣੇ ਹਨ - ਇਸ ਲਈ ਆਓ ਇੱਥੇ ਸ਼ੁਰੂ ਕਰੀਏ:
**ਨੈਤਿਕਤਾ** ਉਹ ਸਾਂਝੇ ਮੁੱਲ ਅਤੇ ਨੈਤਿਕ ਸਿਧਾਂਤ ਹਨ ਜੋ ਸਮਾਜ ਵਿੱਚ ਸਾਡੇ ਵਿਵਹਾਰ ਨੂੰ ਨਿਯੰਤਰਿਤ ਕਰਦੇ ਹਨ। ਨੈਤਿਕਤਾ ਕਾਨੂੰਨਾਂ 'ਤੇ ਨਹੀਂ, ਸਗੋਂ ਇਸ ਗੱਲ 'ਤੇ ਆਧਾਰਿਤ ਹੈ ਕਿ ਕੀ "ਸਹੀ ਅਤੇ ਗਲਤ" ਹੈ। ਹਾਲਾਂਕਿ, ਨੈਤਿਕ ਵਿਚਾਰਨ ਕਾਰਪੋਰੇਟ ਗਵਰਨੈਂਸ ਪਹਲਾਂ ਅਤੇ ਸਰਕਾਰੀ ਨਿਯਮਾਂ ਨੂੰ ਪ੍ਰਭਾਵਿਤ ਕਰ ਸਕਦੇ ਹਨ ਜੋ ਅਨੁਕੂਲਤਾ ਲਈ ਹੋਰ ਪ੍ਰੇਰਣਾ ਪੈਦਾ ਕਰਦੇ ਹਨ।
* [**ਜਵਾਬਦੇਹੀ**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) ਪੇਸ਼ੇਵਰਾਂ ਨੂੰ ਆਪਣੇ ਡਾਟਾ ਅਤੇ AI ਕਾਰਵਾਈਆਂ ਲਈ, ਅਤੇ ਇਨ੍ਹਾਂ ਨੈਤਿਕ ਸਿਧਾਂਤਾਂ ਦੀ ਪਾਲਣਾ ਲਈ _ਜਵਾਬਦੇਹ_ ਬਣਾਉਂਦੀ ਹੈ।
* [**ਪਾਰਦਰਸ਼ਤਾ**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) ਇਹ ਯਕੀਨੀ ਬਣਾਉਂਦੀ ਹੈ ਕਿ ਡਾਟਾ ਅਤੇ AI ਕਾਰਵਾਈਆਂ ਉਪਭੋਗਤਾਵਾਂ ਲਈ _ਸਮਝਣਯੋਗ_ ਹਨ, ਫੈਸਲਿਆਂ ਦੇ ਪਿੱਛੇ ਕੀ ਅਤੇ ਕਿਉਂ ਦੀ ਵਿਆਖਿਆ ਕਰਦੀਆਂ ਹਨ।
* [**ਨਿਆਂ**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1%3aprimaryr6) - ਇਹ ਯਕੀਨੀ ਬਣਾਉਣ 'ਤੇ ਧਿਆਨ ਦਿੰਦਾ ਹੈ ਕਿ AI _ਸਾਰੇ ਲੋਕਾਂ_ ਨਾਲ ਨਿਆਂ ਕਰਦਾ ਹੈ, ਡਾਟਾ ਅਤੇ ਸਿਸਟਮਾਂ ਵਿੱਚ ਕਿਸੇ ਵੀ ਪ੍ਰਣਾਲੀਕ ਜਾਂ ਅਸਪਸ਼ਟ ਸਮਾਜ-ਤਕਨੀਕੀ ਪੱਖਪਾਤ ਨੂੰ ਹਟਾਉਂਦਾ ਹੈ।
* [**ਭਰੋਸੇਯੋਗਤਾ ਅਤੇ ਸੁਰੱਖਿਆ**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - ਇਹ ਯਕੀਨੀ ਬਣਾਉਂਦੀ ਹੈ ਕਿ AI _ਲਗਾਤਾਰ_ ਨਿਰਧਾਰਤ ਮੁੱਲਾਂ ਨਾਲ ਵਿਵਹਾਰ ਕਰਦਾ ਹੈ, ਸੰਭਾਵਿਤ ਨੁਕਸਾਨ ਜਾਂ ਅਣਜਾਣੇ ਨਤੀਜਿਆਂ ਨੂੰ ਘਟਾਉਂਦਾ ਹੈ।
* [**ਗੋਪਨੀਯਤਾ ਅਤੇ ਸੁਰੱਖਿਆ**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - ਇਹ ਡਾਟਾ ਦੀ ਲੀਨਿਏਜ ਨੂੰ ਸਮਝਣ ਅਤੇ ਉਪਭੋਗਤਾਵਾਂ ਨੂੰ _ਡਾਟਾ ਗੋਪਨੀਯਤਾ ਅਤੇ ਸੰਬੰਧਿਤ ਸੁਰੱਖਿਆ_ ਪ੍ਰਦਾਨ ਕਰਨ ਬਾਰੇ ਹੈ।
* [**ਸਮਾਵੇਸ਼ਤਾ**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - ਇਹ ਇਰਾਦੇ ਨਾਲ AI ਹੱਲਾਂ ਨੂੰ ਡਿਜ਼ਾਈਨ ਕਰਨ ਬਾਰੇ ਹੈ, ਇਹਨਾਂ ਨੂੰ _ਵਿਆਪਕ ਮਨੁੱਖੀ ਜ਼ਰੂਰਤਾਂ_ ਅਤੇ ਯੋਗਤਾਵਾਂ ਨੂੰ ਪੂਰਾ ਕਰਨ ਲਈ ਅਨੁਕੂਲ ਬਣਾਉਂਦਾ ਹੈ।
**ਡਾਟਾ ਨੈਤਿਕਤਾ** ਨੈਤਿਕਤਾ ਦੀ ਇੱਕ [ਨਵੀਂ ਸ਼ਾਖਾ](https://royalsocietypublishing.org/doi/full/10.1098/rsta.2016.0360#sec-1) ਹੈ ਜੋ "_ਡਾਟਾ, ਐਲਗੋਰਿਦਮ ਅਤੇ ਸੰਬੰਧਤ ਅਭਿਆਸਾਂ_" ਨਾਲ ਜੁੜੀਆਂ ਨੈਤਿਕ ਸਮੱਸਿਆਵਾਂ ਦਾ ਅਧਿਐਨ ਅਤੇ ਮੁਲਾਂਕਣ ਕਰਦੀ ਹੈ। ਇੱਥੇ, **"ਡਾਟਾ"** ਜਨਰੇਸ਼ਨ, ਰਿਕਾਰਡਿੰਗ, ਕੁਰੇਸ਼ਨ, ਪ੍ਰੋਸੈਸਿੰਗ, ਪ੍ਰਸਾਰਣ, ਸਾਂਝਾ ਕਰਨ ਅਤੇ ਵਰਤਣ ਨਾਲ ਜੁੜੇ ਕਾਰਵਾਈਆਂ 'ਤੇ ਧਿਆਨ ਕੇਂਦਰਿਤ ਕਰਦਾ ਹੈ; **"ਐਲਗੋਰਿਦਮ"** AI, ਏਜੰਟ, ਮਸ਼ੀਨ ਲਰਨਿੰਗ ਅਤੇ ਰੋਬੋਟਾਂ 'ਤੇ ਧਿਆਨ ਦਿੰਦੇ ਹਨ; ਅਤੇ **"ਅਭਿਆਸ"** ਜ਼ਿੰਮੇਵਾਰ ਨਵੀਨਤਾ, ਪ੍ਰੋਗਰਾਮਿੰਗ, ਹੈਕਿੰਗ ਅਤੇ ਨੈਤਿਕ ਕੋਡਾਂ ਵਰਗੇ ਵਿਸ਼ਿਆਂ 'ਤੇ ਧਿਆਨ ਦਿੰਦੇ ਹਨ।
> 🚨 ਸੋਚੋ ਕਿ ਤੁਹਾਡਾ ਡਾਟਾ ਨੈਤਿਕਤਾ ਮਿਸ਼ਨ ਸਟੇਟਮੈਂਟ ਕੀ ਹੋ ਸਕਦਾ ਹੈ। ਹੋਰ ਸੰਗਠਨਾਂ ਦੇ ਨੈਤਿਕ AI ਫਰੇਮਵਰਕ ਦੀ ਪੜਚੋਲ ਕਰੋ - ਇੱਥੇ [IBM](https://www.ibm.com/cloud/learn/ai-ethics), [Google](https://ai.google/principles), ਅਤੇ [Facebook](https://ai.facebook.com/blog/facebooks-five-pillars-of-responsible-ai/) ਦੇ ਉਦਾਹਰਨ ਹਨ। ਉਹਨਾਂ ਦੇ ਸਾਂਝੇ ਮੁੱਲ ਕੀ ਹਨ? ਇਹ ਸਿਧਾਂਤ ਉਹਨਾਂ ਦੇ AI ਉਤਪਾਦ ਜਾਂ ਉਦਯੋਗ ਨਾਲ ਕਿਵੇਂ ਸੰਬੰਧਿਤ ਹਨ?
**ਲਾਗੂ ਨੈਤਿਕਤਾ** ਨੈਤਿਕ ਵਿਚਾਰਾਂ ਦੀ [ਵਿਆਵਹਾਰਿਕ ਲਾਗੂ](https://en.wikipedia.org/wiki/Applied_ethics) ਹੈ। ਇਹ _ਅਸਲ ਦੁਨੀਆ ਦੇ ਕਾਰਵਾਈਆਂ, ਉਤਪਾਦਾਂ ਅਤੇ ਪ੍ਰਕਿਰਿਆਵਾਂ_ ਦੇ ਸੰਦਰਭ ਵਿੱਚ ਨੈਤਿਕ ਮੁੱਦਿਆਂ ਦੀ ਸਰਗਰਮ ਜਾਂਚ ਕਰਨ ਦੀ ਪ੍ਰਕਿਰਿਆ ਹੈ ਅਤੇ ਇਹ ਯਕੀਨੀ ਬਣਾਉਣ ਲਈ ਸਹੀ ਕਦਮ ਚੁੱਕਣ ਦੀ ਪ੍ਰਕਿਰਿਆ ਹੈ ਕਿ ਇਹ ਸਾਡੇ ਪਰਿਭਾਸ਼ਿਤ ਨੈਤਿਕ ਮੁੱਲਾਂ ਨਾਲ ਸੰਗਤ ਰਹੇ।
### 2. ਨੈਤਿਕ ਚੁਣੌਤੀਆਂ
**ਨੈਤਿਕਤਾ ਦੀ ਸੰਸਕ੍ਰਿਤੀ** [_ਲਾਗੂ ਨੈਤਿਕਤਾ ਨੂੰ ਕਾਰਜਨਵੀਂ ਬਣਾਉਣ_](https://hbr.org/2019/05/how-to-design-an-ethical-organization) ਬਾਰੇ ਹੈ ਤਾਂ ਜੋ ਇਹ ਯਕੀਨੀ ਬਣਾਇਆ ਜਾ ਸਕੇ ਕਿ ਸਾਡੇ ਨੈਤਿਕ ਸਿਧਾਂਤ ਅਤੇ ਅਭਿਆਸ ਸਾਰੀ ਸੰਸਥਾ ਵਿੱਚ ਲਗਾਤਾਰ ਅਤੇ ਸਕੇਲਯੋਗ ਢੰਗ ਨਾਲ ਅਪਨਾਏ ਗਏ ਹਨ। ਸਫਲ ਨੈਤਿਕਤਾ ਦੀਆਂ ਸੰਸਕ੍ਰਿਤੀਆਂ ਸੰਸਥਾ-ਵਿਆਪੀ ਨੈਤਿਕ ਸਿਧਾਂਤਾਂ ਨੂੰ ਪਰਿਭਾਸ਼ਿਤ ਕਰਦੀਆਂ ਹਨ, ਅਨੁਕੂਲਤਾ ਲਈ ਅਰਥਪੂਰਨ ਪ੍ਰੇਰਣਾ ਪ੍ਰਦਾਨ ਕਰਦੀਆਂ ਹਨ, ਅਤੇ ਹਰ ਪੱਧਰ 'ਤੇ ਚਾਹੇ ਗਏ ਵਿਵਹਾਰਾਂ ਨੂੰ ਉਤਸ਼ਾਹਿਤ ਅਤੇ ਵਧਾ ਕੇ ਨੈਤਿਕ ਨਿਯਮਾਂ ਨੂੰ ਮਜ਼ਬੂਤ ਕਰਦੀਆਂ ਹਨ।
ਜਦੋਂ ਸਾਡੇ ਕੋਲ ਨੈਤਿਕ ਸਿਧਾਂਤ ਨਿਰਧਾਰਤ ਹੁੰਦੇ ਹਨ, ਅਗਲਾ ਕਦਮ ਸਾਡੇ ਡਾਟਾ ਅਤੇ AI ਕਾਰਵਾਈਆਂ ਦਾ ਮੁਲਾਂਕਣ ਕਰਨਾ ਹੈ ਕਿ ਕੀ ਉਹ ਸਾਂਝੇ ਮੁੱਲਾਂ ਨਾਲ ਸੰਗਤ ਹਨ। ਆਪਣੇ ਕਾਰਵਾਈਆਂ ਨੂੰ ਦੋ ਸ਼੍ਰੇਣੀਆਂ ਵਿੱਚ ਸੋਚੋ: _ਡਾਟਾ ਇਕੱਠਾ ਕਰਨਾ_ ਅਤੇ _ਐਲਗੋਰਿਦਮ ਡਿਜ਼ਾਈਨ_
ਡਾਟਾ ਇਕੱਠਾ ਕਰਨ ਨਾਲ, ਕਾਰਵਾਈਆਂ ਸੰਭਾਵਿਤ ਤੌਰ 'ਤੇ **ਵਿਅਕਤੀਗਤ ਡਾਟਾ** ਜਾਂ ਪਹਿਚਾਣਯੋਗ ਜੀਵਤ ਵਿਅਕਤੀਆਂ ਲਈ ਵਿਅਕਤੀਗਤ ਪਹਿਚਾਣਯੋਗ ਜਾਣਕਾਰੀ (PII) ਸ਼ਾਮਲ ਹੋਵੇਗੀ। ਇਸ ਵਿੱਚ [ਗੈਰ-ਵਿਅਕਤੀਗਤ ਡਾਟਾ](https://ec.europa.eu/info/law/law-topic/data-protection/reform/what-personal-data_en) ਦੇ ਵੱਖ-ਵੱਖ ਆਈਟਮ ਸ਼ਾਮਲ ਹਨ ਜੋ _ਸਾਂਝੇ ਤੌਰ 'ਤੇ_ ਕਿਸੇ ਵਿਅਕਤੀ ਦੀ ਪਹਿਚਾਣ ਕਰਦੇ ਹਨ। ਨੈਤਿਕ ਚੁਣੌਤੀਆਂ _ਡਾਟਾ ਗੋਪਨੀਯਤਾ_, _ਡਾਟਾ ਮਾਲਕੀ_, ਅਤੇ ਸੰਬੰਧਿਤ ਵਿਸ਼ਿਆਂ ਜਿਵੇਂ _ਜਾਣਕਾਰੀ ਸਹਿਮਤੀ_ ਅਤੇ ਉਪਭੋਗਤਾਵਾਂ ਲਈ _ਬੌਧਿਕ ਸੰਪਤੀ ਅਧਿਕਾਰ_ ਨਾਲ ਸੰਬੰਧਿਤ ਹੋ ਸਕਦੀਆਂ ਹਨ।
## ਨੈਤਿਕਤਾ ਦੇ ਸੰਕਲਪ
ਐਲਗੋਰਿਦਮ ਡਿਜ਼ਾਈਨ ਨਾਲ, ਕਾਰਵਾਈਆਂ **ਡਾਟਾਸੈਟ** ਇਕੱਠਾ ਕਰਨ ਅਤੇ ਕਿਊਰੇਟ ਕਰਨ, ਫਿਰ **ਡਾਟਾ ਮਾਡਲ** ਨੂੰ ਅਸਲ ਦੁਨੀਆ ਦੇ ਸੰਦਰਭਾਂ ਵਿੱਚ ਨਤੀਜੇ ਦੀ ਭਵਿੱਖਵਾਣੀ ਕਰਨ ਜਾਂ ਫੈਸਲੇ ਆਟੋਮੇਟ ਕਰਨ ਲਈ ਟ੍ਰੇਨ ਅਤੇ ਤੈਨਾਤ ਕਰਨ ਵਿੱਚ ਸ਼ਾਮਲ ਹੋਣਗੀਆਂ। ਨੈਤਿਕ ਚੁਣੌਤੀਆਂ _ਡਾਟਾਸੈਟ ਪੱਖਪਾਤ_, _ਡਾਟਾ ਗੁਣਵੱਤਾ_ ਦੇ ਮੁੱਦਿਆਂ, _ਅਨਿਆਂ_ ਅਤੇ _ਗਲਤ ਪੇਸ਼ਕਾਰੀ_ ਵਿੱਚ ਉਤਪੰਨ ਹੋ ਸਕਦੀਆਂ ਹਨ - ਜਿਸ ਵਿੱਚ ਕੁਝ ਮੁੱਦੇ ਪ੍ਰਣਾਲੀਕ ਪ੍ਰਕਿਰਤੀ ਦੇ
[Algorithm Fairness](https://towardsdatascience.com/what-is-algorithm-fairness-3182e161cf9f) ਇਹ ਜਾਂਚ ਕਰਦੀ ਹੈ ਕਿ ਕੀ ਐਲਗੋਰਿਥਮ ਡਿਜ਼ਾਈਨ ਸਿਸਟਮੈਟਿਕ ਤੌਰ 'ਤੇ ਡਾਟਾ ਵਿਸ਼ਿਆਂ ਦੇ ਖਾਸ ਉਪ-ਸਮੂਹਾਂ ਦੇ ਖਿਲਾਫ ਭੇਦਭਾਵ ਕਰਦੀ ਹੈ, ਜਿਸ ਨਾਲ _ਵੰਡ_ (ਜਿੱਥੇ ਸਾਧਨ ਉਸ ਸਮੂਹ ਤੋਂ ਰੋਕੇ ਜਾਂ ਵਾਪਸ ਲਏ ਜਾਂਦੇ ਹਨ) ਅਤੇ _ਸੇਵਾ ਦੀ ਗੁਣਵੱਤਾ_ (ਜਿੱਥੇ AI ਕੁਝ ਉਪ-ਸਮੂਹਾਂ ਲਈ ਹੋਰਾਂ ਦੇ ਮੁਕਾਬਲੇ ਘੱਟ ਸਹੀ ਹੁੰਦੀ ਹੈ) ਵਿੱਚ [ਸੰਭਾਵਿਤ ਨੁਕਸਾਨ](https://docs.microsoft.com/en-us/azure/machine-learning/concept-fairness-ml) ਹੁੰਦੇ ਹਨ।
ਇਸ ਭਾਗ ਵਿੱਚ, ਅਸੀਂ **ਸਾਂਝੇ ਮੁੱਲਾਂ** (ਸਿਧਾਂਤਾਂ) ਅਤੇ **ਨੈਤਿਕ ਚੁਣੌਤੀਆਂ** (ਸਮੱਸਿਆਵਾਂ) ਵਰਗੇ ਸੰਕਲਪਾਂ 'ਤੇ ਚਰਚਾ ਕਰਾਂਗੇ ਜੋ ਡਾਟਾ ਨੈਤਿਕਤਾ ਲਈ ਮਹੱਤਵਪੂਰਨ ਹਨ - ਅਤੇ **ਕੇਸ ਅਧਿਐਨ** ਦੀ ਪੜਚੋਲ ਕਰਾਂਗੇ ਜੋ ਤੁਹਾਨੂੰ ਅਸਲ ਦੁਨੀਆ ਦੇ ਸੰਦਰਭਾਂ ਵਿੱਚ ਇਨ੍ਹਾਂ ਸੰਕਲਪਾਂ ਨੂੰ ਸਮਝਣ ਵਿੱਚ ਸਹਾਇਕ ਹਨ।
[Algorithm Fairness](https://towardsdatascience.com/what-is-algorithm-fairness-3182e161cf9f) ਇਹ ਜਾਂਚ ਕਰਦੀ ਹੈ ਕਿ ਕੀ ਐਲਗੋਰਿਥਮ ਡਿਜ਼ਾਈਨ ਸਿਸਟਮੈਟਿਕ ਤੌਰ 'ਤੇ ਡਾਟਾ ਵਿਸ਼ਿਆਂ ਦੇ ਖਾਸ ਉਪ-ਸਮੂਹਾਂ ਦੇ ਖਿਲਾਫ ਭੇਦਭਾਵ ਕਰਦੀ ਹੈ, ਜਿਸ ਨਾਲ _ਵੰਡ_ (ਜਿੱਥੇ ਸਾਧਨ ਉਸ ਸਮੂਹ ਤੋਂ ਇਨਕਾਰ ਜਾਂ ਰੋਕੇ ਜਾਂਦੇ ਹਨ) ਅਤੇ _ਸੇਵਾ ਦੀ ਗੁਣਵੱਤਾ_ (ਜਿੱਥੇ AI ਕੁਝ ਉਪ-ਸਮੂਹਾਂ ਲਈ ਹੋਰਾਂ ਦੇ ਮੁਕਾਬਲੇ ਘੱਟ ਸਹੀ ਹੈ) ਵਿੱਚ [ਸੰਭਾਵਿਤ ਨੁਕਸਾਨ](https://docs.microsoft.com/en-us/azure/machine-learning/concept-fairness-ml) ਹੁੰਦੇ ਹਨ।
ਇਥੇ ਪੜਤਾਲ ਕਰਨ ਵਾਲੇ ਸਵਾਲ ਹਨ:
* ਕੀ ਅਸੀਂ ਵੱਖ-ਵੱਖ ਉਪ-ਸਮੂਹਾਂ ਅਤੇ ਹਾਲਾਤਾਂ ਲਈ ਮਾਡਲ ਦੀ ਸਹੀਤਾ ਦਾ ਮੁਲਾਂਕਨ ਕੀਤਾ?
@ -84,80 +59,81 @@ CO_OP_TRANSLATOR_METADATA:
#### 2.9 ਗਲਤ ਪੇਸ਼ਕਾਰੀ
[ਡਾਟਾ ਗਲਤ ਪੇਸ਼ਕਾਰੀ](https://www.sciencedirect.com/topics/computer-science/misrepresentation) ਇਸ ਗੱਲ ਦਾ ਮੁਲਾਂਕਨ ਕਰਦੀ ਹੈ ਕਿ ਕੀ ਅਸੀਂ ਸੱਚਾਈ ਨਾਲ ਰਿਪੋਰਟ ਕੀਤੇ ਡਾਟਾ ਤੋਂ ਅੰਤਰਦ੍ਰਿਸ਼ਟੀ ਨੂੰ ਇੱਕ ਚਾਹੀਦੀ ਕਹਾਣੀ ਨੂੰ ਸਹਾਰਾ ਦੇਣ ਲਈ ਧੋਖੇਬਾਜ਼ੀ ਨਾਲ ਪੇਸ਼ ਕਰ ਰਹੇ ਹਾਂ।
[ਡਾਟਾ ਗਲਤ ਪੇਸ਼ਕਾਰੀ](https://www.sciencedirect.com/topics/computer-science/misrepresentation) ਇਸ ਗੱਲ ਦਾ ਮੁਲਾਂਕਨ ਕਰਦੀ ਹੈ ਕਿ ਕੀ ਅਸੀਂ ਸੱਚਾਈ ਨਾਲ ਰਿਪੋਰਟ ਕੀਤੇ ਡਾਟਾ ਤੋਂ ਅੰਤਰਦ੍ਰਿਸ਼ਟੀ ਨੂੰ ਇੱਕ ਚਾਹੀਦੀ ਕਹਾਣੀ ਨੂੰ ਸਹਾਰਾ ਦੇਣ ਲਈ ਧੋਖੇ ਨਾਲ ਪੇਸ਼ ਕਰ ਰਹੇ ਹਾਂ।
ਇਥੇ ਪੜਤਾਲ ਕਰਨ ਵਾਲੇ ਸਵਾਲ ਹਨ:
* ਕੀ ਅਸੀਂ ਅਧੂਰਾ ਜਾਂ ਗਲਤ ਡਾਟਾ ਰਿਪੋਰਟ ਕਰ ਰਹੇ ਹਾਂ?
* ਕੀ ਅਸੀਂ ਡਾਟਾ ਨੂੰ ਇਸ ਤਰੀਕੇ ਨਾਲ ਵਿਜੁਅਲਾਈਜ਼ ਕਰ ਰਹੇ ਹਾਂ ਜੋ ਗਲਤ ਨਤੀਜੇ ਪੈਦਾ ਕਰਦਾ ਹੈ?
* ਕੀ ਅਸੀਂ ਨਤੀਜਿਆਂ ਨੂੰ ਹੇਰਫੇਰ ਕਰਨ ਲਈ ਚੁਣਵਾਂ ਸਾਂਖਿਕ ਤਕਨੀਕਾਂ ਦੀ ਵਰਤੋਂ ਕਰ ਰਹੇ ਹਾਂ?
* ਕੀ ਅਸੀਂ ਨਤੀਜਿਆਂ ਨੂੰ ਹੇਰਫੇਰ ਕਰਨ ਲਈ ਚੁਣਿੰਦਾ ਸਾਂਖਿਕ ਤਕਨੀਕਾਂ ਦੀ ਵਰਤੋਂ ਕਰ ਰਹੇ ਹਾਂ?
* ਕੀ ਹੋਰ ਵਿਵਸਥਾਵਾਂ ਹਨ ਜੋ ਵੱਖਰੇ ਨਤੀਜੇ ਪੇਸ਼ ਕਰ ਸਕਦੀਆਂ ਹਨ?
#### 2.10 ਮੁਫ਼ਤ ਚੋਣ
[ਮੁਫ਼ਤ ਚੋਣ ਦਾ ਭਰਮ](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice) ਉਸ ਸਮੇਂ ਹੁੰਦਾ ਹੈ ਜਦੋਂ ਸਿਸਟਮ "ਚੋਣ ਆਰਕੀਟੈਕਚਰ" ਫੈਸਲਾ ਕਰਨ ਵਾਲੇ ਐਲਗੋਰਿਥਮਾਂ ਦੀ ਵਰਤੋਂ ਕਰਦੇ ਹਨ ਤਾਂ ਜੋ ਲੋਕਾਂ ਨੂੰ ਇੱਕ ਪਸੰਦੀਦਾ ਨਤੀਜੇ ਵੱਲ ਧੱਕਾ ਦਿੱਤਾ ਜਾਵੇ, ਜਦੋਂ ਕਿ ਉਨ੍ਹਾਂ ਨੂੰ ਵਿਕਲਪ ਅਤੇ ਨਿਯੰਤਰਣ ਦਿੱਤਾ ਜਾ ਰਿਹਾ ਹੈ। ਇਹ [ਡਾਰਕ ਪੈਟਰਨ](https://www.darkpatterns.org/) ਉਪਭੋਗਤਾਵਾਂ ਨੂੰ ਸਮਾਜਿਕ ਅਤੇ ਆਰਥਿਕ ਨੁਕਸਾਨ ਪਹੁੰਚਾ ਸਕਦੇ ਹਨ। ਕਿਉਂਕਿ ਉਪਭੋਗਤਾ ਦੇ ਫੈਸਲੇ ਵਿਵਹਾਰਕ ਪ੍ਰੋਫਾਈਲਾਂ ਨੂੰ ਪ੍ਰਭਾਵਿਤ ਕਰਦੇ ਹਨ, ਇਹ ਕਾਰਵਾਈਆਂ ਸੰਭਾਵਿਤ ਤੌਰ 'ਤੇ ਭਵਿੱਖ ਦੇ ਚੋਣਾਂ ਨੂੰ ਵਧਾ ਸਕਦੀਆਂ ਹਨ ਜਾਂ ਨੁਕਸਾਨਾਂ ਦੇ ਪ੍ਰਭਾਵ ਨੂੰ ਲੰਬਾ ਕਰ ਸਕਦੀਆਂ ਹਨ।
[ਮੁਫ਼ਤ ਚੋਣ ਦਾ ਭਰਮ](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice) ਉਸ ਸਮੇਂ ਹੁੰਦਾ ਹੈ ਜਦੋਂ ਸਿਸਟਮ "ਚੋਣ ਆਰਕੀਟੈਕਚਰ" ਫੈਸਲਾ ਕਰਨ ਵਾਲੇ ਐਲਗੋਰਿਥਮਾਂ ਦੀ ਵਰਤੋਂ ਕਰਦੇ ਹਨ ਤਾਂ ਜੋ ਲੋਕਾਂ ਨੂੰ ਇੱਕ ਪਸੰਦੀਦਾ ਨਤੀਜੇ ਵੱਲ ਧੱਕਿਆ ਜਾ ਸਕੇ, ਜਦੋਂ ਕਿ ਉਨ੍ਹਾਂ ਨੂੰ ਵਿਕਲਪ ਅਤੇ ਨਿਯੰਤਰਣ ਦਿੱਤਾ ਜਾ ਰਿਹਾ ਹੈ। ਇਹ [ਡਾਰਕ ਪੈਟਰਨ](https://www.darkpatterns.org/) ਉਪਭੋਗਤਾਵਾਂ ਨੂੰ ਸਮਾਜਿਕ ਅਤੇ ਆਰਥਿਕ ਨੁਕਸਾਨ ਪਹੁੰਚਾ ਸਕਦੇ ਹਨ। ਕਿਉਂਕਿ ਉਪਭੋਗਤਾ ਦੇ ਫੈਸਲੇ ਵਿਵਹਾਰਕ ਪ੍ਰੋਫਾਈਲਾਂ ਨੂੰ ਪ੍ਰਭਾਵਿਤ ਕਰਦੇ ਹਨ, ਇਹ ਕਾਰਵਾਈਆਂ ਸੰਭਾਵਿਤ ਤੌਰ 'ਤੇ ਭਵਿੱਖ ਦੇ ਚੋਣਾਂ ਨੂੰ ਵਧਾ ਸਕਦੀਆਂ ਹਨ ਜਾਂ ਨੁਕਸਾਨਾਂ ਦੇ ਪ੍ਰਭਾਵ ਨੂੰ ਲੰਬਾ ਕਰ ਸਕਦੀਆਂ ਹਨ।
ਇਥੇ ਪੜਤਾਲ ਕਰਨ ਵਾਲੇ ਸਵਾਲ ਹਨ:
* ਕੀ ਉਪਭੋਗਤਾ ਨੇ ਉਸ ਚੋਣ ਨੂੰ ਕਰਨ ਦੇ ਪ੍ਰਭਾਵਾਂ ਨੂੰ ਸਮਝਿਆ?
* ਕੀ ਉਪਭੋਗਤਾ ਨੇ ਉਹ ਚੋਣ ਕਰਨ ਦੇ ਪ੍ਰਭਾਵਾਂ ਨੂੰ ਸਮਝਿਆ?
* ਕੀ ਉਪਭੋਗਤਾ (ਵਿਕਲਪਕ) ਚੋਣਾਂ ਅਤੇ ਹਰ ਇੱਕ ਦੇ ਫਾਇਦੇ ਅਤੇ ਨੁਕਸਾਨਾਂ ਤੋਂ ਜਾਣੂ ਸੀ?
* ਕੀ ਉਪਭੋਗਤਾ ਬਾਅਦ ਵਿੱਚ ਇੱਕ ਆਟੋਮੈਟਿਕ ਜਾਂ ਪ੍ਰਭਾਵਿਤ ਚੋਣ ਨੂੰ ਵਾਪਸ ਕਰ ਸਕਦਾ ਹੈ?
* ਕੀ ਉਪਭੋਗਤਾ ਇੱਕ ਆਟੋਮੈਟਿਕ ਜਾਂ ਪ੍ਰਭਾਵਿਤ ਚੋਣ ਨੂੰ ਬਾਅਦ ਵਿੱਚ ਰੱਦ ਕਰ ਸਕਦਾ ਹੈ?
### 3. ਕੇਸ ਸਟੱਡੀਜ਼
ਇਹ ਨੈਤਿਕ ਚੁਣੌਤੀਆਂ ਨੂੰ ਅਸਲ-ਦੁਨੀਆ ਦੇ ਸੰਦਰਭਾਂ ਵਿੱਚ ਰੱਖਣ ਲਈ, ਉਹ ਕੇਸ ਸਟੱਡੀਜ਼ ਦੇਖਣ ਵਿੱਚ ਮਦਦ ਕਰਦੀ ਹੈ ਜੋ ਵਿਅਕਤੀਆਂ ਅਤੇ ਸਮਾਜ ਲਈ ਸੰਭਾਵਿਤ ਨੁਕਸਾਨ ਅਤੇ ਨਤੀਜਿਆਂ ਨੂੰ ਹਾਈਲਾਈਟ ਕਰਦੀਆਂ ਹਨ, ਜਦੋਂ ਇਸ ਤਰ੍ਹਾਂ ਦੀਆਂ ਨੈਤਿਕ ਉਲੰਘਣਾਵਾਂ ਨੂੰ ਨਜ਼ਰਅੰਦਾਜ਼ ਕੀਤਾ ਜਾਂਦਾ ਹੈ।
ਇਹ ਨੈਤਿਕ ਚੁਣੌਤੀਆਂ ਨੂੰ ਅਸਲ-ਜਗਤ ਦੇ ਸੰਦਰਭਾਂ ਵਿੱਚ ਰੱਖਣ ਲਈ, ਉਹ ਕੇਸ ਸਟੱਡੀਜ਼ ਦੇਖਣ ਵਿੱਚ ਮਦਦ ਮਿਲਦੀ ਹੈ ਜੋ ਵਿਅਕਤੀਆਂ ਅਤੇ ਸਮਾਜ ਲਈ ਸੰਭਾਵਿਤ ਨੁਕਸਾਨ ਅਤੇ ਪਰਿਣਾਮਾਂ ਨੂੰ ਰੌਸ਼ਨ ਕਰਦੀਆਂ ਹਨ, ਜਦੋਂ ਇਸ ਤਰ੍ਹਾਂ ਦੀਆਂ ਨੈਤਿਕ ਉਲੰਘਣਾਵਾਂ ਨੂੰ ਨਜ਼ਰਅੰਦਾਜ਼ ਕੀਤਾ ਜਾਂਦਾ ਹੈ।
ਇੱਥੇ ਕੁਝ ਉਦਾਹਰ ਹਨ:
ਇੱਥੇ ਕੁਝ ਉਦਾਹਰ ਹਨ:
| ਨੈਤਿਕ ਚੁਣੌਤੀ | ਕੇਸ ਸਟੱਡੀ |
|--- |--- |
| **ਜਾਣਕਾਰੀ ਸਹਿਮਤੀ** | 1972 - [ਟਸਕੀਗੀ ਸਿਫਿਲਿਸ ਸਟੱਡੀ](https://en.wikipedia.org/wiki/Tuskegee_Syphilis_Study) - ਅਫਰੀਕੀ ਅਮਰੀਕੀ ਪੁਰਸ਼ਾਂ ਨੂੰ ਜੋ ਇਸ ਅਧਿਐਨ ਵਿੱਚ ਸ਼ਾਮਲ ਹੋਏ, ਮੁਫ਼ਤ ਮੈਡੀਕਲ ਦੇਖਭਾਲ ਦਾ ਵਾਅਦਾ ਕੀਤਾ ਗਿਆ _ਪਰ ਧੋਖਾ ਦਿੱਤਾ_ ਗਿਆ। ਖੋਜਕਰਤਾਵਾਂ ਨੇ ਵਿਸ਼ਿਆਂ ਨੂੰ ਉਨ੍ਹਾਂ ਦੀ ਬਿਮਾਰੀ ਜਾਂ ਇਲਾਜ ਦੀ ਉਪਲਬਧਤਾ ਬਾਰੇ ਜਾਣਕਾਰੀ ਨਹੀਂ ਦਿੱਤੀ। ਕਈ ਵਿਸ਼ਿਆਂ ਦੀ ਮੌਤ ਹੋਈ ਅਤੇ ਸਾਥੀ ਜਾਂ ਬੱਚੇ ਪ੍ਰਭਾਵਿਤ ਹੋਏ; ਅਧਿਐਨ 40 ਸਾਲ ਤੱਕ ਚੱਲਿਆ। |
| **ਡਾਟਾ ਪ੍ਰਾਈਵੇਸੀ** | 2007 - [Netflix ਡਾਟਾ ਇਨਾਮ](https://www.wired.com/2007/12/why-anonymous-data-sometimes-isnt/) ਨੇ ਖੋਜਕਰਤਾਵਾਂ ਨੂੰ _50K ਗਾਹਕਾਂ ਤੋਂ 10M ਅਨਾਮਿਤ ਫਿਲਮ ਰੈਂਕਿੰਗ_ ਦਿੱਤੀਆਂ ਤਾਂ ਜੋ ਸਿਫਾਰਸ਼ੀ ਐਲਗੋਰਿਥਮਾਂ ਨੂੰ ਸੁਧਾਰਿਆ ਜਾ ਸਕੇ। ਹਾਲਾਂਕਿ, ਖੋਜਕਰਤਾਵਾਂ ਨੇ ਅਨਾਮਿਤ ਡਾਟਾ ਨੂੰ _ਬਾਹਰੀ ਡਾਟਾਸੈਟਾਂ_ (ਜਿਵੇਂ IMDb ਟਿੱਪਣੀਆਂ) ਵਿੱਚ ਵਿਅਕਤੀਗਤ ਤੌਰ 'ਤੇ ਪਛਾਣਯੋਗ ਡਾਟਾ ਨਾਲ ਜੋੜਨ ਵਿੱਚ ਸਫਲਤਾ ਪ੍ਰਾਪਤ ਕੀਤੀ - ਕੁਝ Netflix ਗਾਹਕਾਂ ਨੂੰ "ਡੀ-ਅਨਾਨਿਮਾਈਜ਼" ਕਰਨਾ। |
| **ਕਲੈਕਸ਼ਨ ਪੱਖਪਾਤ** | 2013 - ਬੋਸਟਨ ਸ਼ਹਿਰ ਨੇ [Street Bump](https://www.boston.gov/transportation/street-bump) ਵਿਕਸਿਤ ਕੀਤਾ, ਇੱਕ ਐਪ ਜਿਸ ਨੇ ਨਾਗਰਿਕਾਂ ਨੂੰ ਪੋਥੋਲ ਦੀ ਰਿਪੋਰਟ ਕਰਨ ਦੀ ਆਗਿਆ ਦਿੱਤੀ, ਜਿਸ ਨਾਲ ਸ਼ਹਿਰ ਨੂੰ ਬਿਹਤਰ ਸੜਕ ਡਾਟਾ ਮਿਲਿਆ। ਹਾਲਾਂਕਿ, [ਘੱਟ ਆਮਦਨ ਵਾਲੇ ਸਮੂਹਾਂ ਦੇ ਲੋਕਾਂ ਕੋਲ ਕਾਰਾਂ ਅਤੇ ਫੋਨਾਂ ਤੱਕ ਘੱਟ ਪਹੁੰਚ ਸੀ](https://hbr.org/2013/04/the-hidden-biases-in-big-data), ਜਿਸ ਨਾਲ ਉਨ੍ਹਾਂ ਦੇ ਸੜਕ ਦੇ ਮੁੱਦੇ ਇਸ ਐਪ ਵਿੱਚ ਅਦ੍ਰਿਸ਼ ਹੋ ਗਏ। ਡਿਵੈਲਪਰਾਂ ਨੇ ਅਕਾਦਮਿਕ ਵਿਦਵਾਨਾਂ ਨਾਲ ਕੰਮ ਕੀਤਾ ਤਾਂ ਜੋ _ਸਮਾਨ ਪਹੁੰਚ ਅਤੇ ਡਿਜ਼ੀਟਲ ਵੱਖ-ਵੱਖਤਾ_ ਦੇ ਮੁੱਦਿਆਂ ਨੂੰ ਨੈਤਿਕਤਾ ਲਈ ਹੱਲ ਕੀਤਾ ਜਾ ਸਕੇ। |
| **ਐਲਗੋਰਿਥਮਿਕ ਨੈਤਿਕਤਾ** | 2018 - MIT [Gender Shades Study](http://gendershades.org/overview.html) ਨੇ ਜੈਂਡਰ ਕਲਾਸੀਫਿਕੇਸ਼ਨ AI ਉਤਪਾਦਾਂ ਦੀ ਸਹੀਤਾ ਦਾ ਮੁਲਾਂਕਨ ਕੀਤਾ, ਜੋ ਮਹਿਲਾਵਾਂ ਅਤੇ ਰੰਗ ਦੇ ਵਿਅਕਤੀਆਂ ਲਈ ਸਹੀਤਾ ਵਿੱਚ ਖਾਮੀਆਂ ਨੂੰ ਬੇਨਕਾਬ ਕਰਦਾ ਹੈ। ਇੱਕ [2019 Apple Card](https://www.wired.com/story/the-apple-card-didnt-see-genderand-thats-the-problem/) ਨੇ ਮਹਿਲਾਵਾਂ ਨੂੰ ਪੁਰਸ਼ਾਂ ਦੇ ਮੁਕਾਬਲੇ ਘੱਟ ਕਰਜ਼ਾ ਦਿੱਤਾ। ਦੋਵੇਂ ਨੇ ਐਲਗੋਰਿਥਮਿਕ ਪੱਖਪਾਤ ਵਿੱਚ ਮੁੱਦਿਆਂ ਨੂੰ ਦਰਸਾਇਆ ਜਿਸ ਨਾਲ ਸਮਾਜਿਕ-ਆਰਥਿਕ ਨੁਕਸਾਨ ਹੋਏ। |
| **ਡਾਟਾ ਗਲਤ ਪੇਸ਼ਕਾਰੀ** | 2020 - [ਜਾਰਜੀਆ ਡਿਪਾਰਟਮੈਂਟ ਆਫ਼ ਪਬਲਿਕ ਹੈਲਥ ਨੇ COVID-19 ਚਾਰਟ ਜਾਰੀ ਕੀਤੇ](https://www.vox.com/covid-19-coronavirus-us-response-trump/2020/5/18/21262265/georgia-covid-19-cases-declining-reopening) ਜੋ ਪੁਸ਼ਟੀ ਕੀਤੇ ਕੇਸਾਂ ਵਿੱਚ ਰੁਝਾਨਾਂ ਬਾਰੇ ਨਾਗਰਿਕਾਂ ਨੂੰ ਗੁੰਮਰਾਹ ਕਰਨ ਲਈ ਗਲਤ ਲਗਦੇ ਸਨ। ਇਹ ਵਿਜੁਅਲਾਈਜ਼ੇਸ਼ਨ ਚਾਲਾਂ ਰਾਹੀਂ ਗਲਤ ਪੇਸ਼ਕਾਰੀ ਨੂੰ ਦਰਸਾਉਂਦਾ ਹੈ। |
| **ਮੁਫ਼ਤ ਚੋਣ ਦਾ ਭਰਮ** | 2020 - ਸਿੱਖਣ ਵਾਲੇ ਐਪ [ABCmouse ਨੇ FTC ਸ਼ਿਕਾਇਤ ਨੂੰ ਸੈਟਲ ਕਰਨ ਲਈ $10M ਦਾ ਭੁਗਤਾਨ ਕੀਤਾ](https://www.washingtonpost.com/business/2020/09/04/abcmouse-10-million-ftc-settlement/) ਜਿੱਥੇ ਮਾਪੇ ਸਬਸਕ੍ਰਿਪਸ਼ਨ ਲਈ ਭੁਗਤਾਨ ਕਰਨ ਲਈ ਫਸੇ ਹੋਏ ਸਨ ਜਿਸ ਨੂੰ ਉਹ ਰੱਦ ਨਹੀਂ ਕਰ ਸਕਦੇ। ਇਹ ਚੋਣ ਆਰਕੀਟੈਕਚਰ ਵਿੱਚ ਡਾਰਕ ਪੈਟਰਨ ਨੂੰ ਦਰਸਾਉਂਦਾ ਹੈ, ਜਿੱਥੇ ਉਪਭੋਗਤਾਵਾਂ ਨੂੰ ਸੰਭਾਵਿਤ ਤੌਰ 'ਤੇ ਨੁਕਸਾਨਦਾਇਕ ਚੋਣਾਂ ਵੱਲ ਧੱਕਿਆ ਗਿਆ। |
| **ਡਾਟਾ ਪ੍ਰਾਈਵੇਸੀ ਅਤੇ ਉਪਭੋਗਤਾ ਅਧਿਕਾਰ** | 2021 - Facebook [ਡਾਟਾ ਬ੍ਰੀਚ](https://www.npr.org/2021/04/09/986005820/after-data-breach-exposes-530-million-facebook-says-it-will-not-notify-users) ਨੇ 530M ਉਪਭੋਗਤਾਵਾਂ ਤੋਂ ਡਾਟਾ ਨੂੰ ਬੇਨਕਾਬ ਕੀਤਾ, ਜਿਸ ਨਾਲ FTC ਨੂੰ $5B ਦਾ ਸੈਟਲਮੈਂਟ ਹੋਇਆ। ਹਾਲਾਂਕਿ, ਇਸ ਨੇ ਉਪਭੋਗਤਾਵਾਂ ਨੂੰ ਬ੍ਰੀਚ ਦੀ ਸੂਚਨਾ ਦੇਣ ਤੋਂ ਇਨਕਾਰ ਕਰ ਦਿੱਤਾ, ਜੋ ਡਾਟਾ ਪਾਰਦਰਸ਼ਤਾ ਅਤੇ ਪਹੁੰਚ ਦੇ ਉਪਭੋਗਤਾ ਅਧਿਕਾਰਾਂ ਦੀ ਉਲੰਘਣਾ ਕਰਦਾ ਹੈ। |
| **ਜਾਣਕਾਰੀ ਸਹਿਮਤੀ** | 1972 - [Tuskegee Syphilis Study](https://en.wikipedia.org/wiki/Tuskegee_Syphilis_Study) - ਅਫਰੀਕੀ ਅਮਰੀਕੀ ਪੁਰਸ਼ਾਂ ਨੂੰ ਜੋ ਇਸ ਅਧਿਐਨ ਵਿੱਚ ਸ਼ਾਮਲ ਹੋਏ, ਮੁਫ਼ਤ ਮੈਡੀਕਲ ਦੇਖਭਾਲ ਦਾ ਵਾਅਦਾ ਕੀਤਾ ਗਿਆ _ਪਰ ਧੋਖਾ ਦਿੱਤਾ_ ਗਿਆ। ਖੋਜਕਰਤਾਵਾਂ ਨੇ ਵਿਸ਼ਿਆਂ ਨੂੰ ਉਨ੍ਹਾਂ ਦੀ ਬਿਮਾਰੀ ਜਾਂ ਇਲਾਜ ਦੀ ਉਪਲਬਧਤਾ ਬਾਰੇ ਜਾਣਕਾਰੀ ਨਹੀਂ ਦਿੱਤੀ। ਕਈ ਵਿਸ਼ਿਆਂ ਦੀ ਮੌਤ ਹੋਈ ਅਤੇ ਸਾਥੀ ਜਾਂ ਬੱਚੇ ਪ੍ਰਭਾਵਿਤ ਹੋਏ; ਅਧਿਐਨ 40 ਸਾਲ ਤੱਕ ਚੱਲਿਆ। |
| **ਡਾਟਾ ਗੋਪਨੀਯਤਾ** | 2007 - [Netflix data prize](https://www.wired.com/2007/12/why-anonymous-data-sometimes-isnt/) ਨੇ ਖੋਜਕਰਤਾਵਾਂ ਨੂੰ _50K ਗਾਹਕਾਂ ਤੋਂ 10M ਅਨਾਮਿਤ ਫਿਲਮ ਰੈਂਕਿੰਗ_ ਦਿੱਤੀਆਂ ਤਾਂ ਜੋ ਸਿਫਾਰਸ਼ੀ ਐਲਗੋਰਿਥਮਾਂ ਨੂੰ ਸੁਧਾਰਿਆ ਜਾ ਸਕੇ। ਹਾਲਾਂਕਿ, ਖੋਜਕਰਤਾਵਾਂ ਅਨਾਮਿਤ ਡਾਟਾ ਨੂੰ _ਬਾਹਰੀ ਡਾਟਾਸੈਟ_ (ਜਿਵੇਂ IMDb ਟਿੱਪਣੀਆਂ) ਨਾਲ ਜੋੜਨ ਵਿੱਚ ਸਫਲ ਰਹੇ - ਕੁਝ Netflix ਗਾਹਕਾਂ ਨੂੰ "ਡੀ-ਅਨਾਨਿਮਾਈਜ਼" ਕਰਦੇ ਹੋਏ।|
| **ਕਲੈਕਸ਼ਨ ਪੱਖਪਾਤ** | 2013 - ਬੋਸਟਨ ਸ਼ਹਿਰ ਨੇ [Street Bump](https://www.boston.gov/transportation/street-bump) ਵਿਕਸਿਤ ਕੀਤਾ, ਇੱਕ ਐਪ ਜਿਸ ਨੇ ਨਾਗਰਿਕਾਂ ਨੂੰ ਪੋਥੋਲ ਦੀ ਰਿਪੋਰਟ ਕਰਨ ਦੀ ਆਗਿਆ ਦਿੱਤੀ, ਜਿਸ ਨਾਲ ਸ਼ਹਿਰ ਨੂੰ ਬਿਹਤਰ ਸੜਕ ਡਾਟਾ ਮਿਲਿਆ। ਹਾਲਾਂਕਿ, [ਘੱਟ ਆਮਦਨ ਵਾਲੇ ਸਮੂਹਾਂ ਦੇ ਲੋਕਾਂ ਨੂੰ ਕਾਰਾਂ ਅਤੇ ਫੋਨਾਂ ਤੱਕ ਘੱਟ ਪਹੁੰਚ](https://hbr.org/2013/04/the-hidden-biases-in-big-data) ਸੀ, ਜਿਸ ਨਾਲ ਉਨ੍ਹਾਂ ਦੇ ਸੜਕ ਦੇ ਮੁੱਦੇ ਇਸ ਐਪ ਵਿੱਚ ਅਦ੍ਰਿਸ਼ ਹੋ ਗਏ। ਵਿਕਾਸਕਾਰਾਂ ਨੇ ਨਿਆਂ ਅਤੇ ਡਿਜ਼ੀਟਲ ਵੰਡ ਦੇ ਮੁੱਦਿਆਂ ਲਈ ਅਕਾਦਮਿਕ ਵਿਦਵਾਨਾਂ ਨਾਲ ਕੰਮ ਕੀਤਾ।|
| **ਐਲਗੋਰਿਥਮਿਕ ਨਿਆਂ** | 2018 - MIT [Gender Shades Study](http://gendershades.org/overview.html) ਨੇ ਜੈਂਡਰ ਕਲਾਸੀਫਿਕੇਸ਼ਨ AI ਉਤਪਾਦਾਂ ਦੀ ਸਹੀਤਾ ਦਾ ਮੁਲਾਂਕਨ ਕੀਤਾ, ਜੋ ਮਹਿਲਾਵਾਂ ਅਤੇ ਰੰਗ ਦੇ ਵਿਅਕਤੀਆਂ ਲਈ ਸਹੀਤਾ ਵਿੱਚ ਖਾਮੀਆਂ ਨੂੰ ਬੇਨਕਾਬ ਕਰਦਾ ਹੈ। ਇੱਕ [2019 Apple Card](https://www.wired.com/story/the-apple-card-didnt-see-genderand-thats-the-problem/) ਨੇ ਮਹਿਲਾਵਾਂ ਨੂੰ ਪੁਰਸ਼ਾਂ ਦੇ ਮੁਕਾਬਲੇ ਘੱਟ ਕ੍ਰੈਡਿਟ ਦੀ ਪੇਸ਼ਕਸ਼ ਕੀਤੀ। ਦੋਵੇਂ ਨੇ ਐਲਗੋਰਿਥਮਿਕ ਪੱਖਪਾਤ ਵਿੱਚ ਸਮਾਜਿਕ-ਆਰਥਿਕ ਨੁਕਸਾਨਾਂ ਨੂੰ ਦਰਸਾਇਆ।|
| **ਡਾਟਾ ਗਲਤ ਪੇਸ਼ਕਾਰੀ** | 2020 - [Georgia Department of Public Health released COVID-19 charts](https://www.vox.com/covid-19-coronavirus-us-response-trump/2020/5/18/21262265/georgia-covid-19-cases-declining-reopening) ਜਿਨ੍ਹਾਂ ਨੇ ਪੁਸ਼ਟੀ ਕੀਤੇ ਕੇਸਾਂ ਦੇ ਰੁਝਾਨਾਂ ਬਾਰੇ ਨਾਗਰਿਕਾਂ ਨੂੰ ਗੁੰਮਰਾਹ ਕਰਨ ਲਈ x-ਅਕਸ 'ਤੇ ਗੈਰ-ਕ੍ਰਮਬੱਧ ਕ੍ਰਮਵਾਰਤਾ ਦੀ ਵਰਤੋਂ ਕੀਤੀ। ਇਹ ਵਿਜੁਅਲਾਈਜ਼ੇਸ਼ਨ ਚਾਲਾਂ ਰਾਹੀਂ ਗਲਤ ਪੇਸ਼ਕਾਰੀ ਨੂੰ ਦਰਸਾਉਂਦਾ ਹੈ।|
| **ਮੁਫ਼ਤ ਚੋਣ ਦਾ ਭਰਮ** | 2020 - ਸਿੱਖਣ ਵਾਲੇ ਐਪ [ABCmouse paid $10M to settle an FTC complaint](https://www.washingtonpost.com/business/2020/09/04/abcmouse-10-million-ftc-settlement/) ਜਿੱਥੇ ਮਾਪੇ ਸਬਸਕ੍ਰਿਪਸ਼ਨ ਲਈ ਫਸੇ ਹੋਏ ਸਨ ਜੋ ਉਹ ਰੱਦ ਨਹੀਂ ਕਰ ਸਕਦੇ। ਇਹ ਚੋਣ ਆਰਕੀਟੈਕਚਰ ਵਿੱਚ ਡਾਰਕ ਪੈਟਰਨ ਨੂੰ ਦਰਸਾਉਂਦਾ ਹੈ, ਜਿੱਥੇ ਉਪਭੋਗਤਾਵਾਂ ਨੂੰ ਸੰਭਾਵਿਤ ਤੌਰ 'ਤੇ ਨੁਕਸਾਨਦਾਇਕ ਚੋਣਾਂ ਵੱਲ ਧੱਕਿਆ ਗਿਆ।|
| **ਡਾਟਾ ਗੋਪਨੀਯਤਾ ਅਤੇ ਉਪਭੋਗਤਾ ਅਧਿਕਾਰ** | 2021 - Facebook [Data Breach](https://www.npr.org/2021/04/09/986005820/after-data-breach-exposes-530-million-facebook-says-it-will-not-notify-users) ਨੇ 530M ਉਪਭੋਗਤਾਵਾਂ ਤੋਂ ਡਾਟਾ ਨੂੰ ਬਾਹਰ ਕੀਤਾ, ਜਿਸ ਨਾਲ FTC ਨੂੰ $5B ਦਾ ਨਿਪਟਾਰਾ ਹੋਇਆ। ਹਾਲਾਂਕਿ, ਇਸ ਨੇ ਉਪਭੋਗਤਾਵਾਂ ਨੂੰ ਡਾਟਾ ਲੀਕ ਬਾਰੇ ਸੂਚਿਤ ਕਰਨ ਤੋਂ ਇਨਕਾਰ ਕਰ ਦਿੱਤਾ, ਜੋ ਡਾਟਾ ਪਾਰਦਰਸ਼ਤਾ ਅਤੇ ਪਹੁੰਚ ਦੇ ਉਪਭੋਗਤਾ ਅਧਿਕਾਰਾਂ ਦੀ ਉਲੰਘਣਾ ਕਰਦਾ ਹੈ।|
ਹੋਰ ਕੇਸ ਸਟੱਡੀਜ਼ ਦੀ ਖੋਜ ਕਰਨਾ ਚਾਹੁੰਦੇ ਹੋ? ਇਹ ਸਰੋਤਾਂ ਦੀ ਜਾਂਚ ਕਰੋ:
* [Ethics Unwrapped](https://ethicsunwrapped.utexas.edu/case-studies) - ਵੱਖ-ਵੱਖ ਉਦਯੋਗਾਂ ਵਿੱਚ ਨੈਤਿਕ ਦਿਲੇਮਂ।
* [Ethics Unwrapped](https://ethicsunwrapped.utexas.edu/case-studies) - ਵੱਖ-ਵੱਖ ਉਦਯੋਗਾਂ ਵਿੱਚ ਨੈਤਿਕ ਦਿਲੇਮਿਆਂ।
* [Data Science Ethics course](https://www.coursera.org/learn/data-science-ethics#syllabus) - ਪ੍ਰਸਿੱਧ ਕੇਸ ਸਟੱਡੀਜ਼ ਦੀ ਖੋਜ।
* [Where things have gone wrong](https://deon.drivendata.org/examples/) - ਡਿਓਨ ਚੈਕਲਿਸਟ ਨਾਲ ਉਦਾਹਰ
* [Where things have gone wrong](https://deon.drivendata.org/examples/) - ਡਿਓਨ ਚੈਕਲਿਸਟ ਨਾਲ ਉਦਾਹਰ
> 🚨 ਉਹ ਕੇਸ ਸਟੱਡੀਜ਼ ਬਾਰੇ ਸੋਚੋ ਜੋ ਤੁਸੀਂ ਦੇਖੀਆਂ ਹਨ - ਕੀ ਤੁਸੀਂ ਆਪਣੇ ਜੀਵਨ ਵਿੱਚ ਇੱਕ ਸਮਾਨ ਨੈਤਿਕ ਚੁਣੌਤੀ ਦਾ ਅਨੁਭਵ ਕੀਤਾ ਹੈ ਜਾਂ ਪ੍ਰਭਾਵਿਤ ਹੋਏ ਹੋ? ਕੀ ਤੁਸੀਂ ਇਸ ਭਾਗ ਵਿੱਚ ਚਰਚਾ ਕੀਤੀ ਗਈ ਨੈਤਿਕ ਚੁਣੌਤੀਆਂ ਵਿੱਚੋਂ ਇੱਕ ਨੂੰ ਦਰਸਾਉਣ ਵਾਲੀ ਘੱਟੋ-ਘੱਟ ਇੱਕ ਹੋਰ ਕੇਸ ਸਟੱਡੀ ਬਾਰੇ ਸੋਚ ਸਕਦੇ ਹੋ?
> 🚨 ਉਹ ਕੇਸ ਸਟੱਡੀਜ਼ ਬਾਰੇ ਸੋਚੋ ਜੋ ਤੁਸੀਂ ਦੇਖੀਆਂ ਹਨ - ਕੀ ਤੁਸੀਂ ਆਪਣੇ ਜੀਵਨ ਵਿੱਚ ਇਸ ਤਰ੍ਹਾਂ ਦੀ ਨੈਤਿਕ ਚੁਣੌਤੀ ਦਾ ਅਨੁਭਵ ਕੀਤਾ ਹੈ ਜਾਂ ਪ੍ਰਭਾਵਿਤ ਹੋਏ ਹੋ? ਕੀ ਤੁਸੀਂ ਇਸ ਭਾਗ ਵਿੱਚ ਚਰਚਾ ਕੀਤੀ ਗਈ ਨੈਤਿਕ ਚੁਣੌਤੀਆਂ ਵਿੱਚੋਂ ਇੱਕ ਨੂੰ ਦਰਸਾਉਣ ਵਾਲੀ ਘੱਟੋ-ਘੱਟ ਇੱਕ ਹੋਰ ਕੇਸ ਸਟੱਡੀ ਬਾਰੇ ਸੋਚ ਸਕਦੇ ਹੋ?
## ਲਾਗੂ ਨੈਤਿਕਤਾ
ਅਸੀਂ ਨੈਤਿਕਤਾ ਦੇ ਅਵਧਾਰਨਾ, ਚੁਣੌਤੀਆਂ ਅਤੇ ਅਸਲ-ਦੁਨੀਆ ਦੇ ਸੰਦਰਭਾਂ ਵਿੱਚ ਕੇਸ ਸਟੱਡੀਜ਼ ਬਾਰੇ ਗੱਲ ਕੀਤੀ ਹੈ। ਪਰ ਅਸੀਂ ਆਪਣੇ ਪ੍ਰਜੈਕਟਾਂ ਵਿੱਚ ਨੈਤਿਕ ਸਿਧਾਂਤਾਂ ਅਤੇ ਅਭਿਆਸਾਂ ਨੂੰ ਲਾਗੂ ਕਰਨ ਦੀ ਸ਼ੁਰੂਆਤ ਕਿਵੇਂ ਕਰਦੇ ਹਾਂ? ਅਤੇ ਅਸੀਂ ਬਿਹਤਰ ਸ਼ਾਸਨ ਲਈ ਇਨ੍ਹਾਂ ਅਭਿਆਸਾਂ ਨੂੰ ਕਿਵੇਂ "ਚਾਲੂ" ਕਰਦੇ ਹਾਂ? ਆਓ ਕੁਝ ਅਸਲ-ਦੁਨੀਆ ਦੇ ਹੱਲਾਂ ਦੀ ਖੋਜ ਕਰੀਏ:
ਅਸੀਂ ਨੈਤਿਕਤਾ ਦੇ ਅਵਧਾਰਨਾ, ਚੁਣੌਤੀਆਂ ਅਤੇ ਅਸਲ-ਜਗਤ ਦੇ ਸੰਦਰਭਾਂ ਵਿੱਚ ਕੇਸ ਸਟੱਡੀਜ਼ ਬਾਰੇ ਗੱਲ ਕੀਤੀ ਹੈ। ਪਰ ਅਸੀਂ ਆਪਣੇ ਪ੍ਰਜੈਕਟਾਂ ਵਿੱਚ ਨੈਤਿਕ ਸਿਧਾਂਤਾਂ ਅਤੇ ਅਭਿਆਸਾਂ ਨੂੰ ਲਾਗੂ ਕਰਨ ਦੀ ਸ਼ੁਰੂਆਤ ਕਿਵੇਂ ਕਰਦੇ ਹਾਂ? ਅਤੇ ਅਸੀਂ ਬਿਹਤਰ ਸ਼ਾਸਨ ਲਈ ਇਨ੍ਹਾਂ ਅਭਿਆਸਾਂ ਨੂੰ ਕਿਵੇਂ "ਚਾਲੂ" ਕਰਦੇ ਹਾਂ? ਆਓ ਕੁਝ ਅਸਲ-ਜਗਤ ਦੇ ਹੱਲਾਂ ਦੀ ਖੋਜ ਕਰੀਏ:
### 1. ਪੇਸ਼ੇਵਰ ਕੋਡ
ਪੇਸ਼ੇਵਰ ਕੋਡ ਸੰਗਠਨਾਂ ਨੂੰ ਆਪਣੇ ਨੈਤਿਕ ਸਿਧਾਂਤਾਂ ਅਤੇ ਮਿਸ਼ਨ ਸਟੇਟਮੈਂਟ ਦਾ ਸਮਰਥਨ ਕਰਨ ਲਈ ਮੈਂਬਰਾਂ ਨੂੰ "ਪ੍ਰੇਰਿਤ" ਕਰਨ ਦਾ ਇੱਕ ਵਿਕਲਪ ਪੇਸ਼ ਕਰਦੇ ਹਨ। ਕੋਡ ਪੇਸ਼ੇਵਰ ਵਿਵਹਾਰ ਲਈ _ਨੈਤਿਕ ਦਿਸ਼ਾ-ਨਿਰਦੇਸ਼_ ਹਨ, ਜੋ ਕਰਮਚਾਰੀਆਂ ਜਾਂ ਮੈਂਬਰਾਂ ਨੂੰ ਆਪਣੇ ਸੰਗਠਨ ਦੇ ਸਿਧਾਂਤਾਂ ਦੇ ਅਨੁਕੂਲ ਫੈਸਲੇ ਕਰਨ ਵਿੱਚ ਮਦਦ ਕਰਦੇ ਹਨ। ਇਹ ਸਿਰਫ ਮੈਂਬਰਾਂ ਦੀ ਸਵੈ-ਇੱਛਾ ਅਨੁਕੂਲਤਾ ਦੇ ਤੌਰ 'ਤੇ ਹੀ ਚੰਗੇ ਹਨ; ਹਾਲਾਂਕਿ, ਕਈ ਸੰਗਠਨ ਮੈਂਬਰਾਂ ਤੋਂ ਅਨੁਕੂਲਤਾ ਨੂੰ ਪ੍ਰੇਰਿਤ ਕਰਨ ਲਈ ਵਾਧੂ ਇਨਾਮ ਅਤੇ ਸਜ਼ਾਵਾਂ ਦੀ ਪੇਸ਼ਕਸ਼ ਕਰਦੇ ਹਨ।
ਪੇਸ਼ੇਵਰ ਕੋਡ ਸੰਗਠਨਾਂ ਨੂੰ ਆਪਣੇ ਨੈਤਿਕ ਸਿਧਾਂਤਾਂ ਅਤੇ ਮਿਸ਼ਨ ਸਟੇਟਮੈਂਟ ਦਾ ਸਮਰਥਨ ਕਰਨ ਲਈ ਮੈਂਬਰਾਂ ਨੂੰ "ਪ੍ਰੇਰਿਤ" ਕਰਨ ਦਾ ਇੱਕ ਵਿਕਲਪ ਪੇਸ਼ ਕਰਦੇ ਹਨ। ਕੋਡ ਪੇਸ਼ੇਵਰ ਵਿਵਹਾਰ ਲਈ _ਨੈਤਿਕ ਦਿਸ਼ਾ-ਨਿਰਦੇਸ਼_ ਹਨ, ਜੋ ਕਰਮਚਾਰੀਆਂ ਜਾਂ ਮੈਂਬਰਾਂ ਨੂੰ ਉਹ ਫੈਸਲੇ ਕਰਨ ਵਿੱਚ ਮਦਦ ਕਰਦੇ ਹਨ ਜੋ ਉਨ੍ਹਾਂ ਦੇ ਸੰਗਠਨ ਦੇ ਸਿਧਾਂਤਾਂ ਨਾਲ ਸੰਗਤ ਰੱਖਦੇ ਹਨ। ਇਹ ਸਿਰਫ ਮੈਂਬਰਾਂ ਦੀ ਸਵੈ-ਇੱਛਾ ਅਨੁਕੂਲਤਾ ਦੇ ਤੌਰ 'ਤੇ ਹੀ ਚੰਗੇ ਹਨ; ਹਾਲਾਂਕਿ, ਕਈ ਸੰਗਠਨ ਮੈਂਬਰਾਂ ਤੋਂ ਅਨੁਕੂਲਤਾ ਪ੍ਰਾਪਤ ਕਰਨ ਲਈ ਵਾਧੂ ਇਨਾਮ ਅਤੇ ਸਜ਼ਾਵਾਂ ਦੀ ਪੇਸ਼ਕਸ਼ ਕਰਦੇ ਹਨ।
ਉਦਾਹਰਾਂ ਵਿੱਚ ਸ਼ਾਮਲ ਹਨ:
* [Oxford Munich](http://www.code-of-ethics.org/code-of-conduct/) ਨੈਤਿਕਤਾ ਦਾ ਕੋਡ
* [Data Science Association](http://datascienceassn.org/code-of-conduct.html) ਕੋਡ ਆਫ਼ ਕੰਡਕਟ (2013 ਵਿੱਚ ਬਣਾਇਆ ਗਿਆ)
* [ACM Code of Ethics and Professional Conduct](https://www.acm.org/code-of-ethics) (1993 ਤੋਂ)
ਉਦਾਹਰਾਂ ਵਿੱਚ ਸ਼ਾਮਲ ਹਨ:
* [Oxford Munich](http://www.code-of-ethics.org/code-of-conduct/) Code of Ethics
* [Data Science Association](http://datascienceassn.org/code-of-conduct.html) Code of Conduct (2013 ਵਿੱਚ ਬਣਾਇਆ ਗਿਆ)
* [ACM Code of Ethics and Professional Conduct](https://www.acm.org/code-of-ethics) (1993 ਤੋਂ)
> 🚨 ਕੀ ਤੁਸੀਂ ਕਿਸੇ ਪੇਸ਼ੇਵਰ ਇੰਜੀਨੀਅਰਿੰਗ ਜਾਂ ਡਾਟਾ ਸਾਇੰਸ ਸੰਗਠਨ ਦੇ ਮੈਂਬਰ ਹੋ? ਉਨ੍ਹਾਂ ਦੀ ਸਾਈਟ ਦੀ ਖੋਜ ਕਰੋ ਤਾਂ ਜੋ ਪਤਾ ਲਗਾਇਆ ਜਾ ਸਕੇ ਕਿ ਕੀ ਉਹ ਪੇਸ਼ੇਵਰ ਨੈਤਿਕਤਾ ਦਾ ਕੋਡ ਪਰਿਭਾਸ਼ਿਤ ਕਰਦੇ ਹਨ। ਇਹ ਉਨ੍ਹਾਂ ਦੇ ਨੈਤਿਕ ਸਿਧਾਂਤਾਂ ਬਾਰੇ ਕੀ ਕਹਿੰਦਾ ਹੈ? ਉਹ ਮੈਂਬਰਾਂ ਨੂੰ ਕੋਡ ਦੀ ਪਾਲਣਾ ਕਰਨ ਲਈ ਕਿਵੇਂ "ਪ੍ਰੇਰਿਤ" ਕਰ ਰਹੇ ਹਨ?
### 2. ਨੈਤਿਕਤਾ ਚੈਕਲਿਸਟ
ਜਦੋਂ ਕਿ ਪੇਸ਼ੇਵਰ ਕੋਡ ਅਭਿਆਸਕਰਤਾਵਾਂ ਤੋਂ ਲੋੜੀਂਦੇ _ਨੈਤਿਕ ਵਿਵਹਾਰ_ ਨੂੰ ਪਰਿਭਾਸ਼ਿਤ ਕਰਦੇ ਹਨ, ਉਹ [ਜਾਣੇ-ਪਛਾਣੇ ਸੀਮਾਵਾਂ](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md) ਵਿੱਚ ਵੱਡੇ-ਪੱਧਰ ਦੇ ਪ੍ਰੋਜੈਕਟਾਂ ਵਿੱਚ ਲਾਗੂ ਕਰਨ ਵਿੱਚ ਹਨ। ਇਸ ਦੇ ਬਦਲੇ, ਕਈ ਡਾਟਾ ਸਾਇੰਸ ਵਿਦਵਾਨ [ਚੈਕਲਿਸਟਾਂ](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md) ਦੀ ਸਿਫਾਰਸ਼ ਕਰਦੇ ਹਨ, ਜੋ **ਸਿਧਾਂਤਾਂ ਨੂੰ ਅਭਿਆਸਾਂ ਨਾਲ** ਹੋਰ ਨਿਰਧਾਰਤ ਅਤੇ ਕਾਰਗਰ ਤਰੀਕੇ ਨਾਲ ਜੋੜ ਸਕਦੇ ਹਨ।
ਜਦੋਂ ਕਿ ਪੇਸ਼ੇਵਰ ਕੋਡ ਅਭਿਆਸਕਰਤਾਵਾਂ ਤੋਂ ਲੋੜੀਂਦੇ _ਨੈਤਿਕ ਵਿਵਹਾਰ_ ਨੂੰ ਪਰਿਭਾਸ਼ਿਤ ਕਰਦੇ ਹਨ, ਉਹ [ਜਾਣੇ-ਪਛਾਣੇ ਸੀਮਾਵਾਂ](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md) ਰੱਖਦੇ ਹਨ, ਖਾਸ ਤੌਰ 'ਤੇ ਵੱਡੇ-ਪੱਧਰ ਦੇ ਪ੍ਰਾਜੈਕਟਾਂ ਵਿੱਚ। ਇਸ ਦੀ ਬਜਾਏ, ਕਈ ਡਾਟਾ ਸਾਇੰਸ ਵਿਦਵਾਨ [ਚੈਕਲਿਸਟਾਂ](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md) ਦੀ ਸਿਫਾਰਸ਼ ਕਰਦੇ ਹਨ, ਜੋ ਸਿਧਾਂਤਾਂ ਨੂੰ ਅਭਿਆਸਾਂ ਨਾਲ **ਜੋੜਨ** ਵਿੱਚ ਜ਼ਿਆਦਾ ਨਿਰਧਾਰਤ ਅਤੇ ਕਾਰਗਰ ਤਰੀਕੇ ਨਾਲ ਮਦਦ ਕਰ ਸਕਦੇ ਹਨ।
ਚੈਕਲਿਸਟ ਸਵਾਲਾਂ ਨੂੰ "ਹਾਂ/ਨਹੀਂ" ਕਾਰਜਾਂ ਵਿੱਚ ਬਦਲ ਦਿੰਦੇ ਹਨ ਜੋ ਚਾਲੂ ਕੀਤੇ ਜਾ ਸਕਦੇ ਹਨ, ਜਿਸ ਨਾਲ ਉਨ੍ਹਾਂ ਨੂੰ ਮਿਆਰੀ ਉਤਪਾਦ ਰਿਲੀਜ਼ ਵਰਕਫਲੋਜ਼ ਦੇ ਹਿੱਸੇ ਵਜੋਂ ਟ੍ਰੈਕ ਕੀਤਾ ਜਾ ਸਕਦਾ ਹੈ।
ਚੈਕਲਿਸਟ ਸਵਾਲਾਂ ਨੂੰ "ਹਾਂ/ਨਹੀਂ" ਕੰਮਾਂ ਵਿੱਚ ਬਦਲ ਦਿੰਦੇ ਹਨ ਜੋ ਚਾਲੂ ਕੀਤੇ ਜਾ ਸਕਦੇ ਹਨ, ਜਿਸ ਨਾਲ ਉਨ੍ਹਾਂ ਨੂੰ ਮਿਆਰੀ ਉਤਪਾਦ ਰਿਲੀਜ਼ ਵਰਕਫਲੋਜ਼ ਦੇ ਹਿੱਸੇ ਵਜੋਂ ਟ੍ਰੈਕ ਕੀਤਾ ਜਾ ਸਕਦਾ ਹੈ।
ਉਦਾਹਰਨਾਂ ਵਿੱਚ ਸ਼ਾਮਲ ਹਨ:
* [Deon](https://deon.drivendata.org/) - ਉਦਯੋਗ ਦੀਆਂ ਸਿਫਾਰਸ਼ਾਂ ਤੋਂ ਬਣਾਈ ਗਈ ਇੱਕ ਜਨਰਲ-ਪPurpose ਡਾਟਾ ਨੈਤਿਕਤਾ ਚੈਕਲਿਸਟ [ਚੈਕਲਿਸਟ-ਸਿਟੇਸ਼ਨ](https://deon.drivendata.org/#checklist-citations) ਨਾਲ ਇੱਕ ਕਮਾਂਡ-ਲਾਈਨ ਟੂਲ ਲਈ ਆਸਾਨ ਇੰਟੀਗ੍ਰੇਸ਼ਨ।
* [Privacy Audit Checklist](https://cyber.harvard.edu/ecommerce/privacyaudit.html) - ਕਾਨੂੰਨੀ ਅਤੇ ਸਮਾਜਿਕ ਪੱਖਾਂ ਤੋਂ ਜਾਣਕਾਰੀ ਸੰਭਾਲਣ ਦੇ ਅਭਿਆਸਾਂ ਲਈ ਆਮ ਦਿਸ਼ਾ-ਨਿਰਦੇਸ਼ ਪ੍ਰਦਾਨ ਕਰਦਾ ਹੈ।
* [AI Fairness Checklist](https://www.microsoft.com/en-us/research/project/ai-fairness-checklist/) - AI ਵਿਕਾਸ ਚ
* [ਜਿੰਮੇਵਾਰ AI ਦੇ ਸਿਧਾਂਤ](https://docs.microsoft.com/en-us/learn/modules/responsible-ai-principles/) - ਮਾਈਕਰੋਸਾਫਟ ਲਰਨ ਤੋਂ ਮੁਫ਼ਤ ਸਿੱਖਣ ਦਾ ਪਾਠ।
* [ਨੈਤਿਕਤਾ ਅਤੇ ਡਾਟਾ ਸਾਇੰਸ](https://resources.oreilly.com/examples/0636920203964) - O'Reilly ਦੀ ਇਬੁੱਕ (M. Loukides, H. Mason ਆਦਿ)।
* [ਡਾਟਾ ਸਾਇੰਸ ਨੈਤਿਕਤਾ](https://www.coursera.org/learn/data-science-ethics#syllabus) - ਮਿਸ਼ੀਗਨ ਯੂਨੀਵਰਸਿਟੀ ਦਾ ਆਨਲਾਈਨ ਕੋਰਸ।
* [ਨੈਤਿਕਤਾ ਅਨਵਰਾਪਡ](https://ethicsunwrapped.utexas.edu/case-studies) - ਟੈਕਸਸ ਯੂਨੀਵਰਸਿਟੀ ਵੱਲੋਂ ਕੇਸ ਅਧਿਐਨ।
ਉਦਾਹਰਣਾਂ ਵਿੱਚ ਸ਼ਾਮਲ ਹਨ:
* [Deon](https://deon.drivendata.org/) - ਉਦਯੋਗ ਦੀਆਂ ਸਿਫਾਰਸ਼ਾਂ ਤੋਂ ਬਣਾਈ ਗਈ ਇੱਕ ਜਨਰਲ-ਪPurpose ਡਾਟਾ ਨੈਤਿਕਤਾ ਚੈਕਲਿਸਟ [industry recommendations](https://deon.drivendata.org/#checklist-citations) ਨਾਲ ਇੱਕ ਕਮਾਂਡ-ਲਾਈਨ ਟੂਲ ਲਈ ਆਸਾਨ ਇੰਟੀਗ੍ਰੇਸ਼ਨ।
* [Privacy Audit Checklist](https://cyber.harvard.edu/ecommerce/privacyaudit.html) - ਕਾਨੂੰਨੀ ਅਤੇ ਸਮਾਜਿਕ ਨਜ਼ਰੀਏ ਤੋਂ ਜਾਣਕਾਰੀ ਸੰਭਾਲਣ ਦੇ ਅਭਿਆਸਾਂ ਲਈ ਆਮ ਦਿਸ਼ਾ-ਨਿਰਦੇਸ਼ ਪ੍ਰਦਾਨ ਕਰਦਾ ਹੈ।
* [AI Fairness Checklist](https://www.microsoft.com/en-us/research/project/ai-fairness-checklist/) - AI ਵਿਕਾਸ ਚੱਕਰਾਂ ਵਿੱਚ ਨਿਆਂ ਦੀ ਜਾਂਚ ਨੂੰ ਅਪਨਾਉਣ ਅਤੇ ਇੰਟੀਗ੍ਰੇਸ਼ਨ ਦਾ ਸਮਰਥਨ ਕਰਨ ਲਈ AI ਅਭਿਆਸਕਰਤਾਵਾਂ ਦੁਆਰਾ ਬਣਾਇਆ ਗਿਆ।
* [22 questions for ethics in data and AI](https://medium.com/the-organization/22-questions-for-ethics-in-data-and-ai-efb68fd19429) - ਡਿਜ਼ਾਈਨ, ਲ
* [ਜਿੰਮੇਵਾਰ AI ਦੇ ਸਿਧਾਂਤ](https://docs.microsoft.com/en-us/learn/modules/responsible-ai-principles/) - Microsoft Learn ਤੋਂ ਮੁਫ਼ਤ ਸਿੱਖਣ ਦਾ ਰਾਹ।
* [ਨੈਤਿਕਤਾ ਅਤੇ ਡਾਟਾ ਸਾਇੰਸ](https://resources.oreilly.com/examples/0636920203964) - O'Reilly EBook (M. Loukides, H. Mason ਆਦਿ)
* [ਡਾਟਾ ਸਾਇੰਸ ਨੈਤਿਕਤਾ](https://www.coursera.org/learn/data-science-ethics#syllabus) - ਮਿਸ਼ੀਗਨ ਯੂਨੀਵਰਸਿਟੀ ਤੋਂ ਆਨਲਾਈਨ ਕੋਰਸ।
* [ਨੈਤਿਕਤਾ ਅਨਵਰਪਡ](https://ethicsunwrapped.utexas.edu/case-studies) - ਟੈਕਸਾਸ ਯੂਨੀਵਰਸਿਟੀ ਤੋਂ ਕੇਸ ਸਟੱਡੀਜ਼।
# ਅਸਾਈਨਮੈਂਟ
[ਡਾਟਾ ਨੈਤਿਕਤਾ ਦਾ ਕੇਸ ਅਧਿਐਨ ਲਿਖੋ](assignment.md)
[ਡਾਟਾ ਨੈਤਿਕਤਾ ਦੇ ਕੇਸ ਸਟੱਡੀ ਲਿਖੋ](assignment.md)
---
**ਅਸਵੀਕਾਰਨਾ**:
ਇਹ ਦਸਤਾਵੇਜ਼ AI ਅਨੁਵਾਦ ਸੇਵਾ [Co-op Translator](https://github.com/Azure/co-op-translator) ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਅਨੁਵਾਦ ਕੀਤਾ ਗਿਆ ਹੈ। ਜਦੋਂ ਕਿ ਅਸੀਂ ਸਹੀ ਹੋਣ ਦਾ ਯਤਨ ਕਰਦੇ ਹਾਂ, ਕਿਰਪਾ ਕਰਕੇ ਧਿਆਨ ਦਿਓ ਕਿ ਸਵੈਚਾਲਿਤ ਅਨੁਵਾਦਾਂ ਵਿੱਚ ਗਲਤੀਆਂ ਜਾਂ ਅਸੁਣੀਕਤਾਵਾਂ ਹੋ ਸਕਦੀਆਂ ਹਨ। ਮੂਲ ਦਸਤਾਵੇਜ਼ ਨੂੰ ਇਸਦੀ ਮੂਲ ਭਾਸ਼ਾ ਵਿੱਚ ਅਧਿਕਾਰਤ ਸਰੋਤ ਮੰਨਿਆ ਜਾਣਾ ਚਾਹੀਦਾ ਹੈ। ਮਹੱਤਵਪੂਰਨ ਜਾਣਕਾਰੀ ਲਈ, ਪੇਸ਼ੇਵਰ ਮਨੁੱਖੀ ਅਨੁਵਾਦ ਦੀ ਸਿਫਾਰਸ਼ ਕੀਤੀ ਜਾਂਦੀ ਹੈ। ਇਸ ਅਨੁਵਾਦ ਦੀ ਵਰਤੋਂ ਤੋਂ ਪੈਦਾ ਹੋਣ ਵਾਲੇ ਕਿਸੇ ਵੀ ਗਲਤਫਹਿਮੀ ਜਾਂ ਗਲਤ ਵਿਆਖਿਆ ਲਈ ਅਸੀਂ ਜ਼ਿੰਮੇਵਾਰ ਨਹੀਂ ਹਾਂ।
ਇਹ ਦਸਤਾਵੇਜ਼ AI ਅਨੁਵਾਦ ਸੇਵਾ [Co-op Translator](https://github.com/Azure/co-op-translator) ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਅਨੁਵਾਦ ਕੀਤਾ ਗਿਆ ਹੈ। ਹਾਲਾਂਕਿ ਅਸੀਂ ਸਹੀਅਤਾ ਲਈ ਯਤਨਸ਼ੀਲ ਹਾਂ, ਕਿਰਪਾ ਕਰਕੇ ਧਿਆਨ ਦਿਓ ਕਿ ਸਵੈਚਾਲਿਤ ਅਨੁਵਾਦਾਂ ਵਿੱਚ ਗਲਤੀਆਂ ਜਾਂ ਅਸੁਚੀਤਤਾਵਾਂ ਹੋ ਸਕਦੀਆਂ ਹਨ। ਮੂਲ ਦਸਤਾਵੇਜ਼ ਨੂੰ ਇਸਦੀ ਮੂਲ ਭਾਸ਼ਾ ਵਿੱਚ ਅਧਿਕਾਰਤ ਸਰੋਤ ਮੰਨਿਆ ਜਾਣਾ ਚਾਹੀਦਾ ਹੈ। ਮਹੱਤਵਪੂਰਨ ਜਾਣਕਾਰੀ ਲਈ, ਪੇਸ਼ੇਵਰ ਮਨੁੱਖੀ ਅਨੁਵਾਦ ਦੀ ਸਿਫਾਰਸ਼ ਕੀਤੀ ਜਾਂਦੀ ਹੈ। ਇਸ ਅਨੁਵਾਦ ਦੀ ਵਰਤੋਂ ਤੋਂ ਪੈਦਾ ਹੋਣ ਵਾਲੇ ਕਿਸੇ ਵੀ ਗਲਤਫਹਿਮੀ ਜਾਂ ਗਲਤ ਵਿਆਖਿਆ ਲਈ ਅਸੀਂ ਜ਼ਿੰਮੇਵਾਰ ਨਹੀਂ ਹਾਂ।

@ -1,8 +1,8 @@
<!--
CO_OP_TRANSLATOR_METADATA:
{
"original_hash": "8796f41f566a0a8ebb72863a83d558ed",
"translation_date": "2025-08-24T21:21:19+00:00",
"original_hash": "3a34157cc63516eba97c89a0b2f8c3e6",
"translation_date": "2025-09-03T21:19:17+00:00",
"source_file": "1-Introduction/02-ethics/README.md",
"language_code": "pl"
}
@ -11,21 +11,21 @@ CO_OP_TRANSLATOR_METADATA:
|![ Sketchnote autorstwa [(@sketchthedocs)](https://sketchthedocs.dev) ](../../sketchnotes/02-Ethics.png)|
|:---:|
| Etyka w nauce o danych - _Sketchnote autorstwa [@nitya](https://twitter.com/nitya)_ |
| Etyka danych - _Sketchnote autorstwa [@nitya](https://twitter.com/nitya)_ |
---
Wszyscy jesteśmy obywatelami danych żyjącymi w świecie zdominowanym przez dane.
Trendy rynkowe wskazują, że do 2022 roku 1 na 3 duże organizacje będzie kupować i sprzedawać swoje dane za pośrednictwem internetowych [rynków i giełd](https://www.gartner.com/smarterwithgartner/gartner-top-10-trends-in-data-and-analytics-for-2020/). Jako **deweloperzy aplikacji**, będziemy mieli łatwiejszy i tańszy dostęp do integracji wniosków opartych na danych oraz automatyzacji napędzanej algorytmami w codziennych doświadczeniach użytkowników. Jednak wraz z coraz większym rozpowszechnieniem AI, musimy również zrozumieć potencjalne szkody wynikające z [uzbrojenia](https://www.youtube.com/watch?v=TQHs8SA1qpk) takich algorytmów na dużą skalę.
Trendy rynkowe wskazują, że do 2022 roku 1 na 3 duże organizacje będzie kupować i sprzedawać swoje dane za pośrednictwem internetowych [rynków i giełd](https://www.gartner.com/smarterwithgartner/gartner-top-10-trends-in-data-and-analytics-for-2020/). Jako **twórcy aplikacji**, będziemy mieli łatwiejszy i tańszy dostęp do integracji wniosków opartych na danych oraz automatyzacji sterowanej algorytmami w codziennych doświadczeniach użytkowników. Jednak wraz z coraz większym rozpowszechnieniem AI, będziemy musieli zrozumieć potencjalne szkody wynikające z [uzbrojenia](https://www.youtube.com/watch?v=TQHs8SA1qpk) takich algorytmów na dużą skalę.
Trendy wskazują również, że do 2025 roku stworzymy i skonsumujemy ponad [180 zettabajtów](https://www.statista.com/statistics/871513/worldwide-data-created/) danych. Jako **naukowcy danych**, zyskamy bezprecedensowy dostęp do danych osobowych. Oznacza to, że możemy budować profile behawioralne użytkowników i wpływać na podejmowanie decyzji w sposób, który tworzy [iluzję wolnego wyboru](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice), jednocześnie potencjalnie kierując użytkowników w stronę preferowanych przez nas wyników. To również rodzi szersze pytania dotyczące prywatności danych i ochrony użytkowników.
Trendy wskazują również, że do 2025 roku stworzymy i zużyjemy ponad [180 zettabajtów](https://www.statista.com/statistics/871513/worldwide-data-created/) danych. Jako **naukowcy danych**, uzyskamy bezprecedensowy dostęp do danych osobowych. Oznacza to, że możemy budować profile behawioralne użytkowników i wpływać na podejmowanie decyzji w sposób, który tworzy [iluzję wolnego wyboru](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice), jednocześnie potencjalnie kierując użytkowników w stronę preferowanych przez nas wyników. To również rodzi szersze pytania dotyczące prywatności danych i ochrony użytkowników.
Etyka danych to teraz _niezbędne zabezpieczenia_ w nauce o danych i inżynierii, które pomagają minimalizować potencjalne szkody i niezamierzone konsekwencje naszych działań opartych na danych. [Cykl Hype Gartnera dla AI](https://www.gartner.com/smarterwithgartner/2-megatrends-dominate-the-gartner-hype-cycle-for-artificial-intelligence-2020/) identyfikuje istotne trendy w zakresie etyki cyfrowej, odpowiedzialnej AI i zarządzania AI jako kluczowe czynniki napędzające większe megatrendy wokół _demokratyzacji_ i _uprzemysłowienia_ AI.
Etyka danych staje się teraz _niezbędnymi barierami ochronnymi_ dla nauki i inżynierii danych, pomagając nam minimalizować potencjalne szkody i niezamierzone konsekwencje wynikające z naszych działań opartych na danych. [Cykl Hype Gartnera dla AI](https://www.gartner.com/smarterwithgartner/2-megatrends-dominate-the-gartner-hype-cycle-for-artificial-intelligence-2020/) identyfikuje istotne trendy w etyce cyfrowej, odpowiedzialnej AI i zarządzaniu AI jako kluczowe czynniki większych megatrendów wokół _demokratyzacji_ i _industrializacji_ AI.
![Cykl Hype Gartnera dla AI - 2020](https://images-cdn.newscred.com/Zz1mOWJhNzlkNDA2ZTMxMWViYjRiOGFiM2IyMjQ1YmMwZQ==)
W tej lekcji zgłębimy fascynujący obszar etyki danych - od podstawowych pojęć i wyzwań, przez studia przypadków, aż po zastosowane koncepcje AI, takie jak zarządzanie, które pomagają ustanowić kulturę etyki w zespołach i organizacjach pracujących z danymi i AI.
W tej lekcji zgłębimy fascynujący obszar etyki danych - od podstawowych pojęć i wyzwań, przez studia przypadków, aż po zastosowane koncepcje AI, takie jak zarządzanie - które pomagają ustanowić kulturę etyki w zespołach i organizacjach pracujących z danymi i AI.
## [Quiz przed wykładem](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/2) 🎯
@ -33,54 +33,54 @@ W tej lekcji zgłębimy fascynujący obszar etyki danych - od podstawowych poję
Zacznijmy od zrozumienia podstawowej terminologii.
Słowo "etyka" pochodzi od [greckiego słowa "ethikos"](https://en.wikipedia.org/wiki/Ethics) (i jego rdzenia "ethos"), oznaczającego _charakter lub moralną naturę_.
Słowo "etyka" pochodzi od [greckiego słowa "ethikos"](https://en.wikipedia.org/wiki/Ethics) (i jego korzenia "ethos"), które oznacza _charakter lub moralną naturę_.
**Etyka** dotyczy wspólnych wartości i zasad moralnych, które regulują nasze zachowanie w społeczeństwie. Etyka nie opiera się na prawach, ale na powszechnie akceptowanych normach tego, co jest "dobre a złe". Jednak rozważania etyczne mogą wpływać na inicjatywy w zakresie ładu korporacyjnego i regulacje rządowe, które tworzą większe zachęty do przestrzegania zasad.
**Etyka** dotyczy wspólnych wartości i zasad moralnych, które regulują nasze zachowanie w społeczeństwie. Etyka opiera się nie na prawach, ale na powszechnie akceptowanych normach tego, co jest "dobre vs. złe". Jednak rozważania etyczne mogą wpływać na inicjatywy w zakresie ładu korporacyjnego oraz regulacje rządowe, które tworzą większe zachęty do przestrzegania zasad.
**Etyka danych** to [nowa gałąź etyki](https://royalsocietypublishing.org/doi/full/10.1098/rsta.2016.0360#sec-1), która "bada i ocenia problemy moralne związane z _danymi, algorytmami i odpowiadającymi im praktykami_". Tutaj **"dane"** koncentrują się na działaniach związanych z generowaniem, rejestrowaniem, kuracją, przetwarzaniem, rozpowszechnianiem, udostępnianiem i użytkowaniem, **"algorytmy"** skupiają się na AI, agentach, uczeniu maszynowym i robotach, a **"praktyki"** dotyczą takich tematów jak odpowiedzialna innowacja, programowanie, hacking i kodeksy etyczne.
**Etyka danych** to [nowa gałąź etyki](https://royalsocietypublishing.org/doi/full/10.1098/rsta.2016.0360#sec-1), która "bada i ocenia problemy moralne związane z _danymi, algorytmami i odpowiadającymi im praktykami_". Tutaj **"dane"** koncentrują się na działaniach związanych z generowaniem, rejestrowaniem, kuracją, przetwarzaniem, rozpowszechnianiem, udostępnianiem i użytkowaniem, **"algorytmy"** skupiają się na AI, agentach, uczeniu maszynowym i robotach, a **"praktyki"** dotyczą takich tematów jak odpowiedzialna innowacja, programowanie, hakowanie i kodeksy etyczne.
**Etyka stosowana** to [praktyczne zastosowanie rozważań moralnych](https://en.wikipedia.org/wiki/Applied_ethics). Jest to proces aktywnego badania kwestii etycznych w kontekście _działań, produktów i procesów w rzeczywistym świecie_ oraz podejmowania działań korygujących, aby upewnić się, że pozostają one zgodne z określonymi wartościami etycznymi.
**Kultura etyczna** dotyczy [_operacjonalizacji_ etyki stosowanej](https://hbr.org/2019/05/how-to-design-an-ethical-organization), aby upewnić się, że nasze zasady i praktyki etyczne są przyjmowane w sposób spójny i skalowalny w całej organizacji. Udane kultury etyczne definiują zasady etyczne na poziomie organizacyjnym, zapewniają znaczące zachęty do przestrzegania zasad i wzmacniają normy etyczne, zachęcając i promując pożądane zachowania na każdym poziomie organizacji.
**Kultura etyki** dotyczy [_operacjonalizacji_ etyki stosowanej](https://hbr.org/2019/05/how-to-design-an-ethical-organization), aby upewnić się, że nasze zasady i praktyki etyczne są przyjmowane w sposób spójny i skalowalny w całej organizacji. Udane kultury etyki definiują zasady etyczne na poziomie organizacyjnym, zapewniają znaczące zachęty do przestrzegania zasad oraz wzmacniają normy etyczne, zachęcając i amplifikując pożądane zachowania na każdym poziomie organizacji.
## Koncepcje etyczne
## Koncepcje etyki
W tej sekcji omówimy koncepcje takie jak **wspólne wartości** (zasady) i **wyzwania etyczne** (problemy) w etyce danych - oraz przeanalizujemy **studia przypadków**, które pomogą zrozumieć te koncepcje w kontekstach rzeczywistych.
W tej sekcji omówimy koncepcje takie jak **wspólne wartości** (zasady) i **wyzwania etyczne** (problemy) w etyce danych - oraz przeanalizujemy **studia przypadków**, które pomogą zrozumieć te koncepcje w kontekstach rzeczywistego świata.
### 1. Zasady etyczne
### 1. Zasady etyki
Każda strategia etyki danych zaczyna się od zdefiniowania _zasad etycznych_ - "wspólnych wartości", które opisują akceptowalne zachowania i kierują działaniami zgodnymi z przepisami w naszych projektach związanych z danymi i AI. Możesz je zdefiniować na poziomie indywidualnym lub zespołowym. Jednak większość dużych organizacji określa je w ramach misji lub struktury _etycznego AI_, która jest definiowana na poziomie korporacyjnym i konsekwentnie egzekwowana we wszystkich zespołach.
Każda strategia etyki danych zaczyna się od zdefiniowania _zasad etycznych_ - "wspólnych wartości", które opisują akceptowalne zachowania i kierują zgodnymi działaniami w naszych projektach związanych z danymi i AI. Możesz je zdefiniować na poziomie indywidualnym lub zespołowym. Jednak większość dużych organizacji określa je w _misji etycznej AI_ lub ramach, które są definiowane na poziomie korporacyjnym i konsekwentnie egzekwowane we wszystkich zespołach.
**Przykład:** Misja [Odpowiedzialnego AI](https://www.microsoft.com/en-us/ai/responsible-ai) Microsoftu brzmi: _"Jesteśmy zaangażowani w rozwój AI napędzanej zasadami etycznymi, które stawiają ludzi na pierwszym miejscu"_ - identyfikując 6 zasad etycznych w poniższym frameworku:
**Przykład:** Misja [Odpowiedzialnej AI](https://www.microsoft.com/en-us/ai/responsible-ai) Microsoftu brzmi: _"Jesteśmy zaangażowani w rozwój AI kierowany przez zasady etyczne, które stawiają ludzi na pierwszym miejscu"_ - identyfikując 6 zasad etycznych w poniższym frameworku:
![Odpowiedzialne AI w Microsoft](https://docs.microsoft.com/en-gb/azure/cognitive-services/personalizer/media/ethics-and-responsible-use/ai-values-future-computed.png)
![Odpowiedzialna AI w Microsoft](https://docs.microsoft.com/en-gb/azure/cognitive-services/personalizer/media/ethics-and-responsible-use/ai-values-future-computed.png)
Przyjrzyjmy się krótko tym zasadom. _Przejrzystość_ i _odpowiedzialność_ są podstawowymi wartościami, na których opierają się inne zasady - zacznijmy więc od nich:
Przyjrzyjmy się krótko tym zasadom. _Przejrzystość_ i _odpowiedzialność_wartościami podstawowymi, na których opierają się inne zasady - więc zacznijmy od nich:
* [**Odpowiedzialność**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) sprawia, że praktycy są _odpowiedzialni_ za swoje działania związane z danymi i AI oraz za zgodność z tymi zasadami etycznymi.
* [**Przejrzystość**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) zapewnia, że działania związane z danymi i AI są _zrozumiałe_ (interpretowalne) dla użytkowników, wyjaśniając, co i dlaczego stoi za decyzjami.
* [**Sprawiedliwość**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1%3aprimaryr6) - koncentruje się na zapewnieniu, że AI traktuje _wszystkich ludzi_ sprawiedliwie, eliminując systemowe lub ukryte uprzedzenia w danych i systemach.
* [**Odpowiedzialność**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) sprawia, że praktycy są _odpowiedzialni_ za swoje operacje związane z danymi i AI oraz za zgodność z tymi zasadami etycznymi.
* [**Przejrzystość**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) zapewnia, że działania związane z danymi i AI są _zrozumiałe_ (interpretowalne) dla użytkowników, wyjaśniając co i dlaczego stoi za decyzjami.
* [**Sprawiedliwość**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1%3aprimaryr6) - koncentruje się na zapewnieniu, że AI traktuje _wszystkich ludzi_ sprawiedliwie, rozwiązując wszelkie systemowe lub ukryte techniczno-społeczne uprzedzenia w danych i systemach.
* [**Niezawodność i bezpieczeństwo**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - zapewnia, że AI działa _spójnie_ z określonymi wartościami, minimalizując potencjalne szkody lub niezamierzone konsekwencje.
* [**Prywatność i bezpieczeństwo**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - dotyczy zrozumienia pochodzenia danych i zapewnienia _prywatności danych oraz związanych z tym ochron_ użytkownikom.
* [**Inkluzywność**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - dotyczy projektowania rozwiązań AI z zamiarem dostosowania ich do _szerokiego zakresu ludzkich potrzeb_ i możliwości.
* [**Prywatność i bezpieczeństwo**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - dotyczy zrozumienia pochodzenia danych oraz zapewnienia _prywatności danych i związanych z nią ochron_ użytkownikom.
* [**Inkluzywność**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - dotyczy projektowania rozwiązań AI z zamiarem, dostosowując je do _szerokiego zakresu ludzkich potrzeb_ i możliwości.
> 🚨 Zastanów się, jaka mogłaby być twoja misja etyki danych. Zbadaj ramy etycznego AI innych organizacji - oto przykłady od [IBM](https://www.ibm.com/cloud/learn/ai-ethics), [Google](https://ai.google/principles) i [Facebook](https://ai.facebook.com/blog/facebooks-five-pillars-of-responsible-ai/). Jakie wspólne wartości mają? Jak te zasady odnoszą się do produktów AI lub branży, w której działają?
> 🚨 Zastanów się, jaka mogłaby być misja etyki danych w Twoim przypadku. Przeanalizuj ramy etyczne AI innych organizacji - oto przykłady od [IBM](https://www.ibm.com/cloud/learn/ai-ethics), [Google](https://ai.google/principles) i [Facebook](https://ai.facebook.com/blog/facebooks-five-pillars-of-responsible-ai/). Jakie wspólne wartości mają? Jak te zasady odnoszą się do produktów AI lub branży, w której działają?
### 2. Wyzwania etyczne
Gdy mamy zdefiniowane zasady etyczne, kolejnym krokiem jest ocena naszych działań związanych z danymi i AI, aby sprawdzić, czy są zgodne z tymi wspólnymi wartościami. Pomyśl o swoich działaniach w dwóch kategoriach: _zbieranie danych_ i _projektowanie algorytmów_.
Gdy mamy zdefiniowane zasady etyczne, kolejnym krokiem jest ocena naszych działań związanych z danymi i AI, aby sprawdzić, czy są zgodne z tymi wspólnymi wartościami. Zastanów się nad swoimi działaniami w dwóch kategoriach: _zbieranie danych_ i _projektowanie algorytmów_.
W przypadku zbierania danych działania prawdopodobnie będą dotyczyć **danych osobowych** lub danych umożliwiających identyfikację osób (PII) dla możliwych do zidentyfikowania żyjących osób. Obejmuje to [różnorodne elementy danych nieosobowych](https://ec.europa.eu/info/law/law-topic/data-protection/reform/what-personal-data_en), które _łącznie_ identyfikują osobę. Wyzwania etyczne mogą dotyczyć _prywatności danych_, _własności danych_ i powiązanych tematów, takich jak _świadoma zgoda_ i _prawa własności intelektualnej_ użytkowników.
Podczas zbierania danych działania będą prawdopodobnie dotyczyć **danych osobowych** lub danych umożliwiających identyfikację osób (PII) dla identyfikowalnych żyjących jednostek. Obejmuje to [różnorodne elementy danych nieosobowych](https://ec.europa.eu/info/law/law-topic/data-protection/reform/what-personal-data_en), które _łącznie_ identyfikują jednostkę. Wyzwania etyczne mogą dotyczyć _prywatności danych_, _własności danych_ oraz powiązanych tematów, takich jak _świadoma zgoda_ i _prawa własności intelektualnej_ użytkowników.
W przypadku projektowania algorytmów działania będą obejmować zbieranie i kurację **zbiorów danych**, a następnie ich wykorzystanie do trenowania i wdrażania **modeli danych**, które przewidują wyniki lub automatyzują decyzje w rzeczywistych kontekstach. Wyzwania etyczne mogą wynikać z _uprzedzeń w zbiorach danych_, _problemów z jakością danych_, _niesprawiedliwości_ i _fałszywego przedstawienia_ w algorytmach - w tym niektórych problemów o charakterze systemowym.
Podczas projektowania algorytmów działania będą obejmować zbieranie i kurację **zbiorów danych**, a następnie ich wykorzystanie do trenowania i wdrażania **modeli danych**, które przewidują wyniki lub automatyzują decyzje w rzeczywistych kontekstach. Wyzwania etyczne mogą wynikać z _uprzedzeń w zbiorach danych_, problemów z _jakością danych_, _niesprawiedliwości_ i _fałszywego przedstawienia_ w algorytmach - w tym niektórych problemów o charakterze systemowym.
W obu przypadkach wyzwania etyczne wskazują obszary, w których nasze działania mogą być sprzeczne z naszymi wspólnymi wartościami. Aby wykryć, złagodzić, zminimalizować lub wyeliminować te obawy, musimy zadawać moralne pytania "tak/nie" dotyczące naszych działań, a następnie podejmować odpowiednie działania korygujące. Przyjrzyjmy się niektórym wyzwaniom etycznym i moralnym pytaniom, które one rodzą:
W obu przypadkach wyzwania etyczne wskazują obszary, w których nasze działania mogą napotkać konflikt z naszymi wspólnymi wartościami. Aby wykryć, złagodzić, zminimalizować lub wyeliminować te obawy, musimy zadawać moralne pytania "tak/nie" dotyczące naszych działań, a następnie podejmować odpowiednie działania korygujące. Przyjrzyjmy się niektórym wyzwaniom etycznym i moralnym pytaniom, które się z nimi wiążą:
#### 2.1 Własność danych
Zbieranie danych często obejmuje dane osobowe, które mogą identyfikować podmioty danych. [Własność danych](https://permission.io/blog/data-ownership) dotyczy _kontroli_ i [_praw użytkowników_](https://permission.io/blog/data-ownership) związanych z tworzeniem, przetwarzaniem i rozpowszechnianiem danych.
Moralne pytania, które musimy zadać:
Moralne pytania, które należy zadać:
* Kto jest właścicielem danych? (użytkownik czy organizacja)
* Jakie prawa mają podmioty danych? (np. dostęp, usunięcie, przenoszenie)
* Jakie prawa mają organizacje? (np. poprawianie złośliwych recenzji użytkowników)
@ -96,7 +96,7 @@ Pytania do rozważenia:
#### 2.3 Własność intelektualna
[Własność intelektualna](https://en.wikipedia.org/wiki/Intellectual_property) odnosi się do niematerialnych wytworów wynikających z ludzkiej inicjatywy, które mogą _mieć wartość ekonomiczną_ dla osób lub firm.
[Własność intelektualna](https://en.wikipedia.org/wiki/Intellectual_property) odnosi się do niematerialnych wytworów wynikających z ludzkiej inicjatywy, które mogą _mieć wartość ekonomiczną_ dla jednostek lub firm.
Pytania do rozważenia:
* Czy zebrane dane miały wartość ekonomiczną dla użytkownika lub firmy?
@ -111,61 +111,59 @@ Pytania do rozważenia:
Pytania do rozważenia:
* Czy dane użytkowników (osobowe) są zabezpieczone przed atakami i wyciekami?
* Czy dane użytkowników są dostępne tylko dla autoryzowanych użytkowników i kontekstów?
* Czy anonimowość użytkowników jest zachowana, gdy dane są udostępniane lub rozpowszechniane?
* Czy anonimowość użytkowników jest zachowana podczas udostępniania lub rozpowszechniania danych?
* Czy użytkownik może zostać zidentyfikowany z anonimowych zbiorów danych?
#### 2.5 Prawo do bycia zapomnianym
[Prawo do bycia zapomnianym](https://en.wikipedia.org/wiki/Right_to_be_forgotten) lub [Prawo do usunięcia](https://www.gdpreu.org/right-to-be-forgotten/) zapewnia użytkownikom dodatkową ochronę danych osobowych. Daje użytkownikom prawo do żądania usunięcia lub wycofania danych osobowych z wyszukiwarek internetowych i innych miejsc, _w określonych okolicznościach_ - umożliwiając im nowy start online bez obciążenia przeszłymi działaniami.
[Prawo do bycia zapomnianym](https://en.wikipedia.org/wiki/Right_to_be_forgotten) lub [Prawo do usunięcia](https://www.gdpreu.org/right-to-be-forgotten/) zapewnia dodatkową ochronę danych osobowych użytkownikom. W szczególności daje użytkownikom prawo do żądania usunięcia lub usunięcia danych osobowych z wyszukiwarek internetowych i innych miejsc, _w określonych okolicznościach_ - pozwalając im na nowy start online bez trzymania ich przeszłych działań przeciwko nim.
Pytania do rozważenia:
* Czy system pozwala podmiotom danych na żądanie usunięcia danych?
* Czy system pozwala podmiotom danych na żądanie usunięcia?
* Czy wycofanie zgody użytkownika powinno automatycznie uruchamiać usunięcie danych?
* Czy dane zostały zebrane bez zgody lub w sposób niezgodny z prawem?
* Czy jesteśmy zgodni z regulacjami rządowymi dotyczącymi prywatności danych?
#### 2.6 Uprzedzenia w zbiorach danych
Uprzedzenia w zbiorach danych lub [uprzedzenia w zbieraniu danych](http://researcharticles.com/index.php/bias-in-data-collection-in-research/) dotyczą wyboru _niereprezentatywnego_ podzbioru danych do rozwoju algorytmu, co może prowadzić do niesprawiedliwych wyników dla różnych grup. Rodzaje uprzedzeń obejmują uprzedzenia selekcyjne, uprzedzenia ochotników i uprzedzenia narzędziowe.
Uprzedzenia w zbiorach danych lub [uprzedzenia w zbieraniu danych](http://researcharticles.com/index.php/bias-in-data-collection-in-research/) dotyczą wyboru _niereprezentatywnego_ podzbioru danych do rozwoju algorytmu, co może prowadzić do potencjalnej niesprawiedliwości w wynikach dla różnych grup. Rodzaje uprzedzeń obejmują uprzedzenia w wyborze lub próbkowaniu, uprzedzenia ochotników i uprzedzenia narzędzi.
Pytania do rozważenia:
* Czy zrekrutowaliśmy reprezentatywny zestaw podmiotów danych?
* Czy przetestowaliśmy nasz zebrany lub kuratorowany zbiór danych pod kątem różnych uprzedzeń?
* Czy możemy złagodzić lub usunąć wykryte uprzedzenia?
* Czy możemy złagodzić lub usunąć odkryte uprzedzenia?
#### 2.7 Jakość danych
[Jakość danych](https://lakefs.io/data-quality-testing/) odnosi się do ważności kuratorowanego zbioru danych używanego do rozwoju naszych algorytmów, sprawdzając, czy cechy i rekordy spełniają wymagania dotyczące poziomu dokładności i spójności potrzebnego do naszego celu AI.
[Jakość danych](https://lakefs.io/data-quality-testing/) odnosi się do ważności kuratorowanego zbioru danych używanego do rozwoju naszych algorytmów, sprawdzając, czy cechy i rekordy spełniają wymagania dotyczące poziomu dokładności i spójności potrzebnego dla naszego celu AI.
Pytania do rozważenia:
* Czy uchwyciliśmy ważne _cechy_ dla naszego przypadku użycia?
* Czy
[Algorithmiczna Sprawiedliwość](https://towardsdatascience.com/what-is-algorithm-fairness-3182e161cf9f) sprawdza, czy projekt algorytmu systematycznie dyskryminuje określone podgrupy osób, co prowadzi do [potencjalnych szkód](https://docs.microsoft.com/en-us/azure/machine-learning/concept-fairness-ml) w zakresie _alokacji_ (gdzie zasoby są odmawiane lub wstrzymywane dla tej grupy) oraz _jakości usług_ (gdzie AI jest mniej dokładne dla niektórych podgrup w porównaniu do innych).
Pytania do rozważ
[Algorithm Fairness](https://towardsdatascience.com/what-is-algorithm-fairness-3182e161cf9f) sprawdza, czy projekt algorytmu systematycznie dyskryminuje określone podgrupy osób, co prowadzi do [potencjalnych szkód](https://docs.microsoft.com/en-us/azure/machine-learning/concept-fairness-ml) w _alokacji_ (gdzie zasoby są odmawiane lub wstrzymywane dla tej grupy) oraz _jakości usług_ (gdzie AI jest mniej dokładne dla niektórych podgrup niż dla innych).
Pytania do rozważenia:
Pytania, które warto tutaj rozważyć:
* Czy oceniliśmy dokładność modelu dla różnych podgrup i warunków?
* Czy przeanalizowaliśmy system pod kątem potencjalnych szkód (np. stereotypizacji)?
* Czy możemy zmodyfikować dane lub ponownie wytrenować modele, aby zminimalizować zidentyfikowane szkody?
Odkryj zasoby, takie jak [listy kontrolne AI Fairness](https://query.prod.cms.rt.microsoft.com/cms/api/am/binary/RE4t6dA), aby dowiedzieć się więcej.
Zapoznaj się z zasobami, takimi jak [AI Fairness checklists](https://query.prod.cms.rt.microsoft.com/cms/api/am/binary/RE4t6dA), aby dowiedzieć się więcej.
#### 2.9 Wprowadzanie w błąd
#### 2.9 Wprowadzenie w błąd
[Wprowadzanie w błąd w danych](https://www.sciencedirect.com/topics/computer-science/misrepresentation) dotyczy pytania, czy komunikujemy wnioski z uczciwie zgromadzonych danych w sposób zwodniczy, aby wspierać pożądany przekaz.
[Wprowadzenie w błąd danych](https://www.sciencedirect.com/topics/computer-science/misrepresentation) dotyczy pytania, czy komunikujemy wnioski z uczciwie zgromadzonych danych w sposób zwodniczy, aby wspierać pożądany przekaz.
Pytania do rozważenia:
* Czy raportujemy niekompletne lub niedokładne dane?
Pytania, które warto tutaj rozważyć:
* Czy raportujemy niekompletne lub nieprecyzyjne dane?
* Czy wizualizujemy dane w sposób prowadzący do mylących wniosków?
* Czy stosujemy wybiórcze techniki statystyczne, aby manipulować wynikami?
* Czy stosujemy selektywne techniki statystyczne, aby manipulować wynikami?
* Czy istnieją alternatywne wyjaśnienia, które mogą prowadzić do innych wniosków?
#### 2.10 Iluzja wolnego wyboru
[Iluzja wolnego wyboru](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice) pojawia się, gdy "architektury wyboru" systemu wykorzystują algorytmy decyzyjne, aby skłonić ludzi do podjęcia preferowanego wyniku, jednocześnie dając im pozory opcji i kontroli. Te [ciemne wzorce](https://www.darkpatterns.org/) mogą powodować szkody społeczne i ekonomiczne dla użytkowników. Ponieważ decyzje użytkowników wpływają na profile behawioralne, te działania mogą potencjalnie napędzać przyszłe wybory, wzmacniając lub przedłużając skutki tych szkód.
#### 2.10 Wolny wybór
[Iluzja wolnego wyboru](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice) pojawia się, gdy "architektury wyboru" systemu wykorzystują algorytmy decyzyjne, aby nakłonić ludzi do podjęcia preferowanego działania, jednocześnie dając im pozorną kontrolę i opcje. Te [ciemne wzorce](https://www.darkpatterns.org/) mogą powodować szkody społeczne i ekonomiczne dla użytkowników. Ponieważ decyzje użytkowników wpływają na profile zachowań, te działania mogą potencjalnie napędzać przyszłe wybory, które wzmacniają lub rozszerzają skutki tych szkód.
Pytania do rozważenia:
Pytania, które warto tutaj rozważyć:
* Czy użytkownik rozumiał konsekwencje podjęcia tej decyzji?
* Czy użytkownik był świadomy (alternatywnych) opcji oraz ich zalet i wad?
* Czy użytkownik może cofnąć automatyczną lub wymuszoną decyzję później?
* Czy użytkownik może później cofnąć automatyczną lub wyniętą decyzję?
### 3. Studia przypadków
@ -175,87 +173,89 @@ Oto kilka przykładów:
| Wyzwanie etyczne | Studium przypadku |
|--- |--- |
| **Świadoma zgoda** | 1972 - [Badanie kiły w Tuskegee](https://en.wikipedia.org/wiki/Tuskegee_Syphilis_Study) - Afroamerykańscy mężczyźni uczestniczący w badaniu zostali zwiedzeni obietnicą darmowej opieki medycznej, podczas gdy badacze nie poinformowali ich o diagnozie ani o dostępności leczenia. Wielu uczestników zmarło, a ich partnerzy lub dzieci zostali dotknięci; badanie trwało 40 lat. |
| **Prywatność danych** | 2007 - [Nagroda Netflixa za dane](https://www.wired.com/2007/12/why-anonymous-data-sometimes-isnt/) udostępniła badaczom _10 milionów zanonimizowanych ocen filmów od 50 tysięcy klientów_, aby poprawić algorytmy rekomendacji. Jednak badacze byli w stanie powiązać zanonimizowane dane z danymi osobowymi w _zewnętrznych zbiorach danych_ (np. komentarze na IMDb), skutecznie "deanonimizując" niektórych subskrybentów Netflixa.|
| **Stronniczość w zbieraniu danych** | 2013 - Miasto Boston [opracowało Street Bump](https://www.boston.gov/transportation/street-bump), aplikację pozwalającą obywatelom zgłaszać dziury w drogach, co miało dostarczyć lepszych danych o drogach. Jednak [osoby z niższych grup dochodowych miały mniejszy dostęp do samochodów i telefonów](https://hbr.org/2013/04/the-hidden-biases-in-big-data), co sprawiło, że ich problemy drogowe były niewidoczne w tej aplikacji. Twórcy współpracowali z akademikami, aby rozwiązać problemy z _równym dostępem i cyfrowymi podziałami_ w celu zapewnienia sprawiedliwości. |
| **Sprawiedliwość algorytmiczna** | 2018 - Badanie MIT [Gender Shades](http://gendershades.org/overview.html) oceniło dokładność produktów AI klasyfikujących płeć, ujawniając luki w dokładności dla kobiet i osób o innym kolorze skóry. [Karta Apple z 2019 roku](https://www.wired.com/story/the-apple-card-didnt-see-genderand-thats-the-problem/) wydawała się oferować mniejsze limity kredytowe kobietom niż mężczyznom. Oba przypadki ilustrują problemy z uprzedzeniami algorytmicznymi prowadzącymi do szkód społeczno-ekonomicznych.|
| **Wprowadzanie w błąd w danych** | 2020 - [Departament Zdrowia Publicznego w Georgii opublikował wykresy COVID-19](https://www.vox.com/covid-19-coronavirus-us-response-trump/2020/5/18/21262265/georgia-covid-19-cases-declining-reopening), które wydawały się wprowadzać obywateli w błąd co do trendów w potwierdzonych przypadkach poprzez niechronologiczne uporządkowanie osi x. To ilustruje wprowadzanie w błąd za pomocą trików wizualizacyjnych. |
| **Iluzja wolnego wyboru** | 2020 - Aplikacja edukacyjna [ABCmouse zapłaciła 10 milionów dolarów w ramach ugody z FTC](https://www.washingtonpost.com/business/2020/09/04/abcmouse-10-million-ftc-settlement/), gdzie rodzice byli zmuszani do opłacania subskrypcji, których nie mogli anulować. To ilustruje ciemne wzorce w architekturach wyboru, gdzie użytkownicy byli skłaniani do potencjalnie szkodliwych decyzji. |
| **Prywatność danych i prawa użytkowników** | 2021 - [Wyciek danych z Facebooka](https://www.npr.org/2021/04/09/986005820/after-data-breach-exposes-530-million-facebook-says-it-will-not-notify-users) ujawnił dane 530 milionów użytkowników, co skutkowało ugodą z FTC na kwotę 5 miliardów dolarów. Jednak Facebook odmówił powiadomienia użytkowników o wycieku, naruszając ich prawa dotyczące przejrzystości danych i dostępu. |
| **Świadoma zgoda** | 1972 - [Tuskegee Syphilis Study](https://en.wikipedia.org/wiki/Tuskegee_Syphilis_Study) - Afroamerykańscy mężczyźni, którzy uczestniczyli w badaniu, zostali obiecani darmową opieką medyczną, _ale zostali oszukani_ przez badaczy, którzy nie poinformowali ich o diagnozie ani o dostępności leczenia. Wielu uczestników zmarło, a ich partnerzy lub dzieci zostali dotknięci; badanie trwało 40 lat. |
| **Prywatność danych** | 2007 - [Netflix data prize](https://www.wired.com/2007/12/why-anonymous-data-sometimes-isnt/) udostępniło badaczom _10M zanonimizowanych ocen filmów od 50K klientów_, aby pomóc w ulepszaniu algorytmów rekomendacji. Jednak badacze byli w stanie powiązać zanonimizowane dane z danymi osobowymi w _zewnętrznych zbiorach danych_ (np. komentarze IMDb), skutecznie "deanonimizując" niektórych subskrybentów Netflixa.|
| **Stronniczość w zbieraniu danych** | 2013 - Miasto Boston [opracowało Street Bump](https://www.boston.gov/transportation/street-bump), aplikację pozwalającą obywatelom zgłaszać dziury w drogach, dostarczając miastu lepszych danych o drogach. Jednak [osoby z niższych grup dochodowych miały mniejszy dostęp do samochodów i telefonów](https://hbr.org/2013/04/the-hidden-biases-in-big-data), co sprawiło, że ich problemy drogowe były niewidoczne w tej aplikacji. Twórcy współpracowali z akademikami, aby rozwiązać problemy _równego dostępu i cyfrowych podziałów_ dla sprawiedliwości. |
| **Sprawiedliwość algorytmiczna** | 2018 - MIT [Gender Shades Study](http://gendershades.org/overview.html) oceniło dokładność produktów AI klasyfikujących płeć, ujawniając luki w dokładności dla kobiet i osób o ciemniejszym kolorze skóry. [Apple Card z 2019 roku](https://www.wired.com/story/the-apple-card-didnt-see-genderand-thats-the-problem/) wydawała się oferować mniej kredytu kobietom niż mężczyznom. Oba przypadki ilustrują problemy z uprzedzeniami algorytmicznymi prowadzącymi do szkód społeczno-ekonomicznych.|
| **Wprowadzenie w błąd danych** | 2020 - [Georgia Department of Public Health opublikowało wykresy COVID-19](https://www.vox.com/covid-19-coronavirus-us-response-trump/2020/5/18/21262265/georgia-covid-19-cases-declining-reopening), które wydawały się wprowadzać obywateli w błąd co do trendów w potwierdzonych przypadkach poprzez niechronologiczne uporządkowanie osi x. To ilustruje wprowadzenie w błąd poprzez sztuczki wizualizacyjne. |
| **Iluzja wolnego wyboru** | 2020 - Aplikacja edukacyjna [ABCmouse zapłaciła 10M USD, aby rozstrzygnąć skargę FTC](https://www.washingtonpost.com/business/2020/09/04/abcmouse-10-million-ftc-settlement/), gdzie rodzice zostali zmuszeni do płacenia za subskrypcje, których nie mogli anulować. To ilustruje ciemne wzorce w architekturach wyboru, gdzie użytkownicy zostali nakłonieni do potencjalnie szkodliwych decyzji. |
| **Prywatność danych i prawa użytkowników** | 2021 - Facebook [Data Breach](https://www.npr.org/2021/04/09/986005820/after-data-breach-exposes-530-million-facebook-says-it-will-not-notify-users) ujawniło dane 530M użytkowników, co skutkowało ugodą w wysokości 5B USD z FTC. Jednak odmówiło powiadomienia użytkowników o naruszeniu, naruszając prawa użytkowników dotyczące przejrzystości danych i dostępu. |
Chcesz poznać więcej studiów przypadków? Sprawdź te zasoby:
* [Ethics Unwrapped](https://ethicsunwrapped.utexas.edu/case-studies) - dylematy etyczne w różnych branżach.
* [Kurs etyki w nauce o danych](https://www.coursera.org/learn/data-science-ethics#syllabus) - omówienie kluczowych studiów przypadków.
* [Gdzie popełniono błędy](https://deon.drivendata.org/examples/) - lista kontrolna Deon z przykładami.
* [Data Science Ethics course](https://www.coursera.org/learn/data-science-ethics#syllabus) - omówienie kluczowych studiów przypadków.
* [Where things have gone wrong](https://deon.drivendata.org/examples/) - lista kontrolna Deon z przykładami.
> 🚨 Pomyśl o studiach przypadków, które widziałeś - czy doświadczyłeś lub byłeś dotknięty podobnym wyzwaniem etycznym w swoim życiu? Czy możesz wymienić przynajmniej jedno inne studium przypadku ilustrujące jedno z omawianych wyzwań etycznych?
> 🚨 Zastanów się nad studiami przypadków, które widziałeś - czy doświadczyłeś lub byłeś dotknięty podobnym wyzwaniem etycznym w swoim życiu? Czy możesz wymyślić co najmniej jedno inne studium przypadku, które ilustruje jedno z wyzwań etycznych omówionych w tej sekcji?
## Etyka stosowana
## Zastosowanie etyki
Omówiliśmy koncepcje etyczne, wyzwania i studia przypadków w kontekstach rzeczywistych. Ale jak zacząć _stosować_ zasady i praktyki etyczne w naszych projektach? I jak _operacjonalizować_ te praktyki dla lepszego zarządzania? Przyjrzyjmy się kilku rzeczywistym rozwiązaniom:
Omówiliśmy koncepcje etyczne, wyzwania i studia przypadków w kontekstach rzeczywistych. Ale jak zacząć _stosować_ zasady i praktyki etyczne w naszych projektach? I jak _operacjonalizować_ te praktyki dla lepszego zarządzania? Przyjrzyjmy się kilku rozwiązaniom praktycznym:
### 1. Kodeksy zawodowe
Kodeksy zawodowe oferują jedną z opcji dla organizacji, aby "zachęcać" członków do wspierania ich zasad etycznych i misji. Kodeksy są _moralnymi wytycznymi_ dotyczącymi zachowań zawodowych, pomagającymi pracownikom lub członkom podejmować decyzje zgodne z zasadami organizacji. Są one skuteczne tylko w takim stopniu, w jakim członkowie dobrowolnie ich przestrzegają; jednak wiele organizacji oferuje dodatkowe nagrody i kary, aby motywować członków do przestrzegania kodeksu.
Kodeksy zawodowe oferują jedną z opcji dla organizacji, aby "zachęcić" członków do wspierania ich zasad etycznych i misji. Kodeksy są _moralnymi wytycznymi_ dla zachowań zawodowych, pomagając pracownikom lub członkom podejmować decyzje zgodne z zasadami organizacji. Są skuteczne tylko w przypadku dobrowolnego przestrzegania przez członków; jednak wiele organizacji oferuje dodatkowe nagrody i kary, aby motywować członków do przestrzegania zasad.
Przykłady obejmują:
* [Kodeks etyki Oxford Munich](http://www.code-of-ethics.org/code-of-conduct/)
* [Kodeks postępowania Stowarzyszenia Nauki o Danych](http://datascienceassn.org/code-of-conduct.html) (stworzony w 2013 roku)
* [Kodeks etyki i postępowania zawodowego ACM](https://www.acm.org/code-of-ethics) (od 1993 roku)
* [Oxford Munich](http://www.code-of-ethics.org/code-of-conduct/) Kodeks Etyki
* [Data Science Association](http://datascienceassn.org/code-of-conduct.html) Kodeks Postępowania (utworzony w 2013 roku)
* [ACM Code of Ethics and Professional Conduct](https://www.acm.org/code-of-ethics) (od 1993 roku)
> 🚨 Czy należysz do organizacji inżynierskiej lub związanej z nauką o danych? Sprawdź ich stronę, aby zobaczyć, czy definiują kodeks etyki zawodowej. Co mówi on o ich zasadach etycznych? Jak "zachęcają" członków do przestrzegania kodeksu?
> 🚨 Czy należysz do organizacji zawodowej związanej z inżynierią lub nauką o danych? Sprawdź ich stronę, aby zobaczyć, czy definiują kodeks etyki zawodowej. Co mówi to o ich zasadach etycznych? Jak "zachęcają" członków do przestrzegania kodeksu?
### 2. Listy kontrolne etyki
Podczas gdy kodeksy zawodowe definiują wymagane _zachowania etyczne_ praktyków, [mają znane ograniczenia](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md) w egzekwowaniu, szczególnie w dużych projektach. Zamiast tego wielu ekspertów ds. nauki o danych [zaleca stosowanie list kontrolnych](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md), które mogą **połączyć zasady z praktykami** w bardziej deterministyczny i wykonalny sposób.
Podczas gdy kodeksy zawodowe definiują wymagane _zachowania etyczne_ od praktyków, [mają znane ograniczenia](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md) w egzekwowaniu, szczególnie w projektach na dużą skalę. Zamiast tego wielu ekspertów ds. nauki o danych [zaleca listy kontrolne](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md), które mogą **połączyć zasady z praktykami** w bardziej deterministyczny i wykonalny sposób.
Listy kontrolne przekształcają pytania w zadania "tak/nie", które można operacjonalizować, umożliwiając ich śledzenie jako część standardowych procesów wydawania produktów.
Listy kontrolne przekształcają pytania w zadania "tak/nie", które można operacjonalizować, umożliwiając ich śledzenie jako część standardowych procesów wydania produktu.
Przykłady obejmują:
* [Deon](https://deon.drivendata.org/) - ogólna lista kontrolna etyki danych stworzona na podstawie [rekomendacji branżowych](https://deon.drivendata.org/#checklist-citations) z narzędziem wiersza poleceń do łatwej integracji.
* [Lista kontrolna audytu prywatności](https://cyber.harvard.edu/ecommerce/privacyaudit.html) - zapewnia ogólne wskazówki dotyczące praktyk zarządzania informacjami z perspektywy prawnej i społecznej.
* [Lista kontrolna AI Fairness](https://www.microsoft.com/en-us/research/project/ai-fairness-checklist/) - stworzona przez praktyków AI, aby wspierać przyjęcie i integrację sprawdzania sprawiedliwości w cyklach rozwoju AI.
* [22 pytania dotyczące etyki w danych i AI](https://medium.com/the-organization/22-questions-for-ethics-in-data-and-ai-efb68fd19429) - bardziej otwarta struktura, zaprojektowana do wstępnej eksploracji problemów etycznych w projektowaniu, wdrażaniu i kontekstach organizacyjnych.
* [Privacy Audit Checklist](https://cyber.harvard.edu/ecommerce/privacyaudit.html) - zapewnia ogólne wskazówki dotyczące praktyk zarządzania informacjami z perspektywy prawnej i społecznej.
* [AI Fairness Checklist](https://www.microsoft.com/en-us/research/project/ai-fairness-checklist/) - stworzona przez praktyków AI, aby wspierać przyjęcie i integrację kontroli sprawiedliwości w cyklach rozwoju AI.
* [22 questions for ethics in data and AI](https://medium.com/the-organization/22-questions-for-ethics-in-data-and-ai-efb68fd19429) - bardziej otwarta struktura, zaprojektowana do wstępnej eksploracji problemów etycznych w projektowaniu, wdrażaniu i kontekstach organizacyjnych.
### 3. Regulacje etyczne
Etyka dotyczy definiowania wspólnych wartości i dobrowolnego postępowania zgodnie z nimi. **Zgodność** dotyczy _przestrzegania prawa_, jeśli i gdzie jest ono zdefiniowane. **Zarządzanie** obejmuje szeroko wszystkie sposoby, w jakie organizacje działają, aby egzekwować zasady etyczne i przestrzegać ustanowionych przepisów.
Etyka dotyczy definiowania wspólnych wartości i dobrowolnego postępowania właściwie. **Zgodność** dotyczy _przestrzegania prawa_, jeśli jest ono określone. **Zarządzanie** obejmuje szeroko wszystkie sposoby, w jakie organizacje działają, aby egzekwować zasady etyczne i przestrzegać ustanowionych przepisów.
Obecnie zarządzanie przyjmuje dwie formy w organizacjach. Po pierwsze, chodzi o definiowanie zasad **etycznego AI** i ustanawianie praktyk, które umożliwiają ich wdrożenie we wszystkich projektach związanych z AI w organizacji. Po drugie, chodzi o przestrzeganie wszystkich rządowych regulacji dotyczących **ochrony danych** w regionach, w których organizacja działa.
Obecnie zarządzanie przyjmuje dwie formy w organizacjach. Po pierwsze, chodzi o definiowanie zasad **etycznego AI** i ustanawianie praktyk, które operacjonalizują ich przyjęcie we wszystkich projektach związanych z AI w organizacji. Po drugie, chodzi o przestrzeganie wszystkich rządowych **regulacji ochrony danych** dla regionów, w których działa.
Przykłady regulacji dotyczących ochrony danych i prywatności:
Przykłady regulacji ochrony danych i prywatności:
* `1974`, [Ustawa o prywatności w USA](https://www.justice.gov/opcl/privacy-act-1974) - reguluje _federalne_ zbieranie, wykorzystywanie i ujawnianie danych osobowych.
* `1996`, [Ustawa o przenośności i odpowiedzialności w ubezpieczeniach zdrowotnych w USA (HIPAA)](https://www.cdc.gov/phlp/publications/topic/hipaa.html) - chroni dane osobowe dotyczące zdrowia.
* `1998`, [Ustawa o ochronie prywatności dzieci w Internecie w USA (COPPA)](https://www.ftc.gov/enforcement/rules/rulemaking-regulatory-reform-proceedings/childrens-online-privacy-protection-rule) - chroni prywatność danych dzieci poniżej 13 roku życia.
* `2018`, [Ogólne rozporządzenie o ochronie danych (GDPR)](https://gdpr-info.eu/) - zapewnia prawa użytkowników, ochronę danych i prywatność.
* `2018`, [Ustawa o ochronie prywatności konsumentów w Kalifornii (CCPA)](https://www.oag.ca.gov/privacy/ccpa) - daje konsumentom większe _prawa_ dotyczące ich danych osobowych.
* `2021`, Chińska [Ustawa o ochronie danych osobowych](https://www.reuters.com/world/china/china-passes-new-personal-data-privacy-law-take-effect-nov-1-2021-08-20/) - jedna z najsilniejszych regulacji dotyczących prywatności danych online na świecie.
* `1974`, [US Privacy Act](https://www.justice.gov/opcl/privacy-act-1974) - reguluje _federalne_ zbieranie, użycie i ujawnianie danych osobowych.
* `1996`, [US Health Insurance Portability & Accountability Act (HIPAA)](https://www.cdc.gov/phlp/publications/topic/hipaa.html) - chroni dane osobowe dotyczące zdrowia.
* `1998`, [US Children's Online Privacy Protection Act (COPPA)](https://www.ftc.gov/enforcement/rules/rulemaking-regulatory-reform-proceedings/childrens-online-privacy-protection-rule) - chroni prywatność danych dzieci poniżej 13 roku życia.
* `2018`, [General Data Protection Regulation (GDPR)](https://gdpr-info.eu/) - zapewnia prawa użytkowników, ochronę danych i prywatność.
* `2018`, [California Consumer Privacy Act (CCPA)](https://www.oag.ca.gov/privacy/ccpa) daje konsumentom więcej _praw_ dotyczących ich (osobistych) danych.
* `2021`, [Chińska ustawa o ochronie danych osobowych](https://www.reuters.com/world/china/china-passes-new-personal-data-privacy-law-take-effect-nov-1-2021-08-20/) właśnie została uchwalona, tworząc jedne z najsilniejszych regulacji dotyczących prywatności danych online na świecie.
> 🚨 Ogólne rozporządzenie o ochronie danych (GDPR) zdefiniowane przez Unię Europejską pozostaje jednym z najbardziej wpływowych regulacji dotyczących prywatności danych. Czy wiesz, że definiuje również [8 praw użytkowników](https://www.freeprivacypolicy.com/blog/8-user-rights-gdpr), aby chronić cyfrową prywatność i dane osobowe obywateli? Dowiedz się, czym są te prawa i dlaczego są ważne.
> 🚨 Unia Europejska zdefiniowała GDPR (General Data Protection Regulation), które pozostaje jednym z najbardziej wpływowych regulacji dotyczących prywatności danych dzisiaj. Czy wiesz, że definiuje również [8 praw użytkowników](https://www.freeprivacypolicy.com/blog/8-user-rights-gdpr), aby chronić cyfrową prywatność i dane osobowe obywateli? Dowiedz się, czym są te prawa i dlaczego są ważne.
### 4. Kultura etyki
Należy zauważyć, że istnieje niematerialna luka między _zgodnością_ (robieniem wystarczająco dużo, aby spełnić "literę prawa") a rozwiązywaniem [systemowych problemów](https://www.coursera.org/learn/data-science-ethics/home/week/4) (takich jak skostnienie, asymetria informacji i niesprawiedliwość dystrybucyjna), które mogą przyspieszyć wykorzystanie AI w szkodliwy sposób.
Należy zauważyć, że istnieje niematerialna luka między _zgodnością_ (robieniem wystarczająco dużo, aby spełnić "literę prawa") a rozwiązywaniem [systemowych problemów](https://www.coursera.org/learn/data-science-ethics/home/week/4) (takich jak utrwalanie, asymetria informacji i niesprawiedliwość dystrybucyjna), które mogą przyspieszyć uzbrojenie AI.
To drugie wymaga [współpracy w definiowaniu kultur etycznych](https://towardsdatascience.com/why-ai-ethics-requires-a-culture-driven-approach-26f451afa29f), które budują emocjonalne więzi i spójne wspólne wartości _w organizacjach_ w branży. Wymaga to bardziej [sformalizowanych kultur etyki danych](https://www.codeforamerica.org/news/formalizing-an-ethical-data-culture/) w organizacjach - umożliwiając _każdemu_ [pociągnięcie za sznur Andon](https://en.wikipedia.org/wiki/Andon_(manufacturing)) (aby zgłosić obawy etyczne na wczesnym etapie procesu) i uczynienie _ocen etycznych_ (np. w rekrutacji) kluczowym kryterium formowania zespołów w projektach AI.
To drugie wymaga [współpracy w definiowaniu kultur etycznych](https://towardsdatascience.com/why-ai-ethics-requires-a-culture-driven-approach-26f451afa29f), które budują emocjonalne więzi i spójne wspólne wartości _w organizacjach_ w branży. Wymaga to bardziej [sformalizowanych kultur etyki danych](https://www.codeforamerica.org/news/formalizing-an-ethical-data-culture/) w organizacjach - pozwalając _każdemu_ [pociągnąć za sznur Andon](https://en.wikipedia.org/wiki/Andon_(manufacturing)) (aby zgłosić obawy etyczne na wczesnym etapie procesu) i czyniąc _oceny etyczne_ (np. przy zatrudnianiu) kluczowym kryterium formowania zespołów w projektach AI.
---
## [Quiz po wykładzie](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/3) 🎯
## [Quiz po wykładzie](https://ff-quizzes.netlify.app/en/ds/) 🎯
## Przegląd i samodzielna nauka
Kursy i książki pomagają zrozumieć podstawowe koncepcje etyczne i wyzwania, podczas gdy studia przypadków i narzędzia pomagają w stosowaniu praktyk etycznych w rzeczywistych kontekstach. Oto kilka zasobów na początek:
Kursy i książki pomagają w zrozumieniu podstawowych koncepcji etycznych i wyzwań, podczas gdy studia przypadków i narzędzia pomagają w stosowaniu praktyk etycznych w rzeczywistych kontekstach. Oto kilka zasobów na początek:
* [Machine Learning For Beginners](https://github.com/microsoft/ML-For-Beginners/blob/main/1-Introduction/3-fairness/README.md) - lekcja o sprawiedliwości, od Microsoft.
* [Zasady Odpowiedzialnej Sztucznej Inteligencji](https://docs.microsoft.com/en-us/learn/modules/responsible-ai-principles/) - darmowa ścieżka edukacyjna od Microsoft Learn.
* [Etyka i Data Science](https://resources.oreilly.com/examples/0636920203964) - EBook od O'Reilly (M. Loukides, H. Mason i in.).
* [Etyka w Data Science](https://www.coursera.org/learn/data-science-ethics#syllabus) - kurs online Uniwersytetu Michigan.
* [Ethics Unwrapped](https://ethicsunwrapped.utexas.edu/case-studies) - studia przypadków z Uniwersytetu Teksasu.
* [Uczenie maszynowe dla początkujących](https://github.com/microsoft/ML-For-Beginners
* [Zasady Odpowiedzialnej AI](https://docs.microsoft.com/en-us/learn/modules/responsible-ai-principles/) - darmowy kurs edukacyjny od Microsoft Learn.
* [Etyka i Data Science](https://resources.oreilly.com/examples/0636920203964) - EBook od O'Reilly (M. Loukides, H. Mason i in.)
* [Etyka w Data Science](https://www.coursera.org/learn/data-science-ethics#syllabus) - kurs online od Uniwersytetu Michigan.
* [Etyka Rozwinięta](https://ethicsunwrapped.utexas.edu/case-studies) - studia przypadków od Uniwersytetu Teksasu.
# Zadanie
# Zadanie
[Napisz studium przypadku dotyczące etyki danych](assignment.md)
[Napisz studium przypadku dotyczące etyki danych](assignment.md)
---
**Zastrzeżenie**:
Ten dokument został przetłumaczony za pomocą usługi tłumaczenia AI [Co-op Translator](https://github.com/Azure/co-op-translator). Chociaż dokładamy wszelkich starań, aby tłumaczenie było precyzyjne, prosimy pamiętać, że automatyczne tłumaczenia mogą zawierać błędy lub nieścisłości. Oryginalny dokument w jego rodzimym języku powinien być uznawany za wiarygodne źródło. W przypadku informacji o kluczowym znaczeniu zaleca się skorzystanie z profesjonalnego tłumaczenia wykonanego przez człowieka. Nie ponosimy odpowiedzialności za jakiekolwiek nieporozumienia lub błędne interpretacje wynikające z użycia tego tłumaczenia.
Ten dokument został przetłumaczony za pomocą usługi tłumaczenia AI [Co-op Translator](https://github.com/Azure/co-op-translator). Chociaż dokładamy wszelkich starań, aby tłumaczenie było precyzyjne, prosimy pamiętać, że automatyczne tłumaczenia mogą zawierać błędy lub nieścisłości. Oryginalny dokument w jego rodzimym języku powinien być uznawany za źródło autorytatywne. W przypadku informacji o kluczowym znaczeniu zaleca się skorzystanie z profesjonalnego tłumaczenia przez człowieka. Nie ponosimy odpowiedzialności za jakiekolwiek nieporozumienia lub błędne interpretacje wynikające z użycia tego tłumaczenia.

@ -1,8 +1,8 @@
<!--
CO_OP_TRANSLATOR_METADATA:
{
"original_hash": "8796f41f566a0a8ebb72863a83d558ed",
"translation_date": "2025-08-24T21:15:34+00:00",
"original_hash": "3a34157cc63516eba97c89a0b2f8c3e6",
"translation_date": "2025-09-03T21:15:45+00:00",
"source_file": "1-Introduction/02-ethics/README.md",
"language_code": "pt"
}
@ -17,11 +17,11 @@ CO_OP_TRANSLATOR_METADATA:
Somos todos cidadãos de dados vivendo num mundo dataficado.
As tendências de mercado indicam que, até 2022, 1 em cada 3 grandes organizações comprará e venderá os seus dados através de [Mercados e Bolsas](https://www.gartner.com/smarterwithgartner/gartner-top-10-trends-in-data-and-analytics-for-2020/) online. Como **Desenvolvedores de Aplicações**, será mais fácil e barato integrar insights baseados em dados e automação orientada por algoritmos nas experiências diárias dos utilizadores. Mas, à medida que a IA se torna mais presente, também será necessário compreender os potenciais danos causados pela [armação](https://www.youtube.com/watch?v=TQHs8SA1qpk) desses algoritmos em larga escala.
As tendências de mercado indicam que, até 2022, 1 em cada 3 grandes organizações comprará e venderá os seus dados através de [Mercados e Bolsas](https://www.gartner.com/smarterwithgartner/gartner-top-10-trends-in-data-and-analytics-for-2020/) online. Como **Desenvolvedores de Aplicações**, será mais fácil e barato integrar insights baseados em dados e automação orientada por algoritmos nas experiências diárias dos utilizadores. Mas, à medida que a IA se torna mais presente, também precisaremos compreender os potenciais danos causados pela [armação](https://www.youtube.com/watch?v=TQHs8SA1qpk) desses algoritmos em larga escala.
As tendências também indicam que criaremos e consumiremos mais de [180 zettabytes](https://www.statista.com/statistics/871513/worldwide-data-created/) de dados até 2025. Como **Cientistas de Dados**, isso nos dá níveis sem precedentes de acesso a dados pessoais. Isso significa que podemos construir perfis comportamentais de utilizadores e influenciar a tomada de decisões de formas que criam uma [ilusão de escolha livre](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice), enquanto potencialmente direcionamos os utilizadores para resultados que preferimos. Isso também levanta questões mais amplas sobre privacidade de dados e proteção dos utilizadores.
A ética de dados é agora _uma barreira necessária_ para a ciência e engenharia de dados, ajudando-nos a minimizar potenciais danos e consequências não intencionais das nossas ações orientadas por dados. O [Ciclo de Hype da Gartner para IA](https://www.gartner.com/smarterwithgartner/2-megatrends-dominate-the-gartner-hype-cycle-for-artificial-intelligence-2020/) identifica tendências relevantes em ética digital, IA responsável e governança de IA como motores-chave para megatendências maiores em torno da _democratização_ e _industrialização_ da IA.
A ética de dados é agora _uma barreira necessária_ para a ciência e engenharia de dados, ajudando-nos a minimizar danos potenciais e consequências não intencionais das nossas ações orientadas por dados. O [Ciclo de Hype da Gartner para IA](https://www.gartner.com/smarterwithgartner/2-megatrends-dominate-the-gartner-hype-cycle-for-artificial-intelligence-2020/) identifica tendências relevantes em ética digital, IA responsável e governança de IA como fatores-chave para megatendências maiores em torno da _democratização_ e _industrialização_ da IA.
![Ciclo de Hype da Gartner para IA - 2020](https://images-cdn.newscred.com/Zz1mOWJhNzlkNDA2ZTMxMWViYjRiOGFiM2IyMjQ1YmMwZQ==)
@ -39,19 +39,19 @@ A palavra "ética" vem da [palavra grega "ethikos"](https://en.wikipedia.org/wik
**Ética de Dados** é um [novo ramo da ética](https://royalsocietypublishing.org/doi/full/10.1098/rsta.2016.0360#sec-1) que "estuda e avalia problemas morais relacionados a _dados, algoritmos e práticas correspondentes_". Aqui, **"dados"** foca em ações relacionadas à geração, gravação, curadoria, processamento, disseminação, partilha e uso; **"algoritmos"** foca em IA, agentes, aprendizagem automática e robôs; e **"práticas"** foca em tópicos como inovação responsável, programação, hacking e códigos de ética.
**Ética Aplicada** é a [aplicação prática de considerações morais](https://en.wikipedia.org/wiki/Applied_ethics). É o processo de investigar ativamente questões éticas no contexto de _ações, produtos e processos do mundo real_, e tomar medidas corretivas para garantir que permaneçam alinhados com os valores éticos definidos.
**Ética Aplicada** é a [aplicação prática de considerações morais](https://en.wikipedia.org/wiki/Applied_ethics). É o processo de investigar ativamente questões éticas no contexto de _ações, produtos e processos do mundo real_, e tomar medidas corretivas para garantir que permaneçam alinhados com os nossos valores éticos definidos.
**Cultura Ética** trata de [_operacionalizar_ a ética aplicada](https://hbr.org/2019/05/how-to-design-an-ethical-organization) para garantir que os nossos princípios e práticas éticas sejam adotados de forma consistente e escalável em toda a organização. Culturas éticas bem-sucedidas definem princípios éticos em toda a organização, fornecem incentivos significativos para conformidade e reforçam normas éticas ao encorajar e amplificar comportamentos desejados em todos os níveis da organização.
## Conceitos de Ética
Nesta secção, discutiremos conceitos como **valores compartilhados** (princípios) e **desafios éticos** (problemas) para ética de dados - e exploraremos **estudos de caso** que ajudam a compreender esses conceitos em contextos do mundo real.
Nesta seção, discutiremos conceitos como **valores compartilhados** (princípios) e **desafios éticos** (problemas) para ética de dados - e exploraremos **estudos de caso** que ajudam a compreender esses conceitos em contextos do mundo real.
### 1. Princípios Éticos
Toda estratégia de ética de dados começa por definir _princípios éticos_ - os "valores compartilhados" que descrevem comportamentos aceitáveis e orientam ações conformes nos nossos projetos de dados e IA. Pode-se definir esses princípios a nível individual ou de equipa. No entanto, a maioria das grandes organizações delineia esses princípios numa declaração de missão ou estrutura de _IA ética_ definida a nível corporativo e aplicada de forma consistente em todas as equipas.
Toda estratégia de ética de dados começa por definir _princípios éticos_ - os "valores compartilhados" que descrevem comportamentos aceitáveis e orientam ações conformes nos nossos projetos de dados e IA. Pode-se defini-los a nível individual ou de equipa. No entanto, a maioria das grandes organizações delineia isso numa declaração de missão ou estrutura de _IA ética_ definida a nível corporativo e aplicada consistentemente em todas as equipas.
**Exemplo:** A declaração de missão de [IA Responsável](https://www.microsoft.com/en-us/ai/responsible-ai) da Microsoft afirma: _"Estamos comprometidos com o avanço da IA orientada por princípios éticos que colocam as pessoas em primeiro lugar"_ - identificando 6 princípios éticos na estrutura abaixo:
**Exemplo:** A declaração de missão de [IA Responsável](https://www.microsoft.com/en-us/ai/responsible-ai) da Microsoft diz: _"Estamos comprometidos com o avanço da IA orientada por princípios éticos que colocam as pessoas em primeiro lugar"_ - identificando 6 princípios éticos na estrutura abaixo:
![IA Responsável na Microsoft](https://docs.microsoft.com/en-gb/azure/cognitive-services/personalizer/media/ethics-and-responsible-use/ai-values-future-computed.png)
@ -60,7 +60,7 @@ Vamos explorar brevemente esses princípios. _Transparência_ e _responsabilidad
* [**Responsabilidade**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) torna os profissionais _responsáveis_ pelas suas operações de dados e IA, e pela conformidade com esses princípios éticos.
* [**Transparência**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) garante que as ações de dados e IA sejam _compreensíveis_ (interpretáveis) para os utilizadores, explicando o quê e o porquê por trás das decisões.
* [**Justiça**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1%3aprimaryr6) - foca em garantir que a IA trate _todas as pessoas_ de forma justa, abordando quaisquer preconceitos sociotécnicos sistémicos ou implícitos nos dados e sistemas.
* [**Fiabilidade e Segurança**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - garante que a IA se comporte de forma _consistente_ com os valores definidos, minimizando potenciais danos ou consequências não intencionais.
* [**Fiabilidade e Segurança**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - garante que a IA se comporte de forma _consistente_ com valores definidos, minimizando danos potenciais ou consequências não intencionais.
* [**Privacidade e Segurança**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - trata de compreender a origem dos dados e fornecer _privacidade de dados e proteções relacionadas_ aos utilizadores.
* [**Inclusão**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - trata de projetar soluções de IA com intenção, adaptando-as para atender a uma _ampla gama de necessidades e capacidades humanas_.
@ -72,9 +72,9 @@ Depois de definir os princípios éticos, o próximo passo é avaliar as nossas
Na coleta de dados, as ações provavelmente envolverão **dados pessoais** ou informações pessoalmente identificáveis (PII) de indivíduos identificáveis. Isso inclui [diversos itens de dados não pessoais](https://ec.europa.eu/info/law/law-topic/data-protection/reform/what-personal-data_en) que, _coletivamente_, identificam um indivíduo. Os desafios éticos podem estar relacionados à _privacidade de dados_, _propriedade de dados_ e tópicos relacionados, como _consentimento informado_ e _direitos de propriedade intelectual_ dos utilizadores.
No design de algoritmos, as ações envolverão a coleta e curadoria de **conjuntos de dados**, e o uso desses dados para treinar e implementar **modelos de dados** que preveem resultados ou automatizam decisões em contextos do mundo real. Os desafios éticos podem surgir de _viés nos conjuntos de dados_, problemas de _qualidade dos dados_, _injustiça_ e _má representação_ nos algoritmos - incluindo alguns problemas que são sistémicos por natureza.
No design de algoritmos, as ações envolverão a coleta e curadoria de **conjuntos de dados**, e o uso deles para treinar e implementar **modelos de dados** que preveem resultados ou automatizam decisões em contextos do mundo real. Os desafios éticos podem surgir de _preconceitos nos conjuntos de dados_, problemas de _qualidade dos dados_, _injustiça_ e _má representação_ nos algoritmos - incluindo alguns problemas que são sistémicos por natureza.
Em ambos os casos, os desafios éticos destacam áreas onde as nossas ações podem entrar em conflito com os valores compartilhados. Para detetar, mitigar, minimizar ou eliminar essas preocupações, precisamos fazer perguntas morais "sim/não" relacionadas às nossas ações e tomar medidas corretivas conforme necessário. Vamos dar uma olhada em alguns desafios éticos e nas questões morais que eles levantam:
Em ambos os casos, os desafios éticos destacam áreas onde as nossas ações podem entrar em conflito com os nossos valores compartilhados. Para detetar, mitigar, minimizar ou eliminar essas preocupações, precisamos fazer perguntas morais "sim/não" relacionadas às nossas ações e tomar medidas corretivas conforme necessário. Vamos dar uma olhada em alguns desafios éticos e nas questões morais que eles levantam:
#### 2.1 Propriedade de Dados
@ -106,11 +106,11 @@ Questões a explorar aqui são:
#### 2.4 Privacidade de Dados
[Privacidade de dados](https://www.northeastern.edu/graduate/blog/what-is-data-privacy/) ou privacidade da informação refere-se à preservação da privacidade do utilizador e proteção da identidade do utilizador em relação a informações pessoalmente identificáveis.
[Privacidade de dados](https://www.northeastern.edu/graduate/blog/what-is-data-privacy/) ou privacidade de informações refere-se à preservação da privacidade do utilizador e proteção da identidade do utilizador em relação a informações pessoalmente identificáveis.
Questões a explorar aqui são:
* Os dados (pessoais) dos utilizadores estão protegidos contra ataques e vazamentos?
* Os dados dos utilizadores são acessíveis apenas a utilizadores e contextos autorizados?
* Os dados dos utilizadores estão acessíveis apenas a utilizadores e contextos autorizados?
* A anonimidade dos utilizadores é preservada quando os dados são partilhados ou disseminados?
* Um utilizador pode ser desidentificado de conjuntos de dados anonimizados?
@ -122,20 +122,20 @@ Questões a explorar aqui são:
* O sistema permite que os sujeitos dos dados solicitem a eliminação?
* A retirada do consentimento do utilizador deve acionar a eliminação automática?
* Os dados foram coletados sem consentimento ou por meios ilegais?
* Estamos em conformidade com as regulamentações governamentais de privacidade de dados?
* Estamos em conformidade com as regulamentações governamentais para privacidade de dados?
#### 2.6 Viés nos Conjuntos de Dados
#### 2.6 Preconceito nos Conjuntos de Dados
Viés nos conjuntos de dados ou [Viés de Coleta](http://researcharticles.com/index.php/bias-in-data-collection-in-research/) trata da seleção de um subconjunto _não representativo_ de dados para o desenvolvimento de algoritmos, criando potencial injustiça nos resultados para grupos diversos. Tipos de viés incluem viés de seleção ou amostragem, viés de voluntariado e viés de instrumentos.
Preconceito nos conjuntos de dados ou [Preconceito na Coleta](http://researcharticles.com/index.php/bias-in-data-collection-in-research/) trata da seleção de um subconjunto _não representativo_ de dados para o desenvolvimento de algoritmos, criando potencial injustiça nos resultados para grupos diversos. Tipos de preconceito incluem preconceito de seleção ou amostragem, preconceito de voluntários e preconceito de instrumentos.
Questões a explorar aqui são:
* Recrutámos um conjunto representativo de sujeitos dos dados?
* Testámos o nosso conjunto de dados coletado ou curado para vários tipos de viés?
* Podemos mitigar ou remover quaisquer vieses descobertos?
* Testámos o nosso conjunto de dados coletado ou curado para vários preconceitos?
* Podemos mitigar ou remover quaisquer preconceitos descobertos?
#### 2.7 Qualidade dos Dados
[Qualidade dos Dados](https://lakefs.io/data-quality-testing/) analisa a validade do conjunto de dados curado usado para desenvolver os nossos algoritmos, verificando se as características e os registos atendem aos requisitos para o nível de precisão e consistência necessário para o propósito da IA.
[Qualidade dos Dados](https://lakefs.io/data-quality-testing/) analisa a validade do conjunto de dados curado usado para desenvolver os nossos algoritmos, verificando se as características e os registos atendem aos requisitos para o nível de precisão e consistência necessário para o nosso propósito de IA.
Questões a explorar aqui são:
* Capturámos características válidas para o nosso caso de uso?
@ -144,112 +144,112 @@ Questões a explorar aqui são:
* As informações capturadas refletem a realidade com precisão?
#### 2.8 Justiça nos Algoritmos
[Justiça Algorítmica](https://towardsdatascience.com/what-is-algorithm-fairness-3182e161cf9f) verifica se o design do algoritmo discrimina sistematicamente subgrupos específicos de sujeitos de dados, levando a [potenciais danos](https://docs.microsoft.com/en-us/azure/machine-learning/concept-fairness-ml) na _alocação_ (quando recursos são negados ou retidos desse grupo) e na _qualidade do serviço_ (quando a IA não é tão precisa para alguns subgrupos quanto é para outros).
[Algorithm Fairness](https://towardsdatascience.com/what-is-algorithm-fairness-3182e161cf9f) verifica se o design do algoritmo discrimina sistematicamente subgrupos específicos de sujeitos de dados, levando a [danos potenciais](https://docs.microsoft.com/en-us/azure/machine-learning/concept-fairness-ml) na _distribuição_ (onde recursos são negados ou retidos para esse grupo) e na _qualidade do serviço_ (onde a IA não é tão precisa para alguns subgrupos quanto é para outros).
Perguntas a explorar aqui são:
* Avaliámos a precisão do modelo para diversos subgrupos e condições?
* Analisámos o sistema em busca de potenciais danos (por exemplo, estereótipos)?
* Avaliámos a precisão do modelo para diferentes subgrupos e condições?
* Examinámos o sistema para identificar possíveis danos (ex.: estereótipos)?
* Podemos revisar os dados ou re-treinar os modelos para mitigar os danos identificados?
Explore recursos como [checklists de Justiça em IA](https://query.prod.cms.rt.microsoft.com/cms/api/am/binary/RE4t6dA) para saber mais.
Explore recursos como [AI Fairness checklists](https://query.prod.cms.rt.microsoft.com/cms/api/am/binary/RE4t6dA) para saber mais.
#### 2.9 Distorção de Dados
#### 2.9 Deturpação
[Distorção de Dados](https://www.sciencedirect.com/topics/computer-science/misrepresentation) refere-se a questionar se estamos a comunicar insights de dados relatados de forma honesta, mas de maneira enganosa, para apoiar uma narrativa desejada.
[Deturpação de Dados](https://www.sciencedirect.com/topics/computer-science/misrepresentation) trata de questionar se estamos a comunicar insights de dados relatados de forma honesta, mas de maneira enganosa, para apoiar uma narrativa desejada.
Perguntas a explorar aqui são:
* Estamos a relatar dados incompletos ou imprecisos?
* Estamos a visualizar dados de forma a induzir conclusões enganosas?
* Estamos a reportar dados incompletos ou imprecisos?
* Estamos a visualizar dados de forma que induza conclusões enganosas?
* Estamos a usar técnicas estatísticas seletivas para manipular resultados?
* Existem explicações alternativas que possam oferecer uma conclusão diferente?
#### 2.10 Livre Escolha
A [Ilusão de Livre Escolha](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice) ocorre quando "arquiteturas de escolha" do sistema usam algoritmos de tomada de decisão para influenciar as pessoas a tomarem um resultado preferido, enquanto aparentam dar-lhes opções e controlo. Estes [padrões obscuros](https://www.darkpatterns.org/) podem causar danos sociais e económicos aos utilizadores. Como as decisões dos utilizadores impactam perfis de comportamento, estas ações podem potencialmente impulsionar escolhas futuras que amplificam ou prolongam o impacto desses danos.
#### 2.10 Escolha Livre
A [Ilusão de Escolha Livre](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice) ocorre quando "arquiteturas de escolha" do sistema utilizam algoritmos de tomada de decisão para influenciar as pessoas a tomarem um resultado preferido, enquanto aparentam dar-lhes opções e controlo. Estes [padrões obscuros](https://www.darkpatterns.org/) podem causar danos sociais e económicos aos utilizadores. Como as decisões dos utilizadores impactam os perfis de comportamento, estas ações podem potencialmente impulsionar escolhas futuras que amplificam ou prolongam o impacto desses danos.
Perguntas a explorar aqui são:
* O utilizador compreendeu as implicações de fazer essa escolha?
* O utilizador estava ciente das (alternativas) escolhas e dos prós e contras de cada uma?
* O utilizador pode reverter uma escolha automatizada ou influenciada mais tarde?
* O utilizador estava ciente das opções (alternativas) e dos prós e contras de cada uma?
* O utilizador pode reverter uma escolha automatizada ou influenciada posteriormente?
### 3. Estudos de Caso
Para colocar esses desafios éticos em contextos do mundo real, é útil analisar estudos de caso que destacam os potenciais danos e consequências para indivíduos e a sociedade, quando essas violações éticas são ignoradas.
Para colocar estes desafios éticos em contextos do mundo real, é útil analisar estudos de caso que destacam os potenciais danos e consequências para indivíduos e para a sociedade, quando tais violações éticas são ignoradas.
Aqui estão alguns exemplos:
| Desafio Ético | Estudo de Caso |
|--- |--- |
| **Consentimento Informado** | 1972 - [Estudo de Sífilis de Tuskegee](https://en.wikipedia.org/wiki/Tuskegee_Syphilis_Study) - Homens afro-americanos que participaram no estudo foram prometidos cuidados médicos gratuitos, _mas foram enganados_ por investigadores que não informaram os sujeitos sobre o diagnóstico ou a disponibilidade de tratamento. Muitos morreram e parceiros ou filhos foram afetados; o estudo durou 40 anos. |
| **Privacidade de Dados** | 2007 - O [prémio de dados da Netflix](https://www.wired.com/2007/12/why-anonymous-data-sometimes-isnt/) forneceu a investigadores _10M classificações de filmes anonimizadas de 50K clientes_ para ajudar a melhorar algoritmos de recomendação. No entanto, os investigadores conseguiram correlacionar dados anonimizados com dados pessoalmente identificáveis em _conjuntos de dados externos_ (por exemplo, comentários no IMDb), efetivamente "desanonimizando" alguns assinantes da Netflix.|
| **Viés na Coleta de Dados** | 2013 - A cidade de Boston [desenvolveu o Street Bump](https://www.boston.gov/transportation/street-bump), uma app que permitia aos cidadãos reportar buracos, fornecendo melhores dados sobre estradas para a cidade identificar e corrigir problemas. No entanto, [pessoas de grupos de baixa renda tinham menos acesso a carros e telemóveis](https://hbr.org/2013/04/the-hidden-biases-in-big-data), tornando os problemas das suas estradas invisíveis nesta app. Os desenvolvedores trabalharam com académicos para abordar questões de _acesso equitativo e divisões digitais_ para maior justiça. |
| **Justiça Algorítmica** | 2018 - O estudo [Gender Shades do MIT](http://gendershades.org/overview.html) avaliou a precisão de produtos de IA para classificação de género, expondo lacunas na precisão para mulheres e pessoas de cor. Um [cartão Apple de 2019](https://www.wired.com/story/the-apple-card-didnt-see-genderand-thats-the-problem/) parecia oferecer menos crédito a mulheres do que a homens. Ambos ilustraram problemas de viés algorítmico que levam a danos socioeconómicos.|
| **Distorção de Dados** | 2020 - O [Departamento de Saúde Pública da Geórgia divulgou gráficos de COVID-19](https://www.vox.com/covid-19-coronavirus-us-response-trump/2020/5/18/21262265/georgia-covid-19-cases-declining-reopening) que pareciam enganar os cidadãos sobre as tendências de casos confirmados com ordenação não cronológica no eixo x. Isto ilustra distorção através de truques de visualização. |
| **Ilusão de Livre Escolha** | 2020 - A app de aprendizagem [ABCmouse pagou $10M para resolver uma queixa da FTC](https://www.washingtonpost.com/business/2020/09/04/abcmouse-10-million-ftc-settlement/) onde os pais foram presos em subscrições que não conseguiam cancelar. Isto ilustra padrões obscuros em arquiteturas de escolha, onde os utilizadores foram influenciados a tomar decisões potencialmente prejudiciais. |
| **Privacidade de Dados & Direitos dos Utilizadores** | 2021 - A [violação de dados do Facebook](https://www.npr.org/2021/04/09/986005820/after-data-breach-exposes-530-million-facebook-says-it-will-not-notify-users) expôs dados de 530M de utilizadores, resultando num acordo de $5B com a FTC. No entanto, a empresa recusou-se a notificar os utilizadores da violação, violando os direitos dos utilizadores em relação à transparência e acesso aos dados. |
Quer explorar mais estudos de caso? Confira estes recursos:
| **Consentimento Informado** | 1972 - [Estudo de Sífilis de Tuskegee](https://en.wikipedia.org/wiki/Tuskegee_Syphilis_Study) - Homens afro-americanos que participaram no estudo foram prometidos cuidados médicos gratuitos, _mas foram enganados_ por investigadores que não informaram os sujeitos sobre o diagnóstico ou sobre a disponibilidade de tratamento. Muitos morreram e parceiros ou filhos foram afetados; o estudo durou 40 anos. |
| **Privacidade de Dados** | 2007 - O [prémio de dados da Netflix](https://www.wired.com/2007/12/why-anonymous-data-sometimes-isnt/) forneceu aos investigadores _10M classificações de filmes anonimizadas de 50K clientes_ para ajudar a melhorar os algoritmos de recomendação. No entanto, os investigadores conseguiram correlacionar dados anonimizados com dados pessoalmente identificáveis em _conjuntos de dados externos_ (ex.: comentários no IMDb), efetivamente "desanonimizando" alguns assinantes da Netflix.|
| **Viés na Coleta de Dados** | 2013 - A cidade de Boston [desenvolveu Street Bump](https://www.boston.gov/transportation/street-bump), uma aplicação que permitia aos cidadãos reportar buracos na estrada, fornecendo à cidade melhores dados sobre vias para identificar e resolver problemas. No entanto, [pessoas de grupos de baixa renda tinham menos acesso a carros e telemóveis](https://hbr.org/2013/04/the-hidden-biases-in-big-data), tornando os problemas das suas vias invisíveis na aplicação. Os desenvolvedores trabalharam com académicos para abordar questões de _acesso equitativo e divisões digitais_ para garantir justiça. |
| **Justiça Algorítmica** | 2018 - O MIT [Gender Shades Study](http://gendershades.org/overview.html) avaliou a precisão de produtos de IA para classificação de género, expondo lacunas na precisão para mulheres e pessoas de cor. Um [Apple Card de 2019](https://www.wired.com/story/the-apple-card-didnt-see-genderand-thats-the-problem/) parecia oferecer menos crédito às mulheres do que aos homens. Ambos ilustraram problemas de viés algorítmico que levaram a danos socioeconómicos.|
| **Deturpação de Dados** | 2020 - O [Departamento de Saúde Pública da Geórgia divulgou gráficos sobre COVID-19](https://www.vox.com/covid-19-coronavirus-us-response-trump/2020/5/18/21262265/georgia-covid-19-cases-declining-reopening) que pareciam enganar os cidadãos sobre tendências de casos confirmados com ordenação não cronológica no eixo x. Isto ilustra deturpação através de truques de visualização. |
| **Ilusão de Escolha Livre** | 2020 - A aplicação de aprendizagem [ABCmouse pagou $10M para resolver uma queixa da FTC](https://www.washingtonpost.com/business/2020/09/04/abcmouse-10-million-ftc-settlement/) onde os pais ficaram presos a pagar por subscrições que não podiam cancelar. Isto ilustra padrões obscuros em arquiteturas de escolha, onde os utilizadores foram influenciados a tomar decisões potencialmente prejudiciais. |
| **Privacidade de Dados & Direitos dos Utilizadores** | 2021 - O [Facebook Data Breach](https://www.npr.org/2021/04/09/986005820/after-data-breach-exposes-530-million-facebook-says-it-will-not-notify-users) expôs dados de 530M utilizadores, resultando num acordo de $5B com a FTC. No entanto, recusou-se a notificar os utilizadores sobre a violação, violando os direitos dos utilizadores em relação à transparência e ao acesso aos dados. |
Quer explorar mais estudos de caso? Veja estes recursos:
* [Ethics Unwrapped](https://ethicsunwrapped.utexas.edu/case-studies) - dilemas éticos em diversas indústrias.
* [Curso de Ética em Ciência de Dados](https://www.coursera.org/learn/data-science-ethics#syllabus) - estudos de caso marcantes explorados.
* [Onde as coisas deram errado](https://deon.drivendata.org/examples/) - checklist Deon com exemplos.
* [Onde as coisas deram errado](https://deon.drivendata.org/examples/) - checklist de Deon com exemplos.
> 🚨 Pense nos estudos de caso que viu - já experienciou ou foi afetado por um desafio ético semelhante na sua vida? Consegue pensar em pelo menos um outro estudo de caso que ilustre um dos desafios éticos discutidos nesta secção?
## Ética Aplicada
Falámos sobre conceitos éticos, desafios e estudos de caso em contextos do mundo real. Mas como começamos a _aplicar_ princípios e práticas éticas nos nossos projetos? E como _operacionalizamos_ essas práticas para uma melhor governança? Vamos explorar algumas soluções do mundo real:
Falámos sobre conceitos éticos, desafios e estudos de caso em contextos do mundo real. Mas como começamos a _aplicar_ princípios e práticas éticas nos nossos projetos? E como _operacionalizamos_ estas práticas para uma melhor governança? Vamos explorar algumas soluções do mundo real:
### 1. Códigos Profissionais
Códigos Profissionais oferecem uma opção para as organizações "incentivarem" os membros a apoiar os seus princípios éticos e declaração de missão. Os códigos são _diretrizes morais_ para o comportamento profissional, ajudando os funcionários ou membros a tomar decisões que estejam alinhadas com os princípios da organização. Eles só são eficazes com a adesão voluntária dos membros; no entanto, muitas organizações oferecem recompensas e penalidades adicionais para motivar a conformidade.
Códigos Profissionais oferecem uma opção para organizações "incentivarem" os membros a apoiar os seus princípios éticos e declaração de missão. Os códigos são _diretrizes morais_ para o comportamento profissional, ajudando os funcionários ou membros a tomar decisões que estejam alinhadas com os princípios da organização. Eles só são eficazes com a adesão voluntária dos membros; no entanto, muitas organizações oferecem recompensas e penalidades adicionais para motivar a conformidade.
Exemplos incluem:
* [Oxford Munich](http://www.code-of-ethics.org/code-of-conduct/) Código de Ética
* [Data Science Association](http://datascienceassn.org/code-of-conduct.html) Código de Conduta (criado em 2013)
* [ACM Código de Ética e Conduta Profissional](https://www.acm.org/code-of-ethics) (desde 1993)
* [ACM Code of Ethics and Professional Conduct](https://www.acm.org/code-of-ethics) (desde 1993)
> 🚨 Pertence a uma organização profissional de engenharia ou ciência de dados? Explore o site para ver se definem um código de ética profissional. O que isso diz sobre os seus princípios éticos? Como estão a "incentivar" os membros a seguir o código?
### 2. Checklists de Ética
Embora os códigos profissionais definam o _comportamento ético_ exigido dos profissionais, eles [têm limitações conhecidas](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md) na aplicação, particularmente em projetos de grande escala. Em vez disso, muitos especialistas em ciência de dados [defendem checklists](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md), que podem **conectar princípios a práticas** de forma mais determinística e acionável.
Enquanto os códigos profissionais definem o _comportamento ético_ exigido dos profissionais, eles [têm limitações conhecidas](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md) na aplicação, particularmente em projetos de grande escala. Em vez disso, muitos especialistas em ciência de dados [defendem checklists](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md), que podem **conectar princípios a práticas** de forma mais determinística e acionável.
Os checklists convertem perguntas em tarefas de "sim/não" que podem ser operacionalizadas, permitindo que sejam rastreadas como parte dos fluxos de trabalho padrão de lançamento de produtos.
Os checklists convertem perguntas em tarefas "sim/não" que podem ser operacionalizadas, permitindo que sejam rastreadas como parte dos fluxos de trabalho padrão de lançamento de produtos.
Exemplos incluem:
* [Deon](https://deon.drivendata.org/) - um checklist de ética em dados de uso geral criado a partir de [recomendações da indústria](https://deon.drivendata.org/#checklist-citations) com uma ferramenta de linha de comando para fácil integração.
* [Checklist de Auditoria de Privacidade](https://cyber.harvard.edu/ecommerce/privacyaudit.html) - fornece orientação geral para práticas de manuseio de informações sob perspetivas legais e sociais.
* [Checklist de Justiça em IA](https://www.microsoft.com/en-us/research/project/ai-fairness-checklist/) - criado por profissionais de IA para apoiar a adoção e integração de verificações de justiça nos ciclos de desenvolvimento de IA.
* [22 perguntas para ética em dados e IA](https://medium.com/the-organization/22-questions-for-ethics-in-data-and-ai-efb68fd19429) - estrutura mais aberta, projetada para exploração inicial de questões éticas em design, implementação e contextos organizacionais.
* [22 perguntas para ética em dados e IA](https://medium.com/the-organization/22-questions-for-ethics-in-data-and-ai-efb68fd19429) - estrutura mais aberta, projetada para exploração inicial de questões éticas no design, implementação e contextos organizacionais.
### 3. Regulamentações de Ética
### 3. Regulamentações Éticas
A ética trata de definir valores compartilhados e fazer o que é certo _voluntariamente_. **Conformidade** trata de _seguir a lei_ onde e quando definida. **Governança** abrange amplamente todas as formas como as organizações operam para aplicar princípios éticos e cumprir leis estabelecidas.
Ética trata de definir valores compartilhados e fazer o que é certo _voluntariamente_. **Conformidade** trata de _seguir a lei_ onde e quando definida. **Governança** cobre amplamente todas as formas como as organizações operam para aplicar princípios éticos e cumprir leis estabelecidas.
Hoje, a governança assume duas formas dentro das organizações. Primeiro, trata-se de definir princípios de **IA ética** e estabelecer práticas para operacionalizar a adoção em todos os projetos relacionados à IA na organização. Segundo, trata-se de cumprir todas as regulamentações governamentais de **proteção de dados** para as regiões em que opera.
Hoje, a governança assume duas formas dentro das organizações. Primeiro, trata-se de definir princípios de **IA ética** e estabelecer práticas para operacionalizar a adoção em todos os projetos relacionados à IA na organização. Segundo, trata-se de cumprir todas as regulamentações de **proteção de dados** exigidas pelo governo nas regiões em que opera.
Exemplos de regulamentações de proteção e privacidade de dados:
* `1974`, [Lei de Privacidade dos EUA](https://www.justice.gov/opcl/privacy-act-1974) - regula a coleta, uso e divulgação de informações pessoais pelo _governo federal_.
* `1996`, [Lei de Portabilidade e Responsabilidade de Seguros de Saúde dos EUA (HIPAA)](https://www.cdc.gov/phlp/publications/topic/hipaa.html) - protege dados de saúde pessoais.
* `1998`, [Lei de Proteção à Privacidade Online das Crianças dos EUA (COPPA)](https://www.ftc.gov/enforcement/rules/rulemaking-regulatory-reform-proceedings/childrens-online-privacy-protection-rule) - protege a privacidade de dados de crianças menores de 13 anos.
* `2018`, [Regulamento Geral de Proteção de Dados (GDPR)](https://gdpr-info.eu/) - fornece direitos aos utilizadores, proteção de dados e privacidade.
* `2018`, [Lei de Privacidade do Consumidor da Califórnia (CCPA)](https://www.oag.ca.gov/privacy/ccpa) - dá aos consumidores mais _direitos_ sobre os seus dados (pessoais).
* `2021`, [Lei de Proteção de Informações Pessoais da China](https://www.reuters.com/world/china/china-passes-new-personal-data-privacy-law-take-effect-nov-1-2021-08-20/) - uma das regulamentações de privacidade de dados online mais fortes do mundo.
* `1974`, [US Privacy Act](https://www.justice.gov/opcl/privacy-act-1974) - regula a coleta, uso e divulgação de informações pessoais pelo _governo federal_.
* `1996`, [US Health Insurance Portability & Accountability Act (HIPAA)](https://www.cdc.gov/phlp/publications/topic/hipaa.html) - protege dados de saúde pessoais.
* `1998`, [US Children's Online Privacy Protection Act (COPPA)](https://www.ftc.gov/enforcement/rules/rulemaking-regulatory-reform-proceedings/childrens-online-privacy-protection-rule) - protege a privacidade de dados de crianças menores de 13 anos.
* `2018`, [Regulamento Geral de Proteção de Dados (GDPR)](https://gdpr-info.eu/) - fornece direitos dos utilizadores, proteção de dados e privacidade.
* `2018`, [California Consumer Privacy Act (CCPA)](https://www.oag.ca.gov/privacy/ccpa) dá aos consumidores mais _direitos_ sobre os seus dados pessoais.
* `2021`, [Lei de Proteção de Informações Pessoais da China](https://www.reuters.com/world/china/china-passes-new-personal-data-privacy-law-take-effect-nov-1-2021-08-20/) acabou de ser aprovada, criando uma das regulamentações de privacidade de dados online mais fortes do mundo.
> 🚨 O Regulamento Geral de Proteção de Dados (GDPR) definido pela União Europeia continua a ser uma das regulamentações de privacidade de dados mais influentes hoje. Sabia que também define [8 direitos dos utilizadores](https://www.freeprivacypolicy.com/blog/8-user-rights-gdpr) para proteger a privacidade digital e os dados pessoais dos cidadãos? Saiba quais são e por que são importantes.
> 🚨 O Regulamento Geral de Proteção de Dados (GDPR) definido pela União Europeia continua a ser uma das regulamentações de privacidade de dados mais influentes hoje. Sabia que também define [8 direitos dos utilizadores](https://www.freeprivacypolicy.com/blog/8-user-rights-gdpr) para proteger a privacidade digital e os dados pessoais dos cidadãos? Descubra quais são e por que são importantes.
### 4. Cultura de Ética
### 4. Cultura Ética
Note que ainda existe uma lacuna intangível entre _conformidade_ (fazer o suficiente para cumprir "a letra da lei") e abordar [questões sistémicas](https://www.coursera.org/learn/data-science-ethics/home/week/4) (como ossificação, assimetria de informações e injustiça distributiva) que podem acelerar a instrumentalização da IA.
Note que ainda existe uma lacuna intangível entre _conformidade_ (fazer o suficiente para cumprir "a letra da lei") e abordar [questões sistémicas](https://www.coursera.org/learn/data-science-ethics/home/week/4) (como ossificação, assimetria de informação e injustiça distributiva) que podem acelerar a utilização indevida da IA.
O último requer [abordagens colaborativas para definir culturas de ética](https://towardsdatascience.com/why-ai-ethics-requires-a-culture-driven-approach-26f451afa29f) que construam conexões emocionais e valores compartilhados consistentes _entre organizações_ na indústria. Isso exige mais [culturas de ética de dados formalizadas](https://www.codeforamerica.org/news/formalizing-an-ethical-data-culture/) nas organizações - permitindo que _qualquer pessoa_ [puxe o cordão Andon](https://en.wikipedia.org/wiki/Andon_(manufacturing)) (para levantar preocupações éticas cedo no processo) e tornando _avaliações éticas_ (por exemplo, em contratações) um critério central na formação de equipas em projetos de IA.
A última requer [abordagens colaborativas para definir culturas éticas](https://towardsdatascience.com/why-ai-ethics-requires-a-culture-driven-approach-26f451afa29f) que construam conexões emocionais e valores compartilhados consistentes _entre organizações_ na indústria. Isto exige mais [culturas éticas formalizadas](https://www.codeforamerica.org/news/formalizing-an-ethical-data-culture/) nas organizações - permitindo que _qualquer pessoa_ [puxe o cordão Andon](https://en.wikipedia.org/wiki/Andon_(manufacturing)) (para levantar preocupações éticas cedo no processo) e tornando _avaliações éticas_ (ex.: na contratação) um critério central na formação de equipas em projetos de IA.
---
## [Questionário pós-aula](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/3) 🎯
## [Questionário pós-aula](https://ff-quizzes.netlify.app/en/ds/) 🎯
## Revisão & Autoestudo
Cursos e livros ajudam a compreender conceitos éticos fundamentais e desafios, enquanto estudos de caso e ferramentas ajudam com práticas de ética aplicada em contextos do mundo real. Aqui estão alguns recursos para começar:
Cursos e livros ajudam a compreender conceitos éticos fundamentais e desafios, enquanto estudos de caso e ferramentas ajudam com práticas éticas aplicadas em contextos do mundo real. Aqui estão alguns recursos para começar:
* [Machine Learning For Beginners](https://github.com/microsoft/ML-For-Beginners/blob/main/1-Introduction/3-fairness/README.md) - lição sobre Justiça, da Microsoft.
* [Princípios de IA Responsável](https://docs.microsoft.com/en-us/learn/modules/responsible-ai-principles/) - percurso de aprendizagem gratuito da Microsoft Learn.
@ -259,7 +259,9 @@ Cursos e livros ajudam a compreender conceitos éticos fundamentais e desafios,
# Tarefa
[Escreva Um Estudo de Caso Sobre Ética de Dados](assignment.md)
[Escreva um Estudo de Caso sobre Ética de Dados](assignment.md)
---
**Aviso Legal**:
Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automáticas podem conter erros ou imprecisões. O documento original no seu idioma nativo deve ser considerado a fonte autoritária. Para informações críticas, recomenda-se uma tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações incorretas resultantes do uso desta tradução.
Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, é importante ter em conta que traduções automáticas podem conter erros ou imprecisões. O documento original na sua língua nativa deve ser considerado a fonte autoritária. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações incorretas decorrentes da utilização desta tradução.

@ -1,8 +1,8 @@
<!--
CO_OP_TRANSLATOR_METADATA:
{
"original_hash": "8796f41f566a0a8ebb72863a83d558ed",
"translation_date": "2025-08-26T15:09:53+00:00",
"original_hash": "3a34157cc63516eba97c89a0b2f8c3e6",
"translation_date": "2025-09-03T21:47:57+00:00",
"source_file": "1-Introduction/02-ethics/README.md",
"language_code": "ro"
}
@ -17,11 +17,11 @@ CO_OP_TRANSLATOR_METADATA:
Suntem cu toții cetățeni ai datelor, trăind într-o lume dominată de acestea.
Tendințele pieței ne arată că, până în 2022, 1 din 3 organizații mari va cumpăra și vinde date prin intermediul [Piețelor și Schimburilor online](https://www.gartner.com/smarterwithgartner/gartner-top-10-trends-in-data-and-analytics-for-2020/). Ca **Dezvoltatori de Aplicații**, vom găsi mai ușor și mai ieftin să integrăm perspective bazate pe date și automatizări bazate pe algoritmi în experiențele zilnice ale utilizatorilor. Dar, pe măsură ce AI devine omniprezent, va trebui să înțelegem și potențialele daune cauzate de [utilizarea abuzivă](https://www.youtube.com/watch?v=TQHs8SA1qpk) a acestor algoritmi la scară largă.
Tendințele pieței ne arată că, până în 2022, 1 din 3 organizații mari va cumpăra și vinde date prin intermediul [Piațelor și Schimburilor online](https://www.gartner.com/smarterwithgartner/gartner-top-10-trends-in-data-and-analytics-for-2020/). Ca **Dezvoltatori de Aplicații**, vom găsi mai ușor și mai ieftin să integrăm perspective bazate pe date și automatizări bazate pe algoritmi în experiențele zilnice ale utilizatorilor. Dar, pe măsură ce AI devine omniprezent, va trebui să înțelegem și potențialele daune cauzate de [utilizarea abuzivă](https://www.youtube.com/watch?v=TQHs8SA1qpk) a acestor algoritmi la scară largă.
Tendințele indică, de asemenea, că vom crea și consuma peste [180 de zettabytes](https://www.statista.com/statistics/871513/worldwide-data-created/) de date până în 2025. Ca **Oameni de Știință ai Datelor**, acest lucru ne oferă un acces fără precedent la date personale. Aceasta înseamnă că putem construi profiluri comportamentale ale utilizatorilor și influența luarea deciziilor într-un mod care creează o [iluzie a alegerii libere](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice), în timp ce, posibil, îi ghidăm pe utilizatori către rezultate pe care le preferăm. De asemenea, ridică întrebări mai ample despre confidențialitatea datelor și protecția utilizatorilor.
Tendințele indică, de asemenea, că vom crea și consuma peste [180 zettabytes](https://www.statista.com/statistics/871513/worldwide-data-created/) de date până în 2025. Ca **Oameni de Știința Datelor**, acest lucru ne oferă un acces fără precedent la datele personale. Aceasta înseamnă că putem construi profiluri comportamentale ale utilizatorilor și influența luarea deciziilor în moduri care creează o [iluzie de alegere liberă](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice), în timp ce îi îndrumăm, posibil, către rezultate pe care le preferăm. De asemenea, ridică întrebări mai ample despre confidențialitatea datelor și protecția utilizatorilor.
Etica datelor reprezintă acum _ghiduri necesare_ pentru știința și ingineria datelor, ajutându-ne să minimizăm potențialele daune și consecințele neintenționate ale acțiunilor noastre bazate pe date. [Ciclul de Hype Gartner pentru AI](https://www.gartner.com/smarterwithgartner/2-megatrends-dominate-the-gartner-hype-cycle-for-artificial-intelligence-2020/) identifică tendințe relevante în etica digitală, AI responsabil și guvernanța AI ca factori cheie pentru megatendințele mai mari legate de _democratizarea_ și _industrializarea_ AI.
Etica datelor devine acum _un ghid necesar_ pentru știința și ingineria datelor, ajutându-ne să minimizăm potențialele daune și consecințele neintenționate ale acțiunilor noastre bazate pe date. [Ciclul de Hype Gartner pentru AI](https://www.gartner.com/smarterwithgartner/2-megatrends-dominate-the-gartner-hype-cycle-for-artificial-intelligence-2020/) identifică tendințe relevante în etica digitală, AI responsabilă și guvernanța AI ca factori cheie pentru megatendințele mai mari legate de _democratizarea_ și _industrializarea_ AI.
![Ciclul de Hype Gartner pentru AI - 2020](https://images-cdn.newscred.com/Zz1mOWJhNzlkNDA2ZTMxMWViYjRiOGFiM2IyMjQ1YmMwZQ==)
@ -29,70 +29,70 @@ Etica datelor reprezintă acum _ghiduri necesare_ pentru știința și ingineria
## [Chestionar înainte de lecție](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/2) 🎯
## Definiții de Bază
## Definiții de bază
Să începem prin a înțelege terminologia de bază.
Cuvântul "etică" provine din [cuvântul grecesc "ethikos"](https://en.wikipedia.org/wiki/Ethics) (și rădăcina sa "ethos"), care înseamnă _caracter sau natură morală_.
**Etica** se referă la valorile comune și principiile morale care ne guvernează comportamentul în societate. Etica nu se bazează pe legi, ci pe norme larg acceptate despre ceea ce este "corect vs. greșit". Totuși, considerațiile etice pot influența inițiativele de guvernanță corporativă și reglementările guvernamentale care creează mai multe stimulente pentru conformitate.
**Etica** se referă la valorile comune și principiile morale care guvernează comportamentul nostru în societate. Etica nu se bazează pe legi, ci pe norme larg acceptate despre ceea ce este "corect vs. greșit". Totuși, considerațiile etice pot influența inițiativele de guvernanță corporativă și reglementările guvernamentale care creează mai multe stimulente pentru conformitate.
**Etica Datelor** este o [ramură nouă a eticii](https://royalsocietypublishing.org/doi/full/10.1098/rsta.2016.0360#sec-1) care "studiază și evaluează problemele morale legate de _date, algoritmi și practicile corespunzătoare_". Aici, **"datele"** se concentrează pe acțiuni legate de generare, înregistrare, curare, procesare, diseminare, partajare și utilizare, **"algoritmii"** se concentrează pe AI, agenți, învățare automată și roboți, iar **"practicile"** se concentrează pe subiecte precum inovația responsabilă, programarea, hacking-ul și codurile de etică.
**Etica Datelor** este o [ramură nouă a eticii](https://royalsocietypublishing.org/doi/full/10.1098/rsta.2016.0360#sec-1) care "studiază și evaluează problemele morale legate de _date, algoritmi și practici corespunzătoare_". Aici, **"datele"** se concentrează pe acțiuni legate de generare, înregistrare, curare, procesare, diseminare, partajare și utilizare, **"algoritmii"** se concentrează pe AI, agenți, învățare automată și roboți, iar **"practicile"** se concentrează pe subiecte precum inovația responsabilă, programarea, hacking-ul și codurile etice.
**Etica Aplicată** este [aplicarea practică a considerațiilor morale](https://en.wikipedia.org/wiki/Applied_ethics). Este procesul de investigare activă a problemelor etice în contextul _acțiunilor, produselor și proceselor din lumea reală_ și de luare a măsurilor corective pentru a ne asigura că acestea rămân aliniate cu valorile noastre etice definite.
**Cultura Eticii** se referă la [_operaționalizarea_ eticii aplicate](https://hbr.org/2019/05/how-to-design-an-ethical-organization) pentru a ne asigura că principiile și practicile noastre etice sunt adoptate într-un mod consecvent și scalabil în întreaga organizație. Culturile etice de succes definesc principii etice la nivel organizațional, oferă stimulente semnificative pentru conformitate și întăresc normele etice prin încurajarea și amplificarea comportamentelor dorite la fiecare nivel al organizației.
**Cultura Eticii** se referă la [_operaționalizarea_ eticii aplicate](https://hbr.org/2019/05/how-to-design-an-ethical-organization) pentru a ne asigura că principiile și practicile noastre etice sunt adoptate într-un mod consistent și scalabil în întreaga organizație. Culturile etice de succes definesc principii etice la nivel organizațional, oferă stimulente semnificative pentru conformitate și întăresc normele etice prin încurajarea și amplificarea comportamentelor dorite la fiecare nivel al organizației.
## Concepte de Etică
## Concepte Etice
În această secțiune, vom discuta concepte precum **valori comune** (principii) și **provocări etice** (probleme) pentru etica datelor - și vom explora **studii de caz** care te ajută să înțelegi aceste concepte în contexte din lumea reală.
În această secțiune, vom discuta concepte precum **valori comune** (principii) și **provocări etice** (probleme) pentru etica datelor - și vom explora **studii de caz** care te ajută să înțelegi aceste concepte în contexte reale.
### 1. Principiile Eticii
### 1. Principii Etice
Fiecare strategie de etică a datelor începe prin definirea _principiilor etice_ - "valorile comune" care descriu comportamentele acceptabile și ghidează acțiunile conforme în proiectele noastre de date și AI. Acestea pot fi definite la nivel individual sau de echipă. Totuși, majoritatea organizațiilor mari le conturează într-o declarație de misiune sau un cadru de _AI etic_ definit la nivel corporativ și aplicat consecvent în toate echipele.
Fiecare strategie de etică a datelor începe prin definirea _principiilor etice_ - "valorile comune" care descriu comportamentele acceptabile și ghidează acțiunile conforme în proiectele noastre de date și AI. Acestea pot fi definite la nivel individual sau de echipă. Totuși, majoritatea organizațiilor mari le conturează într-o declarație de misiune sau cadru de _AI etică_ definit la nivel corporativ și aplicat în mod consistent în toate echipele.
**Exemplu:** Declarația de misiune [AI Responsabil](https://www.microsoft.com/en-us/ai/responsible-ai) a Microsoft spune: _"Suntem dedicați avansării AI ghidată de principii etice care pun oamenii pe primul loc"_ - identificând 6 principii etice în cadrul de mai jos:
**Exemplu:** Declarația de misiune [AI Responsabilă](https://www.microsoft.com/en-us/ai/responsible-ai) de la Microsoft spune: _"Suntem dedicați avansării AI ghidată de principii etice care pun oamenii pe primul loc"_ - identificând 6 principii etice în cadrul de mai jos:
![AI Responsabil la Microsoft](https://docs.microsoft.com/en-gb/azure/cognitive-services/personalizer/media/ethics-and-responsible-use/ai-values-future-computed.png)
![AI Responsabilă la Microsoft](https://docs.microsoft.com/en-gb/azure/cognitive-services/personalizer/media/ethics-and-responsible-use/ai-values-future-computed.png)
Să explorăm pe scurt aceste principii. _Transparența_ și _responsabilitatea_ sunt valori fundamentale pe care se construiesc celelalte principii - așa că să începem cu acestea:
* [**Responsabilitate**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) face practicienii _responsabili_ pentru operațiunile lor de date și AI și pentru conformitatea cu aceste principii etice.
* [**Transparență**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) asigură că acțiunile bazate pe date și AI sunt _ușor de înțeles_ (interpretabile) pentru utilizatori, explicând ce și de ce în spatele deciziilor.
* [**Corectitudine**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1%3aprimaryr6) - se concentrează pe asigurarea faptului că AI tratează _toți oamenii_ în mod echitabil, abordând orice prejudecăți sistemice sau implicite în date și sisteme.
* [**Fiabilitate și Siguranță**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - asigură că AI se comportă _conform_ valorilor definite, minimizând potențialele daune sau consecințe neintenționate.
* [**Confidențialitate și Securitate**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - se referă la înțelegerea provenienței datelor și la oferirea de _protecții legate de confidențialitatea datelor_ utilizatorilor.
* [**Incluziune**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - se referă la proiectarea soluțiilor AI cu intenție, adaptându-le pentru a răspunde unei _gama largă de nevoi și capacități umane_.
* [**Responsabilitatea**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) face ca practicienii să fie _responsabili_ pentru operațiunile lor de date și AI și pentru conformitatea cu aceste principii etice.
* [**Transparența**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) asigură că acțiunile legate de date și AI sunt _ușor de înțeles_ (interpretabile) pentru utilizatori, explicând ce și de ce în spatele deciziilor.
* [**Corectitudinea**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1%3aprimaryr6) - se concentrează pe asigurarea că AI tratează _toți oamenii_ în mod echitabil, abordând orice prejudecăți socio-tehnice sistemice sau implicite în date și sisteme.
* [**Fiabilitatea și Siguranța**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - asigură că AI se comportă _consistent_ cu valorile definite, minimizând potențialele daune sau consecințe neintenționate.
* [**Confidențialitatea și Securitatea**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - se referă la înțelegerea provenienței datelor și la oferirea de _protecții legate de confidențialitatea datelor_ utilizatorilor.
* [**Incluziunea**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - se referă la proiectarea soluțiilor AI cu intenție, adaptându-le pentru a răspunde unei _game largi de nevoi și capacități umane_.
> 🚨 Gândește-te la ce ar putea fi declarația ta de misiune pentru etica datelor. Explorează cadrele de AI etic ale altor organizații - iată exemple de la [IBM](https://www.ibm.com/cloud/learn/ai-ethics), [Google](https://ai.google/principles) și [Facebook](https://ai.facebook.com/blog/facebooks-five-pillars-of-responsible-ai/). Ce valori comune au în comun? Cum se raportează aceste principii la produsul AI sau industria în care operează?
> 🚨 Gândește-te la ce ar putea fi declarația ta de misiune pentru etica datelor. Explorează cadrele de AI etică de la alte organizații - iată exemple de la [IBM](https://www.ibm.com/cloud/learn/ai-ethics), [Google](https://ai.google/principles) și [Facebook](https://ai.facebook.com/blog/facebooks-five-pillars-of-responsible-ai/). Ce valori comune au în comun? Cum se raportează aceste principii la produsul sau industria AI în care operează?
### 2. Provocări Etice
Odată ce avem definite principiile etice, următorul pas este să evaluăm acțiunile noastre legate de date și AI pentru a vedea dacă acestea se aliniază cu valorile comune. Gândește-te la acțiunile tale în două categorii: _colectarea datelor_ și _proiectarea algoritmilor_.
Odată ce am definit principiile etice, următorul pas este să evaluăm acțiunile noastre legate de date și AI pentru a vedea dacă acestea se aliniază cu valorile comune. Gândește-te la acțiunile tale în două categorii: _colectarea datelor_ și _proiectarea algoritmilor_.
În cazul colectării datelor, acțiunile vor implica probabil **date personale** sau informații de identificare personală (PII) pentru indivizi identificabili. Acestea includ [diverse elemente de date non-personale](https://ec.europa.eu/info/law/law-topic/data-protection/reform/what-personal-data_en) care, _împreună_, identifică un individ. Provocările etice pot fi legate de _confidențialitatea datelor_, _proprietatea datelor_ și subiecte conexe precum _consimțământul informat_ și _drepturile de proprietate intelectuală_ ale utilizatorilor.
În cazul colectării datelor, acțiunile vor implica probabil **date personale** sau informații personale identificabile (PII) pentru indivizi identificabili. Acestea includ [diverse elemente de date non-personale](https://ec.europa.eu/info/law/law-topic/data-protection/reform/what-personal-data_en) care, _împreună_, identifică un individ. Provocările etice pot fi legate de _confidențialitatea datelor_, _proprietatea datelor_ și subiecte conexe precum _consimțământul informat_ și _drepturile de proprietate intelectuală_ ale utilizatorilor.
În cazul proiectării algoritmilor, acțiunile vor implica colectarea și curarea **seturilor de date**, apoi utilizarea acestora pentru a antrena și implementa **modele de date** care prezic rezultate sau automatizează decizii în contexte din lumea reală. Provocările etice pot apărea din _prejudecăți în seturile de date_, probleme de _calitate a datelor_, _inechitate_ și _reprezentare greșită_ în algoritmi - inclusiv unele probleme care sunt sistemice.
În cazul proiectării algoritmilor, acțiunile vor implica colectarea și curarea **seturilor de date**, apoi utilizarea acestora pentru a antrena și implementa **modele de date** care prezic rezultate sau automatizează decizii în contexte reale. Provocările etice pot apărea din _prejudecăți în seturile de date_, probleme de _calitate a datelor_, _inechitate_ și _reprezentare greșită_ în algoritmi - inclusiv unele probleme care sunt de natură sistemică.
În ambele cazuri, provocările etice evidențiază zonele în care acțiunile noastre pot intra în conflict cu valorile comune. Pentru a detecta, atenua, minimiza sau elimina aceste preocupări, trebuie să punem întrebări morale de tip "da/nu" legate de acțiunile noastre, apoi să luăm măsuri corective, după caz. Să analizăm câteva provocări etice și întrebările morale pe care le ridică:
În ambele cazuri, provocările etice evidențiază zonele în care acțiunile noastre pot intra în conflict cu valorile comune. Pentru a detecta, atenua, minimiza sau elimina aceste preocupări, trebuie să punem întrebări morale "da/nu" legate de acțiunile noastre, apoi să luăm măsuri corective, după cum este necesar. Să analizăm câteva provocări etice și întrebările morale pe care le ridică:
#### 2.1 Proprietatea Datelor
Colectarea datelor implică adesea date personale care pot identifica subiecții datelor. [Proprietatea datelor](https://permission.io/blog/data-ownership) se referă la _controlul_ și [_drepturile utilizatorilor_](https://permission.io/blog/data-ownership) legate de crearea, procesarea și diseminarea datelor.
Întrebările morale pe care trebuie să le punem sunt:
* Cine deține datele? (utilizatorul sau organizația)
* Cine deține datele? (utilizator sau organizație)
* Ce drepturi au subiecții datelor? (ex: acces, ștergere, portabilitate)
* Ce drepturi au organizațiile? (ex: rectificarea recenziilor utilizatorilor malițioase)
#### 2.2 Consimțământul Informat
[Consimțământul informat](https://legaldictionary.net/informed-consent/) definește actul prin care utilizatorii sunt de acord cu o acțiune (cum ar fi colectarea datelor) cu o _înțelegere completă_ a faptelor relevante, inclusiv scopul, riscurile potențiale și alternativele.
[Consimțământul informat](https://legaldictionary.net/informed-consent/) definește actul utilizatorilor de a fi de acord cu o acțiune (cum ar fi colectarea datelor) cu o _înțelegere completă_ a faptelor relevante, inclusiv scopul, riscurile potențiale și alternativele.
Întrebările de explorat aici sunt:
* A oferit utilizatorul (subiectul datelor) permisiunea pentru captarea și utilizarea datelor?
* A înțeles utilizatorul scopul pentru care au fost capturate datele?
* A înțeles utilizatorul riscurile potențiale ale participării lor?
* Utilizatorul (subiectul datelor) și-a dat permisiunea pentru captarea și utilizarea datelor?
* Utilizatorul a înțeles scopul pentru care au fost capturate datele?
* Utilizatorul a înțeles riscurile potențiale ale participării sale?
#### 2.3 Proprietatea Intelectuală
@ -100,33 +100,33 @@ Colectarea datelor implică adesea date personale care pot identifica subiecții
Întrebările de explorat aici sunt:
* Datele colectate aveau valoare economică pentru un utilizator sau o afacere?
* Are **utilizatorul** drepturi de proprietate intelectuală aici?
* Are **organizația** drepturi de proprietate intelectuală aici?
* Utilizatorul are proprietate intelectuală aici?
* Organizația are proprietate intelectuală aici?
* Dacă aceste drepturi există, cum le protejăm?
#### 2.4 Confidențialitatea Datelor
[Confidențialitatea datelor](https://www.northeastern.edu/graduate/blog/what-is-data-privacy/) sau confidențialitatea informațiilor se referă la păstrarea confidențialității utilizatorilor și protecția identității acestora în ceea ce privește informațiile de identificare personală.
[Confidențialitatea datelor](https://www.northeastern.edu/graduate/blog/what-is-data-privacy/) sau confidențialitatea informațiilor se referă la păstrarea confidențialității utilizatorilor și protecția identității utilizatorilor în raport cu informațiile personale identificabile.
Întrebările de explorat aici sunt:
* Sunt datele (personale) ale utilizatorilor securizate împotriva atacurilor și scurgerilor?
* Sunt datele utilizatorilor accesibile doar utilizatorilor și contextelor autorizate?
* Este păstrată anonimitatea utilizatorilor atunci când datele sunt partajate sau diseminate?
* Datele (personale) ale utilizatorilor sunt securizate împotriva atacurilor și scurgerilor?
* Datele utilizatorilor sunt accesibile doar utilizatorilor și contextelor autorizate?
* Anonimitatea utilizatorilor este păstrată atunci când datele sunt partajate sau diseminate?
* Poate un utilizator fi de-identificat din seturi de date anonimizate?
#### 2.5 Dreptul de a Fi Uitati
#### 2.5 Dreptul de a Fi Uitat
[Dreptul de a Fi Uitati](https://en.wikipedia.org/wiki/Right_to_be_forgotten) sau [Dreptul la Ștergere](https://www.gdpreu.org/right-to-be-forgotten/) oferă protecție suplimentară datelor personale ale utilizatorilor. În mod specific, oferă utilizatorilor dreptul de a solicita ștergerea sau eliminarea datelor personale din căutările pe Internet și alte locații, _în anumite circumstanțe_ - permițându-le un nou început online fără ca acțiunile trecute să fie folosite împotriva lor.
[Dreptul de a Fi Uitat](https://en.wikipedia.org/wiki/Right_to_be_forgotten) sau [Dreptul la Ștergere](https://www.gdpreu.org/right-to-be-forgotten/) oferă protecție suplimentară datelor personale ale utilizatorilor. În mod specific, le oferă utilizatorilor dreptul de a solicita ștergerea sau eliminarea datelor personale din căutările pe Internet și alte locații, _în anumite circumstanțe_ - permițându-le un nou început online fără ca acțiunile din trecut să fie folosite împotriva lor.
Întrebările de explorat aici sunt:
* Permite sistemul subiecților datelor să solicite ștergerea?
* Ar trebui retragerea consimțământului utilizatorului să declanșeze ștergerea automată?
* Au fost datele colectate fără consimțământ sau prin mijloace ilegale?
* Sistemul permite subiecților datelor să solicite ștergerea?
* Retragerea consimțământului utilizatorului ar trebui să declanșeze ștergerea automată?
* Datele au fost colectate fără consimțământ sau prin mijloace ilegale?
* Suntem conformi cu reglementările guvernamentale privind confidențialitatea datelor?
#### 2.6 Prejudecăți în Seturile de Date
Prejudecățile în seturile de date sau [Prejudecățile de Colectare](http://researcharticles.com/index.php/bias-in-data-collection-in-research/) se referă la selectarea unui subset _nereprezentativ_ de date pentru dezvoltarea algoritmilor, creând potențial inechități în rezultatele pentru grupuri diverse. Tipurile de prejudecăți includ prejudecăți de selecție sau eșantionare, prejudecăți ale voluntarilor și prejudecăți ale instrumentelor.
Prejudecățile în seturile de date sau [Prejudecățile de Colectare](http://researcharticles.com/index.php/bias-in-data-collection-in-research/) se referă la selectarea unui subset _nereprezentativ_ de date pentru dezvoltarea algoritmilor, creând potențial inechitate în rezultatele pentru grupuri diverse. Tipurile de prejudecăți includ prejudecăți de selecție sau eșantionare, prejudecăți ale voluntarilor și prejudecăți ale instrumentelor.
Întrebările de explorat aici sunt:
* Am recrutat un set reprezentativ de subiecți ai datelor?
@ -139,127 +139,125 @@ Prejudecățile în seturile de date sau [Prejudecățile de Colectare](http://r
Întrebările de explorat aici sunt:
* Am capturat caracteristici valide pentru cazul nostru de utilizare?
* Au fost datele capturate în mod _consistent_ din surse de date diverse?
* Este setul de date _complet_ pentru condiții sau scenarii diverse?
* Este informația capturată _exactă_ în reflectarea realității?
* Datele au fost capturate în mod consistent din surse de date diverse?
* Setul de date este complet pentru condiții sau scenarii diverse?
* Informațiile capturate reflectă realitatea cu acuratețe?
[Algorithm Fairness](https://towardsdatascience.com/what-is-algorithm-fairness-3182e161cf9f) verifică dacă designul algoritmului discriminează sistematic anumite subgrupuri de persoane, conducând la [posibile prejudicii](https://docs.microsoft.com/en-us/azure/machine-learning/concept-fairness-ml) în _alocare_ (unde resursele sunt refuzate sau reținute de la acel grup) și _calitatea serviciului_ (unde AI nu este la fel de precis pentru unele subgrupuri comparativ cu altele).
#### 2.8 Corectitudinea Algorit
[Algorithm Fairness](https://towardsdatascience.com/what-is-algorithm-fairness-3182e161cf9f) verifică dacă designul algoritmului discriminează sistematic împotriva unor subgrupuri specifice de subiecți de date, conducând la [posibile prejudicii](https://docs.microsoft.com/en-us/azure/machine-learning/concept-fairness-ml) în _alocare_ (unde resursele sunt refuzate sau reținute de la acel grup) și _calitatea serviciului_ (unde AI nu este la fel de precis pentru unele subgrupuri ca pentru altele).
Întrebări de explorat aici sunt:
Întrebări de explorat aici:
* Am evaluat acuratețea modelului pentru subgrupuri și condiții diverse?
* Am analizat sistemul pentru posibile prejudicii (de exemplu, stereotipuri)?
* Putem revizui datele sau reantrena modelele pentru a atenua prejudiciile identificate?
* Putem revizui datele sau reantrena modelele pentru a reduce prejudiciile identificate?
Explorați resurse precum [listele de verificare pentru echitatea AI](https://query.prod.cms.rt.microsoft.com/cms/api/am/binary/RE4t6dA) pentru a afla mai multe.
Explorați resurse precum [AI Fairness checklists](https://query.prod.cms.rt.microsoft.com/cms/api/am/binary/RE4t6dA) pentru a afla mai multe.
#### 2.9 Denaturarea datelor
[Denaturarea datelor](https://www.sciencedirect.com/topics/computer-science/misrepresentation) se referă la întrebarea dacă comunicăm informații din date raportate onest într-un mod înșelător pentru a susține o narațiune dorită.
Întrebări de explorat aici sunt:
Întrebări de explorat aici:
* Raportăm date incomplete sau inexacte?
* Vizualizăm datele într-un mod care conduce la concluzii înșelătoare?
* Folosim tehnici statistice selective pentru a manipula rezultatele?
* Există explicații alternative care ar putea oferi o concluzie diferită?
#### 2.10 Alegerea liberă
[Iluzia alegerii libere](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice) apare atunci când „arhitecturile de alegere” ale sistemului folosesc algoritmi de luare a deciziilor pentru a influența oamenii să ia un rezultat preferat, în timp ce par să le ofere opțiuni și control. Aceste [modele întunecate](https://www.darkpatterns.org/) pot provoca prejudicii sociale și economice utilizatorilor. Deoarece deciziile utilizatorilor influențează profilurile comportamentale, aceste acțiuni potențial conduc la alegeri viitoare care amplifică sau extind impactul acestor prejudicii.
[Iluzia alegerii libere](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice) apare atunci când "arhitecturile de alegere" ale sistemului folosesc algoritmi de luare a deciziilor pentru a influența oamenii să ia un rezultat preferat, în timp ce par să le ofere opțiuni și control. Aceste [dark patterns](https://www.darkpatterns.org/) pot provoca prejudicii sociale și economice utilizatorilor. Deoarece deciziile utilizatorilor influențează profilurile de comportament, aceste acțiuni pot conduce la alegeri viitoare care amplifică sau extind impactul acestor prejudicii.
Întrebări de explorat aici sunt:
* A înțeles utilizatorul implicațiile luării acelei decizii?
* Era utilizatorul conștient de (alte) opțiuni și de avantajele și dezavantajele fiecăreia?
* Poate utilizatorul să revoce o alegere automată sau influențată ulterior?
Întrebări de explorat aici:
* Utilizatorul a înțeles implicațiile alegerii făcute?
* Utilizatorul era conștient de (alternativele) opțiuni și de avantajele și dezavantajele fiecăreia?
* Utilizatorul poate inversa o alegere automată sau influențată ulterior?
### 3. Studii de caz
Pentru a pune aceste provocări etice în contexte din lumea reală, este util să analizăm studii de caz care evidențiază posibilele prejudicii și consecințe asupra indivizilor și societății atunci când astfel de încălcări etice sunt trecute cu vederea.
Pentru a pune aceste provocări etice în contexte reale, este util să analizăm studii de caz care evidențiază prejudiciile și consecințele potențiale asupra indivizilor și societății atunci când astfel de încălcări etice sunt ignorate.
Iată câteva exemple:
| Provocare etică | Studiu de caz |
|--- |--- |
| **Consimțământ informat** | 1972 - [Studiul Tuskegee despre sifilis](https://en.wikipedia.org/wiki/Tuskegee_Syphilis_Study) - Bărbați afro-americani care au participat la studiu au fost promiși îngrijire medicală gratuită, _dar au fost înșelați_ de cercetători care nu i-au informat despre diagnostic sau despre disponibilitatea tratamentului. Mulți subiecți au murit, iar partenerii sau copiii lor au fost afectați; studiul a durat 40 de ani. |
| **Confidențialitatea datelor** | 2007 - [Premiul pentru date Netflix](https://www.wired.com/2007/12/why-anonymous-data-sometimes-isnt/) a oferit cercetătorilor _10 milioane de evaluări anonimizate de filme de la 50.000 de clienți_ pentru a îmbunătăți algoritmii de recomandare. Totuși, cercetătorii au reușit să coreleze datele anonimizate cu date identificabile personal din _seturi de date externe_ (de exemplu, comentarii IMDb) - „de-anonimizând” efectiv unii abonați Netflix.|
| **Părtinire în colectarea datelor** | 2013 - Orașul Boston a [dezvoltat Street Bump](https://www.boston.gov/transportation/street-bump), o aplicație care permitea cetățenilor să raporteze gropi, oferind orașului date mai bune despre drumuri pentru a identifica și repara problemele. Totuși, [persoanele din grupuri cu venituri mai mici aveau mai puțin acces la mașini și telefoane](https://hbr.org/2013/04/the-hidden-biases-in-big-data), făcând problemele lor de infrastructură invizibile în această aplicație. Dezvoltatorii au colaborat cu academicieni pentru a aborda problemele de _acces echitabil și diviziuni digitale_ pentru echitate. |
| **Echitatea algoritmică** | 2018 - Studiul MIT [Gender Shades](http://gendershades.org/overview.html) a evaluat acuratețea produselor AI de clasificare a genului, expunând lacunele în acuratețe pentru femei și persoane de culoare. Un [card Apple din 2019](https://www.wired.com/story/the-apple-card-didnt-see-genderand-thats-the-problem/) părea să ofere mai puțin credit femeilor decât bărbaților. Ambele au ilustrat probleme de părtinire algoritmică care duc la prejudicii socio-economice.|
| **Denaturarea datelor** | 2020 - [Departamentul de Sănătate Publică din Georgia a publicat grafice COVID-19](https://www.vox.com/covid-19-coronavirus-us-response-trump/2020/5/18/21262265/georgia-covid-19-cases-declining-reopening) care păreau să inducă în eroare cetățenii despre tendințele cazurilor confirmate prin ordonarea necronologică pe axa x. Acest lucru ilustrează denaturarea prin trucuri de vizualizare. |
| **Iluzia alegerii libere** | 2020 - Aplicația educațională [ABCmouse a plătit 10 milioane de dolari pentru a soluționa o plângere FTC](https://www.washingtonpost.com/business/2020/09/04/abcmouse-10-million-ftc-settlement/) în care părinții au fost prinși în abonamente pe care nu le puteau anula. Acest lucru ilustrează modelele întunecate în arhitecturile de alegere, unde utilizatorii au fost influențați spre alegeri potențial dăunătoare. |
| **Confidențialitatea datelor și drepturile utilizatorilor** | 2021 - [Scurgerea de date Facebook](https://www.npr.org/2021/04/09/986005820/after-data-breach-exposes-530-million-facebook-says-it-will-not-notify-users) a expus datele a 530 de milioane de utilizatori, rezultând într-o amendă de 5 miliarde de dolari către FTC. Totuși, compania a refuzat să notifice utilizatorii despre breșă, încălcând drepturile utilizatorilor privind transparența și accesul la date. |
| **Consimțământ informat** | 1972 - [Tuskegee Syphilis Study](https://en.wikipedia.org/wiki/Tuskegee_Syphilis_Study) - Bărbații afro-americani care au participat la studiu au fost promiși îngrijire medicală gratuită _dar au fost înșelați_ de cercetători care nu le-au informat despre diagnostic sau despre disponibilitatea tratamentului. Mulți subiecți au murit, iar partenerii sau copiii au fost afectați; studiul a durat 40 de ani. |
| **Confidențialitatea datelor** | 2007 - [Premiul Netflix pentru date](https://www.wired.com/2007/12/why-anonymous-data-sometimes-isnt/) a oferit cercetătorilor _10M de evaluări anonimizate de filme de la 50K de clienți_ pentru a îmbunătăți algoritmii de recomandare. Totuși, cercetătorii au reușit să coreleze datele anonimizate cu date identificabile personal din _seturi de date externe_ (de exemplu, comentarii IMDb) - efectiv "de-anonimizând" unii abonați Netflix.|
| **Bias în colectare** | 2013 - Orașul Boston [a dezvoltat Street Bump](https://www.boston.gov/transportation/street-bump), o aplicație care permite cetățenilor să raporteze gropi, oferind orașului date mai bune despre drumuri pentru a identifica și rezolva problemele. Totuși, [persoanele din grupuri cu venituri mai mici aveau acces redus la mașini și telefoane](https://hbr.org/2013/04/the-hidden-biases-in-big-data), făcând problemele lor de drum invizibile în această aplicație. Dezvoltatorii au colaborat cu academicieni pentru a aborda _accesul echitabil și diviziunile digitale_ pentru corectitudine. |
| **Corectitudinea algoritmică** | 2018 - Studiul MIT [Gender Shades](http://gendershades.org/overview.html) a evaluat acuratețea produselor AI de clasificare a genului, expunând lacunele de acuratețe pentru femei și persoane de culoare. Un [Apple Card din 2019](https://www.wired.com/story/the-apple-card-didnt-see-genderand-thats-the-problem/) părea să ofere mai puțin credit femeilor decât bărbaților. Ambele au ilustrat probleme de bias algoritmic care conduc la prejudicii socio-economice.|
| **Denaturarea datelor** | 2020 - [Departamentul de Sănătate Publică din Georgia a lansat grafice COVID-19](https://www.vox.com/covid-19-coronavirus-us-response-trump/2020/5/18/21262265/georgia-covid-19-cases-declining-reopening) care păreau să inducă în eroare cetățenii despre tendințele cazurilor confirmate prin ordonarea non-cronologică pe axa x. Acest lucru ilustrează denaturarea prin trucuri de vizualizare. |
| **Iluzia alegerii libere** | 2020 - Aplicația de învățare [ABCmouse a plătit 10M pentru a soluționa o plângere FTC](https://www.washingtonpost.com/business/2020/09/04/abcmouse-10-million-ftc-settlement/) unde părinții au fost blocați în plata abonamentelor pe care nu le puteau anula. Acest lucru ilustrează dark patterns în arhitecturile de alegere, unde utilizatorii au fost influențați spre alegeri potențial dăunătoare. |
| **Confidențialitatea datelor și drepturile utilizatorilor** | 2021 - [Breșa de date Facebook](https://www.npr.org/2021/04/09/986005820/after-data-breach-exposes-530-million-facebook-says-it-will-not-notify-users) a expus datele a 530M de utilizatori, rezultând într-o amendă de 5B către FTC. Totuși, compania a refuzat să notifice utilizatorii despre breșă, încălcând drepturile utilizatorilor privind transparența și accesul la date. |
Doriți să explorați mai multe studii de caz? Consultați aceste resurse:
* [Ethics Unwrapped](https://ethicsunwrapped.utexas.edu/case-studies) - dileme etice din diverse industrii.
* [Cursul de etică în știința datelor](https://www.coursera.org/learn/data-science-ethics#syllabus) - studii de caz emblematice explorate.
* [Unde lucrurile au mers prost](https://deon.drivendata.org/examples/) - lista de verificare Deon cu exemple.
* [Cursul de etică în știința datelor](https://www.coursera.org/learn/data-science-ethics#syllabus) - studii de caz de referință explorate.
* [Unde lucrurile au mers prost](https://deon.drivendata.org/examples/) - checklist-ul Deon cu exemple.
> 🚨 Gândiți-vă la studiile de caz pe care le-ați văzut - ați experimentat sau ați fost afectați de o provocare etică similară în viața dumneavoastră? Puteți să vă gândiți la cel puțin un alt studiu de caz care ilustrează una dintre provocările etice discutate în această secțiune?
> 🚨 Gândiți-vă la studiile de caz pe care le-ați văzut - ați experimentat sau ați fost afectați de o provocare etică similară în viața voastră? Puteți să vă gândiți la cel puțin un alt studiu de caz care ilustrează una dintre provocările etice discutate în această secțiune?
## Etică aplicată
## Etica aplicată
Am discutat despre concepte etice, provocări și studii de caz în contexte din lumea reală. Dar cum începem să _aplicăm_ principiile și practicile etice în proiectele noastre? Și cum _operaționalizăm_ aceste practici pentru o mai bună guvernanță? Să explorăm câteva soluții din lumea reală:
Am discutat despre concepte etice, provocări și studii de caz în contexte reale. Dar cum începem să _aplicăm_ principiile și practicile etice în proiectele noastre? Și cum _operaționalizăm_ aceste practici pentru o guvernanță mai bună? Să explorăm câteva soluții reale:
### 1. Coduri profesionale
Codurile profesionale oferă o opțiune pentru organizații de a „stimula” membrii să susțină principiile etice și declarația de misiune. Codurile sunt _ghiduri morale_ pentru comportamentul profesional, ajutând angajații sau membrii să ia decizii care se aliniază cu principiile organizației lor. Ele sunt eficiente doar în măsura în care membrii le respectă voluntar; totuși, multe organizații oferă recompense și penalități suplimentare pentru a motiva conformarea.
Codurile profesionale oferă o opțiune pentru organizații de a "motiva" membrii să susțină principiile etice și declarația de misiune. Codurile sunt _ghiduri morale_ pentru comportamentul profesional, ajutând angajații sau membrii să ia decizii care se aliniază cu principiile organizației lor. Ele sunt eficiente doar în măsura în care membrii le respectă voluntar; totuși, multe organizații oferă recompense și penalități suplimentare pentru a motiva respectarea codurilor.
Exemple includ:
* [Codul de etică Oxford Munich](http://www.code-of-ethics.org/code-of-conduct/)
* [Codul de conduită al Asociației de Știința Datelor](http://datascienceassn.org/code-of-conduct.html) (creat în 2013)
* [Codul de etică și conduită profesională ACM](https://www.acm.org/code-of-ethics) (din 1993)
* [Oxford Munich](http://www.code-of-ethics.org/code-of-conduct/) Cod de Etică
* [Data Science Association](http://datascienceassn.org/code-of-conduct.html) Cod de Conduită (creat în 2013)
* [ACM Code of Ethics and Professional Conduct](https://www.acm.org/code-of-ethics) (din 1993)
> 🚨 Faceți parte dintr-o organizație profesională de inginerie sau știința datelor? Explorați site-ul lor pentru a vedea dacă definesc un cod profesional de etică. Ce spune acesta despre principiile lor etice? Cum „stimulează” membrii să respecte codul?
> 🚨 Faceți parte dintr-o organizație profesională de inginerie sau știința datelor? Explorați site-ul lor pentru a vedea dacă definesc un cod profesional de etică. Ce spune acesta despre principiile lor etice? Cum "motivează" membrii să urmeze codul?
### 2. Liste de verificare etică
În timp ce codurile profesionale definesc comportamentul _etic_ necesar practicienilor, ele [au limitări cunoscute](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md) în aplicare, în special în proiectele de mare amploare. În schimb, mulți experți în știința datelor [pledează pentru liste de verificare](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md), care pot **conecta principiile la practici** într-un mod mai determinist și acționabil.
În timp ce codurile profesionale definesc comportamentul _etic necesar_ de la practicieni, ele [au limitări cunoscute](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md) în aplicare, în special în proiectele de mare amploare. În schimb, mulți experți în știința datelor [pledează pentru liste de verificare](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md), care pot **conecta principiile la practici** într-un mod mai determinist și acționabil.
Listele de verificare transformă întrebările în sarcini „da/nu” care pot fi operaționalizate, permițându-le să fie urmărite ca parte a fluxurilor de lucru standard pentru lansarea produselor.
Listele de verificare transformă întrebările în sarcini "da/nu" care pot fi operaționalizate, permițându-le să fie urmărite ca parte a fluxurilor de lucru standard pentru lansarea produselor.
Exemple includ:
* [Deon](https://deon.drivendata.org/) - o listă de verificare generală pentru etica datelor creată din [recomandări din industrie](https://deon.drivendata.org/#checklist-citations) cu un instrument de linie de comandă pentru integrare ușoară.
* [Lista de verificare pentru auditul confidențialității](https://cyber.harvard.edu/ecommerce/privacyaudit.html) - oferă îndrumări generale pentru practicile de manipulare a informațiilor din perspective legale și sociale.
* [Lista de verificare pentru echitatea AI](https://www.microsoft.com/en-us/research/project/ai-fairness-checklist/) - creată de practicieni AI pentru a sprijini adoptarea și integrarea verificărilor de echitate în ciclurile de dezvoltare AI.
* [22 de întrebări pentru etica în date și AI](https://medium.com/the-organization/22-questions-for-ethics-in-data-and-ai-efb68fd19429) - un cadru mai deschis, structurat pentru explorarea inițială a problemelor etice în design, implementare și contexte organizaționale.
* [Deon](https://deon.drivendata.org/) - o listă generală de verificare pentru etica datelor creată din [recomandări din industrie](https://deon.drivendata.org/#checklist-citations) cu un instrument de linie de comandă pentru integrare ușoară.
* [Lista de verificare pentru auditul confidențialității](https://cyber.harvard.edu/ecommerce/privacyaudit.html) - oferă orientări generale pentru practicile de manipulare a informațiilor din perspective legale și sociale.
* [Lista de verificare pentru corectitudinea AI](https://www.microsoft.com/en-us/research/project/ai-fairness-checklist/) - creată de practicieni AI pentru a sprijini adoptarea și integrarea verificărilor de corectitudine în ciclurile de dezvoltare AI.
* [22 de întrebări pentru etica în date și AI](https://medium.com/the-organization/22-questions-for-ethics-in-data-and-ai-efb68fd19429) - cadru mai deschis, structurat pentru explorarea inițială a problemelor etice în design, implementare și contexte organizaționale.
### 3. Reglementări etice
Etica se referă la definirea valorilor comune și la a face ceea ce este corect _voluntar_. **Conformitatea** se referă la _respectarea legii_ acolo unde este definită. **Guvernanța** acoperă în general toate modurile în care organizațiile operează pentru a aplica principiile etice și pentru a respecta legile stabilite.
Astăzi, guvernanța ia două forme în cadrul organizațiilor. În primul rând, este vorba despre definirea principiilor **AI etice** și stabilirea practicilor pentru a operaționaliza adoptarea lor în toate proiectele AI ale organizației. În al doilea rând, este vorba despre respectarea tuturor reglementărilor guvernamentale privind **protecția datelor** pentru regiunile în care operează.
Astăzi, guvernanța ia două forme în cadrul organizațiilor. În primul rând, este vorba despre definirea principiilor **AI etice** și stabilirea practicilor pentru a operaționaliza adoptarea în toate proiectele AI din organizație. În al doilea rând, este vorba despre respectarea tuturor reglementărilor guvernamentale **privind protecția datelor** pentru regiunile în care operează.
Exemple de reglementări privind protecția și confidențialitatea datelor:
* `1974`, [Legea privind confidențialitatea din SUA](https://www.justice.gov/opcl/privacy-act-1974) - reglementează colectarea, utilizarea și divulgarea informațiilor personale de către _guvernul federal_.
* `1996`, [Legea privind portabilitatea și responsabilitatea asigurărilor de sănătate din SUA (HIPAA)](https://www.cdc.gov/phlp/publications/topic/hipaa.html) - protejează datele personale de sănătate.
* `1998`, [Legea privind protecția confidențialității online a copiilor din SUA (COPPA)](https://www.ftc.gov/enforcement/rules/rulemaking-regulatory-reform-proceedings/childrens-online-privacy-protection-rule) - protejează confidențialitatea datelor copiilor sub 13 ani.
* `2018`, [Regulamentul general privind protecția datelor (GDPR)](https://gdpr-info.eu/) - oferă drepturi utilizatorilor, protecția datelor și confidențialitate.
* `2018`, [Legea privind confidențialitatea consumatorilor din California (CCPA)](https://www.oag.ca.gov/privacy/ccpa) oferă consumatorilor mai multe _drepturi_ asupra datelor lor (personale).
* `2021`, [Legea privind protecția informațiilor personale din China](https://www.reuters.com/world/china/china-passes-new-personal-data-privacy-law-take-effect-nov-1-2021-08-20/) tocmai a fost adoptată, creând una dintre cele mai puternice reglementări privind confidențialitatea datelor online la nivel mondial.
* `1974`, [US Privacy Act](https://www.justice.gov/opcl/privacy-act-1974) - reglementează colectarea, utilizarea și divulgarea informațiilor personale de către _guvernul federal_.
* `1996`, [US Health Insurance Portability & Accountability Act (HIPAA)](https://www.cdc.gov/phlp/publications/topic/hipaa.html) - protejează datele personale de sănătate.
* `1998`, [US Children's Online Privacy Protection Act (COPPA)](https://www.ftc.gov/enforcement/rules/rulemaking-regulatory-reform-proceedings/childrens-online-privacy-protection-rule) - protejează confidențialitatea datelor copiilor sub 13 ani.
* `2018`, [Regulamentul General privind Protecția Datelor (GDPR)](https://gdpr-info.eu/) - oferă drepturi utilizatorilor, protecția datelor și confidențialitate.
* `2018`, [California Consumer Privacy Act (CCPA)](https://www.oag.ca.gov/privacy/ccpa) oferă consumatorilor mai multe _drepturi_ asupra datelor lor (personale).
* `2021`, Legea Chinei privind [Protecția Informațiilor Personale](https://www.reuters.com/world/china/china-passes-new-personal-data-privacy-law-take-effect-nov-1-2021-08-20/) tocmai a fost adoptată, creând una dintre cele mai puternice reglementări privind confidențialitatea datelor online la nivel mondial.
> 🚨 Uniunea Europeană a definit GDPR (Regulamentul general privind protecția datelor), care rămâne una dintre cele mai influente reglementări privind confidențialitatea datelor astăzi. Știați că definește și [8 drepturi ale utilizatorilor](https://www.freeprivacypolicy.com/blog/8-user-rights-gdpr) pentru a proteja confidențialitatea digitală și datele personale ale cetățenilor? Aflați care sunt acestea și de ce contează.
> 🚨 Uniunea Europeană a definit GDPR (Regulamentul General privind Protecția Datelor), care rămâne una dintre cele mai influente reglementări privind confidențialitatea datelor astăzi. Știați că definește și [8 drepturi ale utilizatorilor](https://www.freeprivacypolicy.com/blog/8-user-rights-gdpr) pentru a proteja confidențialitatea digitală și datele personale ale cetățenilor? Aflați care sunt acestea și de ce contează.
### 4. Cultura eticii
### 4. Cultura etică
Rețineți că există un decalaj intangibil între _conformitate_ (a face suficient pentru a respecta „litera legii”) și abordarea [problemelor sistemice](https://www.coursera.org/learn/data-science-ethics/home/week/4) (cum ar fi osificarea, asimetria informațională și inechitatea distribuțională) care pot accelera utilizarea abuzivă a AI.
Rețineți că există un decalaj intangibil între _conformitate_ (a face suficient pentru a respecta "litera legii") și abordarea [problemelor sistemice](https://www.coursera.org/learn/data-science-ethics/home/week/4) (cum ar fi osificarea, asimetria informațiilor și nedreptatea distribuțională) care pot accelera utilizarea abuzivă a AI.
Acestea din urmă necesită [abordări colaborative pentru definirea culturilor etice](https://towardsdatascience.com/why-ai-ethics-requires-a-culture-driven-approach-26f451afa29f) care construiesc conexiuni emoționale și valori comune consistente _în cadrul organizațiilor_ din industrie. Acest lucru solicită mai multe [culturi etice formalizate ale datelor](https://www.codeforamerica.org/news/formalizing-an-ethical-data-culture/) în organizații - permițând _oricui_ să [tragă cablul Andon](https://en.wikipedia.org/wiki/Andon_(manufacturing)) (pentru a ridica preocupări etice devreme în proces) și făcând _evaluările etice_ (de exemplu, în angajare) un criteriu de bază pentru formarea echipelor în proiectele AI.
Acesta din urmă necesită [abordări colaborative pentru definirea culturilor etice](https://towardsdatascience.com/why-ai-ethics-requires-a-culture-driven-approach-26f451afa29f) care construiesc conexiuni emoționale și valori comune consistente _în cadrul organizațiilor_ din industrie. Acest lucru solicită mai multe [culturi etice formalizate](https://www.codeforamerica.org/news/formalizing-an-ethical-data-culture/) în organizații - permițând _oricui_ să [tragă cordonul Andon](https://en.wikipedia.org/wiki/Andon_(manufacturing)) (pentru a ridica preocupări etice devreme în proces) și făcând _evaluările etice_ (de exemplu, în angajare) un criteriu esențial pentru formarea echipelor în proiectele AI.
---
## [Chestionar post-lectură](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/3) 🎯
## Recapitulare și studiu individual
## [Quiz post-lectură](https://ff-quizzes.netlify.app/en/ds/) 🎯
## Recapitulare și auto-studiu
Cursurile și cărțile ajută la înțelegerea conceptelor și provocărilor etice de bază, în timp ce studiile de caz și instrumentele ajută la practicile de etică aplicată în contexte din lumea reală. Iată câteva resurse pentru a începe.
Cursurile și cărțile ajută la înțelegerea conceptelor etice de bază și a provocărilor, în timp ce studiile de caz și instrumentele ajută la practicile etice aplicate în contexte reale. Iată câteva resurse pentru a începe:
* [Machine Learning For Beginners](https://github.com/microsoft/ML-For-Beginners/blob/main/1-Introduction/3-fairness/README.md) - lecție despre echitate, de la Microsoft.
* [Principiile Inteligenței Artificiale Responsabile](https://docs.microsoft.com/en-us/learn/modules/responsible-ai-principles/) - parcurs de învățare gratuit de la Microsoft Learn.
* [Etică și Știința Datelor](https://resources.oreilly.com/examples/0636920203964) - EBook O'Reilly (M. Loukides, H. Mason și alții)
* [Etica în Știința Datelor](https://www.coursera.org/learn/data-science-ethics#syllabus) - curs online de la Universitatea din Michigan.
* [Ethics Unwrapped](https://ethicsunwrapped.utexas.edu/case-studies) - studii de caz de la Universitatea din Texas.
* [Machine Learning For Beginners](https://github.com/microsoft/ML-For-Beginners/blob/main/1-Introduction/3-fairness/README.md) - lecție despre corectitudine, de la Microsoft.
* [Principiile AI Responsabil](https://docs.microsoft.com/en-us/learn/modules/responsible-ai-principles/) - parcurs de învățare gratuit de la Microsoft Learn.
* [Etică și Știința Datelor](https://resources.oreilly.com/examples/0636920203964) - EBook O'Reilly (M. Loukides, H. Mason și alții)
* [Etica în Știința Datelor](https://www.coursera.org/learn/data-science-ethics#syllabus) - curs online de la Universitatea din Michigan.
* [Etica Explicată](https://ethicsunwrapped.utexas.edu/case-studies) - studii de caz de la Universitatea din Texas.
# Temă
# Temă
[Scrie un Studiu de Caz despre Etica Datelor](assignment.md)
[Scrie un Studiu de Caz despre Etica Datelor](assignment.md)
---

@ -1,31 +1,31 @@
<!--
CO_OP_TRANSLATOR_METADATA:
{
"original_hash": "8796f41f566a0a8ebb72863a83d558ed",
"translation_date": "2025-08-27T08:44:10+00:00",
"original_hash": "3a34157cc63516eba97c89a0b2f8c3e6",
"translation_date": "2025-09-03T20:52:41+00:00",
"source_file": "1-Introduction/02-ethics/README.md",
"language_code": "ru"
}
-->
# Введение в этику данных
|![Скетчноут от [(@sketchthedocs)](https://sketchthedocs.dev)](../../sketchnotes/02-Ethics.png)|
|![ Скетчноут от [(@sketchthedocs)](https://sketchthedocs.dev) ](../../sketchnotes/02-Ethics.png)|
|:---:|
| Этика в науке о данных - _Скетчноут от [@nitya](https://twitter.com/nitya)_ |
| Этика данных - _Скетчноут от [@nitya](https://twitter.com/nitya)_ |
---
Мы все являемся гражданами мира данных, живущими в эпоху цифровизации.
Рыночные тенденции показывают, что к 2022 году каждая третья крупная организация будет покупать и продавать свои данные через онлайн-[площадки и биржи](https://www.gartner.com/smarterwithgartner/gartner-top-10-trends-in-data-and-analytics-for-2020/). Как **разработчики приложений**, мы обнаружим, что интеграция аналитики, основанной на данных, и автоматизации, управляемой алгоритмами, в повседневный пользовательский опыт станет проще и дешевле. Однако с распространением ИИ нам также придется понимать потенциальный вред, который может быть вызван [использованием алгоритмов в качестве оружия](https://www.youtube.com/watch?v=TQHs8SA1qpk) в масштабах.
Тенденции рынка показывают, что к 2022 году каждая третья крупная организация будет покупать и продавать свои данные через онлайн-[рынки и биржи](https://www.gartner.com/smarterwithgartner/gartner-top-10-trends-in-data-and-analytics-for-2020/). Как **разработчики приложений**, мы сможем легче и дешевле интегрировать аналитические данные и автоматизацию, основанную на алгоритмах, в повседневный пользовательский опыт. Но с распространением ИИ нам также нужно понимать потенциальный вред, который может быть вызван [использованием алгоритмов в качестве оружия](https://www.youtube.com/watch?v=TQHs8SA1qpk) в масштабах.
Тенденции также указывают на то, что к 2025 году мы будем создавать и потреблять более [180 зеттабайт](https://www.statista.com/statistics/871513/worldwide-data-created/) данных. Как **ученые в области данных**, мы получаем беспрецедентный доступ к персональным данным. Это позволяет нам создавать поведенческие профили пользователей и влиять на принятие решений таким образом, чтобы создавать [иллюзию свободного выбора](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice), при этом потенциально направляя пользователей к результатам, которые мы предпочитаем. Это также поднимает более широкие вопросы о конфиденциальности данных и защите пользователей.
Тенденции также показывают, что к 2025 году мы будем создавать и потреблять более [180 зеттабайт](https://www.statista.com/statistics/871513/worldwide-data-created/) данных. Как **ученые данных**, мы получим беспрецедентный доступ к персональным данным. Это позволит нам создавать поведенческие профили пользователей и влиять на принятие решений, создавая [иллюзию свободного выбора](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice), при этом возможно направляя пользователей к предпочтительным для нас результатам. Это также поднимает более широкие вопросы о конфиденциальности данных и защите пользователей.
Этика данных становится еобходимыми ограничителями_ для науки о данных и инженерии, помогая минимизировать потенциальный вред и непреднамеренные последствия наших действий, основанных на данных. [Цикл ажиотажа Гартнера для ИИ](https://www.gartner.com/smarterwithgartner/2-megatrends-dominate-the-gartner-hype-cycle-for-artificial-intelligence-2020/) выделяет важные тенденции в области цифровой этики, ответственного ИИ и управления ИИ как ключевые драйверы для более крупных мегатрендов, связанных с емократизацией_ и _индустриализацией_ ИИ.
Этика данных становится еобходимыми ограничителями_ для науки о данных и инженерии, помогая минимизировать потенциальный вред и непреднамеренные последствия наших действий, основанных на данных. [Цикл ожиданий Gartner для ИИ](https://www.gartner.com/smarterwithgartner/2-megatrends-dominate-the-gartner-hype-cycle-for-artificial-intelligence-2020/) выделяет важные тенденции в области цифровой этики, ответственного ИИ и управления ИИ как ключевые драйверы более крупных мегатрендов, связанных с емократизацией_ и _индустриализацией_ ИИ.
![Цикл ажиотажа Гартнера для ИИ - 2020](https://images-cdn.newscred.com/Zz1mOWJhNzlkNDA2ZTMxMWViYjRiOGFiM2IyMjQ1YmMwZQ==)
![Цикл ожиданий Gartner для ИИ - 2020](https://images-cdn.newscred.com/Zz1mOWJhNzlkNDA2ZTMxMWViYjRiOGFiM2IyMjQ1YmMwZQ==)
В этом уроке мы исследуем увлекательную область этики данных - от основных концепций и вызовов до примеров из практики и прикладных концепций ИИ, таких как управление, которые помогают создать культуру этики в командах и организациях, работающих с данными и ИИ.
В этом уроке мы изучим увлекательную область этики данных - от основных концепций и вызовов до примеров из реальной жизни и прикладных концепций ИИ, таких как управление, которые помогают создать культуру этики в командах и организациях, работающих с данными и ИИ.
## [Тест перед лекцией](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/2) 🎯
@ -33,61 +33,61 @@ CO_OP_TRANSLATOR_METADATA:
Начнем с понимания базовой терминологии.
Слово "этика" происходит от [греческого слова "ethikos"](https://en.wikipedia.org/wiki/Ethics) (и его корня "ethos"), что означает _характер или моральная природа_.
Слово "этика" происходит от [греческого слова "ethikos"](https://en.wikipedia.org/wiki/Ethics) (и его корня "ethos"), означающего _характер или моральная природа_.
**Этика** касается общих ценностей и моральных принципов, которые регулируют наше поведение в обществе. Этика основывается не на законах, а на широко принятых нормах того, что является "правильным или неправильным". Однако этические соображения могут влиять на корпоративное управление и государственное регулирование, создавая больше стимулов для соблюдения.
**Этика** касается общих ценностей и моральных принципов, которые регулируют наше поведение в обществе. Этика основывается не на законах, а на широко принятых нормах того, что считается "правильным или неправильным". Однако этические соображения могут влиять на инициативы корпоративного управления и государственные регулирования, создавая больше стимулов для соблюдения.
**Этика данных** - это [новая ветвь этики](https://royalsocietypublishing.org/doi/full/10.1098/rsta.2016.0360#sec-1), которая "изучает и оценивает моральные проблемы, связанные с анными, алгоритмами и соответствующими практиками_". Здесь **"данные"** сосредоточены на действиях, связанных с созданием, записью, курированием, обработкой, распространением, обменом и использованием; **"алгоритмы"** - на ИИ, агентах, машинном обучении и роботах; а **"практики"** - на таких темах, как ответственное новаторство, программирование, хакерство и кодексы этики.
**Этика данных** - это [новая ветвь этики](https://royalsocietypublishing.org/doi/full/10.1098/rsta.2016.0360#sec-1), которая "изучает и оценивает моральные проблемы, связанные с анными, алгоритмами и соответствующими практиками_". Здесь **"данные"** сосредоточены на действиях, связанных с генерацией, записью, обработкой, распространением, обменом и использованием, **"алгоритмы"** - на ИИ, агентах, машинном обучении и роботах, а **"практики"** - на таких темах, как ответственное инновации, программирование, хакерство и кодексы этики.
**Прикладная этика** - это [практическое применение моральных соображений](https://en.wikipedia.org/wiki/Applied_ethics). Это процесс активного изучения этических вопросов в контексте _реальных действий, продуктов и процессов_ и принятия корректирующих мер, чтобы они оставались в соответствии с нашими определенными этическими ценностями.
**Культура этики** касается [_операционализации_ прикладной этики](https://hbr.org/2019/05/how-to-design-an-ethical-organization), чтобы гарантировать, что наши этические принципы и практики последовательно и масштабируемо внедряются по всей организации. Успешные культуры этики определяют этические принципы на уровне всей организации, предоставляют значимые стимулы для соблюдения и укрепляют нормы этики, поощряя и усиливая желаемое поведение на каждом уровне организации.
**Культура этики** касается [_операционализации_ прикладной этики](https://hbr.org/2019/05/how-to-design-an-ethical-organization), чтобы гарантировать, что наши этические принципы и практики принимаются последовательно и масштабируемо во всей организации. Успешные культуры этики определяют этические принципы на уровне всей организации, предоставляют значимые стимулы для соблюдения и укрепляют нормы этики, поощряя и усиливая желаемое поведение на каждом уровне организации.
## Концепции этики
В этом разделе мы обсудим такие концепции, как **общие ценности** (принципы) и **этические вызовы** (проблемы) в области этики данных, а также рассмотрим **примеры из практики**, которые помогут вам понять эти концепции в реальных контекстах.
В этом разделе мы обсудим такие концепции, как **общие ценности** (принципы) и **этические вызовы** (проблемы) для этики данных, а также изучим **примеры из реальной жизни**, которые помогут вам понять эти концепции в реальных контекстах.
### 1. Принципы этики
Любая стратегия этики данных начинается с определения _этических принципов_ - "общих ценностей", которые описывают приемлемое поведение и направляют действия, соответствующие требованиям, в наших проектах, связанных с данными и ИИ. Вы можете определить их на индивидуальном или командном уровне. Однако большинство крупных организаций формулируют их в виде миссии или рамочной программы _этического ИИ_, которая определяется на корпоративном уровне и последовательно внедряется во всех командах.
Каждая стратегия этики данных начинается с определения _этических принципов_ - "общих ценностей", которые описывают приемлемое поведение и направляют действия, соответствующие требованиям, в наших проектах, связанных с данными и ИИ. Вы можете определить их на индивидуальном или командном уровне. Однако большинство крупных организаций формулируют их в виде миссии или рамочной программы _этического ИИ_, которая определяется на корпоративном уровне и последовательно применяется ко всем командам.
**Пример:** Миссия [Ответственного ИИ](https://www.microsoft.com/en-us/ai/responsible-ai) компании Microsoft гласит: _"Мы привержены развитию ИИ, основанного на этических принципах, которые ставят людей на первое место"_ - выделяя 6 этических принципов в следующей рамочной программе:
**Пример:** Миссия Microsoft [Ответственный ИИ](https://www.microsoft.com/en-us/ai/responsible-ai) гласит: _"Мы стремимся к развитию ИИ, основанного на этических принципах, которые ставят людей на первое место"_ - определяя 6 этических принципов в рамочной программе ниже:
![Ответственный ИИ в Microsoft](https://docs.microsoft.com/en-gb/azure/cognitive-services/personalizer/media/ethics-and-responsible-use/ai-values-future-computed.png)
Давайте кратко рассмотрим эти принципы. розрачность_ и _ответственность_ являются основополагающими ценностями, на которых строятся другие принципы, поэтому начнем с них:
Давайте кратко рассмотрим эти принципы. розрачность_ и _ответственность_ являются основополагающими ценностями, на которых строятся остальные принципы - начнем с них:
* [**Ответственность**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) делает практиков _ответственными_ за их действия с данными и ИИ, а также за соблюдение этих этических принципов.
* [**Прозрачность**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) гарантирует, что действия с данными и ИИ _понятны_ (интерпретируемы) пользователям, объясняя, что и почему было сделано.
* [**Ответственность**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) делает практиков _ответственными_ за их действия, связанные с данными и ИИ, и за соблюдение этих этических принципов.
* [**Прозрачность**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) гарантирует, что действия, связанные с данными и ИИ, _понятны_ пользователям, объясняя, что и почему было сделано.
* [**Справедливость**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1%3aprimaryr6) - сосредоточена на обеспечении того, чтобы ИИ относился о всем людям_ справедливо, устраняя любые системные или скрытые социально-технические предвзятости в данных и системах.
* [**Надежность и безопасность**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - гарантирует, что ИИ ведет себя _последовательно_ с определенными ценностями, минимизируя потенциальный вред или непреднамеренные последствия.
* [**Конфиденциальность и безопасность**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - касается понимания происхождения данных и предоставления онфиденциальности данных и связанных с этим защит_ пользователям.
* [**Инклюзивность**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - касается проектирования решений ИИ с намерением адаптировать их для удовлетворения _широкого спектра человеческих потребностей_ и возможностей.
> 🚨 Подумайте, какой могла бы быть ваша миссия в области этики данных. Изучите рамочные программы этического ИИ других организаций - вот примеры от [IBM](https://www.ibm.com/cloud/learn/ai-ethics), [Google](https://ai.google/principles) и [Facebook](https://ai.facebook.com/blog/facebooks-five-pillars-of-responsible-ai/). Какие общие ценности у них есть? Как эти принципы соотносятся с продуктами ИИ или отраслью, в которой они работают?
> 🚨 Подумайте, какой могла бы быть ваша миссия в области этики данных. Изучите рамочные программы этического ИИ других организаций - вот примеры от [IBM](https://www.ibm.com/cloud/learn/ai-ethics), [Google](https://ai.google/principles) и [Facebook](https://ai.facebook.com/blog/facebooks-five-pillars-of-responsible-ai/). Какие общие ценности у них есть? Как эти принципы связаны с продуктами ИИ или отраслью, в которой они работают?
### 2. Этические вызовы
После того как мы определили этические принципы, следующий шаг - оценить наши действия с данными и ИИ, чтобы убедиться, что они соответствуют этим общим ценностям. Подумайте о своих действиях в двух категориях: _сбор данных_ и _разработка алгоритмов_.
После того как мы определили этические принципы, следующим шагом будет оценка наших действий, связанных с данными и ИИ, чтобы понять, соответствуют ли они этим общим ценностям. Подумайте о своих действиях в двух категориях: _сбор данных_ и _разработка алгоритмов_.
При сборе данных действия, скорее всего, будут включать **персональные данные** или персонально идентифицируемую информацию (PII) для идентифицируемых живых лиц. Это включает [разнообразные элементы неперсональных данных](https://ec.europa.eu/info/law/law-topic/data-protection/reform/what-personal-data_en), которые совокупности_ идентифицируют человека. Этические вызовы могут быть связаны с онфиденциальностью данных_, _правами собственности на данные_ и такими темами, как _осознанное согласие_ и _права интеллектуальной собственности_ пользователей.
При сборе данных действия, скорее всего, будут связаны с **персональными данными** или персонально идентифицируемой информацией (PII) для идентифицируемых живых лиц. Это включает [разнообразные элементы неперсональных данных](https://ec.europa.eu/info/law/law-topic/data-protection/reform/what-personal-data_en), которые совокупности_ идентифицируют человека. Этические вызовы могут быть связаны с онфиденциальностью данных_, _правами собственности на данные_ и такими темами, как _осознанное согласие_ и _права интеллектуальной собственности_ пользователей.
При разработке алгоритмов действия будут включать сбор и курирование **наборов данных**, а затем их использование для обучения и развертывания **моделей данных**, которые прогнозируют результаты или автоматизируют решения в реальных контекстах. Этические вызовы могут возникать из-за _предвзятости наборов данных_, проблем с ачеством данных_, есправедливости_ и скажений_ в алгоритмах, включая некоторые системные проблемы.
При разработке алгоритмов действия будут включать сбор и обработку **наборов данных**, а затем их использование для обучения и развертывания **моделей данных**, которые предсказывают результаты или автоматизируют принятие решений в реальных контекстах. Этические вызовы могут возникать из-за _предвзятости наборов данных_, проблем с ачеством данных_, есправедливости_ и скажений_ в алгоритмах, включая некоторые системные проблемы.
В обоих случаях этические вызовы подчеркивают области, где наши действия могут вступать в конфликт с нашими общими ценностями. Чтобы обнаружить, смягчить, минимизировать или устранить эти проблемы, нам нужно задавать моральные вопросы "да/нет", связанные с нашими действиями, а затем принимать корректирующие меры по мере необходимости. Давайте рассмотрим некоторые этические вызовы и моральные вопросы, которые они поднимают:
#### 2.1 Право собственности на данные
#### 2.1 Права собственности на данные
Сбор данных часто включает персональные данные, которые могут идентифицировать субъектов данных. [Право собственности на данные](https://permission.io/blog/data-ownership) касается онтроля_ и [_прав пользователей_](https://permission.io/blog/data-ownership), связанных с созданием, обработкой и распространением данных.
Сбор данных часто включает персональные данные, которые могут идентифицировать субъектов данных. [Права собственности на данные](https://permission.io/blog/data-ownership) касаются онтроля_ и [_прав пользователей_](https://permission.io/blog/data-ownership), связанных с созданием, обработкой и распространением данных.
Моральные вопросы, которые нужно задать:
* Кто владеет данными? (пользователь или организация)
* Какие права есть у субъектов данных? (например, доступ, удаление, переносимость)
* Какие права есть у организаций? (например, исправление злонамеренных отзывов пользователей)
* Какие права есть у организаций? (например, исправление вредоносных отзывов пользователей)
#### 2.2 Осознанное согласие
[Осознанное согласие](https://legaldictionary.net/informed-consent/) определяет акт согласия пользователей на действие (например, сбор данных) с _полным пониманием_ соответствующих фактов, включая цель, потенциальные риски и альтернативы.
[Осознанное согласие](https://legaldictionary.net/informed-consent/) определяет акт согласия пользователя на действие (например, сбор данных) с _полным пониманием_ соответствующих фактов, включая цель, потенциальные риски и альтернативы.
Вопросы для изучения:
* Дал ли пользователь (субъект данных) разрешение на сбор и использование данных?
@ -96,46 +96,46 @@ CO_OP_TRANSLATOR_METADATA:
#### 2.3 Интеллектуальная собственность
[Интеллектуальная собственность](https://en.wikipedia.org/wiki/Intellectual_property) относится к нематериальным результатам человеческой инициативы, которые могут _иметь экономическую ценность_ для отдельных лиц или бизнеса.
[Интеллектуальная собственность](https://en.wikipedia.org/wiki/Intellectual_property) относится к нематериальным творениям, возникающим в результате человеческой инициативы, которые могут _иметь экономическую ценность_ для отдельных лиц или бизнеса.
Вопросы для изучения:
* Имеют ли собранные данные экономическую ценность для пользователя или бизнеса?
* Есть ли у **пользователя** права интеллектуальной собственности?
* Есть ли у **организации** права интеллектуальной собственности?
* Если такие права существуют, как мы их защищаем?
* Есть ли у **пользователя** интеллектуальная собственность здесь?
* Есть ли у **организации** интеллектуальная собственность здесь?
* Если эти права существуют, как мы их защищаем?
#### 2.4 Конфиденциальность данных
[Конфиденциальность данных](https://www.northeastern.edu/graduate/blog/what-is-data-privacy/) или информационная конфиденциальность касается сохранения конфиденциальности пользователей и защиты их идентичности в отношении персонально идентифицируемой информации.
[Конфиденциальность данных](https://www.northeastern.edu/graduate/blog/what-is-data-privacy/) или информационная конфиденциальность касается сохранения конфиденциальности пользователя и защиты его идентичности в отношении персонально идентифицируемой информации.
Вопросы для изучения:
* Защищены ли данные пользователей (персональные) от взломов и утечек?
* Доступны ли данные пользователей только авторизованным пользователям и в соответствующих контекстах?
* Сохраняется ли анонимность пользователей при обмене или распространении данных?
* Можно ли деидентифицировать пользователя из анонимизированных наборов данных?
* Можно ли деидентифицировать пользователя из анонимных наборов данных?
#### 2.5 Право быть забытым
[Право быть забытым](https://en.wikipedia.org/wiki/Right_to_be_forgotten) или [право на удаление](https://www.gdpreu.org/right-to-be-forgotten/) предоставляет пользователям дополнительную защиту персональных данных. В частности, оно дает пользователям право запрашивать удаление или удаление персональных данных из интернет-поисковиков и других мест _при определенных обстоятельствах_, позволяя им начать заново в интернете без учета прошлых действий.
[Право быть забытым](https://en.wikipedia.org/wiki/Right_to_be_forgotten) или [право на удаление](https://www.gdpreu.org/right-to-be-forgotten/) предоставляет пользователям дополнительную защиту персональных данных. В частности, оно дает пользователям право запросить удаление или удаление персональных данных из интернет-поисков и других мест, _при определенных обстоятельствах_, позволяя им начать заново онлайн без учета прошлых действий.
Вопросы для изучения:
* Позволяет ли система субъектам данных запрашивать удаление?
* Должно ли отозвание согласия пользователя автоматически запускать удаление данных?
* Должно ли отозвание согласия пользователя автоматически инициировать удаление?
* Были ли данные собраны без согласия или незаконным способом?
* Соответствуем ли мы государственным регламентам по защите данных?
* Соответствуем ли мы государственным нормативам по конфиденциальности данных?
#### 2.6 Предвзятость наборов данных
Предвзятость наборов данных или [предвзятость при сборе](http://researcharticles.com/index.php/bias-in-data-collection-in-research/) касается выбора ерепрезентативного_ подмножества данных для разработки алгоритмов, что может создавать потенциальную несправедливость в результатах для различных групп. Типы предвзятости включают предвзятость при отборе или выборке, предвзятость добровольцев и инструментальную предвзятость.
Предвзятость наборов данных или [предвзятость сбора](http://researcharticles.com/index.php/bias-in-data-collection-in-research/) касается выбора епредставительного_ подмножества данных для разработки алгоритмов, создавая потенциальную несправедливость в результатах для различных групп. Типы предвзятости включают предвзятость выбора или выборки, предвзятость добровольцев и предвзятость инструментов.
Вопросы для изучения:
* Привлекли ли мы репрезентативный набор субъектов данных?
* Проверили ли мы наш собранный или курированный набор данных на наличие различных предвзятостей?
* Привлекли ли мы представительный набор субъектов данных?
* Проверили ли мы собранный или обработанный набор данных на наличие различных предвзятостей?
* Можем ли мы смягчить или устранить обнаруженные предвзятости?
#### 2.7 Качество данных
[Качество данных](https://lakefs.io/data-quality-testing/) оценивает достоверность курированного набора данных, используемого для разработки наших алгоритмов, проверяя, соответствуют ли признаки и записи требованиям к уровню точности и согласованности, необходимым для нашей цели в ИИ.
[Качество данных](https://lakefs.io/data-quality-testing/) оценивает достоверность обработанного набора данных, используемого для разработки наших алгоритмов, проверяя, соответствуют ли признаки и записи требованиям к уровню точности и согласованности, необходимым для нашей цели ИИ.
Вопросы для изучения:
* Захватили ли мы действительные _признаки_ для нашего случая использования?
@ -153,7 +153,7 @@ CO_OP_TRANSLATOR_METADATA:
#### 2.9 Искажение данных
[Искажение данных](https://www.sciencedirect.com/topics/computer-science/misrepresentation) касается вопроса, не передаем ли мы инсайты из честно представленных данных обманным образом, чтобы поддержать желаемый нарратив.
[Искажение данных](https://www.sciencedirect.com/topics/computer-science/misrepresentation) касается вопроса, передаем ли мы инсайты из честно представленных данных обманным образом, чтобы поддержать желаемый нарратив.
Вопросы для изучения:
* Сообщаем ли мы неполные или неточные данные?
@ -162,7 +162,7 @@ CO_OP_TRANSLATOR_METADATA:
* Существуют ли альтернативные объяснения, которые могут предложить другой вывод?
#### 2.10 Свобода выбора
[Иллюзия свободы выбора](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice) возникает, когда "архитектуры выбора" системы используют алгоритмы принятия решений, чтобы подтолкнуть людей к предпочтительному результату, создавая видимость наличия у них опций и контроля. Эти [темные паттерны](https://www.darkpatterns.org/) могут причинять социальный и экономический вред пользователям. Поскольку решения пользователей влияют на профили поведения, эти действия потенциально формируют будущие выборы, которые могут усиливать или расширять воздействие этих вредных последствий.
[Иллюзия свободы выбора](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice) возникает, когда "архитектуры выбора" системы используют алгоритмы принятия решений, чтобы подтолкнуть людей к предпочтительному результату, создавая видимость наличия вариантов и контроля. Эти [темные паттерны](https://www.darkpatterns.org/) могут причинять социальный и экономический вред пользователям. Поскольку решения пользователей влияют на профили поведения, эти действия потенциально формируют будущие выборы, усиливая или расширяя воздействие этих вредных последствий.
Вопросы для изучения:
* Понимал ли пользователь последствия принятия этого выбора?
@ -171,18 +171,18 @@ CO_OP_TRANSLATOR_METADATA:
### 3. Примеры из практики
Чтобы рассмотреть эти этические вызовы в реальных контекстах, полезно изучить примеры из практики, которые подчеркивают потенциальный вред и последствия для отдельных людей и общества, если такие нарушения этики игнорируются.
Чтобы рассмотреть этические вызовы в реальных контекстах, полезно изучить примеры из практики, которые подчеркивают потенциальный вред и последствия для отдельных людей и общества, если этические нарушения остаются без внимания.
Вот несколько примеров:
| Этический вызов | Пример из практики |
|--- |--- |
| **Осознанное согласие** | 1972 - [Исследование сифилиса в Таскиги](https://en.wikipedia.org/wiki/Tuskegee_Syphilis_Study) - афроамериканским мужчинам, участвовавшим в исследовании, обещали бесплатное медицинское обслуживание, о обманули_, не сообщив им о диагнозе или доступности лечения. Многие участники умерли, их партнеры и дети пострадали; исследование длилось 40 лет. |
| **Конфиденциальность данных** | 2007 - [Приз Netflix](https://www.wired.com/2007/12/why-anonymous-data-sometimes-isnt/) предоставил исследователям _10 миллионов анонимных оценок фильмов от 50 тысяч клиентов_, чтобы улучшить алгоритмы рекомендаций. Однако исследователи смогли сопоставить анонимные данные с персонально идентифицируемыми данными из _внешних наборов данных_ (например, комментарии IMDb), фактически "деанонимизировав" некоторых подписчиков Netflix.|
| **Смещение в сборе данных** | 2013 - Город Бостон [разработал приложение Street Bump](https://www.boston.gov/transportation/street-bump), которое позволяло гражданам сообщать о выбоинах, предоставляя городу лучшие данные о дорогах для выявления и устранения проблем. Однако [люди с низким доходом имели меньший доступ к автомобилям и телефонам](https://hbr.org/2013/04/the-hidden-biases-in-big-data), что делало их дорожные проблемы невидимыми для этого приложения. Разработчики работали с учеными над вопросами _равного доступа и цифрового разрыва_ для обеспечения справедливости. |
| **Справедливость алгоритмов** | 2018 - Исследование MIT [Gender Shades](http://gendershades.org/overview.html) оценило точность продуктов ИИ для классификации пола, выявив пробелы в точности для женщин и цветных людей. [Карта Apple 2019 года](https://www.wired.com/story/the-apple-card-didnt-see-genderand-thats-the-problem/), казалось, предлагала меньший кредит женщинам, чем мужчинам. Оба случая иллюстрируют проблемы алгоритмического смещения, приводящие к социально-экономическим последствиям.|
| **Искажение данных** | 2020 - [Департамент здравоохранения Джорджии выпустил графики COVID-19](https://www.vox.com/covid-19-coronavirus-us-response-trump/2020/5/18/21262265/georgia-covid-19-cases-declining-reopening), которые, казалось, вводили граждан в заблуждение относительно тенденций подтвержденных случаев с не хронологическим порядком на оси x. Это иллюстрирует искажение через визуализационные трюки. |
| **Иллюзия свободы выбора** | 2020 - Образовательное приложение [ABCmouse заплатило $10 млн для урегулирования жалобы FTC](https://www.washingtonpost.com/business/2020/09/04/abcmouse-10-million-ftc-settlement/), где родители были вынуждены платить за подписки, которые они не могли отменить. Это иллюстрирует темные паттерны в архитектурах выбора, где пользователи были подтолкнуты к потенциально вредным решениям. |
| **Осознанное согласие** | 1972 - [Исследование сифилиса в Таскиги](https://en.wikipedia.org/wiki/Tuskegee_Syphilis_Study) - афроамериканским мужчинам, участвовавшим в исследовании, обещали бесплатное медицинское обслуживание, о обманули_, не сообщив им диагноз или информацию о доступности лечения. Многие участники умерли, а их партнеры или дети пострадали; исследование длилось 40 лет. |
| **Конфиденциальность данных** | 2007 - [Приз Netflix](https://www.wired.com/2007/12/why-anonymous-data-sometimes-isnt/) предоставил исследователям _10 миллионов анонимных оценок фильмов от 50 тысяч клиентов_, чтобы улучшить алгоритмы рекомендаций. Однако исследователи смогли сопоставить анонимные данные с персонально идентифицируемыми данными из _внешних наборов данных_ (например, комментарии IMDb), фактически "деанонимизировав" некоторых подписчиков Netflix. |
| **Смещение в сборе данных** | 2013 - Город Бостон [разработал Street Bump](https://www.boston.gov/transportation/street-bump), приложение, позволяющее гражданам сообщать о выбоинах, предоставляя городу лучшие данные о дорогах для выявления и устранения проблем. Однако [люди с низким доходом имели меньший доступ к автомобилям и телефонам](https://hbr.org/2013/04/the-hidden-biases-in-big-data), что делало их дорожные проблемы невидимыми для этого приложения. Разработчики сотрудничали с учеными, чтобы решить вопросы _равного доступа и цифрового разрыва_ для справедливости. |
| **Справедливость алгоритмов** | 2018 - Исследование MIT [Gender Shades](http://gendershades.org/overview.html) оценило точность продуктов ИИ для классификации пола, выявив пробелы в точности для женщин и цветных людей. [Apple Card 2019 года](https://www.wired.com/story/the-apple-card-didnt-see-genderand-thats-the-problem/) казалась предоставлять меньший кредит женщинам, чем мужчинам. Оба случая иллюстрируют проблемы алгоритмического смещения, приводящие к социально-экономическим последствиям. |
| **Искажение данных** | 2020 - [Департамент здравоохранения Джорджии выпустил графики COVID-19](https://www.vox.com/covid-19-coronavirus-us-response-trump/2020/5/18/21262265/georgia-covid-19-cases-declining-reopening), которые, казалось, вводили граждан в заблуждение относительно тенденций подтвержденных случаев, используя не хронологический порядок на оси x. Это иллюстрирует искажение через визуализационные трюки. |
| **Иллюзия свободы выбора** | 2020 - Образовательное приложение [ABCmouse выплатило $10 млн для урегулирования жалобы FTC](https://www.washingtonpost.com/business/2020/09/04/abcmouse-10-million-ftc-settlement/), где родители были вынуждены платить за подписки, которые они не могли отменить. Это иллюстрирует темные паттерны в архитектурах выбора, где пользователи были подтолкнуты к потенциально вредным решениям. |
| **Конфиденциальность данных и права пользователей** | 2021 - [Утечка данных Facebook](https://www.npr.org/2021/04/09/986005820/after-data-breach-exposes-530-million-facebook-says-it-will-not-notify-users) раскрыла данные 530 миллионов пользователей, что привело к штрафу в $5 млрд от FTC. Однако компания отказалась уведомить пользователей о нарушении, нарушив их права на прозрачность данных и доступ. |
Хотите изучить больше примеров из практики? Ознакомьтесь с этими ресурсами:
@ -190,18 +190,17 @@ CO_OP_TRANSLATOR_METADATA:
* [Курс по этике в Data Science](https://www.coursera.org/learn/data-science-ethics#syllabus) - изучение знаковых примеров из практики.
* [Где все пошло не так](https://deon.drivendata.org/examples/) - чеклист Deon с примерами.
> 🚨 Подумайте о примерах из практики, которые вы видели - сталкивались ли вы или были ли затронуты подобным этическим вызовом в своей жизни? Можете ли вы вспомнить хотя бы один другой пример, который иллюстрирует один из этических вызовов, обсуждаемых в этом разделе?
> 🚨 Подумайте о примерах из практики, которые вы видели сталкивались ли вы или были ли затронуты подобным этическим вызовом в своей жизни? Можете ли вы придумать хотя бы один другой пример, который иллюстрирует один из этических вызовов, обсуждаемых в этом разделе?
## Прикладная этика
Мы обсудили концепции этики, вызовы и примеры из практики в реальных контекстах. Но как начать _применять_ этические принципы и практики в своих проектах? И как _операционализировать_ эти практики для лучшего управления? Давайте изучим некоторые реальные решения:
Мы обсудили концепции этики, вызовы и примеры из практики в реальных контекстах. Но как начать _применять_ этические принципы и практики в своих проектах? И как _операционализировать_ эти практики для лучшего управления? Давайте изучим несколько реальных решений:
### 1. Профессиональные кодексы
Профессиональные кодексы предлагают один из вариантов для организаций "мотивировать" членов поддерживать их этические принципы и миссию. Кодексы являются оральными руководствами_ для профессионального поведения, помогая сотрудникам или членам принимать решения, которые соответствуют принципам их организации. Они эффективны только при добровольном соблюдении со стороны членов; однако многие организации предлагают дополнительные награды и штрафы, чтобы стимулировать соблюдение.
Примеры включают:
Профессиональные кодексы предлагают один из вариантов для организаций "мотивировать" членов поддерживать их этические принципы и миссию. Кодексы — это оральные ориентиры_ для профессионального поведения, помогающие сотрудникам или членам принимать решения, соответствующие принципам их организации. Они эффективны только при добровольном соблюдении; однако многие организации предлагают дополнительные награды и штрафы, чтобы стимулировать соблюдение.
Примеры:
* [Oxford Munich](http://www.code-of-ethics.org/code-of-conduct/) Кодекс этики
* [Data Science Association](http://datascienceassn.org/code-of-conduct.html) Кодекс поведения (создан в 2013 году)
* [ACM Code of Ethics and Professional Conduct](https://www.acm.org/code-of-ethics) (с 1993 года)
@ -210,56 +209,55 @@ CO_OP_TRANSLATOR_METADATA:
### 2. Чеклисты по этике
Хотя профессиональные кодексы определяют необходимое _этическое поведение_ для специалистов, они [имеют известные ограничения](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md) в обеспечении соблюдения, особенно в крупных проектах. Вместо этого многие эксперты в области Data Science [рекомендуют чеклисты](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md), которые могут **связать принципы с практиками** более детерминированным и действенным образом.
Хотя профессиональные кодексы определяют необходимое _этическое поведение_ для специалистов, они [имеют известные ограничения](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md) в применении, особенно в крупных проектах. Вместо этого многие эксперты в области Data Science [рекомендуют чеклисты](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md), которые могут **связать принципы с практикой** более детерминированным и действенным образом.
Чеклисты превращают вопросы в задачи "да/нет", которые можно операционализировать, позволяя отслеживать их как часть стандартных рабочих процессов выпуска продукта.
Примеры включают:
Примеры:
* [Deon](https://deon.drivendata.org/) - универсальный чеклист по этике данных, созданный на основе [рекомендаций отрасли](https://deon.drivendata.org/#checklist-citations) с инструментом командной строки для легкой интеграции.
* [Чеклист аудита конфиденциальности](https://cyber.harvard.edu/ecommerce/privacyaudit.html) - предоставляет общие рекомендации по практике обработки информации с точки зрения юридической и социальной экспозиции.
* [Чеклист справедливости ИИ](https://www.microsoft.com/en-us/research/project/ai-fairness-checklist/) - созданный практиками ИИ для поддержки внедрения и интеграции проверок справедливости в циклы разработки ИИ.
* [22 вопроса по этике данных и ИИ](https://medium.com/the-organization/22-questions-for-ethics-in-data-and-ai-efb68fd19429) - более открытая структура, предназначенная для первоначального изучения этических вопросов в дизайне, реализации и организационных контекстах.
* [Чеклист аудита конфиденциальности](https://cyber.harvard.edu/ecommerce/privacyaudit.html) - предоставляет общие рекомендации по практике обработки информации с точки зрения юридической и социальной ответственности.
* [Чеклист справедливости ИИ](https://www.microsoft.com/en-us/research/project/ai-fairness-checklist/) - создан практиками ИИ для поддержки внедрения и интеграции проверок справедливости в циклы разработки ИИ.
* [22 вопроса по этике данных и ИИ](https://medium.com/the-organization/22-questions-for-ethics-in-data-and-ai-efb68fd19429) - более открытая структура, предназначенная для начального изучения этических вопросов в дизайне, реализации и организационных контекстах.
### 3. Регулирование этики
Этика касается определения общих ценностей и добровольного выполнения правильных действий. **Соблюдение** касается _следования закону_, если он определен. **Управление** охватывает все способы, которыми организации работают для обеспечения соблюдения этических принципов и выполнения установленных законов.
Сегодня управление принимает две формы в рамках организаций. Во-первых, это определение принципов **этического ИИ** и установление практик для операционализации их внедрения во всех проектах, связанных с ИИ, в организации. Во-вторых, это соблюдение всех государственных **регламентов защиты данных**, действующих в регионах, где она работает.
Сегодня управление принимает две формы в рамках организаций. Во-первых, это определение принципов **этического ИИ** и установление практик для операционализации их внедрения во всех проектах, связанных с ИИ, в организации. Во-вторых, это соблюдение всех государственных **регламентов защиты данных** для регионов, где она работает.
Примеры регламентов защиты данных и конфиденциальности:
* `1974`, [US Privacy Act](https://www.justice.gov/opcl/privacy-act-1974) - регулирует сбор, использование и раскрытие личной информации едеральным правительством_.
* `1996`, [US Health Insurance Portability & Accountability Act (HIPAA)](https://www.cdc.gov/phlp/publications/topic/hipaa.html) - защищает персональные медицинские данные.
* `1998`, [US Children's Online Privacy Protection Act (COPPA)](https://www.ftc.gov/enforcement/rules/rulemaking-regulatory-reform-proceedings/childrens-online-privacy-protection-rule) - защищает конфиденциальность данных детей младше 13 лет.
* `2018`, [Общий регламент защиты данных (GDPR)](https://gdpr-info.eu/) - предоставляет права пользователей, защиту данных и конфиденциальность.
* `2018`, [Закон о конфиденциальности потребителей Калифорнии (CCPA)](https://www.oag.ca.gov/privacy/ccpa) предоставляет потребителям больше _прав_ на их (личные) данные.
* `2018`, [Закон о конфиденциальности потребителей Калифорнии (CCPA)](https://www.oag.ca.gov/privacy/ccpa) предоставляет потребителям больше _прав_ в отношении их (персональных) данных.
* `2021`, Китайский [Закон о защите персональной информации](https://www.reuters.com/world/china/china-passes-new-personal-data-privacy-law-take-effect-nov-1-2021-08-20/) недавно принят, создавая один из самых строгих онлайн-регламентов конфиденциальности данных в мире.
> 🚨 Европейский Союз определил GDPR (Общий регламент защиты данных), который остается одним из самых влиятельных регламентов конфиденциальности данных сегодня. Знаете ли вы, что он также определяет [8 прав пользователей](https://www.freeprivacypolicy.com/blog/8-user-rights-gdpr) для защиты цифровой конфиденциальности и персональных данных граждан? Узнайте, что это за права и почему они важны.
### 4. Культура этики
Обратите внимание, что существует нематериальный разрыв между _соблюдением_ (выполнением минимальных требований закона) и решением [системных проблем](https://www.coursera.org/learn/data-science-ethics/home/week/4) (таких как закостенелость, асимметрия информации и несправедливость распределения), которые могут ускорить использование ИИ в вредных целях.
Обратите внимание, что существует нематериальный разрыв между _соблюдением_ (выполнение достаточного для соответствия "букве закона") и решением [системных проблем](https://www.coursera.org/learn/data-science-ethics/home/week/4) (таких как окаменелость, информационная асимметрия и несправедливость распределения), которые могут ускорить использование ИИ в вредных целях.
Последнее требует [коллаборативных подходов к определению культуры этики](https://towardsdatascience.com/why-ai-ethics-requires-a-culture-driven-approach-26f451afa29f), которые строят эмоциональные связи и последовательные общие ценности организациях_ отрасли. Это требует более [формализованных культур этики данных](https://www.codeforamerica.org/news/formalizing-an-ethical-data-culture/) в организациях - позволяя _любому_ [потянуть шнур Андон](https://en.wikipedia.org/wiki/Andon_(manufacturing)) (чтобы поднять этические вопросы на ранних этапах процесса) и делая _этические оценки_ (например, при найме) ключевым критерием формирования команды в проектах ИИ.
Последнее требует [коллаборативных подходов к определению культур этики](https://towardsdatascience.com/why-ai-ethics-requires-a-culture-driven-approach-26f451afa29f), которые создают эмоциональные связи и последовательные общие ценности организациях_ отрасли. Это требует более [формализованных культур этики данных](https://www.codeforamerica.org/news/formalizing-an-ethical-data-culture/) в организациях позволяя _любому_ [потянуть шнур Андон](https://en.wikipedia.org/wiki/Andon_(manufacturing)) (чтобы поднять этические вопросы на ранних этапах процесса) и делая _этические оценки_ (например, при найме) ключевым критерием формирования команды в проектах ИИ.
---
## [Викторина после лекции](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/3) 🎯
## [Викторина после лекции](https://ff-quizzes.netlify.app/en/ds/) 🎯
## Обзор и самостоятельное изучение
Курсы и книги помогают понять основные концепции и вызовы этики, а примеры из практики и инструменты помогают применять этические практики в реальных контекстах. Вот несколько ресурсов для начала:
Курсы и книги помогают понять основные концепции этики и вызовы, а примеры из практики и инструменты помогают применять этические принципы в реальных контекстах. Вот несколько ресурсов для начала:
* [Machine Learning For Beginners](https://github.com/microsoft/ML-For-Beginners/blob/main/1-Introduction/3-fairness/README.md) - урок о справедливости от Microsoft.
* [Принципы ответственного ИИ](https://docs.microsoft.com/en-us/learn/modules/responsible-ai-principles/) - бесплатный учебный курс от Microsoft Learn.
* [Этика и наука о данных](https://resources.oreilly.com/examples/0636920203964) - электронная книга от O'Reilly (М. Лукидес, Х. Мейсон и др.).
* [Этика в науке о данных](https://www.coursera.org/learn/data-science-ethics#syllabus) - онлайн-курс от Мичиганского университета.
* [Этика в деталях](https://ethicsunwrapped.utexas.edu/case-studies) - кейс-стадии от Техасского университета.
* [Принципы ответственного ИИ](https://docs.microsoft.com/en-us/learn/modules/responsible-ai-principles/) - бесплатный учебный курс от Microsoft Learn.
* [Этика и наука о данных](https://resources.oreilly.com/examples/0636920203964) - электронная книга от O'Reilly (М. Лукидес, Х. Мейсон и др.)
* [Этика в науке о данных](https://www.coursera.org/learn/data-science-ethics#syllabus) - онлайн-курс от Университета Мичигана.
* [Этика в деталях](https://ethicsunwrapped.utexas.edu/case-studies) - примеры из Университета Техаса.
# Задание
# Задание
[Напишите кейс-стадию по этике данных](assignment.md)
[Напишите кейс по этике данных](assignment.md)
---
**Отказ от ответственности**:
Этот документ был переведен с помощью сервиса автоматического перевода [Co-op Translator](https://github.com/Azure/co-op-translator). Хотя мы стремимся к точности, пожалуйста, имейте в виду, что автоматические переводы могут содержать ошибки или неточности. Оригинальный документ на его исходном языке следует считать авторитетным источником. Для получения критически важной информации рекомендуется профессиональный перевод человеком. Мы не несем ответственности за любые недоразумения или неправильные толкования, возникшие в результате использования данного перевода.
Этот документ был переведен с помощью сервиса автоматического перевода [Co-op Translator](https://github.com/Azure/co-op-translator). Хотя мы стремимся к точности, пожалуйста, учитывайте, что автоматические переводы могут содержать ошибки или неточности. Оригинальный документ на его исходном языке следует считать авторитетным источником. Для получения критически важной информации рекомендуется профессиональный перевод человеком. Мы не несем ответственности за любые недоразумения или неправильные интерпретации, возникшие в результате использования данного перевода.

@ -1,8 +1,8 @@
<!--
CO_OP_TRANSLATOR_METADATA:
{
"original_hash": "8796f41f566a0a8ebb72863a83d558ed",
"translation_date": "2025-08-26T15:07:47+00:00",
"original_hash": "3a34157cc63516eba97c89a0b2f8c3e6",
"translation_date": "2025-09-03T21:46:32+00:00",
"source_file": "1-Introduction/02-ethics/README.md",
"language_code": "sk"
}
@ -17,15 +17,15 @@ CO_OP_TRANSLATOR_METADATA:
Sme všetci dátoví občania žijúci v dátovom svete.
Trhové trendy naznačujú, že do roku 2022 bude 1 z 3 veľkých organizácií nakupovať a predávať svoje dáta prostredníctvom online [trhovísk a výmenných platforiem](https://www.gartner.com/smarterwithgartner/gartner-top-10-trends-in-data-and-analytics-for-2020/). Ako **vývojári aplikácií** zistíme, že je jednoduchšie a lacnejšie integrovať poznatky založené na dátach a automatizáciu riadenú algoritmami do každodenných používateľských skúseností. Ale ako sa AI stáva všadeprítomnou, budeme musieť pochopiť aj potenciálne škody spôsobené [zbraňovaním](https://www.youtube.com/watch?v=TQHs8SA1qpk) takýchto algoritmov vo veľkom rozsahu.
Trhové trendy naznačujú, že do roku 2022 bude 1 z 3 veľkých organizácií kupovať a predávať svoje dáta prostredníctvom online [trhov a výmenných platforiem](https://www.gartner.com/smarterwithgartner/gartner-top-10-trends-in-data-and-analytics-for-2020/). Ako **vývojári aplikácií** zistíme, že je jednoduchšie a lacnejšie integrovať poznatky založené na dátach a automatizáciu riadenú algoritmami do každodenných používateľských skúseností. Ale ako sa AI stáva všadeprítomnou, budeme musieť pochopiť aj potenciálne škody spôsobené [zbraňovaním](https://www.youtube.com/watch?v=TQHs8SA1qpk) takýchto algoritmov vo veľkom rozsahu.
Trendy tiež naznačujú, že do roku 2025 vytvoríme a spotrebujeme viac ako [180 zettabajtov](https://www.statista.com/statistics/871513/worldwide-data-created/) dát. Ako **dátoví vedci** získame bezprecedentný prístup k osobným údajom. To znamená, že môžeme vytvárať behaviorálne profily používateľov a ovplyvňovať rozhodovanie spôsobmi, ktoré vytvárajú [ilúziu slobodnej voľby](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice), pričom potenciálne posúvame používateľov k výsledkom, ktoré preferujeme. To tiež otvára širšie otázky o ochrane súkromia a právach používateľov.
Trendy tiež naznačujú, že do roku 2025 vytvoríme a spotrebujeme viac ako [180 zettabajtov](https://www.statista.com/statistics/871513/worldwide-data-created/) dát. Ako **dátoví vedci** získame bezprecedentný prístup k osobným údajom. To znamená, že môžeme vytvárať behaviorálne profily používateľov a ovplyvňovať rozhodovanie spôsobmi, ktoré vytvárajú [ilúziu voľby](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice), pričom potenciálne smerujeme používateľov k výsledkom, ktoré preferujeme. To tiež otvára širšie otázky o ochrane súkromia a právach používateľov.
Dátová etika je teraz _nevyhnutným ochranným mechanizmom_ pre dátovú vedu a inžinierstvo, pomáhajúc nám minimalizovať potenciálne škody a neúmyselné dôsledky našich rozhodnutí založených na dátach. [Gartnerov Hype Cycle pre AI](https://www.gartner.com/smarterwithgartner/2-megatrends-dominate-the-gartner-hype-cycle-for-artificial-intelligence-2020/) identifikuje relevantné trendy v digitálnej etike, zodpovednej AI a správe AI ako kľúčové faktory pre väčšie megatrendy okolo _demokratizácie_ a _industrializácie_ AI.
![Gartnerov Hype Cycle pre AI - 2020](https://images-cdn.newscred.com/Zz1mOWJhNzlkNDA2ZTMxMWViYjRiOGFiM2IyMjQ1YmMwZQ==)
V tejto lekcii preskúmame fascinujúcu oblasť dátovej etiky - od základných konceptov a výziev, cez prípadové štúdie až po aplikované koncepty AI, ako je správa - ktoré pomáhajú vytvárať kultúru etiky v tímoch a organizáciách pracujúcich s dátami a AI.
V tejto lekcii preskúmame fascinujúcu oblasť dátovej etiky - od základných konceptov a výziev, cez prípadové štúdie až po aplikované koncepty AI, ako je správa - ktoré pomáhajú vytvoriť kultúru etiky v tímoch a organizáciách pracujúcich s dátami a AI.
## [Kvíz pred prednáškou](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/2) 🎯
@ -37,19 +37,19 @@ Slovo "etika" pochádza z [gréckeho slova "ethikos"](https://en.wikipedia.org/w
**Etika** sa týka spoločných hodnôt a morálnych princípov, ktoré riadia naše správanie v spoločnosti. Etika nie je založená na zákonoch, ale na všeobecne prijatých normách toho, čo je "správne vs. nesprávne". Etické úvahy však môžu ovplyvniť iniciatívy korporátneho riadenia a vládne regulácie, ktoré vytvárajú viac stimulov na dodržiavanie pravidiel.
**Dátová etika** je [nová vetva etiky](https://royalsocietypublishing.org/doi/full/10.1098/rsta.2016.0360#sec-1), ktorá "študuje a hodnotí morálne problémy súvisiace s _dátami, algoritmami a zodpovedajúcimi praktikami_". Tu sa **"dáta"** zameriavajú na akcie súvisiace s generovaním, zaznamenávaním, kuráciou, spracovaním, šírením, zdieľaním a používaním, **"algoritmy"** sa zameriavajú na AI, agentov, strojové učenie a roboty, a **"praktiky"** sa zameriavajú na témy ako zodpovedná inovácia, programovanie, hacking a etické kódy.
**Dátová etika** je [nová oblasť etiky](https://royalsocietypublishing.org/doi/full/10.1098/rsta.2016.0360#sec-1), ktorá "študuje a hodnotí morálne problémy súvisiace s _dátami, algoritmami a zodpovedajúcimi praktikami_". Tu sa **"dáta"** zameriavajú na akcie súvisiace s generovaním, zaznamenávaním, kuráciou, spracovaním, šírením, zdieľaním a používaním, **"algoritmy"** sa zameriavajú na AI, agentov, strojové učenie a roboty, a **"praktiky"** sa zameriavajú na témy ako zodpovedná inovácia, programovanie, hacking a etické kódy.
**Aplikovaná etika** je [praktická aplikácia morálnych úvah](https://en.wikipedia.org/wiki/Applied_ethics). Ide o proces aktívneho skúmania etických otázok v kontexte _skutočných akcií, produktov a procesov_ a prijímania nápravných opatrení, aby zostali v súlade s našimi definovanými etickými hodnotami.
**Aplikovaná etika** je [praktická aplikácia morálnych úvah](https://en.wikipedia.org/wiki/Applied_ethics). Ide o proces aktívneho skúmania etických otázok v kontexte _reálnych akcií, produktov a procesov_ a prijímania nápravných opatrení, aby zostali v súlade s našimi definovanými etickými hodnotami.
**Kultúra etiky** je o [_operacionalizácii_ aplikovanej etiky](https://hbr.org/2019/05/how-to-design-an-ethical-organization), aby sme zabezpečili, že naše etické princípy a praktiky sú prijaté konzistentne a škálovateľne naprieč celou organizáciou. Úspešné kultúry etiky definujú celopodnikové etické princípy, poskytujú zmysluplné stimuly na dodržiavanie pravidiel a posilňujú normy etiky podporovaním a amplifikáciou požadovaného správania na každej úrovni organizácie.
## Koncepty etiky
V tejto sekcii sa budeme zaoberať konceptmi ako **spoločné hodnoty** (princípy) a **etické výzvy** (problémy) pre dátovú etiku - a preskúmame **prípadové štúdie**, ktoré vám pomôžu pochopiť tieto koncepty v reálnych kontextoch.
V tejto sekcii budeme diskutovať o konceptoch ako **spoločné hodnoty** (princípy) a **etické výzvy** (problémy) pre dátovú etiku - a preskúmame **prípadové štúdie**, ktoré vám pomôžu pochopiť tieto koncepty v reálnych kontextoch.
### 1. Princípy etiky
Každá stratégia dátovej etiky začína definovaním _etických princípov_ - "spoločných hodnôt", ktoré opisujú prijateľné správanie a usmerňujú súladné akcie v našich dátových a AI projektoch. Môžete ich definovať na individuálnej alebo tímovej úrovni. Väčšina veľkých organizácií však tieto princípy uvádza v _misijnom vyhlásení alebo rámci etickej AI_, ktorý je definovaný na korporátnej úrovni a dôsledne presadzovaný vo všetkých tímoch.
Každá stratégia dátovej etiky začína definovaním _etických princípov_ - "spoločných hodnôt", ktoré opisujú prijateľné správanie a riadia súladné akcie v našich dátových a AI projektoch. Môžete ich definovať na individuálnej alebo tímovej úrovni. Väčšina veľkých organizácií však tieto princípy uvádza v _misijnom vyhlásení alebo rámci etickej AI_, ktorý je definovaný na korporátnej úrovni a dôsledne presadzovaný naprieč všetkými tímami.
**Príklad:** Microsoftovo [Responsible AI](https://www.microsoft.com/en-us/ai/responsible-ai) misijné vyhlásenie znie: _"Sme odhodlaní k pokroku AI riadenému etickými princípmi, ktoré kladú ľudí na prvé miesto"_ - identifikujúc 6 etických princípov v rámci nižšie:
@ -61,24 +61,24 @@ Poďme si stručne preskúmať tieto princípy. _Transparentnosť_ a _zodpovedno
* [**Transparentnosť**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) zabezpečuje, že dátové a AI akcie sú _pochopiteľné_ (interpretovateľné) pre používateľov, vysvetľujúc čo a prečo za rozhodnutiami.
* [**Spravodlivosť**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1%3aprimaryr6) - zameriava sa na zabezpečenie, že AI zaobchádza _so všetkými ľuďmi_ spravodlivo, riešiac akékoľvek systémové alebo implicitné sociálno-technické predsudky v dátach a systémoch.
* [**Spoľahlivosť a bezpečnosť**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - zabezpečuje, že AI sa správa _konzistentne_ s definovanými hodnotami, minimalizujúc potenciálne škody alebo neúmyselné dôsledky.
* [**Súkromie a bezpečnosť**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - ide o pochopenie pôvodu dát a poskytovanie _ochrany súkromia a súvisiacich práv_ používateľom.
* [**Inkluzívnosť**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - ide o navrhovanie AI riešení s úmyslom, prispôsobujúc ich na splnenie _širokého spektra ľudských potrieb_ a schopností.
* [**Súkromie a bezpečnosť**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - je o pochopení pôvodu dát a poskytovaní _ochrany súkromia a súvisiacich práv_ používateľom.
* [**Inkluzívnosť**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - je o navrhovaní AI riešení s úmyslom, prispôsobujúc ich na splnenie _širokého spektra ľudských potrieb_ a schopností.
> 🚨 Premýšľajte o tom, aké by mohlo byť vaše misijné vyhlásenie dátovej etiky. Preskúmajte rámce etickej AI od iných organizácií - tu sú príklady od [IBM](https://www.ibm.com/cloud/learn/ai-ethics), [Google](https://ai.google/principles) a [Facebook](https://ai.facebook.com/blog/facebooks-five-pillars-of-responsible-ai/). Aké spoločné hodnoty majú? Ako sa tieto princípy vzťahujú na AI produkt alebo odvetvie, v ktorom pôsobia?
### 2. Výzvy etiky
Keď máme definované etické princípy, ďalším krokom je hodnotenie našich dátových a AI akcií, aby sme zistili, či sú v súlade s týmito spoločnými hodnotami. Premýšľajte o svojich akciách v dvoch kategóriách: _zber dát_ a _návrh algoritmov_.
Keď máme definované etické princípy, ďalším krokom je vyhodnotenie našich dátových a AI akcií, aby sme zistili, či sú v súlade s týmito spoločnými hodnotami. Premýšľajte o svojich akciách v dvoch kategóriách: _zber dát_ a _návrh algoritmov_.
Pri zbere dát budú akcie pravdepodobne zahŕňať **osobné údaje** alebo osobne identifikovateľné informácie (PII) pre identifikovateľné živé osoby. To zahŕňa [rôzne položky neosobných údajov](https://ec.europa.eu/info/law/law-topic/data-protection/reform/what-personal-data_en), ktoré _spoločne_ identifikujú jednotlivca. Etické výzvy sa môžu týkať _ochrany súkromia_, _vlastníctva dát_ a súvisiacich tém ako _informovaný súhlas_ a _práva duševného vlastníctva_ pre používateľov.
Pri zbere dát budú akcie pravdepodobne zahŕňať **osobné údaje** alebo osobne identifikovateľné informácie (PII) pre identifikovateľné živé osoby. To zahŕňa [rôzne položky neosobných údajov](https://ec.europa.eu/info/law/law-topic/data-protection/reform/what-personal-data_en), ktoré _spoločne_ identifikujú jednotlivca. Etické výzvy môžu súvisieť s _ochranou súkromia_, _vlastníctvom dát_ a súvisiacimi témami ako _informovaný súhlas_ a _práva duševného vlastníctva_ používateľov.
Pri návrhu algoritmov budú akcie zahŕňať zber a kuráciu **datasetov**, potom ich použitie na trénovanie a nasadenie **dátových modelov**, ktoré predpovedajú výsledky alebo automatizujú rozhodnutia v reálnych kontextoch. Etické výzvy môžu vzniknúť z _predsudkov v datasetoch_, _problémov kvality dát_, _nespravodlivosti_ a _skreslenia_ v algoritmoch - vrátane niektorých problémov, ktoré sú systémové.
Pri návrhu algoritmov budú akcie zahŕňať zber a kuráciu **datasetov**, potom ich použitie na trénovanie a nasadenie **dátových modelov**, ktoré predpovedajú výsledky alebo automatizujú rozhodnutia v reálnych kontextoch. Etické výzvy môžu vzniknúť z _predsudkov v datasetoch_, _problémov s kvalitou dát_, _nespravodlivosti_ a _nesprávneho zastúpenia_ v algoritmoch - vrátane niektorých problémov, ktoré sú systémové.
V oboch prípadoch etické výzvy poukazujú na oblasti, kde naše akcie môžu naraziť na konflikt s našimi spoločnými hodnotami. Na ich detekciu, zmiernenie, minimalizáciu alebo odstránenie musíme klásť morálne "áno/nie" otázky súvisiace s našimi akciami a následne prijať nápravné opatrenia podľa potreby. Pozrime sa na niektoré etické výzvy a morálne otázky, ktoré vyvolávajú:
V oboch prípadoch etické výzvy poukazujú na oblasti, kde naše akcie môžu naraziť na konflikt s našimi spoločnými hodnotami. Na ich detekciu, zmiernenie, minimalizáciu alebo elimináciu musíme klásť morálne "áno/nie" otázky súvisiace s našimi akciami a potom prijať nápravné opatrenia podľa potreby. Pozrime sa na niektoré etické výzvy a morálne otázky, ktoré vyvolávajú:
#### 2.1 Vlastníctvo dát
Zber dát často zahŕňa osobné údaje, ktoré môžu identifikovať subjekty dát. [Vlastníctvo dát](https://permission.io/blog/data-ownership) sa týka _kontroly_ a [_práv používateľov_](https://permission.io/blog/data-ownership) súvisiacich s vytváraním, spracovaním a šírením dát.
Zber dát často zahŕňa osobné údaje, ktoré môžu identifikovať subjekty dát. [Vlastníctvo dát](https://permission.io/blog/data-ownership) je o _kontrole_ a [_právach používateľov_](https://permission.io/blog/data-ownership) súvisiacich s vytváraním, spracovaním a šírením dát.
Morálne otázky, ktoré musíme klásť, sú:
* Kto vlastní dáta? (používateľ alebo organizácia)
@ -87,9 +87,9 @@ Morálne otázky, ktoré musíme klásť, sú:
#### 2.2 Informovaný súhlas
[Informovaný súhlas](https://legaldictionary.net/informed-consent/) definuje akt používateľov, ktorí súhlasia s akciou (napr. zber dát) s _plným pochopením_ relevantných faktov vrátane účelu, potenciálnych rizík a alternatív.
[Informovaný súhlas](https://legaldictionary.net/informed-consent/) definuje akt, keď používateľ súhlasí s akciou (ako je zber dát) s _plným pochopením_ relevantných faktov vrátane účelu, potenciálnych rizík a alternatív.
Otázky na preskúmanie sú:
Otázky na preskúmanie tu sú:
* Dal používateľ (subjekt dát) povolenie na zber a použitie dát?
* Pochopil používateľ účel, na ktorý boli dáta zhromaždené?
* Pochopil používateľ potenciálne riziká z ich účasti?
@ -98,7 +98,7 @@ Otázky na preskúmanie sú:
[Duševné vlastníctvo](https://en.wikipedia.org/wiki/Intellectual_property) sa týka nehmotných výtvorov vyplývajúcich z ľudskej iniciatívy, ktoré môžu _mať ekonomickú hodnotu_ pre jednotlivcov alebo podniky.
Otázky na preskúmanie sú:
Otázky na preskúmanie tu sú:
* Mali zhromaždené dáta ekonomickú hodnotu pre používateľa alebo podnik?
* Má **používateľ** duševné vlastníctvo v tomto prípade?
* Má **organizácia** duševné vlastníctvo v tomto prípade?
@ -108,7 +108,7 @@ Otázky na preskúmanie sú:
[Ochrana súkromia dát](https://www.northeastern.edu/graduate/blog/what-is-data-privacy/) alebo informačné súkromie sa týka zachovania súkromia používateľov a ochrany identity používateľov vo vzťahu k osobne identifikovateľným informáciám.
Otázky na preskúmanie sú:
Otázky na preskúmanie tu sú:
* Sú dáta používateľov (osobné) zabezpečené proti hackom a únikom?
* Sú dáta používateľov prístupné iba autorizovaným používateľom a kontextom?
* Je anonymita používateľov zachovaná pri zdieľaní alebo šírení dát?
@ -116,9 +116,9 @@ Otázky na preskúmanie sú:
#### 2.5 Právo byť zabudnutý
[Právo byť zabudnutý](https://en.wikipedia.org/wiki/Right_to_be_forgotten) alebo [Právo na vymazanie](https://www.gdpreu.org/right-to-be-forgotten/) poskytuje používateľom dodatočnú ochranu osobných údajov. Konkrétne dáva používateľom právo požiadať o vymazanie alebo odstránenie osobných údajov z internetových vyhľadávaní a iných lokalít, _za špecifických okolností_ - umožňujúc im nový začiatok online bez toho, aby ich minulé akcie boli proti nim použité.
[Právo byť zabudnutý](https://en.wikipedia.org/wiki/Right_to_be_forgotten) alebo [Právo na vymazanie](https://www.gdpreu.org/right-to-be-forgotten/) poskytuje používateľom dodatočnú ochranu osobných údajov. Konkrétne dáva používateľom právo požiadať o vymazanie alebo odstránenie osobných údajov z internetových vyhľadávaní a iných miest, _za špecifických okolností_ - umožňujúc im nový začiatok online bez toho, aby ich minulé akcie boli proti nim použité.
Otázky na preskúmanie sú:
Otázky na preskúmanie tu sú:
* Umožňuje systém subjektom dát požiadať o vymazanie?
* Mal by odvolanie súhlasu používateľa spustiť automatické vymazanie?
* Boli dáta zhromaždené bez súhlasu alebo nezákonnými prostriedkami?
@ -126,35 +126,33 @@ Otázky na preskúmanie sú:
#### 2.6 Predsudky v datasetoch
Predsudky v datasetoch alebo [Predsudky pri zbere](http://researcharticles.com/index.php/bias-in-data-collection-in-research/) sa týkajú výberu _nereprezentatívnej_ podmnožiny dát na vývoj algoritmov, čo vytvára potenciálnu nespravodlivosť vo výsledkoch pre rôzne skupiny. Typy predsudkov zahŕňajú výberové alebo vzorkové predsudky, dobrovoľnícke predsudky a predsudky nástrojov.
Predsudky v datasetoch alebo [Predsudky pri zbere dát](http://researcharticles.com/index.php/bias-in-data-collection-in-research/) sa týkajú výberu _nereprezentatívnej_ podmnožiny dát na vývoj algoritmov, čo môže vytvárať potenciálnu nespravodlivosť vo výsledkoch pre rôzne skupiny. Typy predsudkov zahŕňajú výberové alebo vzorkové predsudky, dobrovoľnícke predsudky a predsudky nástrojov.
Otázky na preskúmanie sú:
Otázky na preskúmanie tu sú:
* Rekrutovali sme reprezentatívnu skupinu subjektov dát?
* Testovali sme náš zhromaždený alebo kurátovaný dataset na rôzne predsudky?
* Môžeme zmierniť alebo odstrániť objavené predsudky?
[Algorithmická spravodlivosť](https://towardsdatascience.com/what-is-algorithm-fairness-3182e161cf9f) skúma, či návrh algoritmu systematicky nediskriminuje konkrétne podskupiny dátových subjektov, čo môže viesť k [potenciálnym škodám](https://docs.microsoft.com/en-us/azure/machine-learning/concept-fairness-ml) v oblasti _alokácie_ (kde sú zdroje odmietnuté alebo zadržané pre túto skupinu) a _kvality služieb_ (kde AI nie je pre niektoré podskupiny taká presná ako pre iné).
* Môžeme zmierniť alebo odstrániť objaven
[Algorithmická spravodlivosť](https://towardsdatascience.com/what-is-algorithm-fairness-3182e161cf9f) skúma, či návrh algoritmu systematicky diskriminuje konkrétne podskupiny dátových subjektov, čo vedie k [potenciálnym škodám](https://docs.microsoft.com/en-us/azure/machine-learning/concept-fairness-ml) v _alokácii_ (kde sú zdroje odmietnuté alebo zadržiavané tejto skupine) a _kvalite služieb_ (kde AI nie je tak presná pre niektoré podskupiny ako pre iné).
Otázky na preskúmanie:
* Vyhodnotili sme presnosť modelu pre rôzne podskupiny a podmienky?
* Preskúmali sme systém z hľadiska potenciálnych škôd (napr. stereotypizácie)?
* Preskúmali sme systém kvôli potenciálnym škodám (napr. stereotypizácia)?
* Môžeme upraviť dáta alebo preškoliť modely na zmiernenie identifikovaných škôd?
Preskúmajte zdroje ako [kontrolné zoznamy pre spravodlivosť AI](https://query.prod.cms.rt.microsoft.com/cms/api/am/binary/RE4t6dA), aby ste sa dozvedeli viac.
Preskúmajte zdroje ako [kontrolné zoznamy spravodlivosti AI](https://query.prod.cms.rt.microsoft.com/cms/api/am/binary/RE4t6dA) pre viac informácií.
#### 2.9 Nesprávne prezentovanie údajov
#### 2.9 Skreslenie údajov
[Nesprávne prezentovanie údajov](https://www.sciencedirect.com/topics/computer-science/misrepresentation) sa týka otázky, či komunikujeme poznatky z čestne získaných údajov zavádzajúcim spôsobom, aby sme podporili požadovaný naratív.
[Skreslenie údajov](https://www.sciencedirect.com/topics/computer-science/misrepresentation) sa týka otázky, či komunikujeme poznatky z čestne hlásených údajov zavádzajúcim spôsobom na podporu požadovaného naratívu.
Otázky na preskúmanie:
* Hlásime neúplné alebo nepresné údaje?
* Vizualizujeme údaje spôsobom, ktorý vedie k zavádzajúcim záverom?
* Používame selektívne štatistické techniky na manipuláciu s výsledkami?
* Existujú alternatívne vysvetlenia, ktoré by mohli ponúknuť iný záver?
* Používame selektívne štatistické techniky na manipuláciu výsledkov?
* Existujú alternatívne vysvetlenia, ktoré môžu ponúknuť iný záver?
#### 2.10 Ilúzia voľby
[Ilúzia voľby](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice) nastáva, keď „architektúry voľby“ systému používajú rozhodovacie algoritmy na ovplyvnenie ľudí, aby prijali preferovaný výsledok, pričom im dávajú zdanie možností a kontroly. Tieto [temné vzory](https://www.darkpatterns.org/) môžu spôsobiť sociálne a ekonomické škody používateľom. Keďže rozhodnutia používateľov ovplyvňujú profily správania, tieto akcie môžu potenciálne poháňať budúce voľby, ktoré môžu zosilniť alebo predĺžiť dopad týchto škôd.
[Ilúzia voľby](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice) nastáva, keď "architektúry voľby" systému používajú algoritmy rozhodovania na ovplyvnenie ľudí, aby prijali preferovaný výsledok, pričom im dávajú pocit, že majú možnosti a kontrolu. Tieto [temné vzory](https://www.darkpatterns.org/) môžu spôsobiť sociálne a ekonomické škody používateľom. Keďže rozhodnutia používateľov ovplyvňujú profily správania, tieto akcie môžu potenciálne poháňať budúce voľby, ktoré môžu zosilniť alebo rozšíriť dopad týchto škôd.
Otázky na preskúmanie:
* Rozumel používateľ dôsledkom prijatia tejto voľby?
@ -163,48 +161,48 @@ Otázky na preskúmanie:
### 3. Prípadové štúdie
Aby sme tieto etické výzvy zasadili do reálneho kontextu, je užitočné pozrieť sa na prípadové štúdie, ktoré zdôrazňujú potenciálne škody a dôsledky pre jednotlivcov a spoločnosť, keď sa tieto etické porušenia prehliadajú.
Aby sme tieto etické výzvy zasadili do kontextu reálneho sveta, je užitočné pozrieť sa na prípadové štúdie, ktoré zdôrazňujú potenciálne škody a dôsledky pre jednotlivcov a spoločnosť, keď sa takéto etické porušenia prehliadajú.
Tu je niekoľko príkladov:
| Etická výzva | Prípadová štúdia |
| Etická výzva | Prípadová štúdia |
|--- |--- |
| **Informovaný súhlas** | 1972 - [Štúdia syfilisu v Tuskegee](https://en.wikipedia.org/wiki/Tuskegee_Syphilis_Study) - Afroamerickým mužom, ktorí sa zúčastnili štúdie, bola sľúbená bezplatná zdravotná starostlivosť, _ale boli oklamaní_ výskumníkmi, ktorí im neoznámili ich diagnózu ani dostupnosť liečby. Mnohí účastníci zomreli a ich partneri alebo deti boli ovplyvnení; štúdia trvala 40 rokov. |
| **Ochrana údajov** | 2007 - [Netflix Data Prize](https://www.wired.com/2007/12/why-anonymous-data-sometimes-isnt/) poskytla výskumníkom _10 miliónov anonymizovaných hodnotení filmov od 50 000 zákazníkov_, aby pomohla zlepšiť odporúčacie algoritmy. Výskumníci však dokázali prepojiť anonymizované údaje s osobne identifikovateľnými údajmi v _externých datasetoch_ (napr. komentáre na IMDb), čím efektívne „de-anonymizovali“ niektorých predplatiteľov Netflixu.|
| **Zber dát s predsudkami** | 2013 - Mesto Boston [vyvinulo aplikáciu Street Bump](https://www.boston.gov/transportation/street-bump), ktorá umožnila občanom hlásiť výtlky, čím mestu poskytla lepšie údaje o cestách na identifikáciu a opravu problémov. Avšak [ľudia s nižšími príjmami mali menší prístup k autám a telefónom](https://hbr.org/2013/04/the-hidden-biases-in-big-data), čo spôsobilo, že ich problémy s cestami zostali v aplikácii neviditeľné. Vývojári spolupracovali s akademikmi na riešení problémov _rovnakého prístupu a digitálnych rozdielov_ pre spravodlivosť. |
| **Algoritmická spravodlivosť** | 2018 - MIT [Gender Shades Study](http://gendershades.org/overview.html) hodnotila presnosť AI produktov na klasifikáciu pohlavia, pričom odhalila medzery v presnosti pre ženy a osoby inej farby pleti. [Apple Card z roku 2019](https://www.wired.com/story/the-apple-card-didnt-see-genderand-thats-the-problem/) sa zdala ponúkať menej úveru ženám ako mužom. Obe štúdie ilustrovali problémy algoritmických predsudkov vedúcich k socio-ekonomickým škodám.|
| **Nesprávne prezentovanie údajov** | 2020 - [Ministerstvo zdravotníctva štátu Georgia zverejnilo grafy COVID-19](https://www.vox.com/covid-19-coronavirus-us-response-trump/2020/5/18/21262265/georgia-covid-19-cases-declining-reopening), ktoré sa zdali zavádzať občanov o trendoch potvrdených prípadov pomocou nechronologického usporiadania na osi x. To ilustruje nesprávne prezentovanie údajov prostredníctvom vizualizačných trikov. |
| **Ilúzia voľby** | 2020 - Vzdelávacia aplikácia [ABCmouse zaplatila 10 miliónov dolárov na urovnanie sťažnosti FTC](https://www.washingtonpost.com/business/2020/09/04/abcmouse-10-million-ftc-settlement/), kde boli rodičia nútení platiť za predplatné, ktoré nemohli zrušiť. To ilustruje temné vzory v architektúrach voľby, kde boli používatelia ovplyvnení k potenciálne škodlivým rozhodnutiam. |
| **Ochrana údajov a práva používateľov** | 2021 - [Únik údajov na Facebooku](https://www.npr.org/2021/04/09/986005820/after-data-breach-exposes-530-million-facebook-says-it-will-not-notify-users) odhalil údaje 530 miliónov používateľov, čo viedlo k urovnaniu vo výške 5 miliárd dolárov s FTC. Facebook však odmietol informovať používateľov o úniku, čím porušil práva používateľov na transparentnosť a prístup k údajom. |
| **Informovaný súhlas** | 1972 - [Štúdia syfilisu v Tuskegee](https://en.wikipedia.org/wiki/Tuskegee_Syphilis_Study) - Afroamerickým mužom, ktorí sa zúčastnili štúdie, bola sľúbená bezplatná lekárska starostlivosť, _ale boli oklamaní_ výskumníkmi, ktorí im neoznámili diagnózu ani dostupnosť liečby. Mnoho subjektov zomrelo a ich partneri alebo deti boli ovplyvnení; štúdia trvala 40 rokov. |
| **Ochrana údajov** | 2007 - [Netflix data prize](https://www.wired.com/2007/12/why-anonymous-data-sometimes-isnt/) poskytla výskumníkom _10M anonymizovaných hodnotení filmov od 50K zákazníkov_, aby pomohla zlepšiť odporúčacie algoritmy. Výskumníci však dokázali korelovať anonymizované údaje s osobne identifikovateľnými údajmi v _externých datasetoch_ (napr. komentáre na IMDb) - efektívne "de-anonymizovali" niektorých predplatiteľov Netflixu.|
| **Zber dát s predsudkami** | 2013 - Mesto Boston [vyvinulo Street Bump](https://www.boston.gov/transportation/street-bump), aplikáciu, ktorá umožnila občanom hlásiť výtlky, čím mesto získalo lepšie údaje o cestách na identifikáciu a opravu problémov. Avšak [ľudia s nižšími príjmami mali menší prístup k autám a telefónom](https://hbr.org/2013/04/the-hidden-biases-in-big-data), čo spôsobilo, že ich problémy s cestami boli v aplikácii neviditeľné. Vývojári spolupracovali s akademikmi na riešení problémov _rovnakého prístupu a digitálnych rozdielov_ pre spravodlivosť. |
| **Algoritmická spravodlivosť** | 2018 - MIT [Gender Shades Study](http://gendershades.org/overview.html) hodnotila presnosť AI produktov na klasifikáciu pohlavia, odhaľujúc medzery v presnosti pre ženy a osoby farebnej pleti. [Apple Card z roku 2019](https://www.wired.com/story/the-apple-card-didnt-see-genderand-thats-the-problem/) sa zdala ponúkať menej kreditu ženám ako mužom. Obe ilustrovali problémy algoritmických predsudkov vedúcich k socio-ekonomickým škodám.|
| **Skreslenie údajov** | 2020 - [Ministerstvo zdravotníctva Georgie vydalo COVID-19 grafy](https://www.vox.com/covid-19-coronavirus-us-response-trump/2020/5/18/21262265/georgia-covid-19-cases-declining-reopening), ktoré sa zdali zavádzať občanov o trendoch potvrdených prípadov s nechronologickým usporiadaním na osi x. Toto ilustruje skreslenie prostredníctvom vizualizačných trikov. |
| **Ilúzia voľby** | 2020 - Vzdelávacia aplikácia [ABCmouse zaplatila $10M na urovnanie sťažnosti FTC](https://www.washingtonpost.com/business/2020/09/04/abcmouse-10-million-ftc-settlement/), kde rodičia boli uväznení v platení za predplatné, ktoré nemohli zrušiť. Toto ilustruje temné vzory v architektúrach voľby, kde boli používatelia ovplyvnení k potenciálne škodlivým rozhodnutiam. |
| **Ochrana údajov a práva používateľov** | 2021 - Facebook [Únik údajov](https://www.npr.org/2021/04/09/986005820/after-data-breach-exposes-530-million-facebook-says-it-will-not-notify-users) odhalil údaje 530M používateľov, čo viedlo k urovnaniu vo výške $5B s FTC. Napriek tomu odmietol informovať používateľov o úniku, čím porušil práva používateľov na transparentnosť a prístup k údajom. |
Chcete preskúmať viac prípadových štúdií? Pozrite si tieto zdroje:
* [Ethics Unwrapped](https://ethicsunwrapped.utexas.edu/case-studies) - etické dilemy v rôznych odvetviach.
* [Kurz etiky dátovej vedy](https://www.coursera.org/learn/data-science-ethics#syllabus) - preskúmanie významných prípadových štúdií.
* [Ethics Unwrapped](https://ethicsunwrapped.utexas.edu/case-studies) - etické dilemy naprieč rôznymi odvetviami.
* [Kurz etiky dátovej vedy](https://www.coursera.org/learn/data-science-ethics#syllabus) - prípadové štúdie z praxe.
* [Kde sa veci pokazili](https://deon.drivendata.org/examples/) - kontrolný zoznam Deon s príkladmi.
> 🚨 Zamyslite sa nad prípadovými štúdiami, ktoré ste videli zažili ste alebo boli ste ovplyvnení podobnou etickou výzvou vo svojom živote? Dokážete si spomenúť na aspoň jednu ďalšiu prípadovú štúdiu, ktorá ilustruje jednu z etických výziev, o ktorých sme diskutovali v tejto sekcii?
> 🚨 Zamyslite sa nad prípadovými štúdiami, ktoré ste videli - zažili ste alebo boli ovplyvnení podobnou etickou výzvou vo svojom živote? Dokážete si spomenúť na aspoň jednu ďalšiu prípadovú štúdiu, ktorá ilustruje jednu z etických výziev, o ktorých sme diskutovali v tejto sekcii?
## Aplikovaná etika
Hovorili sme o etických konceptoch, výzvach a prípadových štúdiách v reálnom kontexte. Ako však začať _uplatňovať_ etické princípy a praktiky vo svojich projektoch? A ako _zaviesť_ tieto praktiky pre lepšie riadenie? Poďme preskúmať niektoré reálne riešenia:
Hovorili sme o etických konceptoch, výzvach a prípadových štúdiách v kontexte reálneho sveta. Ale ako začať _uplatňovať_ etické princípy a praktiky vo svojich projektoch? A ako _operacionalizovať_ tieto praktiky pre lepšie riadenie? Preskúmajme niektoré riešenia z praxe:
### 1. Profesionálne kódexy
Profesionálne kódexy ponúkajú jednu možnosť pre organizácie, ako „motivovať“ členov k podpore ich etických princípov a poslania. Kódexy sú _morálne usmernenia_ pre profesionálne správanie, ktoré pomáhajú zamestnancom alebo členom robiť rozhodnutia v súlade s princípmi ich organizácie. Ich účinnosť však závisí od dobrovoľného dodržiavania členmi; mnohé organizácie však ponúkajú dodatočné odmeny a sankcie na podporu dodržiavania.
Profesijné kódexy ponúkajú jednu možnosť pre organizácie, ako "motivovať" členov k podpore ich etických princípov a poslania. Kódexy sú _morálne usmernenia_ pre profesionálne správanie, ktoré pomáhajú zamestnancom alebo členom robiť rozhodnutia v súlade s princípmi organizácie. Sú však účinné len do miery dobrovoľného dodržiavania členmi; mnohé organizácie však ponúkajú dodatočné odmeny a sankcie na motiváciu dodržiavania.
Príklady zahŕňajú:
* [Oxford Munich](http://www.code-of-ethics.org/code-of-conduct/) Kódex etiky
* [Oxford Munich](http://www.code-of-ethics.org/code-of-conduct/) Etický kódex
* [Data Science Association](http://datascienceassn.org/code-of-conduct.html) Kódex správania (vytvorený v roku 2013)
* [ACM Kódex etiky a profesionálneho správania](https://www.acm.org/code-of-ethics) (od roku 1993)
* [ACM Code of Ethics and Professional Conduct](https://www.acm.org/code-of-ethics) (od roku 1993)
> 🚨 Patríte do profesionálnej inžinierskej alebo dátovej organizácie? Preskúmajte ich webovú stránku, aby ste zistili, či definujú profesionálny kódex etiky. Čo to hovorí o ich etických princípoch? Ako motivujú členov k dodržiavaniu kódexu?
> 🚨 Patríte do profesionálnej organizácie pre inžinierstvo alebo dátovú vedu? Preskúmajte ich webovú stránku, aby ste zistili, či definujú profesionálny etický kódex. Čo to hovorí o ich etických princípoch? Ako motivujú členov k dodržiavaniu kódexu?
### 2. Etické kontrolné zoznamy
Zatiaľ čo profesionálne kódexy definujú požadované _etické správanie_ od odborníkov, [majú známe obmedzenia](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md) pri presadzovaní, najmä pri veľkých projektoch. Mnohí odborníci na dátovú vedu preto [odporúčajú kontrolné zoznamy](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md), ktoré môžu **prepojiť princípy s praxou** deterministickým a akčným spôsobom.
Zatiaľ čo profesionálne kódexy definujú požadované _etické správanie_ od odborníkov, [majú známe obmedzenia](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md) v presadzovaní, najmä pri veľkých projektoch. Namiesto toho mnohí odborníci na dátovú vedu [odporúčajú kontrolné zoznamy](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md), ktoré môžu **prepojiť princípy s praxou** deterministickým a akčným spôsobom.
Kontrolné zoznamy premieňajú otázky na „áno/nie“ úlohy, ktoré je možné operacionalizovať, čo umožňuje ich sledovanie ako súčasť štandardných pracovných postupov pri vydávaní produktov.
Kontrolné zoznamy prevádzajú otázky na "áno/nie" úlohy, ktoré môžu byť operacionalizované, čo umožňuje ich sledovanie ako súčasť štandardných pracovných postupov pri vydávaní produktov.
Príklady zahŕňajú:
* [Deon](https://deon.drivendata.org/) - všeobecný kontrolný zoznam etiky dát vytvorený na základe [odporúčaní z odvetvia](https://deon.drivendata.org/#checklist-citations) s nástrojom príkazového riadku pre jednoduchú integráciu.
@ -214,36 +212,42 @@ Príklady zahŕňajú:
### 3. Etické regulácie
Etika je o definovaní spoločných hodnôt a dobrovoľnom konaní správnych vecí. **Súlad** je o _dodržiavaní zákona_, ak a kde je definovaný. **Riadenie** zahŕňa všetky spôsoby, akými organizácie presadzujú etické princípy a dodržiavajú stanovené zákony.
Etika je o definovaní spoločných hodnôt a dobrovoľnom konaní správne. **Dodržiavanie** je o _dodržiavaní zákona_, ak je definovaný. **Riadenie** zahŕňa všetky spôsoby, ktorými organizácie presadzujú etické princípy a dodržiavajú stanovené zákony.
Dnes riadenie zahŕňa dve formy v rámci organizácií. Po prvé, ide o definovanie **etických princípov AI** a zavedenie praktík na podporu ich prijatia vo všetkých projektoch súvisiacich s AI v organizácii. Po druhé, ide o dodržiavanie všetkých vládou nariadených **regulácií ochrany údajov** pre regióny, v ktorých organizácia pôsobí.
Dnes riadenie dve formy v rámci organizácií. Po prvé, ide o definovanie princípov **etickej AI** a zavedenie praktík na operacionalizáciu prijatia vo všetkých projektoch súvisiacich s AI v organizácii. Po druhé, ide o dodržiavanie všetkých vládou stanovených **regulácií ochrany údajov** pre regióny, v ktorých pôsobí.
Príklady regulácií ochrany údajov a súkromia:
* `1974`, [Zákon o ochrane súkromia USA](https://www.justice.gov/opcl/privacy-act-1974) - reguluje _federálnu vládu_ pri zhromažďovaní, používaní a zverejňovaní osobných údajov.
* `1996`, [Zákon o prenosnosti a zodpovednosti zdravotného poistenia USA (HIPAA)](https://www.cdc.gov/phlp/publications/topic/hipaa.html) - chráni osobné zdravotné údaje.
* `1998`, [Zákon o ochrane súkromia detí online (COPPA)](https://www.ftc.gov/enforcement/rules/rulemaking-regulatory-reform-proceedings/childrens-online-privacy-protection-rule) - chráni údaje detí mladších ako 13 rokov.
* `2018`, [Všeobecné nariadenie o ochrane údajov (GDPR)](https://gdpr-info.eu/) - poskytuje práva používateľov, ochranu údajov a súkromie.
* `2018`, [Kalifornský zákon o ochrane spotrebiteľov (CCPA)](https://www.oag.ca.gov/privacy/ccpa) - dáva spotrebiteľom viac _práv_ nad ich (osobnými) údajmi.
* `2021`, Čína [Zákon o ochrane osobných údajov](https://www.reuters.com/world/china/china-passes-new-personal-data-privacy-law-take-effect-nov-1-2021-08-20/) - jeden z najsilnejších online zákonov o ochrane súkromia na svete.
* `1974`, [US Privacy Act](https://www.justice.gov/opcl/privacy-act-1974) - reguluje _federálnu vládu_ pri zbere, používaní a zverejňovaní osobných údajov.
* `1996`, [US Health Insurance Portability & Accountability Act (HIPAA)](https://www.cdc.gov/phlp/publications/topic/hipaa.html) - chráni osobné zdravotné údaje.
* `1998`, [US Children's Online Privacy Protection Act (COPPA)](https://www.ftc.gov/enforcement/rules/rulemaking-regulatory-reform-proceedings/childrens-online-privacy-protection-rule) - chráni údaje detí mladších ako 13 rokov.
* `2018`, [General Data Protection Regulation (GDPR)](https://gdpr-info.eu/) - poskytuje práva používateľov, ochranu údajov a súkromie.
* `2018`, [California Consumer Privacy Act (CCPA)](https://www.oag.ca.gov/privacy/ccpa) - dáva spotrebiteľom viac _práv_ nad ich (osobnými) údajmi.
* `2021`, Čína [Zákon o ochrane osobných údajov](https://www.reuters.com/world/china/china-passes-new-personal-data-privacy-law-take-effect-nov-1-2021-08-20/) práve prijatý, vytvára jeden z najsilnejších online regulácií ochrany údajov na svete.
> 🚨 Európska únia definovala GDPR (General Data Protection Regulation), ktorý zostáva jedným z najvplyvnejších regulácií ochrany údajov dnes. Vedeli ste, že tiež definuje [8 práv používateľov](https://www.freeprivacypolicy.com/blog/8-user-rights-gdpr) na ochranu digitálneho súkromia a osobných údajov občanov? Zistite, čo to sú a prečo sú dôležité.
> 🚨 Európska únia definovala GDPR (Všeobecné nariadenie o ochrane údajov), ktoré zostáva jedným z najvplyvnejších nariadení o ochrane údajov dnes. Vedeli ste, že GDPR tiež definuje [8 práv používateľov](https://www.freeprivacypolicy.com/blog/8-user-rights-gdpr) na ochranu digitálneho súkromia a osobných údajov občanov? Zistite, aké sú tieto práva a prečo sú dôležité.
### 4. Etická kultúra
### 4. Kultúra etiky
Poznamenajte, že stále existuje nehmotná medzera medzi _dodržiavaním_ (urobením dostatočného na splnenie "litery zákona") a riešením [systémových problémov](https://www.coursera.org/learn/data-science-ethics/home/week/4) (ako je osifikácia, informačná asymetria a distribučná nespravodlivosť), ktoré môžu urýchliť zneužitie AI.
Treba si uvedomiť, že medzi _dodržiavaním zákona_ (splnením „litery zákona“) a riešením [systémových problémov](https://www.coursera.org/learn/data-science-ethics/home/week/4) (ako je zakonzervovanie, informačná asymetria a distribučná nespravodlivosť), ktoré môžu urýchliť zneužitie AI, zostáva nehmotná priepasť.
To druhé si vyžaduje [spoluprácu pri definovaní etických kultúr](https://towardsdatascience.com/why-ai-ethics-requires-a-culture-driven-approach-26f451afa29f), ktoré budujú emocionálne spojenia a konzistentné spoločné hodnoty _naprieč organizáciami_ v odvetví. To si vyžaduje viac [formalizovaných kultúr etiky dát](https://www.codeforamerica.org/news/formalizing-an-ethical-data-culture/) v organizáciách - umožňujúc _komukoľvek_ [zatiahnuť Andon šnúru](https://en.wikipedia.org/wiki/Andon_(manufacturing)) (na včasné upozornenie na etické problémy) a robiť _etické hodnotenia_ (napr. pri nábore) ako základné kritérium pri formovaní tímov v AI projektoch.
---
## [Kvíz po prednáške](https://ff-quizzes.netlify.app/en/ds/) 🎯
## Prehľad a samostatné štúdium
Riešenie týchto problémov si vyžaduje [spoluprácu na definovaní kultúr etiky](https://towardsdatascience.com/why-ai-ethics-requires-a-culture-driven-approach-26f451afa29f), ktoré budujú emocionálne spojenia a konzistentné spoločné hodnoty _naprieč organizáciami_ v odvetví. To si vyžaduje viac [formalizovaných kultúr etiky dát](https://www.codeforamerica.org/news/formalizing-an-ethical-data-culture/) v organizáciách umožňujúc _komukoľvek_ [zatiahnuť Andon šnúru](https://en.wikipedia.org/wiki/Andon_(manufacturing)) (na včasné upozornenie na etické problémy) a robiť _etické hodnot
* [Zásady zodpovednej umelej inteligencie](https://docs.microsoft.com/en-us/learn/modules/responsible-ai-principles/) - bezplatná vzdelávacia cesta od Microsoft Learn.
* [Etika a dátová veda](https://resources.oreilly.com/examples/0636920203964) - EBook od O'Reilly (M. Loukides, H. Mason a kol.)
* [Etika v dátovej vede](https://www.coursera.org/learn/data-science-ethics#syllabus) - online kurz od University of Michigan.
* [Etika v praxi](https://ethicsunwrapped.utexas.edu/case-studies) - prípadové štúdie od University of Texas.
Kurzy a knihy pomáhajú pochopiť základné etické koncepty a výzvy, zatiaľ čo prípadové štúdie a nástroje pomáhajú s aplikovanými etickými praktikami
* [Princípy zodpovednej AI](https://docs.microsoft.com/en-us/learn/modules/responsible-ai-principles/) - bezplatná vzdelávacia cesta od Microsoft Learn.
* [Etika a dátová veda](https://resources.oreilly.com/examples/0636920203964) - O'Reilly EBook (M. Loukides, H. Mason a kol.)
* [Etika dátovej vedy](https://www.coursera.org/learn/data-science-ethics#syllabus) - online kurz z University of Michigan.
* [Etika v praxi](https://ethicsunwrapped.utexas.edu/case-studies) - prípadové štúdie z University of Texas.
# Zadanie
# Zadanie
[Napíšte prípadovú štúdiu o etike dát](assignment.md)
[Napíšte prípadovú štúdiu o etike dát](assignment.md)
---
**Upozornenie**:
Tento dokument bol preložený pomocou služby AI prekladu [Co-op Translator](https://github.com/Azure/co-op-translator). Aj keď sa snažíme o presnosť, prosím, berte na vedomie, že automatizované preklady môžu obsahovať chyby alebo nepresnosti. Pôvodný dokument v jeho pôvodnom jazyku by mal byť považovaný za autoritatívny zdroj. Pre kritické informácie sa odporúča profesionálny ľudský preklad. Nenesieme zodpovednosť za akékoľvek nedorozumenia alebo nesprávne interpretácie vyplývajúce z použitia tohto prekladu.
Tento dokument bol preložený pomocou služby AI prekladu [Co-op Translator](https://github.com/Azure/co-op-translator). Hoci sa snažíme o presnosť, prosím, berte na vedomie, že automatizované preklady môžu obsahovať chyby alebo nepresnosti. Pôvodný dokument v jeho rodnom jazyku by mal byť považovaný za autoritatívny zdroj. Pre kritické informácie sa odporúča profesionálny ľudský preklad. Nie sme zodpovední za akékoľvek nedorozumenia alebo nesprávne interpretácie vyplývajúce z použitia tohto prekladu.

@ -1,8 +1,8 @@
<!--
CO_OP_TRANSLATOR_METADATA:
{
"original_hash": "8796f41f566a0a8ebb72863a83d558ed",
"translation_date": "2025-08-30T19:41:44+00:00",
"original_hash": "3a34157cc63516eba97c89a0b2f8c3e6",
"translation_date": "2025-09-03T21:54:57+00:00",
"source_file": "1-Introduction/02-ethics/README.md",
"language_code": "sl"
}
@ -17,15 +17,15 @@ CO_OP_TRANSLATOR_METADATA:
Vsi smo podatkovni državljani, ki živimo v svetu, prežetem s podatki.
Tržni trendi kažejo, da bo do leta 2022 ena od treh velikih organizacij kupovala in prodajala svoje podatke prek spletnih [tržnic in izmenjav](https://www.gartner.com/smarterwithgartner/gartner-top-10-trends-in-data-and-analytics-for-2020/). Kot **razvijalci aplikacij** bomo lažje in ceneje vključili vpoglede, ki temeljijo na podatkih, ter avtomatizacijo, ki jo poganjajo algoritmi, v vsakodnevne uporabniške izkušnje. Toda z vseprisotnostjo umetne inteligence bomo morali razumeti tudi potencialne škodljive učinke [uporabe algoritmov kot orožja](https://www.youtube.com/watch?v=TQHs8SA1qpk) v velikem obsegu.
Tržni trendi kažejo, da bo do leta 2022 1 od 3 velikih organizacij kupovala in prodajala svoje podatke prek spletnih [tržnic in izmenjav](https://www.gartner.com/smarterwithgartner/gartner-top-10-trends-in-data-and-analytics-for-2020/). Kot **razvijalci aplikacij** bomo lažje in ceneje vključili vpoglede, ki temeljijo na podatkih, ter avtomatizacijo, ki jo poganjajo algoritmi, v vsakodnevne uporabniške izkušnje. Toda z razširjenostjo umetne inteligence bomo morali razumeti tudi potencialne škodljive učinke [uporabe algoritmov kot orožja](https://www.youtube.com/watch?v=TQHs8SA1qpk) v velikem obsegu.
Trendi prav tako kažejo, da bomo do leta 2025 ustvarili in porabili več kot [180 zettabajtov](https://www.statista.com/statistics/871513/worldwide-data-created/) podatkov. Kot **podatkovni znanstveniki** imamo s tem neprimerljivo raven dostopa do osebnih podatkov. To nam omogoča gradnjo vedenjskih profilov uporabnikov in vplivanje na sprejemanje odločitev na načine, ki ustvarjajo [iluzijo svobodne izbire](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice), hkrati pa potencialno usmerjajo uporabnike k izidom, ki jih sami preferiramo. To odpira tudi širša vprašanja o zasebnosti podatkov in zaščiti uporabnikov.
Trend kaže tudi, da bomo do leta 2025 ustvarili in porabili več kot [180 zettabajtov](https://www.statista.com/statistics/871513/worldwide-data-created/) podatkov. Kot **podatkovni znanstveniki** bomo imeli neprimerljivo raven dostopa do osebnih podatkov. To nam omogoča gradnjo vedenjskih profilov uporabnikov in vplivanje na sprejemanje odločitev na načine, ki ustvarjajo [iluzijo svobodne izbire](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice), hkrati pa potencialno usmerjajo uporabnike k izidom, ki jih sami preferiramo. To pa odpira širša vprašanja o zasebnosti podatkov in zaščiti uporabnikov.
Podatkovna etika je zdaj _nujna varovalka_ za podatkovno znanost in inženiring, ki nam pomaga zmanjšati potencialne škodljive učinke in nenamerne posledice naših dejanj, ki temeljijo na podatkih. [Gartnerjev Hype Cycle za umetno inteligenco](https://www.gartner.com/smarterwithgartner/2-megatrends-dominate-the-gartner-hype-cycle-for-artificial-intelligence-2020/) identificira relevantne trende v digitalni etiki, odgovorni umetni inteligenci in upravljanju umetne inteligence kot ključne gonilnike večjih megatrendov okoli _demokratizacije_ in _industrializacije_ umetne inteligence.
Podatkovna etika je zdaj _nujna varovalka_ za podatkovno znanost in inženiring, ki nam pomaga zmanjšati potencialne škodljive učinke in nenamerne posledice naših dejanj, ki temeljijo na podatkih. [Gartnerjev Hype Cycle za AI](https://www.gartner.com/smarterwithgartner/2-megatrends-dominate-the-gartner-hype-cycle-for-artificial-intelligence-2020/) identificira relevantne trende v digitalni etiki, odgovorni AI in upravljanju AI kot ključne dejavnike večjih megatrendov okoli _demokratizacije_ in _industrializacije_ umetne inteligence.
![Gartnerjev Hype Cycle za umetno inteligenco - 2020](https://images-cdn.newscred.com/Zz1mOWJhNzlkNDA2ZTMxMWViYjRiOGFiM2IyMjQ1YmMwZQ==)
![Gartnerjev Hype Cycle za AI - 2020](https://images-cdn.newscred.com/Zz1mOWJhNzlkNDA2ZTMxMWViYjRiOGFiM2IyMjQ1YmMwZQ==)
V tej lekciji bomo raziskali fascinantno področje podatkovne etike - od osnovnih konceptov in izzivov do študij primerov in uporabljenih konceptov umetne inteligence, kot je upravljanje, ki pomagajo vzpostaviti kulturo etike v ekipah in organizacijah, ki delajo s podatki in umetno inteligenco.
V tej lekciji bomo raziskali fascinantno področje podatkovne etike - od osnovnih konceptov in izzivov do študij primerov in uporabljenih konceptov AI, kot je upravljanje, ki pomagajo vzpostaviti kulturo etike v ekipah in organizacijah, ki delajo s podatki in umetno inteligenco.
## [Predhodni kviz](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/2) 🎯
@ -37,11 +37,11 @@ Beseda "etika" izhaja iz [grške besede "ethikos"](https://en.wikipedia.org/wiki
**Etika** se nanaša na skupne vrednote in moralna načela, ki usmerjajo naše vedenje v družbi. Etika temelji ne na zakonih, temveč na splošno sprejetih normah, kaj je "prav vs. narobe". Vendar pa lahko etične premisleke vplivajo na pobude korporativnega upravljanja in vladne regulacije, ki ustvarjajo več spodbud za skladnost.
**Podatkovna etika** je [nova veja etike](https://royalsocietypublishing.org/doi/full/10.1098/rsta.2016.0360#sec-1), ki "preučuje in ocenjuje moralne probleme, povezane s _podatki, algoritmi in ustreznimi praksami_". Tukaj se **"podatki"** osredotočajo na dejanja, povezana z generiranjem, beleženjem, kuriranjem, obdelavo, razširjanjem, deljenjem in uporabo, **"algoritmi"** se osredotočajo na umetno inteligenco, agente, strojno učenje in robote, medtem ko se **"prakse"** osredotočajo na teme, kot so odgovorne inovacije, programiranje, hekanje in kodeks etike.
**Podatkovna etika** je [nova veja etike](https://royalsocietypublishing.org/doi/full/10.1098/rsta.2016.0360#sec-1), ki "preučuje in ocenjuje moralne probleme, povezane s _podatki, algoritmi in ustreznimi praksami_". Tukaj se **"podatki"** osredotočajo na dejanja, povezana z generiranjem, beleženjem, kuriranjem, obdelavo, razširjanjem, deljenjem in uporabo, **"algoritmi"** se osredotočajo na AI, agente, strojno učenje in robote, medtem ko se **"prakse"** osredotočajo na teme, kot so odgovorne inovacije, programiranje, hekanje in kodeks etike.
**Uporabljena etika** je [praktična uporaba moralnih premislekov](https://en.wikipedia.org/wiki/Applied_ethics). Gre za proces aktivnega raziskovanja etičnih vprašanj v kontekstu _dejanskih dejanj, izdelkov in procesov_ ter sprejemanja korektivnih ukrepov, da ostanejo skladni z našimi opredeljenimi etičnimi vrednotami.
**Kultura etike** se nanaša na [_operacionalizacijo_ uporabljene etike](https://hbr.org/2019/05/how-to-design-an-ethical-organization), da zagotovimo, da so naša etična načela in prakse sprejeta na dosleden in razširljiv način po celotni organizaciji. Uspešne kulture etike opredelijo organizacijsko široka etična načela, zagotavljajo smiselne spodbude za skladnost ter krepijo etične norme z vzpodbujanjem in amplifikacijo želenih vedenj na vseh ravneh organizacije.
**Kultura etike** se nanaša na [_operacionalizacijo_ uporabljene etike](https://hbr.org/2019/05/how-to-design-an-ethical-organization), da zagotovimo, da so naša etična načela in prakse sprejeta na dosleden in razširljiv način po celotni organizaciji. Uspešne kulture etike opredelijo organizacijsko široka etična načela, zagotavljajo smiselne spodbude za skladnost in krepijo etične norme z vzpodbujanjem in amplifikacijo želenih vedenj na vseh ravneh organizacije.
## Koncepti etike
@ -49,28 +49,28 @@ V tem razdelku bomo razpravljali o konceptih, kot so **skupne vrednote** (načel
### 1. Načela etike
Vsaka strategija podatkovne etike se začne z opredelitvijo _etičnih načel_ - "skupnih vrednot", ki opisujejo sprejemljiva vedenja in usmerjajo skladna dejanja v naših projektih, povezanih s podatki in umetno inteligenco. Ta načela lahko opredelite na individualni ali skupinski ravni. Vendar pa večina velikih organizacij opredeli ta načela v _etičnem AI_ misijskem izjavi ali okviru, ki je opredeljen na korporativni ravni in dosledno uveljavljen v vseh ekipah.
Vsaka strategija podatkovne etike se začne z opredelitvijo _etičnih načel_ - "skupnih vrednot", ki opisujejo sprejemljiva vedenja in usmerjajo skladna dejanja v naših projektih, povezanih s podatki in AI. Ta načela lahko opredelite na individualni ali skupinski ravni. Vendar pa večina velikih organizacij opredeli ta načela v _etičnem AI_ misijskem izjavi ali okviru, ki je opredeljen na korporativni ravni in dosledno uveljavljen v vseh ekipah.
**Primer:** Microsoftova [Odgovorna umetna inteligenca](https://www.microsoft.com/en-us/ai/responsible-ai) misijska izjava se glasi: _"Zavezani smo k napredku umetne inteligence, ki temelji na etičnih načelih, ki postavljajo ljudi na prvo mesto"_ - opredeljuje 6 etičnih načel v spodnjem okviru:
**Primer:** Microsoftova [Odgovorna AI](https://www.microsoft.com/en-us/ai/responsible-ai) misijska izjava se glasi: _"Zavezani smo k napredku AI, ki ga vodijo etična načela, ki postavljajo ljudi na prvo mesto"_ - opredeljuje 6 etičnih načel v spodnjem okviru:
![Odgovorna umetna inteligenca pri Microsoftu](https://docs.microsoft.com/en-gb/azure/cognitive-services/personalizer/media/ethics-and-responsible-use/ai-values-future-computed.png)
![Odgovorna AI pri Microsoftu](https://docs.microsoft.com/en-gb/azure/cognitive-services/personalizer/media/ethics-and-responsible-use/ai-values-future-computed.png)
Na kratko raziščimo ta načela. _Transparentnost_ in _odgovornost_ sta temeljni vrednoti, na katerih temeljijo druga načela - zato začnimo tukaj:
Na kratko raziščimo ta načela. _Transparentnost_ in _odgovornost_ sta temeljni vrednoti, na katerih temeljijo druga načela - zato začnimo tam:
* [**Odgovornost**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) zahteva, da so praktiki _odgovorni_ za svoje operacije, povezane s podatki in umetno inteligenco, ter skladnost s temi etičnimi načeli.
* [**Transparentnost**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) zagotavlja, da so dejanja, povezana s podatki in umetno inteligenco, _razumljiva_ (interpretabilna) za uporabnike, pojasnjujoč kaj in zakaj za odločitvami.
* [**Pravičnost**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1%3aprimaryr6) - se osredotoča na zagotavljanje, da umetna inteligenca _vse ljudi_ obravnava pravično, obravnavajoč morebitne sistemske ali implicitne socio-tehnične pristranskosti v podatkih in sistemih.
* [**Zanesljivost in varnost**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - zagotavlja, da umetna inteligenca deluje _dosledno_ z opredeljenimi vrednotami, zmanjšuje potencialne škodljive učinke ali nenamerne posledice.
* [**Odgovornost**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) zahteva, da so praktiki _odgovorni_ za svoje podatkovne in AI operacije ter skladnost s temi etičnimi načeli.
* [**Transparentnost**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) zagotavlja, da so dejanja, povezana s podatki in AI, _razumljiva_ (interpretabilna) za uporabnike, pojasnjujoč kaj in zakaj za odločitvami.
* [**Pravičnost**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1%3aprimaryr6) - se osredotoča na zagotavljanje, da AI _vse ljudi_ obravnava pravično, obravnavajoč sistemske ali implicitne socio-tehnične pristranskosti v podatkih in sistemih.
* [**Zanesljivost in varnost**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - zagotavlja, da AI deluje _dosledno_ z opredeljenimi vrednotami, zmanjšuje potencialne škodljive učinke ali nenamerne posledice.
* [**Zasebnost in varnost**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - se nanaša na razumevanje izvora podatkov ter zagotavljanje _zasebnosti podatkov in povezanih zaščit_ za uporabnike.
* [**Vključenost**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - se nanaša na načrtovanje rešitev umetne inteligence z namenom, prilagajanje za izpolnjevanje _širokega spektra človeških potreb_ in sposobnosti.
* [**Vključenost**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - se nanaša na oblikovanje AI rešitev z namenom, prilagajanje za izpolnjevanje _širokega spektra človeških potreb_ in sposobnosti.
> 🚨 Razmislite, kakšna bi lahko bila vaša misijska izjava o podatkovni etiki. Raziščite etične AI okvire drugih organizacij - tukaj so primeri od [IBM](https://www.ibm.com/cloud/learn/ai-ethics), [Google](https://ai.google/principles) in [Facebook](https://ai.facebook.com/blog/facebooks-five-pillars-of-responsible-ai/). Katere skupne vrednote imajo? Kako se ta načela nanašajo na AI izdelke ali industrijo, v kateri delujejo?
### 2. Etični izzivi
Ko imamo opredeljena etična načela, je naslednji korak oceniti naša dejanja, povezana s podatki in umetno inteligenco, da vidimo, ali so skladna s temi skupnimi vrednotami. Razmislite o svojih dejanjih v dveh kategorijah: _zbiranje podatkov_ in _oblikovanje algoritmov_.
Ko imamo opredeljena etična načela, je naslednji korak oceniti naša dejanja, povezana s podatki in AI, da vidimo, ali so skladna s temi skupnimi vrednotami. Razmislite o svojih dejanjih v dveh kategorijah: _zbiranje podatkov_ in _oblikovanje algoritmov_.
Pri zbiranju podatkov bodo dejanja verjetno vključevala **osebne podatke** ali osebno prepoznavne informacije (PII) za prepoznavne žive posameznike. To vključuje [različne elemente neosebnih podatkov](https://ec.europa.eu/info/law/law-topic/data-protection/reform/what-personal-data_en), ki _skupno_ identificirajo posameznika. Etični izzivi se lahko nanašajo na _zasebnost podatkov_, _lastništvo podatkov_ in povezana vprašanja, kot so _informirano soglasje_ ter _pravice intelektualne lastnine_ za uporabnike.
Pri zbiranju podatkov bodo dejanja verjetno vključevala **osebne podatke** ali osebno prepoznavne informacije (PII) za prepoznavne žive posameznike. To vključuje [raznolike elemente neosebnih podatkov](https://ec.europa.eu/info/law/law-topic/data-protection/reform/what-personal-data_en), ki _skupno_ identificirajo posameznika. Etični izzivi se lahko nanašajo na _zasebnost podatkov_, _lastništvo podatkov_ in povezana vprašanja, kot so _informirano soglasje_ ter _pravice intelektualne lastnine_ za uporabnike.
Pri oblikovanju algoritmov bodo dejanja vključevala zbiranje in kuriranje **naborov podatkov**, nato pa njihovo uporabo za treniranje in uvajanje **podatkovnih modelov**, ki napovedujejo izide ali avtomatizirajo odločitve v realnih kontekstih. Etični izzivi se lahko pojavijo zaradi _pristranskosti nabora podatkov_, _težav s kakovostjo podatkov_, _nepravičnosti_ in _napačne predstavitve_ v algoritmih - vključno z nekaterimi vprašanji, ki so sistemske narave.
@ -126,7 +126,7 @@ Vprašanja za raziskovanje tukaj so:
#### 2.6 Pristranskost nabora podatkov
Nabor podatkov ali [pristranskost zbiranja](http://researcharticles.com/index.php/bias-in-data-collection-in-research/) se nanaša na izbiro _nereprezentativnega_ podnabora podatkov za razvoj algoritmov, kar ustvarja potencialno nepravičnost v rezultatih za različne skupine. Vrste pristranskosti vključujejo pristranskost izbire ali vzorčenja, pristranskost prostovoljcev in pristranskost instrumentov.
Pristranskost nabora podatkov ali [pristranskost zbiranja](http://researcharticles.com/index.php/bias-in-data-collection-in-research/) se nanaša na izbiro _nereprezentativnega_ podnabora podatkov za razvoj algoritmov, kar lahko povzroči potencialno nepravičnost v rezultatih za raznolike skupine. Vrste pristranskosti vključujejo pristranskost izbire ali vzorčenja, pristranskost prostovoljcev in pristranskost instrumentov.
Vprašanja za raziskovanje tukaj so:
* Ali smo pridobili reprezentativen nabor podatkovnih subjektov?
@ -135,12 +135,14 @@ Vprašanja za raziskovanje tukaj so:
#### 2.7 Kakovost podatkov
[Kakovost podatkov](https://lakefs.io/data-quality-testing/) preverja veljavnost kuriranega nabora podatkov, uporabljenega za razvoj naših algoritmov, preverja, ali značilnosti in zapisi izpolnjujejo zahteve za raven natančnosti in doslednosti, potrebne za naš namen umetne inteligence.
[Kakovost podatkov](https://lakefs.io/data-quality-testing/) preverja veljavnost kuriranega nabora podatkov, uporabljenega za razvoj naših algoritmov, preverja, ali značilnosti in zapisi izpolnjujejo zahteve za raven natančnosti in doslednosti, ki je potrebna za naš AI namen.
Vprašanja za raziskovanje tukaj so:
* Ali smo zajeli veljavne _značilnosti_ za naš primer uporabe?
* Ali so
[Algorithm Fairness](https://towardsdatascience.com/what-is-algorithm-fairness-3182e161cf9f) preveri, ali zasnova algoritma sistematično diskriminira določene podskupine podatkovnih subjektov, kar lahko vodi do [potencialnih škod](https://docs.microsoft.com/en-us/azure/machine-learning/concept-fairness-ml) pri _dodeljevanju_ (kjer so sredstva zavrnjena ali zadržana za to skupino) in _kakovosti storitev_ (kjer AI ni tako natančen za nekatere podskupine kot za druge).
* Ali so bili podatki zajeti _dosledno_ iz raznolikih virov podatkov?
* Ali je nabor podatkov _popoln_ za raznolike pogoje ali scenarije?
* Ali so informacije zajete _natančno_
[Algorithm Fairness](https://towardsdatascience.com/what-is-algorithm-fairness-3182e161cf9f) preverja, ali zasnova algoritma sistematično diskriminira določene podskupine podatkovnih subjektov, kar lahko vodi do [potencialnih škod](https://docs.microsoft.com/en-us/azure/machine-learning/concept-fairness-ml) pri _dodeljevanju_ (kjer so sredstva zavrnjena ali zadržana za to skupino) in _kakovosti storitev_ (kjer AI ni tako natančen za nekatere podskupine kot za druge).
Vprašanja, ki jih je treba raziskati:
* Ali smo ocenili natančnost modela za različne podskupine in pogoje?
@ -154,49 +156,49 @@ Raziskujte vire, kot so [AI Fairness checklists](https://query.prod.cms.rt.micro
[Napačna predstavitev podatkov](https://www.sciencedirect.com/topics/computer-science/misrepresentation) se nanaša na vprašanje, ali sporočamo vpoglede iz pošteno poročanih podatkov na zavajajoč način, da podpiramo želeno pripoved.
Vprašanja, ki jih je treba raziskati:
* Ali poročamo nepopolne ali netočne podatke?
* Ali poročamo o nepopolnih ali netočnih podatkih?
* Ali vizualiziramo podatke na način, ki vodi do zavajajočih zaključkov?
* Ali uporabljamo selektivne statistične tehnike za manipulacijo rezultatov?
* Ali obstajajo alternativne razlage, ki bi lahko ponudile drugačen zaključek?
#### 2.10 Svobodna izbira
[Iluzija svobodne izbire](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice) se pojavi, ko "arhitekture izbire" sistema uporabljajo algoritme za sprejemanje odločitev, da ljudi usmerijo k želenemu rezultatu, medtem ko jim dajejo občutek možnosti in nadzora. Ti [temni vzorci](https://www.darkpatterns.org/) lahko povzročijo socialno in ekonomsko škodo uporabnikom. Ker odločitve uporabnikov vplivajo na vedenjske profile, lahko te akcije potencialno usmerjajo prihodnje izbire, ki lahko okrepijo ali podaljšajo vpliv teh škod.
[Iluzija svobodne izbire](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice) se pojavi, ko "arhitekture izbire" sistema uporabljajo algoritme za sprejemanje odločitev, da ljudi usmerijo k želenemu izidu, medtem ko jim dajejo občutek možnosti in nadzora. Ti [temni vzorci](https://www.darkpatterns.org/) lahko povzročijo socialno in ekonomsko škodo uporabnikom. Ker odločitve uporabnikov vplivajo na vedenjske profile, lahko te akcije potencialno poganjajo prihodnje izbire, ki lahko okrepijo ali podaljšajo vpliv teh škod.
Vprašanja, ki jih je treba raziskati:
* Ali je uporabnik razumel posledice sprejetja te odločitve?
* Ali je bil uporabnik seznanjen z (alternativnimi) možnostmi in prednostmi ter slabostmi vsake?
* Ali je uporabnik razumel posledice sprejemanja te izbire?
* Ali je bil uporabnik seznanjen z (alternativnimi) izbirami in prednostmi ter slabostmi vsake?
* Ali lahko uporabnik kasneje razveljavi avtomatizirano ali vplivano izbiro?
### 3. Študije primerov
Da bi te etične izzive postavili v kontekst resničnega sveta, je koristno pogledati študije primerov, ki poudarjajo potencialne škode in posledice za posameznike ter družbo, kadar se takšne kršitve etike prezrejo.
Da bi te etične izzive postavili v kontekst resničnega sveta, je koristno pogledati študije primerov, ki poudarjajo potencialne škode in posledice za posameznike in družbo, kadar se takšne kršitve etike prezrejo.
Tukaj je nekaj primerov:
| Etični izziv | Študija primera |
|--- |--- |
| **Informirano soglasje** | 1972 - [Študija sifilisa Tuskegee](https://en.wikipedia.org/wiki/Tuskegee_Syphilis_Study) - Afroameriškim moškim, ki so sodelovali v študiji, so obljubili brezplačno zdravstveno oskrbo, _vendar so jih raziskovalci zavajali_, saj jim niso povedali diagnoze ali o razpoložljivosti zdravljenja. Veliko udeležencev je umrlo, prizadeti pa so bili tudi partnerji in otroci; študija je trajala 40 let. |
| **Informirano soglasje** | 1972 - [Študija sifilisa Tuskegee](https://en.wikipedia.org/wiki/Tuskegee_Syphilis_Study) - Afroameriškim moškim, ki so sodelovali v študiji, so obljubili brezplačno zdravstveno oskrbo, _vendar so jih raziskovalci zavajali_, saj jim niso povedali za diagnozo ali razpoložljivost zdravljenja. Veliko udeležencev je umrlo, prizadeti pa so bili tudi partnerji in otroci; študija je trajala 40 let. |
| **Zasebnost podatkov** | 2007 - [Netflixova nagrada za podatke](https://www.wired.com/2007/12/why-anonymous-data-sometimes-isnt/) je raziskovalcem zagotovila _10M anonimiziranih ocen filmov od 50K strank_, da bi izboljšali algoritme priporočanja. Vendar so raziskovalci uspeli povezati anonimizirane podatke z osebnimi podatki v _zunanjih zbirkah podatkov_ (npr. komentarji na IMDb) - učinkovito "deanonimizirali" nekatere naročnike Netflixa.|
| **Pristranskost pri zbiranju podatkov** | 2013 - Mesto Boston je [razvilo Street Bump](https://www.boston.gov/transportation/street-bump), aplikacijo, ki je omogočila državljanom prijavo lukenj na cestah, kar je mestu zagotovilo boljše podatke o cestah za odpravljanje težav. Vendar pa [ljudje z nižjimi dohodki niso imeli enakega dostopa do avtomobilov in telefonov](https://hbr.org/2013/04/the-hidden-biases-in-big-data), zaradi česar so njihove težave s cestami ostale nevidne v tej aplikaciji. Razvijalci so sodelovali z akademiki, da bi obravnavali _vprašanja pravičnega dostopa in digitalnih vrzeli_. |
| **Pravičnost algoritmov** | 2018 - MIT [Gender Shades Study](http://gendershades.org/overview.html) je ocenila natančnost AI produktov za klasifikacijo spola in razkrila vrzeli v natančnosti za ženske in osebe temnejše polti. [Apple Card iz leta 2019](https://www.wired.com/story/the-apple-card-didnt-see-genderand-thats-the-problem/) je očitno ponujala manj kreditov ženskam kot moškim. Obe študiji sta pokazali težave pristranskosti algoritmov, ki vodijo do socio-ekonomskih škod.|
| **Pristranskost pri zbiranju podatkov** | 2013 - Mesto Boston je [razvilo Street Bump](https://www.boston.gov/transportation/street-bump), aplikacijo, ki je državljanom omogočila prijavo lukenj na cestah, kar je mestu zagotovilo boljše podatke o cestah za odpravljanje težav. Vendar pa [ljudje z nižjimi dohodki niso imeli enakega dostopa do avtomobilov in telefonov](https://hbr.org/2013/04/the-hidden-biases-in-big-data), zaradi česar so bile njihove težave na cestah nevidne v tej aplikaciji. Razvijalci so sodelovali z akademiki pri reševanju vprašanj _enakopravnega dostopa in digitalnih vrzeli_ za pravičnost. |
| **Pravičnost algoritmov** | 2018 - MIT [Gender Shades Study](http://gendershades.org/overview.html) je ocenila natančnost AI produktov za klasifikacijo spola, razkrivajoč vrzeli v natančnosti za ženske in osebe barve. [Apple Card iz leta 2019](https://www.wired.com/story/the-apple-card-didnt-see-genderand-thats-the-problem/) je očitno ponujala manj kreditov ženskam kot moškim. Obe študiji sta pokazali težave pristranskosti algoritmov, ki vodijo do socio-ekonomskih škod.|
| **Napačna predstavitev podatkov** | 2020 - [Oddelek za javno zdravje Georgie je objavil COVID-19 grafe](https://www.vox.com/covid-19-coronavirus-us-response-trump/2020/5/18/21262265/georgia-covid-19-cases-declining-reopening), ki so zavajali državljane glede trendov potrjenih primerov z ne-kronološkim razvrščanjem na x-osi. To ponazarja napačno predstavitev s triki vizualizacije. |
| **Iluzija svobodne izbire** | 2020 - Učna aplikacija [ABCmouse je plačala $10M za poravnavo pritožbe FTC](https://www.washingtonpost.com/business/2020/09/04/abcmouse-10-million-ftc-settlement/), kjer so starši ostali ujeti v plačevanje naročnin, ki jih niso mogli preklicati. To ponazarja temne vzorce v arhitekturah izbire, kjer so bili uporabniki usmerjeni k potencialno škodljivim odločitvam. |
| **Zasebnost podatkov in pravice uporabnikov** | 2021 - Facebook [kršitev podatkov](https://www.npr.org/2021/04/09/986005820/after-data-breach-exposes-530-million-facebook-says-it-will-not-notify-users) je razkrila podatke 530M uporabnikov, kar je privedlo do poravnave v višini $5B z FTC. Vendar pa ni obvestil uporabnikov o kršitvi, kar je kršilo pravice uporabnikov glede transparentnosti podatkov in dostopa. |
| **Iluzija svobodne izbire** | 2020 - Učna aplikacija [ABCmouse je plačala 10M za poravnavo pritožbe FTC](https://www.washingtonpost.com/business/2020/09/04/abcmouse-10-million-ftc-settlement/), kjer so bili starši ujeti v plačevanje naročnin, ki jih niso mogli preklicati. To ponazarja temne vzorce v arhitekturah izbire, kjer so bili uporabniki usmerjeni k potencialno škodljivim odločitvam. |
| **Zasebnost podatkov in pravice uporabnikov** | 2021 - Facebook [kršitev podatkov](https://www.npr.org/2021/04/09/986005820/after-data-breach-exposes-530-million-facebook-says-it-will-not-notify-users) je razkrila podatke 530M uporabnikov, kar je privedlo do poravnave v višini 5B z FTC. Vendar pa ni obvestil uporabnikov o kršitvi, kar je kršilo pravice uporabnikov glede transparentnosti podatkov in dostopa. |
Želite raziskati več študij primerov? Oglejte si te vire:
* [Ethics Unwrapped](https://ethicsunwrapped.utexas.edu/case-studies) - etične dileme v različnih industrijah.
* [Tečaj o etiki podatkovne znanosti](https://www.coursera.org/learn/data-science-ethics#syllabus) - obravnava ključne študije primerov.
* [Kje so stvari šle narobe](https://deon.drivendata.org/examples/) - kontrolni seznam Deon z zgledi.
* [Tečaj o etiki podatkovne znanosti](https://www.coursera.org/learn/data-science-ethics#syllabus) - raziskane ključne študije primerov.
* [Kje so stvari šle narobe](https://deon.drivendata.org/examples/) - kontrolni seznam Deon z primeri.
> 🚨 Razmislite o študijah primerov, ki ste jih videli - ali ste doživeli ali bili prizadeti zaradi podobnega etičnega izziva v svojem življenju? Ali lahko pomislite na vsaj eno drugo študijo primera, ki ponazarja enega od etičnih izzivov, o katerih smo razpravljali v tem razdelku?
## Uporabna etika
Govorili smo o konceptih etike, izzivih in študijah primerov v kontekstu resničnega sveta. Toda kako začeti _uporabljati_ etična načela in prakse v svojih projektih? In kako _operacionalizirati_ te prakse za boljše upravljanje? Raziščimo nekaj rešitev iz resničnega sveta:
Pogovarjali smo se o konceptih etike, izzivih in študijah primerov v kontekstih resničnega sveta. Toda kako začeti _uporabljati_ etična načela in prakse v svojih projektih? In kako _operacionalizirati_ te prakse za boljše upravljanje? Raziskujmo nekaj rešitev iz resničnega sveta:
### 1. Profesionalni kodeksi
Profesionalni kodeksi ponujajo eno možnost za organizacije, da "spodbujajo" člane k podpori njihovih etičnih načel in poslanstva. Kodeksi so _moralne smernice_ za profesionalno vedenje, ki pomagajo zaposlenim ali članom sprejemati odločitve, ki so skladne z načeli njihove organizacije. Njihova učinkovitost je odvisna od prostovoljne skladnosti članov; vendar pa mnoge organizacije ponujajo dodatne nagrade in kazni za motivacijo skladnosti.
Profesionalni kodeksi ponujajo eno možnost za organizacije, da "spodbujajo" člane k podpori njihovih etičnih načel in poslanstva. Kodeksi so _moralne smernice_ za profesionalno vedenje, ki pomagajo zaposlenim ali članom sprejemati odločitve, ki so skladne z načeli njihove organizacije. Njihova učinkovitost je odvisna od prostovoljne skladnosti članov; vendar pa mnoge organizacije ponujajo dodatne nagrade in kazni za motivacijo skladnosti članov.
Primeri vključujejo:
@ -204,52 +206,52 @@ Primeri vključujejo:
* [Data Science Association](http://datascienceassn.org/code-of-conduct.html) Kodeks ravnanja (ustvarjen leta 2013)
* [ACM Code of Ethics and Professional Conduct](https://www.acm.org/code-of-ethics) (od leta 1993)
> 🚨 Ali pripadate profesionalni inženirski ali podatkovno-znanstveni organizaciji? Raziščite njihovo spletno stran, da vidite, ali opredeljujejo profesionalni kodeks etike. Kaj to pove o njihovih etičnih načelih? Kako "spodbujajo" člane k upoštevanju kodeksa?
> 🚨 Ali pripadate profesionalni inženirski ali podatkovno-znanstveni organizaciji? Raziskujte njihovo spletno stran, da vidite, ali definirajo profesionalni kodeks etike. Kaj to pove o njihovih etičnih načelih? Kako "spodbujajo" člane k upoštevanju kodeksa?
### 2. Etični kontrolni seznami
Medtem ko profesionalni kodeksi opredeljujejo zahtevano _etično vedenje_ od praktikov, [imajo znane omejitve](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md) pri izvajanju, zlasti pri velikih projektih. Namesto tega mnogi strokovnjaki za podatkovno znanost [zagovarjajo kontrolne sezname](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md), ki lahko **povežejo načela s praksami** na bolj determinističen in izvedljiv način.
Medtem ko profesionalni kodeksi definirajo zahtevano _etično vedenje_ od praktikov, imajo [znane omejitve](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md) pri izvajanju, zlasti pri velikih projektih. Namesto tega mnogi strokovnjaki za podatkovno znanost [zagovarjajo kontrolne sezname](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md), ki lahko **povežejo načela s praksami** na bolj determinističen in izvedljiv način.
Kontrolni seznami pretvorijo vprašanja v "da/ne" naloge, ki jih je mogoče operacionalizirati, kar omogoča njihovo sledenje kot del standardnih delovnih tokov za izdajo izdelkov.
Primeri vključujejo:
* [Deon](https://deon.drivendata.org/) - splošni kontrolni seznam etike podatkov, ustvarjen iz [priporočil industrije](https://deon.drivendata.org/#checklist-citations) z orodjem ukazne vrstice za enostavno integracijo.
* [Kontrolni seznam za revizijo zasebnosti](https://cyber.harvard.edu/ecommerce/privacyaudit.html) - zagotavlja splošne smernice za prakse ravnanja z informacijami z vidika pravne in socialne izpostavljenosti.
* [Kontrolni seznam za pravičnost AI](https://www.microsoft.com/en-us/research/project/ai-fairness-checklist/) - ustvarjen s strani AI praktikov za podporo sprejetju in integraciji preverjanj pravičnosti v razvojne cikle AI.
* [Kontrolni seznam za revizijo zasebnosti](https://cyber.harvard.edu/ecommerce/privacyaudit.html) - zagotavlja splošne smernice za ravnanje z informacijami z vidika pravne in socialne izpostavljenosti.
* [Kontrolni seznam pravičnosti AI](https://www.microsoft.com/en-us/research/project/ai-fairness-checklist/) - ustvarjen s strani AI praktikov za podporo sprejemanju in integraciji preverjanj pravičnosti v razvojne cikle AI.
* [22 vprašanj za etiko v podatkih in AI](https://medium.com/the-organization/22-questions-for-ethics-in-data-and-ai-efb68fd19429) - bolj odprt okvir, strukturiran za začetno raziskovanje etičnih vprašanj v oblikovanju, izvajanju in organizacijskih kontekstih.
### 3. Etika in regulacije
Etika se ukvarja z opredeljevanjem skupnih vrednot in prostovoljnim delovanjem _pravilno_. **Skladnost** se nanaša na _upoštevanje zakonov_, če in kjer so opredeljeni. **Upravljanje** na splošno zajema vse načine, kako organizacije delujejo za uveljavljanje etičnih načel in skladnost z uveljavljenimi zakoni.
Etika je o definiranju skupnih vrednot in prostovoljnem ravnanju _pravilno_. **Skladnost** je o _upoštevanju zakonov_, če in kjer so opredeljeni. **Upravljanje** na splošno zajema vse načine, kako organizacije delujejo za uveljavljanje etičnih načel in skladnost z uveljavljenimi zakoni.
Danes upravljanje poteka v dveh oblikah znotraj organizacij. Prvič, gre za opredelitev **etičnih AI** načel in vzpostavitev praks za operacionalizacijo sprejetja v vseh projektih, povezanih z AI, v organizaciji. Drugič, gre za skladnost z vsemi vladno določenimi **regulacijami varstva podatkov** za regije, v katerih deluje.
Danes upravljanje poteka v dveh oblikah znotraj organizacij. Prvič, gre za definiranje **etičnih AI** načel in vzpostavitev praks za operacionalizacijo sprejemanja v vseh projektih, povezanih z AI, v organizaciji. Drugič, gre za skladnost z vsemi vladno določenimi **regulacijami zaščite podatkov** za regije, v katerih deluje.
Primeri regulacij varstva podatkov in zasebnosti:
Primeri regulacij zaščite podatkov in zasebnosti:
* `1974`, [Zakon o zasebnosti ZDA](https://www.justice.gov/opcl/privacy-act-1974) - ureja _zbiranje, uporabo in razkritje osebnih podatkov_ s strani zvezne vlade.
* `1996`, [Zakon o prenosljivosti in odgovornosti zdravstvenega zavarovanja ZDA (HIPAA)](https://www.cdc.gov/phlp/publications/topic/hipaa.html) - ščiti osebne zdravstvene podatke.
* `1998`, [Zakon o zasebnosti otrok na spletu ZDA (COPPA)](https://www.ftc.gov/enforcement/rules/rulemaking-regulatory-reform-proceedings/childrens-online-privacy-protection-rule) - ščiti zasebnost podatkov otrok, mlajših od 13 let.
* `2018`, [Splošna uredba o varstvu podatkov (GDPR)](https://gdpr-info.eu/) - zagotavlja pravice uporabnikov, varstvo podatkov in zasebnost.
* `2018`, [Splošna uredba o varstvu podatkov (GDPR)](https://gdpr-info.eu/) - zagotavlja pravice uporabnikov, zaščito podatkov in zasebnost.
* `2018`, [Kalifornijski zakon o zasebnosti potrošnikov (CCPA)](https://www.oag.ca.gov/privacy/ccpa) daje potrošnikom več _pravic_ nad njihovimi (osebnimi) podatki.
* `2021`, Kitajska [Zakon o varstvu osebnih podatkov](https://www.reuters.com/world/china/china-passes-new-personal-data-privacy-law-take-effect-nov-1-2021-08-20/) je bil pravkar sprejet, kar ustvarja eno najmočnejših regulacij zasebnosti podatkov na spletu na svetu.
* `2021`, Kitajska [Zakon o zaščiti osebnih podatkov](https://www.reuters.com/world/china/china-passes-new-personal-data-privacy-law-take-effect-nov-1-2021-08-20/) je pravkar sprejet, kar ustvarja eno najmočnejših regulacij zasebnosti podatkov na spletu na svetu.
> 🚨 Evropska unija je opredelila GDPR (Splošna uredba o varstvu podatkov), ki ostaja ena najbolj vplivnih regulacij zasebnosti podatkov danes. Ali ste vedeli, da opredeljuje tudi [8 pravic uporabnikov](https://www.freeprivacypolicy.com/blog/8-user-rights-gdpr) za zaščito digitalne zasebnosti in osebnih podatkov državljanov? Preberite, katere so te pravice in zakaj so pomembne.
> 🚨 Evropska unija je definirala GDPR (Splošna uredba o varstvu podatkov), ki ostaja ena najvplivnejših regulacij zasebnosti podatkov danes. Ali ste vedeli, da definira tudi [8 pravic uporabnikov](https://www.freeprivacypolicy.com/blog/8-user-rights-gdpr) za zaščito digitalne zasebnosti in osebnih podatkov državljanov? Naučite se, kaj so te pravice in zakaj so pomembne.
### 4. Kultura etike
Upoštevajte, da ostaja neotipljiva vrzel med _skladnostjo_ (narediti dovolj, da izpolnimo "črko zakona") in obravnavanjem [sistemskih vprašanj](https://www.coursera.org/learn/data-science-ethics/home/week/4) (kot so okostenelost, asimetrija informacij in distribucijska nepravičnost), ki lahko pospešijo orožitev AI.
Upoštevajte, da ostaja neoprijemljiva vrzel med _skladnostjo_ (narediti dovolj, da izpolnimo "črko zakona") in obravnavanjem [sistemskih vprašanj](https://www.coursera.org/learn/data-science-ethics/home/week/4) (kot so okostenelost, asimetrija informacij in distribucijska nepravičnost), ki lahko pospešijo orožitev AI.
Slednje zahteva [sodelovalne pristope k opredeljevanju kultur etike](https://towardsdatascience.com/why-ai-ethics-requires-a-culture-driven-approach-26f451afa29f), ki gradijo čustvene povezave in dosledne skupne vrednote _med organizacijami_ v industriji. To zahteva bolj [formalizirane kulture etike podatkov](https://www.codeforamerica.org/news/formalizing-an-ethical-data-culture/) v organizacijah - omogočanje _komurkoli_, da [potegne Andon vrv](https://en.wikipedia.org/wiki/Andon_(manufacturing)) (za zgodnje opozarjanje na etične pomisleke) in vključitev _etičnih ocen_ (npr. pri zaposlovanju) kot ključnega kriterija za oblikovanje ekip v AI projektih.
Za slednje so potrebni [sodelovalni pristopi k definiranju kultur etike](https://towardsdatascience.com/why-ai-ethics-requires-a-culture-driven-approach-26f451afa29f), ki gradijo čustvene povezave in dosledne skupne vrednote _med organizacijami_ v industriji. To zahteva bolj [formalizirane kulture etike podatkov](https://www.codeforamerica.org/news/formalizing-an-ethical-data-culture/) v organizacijah - omogočanje _komurkoli_, da [potegne Andon vrv](https://en.wikipedia.org/wiki/Andon_(manufacturing)) (za zgodnje opozarjanje na etične pomisleke) in postavljanje _etičnih ocen_ (npr. pri zaposlovanju) kot ključnega kriterija za oblikovanje ekip v AI projektih.
---
## [Kvizi po predavanju](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/3) 🎯
## Pregled in samostojno učenje
## [Kvizi po predavanju](https://ff-quizzes.netlify.app/en/ds/) 🎯
## Pregled in samostojno učenje
Tečaji in knjige pomagajo pri razumevanju osnovnih konceptov etike in izzivov, medtem ko študije primerov in orodja pomagajo pri uporabi etičnih praks v resničnem svetu. Tukaj je nekaj virov za začetek.
Tečaji in knjige pomagajo pri razumevanju osnovnih konceptov etike in izzivov, medtem ko študije primerov in orodja pomagajo pri uporabi etičnih praks v kontekstih resničnega sveta. Tukaj je nekaj virov za začetek.
* [Strojno učenje za začetnike](https://github.com/microsoft/ML-For-Beginners/blob/main/1-Introduction/3-fairness/README.md) - lekcija o pravičnosti, Microsoft.
* [Načela odgovorne umetne inteligence](https://docs.microsoft.com/en-us/learn/modules/responsible-ai-principles/) - brezplačna učna pot na Microsoft Learn.
* [Etika in podatkovna znanost](https://resources.oreilly.com/examples/0636920203964) - O'Reilly EBook (M. Loukides, H. Mason et. al)
* [Etika in podatkovna znanost](https://resources.oreilly.com/examples/0636920203964) - O'Reilly EBook (M. Loukides, H. Mason in drugi)
* [Etika podatkovne znanosti](https://www.coursera.org/learn/data-science-ethics#syllabus) - spletni tečaj Univerze v Michiganu.
* [Etika razkrita](https://ethicsunwrapped.utexas.edu/case-studies) - študije primerov Univerze v Teksasu.
@ -260,4 +262,4 @@ Tečaji in knjige pomagajo pri razumevanju osnovnih konceptov etike in izzivov,
---
**Omejitev odgovornosti**:
Ta dokument je bil preveden z uporabo storitve za strojno prevajanje [Co-op Translator](https://github.com/Azure/co-op-translator). Čeprav si prizadevamo za natančnost, vas prosimo, da upoštevate, da lahko avtomatizirani prevodi vsebujejo napake ali netočnosti. Izvirni dokument v njegovem maternem jeziku je treba obravnavati kot avtoritativni vir. Za ključne informacije priporočamo profesionalni človeški prevod. Ne prevzemamo odgovornosti za morebitne nesporazume ali napačne razlage, ki izhajajo iz uporabe tega prevoda.
Ta dokument je bil preveden z uporabo storitve za prevajanje z umetno inteligenco [Co-op Translator](https://github.com/Azure/co-op-translator). Čeprav si prizadevamo za natančnost, vas prosimo, da upoštevate, da lahko avtomatizirani prevodi vsebujejo napake ali netočnosti. Izvirni dokument v njegovem maternem jeziku je treba obravnavati kot avtoritativni vir. Za ključne informacije priporočamo profesionalni človeški prevod. Ne prevzemamo odgovornosti za morebitna nesporazume ali napačne razlage, ki bi nastale zaradi uporabe tega prevoda.

@ -1,8 +1,8 @@
<!--
CO_OP_TRANSLATOR_METADATA:
{
"original_hash": "8796f41f566a0a8ebb72863a83d558ed",
"translation_date": "2025-08-30T19:38:58+00:00",
"original_hash": "3a34157cc63516eba97c89a0b2f8c3e6",
"translation_date": "2025-09-03T21:52:07+00:00",
"source_file": "1-Introduction/02-ethics/README.md",
"language_code": "sr"
}
@ -17,15 +17,15 @@ CO_OP_TRANSLATOR_METADATA:
Сви смо ми грађани података који живе у свету заснованом на подацима.
Трендови на тржишту показују да ће до 2022. године једна од три велике организације куповати и продавати своје податке преко онлајн [тржишта и берзи](https://www.gartner.com/smarterwithgartner/gartner-top-10-trends-in-data-and-analytics-for-2020/). Као **развијачи апликација**, лакше и јефтиније ћемо интегрисати увиде засноване на подацима и аутоматизацију засновану на алгоритмима у свакодневна корисничка искуства. Али како вештачка интелигенција постаје све присутнија, мораћемо да разумемо потенцијалне штете које могу настати [употребом алгоритама као оружја](https://www.youtube.com/watch?v=TQHs8SA1qpk) у великом обиму.
Трендови на тржишту показују да ће до 2022. године једна од три велике организације куповати и продавати своје податке преко онлајн [тржишта и берзи](https://www.gartner.com/smarterwithgartner/gartner-top-10-trends-in-data-and-analytics-for-2020/). Као **развијачи апликација**, лакше ћемо и јефтиније интегрисати увиде засноване на подацима и аутоматизацију засновану на алгоритмима у свакодневна корисничка искуства. Али како вештачка интелигенција постаје све присутнија, мораћемо да разумемо потенцијалне штете које могу настати [употребом](https://www.youtube.com/watch?v=TQHs8SA1qpk) таквих алгоритама у великом обиму.
Трендови такође указују да ћемо до 2025. године креирати и конзумирати преко [180 зетабајта](https://www.statista.com/statistics/871513/worldwide-data-created/) података. Као **научници о подацима**, имаћемо невиђен ниво приступа личним подацима. То значи да можемо градити профиле понашања корисника и утицати на доношење одлука на начине који стварају [илузију слободног избора](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice), док потенцијално усмеравамо кориснике ка исходима који нам одговарају. Ово такође поставља шира питања о приватности података и заштити корисника.
Трендови такође указују да ћемо до 2025. године креирати и конзумирати преко [180 зетабајта](https://www.statista.com/statistics/871513/worldwide-data-created/) података. Као **научници о подацима**, то нам пружа невиђене нивое приступа личним подацима. То значи да можемо градити профиле понашања корисника и утицати на доношење одлука на начине који стварају [илузију слободног избора](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice), док потенцијално усмеравамо кориснике ка исходима који нам одговарају. Ово такође поставља шира питања о приватности података и заштити корисника.
Етика података сада представља еопходне заштитне мере_ за науку о подацима и инжењеринг, помажући нам да минимизирамо потенцијалне штете и нежељене последице наших акција заснованих на подацима. [Гартнеров циклус хипа за вештачку интелигенцију](https://www.gartner.com/smarterwithgartner/2-megatrends-dominate-the-gartner-hype-cycle-for-artificial-intelligence-2020/) идентификује релевантне трендове у дигиталној етици, одговорној вештачкој интелигенцији и управљању вештачком интелигенцијом као кључне покретаче већих мегатрендова око емократизације_ и _индустријализације_ вештачке интелигенције.
Етика података сада представља еопходне оквире_ за науку о подацима и инжењеринг, помажући нам да минимизирамо потенцијалне штете и нежељене последице наших акција заснованих на подацима. [Гартнеров циклус хипа за вештачку интелигенцију](https://www.gartner.com/smarterwithgartner/2-megatrends-dominate-the-gartner-hype-cycle-for-artificial-intelligence-2020/) идентификује релевантне трендове у дигиталној етици, одговорној вештачкој интелигенцији и управљању вештачком интелигенцијом као кључне покретаче већих мегатрендова око емократизације_ и _индустријализације_ вештачке интелигенције.
![Гартнеров циклус хипа за вештачку интелигенцију - 2020](https://images-cdn.newscred.com/Zz1mOWJhNzlkNDA2ZTMxMWViYjRiOGFiM2IyMjQ1YmMwZQ==)
У овом часу, истражићемо фасцинантну област етике података - од основних концепата и изазова, до студија случаја и примењених концепата вештачке интелигенције као што је управљање - који помажу у успостављању културе етике у тимовима и организацијама које раде са подацима и вештачком интелигенцијом.
У овом лекцији, истражићемо фасцинантну област етике података - од основних концепата и изазова, до студија случаја и примењених концепата вештачке интелигенције као што је управљање - који помажу у успостављању културе етике у тимовима и организацијама које раде са подацима и вештачком интелигенцијом.
## [Квиз пре предавања](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/2) 🎯
@ -37,7 +37,7 @@ CO_OP_TRANSLATOR_METADATA:
**Етика** се односи на заједничке вредности и моралне принципе који управљају нашим понашањем у друштву. Етика се не заснива на законима, већ на широко прихваћеним нормама о томе шта је "исправно наспрам погрешног". Међутим, етичка разматрања могу утицати на иницијативе корпоративног управљања и владине регулативе које стварају више подстицаја за усаглашеност.
**Етика података** је [нови огранак етике](https://royalsocietypublishing.org/doi/full/10.1098/rsta.2016.0360#sec-1) који "проучава и процењује моралне проблеме повезане са _подацима, алгоритмима и одговарајућим праксама_". Овде, **"подаци"** се фокусирају на акције везане за генерисање, снимање, курирање, обраду, ширење, дељење и употребу, **"алгоритми"** се фокусирају на вештачку интелигенцију, агенте, машинско учење и роботе, а **"праксе"** се фокусирају на теме као што су одговорна иновација, програмирање, хаковање и кодекси етике.
**Етика података** је [нова грана етике](https://royalsocietypublishing.org/doi/full/10.1098/rsta.2016.0360#sec-1) која "проучава и процењује моралне проблеме повезане са _подацима, алгоритмима и одговарајућим праксама_". Овде, **"подаци"** се фокусирају на акције везане за генерисање, снимање, курирање, обраду, ширење, дељење и употребу, **"алгоритми"** се фокусирају на вештачку интелигенцију, агенте, машинско учење и роботе, а **"праксе"** се фокусирају на теме као што су одговорна иновација, програмирање, хаковање и кодекси етике.
**Примењена етика** је [практична примена моралних разматрања](https://en.wikipedia.org/wiki/Applied_ethics). То је процес активног истраживања етичких питања у контексту _акција, производа и процеса у стварном свету_, и предузимање корективних мера како би се осигурало да они остану усклађени са нашим дефинисаним етичким вредностима.
@ -45,17 +45,17 @@ CO_OP_TRANSLATOR_METADATA:
## Концепти етике
У овом делу, разговараћемо о концептима као што су **заједничке вредности** (принципи) и **етички изазови** (проблеми) за етику података - и истражити **студије случаја** које вам помажу да разумете ове концепте у контекстима стварног света.
У овом одељку, разговараћемо о концептима као што су **заједничке вредности** (принципи) и **етички изазови** (проблеми) за етику података - и истражити **студије случаја** које вам помажу да разумете ове концепте у контекстима стварног света.
### 1. Принципи етике
Свака стратегија етике података почиње дефинисањем _етичких принципа_ - "заједничких вредности" које описују прихватљива понашања и воде усаглашене акције у нашим пројектима заснованим на подацима и вештачкој интелигенцији. Можете их дефинисати на индивидуалном или тимском нивоу. Међутим, већина великих организација их наводи у _мисији етичке вештачке интелигенције_ или оквиру који је дефинисан на корпоративном нивоу и доследно спроведен у свим тимовима.
**Пример:** Мисија [Одговорне вештачке интелигенције](https://www.microsoft.com/en-us/ai/responsible-ai) компаније Microsoft гласи: _"Посвећени смо напретку вештачке интелигенције вођене етичким принципима који стављају људе на прво место"_ - идентификујући 6 етичких принципа у оквиру испод:
**Пример:** Мисија [Одговорне вештачке интелигенције](https://www.microsoft.com/en-us/ai/responsible-ai) компаније Microsoft гласи: _"Посвећени смо унапређењу вештачке интелигенције вођене етичким принципима који стављају људе на прво место"_ - идентификујући 6 етичких принципа у оквиру испод:
![Одговорна вештачка интелигенција у Microsoft-у](https://docs.microsoft.com/en-gb/azure/cognitive-services/personalizer/media/ethics-and-responsible-use/ai-values-future-computed.png)
Хајде да укратко истражимо ове принципе. _Транспарентност_ и _одговорност_ су основне вредности на којима се граде остали принципи - па почнимо од њих:
Хајде да укратко истражимо ове принципе. _Транспарентност_ и _одговорност_ су основне вредности на којима се граде остали принципи - па почнимо одатле:
* [**Одговорност**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) чини практичаре _одговорним_ за њихове операције са подацима и вештачком интелигенцијом, као и за усаглашеност са овим етичким принципима.
* [**Транспарентност**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) осигурава да акције засноване на подацима и вештачкој интелигенцији буду _разумљиве_ (интерпретабилне) корисницима, објашњавајући шта и зашто стоји иза одлука.
@ -64,21 +64,21 @@ CO_OP_TRANSLATOR_METADATA:
* [**Приватност и безбедност**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - односи се на разумевање порекла података и пружање аштите приватности података_ корисницима.
* [**Инклузивност**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - односи се на дизајнирање решења заснованих на вештачкој интелигенцији са намером, прилагођавајући их да задовоље _широк спектар људских потреба_ и способности.
> 🚨 Размислите о томе шта би могла бити ваша мисија етике података. Истражите оквире етичке вештачке интелигенције других организација - овде су примери из [IBM](https://www.ibm.com/cloud/learn/ai-ethics), [Google](https://ai.google/principles), и [Facebook](https://ai.facebook.com/blog/facebooks-five-pillars-of-responsible-ai/). Које заједничке вредности имају? Како се ови принципи односе на производе засноване на вештачкој интелигенцији или индустрију у којој раде?
> 🚨 Размислите о томе шта би могла бити ваша мисија етике података. Истражите оквире етичке вештачке интелигенције других организација - овде су примери од [IBM](https://www.ibm.com/cloud/learn/ai-ethics), [Google](https://ai.google/principles), и [Facebook](https://ai.facebook.com/blog/facebooks-five-pillars-of-responsible-ai/). Које заједничке вредности имају? Како се ови принципи односе на производе засноване на вештачкој интелигенцији или индустрију у којој делују?
### 2. Етички изазови
Када дефинишемо етичке принципе, следећи корак је процена наших акција заснованих на подацима и вештачкој интелигенцији како бисмо видели да ли су у складу са тим заједничким вредностима. Размислите о својим акцијама у две категорије: _прикупљање података_ и _дизајн алгоритама_.
Код прикупљања података, акције ће вероватно укључивати **личне податке** или информације које могу идентификовати живе појединце. Ово укључује [разноврсне ставке неперсоналних података](https://ec.europa.eu/info/law/law-topic/data-protection/reform/what-personal-data_en) које аједно_ идентификују појединца. Етички изазови могу се односити на _приватност података_, _власништво над подацима_ и сродне теме као што су _информисани пристанак_ и _права интелектуалне својине_ корисника.
Код прикупљања података, акције ће вероватно укључивати **личне податке** или лично идентификационе информације (PII) за идентификоване живе особе. Ово укључује [разноврсне ставке неперсоналних података](https://ec.europa.eu/info/law/law-topic/data-protection/reform/what-personal-data_en) које аједно_ идентификују појединца. Етички изазови могу се односити на _приватност података_, _власништво над подацима_ и сродне теме као што су _информисани пристанак_ и _права интелектуалне својине_ за кориснике.
Код дизајна алгоритама, акције ће укључивати прикупљање и курирање **скупова података**, а затим њихово коришћење за обуку и примену **модела података** који предвиђају исходе или аутоматизују одлуке у стварним контекстима. Етички изазови могу настати из _пристраности у скупу података_, проблема са _квалитетом података_, еправедности_ и _погрешног представљања_ у алгоритмима - укључујући неке проблеме који су системске природе.
Код дизајна алгоритама, акције ће укључивати прикупљање и курирање **скупова података**, а затим њихово коришћење за тренирање и примену **модела података** који предвиђају исходе или аутоматизују одлуке у стварним контекстима. Етички изазови могу настати из _пристраности у скупу података_, проблема са _квалитетом података_, еправедности_ и _погрешног представљања_ у алгоритмима - укључујући неке проблеме који су системске природе.
У оба случаја, етички изазови истичу области где наше акције могу бити у сукобу са нашим заједничким вредностима. Да бисмо открили, ублажили, минимизирали или елиминисали ове проблеме, морамо постављати морална "да/не" питања у вези са нашим акцијама, а затим предузимати корективне мере по потреби. Хајде да погледамо неке етичке изазове и морална питања која они постављају:
#### 2.1 Власништво над подацима
Прикупљање података често укључује личне податке који могу идентификовати субјекте података. [Власништво над подацима](https://permission.io/blog/data-ownership) се односи на онтролу_ и [_права корисника_](https://permission.io/blog/data-ownership) у вези са креирањем, обрадом и ширењем података.
Прикупљање података често укључује личне податке који могу идентификовати субјекте података. [Власништво над подацима](https://permission.io/blog/data-ownership) односи се на онтролу_ и [_права корисника_](https://permission.io/blog/data-ownership) у вези са креирањем, обрадом и ширењем података.
Морална питања која треба поставити су:
* Ко поседује податке? (корисник или организација)
@ -90,13 +90,13 @@ CO_OP_TRANSLATOR_METADATA:
[Информисани пристанак](https://legaldictionary.net/informed-consent/) дефинише чин корисника који пристају на акцију (као што је прикупљање података) уз _потпуно разумевање_ релевантних чињеница, укључујући сврху, потенцијалне ризике и алтернативе.
Питања за истраживање овде су:
* Да ли је корисник (субјект података) дао дозволу за прикупљање и коришћење података?
* Да ли је корисник (субјект података) дао дозволу за прикупљање и употребу података?
* Да ли је корисник разумео сврху за коју су ти подаци прикупљени?
* Да ли је корисник разумео потенцијалне ризике од свог учешћа?
#### 2.3 Интелектуална својина
[Интелектуална својина](https://en.wikipedia.org/wiki/Intellectual_property) се односи на нематеријалне творевине настале људском иницијативом, које могу _имати економску вредност_ за појединце или предузећа.
[Интелектуална својина](https://en.wikipedia.org/wiki/Intellectual_property) односи се на нематеријалне креације које су резултат људске иницијативе и које могу _имати економску вредност_ за појединце или предузећа.
Питања за истраживање овде су:
* Да ли прикупљени подаци имају економску вредност за корисника или предузеће?
@ -106,64 +106,63 @@ CO_OP_TRANSLATOR_METADATA:
#### 2.4 Приватност података
[Приватност података](https://www.northeastern.edu/graduate/blog/what-is-data-privacy/) или информациона приватност односи се на очување приватности корисника и заштиту идентитета корисника у вези са лично идентификујућим информацијама.
[Приватност података](https://www.northeastern.edu/graduate/blog/what-is-data-privacy/) или информациона приватност односи се на очување приватности корисника и заштиту идентитета корисника у вези са лично идентификационим информацијама.
Питања за истраживање овде су:
* Да ли су лични подаци корисника заштићени од хаковања и цурења?
* Да ли су подаци корисника доступни само овлашћеним корисницима и контекстима?
* Да ли су кориснички (лични) подаци заштићени од хаковања и цурења?
* Да ли су кориснички подаци доступни само овлашћеним корисницима и контекстима?
* Да ли је анонимност корисника очувана када се подаци деле или шире?
* Може ли корисник бити деидентификован из анонимизованих скупова података?
* Може ли корисник бити деиденти
[Algorithm Fairness](https://towardsdatascience.com/what-is-algorithm-fairness-3182e161cf9f) проверава да ли дизајн алгоритма систематски дискриминише одређене подгрупе субјеката података, што доводи до [потенцијалних штета](https://docs.microsoft.com/en-us/azure/machine-learning/concept-fairness-ml) у _расподели_ (где се ресурси ускраћују или одбијају тој групи) и _квалитету услуге_ (где вештачка интелигенција није толико прецизна за неке подгрупе као за друге).
#### 2
[Algorithm Fairness](https://towardsdatascience.com/what-is-algorithm-fairness-3182e161cf9f) проверава да ли је дизајн алгоритма систематски дискриминаторски према одређеним подгрупама субјеката података, што доводи до [потенцијалних штета](https://docs.microsoft.com/en-us/azure/machine-learning/concept-fairness-ml) у _расподели_ (где се ресурси ускраћују или одбијају тој групи) и _квалитету услуге_ (где вештачка интелигенција није толико прецизна за неке подгрупе као за друге).
Питања за истраживање:
* Да ли смо проценили тачност модела за различите подгрупе и услове?
* Да ли смо детаљно испитали систем због потенцијалних штета (нпр. стереотипизација)?
* Можемо ли ревидирати податке или поново обучити моделе како бисмо ублажили идентификоване штете?
Питања за истраживање овде су:
* Да ли смо проценили тачност модела за различите подгрупе и услове?
* Да ли смо детаљно анализирали систем за потенцијалне штете (нпр. стереотипизацију)?
* Можемо ли ревидирати податке или поново обучити моделе како бисмо ублажили идентификоване штете?
Истражите ресурсе као што су [AI Fairness checklists](https://query.prod.cms.rt.microsoft.com/cms/api/am/binary/RE4t6dA) да бисте сазнали више.
Истражите ресурсе као што су [AI Fairness checklists](https://query.prod.cms.rt.microsoft.com/cms/api/am/binary/RE4t6dA) за више информација.
#### 2.9 Погрешно представљање
[Data Misrepresentation](https://www.sciencedirect.com/topics/computer-science/misrepresentation) се односи на питање да ли комуницирамо увиде из искрено пријављених података на обмањујући начин како бисмо подржали жељени наратив.
[Погрешно представљање података](https://www.sciencedirect.com/topics/computer-science/misrepresentation) подразумева питање да ли комуницирамо увиде из искрено пријављених података на обмањујући начин како бисмо подржали жељени наратив.
Питања за истраживање овде су:
* Да ли пријављујемо непотпуне или нетачне податке?
* Да ли визуализујемо податке на начин који води до погрешних закључака?
* Да ли користимо селективне статистичке технике за манипулацију резултатима?
* Да ли постоје алтернативна објашњења која могу понудити другачији закључак?
Питања за истраживање:
* Да ли пријављујемо непотпуне или нетачне податке?
* Да ли визуализујемо податке на начин који води до погрешних закључака?
* Да ли користимо селективне статистичке технике за манипулацију резултатима?
* Да ли постоје алтернативна објашњења која могу понудити другачији закључак?
#### 2.10 Слободан избор
[Илузија слободног избора](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice) се јавља када системске "архитектуре избора" користе алгоритме за доношење одлука како би усмериле људе ка жељеном исходу, док им истовремено дају привид опција и контроле. Ови [dark patterns](https://www.darkpatterns.org/) могу изазвати социјалну и економску штету корисницима. Пошто одлуке корисника утичу на профиле понашања, ове акције потенцијално покрећу будуће изборе који могу појачати или продужити утицај ових штета.
Питања за истраживање овде су:
* Да ли је корисник разумео импликације доношења тог избора?
* Да ли је корисник био свестан (алтернативних) избора и предности и недостатака сваког?
* Може ли корисник касније поништити аутоматизован или утицајем изазван избор?
[Илузија слободног избора](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice) се јавља када системске "архитектуре избора" користе алгоритме за доношење одлука како би подстакле људе да донесу пожељан исход, док им се истовремено чини да имају опције и контролу. Ови [мрачни обрасци](https://www.darkpatterns.org/) могу изазвати социјалну и економску штету корисницима. Пошто одлуке корисника утичу на профиле понашања, ове акције потенцијално покрећу будуће изборе који могу појачати или продужити утицај ових штета.
Питања за истраживање:
* Да ли је корисник разумео импликације доношења тог избора?
* Да ли је корисник био свестан (алтернативних) избора и предности и недостатака сваког?
* Може ли корисник касније поништити аутоматизован или утицајем изазван избор?
### 3. Студије случаја
Да бисмо поставили ове етичке изазове у контекст стварног света, корисно је погледати студије случаја које истичу потенцијалне штете и последице за појединце и друштво када се занемарују кршења етике.
Да бисмо поставили ове етичке изазове у контекст стварног света, корисно је погледати студије случаја које истичу потенцијалне штете и последице за појединце и друштво када се кршење етике занемарује.
Ево неколико примера:
| Етички изазов | Студија случаја |
| Етички изазов | Студија случаја |
|--- |--- |
| **Информисани пристанак** | 1972 - [Tuskegee Syphilis Study](https://en.wikipedia.org/wiki/Tuskegee_Syphilis_Study) - Афроамериканци који су учествовали у студији обећана је бесплатна медицинска нега _али су обманути_ од стране истраживача који нису обавестили субјекте о њиховој дијагнози или доступности лечења. Многи субјекти су умрли, а партнери или деца су били погођени; студија је трајала 40 година. |
| **Приватност података** | 2007 - [Netflix data prize](https://www.wired.com/2007/12/why-anonymous-data-sometimes-isnt/) је истраживачима пружио _10 милиона анонимизованих оцена филмова од 50 хиљада корисника_ како би побољшали алгоритме препорука. Међутим, истраживачи су успели да повежу анонимизоване податке са лично идентификованим подацима у _спољним скуповима података_ (нпр. IMDb коментари) - ефективно "деанонимизујући" неке Netflix претплатнике.|
| **Прикупљање пристрасних података** | 2013 - Град Бостон [развио Street Bump](https://www.boston.gov/transportation/street-bump), апликацију која је омогућила грађанима да пријаве рупе на путу, пружајући граду боље податке о путевима за проналажење и поправку проблема. Међутим, [људи из група са нижим приходима имали су мањи приступ аутомобилима и телефонима](https://hbr.org/2013/04/the-hidden-biases-in-big-data), чинећи њихове проблеме на путевима невидљивим у овој апликацији. Програмери су сарађивали са академицима на решавању _питања праведног приступа и дигиталних подела_. |
| **Праведност алгоритма** | 2018 - MIT [Gender Shades Study](http://gendershades.org/overview.html) је проценио тачност AI производа за класификацију пола, откривајући недостатке у тачности за жене и особе боје коже. [Apple Card из 2019](https://www.wired.com/story/the-apple-card-didnt-see-genderand-thats-the-problem/) је изгледа нудио мање кредита женама него мушкарцима. Оба случаја илуструју проблеме пристрасности алгоритма који доводе до социо-економских штета.|
| **Погрешно представљање података** | 2020 - [Georgia Department of Public Health released COVID-19 charts](https://www.vox.com/covid-19-coronavirus-us-response-trump/2020/5/18/21262265/georgia-covid-19-cases-declining-reopening) који су изгледали као да обмањују грађане о трендовима у потврђеним случајевима са нехронолошким редоследом на x-оси. Ово илуструје погрешно представљање кроз трикове визуализације. |
| **Илузија слободног избора** | 2020 - Апликација за учење [ABCmouse платила $10M да реши жалбу FTC](https://www.washingtonpost.com/business/2020/09/04/abcmouse-10-million-ftc-settlement/) где су родитељи били приморани да плаћају претплате које нису могли да откажу. Ово илуструје dark patterns у архитектури избора, где су корисници били усмерени ка потенцијално штетним изборима. |
| **Приватност података и права корисника** | 2021 - Facebook [Data Breach](https://www.npr.org/2021/04/09/986005820/after-data-breach-exposes-530-million-facebook-says-it-will-not-notify-users) је открио податке 530 милиона корисника, што је резултирало нагодбом од $5 милијарди са FTC. Међутим, компанија је одбила да обавести кориснике о кршењу, кршећи права корисника у вези са транспарентношћу и приступом подацима. |
| **Информисани пристанак** | 1972 - [Тускеги студија о сифилису](https://en.wikipedia.org/wiki/Tuskegee_Syphilis_Study) - Афроамериканци који су учествовали у студији обећана је бесплатна медицинска нега, _али су истраживачи обманули_ учеснике, не обавестивши их о дијагнози или доступности лечења. Многи учесници су умрли, а партнери или деца су били погођени; студија је трајала 40 година. |
| **Приватност података** | 2007 - [Netflix награда за податке](https://www.wired.com/2007/12/why-anonymous-data-sometimes-isnt/) истраживачима је пружила _10 милиона анонимних оцена филмова од 50 хиљада корисника_ како би побољшали алгоритме препорука. Међутим, истраживачи су успели да повежу анонимне податке са лично идентификационим подацима у _спољним скуповима података_ (нпр. IMDb коментари), ефективно "деанонимизујући" неке Netflix претплатнике. |
| **Прикупљање пристрасних података** | 2013 - Град Бостон [развио Street Bump](https://www.boston.gov/transportation/street-bump), апликацију која је омогућила грађанима да пријаве рупе на путу, пружајући граду боље податке о путевима за решавање проблема. Међутим, [људи из група са нижим приходима имали су мањи приступ аутомобилима и телефонима](https://hbr.org/2013/04/the-hidden-biases-in-big-data), чинећи њихове проблеме на путевима невидљивим у овој апликацији. Програмери су сарађивали са академицима на решавању питања _праведног приступа и дигиталних подела_. |
| **Праведност алгоритма** | 2018 - MIT [Gender Shades Study](http://gendershades.org/overview.html) проценио је тачност AI производа за класификацију пола, откривајући недостатке у тачности за жене и особе тамније боје коже. [Apple Card из 2019](https://www.wired.com/story/the-apple-card-didnt-see-genderand-thats-the-problem/) је изгледа нудила мање кредита женама него мушкарцима. Оба случаја илуструју проблеме пристрасности алгоритма који доводе до социо-економских штета. |
| **Погрешно представљање података** | 2020 - [Одељење за јавно здравље Џорџије објавило је графиконе о COVID-19](https://www.vox.com/covid-19-coronavirus-us-response-trump/2020/5/18/21262265/georgia-covid-19-cases-declining-reopening) који су изгледали као да обмањују грађане о трендовима потврђених случајева са нехронолошким редоследом на x-оси. Ово илуструје погрешно представљање кроз трикове визуализације. |
| **Илузија слободног избора** | 2020 - Апликација за учење [ABCmouse платила је $10M за решавање жалбе FTC-а](https://www.washingtonpost.com/business/2020/09/04/abcmouse-10-million-ftc-settlement/) где су родитељи били приморани да плаћају претплате које нису могли отказати. Ово илуструје мрачне обрасце у архитектури избора, где су корисници били подстакнути на потенцијално штетне изборе. |
| **Приватност података и права корисника** | 2021 - Facebook [Цурење података](https://www.npr.org/2021/04/09/986005820/after-data-breach-exposes-530-million-facebook-says-it-will-not-notify-users) открило је податке 530 милиона корисника, што је резултирало нагодбом од $5 милијарди са FTC-ом. Међутим, Facebook је одбио да обавести кориснике о цурењу, кршећи права корисника у вези са транспарентношћу и приступом подацима. |
Желите да истражите више студија случаја? Погледајте ове ресурсе:
* [Ethics Unwrapped](https://ethicsunwrapped.utexas.edu/case-studies) - етичке дилеме у различитим индустријама.
* [Data Science Ethics course](https://www.coursera.org/learn/data-science-ethics#syllabus) - истражене значајне студије случаја.
* [Where things have gone wrong](https://deon.drivendata.org/examples/) - Deon чеклиста са примерима.
* [Ethics Unwrapped](https://ethicsunwrapped.utexas.edu/case-studies) - етичке дилеме у различитим индустријама.
* [Курс о етици у науци о подацима](https://www.coursera.org/learn/data-science-ethics#syllabus) - истраживање значајних студија случаја.
* [Где су ствари пошле наопако](https://deon.drivendata.org/examples/) - Deon чеклиста са примерима.
> 🚨 Размислите о студијама случаја које сте видели - да ли сте доживели или били погођени сличним етичким изазовом у свом животу? Можете ли се сетити барем једне друге студије случаја која илуструје један од етичких изазова које смо овде разматрали?
> 🚨 Размислите о студијама случаја које сте видели - да ли сте доживели или били погођени сличним етичким изазовом у свом животу? Можете ли се сетити бар једне друге студије случаја која илуструје један од етичких изазова које смо овде разматрали?
## Примењена етика
@ -171,13 +170,12 @@ CO_OP_TRANSLATOR_METADATA:
### 1. Професионални кодекси
Професионални кодекси нуде једну опцију за организације да "подстакну" чланове да подрже своје етичке принципе и мисију. Кодекси су оралне смернице_ за професионално понашање, помажући запосленима или члановима да доносе одлуке које су у складу са принципима њихове организације. Они су добри онолико колико је добра добровољна усаглашеност чланова; међутим, многе организације нуде додатне награде и казне како би мотивисале чланове да се придржавају кодекса.
Професионални кодекси нуде једну опцију за организације да "подстакну" чланове да подрже њихове етичке принципе и мисију. Кодекси су оралне смернице_ за професионално понашање, помажући запосленима или члановима да доносе одлуке које су у складу са принципима њихове организације. Они су добри онолико колико је добра добровољна усаглашеност чланова; међутим, многе организације нуде додатне награде и казне како би мотивисале чланове на усаглашеност.
Примери укључују:
* [Oxford Munich](http://www.code-of-ethics.org/code-of-conduct/) Кодекс етике
* [Data Science Association](http://datascienceassn.org/code-of-conduct.html) Кодекс понашања (креиран 2013)
* [ACM Code of Ethics and Professional Conduct](https://www.acm.org/code-of-ethics) (од 1993)
* [Oxford Munich](http://www.code-of-ethics.org/code-of-conduct/) Кодекс етике
* [Data Science Association](http://datascienceassn.org/code-of-conduct.html) Кодекс понашања (креиран 2013)
* [ACM Code of Ethics and Professional Conduct](https://www.acm.org/code-of-ethics) (од 1993)
> 🚨 Да ли припадате професионалној организацији за инжењеринг или науку о подацима? Истражите њихов сајт да видите да ли дефинишу професионални кодекс етике. Шта то говори о њиховим етичким принципима? Како "подстичу" чланове да следе кодекс?
@ -188,35 +186,34 @@ CO_OP_TRANSLATOR_METADATA:
Чеклисте претварају питања у "да/не" задатке који се могу операционализовати, омогућавајући њихово праћење као део стандардних радних токова за пуштање производа.
Примери укључују:
* [Deon](https://deon.drivendata.org/) - општа чеклиста за етику података креирана из [препорука индустрије](https://deon.drivendata.org/#checklist-citations) са алатом командне линије за лаку интеграцију.
* [Privacy Audit Checklist](https://cyber.harvard.edu/ecommerce/privacyaudit.html) - пружа опште смернице за праксе руковања информацијама из правних и социјалних перспектива.
* [AI Fairness Checklist](https://www.microsoft.com/en-us/research/project/ai-fairness-checklist/) - креирана од стране AI практичара за подршку усвајању и интеграцији провера праведности у циклусе развоја AI.
* [22 questions for ethics in data and AI](https://medium.com/the-organization/22-questions-for-ethics-in-data-and-ai-efb68fd19429) - отворенији оквир, структуриран за почетно истраживање етичких питања у дизајну, имплементацији и организационим контекстима.
* [Deon](https://deon.drivendata.org/) - општа чеклиста за етику података креирана из [препорука индустрије](https://deon.drivendata.org/#checklist-citations) са алатом командне линије за лаку интеграцију.
* [Privacy Audit Checklist](https://cyber.harvard.edu/ecommerce/privacyaudit.html) - пружа опште смернице за праксе руковања информацијама из правних и социјалних перспектива.
* [AI Fairness Checklist](https://www.microsoft.com/en-us/research/project/ai-fairness-checklist/) - креирана од стране AI практичара за подршку усвајању и интеграцији провера праведности у циклусе развоја AI.
* [22 питања за етику у подацима и AI](https://medium.com/the-organization/22-questions-for-ethics-in-data-and-ai-efb68fd19429) - отворенији оквир, структуриран за почетно истраживање етичких питања у дизајну, имплементацији и организационим контекстима.
### 3. Етички прописи
Етика се односи на дефинисање заједничких вредности и добровољно чинињење исправних ствари. **Усклађеност** се односи на _поштовање закона_ ако и где је дефинисан. **Управљање** у ширем смислу обухвата све начине на које организације делују како би спровеле етичке принципе и поштовале утврђене законе.
Етика се односи на дефинисање заједничких вредности и добровољно чинињење исправних ствари. **Усаглашеност** се односи на _поштовање закона_ ако и где је дефинисан. **Управљање** у ширем смислу обухвата све начине на које организације раде на спровођењу етичких принципа и усаглашавању са утврђеним законима.
Данас управљање има два облика унутар организација. Прво, ради се о дефинисању **етичких AI** принципа и успостављању пракси за операционализацију усвајања у свим AI пројектима у организацији. Друго, ради се о усклађивању са свим владиним прописима о **заштити података** за регионе у којима послује.
Данас управљање има два облика унутар организација. Прво, ради се о дефинисању принципа **етичке AI** и успостављању пракси за операционализацију усвајања у свим пројектима везаним за AI у организацији. Друго, ради се о усаглашавању са свим владиним прописима о **заштити података** за регионе у којима послује.
Примери прописа о заштити података и приватности:
* `1974`, [US Privacy Act](https://www.justice.gov/opcl/privacy-act-1974) - регулише едералну владу_ у прикупљању, коришћењу и откривању личних информација.
* `1996`, [US Health Insurance Portability & Accountability Act (HIPAA)](https://www.cdc.gov/phlp/publications/topic/hipaa.html) - штити личне здравствене податке.
* `1998`, [US Children's Online Privacy Protection Act (COPPA)](https://www.ftc.gov/enforcement/rules/rulemaking-regulatory-reform-proceedings/childrens-online-privacy-protection-rule) - штити приватност података деце млађе од 13 година.
* `2018`, [General Data Protection Regulation (GDPR)](https://gdpr-info.eu/) - пружа права корисника, заштиту података и приватност.
* `2018`, [California Consumer Privacy Act (CCPA)](https://www.oag.ca.gov/privacy/ccpa) даје потрошачима више _права_ над њиховим (личним) подацима.
* `2021`, Кина [Закон о заштити личних података](https://www.reuters.com/world/china/china-passes-new-personal-data-privacy-law-take-effect-nov-1-2021-08-20/) управо усвојен, стварајући један од најјачих прописа о приватности података на мрежи у свету.
* `1974`, [US Privacy Act](https://www.justice.gov/opcl/privacy-act-1974) - регулише едералну владу_ у прикупљању, коришћењу и откривању личних информација.
* `1996`, [US Health Insurance Portability & Accountability Act (HIPAA)](https://www.cdc.gov/phlp/publications/topic/hipaa.html) - штити личне здравствене податке.
* `1998`, [US Children's Online Privacy Protection Act (COPPA)](https://www.ftc.gov/enforcement/rules/rulemaking-regulatory-reform-proceedings/childrens-online-privacy-protection-rule) - штити приватност података деце млађе од 13 година.
* `2018`, [General Data Protection Regulation (GDPR)](https://gdpr-info.eu/) - пружа права корисника, заштиту података и приватност.
* `2018`, [California Consumer Privacy Act (CCPA)](https://www.oag.ca.gov/privacy/ccpa) даје потрошачима више _права_ над њиховим (личним) подацима.
* `2021`, Кина [Personal Information Protection Law](https://www.reuters.com/world/china/china-passes-new-personal-data-privacy-law-take-effect-nov-1-2021-08-20/) је управо усвојила, стварајући један од најјачих прописа о приватности података на мрежи у свету.
> 🚨 Европска унија је дефинисала GDPR (General Data Protection Regulation), који остаје један од најзначајнијих прописа о приватности података данас. Да ли сте знали да он такође дефинише [8 права корисника](https://www.freeprivacypolicy.com/blog/8-user-rights-gdpr) за заштиту дигиталне приватности и личних података грађана? Сазнајте која су то права и зашто су важна.
> 🚨 Европска унија је дефинисала GDPR (Општа уредба о заштити података), која остаје један од најутицајнијих прописа о приватности података данас. Да ли сте знали да такође дефинише [8 права корисника](https://www.freeprivacypolicy.com/blog/8-user-rights-gdpr) за заштиту дигиталне приватности и личних података грађана? Сазнајте која су то права и зашто су важна.
### 4. Култура етике
Имајте на уму да постоји нематеријални јаз између _усклађености_ (чинињења довољно да се испуни "слово закона") и решавања [системских проблема](https://www.coursera.org/learn/data-science-ethics/home/week/4) (као што су осификација, асиметрија информација и неправедна расподела) који могу убрзати злоупотребу AI.
Имајте на уму да постоји нематеријални јаз између _усаглашености_ (чинињења довољно да се испуни "слово закона") и решавања [системских проблема](https://www.coursera.org/learn/data-science-ethics/home/week/4) (као што су осификација, асиметрија информација и неправедна расподела) који могу убрзати злоупотребу AI.
Ово друго захтева [колаборативне приступе дефинисању култура етике](https://towardsdatascience.com/why-ai-ethics-requires-a-culture-driven-approach-26f451afa29f) који граде емоционалне везе и доследне заједничке вредности _широм организација_ у индустрији. Ово позива на више [формализованих култура етике података](https://www.codeforamerica.org/news/formalizing-an-ethical-data-culture/) у организацијама - омогућавајући _било коме_ да [повуче Андон конопац](https://
* [Принципи одговорне вештачке интелигенције](https://docs.microsoft.com/en-us/learn/modules/responsible-ai-principles/) - бесплатан курс на Microsoft Learn.
* [Етика и наука о подацима](https://resources.oreilly.com/examples/0636920203964) - O'Reilly Е-књига (М. Лукидес, Х. Мејсон и др.)
Ово друго захтева [колаборативне приступе дефинисању култура етике](https://towardsdatascience.com/why-ai-ethics-requires-a-culture-driven-approach-26f451afa29f) који граде емоционалне везе и доследне заједничке вредности _широм организација_ у индустрији. Ово позива на више [формализованих култура ети
* [Принципи одговорне вештачке интелигенције](https://docs.microsoft.com/en-us/learn/modules/responsible-ai-principles/) - бесплатан курс на Microsoft Learn платформи.
* [Етика и наука о подацима](https://resources.oreilly.com/examples/0636920203964) - O'Reilly електронска књига (М. Лукидес, Х. Мејсон и др.)
* [Етика у науци о подацима](https://www.coursera.org/learn/data-science-ethics#syllabus) - онлајн курс са Универзитета у Мичигену.
* [Етика без маске](https://ethicsunwrapped.utexas.edu/case-studies) - студије случаја са Универзитета у Тексасу.
@ -227,4 +224,4 @@ CO_OP_TRANSLATOR_METADATA:
---
**Одрицање од одговорности**:
Овај документ је преведен коришћењем услуге за превођење помоћу вештачке интелигенције [Co-op Translator](https://github.com/Azure/co-op-translator). Иако се трудимо да обезбедимо тачност, молимо вас да имате у виду да аутоматски преводи могу садржати грешке или нетачности. Оригинални документ на његовом изворном језику треба сматрати ауторитативним извором. За критичне информације препоручује се професионални превод од стране људи. Не сносимо одговорност за било каква погрешна тумачења или неспоразуме који могу произаћи из коришћења овог превода.
Овај документ је преведен коришћењем услуге за превођење помоћу вештачке интелигенције [Co-op Translator](https://github.com/Azure/co-op-translator). Иако се трудимо да обезбедимо тачност, молимо вас да имате у виду да аутоматски преводи могу садржати грешке или нетачности. Оригинални документ на његовом изворном језику треба сматрати меродавним извором. За критичне информације препоручује се професионални превод од стране људи. Не преузимамо одговорност за било каква погрешна тумачења или неспоразуме који могу настати услед коришћења овог превода.

@ -1,8 +1,8 @@
<!--
CO_OP_TRANSLATOR_METADATA:
{
"original_hash": "8796f41f566a0a8ebb72863a83d558ed",
"translation_date": "2025-08-26T21:20:55+00:00",
"original_hash": "3a34157cc63516eba97c89a0b2f8c3e6",
"translation_date": "2025-09-03T21:27:44+00:00",
"source_file": "1-Introduction/02-ethics/README.md",
"language_code": "sv"
}
@ -17,17 +17,17 @@ CO_OP_TRANSLATOR_METADATA:
Vi är alla datamedborgare som lever i en datadriven värld.
Marknadstrender visar att år 2022 kommer 1 av 3 stora organisationer att köpa och sälja sin data via online-[marknadsplatser och börser](https://www.gartner.com/smarterwithgartner/gartner-top-10-trends-in-data-and-analytics-for-2020/). Som **apputvecklare** kommer vi att upptäcka att det blir enklare och billigare att integrera datadrivna insikter och algoritmstyrd automation i dagliga användarupplevelser. Men när AI blir alltmer utbrett måste vi också förstå de potentiella skador som kan orsakas av [vapenisering](https://www.youtube.com/watch?v=TQHs8SA1qpk) av sådana algoritmer i stor skala.
Marknadstrender visar att år 2022 kommer 1 av 3 stora organisationer att köpa och sälja sin data via online [marknadsplatser och utbyten](https://www.gartner.com/smarterwithgartner/gartner-top-10-trends-in-data-and-analytics-for-2020/). Som **apputvecklare** kommer vi att upptäcka att det blir enklare och billigare att integrera datadrivna insikter och algoritmbaserad automatisering i dagliga användarupplevelser. Men när AI blir alltmer utbrett måste vi också förstå de potentiella skador som kan orsakas av [vapenisering](https://www.youtube.com/watch?v=TQHs8SA1qpk) av sådana algoritmer i stor skala.
Trender visar också att vi kommer att skapa och konsumera över [180 zettabyte](https://www.statista.com/statistics/871513/worldwide-data-created/) data år 2025. Som **dataforskare** ger detta oss enastående tillgång till personlig data. Det innebär att vi kan bygga beteendeprofiler av användare och påverka beslutsfattande på sätt som skapar en [illusion av fritt val](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice), samtidigt som vi potentiellt styr användare mot resultat vi föredrar. Detta väcker också bredare frågor om dataintegritet och användarskydd.
Trender visar också att vi kommer att skapa och konsumera över [180 zettabyte](https://www.statista.com/statistics/871513/worldwide-data-created/) data år 2025. Som **dataforskare** ger detta oss enastående tillgång till personlig data. Det innebär att vi kan bygga beteendeprofiler av användare och påverka beslutsfattande på sätt som skapar en [illusion av fri vilja](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice) samtidigt som vi potentiellt styr användare mot resultat vi föredrar. Det väcker också bredare frågor om datasekretess och användarskydd.
Dataetik är nu _nödvändiga skyddsräcken_ för data science och ingenjörskonst, som hjälper oss att minimera potentiella skador och oavsiktliga konsekvenser av våra datadrivna handlingar. [Gartner Hype Cycle för AI](https://www.gartner.com/smarterwithgartner/2-megatrends-dominate-the-gartner-hype-cycle-for-artificial-intelligence-2020/) identifierar relevanta trender inom digital etik, ansvarsfull AI och AI-styrning som nyckeldrivkrafter för större megatrender kring _demokratisering_ och _industrialisering_ av AI.
Dataetik är nu _nödvändiga skyddsräcken_ för dataforskning och ingenjörskonst, som hjälper oss att minimera potentiella skador och oavsiktliga konsekvenser av våra datadrivna handlingar. [Gartners Hype Cycle för AI](https://www.gartner.com/smarterwithgartner/2-megatrends-dominate-the-gartner-hype-cycle-for-artificial-intelligence-2020/) identifierar relevanta trender inom digital etik, ansvarsfull AI och AI-styrning som nyckeldrivkrafter för större megatrender kring _demokratisering_ och _industrialisering_ av AI.
![Gartner's Hype Cycle för AI - 2020](https://images-cdn.newscred.com/Zz1mOWJhNzlkNDA2ZTMxMWViYjRiOGFiM2IyMjQ1YmMwZQ==)
![Gartners Hype Cycle för AI - 2020](https://images-cdn.newscred.com/Zz1mOWJhNzlkNDA2ZTMxMWViYjRiOGFiM2IyMjQ1YmMwZQ==)
I denna lektion kommer vi att utforska det fascinerande området dataetik - från grundläggande koncept och utmaningar till fallstudier och tillämpade AI-koncept som styrning - som hjälper till att etablera en etikkultur i team och organisationer som arbetar med data och AI.
I denna lektion kommer vi att utforska det fascinerande området dataetik - från grundläggande begrepp och utmaningar till fallstudier och tillämpade AI-koncept som styrning - som hjälper till att etablera en etisk kultur i team och organisationer som arbetar med data och AI.
## [Förtest innan föreläsning](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/2) 🎯
## [Quiz före föreläsningen](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/2) 🎯
## Grundläggande Definitioner
@ -35,55 +35,55 @@ Låt oss börja med att förstå den grundläggande terminologin.
Ordet "etik" kommer från det [grekiska ordet "ethikos"](https://en.wikipedia.org/wiki/Ethics) (och dess rot "ethos") som betyder _karaktär eller moralisk natur_.
**Etik** handlar om de gemensamma värderingar och moraliska principer som styr vårt beteende i samhället. Etik baseras inte på lagar utan på allmänt accepterade normer för vad som är "rätt kontra fel". Etiska överväganden kan dock påverka företagsstyrningsinitiativ och regeringsregleringar som skapar fler incitament för efterlevnad.
**Etik** handlar om de gemensamma värderingar och moraliska principer som styr vårt beteende i samhället. Etik baseras inte på lagar utan på allmänt accepterade normer för vad som är "rätt kontra fel". Etiska överväganden kan dock påverka företagsstyrningsinitiativ och statliga regleringar som skapar fler incitament för efterlevnad.
**Dataetik** är en [ny gren av etiken](https://royalsocietypublishing.org/doi/full/10.1098/rsta.2016.0360#sec-1) som "studerar och utvärderar moraliska problem relaterade till _data, algoritmer och motsvarande praxis_". Här fokuserar **"data"** på åtgärder relaterade till generering, registrering, kurering, bearbetning, spridning, delning och användning, **"algoritmer"** fokuserar på AI, agenter, maskininlärning och robotar, och **"praxis"** fokuserar på ämnen som ansvarsfull innovation, programmering, hacking och etiska koder.
**Dataetik** är en [ny gren av etiken](https://royalsocietypublishing.org/doi/full/10.1098/rsta.2016.0360#sec-1) som "studerar och utvärderar moraliska problem relaterade till _data, algoritmer och motsvarande praxis_". Här fokuserar **"data"** på handlingar relaterade till generering, registrering, kurering, bearbetning, spridning, delning och användning, **"algoritmer"** fokuserar på AI, agenter, maskininlärning och robotar, och **"praxis"** fokuserar på ämnen som ansvarsfull innovation, programmering, hacking och etiska koder.
**Tillämpad etik** är den [praktiska tillämpningen av moraliska överväganden](https://en.wikipedia.org/wiki/Applied_ethics). Det är processen att aktivt undersöka etiska frågor i sammanhanget av _verkliga handlingar, produkter och processer_ och vidta korrigerande åtgärder för att säkerställa att dessa förblir i linje med våra definierade etiska värderingar.
**Tillämpad etik** är den [praktiska tillämpningen av moraliska överväganden](https://en.wikipedia.org/wiki/Applied_ethics). Det är processen att aktivt undersöka etiska frågor i samband med _verkliga handlingar, produkter och processer_, och vidta korrigerande åtgärder för att säkerställa att dessa förblir i linje med våra definierade etiska värderingar.
**Etikkultur** handlar om [_operationalisering_ av tillämpad etik](https://hbr.org/2019/05/how-to-design-an-ethical-organization) för att säkerställa att våra etiska principer och praxis antas på ett konsekvent och skalbart sätt i hela organisationen. Framgångsrika etikkulturer definierar organisationsövergripande etiska principer, tillhandahåller meningsfulla incitament för efterlevnad och förstärker etiska normer genom att uppmuntra och förstärka önskade beteenden på alla nivåer i organisationen.
**Etisk kultur** handlar om [_operationalisering_ av tillämpad etik](https://hbr.org/2019/05/how-to-design-an-ethical-organization) för att säkerställa att våra etiska principer och praxis antas på ett konsekvent och skalbart sätt i hela organisationen. Framgångsrika etiska kulturer definierar organisationsövergripande etiska principer, tillhandahåller meningsfulla incitament för efterlevnad och förstärker etiska normer genom att uppmuntra och förstärka önskade beteenden på alla nivåer i organisationen.
## Etiska Koncept
## Etiska Begrepp
I denna sektion kommer vi att diskutera koncept som **gemensamma värderingar** (principer) och **etiska utmaningar** (problem) för dataetik - och utforska **fallstudier** som hjälper dig att förstå dessa koncept i verkliga sammanhang.
I denna sektion kommer vi att diskutera begrepp som **gemensamma värderingar** (principer) och **etiska utmaningar** (problem) för dataetik - och utforska **fallstudier** som hjälper dig att förstå dessa begrepp i verkliga sammanhang.
### 1. Etiska Principer
Varje strategi för dataetik börjar med att definiera _etiska principer_ - de "gemensamma värderingar" som beskriver acceptabla beteenden och vägleder efterlevnad i våra data- och AI-projekt. Du kan definiera dessa på individuell eller teamnivå. De flesta stora organisationer beskriver dock dessa i ett _etiskt AI_-uppdrag eller ramverk som definieras på företagsnivå och tillämpas konsekvent över alla team.
Varje strategi för dataetik börjar med att definiera _etiska principer_ - de "gemensamma värderingar" som beskriver acceptabla beteenden och styr efterlevnad i våra data- och AI-projekt. Du kan definiera dessa på individuell eller teamnivå. Men de flesta stora organisationer beskriver dessa i ett _etiskt AI_-uppdrag eller ramverk som definieras på företagsnivå och tillämpas konsekvent över alla team.
**Exempel:** Microsofts [Ansvarsfull AI](https://www.microsoft.com/en-us/ai/responsible-ai) uppdrag lyder: _"Vi är engagerade i att främja AI som drivs av etiska principer som sätter människor i första hand"_ - och identifierar 6 etiska principer i ramverket nedan:
**Exempel:** Microsofts [Ansvarsfull AI](https://www.microsoft.com/en-us/ai/responsible-ai) uppdrag lyder: _"Vi är engagerade i att främja AI som drivs av etiska principer som sätter människor först"_ - och identifierar 6 etiska principer i ramverket nedan:
![Ansvarsfull AI hos Microsoft](https://docs.microsoft.com/en-gb/azure/cognitive-services/personalizer/media/ethics-and-responsible-use/ai-values-future-computed.png)
Låt oss kortfattat utforska dessa principer. _Transparens_ och _ansvarighet_ är grundläggande värderingar som andra principer bygger på - så låt oss börja där:
Låt oss kortfattat utforska dessa principer. _Transparens_ och _ansvar_ är grundläggande värderingar som andra principer bygger på - så låt oss börja där:
* [**Ansvarighet**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) gör praktiker _ansvariga_ för sina data- och AI-operationer och efterlevnad av dessa etiska principer.
* [**Transparens**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) säkerställer att data- och AI-åtgärder är _förståeliga_ (tolkbara) för användare och förklarar vad och varför bakom beslut.
* [**Rättvisa**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1%3aprimaryr6) - fokuserar på att säkerställa att AI behandlar _alla människor_ rättvist och adresserar eventuella systemiska eller implicita socio-tekniska fördomar i data och system.
* [**Tillförlitlighet och Säkerhet**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - säkerställer att AI beter sig _konsekvent_ med definierade värderingar och minimerar potentiella skador eller oavsiktliga konsekvenser.
* [**Integritet och Säkerhet**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - handlar om att förstå datahärkomst och tillhandahålla _dataintegritet och relaterade skydd_ för användare.
* [**Inkludering**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - handlar om att designa AI-lösningar med avsikt och anpassa dem för att möta ett _brett spektrum av mänskliga behov_ och förmågor.
* [**Ansvar**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) gör utövare _ansvariga_ för sina data- och AI-operationer och efterlevnad av dessa etiska principer.
* [**Transparens**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) säkerställer att data och AI-åtgärder är _förståeliga_ (tolkbara) för användare, och förklarar vad och varför bakom beslut.
* [**Rättvisa**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1%3aprimaryr6) - fokuserar på att säkerställa att AI behandlar _alla människor_ rättvist, och adresserar eventuella systemiska eller implicita socio-tekniska fördomar i data och system.
* [**Tillförlitlighet och säkerhet**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - säkerställer att AI beter sig _konsekvent_ med definierade värderingar, och minimerar potentiella skador eller oavsiktliga konsekvenser.
* [**Sekretess och säkerhet**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - handlar om att förstå dataursprung och tillhandahålla _datasekretess och relaterade skydd_ för användare.
* [**Inkludering**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - handlar om att designa AI-lösningar med avsikt, och anpassa dem för att möta ett _brett spektrum av mänskliga behov_ och förmågor.
> 🚨 Fundera på vad ditt dataetiska uppdrag skulle kunna vara. Utforska etiska AI-ramverk från andra organisationer - här är exempel från [IBM](https://www.ibm.com/cloud/learn/ai-ethics), [Google](https://ai.google/principles) och [Facebook](https://ai.facebook.com/blog/facebooks-five-pillars-of-responsible-ai/). Vilka gemensamma värderingar har de? Hur relaterar dessa principer till AI-produkten eller branschen de verkar inom?
> 🚨 Fundera på vad ditt uppdrag för dataetik skulle kunna vara. Utforska etiska AI-ramverk från andra organisationer - här är exempel från [IBM](https://www.ibm.com/cloud/learn/ai-ethics), [Google](https://ai.google/principles), och [Facebook](https://ai.facebook.com/blog/facebooks-five-pillars-of-responsible-ai/). Vilka gemensamma värderingar har de? Hur relaterar dessa principer till AI-produkten eller industrin de verkar inom?
### 2. Etiska Utmaningar
När vi har definierat etiska principer är nästa steg att utvärdera våra data- och AI-åtgärder för att se om de är i linje med dessa gemensamma värderingar. Tänk på dina åtgärder i två kategorier: _datainsamling_ och _algoritmdesign_.
När vi har definierat etiska principer är nästa steg att utvärdera våra data- och AI-åtgärder för att se om de stämmer överens med dessa gemensamma värderingar. Tänk på dina åtgärder i två kategorier: _datainsamling_ och _algoritmdesign_.
Vid datainsamling kommer åtgärder sannolikt att involvera **personlig data** eller personligt identifierbar information (PII) för identifierbara levande individer. Detta inkluderar [olika typer av icke-personlig data](https://ec.europa.eu/info/law/law-topic/data-protection/reform/what-personal-data_en) som _tillsammans_ kan identifiera en individ. Etiska utmaningar kan relatera till _dataintegritet_, _dataägande_ och relaterade ämnen som _informerat samtycke_ och _immateriella rättigheter_ för användare.
Vid datainsamling kommer åtgärder sannolikt att involvera **personlig data** eller personligt identifierbar information (PII) för identifierbara levande individer. Detta inkluderar [diverse typer av icke-personlig data](https://ec.europa.eu/info/law/law-topic/data-protection/reform/what-personal-data_en) som _tillsammans_ identifierar en individ. Etiska utmaningar kan relatera till _datasekretess_, _dataägande_ och relaterade ämnen som _informerat samtycke_ och _immateriella rättigheter_ för användare.
Vid algoritmdesign kommer åtgärder att involvera insamling och kurering av **datamängder**, och sedan använda dem för att träna och distribuera **datamodeller** som förutspår resultat eller automatiserar beslut i verkliga sammanhang. Etiska utmaningar kan uppstå från _datamängdsfördomar_, _datakvalitetsproblem_, _orättvisor_ och _missrepresentation_ i algoritmer - inklusive vissa problem som är systemiska till sin natur.
Vid algoritmdesign kommer åtgärder att involvera insamling och kurering av **datamängder**, och sedan använda dem för att träna och implementera **datamodeller** som förutspår resultat eller automatiserar beslut i verkliga sammanhang. Etiska utmaningar kan uppstå från _datamängdsfördomar_, _datakvalitetsproblem_, _orättvisa_ och _missrepresentation_ i algoritmer - inklusive vissa problem som är systemiska till sin natur.
I båda fallen belyser etiska utmaningar områden där våra åtgärder kan komma i konflikt med våra gemensamma värderingar. För att upptäcka, mildra, minimera eller eliminera dessa bekymmer måste vi ställa moraliska "ja/nej"-frågor relaterade till våra åtgärder och sedan vidta korrigerande åtgärder vid behov. Låt oss titta på några etiska utmaningar och de moraliska frågor de väcker:
#### 2.1 Dataägande
Datainsamling involverar ofta personlig data som kan identifiera datasubjekt. [Dataägande](https://permission.io/blog/data-ownership) handlar om _kontroll_ och [_användarrättigheter_](https://permission.io/blog/data-ownership) relaterade till skapande, bearbetning och spridning av data.
Datainsamling involverar ofta personlig data som kan identifiera datasubjekten. [Dataägande](https://permission.io/blog/data-ownership) handlar om _kontroll_ och [_användarrättigheter_](https://permission.io/blog/data-ownership) relaterade till skapande, bearbetning och spridning av data.
De moraliska frågor vi behöver ställa är:
* Vem äger datan? (användare eller organisation)
* Vilka rättigheter har datasubjekt? (ex: åtkomst, radering, portabilitet)
* Vilka rättigheter har organisationer? (ex: rätta illvilliga användarrecensioner)
* Vilka rättigheter har datasubjekten? (ex: åtkomst, radering, portabilitet)
* Vilka rättigheter har organisationer? (ex: rätta skadliga användarrecensioner)
#### 2.2 Informerat Samtycke
@ -96,17 +96,17 @@ Frågor att utforska här är:
#### 2.3 Immateriella Rättigheter
[Immateriella rättigheter](https://en.wikipedia.org/wiki/Intellectual_property) avser immateriella skapelser som härrör från mänskligt initiativ och som kan _ha ekonomiskt värde_ för individer eller företag.
[Immateriella rättigheter](https://en.wikipedia.org/wiki/Intellectual_property) avser immateriella skapelser som resultat av mänskligt initiativ, som kan _ha ekonomiskt värde_ för individer eller företag.
Frågor att utforska här är:
* Hade den insamlade datan ekonomiskt värde för en användare eller ett företag?
* Har **användaren** immateriella rättigheter här?
* Har **organisationen** immateriella rättigheter här?
* Om dessa rättigheter existerar, hur skyddar vi dem?
* Om dessa rättigheter finns, hur skyddar vi dem?
#### 2.4 Dataintegritet
#### 2.4 Datasekretess
[Dataintegritet](https://www.northeastern.edu/graduate/blog/what-is-data-privacy/) eller informationsintegritet avser bevarandet av användarens integritet och skyddet av användarens identitet med avseende på personligt identifierbar information.
[Datasekretess](https://www.northeastern.edu/graduate/blog/what-is-data-privacy/) eller informationssekretess avser bevarandet av användarsekretess och skydd av användaridentitet med avseende på personligt identifierbar information.
Frågor att utforska här är:
* Är användarnas (personliga) data säkrad mot hack och läckor?
@ -122,7 +122,7 @@ Frågor att utforska här är:
* Tillåter systemet datasubjekt att begära radering?
* Bör återkallande av användarsamtycke utlösa automatisk radering?
* Samlades data in utan samtycke eller på olagliga sätt?
* Är vi kompatibla med regeringsregler för dataintegritet?
* Är vi kompatibla med statliga regleringar för datasekretess?
#### 2.6 Datamängdsfördomar
@ -131,11 +131,11 @@ Datamängds- eller [insamlingfördomar](http://researcharticles.com/index.php/bi
Frågor att utforska här är:
* Rekryterade vi en representativ uppsättning datasubjekt?
* Testade vi vår insamlade eller kuraterade datamängd för olika fördomar?
* Kan vi mildra eller ta bort några upptäckta fördomar?
* Kan vi mildra eller ta bort upptäckta fördomar?
#### 2.7 Datakvalitet
[Datakvalitet](https://lakefs.io/data-quality-testing/) handlar om att kontrollera giltigheten hos den kuraterade datamängden som används för att utveckla våra algoritmer, och säkerställa att funktioner och poster uppfyller kraven för den nivå av noggrannhet och konsekvens som behövs för vårt AI-syfte.
[Datakvalitet](https://lakefs.io/data-quality-testing/) handlar om att kontrollera validiteten hos den kuraterade datamängden som används för att utveckla våra algoritmer, och se om funktioner och poster uppfyller kraven för den nivå av noggrannhet och konsekvens som behövs för vårt AI-syfte.
Frågor att utforska här är:
* Fångade vi giltiga _funktioner_ för vårt användningsfall?
@ -144,7 +144,7 @@ Frågor att utforska här är:
* Är informationen som samlades in _korrekt_ i att återspegla verkligheten?
#### 2.8 Algoritmisk Rättvisa
[Algoritmisk rättvisa](https://towardsdatascience.com/what-is-algorithm-fairness-3182e161cf9f) handlar om att undersöka om algoritmdesignen systematiskt diskriminerar specifika undergrupper av datamottagare, vilket kan leda till [potentiella skador](https://docs.microsoft.com/en-us/azure/machine-learning/concept-fairness-ml) inom _resursfördelning_ (där resurser nekas eller undanhålls från den gruppen) och _servicekvalitet_ (där AI inte är lika exakt för vissa undergrupper som för andra).
[Algorithmisk rättvisa](https://towardsdatascience.com/what-is-algorithm-fairness-3182e161cf9f) handlar om att undersöka om algoritmdesignen systematiskt diskriminerar specifika undergrupper av datamottagare, vilket kan leda till [potentiella skador](https://docs.microsoft.com/en-us/azure/machine-learning/concept-fairness-ml) inom _resursfördelning_ (där resurser nekas eller undanhålls från den gruppen) och _servicekvalitet_ (där AI inte är lika exakt för vissa undergrupper som för andra).
Frågor att utforska här är:
* Har vi utvärderat modellens noggrannhet för olika undergrupper och förhållanden?
@ -164,35 +164,35 @@ Frågor att utforska här är:
* Finns det alternativa förklaringar som kan ge en annan slutsats?
#### 2.10 Fri vilja
[Illusionen av fri vilja](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice) uppstår när systemets "valarkitekturer" använder beslutsalgoritmer för att påverka människor att ta ett föredraget resultat, samtidigt som det verkar ge dem alternativ och kontroll. Dessa [mörka mönster](https://www.darkpatterns.org/) kan orsaka social och ekonomisk skada för användare. Eftersom användarbeslut påverkar beteendeprofiler kan dessa handlingar potentiellt driva framtida val som förstärker eller förlänger effekten av dessa skador.
[Illusionen av fri vilja](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice) uppstår när systemets "valarkitekturer" använder beslutsalgoritmer för att påverka människor att ta ett föredraget resultat samtidigt som det verkar ge dem alternativ och kontroll. Dessa [mörka mönster](https://www.darkpatterns.org/) kan orsaka social och ekonomisk skada för användare. Eftersom användarbeslut påverkar beteendeprofiler kan dessa handlingar potentiellt driva framtida val som förstärker eller förlänger effekten av dessa skador.
Frågor att utforska här är:
* Förstod användaren konsekvenserna av att göra det valet?
* Var användaren medveten om (alternativa) val och för- och nackdelarna med varje?
* Kan användaren senare ändra ett automatiserat eller påverkat val?
* Var användaren medveten om (alternativa) val och för- och nackdelar med varje?
* Kan användaren ångra ett automatiserat eller påverkat val senare?
### 3. Fallstudier
För att sätta dessa etiska utmaningar i verkliga sammanhang kan det vara hjälpsamt att titta på fallstudier som belyser potentiella skador och konsekvenser för individer och samhället när sådana etiska överträdelser förbises.
För att sätta dessa etiska utmaningar i verkliga sammanhang är det hjälpsamt att titta på fallstudier som belyser potentiella skador och konsekvenser för individer och samhället när sådana etiska överträdelser förbises.
Här är några exempel:
| Etisk utmaning | Fallstudie |
|--- |--- |
| **Informerat samtycke** | 1972 - [Tuskegee Syphilis Study](https://en.wikipedia.org/wiki/Tuskegee_Syphilis_Study) - Afroamerikanska män som deltog i studien lovades gratis medicinsk vård _men blev lurade_ av forskare som inte informerade deltagarna om deras diagnos eller om tillgänglig behandling. Många deltagare dog och deras partners eller barn påverkades; studien pågick i 40 år. |
| **Datasekretess** | 2007 - [Netflix data prize](https://www.wired.com/2007/12/why-anonymous-data-sometimes-isnt/) gav forskare _10M anonymiserade filmrankningar från 50K kunder_ för att förbättra rekommendationsalgoritmer. Forskare kunde dock korrelera anonymiserad data med personligt identifierbar data i _externa dataset_ (t.ex. IMDb-kommentarer) - vilket effektivt "de-anonymiserade" vissa Netflix-abonnenter.|
| **Insamlingsbias** | 2013 - Staden Boston [utvecklade Street Bump](https://www.boston.gov/transportation/street-bump), en app som lät medborgare rapportera potthål, vilket gav staden bättre vägdata för att hitta och åtgärda problem. Dock hade [personer i låginkomstgrupper mindre tillgång till bilar och telefoner](https://hbr.org/2013/04/the-hidden-biases-in-big-data), vilket gjorde deras vägproblem osynliga i appen. Utvecklare samarbetade med akademiker för att hantera _rättvis tillgång och digitala klyftor_. |
| **Algoritmisk rättvisa** | 2018 - MIT:s [Gender Shades Study](http://gendershades.org/overview.html) utvärderade noggrannheten hos AI-produkter för könsklassificering och avslöjade brister i noggrannhet för kvinnor och personer med mörkare hudton. Ett [2019 Apple Card](https://www.wired.com/story/the-apple-card-didnt-see-genderand-thats-the-problem/) verkade erbjuda mindre kredit till kvinnor än män. Båda exemplen illustrerade problem med algoritmisk bias som leder till socioekonomiska skador.|
| **Informerat samtycke** | 1972 - [Tuskegee Syfilisstudie](https://en.wikipedia.org/wiki/Tuskegee_Syphilis_Study) - Afroamerikanska män som deltog i studien lovades gratis medicinsk vård _men blev lurade_ av forskare som inte informerade deltagarna om deras diagnos eller om tillgänglig behandling. Många deltagare dog och partners eller barn påverkades; studien pågick i 40 år. |
| **Datasekretess** | 2007 - [Netflix dataprize](https://www.wired.com/2007/12/why-anonymous-data-sometimes-isnt/) gav forskare _10M anonymiserade filmrankningar från 50K kunder_ för att förbättra rekommendationsalgoritmer. Dock kunde forskare korrelera anonymiserad data med personligt identifierbar data i _externa dataset_ (t.ex. IMDb-kommentarer) - vilket effektivt "de-anonymiserade" vissa Netflix-abonnenter.|
| **Insamlingsbias** | 2013 - Staden Boston [utvecklade Street Bump](https://www.boston.gov/transportation/street-bump), en app som lät medborgare rapportera potthål, vilket gav staden bättre vägdata för att hitta och åtgärda problem. Dock hade [personer i låginkomstgrupper mindre tillgång till bilar och telefoner](https://hbr.org/2013/04/the-hidden-biases-in-big-data), vilket gjorde deras vägproblem osynliga i denna app. Utvecklare samarbetade med akademiker för att hantera _rättvis tillgång och digitala klyftor_. |
| **Algoritmisk rättvisa** | 2018 - MIT:s [Gender Shades Study](http://gendershades.org/overview.html) utvärderade noggrannheten hos AI-produkter för könsklassificering och avslöjade brister i noggrannhet för kvinnor och personer med mörkare hudton. Ett [2019 Apple Card](https://www.wired.com/story/the-apple-card-didnt-see-genderand-thats-the-problem/) verkade erbjuda mindre kredit till kvinnor än män. Båda illustrerade problem med algoritmisk bias som leder till socioekonomiska skador.|
| **Datamissrepresentation** | 2020 - [Georgia Department of Public Health släppte COVID-19-diagram](https://www.vox.com/covid-19-coronavirus-us-response-trump/2020/5/18/21262265/georgia-covid-19-cases-declining-reopening) som verkade vilseleda medborgare om trender i bekräftade fall med icke-kronologisk ordning på x-axeln. Detta illustrerar missrepresentation genom visualiseringstrick. |
| **Illusionen av fri vilja** | 2020 - Läroappen [ABCmouse betalade $10M för att lösa en FTC-klagan](https://www.washingtonpost.com/business/2020/09/04/abcmouse-10-million-ftc-settlement/) där föräldrar fastnade i att betala för abonnemang de inte kunde avsluta. Detta illustrerar mörka mönster i valarkitekturer, där användare påverkades att göra potentiellt skadliga val. |
| **Datasekretess & användarrättigheter** | 2021 - Facebook [Data Breach](https://www.npr.org/2021/04/09/986005820/after-data-breach-exposes-530-million-facebook-says-it-will-not-notify-users) exponerade data från 530M användare, vilket resulterade i en $5B-uppgörelse med FTC. Företaget vägrade dock att informera användare om dataintrånget, vilket bröt mot användarrättigheter kring datatransparens och åtkomst. |
| **Datasekretess & användarrättigheter** | 2021 - Facebook [Dataintrång](https://www.npr.org/2021/04/09/986005820/after-data-breach-exposes-530-million-facebook-says-it-will-not-notify-users) exponerade data från 530M användare, vilket resulterade i en $5B förlikning med FTC. Det vägrade dock att informera användare om intrånget, vilket bröt mot användarrättigheter kring datatransparens och åtkomst. |
Vill du utforska fler fallstudier? Kolla in dessa resurser:
* [Ethics Unwrapped](https://ethicsunwrapped.utexas.edu/case-studies) - etiska dilemman inom olika branscher.
* [Ethics Unwrapped](https://ethicsunwrapped.utexas.edu/case-studies) - etiska dilemman inom olika industrier.
* [Data Science Ethics course](https://www.coursera.org/learn/data-science-ethics#syllabus) - fallstudier som utforskas.
* [Where things have gone wrong](https://deon.drivendata.org/examples/) - deon-checklista med exempel.
> 🚨 Tänk på de fallstudier du har sett - har du upplevt eller blivit påverkad av en liknande etisk utmaning i ditt liv? Kan du komma på minst en annan fallstudie som illustrerar en av de etiska utmaningarna vi har diskuterat i detta avsnitt?
> 🚨 Tänk på de fallstudier du har sett - har du upplevt eller blivit påverkad av en liknande etisk utmaning i ditt liv? Kan du komma på minst en annan fallstudie som illustrerar en av de etiska utmaningar vi har diskuterat i detta avsnitt?
## Tillämpad etik
@ -200,15 +200,15 @@ Vi har pratat om etiska koncept, utmaningar och fallstudier i verkliga sammanhan
### 1. Professionella koder
Professionella koder erbjuder ett alternativ för organisationer att "motivera" medlemmar att stödja deras etiska principer och uppdragsbeskrivning. Koder är _moraliska riktlinjer_ för professionellt beteende och hjälper anställda eller medlemmar att fatta beslut som överensstämmer med organisationens principer. De är endast effektiva om medlemmarna frivilligt följer dem; dock erbjuder många organisationer ytterligare belöningar och straff för att motivera efterlevnad.
Professionella koder erbjuder ett alternativ för organisationer att "motivera" medlemmar att stödja deras etiska principer och uppdragsbeskrivning. Koder är _moraliska riktlinjer_ för professionellt beteende, som hjälper anställda eller medlemmar att fatta beslut som överensstämmer med organisationens principer. De är bara så bra som den frivilliga efterlevnaden från medlemmarna; dock erbjuder många organisationer ytterligare belöningar och straff för att motivera efterlevnad.
Exempel inkluderar:
* [Oxford Munich](http://www.code-of-ethics.org/code-of-conduct/) Code of Ethics
* [Data Science Association](http://datascienceassn.org/code-of-conduct.html) Code of Conduct (skapad 2013)
* [Oxford Munich](http://www.code-of-ethics.org/code-of-conduct/) Etikkod
* [Data Science Association](http://datascienceassn.org/code-of-conduct.html) Uppförandekod (skapad 2013)
* [ACM Code of Ethics and Professional Conduct](https://www.acm.org/code-of-ethics) (sedan 1993)
> 🚨 Tillhör du en professionell ingenjörs- eller datavetenskapsorganisation? Utforska deras webbplats för att se om de definierar en professionell etisk kod. Vad säger detta om deras etiska principer? Hur motiverar de medlemmar att följa koden?
> 🚨 Tillhör du en professionell ingenjörs- eller datavetenskapsorganisation? Utforska deras webbplats för att se om de definierar en professionell etikkod. Vad säger detta om deras etiska principer? Hur "motiverar" de medlemmar att följa koden?
### 2. Etiska checklistor
@ -217,51 +217,51 @@ Medan professionella koder definierar nödvändigt _etiskt beteende_ från prakt
Checklistor omvandlar frågor till "ja/nej"-uppgifter som kan operationaliseras, vilket gör att de kan spåras som en del av standardarbetsflöden för produktlansering.
Exempel inkluderar:
* [Deon](https://deon.drivendata.org/) - en allmän datavetenskaplig etisk checklista skapad från [branschrekommendationer](https://deon.drivendata.org/#checklist-citations) med ett kommandoradsverktyg för enkel integration.
* [Privacy Audit Checklist](https://cyber.harvard.edu/ecommerce/privacyaudit.html) - ger allmän vägledning för informationshantering ur juridiska och sociala perspektiv.
* [Deon](https://deon.drivendata.org/) - en allmän datetikchecklista skapad från [industrirekommendationer](https://deon.drivendata.org/#checklist-citations) med ett kommandoradsverktyg för enkel integration.
* [Privacy Audit Checklist](https://cyber.harvard.edu/ecommerce/privacyaudit.html) - ger allmän vägledning för informationshanteringspraxis ur juridiska och sociala exponeringsperspektiv.
* [AI Fairness Checklist](https://www.microsoft.com/en-us/research/project/ai-fairness-checklist/) - skapad av AI-praktiker för att stödja adoption och integration av rättvisekontroller i AI-utvecklingscykler.
* [22 frågor för etik inom data och AI](https://medium.com/the-organization/22-questions-for-ethics-in-data-and-ai-efb68fd19429) - en mer öppen ram, strukturerad för initial utforskning av etiska frågor i design, implementering och organisatoriska sammanhang.
### 3. Etiska regleringar
Etik handlar om att definiera gemensamma värderingar och göra det rätta _frivilligt_. **Efterlevnad** handlar om att _följa lagen_ där den är definierad. **Styrning** täcker brett alla sätt som organisationer arbetar för att upprätthålla etiska principer och följa etablerade lagar.
Etik handlar om att definiera gemensamma värderingar och göra rätt saker _frivilligt_. **Efterlevnad** handlar om _att följa lagen_ där den är definierad. **Styrning** omfattar brett alla sätt på vilka organisationer arbetar för att upprätthålla etiska principer och följa etablerade lagar.
Idag tar styrning två former inom organisationer. För det första handlar det om att definiera **etiska AI**-principer och etablera praxis för att operationalisera adoption över alla AI-relaterade projekt i organisationen. För det andra handlar det om att följa alla statligt föreskrivna **dataskyddsregleringar** för regioner där organisationen verkar.
Idag tar styrning två former inom organisationer. För det första handlar det om att definiera **etiska AI**-principer och etablera praxis för att operationalisera adoption över alla AI-relaterade projekt i organisationen. För det andra handlar det om att följa alla statligt föreskrivna **dataskyddsregleringar** för de regioner där organisationen verkar.
Exempel på dataskydds- och sekretessregleringar:
* `1974`, [US Privacy Act](https://www.justice.gov/opcl/privacy-act-1974) - reglerar _federala myndigheters_ insamling, användning och spridning av personlig information.
* `1974`, [US Privacy Act](https://www.justice.gov/opcl/privacy-act-1974) - reglerar _federala myndigheters_ insamling, användning och avslöjande av personlig information.
* `1996`, [US Health Insurance Portability & Accountability Act (HIPAA)](https://www.cdc.gov/phlp/publications/topic/hipaa.html) - skyddar personlig hälsodata.
* `1998`, [US Children's Online Privacy Protection Act (COPPA)](https://www.ftc.gov/enforcement/rules/rulemaking-regulatory-reform-proceedings/childrens-online-privacy-protection-rule) - skyddar datasekretess för barn under 13 år.
* `2018`, [General Data Protection Regulation (GDPR)](https://gdpr-info.eu/) - ger användarrättigheter, dataskydd och sekretess.
* `2018`, [California Consumer Privacy Act (CCPA)](https://www.oag.ca.gov/privacy/ccpa) ger konsumenter fler _rättigheter_ över deras (personliga) data.
* `2021`, Kinas [Personal Information Protection Law](https://www.reuters.com/world/china/china-passes-new-personal-data-privacy-law-take-effect-nov-1-2021-08-20/) antogs nyligen och skapar en av de starkaste regleringarna för datasekretess online i världen.
> 🚨 Europeiska unionens GDPR (General Data Protection Regulation) är fortfarande en av de mest inflytelserika regleringarna för datasekretess idag. Visste du att den också definierar [8 användarrättigheter](https://www.freeprivacypolicy.com/blog/8-user-rights-gdpr) för att skydda medborgares digitala sekretess och personliga data? Lär dig vad dessa är och varför de är viktiga.
> 🚨 Europeiska unionens GDPR (General Data Protection Regulation) är fortfarande en av de mest inflytelserika regleringarna för datasekretess idag. Visste du att den också definierar [8 användarrättigheter](https://www.freeprivacypolicy.com/blog/8-user-rights-gdpr) för att skydda medborgarnas digitala sekretess och personliga data? Lär dig vad dessa är och varför de är viktiga.
### 4. Etisk kultur
Observera att det fortfarande finns en immateriell klyfta mellan _efterlevnad_ (att göra tillräckligt för att uppfylla "lagens bokstav") och att adressera [systemiska problem](https://www.coursera.org/learn/data-science-ethics/home/week/4) (som stelbenthet, informationsasymmetri och orättvis fördelning) som kan påskynda vapeniseringen av AI.
Observera att det fortfarande finns en immateriell klyfta mellan _efterlevnad_ (att göra tillräckligt för att uppfylla "lagens bokstav") och att hantera [systemiska problem](https://www.coursera.org/learn/data-science-ethics/home/week/4) (som stelhet, informationsasymmetri och orättvis fördelning) som kan påskynda vapentillverkningen av AI.
Det senare kräver [samarbetsmetoder för att definiera etiska kulturer](https://towardsdatascience.com/why-ai-ethics-requires-a-culture-driven-approach-26f451afa29f) som bygger känslomässiga kopplingar och konsekventa gemensamma värderingar _över organisationer_ inom branschen. Detta kräver mer [formaliserade datavetenskapliga etiska kulturer](https://www.codeforamerica.org/news/formalizing-an-ethical-data-culture/) i organisationer - vilket gör det möjligt för _vem som helst_ att [dra Andon-snöret](https://en.wikipedia.org/wiki/Andon_(manufacturing)) (för att lyfta etiska problem tidigt i processen) och göra _etiska bedömningar_ (t.ex. vid rekrytering) till ett kärnkriterium för teamformation i AI-projekt.
Det senare kräver [samarbetsmetoder för att definiera etiska kulturer](https://towardsdatascience.com/why-ai-ethics-requires-a-culture-driven-approach-26f451afa29f) som bygger känslomässiga kopplingar och konsekventa gemensamma värderingar _över organisationer_ inom industrin. Detta kräver mer [formaliserade datetikskulturer](https://www.codeforamerica.org/news/formalizing-an-ethical-data-culture/) i organisationer - vilket gör det möjligt för _vem som helst_ att [dra Andon-snöret](https://en.wikipedia.org/wiki/Andon_(manufacturing)) (för att lyfta etiska problem tidigt i processen) och göra _etiska bedömningar_ (t.ex. vid rekrytering) till ett kärnkriterium för teambildning i AI-projekt.
---
## [Quiz efter föreläsningen](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/3) 🎯
## [Efterföreläsningsquiz](https://ff-quizzes.netlify.app/en/ds/) 🎯
## Granskning & Självstudier
Kurser och böcker hjälper till att förstå grundläggande etiska koncept och utmaningar, medan fallstudier och verktyg hjälper till med tillämpad etik i verkliga sammanhang. Här är några resurser att börja med.
* [Machine Learning For Beginners](https://github.com/microsoft/ML-For-Beginners/blob/main/1-Introduction/3-fairness/README.md) - lektion om rättvisa, från Microsoft.
* [Principer för Ansvarsfull AI](https://docs.microsoft.com/en-us/learn/modules/responsible-ai-principles/) - gratis utbildningsväg från Microsoft Learn.
* [Principer för ansvarsfull AI](https://docs.microsoft.com/en-us/learn/modules/responsible-ai-principles/) - gratis utbildningsväg från Microsoft Learn.
* [Etik och Data Science](https://resources.oreilly.com/examples/0636920203964) - O'Reilly EBook (M. Loukides, H. Mason m.fl.)
* [Data Science Etik](https://www.coursera.org/learn/data-science-ethics#syllabus) - onlinekurs från University of Michigan.
* [Ethics Unwrapped](https://ethicsunwrapped.utexas.edu/case-studies) - fallstudier från University of Texas.
# Uppgift
# Uppgift
[Skriv en fallstudie om dataetik](assignment.md)
---
**Ansvarsfriskrivning**:
Detta dokument har översatts med hjälp av AI-översättningstjänsten [Co-op Translator](https://github.com/Azure/co-op-translator). Även om vi strävar efter noggrannhet, bör det noteras att automatiska översättningar kan innehålla fel eller inexaktheter. Det ursprungliga dokumentet på dess originalspråk bör betraktas som den auktoritativa källan. För kritisk information rekommenderas professionell mänsklig översättning. Vi ansvarar inte för eventuella missförstånd eller feltolkningar som kan uppstå vid användning av denna översättning.
Detta dokument har översatts med hjälp av AI-översättningstjänsten [Co-op Translator](https://github.com/Azure/co-op-translator). Även om vi strävar efter noggrannhet, bör du vara medveten om att automatiserade översättningar kan innehålla fel eller felaktigheter. Det ursprungliga dokumentet på dess originalspråk bör betraktas som den auktoritativa källan. För kritisk information rekommenderas professionell mänsklig översättning. Vi ansvarar inte för eventuella missförstånd eller feltolkningar som uppstår vid användning av denna översättning.

@ -1,8 +1,8 @@
<!--
CO_OP_TRANSLATOR_METADATA:
{
"original_hash": "8796f41f566a0a8ebb72863a83d558ed",
"translation_date": "2025-08-26T15:00:21+00:00",
"original_hash": "3a34157cc63516eba97c89a0b2f8c3e6",
"translation_date": "2025-09-03T21:41:05+00:00",
"source_file": "1-Introduction/02-ethics/README.md",
"language_code": "sw"
}
@ -15,15 +15,15 @@ CO_OP_TRANSLATOR_METADATA:
---
Sote ni raia wa takwimu tunaoishi katika ulimwengu uliojaa data.
Sisi sote ni raia wa takwimu tunaoishi katika ulimwengu uliojaa data.
Mwelekeo wa soko unaonyesha kwamba kufikia mwaka wa 2022, shirika moja kati ya matatu kubwa litanunua na kuuza data yake kupitia [Masoko na Mabadilishano ya Mtandaoni](https://www.gartner.com/smarterwithgartner/gartner-top-10-trends-in-data-and-analytics-for-2020/). Kama **Watengenezaji wa Programu**, tutapata urahisi na gharama nafuu ya kuunganisha maarifa yanayotokana na data na otomatiki inayotokana na algorithimu katika uzoefu wa kila siku wa watumiaji. Lakini kadri AI inavyoenea, tutahitaji pia kuelewa madhara yanayoweza kusababishwa na [utumiaji mbaya](https://www.youtube.com/watch?v=TQHs8SA1qpk) wa algorithimu hizo kwa kiwango kikubwa.
Mwelekeo wa soko unaonyesha kwamba kufikia mwaka wa 2022, shirika moja kati ya matatu makubwa litakuwa linanunua na kuuza data yake kupitia [Masoko na Mabadilishano ya Mtandaoni](https://www.gartner.com/smarterwithgartner/gartner-top-10-trends-in-data-and-analytics-for-2020/). Kama **Watengenezaji wa Programu**, itakuwa rahisi na nafuu zaidi kwetu kuunganisha maarifa yanayotokana na data na otomatiki inayotegemea algoriti katika uzoefu wa kila siku wa watumiaji. Lakini kadri AI inavyoenea, tutahitaji pia kuelewa madhara yanayoweza kusababishwa na [utumiaji mbaya](https://www.youtube.com/watch?v=TQHs8SA1qpk) wa algoriti hizi kwa kiwango kikubwa.
Mwelekeo pia unaonyesha kwamba tutazalisha na kutumia zaidi ya [zettabyte 180](https://www.statista.com/statistics/871513/worldwide-data-created/) za data kufikia mwaka wa 2025. Kama **Wanasayansi wa Takwimu**, hii inatupa viwango vya kipekee vya ufikiaji wa data ya kibinafsi. Hii inamaanisha tunaweza kujenga maelezo ya tabia za watumiaji na kushawishi maamuzi kwa njia zinazounda [udanganyifu wa chaguo huru](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice) huku tukiwashawishi watumiaji kuelekea matokeo tunayopendelea. Pia inazua maswali mapana kuhusu faragha ya data na ulinzi wa watumiaji.
Mwelekeo pia unaonyesha kwamba tutazalisha na kutumia zaidi ya [zettabyte 180](https://www.statista.com/statistics/871513/worldwide-data-created/) za data kufikia mwaka wa 2025. Kama **Wanasayansi wa Takwimu**, hii inatupa viwango vya kipekee vya ufikiaji wa data ya kibinafsi. Hii inamaanisha tunaweza kujenga wasifu wa tabia za watumiaji na kushawishi maamuzi kwa njia zinazounda [dhana ya chaguo huru](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice) huku tukiwashawishi watumiaji kuelekea matokeo tunayopendelea. Pia inazua maswali mapana kuhusu faragha ya data na ulinzi wa watumiaji.
Maadili ya takwimu sasa ni _miongozo muhimu_ kwa sayansi ya takwimu na uhandisi, yakitusaidia kupunguza madhara yanayoweza kutokea na matokeo yasiyotarajiwa kutoka kwa vitendo vyetu vinavyotegemea data. [Mzunguko wa Hype wa Gartner kwa AI](https://www.gartner.com/smarterwithgartner/2-megatrends-dominate-the-gartner-hype-cycle-for-artificial-intelligence-2020/) unataja mwelekeo muhimu katika maadili ya kidijitali, AI inayowajibika, na usimamizi wa AI kama vichochezi vikuu vya mwelekeo mkubwa wa _demokrasia_ na _viwanda_ vya AI.
Maadili ya takwimu sasa ni _miongozo muhimu_ kwa sayansi ya takwimu na uhandisi, yakitusaidia kupunguza madhara yanayoweza kutokea na matokeo yasiyotarajiwa kutoka kwa vitendo vyetu vinavyotegemea data. [Gartner Hype Cycle for AI](https://www.gartner.com/smarterwithgartner/2-megatrends-dominate-the-gartner-hype-cycle-for-artificial-intelligence-2020/) inatambua mwelekeo muhimu katika maadili ya kidijitali, AI inayowajibika, na usimamizi wa AI kama vichochezi vikuu vya mwelekeo mkubwa wa _demokrasia_ na _viwanda_ vya AI.
![Mzunguko wa Hype wa Gartner kwa AI - 2020](https://images-cdn.newscred.com/Zz1mOWJhNzlkNDA2ZTMxMWViYjRiOGFiM2IyMjQ1YmMwZQ==)
![Gartner's Hype Cycle for AI - 2020](https://images-cdn.newscred.com/Zz1mOWJhNzlkNDA2ZTMxMWViYjRiOGFiM2IyMjQ1YmMwZQ==)
Katika somo hili, tutachunguza eneo la kuvutia la maadili ya takwimu - kuanzia dhana za msingi na changamoto, hadi masomo ya kesi na dhana za AI zinazotumika kama usimamizi - ambazo husaidia kuanzisha utamaduni wa maadili katika timu na mashirika yanayofanya kazi na data na AI.
@ -35,13 +35,13 @@ Tuanzie kwa kuelewa istilahi za msingi.
Neno "maadili" linatokana na [neno la Kigiriki "ethikos"](https://en.wikipedia.org/wiki/Ethics) (na mzizi wake "ethos") linalomaanisha _tabia au asili ya maadili_.
**Maadili** yanahusu maadili ya pamoja na kanuni za kimaadili zinazotawala tabia yetu katika jamii. Maadili hayategemei sheria bali yanategemea kanuni zinazokubalika kwa ujumla kuhusu kile kilicho "sahihi dhidi ya makosa". Hata hivyo, masuala ya kimaadili yanaweza kuathiri mipango ya usimamizi wa mashirika na kanuni za serikali zinazounda motisha zaidi ya kufuata.
**Maadili** yanahusu maadili ya pamoja na kanuni za kimaadili zinazotawala tabia yetu katika jamii. Maadili hayategemei sheria bali yanategemea kanuni zinazokubalika kwa ujumla kuhusu nini ni "sahihi dhidi ya makosa". Hata hivyo, masuala ya kimaadili yanaweza kuathiri mipango ya usimamizi wa mashirika na kanuni za serikali zinazounda motisha zaidi ya kufuata.
**Maadili ya Takwimu** ni [tawi jipya la maadili](https://royalsocietypublishing.org/doi/full/10.1098/rsta.2016.0360#sec-1) linalochunguza na kutathmini matatizo ya kimaadili yanayohusiana na _data, algorithimu na mazoea yanayohusiana_. Hapa, **"data"** inazingatia vitendo vinavyohusiana na uzalishaji, kurekodi, kutunza, kuchakata, kusambaza, kushiriki, na matumizi, **"algorithimu"** inazingatia AI, mawakala, kujifunza kwa mashine, na roboti, na **"mazoea"** yanazingatia mada kama uvumbuzi unaowajibika, programu, udukuzi, na kanuni za maadili.
**Maadili ya Takwimu** ni [tawi jipya la maadili](https://royalsocietypublishing.org/doi/full/10.1098/rsta.2016.0360#sec-1) linalochunguza na kutathmini matatizo ya kimaadili yanayohusiana na _data, algoriti na mazoea yanayohusiana_. Hapa, **"data"** inazingatia vitendo vinavyohusiana na uzalishaji, kurekodi, kutunza, kuchakata, kusambaza, kushiriki, na matumizi, **"algoriti"** inazingatia AI, mawakala, kujifunza kwa mashine, na roboti, na **"mazoea"** yanazingatia mada kama uvumbuzi unaowajibika, programu, udukuzi, na kanuni za maadili.
**Maadili Yanayotumika** ni [matumizi ya vitendo ya masuala ya kimaadili](https://en.wikipedia.org/wiki/Applied_ethics). Ni mchakato wa kuchunguza masuala ya kimaadili kwa bidii katika muktadha wa _vitendo halisi, bidhaa na michakato_, na kuchukua hatua za kurekebisha ili kuhakikisha kwamba zinabaki kulingana na maadili yetu yaliyofafanuliwa.
**Utamaduni wa Maadili** unahusu [_utekelezaji_ wa maadili yanayotumika](https://hbr.org/2019/05/how-to-design-an-ethical-organization) ili kuhakikisha kwamba kanuni na mazoea yetu ya kimaadili yanapitishwa kwa njia thabiti na inayoweza kupanuka katika shirika zima. Utamaduni wa maadili uliofanikiwa hufafanua kanuni za kimaadili za shirika, hutoa motisha yenye maana ya kufuata, na kuimarisha kanuni za maadili kwa kuhimiza na kukuza tabia zinazotakiwa katika kila ngazi ya shirika.
**Utamaduni wa Maadili** unahusu [_utekelezaji_ wa maadili yanayotumika](https://hbr.org/2019/05/how-to-design-an-ethical-organization) ili kuhakikisha kwamba kanuni na mazoea yetu ya kimaadili yanachukuliwa kwa njia thabiti na inayoweza kupanuka katika shirika zima. Utamaduni wa maadili uliofanikiwa hufafanua kanuni za kimaadili za shirika, hutoa motisha yenye maana ya kufuata, na kuimarisha kanuni za maadili kwa kuhimiza na kukuza tabia zinazotakiwa katika kila ngazi ya shirika.
## Dhana za Maadili
@ -58,21 +58,21 @@ Kila mkakati wa maadili ya takwimu huanza kwa kufafanua _kanuni za kimaadili_ -
Hebu tuchunguze kwa ufupi kanuni hizi. _Uwajibikaji_ na _uwazi_ ni maadili ya msingi ambayo kanuni nyingine zinajengwa juu yake - kwa hivyo tuanze hapo:
* [**Uwajibikaji**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) huwafanya watendaji _wajibike_ kwa shughuli zao za data na AI, na kufuata kanuni hizi za kimaadili.
* [**Uwazi**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) huhakikisha kwamba vitendo vya data na AI vinaweza kueleweka (kufasiriwa) na watumiaji, kuelezea nini na kwa nini nyuma ya maamuzi.
* [**Haki**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1%3aprimaryr6) - inazingatia kuhakikisha AI inawatendea _watu wote_ kwa haki, ikishughulikia upendeleo wowote wa kijamii au wa kiufundi katika data na mifumo.
* [**Uaminifu na Usalama**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - huhakikisha kwamba AI inatenda _kwa uthabiti_ kulingana na maadili yaliyofafanuliwa, ikipunguza madhara yanayoweza kutokea au matokeo yasiyotarajiwa.
* [**Faragha na Usalama**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - inahusu kuelewa mwelekeo wa data, na kutoa _faragha ya data na ulinzi unaohusiana_ kwa watumiaji.
* [**Ujumuishi**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - inahusu kubuni suluhisho za AI kwa makusudi, kuzibadilisha ili kukidhi _mahitaji na uwezo mbalimbali ya binadamu_.
* [**Uwazi**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) huhakikisha kwamba vitendo vya data na AI vinaweza _kueleweka_ (kufasiriwa) na watumiaji, kuelezea nini na kwa nini nyuma ya maamuzi.
* [**Haki**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1%3aprimaryr6) - inalenga kuhakikisha AI inawatendea _watu wote_ kwa haki, ikishughulikia upendeleo wowote wa kijamii au wa kiufundi katika data na mifumo.
* [**Uaminifu na Usalama**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - huhakikisha kwamba AI inatenda kwa _uthabiti_ kulingana na maadili yaliyofafanuliwa, ikipunguza madhara yanayoweza kutokea au matokeo yasiyotarajiwa.
* [**Faragha na Usalama**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - inahusu kuelewa asili ya data, na kutoa _faragha ya data na ulinzi unaohusiana_ kwa watumiaji.
* [**Ujumuishi**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - inahusu kubuni suluhisho za AI kwa nia, kuzibadilisha ili kukidhi _mahitaji na uwezo mbalimbali ya binadamu_.
> 🚨 Fikiria kuhusu taarifa yako ya dhamira ya maadili ya takwimu inaweza kuwa nini. Chunguza mifumo ya AI inayowajibika kutoka kwa mashirika mengine - hapa kuna mifano kutoka [IBM](https://www.ibm.com/cloud/learn/ai-ethics), [Google](https://ai.google/principles), na [Facebook](https://ai.facebook.com/blog/facebooks-five-pillars-of-responsible-ai/). Ni maadili gani ya pamoja wanayo? Kanuni hizi zinahusiana vipi na bidhaa za AI au sekta wanayofanya kazi ndani yake?
> 🚨 Fikiria kuhusu nini taarifa yako ya dhamira ya maadili ya takwimu inaweza kuwa. Chunguza mifumo ya AI inayowajibika kutoka kwa mashirika mengine - hapa kuna mifano kutoka [IBM](https://www.ibm.com/cloud/learn/ai-ethics), [Google](https://ai.google/principles), na [Facebook](https://ai.facebook.com/blog/facebooks-five-pillars-of-responsible-ai/). Ni maadili gani ya pamoja wanayo? Kanuni hizi zinahusiana vipi na bidhaa za AI au sekta wanayofanya kazi ndani yake?
### 2. Changamoto za Maadili
Mara tu tunapokuwa na kanuni za kimaadili zilizofafanuliwa, hatua inayofuata ni kutathmini vitendo vyetu vya data na AI ili kuona kama vinakubaliana na maadili hayo ya pamoja. Fikiria kuhusu vitendo vyako katika makundi mawili: _ukusanyaji wa data_ na _muundo wa algorithimu_.
Mara tu tunapokuwa na kanuni za kimaadili zilizofafanuliwa, hatua inayofuata ni kutathmini vitendo vyetu vya data na AI ili kuona kama vinakubaliana na maadili hayo ya pamoja. Fikiria kuhusu vitendo vyako katika makundi mawili: _ukusanyaji wa data_ na _muundo wa algoriti_.
Katika ukusanyaji wa data, vitendo vinaweza kuhusisha **data ya kibinafsi** au taarifa zinazoweza kumtambua mtu (PII) kwa watu wanaotambulika. Hii inajumuisha [vitu mbalimbali vya data isiyo ya kibinafsi](https://ec.europa.eu/info/law/law-topic/data-protection/reform/what-personal-data_en) ambavyo _kwa pamoja_ vinaweza kumtambua mtu. Changamoto za kimaadili zinaweza kuhusiana na _faragha ya data_, _umiliki wa data_, na mada zinazohusiana kama _idhini ya taarifa_ na _haki za mali ya kiakili_ kwa watumiaji.
Katika muundo wa algorithimu, vitendo vitahusisha kukusanya na kutunza **seti za data**, kisha kuzitumia kufundisha na kupeleka **miundo ya data** inayotabiri matokeo au kuendesha maamuzi katika muktadha wa ulimwengu halisi. Changamoto za kimaadili zinaweza kutokea kutokana na _upendeleo wa seti ya data_, _masuala ya ubora wa data_, _kutokuwa na haki_, na _upotoshaji_ katika algorithimu - ikiwa ni pamoja na masuala mengine ambayo ni ya mfumo.
Katika muundo wa algoriti, vitendo vitahusisha kukusanya na kutunza **seti za data**, kisha kuzitumia kufundisha na kupeleka **miundo ya data** inayotabiri matokeo au kuendesha maamuzi katika muktadha wa ulimwengu halisi. Changamoto za kimaadili zinaweza kutokea kutokana na _upendeleo wa seti ya data_, masuala ya _ubora wa data_, _kutokuwa na haki_, na _upotoshaji_ katika algoriti - ikiwa ni pamoja na masuala mengine ambayo ni ya kimfumo.
Katika hali zote mbili, changamoto za maadili zinaonyesha maeneo ambapo vitendo vyetu vinaweza kukutana na migogoro na maadili yetu ya pamoja. Ili kugundua, kupunguza, kupunguza, au kuondoa wasiwasi huu - tunahitaji kuuliza maswali ya kimaadili ya "ndiyo/hapana" yanayohusiana na vitendo vyetu, kisha kuchukua hatua za kurekebisha inapohitajika. Hebu tuangalie baadhi ya changamoto za kimaadili na maswali ya kimaadili wanayozua:
@ -82,21 +82,21 @@ Ukusanyaji wa data mara nyingi unahusisha data ya kibinafsi inayoweza kumtambua
Maswali ya kimaadili tunayotakiwa kuuliza ni:
* Nani anamiliki data? (mtumiaji au shirika)
* Ni haki gani walizonazo wahusika wa data? (mfano: ufikiaji, kufutwa, kubebeka)
* Ni haki gani mashirika yanayo? (mfano: kurekebisha hakiki za watumiaji zenye nia mbaya)
* Ni haki gani mhusika wa data anazo? (mfano: ufikiaji, kufutwa, kubebeka)
* Ni haki gani mashirika yanazo? (mfano: kurekebisha hakiki za watumiaji zenye nia mbaya)
#### 2.2 Idhini ya Taarifa
[Idhini ya taarifa](https://legaldictionary.net/informed-consent/) inafafanua kitendo cha watumiaji kukubali hatua (kama ukusanyaji wa data) kwa _ufahamu kamili_ wa ukweli muhimu ikiwa ni pamoja na madhumuni, hatari zinazoweza kutokea, na mbadala.
[Idhini ya taarifa](https://legaldictionary.net/informed-consent/) inafafanua kitendo cha watumiaji kukubali hatua (kama ukusanyaji wa data) kwa _ufahamu kamili_ wa ukweli muhimu ikiwa ni pamoja na madhumuni, hatari zinazowezekana, na mbadala.
Maswali ya kuchunguza hapa ni:
* Je, mtumiaji (mhusika wa data) alitoa ruhusa ya kukamata na kutumia data?
* Je, mtumiaji alielewa madhumuni ya kukamatwa kwa data hiyo?
* Je, mtumiaji alielewa hatari zinazoweza kutokea kutokana na ushiriki wao?
* Je, mtumiaji alielewa hatari zinazowezekana kutoka kwa ushiriki wao?
#### 2.3 Mali ya Kiakili
[Mali ya kiakili](https://en.wikipedia.org/wiki/Intellectual_property) inahusu ubunifu usioonekana unaotokana na juhudi za binadamu, ambao unaweza _kuwa na thamani ya kiuchumi_ kwa watu binafsi au biashara.
[Mali ya kiakili](https://en.wikipedia.org/wiki/Intellectual_property) inahusu ubunifu usioonekana unaotokana na juhudi za binadamu, ambazo zinaweza _kuwa na thamani ya kiuchumi_ kwa watu binafsi au biashara.
Maswali ya kuchunguza hapa ni:
* Je, data iliyokusanywa ilikuwa na thamani ya kiuchumi kwa mtumiaji au biashara?
@ -116,7 +116,7 @@ Maswali ya kuchunguza hapa ni:
#### 2.5 Haki ya Kusahaulika
[Haki ya Kusahaulika](https://en.wikipedia.org/wiki/Right_to_be_forgotten) au [Haki ya Kufutwa](https://www.gdpreu.org/right-to-be-forgotten/) hutoa ulinzi wa ziada wa data ya kibinafsi kwa watumiaji. Hasa, inawapa watumiaji haki ya kuomba kufutwa au kuondolewa kwa data ya kibinafsi kutoka kwa tafuta za mtandaoni na maeneo mengine, _chini ya hali maalum_ - ikiwapa mwanzo mpya mtandaoni bila matendo ya zamani kushikiliwa dhidi yao.
[Haki ya Kusahaulika](https://en.wikipedia.org/wiki/Right_to_be_forgotten) au [Haki ya Kufutwa](https://www.gdpreu.org/right-to-be-forgotten/) hutoa ulinzi wa ziada wa data ya kibinafsi kwa watumiaji. Hasa, inawapa watumiaji haki ya kuomba kufutwa au kuondolewa kwa data ya kibinafsi kutoka kwa utafutaji wa mtandao na maeneo mengine, _chini ya hali maalum_ - ikiwapa mwanzo mpya mtandaoni bila matendo ya zamani kushikiliwa dhidi yao.
Maswali ya kuchunguza hapa ni:
* Je, mfumo unaruhusu wahusika wa data kuomba kufutwa?
@ -126,7 +126,7 @@ Maswali ya kuchunguza hapa ni:
#### 2.6 Upendeleo wa Seti ya Data
Upendeleo wa seti ya data au [Upendeleo wa Ukusanyaji](http://researcharticles.com/index.php/bias-in-data-collection-in-research/) unahusu kuchagua sehemu _isiyowakilisha_ ya data kwa ajili ya maendeleo ya algorithimu, na kuunda kutokuwa na haki kwa matokeo ya matokeo kwa vikundi mbalimbali. Aina za upendeleo ni pamoja na upendeleo wa uteuzi au sampuli, upendeleo wa kujitolea, na upendeleo wa chombo.
Upendeleo wa seti ya data au [Upendeleo wa Ukusanyaji](http://researcharticles.com/index.php/bias-in-data-collection-in-research/) unahusu kuchagua sehemu _isiyowakilisha_ ya data kwa ajili ya maendeleo ya algoriti, na kuunda kutokuwa na haki kwa matokeo ya vikundi mbalimbali. Aina za upendeleo ni pamoja na upendeleo wa uteuzi au sampuli, upendeleo wa kujitolea, na upendeleo wa chombo.
Maswali ya kuchunguza hapa ni:
* Je, tulikusanya seti ya wahusika wa data inayowakilisha?
@ -135,69 +135,69 @@ Maswali ya kuchunguza hapa ni:
#### 2.7 Ubora wa Data
[Ubora wa Data](https://lakefs.io/data-quality-testing/) huangalia uhalali wa seti ya data iliyotunzwa inayotumika kuendeleza algorithimu zetu, ikichunguza kuona kama vipengele na rekodi zinakidhi mahitaji ya kiwango cha usahihi na uthabiti kinachohitajika kwa madhumuni yetu ya AI.
[Ubora wa Data](https://lakefs.io/data-quality-testing/) huangalia uhalali wa seti ya data iliyotunzwa inayotumika kuendeleza algoriti zetu, ikichunguza kuona kama vipengele na rekodi zinakidhi mahitaji ya kiwango cha usahihi na uthabiti kinachohitajika kwa madhumuni yetu ya AI.
Maswali ya kuchunguza hapa ni:
* Je, tulikamata vipengele halali kwa kesi yetu ya matumizi?
* Je, data ilikamatwa kwa _uthabiti_ katika vyanzo mbalimbali vya data?
*
[Algorithm Fairness](https://towardsdatascience.com/what-is-algorithm-fairness-3182e161cf9f) inachunguza kama muundo wa algorithimu unawabagua kwa mfumo maalum makundi fulani ya watu, na kusababisha [madhara yanayoweza kutokea](https://docs.microsoft.com/en-us/azure/machine-learning/concept-fairness-ml) katika _ugawaji_ (ambapo rasilimali zinanyimwa au hazitolewi kwa kundi hilo) na _ubora wa huduma_ (ambapo AI haifanyi kazi kwa usahihi kwa baadhi ya makundi kama inavyofanya kwa mengine).
* Je, tulikusanya vipengele halali kwa muktadha wetu?
* Je, data ilikusanywa kwa uthabiti kutoka kwa vyanzo mbalimbali vya data?
* Je, seti ya data ni kam
[Algorithm Fairness](https://towardsdatascience.com/what-is-algorithm-fairness-3182e161cf9f) inachunguza kama muundo wa algorithimu unawabagua kwa mfumo maalum makundi fulani ya watu, na kusababisha [madhara yanayowezekana](https://docs.microsoft.com/en-us/azure/machine-learning/concept-fairness-ml) katika _ugawaji_ (ambapo rasilimali zinanyimwa au hazitolewi kwa kundi hilo) na _ubora wa huduma_ (ambapo AI haifanyi kazi kwa usahihi kwa baadhi ya makundi kama inavyofanya kwa mengine).
Maswali ya kuzingatia hapa ni:
* Je, tulipima usahihi wa modeli kwa makundi na hali mbalimbali?
* Je, tulichunguza mfumo kwa madhara yanayoweza kutokea (mfano, ubaguzi)?
* Je, tulichunguza mfumo kwa madhara yanayowezekana (mfano, ubaguzi wa kijinsia)?
* Je, tunaweza kurekebisha data au kufundisha upya modeli ili kupunguza madhara yaliyotambuliwa?
Chunguza rasilimali kama [AI Fairness checklists](https://query.prod.cms.rt.microsoft.com/cms/api/am/binary/RE4t6dA) ili kujifunza zaidi.
#### 2.9 Upotoshaji
[Upotoshaji wa Data](https://www.sciencedirect.com/topics/computer-science/misrepresentation) unahusu kujiuliza kama tunawasilisha maarifa kutoka kwa data iliyoripotiwa kwa uaminifu kwa njia ya udanganyifu ili kuunga mkono simulizi inayotakiwa.
[Upotoshaji wa Data](https://www.sciencedirect.com/topics/computer-science/misrepresentation) unahusu kujiuliza kama tunawasilisha maarifa kutoka kwa data iliyoripotiwa kwa uaminifu kwa njia ya udanganyifu ili kuunga mkono simulizi fulani.
Maswali ya kuzingatia hapa ni:
* Je, tunaripoti data isiyo kamili au isiyo sahihi?
* Je, tunaonyesha data kwa njia inayosababisha hitimisho la kupotosha?
* Je, tunawasilisha data kwa njia inayosababisha hitimisho la kupotosha?
* Je, tunatumia mbinu za takwimu za kuchagua ili kudanganya matokeo?
* Je, kuna maelezo mbadala yanayoweza kutoa hitimisho tofauti?
#### 2.10 Uchaguzi Huru
[Udanganyifu wa Uchaguzi Huru](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice) hutokea pale ambapo "miundo ya uchaguzi" ya mfumo hutumia algorithimu za kufanya maamuzi kuwashawishi watu kuchukua matokeo yanayopendelewa huku wakionekana kuwa na chaguo na udhibiti. [Mifumo ya giza](https://www.darkpatterns.org/) inaweza kusababisha madhara ya kijamii na kiuchumi kwa watumiaji. Kwa kuwa maamuzi ya watumiaji yanaathiri wasifu wa tabia, vitendo hivi vinaweza kuendesha chaguo za baadaye ambazo zinaweza kuongeza au kupanua madhara haya.
#### 2.10 Uhuru wa Kuchagua
[Udanganyifu wa Uhuru wa Kuchagua](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice) hutokea pale ambapo "miundo ya uchaguzi" ya mfumo hutumia algorithimu za kufanya maamuzi kuwashawishi watu kuchukua matokeo yanayopendelewa huku wakionekana kuwa na chaguo na udhibiti. [Mifumo ya giza](https://www.darkpatterns.org/) inaweza kusababisha madhara ya kijamii na kiuchumi kwa watumiaji. Kwa kuwa maamuzi ya watumiaji yanaathiri wasifu wa tabia, vitendo hivi vinaweza kuendesha chaguo za baadaye na kuongeza au kupanua athari za madhara haya.
Maswali ya kuzingatia hapa ni:
* Je, mtumiaji alielewa athari za kufanya uchaguzi huo?
* Je, mtumiaji alielewa athari za kufanya chaguo hilo?
* Je, mtumiaji alikuwa na ufahamu wa chaguo (mbadala) na faida & hasara za kila moja?
* Je, mtumiaji anaweza kubatilisha uchaguzi uliofanywa kiotomatiki au ulioathiriwa baadaye?
* Je, mtumiaji anaweza kubadilisha chaguo lililoathiriwa au lililofanywa kiotomatiki baadaye?
### 3. Uchunguzi wa Matukio
### 3. Masomo ya Kesi
Ili kuweka changamoto hizi za kimaadili katika muktadha wa ulimwengu halisi, inasaidia kuangalia uchunguzi wa matukio unaoonyesha madhara na matokeo yanayoweza kutokea kwa watu binafsi na jamii, pale ambapo ukiukaji wa maadili hauzingatiwi.
Ili kuweka changamoto hizi za kimaadili katika muktadha wa ulimwengu halisi, inasaidia kuangalia masomo ya kesi yanayoonyesha madhara na matokeo yanayoweza kutokea kwa watu binafsi na jamii, pale ambapo ukiukaji wa maadili unapuuzwa.
Hapa kuna mifano kadhaa:
| Changamoto ya Maadili | Uchunguzi wa Tukio |
| Changamoto ya Maadili | Somo la Kesi |
|--- |--- |
| **Idhini ya Habari** | 1972 - [Tuskegee Syphilis Study](https://en.wikipedia.org/wiki/Tuskegee_Syphilis_Study) - Wanaume wa Kiafrika-Amerika waliokuwa washiriki wa utafiti waliahidiwa huduma ya matibabu _lakini walidanganywa_ na watafiti ambao hawakuwajulisha washiriki kuhusu utambuzi wao au upatikanaji wa matibabu. Washiriki wengi walikufa & wenzi au watoto waliathirika; utafiti ulidumu miaka 40. |
| **Idhini ya Habari** | 1972 - [Tuskegee Syphilis Study](https://en.wikipedia.org/wiki/Tuskegee_Syphilis_Study) - Wanaume wa Kiafrika-Amerika waliokuwa sehemu ya utafiti waliahidiwa huduma ya matibabu _lakini walidanganywa_ na watafiti ambao hawakuwajulisha kuhusu utambuzi wao au upatikanaji wa matibabu. Wengi walikufa & wenzi au watoto waliathirika; utafiti ulidumu kwa miaka 40. |
| **Faragha ya Data** | 2007 - [Netflix data prize](https://www.wired.com/2007/12/why-anonymous-data-sometimes-isnt/) iliwapa watafiti _alama za filamu milioni 10 zilizofichwa kutoka kwa wateja 50,000_ ili kusaidia kuboresha algorithimu za mapendekezo. Hata hivyo, watafiti waliweza kuhusisha data iliyofichwa na data inayotambulika kibinafsi katika _seti za data za nje_ (mfano, maoni ya IMDb) - kwa ufanisi "kufichua" baadhi ya wateja wa Netflix.|
| **Upendeleo wa Ukusanyaji** | 2013 - Jiji la Boston [liliunda Street Bump](https://www.boston.gov/transportation/street-bump), programu iliyowaruhusu raia kuripoti mashimo, ikilipa jiji data bora ya barabara kutambua na kurekebisha matatizo. Hata hivyo, [watu katika makundi ya kipato cha chini walikuwa na upatikanaji mdogo wa magari na simu](https://hbr.org/2013/04/the-hidden-biases-in-big-data), na kufanya matatizo yao ya barabara kuwa yasiyoonekana katika programu hii. Waendelezaji walifanya kazi na wasomi kushughulikia _masuala ya upatikanaji sawa na mgawanyiko wa kidijitali_ kwa haki. |
| **Haki ya Algorithimu** | 2018 - Utafiti wa MIT [Gender Shades Study](http://gendershades.org/overview.html) ulitathmini usahihi wa bidhaa za AI za uainishaji wa jinsia, ukifichua mapungufu ya usahihi kwa wanawake na watu wa rangi. [Kadi ya Apple ya 2019](https://www.wired.com/story/the-apple-card-didnt-see-genderand-thats-the-problem/) ilionekana kutoa mkopo mdogo kwa wanawake kuliko wanaume. Zote zilionyesha masuala ya upendeleo wa algorithimu yanayosababisha madhara ya kijamii na kiuchumi.|
| **Upotoshaji wa Data** | 2020 - [Idara ya Afya ya Georgia ilitoa chati za COVID-19](https://www.vox.com/covid-19-coronavirus-us-response-trump/2020/5/18/21262265/georgia-covid-19-cases-declining-reopening) ambazo zilionekana kupotosha raia kuhusu mwenendo wa kesi zilizothibitishwa kwa mpangilio usio wa kimaandishi kwenye mhimili wa x. Hii inaonyesha upotoshaji kupitia mbinu za kuonyesha. |
| **Udanganyifu wa uchaguzi huru** | 2020 - Programu ya kujifunza [ABCmouse ililipa $10M kumaliza malalamiko ya FTC](https://www.washingtonpost.com/business/2020/09/04/abcmouse-10-million-ftc-settlement/) ambapo wazazi walinaswa kulipa kwa usajili ambao hawakuweza kufuta. Hii inaonyesha mifumo ya giza katika miundo ya uchaguzi, ambapo watumiaji walishawishiwa kuchukua chaguo zinazoweza kuwa na madhara. |
| **Upendeleo wa Ukusanyaji** | 2013 - Jiji la Boston [liliunda Street Bump](https://www.boston.gov/transportation/street-bump), programu iliyowaruhusu raia kuripoti mashimo barabarani, ikilipa jiji data bora ya barabara kutambua na kurekebisha matatizo. Hata hivyo, [watu katika makundi ya kipato cha chini walikuwa na upatikanaji mdogo wa magari na simu](https://hbr.org/2013/04/the-hidden-biases-in-big-data), na kufanya matatizo yao ya barabara kuwa yasiyoonekana katika programu hii. Watengenezaji walifanya kazi na wasomi kushughulikia _masuala ya upatikanaji sawa na mgawanyiko wa kidijitali_ kwa haki. |
| **Haki ya Algorithimu** | 2018 - Utafiti wa MIT [Gender Shades Study](http://gendershades.org/overview.html) ulitathmini usahihi wa bidhaa za AI za uainishaji wa jinsia, ukionyesha mapungufu ya usahihi kwa wanawake na watu wa rangi. [Kadi ya Apple ya 2019](https://www.wired.com/story/the-apple-card-didnt-see-genderand-thats-the-problem/) ilionekana kutoa mkopo mdogo kwa wanawake kuliko wanaume. Zote zilionyesha masuala ya upendeleo wa algorithimu yanayosababisha madhara ya kijamii na kiuchumi.|
| **Upotoshaji wa Data** | 2020 - [Idara ya Afya ya Georgia ilitoa chati za COVID-19](https://www.vox.com/covid-19-coronavirus-us-response-trump/2020/5/18/21262265/georgia-covid-19-cases-declining-reopening) ambazo zilionekana kupotosha raia kuhusu mwenendo wa kesi zilizothibitishwa kwa mpangilio usio wa kronolojia kwenye mhimili wa x. Hii inaonyesha upotoshaji kupitia mbinu za taswira. |
| **Udanganyifu wa uhuru wa kuchagua** | 2020 - Programu ya kujifunza [ABCmouse ililipa $10M kutatua malalamiko ya FTC](https://www.washingtonpost.com/business/2020/09/04/abcmouse-10-million-ftc-settlement/) ambapo wazazi walinaswa kulipa kwa usajili ambao hawakuweza kufuta. Hii inaonyesha mifumo ya giza katika miundo ya uchaguzi, ambapo watumiaji walishawishiwa kuchagua chaguo zenye madhara. |
| **Faragha ya Data & Haki za Watumiaji** | 2021 - [Uvujaji wa Data wa Facebook](https://www.npr.org/2021/04/09/986005820/after-data-breach-exposes-530-million-facebook-says-it-will-not-notify-users) ulifichua data kutoka kwa watumiaji milioni 530, na kusababisha makubaliano ya $5B na FTC. Hata hivyo, ilikataa kuwajulisha watumiaji kuhusu uvujaji huo, ikikiuka haki za watumiaji kuhusu uwazi wa data na upatikanaji. |
Unataka kuchunguza uchunguzi zaidi wa matukio? Angalia rasilimali hizi:
Unataka kuchunguza masomo zaidi ya kesi? Angalia rasilimali hizi:
* [Ethics Unwrapped](https://ethicsunwrapped.utexas.edu/case-studies) - changamoto za maadili katika sekta mbalimbali.
* [Kozi ya Maadili ya Sayansi ya Data](https://www.coursera.org/learn/data-science-ethics#syllabus) - uchunguzi wa matukio muhimu unachunguzwa.
* [Mahali mambo yameenda vibaya](https://deon.drivendata.org/examples/) - orodha ya Deon yenye mifano.
* [Kozi ya Maadili ya Sayansi ya Data](https://www.coursera.org/learn/data-science-ethics#syllabus) - masomo ya kesi muhimu yanachunguzwa.
* [Mahali ambapo mambo yameenda vibaya](https://deon.drivendata.org/examples/) - orodha ya Deon yenye mifano.
> 🚨 Fikiria kuhusu uchunguzi wa matukio uliyoona - je, umewahi kukumbana au kuathiriwa na changamoto ya kimaadili kama hiyo maishani mwako? Je, unaweza kufikiria angalau uchunguzi mmoja wa tukio unaoonyesha mojawapo ya changamoto za kimaadili tulizojadili katika sehemu hii?
> 🚨 Fikiria kuhusu masomo ya kesi ambayo umeona - je, umewahi kukumbana au kuathiriwa na changamoto ya kimaadili kama hiyo maishani mwako? Je, unaweza kufikiria angalau somo moja la kesi linaloonyesha mojawapo ya changamoto za kimaadili tulizojadili katika sehemu hii?
## Maadili ya Kazi
Tumeelezea dhana za maadili, changamoto, na uchunguzi wa matukio katika muktadha wa ulimwengu halisi. Lakini tunaanzaje _kutumia_ kanuni na mazoea ya kimaadili katika miradi yetu? Na tunafanyaje _utekelezaji_ wa mazoea haya kwa utawala bora? Hebu tuchunguze suluhisho za ulimwengu halisi:
Tumeelezea dhana za maadili, changamoto, na masomo ya kesi katika muktadha wa ulimwengu halisi. Lakini tunaanzaje _kutumia_ kanuni na mazoea ya kimaadili katika miradi yetu? Na tunafanyaje _utekelezaji_ wa mazoea haya kwa utawala bora? Hebu tuchunguze suluhisho za ulimwengu halisi:
### 1. Kanuni za Kitaaluma
Kanuni za Kitaaluma zinatoa chaguo moja kwa mashirika "kuhamasisha" wanachama kuunga mkono kanuni zao za kimaadili na taarifa ya dhamira. Kanuni ni _miongozo ya kimaadili_ kwa tabia ya kitaaluma, kusaidia wafanyakazi au wanachama kufanya maamuzi yanayolingana na kanuni za shirika lao. Zinategemea utii wa hiari kutoka kwa wanachama; hata hivyo, mashirika mengi hutoa tuzo na adhabu za ziada kuhamasisha utii kutoka kwa wanachama.
Kanuni za Kitaaluma zinatoa chaguo moja kwa mashirika "kuwahamasisha" wanachama wao kuunga mkono kanuni za kimaadili na taarifa ya dhamira yao. Kanuni ni _miongozo ya kimaadili_ kwa tabia ya kitaaluma, ikiwasaidia wafanyakazi au wanachama kufanya maamuzi yanayolingana na kanuni za shirika lao. Zinategemea utiifu wa hiari kutoka kwa wanachama; hata hivyo, mashirika mengi hutoa motisha ya ziada na adhabu ili kuhamasisha utiifu kutoka kwa wanachama.
Mifano ni pamoja na:
@ -207,11 +207,11 @@ Mifano ni pamoja na:
> 🚨 Je, wewe ni mwanachama wa shirika la uhandisi au sayansi ya data? Chunguza tovuti yao ili kuona kama wanataja kanuni za kitaaluma za maadili. Hii inasema nini kuhusu kanuni zao za kimaadili? Wanahamasishaje wanachama kufuata kanuni hizo?
### 2. Orodha za Maadili
### 2. Orodha za Ukaguzi wa Maadili
Wakati kanuni za kitaaluma zinafafanua tabia ya _kimaadili_ inayohitajika kutoka kwa wataalamu, [zina mapungufu yanayojulikana](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md) katika utekelezaji, hasa katika miradi mikubwa. Badala yake, wataalamu wengi wa Sayansi ya Data [wanapendekeza orodha za ukaguzi](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md), ambazo zinaweza **kuunganisha kanuni na mazoea** kwa njia za kimaamuzi na zinazoweza kutekelezwa.
Wakati kanuni za kitaaluma zinafafanua tabia ya _kimaadili_ inayohitajika kutoka kwa wataalamu, [zina mapungufu yanayojulikana](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md) katika utekelezaji, hasa katika miradi mikubwa. Badala yake, wataalamu wengi wa Sayansi ya Data [wanapendekeza orodha za ukaguzi](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md), ambazo zinaweza **kuunganisha kanuni na mazoea** kwa njia za kivitendo na zinazoweza kutekelezwa.
Orodha za ukaguzi hubadilisha maswali kuwa kazi za "ndiyo/hapana" zinazoweza kutekelezwa, na kuruhusu kufuatiliwa kama sehemu ya mtiririko wa kazi wa kawaida wa kutolewa bidhaa.
Orodha za ukaguzi hubadilisha maswali kuwa kazi za "ndiyo/hapana" ambazo zinaweza kutekelezwa, na kuruhusu kufuatiliwa kama sehemu ya mtiririko wa kazi wa kawaida wa kutolewa kwa bidhaa.
Mifano ni pamoja na:
* [Deon](https://deon.drivendata.org/) - orodha ya ukaguzi ya maadili ya data ya matumizi ya jumla iliyoundwa kutoka kwa [mapendekezo ya sekta](https://deon.drivendata.org/#checklist-citations) na zana ya mstari wa amri kwa urahisi wa ujumuishaji.
@ -221,44 +221,44 @@ Mifano ni pamoja na:
### 3. Kanuni za Maadili
Maadili yanahusu kufafanua maadili ya pamoja na kufanya jambo sahihi _kwa hiari_. **Utii** unahusu _kufuata sheria_ ikiwa na pale inapofafanuliwa. **Utawala** kwa ujumla unahusu njia zote ambazo mashirika yanafanya kazi kutekeleza kanuni za kimaadili na kufuata sheria zilizowekwa.
Maadili yanahusu kufafanua maadili ya pamoja na kufanya jambo sahihi _kwa hiari_. **Utiifu** unahusu _kufuata sheria_ ikiwa na pale inapofafanuliwa. **Utawala** kwa ujumla unahusu njia zote ambazo mashirika yanafanya kazi kutekeleza kanuni za kimaadili na kufuata sheria zilizowekwa.
Leo, utawala unachukua aina mbili ndani ya mashirika. Kwanza, ni kuhusu kufafanua kanuni za **AI ya kimaadili** na kuanzisha mazoea ya kutekeleza kupitishwa kwa miradi yote inayohusiana na AI katika shirika. Pili, ni kuhusu kufuata kanuni zote za serikali zinazohitajika za **ulinzi wa data** kwa maeneo inayoendesha.
Leo, utawala unachukua aina mbili ndani ya mashirika. Kwanza, ni kuhusu kufafanua kanuni za **AI ya kimaadili** na kuanzisha mazoea ya kutekeleza kupitishwa kwa miradi yote inayohusiana na AI katika shirika. Pili, ni kuhusu kufuata kanuni zote za serikali zinazohitajika za **ulinzi wa data** kwa maeneo ambayo linafanya kazi.
Mifano ya kanuni za ulinzi wa data na faragha:
* `1974`, [US Privacy Act](https://www.justice.gov/opcl/privacy-act-1974) - inasimamia _serikali ya shirikisho_ ukusanyaji, matumizi, na ufichuzi wa taarifa za kibinafsi.
* `1996`, [US Health Insurance Portability & Accountability Act (HIPAA)](https://www.cdc.gov/phlp/publications/topic/hipaa.html) - inalinda data ya afya ya kibinafsi.
* `1998`, [US Children's Online Privacy Protection Act (COPPA)](https://www.ftc.gov/enforcement/rules/rulemaking-regulatory-reform-proceedings/childrens-online-privacy-protection-rule) - inalinda faragha ya data ya watoto chini ya miaka 13.
* `2018`, [General Data Protection Regulation (GDPR)](https://gdpr-info.eu/) - inatoa haki za watumiaji, ulinzi wa data, na faragha.
* `2018`, [California Consumer Privacy Act (CCPA)](https://www.oag.ca.gov/privacy/ccpa) inawapa watumiaji haki zaidi juu ya data yao (ya kibinafsi).
* `2021`, Sheria ya [Ulinzi wa Taarifa za Kibinafsi ya China](https://www.reuters.com/world/china/china-passes-new-personal-data-privacy-law-take-effect-nov-1-2021-08-20/) imepitishwa, ikianzisha mojawapo ya kanuni kali zaidi za faragha ya data mtandaoni duniani.
* `1974`, [Sheria ya Faragha ya Marekani](https://www.justice.gov/opcl/privacy-act-1974) - inasimamia _serikali ya shirikisho_ ukusanyaji, matumizi, na ufichuzi wa taarifa za kibinafsi.
* `1996`, [Sheria ya Bima ya Afya ya Marekani (HIPAA)](https://www.cdc.gov/phlp/publications/topic/hipaa.html) - inalinda data ya afya ya kibinafsi.
* `1998`, [Sheria ya Ulinzi wa Faragha Mtandaoni ya Watoto ya Marekani (COPPA)](https://www.ftc.gov/enforcement/rules/rulemaking-regulatory-reform-proceedings/childrens-online-privacy-protection-rule) - inalinda faragha ya data ya watoto chini ya miaka 13.
* `2018`, [Kanuni ya Ulinzi wa Data ya Jumla (GDPR)](https://gdpr-info.eu/) - inatoa haki za watumiaji, ulinzi wa data, na faragha.
* `2018`, [Sheria ya Faragha ya Watumiaji wa California (CCPA)](https://www.oag.ca.gov/privacy/ccpa) inawapa watumiaji haki zaidi juu ya data yao (ya kibinafsi).
* `2021`, Sheria ya [Ulinzi wa Taarifa za Kibinafsi ya China](https://www.reuters.com/world/china/china-passes-new-personal-data-privacy-law-take-effect-nov-1-2021-08-20/) ilipitishwa, ikianzisha mojawapo ya kanuni kali zaidi za faragha ya data mtandaoni duniani.
> 🚨 Umoja wa Ulaya ulifafanua GDPR (Kanuni ya Ulinzi wa Data ya Jumla) ambayo inabaki kuwa mojawapo ya kanuni zenye ushawishi mkubwa wa faragha ya data leo. Je, unajua pia inafafanua [haki 8 za watumiaji](https://www.freeprivacypolicy.com/blog/8-user-rights-gdpr) kulinda faragha ya kidijitali na data ya kibinafsi ya raia? Jifunze kuhusu haki hizi ni zipi, na kwa nini zinajali.
> 🚨 Umoja wa Ulaya ulifafanua GDPR (Kanuni ya Ulinzi wa Data ya Jumla) ambayo inabaki kuwa mojawapo ya kanuni zenye ushawishi mkubwa wa faragha ya data leo. Je, unajua pia inafafanua [haki 8 za watumiaji](https://www.freeprivacypolicy.com/blog/8-user-rights-gdpr) kulinda faragha ya kidijitali na data ya kibinafsi ya raia? Jifunze kuhusu haki hizi ni nini, na kwa nini zinajali.
### 4. Utamaduni wa Maadili
Kumbuka kuwa kuna pengo lisiloonekana kati ya _utii_ (kufanya vya kutosha kufikia "barua ya sheria") na kushughulikia [masuala ya kimfumo](https://www.coursera.org/learn/data-science-ethics/home/week/4) (kama ugumu, usawa wa taarifa, na kutokuwepo kwa usawa wa usambazaji) ambayo yanaweza kuharakisha silaha ya AI.
Kumbuka kuwa kuna pengo lisiloonekana kati ya _utiifu_ (kufanya vya kutosha kufikia "barua ya sheria") na kushughulikia [masuala ya kimfumo](https://www.coursera.org/learn/data-science-ethics/home/week/4) (kama ugumu wa mabadiliko, asymmetry ya taarifa, na kutokuwepo kwa usawa wa mgawanyo) ambayo yanaweza kuharakisha silaha ya AI.
Hili linahitaji [njia za ushirikiano za kufafanua utamaduni wa maadili](https://towardsdatascience.com/why-ai-ethics-requires-a-culture-driven-approach-26f451afa29f) zinazojenga uhusiano wa kihisia na maadili ya pamoja yanayolingana _katika mashirika_ katika sekta hiyo. Hii inahitaji zaidi [utamaduni rasmi wa maadili ya data](https://www.codeforamerica.org/news/formalizing-an-ethical-data-culture/) katika mashirika - kuruhusu _mtu yeyote_ [kuvuta kamba ya Andon](https://en.wikipedia.org/wiki/Andon_(manufacturing)) (kuibua wasiwasi wa kimaadili mapema katika mchakato) na kufanya _tathmini za kimaadili_ (mfano, katika kuajiri) kuwa kigezo cha msingi cha uundaji wa timu katika miradi ya AI.
Hili linahitaji [njia za ushirikiano za kufafanua utamaduni wa maadili](https://towardsdatascience.com/why-ai-ethics-requires-a-culture-driven-approach-26f451afa29f) zinazojenga uhusiano wa kihisia na maadili ya pamoja yanayolingana _katika mashirika_ katika sekta. Hii inahitaji zaidi [utamaduni rasmi wa maadili ya data](https://www.codeforamerica.org/news/formalizing-an-ethical-data-culture/) katika mashirika - kuruhusu _mtu yeyote_ [kuvuta kamba ya Andon](https://en.wikipedia.org/wiki/Andon_(manufacturing)) (kuibua wasiwasi wa kimaadili mapema katika mchakato) na kufanya _tathmini za kimaadili_ (mfano, katika kuajiri) kuwa kigezo cha msingi cha uundaji wa timu katika miradi ya AI.
---
## [Jaribio la baada ya somo](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/3) 🎯
## [Jaribio la baada ya somo](https://ff-quizzes.netlify.app/en/ds/) 🎯
## Mapitio & Kujisomea
Kozi na vitabu husaidia kuelewa dhana za msingi za maadili na changamoto, wakati uchunguzi wa matukio na zana husaidia na mazoea ya maadili yanayotumika katika muktadha wa ulimwengu halisi. Hapa kuna rasilimali chache za kuanza nazo.
Kozi na vitabu husaidia kuelewa dhana za msingi za maadili, changamoto, huku masomo ya kesi na zana zikisaidia mazoea ya maadili katika muktadha wa ulimwengu halisi. Hapa kuna rasilimali chache za kuanza nazo.
* [Machine Learning For Beginners](https://github.com/microsoft/ML-For-Beginners/blob/main/1-Introduction/3-fairness/README.md) - somo kuhusu Haki, kutoka Microsoft.
* [Kanuni za AI Inayowajibika](https://docs.microsoft.com/en-us/learn/modules/responsible-ai-principles/) - njia ya kujifunza bila malipo kutoka Microsoft Learn.
* [Maadili na Sayansi ya Takwimu](https://resources.oreilly.com/examples/0636920203964) - Kitabu cha O'Reilly (M. Loukides, H. Mason na wengineo)
* [Maadili ya Sayansi ya Takwimu](https://www.coursera.org/learn/data-science-ethics#syllabus) - kozi ya mtandaoni kutoka Chuo Kikuu cha Michigan.
* [Maadili Yaliyofafanuliwa](https://ethicsunwrapped.utexas.edu/case-studies) - masomo ya kesi kutoka Chuo Kikuu cha Texas.
* [Kanuni za AI Inayowajibika](https://docs.microsoft.com/en-us/learn/modules/responsible-ai-principles/) - njia ya kujifunza bila malipo kutoka Microsoft Learn.
* [Maadili na Sayansi ya Takwimu](https://resources.oreilly.com/examples/0636920203964) - Kitabu cha O'Reilly (M. Loukides, H. Mason et. al)
* [Maadili ya Sayansi ya Takwimu](https://www.coursera.org/learn/data-science-ethics#syllabus) - kozi ya mtandaoni kutoka Chuo Kikuu cha Michigan.
* [Maadili Yaliyofunguliwa](https://ethicsunwrapped.utexas.edu/case-studies) - masomo ya kesi kutoka Chuo Kikuu cha Texas.
# Kazi
# Kazi
[Andika Kisa cha Maadili ya Takwimu](assignment.md)
[Andika Utafiti wa Kesi Kuhusu Maadili ya Takwimu](assignment.md)
---
**Kanusho**:
Hati hii imetafsiriwa kwa kutumia huduma ya tafsiri ya AI [Co-op Translator](https://github.com/Azure/co-op-translator). Ingawa tunajitahidi kuhakikisha usahihi, tafadhali fahamu kuwa tafsiri za kiotomatiki zinaweza kuwa na makosa au kutokuwa sahihi. Hati asilia katika lugha yake ya awali inapaswa kuzingatiwa kama chanzo cha mamlaka. Kwa taarifa muhimu, tafsiri ya kitaalamu ya binadamu inapendekezwa. Hatutawajibika kwa kutoelewana au tafsiri zisizo sahihi zinazotokana na matumizi ya tafsiri hii.
Hati hii imetafsiriwa kwa kutumia huduma ya tafsiri ya AI [Co-op Translator](https://github.com/Azure/co-op-translator). Ingawa tunajitahidi kuhakikisha usahihi, tafsiri za kiotomatiki zinaweza kuwa na makosa au kutokuwa sahihi. Hati ya asili katika lugha yake ya awali inapaswa kuchukuliwa kama chanzo cha mamlaka. Kwa taarifa muhimu, tafsiri ya kitaalamu ya binadamu inapendekezwa. Hatutawajibika kwa kutoelewana au tafsiri zisizo sahihi zinazotokana na matumizi ya tafsiri hii.

@ -1,118 +1,119 @@
<!--
CO_OP_TRANSLATOR_METADATA:
{
"original_hash": "8796f41f566a0a8ebb72863a83d558ed",
"translation_date": "2025-08-26T21:19:22+00:00",
"original_hash": "3a34157cc63516eba97c89a0b2f8c3e6",
"translation_date": "2025-09-03T21:26:17+00:00",
"source_file": "1-Introduction/02-ethics/README.md",
"language_code": "th"
}
-->
# บทนำสู่จริยธรรมข้อมูล
|![ สเก็ตช์โน้ตโดย [(@sketchthedocs)](https://sketchthedocs.dev) ](../../sketchnotes/02-Ethics.png)|
|![ สเก็ตโน้ตโดย [(@sketchthedocs)](https://sketchthedocs.dev) ](../../sketchnotes/02-Ethics.png)|
|:---:|
| จริยธรรมข้อมูล - _สเก็ตช์โน้ตโดย [@nitya](https://twitter.com/nitya)_ |
| จริยธรรมวิทยาศาสตร์ข้อมูล - _สเก็ตโน้ตโดย [@nitya](https://twitter.com/nitya)_ |
---
เราทุกคนเป็นพลเมืองข้อมูลที่อาศัยอยู่ในโลกที่เต็มไปด้วยข้อมูล
แนวโน้มตลาดบอกเราว่าภายในปี 2022 องค์กรขนาดใหญ่ 1 ใน 3 จะซื้อและขายข้อมูลของพวกเขาผ่าน [ตลาดและการแลกเปลี่ยนออนไลน์](https://www.gartner.com/smarterwithgartner/gartner-top-10-trends-in-data-and-analytics-for-2020/) ในฐานะ **นักพัฒนาแอปพลิเคชัน** เราจะพบว่าการผสานข้อมูลเชิงลึกที่ขับเคลื่อนด้วยข้อมูลและระบบอัตโนมัติที่ขับเคลื่อนด้วยอัลกอริทึมเข้ากับประสบการณ์ผู้ใช้ในชีวิตประจำวันนั้นง่ายและถูกลง แต่เมื่อ AI กลายเป็นสิ่งที่แพร่หลาย เราก็ต้องเข้าใจถึงอันตรายที่อาจเกิดขึ้นจาก [การใช้อัลกอริทึมในทางที่ผิด](https://www.youtube.com/watch?v=TQHs8SA1qpk) ในระดับใหญ่ด้วย
แนวโน้มตลาดบอกเราว่า ภายในปี 2022 องค์กรขนาดใหญ่ 1 ใน 3 จะซื้อและขายข้อมูลของพวกเขาผ่าน [ตลาดและการแลกเปลี่ยนออนไลน์](https://www.gartner.com/smarterwithgartner/gartner-top-10-trends-in-data-and-analytics-for-2020/) ในฐานะ **นักพัฒนาแอปพลิเคชัน** เราจะพบว่าการผสานข้อมูลเชิงลึกที่ขับเคลื่อนด้วยข้อมูลและระบบอัตโนมัติที่ขับเคลื่อนด้วยอัลกอริทึมเข้ากับประสบการณ์ผู้ใช้ในชีวิตประจำวันนั้นง่ายและถูกลง แต่เมื่อ AI กลายเป็นสิ่งที่แพร่หลาย เราก็ต้องเข้าใจถึงอันตรายที่อาจเกิดขึ้นจาก [การใช้อัลกอริทึมในทางที่ผิด](https://www.youtube.com/watch?v=TQHs8SA1qpk) ในระดับใหญ่ด้วย
แนวโน้มยังชี้ให้เห็นว่าเราจะสร้างและบริโภคข้อมูลมากกว่า [180 เซตตะไบต์](https://www.statista.com/statistics/871513/worldwide-data-created/) ภายในปี 2025 ในฐานะ **นักวิทยาศาสตร์ข้อมูล** สิ่งนี้ทำให้เรามีโอกาสเข้าถึงข้อมูลส่วนบุคคลในระดับที่ไม่เคยมีมาก่อน ซึ่งหมายความว่าเราสามารถสร้างโปรไฟล์พฤติกรรมของผู้ใช้และมีอิทธิพลต่อการตัดสินใจในลักษณะที่สร้าง [ภาพลวงตาของการเลือกอย่างเสรี](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice) ในขณะเดียวกันก็อาจผลักดันผู้ใช้ไปสู่ผลลัพธ์ที่เราต้องการ นอกจากนี้ยังทำให้เกิดคำถามที่กว้างขึ้นเกี่ยวกับความเป็นส่วนตัวของข้อมูลและการคุ้มครองผู้ใช้
แนวโน้มยังชี้ให้เห็นว่าเราจะสร้างและบริโภคข้อมูลมากกว่า [180 เซตตะไบต์](https://www.statista.com/statistics/871513/worldwide-data-created/) ภายในปี 2025 ในฐานะ **นักวิทยาศาสตร์ข้อมูล** สิ่งนี้ทำให้เรามีระดับการเข้าถึงข้อมูลส่วนบุคคลที่ไม่เคยมีมาก่อน ซึ่งหมายความว่าเราสามารถสร้างโปรไฟล์พฤติกรรมของผู้ใช้และมีอิทธิพลต่อการตัดสินใจในลักษณะที่สร้าง [ภาพลวงตาของการเลือกอย่างอิสระ](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice) ในขณะเดียวกันก็อาจผลักดันผู้ใช้ไปสู่ผลลัพธ์ที่เราต้องการ นอกจากนี้ยังทำให้เกิดคำถามที่กว้างขึ้นเกี่ยวกับความเป็นส่วนตัวของข้อมูลและการปกป้องผู้ใช้
จริยธรรมข้อมูลในปัจจุบันเป็น _รั้วป้องกันที่จำเป็น_ สำหรับวิทยาศาสตร์ข้อมูลและวิศวกรรม โดยช่วยลดอันตรายที่อาจเกิดขึ้นและผลกระทบที่ไม่ได้ตั้งใจจากการกระทำที่ขับเคลื่อนด้วยข้อมูลของเรา [Gartner Hype Cycle for AI](https://www.gartner.com/smarterwithgartner/2-megatrends-dominate-the-gartner-hype-cycle-for-artificial-intelligence-2020/) ระบุแนวโน้มที่เกี่ยวข้องในด้านจริยธรรมดิจิทัล AI ที่รับผิดชอบ และการกำกับดูแล AI ว่าเป็นตัวขับเคลื่อนสำคัญสำหรับแนวโน้มใหญ่ที่เกี่ยวกับ _การทำให้เป็นประชาธิปไตย_ และ _การทำให้เป็นอุตสาหกรรม_ ของ AI
จริยธรรมข้อมูลจึงกลายเป็น _รั้วป้องกันที่จำเป็น_ สำหรับวิทยาศาสตร์ข้อมูลและวิศวกรรม ซึ่งช่วยลดอันตรายที่อาจเกิดขึ้นและผลกระทบที่ไม่ได้ตั้งใจจากการกระทำที่ขับเคลื่อนด้วยข้อมูลของเรา [Gartner Hype Cycle for AI](https://www.gartner.com/smarterwithgartner/2-megatrends-dominate-the-gartner-hype-cycle-for-artificial-intelligence-2020/) ระบุแนวโน้มที่เกี่ยวข้องในด้านจริยธรรมดิจิทัล AI ที่รับผิดชอบ และการกำกับดูแล AI เป็นตัวขับเคลื่อนสำคัญสำหรับแนวโน้มใหญ่ที่เกี่ยวกับ _การทำให้เป็นประชาธิปไตย_ และ _การทำให้เป็นอุตสาหกรรม_ ของ AI
![Gartner's Hype Cycle for AI - 2020](https://images-cdn.newscred.com/Zz1mOWJhNzlkNDA2ZTMxMWViYjRiOGFiM2IyMjQ1YmMwZQ==)
ในบทเรียนนี้ เราจะสำรวจพื้นที่ที่น่าสนใจของจริยธรรมข้อมูล ตั้งแต่แนวคิดหลักและความท้าทาย ไปจนถึงกรณีศึกษาและแนวคิด AI ประยุกต์ เช่น การกำกับดูแล ที่ช่วยสร้างวัฒนธรรมจริยธรรมในทีมและองค์กรที่ทำงานกับข้อมูลและ AI
ในบทเรียนนี้ เราจะสำรวจพื้นที่ที่น่าสนใจของจริยธรรมข้อมูล ตั้งแต่แนวคิดและความท้าทายหลัก ไปจนถึงกรณีศึกษาและแนวคิด AI ที่ประยุกต์ใช้ เช่น การกำกับดูแล ซึ่งช่วยสร้างวัฒนธรรมจริยธรรมในทีมและองค์กรที่ทำงานกับข้อมูลและ AI
## [แบบทดสอบก่อนการบรรยาย](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/2) 🎯
## คำจำกัดความพื้นฐาน
เริ่มต้นด้วยการทำความเข้าใจคำศัพท์พื้นฐานกันก่อน
เริ่มต้นด้วยการทำความเข้าใจคำศัพท์พื้นฐาน
คำว่า "จริยธรรม" มาจาก [คำภาษากรีก "ethikos"](https://en.wikipedia.org/wiki/Ethics) (และรากศัพท์ "ethos") ซึ่งหมายถึง _ลักษณะนิสัยหรือธรรมชาติทางศีลธรรม_
**จริยธรรม** เกี่ยวกับค่านิยมร่วมกันและหลักการทางศีลธรรมที่กำหนดพฤติกรรมของเราในสังคม จริยธรรมไม่ได้ขึ้นอยู่กับกฎหมาย แต่ขึ้นอยู่กับบรรทัดฐานที่ยอมรับกันอย่างกว้างขวางว่าอะไรคือ "ถูกหรือผิด" อย่างไรก็ตาม การพิจารณาด้านจริยธรรมสามารถมีอิทธิพลต่อการกำกับดูแลขององค์กรและกฎระเบียบของรัฐบาลที่สร้างแรงจูงใจให้ปฏิบัติตามมากขึ้น
**จริยธรรม** คือค่านิยมร่วมและหลักการทางศีลธรรมที่กำหนดพฤติกรรมของเราในสังคม จริยธรรมไม่ได้ขึ้นอยู่กับกฎหมาย แต่ขึ้นอยู่กับบรรทัดฐานที่ได้รับการยอมรับอย่างกว้างขวางว่าอะไรคือ "ถูก vs. ผิด" อย่างไรก็ตาม การพิจารณาด้านจริยธรรมสามารถมีอิทธิพลต่อการริเริ่มการกำกับดูแลองค์กรและกฎระเบียบของรัฐบาลที่สร้างแรงจูงใจเพิ่มเติมสำหรับการปฏิบัติตาม
**จริยธรรมข้อมูล** เป็น [สาขาใหม่ของจริยธรรม](https://royalsocietypublishing.org/doi/full/10.1098/rsta.2016.0360#sec-1) ที่ "ศึกษาและประเมินปัญหาทางศีลธรรมที่เกี่ยวข้องกับ _ข้อมูล อัลกอริทึม และการปฏิบัติที่เกี่ยวข้อง_" ในที่นี้ **"ข้อมูล"** มุ่งเน้นไปที่การกระทำที่เกี่ยวข้องกับการสร้าง การบันทึก การดูแล การประมวลผล การเผยแพร่ การแบ่งปัน และการใช้งาน **"อัลกอริทึม"** มุ่งเน้นไปที่ AI ตัวแทน การเรียนรู้ของเครื่อง และหุ่นยนต์ และ **"การปฏิบัติ"** มุ่งเน้นไปที่หัวข้อต่างๆ เช่น นวัตกรรมที่รับผิดชอบ การเขียนโปรแกรม การแฮ็ก และจรรยาบรรณ
**จริยธรรมข้อมูล** เป็น [สาขาใหม่ของจริยธรรม](https://royalsocietypublishing.org/doi/full/10.1098/rsta.2016.0360#sec-1) ที่ "ศึกษาและประเมินปัญหาทางศีลธรรมที่เกี่ยวข้องกับ _ข้อมูล อัลกอริทึม และการปฏิบัติที่เกี่ยวข้อง_" ในที่นี้ **"ข้อมูล"** มุ่งเน้นไปที่การกระทำที่เกี่ยวข้องกับการสร้าง การบันทึก การดูแล การประมวลผล การเผยแพร่ การแบ่งปัน และการใช้งาน **"อัลกอริทึม"** มุ่งเน้นไปที่ AI ตัวแทน การเรียนรู้ของเครื่อง และหุ่นยนต์ และ **"การปฏิบัติ"** มุ่งเน้นไปที่หัวข้อต่างๆ เช่น นวัตกรรมที่รับผิดชอบ การเขียนโปรแกรม การแฮ็ก และรหัสจริยธรรม
**จริยธรรมประยุกต์** คือ [การประยุกต์ใช้ข้อพิจารณาทางศีลธรรมในทางปฏิบัติ](https://en.wikipedia.org/wiki/Applied_ethics) เป็นกระบวนการตรวจสอบปัญหาด้านจริยธรรมในบริบทของ _การกระทำ ผลิตภัณฑ์ และกระบวนการในโลกแห่งความเป็นจริง_ และดำเนินการแก้ไขเพื่อให้สิ่งเหล่านี้ยังคงสอดคล้องกับค่านิยมทางจริยธรรมที่กำหนดไว้
**จริยธรรมประยุกต์** คือ [การประยุกต์ใช้การพิจารณาทางศีลธรรมในทางปฏิบัติ](https://en.wikipedia.org/wiki/Applied_ethics) เป็นกระบวนการตรวจสอบปัญหาด้านจริยธรรมอย่างแข็งขันในบริบทของ _การกระทำ ผลิตภัณฑ์ และกระบวนการในโลกแห่งความเป็นจริง_ และดำเนินการแก้ไขเพื่อให้แน่ใจว่าสิ่งเหล่านี้ยังคงสอดคล้องกับค่านิยมทางจริยธรรมที่กำหนดไว้
**วัฒนธรรมจริยธรรม** เกี่ยวกับ [_การทำให้จริยธรรมประยุกต์เป็นรูปธรรม_](https://hbr.org/2019/05/how-to-design-an-ethical-organization) เพื่อให้แน่ใจว่าหลักการและการปฏิบัติด้านจริยธรรมของเราได้รับการนำไปใช้อย่างสม่ำเสมอและขยายขอบเขตได้ทั่วทั้งองค์กร วัฒนธรรมจริยธรรมที่ประสบความสำเร็จจะกำหนดหลักการจริยธรรมทั่วทั้งองค์กร ให้แรงจูงใจที่มีความหมายสำหรับการปฏิบัติตาม และเสริมสร้างบรรทัดฐานด้านจริยธรรมโดยการสนับสนุนและขยายพฤติกรรมที่พึงประสงค์ในทุกระดับขององค์กร
**วัฒนธรรมจริยธรรม** คือการ [_ทำให้จริยธรรมประยุกต์เป็นรูปธรรม_](https://hbr.org/2019/05/how-to-design-an-ethical-organization) เพื่อให้แน่ใจว่าหลักการและการปฏิบัติทางจริยธรรมของเราได้รับการนำไปใช้อย่างสม่ำเสมอและขยายได้ทั่วทั้งองค์กร วัฒนธรรมจริยธรรมที่ประสบความสำเร็จจะกำหนดหลักการทางจริยธรรมทั่วทั้งองค์กร ให้แรงจูงใจที่มีความหมายสำหรับการปฏิบัติตาม และเสริมสร้างบรรทัดฐานทางจริยธรรมโดยการสนับสนุนและขยายพฤติกรรมที่ต้องการในทุกระดับขององค์กร
## แนวคิดด้านจริยธรรม
ในส่วนนี้ เราจะพูดถึงแนวคิดต่างๆ เช่น **ค่านิยมร่วมกัน** (หลักการ) และ **ความท้าทายด้านจริยธรรม** (ปัญหา) สำหรับจริยธรรมข้อมูล - และสำรวจ **กรณีศึกษา** ที่ช่วยให้คุณเข้าใจแนวคิดเหล่านี้ในบริบทของโลกแห่งความเป็นจริง
ในส่วนนี้ เราจะพูดถึงแนวคิด เช่น **ค่านิยมร่วม** (หลักการ) และ **ความท้าทายด้านจริยธรรม** (ปัญหา) สำหรับจริยธรรมข้อมูล และสำรวจ **กรณีศึกษา** ที่ช่วยให้คุณเข้าใจแนวคิดเหล่านี้ในบริบทของโลกแห่งความเป็นจริง
### 1. หลักการด้านจริยธรรม
กลยุทธ์จริยธรรมข้อมูลทุกกลยุทธ์เริ่มต้นด้วยการกำหนด _หลักการด้านจริยธรรม_ - "ค่านิยมร่วมกัน" ที่อธิบายพฤติกรรมที่ยอมรับได้ และชี้นำการกระทำที่สอดคล้องกันในโครงการข้อมูลและ AI ของเรา คุณสามารถกำหนดสิ่งเหล่านี้ในระดับบุคคลหรือทีม อย่างไรก็ตาม องค์กรขนาดใหญ่มักจะกำหนดสิ่งเหล่านี้ในแถลงการณ์พันธกิจหรือกรอบงาน _AI ที่มีจริยธรรม_ ซึ่งกำหนดในระดับองค์กรและบังคับใช้อย่างสม่ำเสมอในทุกทีม
กลยุทธ์จริยธรรมข้อมูลทุกอย่างเริ่มต้นด้วยการกำหนด _หลักการด้านจริยธรรม_ - "ค่านิยมร่วม" ที่อธิบายพฤติกรรมที่ยอมรับได้ และชี้นำการกระทำที่สอดคล้อง ในโครงการข้อมูลและ AI ของเรา คุณสามารถกำหนดสิ่งเหล่านี้ในระดับบุคคลหรือทีม อย่างไรก็ตาม องค์กรขนาดใหญ่มักจะกำหนดสิ่งเหล่านี้ในแถลงการณ์พันธกิจ AI ด้านจริยธรรม หรือกรอบงานที่กำหนดในระดับองค์กรและบังคับใช้อย่างสม่ำเสมอในทุกทีม
**ตัวอย่าง:** แถลงการณ์พันธกิจ [AI ที่รับผิดชอบ](https://www.microsoft.com/en-us/ai/responsible-ai) ของ Microsoft ระบุว่า: _"เรามุ่งมั่นที่จะพัฒนา AI โดยยึดหลักจริยธรรมที่ให้ความสำคัญกับผู้คนเป็นอันดับแรก"_ - โดยระบุหลักการจริยธรรม 6 ข้อในกรอบงานด้านล่าง:
**ตัวอย่าง:** แถลงการณ์พันธกิจ [AI ที่รับผิดชอบ](https://www.microsoft.com/en-us/ai/responsible-ai) ของ Microsoft อ่านว่า: _"เรามุ่งมั่นที่จะพัฒนา AI ที่ขับเคลื่อนด้วยหลักการทางจริยธรรมที่ให้ความสำคัญกับผู้คนเป็นอันดับแรก"_ - โดยระบุหลักการทางจริยธรรม 6 ข้อในกรอบงานด้านล่าง:
![AI ที่รับผิดชอบของ Microsoft](https://docs.microsoft.com/en-gb/azure/cognitive-services/personalizer/media/ethics-and-responsible-use/ai-values-future-computed.png)
มาสำรวจหลักการเหล่านี้กันสั้นๆ _ความโปร่งใส_ และ _ความรับผิดชอบ_ เป็นค่านิยมพื้นฐานที่หลักการอื่นๆ สร้างขึ้น - ดังนั้นเรามาเริ่มต้นที่นี่:
ลองสำรวจหลักการเหล่านี้กัน _ความโปร่งใส_ และ _ความรับผิดชอบ_ เป็นค่านิยมพื้นฐานที่หลักการอื่นๆ สร้างขึ้น - ดังนั้นเรามาเริ่มต้นที่นี่:
* [**ความรับผิดชอบ**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) ทำให้ผู้ปฏิบัติงาน _รับผิดชอบ_ ต่อการดำเนินงานด้านข้อมูลและ AI ของพวกเขา และการปฏิบัติตามหลักการจริยธรรมเหล่านี้
* [**ความโปร่งใส**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) ทำให้มั่นใจว่าการกระทำด้านข้อมูลและ AI นั้น _เข้าใจได้_ (ตีความได้) สำหรับผู้ใช้ โดยอธิบายว่าอะไรและทำไมเบื้องหลังการตัดสินใจ
* [**ความยุติธรรม**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1%3aprimaryr6) - มุ่งเน้นไปที่การทำให้มั่นใจว่า AI ปฏิบัติต่อ _ทุกคน_ อย่างยุติธรรม โดยจัดการกับอคติทางสังคม-เทคนิคที่เป็นระบบหรือโดยนัยในข้อมูลและระบบ
* [**ความน่าเชื่อถือและความปลอดภัย**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - ทำให้มั่นใจว่า AI มีพฤติกรรม _สอดคล้อง_ กับค่านิยมที่กำหนดไว้ ลดอันตรายที่อาจเกิดขึ้นหรือผลกระทบที่ไม่ได้ตั้งใจ
* [**ความเป็นส่วนตัวและความปลอดภัย**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - เกี่ยวกับการทำความเข้าใจแหล่งที่มาของข้อมูล และให้ _ความเป็นส่วนตัวของข้อมูลและการป้องกันที่เกี่ยวข้อง_ แก่ผู้ใช้
* [**การมีส่วนร่วม**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - เกี่ยวกับการออกแบบโซลูชัน AI ด้วยความตั้งใจ ปรับให้เหมาะสมเพื่อตอบสนอง _ความต้องการและความสามารถของมนุษย์ที่หลากหลาย_
* [**ความรับผิดชอบ**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) ทำให้ผู้ปฏิบัติงาน _รับผิดชอบ_ ต่อการดำเนินงานด้านข้อมูลและ AI ของพวกเขา และการปฏิบัติตามหลักการทางจริยธรรมเหล่านี้
* [**ความโปร่งใส**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) ทำให้การกระทำด้านข้อมูลและ AI _เข้าใจได้_ (ตีความได้) สำหรับผู้ใช้ โดยอธิบายว่าอะไรและทำไมเบื้องหลังการตัดสินใจ
* [**ความเป็นธรรม**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1%3aprimaryr6) - มุ่งเน้นไปที่การทำให้ AI ปฏิบัติต่อ _ทุกคน_ อย่างเป็นธรรม โดยแก้ไขอคติทางสังคม-เทคนิคที่เป็นระบบหรือโดยนัยในข้อมูลและระบบ
* [**ความน่าเชื่อถือและความปลอดภัย**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - ทำให้ AI มีพฤติกรรม _สอดคล้อง_ กับค่านิยมที่กำหนด ลดอันตรายที่อาจเกิดขึ้นหรือผลกระทบที่ไม่ได้ตั้งใจ
* [**ความเป็นส่วนตัวและความปลอดภัย**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - เกี่ยวกับการทำความเข้าใจสายข้อมูล และให้ _ความเป็นส่วนตัวของข้อมูลและการปกป้องที่เกี่ยวข้อง_ แก่ผู้ใช้
* [**การมีส่วนร่วม**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - เกี่ยวกับการออกแบบโซลูชัน AI ด้วยความตั้งใจ ปรับให้เหมาะสมกับ _ความต้องการและความสามารถของมนุษย์ที่หลากหลาย_
> 🚨 ลองคิดดูว่าแถลงการณ์พันธกิจจริยธรรมข้อมูลของคุณจะเป็นอย่างไร สำรวจกรอบงาน AI ที่มีจริยธรรมจากองค์กรอื่นๆ - นี่คือตัวอย่างจาก [IBM](https://www.ibm.com/cloud/learn/ai-ethics), [Google](https://ai.google/principles), และ [Facebook](https://ai.facebook.com/blog/facebooks-five-pillars-of-responsible-ai/) ค่านิยมร่วมกันที่พวกเขามีเหมือนกันคืออะไร? หลักการเหล่านี้เกี่ยวข้องกับผลิตภัณฑ์ AI หรืออุตสาหกรรมที่พวกเขาดำเนินการอย่างไร?
> 🚨 ลองคิดดูว่าคำแถลงพันธกิจจริยธรรมข้อมูลของคุณจะเป็นอย่างไร สำรวจกรอบงาน AI ด้านจริยธรรมจากองค์กรอื่นๆ - นี่คือตัวอย่างจาก [IBM](https://www.ibm.com/cloud/learn/ai-ethics), [Google](https://ai.google/principles), และ [Facebook](https://ai.facebook.com/blog/facebooks-five-pillars-of-responsible-ai/) ค่านิยมร่วมที่พวกเขามีเหมือนกันคืออะไร? หลักการเหล่านี้เกี่ยวข้องกับผลิตภัณฑ์ AI หรืออุตสาหกรรมที่พวกเขาดำเนินการอย่างไร?
### 2. ความท้าทายด้านจริยธรรม
เมื่อเรากำหนดหลักการจริยธรรมแล้ว ขั้นตอนต่อไปคือการประเมินการกระทำด้านข้อมูลและ AI ของเราเพื่อดูว่าพวกมันสอดคล้องกับค่านิยมร่วมกันเหล่านั้นหรือไม่ ลองคิดถึงการกระทำของคุณในสองหมวดหมู่: _การเก็บรวบรวมข้อมูล_ และ _การออกแบบอัลกอริทึม_
เมื่อเรากำหนดหลักการทางจริยธรรมแล้ว ขั้นตอนต่อไปคือการประเมินการกระทำด้านข้อมูลและ AI ของเราเพื่อดูว่ามันสอดคล้องกับค่านิยมร่วมเหล่านั้นหรือไม่ ลองคิดถึงการกระทำของคุณในสองหมวดหมู่: _การเก็บรวบรวมข้อมูล_ และ _การออกแบบอัลกอริทึม_
ในการเก็บรวบรวมข้อมูล การกระทำมักจะเกี่ยวข้องกับ **ข้อมูลส่วนบุคคล** หรือข้อมูลที่สามารถระบุตัวบุคคลได้ (PII) สำหรับบุคคลที่สามารถระบุตัวตนได้ ซึ่งรวมถึง [รายการข้อมูลที่ไม่ใช่ส่วนบุคคลที่หลากหลาย](https://ec.europa.eu/info/law/law-topic/data-protection/reform/what-personal-data_en) ที่ _รวมกัน_ สามารถระบุตัวบุคคลได้ ความท้าทายด้านจริยธรรมอาจเกี่ยวข้องกับ _ความเป็นส่วนตัวของข้อมูล_ _การเป็นเจ้าของข้อมูล_ และหัวข้อที่เกี่ยวข้อง เช่น _การยินยอมที่ได้รับการแจ้ง_ และ _สิทธิในทรัพย์สินทางปัญญา_ ของผู้ใช้
ในการเก็บรวบรวมข้อมูล การกระทำมักจะเกี่ยวข้องกับ **ข้อมูลส่วนบุคคล** หรือข้อมูลที่สามารถระบุตัวบุคคลได้ (PII) สำหรับบุคคลที่สามารถระบุตัวตนได้ ซึ่งรวมถึง [รายการข้อมูลที่ไม่ใช่ข้อมูลส่วนบุคคลที่หลากหลาย](https://ec.europa.eu/info/law/law-topic/data-protection/reform/what-personal-data_en) ที่ _รวมกัน_ สามารถระบุตัวบุคคลได้ ความท้าทายด้านจริยธรรมอาจเกี่ยวข้องกับ _ความเป็นส่วนตัวของข้อมูล_ _การเป็นเจ้าของข้อมูล_ และหัวข้อที่เกี่ยวข้อง เช่น _การยินยอมที่ได้รับการแจ้ง_ และ _สิทธิในทรัพย์สินทางปัญญา_ สำหรับผู้ใช้
ในการออกแบบอัลกอริทึม การกระทำจะเกี่ยวข้องกับการเก็บรวบรวมและดูแล **ชุดข้อมูล** จากนั้นใช้ชุดข้อมูลเหล่านี้เพื่อฝึกอบรมและปรับใช้ **โมเดลข้อมูล** ที่คาดการณ์ผลลัพธ์หรือทำการตัดสินใจอัตโนมัติในบริบทของโลกแห่งความเป็นจริง ความท้าทายด้านจริยธรรมอาจเกิดจาก _อคติในชุดข้อมูล_ _ปัญหาคุณภาพของข้อมูล_ _ความไม่ยุติธรรม_ และ _การบิดเบือน_ ในอัลกอริทึม - รวมถึงปัญหาบางอย่างที่เป็นระบบ
ในการออกแบบอัลกอริทึม การกระทำจะเกี่ยวข้องกับการเก็บรวบรวมและดูแล **ชุดข้อมูล** จากนั้นใช้ชุดข้อมูลเหล่านั้นเพื่อฝึกและปรับใช้ **โมเดลข้อมูล** ที่คาดการณ์ผลลัพธ์หรือทำการตัดสินใจอัตโนมัติในบริบทของโลกแห่งความเป็นจริง ความท้าทายด้านจริยธรรมอาจเกิดจาก _อคติในชุดข้อมูล_ _ปัญหาคุณภาพของข้อมูล_ _ความไม่เป็นธรรม_ และ _การบิดเบือน_ ในอัลกอริทึม - รวมถึงปัญหาบางอย่างที่เป็นระบบในธรรมชาติ
ในทั้งสองกรณี ความท้าทายด้านจริยธรรมเน้นพื้นที่ที่การกระทำของเราอาจขัดแย้งกับค่านิยมร่วมกันของเรา เพื่อที่จะตรวจจับ บรรเทา ลด หรือกำจัดข้อกังวลเหล่านี้ - เราจำเป็นต้องตั้งคำถามทางศีลธรรม "ใช่/ไม่ใช่" ที่เกี่ยวข้องกับการกระทำของเรา จากนั้นดำเนินการแก้ไขตามความจำเป็น มาดูความท้าทายด้านจริยธรรมบางประการและคำถามทางศีลธรรมที่พวกมันก่อให้เกิด:
ในทั้งสองกรณี ความท้าทายด้านจริยธรรมเน้นพื้นที่ที่การกระทำของเราอาจขัดแย้งกับค่านิยมร่วมของเรา เพื่อที่จะตรวจจับ ลดผลกระทบ ลด หรือกำจัดข้อกังวลเหล่านี้ - เราจำเป็นต้องตั้งคำถามทางศีลธรรม "ใช่/ไม่ใช่" ที่เกี่ยวข้องกับการกระทำของเรา จากนั้นดำเนินการแก้ไขตามความจำเป็น ลองมาดูความท้าทายด้านจริยธรรมบางประการและคำถามทางศีลธรรมที่พวกเขาเรียกร้อง:
#### 2.1 การเป็นเจ้าของข้อมูล
การเก็บรวบรวมข้อมูลมักเกี่ยวข้องกับข้อมูลส่วนบุคคลที่สามารถระบุตัวตนของเจ้าของข้อมูลได้ [การเป็นเจ้าของข้อมูล](https://permission.io/blog/data-ownership) หมายถึง _การควบคุม_ และ [_สิทธิของผู้ใช้_](https://permission.io/blog/data-ownership) ที่เกี่ยวข้องกับการสร้าง การประมวลผล และการเผยแพร่ข้อมูล
การเก็บรวบรวมข้อมูลมักเกี่ยวข้องกับข้อมูลส่วนบุคคลที่สามารถระบุตัวตนของผู้ให้ข้อมูล [การเป็นเจ้าของข้อมูล](https://permission.io/blog/data-ownership) เกี่ยวกับ _การควบคุม_ และ [_สิทธิของผู้ใช้_](https://permission.io/blog/data-ownership) ที่เกี่ยวข้องกับการสร้าง การประมวลผล และการเผยแพร่ข้อมูล
คำถามทางศีลธรรมที่เราต้องถามคือ:
* ใครเป็นเจ้าของข้อมูล? (ผู้ใช้หรือองค์กร)
* เจ้าของข้อมูลมีสิทธิอะไรบ้าง? (เช่น การเข้าถึง การลบ การพกพา)
* องค์กรมีสิทธิอะไรบ้าง? (เช่น การแก้ไขรีวิวที่เป็นอันตราย)
* ผู้ให้ข้อมูลมีสิทธิ์อะไรบ้าง? (เช่น การเข้าถึง การลบ การพกพา)
* องค์กรมีสิทธิอะไรบ้าง? (เช่น การแก้ไขรีวิวผู้ใช้ที่เป็นอันตราย)
#### 2.2 การยินยอมที่ได้รับการแจ้ง
[การยินยอมที่ได้รับการแจ้ง](https://legaldictionary.net/informed-consent/) หมายถึงการกระทำที่ผู้ใช้ยอมรับการกระทำ (เช่น การเก็บข้อมูล) โดยมี _ความเข้าใจอย่างเต็มที่_ เกี่ยวกับข้อเท็จจริงที่เกี่ยวข้อง รวมถึงวัตถุประสงค์ ความเสี่ยงที่อาจเกิดขึ้น และทางเลือกอื่นๆ
[การยินยอมที่ได้รับการแจ้ง](https://legaldictionary.net/informed-consent/) หมายถึงการกระทำที่ผู้ใช้ตกลงที่จะดำเนินการ (เช่น การเก็บข้อมูล) โดยมี _ความเข้าใจอย่างเต็มที่_ เกี่ยวกับข้อเท็จจริงที่เกี่ยวข้อง รวมถึงวัตถุประสงค์ ความเสี่ยงที่อาจเกิดขึ้น และทางเลือกอื่นๆ
คำถามที่ควรสำรวจในที่นี้คือ:
* ผู้ใช้ (เจ้าของข้อมูล) ให้อนุญาตสำหรับการเก็บและการใช้ข้อมูลหรือไม่?
* ผู้ใช้เข้าใจวัตถุประสงค์ที่เก็บข้อมูลหรือไม่?
คำถามที่ต้องสำรวจในที่นี้คือ:
* ผู้ใช้ (ผู้ให้ข้อมูล) ให้อนุญาตสำหรับการเก็บและการใช้ข้อมูลหรือไม่?
* ผู้ใช้เข้าใจวัตถุประสงค์ที่ข้อมูลนั้นถูกเก็บหรือไม่?
* ผู้ใช้เข้าใจความเสี่ยงที่อาจเกิดขึ้นจากการมีส่วนร่วมของพวกเขาหรือไม่?
#### 2.3 ทรัพย์สินทางปัญญา
[ทรัพย์สินทางปัญญา](https://en.wikipedia.org/wiki/Intellectual_property) หมายถึงการสร้างสรรค์ที่จับต้องไม่ได้ซึ่งเกิดจากความคิดริเริ่มของมนุษย์ ซึ่งอาจ _มีมูลค่าทางเศรษฐกิจ_ ต่อบุคคลหรือธุรกิจ
คำถามที่ควรสำรวจในที่นี้คือ:
คำถามที่ต้องสำรวจในที่นี้คือ:
* ข้อมูลที่เก็บรวบรวมมีมูลค่าทางเศรษฐกิจต่อผู้ใช้หรือธุรกิจหรือไม่?
* **ผู้ใช้** มีทรัพย์สินทางปัญญาในที่นี้หรือไม่?
* **องค์กร** มีทรัพย์สินทางปัญญาในที่นี้หรือไม่?
* หากสิทธิ์เหล่านี้มีอยู่ เราปกป้องสิทธิ์เหล่านี้อย่างไร?
* หากสิทธิ์เหล่านี้มีอยู่ เรากำลังปกป้องสิทธิ์เหล่านี้อย่างไร?
#### 2.4 ความเป็นส่วนตัวของข้อมูล
[ความเป็นส่วนตัวของข้อมูล](https://www.northeastern.edu/graduate/blog/what-is-data-privacy/) หรือความเป็นส่วนตัวของข้อมูลหมายถึงการรักษาความเป็นส่วนตัวของผู้ใช้และการปกป้องตัวตนของผู้ใช้เกี่ยวกับข้อมูลที่สามารถระบุตัวบุคคลได้
[ความเป็นส่วนตัวของข้อมูล](https://www.northeastern.edu/graduate/blog/what-is-data-privacy/) หรือความเป็นส่วนตัวของข้อมูลหมายถึงการรักษาความเป็นส่วนตัวของผู้ใช้และการปกป้องตัวตนของผู้ใช้เกี่ยวกับข้อมูลที่สามารถระบุตัวตนได้
คำถามที่ควรสำรวจในที่นี้คือ:
* ข้อมูลส่วนบุคคลของผู้ใช้ปลอดภัยจากการแฮ็กและการรั่วไหลหรือไม่?
* ข้อมูลของผู้ใช้สามารถเข้าถึงได้เฉพาะผู้ใช้ที่ได้รับอนุญาตและบริบทที่เหมาะสมหรือไม่?
* การไม่ระบุตัวตนของผู้ใช้ได้รับการรักษาไว้เมื่อมีการแบ่งปัน
[Algorithm Fairness](https://towardsdatascience.com/what-is-algorithm-fairness-3182e161cf9f) คือการตรวจสอบว่า การออกแบบอัลกอริทึมมีการเลือกปฏิบัติต่อกลุ่มย่อยของข้อมูลอย่างเป็นระบบหรือไม่ ซึ่งอาจนำไปสู่ [ผลกระทบที่อาจเกิดขึ้น](https://docs.microsoft.com/en-us/azure/machine-learning/concept-fairness-ml) ในเรื่องของ _การจัดสรรทรัพยากร_ (ที่ทรัพยากรถูกปฏิเสธหรือถูกระงับจากกลุ่มนั้น) และ _คุณภาพของบริการ_ (ที่ AI มีความแม่นยำไม่เท่ากันสำหรับกลุ่มย่อยต่าง ๆ)
คำถามที่ต้องสำรวจในที่นี้คือ:
* ข้อมูลส่วนบุคคลของผู้ใช้ได้รับการปกป้องจากการแฮ็กและการรั่วไหลหรือไม่?
* ข้อมูลของผู้ใช้สามารถเข้าถึงได้เฉพาะผู้ใช้ที่ได้รับอนุญาตและบริบทที่ได้รับอนุญาตหรือไม่?
* การไม่เปิดเผยตัวตนของผู้ใช้ได้รับการรักษาไว้เมื่อข้อมูลถูกแบ่งปันหรือเผยแพร่หรือไม่?
* ผู้ใช้สามารถถูกลบออกจากชุดข้อมูลที่ไม่ระบุตัวตนได้หรือไม่
[Algorithm Fairness](https://towardsdatascience.com/what-is-algorithm-fairness-3182e161cf9f) คือการตรวจสอบว่า การออกแบบอัลกอริทึมมีการเลือกปฏิบัติต่อกลุ่มย่อยเฉพาะของข้อมูลหรือไม่ ซึ่งอาจนำไปสู่ [ผลกระทบที่อาจเกิดขึ้น](https://docs.microsoft.com/en-us/azure/machine-learning/concept-fairness-ml) ในเรื่อง _การจัดสรรทรัพยากร_ (ที่ทรัพยากรถูกปฏิเสธหรือไม่ถูกมอบให้กับกลุ่มนั้น) และ _คุณภาพของบริการ_ (ที่ AI มีความแม่นยำไม่เท่ากันสำหรับกลุ่มย่อยต่าง ๆ)
คำถามที่ควรพิจารณา:
* เราได้ประเมินความแม่นยำของโมเดลสำหรับกลุ่มย่อยและเงื่อนไขที่หลากหลายหรือไม่?
@ -127,12 +128,12 @@ CO_OP_TRANSLATOR_METADATA:
คำถามที่ควรพิจารณา:
* เรากำลังรายงานข้อมูลที่ไม่ครบถ้วนหรือไม่ถูกต้องหรือไม่?
* เรากำลังแสดงข้อมูลในลักษณะที่นำไปสู่ข้อสรุปที่ทำให้เข้าใจผิดหรือไม่?
* เรากำลังใช้เทคนิคทางสถิติที่เลือกสรรเพื่อปรับเปลี่ยนผลลัพธ์หรือไม่?
* เรากำลังแสดงภาพข้อมูลในลักษณะที่นำไปสู่ข้อสรุปที่ผิดพลาดหรือไม่?
* เรากำลังใช้เทคนิคทางสถิติที่เลือกเฉพาะเพื่อปรับเปลี่ยนผลลัพธ์หรือไม่?
* มีคำอธิบายทางเลือกอื่นที่อาจนำไปสู่ข้อสรุปที่แตกต่างหรือไม่?
#### 2.10 การเลือกอย่างอิสระ
[Illusion of Free Choice](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice) เกิดขึ้นเมื่อ "สถาปัตยกรรมการเลือก" ของระบบใช้อัลกอริทึมการตัดสินใจเพื่อชักจูงให้ผู้คนเลือกผลลัพธ์ที่ต้องการ ในขณะที่ดูเหมือนว่าพวกเขามีตัวเลือกและการควบคุม [รูปแบบมืด](https://www.darkpatterns.org/) เหล่านี้สามารถก่อให้เกิดผลกระทบทางสังคมและเศรษฐกิจต่อผู้ใช้ เนื่องจากการตัดสินใจของผู้ใช้ส่งผลต่อโปรไฟล์พฤติกรรม การกระทำเหล่านี้อาจผลักดันการเลือกในอนาคตที่ขยายผลกระทบของความเสียหายเหล่านี้
[Illusion of Free Choice](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice) เกิดขึ้นเมื่อ "สถาปัตยกรรมการเลือก" ของระบบใช้อัลกอริทึมการตัดสินใจเพื่อชักจูงให้ผู้คนเลือกผลลัพธ์ที่ต้องการ ในขณะที่ดูเหมือนว่าพวกเขามีตัวเลือกและการควบคุม สิ่งเหล่านี้เรียกว่า [dark patterns](https://www.darkpatterns.org/) ซึ่งอาจก่อให้เกิดผลกระทบทางสังคมและเศรษฐกิจต่อผู้ใช้ การตัดสินใจของผู้ใช้ส่งผลต่อโปรไฟล์พฤติกรรม ซึ่งอาจขับเคลื่อนการเลือกในอนาคตและขยายผลกระทบของความเสียหายเหล่านี้
คำถามที่ควรพิจารณา:
* ผู้ใช้เข้าใจผลกระทบของการเลือกนั้นหรือไม่?
@ -141,26 +142,26 @@ CO_OP_TRANSLATOR_METADATA:
### 3. กรณีศึกษา
เพื่อให้เข้าใจความท้าทายด้านจริยธรรมในบริบทของโลกจริง การศึกษากรณีที่แสดงให้เห็นถึงผลกระทบและผลลัพธ์ที่อาจเกิดขึ้นต่อบุคคลและสังคมเมื่อการละเมิดจริยธรรมถูกมองข้ามจะช่วยได้
เพื่อทำความเข้าใจความท้าทายด้านจริยธรรมในบริบทของโลกจริง การศึกษากรณีที่แสดงให้เห็นถึงผลกระทบและผลลัพธ์ที่อาจเกิดขึ้นต่อบุคคลและสังคมเมื่อการละเมิดจริยธรรมถูกมองข้ามจะช่วยได้
ตัวอย่างบางส่วน:
| ความท้าทายด้านจริยธรรม | กรณีศึกษา |
|--- |--- |
| **การยินยอมโดยได้รับข้อมูล** | 1972 - [Tuskegee Syphilis Study](https://en.wikipedia.org/wiki/Tuskegee_Syphilis_Study) - ผู้ชายชาวแอฟริกันอเมริกันที่เข้าร่วมการศึกษานี้ได้รับสัญญาว่าจะได้รับการดูแลทางการแพทย์ฟรี _แต่ถูกหลอกลวง_ โดยนักวิจัยที่ไม่แจ้งให้ทราบถึงการวินิจฉัยหรือการรักษาที่มีอยู่ ผู้เข้าร่วมหลายคนเสียชีวิต และคู่สมรสหรือบุตรได้รับผลกระทบ การศึกษานี้ดำเนินไปเป็นเวลา 40 ปี |
| **ความเป็นส่วนตัวของข้อมูล** | 2007 - [Netflix data prize](https://www.wired.com/2007/12/why-anonymous-data-sometimes-isnt/) ให้ข้อมูลการจัดอันดับภาพยนตร์ที่ไม่ระบุตัวตนจำนวน _10 ล้านรายการจากลูกค้า 50,000 คน_ เพื่อช่วยปรับปรุงอัลกอริทึมการแนะนำ อย่างไรก็ตาม นักวิจัยสามารถเชื่อมโยงข้อมูลที่ไม่ระบุตัวตนกับข้อมูลที่สามารถระบุตัวตนได้ใน _ชุดข้อมูลภายนอก_ (เช่น ความคิดเห็นใน IMDb) ซึ่งทำให้สามารถ "ระบุตัวตน" ผู้ใช้ Netflix บางคนได้ |
| **อคติในการเก็บข้อมูล** | 2013 - เมืองบอสตัน [พัฒนา Street Bump](https://www.boston.gov/transportation/street-bump) แอปที่ให้พลเมืองรายงานหลุมบ่อ เพื่อให้เมืองมีข้อมูลถนนที่ดีขึ้นในการแก้ไขปัญหา อย่างไรก็ตาม [ผู้คนในกลุ่มรายได้ต่ำมีการเข้าถึงรถยนต์และโทรศัพท์น้อยกว่า](https://hbr.org/2013/04/the-hidden-biases-in-big-data) ทำให้ปัญหาถนนของพวกเขาไม่ปรากฏในแอปนี้ นักพัฒนาร่วมมือกับนักวิชาการเพื่อแก้ไขปัญหา _การเข้าถึงที่เท่าเทียมและช่องว่างทางดิจิทัล_ เพื่อความเป็นธรรม |
| **ความเป็นธรรมของอัลกอริทึม** | 2018 - MIT [Gender Shades Study](http://gendershades.org/overview.html) ประเมินความแม่นยำของผลิตภัณฑ์ AI ที่จำแนกเพศ เผยให้เห็นช่องว่างในความแม่นยำสำหรับผู้หญิงและคนผิวสี [Apple Card ปี 2019](https://www.wired.com/story/the-apple-card-didnt-see-genderand-thats-the-problem/) ดูเหมือนจะให้เครดิตน้อยกว่ากับผู้หญิงเมื่อเทียบกับผู้ชาย ทั้งสองกรณีแสดงให้เห็นถึงปัญหาอคติในอัลกอริทึมที่นำไปสู่ผลกระทบทางเศรษฐกิจและสังคม |
| **การบิดเบือนข้อมูล** | 2020 - [กรมสาธารณสุขจอร์เจียเผยแพร่แผนภูมิ COVID-19](https://www.vox.com/covid-19-coronavirus-us-response-trump/2020/5/18/21262265/georgia-covid-19-cases-declining-reopening) ที่ดูเหมือนจะทำให้ประชาชนเข้าใจผิดเกี่ยวกับแนวโน้มของจำนวนผู้ป่วยที่ได้รับการยืนยัน โดยการจัดลำดับแกน x ที่ไม่เป็นไปตามลำดับเวลา ซึ่งแสดงให้เห็นถึงการบิดเบือนผ่านเทคนิคการแสดงภาพ |
| **ภาพลวงตาของการเลือกอย่างอิสระ** | 2020 - แอปการเรียนรู้ [ABCmouse จ่ายเงิน 10 ล้านดอลลาร์เพื่อยุติข้อร้องเรียนของ FTC](https://www.washingtonpost.com/business/2020/09/04/abcmouse-10-million-ftc-settlement/) ที่ผู้ปกครองถูกบังคับให้จ่ายเงินสำหรับการสมัครสมาชิกที่ไม่สามารถยกเลิกได้ ซึ่งแสดงให้เห็นถึงรูปแบบมืดในสถาปัตยกรรมการเลือก ที่ผู้ใช้ถูกชักจูงไปสู่การเลือกที่อาจเป็นอันตราย |
| **ความเป็นส่วนตัวของข้อมูลและสิทธิของผู้ใช้** | 2021 - [การละเมิดข้อมูล Facebook](https://www.npr.org/2021/04/09/986005820/after-data-breach-exposes-530-million-facebook-says-it-will-not-notify-users) เปิดเผยข้อมูลจากผู้ใช้ 530 ล้านคน ส่งผลให้มีการยุติคดีด้วยเงิน 5 พันล้านดอลลาร์กับ FTC อย่างไรก็ตาม Facebook ปฏิเสธที่จะแจ้งเตือนผู้ใช้เกี่ยวกับการละเมิด ซึ่งเป็นการละเมิดสิทธิของผู้ใช้เกี่ยวกับความโปร่งใสและการเข้าถึงข้อมูล |
| **ความเป็นส่วนตัวของข้อมูล** | 2007 - [Netflix data prize](https://www.wired.com/2007/12/why-anonymous-data-sometimes-isnt/) มอบข้อมูลการจัดอันดับภาพยนตร์ที่ไม่ระบุตัวตนจำนวน _10 ล้านรายการจากลูกค้า 50,000 คน_ ให้กับนักวิจัยเพื่อปรับปรุงอัลกอริทึมการแนะนำ อย่างไรก็ตาม นักวิจัยสามารถเชื่อมโยงข้อมูลที่ไม่ระบุตัวตนกับข้อมูลที่สามารถระบุตัวตนได้ใน _ชุดข้อมูลภายนอก_ (เช่น ความคิดเห็นใน IMDb) ซึ่งทำให้สามารถ "ระบุตัวตน" ของสมาชิก Netflix บางคนได้ |
| **อคติในการเก็บข้อมูล** | 2013 - เมืองบอสตัน [พัฒนา Street Bump](https://www.boston.gov/transportation/street-bump) แอปที่ให้พลเมืองรายงานหลุมบ่อ เพื่อให้เมืองมีข้อมูลถนนที่ดีขึ้นในการแก้ไขปัญหา อย่างไรก็ตาม [ผู้คนในกลุ่มรายได้ต่ำมีการเข้าถึงรถยนต์และโทรศัพท์น้อยกว่า](https://hbr.org/2013/04/the-hidden-biases-in-big-data) ทำให้ปัญหาถนนของพวกเขาไม่ปรากฏในแอปนี้ นักพัฒนาได้ทำงานร่วมกับนักวิชาการเพื่อแก้ไขปัญหา _การเข้าถึงที่เท่าเทียมและช่องว่างทางดิจิทัล_ เพื่อความเป็นธรรม |
| **ความเป็นธรรมของอัลกอริทึม** | 2018 - MIT [Gender Shades Study](http://gendershades.org/overview.html) ประเมินความแม่นยำของผลิตภัณฑ์ AI ที่จำแนกเพศ โดยเปิดเผยช่องว่างในความแม่นยำสำหรับผู้หญิงและคนผิวสี [Apple Card ปี 2019](https://www.wired.com/story/the-apple-card-didnt-see-genderand-thats-the-problem/) ดูเหมือนจะให้เครดิตน้อยกว่ากับผู้หญิงเมื่อเทียบกับผู้ชาย ทั้งสองกรณีแสดงให้เห็นถึงปัญหาอคติในอัลกอริทึมที่นำไปสู่ผลกระทบทางเศรษฐกิจและสังคม |
| **การบิดเบือนข้อมูล** | 2020 - [กรมสาธารณสุขจอร์เจียเผยแพร่แผนภูมิ COVID-19](https://www.vox.com/covid-19-coronavirus-us-response-trump/2020/5/18/21262265/georgia-covid-19-cases-declining-reopening) ที่ดูเหมือนจะทำให้ประชาชนเข้าใจผิดเกี่ยวกับแนวโน้มของจำนวนผู้ป่วยที่ได้รับการยืนยัน โดยการจัดลำดับแกน x ที่ไม่เป็นไปตามลำดับเวลา ซึ่งแสดงให้เห็นถึงการบิดเบือนผ่านเทคนิคการแสดงภาพ |
| **ภาพลวงตาของการเลือกอย่างอิสระ** | 2020 - แอปการเรียนรู้ [ABCmouse จ่ายเงิน 10 ล้านดอลลาร์เพื่อยุติข้อร้องเรียนของ FTC](https://www.washingtonpost.com/business/2020/09/04/abcmouse-10-million-ftc-settlement/) ซึ่งผู้ปกครองถูกบังคับให้จ่ายเงินสำหรับการสมัครสมาชิกที่ไม่สามารถยกเลิกได้ กรณีนี้แสดงให้เห็นถึง dark patterns ในสถาปัตยกรรมการเลือก ที่ผู้ใช้ถูกชักจูงไปสู่การเลือกที่อาจเป็นอันตราย |
| **ความเป็นส่วนตัวของข้อมูลและสิทธิของผู้ใช้** | 2021 - [การละเมิดข้อมูล Facebook](https://www.npr.org/2021/04/09/986005820/after-data-breach-exposes-530-million-facebook-says-it-will-not-notify-users) เปิดเผยข้อมูลจากผู้ใช้ 530 ล้านคน ส่งผลให้เกิดการยุติคดีมูลค่า 5 พันล้านดอลลาร์กับ FTC อย่างไรก็ตาม Facebook ปฏิเสธที่จะแจ้งผู้ใช้เกี่ยวกับการละเมิด ซึ่งเป็นการละเมิดสิทธิของผู้ใช้เกี่ยวกับความโปร่งใสและการเข้าถึงข้อมูล |
ต้องการสำรวจกรณีศึกษาเพิ่มเติม? ลองดูแหล่งข้อมูลเหล่านี้:
* [Ethics Unwrapped](https://ethicsunwrapped.utexas.edu/case-studies) - ภาวะที่กลืนไม่เข้าคายไม่ออกด้านจริยธรรมในอุตสาหกรรมต่าง ๆ
* [Data Science Ethics course](https://www.coursera.org/learn/data-science-ethics#syllabus) - กรณีศึกษาสำคัญที่ถูกสำรวจ
* [Where things have gone wrong](https://deon.drivendata.org/examples/) - รายการตรวจสอบ Deon พร้อมตัวอย่าง
> 🚨 ลองคิดถึงกรณีศึกษาที่คุณเคยเห็น - คุณเคยประสบหรือได้รับผลกระทบจากความท้าทายด้านจริยธรรมที่คล้ายกันในชีวิตของคุณหรือไม่? คุณสามารถคิดถึงกรณีศึกษาอื่นอย่างน้อยหนึ่งกรณีที่แสดงให้เห็นถึงหนึ่งในความท้าทายด้านจริยธรรมที่เราได้พูดถึงในส่วนนี้หรือไม่?
> 🚨 ลองคิดถึงกรณีศึกษาที่คุณเคยเห็น - คุณเคยประสบหรือได้รับผลกระทบจากความท้าทายด้านจริยธรรมที่คล้ายกันในชีวิตของคุณหรือไม่? คุณสามารถคิดถึงกรณีศึกษาอื่นที่แสดงให้เห็นถึงหนึ่งในความท้าทายด้านจริยธรรมที่เราได้พูดถึงในส่วนนี้ได้หรือไม่?
## จริยธรรมประยุกต์
@ -168,50 +169,50 @@ CO_OP_TRANSLATOR_METADATA:
### 1. รหัสวิชาชีพ
รหัสวิชาชีพเป็นตัวเลือกหนึ่งสำหรับองค์กรในการ "จูงใจ" สมาชิกให้สนับสนุนหลักการด้านจริยธรรมและพันธกิจขององค์กร รหัสเหล่านี้เป็น _แนวทางทางศีลธรรม_ สำหรับพฤติกรรมวิชาชีพ ช่วยให้พนักงานหรือสมาชิกตัดสินใจที่สอดคล้องกับหลักการขององค์กร รหัสเหล่านี้จะมีประสิทธิภาพเท่ากับการปฏิบัติตามโดยสมัครใจของสมาชิก อย่างไรก็ตาม หลายองค์กรมีรางวัลและบทลงโทษเพิ่มเติมเพื่อกระตุ้นการปฏิบัติตามของสมาชิก
รหัสวิชาชีพเป็นตัวเลือกหนึ่งสำหรับองค์กรในการ "จูงใจ" สมาชิกให้สนับสนุนหลักการด้านจริยธรรมและพันธกิจขององค์กร รหัสเหล่านี้เป็น _แนวทางทางศีลธรรม_ สำหรับพฤติกรรมวิชาชีพ ช่วยให้พนักงานหรือสมาชิกตัดสินใจที่สอดคล้องกับหลักการขององค์กร อย่างไรก็ตาม รหัสเหล่านี้จะมีประสิทธิภาพเท่ากับการปฏิบัติตามโดยสมัครใจจากสมาชิกเท่านั้น หลายองค์กรจึงเสนอรางวัลและบทลงโทษเพิ่มเติมเพื่อกระตุ้นการปฏิบัติตาม
ตัวอย่าง:
* [Oxford Munich](http://www.code-of-ethics.org/code-of-conduct/) Code of Ethics
* [Data Science Association](http://datascienceassn.org/code-of-conduct.html) Code of Conduct (สร้างขึ้นในปี 2013)
* [ACM Code of Ethics and Professional Conduct](https://www.acm.org/code-of-ethics) (ตั้งแต่ปี 1993)
> 🚨 คุณเป็นสมาชิกขององค์กรวิศวกรรมหรือวิทยาศาสตร์ข้อมูลวิชาชีพหรือไม่? สำรวจเว็บไซต์ของพวกเขาเพื่อดูว่าพวกเขากำหนดรหัสจริยธรรมวิชาชีพหรือไม่ สิ่งนี้บอกอะไรเกี่ยวกับหลักการด้านจริยธรรมของพวกเขา? พวกเขา "จูงใจ" สมาชิกให้ปฏิบัติตามรหัสอย่างไร?
> 🚨 คุณเป็นสมาชิกขององค์กรวิศวกรรมหรือวิทยาศาสตร์ข้อมูลวิชาชีพหรือไม่? ลองสำรวจเว็บไซต์ของพวกเขาเพื่อดูว่าพวกเขากำหนดรหัสจริยธรรมวิชาชีพหรือไม่ สิ่งนี้บอกอะไรเกี่ยวกับหลักการด้านจริยธรรมของพวกเขา? พวกเขา "จูงใจ" สมาชิกให้ปฏิบัติตามรหัสอย่างไร?
### 2. รายการตรวจสอบด้านจริยธรรม
ในขณะที่รหัสวิชาชีพกำหนด _พฤติกรรมด้านจริยธรรม_ ที่จำเป็นจากผู้ปฏิบัติงาน แต่ [มีข้อจำกัดที่ทราบกันดี](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md) ในการบังคับใช้ โดยเฉพาะในโครงการขนาดใหญ่ ผู้เชี่ยวชาญด้านวิทยาศาสตร์ข้อมูลหลายคน [สนับสนุนการใช้รายการตรวจสอบ](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md) ซึ่งสามารถ **เชื่อมโยงหลักการกับแนวปฏิบัติ** ในลักษณะที่กำหนดและนำไปปฏิบัติได้จริงมากขึ้น
ในขณะที่รหัสวิชาชีพกำหนดพฤติกรรม _ด้านจริยธรรม_ ที่จำเป็นจากผู้ปฏิบัติงาน แต่ [มีข้อจำกัดที่ทราบกันดี](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md) ในการบังคับใช้ โดยเฉพาะในโครงการขนาดใหญ่ ผู้เชี่ยวชาญด้านวิทยาศาสตร์ข้อมูลหลายคน [สนับสนุนการใช้รายการตรวจสอบ](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md) ซึ่งสามารถ **เชื่อมโยงหลักการกับแนวปฏิบัติ** ในลักษณะที่กำหนดและนำไปปฏิบัติได้
รายการตรวจสอบเปลี่ยนคำถามให้เป็นงาน "ใช่/ไม่ใช่" ที่สามารถนำไปปฏิบัติได้ ทำให้สามารถติดตามได้เป็นส่วนหนึ่งของกระบวนการปล่อยผลิตภัณฑ์มาตรฐาน
ตัวอย่าง:
* [Deon](https://deon.drivendata.org/) - รายการตรวจสอบจริยธรรมข้อมูลทั่วไปที่สร้างขึ้นจาก [คำแนะนำในอุตสาหกรรม](https://deon.drivendata.org/#checklist-citations) พร้อมเครื่องมือบรรทัดคำสั่งสำหรับการผสานรวมที่ง่ายดาย
* [Privacy Audit Checklist](https://cyber.harvard.edu/ecommerce/privacyaudit.html) - ให้คำแนะนำทั่วไปสำหรับแนวปฏิบัติในการจัดการข้อมูลจากมุมมองทางกฎหมายและสังคม
* [AI Fairness Checklist](https://www.microsoft.com/en-us/research/project/ai-fairness-checklist/) - สร้างโดยผู้ปฏิบัติงานด้าน AI เพื่อสนับสนุนการนำการตรวจสอบความเป็นธรรมไปใช้ในวงจรการพัฒนา AI
* [22 questions for ethics in data and AI](https://medium.com/the-organization/22-questions-for-ethics-in-data-and-ai-efb68fd19429) - กรอบงานที่เปิดกว้างมากขึ้น โครงสร้างสำหรับการสำรวจเบื้องต้นเกี่ยวกับปัญหาด้านจริยธรรมในด้านการออกแบบ การดำเนินการ และบริบทขององค์กร
* [Privacy Audit Checklist](https://cyber.harvard.edu/ecommerce/privacyaudit.html) - ให้คำแนะนำทั่วไปสำหรับแนวปฏิบัติการจัดการข้อมูลจากมุมมองทางกฎหมายและสังคม
* [AI Fairness Checklist](https://www.microsoft.com/en-us/research/project/ai-fairness-checklist/) - สร้างขึ้นโดยผู้ปฏิบัติงาน AI เพื่อสนับสนุนการนำการตรวจสอบความเป็นธรรมไปใช้ในวงจรการพัฒนา AI
* [22 questions for ethics in data and AI](https://medium.com/the-organization/22-questions-for-ethics-in-data-and-ai-efb68fd19429) - กรอบงานที่เปิดกว้างมากขึ้น ซึ่งมีโครงสร้างสำหรับการสำรวจเบื้องต้นเกี่ยวกับปัญหาด้านจริยธรรมในบริบทของการออกแบบ การดำเนินการ และองค์กร
### 3. กฎระเบียบด้านจริยธรรม
จริยธรรมเกี่ยวกับการกำหนดค่านิยมร่วมกันและการทำสิ่งที่ถูกต้อง _โดยสมัครใจ_ **การปฏิบัติตาม** เกี่ยวกับ _การปฏิบัติตามกฎหมาย_ หากมีการกำหนดไว้ **การกำกับดูแล** ครอบคลุมวิธีการทั้งหมดที่องค์กรดำเนินการเพื่อบังคับใช้หลักการด้านจริยธรรมและปฏิบัติตามกฎหมายที่กำหนดไว้
จริยธรรมเกี่ยวกับการกำหนดค่านิยมร่วมกันและการทำสิ่งที่ถูกต้อง _โดยสมัครใจ_ **การปฏิบัติตาม** คือการ _ปฏิบัติตามกฎหมาย_ หากมีการกำหนดไว้ **การกำกับดูแล** ครอบคลุมวิธีการทั้งหมดที่องค์กรดำเนินการเพื่อบังคับใช้หลักการด้านจริยธรรมและปฏิบัติตามกฎหมายที่กำหนดไว้
ปัจจุบัน การกำกับดูแลมีสองรูปแบบในองค์กร ประการแรกคือการกำหนดหลักการ **AI ด้านจริยธรรม** และสร้างแนวปฏิบัติเพื่อทำให้การนำไปใช้เป็นระบบในทุกโครงการที่เกี่ยวข้องกับ AI ในองค์กร ประการที่สองคือการปฏิบัติตาม **กฎระเบียบการคุ้มครองข้อมูล** ที่รัฐบาลกำหนดสำหรับภูมิภาคที่องค์กรดำเนินการอยู่
ตัวอย่างกฎระเบียบการคุ้มครองข้อมูลและความเป็นส่วนตัว:
* `1974`, [US Privacy Act](https://www.justice.gov/opcl/privacy-act-1974) - ควบคุมการรวบรวม การใช้ และการเปิดเผยข้อมูลส่วนบุคคลของ _รัฐบาลกลาง_
* `1974`, [US Privacy Act](https://www.justice.gov/opcl/privacy-act-1974) - ควบคุมการเก็บรวบรวม การใช้ และการเปิดเผยข้อมูลส่วนบุคคลของ _รัฐบาลกลาง_
* `1996`, [US Health Insurance Portability & Accountability Act (HIPAA)](https://www.cdc.gov/phlp/publications/topic/hipaa.html) - ปกป้องข้อมูลสุขภาพส่วนบุคคล
* `1998`, [US Children's Online Privacy Protection Act (COPPA)](https://www.ftc.gov/enforcement/rules/rulemaking-regulatory-reform-proceedings/childrens-online-privacy-protection-rule) - ปกป้องความเป็นส่วนตัวของข้อมูลเด็กอายุต่ำกว่า 13 ปี
* `2018`, [General Data Protection Regulation (GDPR)](https://gdpr-info.eu/) - ให้สิทธิผู้ใช้ การคุ้มครองข้อมูล และความเป็นส่วนตัว
* `2018`, [California Consumer Privacy Act (CCPA)](https://www.oag.ca.gov/privacy/ccpa) - ให้สิทธิผู้บริโภคมากขึ้นเกี่ยวกับข้อมูล (ส่วนบุคคล) ของพวกเขา
* `2021`, [กฎหมายคุ้มครองข้อมูลส่วนบุคคลของจีน](https://www.reuters.com/world/china/china-passes-new-personal-data-privacy-law-take-effect-nov-1-2021-08-20/) เพิ่งผ่าน ซึ่งเป็นหนึ่งในกฎระเบียบความเป็นส่วนตัวออนไลน์ที่เข้มงวดที่สุดในโลก
> 🚨 สหภาพยุโรปกำหนด GDPR (General Data Protection Regulation) ซึ่งยังคงเป็นหนึ่งในกฎระเบียบความเป็นส่วนตัวของข้อมูลที่มีอิทธิพลมากที่สุดในปัจจุบัน คุณทราบหรือไม่ว่ามันยังกำหนด [8 สิทธิของผู้ใช้](https://www.freeprivacypolicy.com/blog/8-user-rights-gdpr) เพื่อปกป้องความเป็นส่วนตัวทางดิจิทัลและข้อมูลส่วนบุคคลของพลเมือง? เรียนรู้เกี่ยวกับสิ่งเหล่านี้และเหตุผลที่สำคัญ
> 🚨 สหภาพยุโรปกำหนด GDPR (General Data Protection Regulation) ซึ่งยังคงเป็นหนึ่งในกฎระเบียบความเป็นส่วนตัวของข้อมูลที่มีอิทธิพลมากที่สุดในปัจจุบัน คุณทราบหรือไม่ว่า GDPR ยังกำหนด [8 สิทธิของผู้ใช้](https://www.freeprivacypolicy.com/blog/8-user-rights-gdpr) เพื่อปกป้องความเป็นส่วนตัวทางดิจิทัลและข้อมูลส่วนบุคคลของพลเมือง? เรียนรู้เกี่ยวกับสิ่งเหล่านี้และเหตุผลที่สำคัญ
### 4. วัฒนธรรมด้านจริยธรรม
โปรดทราบว่ายังคงมีช่องว่างที่จับต้องไม่ได้ระหว่าง _การปฏิบัติตาม_ (การทำให้เพียงพอเพื่อให้เป็นไปตาม "ตัวอักษรของกฎหมาย") และการแก้ไข [ปัญหาระบบ](https://www.coursera.org/learn/data-science-ethics/home/week/4) (เช่น การแข็งตัวของระบบ ความไม่สมดุลของข้อมูล และความไม่เป็นธรรมในการกระจาย) ที่สามารถเร่งการใช้งาน AI ในทางที่ผิด
โปรดทราบว่ายังมีช่องว่างที่จับต้องไม่ได้ระหว่าง _การปฏิบัติตาม_ (การทำเพียงพอเพื่อให้เป็นไปตาม "ตัวอักษรของกฎหมาย") และการแก้ไข [ปัญหาระบบ](https://www.coursera.org/learn/data-science-ethics/home/week/4) (เช่น การแข็งตัวของระบบ ความไม่สมดุลของข้อมูล และความไม่เป็นธรรมในการกระจาย) ที่สามารถเร่งการใช้งาน AI ในทางที่ผิด
สิ่งหลังนี้
การแก้ไขปัญหาระบบต้องการ [แนวทางการทำ
* [หลักการของ AI ที่มีความรับผิดชอบ](https://docs.microsoft.com/en-us/learn/modules/responsible-ai-principles/) - เส้นทางการเรียนรู้ฟรีจาก Microsoft Learn
* [จริยธรรมและวิทยาศาสตร์ข้อมูล](https://resources.oreilly.com/examples/0636920203964) - หนังสืออิเล็กทรอนิกส์จาก O'Reilly (M. Loukides, H. Mason และคณะ)
* [จริยธรรมและวิทยาศาสตร์ข้อมูล](https://resources.oreilly.com/examples/0636920203964) - หนังสืออิเล็กทรอนิกส์จาก O'Reilly (M. Loukides, H. Mason และคนอื่น ๆ)
* [จริยธรรมในวิทยาศาสตร์ข้อมูล](https://www.coursera.org/learn/data-science-ethics#syllabus) - คอร์สออนไลน์จากมหาวิทยาลัยมิชิแกน
* [Ethics Unwrapped](https://ethicsunwrapped.utexas.edu/case-studies) - กรณีศึกษาจากมหาวิทยาลัยเท็กซัส

@ -1,8 +1,8 @@
<!--
CO_OP_TRANSLATOR_METADATA:
{
"original_hash": "8796f41f566a0a8ebb72863a83d558ed",
"translation_date": "2025-08-28T02:46:34+00:00",
"original_hash": "3a34157cc63516eba97c89a0b2f8c3e6",
"translation_date": "2025-09-03T21:39:41+00:00",
"source_file": "1-Introduction/02-ethics/README.md",
"language_code": "tl"
}
@ -15,169 +15,176 @@ CO_OP_TRANSLATOR_METADATA:
---
Tayo ay mga mamamayan ng datos na nabubuhay sa isang mundong puno ng datos.
Tayo ay mga mamamayan ng datos na nabubuhay sa isang mundo na puno ng datos.
Ayon sa mga trend sa merkado, sa 2022, 1 sa bawat 3 malalaking organisasyon ay bibili at magbebenta ng kanilang datos sa pamamagitan ng mga online na [Pamilihan at Palitan](https://www.gartner.com/smarterwithgartner/gartner-top-10-trends-in-data-and-analytics-for-2020/). Bilang mga **App Developers**, mas madali at mas mura para sa atin ang pagsasama ng mga insight na batay sa datos at automation na pinapatakbo ng algorithm sa pang-araw-araw na karanasan ng mga gumagamit. Ngunit habang nagiging laganap ang AI, kailangan din nating maunawaan ang mga posibleng pinsala na dulot ng [weaponization](https://www.youtube.com/watch?v=TQHs8SA1qpk) ng mga algorithm na ito sa malawakang saklaw.
Ayon sa mga trend ng merkado, sa taong 2022, 1 sa bawat 3 malalaking organisasyon ay bibili at magbebenta ng kanilang datos sa pamamagitan ng online na [Marketplaces at Exchanges](https://www.gartner.com/smarterwithgartner/gartner-top-10-trends-in-data-and-analytics-for-2020/). Bilang mga **App Developers**, mas madali at mas mura para sa atin na isama ang mga insight na nakabatay sa datos at automation na pinapatakbo ng algorithm sa pang-araw-araw na karanasan ng mga gumagamit. Ngunit habang nagiging laganap ang AI, kailangan din nating maunawaan ang mga posibleng pinsala na dulot ng [weaponization](https://www.youtube.com/watch?v=TQHs8SA1qpk) ng ganitong mga algorithm sa malawakang saklaw.
Ipinapakita rin ng mga trend na makakalikha at makakakonsumo tayo ng higit sa [180 zettabytes](https://www.statista.com/statistics/871513/worldwide-data-created/) ng datos pagsapit ng 2025. Bilang mga **Data Scientists**, nagbibigay ito sa atin ng walang kapantay na antas ng access sa personal na datos. Nangangahulugan ito na maaari tayong bumuo ng mga profile ng pag-uugali ng mga gumagamit at maimpluwensyahan ang kanilang mga desisyon sa paraang lumilikha ng isang [ilusyon ng malayang pagpili](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice) habang maaaring itinutulak sila patungo sa mga resulta na ating nais. Nagdudulot din ito ng mas malawak na mga tanong tungkol sa privacy ng datos at proteksyon ng mga gumagamit.
Ipinapakita rin ng mga trend na tayo ay lilikha at gagamit ng mahigit [180 zettabytes](https://www.statista.com/statistics/871513/worldwide-data-created/) ng datos sa taong 2025. Bilang mga **Data Scientists**, nagbibigay ito sa atin ng walang kapantay na antas ng access sa personal na datos. Nangangahulugan ito na maaari tayong bumuo ng mga behavioral profile ng mga gumagamit at impluwensyahan ang kanilang mga desisyon sa paraang lumilikha ng [ilusyon ng malayang pagpili](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice) habang posibleng itinutulak sila sa mga resulta na mas gusto natin. Nagdudulot din ito ng mas malawak na mga tanong tungkol sa privacy ng datos at proteksyon ng mga gumagamit.
Ang etika ng datos ay ngayon ay _mga kinakailangang gabay_ para sa agham at inhinyeriya ng datos, na tumutulong sa atin na mabawasan ang mga posibleng pinsala at hindi inaasahang resulta mula sa ating mga aksyon na batay sa datos. Ang [Gartner Hype Cycle para sa AI](https://www.gartner.com/smarterwithgartner/2-megatrends-dominate-the-gartner-hype-cycle-for-artificial-intelligence-2020/) ay tumutukoy sa mga kaugnay na trend sa digital ethics, responsableng AI, at pamamahala ng AI bilang mga pangunahing tagapagpatakbo para sa mas malalaking megatrend sa _demokrasya_ at _industriyalisasyon_ ng AI.
Ang etika ng datos ay ngayon ay _kinakailangang gabay_ para sa agham ng datos at engineering, na tumutulong sa atin na mabawasan ang mga posibleng pinsala at hindi sinasadyang mga resulta mula sa ating mga aksyon na nakabatay sa datos. Ang [Gartner Hype Cycle para sa AI](https://www.gartner.com/smarterwithgartner/2-megatrends-dominate-the-gartner-hype-cycle-for-artificial-intelligence-2020/) ay tumutukoy sa mga kaugnay na trend sa digital ethics, responsableng AI, at pamamahala ng AI bilang mga pangunahing salik para sa mas malalaking megatrends sa _demokratisasyon_ at _industrialisasyon_ ng AI.
![Gartner's Hype Cycle para sa AI - 2020](https://images-cdn.newscred.com/Zz1mOWJhNzlkNDA2ZTMxMWViYjRiOGFiM2IyMjQ1YmMwZQ==)
Sa araling ito, tatalakayin natin ang kamangha-manghang larangan ng etika ng datos - mula sa mga pangunahing konsepto at hamon, hanggang sa mga case study at mga inilapat na konsepto ng AI tulad ng pamamahala - na tumutulong sa pagtatatag ng kultura ng etika sa mga koponan at organisasyon na nagtatrabaho gamit ang datos at AI.
Sa araling ito, ating susuriin ang kamangha-manghang larangan ng etika ng datos - mula sa mga pangunahing konsepto at hamon, hanggang sa mga case study at mga applied AI na konsepto tulad ng pamamahala - na tumutulong sa pagtatatag ng kultura ng etika sa mga koponan at organisasyon na nagtatrabaho gamit ang datos at AI.
## [Pre-lecture quiz](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/2) 🎯
## Mga Pangunahing Depinisyon
Magsimula tayo sa pag-unawa sa mga pangunahing termino.
Magsimula tayo sa pag-unawa sa mga pangunahing terminolohiya.
Ang salitang "etika" ay nagmula sa [salitang Griyego na "ethikos"](https://en.wikipedia.org/wiki/Ethics) (at ang ugat nitong "ethos") na nangangahulugang _karakter o moral na kalikasan_.
Ang salitang "etika" ay nagmula sa [salitang Griyego na "ethikos"](https://en.wikipedia.org/wiki/Ethics) (at ang ugat nito na "ethos") na nangangahulugang _karakter o moral na kalikasan_.
**Etika** ay tungkol sa mga pinagsasaluhang halaga at prinsipyo ng moral na gumagabay sa ating pag-uugali sa lipunan. Ang etika ay hindi batay sa mga batas kundi sa malawakang tinatanggap na mga pamantayan ng kung ano ang "tama laban sa mali". Gayunpaman, ang mga konsiderasyong etikal ay maaaring maka-impluwensya sa mga inisyatibo ng pamamahala ng korporasyon at mga regulasyon ng gobyerno na lumilikha ng mas maraming insentibo para sa pagsunod.
**Etika** ay tungkol sa mga pinagsasaluhang halaga at prinsipyo ng moralidad na gumagabay sa ating pag-uugali sa lipunan. Ang etika ay hindi nakabatay sa mga batas kundi sa malawakang tinatanggap na mga pamantayan ng kung ano ang "tama vs. mali". Gayunpaman, ang mga konsiderasyong etikal ay maaaring maka-impluwensya sa mga inisyatibo ng corporate governance at mga regulasyon ng gobyerno na lumilikha ng mas maraming insentibo para sa pagsunod.
**Etika ng Datos** ay isang [bagong sangay ng etika](https://royalsocietypublishing.org/doi/full/10.1098/rsta.2016.0360#sec-1) na "nag-aaral at nagsusuri ng mga moral na problema na may kaugnayan sa _datos, mga algorithm at mga kaukulang gawain_". Dito, ang **"datos"** ay nakatuon sa mga aksyon na may kaugnayan sa paglikha, pagrekord, pag-aalaga, pagproseso, pagpapakalat, pagbabahagi, at paggamit; ang **"mga algorithm"** ay nakatuon sa AI, mga ahente, machine learning, at mga robot; at ang **"mga gawain"** ay nakatuon sa mga paksa tulad ng responsableng inobasyon, programming, hacking, at mga code ng etika.
**Etika ng Datos** ay isang [bagong sangay ng etika](https://royalsocietypublishing.org/doi/full/10.1098/rsta.2016.0360#sec-1) na "nag-aaral at nag-e-evaluate ng mga moral na problema na may kaugnayan sa _datos, algorithm, at mga kaugnay na praktis_". Dito, ang **"datos"** ay nakatuon sa mga aksyon na may kaugnayan sa paglikha, pagrekord, pag-curate, pagproseso, pagkalat, pagbabahagi, at paggamit; ang **"algorithm"** ay nakatuon sa AI, mga ahente, machine learning, at mga robot; at ang **"praktis"** ay nakatuon sa mga paksa tulad ng responsableng inobasyon, programming, hacking, at mga code ng etika.
**Inilapat na Etika** ay ang [praktikal na aplikasyon ng mga konsiderasyong moral](https://en.wikipedia.org/wiki/Applied_ethics). Ito ang proseso ng aktibong pagsisiyasat sa mga isyung etikal sa konteksto ng _mga aktwal na aksyon, produkto, at proseso_, at paggawa ng mga hakbang upang matiyak na ang mga ito ay nananatiling naaayon sa ating mga tinukoy na halaga ng etika.
**Applied Ethics** ay ang [praktikal na aplikasyon ng mga konsiderasyong moral](https://en.wikipedia.org/wiki/Applied_ethics). Ito ang proseso ng aktibong pagsisiyasat sa mga isyung etikal sa konteksto ng _mga aksyon, produkto, at proseso sa totoong mundo_, at pagkuha ng mga hakbang na nagwawasto upang matiyak na ang mga ito ay nananatiling naaayon sa ating tinukoy na mga halaga ng etika.
**Kultura ng Etika** ay tungkol sa [_pagpapatakbo_ ng inilapat na etika](https://hbr.org/2019/05/how-to-design-an-ethical-organization) upang matiyak na ang ating mga prinsipyo at gawain sa etika ay naisasagawa sa isang pare-pareho at nasusukat na paraan sa buong organisasyon. Ang matagumpay na mga kultura ng etika ay nagtatakda ng mga prinsipyo ng etika sa buong organisasyon, nagbibigay ng makabuluhang insentibo para sa pagsunod, at pinapalakas ang mga pamantayan ng etika sa pamamagitan ng paghikayat at pagpapalaganap ng mga nais na pag-uugali sa bawat antas ng organisasyon.
**Kultura ng Etika** ay tungkol sa [_pagpapatakbo_ ng applied ethics](https://hbr.org/2019/05/how-to-design-an-ethical-organization) upang matiyak na ang ating mga prinsipyo at praktis ng etika ay tinatanggap sa isang pare-pareho at nasusukat na paraan sa buong organisasyon. Ang matagumpay na kultura ng etika ay nagtatakda ng mga prinsipyo ng etika sa buong organisasyon, nagbibigay ng makabuluhang insentibo para sa pagsunod, at pinapalakas ang mga pamantayan ng etika sa pamamagitan ng paghikayat at pagpapalakas ng mga ninanais na pag-uugali sa bawat antas ng organisasyon.
## Mga Konsepto ng Etika
Sa seksyong ito, tatalakayin natin ang mga konsepto tulad ng **pinagsasaluhang halaga** (mga prinsipyo) at **mga hamon sa etika** (mga problema) para sa etika ng datos - at susuriin ang mga **case study** na tumutulong sa iyong maunawaan ang mga konseptong ito sa mga aktwal na konteksto.
Sa seksyong ito, tatalakayin natin ang mga konsepto tulad ng **pinagsasaluhang halaga** (mga prinsipyo) at **mga hamon sa etika** (mga problema) para sa etika ng datos - at susuriin ang **mga case study** na tumutulong sa iyong maunawaan ang mga konseptong ito sa mga konteksto ng totoong mundo.
### 1. Mga Prinsipyo ng Etika
Ang bawat estratehiya sa etika ng datos ay nagsisimula sa pagtukoy ng _mga prinsipyo ng etika_ - ang "mga pinagsasaluhang halaga" na naglalarawan ng katanggap-tanggap na mga pag-uugali, at gumagabay sa mga aksyong sumusunod, sa ating mga proyekto sa datos at AI. Maaari mong tukuyin ang mga ito sa antas ng indibidwal o koponan. Gayunpaman, karamihan sa mga malalaking organisasyon ay nagbabalangkas ng mga ito sa isang _misyon ng etikal na AI_ o balangkas na tinutukoy sa antas ng korporasyon at ipinatutupad nang pare-pareho sa lahat ng mga koponan.
Ang bawat estratehiya sa etika ng datos ay nagsisimula sa pagtukoy ng _mga prinsipyo ng etika_ - ang "pinagsasaluhang halaga" na naglalarawan ng mga katanggap-tanggap na pag-uugali, at gumagabay sa mga aksyon na sumusunod, sa ating mga proyekto sa datos at AI. Maaari mong tukuyin ang mga ito sa antas ng indibidwal o koponan. Gayunpaman, karamihan sa malalaking organisasyon ay nagbabalangkas ng mga ito sa isang _misyon ng etikal na AI_ o framework na tinutukoy sa antas ng korporasyon at ipinatutupad nang pare-pareho sa lahat ng koponan.
**Halimbawa:** Ang misyon ng [Responsible AI](https://www.microsoft.com/en-us/ai/responsible-ai) ng Microsoft ay nagsasaad: _"Kami ay nakatuon sa pagsulong ng AI na pinapatakbo ng mga prinsipyo ng etika na inuuna ang mga tao"_ - na tumutukoy sa 6 na prinsipyo ng etika sa balangkas sa ibaba:
**Halimbawa:** Ang [Responsible AI](https://www.microsoft.com/en-us/ai/responsible-ai) na misyon ng Microsoft ay nagsasaad: _"Kami ay nakatuon sa pagpapalaganap ng AI na pinapatakbo ng mga prinsipyo ng etika na inuuna ang tao"_ - na tumutukoy sa 6 na prinsipyo ng etika sa framework sa ibaba:
![Responsible AI sa Microsoft](https://docs.microsoft.com/en-gb/azure/cognitive-services/personalizer/media/ethics-and-responsible-use/ai-values-future-computed.png)
Suriin natin nang maikli ang mga prinsipyong ito. Ang _Transparency_ at _Accountability_ ay mga pundasyong halaga na pinagtatayuan ng iba pang mga prinsipyo - kaya magsimula tayo doon:
Saglit nating suriin ang mga prinsipyong ito. Ang _Transparency_ at _Accountability_ ay mga pundasyong halaga na binubuo ng iba pang mga prinsipyo - kaya magsimula tayo dito:
* [**Accountability**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) ay ginagawang _responsable_ ang mga practitioner para sa kanilang mga operasyon sa datos at AI, at pagsunod sa mga prinsipyong etikal na ito.
* [**Accountability**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) ay ginagawang _responsable_ ang mga practitioner para sa kanilang mga operasyon sa datos at AI, at pagsunod sa mga prinsipyong etikal.
* [**Transparency**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) ay tinitiyak na ang mga aksyon sa datos at AI ay _naiintindihan_ (interpretable) ng mga gumagamit, ipinaliliwanag ang ano at bakit sa likod ng mga desisyon.
* [**Fairness**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1%3aprimaryr6) - nakatuon sa pagtiyak na ang AI ay patas sa _lahat ng tao_, tinutugunan ang anumang sistemiko o implicit na socio-technical biases sa datos at mga sistema.
* [**Reliability & Safety**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - tinitiyak na ang AI ay kumikilos nang _pare-pareho_ sa mga tinukoy na halaga, binabawasan ang mga posibleng pinsala o hindi inaasahang resulta.
* [**Reliability & Safety**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - tinitiyak na ang AI ay kumikilos nang _pare-pareho_ sa tinukoy na mga halaga, binabawasan ang mga posibleng pinsala o hindi sinasadyang resulta.
* [**Privacy & Security**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - tungkol sa pag-unawa sa pinagmulan ng datos, at pagbibigay ng _privacy ng datos at kaugnay na proteksyon_ sa mga gumagamit.
* [**Inclusiveness**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - tungkol sa pagdidisenyo ng mga solusyon sa AI nang may layunin, inaangkop ang mga ito upang matugunan ang _malawak na hanay ng mga pangangailangan at kakayahan ng tao_.
* [**Inclusiveness**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - tungkol sa pagdidisenyo ng mga solusyon sa AI nang may intensyon, inaangkop ang mga ito upang matugunan ang _malawak na hanay ng mga pangangailangan at kakayahan ng tao_.
> 🚨 Pag-isipan kung ano ang maaaring maging misyon ng iyong etika sa datos. Suriin ang mga balangkas ng etikal na AI mula sa ibang mga organisasyon - narito ang mga halimbawa mula sa [IBM](https://www.ibm.com/cloud/learn/ai-ethics), [Google](https://ai.google/principles), at [Facebook](https://ai.facebook.com/blog/facebooks-five-pillars-of-responsible-ai/). Ano ang mga pinagsasaluhang halaga na mayroon sila? Paano nauugnay ang mga prinsipyong ito sa produktong AI o industriya na kanilang kinabibilangan?
> 🚨 Pag-isipan kung ano ang maaaring maging misyon ng etika ng datos para sa iyo. Suriin ang mga framework ng etikal na AI mula sa ibang mga organisasyon - narito ang mga halimbawa mula sa [IBM](https://www.ibm.com/cloud/learn/ai-ethics), [Google](https://ai.google/principles), at [Facebook](https://ai.facebook.com/blog/facebooks-five-pillars-of-responsible-ai/). Anong mga pinagsasaluhang halaga ang mayroon sila? Paano nauugnay ang mga prinsipyong ito sa produktong AI o industriya na kanilang kinabibilangan?
### 2. Mga Hamon sa Etika
Kapag natukoy na ang mga prinsipyo ng etika, ang susunod na hakbang ay suriin ang ating mga aksyon sa datos at AI upang makita kung naaayon ang mga ito sa mga pinagsasaluhang halaga. Pag-isipan ang iyong mga aksyon sa dalawang kategorya: _pagkolekta ng datos_ at _disenyo ng algorithm_.
Kapag natukoy na ang mga prinsipyo ng etika, ang susunod na hakbang ay suriin ang ating mga aksyon sa datos at AI upang makita kung naaayon ang mga ito sa mga pinagsasaluhang halaga. Pag-isipan ang iyong mga aksyon sa dalawang kategorya: _koleksyon ng datos_ at _disenyo ng algorithm_.
Sa pagkolekta ng datos, ang mga aksyon ay malamang na may kinalaman sa **personal na datos** o personal na makikilalang impormasyon (PII) para sa mga makikilalang buhay na indibidwal. Kasama rito ang [iba't ibang uri ng hindi personal na datos](https://ec.europa.eu/info/law/law-topic/data-protection/reform/what-personal-data_en) na _sama-samang_ makikilala ang isang indibidwal. Ang mga hamon sa etika ay maaaring may kaugnayan sa _privacy ng datos_, _pagmamay-ari ng datos_, at mga kaugnay na paksa tulad ng _may malay na pahintulot_ at _mga karapatan sa intelektwal na ari-arian_ para sa mga gumagamit.
Sa koleksyon ng datos, ang mga aksyon ay malamang na may kaugnayan sa **personal na datos** o personal na makikilalang impormasyon (PII) para sa mga makikilalang buhay na indibidwal. Kasama rito ang [iba't ibang uri ng hindi personal na datos](https://ec.europa.eu/info/law/law-topic/data-protection/reform/what-personal-data_en) na _sama-samang_ nakikilala ang isang indibidwal. Ang mga hamon sa etika ay maaaring may kaugnayan sa _privacy ng datos_, _pagmamay-ari ng datos_, at mga kaugnay na paksa tulad ng _informed consent_ at _mga karapatan sa intelektwal na ari-arian_ para sa mga gumagamit.
Sa disenyo ng algorithm, ang mga aksyon ay may kinalaman sa pagkolekta at pag-aalaga ng **mga dataset**, pagkatapos ay ginagamit ang mga ito upang sanayin at i-deploy ang **mga modelo ng datos** na nagtataya ng mga resulta o nag-a-automate ng mga desisyon sa aktwal na mga konteksto. Ang mga hamon sa etika ay maaaring lumitaw mula sa _bias sa dataset_, mga isyu sa _kalidad ng datos_, _kawalan ng katarungan_, at _maling representasyon_ sa mga algorithm - kabilang ang ilang mga isyung sistemiko.
Sa disenyo ng algorithm, ang mga aksyon ay may kaugnayan sa pagkolekta at pag-curate ng **datasets**, pagkatapos ay ginagamit ang mga ito upang sanayin at i-deploy ang **data models** na nagpo-predict ng mga resulta o nag-a-automate ng mga desisyon sa mga konteksto ng totoong mundo. Ang mga hamon sa etika ay maaaring lumitaw mula sa _bias sa dataset_, mga isyu sa _kalidad ng datos_, _hindi pagiging patas_, at _maling representasyon_ sa mga algorithm - kabilang ang ilang mga isyung sistemiko.
Sa parehong kaso, ang mga hamon sa etika ay nagha-highlight ng mga lugar kung saan maaaring magkaroon ng salungatan ang ating mga aksyon sa ating mga pinagsasaluhang halaga. Upang matukoy, mabawasan, mabawasan, o maalis ang mga alalahaning ito - kailangan nating magtanong ng mga moral na tanong na "oo/hindi" na may kaugnayan sa ating mga aksyon, pagkatapos ay gumawa ng mga hakbang upang maitama ang mga ito kung kinakailangan. Tingnan natin ang ilang mga hamon sa etika at ang mga moral na tanong na kanilang itinatampok:
Sa parehong kaso, ang mga hamon sa etika ay nagha-highlight ng mga lugar kung saan ang ating mga aksyon ay maaaring makaranas ng salungatan sa ating mga pinagsasaluhang halaga. Upang matukoy, mabawasan, mapaliit, o maalis ang mga alalahaning ito - kailangan nating magtanong ng moral na "oo/hindi" na mga tanong na may kaugnayan sa ating mga aksyon, pagkatapos ay kumuha ng mga hakbang na nagwawasto kung kinakailangan. Tingnan natin ang ilang mga hamon sa etika at ang mga moral na tanong na kanilang itinatampok:
#### 2.1 Pagmamay-ari ng Datos
Ang pagkolekta ng datos ay madalas na may kinalaman sa personal na datos na maaaring makilala ang mga paksa ng datos. Ang [pagmamay-ari ng datos](https://permission.io/blog/data-ownership) ay tungkol sa _kontrol_ at [_mga karapatan ng gumagamit_](https://permission.io/blog/data-ownership) na may kaugnayan sa paglikha, pagproseso, at pagpapakalat ng datos.
Ang koleksyon ng datos ay madalas na may kaugnayan sa personal na datos na maaaring makilala ang mga data subjects. Ang [pagmamay-ari ng datos](https://permission.io/blog/data-ownership) ay tungkol sa _kontrol_ at [_mga karapatan ng gumagamit_](https://permission.io/blog/data-ownership) na may kaugnayan sa paglikha, pagproseso, at pagkalat ng datos.
Ang mga moral na tanong na dapat nating itanong ay:
Ang mga moral na tanong na dapat itanong ay:
* Sino ang nagmamay-ari ng datos? (gumagamit o organisasyon)
* Anong mga karapatan ang mayroon ang mga paksa ng datos? (hal: access, pagbura, portability)
* Anong mga karapatan ang mayroon ang mga organisasyon? (hal: itama ang mapanirang mga review ng gumagamit)
* Anong mga karapatan ang mayroon ang mga data subjects? (hal: access, erasure, portability)
* Anong mga karapatan ang mayroon ang mga organisasyon? (hal: pagwawasto ng mga mapanirang review ng gumagamit)
#### 2.2 May Malay na Pahintulot
#### 2.2 Informed Consent
Ang [may malay na pahintulot](https://legaldictionary.net/informed-consent/) ay tumutukoy sa kilos ng mga gumagamit na pumapayag sa isang aksyon (tulad ng pagkolekta ng datos) na may _buong pag-unawa_ sa mga kaugnay na katotohanan kabilang ang layunin, mga posibleng panganib, at mga alternatibo.
Ang [Informed consent](https://legaldictionary.net/informed-consent/) ay tumutukoy sa kilos ng mga gumagamit na pumapayag sa isang aksyon (tulad ng koleksyon ng datos) na may _buong pag-unawa_ sa mga kaugnay na katotohanan kabilang ang layunin, mga posibleng panganib, at mga alternatibo.
Mga tanong na dapat tuklasin dito:
* Nagbigay ba ng pahintulot ang gumagamit (paksa ng datos) para sa pagkolekta at paggamit ng datos?
* Naiintindihan ba ng gumagamit ang layunin kung bakit kinolekta ang datos na iyon?
Mga tanong na dapat suriin dito:
* Nagbigay ba ng pahintulot ang gumagamit (data subject) para sa pagkuha at paggamit ng datos?
* Naiintindihan ba ng gumagamit ang layunin kung bakit kinukuha ang datos?
* Naiintindihan ba ng gumagamit ang mga posibleng panganib mula sa kanilang pakikilahok?
#### 2.3 Intelektwal na Ari-arian
Ang [intelektwal na ari-arian](https://en.wikipedia.org/wiki/Intellectual_property) ay tumutukoy sa mga hindi materyal na likha na resulta ng inisyatiba ng tao, na maaaring _may pang-ekonomiyang halaga_ sa mga indibidwal o negosyo.
Ang [Intelektwal na ari-arian](https://en.wikipedia.org/wiki/Intellectual_property) ay tumutukoy sa mga hindi materyal na likha na resulta ng inisyatibo ng tao, na maaaring _may ekonomikong halaga_ sa mga indibidwal o negosyo.
Mga tanong na dapat tuklasin dito:
* Ang nakolektang datos ba ay may pang-ekonomiyang halaga sa isang gumagamit o negosyo?
* Mayroon bang intelektwal na ari-arian ang **gumagamit** dito?
* Mayroon bang intelektwal na ari-arian ang **organisasyon** dito?
* Kung umiiral ang mga karapatang ito, paano natin ito pinoprotektahan?
Mga tanong na dapat suriin dito:
* May ekonomikong halaga ba ang nakolektang datos sa isang gumagamit o negosyo?
* May intelektwal na ari-arian ba ang **gumagamit** dito?
* May intelektwal na ari-arian ba ang **organisasyon** dito?
* Kung umiiral ang mga karapatang ito, paano natin pinoprotektahan ang mga ito?
#### 2.4 Privacy ng Datos
Ang [privacy ng datos](https://www.northeastern.edu/graduate/blog/what-is-data-privacy/) o privacy ng impormasyon ay tumutukoy sa pangangalaga ng privacy ng gumagamit at proteksyon ng pagkakakilanlan ng gumagamit kaugnay ng personal na makikilalang impormasyon.
Ang [Privacy ng datos](https://www.northeastern.edu/graduate/blog/what-is-data-privacy/) o impormasyon privacy ay tumutukoy sa pangangalaga ng privacy ng gumagamit at proteksyon ng pagkakakilanlan ng gumagamit na may kaugnayan sa personal na makikilalang impormasyon.
Mga tanong na dapat tuklasin dito:
* Ang datos ba ng mga gumagamit (personal) ay ligtas laban sa mga hack at pagtagas?
Mga tanong na dapat suriin dito:
* Ang datos ba ng mga gumagamit (personal) ay ligtas laban sa mga hack at leaks?
* Ang datos ba ng mga gumagamit ay naa-access lamang sa mga awtorisadong gumagamit at konteksto?
* Ang anonymity ba ng mga gumagamit ay napapanatili kapag ang datos ay ibinabahagi o ipinapakalat?
* Maaari bang ma-de-identify ang isang gumagamit mula sa mga anonymized na dataset?
* Ang anonymity ba ng mga gumagamit ay napapanatili kapag ang datos ay ibinabahagi o ikinakalat?
* Maaari bang ma-deidentify ang isang gumagamit mula sa mga anonymized datasets?
#### 2.5 Karapatan na Maging Nakalimutan
Ang [Karapatan na Maging Nakalimutan](https://en.wikipedia.org/wiki/Right_to_be_forgotten) o [Karapatan sa Pagbura](https://www.gdpreu.org/right-to-be-forgotten/) ay nagbibigay ng karagdagang proteksyon sa personal na datos ng mga gumagamit. Partikular, binibigyan nito ang mga gumagamit ng karapatang humiling ng pagbura o pagtanggal ng personal na datos mula sa mga paghahanap sa Internet at iba pang lokasyon, _sa ilalim ng mga tiyak na kalagayan_ - na nagbibigay-daan sa kanila ng bagong simula online nang hindi hinuhusgahan ang kanilang mga nakaraang aksyon.
Ang [Karapatan na Maging Nakalimutan](https://en.wikipedia.org/wiki/Right_to_be_forgotten) o [Karapatan sa Pagbura](https://www.gdpreu.org/right-to-be-forgotten/) ay nagbibigay ng karagdagang proteksyon sa personal na datos ng mga gumagamit. Partikular, binibigyan nito ang mga gumagamit ng karapatang humiling ng pagbura o pag-alis ng personal na datos mula sa mga Internet search at iba pang lokasyon, _sa ilalim ng mga partikular na pangyayari_ - na nagbibigay-daan sa kanila ng bagong simula online nang hindi hinahawakan laban sa kanila ang mga nakaraang aksyon.
Mga tanong na dapat tuklasin dito:
* Pinapayagan ba ng sistema ang mga paksa ng datos na humiling ng pagbura?
* Dapat bang awtomatikong ma-trigger ng pag-atras ng pahintulot ng gumagamit ang pagbura?
Mga tanong na dapat suriin dito:
* Pinapayagan ba ng sistema ang mga data subjects na humiling ng pagbura?
* Dapat bang awtomatikong mag-trigger ng pagbura ang pag-withdraw ng pahintulot ng gumagamit?
* Ang datos ba ay nakolekta nang walang pahintulot o sa pamamagitan ng ilegal na paraan?
* Tayo ba ay sumusunod sa mga regulasyon ng gobyerno para sa privacy ng datos?
#### 2.6 Bias sa Dataset
Ang bias sa dataset o [Bias sa Pagkolekta](http://researcharticles.com/index.php/bias-in-data-collection-in-research/) ay tungkol sa pagpili ng isang _hindi kinatawan_ na subset ng datos para sa pagbuo ng algorithm, na lumilikha ng potensyal na kawalan ng katarungan sa mga resulta para sa iba't ibang grupo. Kasama sa mga uri ng bias ang bias sa pagpili o sampling, bias ng boluntaryo, at bias sa instrumento.
Ang Bias sa Dataset o [Bias sa Koleksyon](http://researcharticles.com/index.php/bias-in-data-collection-in-research/) ay tungkol sa pagpili ng isang _hindi representatibong_ subset ng datos para sa pag-develop ng algorithm, na lumilikha ng posibleng hindi pagiging patas sa mga resulta para sa iba't ibang grupo. Ang mga uri ng bias ay kinabibilangan ng bias sa pagpili o sampling, bias sa boluntaryo, at bias sa instrumento.
Mga tanong na
[Algorithm Fairness](https://towardsdatascience.com/what-is-algorithm-fairness-3182e161cf9f) ay tumutukoy sa pagsusuri kung ang disenyo ng algorithm ay sistematikong nagdidiskrimina laban sa partikular na mga subgroup ng data subjects, na nagdudulot ng [mga potensyal na pinsala](https://docs.microsoft.com/en-us/azure/machine-learning/concept-fairness-ml) sa _alokasyon_ (kung saan ang mga resources ay tinatanggihan o hindi ibinibigay sa grupong iyon) at _kalidad ng serbisyo_ (kung saan ang AI ay hindi kasing tumpak para sa ilang subgroup kumpara sa iba).
Mga tanong na dapat suriin dito:
* Nag-recruit ba tayo ng representatibong set ng mga data subjects?
* Nasuri ba natin ang nakolekta o na-curate na dataset para sa iba't ibang bias?
* Maaari ba nating mabawasan o alisin ang anumang natuklasang bias?
#### 2.7 Kalidad ng Datos
Ang [Kalidad ng Datos](https://
[Algorithm Fairness](https://towardsdatascience.com/what-is-algorithm-fairness-3182e161cf9f) ay tumutukoy sa pagsusuri kung ang disenyo ng algorithm ay sistematikong nagdidiskrimina laban sa partikular na mga subgroup ng data subjects, na nagdudulot ng [mga posibleng pinsala](https://docs.microsoft.com/en-us/azure/machine-learning/concept-fairness-ml) sa _allocation_ (kung saan ang mga resources ay tinatanggihan o hindi ibinibigay sa grupong iyon) at _quality of service_ (kung saan ang AI ay hindi kasing-eksakto para sa ilang subgroup kumpara sa iba).
Mga tanong na dapat pag-isipan:
* Nasuri ba natin ang katumpakan ng modelo para sa iba't ibang subgroup at kundisyon?
* Sinuri ba natin ang sistema para sa mga potensyal na pinsala (hal., stereotyping)?
* Nasuri ba natin ang katumpakan ng modelo para sa iba't ibang subgroup at kondisyon?
* Sinuri ba natin ang sistema para sa mga posibleng pinsala (hal., stereotyping)?
* Maaari ba nating baguhin ang data o muling sanayin ang mga modelo upang mabawasan ang mga natukoy na pinsala?
Suriin ang mga mapagkukunan tulad ng [AI Fairness checklists](https://query.prod.cms.rt.microsoft.com/cms/api/am/binary/RE4t6dA) upang matuto pa.
#### 2.9 Misrepresentation
[Data Misrepresentation](https://www.sciencedirect.com/topics/computer-science/misrepresentation) ay tumutukoy sa pagsusuri kung ang mga insight mula sa data ay tapat na iniulat o kung ito ay ipinapakita sa mapanlinlang na paraan upang suportahan ang isang nais na naratibo.
[Data Misrepresentation](https://www.sciencedirect.com/topics/computer-science/misrepresentation) ay tumutukoy sa tanong kung tayo ba ay nagpapahayag ng mga insight mula sa tapat na iniulat na data sa isang mapanlinlang na paraan upang suportahan ang isang nais na naratibo.
Mga tanong na dapat pag-isipan:
* Nag-uulat ba tayo ng hindi kumpleto o hindi tumpak na data?
* Nag-uulat ba tayo ng hindi kumpleto o hindi tamang data?
* Nagpapakita ba tayo ng data sa paraang nagdudulot ng maling konklusyon?
* Gumagamit ba tayo ng piling mga teknik sa istatistika upang manipulahin ang mga resulta?
* Gumagamit ba tayo ng piling mga teknik sa estadistika upang manipulahin ang mga resulta?
* Mayroon bang alternatibong paliwanag na maaaring magbigay ng ibang konklusyon?
#### 2.10 Free Choice
Ang [Illusion of Free Choice](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice) ay nangyayari kapag ang "choice architectures" ng sistema ay gumagamit ng mga algorithm sa paggawa ng desisyon upang itulak ang mga tao na pumili ng isang nais na resulta habang tila binibigyan sila ng mga opsyon at kontrol. Ang mga [dark patterns](https://www.darkpatterns.org/) na ito ay maaaring magdulot ng panlipunan at pang-ekonomiyang pinsala sa mga gumagamit. Dahil ang mga desisyon ng gumagamit ay nakakaapekto sa mga profile ng pag-uugali, ang mga aksyong ito ay maaaring magdulot ng mga hinaharap na pagpipilian na maaaring palalain o palawigin ang epekto ng mga pinsalang ito.
Ang [Illusion of Free Choice](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice) ay nangyayari kapag ang "choice architectures" ng sistema ay gumagamit ng mga algorithm sa paggawa ng desisyon upang itulak ang mga tao na pumili ng isang nais na resulta habang tila binibigyan sila ng mga opsyon at kontrol. Ang mga [dark patterns](https://www.darkpatterns.org/) na ito ay maaaring magdulot ng panlipunan at pang-ekonomiyang pinsala sa mga gumagamit. Dahil ang mga desisyon ng gumagamit ay nakakaapekto sa mga profile ng pag-uugali, ang mga aksyong ito ay maaaring magdulot ng mga susunod na pagpipilian na maaaring palalain o palawigin ang epekto ng mga pinsalang ito.
Mga tanong na dapat pag-isipan:
* Naiintindihan ba ng gumagamit ang mga implikasyon ng paggawa ng desisyong iyon?
* Alam ba ng gumagamit ang (mga alternatibong) opsyon at ang mga kalamangan at kahinaan ng bawat isa?
* Alam ba ng gumagamit ang (mga alternatibong) pagpipilian at ang mga pros & cons ng bawat isa?
* Maaari bang baligtarin ng gumagamit ang isang automated o naimpluwensiyahang desisyon sa hinaharap?
### 3. Mga Pag-aaral ng Kaso
Upang mailagay ang mga hamon sa etika sa mga konteksto ng totoong mundo, makakatulong ang pagtingin sa mga pag-aaral ng kaso na naglalarawan ng mga potensyal na pinsala at kahihinatnan sa mga indibidwal at lipunan kapag ang mga paglabag sa etika ay hindi napapansin.
Upang mailagay ang mga hamon sa etika sa mga konteksto ng totoong mundo, makakatulong ang pagtingin sa mga pag-aaral ng kaso na nagha-highlight ng mga posibleng pinsala at kahihinatnan sa mga indibidwal at lipunan kapag ang mga paglabag sa etika ay hindi napapansin.
Narito ang ilang halimbawa:
| Hamon sa Etika | Pag-aaral ng Kaso |
|--- |--- |
| **Informed Consent** | 1972 - [Tuskegee Syphilis Study](https://en.wikipedia.org/wiki/Tuskegee_Syphilis_Study) - Ang mga African American na lalaki na lumahok sa pag-aaral ay pinangakuan ng libreng medikal na pangangalaga _ngunit nilinlang_ ng mga mananaliksik na hindi ipinaalam sa kanila ang kanilang diagnosis o ang pagkakaroon ng paggamot. Maraming namatay, at naapektuhan ang mga asawa o anak; tumagal ang pag-aaral ng 40 taon. |
| **Data Privacy** | 2007 - Ang [Netflix data prize](https://www.wired.com/2007/12/why-anonymous-data-sometimes-isnt/) ay nagbigay sa mga mananaliksik ng _10M anonymized movie rankings mula sa 50K customer_ upang mapabuti ang mga algorithm ng rekomendasyon. Gayunpaman, nagawa ng mga mananaliksik na iugnay ang anonymized data sa personal na makikilalang data sa _mga panlabas na dataset_ (hal., IMDb comments) - epektibong "de-anonymizing" ang ilang Netflix subscribers.|
| **Collection Bias** | 2013 - Ang Lungsod ng Boston ay [nag-develop ng Street Bump](https://www.boston.gov/transportation/street-bump), isang app na nagpapahintulot sa mga mamamayan na mag-ulat ng mga potholes, na nagbibigay sa lungsod ng mas mahusay na data sa kalsada upang mahanap at maayos ang mga isyu. Gayunpaman, [ang mga tao sa mas mababang kita ay may mas kaunting access sa mga kotse at telepono](https://hbr.org/2013/04/the-hidden-biases-in-big-data), na ginagawang hindi nakikita ang kanilang mga isyu sa kalsada sa app na ito. Nakipagtulungan ang mga developer sa mga akademiko upang tugunan ang _pantay na access at digital divides_ para sa katarungan. |
| **Algorithmic Fairness** | 2018 - Ang MIT [Gender Shades Study](http://gendershades.org/overview.html) ay nagsuri sa katumpakan ng mga produkto ng AI sa pag-uuri ng kasarian, na naglantad ng mga agwat sa katumpakan para sa kababaihan at mga taong may kulay. Ang isang [2019 Apple Card](https://www.wired.com/story/the-apple-card-didnt-see-genderand-thats-the-problem/) ay tila nag-aalok ng mas mababang credit sa kababaihan kaysa sa kalalakihan. Parehong nagpakita ng mga isyu sa bias ng algorithm na nagdudulot ng mga socio-economic harms.|
| **Data Misrepresentation** | 2020 - Ang [Georgia Department of Public Health ay naglabas ng mga COVID-19 chart](https://www.vox.com/covid-19-coronavirus-us-response-trump/2020/5/18/21262265/georgia-covid-19-cases-declining-reopening) na tila nililinlang ang mga mamamayan tungkol sa mga trend ng kumpirmadong kaso gamit ang hindi kronolohikal na pagkakasunod-sunod sa x-axis. Ipinapakita nito ang maling representasyon sa pamamagitan ng mga trick sa visualization. |
| **Illusion of free choice** | 2020 - Ang learning app na [ABCmouse ay nagbayad ng $10M upang ayusin ang reklamo ng FTC](https://www.washingtonpost.com/business/2020/09/04/abcmouse-10-million-ftc-settlement/) kung saan ang mga magulang ay na-trap sa pagbabayad para sa mga subscription na hindi nila ma-cancel. Ipinapakita nito ang dark patterns sa choice architectures, kung saan ang mga gumagamit ay itinulak sa mga potensyal na mapanganib na desisyon. |
| **Data Privacy & User Rights** | 2021 - Ang Facebook [Data Breach](https://www.npr.org/2021/04/09/986005820/after-data-breach-exposes-530-million-facebook-says-it-will-not-notify-users) ay naglantad ng data mula sa 530M na gumagamit, na nagresulta sa $5B na settlement sa FTC. Gayunpaman, tumanggi itong ipaalam sa mga gumagamit ang breach, na lumalabag sa mga karapatan ng gumagamit sa transparency ng data at access. |
| **Informed Consent** | 1972 - [Tuskegee Syphilis Study](https://en.wikipedia.org/wiki/Tuskegee_Syphilis_Study) - Ang mga African American na lalaki na lumahok sa pag-aaral ay pinangakuan ng libreng pangangalagang medikal _ngunit nilinlang_ ng mga mananaliksik na hindi ipinaalam sa kanila ang kanilang diagnosis o ang pagkakaroon ng paggamot. Maraming namatay, at naapektuhan ang mga partner o anak; tumagal ang pag-aaral ng 40 taon. |
| **Data Privacy** | 2007 - Ang [Netflix data prize](https://www.wired.com/2007/12/why-anonymous-data-sometimes-isnt/) ay nagbigay sa mga mananaliksik ng _10M anonymized movie rankings mula sa 50K customer_ upang mapabuti ang mga algorithm sa rekomendasyon. Gayunpaman, nagawa ng mga mananaliksik na i-correlate ang anonymized data sa personal na makikilalang data sa _mga panlabas na dataset_ (hal., IMDb comments) - epektibong "de-anonymizing" ang ilang subscriber ng Netflix.|
| **Collection Bias** | 2013 - Ang Lungsod ng Boston ay [nag-develop ng Street Bump](https://www.boston.gov/transportation/street-bump), isang app na nagpapahintulot sa mga mamamayan na mag-ulat ng mga potholes, na nagbibigay sa lungsod ng mas mahusay na data sa kalsada upang mahanap at maayos ang mga isyu. Gayunpaman, [ang mga tao sa mas mababang kita ay may mas kaunting access sa mga kotse at telepono](https://hbr.org/2013/04/the-hidden-biases-in-big-data), na ginagawang hindi nakikita ang kanilang mga isyu sa kalsada sa app na ito. Nakipagtulungan ang mga developer sa mga akademiko upang tugunan ang _equitable access at digital divides_ para sa patas na paggamit. |
| **Algorithmic Fairness** | 2018 - Ang MIT [Gender Shades Study](http://gendershades.org/overview.html) ay nagsuri sa katumpakan ng mga produkto ng AI sa gender classification, na naglantad ng mga kakulangan sa katumpakan para sa mga kababaihan at mga taong may kulay. Ang isang [2019 Apple Card](https://www.wired.com/story/the-apple-card-didnt-see-genderand-thats-the-problem/) ay tila nagbigay ng mas mababang credit sa mga kababaihan kaysa sa mga lalaki. Parehong nagpakita ng mga isyu sa bias ng algorithm na nagdudulot ng socio-economic harms.|
| **Data Misrepresentation** | 2020 - Ang [Georgia Department of Public Health ay naglabas ng mga COVID-19 charts](https://www.vox.com/covid-19-coronavirus-us-response-trump/2020/5/18/21262265/georgia-covid-19-cases-declining-reopening) na tila nililinlang ang mga mamamayan tungkol sa mga trend ng kumpirmadong kaso gamit ang non-chronological ordering sa x-axis. Ipinapakita nito ang maling representasyon sa pamamagitan ng mga trick sa visualization. |
| **Illusion of free choice** | 2020 - Ang learning app na [ABCmouse ay nagbayad ng $10M upang ayusin ang reklamo ng FTC](https://www.washingtonpost.com/business/2020/09/04/abcmouse-10-million-ftc-settlement/) kung saan ang mga magulang ay na-trap sa pagbabayad para sa mga subscription na hindi nila ma-cancel. Ipinapakita nito ang dark patterns sa choice architectures, kung saan ang mga gumagamit ay itinulak sa mga posibleng mapanirang desisyon. |
| **Data Privacy & User Rights** | 2021 - Ang Facebook [Data Breach](https://www.npr.org/2021/04/09/986005820/after-data-breach-exposes-530-million-facebook-says-it-will-not-notify-users) ay naglantad ng data mula sa 530M na gumagamit, na nagresulta sa $5B settlement sa FTC. Gayunpaman, tumanggi itong ipaalam sa mga gumagamit ang breach, na lumalabag sa mga karapatan ng gumagamit sa transparency ng data at access. |
Gusto mo bang mag-explore ng higit pang mga pag-aaral ng kaso? Tingnan ang mga mapagkukunang ito:
* [Ethics Unwrapped](https://ethicsunwrapped.utexas.edu/case-studies) - mga dilemmas sa etika sa iba't ibang industriya.
* [Data Science Ethics course](https://www.coursera.org/learn/data-science-ethics#syllabus) - landmark na mga pag-aaral ng kaso na tinalakay.
* [Where things have gone wrong](https://deon.drivendata.org/examples/) - checklist ng deon na may mga halimbawa.
> 🚨 Pag-isipan ang mga pag-aaral ng kaso na iyong nakita - nakaranas ka na ba, o naapektuhan ng, katulad na hamon sa etika sa iyong buhay? Makakaisip ka ba ng kahit isang pag-aaral ng kaso na naglalarawan ng isa sa mga hamon sa etika na tinalakay natin sa seksyong ito?
> 🚨 Pag-isipan ang mga pag-aaral ng kaso na iyong nakita - nakaranas ka na ba, o naapektuhan ng, katulad na hamon sa etika sa iyong buhay? Makakaisip ka ba ng kahit isang karagdagang pag-aaral ng kaso na naglalarawan ng isa sa mga hamon sa etika na tinalakay natin sa seksyong ito?
## Applied Ethics
@ -185,7 +192,7 @@ Napag-usapan natin ang mga konsepto ng etika, mga hamon, at mga pag-aaral ng kas
### 1. Professional Codes
Ang Professional Codes ay nag-aalok ng isang opsyon para sa mga organisasyon upang "hikayatin" ang mga miyembro na suportahan ang kanilang mga prinsipyo sa etika at misyon. Ang mga code ay _moral na gabay_ para sa propesyonal na pag-uugali, na tumutulong sa mga empleyado o miyembro na gumawa ng mga desisyon na naaayon sa mga prinsipyo ng kanilang organisasyon. Ang mga ito ay epektibo lamang kung may boluntaryong pagsunod mula sa mga miyembro; gayunpaman, maraming organisasyon ang nag-aalok ng karagdagang gantimpala at parusa upang mag-udyok ng pagsunod mula sa mga miyembro.
Ang Professional Codes ay nag-aalok ng isang opsyon para sa mga organisasyon upang "hikayatin" ang mga miyembro na suportahan ang kanilang mga prinsipyo sa etika at misyon. Ang mga code ay _moral guidelines_ para sa propesyonal na pag-uugali, na tumutulong sa mga empleyado o miyembro na gumawa ng mga desisyon na naaayon sa mga prinsipyo ng kanilang organisasyon. Ang mga ito ay kasing ganda lamang ng boluntaryong pagsunod mula sa mga miyembro; gayunpaman, maraming organisasyon ang nag-aalok ng karagdagang mga gantimpala at parusa upang hikayatin ang pagsunod mula sa mga miyembro.
Mga halimbawa:
* [Oxford Munich](http://www.code-of-ethics.org/code-of-conduct/) Code of Ethics
@ -196,53 +203,54 @@ Mga halimbawa:
### 2. Ethics Checklists
Habang ang mga professional codes ay tumutukoy sa kinakailangang _etikal na pag-uugali_ mula sa mga practitioner, [mayroon silang kilalang limitasyon](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md) sa pagpapatupad, partikular sa malalaking proyekto. Sa halip, maraming eksperto sa data science ang [nagpapayo ng paggamit ng checklists](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md), na maaaring **mag-ugnay ng mga prinsipyo sa mga kasanayan** sa mas deterministiko at maaksiyong paraan.
Habang ang mga professional codes ay tumutukoy sa kinakailangang _ethical behavior_ mula sa mga practitioner, [mayroon itong mga kilalang limitasyon](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md) sa pagpapatupad, partikular sa malalaking proyekto. Sa halip, maraming eksperto sa data science ang [nagpapayo ng mga checklist](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md) na maaaring **ikonekta ang mga prinsipyo sa mga kasanayan** sa mas deterministiko at maaksiyong paraan.
Ang mga checklist ay nagko-convert ng mga tanong sa "oo/hindi" na mga gawain na maaaring maisagawa, na nagpapahintulot sa mga ito na masubaybayan bilang bahagi ng karaniwang workflows sa paglabas ng produkto.
Ang mga checklist ay nagko-convert ng mga tanong sa "yes/no" na mga gawain na maaaring maisagawa, na nagpapahintulot sa mga ito na masubaybayan bilang bahagi ng standard na workflows sa pag-release ng produkto.
Mga halimbawa:
* [Deon](https://deon.drivendata.org/) - isang pangkalahatang checklist sa etika ng data na nilikha mula sa [mga rekomendasyon ng industriya](https://deon.drivendata.org/#checklist-citations) na may command-line tool para sa madaling integrasyon.
* [Deon](https://deon.drivendata.org/) - isang general-purpose data ethics checklist na nilikha mula sa [mga rekomendasyon ng industriya](https://deon.drivendata.org/#checklist-citations) na may command-line tool para sa madaling integrasyon.
* [Privacy Audit Checklist](https://cyber.harvard.edu/ecommerce/privacyaudit.html) - nagbibigay ng pangkalahatang gabay para sa mga kasanayan sa paghawak ng impormasyon mula sa legal at panlipunang pananaw.
* [AI Fairness Checklist](https://www.microsoft.com/en-us/research/project/ai-fairness-checklist/) - nilikha ng mga practitioner ng AI upang suportahan ang pag-aampon at integrasyon ng fairness checks sa mga development cycle ng AI.
* [22 questions for ethics in data and AI](https://medium.com/the-organization/22-questions-for-ethics-in-data-and-ai-efb68fd19429) - mas bukas na framework, na naka-istruktura para sa paunang pagsusuri ng mga isyu sa etika sa disenyo, implementasyon, at mga konteksto ng organisasyon.
* [22 questions for ethics in data and AI](https://medium.com/the-organization/22-questions-for-ethics-in-data-and-ai-efb68fd19429) - mas bukas na framework, na naka-structure para sa paunang pagsusuri ng mga isyu sa etika sa disenyo, implementasyon, at mga konteksto ng organisasyon.
### 3. Ethics Regulations
Ang etika ay tungkol sa pagtukoy ng mga pinagsasaluhang halaga at paggawa ng tama _boluntaryo_. **Compliance** ay tungkol sa _pagsunod sa batas_ kung saan ito tinukoy. Ang **Governance** ay sumasaklaw sa lahat ng paraan kung paano nagpapatakbo ang mga organisasyon upang ipatupad ang mga prinsipyo ng etika at sumunod sa mga itinatag na batas.
Ang etika ay tungkol sa pagtukoy ng mga pinagsasaluhang halaga at paggawa ng tama _boluntaryo_. **Compliance** ay tungkol sa _pagsunod sa batas_ kung saan ito tinukoy. Ang **Governance** ay sumasaklaw sa lahat ng paraan kung paano nagpapatakbo ang mga organisasyon upang ipatupad ang mga prinsipyo sa etika at sumunod sa mga itinatag na batas.
Sa kasalukuyan, ang pamamahala ay may dalawang anyo sa loob ng mga organisasyon. Una, ito ay tungkol sa pagtukoy ng **ethical AI** principles at pagtatatag ng mga kasanayan upang maisagawa ang pag-aampon sa lahat ng AI-related na proyekto sa organisasyon. Pangalawa, ito ay tungkol sa pagsunod sa lahat ng government-mandated **data protection regulations** para sa mga rehiyon kung saan ito nagpapatakbo.
Ngayon, ang pamamahala ay may dalawang anyo sa loob ng mga organisasyon. Una, ito ay tungkol sa pagtukoy ng mga prinsipyo ng **ethical AI** at pagtatatag ng mga kasanayan upang maisagawa ang pag-aampon sa lahat ng mga proyekto na may kaugnayan sa AI sa organisasyon. Pangalawa, ito ay tungkol sa pagsunod sa lahat ng mga regulasyon sa proteksyon ng data na ipinag-uutos ng gobyerno para sa mga rehiyon kung saan ito nagpapatakbo.
Mga halimbawa ng data protection at privacy regulations:
Mga halimbawa ng regulasyon sa proteksyon ng data at privacy:
* `1974`, [US Privacy Act](https://www.justice.gov/opcl/privacy-act-1974) - nagre-regulate ng _federal govt._ sa koleksyon, paggamit, at paglalantad ng personal na impormasyon.
* `1996`, [US Health Insurance Portability & Accountability Act (HIPAA)](https://www.cdc.gov/phlp/publications/topic/hipaa.html) - pinoprotektahan ang personal na data sa kalusugan.
* `1998`, [US Children's Online Privacy Protection Act (COPPA)](https://www.ftc.gov/enforcement/rules/rulemaking-regulatory-reform-proceedings/childrens-online-privacy-protection-rule) - pinoprotektahan ang privacy ng data ng mga bata na wala pang 13 taong gulang.
* `1974`, [US Privacy Act](https://www.justice.gov/opcl/privacy-act-1974) - nagre-regulate sa _federal govt._ collection, paggamit, at pag-disclose ng personal na impormasyon.
* `1996`, [US Health Insurance Portability & Accountability Act (HIPAA)](https://www.cdc.gov/phlp/publications/topic/hipaa.html) - pinoprotektahan ang personal na health data.
* `1998`, [US Children's Online Privacy Protection Act (COPPA)](https://www.ftc.gov/enforcement/rules/rulemaking-regulatory-reform-proceedings/childrens-online-privacy-protection-rule) - pinoprotektahan ang data privacy ng mga bata sa ilalim ng 13.
* `2018`, [General Data Protection Regulation (GDPR)](https://gdpr-info.eu/) - nagbibigay ng mga karapatan ng gumagamit, proteksyon ng data, at privacy.
* `2018`, [California Consumer Privacy Act (CCPA)](https://www.oag.ca.gov/privacy/ccpa) - nagbibigay sa mga consumer ng mas maraming _karapatan_ sa kanilang (personal) na data.
* `2021`, China's [Personal Information Protection Law](https://www.reuters.com/world/china/china-passes-new-personal-data-privacy-law-take-effect-nov-1-2021-08-20/) - kamakailan lamang naipasa, na lumilikha ng isa sa pinakamalakas na regulasyon sa online data privacy sa buong mundo.
* `2021`, China's [Personal Information Protection Law](https://www.reuters.com/world/china/china-passes-new-personal-data-privacy-law-take-effect-nov-1-2021-08-20/) - kamakailan lamang naipasa, na lumilikha ng isa sa pinakamalakas na online data privacy regulations sa buong mundo.
> 🚨 Ang European Union na nagtakda ng GDPR (General Data Protection Regulation) ay nananatiling isa sa mga pinaka-maimpluwensiyang regulasyon sa privacy ng data ngayon. Alam mo ba na tinutukoy din nito ang [8 karapatan ng gumagamit](https://www.freeprivacypolicy.com/blog/8-user-rights-gdpr) upang protektahan ang digital na privacy at personal na data ng mga mamamayan? Alamin kung ano ang mga ito, at kung bakit mahalaga ang mga ito.
> 🚨 Ang European Union na nagtakda ng GDPR (General Data Protection Regulation) ay nananatiling isa sa mga pinaka-maimpluwensiyang data privacy regulations ngayon. Alam mo ba na tinutukoy din nito ang [8 user rights](https://www.freeprivacypolicy.com/blog/8-user-rights-gdpr) upang protektahan ang digital privacy at personal na data ng mga mamamayan? Alamin kung ano ang mga ito, at bakit mahalaga ang mga ito.
### 4. Ethics Culture
Tandaan na may natitirang hindi nakikitang agwat sa pagitan ng _compliance_ (paggawa ng sapat upang matugunan ang "letra ng batas") at pagtugon sa [mga sistematikong isyu](https://www.coursera.org/learn/data-science-ethics/home/week/4) (tulad ng ossification, information asymmetry, at distributional unfairness) na maaaring magpabilis sa weaponization ng AI.
Ang huli ay nangangailangan ng [mga collaborative na diskarte sa pagtukoy ng mga kultura ng etika](https://towardsdatascience.com/why-ai-ethics-requires-a-culture-driven-approach-26f451afa29f) na bumubuo ng emosyonal na koneksyon at pare-parehong pinagsasaluhang halaga _sa mga organisasyon_ sa industriya. Ito ay nangangailangan ng mas [pormalisadong kultura ng etika sa data](https://www.codeforamerica.org/news/formalizing-an-ethical-data-culture/) sa mga organisasyon - na nagpapahintulot sa _sinuman_ na [hilahin ang Andon cord](https://en.wikipedia.org/wiki/Andon_(manufacturing)) (upang itaas ang mga alalahanin sa etika nang maaga sa proseso) at gawing _mga etikal na pagtatasa_ (hal., sa pagkuha) isang pangunahing pamantayan sa pagbuo ng koponan sa mga proyekto ng AI.
Ang huli ay nangangailangan ng [collaborative approaches sa pagtukoy ng ethics cultures](https://towardsdatascience.com/why-ai-ethics-requires-a-culture-driven-approach-26f451afa29f) na bumubuo ng emosyonal na koneksyon at pare-parehong pinagsasaluhang halaga _sa mga organisasyon_ sa industriya. Ito ay nangangailangan ng mas [pormalisadong data ethics cultures](https://www.codeforamerica.org/news/formalizing-an-ethical-data-culture/) sa mga organisasyon - na nagpapahintulot sa _sinuman_ na [hilahin ang Andon cord](https://en.wikipedia.org/wiki/Andon_(manufacturing)) (upang itaas ang mga alalahanin sa etika nang maaga sa proseso) at gawing _ethical assessments_ (hal., sa pagkuha ng empleyado) isang pangunahing pamantayan sa pagbuo ng team sa mga proyekto ng AI.
---
## [Post-lecture quiz](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/3) 🎯
## [Post-lecture quiz](https://ff-quizzes.netlify.app/en/ds/) 🎯
## Review & Self Study
Ang mga kurso at libro ay tumutulong sa pag-unawa sa mga pangunahing konsepto ng etika at mga hamon, habang ang mga pag-aaral ng kaso at mga tool ay tumutulong sa mga kasanayan sa etika sa totoong mundo. Narito ang ilang mapagkukunan upang magsimula:
Ang mga kurso at libro ay tumutulong sa pag-unawa sa mga pangunahing konsepto ng etika at mga hamon, habang ang mga pag-aaral ng kaso at mga tool ay tumutulong sa mga kasanayan sa etika sa totoong mundo. Narito ang ilang mga mapagkukunan upang magsimula:
* [Machine Learning For Beginners](https://github.com/microsoft/ML-For-Beginners/blob/main/1-Introduction/3-fairness/README.md) - aralin tungkol sa Fairness, mula sa Microsoft.
* [Mga Prinsipyo ng Responsableng AI](https://docs.microsoft.com/en-us/learn/modules/responsible-ai-principles/) - libreng learning path mula sa Microsoft Learn.
* [Etika at Agham ng Datos](https://resources.oreilly.com/examples/0636920203964) - O'Reilly EBook (M. Loukides, H. Mason et. al)
* [Etika sa Agham ng Datos](https://www.coursera.org/learn/data-science-ethics#syllabus) - online na kurso mula sa University of Michigan.
* [Ethics Unwrapped](https://ethicsunwrapped.utexas.edu/case-studies) - mga case study mula sa University of Texas.
* [Mga Prinsipyo ng Responsable AI](https://docs.microsoft.com/en-us/learn/modules/responsible-ai-principles/) - libreng learning path mula sa Microsoft Learn.
* [Etika at Data Science](https://resources.oreilly.com/examples/0636920203964) - O'Reilly EBook (M. Loukides, H. Mason et. al)
* [Etika sa Data Science](https://www.coursera.org/learn/data-science-ethics#syllabus) - online na kurso mula sa University of Michigan.
* [Ethics Unwrapped](https://ethicsunwrapped.utexas.edu/case-studies) - mga case study mula sa University of Texas.
# Takdang-Aralin
# Takdang-Aralin
[Sumulat ng Isang Case Study Tungkol sa Etika ng Datos](assignment.md)
[Sumulat ng Isang Case Study Tungkol sa Etika ng Data](assignment.md)
---

@ -1,13 +1,13 @@
<!--
CO_OP_TRANSLATOR_METADATA:
{
"original_hash": "8796f41f566a0a8ebb72863a83d558ed",
"translation_date": "2025-08-28T11:27:49+00:00",
"original_hash": "3a34157cc63516eba97c89a0b2f8c3e6",
"translation_date": "2025-09-03T21:20:39+00:00",
"source_file": "1-Introduction/02-ethics/README.md",
"language_code": "tr"
}
-->
# Veri Etiği Giriş
# Veri Etiğine Giriş
|![ Sketchnote by [(@sketchthedocs)](https://sketchthedocs.dev) ](../../sketchnotes/02-Ethics.png)|
|:---:|
@ -17,11 +17,11 @@ CO_OP_TRANSLATOR_METADATA:
Hepimiz veriyle dolu bir dünyada yaşayan veri vatandaşlarıyız.
Pazar trendleri, 2022 yılı itibarıyla büyük organizasyonların üçte birinin verilerini çevrimiçi [Pazar Yerleri ve Borsalar](https://www.gartner.com/smarterwithgartner/gartner-top-10-trends-in-data-and-analytics-for-2020/) aracılığıyla alıp satacağını gösteriyor. **Uygulama Geliştiricileri** olarak, veri odaklı içgörüleri ve algoritma tabanlı otomasyonu günlük kullanıcı deneyimlerine entegre etmenin daha kolay ve ucuz hale geldiğini göreceğiz. Ancak yapay zeka yaygınlaştıkça, bu tür algoritmaların [silah haline getirilmesi](https://www.youtube.com/watch?v=TQHs8SA1qpk) sonucu oluşabilecek potansiyel zararları da anlamamız gerekecek.
Pazar trendleri, 2022 yılı itibarıyla büyük organizasyonların üçte birinin verilerini çevrimiçi [Pazar Yerleri ve Borsalar](https://www.gartner.com/smarterwithgartner/gartner-top-10-trends-in-data-and-analytics-for-2020/) aracılığıyla alıp satacağını gösteriyor. **Uygulama Geliştiricileri** olarak, veri odaklı içgörüleri ve algoritma tabanlı otomasyonu günlük kullanıcı deneyimlerine entegre etmenin daha kolay ve ucuz hale geldiğini göreceğiz. Ancak yapay zeka yaygınlaştıkça, bu tür algoritmaların [silah haline getirilmesi](https://www.youtube.com/watch?v=TQHs8SA1qpk) sonucu ortaya çıkabilecek potansiyel zararları da anlamamız gerekecek.
Trendler ayrıca 2025 yılına kadar [180 zettabayt](https://www.statista.com/statistics/871513/worldwide-data-created/) veri oluşturup tüketeceğimizi gösteriyor. **Veri Bilimcileri** olarak, bu durum bize kişisel verilere benzeri görülmemiş bir erişim sağlıyor. Bu, kullanıcıların davranış profillerini oluşturabileceğimiz ve karar alma süreçlerini, kullanıcıları tercih ettiğimiz sonuçlara yönlendirebilecek şekilde etkileyebileceğimiz anlamına geliyor. Aynı zamanda veri gizliliği ve kullanıcı korumaları gibi daha geniş soruları da gündeme getiriyor.
Trendler ayrıca 2025 yılına kadar [180 zettabayt](https://www.statista.com/statistics/871513/worldwide-data-created/) veri üreteceğimizi ve tüketeceğimizi gösteriyor. **Veri Bilimcileri** olarak, bu durum bize kişisel verilere benzeri görülmemiş bir erişim sağlıyor. Bu, kullanıcıların davranış profillerini oluşturabileceğimiz ve karar alma süreçlerini, kullanıcıları tercih ettiğimiz sonuçlara yönlendirebilecek şekilde etkileyebileceğimiz anlamına geliyor. Aynı zamanda veri gizliliği ve kullanıcı korumaları gibi daha geniş soruları da gündeme getiriyor.
Veri etiği, veri bilimi ve mühendisliği için artık _gerekli koruma önlemleri_ haline geldi ve veri odaklı eylemlerimizden kaynaklanabilecek potansiyel zararları ve istenmeyen sonuçları en aza indirmemize yardımcı oluyor. [Gartner'ın Yapay Zeka Hype Döngüsü](https://www.gartner.com/smarterwithgartner/2-megatrends-dominate-the-gartner-hype-cycle-for-artificial-intelligence-2020/), dijital etik, sorumlu yapay zeka ve yapay zeka yönetimi gibi ilgili trendleri, yapay zekanın _demokratikleşmesi_ ve _endüstrileşmesi_ etrafındaki daha büyük megatrendlerin anahtar itici güçleri olarak tanımlıyor.
Veri etiği, veri bilimi ve mühendisliği için artık _gerekli koruma önlemleri_ haline geldi ve veri odaklı eylemlerimizden kaynaklanabilecek potansiyel zararları ve istenmeyen sonuçları en aza indirmemize yardımcı oluyor. [Gartner'ın Yapay Zeka Hype Döngüsü](https://www.gartner.com/smarterwithgartner/2-megatrends-dominate-the-gartner-hype-cycle-for-artificial-intelligence-2020/), dijital etik, sorumlu yapay zeka ve yapay zeka yönetimi gibi ilgili trendleri, yapay zekanın _demokratikleşmesi_ ve _endüstrileşmesi_ gibi daha büyük megatrendlerin anahtar itici güçleri olarak tanımlıyor.
![Gartner'ın Yapay Zeka Hype Döngüsü - 2020](https://images-cdn.newscred.com/Zz1mOWJhNzlkNDA2ZTMxMWViYjRiOGFiM2IyMjQ1YmMwZQ==)
@ -35,44 +35,44 @@ Bu derste, veri etiği alanını keşfedeceğiz - temel kavramlardan ve zorlukla
"Etik" kelimesi, _karakter veya ahlaki doğa_ anlamına gelen [Yunanca "ethikos"](https://en.wikipedia.org/wiki/Ethics) (ve kökü "ethos") kelimesinden gelir.
**Etik**, toplumdaki davranışlarımızı yöneten ortak değerler ve ahlaki ilkelerdir. Etik, yasalara değil, "doğru ve yanlış" olarak kabul edilen normlara dayanır. Ancak etik değerlendirmeler, uyum için daha fazla teşvik yaratan kurumsal yönetim girişimlerini ve hükümet düzenlemelerini etkileyebilir.
**Etik**, toplumdaki davranışlarımızı yöneten ortak değerler ve ahlaki prensiplerle ilgilidir. Etik, yasalara değil, "doğru ve yanlış" olarak kabul edilen normlara dayanır. Ancak etik düşünceler, uyum için daha fazla teşvik yaratan kurumsal yönetim girişimlerini ve hükümet düzenlemelerini etkileyebilir.
**Veri Etiği**, "_veriler, algoritmalar ve ilgili uygulamalarla_ ilgili ahlaki sorunları inceleyen ve değerlendiren" [etik alanında yeni bir dal](https://royalsocietypublishing.org/doi/full/10.1098/rsta.2016.0360#sec-1) olarak tanımlanır. Burada, **"veri"** oluşturma, kaydetme, düzenleme, işleme, yayma, paylaşma ve kullanım ile ilgili eylemlere odaklanır; **"algoritmalar"** yapay zeka, ajanlar, makine öğrenimi ve robotlara odaklanır; ve **"uygulamalar"** sorumlu yenilik, programlama, hackleme ve etik kodlar gibi konulara odaklanır.
**Veri Etiği**, "_veriler, algoritmalar ve ilgili uygulamalarla_ ilgili ahlaki sorunları inceleyen ve değerlendiren" [etik alanında yeni bir dal](https://royalsocietypublishing.org/doi/full/10.1098/rsta.2016.0360#sec-1) olarak tanımlanır. Burada, **"veri"** veri üretimi, kaydı, kürasyonu, işlenmesi, yayılması, paylaşımı ve kullanımı ile ilgili eylemlere odaklanır; **"algoritmalar"** yapay zeka, ajanlar, makine öğrenimi ve robotlara odaklanır; ve **"uygulamalar"** sorumlu yenilik, programlama, hackleme ve etik kodlar gibi konulara odaklanır.
**Uygulamalı Etik**, [_ahlaki değerlendirmelerin pratik uygulamasıdır_](https://en.wikipedia.org/wiki/Applied_ethics). Bu, _gerçek dünya eylemleri, ürünleri ve süreçleri_ bağlamında etik sorunları aktif olarak araştırma ve bunların tanımlanmış etik değerlerimizle uyumlu kalmasını sağlamak için düzeltici önlemler alma sürecidir.
**Uygulamalı Etik**, [_ahlaki düşüncelerin pratik uygulaması_](https://en.wikipedia.org/wiki/Applied_ethics) ile ilgilidir. Bu, _gerçek dünya eylemleri, ürünleri ve süreçleri_ bağlamında etik sorunları aktif olarak araştırma ve bu sorunların tanımlı etik değerlerimizle uyumlu kalmasını sağlamak için düzeltici önlemler alma sürecidir.
**Etik Kültürü**, [_uygulamalı etiği_](https://hbr.org/2019/05/how-to-design-an-ethical-organization) operasyonel hale getirmekle ilgilidir; böylece etik ilkelerimizin ve uygulamalarımızın, bir organizasyonun her seviyesinde tutarlı ve ölçeklenebilir bir şekilde benimsenmesini sağlarız. Başarılı etik kültürleri, organizasyon genelinde etik ilkeler tanımlar, uyum için anlamlı teşvikler sağlar ve istenen davranışları teşvik ederek ve güçlendirerek etik normları her seviyede pekiştirir.
**Etik Kültürü**, [_uygulamalı etiği_](https://hbr.org/2019/05/how-to-design-an-ethical-organization) operasyonel hale getirmekle ilgilidir; böylece etik prensiplerimizin ve uygulamalarımızın tüm organizasyon genelinde tutarlı ve ölçeklenebilir bir şekilde benimsenmesini sağlar. Başarılı etik kültürleri, organizasyon genelinde etik prensipler tanımlar, uyum için anlamlı teşvikler sağlar ve istenen davranışları her seviyede teşvik ederek ve güçlendirerek etik normları pekiştirir.
## Etik Kavramları
Bu bölümde, veri etiği için **ortak değerler** (ilkeler) ve **etik zorluklar** (sorunlar) gibi kavramları tartışacağız - ve bu kavramları gerçek dünya bağlamlarında anlamanıza yardımcı olacak **vaka çalışmaları** inceleyeceğiz.
Bu bölümde, veri etiği için **ortak değerler** (prensipler) ve **etik zorluklar** (sorunlar) gibi kavramları tartışacağız - ve bu kavramları gerçek dünya bağlamlarında anlamanıza yardımcı olacak **vaka çalışmaları** inceleyeceğiz.
### 1. Etik İlkeler
### 1. Etik Prensipler
Her veri etiği stratejisi, veri ve yapay zeka projelerimizde kabul edilebilir davranışları tanımlayan ve uyumlu eylemleri yönlendiren "ortak değerler" olan _etik ilkeleri_ tanımlamakla başlar. Bunları bireysel veya ekip düzeyinde tanımlayabilirsiniz. Ancak, çoğu büyük organizasyon, bunları kurumsal düzeyde tanımlanan ve tüm ekiplerde tutarlı bir şekilde uygulanan bir _etik yapay zeka_ misyon bildirimi veya çerçevesinde belirtir.
Her veri etiği stratejisi, veri ve yapay zeka projelerimizde kabul edilebilir davranışları tanımlayan ve uyumlu eylemleri yönlendiren _etik prensipleri_ tanımlamakla başlar. Bunları bireysel veya ekip düzeyinde tanımlayabilirsiniz. Ancak, çoğu büyük organizasyon, bunları kurumsal düzeyde tanımlanan ve tüm ekiplerde tutarlı bir şekilde uygulanan bir _etik yapay zeka_ misyon bildirimi veya çerçevesinde belirtir.
**Örnek:** Microsoft'un [Sorumlu Yapay Zeka](https://www.microsoft.com/en-us/ai/responsible-ai) misyon bildirimi şöyle der: _"İnsanları önceliklendiren etik ilkelerle yönlendirilen yapay zekanın ilerlemesine bağlıyız"_ - aşağıdaki çerçevede 6 etik ilkeyi tanımlıyor:
**Örnek:** Microsoft'un [Sorumlu Yapay Zeka](https://www.microsoft.com/en-us/ai/responsible-ai) misyon bildirimi şu şekilde ifade edilir: _"İnsanları önceliklendiren etik prensiplerle yönlendirilen yapay zekanın ilerlemesine bağlıyız"_ - aşağıdaki çerçevede 6 etik prensibi tanımlıyor:
![Microsoft'ta Sorumlu Yapay Zeka](https://docs.microsoft.com/en-gb/azure/cognitive-services/personalizer/media/ethics-and-responsible-use/ai-values-future-computed.png)
Bu ilkeleri kısaca inceleyelim. _Şeffaflık_ ve _hesap verebilirlik_, diğer ilkelerin üzerine inşa edildiği temel değerlerdir - bu yüzden buradan başlayalım:
Bu prensipleri kısaca inceleyelim. _Şeffaflık_ ve _hesap verebilirlik_, diğer prensiplerin üzerine inşa edildiği temel değerlerdir - bu yüzden buradan başlayalım:
* [**Hesap Verebilirlik**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6), uygulayıcıları veri ve yapay zeka operasyonlarından ve bu etik ilkelere uyumdan _sorumlu_ kılar.
* [**Şeffaflık**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6), veri ve yapay zeka eylemlerinin kullanıcılar için _anlaşılır_ (yorumlanabilir) olmasını sağlar, kararların ne ve nedenini açıklar.
* [**Adalet**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1%3aprimaryr6), yapay zekanın _tüm insanlara_ adil davranmasını sağlar, veri ve sistemlerdeki sistemik veya örtük sosyo-teknik önyargıları ele alır.
* [**Güvenilirlik ve Güvenlik**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6), yapay zekanın tanımlanmış değerlere _tutarlı_ bir şekilde davranmasını sağlar, potansiyel zararları veya istenmeyen sonuçları en aza indirir.
* [**Hesap Verebilirlik**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6), uygulayıcıları veri ve yapay zeka operasyonları ve bu etik prensiplere uyum konusunda _sorumlu_ kılar.
* [**Şeffaflık**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6), veri ve yapay zeka eylemlerinin kullanıcılar için _anlaşılır_ (yorumlanabilir) olmasını sağlar, kararların arkasındaki ne ve nedenleri açıklar.
* [**Adalet**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1%3aprimaryr6), yapay zekanın _tüm insanlara_ adil davranmasını sağlamaya odaklanır, veri ve sistemlerdeki sistemik veya örtük sosyo-teknik önyargıları ele alır.
* [**Güvenilirlik ve Güvenlik**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6), yapay zekanın tanımlı değerlere _tutarlı_ bir şekilde davranmasını sağlar, potansiyel zararları veya istenmeyen sonuçları en aza indirir.
* [**Gizlilik ve Güvenlik**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6), veri kökenini anlamak ve kullanıcılara _veri gizliliği ve ilgili korumalar_ sağlamakla ilgilidir.
* [**Kapsayıcılık**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6), yapay zeka çözümlerini niyetle tasarlamak ve onları _geniş bir insan ihtiyaçları ve yetenekleri yelpazesine_ uyarlamakla ilgilidir.
> 🚨 Veri etiği misyon bildiriminizin ne olabileceğini düşünün. Diğer organizasyonların etik yapay zeka çerçevelerini keşfedin - işte [IBM](https://www.ibm.com/cloud/learn/ai-ethics), [Google](https://ai.google/principles) ve [Facebook](https://ai.facebook.com/blog/facebooks-five-pillars-of-responsible-ai/) örnekleri. Ortak değerleri nelerdir? Bu ilkeler, faaliyet gösterdikleri yapay zeka ürünü veya endüstri ile nasıl ilişkilidir?
> 🚨 Veri etiği misyon bildiriminizin ne olabileceğini düşünün. Diğer organizasyonların etik yapay zeka çerçevelerini keşfedin - işte [IBM](https://www.ibm.com/cloud/learn/ai-ethics), [Google](https://ai.google/principles) ve [Facebook](https://ai.facebook.com/blog/facebooks-five-pillars-of-responsible-ai/) örnekleri. Ortak değerleri nelerdir? Bu prensipler, faaliyet gösterdikleri yapay zeka ürünü veya endüstri ile nasıl ilişkilidir?
### 2. Etik Zorluklar
Etik ilkeler tanımlandıktan sonra, bir sonraki adım, veri ve yapay zeka eylemlerimizin bu ortak değerlerle uyumlu olup olmadığını değerlendirmektir. Eylemlerinizi iki kategoriye ayırarak düşünün: _veri toplama_ ve _algoritma tasarımı_.
Etik prensiplerimizi tanımladıktan sonra, bir sonraki adım, veri ve yapay zeka eylemlerimizin bu ortak değerlerle uyumlu olup olmadığını değerlendirmektir. Eylemlerinizi iki kategoriye ayırarak düşünün: _veri toplama_ ve _algoritma tasarımı_.
Veri toplama ile ilgili eylemler, muhtemelen **kişisel veri** veya yaşayan bireyler için kişisel olarak tanımlanabilir bilgiler (PII) içerecektir. Bu, bir bireyi _toplu olarak_ tanımlayan [çeşitli kişisel olmayan veri öğelerini](https://ec.europa.eu/info/law/law-topic/data-protection/reform/what-personal-data_en) içerir. Etik zorluklar, _veri gizliliği_, _veri sahipliği_ ve kullanıcılar için _bilgilendirilmiş onay_ ve _fikri mülkiyet hakları_ gibi ilgili konularla ilgili olabilir.
Veri toplama ile ilgili eylemler, muhtemelen **kişisel veri** veya yaşayan bireyler için kişisel olarak tanımlanabilir bilgiler (PII) içerecektir. Bu, bir bireyi _toplu olarak_ tanımlayan [çeşitli kişisel olmayan veri öğelerini](https://ec.europa.eu/info/law/law-topic/data-protection/reform/what-personal-data_en) içerir. Etik zorluklar, _veri gizliliği_, _veri sahipliği_ ve _bilgilendirilmiş onay_ gibi ilgili konularla bağlantılı olabilir.
Algoritma tasarımı ile ilgili eylemler, **veri setleri** toplama ve düzenleme, ardından bunları gerçek dünya bağlamlarında sonuçları tahmin eden veya kararları otomatikleştiren **veri modelleri** eğitmek ve dağıtmakla ilgili olacaktır. Etik zorluklar, _veri seti önyargısı_, _veri kalitesi_ sorunları, _adaletsizlik_ ve algoritmalardaki _yanlış temsil_ gibi konulardan kaynaklanabilir - bazıları sistemik nitelikte olabilir.
Algoritma tasarımı ile ilgili eylemler, **veri setleri** toplama ve küratörlüğünü yapmayı, ardından bunları gerçek dünya bağlamlarında sonuçları tahmin eden veya kararları otomatikleştiren **veri modelleri** eğitmek ve dağıtmak için kullanmayı içerecektir. Etik zorluklar, _veri seti önyargısı_, _veri kalitesi_ sorunları, _adaletsizlik_ ve algoritmalardaki _yanlış temsil_ gibi konulardan kaynaklanabilir - bazıları sistemik nitelikte olabilir.
Her iki durumda da, etik zorluklar, eylemlerimizin ortak değerlerimizle çatışabileceği alanları vurgular. Bu endişeleri tespit etmek, hafifletmek, en aza indirmek veya ortadan kaldırmak için, eylemlerimizle ilgili ahlaki "evet/hayır" soruları sormamız ve gerektiğinde düzeltici eylemler almamız gerekir. Şimdi bazı etik zorluklara ve bunların ortaya çıkardığı ahlaki sorulara bakalım:
@ -106,17 +106,17 @@ Burada keşfedilecek sorular şunlardır:
#### 2.4 Veri Gizliliği
[Veri gizliliği](https://www.northeastern.edu/graduate/blog/what-is-data-privacy/) veya bilgi gizliliği, kullanıcı gizliliğinin korunması ve kişisel olarak tanımlanabilir bilgilerin kullanıcı kimliğinin korunması ile ilgilidir.
[Veri gizliliği](https://www.northeastern.edu/graduate/blog/what-is-data-privacy/) veya bilgi gizliliği, kullanıcı kimliğinin korunması ve kişisel olarak tanımlanabilir bilgilerin korunması ile ilgilidir.
Burada keşfedilecek sorular şunlardır:
* Kullanıcıların (kişisel) verileri hacklere ve sızıntılara karşı güvenli mi?
* Kullanıcıların verileri yalnızca yetkili kullanıcılar ve bağlamlar tarafından erişilebilir mi?
* Kullanıcıların anonimliği, veri paylaşıldığında veya yayıldığında korunuyor mu?
* Bir kullanıcı anonimleştirilmiş veri setlerinden kimliksizleştirilebilir mi?
* Kullanıcıların verileri yalnızca yetkili kullanıcılar ve bağlamlar için erişilebilir mi?
* Veri paylaşıldığında veya yayıldığında kullanıcıların anonimliği korunuyor mu?
* Kullanıcı anonimleştirilmiş veri setlerinden kimliksizleştirilebilir mi?
#### 2.5 Unutulma Hakkı
[Unutulma Hakkı](https://en.wikipedia.org/wiki/Right_to_be_forgotten) veya [Silme Hakkı](https://www.gdpreu.org/right-to-be-forgotten/), kullanıcılara ek kişisel veri koruması sağlar. Özellikle, kullanıcılara İnternet aramalarından ve diğer konumlardan kişisel verilerin silinmesini veya kaldırılmasını talep etme hakkı verir, _belirli koşullar altında_ - geçmiş eylemlerin kendilerine karşı kullanılmamasını sağlayarak çevrimiçi olarak yeni bir başlangıç yapmalarına olanak tanır.
[Unutulma Hakkı](https://en.wikipedia.org/wiki/Right_to_be_forgotten) veya [Silinme Hakkı](https://www.gdpreu.org/right-to-be-forgotten/), kullanıcılara ek kişisel veri koruması sağlar. Özellikle, kullanıcılara İnternet aramalarından ve diğer konumlardan kişisel verilerin silinmesini veya kaldırılmasını talep etme hakkı verir, _belirli koşullar altında_ - geçmiş eylemlerin kendilerine karşı kullanılmaması için çevrimiçi olarak yeni bir başlangıç yapmalarına olanak tanır.
Burada keşfedilecek sorular şunlardır:
* Sistem, veri konularının silme talebinde bulunmasına izin veriyor mu?
@ -126,132 +126,132 @@ Burada keşfedilecek sorular şunlardır:
#### 2.6 Veri Seti Önyargısı
Veri seti veya [Toplama Önyargısı](http://researcharticles.com/index.php/bias-in-data-collection-in-research/), algoritma geliştirme için _temsil edici olmayan_ bir veri alt kümesi seçmekle ilgilidir ve bu durum çeşitli gruplar için sonuçlarda potansiyel adaletsizlik yaratır. Önyargı türleri arasında seçim veya örnekleme önyargısı, gönüllü önyargı ve araç önyargısı bulunur.
Veri seti veya [Toplama Önyargısı](http://researcharticles.com/index.php/bias-in-data-collection-in-research/), algoritma geliştirme için _temsil edici olmayan_ bir veri alt kümesi seçmekle ilgilidir ve bu durum, çeşitli gruplar için sonuçların adaletsiz olmasına neden olabilir. Önyargı türleri arasında seçim veya örnekleme önyargısı, gönüllü önyargısı ve araç önyargısı bulunur.
Burada keşfedilecek sorular şunlardır:
* Temsil edici bir veri konusu seti mi topladık?
* Toplanan veya düzenlenen veri setimizi çeşitli önyargılar açısından test ettik mi?
* Bulunan önyargıları hafifletebilir veya ortadan kaldırabilir miyiz?
* Toplanan veya küratörlüğü yapılan veri setimizi çeşitli önyargılar açısından test ettik mi?
* Keşfedilen önyargıları hafifletebilir veya ortadan kaldırabilir miyiz?
#### 2.7 Veri Kalitesi
[Veri Kalitesi](https://lakefs.io/data-quality-testing/), algoritmalarımızı geliştirmek için kullanılan düzenlenmiş veri setinin geçerliliğini inceler ve özelliklerin ve kayıtların yapay zeka amacımız için gereken doğruluk ve tutarlılık düzeyini karşılayıp karşılamadığını kontrol eder.
[Veri Kalitesi](https://lakefs.io/data-quality-testing/), algoritmalarımızı geliştirmek için kullanılan küratörlüğü yapılmış veri setinin geçerliliğini inceler ve özelliklerin ve kayıtların yapay zeka amacımız için gereken doğruluk ve tutarlılık düzeyini karşılayıp karşılamadığını kontrol eder.
Burada keşfedilecek sorular şunlardır:
* Kullanım durumumuz için geçerli _özellikler_ yakaladık mı?
* Kullanım senaryomuz için geçerli _özellikler_ yakaladık mı?
* Çeşitli veri kaynakları arasında veri _tutarlı_ bir şekilde mi yakalandı?
* Veri seti, çeşitli koşullar veya senaryolar için _tam_ mı?
* Bilgiler, gerçekliği yansıtacak şekilde _doğru_ bir şekilde mi yakalandı?
#### 2.8 Algoritma Adaleti
[Algorithm Adaleti](https://towardsdatascience.com/what-is-algorithm-fairness-3182e161cf9f), algoritma tasarımının belirli veri gruplarına sistematik olarak ayrımcılık yapıp yapmadığını ve bunun sonucunda _kaynak tahsisi_ (kaynakların o gruptan esirgenmesi veya reddedilmesi) ve _hizmet kalitesi_ (AI'nin bazı alt gruplar için diğerlerine göre daha az doğru olması) gibi [potansiyel zararlar](https://docs.microsoft.com/en-us/azure/machine-learning/concept-fairness-ml) oluşturup oluşturmadığını kontrol eder.
[Algoritma Adaleti](https://towardsdatascience.com/what-is-algorithm-fairness-3182e161cf9f), algoritma tasarımının belirli veri gruplarına sistematik olarak ayrımcılık yapıp yapmadığını ve bunun sonucunda _dağıtım_ (kaynakların o gruptan esirgenmesi veya reddedilmesi) ve _hizmet kalitesi_ (Yapay Zeka'nın bazı alt gruplar için diğerlerine kıyasla daha az doğru olması) gibi [potansiyel zararlar](https://docs.microsoft.com/en-us/azure/machine-learning/concept-fairness-ml) yaratıp yaratmadığını kontrol eder.
Burada incelenmesi gereken sorular:
Burada incelenmesi gereken sorular şunlardır:
* Model doğruluğunu farklı alt gruplar ve koşullar için değerlendirdik mi?
* Sistemi potansiyel zararlar (örneğin, stereotipleme) açısından inceledik mi?
* Belirlenen zararları azaltmak için verileri revize edebilir veya modelleri yeniden eğitebilir miyiz?
* Belirlenen zararları azaltmak için verileri yeniden düzenleyebilir veya modelleri yeniden eğitebilir miyiz?
Daha fazla bilgi edinmek için [AI Adalet kontrol listeleri](https://query.prod.cms.rt.microsoft.com/cms/api/am/binary/RE4t6dA) gibi kaynakları keşfedin.
Daha fazla bilgi edinmek için [Yapay Zeka Adaleti kontrol listeleri](https://query.prod.cms.rt.microsoft.com/cms/api/am/binary/RE4t6dA) gibi kaynakları keşfedin.
#### 2.9 Yanıltıcı Temsil
#### 2.9 Yanıltıcı Bilgi
[Veri Yanıltıcı Temsili](https://www.sciencedirect.com/topics/computer-science/misrepresentation), dürüstçe raporlanan verilerden elde edilen içgörüleri, istenen bir anlatıyı desteklemek için aldatıcı bir şekilde iletişim kurup kurmadığımızı sorgular.
[Veri Yanıltıcılığı](https://www.sciencedirect.com/topics/computer-science/misrepresentation), dürüstçe raporlanan verilerden elde edilen içgörülerin, istenen bir anlatıyı desteklemek için yanıltıcı bir şekilde sunulup sunulmadığını sorgular.
Burada incelenmesi gereken sorular:
Burada incelenmesi gereken sorular şunlardır:
* Eksik veya yanlış veri mi raporluyoruz?
* Verileri yanıltıcı sonuçlar çıkaracak şekilde mi görselleştiriyoruz?
* Verileri yanıltıcı sonuçlara yönlendirecek şekilde mi görselleştiriyoruz?
* Sonuçları manipüle etmek için seçici istatistiksel teknikler mi kullanıyoruz?
* Farklı bir sonuca yol açabilecek alternatif açıklamalar var mı?
* Farklı bir sonuca götürebilecek alternatif açıklamalar var mı?
#### 2.10 Özgür Seçim
[Özgür Seçim Yanılsaması](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice), sistem "seçim mimarilerinin" karar verme algoritmalarını kullanarak insanları tercih edilen bir sonuca yönlendirdiği, ancak onlara seçenekler ve kontrol sunduğu izlenimini verdiği durumlarda ortaya çıkar. Bu [karanlık desenler](https://www.darkpatterns.org/) kullanıcılar için sosyal ve ekonomik zararlar yaratabilir. Kullanıcı kararları davranış profillerini etkilediğinden, bu eylemler potansiyel olarak bu zararların etkisini artırabilir veya uzatabilir.
[Özgür Seçim Yanılsaması](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice), sistemin "seçim mimarilerinin" karar verme algoritmalarını kullanarak insanları tercih edilen bir sonuca yönlendirdiği, ancak onlara seçenekler ve kontrol sunduğu izlenimini verdiği durumlarda ortaya çıkar. Bu tür [karanlık desenler](https://www.darkpatterns.org/), kullanıcılar için sosyal ve ekonomik zararlara yol açabilir. Kullanıcı kararları davranış profillerini etkilediğinden, bu eylemler potansiyel olarak bu zararların etkisini artırabilir veya uzatabilir.
Burada incelenmesi gereken sorular:
* Kullanıcı, o seçimi yapmanın sonuçlarını anladı mı?
* Kullanıcı, (alternatif) seçeneklerin ve her birinin artıları ve eksilerinin farkında mıydı?
* Kullanıcı, otomatik veya etkilenmiş bir seçimi daha sonra geri alabilir mi?
Burada incelenmesi gereken sorular şunlardır:
* Kullanıcı, bu seçimi yapmanın sonuçlarını anladı mı?
* Kullanıcı, (alternatif) seçeneklerin ve her birinin artı ve eksilerinin farkında mıydı?
* Kullanıcı, otomatikleştirilmiş veya etkilenmiş bir seçimi daha sonra geri alabilir mi?
### 3. Vaka Çalışmaları
Bu etik zorlukları gerçek dünya bağlamlarında ele almak için, bu tür etik ihlallerin göz ardı edildiğinde bireyler ve toplum üzerindeki potansiyel zararları ve sonuçları vurgulayan vaka çalışmalarına bakmak faydalı olur.
Bu etik zorlukları gerçek dünya bağlamlarına yerleştirmek için, bu tür etik ihlallerin göz ardı edilmesi durumunda bireyler ve toplum üzerindeki potansiyel zararları ve sonuçları vurgulayan vaka çalışmalarına bakmak faydalı olur.
İşte birkaç örnek:
| Etik Zorluk | Vaka Çalışması |
| Etik Zorluğu | Vaka Çalışması |
|--- |--- |
| **Bilgilendirilmiş Onay** | 1972 - [Tuskegee Frengi Çalışması](https://en.wikipedia.org/wiki/Tuskegee_Syphilis_Study) - Çalışmaya katılan Afrikalı Amerikalı erkeklere ücretsiz tıbbi bakım vaat edildi, ancak araştırmacılar teşhislerini veya tedavi seçeneklerini açıklamayarak onları _aldattı_. Birçok katılımcı öldü ve eşleri veya çocukları etkilendi; çalışma 40 yıl sürdü. |
| **Veri Gizliliği** | 2007 - [Netflix veri ödülü](https://www.wired.com/2007/12/why-anonymous-data-sometimes-isnt/) araştırmacılara _50K müşteriden 10M anonimleştirilmiş film puanlaması_ sağladı, böylece öneri algoritmalarını geliştirebilirlerdi. Ancak, araştırmacılar anonimleştirilmiş verileri _harici veri setlerindeki_ (örneğin, IMDb yorumları) kişisel olarak tanımlanabilir verilerle ilişkilendirebildi - bazı Netflix abonelerini "de-anonimleştirdi".|
| **Toplama Önyargısı** | 2013 - Boston Şehri [Street Bump uygulamasını geliştirdi](https://www.boston.gov/transportation/street-bump), vatandaşların çukurları bildirmesine olanak tanıyarak şehre yol sorunlarını bulmak ve düzeltmek için daha iyi veriler sağladı. Ancak, [düşük gelir gruplarındaki insanların araba ve telefonlara erişimi daha azdı](https://hbr.org/2013/04/the-hidden-biases-in-big-data), bu da onların yol sorunlarını bu uygulamada görünmez hale getirdi. Geliştiriciler, adalet için _eşit erişim ve dijital bölünmeler_ sorunları üzerinde akademisyenlerle çalıştı. |
| **Algoritmik Adalet** | 2018 - MIT [Gender Shades Çalışması](http://gendershades.org/overview.html), cinsiyet sınıflandırma AI ürünlerinin doğruluğunu değerlendirdi ve kadınlar ve renkli insanlar için doğrulukta boşluklar olduğunu ortaya çıkardı. Bir [2019 Apple Card](https://www.wired.com/story/the-apple-card-didnt-see-genderand-thats-the-problem/) kadınlara erkeklere göre daha az kredi sunmuş gibi göründü. Her ikisi de algoritmik önyargıların sosyo-ekonomik zararlara yol açtığını gösterdi.|
| **Veri Yanıltıcı Temsili** | 2020 - [Georgia Halk Sağlığı Departmanı COVID-19 grafiklerini yayınladı](https://www.vox.com/covid-19-coronavirus-us-response-trump/2020/5/18/21262265/georgia-covid-19-cases-declining-reopening) ve x ekseninde kronolojik olmayan sıralama ile vatandaşları doğrulanmış vakalardaki eğilimler hakkında yanıltmış gibi göründü. Bu, görselleştirme hileleriyle yanıltıcı temsili örnekler. |
| **Özgür Seçim Yanılsaması** | 2020 - Öğrenme uygulaması [ABCmouse, FTC şikayetini çözmek için 10M $ ödedi](https://www.washingtonpost.com/business/2020/09/04/abcmouse-10-million-ftc-settlement/) ve ebeveynler iptal edemedikleri abonelikler için ödeme yapmaya zorlandı. Bu, kullanıcıların potansiyel olarak zararlı seçimlere yönlendirildiği seçim mimarilerindeki karanlık desenleri gösteriyor. |
| **Veri Gizliliği ve Kullanıcı Hakları** | 2021 - Facebook [Veri İhlali](https://www.npr.org/2021/04/09/986005820/after-data-breach-exposes-530-million-facebook-says-it-will-not-notify-users) 530M kullanıcının verilerini ifşa etti ve FTC'ye 5B $ ödeme yaptı. Ancak, kullanıcıları ihlal hakkında bilgilendirmeyi reddetti ve veri şeffaflığı ve erişimi ile ilgili kullanıcı haklarını ihlal etti. |
| **Bilgilendirilmiş Onay** | 1972 - [Tuskegee Frengi Çalışması](https://en.wikipedia.org/wiki/Tuskegee_Syphilis_Study) - Çalışmaya katılan Afrikalı Amerikalı erkeklere ücretsiz tıbbi bakım vaat edildi, _ancak_ araştırmacılar teşhislerini veya tedavi seçeneklerini açıklamadı. Birçok katılımcı öldü ve eşleri veya çocukları etkilendi; çalışma 40 yıl sürdü. |
| **Veri Gizliliği** | 2007 - [Netflix veri ödülü](https://www.wired.com/2007/12/why-anonymous-data-sometimes-isnt/), araştırmacılara _50K müşteriden 10M anonimleştirilmiş film derecelendirmesi_ sağladı. Ancak, araştırmacılar anonimleştirilmiş verileri _harici veri setlerindeki_ (örneğin, IMDb yorumları) kişisel olarak tanımlanabilir verilerle ilişkilendirebildi - bazı Netflix abonelerini "de-anonimleştirdi".|
| **Toplama Yanlılığı** | 2013 - Boston Şehri, vatandaşların çukurları bildirmesine olanak tanıyan [Street Bump](https://www.boston.gov/transportation/street-bump) adlı bir uygulama geliştirdi. Ancak, [düşük gelirli grupların araba ve telefonlara daha az erişimi vardı](https://hbr.org/2013/04/the-hidden-biases-in-big-data), bu da onların yol sorunlarını bu uygulamada görünmez hale getirdi. Geliştiriciler, adalet için _eşit erişim ve dijital uçurumlar_ sorunlarını çözmek üzere akademisyenlerle çalıştı. |
| **Algoritmik Adalet** | 2018 - MIT [Gender Shades Çalışması](http://gendershades.org/overview.html), cinsiyet sınıflandırma yapay zeka ürünlerinin doğruluğunu değerlendirdi ve kadınlar ve renkli insanlar için doğrulukta boşluklar olduğunu ortaya çıkardı. Bir [2019 Apple Card](https://www.wired.com/story/the-apple-card-didnt-see-genderand-thats-the-problem/), kadınlara erkeklere kıyasla daha az kredi sunuyor gibi görünüyordu. Her ikisi de sosyo-ekonomik zararlara yol açan algoritmik önyargı sorunlarını gösterdi.|
| **Veri Yanıltıcılığı** | 2020 - [Georgia Halk Sağlığı Departmanı, COVID-19 grafiklerini](https://www.vox.com/covid-19-coronavirus-us-response-trump/2020/5/18/21262265/georgia-covid-19-cases-declining-reopening) yayınladı ve x ekseninde kronolojik olmayan sıralama ile vatandaşları doğrulanmış vaka eğilimleri hakkında yanıltıyor gibi göründü. Bu, görselleştirme hileleriyle yanıltıcılığı gösterir. |
| **Özgür Seçim Yanılsaması** | 2020 - Öğrenme uygulaması [ABCmouse, FTC şikayetini çözmek için 10M $ ödedi](https://www.washingtonpost.com/business/2020/09/04/abcmouse-10-million-ftc-settlement/). Bu, kullanıcıların potansiyel olarak zararlı seçimlere yönlendirildiği seçim mimarilerindeki karanlık desenleri gösterir. |
| **Veri Gizliliği ve Kullanıcı Hakları** | 2021 - Facebook [Veri İhlali](https://www.npr.org/2021/04/09/986005820/after-data-breach-exposes-530-million-facebook-says-it-will-not-notify-users), 530M kullanıcının verilerini açığa çıkardı ve FTC'ye 5B $'lık bir anlaşma ile sonuçlandı. Ancak, kullanıcıları ihlal hakkında bilgilendirmeyi reddetti ve veri şeffaflığı ve erişimi konusundaki kullanıcı haklarını ihlal etti. |
Daha fazla vaka çalışması keşfetmek ister misiniz? Bu kaynaklara göz atın:
* [Ethics Unwrapped](https://ethicsunwrapped.utexas.edu/case-studies) - çeşitli endüstrilerde etik ikilemler.
* [Data Science Ethics course](https://www.coursera.org/learn/data-science-ethics#syllabus) - önemli vaka çalışmaları inceleniyor.
* [Where things have gone wrong](https://deon.drivendata.org/examples/) - deon kontrol listesi ve örnekler.
* [Ethics Unwrapped](https://ethicsunwrapped.utexas.edu/case-studies) - çeşitli sektörlerde etik ikilemler.
* [Veri Bilimi Etiği kursu](https://www.coursera.org/learn/data-science-ethics#syllabus) - önemli vaka çalışmaları inceleniyor.
* [Yanlış giden örnekler](https://deon.drivendata.org/examples/) - deon kontrol listesi örnekleriyle.
> 🚨 Gördüğünüz vaka çalışmalarını düşünün - hayatınızda benzer bir etik zorlukla karşılaştınız mı veya etkilendiniz mi? Bu bölümde tartıştığımız etik zorluklardan birini gösteren en az bir başka vaka çalışması düşünebilir misiniz?
> 🚨 Gördüğünüz vaka çalışmalarını düşünün - hayatınızda benzer bir etik zorluk yaşadınız mı veya etkilendiniz mi? Bu bölümde tartıştığımız etik zorluklardan birini gösteren başka bir vaka çalışması düşünebilir misiniz?
## Uygulamalı Etik
Etik kavramları, zorlukları ve gerçek dünya bağlamlarında vaka çalışmalarını konuştuk. Peki, projelerimizde etik ilkeleri ve uygulamaları nasıl _uygularız_? Ve bu uygulamaları daha iyi yönetişim için nasıl _operasyonelleştiririz_? Gerçek dünya çözümlerini keşfedelim:
Etik kavramları, zorlukları ve vaka çalışmalarını gerçek dünya bağlamlarında ele aldık. Ancak, projelerimizde etik ilkeleri ve uygulamaları _uygulamaya_ nasıl başlarız? Ve bu uygulamaları daha iyi yönetişim için nasıl _operasyonelleştiririz_? Gerçek dünya çözümlerini keşfedelim:
### 1. Mesleki Kodlar
Mesleki Kodlar, kuruluşların üyelerini etik ilkelerini ve misyon bildirimlerini desteklemeye "teşvik etmek" için bir seçenek sunar. Kodlar, profesyonel davranış için _ahlaki yönergeler_ olup, çalışanların veya üyelerin kuruluşlarının ilkelerine uygun kararlar almasına yardımcı olur. Üyelerin gönüllü uyumu kadar etkili olsalar da, birçok kuruluş üyelerin uyumunu motive etmek için ek ödüller ve cezalar sunar.
Mesleki Kodlar, kuruluşların üyelerini etik ilkelerini ve misyon beyanlarını desteklemeye "teşvik etmek" için bir seçenek sunar. Kodlar, profesyonel davranış için _ahlaki kılavuzlardır_ ve çalışanların veya üyelerin kuruluşlarının ilkelerine uygun kararlar almasına yardımcı olur. Ancak, üyelerin gönüllü uyumu kadar etkilidir; birçok kuruluş, üyelerin uyumunu motive etmek için ek ödüller ve cezalar sunar.
Örnekler:
* [Oxford Munich](http://www.code-of-ethics.org/code-of-conduct/) Etik Kodu
* [Data Science Association](http://datascienceassn.org/code-of-conduct.html) Davranış Kuralları (2013'te oluşturuldu)
* [ACM Code of Ethics and Professional Conduct](https://www.acm.org/code-of-ethics) (1993'ten beri)
* [Veri Bilimi Derneği](http://datascienceassn.org/code-of-conduct.html) Davranış Kuralları (2013'te oluşturuldu)
* [ACM Etik ve Profesyonel Davranış Kodu](https://www.acm.org/code-of-ethics) (1993'ten beri)
> 🚨 Bir profesyonel mühendislik veya veri bilimi organizasyonuna üye misiniz? Sitelerini inceleyerek bir mesleki etik kodu tanımlayıp tanımlamadıklarını görün. Bu, etik ilkeleri hakkında ne söylüyor? Üyeleri kodu takip etmeye nasıl "teşvik ediyorlar"?
> 🚨 Bir mühendislik veya veri bilimi meslek kuruluşuna üye misiniz? Sitelerini inceleyerek bir mesleki etik kodu tanımlayıp tanımlamadıklarını görün. Bu, etik ilkeleri hakkında ne söylüyor? Üyeleri kodu takip etmeye nasıl "teşvik ediyorlar"?
### 2. Etik Kontrol Listeleri
Mesleki kodlar, uygulayıcılardan beklenen _etik davranışı_ tanımlarken, [bilinen sınırlamaları](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md) vardır, özellikle büyük ölçekli projelerde. Bunun yerine, birçok veri bilimi uzmanı [kontrol listelerini](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md) savunur, bu da **ilkeleri uygulamalara bağlayabilir** ve daha belirleyici ve uygulanabilir yollar sunabilir.
Mesleki kodlar, uygulayıcılardan beklenen _etik davranışı_ tanımlarken, [büyük ölçekli projelerde](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md) uygulanabilirlik açısından bilinen sınırlamalara sahiptir. Bunun yerine, birçok veri bilimi uzmanı, ilkeleri daha belirleyici ve uygulanabilir yollarla **uygulamalara bağlayabilen** [kontrol listelerini](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md) savunur.
Kontrol listeleri, soruları "evet/hayır" görevlerine dönüştürerek operasyonelleştirilebilir ve standart ürün sürüm iş akışlarının bir parçası olarak izlenebilir hale getirir.
Örnekler:
* [Deon](https://deon.drivendata.org/) - [endüstri önerilerinden](https://deon.drivendata.org/#checklist-citations) oluşturulmuş genel amaçlı bir veri etik kontrol listesi ve kolay entegrasyon için bir komut satırı aracı.
* [Deon](https://deon.drivendata.org/) - [sektör önerilerinden](https://deon.drivendata.org/#checklist-citations) oluşturulmuş genel amaçlı bir veri etiği kontrol listesi ve kolay entegrasyon için bir komut satırı aracı.
* [Gizlilik Denetim Kontrol Listesi](https://cyber.harvard.edu/ecommerce/privacyaudit.html) - yasal ve sosyal maruz kalma perspektiflerinden bilgi işleme uygulamaları için genel rehberlik sağlar.
* [AI Adalet Kontrol Listesi](https://www.microsoft.com/en-us/research/project/ai-fairness-checklist/) - AI geliştirme döngülerine adalet kontrollerinin benimsenmesini ve entegrasyonunu desteklemek için AI uygulayıcıları tarafından oluşturuldu.
* [Veri ve AI'da etik için 22 soru](https://medium.com/the-organization/22-questions-for-ethics-in-data-and-ai-efb68fd19429) - tasarım, uygulama ve organizasyonel bağlamlarda etik sorunların ilk keşfi için daha açık uçlu bir çerçeve.
* [Yapay Zeka Adaleti Kontrol Listesi](https://www.microsoft.com/en-us/research/project/ai-fairness-checklist/) - adalet kontrollerinin yapay zeka geliştirme döngülerine entegrasyonunu desteklemek için yapay zeka uygulayıcıları tarafından oluşturulmuştur.
* [Veri ve Yapay Zekada Etik için 22 Soru](https://medium.com/the-organization/22-questions-for-ethics-in-data-and-ai-efb68fd19429) - tasarım, uygulama ve organizasyonel bağlamlarda etik sorunların ilk keşfi için yapılandırılmış daha açık uçlu bir çerçeve.
### 3. Etik Düzenlemeler
Etik, paylaşılan değerleri tanımlamak ve doğru olanı _gönüllü olarak_ yapmakla ilgilidir. **Uyum**, tanımlandığı takdirde _yasaya uymak_ ile ilgilidir. **Yönetişim**, kuruluşların etik ilkeleri uygulamak ve tanımlanmış yasalara uymak için çalıştığı tüm yolları kapsar.
Etik, paylaşılan değerleri tanımlamak ve _gönüllü olarak_ doğru olanı yapmakla ilgilidir. **Uyum**, tanımlandığı takdirde _yasalara uymakla_ ilgilidir. **Yönetişim**, kuruluşların etik ilkeleri uygulamak ve belirlenmiş yasalara uymak için faaliyet gösterdiği tüm yolları kapsar.
Bugün yönetişim, kuruluşlar içinde iki şekilde gerçekleşir. İlk olarak, **etik AI** ilkelerini tanımlamak ve kuruluşun tüm AI ile ilgili projelerinde benimsenmeyi operasyonelleştirmekle ilgilidir. İkincisi, faaliyet gösterdiği bölgeler için tüm hükümet tarafından belirlenmiş **veri koruma düzenlemelerine** uymakla ilgilidir.
Bugün yönetişim, kuruluşlar içinde iki şekilde gerçekleşir. İlk olarak, **etik yapay zeka** ilkelerini tanımlamak ve kuruluşun tüm yapay zeka ile ilgili projelerinde benimsenmesini sağlamak için uygulamalar oluşturmaktır. İkincisi, faaliyet gösterdiği bölgelerdeki tüm hükümet tarafından belirlenen **veri koruma düzenlemelerine** uymaktır.
Veri koruma ve gizlilik düzenlemeleri örnekleri:
Veri koruma ve gizlilik düzenlemelerine örnekler:
* `1974`, [ABD Gizlilik Yasası](https://www.justice.gov/opcl/privacy-act-1974) - _federal hükümetin_ kişisel bilgilerin toplanması, kullanılması ve açıklanmasını düzenler.
* `1996`, [ABD Sağlık Sigortası Taşınabilirlik ve Hesap Verebilirlik Yasası (HIPAA)](https://www.cdc.gov/phlp/publications/topic/hipaa.html) - kişisel sağlık verilerini korur.
* `1974`, [ABD Gizlilik Yasası](https://www.justice.gov/opcl/privacy-act-1974) - _federal hükümetin_ kişisel bilgileri toplamasını, kullanmasını ve ifşa etmesini düzenler.
* `1996`, [ABD Sağlık Sigortası Taşınabilirlik ve Sorumluluk Yasası (HIPAA)](https://www.cdc.gov/phlp/publications/topic/hipaa.html) - kişisel sağlık verilerini korur.
* `1998`, [ABD Çocukların Çevrimiçi Gizliliğini Koruma Yasası (COPPA)](https://www.ftc.gov/enforcement/rules/rulemaking-regulatory-reform-proceedings/childrens-online-privacy-protection-rule) - 13 yaş altındaki çocukların veri gizliliğini korur.
* `2018`, [Genel Veri Koruma Yönetmeliği (GDPR)](https://gdpr-info.eu/) - kullanıcı hakları, veri koruma ve gizlilik sağlar.
* `2018`, [California Tüketici Gizliliği Yasası (CCPA)](https://www.oag.ca.gov/privacy/ccpa) tüketicilere (kişisel) verileri üzerinde daha fazla _hak_ verir.
* `2018`, [Kaliforniya Tüketici Gizliliği Yasası (CCPA)](https://www.oag.ca.gov/privacy/ccpa) - tüketicilere (kişisel) verileri üzerinde daha fazla _hak_ verir.
* `2021`, Çin'in [Kişisel Bilgi Koruma Yasası](https://www.reuters.com/world/china/china-passes-new-personal-data-privacy-law-take-effect-nov-1-2021-08-20/) yeni geçti ve dünya çapında en güçlü çevrimiçi veri gizliliği düzenlemelerinden birini oluşturdu.
> 🚨 Avrupa Birliği tarafından tanımlanan GDPR (Genel Veri Koruma Yönetmeliği), bugün en etkili veri gizliliği düzenlemelerinden biri olmaya devam ediyor. Ayrıca vatandaşların dijital gizliliğini ve kişisel verilerini korumak için [8 kullanıcı hakkı](https://www.freeprivacypolicy.com/blog/8-user-rights-gdpr) tanımladığını biliyor muydunuz? Bunların ne olduğunu ve neden önemli olduklarını öğrenin.
### 4. Etik Kültürü
Uyum (yasaların "harfini" yerine getirmek için yeterince yapmak) ile [sistemik sorunları](https://www.coursera.org/learn/data-science-ethics/home/week/4) ele almak (örneğin, katılaşma, bilgi asimetrisi ve dağıtımsal adaletsizlik) arasında hala elle tutulamayan bir boşluk olduğunu unutmayın.
Not edin ki, _uyum_ (yasanın "harfine" uygun hareket etmek) ile [sistemik sorunları](https://www.coursera.org/learn/data-science-ethics/home/week/4) ele almak (örneğin, katılaşma, bilgi asimetrisi ve dağıtım adaletsizliği) arasında soyut bir boşluk vardır. Bu tür sorunlar, yapay zekanın silah haline getirilmesini hızlandırabilir.
İkincisi, [etik kültürlerini tanımlamak için işbirlikçi yaklaşımlar](https://towardsdatascience.com/why-ai-ethics-requires-a-culture-driven-approach-26f451afa29f) gerektirir ve bu, endüstrideki kuruluşlar arasında duygusal bağlar ve tutarlı paylaşılan değerler oluşturur. Bu, kuruluşlarda daha [resmileştirilmiş veri etik kültürleri](https://www.codeforamerica.org/news/formalizing-an-ethical-data-culture/) oluşturmayı gerektirir - _herkesin_ (etik endişeleri sürecin başında dile getirmek için) [Andon ipini çekmesine](https://en.wikipedia.org/wiki/Andon_(manufacturing)) olanak tanır ve _etik değerlendirmeleri_ (örneğin, işe alımda) AI projelerinde ekip oluşturmanın temel kriteri haline getirir.
İkincisi, [etik kültürlerini tanımlamak için işbirlikçi yaklaşımlar](https://towardsdatascience.com/why-ai-ethics-requires-a-culture-driven-approach-26f451afa29f) gerektirir. Bu, duygusal bağlar kurmayı ve sektördeki kuruluşlar arasında tutarlı ortak değerler oluşturmayı içerir. Bu, kuruluşlarda daha [resmileştirilmiş veri etiği kültürleri](https://www.codeforamerica.org/news/formalizing-an-ethical-data-culture/) oluşturmayı gerektirir - _herkesin_ (süreçte erken aşamada etik kaygıları dile getirmek için) [Andon ipini çekmesine](https://en.wikipedia.org/wiki/Andon_(manufacturing)) olanak tanır ve yapay zeka projelerinde ekip oluşturmanın temel kriteri olarak _etik değerlendirmeleri_ (örneğin, işe alımda) yapar.
---
## [Ders sonrası test](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/3) 🎯
## Gözden Geçirme ve Kendi Kendine Çalışma
## [Ders sonrası sınav](https://ff-quizzes.netlify.app/en/ds/) 🎯
## Gözden Geçirme ve Kendi Kendine Çalışma
Kurslar ve kitaplar temel etik kavramları ve zorlukları anlamaya yardımcı olurken, vaka çalışmaları ve araçlar gerçek dünya bağlamlarında uygulamalı etik uygulamalarına yardımcı olur. İşte başlamak için birkaç kaynak.
Kurslar ve kitaplar, temel etik kavramlarını ve zorluklarını anlamaya yardımcı olurken, vaka çalışmaları ve araçlar, gerçek dünya bağlamlarında uygulamalı etik uygulamalarına yardımcı olur. Başlamak için birkaç kaynak:
* [Başlangıç Seviyesi Makine Öğrenimi](https://github.com/microsoft/ML-For-Beginners/blob/main/1-Introduction/3-fairness/README.md) - Microsoft'tan Adalet üzerine bir ders.
* [Başlangıç Seviyesi için Makine Öğrenimi](https://github.com/microsoft/ML-For-Beginners/blob/main/1-Introduction/3-fairness/README.md) - Microsoft'tan Adalet üzerine bir ders.
* [Sorumlu Yapay Zeka İlkeleri](https://docs.microsoft.com/en-us/learn/modules/responsible-ai-principles/) - Microsoft Learn'den ücretsiz öğrenim yolu.
* [Etik ve Veri Bilimi](https://resources.oreilly.com/examples/0636920203964) - O'Reilly EKitap (M. Loukides, H. Mason ve diğerleri)
* [Veri Bilimi Etiği](https://www.coursera.org/learn/data-science-ethics#syllabus) - Michigan Üniversitesi'nden çevrimiçi kurs.
@ -264,4 +264,4 @@ Kurslar ve kitaplar temel etik kavramları ve zorlukları anlamaya yardımcı ol
---
**Feragatname**:
Bu belge, [Co-op Translator](https://github.com/Azure/co-op-translator) adlı yapay zeka çeviri hizmeti kullanılarak çevrilmiştir. Doğruluk için çaba göstersek de, otomatik çevirilerin hata veya yanlışlıklar içerebileceğini lütfen unutmayın. Belgenin orijinal dili, yetkili kaynak olarak kabul edilmelidir. Kritik bilgiler için profesyonel insan çevirisi önerilir. Bu çevirinin kullanımından kaynaklanan yanlış anlamalar veya yanlış yorumlamalar için sorumluluk kabul etmiyoruz.
Bu belge, AI çeviri hizmeti [Co-op Translator](https://github.com/Azure/co-op-translator) kullanılarak çevrilmiştir. Doğruluğu sağlamak için çaba göstersek de, otomatik çevirilerin hata veya yanlışlık içerebileceğini lütfen unutmayın. Belgenin orijinal dili, yetkili kaynak olarak kabul edilmelidir. Kritik bilgiler için profesyonel insan çevirisi önerilir. Bu çevirinin kullanımından kaynaklanan yanlış anlamalar veya yanlış yorumlamalardan sorumlu değiliz.

@ -1,203 +1,199 @@
<!--
CO_OP_TRANSLATOR_METADATA:
{
"original_hash": "8796f41f566a0a8ebb72863a83d558ed",
"translation_date": "2025-08-25T16:39:50+00:00",
"original_hash": "3a34157cc63516eba97c89a0b2f8c3e6",
"translation_date": "2025-09-03T21:01:35+00:00",
"source_file": "1-Introduction/02-ethics/README.md",
"language_code": "tw"
}
-->
# 資料倫理簡介
|![ [(@sketchthedocs)](https://sketchthedocs.dev) 繪製的草圖筆記 ](../../sketchnotes/02-Ethics.png)|
|![ Sketchnote by [(@sketchthedocs)](https://sketchthedocs.dev) ](../../sketchnotes/02-Ethics.png)|
|:---:|
| 資料科學倫理 - _由 [@nitya](https://twitter.com/nitya) 繪製的草圖筆記_ |
| 資料科學倫理 - _Sketchnote by [@nitya](https://twitter.com/nitya)_ |
---
我們都是生活在數據化世界中的資料公民。
我們都是生活在數據化世界中的數據公民。
市場趨勢顯示到2022年每三家大型組織中就有一家將通過線上[市場和交易所](https://www.gartner.com/smarterwithgartner/gartner-top-10-trends-in-data-and-analytics-for-2020/)購買和出售其數據。作為**應用程式開發者**,我們會發現將數據驅動的洞察力和算法驅動的自動化整合到日常用戶體驗中變得更加容易和便宜。但隨著人工智慧AI的普及,我們也需要了解這些算法在大規模應用中可能帶來的[武器化](https://www.youtube.com/watch?v=TQHs8SA1qpk)危害。
市場趨勢顯示到2022年三分之一的大型組織將通過線上[市場和交易所](https://www.gartner.com/smarterwithgartner/gartner-top-10-trends-in-data-and-analytics-for-2020/)購買和出售數據。作為**應用程式開發者**,我們將更容易、更便宜地將數據驅動的洞察力和算法驅動的自動化整合到日常用戶體驗中。但隨著人工智慧的普及,我們也需要了解這些算法在大規模應用中可能造成的[武器化](https://www.youtube.com/watch?v=TQHs8SA1qpk)危害。
趨勢還顯示到2025年我們將創造消耗超過[180澤字節](https://www.statista.com/statistics/871513/worldwide-data-created/)的數據。作為**資料科學家**,這讓我們能夠以前所未有的程度接觸到個人數據。這意味著我們可以建立用戶的行為檔案,並以某種方式影響決策,從而創造一種[自由選擇的假象](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice),同時可能將用戶推向我們偏好的結果。這也引發了關於數據隱私和用戶保護的更廣泛問題。
趨勢還顯示到2025年我們將創造消耗超過[180澤字節](https://www.statista.com/statistics/871513/worldwide-data-created/)的數據。作為**資料科學家**,這使我們能夠前所未有地接觸到個人數據。這意味著我們可以建立用戶的行為檔案,並以某些方式影響決策,創造一種[自由選擇的幻覺](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice),同時可能引導用戶朝向我們偏好的結果。這也引發了關於數據隱私和用戶保護的更廣泛問題。
資料倫理現在是資料科學和工程的_必要防護欄_幫助我們最大限度地減少數據驅動行動可能帶來的潛在危害和意外後果。[Gartner AI 技術成熟度曲線](https://www.gartner.com/smarterwithgartner/2-megatrends-dominate-the-gartner-hype-cycle-for-artificial-intelligence-2020/)將數字倫理、負責任的AI和AI治理的相關趨勢確定為推動AI_民主化_和_工業化_這兩大趨勢的關鍵因素。
![Gartner的AI技術成熟度曲線 - 2020](https://images-cdn.newscred.com/Zz1mOWJhNzlkNDA2ZTMxMWViYjRiOGFiM2IyMjQ1YmMwZQ==)
在本課程中我們將探索資料倫理這一迷人的領域——從核心概念和挑戰到案例研究和應用AI概念如治理這些都幫助在處理數據和AI的團隊和組織中建立倫理文化。
資料倫理現在是資料科學和工程的_必要防護措施_幫助我們減少數據驅動行動可能帶來的潛在危害和意外後果。[Gartner人工智慧技術成熟度曲線](https://www.gartner.com/smarterwithgartner/2-megatrends-dominate-the-gartner-hype-cycle-for-artificial-intelligence-2020/)指出數字倫理、負責任的人工智慧和人工智慧治理是推動人工智慧_民主化_和_工業化_的主要趨勢。
![Gartner的人工智慧技術成熟度曲線 - 2020](https://images-cdn.newscred.com/Zz1mOWJhNzlkNDA2ZTMxMWViYjRiOGFiM2IyMjQ1YmMwZQ==)
在本課程中,我們將探索資料倫理這個迷人的領域——從核心概念和挑戰,到案例研究和應用人工智慧概念(如治理),幫助在處理數據和人工智慧的團隊和組織中建立倫理文化。
## [課前測驗](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/2) 🎯
## 基本定義
讓我們從理解基本術語開始
讓我們先了解一些基本術語
"倫理"一詞來自[希臘詞 "ethikos"](https://en.wikipedia.org/wiki/Ethics)(及其根源 "ethos"),意_品格或道德本質_。
「倫理」一詞源自[希臘詞 "ethikos"](https://en.wikipedia.org/wiki/Ethics)(及其根源 "ethos"),意_品格或道德本質_。
**倫理**是指在社會中規範我們行為的共同價值觀和道德原則。倫理不是基於法律,而是基於廣泛接受的"對與錯"的標準。然而,倫理考量可以影響公司治理舉措和政府法規,從而創造更多的合規激勵
**倫理**是指在社會中規範我們行為的共同價值觀和道德原則。倫理不是基於法律,而是基於廣泛接受的「對與錯」的標準。然而,倫理考量可以影響企業治理倡議和政府法規,從而創造更多遵守的激勵措施
**資料倫理**是一個[新的倫理分支](https://royalsocietypublishing.org/doi/full/10.1098/rsta.2016.0360#sec-1)它"研究和評估與_數據、算法及相關實踐_相關的道德問題"。其中,**"數據"**側重於與生成、記錄、管理、處理、傳播、共享和使用相關的行動,**"算法"**側重於AI、代理、機器學習和機器人**"實踐"**則側重於負責任的創新、編程、駭客行為和倫理守則等主題。
**資料倫理**是一個[新的倫理分支](https://royalsocietypublishing.org/doi/full/10.1098/rsta.2016.0360#sec-1)研究和評估與_數據、算法及相關實踐_相關的道德問題。在這裡,**「數據」**側重於生成、記錄、策劃、處理、傳播、共享和使用的行動,**「算法」**側重於人工智慧、代理、機器學習和機器人,**「實踐」**側重於負責任的創新、編程、駭客行為和倫理守則等主題。
**應用倫理**是[道德考量的實際應用](https://en.wikipedia.org/wiki/Applied_ethics)。它是積極調查_現實世界行動、產品和流程_中的倫理問題並採取糾正措施以確保這些行動與我們定義的倫理價值保持一致的過程。
**倫理文化**是關於[將應用倫理_操作化_](https://hbr.org/2019/05/how-to-design-an-ethical-organization),以確保我們的倫理原則和實踐在整個組織中以一致且可擴展的方式被採用。成功的倫理文化會定義全組織範圍的倫理原則,提供有意義的合規激勵,並通過在組織各層級鼓勵和放大期望的行為來強化倫理規範。
**倫理文化**是關於[_操作化_應用倫理](https://hbr.org/2019/05/how-to-design-an-ethical-organization),確保我們的倫理原則和實踐在整個組織中以一致且可擴展的方式被採用。成功的倫理文化定義了全組織範圍的倫理原則,提供有意義的遵守激勵措施,並通過鼓勵和放大期望的行為來加強倫理規範。
## 倫理概念
在本節中,我們將討論**共同價值觀**(原則)和**倫理挑戰**(問題)等資料倫理概念,並通過**案例研究**來幫助您在現實世界的背景中理解這些概念。
在本節中,我們將討論資料倫理中的**共同價值**(原則)和**倫理挑戰**(問題),並探索**案例研究**幫助您在現實世界的背景中理解這些概念。
### 1. 倫理原則
每個資料倫理策略都始於定義_倫理原則_——這些"共同價值觀"描述了可接受的行為並指導我們在資料和AI項目中的合規行動。您可以在個人或團隊層面定義這些原則。然而大多數大型組織會在公司層面定義這些原則並在所有團隊中一致執行通常以_倫理AI_使命聲明或框架的形式呈現
每個資料倫理策略都始於定義_倫理原則_——描述可接受行為並指導合規行動的「共同價值」用於我們的數據和人工智慧項目。您可以在個人或團隊層面定義這些原則。然而大多數大型組織會在企業層面定義並一致執行的_倫理人工智慧_使命聲明或框架中概述這些原則
**範例:** 微軟的[負責任AI](https://www.microsoft.com/en-us/ai/responsible-ai)使命聲明寫道_"我們致力於推動以道德原則為基礎的AI發展將人放在首位"_並在以下框架中確定了6個倫理原則:
**範例:** 微軟的[負責任人工智慧](https://www.microsoft.com/en-us/ai/responsible-ai)使命聲明寫道_「我們致力於推動以倫理原則為基礎的人工智慧將人放在首位」_並在以下框架中識別了六個倫理原則:
![微軟的負責任AI](https://docs.microsoft.com/en-gb/azure/cognitive-services/personalizer/media/ethics-and-responsible-use/ai-values-future-computed.png)
![微軟的負責任人工智慧](https://docs.microsoft.com/en-gb/azure/cognitive-services/personalizer/media/ethics-and-responsible-use/ai-values-future-computed.png)
讓我們簡要探討這些原則。_透明性_和_問責性_是其他原則的基石,因此我們從這裡開始:
讓我們簡要探索這些原則。_透明性_和_問責性_是其他原則的基礎價值,因此我們從這裡開始:
* [**問責性**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6)使從業者對其資料和AI操作以及對這些倫理原則的合規負責。
* [**透明性**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6)確保資料和AI行動對用戶是_可理解的_可解釋的解釋決策背後的內容和原因。
* [**公平性**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1%3aprimaryr6)——專注於確保AI對_所有人_公平對待解決資料和系統中的任何系統性或隱性社會技術偏見。
* [**可靠性與安全性**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6)——確保AI行為與定義的價值觀_一致_最大限度地減少潛在危害或意外後果。
* [**隱私與安全**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6)——關於理解資料來源並為用戶提供_資料隱私及相關保護_。
* [**包容性**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6)——關於有意設計AI解決方案並使其適應_廣泛的人類需求_和能力。
* [**問責性**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6)使實踐者對其數據和人工智慧操作以及遵守這些倫理原則負責。
* [**透明性**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6)確保數據和人工智慧行動對用戶是_可理解的_可解釋的解釋決策背後的內容和原因。
* [**公平性**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1%3aprimaryr6)——確保人工智慧公平對待_所有人_解決數據和系統中的任何系統性或隱性社會技術偏見。
* [**可靠性與安全性**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6)——確保人工智慧以_一致性_的方式行事符合定義的價值觀減少潛在危害或意外後果。
* [**隱私與安全**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6)——了解數據的來源並為用戶提供_數據隱私及相關保護_。
* [**包容性**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6)——有意設計人工智慧解決方案,適應以滿足_廣泛的人類需求_和能力。
> 🚨 想想您的資料倫理使命聲明可能是什麼。探索其他組織的倫理AI框架——這裡有[IBM](https://www.ibm.com/cloud/learn/ai-ethics)、[Google](https://ai.google/principles)和[Facebook](https://ai.facebook.com/blog/facebooks-five-pillars-of-responsible-ai/)的範例。它們有哪些共同的價值觀這些原則如何與它們運作的AI產品或行業相關?
> 🚨 想想您的資料倫理使命聲明可能是什麼。探索其他組織的倫理人工智慧框架——以下是[IBM](https://www.ibm.com/cloud/learn/ai-ethics)、[Google](https://ai.google/principles)和[Facebook](https://ai.facebook.com/blog/facebooks-five-pillars-of-responsible-ai/)的範例。他們有哪些共同的價值觀?這些原則如何與他們所運營的人工智慧產品或行業相關?
### 2. 倫理挑戰
一旦我們定義了倫理原則,下一步就是評估我們的資料和AI行動是否與這些共同價值觀一致。考慮您的行動可以分為兩類_資料收集_和_算法設計_。
一旦我們定義了倫理原則,下一步就是評估我們的數據和人工智慧行動是否符合這些共同價值。思考您的行動可以分為兩類_數據收集_和_算法設計_。
資料收集方面,行動可能涉及**個人資料**或可識別的個人信息PII這些信息可以識別活著的個體包括[多樣的非個人資料項目](https://ec.europa.eu/info/law/law-topic/data-protection/reform/what-personal-data_en),這些項目_集體_識別一個人。倫理挑戰可能涉及_資料隱私_、_資料所有權_以及相關主題如_知情同意_和用戶的_知識產權_。
數據收集方面,行動可能涉及**個人數據**或可識別的個人信息PII這些信息可以識別活著的個人。這包括[多樣化的非個人數據項目](https://ec.europa.eu/info/law/law-topic/data-protection/reform/what-personal-data_en),這些數據_共同_識別一個人。倫理挑戰可能涉及_數據隱私_、_數據所有權_以及相關主題如_知情同意_和用戶的_知識產權權利_。
在算法設計方面,行動將涉及收集和管理**數據集**,然後使用它們來訓練和部署**數據模型**以在現實世界的背景中預測結果或自動化決策。倫理挑戰可能來自_數據集偏見_、_數據質量_問題、_不公平性_和算法中的_誤導性_包括一些系統性問題。
在算法設計方面,行動將涉及收集和策劃**數據集**,然後使用它們來訓練和部署**數據模型**以在現實世界的背景中預測結果或自動化決策。倫理挑戰可能來自_數據集偏差_、_數據質量_問題、_不公平性_和算法中的_誤導性_——包括一些系統性問題。
在這兩種情況下,倫理挑戰突出了我們的行動可能與共同價值發生衝突的領域。為了檢測、減輕、最小化或消除這些問題,我們需要針對行動提出道德上的"是/否"問題,然後根據需要採取糾正措施。讓我們看看一些倫理挑戰及其引發的道德問題:
在這兩種情況下,倫理挑戰突出了我們的行動可能與共同價值發生衝突的領域。為了檢測、減輕、最小化或消除這些問題,我們需要針對行動提出道德的「是/否」問題,然後根據需要採取糾正措施。讓我們看看一些倫理挑戰及其引發的道德問題:
#### 2.1 數據所有權
#### 2.1 資料所有權
數據收集通常涉及可以識別數據主體的個人數據。[數據所有權](https://permission.io/blog/data-ownership)是關於與數據的創建、處理和傳播相關的_控制_和[_用戶權利_](https://permission.io/blog/data-ownership)。
資料收集通常涉及可識別資料主體的個人資料。[資料所有權](https://permission.io/blog/data-ownership)關於與資料創建、處理和傳播相關的_控制_和[用戶權利](https://permission.io/blog/data-ownership)。
我們需要提出的道德問題包括:
* 誰擁有資料?(用戶還是組織)
* 資料主體擁有哪些權利?(例如:訪問、刪除、可攜性)
* 組織擁有哪些權利?(例如:更正惡意用戶評論)
需要提出的道德問題包括:
* 誰擁有數據?(用戶或組織)
* 數據主體擁有哪些權利?(例如:訪問、刪除、可攜性)
* 組織擁有哪些權利?(例如:糾正惡意用戶評論)
#### 2.2 知情同意
[知情同意](https://legaldictionary.net/informed-consent/)指用戶在充分了解相關事實(包括目的、潛在風險和替代方案)的情況下,同意某項行動(如資料收集)。
[知情同意](https://legaldictionary.net/informed-consent/)指的是用戶在充分了解相關事實(包括目的、潛在風險和替代方案)的情況下同意某項行動(如數據收集)。
需要探討的問題包括:
* 用戶(資料主體)是否允許資料的收集和使用?
* 用戶是否理解資料收集的目的?
* 用戶是否理解參與可能帶來的潛在風險?
* 用戶(數據主體)是否允許數據的捕獲和使用?
* 用戶是否理解捕獲數據的目的?
* 用戶是否理解參與可能帶來的潛在風險?
#### 2.3 知識產權
[知識產權](https://en.wikipedia.org/wiki/Intellectual_property)指由人類創造的無形產物,這些產物可能對個人或企業具有_經濟價值_。
[知識產權](https://en.wikipedia.org/wiki/Intellectual_property)指的是人類創造的無形產物,可能對個人或企業具有_經濟價值_。
需要探討的問題包括:
* 收集的資料是否對用戶或企業具有經濟價值?
* **用戶**是否擁有這裡的知識產權?
* **組織**是否擁有這裡的知識產權?
* 如果這些權利存在,我們如何保護它們?
* 收集的數據是否對用戶或企業具有經濟價值?
* **用戶**是否擁有知識產權?
* **組織**是否擁有知識產權?
* 如果存在這些權利,我們如何保護它們?
#### 2.4 資料隱私
#### 2.4 數據隱私
[資料隱私](https://www.northeastern.edu/graduate/blog/what-is-data-privacy/)或信息隱私指保護用戶隱私和身份,特別是與可識別個人信息相關的隱私
[數據隱私](https://www.northeastern.edu/graduate/blog/what-is-data-privacy/)或信息隱私指的是保護用戶隱私和身份,特別是與可識別個人信息相關。
需要探討的問題包括:
* 用戶的(個人)資料是否安全,防止駭客攻擊和洩漏?
* 用戶的資料是否僅限於授權用戶和上下文訪問?
* 在資料共享或傳播時,用戶的匿名性是否得到保護
* 用戶是否可以從匿名數據集中被重新識別?
* 用戶的(個人)數據是否防止駭客攻擊和洩漏?
* 用戶的數據是否僅限於授權用戶和上下文訪問?
* 在數據共享或傳播時,是否保留用戶的匿名性
* 用戶是否可以從匿名數據集中被去識別?
#### 2.5 被遺忘權
#### 2.5 被遺忘
[被遺忘權](https://en.wikipedia.org/wiki/Right_to_be_forgotten)或[刪除權](https://www.gdpreu.org/right-to-be-forgotten/)為用戶提供額外的個人資料保護。具體來說,它賦予用戶在特定情況下請求刪除或移除個人資料的權利,允許他們在網上獲得一個新的開始,而不會因過去的行為受到影響。
[被遺忘](https://en.wikipedia.org/wiki/Right_to_be_forgotten)或[刪除權](https://www.gdpreu.org/right-to-be-forgotten/)為用戶提供額外的個人數據保護。具體而言,它賦予用戶在特定情況下要求刪除或移除個人數據的權利,允許他們在網上重新開始,而不受過去行動的影響。
需要探討的問題包括:
* 系統是否允許資料主體請求刪除?
* 用戶撤回同意是否應觸發自動刪除?
* 資料是否在未經同意或非法手段收集?
* 我們是否符合政府對資料隱私的法規?
* 系統是否允許數據主體請求刪除?
* 用戶撤回同意是否應觸發自動刪除?
* 是否在未經同意或非法手段收集的數據
* 我們是否符合政府對數據隱私的法規?
#### 2.6 數據集偏
#### 2.6 數據集偏
數據集或[收集偏見](http://researcharticles.com/index.php/bias-in-data-collection-in-research/)指為算法開發選擇了一個_非代表性_的數據子集可能導致對不同群體的不公平結果。偏見類型包括選擇或抽樣偏見、自願者偏見和工具偏見
數據集或[收集偏差](http://researcharticles.com/index.php/bias-in-data-collection-in-research/)指的是選擇_非代表性_的數據子集進行算法開發可能導致對不同群體的結果不公平。偏差類型包括選擇或抽樣偏差、志願者偏差和工具偏差
需要探討的問題包括:
* 我們是否招募了一個具有代表性的資料主體集合
* 我們是否測試了收集或管理的數據集是否存在各種偏見
* 我們是否可以減輕或消除發現的任何偏見
* 我們是否招募了代表性數據主體
* 我們是否測試了收集或策劃的數據集以檢測各種偏差
* 我們是否能減輕或消除發現的偏差
#### 2.7 資料質量
#### 2.7 數據質量
[資料質量](https://lakefs.io/data-quality-testing/)檢查用於開發算法的數據集的有效性,確保特徵和記錄符合我們AI目的所需的準確性和一致性要求。
[數據質量](https://lakefs.io/data-quality-testing/)檢查用於開發算法的策劃數據集的有效性,確保特徵和記錄符合人工智慧目的所需的準確性和一致性要求。
需要探討的問題包括:
* 我們是否捕獲了適合我們用例的有效_特徵_
* 是否在不同數據來源中_一致地_捕獲了資料
* 數據集是否_完整_涵蓋了不同的條件或場景?
* 捕獲的信息是否_準確_反映了現實?
* 我們是否捕獲了適合我們使例的有效_特徵_
* 數據是否在不同數據來源中_一致地_捕獲
* 數據集是否_完整_涵蓋多樣化的條件或場景?
* 捕獲的信息是否_準確_反映了現實
#### 2.8 算法公平性
[演算法公平性](https://towardsdatascience.com/what-is-algorithm-fairness-3182e161cf9f) 是檢查演算法設計是否系統性地對特定數據主體的子群體造成歧視,導致在資源分配(_allocation_方面資源被拒絕或扣留以及服務品質_quality of service_方面AI對某些子群體的準確性不如其他群體出現[潛在傷害](https://docs.microsoft.com/en-us/azure/machine-learning/concept-fairness-ml)。
[演算法公平性](https://towardsdatascience.com/what-is-algorithm-fairness-3182e161cf9f) 是檢查演算法設計是否系統性地對特定數據主體的子群體造成歧視,導致在資源分配(例如拒絕或扣留該群體的資源)和服務品質(例如 AI 對某些子群體的準確性不如其他群體)方面的[潛在傷害](https://docs.microsoft.com/en-us/azure/machine-learning/concept-fairness-ml)。
以下是需要探討的問題:
需要探討的問題包括
* 我們是否評估了模型在不同子群體和條件下的準確性?
* 我們是否仔細檢查了系統可能造成的傷害(例如刻板印象)?
* 我們是否可以修正數據或重新訓練模型以減輕已識別的傷害?
探索像[AI公平性檢查清單](https://query.prod.cms.rt.microsoft.com/cms/api/am/binary/RE4t6dA)等資源以了解更多。
探索像 [AI 公平性檢查清單](https://query.prod.cms.rt.microsoft.com/cms/api/am/binary/RE4t6dA) 這樣的資源以了解更多。
#### 2.9 錯誤呈現
[數據錯誤呈現](https://www.sciencedirect.com/topics/computer-science/misrepresentation) 是指我們是否以欺騙的方式傳達來自誠實報告數據的洞察,以支持某種期望的敘述。
以下是需要探討的問題:
需要探討的問題包括
* 我們是否報告了不完整或不準確的數據?
* 我們是否以誤導的方式可視化數據,導致錯誤結論
* 我們是否以誤導性結論的方式可視化數據?
* 我們是否使用選擇性的統計技術來操控結果?
* 是否存在可能提供不同結論的替代解釋?
#### 2.10 自由選擇
[自由選擇的象](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice) 是指系統的「選擇架構」使用決策演算法來引導人們選擇偏好的結果,同時看似給予他們選擇和控制。這些[黑暗模式](https://www.darkpatterns.org/)可能對用戶造成社會和經濟上的傷害。由於用戶的決策會影響行為檔案,這些行動可能驅動未來的選擇,進一步放大或延這些傷害的影響。
[自由選擇的象](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice) 是指系統的「選擇架構」使用決策演算法來引導人們採取偏好的結果,同時看似給予他們選擇和控制權。這些[黑暗模式](https://www.darkpatterns.org/)可能對用戶造成社會和經濟上的傷害。由於用戶的決策會影響行為檔案,這些行動可能驅動未來的選擇,進一步放大或延這些傷害的影響。
以下是需要探討的問題:
需要探討的問題包括
* 用戶是否理解做出該選擇的影響?
* 用戶是否了解(替代)選擇及其各自的優缺點?
* 用戶是否能夠在事後逆轉自動化或受影響的選擇?
* 用戶是否可以在之後撤銷自動化或受影響的選擇?
### 3. 案例研究
為了將這些倫理挑戰置於現實世界的背景中,研究案例研究有助於了解當忽視這些倫理問題時,可能對個人和社會造成的傷害和後果。
為了將這些倫理挑戰置於現實世界的背景中,研究案例有助於了解當忽視這些倫理問題時,對個人和社會可能造成的傷害和後果。
以下是一些例子:
| 倫理挑戰 | 案例研究 |
|--- |--- |
| **知情同意** | 1972 - [塔斯基吉梅毒研究](https://en.wikipedia.org/wiki/Tuskegee_Syphilis_Study) - 參與研究的非裔美國男性被承諾提供免費醫療服務,但研究人員欺騙了受試者,未告知他們的診斷或治療的可用性。許多受試者死亡其伴侶或子女也受到影響研究持續了40年。 |
| **數據隱私** | 2007 - [Netflix數據獎](https://www.wired.com/2007/12/why-anonymous-data-sometimes-isnt/)向研究人員提供了_50,000名客戶的1,000萬匿名電影評分_以幫助改進推薦演算法。然而研究人員能夠將匿名數據與外部數據集例如IMDb評論中的個人身份數據相關聯實際上「去匿名化」了一些Netflix訂閱者。|
| **收集偏差** | 2013 - 波士頓市[開發了Street Bump](https://www.boston.gov/transportation/street-bump),一款讓市民報告路面坑洞的應用程式,為城市提供更好的道路數據以發現和修復問題。然而,[低收入群體的人們較少擁有汽車和手機](https://hbr.org/2013/04/the-hidden-biases-in-big-data)使得他們的道路問題在此應用程式中不可見。開發者與學者合作解決_公平性和數鴻溝_問題。 |
| **演算法公平性** | 2018 - MIT [Gender Shades研究](http://gendershades.org/overview.html)評估性別分類AI產品的準確性揭示了女性和有色人種的準確性差距。一[2019年Apple Card](https://www.wired.com/story/the-apple-card-didnt-see-genderand-thats-the-problem/)似乎給女性提供的信用額度低於男性。這兩個例子都說明了演算法偏差導致的社會經濟傷害。|
| **數據錯誤呈現** | 2020 - [喬治亞州公共衛生部發布COVID-19圖表](https://www.vox.com/covid-19-coronavirus-us-response-trump/2020/5/18/21262265/georgia-covid-19-cases-declining-reopening)似乎通過非時間順序的x軸排列誤導公民關於確診病例趨勢的理解。這說明了通過可視化技巧進行的錯誤呈現。 |
| **自由選擇的幻象** | 2020年 - 學習應用程式[ABCmouse支付了1000萬美元以解決FTC投訴](https://www.washingtonpost.com/business/2020/09/04/abcmouse-10-million-ftc-settlement/),家長被困於無法取消的訂閱付款中。這說明了選擇架構中的黑暗模式,導致用戶被引導至可能有害的選擇。 |
| **數據隱私與用戶權利** | 2021 - Facebook [數據洩漏](https://www.npr.org/2021/04/09/986005820/after-data-breach-exposes-530-million-facebook-says-it-will-not-notify-users)洩漏了5.3億用戶的數據導致向FTC支付了50億美元的和解金。然而它拒絕通知用戶洩漏事件違反了用戶關於數據透明性和訪問的權利。 |
想探索更多案例研究?查看以下資源:
| **知情同意** | 1972 - [塔斯基吉梅毒研究](https://en.wikipedia.org/wiki/Tuskegee_Syphilis_Study) - 參與研究的非裔美國男性被承諾提供免費醫療服務,但研究人員欺騙了受試者,未告知診斷或治療的可用性。許多受試者死亡其伴侶或子女也受到影響研究持續了40年。 |
| **數據隱私** | 2007 - [Netflix數據獎](https://www.wired.com/2007/12/why-anonymous-data-sometimes-isnt/) 向研究人員提供了_50K客戶的10M匿名電影評分_以改進推薦演算法。然而,研究人員能夠將匿名數據與_外部數據集_例如IMDb評論中的個人身份數據相關聯實際上「去匿名化」了一些Netflix訂閱者。|
| **收集偏差** | 2013 - 波士頓市[開發了Street Bump](https://www.boston.gov/transportation/street-bump),一款讓市民報告路面坑洞的應用程式,幫助城市獲得更好的道路數據以發現和修復問題。然而,[低收入群體的人們較少擁有汽車和手機](https://hbr.org/2013/04/the-hidden-biases-in-big-data)使得他們的道路問題在此應用程式中不可見。開發者與學者合作解決_公平性和數鴻溝_問題。 |
| **演算法公平性** | 2018 - MIT [Gender Shades研究](http://gendershades.org/overview.html) 評估性別分類AI產品的準確性揭示了女性和有色人種的準確性差距。一[2019年Apple Card](https://www.wired.com/story/the-apple-card-didnt-see-genderand-thats-the-problem/) 似乎給女性的信用額度低於男性。這兩個例子都說明了演算法偏差導致的社會經濟傷害。|
| **數據錯誤呈現** | 2020 - [喬治亞州公共衛生部發布COVID-19圖表](https://www.vox.com/covid-19-coronavirus-us-response-trump/2020/5/18/21262265/georgia-covid-19-cases-declining-reopening)似乎通過非時間順序的x軸排列誤導公民關於確診病例趨勢的理解。這說明了通過可視化技巧進行的錯誤呈現。 |
| **自由選擇的假象** | 2020 - 學習應用程式[ABCmouse支付了1000萬美元以解決FTC投訴](https://www.washingtonpost.com/business/2020/09/04/abcmouse-10-million-ftc-settlement/),家長被困於無法取消的訂閱付款中。這說明了選擇架構中的黑暗模式,導致用戶做出可能有害的選擇。 |
| **數據隱私與用戶權利** | 2021 - Facebook [數據洩漏](https://www.npr.org/2021/04/09/986005820/after-data-breach-exposes-530-million-facebook-says-it-will-not-notify-users) 暴露了5.3億用戶的數據導致向FTC支付了50億美元的和解金。然而它拒絕通知用戶洩漏事件違反了用戶關於數據透明性和訪問的權利。 |
探索更多案例研究?查看以下資源:
* [Ethics Unwrapped](https://ethicsunwrapped.utexas.edu/case-studies) - 涵蓋多個行業的倫理困境。
* [數據科學倫理課程](https://www.coursera.org/learn/data-science-ethics#syllabus) - 探標誌性案例研究。
* [問題出在哪裡](https://deon.drivendata.org/examples/) - Deon清單中的示例。
* [數據科學倫理課程](https://www.coursera.org/learn/data-science-ethics#syllabus) - 探標誌性案例研究。
* [問題出在哪裡](https://deon.drivendata.org/examples/) - Deon清單中的案例示例。
> 🚨 思考你所見過的案例研究——你是否曾經遇到或受到類似倫理挑戰的影響?你能想到至少一個其他案例研究來說明我們在本節中討論的倫理挑戰之一
> 🚨 思考你所見過的案例研究——你是否曾經遇到或受到類似倫理挑戰的影響?你能想到至少一個其他案例研究來說明我們在本節中討論的倫理挑戰
## 應用倫理
@ -205,56 +201,56 @@ CO_OP_TRANSLATOR_METADATA:
### 1. 專業守則
專業守則為組織提供了一種選擇,通過「激勵」成員支持其倫理原則和使命宣言。守則是專業行為的_道德指南_幫助員工或成員做出符合組織原則的決策。它的效取決於成員的自願遵守;然而,許多組織提供額外的獎勵和懲罰以激勵成員遵守。
專業守則為組織提供了一種選擇,用於「激勵」成員支持其倫理原則和使命宣言。守則是專業行為的_道德指南_幫助員工或成員做出符合組織原則的決策。它的效取決於成員的自願遵守;然而,許多組織提供額外的獎勵和懲罰以激勵成員遵守。
例包括:
包括:
* [Oxford Munich](http://www.code-of-ethics.org/code-of-conduct/)倫理守則
* [數據科學協會](http://datascienceassn.org/code-of-conduct.html)行為守則創建於2013年
* [Oxford Munich](http://www.code-of-ethics.org/code-of-conduct/) 倫理守則
* [數據科學協會](http://datascienceassn.org/code-of-conduct.html) 行為守則創建於2013年
* [ACM倫理守則與專業行為守則](https://www.acm.org/code-of-ethics)自1993年起
> 🚨 你是否屬於某個專業工程或數據科學組織?探索他們的網站,看看是否定義了專業倫理守則。這些守則說明了哪些倫理原則?他們如何「激勵」成員遵守守則?
### 2. 倫理清單
### 2. 倫理檢查清單
雖然專業守則定義了從業者所需的_倫理行為_但它在執行方面[存在已知的局限性](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md),特別是在大項目中。因此,許多數據科學專家[提倡使用清單](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md)這可以**將原則與實踐**更具決定性和可操作性地聯繫起來
雖然專業守則定義了從業者所需的_倫理行為_但它在執行方面[存在已知的局限性](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md),特別是在大規模項目中。因此,許多數據科學專家[提倡使用檢查清單](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md)以**將原則轉化為實踐**,使其更具決定性和可操作性
清單將問題轉化為「是/否」任務,可以被操作化,並作為標準產品發布工作流程的一部分進行跟蹤。
檢查清單將問題轉化為「是/否」任務,可以被操作化,並作為標準產品發布工作流程的一部分進行跟蹤。
例包括:
* [Deon](https://deon.drivendata.org/) - 一個通用數據倫理清單,由[行業建議](https://deon.drivendata.org/#checklist-citations)創建,並提供命令行工具以便於集成。
* [隱私審核清單](https://cyber.harvard.edu/ecommerce/privacyaudit.html) - 從法律和社會暴露的角度提供信息處理實踐的一般指導。
* [AI公平性清單](https://www.microsoft.com/en-us/research/project/ai-fairness-checklist/) - 由AI從業者創建以支持公平性檢查在AI開發周期中的採用和集成
* [數據與AI倫理的22個問題](https://medium.com/the-organization/22-questions-for-ethics-in-data-and-ai-efb68fd19429) - 更開放式的框架,結構化用於設計、實施和組織背景下倫理問題初步探索。
包括:
* [Deon](https://deon.drivendata.org/) - 一個通用數據倫理檢查清單,由[行業建議](https://deon.drivendata.org/#checklist-citations)創建,並提供命令行工具以便於集成。
* [隱私審核檢查清單](https://cyber.harvard.edu/ecommerce/privacyaudit.html) - 從法律和社會暴露的角度提供信息處理實踐的一般指導。
* [AI公平性檢查清單](https://www.microsoft.com/en-us/research/project/ai-fairness-checklist/) - 由AI從業者創建用於支持公平性檢查的採用和集成到AI開發周期中
* [數據與AI倫理的22個問題](https://medium.com/the-organization/22-questions-for-ethics-in-data-and-ai-efb68fd19429) - 更開放式的框架,結構化用於設計、實施和組織背景下倫理問題初步探索。
### 3. 倫理法規
倫理是關於定義共享價值並自願做正確的事情。**合規**是指在法律定義的情況下_遵守法律_。**治理**則涵蓋了組織為執行倫理原則和遵守既定法律所採取的所有方式。
倫理是關於定義共享價值並自願做正確的事情。**合規**是指在法律定義的情況下_遵守法律_。**治理**則涵蓋了組織運作以執行倫理原則並遵守既定法律的所有方式。
今天,治理在組織內部有兩種形式。首先,它是關於定義**倫理AI**原則並建立實踐以在組織內所有與AI相關的項目中實現採用。其次,它是關於遵守所有政府規定的**數據保護法規**,以適應其運營的地區。
今天,治理在組織內部有兩種形式。首先,它是關於定義**倫理AI**原則並建立實踐以實現所有與AI相關項目中的採用。其次,它是關於遵守所有政府規定的**數據保護法規**,以適應其運營的地區。
數據保護和隱私法規的例:
數據保護和隱私法規的例
* `1974年`[美國隱私法案](https://www.justice.gov/opcl/privacy-act-1974) - 規範_聯邦政府_收集、使用和披露個人信息。
* `1996年`[美國健康保險流通與責任法案HIPAA](https://www.cdc.gov/phlp/publications/topic/hipaa.html) - 保護個人健康數據。
* `1998年`[美國兒童在線隱私保護法案COPPA](https://www.ftc.gov/enforcement/rules/rulemaking-regulatory-reform-proceedings/childrens-online-privacy-protection-rule) - 保護13歲以下兒童的數據隱私。
* `2018年`[通用數據保護法規GDPR](https://gdpr-info.eu/) - 提供用戶權利、數據保護和隱私。
* `2018年`[加州消費者隱私法案CCPA](https://www.oag.ca.gov/privacy/ccpa) - 賦予消費者更多_個人數據_的權利
* `2021年`,中國[個人信息保護法](https://www.reuters.com/world/china/china-passes-new-personal-data-privacy-law-take-effect-nov-1-2021-08-20/)剛剛通過,創造了全球最強的在線數據隱私法規之一。
* `2018年`[加州消費者隱私法案CCPA](https://www.oag.ca.gov/privacy/ccpa) - 賦予消費者更多對其個人數據的_權利_
* `2021年`,中國[個人信息保護法](https://www.reuters.com/world/china/china-passes-new-personal-data-privacy-law-take-effect-nov-1-2021-08-20/) 剛剛通過,創造了全球最強的在線數據隱私法規之一。
> 🚨 歐盟定義的GDPR通用數據保護法規仍然是今天最具影響力的數據隱私法規之一。你知道它還定義了[8項用戶權利](https://www.freeprivacypolicy.com/blog/8-user-rights-gdpr)以保護公民的數字隱私和個人數據嗎?了解這些權利是什麼以及它們為什麼重要。
> 🚨 歐盟定義的GDPR通用數據保護法規仍然是今天最具影響力的數據隱私法規之一。你知道它還定義了[8項用戶權利](https://www.freeprivacypolicy.com/blog/8-user-rights-gdpr)以保護公民的數字隱私和個人數據嗎?了解這些權利是什麼以及它們為什麼重要。
### 4. 倫理文化
注意仍然存在一個無形的差距即_合規_足以滿足「法律條文」的要求)與解決[系統性問題](https://www.coursera.org/learn/data-science-ethics/home/week/4)例如僵化、信息不對稱和分配不公平之間的差距這些問題可能加速AI的武器化。
注意仍然存在一個無形的差距即_合規_到足以符合「法律的字面要求」)與解決[系統性問題](https://www.coursera.org/learn/data-science-ethics/home/week/4)例如僵化、信息不對稱和分配不公平之間的差距這些問題可能加速AI的武器化。
後者需要[協作方來定義倫理文化](https://towardsdatascience.com/why-ai-ethics-requires-a-culture-driven-approach-26f451afa29f),以在行業內建立情感聯繫和一致的共享價值。這需要在組織內建立更[正式化的數據倫理文化](https://www.codeforamerica.org/news/formalizing-an-ethical-data-culture)允許_任何人_在過程早期[拉動安燈繩](https://en.wikipedia.org/wiki/Andon_(manufacturing))提出倫理問題並將_倫理評估_例如在招聘中作為AI項目團隊組建的核心標準。
後者需要[協作方來定義倫理文化](https://towardsdatascience.com/why-ai-ethics-requires-a-culture-driven-approach-26f451afa29f),以在行業內建立情感聯繫和一致的共享價值。這需要在組織內部[正式化數據倫理文化](https://www.codeforamerica.org/news/formalizing-an-ethical-data-culture/)——允許_任何人_ [拉動Andon繩](https://en.wikipedia.org/wiki/Andon_(manufacturing))在過程早期提出倫理問題並將_倫理評估_例如在招聘中作為AI項目團隊組建的核心標準。
---
## [課後測驗](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/3) 🎯
## [課後測驗](https://ff-quizzes.netlify.app/en/ds/) 🎯
## 回顧與自學
課程和書籍有助於理解核心倫理概念和挑戰,而案例研究和工具有助於在現實世界中應用倫理實踐。以下是一些入門資源
課程和書籍有助於理解核心倫理概念和挑戰,而案例研究和工具有助於在現實世界中應用倫理實踐。以下是一些入門資源
* [初學者的機器學習](https://github.com/microsoft/ML-For-Beginners/blob/main/1-Introduction/3-fairness/README.md) - 來自Microsoft的公平性課程。
* [負責任人工智慧的原則](https://docs.microsoft.com/en-us/learn/modules/responsible-ai-principles/) - Microsoft Learn 提供的免費學習路徑。
@ -266,5 +262,7 @@ CO_OP_TRANSLATOR_METADATA:
[撰寫一篇數據倫理案例研究](assignment.md)
---
**免責聲明**
本文件使用 AI 翻譯服務 [Co-op Translator](https://github.com/Azure/co-op-translator) 進行翻譯。雖然我們致力於提供準確的翻譯,但請注意,自動翻譯可能包含錯誤或不準確之處。原始文件的母語版本應被視為權威來源。對於關鍵信息,建議使用專業人工翻譯。我們對因使用此翻譯而產生的任何誤解或錯誤解釋不承擔責任。
本文件使用 AI 翻譯服務 [Co-op Translator](https://github.com/Azure/co-op-translator) 進行翻譯。儘管我們努力確保翻譯的準確性,但請注意,自動翻譯可能包含錯誤或不準確之處。原始文件的母語版本應被視為權威來源。對於關鍵資訊,建議使用專業人工翻譯。我們對因使用此翻譯而引起的任何誤解或錯誤解釋不承擔責任。

@ -1,8 +1,8 @@
<!--
CO_OP_TRANSLATOR_METADATA:
{
"original_hash": "8796f41f566a0a8ebb72863a83d558ed",
"translation_date": "2025-08-30T19:44:24+00:00",
"original_hash": "3a34157cc63516eba97c89a0b2f8c3e6",
"translation_date": "2025-09-03T21:59:07+00:00",
"source_file": "1-Introduction/02-ethics/README.md",
"language_code": "uk"
}
@ -17,15 +17,15 @@ CO_OP_TRANSLATOR_METADATA:
Ми всі є громадянами даних, які живуть у світі, де дані відіграють ключову роль.
Ринкові тенденції показують, що до 2022 року кожна третя велика організація буде купувати та продавати свої дані через онлайн [Маркетплейси та Біржі](https://www.gartner.com/smarterwithgartner/gartner-top-10-trends-in-data-and-analytics-for-2020/). Як **розробники додатків**, ми зможемо легше та дешевше інтегрувати аналітику, засновану на даних, та автоматизацію, керовану алгоритмами, у щоденний досвід користувачів. Але з поширенням штучного інтелекту нам також потрібно буде розуміти потенційні шкоди, які можуть виникнути через [використання алгоритмів у шкідливих цілях](https://www.youtube.com/watch?v=TQHs8SA1qpk) у великому масштабі.
Ринкові тенденції показують, що до 2022 року кожна третя велика організація буде купувати та продавати свої дані через онлайн [Маркетплейси та Біржі](https://www.gartner.com/smarterwithgartner/gartner-top-10-trends-in-data-and-analytics-for-2020/). Як **розробники додатків**, ми зможемо легше та дешевше інтегрувати інсайти, отримані з даних, та автоматизацію, керовану алгоритмами, у щоденні користувацькі досвіди. Але з поширенням штучного інтелекту нам також потрібно буде розуміти потенційні шкоди, які можуть виникнути через [використання алгоритмів у шкідливих цілях](https://www.youtube.com/watch?v=TQHs8SA1qpk) у великому масштабі.
Тенденції також показують, що до 2025 року ми створимо та споживатимемо понад [180 зетабайтів](https://www.statista.com/statistics/871513/worldwide-data-created/) даних. Як **науковці з даних**, це дає нам безпрецедентний рівень доступу до персональних даних. Це означає, що ми можемо створювати поведінкові профілі користувачів і впливати на прийняття рішень таким чином, що створює [ілюзію вільного вибору](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice), водночас потенційно підштовхуючи користувачів до бажаних для нас результатів. Це також піднімає ширші питання щодо конфіденційності даних та захисту користувачів.
Тенденції також вказують на те, що до 2025 року ми створимо та споживатимемо понад [180 зетабайтів](https://www.statista.com/statistics/871513/worldwide-data-created/) даних. Як **науковці з даних**, це дає нам безпрецедентний рівень доступу до персональних даних. Це означає, що ми можемо створювати поведінкові профілі користувачів і впливати на прийняття рішень таким чином, що створює [ілюзію вільного вибору](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice), водночас потенційно підштовхуючи користувачів до бажаних для нас результатів. Це також піднімає ширші питання щодо конфіденційності даних та захисту користувачів.
Етика даних тепер є еобхідними обмеженнями_ для науки про дані та інженерії, допомагаючи нам мінімізувати потенційні шкоди та непередбачені наслідки наших дій, заснованих на даних. [Цикл хайпу Gartner для ШІ](https://www.gartner.com/smarterwithgartner/2-megatrends-dominate-the-gartner-hype-cycle-for-artificial-intelligence-2020/) визначає актуальні тенденції в цифровій етиці, відповідальному ШІ та управлінні ШІ як ключові рушії для більших мегатрендів навколо емократизації_ та _індустріалізації_ ШІ.
Етика даних тепер є еобхідними обмеженнями_ для науки про дані та інженерії, які допомагають мінімізувати потенційні шкоди та непередбачені наслідки наших дій, керованих даними. [Цикл хайпу Gartner для AI](https://www.gartner.com/smarterwithgartner/2-megatrends-dominate-the-gartner-hype-cycle-for-artificial-intelligence-2020/) визначає відповідні тенденції в цифровій етиці, відповідальному AI та управлінні AI як ключові рушії для більших мегатрендів навколо емократизації_ та _індустріалізації_ AI.
![Цикл хайпу Gartner для ШІ - 2020](https://images-cdn.newscred.com/Zz1mOWJhNzlkNDA2ZTMxMWViYjRiOGFiM2IyMjQ1YmMwZQ==)
![Цикл хайпу Gartner для AI - 2020](https://images-cdn.newscred.com/Zz1mOWJhNzlkNDA2ZTMxMWViYjRiOGFiM2IyMjQ1YmMwZQ==)
У цьому уроці ми дослідимо захоплюючу сферу етики даних - від основних концепцій і викликів до кейсів та прикладних концепцій ШІ, таких як управління, які допомагають створити культуру етики в командах та організаціях, що працюють з даними та ШІ.
У цьому уроці ми дослідимо захоплюючу область етики даних - від основних концепцій і викликів до кейсів і прикладних концепцій AI, таких як управління, які допомагають створити культуру етики в командах і організаціях, що працюють з даними та AI.
## [Тест перед лекцією](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/2) 🎯
@ -33,11 +33,11 @@ CO_OP_TRANSLATOR_METADATA:
Почнемо з розуміння базової термінології.
Слово "етика" походить від [грецького слова "ethikos"](https://en.wikipedia.org/wiki/Ethics) (та його кореня "ethos"), що означає _характер або моральна природа_.
Слово "етика" походить від [грецького слова "ethikos"](https://en.wikipedia.org/wiki/Ethics) (та його кореня "ethos"), що означає _характер або моральна природа_.
**Етика** стосується спільних цінностей та моральних принципів, які регулюють нашу поведінку в суспільстві. Етика базується не на законах, а на широко прийнятих нормах того, що є "правильним проти неправильного". Однак етичні міркування можуть впливати на ініціативи корпоративного управління та урядові регуляції, які створюють більше стимулів для дотримання.
**Етика даних** є [новою галуззю етики](https://royalsocietypublishing.org/doi/full/10.1098/rsta.2016.0360#sec-1), яка "вивчає та оцінює моральні проблеми, пов'язані з аними, алгоритмами та відповідними практиками_". Тут **"дані"** зосереджуються на діях, пов'язаних із створенням, записом, кураторством, обробкою, поширенням, обміном та використанням, **"алгоритми"** зосереджуються на ШІ, агентах, машинному навчанні та роботах, а **"практики"** зосереджуються на таких темах, як відповідальні інновації, програмування, хакінг та кодекси етики.
**Етика даних** є [новою галуззю етики](https://royalsocietypublishing.org/doi/full/10.1098/rsta.2016.0360#sec-1), яка "вивчає та оцінює моральні проблеми, пов'язані з аними, алгоритмами та відповідними практиками_". Тут **"дані"** зосереджуються на діях, пов'язаних із створенням, записом, кураторством, обробкою, поширенням, обміном та використанням, **"алгоритми"** зосереджуються на AI, агентів, машинному навчанні та роботах, а **"практики"** зосереджуються на таких темах, як відповідальні інновації, програмування, хакінг та кодекси етики.
**Прикладна етика** є [практичним застосуванням моральних міркувань](https://en.wikipedia.org/wiki/Applied_ethics). Це процес активного дослідження етичних питань у контексті _реальних дій, продуктів та процесів_ і вжиття коригувальних заходів для забезпечення їх відповідності визначеним етичним цінностям.
@ -45,34 +45,34 @@ CO_OP_TRANSLATOR_METADATA:
## Концепції етики
У цьому розділі ми обговоримо такі концепції, як **спільні цінності** (принципи) та **етичні виклики** (проблеми) для етики даних - і дослідимо **кейс-стадії**, які допоможуть вам зрозуміти ці концепції в реальних контекстах.
У цьому розділі ми обговоримо такі концепції, як **спільні цінності** (принципи) та **етичні виклики** (проблеми) для етики даних - і дослідимо **кейси**, які допоможуть вам зрозуміти ці концепції в реальних контекстах.
### 1. Принципи етики
Кожна стратегія етики даних починається з визначення _етичних принципів_ - "спільних цінностей", які описують прийнятну поведінку та керують діями, що відповідають нормам, у наших проектах з даними та ШІ. Ви можете визначити їх на індивідуальному або командному рівні. Однак більшість великих організацій окреслюють їх у ісії етичного ШІ_ або рамках, які визначаються на корпоративному рівні та послідовно впроваджуються у всіх командах.
Кожна стратегія етики даних починається з визначення _етичних принципів_ - "спільних цінностей", які описують прийнятну поведінку та спрямовують дії, що відповідають нормам, у наших проектах з даними та AI. Ви можете визначити їх на індивідуальному або командному рівні. Однак більшість великих організацій окреслюють їх у місії або рамках _етичного AI_, які визначаються на корпоративному рівні та послідовно впроваджуються у всіх командах.
**Приклад:** Місія [Відповідального ШІ](https://www.microsoft.com/en-us/ai/responsible-ai) Microsoft звучить: _"Ми прагнемо до розвитку ШІ, керованого етичними принципами, які ставлять людей на перше місце"_ - визначаючи 6 етичних принципів у наведеній нижче рамці:
**Приклад:** Місія [Відповідального AI](https://www.microsoft.com/en-us/ai/responsible-ai) Microsoft звучить: _"Ми прагнемо до розвитку AI, керованого етичними принципами, які ставлять людей на перше місце"_ - визначаючи 6 етичних принципів у наведеній нижче рамці:
![Відповідальний ШІ у Microsoft](https://docs.microsoft.com/en-gb/azure/cognitive-services/personalizer/media/ethics-and-responsible-use/ai-values-future-computed.png)
![Відповідальний AI у Microsoft](https://docs.microsoft.com/en-gb/azure/cognitive-services/personalizer/media/ethics-and-responsible-use/ai-values-future-computed.png)
Давайте коротко розглянемо ці принципи. розорість_ та ідповідальність_ є основними цінностями, на яких будуються інші принципи - тому почнемо з них:
* [**Відповідальність**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) робить практиків ідповідальними_ за їхні операції з даними та ШІ, а також за дотримання цих етичних принципів.
* [**Прозорість**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) забезпечує, щоб дії з даними та ШІ були розумілими_ (інтерпретованими) для користувачів, пояснюючи що і чому стоїть за рішеннями.
* [**Справедливість**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1%3aprimaryr6) - зосереджується на забезпеченні того, щоб ШІ ставився о всіх людей_ справедливо, вирішуючи будь-які системні або приховані соціально-технічні упередження в даних та системах.
* [**Надійність та безпека**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - забезпечує, щоб ШІ поводився _послідовно_ з визначеними цінностями, мінімізуючи потенційні шкоди або непередбачені наслідки.
* [**Відповідальність**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) робить практиків ідповідальними_ за їхні операції з даними та AI, а також за дотримання цих етичних принципів.
* [**Прозорість**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) забезпечує, щоб дії з даними та AI були розумілими_ (інтерпретованими) для користувачів, пояснюючи що і чому стоїть за рішеннями.
* [**Справедливість**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1%3aprimaryr6) - зосереджується на забезпеченні того, щоб AI ставився о всіх людей_ справедливо, вирішуючи будь-які системні або приховані соціально-технічні упередження в даних та системах.
* [**Надійність та безпека**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - забезпечує, що AI поводиться _послідовно_ з визначеними цінностями, мінімізуючи потенційні шкоди або непередбачені наслідки.
* [**Конфіденційність та безпека**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - стосується розуміння походження даних та забезпечення онфіденційності даних та пов'язаних із цим захистів_ для користувачів.
* [**Інклюзивність**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - стосується розробки рішень ШІ з наміром, адаптуючи їх для задоволення _широкого спектру людських потреб_ та можливостей.
* [**Інклюзивність**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - стосується розробки AI-рішень з наміром адаптувати їх для задоволення _широкого спектру людських потреб_ та можливостей.
> 🚨 Подумайте, якою могла б бути ваша місія етики даних. Досліджуйте рамки етичного ШІ інших організацій - ось приклади від [IBM](https://www.ibm.com/cloud/learn/ai-ethics), [Google](https://ai.google/principles) та [Facebook](https://ai.facebook.com/blog/facebooks-five-pillars-of-responsible-ai/). Які спільні цінності вони мають? Як ці принципи пов'язані з продуктом ШІ або галуззю, в якій вони працюють?
> 🚨 Подумайте, якою могла б бути ваша місія етики даних. Досліджуйте рамки етичного AI інших організацій - ось приклади від [IBM](https://www.ibm.com/cloud/learn/ai-ethics), [Google](https://ai.google/principles) та [Facebook](https://ai.facebook.com/blog/facebooks-five-pillars-of-responsible-ai/). Які спільні цінності вони мають? Як ці принципи пов'язані з продуктом AI або галуззю, в якій вони працюють?
### 2. Виклики етики
Після визначення етичних принципів наступним кроком є оцінка наших дій з даними та ШІ, щоб переконатися, що вони відповідають цим спільним цінностям. Подумайте про свої дії у двох категоріях: бір даних_ та _розробка алгоритмів_.
Після того, як ми визначили етичні принципи, наступним кроком є оцінка наших дій з даними та AI, щоб побачити, чи відповідають вони цим спільним цінностям. Подумайте про свої дії у двох категоріях: бір даних_ та _розробка алгоритмів_.
Під час збору даних дії, ймовірно, будуть включати **персональні дані** або персонально ідентифіковану інформацію (PII) для ідентифікованих живих осіб. Це включає [різноманітні елементи неперсональних даних](https://ec.europa.eu/info/law/law-topic/data-protection/reform/what-personal-data_en), які олективно_ ідентифікують особу. Етичні виклики можуть стосуватися онфіденційності даних_, _власності даних_ та пов'язаних тем, таких як _інформована згода_ та _права інтелектуальної власності_ для користувачів.
Під час збору даних дії, ймовірно, будуть включати **персональні дані** або персонально ідентифіковану інформацію (PII) для ідентифікованих живих осіб. Це включає [різноманітні елементи неперсональних даних](https://ec.europa.eu/info/law/law-topic/data-protection/reform/what-personal-data_en), які олективно_ ідентифікують особу. Етичні виклики можуть стосуватися онфіденційності даних_, _власності даних_ та пов'язаних тем, таких як _усвідомлена згода_ та _права інтелектуальної власності_ для користувачів.
Під час розробки алгоритмів дії будуть включати збір та кураторство **наборів даних**, а потім їх використання для навчання та розгортання **моделей даних**, які прогнозують результати або автоматизують рішення в реальних контекстах. Етичні виклики можуть виникати через _упередженість набору даних_, _проблеми якості даних_, есправедливість_ та _спотворення_ в алгоритмах - включаючи деякі системні проблеми.
Під час розробки алгоритмів дії будуть включати збір та кураторство **наборів даних**, а потім їх використання для навчання та розгортання **моделей даних**, які прогнозують результати або автоматизують рішення в реальних контекстах. Етичні виклики можуть виникати через _упередженість набору даних_, _проблеми якості даних_, есправедливість_ та _спотворення_ в алгоритмах - включаючи деякі проблеми, які є системними за своєю природою.
В обох випадках етичні виклики висвітлюють області, де наші дії можуть вступати в конфлікт із нашими спільними цінностями. Щоб виявити, пом'якшити, мінімізувати або усунути ці проблеми, нам потрібно ставити моральні "так/ні" питання щодо наших дій, а потім вживати коригувальних заходів за потреби. Давайте розглянемо деякі етичні виклики та моральні питання, які вони піднімають:
@ -85,9 +85,9 @@ CO_OP_TRANSLATOR_METADATA:
* Які права мають суб'єкти даних? (наприклад, доступ, видалення, перенесення)
* Які права мають організації? (наприклад, виправлення шкідливих відгуків користувачів)
#### 2.2 Інформована згода
#### 2.2 Усвідомлена згода
[Інформована згода](https://legaldictionary.net/informed-consent/) визначає акт, коли користувачі погоджуються на дію (наприклад, збір даних) з _повним розумінням_ відповідних фактів, включаючи мету, потенційні ризики та альтернативи.
[Усвідомлена згода](https://legaldictionary.net/informed-consent/) визначає акт, коли користувачі погоджуються на дію (наприклад, збір даних) з _повним розумінням_ відповідних фактів, включаючи мету, потенційні ризики та альтернативи.
Питання для дослідження:
* Чи дав користувач (суб'єкт даних) дозвіл на збір та використання даних?
@ -109,76 +109,76 @@ CO_OP_TRANSLATOR_METADATA:
[Конфіденційність даних](https://www.northeastern.edu/graduate/blog/what-is-data-privacy/) або інформаційна конфіденційність стосується збереження конфіденційності користувачів та захисту їхньої ідентичності щодо персонально ідентифікованої інформації.
Питання для дослідження:
* Чи захищені персональні дані користувачів від зломів та витоків?
* Чи доступні дані користувачів лише для авторизованих користувачів та контекстів?
* Чи збережена анонімність користувачів при обміні або поширенні даних?
* Чи може користувач бути деідентифікований з анонімних наборів даних?
* Чи захищені персональні дані користувачів від хакерських атак та витоків?
* Чи доступні дані користувачів лише авторизованим користувачам та в контекстах?
* Чи збережена анонімність користувачів під час обміну або поширення даних?
* Чи можна деідентифікувати користувача з анонімізованих наборів даних?
#### 2.5 Право бути забутим
[Право бути забутим](https://en.wikipedia.org/wiki/Right_to_be_forgotten) або [Право на видалення](https://www.gdpreu.org/right-to-be-forgotten/) забезпечує додатковий захист персональних даних для користувачів. Зокрема, це дає користувачам право вимагати видалення або усунення персональних даних з Інтернету та інших місць, а певних обставин_, дозволяючи їм почати нове життя онлайн без того, щоб минулі дії були використані проти них.
[Право бути забутим](https://en.wikipedia.org/wiki/Right_to_be_forgotten) або [Право на видалення](https://www.gdpreu.org/right-to-be-forgotten/) забезпечує додатковий захист персональних даних для користувачів. Зокрема, це дає користувачам право вимагати видалення або вилучення персональних даних з пошукових систем Інтернету та інших місць, а певних обставин_, дозволяючи їм новий старт онлайн без того, щоб минулі дії використовувалися проти них.
Питання для дослідження:
* Чи дозволяє система суб'єктам даних запитувати видалення?
* Чи дозволяє система суб'єктам даних вимагати видалення?
* Чи повинно відкликання згоди користувача автоматично запускати видалення?
* Чи були дані зібрані без згоди або незаконними засобами?
* Чи відповідаємо ми урядовим регуляціям щодо конфіденційності даних?
#### 2.6 Упередженість набору даних
Упередженість набору даних або [упередженість збору](http://researcharticles.com/index.php/bias-in-data-collection-in-research/) стосується вибору ерепрезентативного_ підмножини даних для розробки алгоритму, що створює потенційну несправедливість у результатах для різних груп. Типи упередженості включають упередженість вибірки, упередженість добровольців та упередженість інструментів.
Упередженість набору даних або [упередженість збору](http://researcharticles.com/index.php/bias-in-data-collection-in-research/) стосується вибору ерепрезентативного_ підмножини даних для розробки алгоритму, створюючи потенційну несправедливість у результатах для різних груп. Типи упередженості включають упередженість вибірки, упередженість добровольців та упередженість інструментів.
Питання для дослідж
[Algorithm Fairness](https://towardsdatascience.com/what-is-algorithm-fairness-3182e161cf9f) перевіряє, чи дизайн алгоритму систематично дискримінує певні підгрупи суб'єктів даних, що може призводити до [потенційних шкод](https://docs.microsoft.com/en-us/azure/machine-learning/concept-fairness-ml) у _розподілі_ (коли ресурси відмовляють або утримують від цієї групи) та _якості обслуговування_ (коли штучний інтелект менш точний для деяких підгруп порівняно з іншими).
Питання для дослідження:
* Чи залучили ми реп
[Algorithm Fairness](https://towardsdatascience.com/what-is-algorithm-fairness-3182e161cf9f) перевіряє, чи дизайн алгоритму систематично дискримінує певні підгрупи суб’єктів даних, що може призвести до [потенційної шкоди](https://docs.microsoft.com/en-us/azure/machine-learning/concept-fairness-ml) у _розподілі ресурсів_ (коли ресурси відмовляють або утримують для цієї групи) та _якості обслуговування_ (коли ШІ менш точний для одних підгруп, ніж для інших).
Питання для розгляду:
* Чи ми оцінювали точність моделі для різноманітних підгруп і умов?
* Чи ми аналізували систему на предмет потенційних шкод (наприклад, стереотипів)?
* Чи можемо ми переглянути дані або перенавчити моделі для зменшення виявлених шкод?
* Чи оцінювали ми точність моделі для різних підгруп і умов?
* Чи аналізували ми систему на предмет потенційної шкоди (наприклад, стереотипізації)?
* Чи можемо ми переглянути дані або перенавчити моделі, щоб зменшити виявлену шкоду?
Досліджуйте ресурси, такі як [AI Fairness checklists](https://query.prod.cms.rt.microsoft.com/cms/api/am/binary/RE4t6dA), щоб дізнатися більше.
#### 2.9 Викривлення даних
[Викривлення даних](https://www.sciencedirect.com/topics/computer-science/misrepresentation) стосується питання, чи ми передаємо інсайти з чесно представлених даних у маніпулятивний спосіб для підтримки бажаного наративу.
[Викривлення даних](https://www.sciencedirect.com/topics/computer-science/misrepresentation) стосується питання, чи передаємо ми висновки з чесно представлених даних у спосіб, що вводить в оману, щоб підтримати бажаний наратив.
Питання для розгляду:
* Чи ми повідомляємо неповні або неточні дані?
* Чи ми візуалізуємо дані так, що це сприяє хибним висновкам?
* Чи ми використовуємо вибіркові статистичні методи для маніпуляції результатами?
* Чи повідомляємо ми неповні або неточні дані?
* Чи візуалізуємо ми дані так, що це може призвести до хибних висновків?
* Чи використовуємо ми вибіркові статистичні методи для маніпуляції результатами?
* Чи існують альтернативні пояснення, які можуть запропонувати інший висновок?
#### 2.10 Ілюзія вільного вибору
[Ілюзія вільного вибору](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice) виникає, коли "архітектури вибору" системи використовують алгоритми прийняття рішень, щоб підштовхнути людей до прийняття бажаного результату, водночас створюючи видимість варіантів і контролю. Ці [темні патерни](https://www.darkpatterns.org/) можуть завдати соціальної та економічної шкоди користувачам. Оскільки рішення користувачів впливають на профілі поведінки, ці дії потенційно формують майбутні вибори, що може посилити або продовжити вплив цих шкод.
[Ілюзія вільного вибору](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice) виникає, коли "архітектури вибору" системи використовують алгоритми прийняття рішень, щоб підштовхнути людей до бажаного результату, створюючи видимість вибору та контролю. Ці [темні патерни](https://www.darkpatterns.org/) можуть завдати соціальної та економічної шкоди користувачам. Оскільки рішення користувачів впливають на профілі поведінки, ці дії потенційно формують майбутні вибори, що можуть посилити або продовжити вплив цієї шкоди.
Питання для розгляду:
* Чи користувач розумів наслідки прийняття цього рішення?
* Чи користувач був обізнаний про (альтернативні) варіанти та їхні переваги й недоліки?
* Чи розумів користувач наслідки свого вибору?
* Чи був користувач обізнаний про (альтернативні) варіанти вибору та їхні переваги й недоліки?
* Чи може користувач скасувати автоматизований або впливовий вибір пізніше?
### 3. Кейси
Щоб розглянути ці етичні виклики в реальних контекстах, корисно звернутися до кейсів, які демонструють потенційні шкоди та наслідки для окремих осіб і суспільства, коли такі порушення етики ігноруються.
Щоб розглянути ці етичні виклики в реальних контекстах, корисно звернутися до кейсів, які демонструють потенційну шкоду та наслідки для окремих осіб і суспільства, якщо такі порушення етики ігноруються.
Ось кілька прикладів:
| Етичний виклик | Кейси |
|--- |--- |
| **Інформована згода** | 1972 - [Дослідження сифілісу в Таскігі](https://en.wikipedia.org/wiki/Tuskegee_Syphilis_Study) - афроамериканські чоловіки, які брали участь у дослідженні, отримали обіцянку безкоштовного медичного обслуговування, _але були обмануті_ дослідниками, які не повідомили їм про діагноз або доступність лікування. Багато учасників померли, а їхні партнери чи діти постраждали; дослідження тривало 40 років. |
| **Конфіденційність даних** | 2007 - [Конкурс даних Netflix](https://www.wired.com/2007/12/why-anonymous-data-sometimes-isnt/) надав дослідникам _10 млн анонімних оцінок фільмів від 50 тис. клієнтів_, щоб покращити алгоритми рекомендацій. Однак дослідники змогли зіставити анонімні дані з персонально ідентифікованими даними в овнішніх наборах даних_ (наприклад, коментарі IMDb), фактично "деанонімізуючи" деяких підписників Netflix.|
| **Упередженість у зборі даних** | 2013 - Місто Бостон [розробило Street Bump](https://www.boston.gov/transportation/street-bump), додаток, який дозволяв громадянам повідомляти про ями, надаючи місту кращі дані про дороги для вирішення проблем. Однак [люди з низьким рівнем доходу мали менший доступ до автомобілів і телефонів](https://hbr.org/2013/04/the-hidden-biases-in-big-data), що робило їхні проблеми з дорогами невидимими в цьому додатку. Розробники співпрацювали з академіками для вирішення питань _справедливого доступу та цифрових розривів_. |
| **Справедливість алгоритмів** | 2018 - Дослідження MIT [Gender Shades](http://gendershades.org/overview.html) оцінювало точність продуктів AI для класифікації гендеру, виявляючи прогалини в точності для жінок і людей кольору. У [2019 році Apple Card](https://www.wired.com/story/the-apple-card-didnt-see-genderand-thats-the-problem/) здавалося, пропонувала менший кредит жінкам, ніж чоловікам. Обидва випадки ілюструють проблеми упередженості алгоритмів, що призводять до соціально-економічних шкод.|
| **Викривлення даних** | 2020 - [Департамент охорони здоров'я Джорджії опублікував графіки COVID-19](https://www.vox.com/covid-19-coronavirus-us-response-trump/2020/5/18/21262265/georgia-covid-19-cases-declining-reopening), які, здається, вводили громадян в оману щодо тенденцій підтверджених випадків через не-хронологічне упорядкування на осі x. Це ілюструє викривлення через трюки візуалізації. |
| **Ілюзія вільного вибору** | 2020 - Навчальний додаток [ABCmouse заплатив $10 млн для врегулювання скарги FTC](https://www.washingtonpost.com/business/2020/09/04/abcmouse-10-million-ftc-settlement/), де батьки були змушені платити за підписки, які вони не могли скасувати. Це ілюструє темні патерни в архітектурах вибору, де користувачів підштовхували до потенційно шкідливих рішень. |
| **Конфіденційність даних та права користувачів** | 2021 - [Витік даних Facebook](https://www.npr.org/2021/04/09/986005820/after-data-breach-exposes-530-million-facebook-says-it-will-not-notify-users) розкрив дані 530 млн користувачів, що призвело до штрафу $5 млрд від FTC. Однак компанія відмовилася повідомити користувачів про витік, порушуючи права користувачів щодо прозорості даних і доступу. |
| **Поінформована згода** | 1972 - [Дослідження сифілісу в Таскігі](https://en.wikipedia.org/wiki/Tuskegee_Syphilis_Study) - афроамериканським чоловікам, які брали участь у дослідженні, обіцяли безкоштовну медичну допомогу, _але обманювали_, не повідомляючи про їхній діагноз або доступність лікування. Багато учасників померли, а їхні партнери чи діти постраждали; дослідження тривало 40 років. |
| **Конфіденційність даних** | 2007 - [Netflix Data Prize](https://www.wired.com/2007/12/why-anonymous-data-sometimes-isnt/) надав дослідникам _10 млн анонімізованих оцінок фільмів від 50 тис. клієнтів_, щоб покращити алгоритми рекомендацій. Однак дослідники змогли зіставити анонімізовані дані з персонально ідентифікованими даними з овнішніх наборів даних_ (наприклад, коментарів IMDb), фактично "деанонімізуючи" деяких підписників Netflix.|
| **Упередженість у зборі даних** | 2013 - Місто Бостон [розробило Street Bump](https://www.boston.gov/transportation/street-bump), додаток, який дозволяв громадянам повідомляти про ями на дорогах, надаючи місту кращі дані для виявлення та усунення проблем. Однак [люди з низьким рівнем доходу мали менший доступ до автомобілів і телефонів](https://hbr.org/2013/04/the-hidden-biases-in-big-data), що робило їхні проблеми з дорогами невидимими для цього додатка. Розробники співпрацювали з науковцями, щоб вирішити питання _рівного доступу та цифрового розриву_ для забезпечення справедливості. |
| **Справедливість алгоритмів** | 2018 - Дослідження MIT [Gender Shades](http://gendershades.org/overview.html) оцінювало точність продуктів ШІ для класифікації статі, виявляючи прогалини в точності для жінок і людей з кольоровою шкірою. У [2019 році Apple Card](https://www.wired.com/story/the-apple-card-didnt-see-genderand-thats-the-problem/) здавалося, пропонувала менший кредит жінкам, ніж чоловікам. Обидва випадки ілюструють проблеми алгоритмічної упередженості, що призводить до соціально-економічної шкоди.|
| **Викривлення даних** | 2020 - [Департамент охорони здоровя Джорджії опублікував графіки COVID-19](https://www.vox.com/covid-19-coronavirus-us-response-trump/2020/5/18/21262265/georgia-covid-19-cases-declining-reopening), які, здавалося, вводили громадян в оману щодо тенденцій підтверджених випадків через не хронологічний порядок на осі x. Це ілюструє викривлення через маніпуляції з візуалізацією. |
| **Ілюзія вільного вибору** | 2020 - Навчальний додаток [ABCmouse сплатив $10 млн для врегулювання скарги FTC](https://www.washingtonpost.com/business/2020/09/04/abcmouse-10-million-ftc-settlement/), де батьки були змушені платити за підписки, які вони не могли скасувати. Це ілюструє темні патерни в архітектурі вибору, де користувачів підштовхували до потенційно шкідливих рішень. |
| **Конфіденційність даних та права користувачів** | 2021 - [Витік даних Facebook](https://www.npr.org/2021/04/09/986005820/after-data-breach-exposes-530-million-facebook-says-it-will-not-notify-users) розкрив дані 530 млн користувачів, що призвело до врегулювання на $5 млрд з FTC. Однак компанія відмовилася повідомити користувачів про витік, порушуючи їхні права на прозорість і доступ до даних. |
Хочете дослідити більше кейсів? Ознайомтеся з цими ресурсами:
* [Ethics Unwrapped](https://ethicsunwrapped.utexas.edu/case-studies) - етичні дилеми в різних галузях.
* [Курс з етики в Data Science](https://www.coursera.org/learn/data-science-ethics#syllabus) - аналіз ключових кейсів.
* [Де все пішло не так](https://deon.drivendata.org/examples/) - чекліст Deon з прикладами.
* [Курс з етики в Data Science](https://www.coursera.org/learn/data-science-ethics#syllabus) - аналіз знакових кейсів.
* [Де все пішло не так](https://deon.drivendata.org/examples/) - чекліст Deon із прикладами.
> 🚨 Подумайте про кейси, які ви бачили - чи ви стикалися або були під впливом подібного етичного виклику у своєму житті? Чи можете ви згадати хоча б один інший кейс, який ілюструє один із етичних викликів, обговорених у цьому розділі?
> 🚨 Подумайте про кейси, які ви бачили - чи стикалися ви або були під впливом подібного етичного виклику у своєму житті? Чи можете ви навести хоча б один інший кейс, що ілюструє один із етичних викликів, обговорених у цьому розділі?
## Прикладна етика
@ -186,66 +186,66 @@ CO_OP_TRANSLATOR_METADATA:
### 1. Професійні кодекси
Професійні кодекси пропонують один із варіантів для організацій "стимулювати" членів підтримувати їхні етичні принципи та місію. Кодекси є оральними орієнтирами_ для професійної поведінки, допомагаючи співробітникам або членам приймати рішення, які відповідають принципам організації. Вони ефективні настільки, наскільки добровільно дотримуються членами; однак багато організацій пропонують додаткові винагороди та санкції для мотивації дотримання.
Професійні кодекси пропонують один із варіантів для організацій "стимулювати" членів підтримувати їхні етичні принципи та місію. Кодекси є оральними орієнтирами_ для професійної поведінки, допомагаючи працівникам або членам приймати рішення, що відповідають принципам організації. Вони ефективні настільки, наскільки члени добровільно їх дотримуються; однак багато організацій пропонують додаткові винагороди та санкції для мотивації.
Приклади:
* [Oxford Munich](http://www.code-of-ethics.org/code-of-conduct/) Кодекс етики
* [Data Science Association](http://datascienceassn.org/code-of-conduct.html) Кодекс поведінки (створений у 2013 році)
* [ACM Code of Ethics and Professional Conduct](https://www.acm.org/code-of-ethics) (з 1993 року)
> 🚨 Ви є членом професійної інженерної або організації з Data Science? Досліджуйте їхній сайт, щоб дізнатися, чи вони визначають професійний кодекс етики. Що це говорить про їхні етичні принципи? Як вони "стимулюють" членів дотримуватися кодексу?
> 🚨 Чи належите ви до професійної організації інженерів або спеціалістів з даних? Дослідіть їхній сайт, щоб дізнатися, чи визначають вони професійний кодекс етики. Що це говорить про їхні етичні принципи? Як вони "стимулюють" членів дотримуватися кодексу?
### 2. Етичні чеклісти
Хоча професійні кодекси визначають необхідну _етичну поведінку_ від практиків, вони [мають відомі обмеження](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md) у забезпеченні виконання, особливо в масштабних проєктах. Натомість багато експертів з Data Science [рекомендують чеклісти](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md), які можуть **з'єднувати принципи з практиками** більш детермінованим і дієвим способом.
Хоча професійні кодекси визначають необхідну _етичну поведінку_ для практиків, вони [мають відомі обмеження](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md) у забезпеченні дотримання, особливо в масштабних проєктах. Натомість багато експертів з даних [закликають до використання чеклістів](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md), які можуть **перевести принципи в практичні дії**.
Чеклісти перетворюють питання на "так/ні" завдання, які можна операціоналізувати, дозволяючи їх відстежувати як частину стандартних робочих процесів випуску продукту.
Чеклісти перетворюють питання на завдання "так/ні", які можна операціоналізувати, дозволяючи відстежувати їх як частину стандартних робочих процесів випуску продукту.
Приклади:
* [Deon](https://deon.drivendata.org/) - універсальний чекліст етики даних, створений на основі [рекомендацій галузі](https://deon.drivendata.org/#checklist-citations) з інструментом командного рядка для легкої інтеграції.
* [Privacy Audit Checklist](https://cyber.harvard.edu/ecommerce/privacyaudit.html) - надає загальні рекомендації щодо практик обробки інформації з юридичної та соціальної точки зору.
* [AI Fairness Checklist](https://www.microsoft.com/en-us/research/project/ai-fairness-checklist/) - створений практиками AI для підтримки впровадження перевірок справедливості в цикли розробки AI.
* [22 питання для етики в даних та AI](https://medium.com/the-organization/22-questions-for-ethics-in-data-and-ai-efb68fd19429) - більш відкритий формат, структурований для початкового дослідження етичних питань у дизайні, впровадженні та організаційних контекстах.
* [Deon](https://deon.drivendata.org/) - універсальний чекліст етики даних, створений на основі [рекомендацій галузі](https://deon.drivendata.org/#checklist-citations) із командним інструментом для легкої інтеграції.
* [Privacy Audit Checklist](https://cyber.harvard.edu/ecommerce/privacyaudit.html) - надає загальні рекомендації щодо практик обробки інформації з юридичної та соціальної точок зору.
* [AI Fairness Checklist](https://www.microsoft.com/en-us/research/project/ai-fairness-checklist/) - створений практиками ШІ для підтримки впровадження перевірок справедливості в цикли розробки ШІ.
* [22 питання для етики в даних та ШІ](https://medium.com/the-organization/22-questions-for-ethics-in-data-and-ai-efb68fd19429) - більш відкритий фреймворк, структурований для початкового дослідження етичних питань у дизайні, впровадженні та організаційних контекстах.
### 3. Етичні регуляції
Етика стосується визначення спільних цінностей і добровільного виконання "правильних речей". **Дотримання** стосується _виконання закону_, якщо він визначений. **Управління** охоплює всі способи, якими організації працюють для забезпечення етичних принципів і дотримання встановлених законів.
Етика стосується визначення спільних цінностей і добровільного дотримання "правильних" дій. **Дотримання** стосується _виконання закону_, якщо він визначений. **Управління** охоплює всі способи, якими організації забезпечують дотримання етичних принципів і відповідність встановленим законам.
Сьогодні управління має дві форми в організаціях. По-перше, це визначення принципів **етичного AI** і встановлення практик для операціоналізації впровадження у всіх проєктах, пов'язаних з AI, в організації. По-друге, це дотримання всіх урядових регуляцій щодо **захисту даних**, які діють у регіонах, де організація працює.
Сьогодні управління має дві форми в організаціях. По-перше, це визначення **етичних принципів ШІ** та встановлення практик для їх впровадження у всі проєкти, пов’язані з ШІ. По-друге, це дотримання всіх урядових **регуляцій захисту даних** у регіонах, де вони працюють.
Приклади регуляцій щодо захисту даних і конфіденційності:
* `1974`, [US Privacy Act](https://www.justice.gov/opcl/privacy-act-1974) - регулює едеральний уряд_ щодо збору, використання та розкриття персональної інформації.
* `1996`, [US Health Insurance Portability & Accountability Act (HIPAA)](https://www.cdc.gov/phlp/publications/topic/hipaa.html) - захищає персональні медичні дані.
* `1998`, [US Children's Online Privacy Protection Act (COPPA)](https://www.ftc.gov/enforcement/rules/rulemaking-regulatory-reform-proceedings/childrens-online-privacy-protection-rule) - захищає конфіденційність даних дітей до 13 років.
* `2018`, [General Data Protection Regulation (GDPR)](https://gdpr-info.eu/) - забезпечує права користувачів, захист даних і конфіденційність.
* `2018`, [California Consumer Privacy Act (CCPA)](https://www.oag.ca.gov/privacy/ccpa) - надає споживачам більше _прав_ щодо їхніх (персональних) даних.
* `2021`, Китайський [Закон про захист персональної інформації](https://www.reuters.com/world/china/china-passes-new-personal-data-privacy-law-take-effect-nov-1-2021-08-20/) щойно прийнятий, створюючи один із найсильніших регуляцій щодо конфіденційності даних онлайн у світі.
Приклади регуляцій захисту даних і конфіденційності:
* `1974`, [Закон США про конфіденційність](https://www.justice.gov/opcl/privacy-act-1974) - регулює едеральний уряд_ у зборі, використанні та розкритті персональної інформації.
* `1996`, [HIPAA](https://www.cdc.gov/phlp/publications/topic/hipaa.html) - захищає персональні медичні дані.
* `1998`, [COPPA](https://www.ftc.gov/enforcement/rules/rulemaking-regulatory-reform-proceedings/childrens-online-privacy-protection-rule) - захищає конфіденційність даних дітей до 13 років.
* `2018`, [GDPR](https://gdpr-info.eu/) - забезпечує права користувачів, захист даних і конфіденційність.
* `2018`, [CCPA](https://www.oag.ca.gov/privacy/ccpa) - надає споживачам більше _прав_ щодо їхніх (персональних) даних.
* `2021`, [Закон Китаю про захист персональної інформації](https://www.reuters.com/world/china/china-passes-new-personal-data-privacy-law-take-effect-nov-1-2021-08-20/) - один із найсуворіших регуляцій конфіденційності даних у світі.
> 🚨 Європейський Союз визначив GDPR (General Data Protection Regulation), який залишається одним із найвпливовіших регуляцій щодо конфіденційності даних сьогодні. Чи знали ви, що він також визначає [8 прав користувачів](https://www.freeprivacypolicy.com/blog/8-user-rights-gdpr) для захисту цифрової конфіденційності та персональних даних громадян? Дізнайтеся, що це за права і чому вони важливі.
> 🚨 Європейський Союз визначив GDPR (Загальний регламент захисту даних), який залишається одним із найвпливовіших регуляцій конфіденційності даних сьогодні. Чи знали ви, що він також визначає [8 прав користувачів](https://www.freeprivacypolicy.com/blog/8-user-rights-gdpr) для захисту цифрової конфіденційності та персональних даних громадян? Дізнайтеся, що це за права і чому вони важливі.
### 4. Культура етики
Зверніть увагу, що залишається невловима різниця між отриманням_ (виконанням "букви закону") і вирішенням [системних проблем](https://www.coursera.org/learn/data-science-ethics/home/week/4) (таких як закостенілість, інформаційна асиметрія та розподільна несправедливість), які можуть прискорити використання AI у шкідливих цілях.
Зверніть увагу, що існує невловимий розрив між отриманням_ (виконанням "букви закону") та вирішенням [системних проблем](https://www.coursera.org/learn/data-science-ethics/home/week/4) (таких як закостенілість, інформаційна асиметрія та розподільна несправедливість), які можуть прискорити використання ШІ у шкідливих цілях.
Останнє вимагає [спільних підходів до визначення культури етики](https://towardsdatascience.com/why-ai-ethics-requires-a-culture-driven-approach-26f451afa29f), які створюють емоційні зв'язки та послідовні спільні цінності організаціях_ галузі. Це закликає до більш [формалізованих культур етики даних](https://www.codeforamerica.org/news/formalizing-an-ethical-data-culture/) в організаціях - дозволяючи _будь-кому_ [потягнути шнур Андон](https://en.wikipedia.org/wiki/Andon_(manufacturing)) (щоб підняти етичні питання на ранніх етапах процесу) і роблячи _етичні оцінки_ (наприклад, при наймі) основним критерієм формування команд у проєктах AI.
Останнє вимагає [спільних підходів до визначення культури етики](https://towardsdatascience.com/why-ai-ethics-requires-a-culture-driven-approach-26f451afa29f), які створюють емоційні звязки та послідовні спільні цінності організаціях_ галузі. Це закликає до більш [формалізованих культур етики даних](https://www.codeforamerica.org/news/formalizing-an-ethical-data-culture/) в організаціях - дозволяючи _будь-кому_ [потягнути за шнур Андон](https://en.wikipedia.org/wiki/Andon_(manufacturing)) (щоб підняти етичні питання на ранніх етапах процесу) і зробити _етичні оцінки_ (наприклад, при наймі) основним критерієм формування команди в проєктах ШІ.
---
## [Післялекційний тест](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/3) 🎯
## [Післялекційний тест](https://ff-quizzes.netlify.app/en/ds/) 🎯
## Огляд і самостійне навчання
Курси та книги допомагають зрозуміти основні концепції етики та виклики, а кейси та інструменти допомагають із практикою прикладної етики в реальних контекстах. Ось кілька ресурсів для початку:
Курси та книги допомагають зрозуміти основні концепції етики та виклики, тоді як кейси та інструменти допомагають застосовувати етичні практики в реальних контекстах. Ось кілька ресурсів для початку:
* [Machine Learning For Beginners](https://github
* [Принципи відповідального штучного інтелекту](https://docs.microsoft.com/en-us/learn/modules/responsible-ai-principles/) - безкоштовний навчальний курс від Microsoft Learn.
* [Етика та наука про дані](https://resources.oreilly.com/examples/0636920203964) - електронна книга від O'Reilly (М. Лоукідес, Х. Мейсон та ін.).
* [Етика в науці про дані](https://www.coursera.org/learn/data-science-ethics#syllabus) - онлайн-курс від Мічиганського університету.
* [Етика в дії](https://ethicsunwrapped.utexas.edu/case-studies) - кейс-стадії від Техаського університету.
* [Machine Learning For Beginners](https://github.com/microsoft/ML-For-Beginners/blob/main/1-Introduction/3-fairness/README.md) - урок про справедливість від Microsoft.
* [Принципи відповідального штучного інтелекту](https://docs.microsoft.com/en-us/learn/modules/responsible-ai-principles/) - безкоштовний навчальний курс від Microsoft Learn.
* [Етика та наука про дані](https://resources.oreilly.com/examples/0636920203964) - електронна книга від O'Reilly (М. Лоукідес, Х. Мейсон та інші).
* [Етика науки про дані](https://www.coursera.org/learn/data-science-ethics#syllabus) - онлайн-курс від Університету Мічигану.
* [Етика без прикрас](https://ethicsunwrapped.utexas.edu/case-studies) - кейс-стадії від Університету Техасу.
# Завдання
# Завдання
[Напишіть кейс-стадію з етики даних](assignment.md)
[Напишіть кейс-стадію з етики даних](assignment.md)
---
**Відмова від відповідальності**:
Цей документ було перекладено за допомогою сервісу автоматичного перекладу [Co-op Translator](https://github.com/Azure/co-op-translator). Хоча ми прагнемо до точності, звертаємо вашу увагу, що автоматичні переклади можуть містити помилки або неточності. Оригінальний документ мовою оригіналу слід вважати авторитетним джерелом. Для критично важливої інформації рекомендується звертатися до професійного людського перекладу. Ми не несемо відповідальності за будь-які непорозуміння або неправильні тлумачення, що виникли внаслідок використання цього перекладу.
Цей документ був перекладений за допомогою сервісу автоматичного перекладу [Co-op Translator](https://github.com/Azure/co-op-translator). Хоча ми прагнемо до точності, звертаємо вашу увагу, що автоматичні переклади можуть містити помилки або неточності. Оригінальний документ на його рідній мові слід вважати авторитетним джерелом. Для критично важливої інформації рекомендується професійний людський переклад. Ми не несемо відповідальності за будь-які непорозуміння або неправильні тлумачення, що виникли внаслідок використання цього перекладу.

@ -1,31 +1,31 @@
<!--
CO_OP_TRANSLATOR_METADATA:
{
"original_hash": "8796f41f566a0a8ebb72863a83d558ed",
"translation_date": "2025-08-27T08:49:08+00:00",
"original_hash": "3a34157cc63516eba97c89a0b2f8c3e6",
"translation_date": "2025-09-03T20:56:37+00:00",
"source_file": "1-Introduction/02-ethics/README.md",
"language_code": "ur"
}
-->
# ڈیٹا اخلاقیات کا تعارف
|![ [(@sketchthedocs)](https://sketchthedocs.dev) کی اسکیچ نوٹ ](../../sketchnotes/02-Ethics.png)|
|![ اسکیچ نوٹ [(@sketchthedocs)](https://sketchthedocs.dev) کی طرف سے ](../../sketchnotes/02-Ethics.png)|
|:---:|
| ڈیٹا سائنس اخلاقیات - _[@nitya](https://twitter.com/nitya) کی اسکیچ نوٹ_ |
| ڈیٹا سائنس اخلاقیات - _اسکیچ نوٹ [@nitya](https://twitter.com/nitya) کی طرف سے_ |
---
ہم سب ایک ایسے دنیا میں رہتے ہیں جو مکمل طور پر ڈیٹا پر مبنی ہو چکی ہے۔
ہم سب ایک ڈیٹا سے بھرپور دنیا میں ڈیٹا کے شہری ہیں۔
مارکیٹ کے رجحانات بتاتے ہیں کہ 2022 تک، ہر تین میں سے ایک بڑی تنظیم اپنا ڈیٹا آن لائن [مارکیٹ پلیسز اور ایکسچینجز](https://www.gartner.com/smarterwithgartner/gartner-top-10-trends-in-data-and-analytics-for-2020/) کے ذریعے خریدے گی اور بیچے گی۔ بطور **ایپ ڈویلپرز**، ہمارے لیے ڈیٹا پر مبنی بصیرتوں اور الگورتھم پر مبنی خودکار نظاموں کو روزمرہ کے صارف تجربات میں شامل کرنا آسان اور سستا ہو جائے گا۔ لیکن جیسے جیسے AI عام ہوتا جا رہا ہے، ہمیں یہ بھی سمجھنا ہوگا کہ بڑے پیمانے پر ان الگورتھمز کے [ہتھیار بننے](https://www.youtube.com/watch?v=TQHs8SA1qpk) سے کیا ممکنہ نقصانات ہو سکتے ہیں۔
مارکیٹ کے رجحانات بتاتے ہیں کہ 2022 تک، ہر تین میں سے ایک بڑی تنظیم اپنا ڈیٹا آن لائن [مارکیٹ پلیسز اور ایکسچینجز](https://www.gartner.com/smarterwithgartner/gartner-top-10-trends-in-data-and-analytics-for-2020/) کے ذریعے خریدے گی اور بیچے گی۔ بطور **ایپ ڈویلپرز**، ہمارے لیے ڈیٹا سے چلنے والی بصیرتوں اور الگورتھم سے چلنے والی خودکاریت کو روزمرہ کے صارف تجربات میں شامل کرنا آسان اور سستا ہوگا۔ لیکن جیسے جیسے AI عام ہوتا جا رہا ہے، ہمیں یہ بھی سمجھنا ہوگا کہ بڑے پیمانے پر ان الگورتھمز کے [ہتھیار سازی](https://www.youtube.com/watch?v=TQHs8SA1qpk) سے ممکنہ نقصانات کیا ہو سکتے ہیں۔
رجحانات یہ بھی ظاہر کرتے ہیں کہ ہم 2025 تک [180 زیٹابائٹس](https://www.statista.com/statistics/871513/worldwide-data-created/) سے زیادہ ڈیٹا تخلیق اور استعمال کریں گے۔ بطور **ڈیٹا سائنسدان**، یہ ہمیں ذاتی ڈیٹا تک بے مثال رسائی فراہم کرتا ہے۔ اس کا مطلب یہ ہے کہ ہم صارفین کے رویوں کے پروفائل بنا سکتے ہیں اور فیصلہ سازی پر اثر ڈال سکتے ہیں، جس سے ایک [آزاد انتخاب کا دھوکہ](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice) پیدا ہو سکتا ہے، جبکہ ممکنہ طور پر صارفین کو ان نتائج کی طرف دھکیل سکتے ہیں جو ہم چاہتے ہیں۔ یہ ڈیٹا کی پرائیویسی اور صارف کے تحفظات پر وسیع تر سوالات بھی اٹھاتا ہے۔
رجحانات یہ بھی ظاہر کرتے ہیں کہ ہم 2025 تک [180 زیٹا بائٹس](https://www.statista.com/statistics/871513/worldwide-data-created/) سے زیادہ ڈیٹا تخلیق کریں گے اور استعمال کریں گے۔ بطور **ڈیٹا سائنسدان**، یہ ہمیں ذاتی ڈیٹا تک بے مثال رسائی فراہم کرتا ہے۔ اس کا مطلب ہے کہ ہم صارفین کے رویے کے پروفائل بنا سکتے ہیں اور فیصلہ سازی پر اثر ڈال سکتے ہیں، جس سے ایک [آزاد انتخاب کا دھوکہ](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice) پیدا ہو سکتا ہے، جبکہ ممکنہ طور پر صارفین کو ان نتائج کی طرف دھکیل سکتے ہیں جو ہمیں پسند ہیں۔ یہ ڈیٹا کی پرائیویسی اور صارف تحفظات پر وسیع سوالات بھی اٹھاتا ہے۔
ڈیٹا اخلاقیات اب ڈیٹا سائنس اور انجینئرنگ کے لیے _ضروری حفاظتی اصول_ بن چکے ہیں، جو ہمیں ڈیٹا پر مبنی اقدامات سے ممکنہ نقصانات اور غیر ارادی نتائج کو کم کرنے میں مدد دیتے ہیں۔ [گارٹنر ہائپ سائیکل برائے AI](https://www.gartner.com/smarterwithgartner/2-megatrends-dominate-the-gartner-hype-cycle-for-artificial-intelligence-2020/) ڈیجیٹل اخلاقیات، ذمہ دار AI، اور AI گورننس میں رجحانات کو بڑے میگا رجحانات کے کلیدی ڈرائیورز کے طور پر شناخت کرتا ہے، جیسے کہ AI کی _جمہوریت سازی_ اور _صنعت کاری_۔
ڈیٹا اخلاقیات اب ڈیٹا سائنس اور انجینئرنگ کے لیے _ضروری حفاظتی اصول_ ہیں، جو ہمارے ڈیٹا سے چلنے والے اقدامات کے ممکنہ نقصانات اور غیر ارادی نتائج کو کم کرنے میں مدد کرتے ہیں۔ [گارٹنر ہائپ سائیکل برائے AI](https://www.gartner.com/smarterwithgartner/2-megatrends-dominate-the-gartner-hype-cycle-for-artificial-intelligence-2020/) ڈیجیٹل اخلاقیات، ذمہ دار AI، اور AI گورننس میں متعلقہ رجحانات کو بڑے رجحانات کے کلیدی محرکات کے طور پر شناخت کرتا ہے، جیسے AI کی _جمہوریت سازی_ اور _صنعت کاری_۔
![گارٹنر کا ہائپ سائیکل برائے AI - 2020](https://images-cdn.newscred.com/Zz1mOWJhNzlkNDA2ZTMxMWViYjRiOGFiM2IyMjQ1YmMwZQ==)
اس سبق میں، ہم ڈیٹا اخلاقیات کے دلچسپ میدان کو دریافت کریں گے - بنیادی تصورات اور چیلنجز سے لے کر کیس اسٹڈیز اور عملی AI تصورات جیسے گورننس تک - جو ان ٹیموں اور تنظیموں میں اخلاقیات کی ثقافت قائم کرنے میں مدد دیتے ہیں جو ڈیٹا اور AI کے ساتھ کام کرتی ہیں۔
اس سبق میں، ہم ڈیٹا اخلاقیات کے دلچسپ علاقے کو دریافت کریں گے - بنیادی تصورات اور چیلنجز سے لے کر کیس اسٹڈیز اور AI کے عملی تصورات جیسے گورننس - جو ڈیٹا اور AI کے ساتھ کام کرنے والی ٹیموں اور تنظیموں میں اخلاقیات کی ثقافت قائم کرنے میں مدد کرتے ہیں۔
## [لیکچر سے پہلے کا کوئز](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/2) 🎯
@ -33,163 +33,166 @@ CO_OP_TRANSLATOR_METADATA:
آئیے بنیادی اصطلاحات کو سمجھنے سے شروع کرتے ہیں۔
"اخلاقیات" کا لفظ [یونانی لفظ "ethikos"](https://en.wikipedia.org/wiki/Ethics) (اور اس کی جڑ "ethos") سے آیا ہے، جس کا مطلب ہے _کردار یا اخلاقی فطرت_۔
لفظ "اخلاقیات" [یونانی لفظ "ethikos"](https://en.wikipedia.org/wiki/Ethics) (اور اس کی جڑ "ethos") سے آیا ہے، جس کا مطلب ہے _کردار یا اخلاقی فطرت_۔
**اخلاقیات** ان مشترکہ اقدار اور اخلاقی اصولوں کے بارے میں ہیں جو معاشرے میں ہمارے رویے کو کنٹرول کرتے ہیں۔ اخلاقیات قوانین پر مبنی نہیں ہیں بلکہ اس بات پر مبنی ہیں کہ "صحیح اور غلط" کے بارے میں کیا وسیع پیمانے پر قبول کیا جاتا ہے۔ تاہم، اخلاقی غور و فکر کارپوریٹ گورننس کے اقدامات اور حکومتی ضوابط کو متاثر کر سکتے ہیں جو تعمیل کے لیے مزید ترغیبات پیدا کرتے ہیں۔
**اخلاقیات** ان مشترکہ اقدار اور اخلاقی اصولوں کے بارے میں ہیں جو معاشرے میں ہمارے رویے کو کنٹرول کرتے ہیں۔ اخلاقیات قوانین پر مبنی نہیں ہیں بلکہ اس بات پر مبنی ہیں کہ "صحیح بمقابلہ غلط" کیا ہے۔ تاہم، اخلاقی غور و فکر کارپوریٹ گورننس اقدامات اور حکومتی ضوابط کو متاثر کر سکتے ہیں، جو تعمیل کے لیے مزید مراعات پیدا کرتے ہیں۔
**ڈیٹا اخلاقیات** اخلاقیات کی ایک [نئی شاخ](https://royalsocietypublishing.org/doi/full/10.1098/rsta.2016.0360#sec-1) ہے جو "_ڈیٹا، الگورتھمز اور متعلقہ طریقوں_" سے متعلق اخلاقی مسائل کا مطالعہ اور جائزہ لیتی ہے۔ یہاں، **"ڈیٹا"** ان اعمال پر مرکوز ہے جو تخلیق، ریکارڈنگ، کیوریشن، پروسیسنگ، تقسیم، اشتراک، اور استعمال سے متعلق ہیں، **"الگورتھمز"** AI، ایجنٹس، مشین لرننگ، اور روبوٹس پر مرکوز ہیں، اور **"طریقے"** ذمہ دارانہ جدت، پروگرامنگ، ہیکنگ، اور اخلاقیات کے ضابطوں جیسے موضوعات پر مرکوز ہیں۔
**عملی اخلاقیات** اخلاقی غور و فکر کے [عملی اطلاق](https://en.wikipedia.org/wiki/Applied_ethics) کا نام ہے۔ یہ _حقیقی دنیا کے اعمال، مصنوعات، اور عمل_ کے سیاق و سباق میں اخلاقی مسائل کی فعال طور پر تحقیق کرنے اور ان کو درست کرنے کے اقدامات کرنے کا عمل ہے تاکہ یہ یقینی بنایا جا سکے کہ یہ ہمارے بیان کردہ اخلاقی اقدار کے مطابق رہیں۔
**عملی اخلاقیات** اخلاقی غور و فکر کے [عملی اطلاق](https://en.wikipedia.org/wiki/Applied_ethics) کے بارے میں ہیں۔ یہ _حقیقی دنیا کے اعمال، مصنوعات، اور عمل_ کے سیاق و سباق میں اخلاقی مسائل کی فعال طور پر تحقیق کرنے اور اصلاحی اقدامات کرنے کا عمل ہے تاکہ یہ یقینی بنایا جا سکے کہ یہ ہماری بیان کردہ اخلاقی اقدار کے مطابق رہیں۔
**اخلاقیات کی ثقافت** [_عملی اخلاقیات کو عملی جامہ پہنانے_](https://hbr.org/2019/05/how-to-design-an-ethical-organization) کے بارے میں ہے تاکہ یہ یقینی بنایا جا سکے کہ ہمارے اخلاقی اصول اور طریقے پوری تنظیم میں مستقل اور قابل پیمائش انداز میں اپنائے جائیں۔ کامیاب اخلاقی ثقافتیں تنظیمی سطح پر اخلاقی اصولوں کی وضاحت کرتی ہیں، تعمیل کے لیے بامعنی ترغیبات فراہم کرتی ہیں، اور ہر سطح پر مطلوبہ رویوں کو فروغ دے کر اخلاقی اصولوں کو تقویت دیتی ہیں۔
**اخلاقیات کی ثقافت** [_عملی اخلاقیات کو عملی جامہ پہنانے_](https://hbr.org/2019/05/how-to-design-an-ethical-organization) کے بارے میں ہے تاکہ یہ یقینی بنایا جا سکے کہ ہماری اخلاقی اصول اور طریقے پورے تنظیم میں مستقل اور قابل پیمانہ انداز میں اپنائے جائیں۔ کامیاب اخلاقیات کی ثقافتیں تنظیمی سطح پر اخلاقی اصولوں کی وضاحت کرتی ہیں، تعمیل کے لیے بامعنی مراعات فراہم کرتی ہیں، اور ہر سطح پر مطلوبہ رویوں کو فروغ دے کر اور بڑھا کر اخلاقیات کے اصولوں کو تقویت دیتی ہیں۔
## اخلاقیات کے تصورات
اس حصے میں، ہم **مشترکہ اقدار** (اصول) اور **اخلاقی چیلنجز** (مسائل) جیسے تصورات پر بات کریں گے اور **کیس اسٹڈیز** کا جائزہ لیں گے جو آپ کو حقیقی دنیا کے سیاق و سباق میں ان تصورات کو سمجھنے میں مدد دیتے ہیں۔
اس حصے میں، ہم **مشترکہ اقدار** (اصول) اور **اخلاقی چیلنجز** (مسائل) جیسے تصورات پر بات کریں گے، اور **کیس اسٹڈیز** کا جائزہ لیں گے جو آپ کو حقیقی دنیا کے سیاق و سباق میں ان تصورات کو سمجھنے میں مدد فراہم کریں گے۔
### 1. اخلاقی اصول
### 1. اخلاقیات کے اصول
ہر ڈیٹا اخلاقیات کی حکمت عملی _اخلاقی اصولوں_ کی وضاحت سے شروع ہوتی ہے - وہ "مشترکہ اقدار" جو قابل قبول رویوں کو بیان کرتی ہیں اور ہمارے ڈیٹا اور AI منصوبوں میں تعمیل کے اقدامات کی رہنمائی کرتی ہیں۔ آپ ان کی وضاحت انفرادی یا ٹیم کی سطح پر کر سکتے ہیں۔ تاہم، زیادہ تر بڑی تنظیمیں ان کی وضاحت ایک _اخلاقی AI_ مشن بیان یا فریم ورک میں کرتی ہیں جو کارپوریٹ سطح پر بیان کیا جاتا ہے اور تمام ٹیموں میں مستقل طور پر نافذ کیا جاتا ہے۔
ہر ڈیٹا اخلاقیات کی حکمت عملی _اخلاقی اصولوں_ کی وضاحت سے شروع ہوتی ہے - وہ "مشترکہ اقدار" جو قابل قبول رویوں کو بیان کرتی ہیں اور ہمارے ڈیٹا اور AI منصوبوں میں تعمیل کے اقدامات کی رہنمائی کرتی ہیں۔ آپ ان اصولوں کو انفرادی یا ٹیم کی سطح پر بیان کر سکتے ہیں۔ تاہم، زیادہ تر بڑی تنظیمیں ان اصولوں کو ایک _اخلاقی AI_ مشن بیان یا فریم ورک میں بیان کرتی ہیں، جو کارپوریٹ سطح پر بیان کیا جاتا ہے اور تمام ٹیموں میں مستقل طور پر نافذ کیا جاتا ہے۔
**مثال:** مائیکروسافٹ کا [ذمہ دار AI](https://www.microsoft.com/en-us/ai/responsible-ai) مشن بیان کہتا ہے: _"ہم AI کی ترقی کے لیے پرعزم ہیں جو اخلاقی اصولوں کے ذریعے لوگوں کو اولین ترجیح دیتا ہے"_ - جو نیچے دیے گئے فریم ورک میں 6 اخلاقی اصولوں کی نشاندہی کرتا ہے:
**مثال:** مائیکروسافٹ کا [ذمہ دار AI](https://www.microsoft.com/en-us/ai/responsible-ai) مشن بیان کہتا ہے: _"ہم AI کی ترقی کے لیے پرعزم ہیں جو اخلاقی اصولوں پر مبنی ہو جو لوگوں کو اولین ترجیح دے"_ - اور نیچے دیے گئے فریم ورک میں 6 اخلاقی اصولوں کی نشاندہی کرتا ہے:
![مائیکروسافٹ میں ذمہ دار AI](https://docs.microsoft.com/en-gb/azure/cognitive-services/personalizer/media/ethics-and-responsible-use/ai-values-future-computed.png)
آئیے ان اصولوں کا مختصر جائزہ لیں۔ _شفافیت_ اور _جوابدہی_ بنیادی اقدار ہیں جن پر دیگر اصول تعمیر کیے گئے ہیں - تو آئیے یہاں سے شروع کرتے ہیں:
آئیے ان اصولوں کو مختصراً دریافت کریں۔ _شفافیت_ اور _جوابدہی_ بنیادی اقدار ہیں جن پر دیگر اصول تعمیر کیے گئے ہیں - تو آئیے یہاں سے شروع کریں:
* [**جوابدہی**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) پریکٹیشنرز کو ان کے ڈیٹا اور AI آپریشنز اور ان اخلاقی اصولوں کی تعمیل کے لیے _ذمہ دار_ بناتی ہے۔
* [**شفافیت**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) اس بات کو یقینی بناتی ہے کہ ڈیٹا اور AI کے اقدامات صارفین کے لیے _سمجھے جانے کے قابل_ ہوں، فیصلوں کے پیچھے کیا اور کیوں کی وضاحت کرتے ہوئے۔
* [**منصفانہ رویہ**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1%3aprimaryr6) - اس بات پر مرکوز ہے کہ AI تمام لوگوں کے ساتھ _منصفانہ_ سلوک کرے، ڈیٹا اور نظام میں کسی بھی نظامی یا مضمر سماجی-تکنیکی تعصبات کو حل کرے۔
* [**قابل اعتماد اور حفاظت**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - اس بات کو یقینی بناتی ہے کہ AI ستقل طور پر_ بیان کردہ اقدار کے مطابق برتاؤ کرے، ممکنہ نقصانات یا غیر ارادی نتائج کو کم کرے۔
* [**پرائیویسی اور سیکیورٹی**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - ڈیٹا کے ماخذ کو سمجھنے اور صارفین کو _ڈیٹا پرائیویسی اور متعلقہ تحفظات_ فراہم کرنے کے بارے میں ہے۔
* [**شفافیت**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) اس بات کو یقینی بناتی ہے کہ ڈیٹا اور AI کے اقدامات صارفین کے لیے _سمجھنے کے قابل_ ہوں، فیصلوں کے پیچھے کیا اور کیوں کی وضاحت کرتے ہوئے۔
* [**انصاف**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1%3aprimaryr6) - اس بات پر مرکوز ہے کہ AI تمام لوگوں کے ساتھ _منصفانہ_ سلوک کرے، ڈیٹا اور نظام میں کسی بھی نظامی یا غیر واضح سماجی-تکنیکی تعصبات کو حل کرے۔
* [**قابل اعتمادیت اور حفاظت**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - اس بات کو یقینی بناتی ہے کہ AI خصوص اقدار_ کے ساتھ مستقل طور پر کام کرے، ممکنہ نقصانات یا غیر ارادی نتائج کو کم کرے۔
* [**پرائیویسی اور سیکیورٹی**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - ڈیٹا کی اصل کو سمجھنے اور صارفین کو _ڈیٹا پرائیویسی اور متعلقہ تحفظات_ فراہم کرنے کے بارے میں ہے۔
* [**شمولیت**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - AI حل کو ارادے کے ساتھ ڈیزائن کرنے کے بارے میں ہے، انہیں _وسیع انسانی ضروریات_ اور صلاحیتوں کو پورا کرنے کے لیے ڈھالنا۔
> 🚨 سوچیں کہ آپ کا ڈیٹا اخلاقیات کا مشن بیان کیا ہو سکتا ہے۔ دیگر تنظیموں کے اخلاقی AI فریم ورک کو دریافت کریں - یہاں [IBM](https://www.ibm.com/cloud/learn/ai-ethics)، [Google](https://ai.google/principles)، اور [Facebook](https://ai.facebook.com/blog/facebooks-five-pillars-of-responsible-ai/) کی مثالیں ہیں۔ ان میں کون سی مشترکہ اقدار ہیں؟ یہ اصول ان کے AI پروڈکٹ یا صنعت سے کیسے متعلق ہیں؟
> 🚨 سوچیں کہ آپ کا ڈیٹا اخلاقیات مشن بیان کیا ہو سکتا ہے۔ دیگر تنظیموں کے اخلاقی AI فریم ورک کو دریافت کریں - یہاں [IBM](https://www.ibm.com/cloud/learn/ai-ethics)، [Google](https://ai.google/principles)، اور [Facebook](https://ai.facebook.com/blog/facebooks-five-pillars-of-responsible-ai/) کی مثالیں ہیں۔ ان میں کون سی مشترکہ اقدار ہیں؟ یہ اصول ان کے AI پروڈکٹ یا صنعت سے کیسے متعلق ہیں؟
### 2. اخلاقی چیلنجز
### 2. اخلاقیات کے چیلنجز
جب ہم اخلاقی اصولوں کی وضاحت کر لیتے ہیں، تو اگلا قدم یہ ہے کہ ہم اپنے ڈیٹا اور AI کے اقدامات کا جائزہ لیں تاکہ یہ دیکھا جا سکے کہ آیا وہ ان مشترکہ اقدار کے مطابق ہیں۔ اپنے اقدامات کو دو زمروں میں سوچیں: _ڈیٹا اکٹھا کرنا_ اور _الگورتھم ڈیزائن_۔
جب ہم اخلاقی اصولوں کی وضاحت کر لیتے ہیں، تو اگلا قدم یہ ہے کہ ہمارے ڈیٹا اور AI اقدامات کا جائزہ لیا جائے کہ آیا وہ ان مشترکہ اقدار کے مطابق ہیں۔ اپنے اقدامات کو دو زمروں میں سوچیں: _ڈیٹا جمع کرنا_ اور _الگورتھم ڈیزائن_۔
ڈیٹا اکٹھا کرنے کے ساتھ، اقدامات ممکنہ طور پر **ذاتی ڈیٹا** یا ذاتی طور پر قابل شناخت معلومات (PII) پر مشتمل ہوں گے جو زندہ افراد کی شناخت کر سکتی ہیں۔ اس میں [غیر ذاتی ڈیٹا کی مختلف اشیاء](https://ec.europa.eu/info/law/law-topic/data-protection/reform/what-personal-data_en) شامل ہیں جو _اجتماعی طور پر_ کسی فرد کی شناخت کرتی ہیں۔ اخلاقی چیلنجز _ڈیٹا پرائیویسی_، _ڈیٹا کی ملکیت_، اور متعلقہ موضوعات جیسے _مطلع رضامندی_ اور صارفین کے لیے انشورانہ املاک کے حقوق_ سے متعلق ہو سکتے ہیں۔
ڈیٹا جمع کرنے کے ساتھ، اقدامات ممکنہ طور پر **ذاتی ڈیٹا** یا ذاتی طور پر قابل شناخت معلومات (PII) شامل کریں گے جو زندہ افراد کی شناخت کر سکتی ہیں۔ اس میں [غیر ذاتی ڈیٹا کی متنوع اشیاء](https://ec.europa.eu/info/law/law-topic/data-protection/reform/what-personal-data_en) شامل ہیں جو _اجتماعی طور پر_ کسی فرد کی شناخت کرتی ہیں۔ اخلاقی چیلنجز _ڈیٹا پرائیویسی_، _ڈیٹا کی ملکیت_، اور متعلقہ موضوعات جیسے _مطلع رضامندی_ اور صارفین کے لیے انشورانہ املاک کے حقوق_ سے متعلق ہو سکتے ہیں۔
الگورتھم ڈیزائن کے ساتھ، اقدامات میں **ڈیٹاسیٹس** کو جمع کرنا اور ترتیب دینا شامل ہوگا، پھر ان کا استعمال کرتے ہوئے **ڈیٹا ماڈلز** کو تربیت دینا اور تعینات کرنا جو حقیقی دنیا کے سیاق و سباق میں نتائج کی پیش گوئی کرتے ہیں یا فیصلے خودکار بناتے ہیں۔ اخلاقی چیلنجز _ڈیٹاسیٹ کے تعصب_، _ڈیٹا کے معیار_ کے مسائل، _غیر منصفانہ رویہ_، اور الگورتھمز میں _غلط بیانی_ سے پیدا ہو سکتے ہیں - بشمول کچھ مسائل جو نظامی نوعیت کے ہیں۔
الگورتھم ڈیزائن کے ساتھ، اقدامات **ڈیٹا سیٹس** جمع کرنے اور ان کا انتظام کرنے، پھر انہیں حقیقی دنیا کے سیاق و سباق میں نتائج کی پیش گوئی یا فیصلوں کو خودکار کرنے کے لیے **ڈیٹا ماڈلز** کو تربیت دینے اور تعینات کرنے پر مشتمل ہوں گے۔ اخلاقی چیلنجز _ڈیٹا سیٹ کے تعصب_، _ڈیٹا کے معیار_ کے مسائل، _غیر منصفانہ_ اور _غلط بیانی_ میں الگورتھمز میں پیدا ہو سکتے ہیں - بشمول کچھ مسائل جو نظامی نوعیت کے ہیں۔
دونوں صورتوں میں، اخلاقی چیلنجز ان علاقوں کو اجاگر کرتے ہیں جہاں ہمارے اقدامات ہمارے مشترکہ اقدار کے ساتھ تنازعہ پیدا کر سکتے ہیں۔ ان خدشات کا پتہ لگانے، ان کو کم کرنے، کم سے کم کرنے، یا ختم کرنے کے لیے - ہمیں اپنے اقدامات سے متعلق اخلاقی "ہاں/نہیں" سوالات پوچھنے کی ضرورت ہے، پھر ضرورت کے مطابق اصلاحی اقدامات کریں۔ آئیے کچھ اخلاقی چیلنجز اور ان کے اٹھائے گئے اخلاقی سوالات پر نظر ڈالیں:
دونوں صورتوں میں، اخلاقیات کے چیلنجز ان علاقوں کو اجاگر کرتے ہیں جہاں ہمارے اقدامات ہمارے مشترکہ اقدار کے ساتھ تنازعہ پیدا کر سکتے ہیں۔ ان خدشات کا پتہ لگانے، کم کرنے، کم سے کم کرنے، یا ختم کرنے کے لیے - ہمیں اپنے اقدامات سے متعلق اخلاقی "ہاں/نہیں" سوالات پوچھنے کی ضرورت ہے، پھر ضرورت کے مطابق اصلاحی اقدامات کریں۔ آئیے کچھ اخلاقی چیلنجز اور ان کے اٹھائے گئے اخلاقی سوالات پر نظر ڈالیں:
#### 2.1 ڈیٹا کی ملکیت
ڈیٹا اکٹھا کرنا اکثر ذاتی ڈیٹا پر مشتمل ہوتا ہے جو ڈیٹا کے موضوعات کی شناخت کر سکتا ہے۔ [ڈیٹا کی ملکیت](https://permission.io/blog/data-ownership) ڈیٹا کی تخلیق، پروسیسنگ، اور تقسیم سے متعلق _کنٹرول_ اور [ارف کے حقوق_](https://permission.io/blog/data-ownership) کے بارے میں ہے۔
ڈیٹا جمع کرنا اکثر ذاتی ڈیٹا شامل کرتا ہے جو ڈیٹا کے موضوعات کی شناخت کر سکتا ہے۔ [ڈیٹا کی ملکیت](https://permission.io/blog/data-ownership) ڈیٹا کی تخلیق، پروسیسنگ، اور تقسیم سے متعلق _کنٹرول_ اور [ارف کے حقوق_](https://permission.io/blog/data-ownership) کے بارے میں ہے۔
ہمیں جو اخلاقی سوالات پوچھنے کی ضرورت ہے:
* ڈیٹا کا مالک کون ہے؟ (صارف یا تنظیم)
* ڈیٹا کے موضوعات کے کیا حقوق ہیں؟ (مثلاً: رسائی، حذف، پورٹیبلٹی)
* تنظیم کے کیا حقوق ہیں؟ (مثلاً: بدنیتی پر مبنی صارف کے جائزوں کو درست کرنا)
اخلاقی سوالات جو ہمیں پوچھنے کی ضرورت ہے:
* ڈیٹا کا مالک کون ہے؟ (صارف یا تنظیم)
* ڈیٹا کے موضوعات کے کیا حقوق ہیں؟ (مثلاً: رسائی، حذف، پورٹیبلٹی)
* تنظیموں کے کیا حقوق ہیں؟ (مثلاً: بدنیتی پر مبنی صارف جائزوں کو درست کرنا)
#### 2.2 مطلع رضامندی
[مطلع رضامندی](https://legaldictionary.net/informed-consent/) اس عمل کی وضاحت کرتی ہے جس میں صارفین کسی عمل (جیسے ڈیٹا اکٹھا کرنا) پر _مکمل معلومات_ کے ساتھ رضامندی دیتے ہیں، بشمول مقصد، ممکنہ خطرات، اور متبادلات۔
[مطلع رضامندی](https://legaldictionary.net/informed-consent/) صارفین کے کسی عمل (جیسے ڈیٹا جمع کرنا) پر اتفاق کرنے کے عمل کی وضاحت کرتی ہے، جس میں متعلقہ حقائق کی _مکمل سمجھ_ شامل ہوتی ہے، بشمول مقصد، ممکنہ خطرات، اور متبادل۔
یہاں دریافت کرنے کے لیے سوالات:
* کیا صارف (ڈیٹا کا موضوع) نے ڈیٹا کیپچر اور استعمال کی اجازت دی؟
* کیا صارف نے سمجھا کہ یہ ڈیٹا کس مقصد کے لیے اکٹھا کیا گیا؟
* کیا صارف نے اپنی شرکت سے ممکنہ خطرات کو سمجھا؟
یہاں دریافت کرنے کے سوالات:
* کیا صارف (ڈیٹا کا موضوع) نے ڈیٹا کیپچر اور استعمال کی اجازت دی؟
* کیا صارف نے اس مقصد کو سمجھا جس کے لیے وہ ڈیٹا جمع کیا گیا تھا؟
* کیا صارف نے اپنی شرکت سے ممکنہ خطرات کو سمجھا؟
#### 2.3 دانشورانہ املاک
[دانشورانہ املاک](https://en.wikipedia.org/wiki/Intellectual_property) انسانی پہل سے پیدا ہونے والی غیر مادی تخلیقات کو کہتے ہیں، جو افراد یا کاروبار کے لیے _معاشی قدر_ رکھ سکتی ہیں۔
[دانشورانہ املاک](https://en.wikipedia.org/wiki/Intellectual_property) انسانی پہل سے پیدا ہونے والی غیر محسوس تخلیقات کو ظاہر کرتی ہے، جو افراد یا کاروبار کے لیے _معاشی قدر_ رکھ سکتی ہیں۔
یہاں دریافت کرنے کے لیے سوالات:
* کیا جمع کیا گیا ڈیٹا صارف یا کاروبار کے لیے معاشی قدر رکھتا ہے؟
* کیا یہاں **صارف** کی دانشورانہ املاک موجود ہے؟
* کیا یہاں **تنظیم** کی دانشورانہ املاک موجود ہے؟
* اگر یہ حقوق موجود ہیں، تو ہم انہیں کیسے محفوظ کر رہے ہیں؟
یہاں دریافت کرنے کے سوالات:
* کیا جمع کردہ ڈیٹا صارف یا کاروبار کے لیے معاشی قدر رکھتا ہے؟
* کیا یہاں **صارف** کے پاس دانشورانہ املاک ہے؟
* کیا یہاں **تنظیم** کے پاس دانشورانہ املاک ہے؟
* اگر یہ حقوق موجود ہیں، تو ہم انہیں کیسے محفوظ کر رہے ہیں؟
#### 2.4 ڈیٹا پرائیویسی
[ڈیٹا پرائیویسی](https://www.northeastern.edu/graduate/blog/what-is-data-privacy/) یا معلومات کی پرائیویسی صارف کی شناخت کے تحفظ اور ذاتی طور پر قابل شناخت معلومات کے تحفظ سے متعلق ہے۔
یہاں دریافت کرنے کے لیے سوالات:
* کیا صارفین کا (ذاتی) ڈیٹا ہیکس اور لیکس سے محفوظ ہے؟
* کیا صارفین کا ڈیٹا صرف مجاز صارفین اور سیاق و سباق تک رسائی رکھتا ہے؟
* کیا صارفین کی گمنامی کو ڈیٹا کے اشتراک یا تقسیم کے وقت محفوظ رکھا گیا؟
* کیا صارف کو گمنام ڈیٹاسیٹس سے دوبارہ شناخت کیا جا سکتا ہے؟
یہاں دریافت کرنے کے سوالات:
* کیا صارفین کا (ذاتی) ڈیٹا ہیک اور لیک سے محفوظ ہے؟
* کیا صارفین کا ڈیٹا صرف مجاز صارفین اور سیاق و سباق تک قابل رسائی ہے؟
* کیا ڈیٹا کے اشتراک یا تقسیم کے وقت صارفین کی گمنامی محفوظ ہے؟
* کیا صارف کو گمنام ڈیٹا سیٹس سے دوبارہ شناخت کیا جا سکتا ہے؟
#### 2.5 بھول جانے کا حق
[بھول جانے کا حق](https://en.wikipedia.org/wiki/Right_to_be_forgotten) یا [حذف کا حق](https://www.gdpreu.org/right-to-be-forgotten/) صارفین کو اضافی ذاتی ڈیٹا کے تحفظ فراہم کرتا ہے۔ خاص طور پر، یہ صارفین کو انٹرنیٹ تلاشوں اور دیگر مقامات سے ذاتی ڈیٹا کو حذف کرنے یا ہٹانے کی درخواست کرنے کا حق دیتا ہے، _مخصوص حالات کے تحت_ - انہیں آن لائن ایک نیا آغاز کرنے کی اجازت دیتا ہے بغیر ماضی کے اعمال کے ان کے خلاف استعمال ہونے کے۔
[بھول جانے کا حق](https://en.wikipedia.org/wiki/Right_to_be_forgotten) یا [حذف کرنے کا حق](https://www.gdpreu.org/right-to-be-forgotten/) صارفین کو اضافی ذاتی ڈیٹا تحفظ فراہم کرتا ہے۔ خاص طور پر، یہ صارفین کو انٹرنیٹ تلاشوں اور دیگر مقامات سے ذاتی ڈیٹا کو حذف یا ہٹانے کی درخواست کرنے کا حق دیتا ہے، _مخصوص حالات کے تحت_ - انہیں آن لائن ایک نئی شروعات کرنے کی اجازت دیتا ہے بغیر ماضی کے اعمال کو ان کے خلاف رکھا جائے۔
یہاں دریافت کرنے کے لیے سوالات:
* کیا نظام ڈیٹا کے موضوعات کو حذف کی درخواست کرنے کی اجازت دیتا ہے؟
* کیا صارف کی رضامندی کی واپسی خودکار حذف کو متحرک کرنی چاہیے؟
* کیا ڈیٹا بغیر رضامندی یا غیر قانونی ذرائع سے اکٹھا کیا گیا؟
* کیا ہم ڈیٹا پرائیویسی کے لیے حکومتی ضوابط کے مطابق ہیں؟
یہاں دریافت کرنے کے سوالات:
* کیا نظام ڈیٹا کے موضوعات کو حذف کرنے کی درخواست کرنے کی اجازت دیتا ہے؟
* کیا صارف کی رضامندی کی واپسی خودکار حذف کو متحرک کرنی چاہیے؟
* کیا ڈیٹا بغیر رضامندی یا غیر قانونی ذرائع سے جمع کیا گیا تھا؟
* کیا ہم ڈیٹا پرائیویسی کے لیے حکومتی ضوابط کے مطابق ہیں؟
#### 2.6 ڈیٹاسیٹ کا تعصب
#### 2.6 ڈیٹا سیٹ کا تعصب
ڈیٹاسیٹ یا [اکٹھا کرنے کا تعصب](http://researcharticles.com/index.php/bias-in-data-collection-in-research/) غیر نمائندہ ڈیٹا کے ذیلی سیٹ کو الگورتھم کی ترقی کے لیے منتخب کرنے کے بارے میں ہے، جو مختلف گروہوں کے لیے ممکنہ طور پر غیر منصفانہ نتائج پیدا کرتا ہے۔ تعصب کی اقسام میں انتخاب یا سیمپلنگ کا تعصب، رضاکارانہ تعصب، اور آلے کا تعصب شامل ہیں۔
ڈیٹا سیٹ یا [جمع کرنے کا تعصب](http://researcharticles.com/index.php/bias-in-data-collection-in-research/) ایک _غیر نمائندہ_ ڈیٹا کے ذیلی سیٹ کو الگورتھم کی ترقی کے لیے منتخب کرنے کے بارے میں ہے، جو مختلف گروہوں کے لیے ممکنہ غیر منصفانہ نتائج پیدا کرتا ہے۔ تعصب کی اقسام میں انتخاب یا نمونہ تعصب، رضاکارانہ تعصب، اور آلہ تعصب شامل ہیں۔
یہاں دریافت کرنے کے لیے سوالات:
* کیا ہم نے ڈیٹا کے موضوعات کا نمائندہ سیٹ بھرتی کیا؟
* کیا ہم نے اپنے جمع کیے گئے یا ترتیب دیے گئے ڈیٹاسیٹ کو مختلف تعصبات کے لیے جانچا؟
* کیا ہم دریافت شدہ تعصبات کو کم یا ختم کر سکتے ہیں؟
یہاں دریافت کرنے کے سوالات:
* کیا ہم نے ڈیٹا کے موضوعات کا نمائندہ سیٹ بھرتی کیا؟
* کیا ہم نے مختلف تعصبات کے لیے اپنے جمع کردہ یا تیار کردہ ڈیٹا سیٹ کی جانچ کی؟
* کیا ہم دریافت شدہ تعصبات کو کم یا ختم کر سکتے ہیں؟
#### 2.7 ڈیٹا کا معیار
[ڈیٹا کا معیار](https://lakefs.io/data-quality-testing/) اس ترتیب دیے گئے ڈیٹاسیٹ کی درستگی کو دیکھتا ہے جو ہمارے الگورتھمز کو تیار کرنے کے لیے استعمال کیا جاتا ہے، یہ چیک کرتے ہوئے کہ آیا خصوصیات اور ریکارڈز ہمارے AI مقصد کے لیے درکار درستگی اور مستقل مزاجی کی سطح کو پورا کرتے ہیں۔
[ڈیٹا کا معیار](https://lakefs.io/data-quality-testing/) ہمارے الگورتھمز کو تیار کرنے کے لیے استعمال کیے گئے تیار کردہ ڈیٹا سیٹ کی درستگی کو دیکھتا ہے، یہ جانچتا ہے کہ آیا خصوصیات اور ریکارڈز ہمارے AI مقصد کے لیے مطلوبہ سطح کی درستگی اور مستقل مزاجی کو پورا کرتے ہیں۔
یہاں دریافت کرنے کے لیے سوالات:
* کیا ہم نے اپنے استعمال کے کیس کے لیے درست _خصوصیات_ کو قید کیا؟
* کیا مختلف ڈیٹا ذرائع کے درمیان ڈیٹا کو _مستقل طور پر_ قید کیا گیا؟
* کیا
[الگورتھم کی منصفانہ جانچ](https://towardsdatascience.com/what-is-algorithm-fairness-3182e161cf9f) یہ دیکھتی ہے کہ آیا الگورتھم کا ڈیزائن مخصوص گروہوں کے خلاف منظم طور پر امتیاز کرتا ہے، جس کے نتیجے میں _وسائل کی تقسیم_ (جہاں وسائل کو اس گروہ سے انکار یا روکا جاتا ہے) اور _سروس کے معیار_ (جہاں AI کچھ گروہوں کے لیے اتنا درست نہیں جتنا دوسروں کے لیے ہے) میں [ممکنہ نقصان](https://docs.microsoft.com/en-us/azure/machine-learning/concept-fairness-ml) ہوتا ہے۔
یہاں دریافت کرنے کے سوالات:
* کیا ہم نے اپنے استعمال کے کیس کے لیے درست _خصوصیات_ کو جمع کیا؟
* کیا مختلف ڈیٹا ذرائع کے درمیان ڈیٹا _مسلسل_ طور پر جمع کیا گیا؟
* کیا مختلف حالات یا منظرناموں کے لیے ڈیٹا سیٹ _مکمل_ ہے؟
* کیا معلومات حقیقت کی عکاسی میں _درست_ طور پر جمع کی گئی ہیں؟
#### 2.8 الگورتھم کا انصاف
[Algorithm Fairness](https://towardsdatascience.com/what-is-algorithm-fairness-3182e161cf9f) یہ جانچتا ہے کہ آیا الگورتھم کا ڈیزائن مخصوص گروہوں کے خلاف منظم طور پر امتیاز کرتا ہے، جس کے نتیجے میں _وسائل کی تقسیم_ (جہاں وسائل کو اس گروہ سے انکار یا روکا جاتا ہے) اور _سروس کے معیار_ (جہاں AI کچھ گروہوں کے لیے اتنا درست نہیں جتنا دوسروں کے لیے ہے) میں [ممکنہ نقصانات](https://docs.microsoft.com/en-us/azure/machine-learning/concept-fairness-ml) پیدا ہوتے ہیں۔
یہاں غور کرنے کے سوالات:
* کیا ہم نے مختلف گروہوں اور حالات کے لیے ماڈل کی درستگی کا جائزہ لیا؟
* کیا ہم نے ممکنہ نقصانات (جیسے دقیانوسی تصورات) کے لیے نظام کا بغور جائزہ لیا؟
* کیا ہم نے ممکنہ نقصانات (جیسے، دقیانوسی تصورات) کے لیے نظام کا بغور جائزہ لیا؟
* کیا ہم ڈیٹا کو دوبارہ ترتیب دے سکتے ہیں یا ماڈلز کو دوبارہ تربیت دے سکتے ہیں تاکہ شناخت شدہ نقصانات کو کم کیا جا سکے؟
مزید جاننے کے لیے [AI Fairness چیک لسٹس](https://query.prod.cms.rt.microsoft.com/cms/api/am/binary/RE4t6dA) جیسے وسائل کا جائزہ لیں۔
مزید جاننے کے لیے [AI Fairness checklists](https://query.prod.cms.rt.microsoft.com/cms/api/am/binary/RE4t6dA) جیسے وسائل کا جائزہ لیں۔
#### 2.9 غلط بیانی
[ڈیٹا کی غلط بیانی](https://www.sciencedirect.com/topics/computer-science/misrepresentation) یہ سوال اٹھاتی ہے کہ آیا ہم دیانتداری سے رپورٹ کیے گئے ڈیٹا سے حاصل کردہ بصیرت کو دھوکہ دہی کے انداز میں پیش کر رہے ہیں تاکہ مطلوبہ بیانیہ کی حمایت کی جا سکے۔
[Data Misrepresentation](https://www.sciencedirect.com/topics/computer-science/misrepresentation) یہ سوال اٹھاتا ہے کہ آیا ہم دیانتداری سے رپورٹ کیے گئے ڈیٹا سے حاصل کردہ بصیرت کو دھوکہ دہی سے پیش کر رہے ہیں تاکہ مطلوبہ بیانیہ کی حمایت کی جا سکے۔
یہاں غور کرنے کے سوالات:
* کیا ہم نامکمل یا غلط ڈیٹا رپورٹ کر رہے ہیں؟
* کیا ہم ڈیٹا کو اس طرح سے بصری بنا رہے ہیں جو گمراہ کن نتائج کو جنم دیتا ہے؟
* کیا ہم ڈیٹا کو اس طرح سے پیش کر رہے ہیں جو گمراہ کن نتائج کو جنم دیتا ہے؟
* کیا ہم نتائج کو جوڑنے کے لیے منتخب شماریاتی تکنیک استعمال کر رہے ہیں؟
* کیا متبادل وضاحتیں موجود ہیں جو مختلف نتیجہ پیش کر سکتی ہیں؟
#### 2.10 آزاد انتخاب
[آزاد انتخاب کا دھوکہ](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice) اس وقت ہوتا ہے جب نظام کے "انتخابی ڈھانچے" فیصلہ سازی کے الگورتھمز کا استعمال کرتے ہوئے لوگوں کو ایک ترجیحی نتیجہ کی طرف دھکیلتے ہیں، جبکہ انہیں اختیارات اور کنٹرول دینے کا تاثر دیتے ہیں۔ یہ [تاریک نمونے](https://www.darkpatterns.org/) صارفین کو سماجی اور اقتصادی نقصان پہنچا سکتے ہیں۔ چونکہ صارف کے فیصلے رویے کے پروفائلز پر اثر انداز ہوتے ہیں، یہ اقدامات ممکنہ طور پر مستقبل کے انتخاب کو بڑھا سکتے ہیں یا ان نقصانات کے اثرات کو بڑھا سکتے ہیں۔
[Illusion of Free Choice](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice) اس وقت پیدا ہوتی ہے جب نظام کے "چوائس آرکیٹیکچرز" فیصلہ سازی کے الگورتھمز کا استعمال کرتے ہوئے لوگوں کو ایک ترجیحی نتیجہ کی طرف دھکیلتے ہیں، جبکہ انہیں اختیارات اور کنٹرول دینے کا تاثر دیتے ہیں۔ یہ [dark patterns](https://www.darkpatterns.org/) صارفین کو سماجی اور اقتصادی نقصان پہنچا سکتے ہیں۔ چونکہ صارف کے فیصلے رویے کے پروفائلز پر اثر انداز ہوتے ہیں، یہ اقدامات ممکنہ طور پر مستقبل کے انتخاب کو بڑھا سکتے ہیں یا ان نقصانات کے اثرات کو بڑھا سکتے ہیں۔
یہاں غور کرنے کے سوالات:
* کیا صارف نے اس انتخاب کے اثرات کو سمجھا؟
* کیا صارف کو (متبادل) انتخاب اور ہر ایک کے فوائد و نقصانات کا علم تھا؟
* کیا صارف بعد میں خودکار یا متاثرہ انتخاب کو واپس لے سکتا ہے؟
* کیا صارف کو (متبادل) انتخاب اور ان کے فوائد و نقصانات کا علم تھا؟
* کیا صارف بعد میں خودکار یا متاثرہ انتخاب کو تبدیل کر سکتا ہے؟
### 3. کیس اسٹڈیز
ان اخلاقی چیلنجز کو حقیقی دنیا کے سیاق و سباق میں رکھنے کے لیے، ایسے کیس اسٹڈیز کو دیکھنا مددگار ثابت ہوتا ہے جو ان اخلاقی خلاف ورزیوں کو نظر انداز کرنے پر افراد اور معاشرے کو ممکنہ نقصانات اور نتائج کو اجاگر کرتے ہیں۔
ان اخلاقی چیلنجز کو حقیقی دنیا کے سیاق و سباق میں رکھنے کے لیے، ایسے کیس اسٹڈیز کو دیکھنا مددگار ثابت ہوتا ہے جو ان اخلاقی خلاف ورزیوں کو نظر انداز کرنے پر افراد اور معاشرے پر ممکنہ نقصانات اور نتائج کو اجاگر کرتے ہیں۔
یہاں کچھ مثالیں ہیں:
| اخلاقی چیلنج | کیس اسٹڈی |
|--- |--- |
| **مطلع رضامندی** | 1972 - [ٹسکیگی سیفلس اسٹڈی](https://en.wikipedia.org/wiki/Tuskegee_Syphilis_Study) - افریقی امریکی مردوں کو جو اس مطالعے میں شامل تھے، مفت طبی دیکھ بھال کا وعدہ کیا گیا تھا _لیکن دھوکہ دیا گیا_ کیونکہ محققین نے شرکاء کو ان کی تشخیص یا علاج کی دستیابی کے بارے میں مطلع کرنے میں ناکام رہے۔ کئی شرکاء فوت ہو گئے اور ان کے شریک حیات یا بچے متاثر ہوئے؛ مطالعہ 40 سال تک جاری رہا۔ |
| **ڈیٹا کی پرائیویسی** | 2007 - [نیٹ فلکس ڈیٹا انعام](https://www.wired.com/2007/12/why-anonymous-data-sometimes-isnt/) نے محققین کو _50K صارفین کے 10M گمنام فلمی درجہ بندی_ فراہم کی تاکہ سفارش الگورتھمز کو بہتر بنایا جا سکے۔ تاہم، محققین گمنام ڈیٹا کو _بیرونی ڈیٹاسیٹس_ (جیسے IMDb تبصرے) میں ذاتی طور پر شناختی ڈیٹا کے ساتھ جوڑنے میں کامیاب رہے - مؤثر طریقے سے کچھ نیٹ فلکس صارفین کو "ڈی-گمنام" کر دیا۔|
| **مجموعہ تعصب** | 2013 - بوسٹن شہر نے [اسٹریٹ بمپ](https://www.boston.gov/transportation/street-bump) تیار کیا، ایک ایپ جو شہریوں کو گڑھے رپورٹ کرنے دیتی ہے، جس سے شہر کو بہتر سڑک کے ڈیٹا حاصل کرنے میں مدد ملی۔ تاہم، [کم آمدنی والے گروہوں کے لوگوں کو کاروں اور فونز تک کم رسائی حاصل تھی](https://hbr.org/2013/04/the-hidden-biases-in-big-data)، جس سے ان کے سڑک کے مسائل اس ایپ میں پوشیدہ ہو گئے۔ ڈویلپرز نے منصفانہ رسائی اور ڈیجیٹل تقسیم کے مسائل کے لیے ماہرین کے ساتھ کام کیا۔ |
| **الگورتھم کی منصفانہ جانچ** | 2018 - MIT [جینڈر شیڈز اسٹڈی](http://gendershades.org/overview.html) نے صنفی درجہ بندی AI مصنوعات کی درستگی کا جائزہ لیا، خواتین اور رنگین افراد کے لیے درستگی میں فرق کو ظاہر کیا۔ ایک [2019 ایپل کارڈ](https://www.wired.com/story/the-apple-card-didnt-see-genderand-thats-the-problem/) نے مردوں کے مقابلے میں خواتین کو کم کریڈٹ پیش کیا۔ دونوں نے الگورتھم کے تعصب میں مسائل کو اجاگر کیا جو سماجی و اقتصادی نقصانات کا باعث بنتے ہیں۔|
| **ڈیٹا کی غلط بیانی** | 2020 - [جارجیا ڈیپارٹمنٹ آف پبلک ہیلتھ نے COVID-19 چارٹس جاری کیے](https://www.vox.com/covid-19-coronavirus-us-response-trump/2020/5/18/21262265/georgia-covid-19-cases-declining-reopening) جو شہریوں کو تصدیق شدہ کیسز کے رجحانات کے بارے میں گمراہ کرنے کے لیے x-axis پر غیر زمانی ترتیب کا استعمال کرتے ہوئے نظر آئے۔ یہ بصری چالوں کے ذریعے غلط بیانی کو ظاہر کرتا ہے۔ |
| **آزاد انتخاب کا دھوکہ** | 2020 - لرننگ ایپ [ABCmouse نے FTC شکایت کو حل کرنے کے لیے $10M ادا کیے](https://www.washingtonpost.com/business/2020/09/04/abcmouse-10-million-ftc-settlement/) جہاں والدین کو سبسکرپشنز کے لیے ادائیگی کرنے پر مجبور کیا گیا جسے وہ منسوخ نہیں کر سکتے تھے۔ یہ انتخابی ڈھانچوں میں تاریک نمونوں کو ظاہر کرتا ہے، جہاں صارفین کو ممکنہ طور پر نقصان دہ انتخاب کی طرف دھکیل دیا گیا۔ |
| **ڈیٹا کی پرائیویسی اور صارف کے حقوق** | 2021 - فیس بک [ڈیٹا لیک](https://www.npr.org/2021/04/09/986005820/after-data-breach-exposes-530-million-facebook-says-it-will-not-notify-users) نے 530M صارفین کا ڈیٹا افشا کیا، جس کے نتیجے میں FTC کو $5B کی ادائیگی ہوئی۔ تاہم، اس نے صارفین کو لیک کے بارے میں مطلع کرنے سے انکار کر دیا، صارف کے ڈیٹا کی شفافیت اور رسائی کے حقوق کی خلاف ورزی کی۔ |
| **مطلع رضامندی** | 1972 - [Tuskegee Syphilis Study](https://en.wikipedia.org/wiki/Tuskegee_Syphilis_Study) - افریقی امریکی مردوں کو جو اس مطالعے میں شامل تھے، مفت طبی دیکھ بھال کا وعدہ کیا گیا تھا _لیکن دھوکہ دیا گیا_، کیونکہ محققین نے شرکاء کو ان کی تشخیص یا علاج کی دستیابی کے بارے میں مطلع کرنے میں ناکام رہے۔ کئی شرکاء فوت ہو گئے اور ان کے شریک حیات یا بچے متاثر ہوئے؛ یہ مطالعہ 40 سال تک جاری رہا۔ |
| **ڈیٹا پرائیویسی** | 2007 - [Netflix data prize](https://www.wired.com/2007/12/why-anonymous-data-sometimes-isnt/) نے محققین کو _50K صارفین کے 10M گمنام فلمی درجہ بندی_ فراہم کی تاکہ سفارش الگورتھمز کو بہتر بنایا جا سکے۔ تاہم، محققین گمنام ڈیٹا کو _بیرونی ڈیٹا سیٹس_ (جیسے، IMDb تبصرے) کے ساتھ ذاتی طور پر شناختی ڈیٹا سے جوڑنے میں کامیاب رہے - مؤثر طریقے سے کچھ Netflix صارفین کو "ڈی-گمنام" کر دیا۔ |
| **کلیکشن تعصب** | 2013 - بوسٹن شہر نے [Street Bump](https://www.boston.gov/transportation/street-bump) تیار کیا، ایک ایپ جو شہریوں کو گڑھے رپورٹ کرنے دیتی ہے، جس سے شہر کو بہتر سڑک کے ڈیٹا حاصل کرنے میں مدد ملی۔ تاہم، [کم آمدنی والے گروہوں کے لوگوں کو کاروں اور فونز تک کم رسائی حاصل تھی](https://hbr.org/2013/04/the-hidden-biases-in-big-data)، جس سے ان کے سڑک کے مسائل اس ایپ میں پوشیدہ ہو گئے۔ ڈویلپرز نے منصفانہ رسائی اور ڈیجیٹل تقسیم کے مسائل پر کام کیا۔ |
| **الگورتھمک انصاف** | 2018 - MIT [Gender Shades Study](http://gendershades.org/overview.html) نے صنفی درجہ بندی AI مصنوعات کی درستگی کا جائزہ لیا، خواتین اور رنگین افراد کے لیے درستگی میں فرق کو ظاہر کیا۔ ایک [2019 Apple Card](https://www.wired.com/story/the-apple-card-didnt-see-genderand-thats-the-problem/) نے مردوں کے مقابلے میں خواتین کو کم کریڈٹ پیش کیا۔ دونوں نے الگورتھمک تعصب میں مسائل کو اجاگر کیا جو سماجی و اقتصادی نقصانات کا باعث بنتے ہیں۔ |
| **ڈیٹا غلط بیانی** | 2020 - [Georgia Department of Public Health released COVID-19 charts](https://www.vox.com/covid-19-coronavirus-us-response-trump/2020/5/18/21262265/georgia-covid-19-cases-declining-reopening) جو شہریوں کو تصدیق شدہ کیسز کے رجحانات کے بارے میں گمراہ کرنے کے لیے x-axis پر غیر زمانی ترتیب کا استعمال کرتے ہوئے دکھائی دی۔ یہ بصری چالوں کے ذریعے غلط بیانی کو ظاہر کرتا ہے۔ |
| **آزاد انتخاب کا دھوکہ** | 2020 - لرننگ ایپ [ABCmouse paid $10M to settle an FTC complaint](https://www.washingtonpost.com/business/2020/09/04/abcmouse-10-million-ftc-settlement/) جہاں والدین کو سبسکرپشنز کے لیے ادائیگی کرنے پر مجبور کیا گیا جسے وہ منسوخ نہیں کر سکتے تھے۔ یہ چوائس آرکیٹیکچرز میں تاریک نمونوں کو ظاہر کرتا ہے، جہاں صارفین کو ممکنہ طور پر نقصان دہ انتخاب کی طرف دھکیل دیا گیا۔ |
| **ڈیٹا پرائیویسی اور صارف کے حقوق** | 2021 - Facebook [Data Breach](https://www.npr.org/2021/04/09/986005820/after-data-breach-exposes-530-million-facebook-says-it-will-not-notify-users) نے 530M صارفین کا ڈیٹا افشا کیا، جس کے نتیجے میں FTC کو $5B کا تصفیہ ہوا۔ تاہم، اس نے صارفین کو خلاف ورزی کے بارے میں مطلع کرنے سے انکار کر دیا، صارف کے حقوق کی خلاف ورزی کی۔ |
مزید کیس اسٹڈیز دریافت کرنا چاہتے ہیں؟ ان وسائل کو دیکھیں:
* [Ethics Unwrapped](https://ethicsunwrapped.utexas.edu/case-studies) - مختلف صنعتوں میں اخلاقی مسائل۔
* [ڈیٹا سائنس اخلاقیات کورس](https://www.coursera.org/learn/data-science-ethics#syllabus) - اہم کیس اسٹڈیز کا جائزہ۔
* [جہاں چیزیں غلط ہوئیں](https://deon.drivendata.org/examples/) - ڈیون چیک لسٹ کے ساتھ مثالیں۔
* [Ethics Unwrapped](https://ethicsunwrapped.utexas.edu/case-studies) - مختلف صنعتوں میں اخلاقی مخمصے۔
* [Data Science Ethics course](https://www.coursera.org/learn/data-science-ethics#syllabus) - اہم کیس اسٹڈیز کا جائزہ۔
* [Where things have gone wrong](https://deon.drivendata.org/examples/) - ڈیون چیک لسٹ کے ساتھ مثالیں۔
> 🚨 ان کیس اسٹڈیز کے بارے میں سوچیں جو آپ نے دیکھے ہیں - کیا آپ نے اپنی زندگی میں اسی طرح کے اخلاقی چیلنج کا سامنا کیا ہے یا متاثر ہوئے ہیں؟ کیا آپ کم از کم ایک اور کیس اسٹڈی کے بارے میں سوچ سکتے ہیں جو اس سیکشن میں زیر بحث اخلاقی چیلنجز میں سے ایک کو ظاہر کرتا ہو؟
> 🚨 ان کیس اسٹڈیز کے بارے میں سوچیں جو آپ نے دیکھے ہیں - کیا آپ نے اپنی زندگی میں اسی طرح کے اخلاقی چیلنج کا تجربہ کیا یا اس سے متاثر ہوئے؟ کیا آپ کم از کم ایک اور کیس اسٹڈی کے بارے میں سوچ سکتے ہیں جو اس سیکشن میں زیر بحث اخلاقی چیلنجز میں سے ایک کو ظاہر کرتا ہو؟
## اطلاقی اخلاقیات
@ -197,62 +200,61 @@ CO_OP_TRANSLATOR_METADATA:
### 1. پیشہ ورانہ ضابطے
پیشہ ورانہ ضابطے تنظیموں کو اپنے اخلاقی اصولوں اور مشن بیان کی حمایت کرنے کے لیے اراکین کو "حوصلہ افزائی" کرنے کا ایک آپشن پیش کرتے ہیں۔ ضابطے پیشہ ورانہ رویے کے لیے _اخلاقی رہنما خطوط_ ہیں، جو ملازمین یا اراکین کو ایسے فیصلے کرنے میں مدد دیتے ہیں جو ان کی تنظیم کے اصولوں کے مطابق ہوں۔ یہ صرف اراکین کی رضاکارانہ تعمیل کے طور پر اچھے ہیں؛ تاہم، بہت سی تنظیمیں اراکین کی تعمیل کو متحرک کرنے کے لیے اضافی انعامات اور سزائیں پیش کرتی ہیں۔
پیشہ ورانہ ضابطے تنظیموں کو اپنے اخلاقی اصولوں اور مشن بیان کی حمایت کرنے کے لیے ممبران کو "حوصلہ افزائی" کرنے کا ایک آپشن پیش کرتے ہیں۔ ضابطے پیشہ ورانہ رویے کے لیے _اخلاقی رہنما خطوط_ ہیں، جو ملازمین یا ممبران کو ایسے فیصلے کرنے میں مدد دیتے ہیں جو ان کی تنظیم کے اصولوں کے مطابق ہوں۔ یہ صرف ممبران کی رضاکارانہ تعمیل کے طور پر اچھے ہیں؛ تاہم، بہت سی تنظیمیں ممبران کی تعمیل کو متحرک کرنے کے لیے اضافی انعامات اور سزائیں پیش کرتی ہیں۔
مثالیں شامل ہیں:
* [Oxford Munich](http://www.code-of-ethics.org/code-of-conduct/) Code of Ethics
* [Data Science Association](http://datascienceassn.org/code-of-conduct.html) Code of Conduct (2013 میں تخلیق کیا گیا)
* [ACM Code of Ethics and Professional Conduct](https://www.acm.org/code-of-ethics) (1993 سے)
* [آکسفورڈ میونخ](http://www.code-of-ethics.org/code-of-conduct/) اخلاقیات کا ضابطہ
* [ڈیٹا سائنس ایسوسی ایشن](http://datascienceassn.org/code-of-conduct.html) ضابطہ اخلاق (2013 میں تخلیق کیا گیا)
* [ACM ضابطہ اخلاق اور پیشہ ورانہ طرز عمل](https://www.acm.org/code-of-ethics) (1993 سے)
> 🚨 کیا آپ کسی پیشہ ور انجینئرنگ یا ڈیٹا سائنس تنظیم کے رکن ہیں؟ ان کی ویب سائٹ کو دیکھیں کہ آیا وہ پیشہ ورانہ اخلاقیات کا ضابطہ بیان کرتے ہیں۔ یہ ان کے اخلاقی اصولوں کے بارے میں کیا کہتا ہے؟ وہ اراکین کو ضابطے پر عمل کرنے کے لیے کیسے "حوصلہ افزائی" کر رہے ہیں؟
> 🚨 کیا آپ کسی پیشہ ور انجینئرنگ یا ڈیٹا سائنس تنظیم کے ممبر ہیں؟ ان کی ویب سائٹ کو دریافت کریں تاکہ یہ دیکھ سکیں کہ آیا وہ پیشہ ورانہ اخلاقیات کا ضابطہ بیان کرتے ہیں۔ یہ ان کے اخلاقی اصولوں کے بارے میں کیا کہتا ہے؟ وہ ممبران کو ضابطے پر عمل کرنے کے لیے کیسے "حوصلہ افزائی" کر رہے ہیں؟
### 2. اخلاقیات چیک لسٹس
جبکہ پیشہ ورانہ ضابطے پریکٹیشنرز سے مطلوبہ _اخلاقی رویے_ کی وضاحت کرتے ہیں، ان کے نفاذ میں [معلوم حدود](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md) ہیں، خاص طور پر بڑے پیمانے پر منصوبوں میں۔ اس کے بجائے، بہت سے ڈیٹا سائنس ماہرین [چیک لسٹس کی وکالت کرتے ہیں](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md)، جو **اصولوں کو عملی طریقوں سے جوڑ سکتے ہیں**۔
جبکہ پیشہ ورانہ ضابطے پریکٹیشنرز سے مطلوبہ _اخلاقی رویے_ کی وضاحت کرتے ہیں، وہ [نفاذ میں معلوم حدود](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md) رکھتے ہیں، خاص طور پر بڑے پیمانے پر منصوبوں میں۔ اس کے بجائے، بہت سے ڈیٹا سائنس ماہرین [چیک لسٹس کی وکالت کرتے ہیں](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md)، جو **اصولوں کو عمل سے جوڑنے** کے لیے زیادہ تعیناتی اور قابل عمل طریقے فراہم کرتے ہیں۔
چیک لسٹس سوالات کو "ہاں/نہیں" کاموں میں تبدیل کرتی ہیں جنہیں عملی شکل دی جا سکتی ہے، جس سے انہیں معیاری پروڈکٹ ریلیز ورک فلو کے حصے کے طور پر ٹریک کیا جا سکتا ہے۔
مثالیں شامل ہیں:
* [ڈیون](https://deon.drivendata.org/) - صنعت کی سفارشات سے تخلیق کردہ ایک عمومی مقصد ڈیٹا اخلاقیات چیک لسٹ [کمانڈ لائن ٹول](https://deon.drivendata.org/#checklist-citations) کے ساتھ آسان انضمام کے لیے۔
* [پرائیویسی آڈٹ چیک لسٹ](https://cyber.harvard.edu/ecommerce/privacyaudit.html) - قانونی اور سماجی نمائش کے نقطہ نظر سے معلوماتی ہینڈلنگ کے طریقوں کے لیے عمومی رہنمائی فراہم کرتی ہے۔
* [AI منصفانہ چیک لسٹ](https://www.microsoft.com/en-us/research/project/ai-fairness-checklist/) - AI پریکٹیشنرز کے ذریعہ تخلیق کردہ، AI ترقیاتی سائیکلوں میں منصفانہ چیکوں کو اپنانے اور انضمام کی حمایت کے لیے۔
* [ڈیٹا اور AI میں اخلاقیات کے لیے 22 سوالات](https://medium.com/the-organization/22-questions-for-ethics-in-data-and-ai-efb68fd19429) - زیادہ کھلے ڈھانچے کا فریم ورک، ڈیزائن، نفاذ، اور تنظیمی سیاق و سباق میں اخلاقی مسائل کی ابتدائی تلاش کے لیے۔
* [Deon](https://deon.drivendata.org/) - صنعت کی سفارشات سے تخلیق کردہ ایک عمومی مقصد ڈیٹا اخلاقیات چیک لسٹ [کمانڈ لائن ٹول](https://deon.drivendata.org/#checklist-citations) کے ساتھ آسان انضمام کے لیے۔
* [Privacy Audit Checklist](https://cyber.harvard.edu/ecommerce/privacyaudit.html) - قانونی اور سماجی نمائش کے نقطہ نظر سے معلوماتی ہینڈلنگ کے طریقوں کے لیے عمومی رہنمائی فراہم کرتا ہے۔
* [AI Fairness Checklist](https://www.microsoft.com/en-us/research/project/ai-fairness-checklist/) - AI پریکٹیشنرز کے ذریعہ تخلیق کردہ، AI ترقیاتی سائیکلوں میں انصاف کے چیکوں کو اپنانے اور انضمام کی حمایت کے لیے۔
* [22 questions for ethics in data and AI](https://medium.com/the-organization/22-questions-for-ethics-in-data-and-ai-efb68fd19429) - زیادہ کھلا فریم ورک، ڈیزائن، نفاذ، اور تنظیمی سیاق و سباق میں اخلاقی مسائل کی ابتدائی تلاش کے لیے تشکیل دیا گیا۔
### 3. اخلاقیات کے ضوابط
اخلاقیات مشترکہ اقدار کی وضاحت کرنے اور _رضاکارانہ طور پر_ صحیح کام کرنے کے بارے میں ہیں۔ **تعمیل** اس بارے میں ہے کہ انون کی پیروی کرنا_ اگر اور جہاں بیان کیا گیا ہو۔ **حکمرانی** وسیع پیمانے پر ان تمام طریقوں کا احاطہ کرتی ہے جن کے ذریعے تنظیمیں اخلاقی اصولوں کو نافذ کرنے اور قائم کردہ قوانین کی تعمیل کرنے کے لیے کام کرتی ہیں۔
اخلاقیات مشترکہ اقدار کی وضاحت کرنے اور _رضاکارانہ طور پر_ صحیح کام کرنے کے بارے میں ہے۔ **تعمیل** اس بارے میں ہے کہ انون کی پیروی_ کہاں اور اگر بیان کی گئی ہو۔ **حکمرانی** وسیع طور پر ان تمام طریقوں کا احاطہ کرتی ہے جن کے ذریعے تنظیمیں اخلاقی اصولوں کو نافذ کرنے اور قائم کردہ قوانین کی تعمیل کرنے کے لیے کام کرتی ہیں۔
آج، حکمرانی تنظیموں کے اندر دو شکلیں اختیار کرتی ہے۔ پہلے، یہ **اخلاقی AI** اصولوں کی وضاحت کرنے اور تنظیم میں تمام AI سے متعلق منصوبوں میں اپنانے کو عملی شکل دینے کے طریقوں کو قائم کرنے کے بارے میں ہے۔ دوسرا، یہ ان تمام حکومت کی طرف سے لازمی **ڈیٹا تحفظ کے ضوابط** کی تعمیل کے بارے میں ہے جن علاقوں میں یہ کام کرتی ہے۔
ڈیٹا تحفظ اور پرائیویسی ضوابط کی مثالیں:
* `1974`, [امریکی پرائیویسی ایکٹ](https://www.justice.gov/opcl/privacy-act-1974) - _وفاقی حکومت_ کے ذاتی معلومات کے جمع کرنے، استعمال، اور انکشاف کو منظم کرتا ہے۔
* `1996`, [امریکی ہیلتھ انشورنس پورٹیبلٹی اور احتساب ایکٹ (HIPAA)](https://www.cdc.gov/phlp/publications/topic/hipaa.html) - ذاتی صحت کے ڈیٹا کی حفاظت کرتا ہے۔
* `1998`, [امریکی بچوں کا آن لائن پرائیویسی تحفظ ایکٹ (COPPA)](https://www.ftc.gov/enforcement/rules/rulemaking-regulatory-reform-proceedings/childrens-online-privacy-protection-rule) - 13 سال سے کم عمر بچوں کے ڈیٹا کی پرائیویسی کی حفاظت کرتا ہے۔
* `2018`, [جنرل ڈیٹا پروٹیکشن ریگولیشن (GDPR)](https://gdpr-info.eu/) - صارف کے حقوق، ڈیٹا تحفظ، اور پرائیویسی فراہم کرتا ہے۔
* `2018`, [کیلیفورنیا کنزیومر پرائیویسی ایکٹ (CCPA)](https://www.oag.ca.gov/privacy/ccpa) صارفین کو ان کے (ذاتی) ڈیٹا پر زیادہ _حقوق_ دیتا ہے۔
* `2021`, چین کا [ذاتی معلومات کا تحفظ قانون](https://www.reuters.com/world/china/china-passes-new-personal-data-privacy-law-take-effect-nov-1-2021-08-20/) ابھی پاس ہوا، دنیا میں آن لائن ڈیٹا پرائیویسی کے سب سے مضبوط ضوابط میں سے ایک تخلیق کرتا ہے۔
* `1974`, [US Privacy Act](https://www.justice.gov/opcl/privacy-act-1974) - _وفاقی حکومت_ کے ذاتی معلومات کے جمع کرنے، استعمال، اور انکشاف کو منظم کرتا ہے۔
* `1996`, [US Health Insurance Portability & Accountability Act (HIPAA)](https://www.cdc.gov/phlp/publications/topic/hipaa.html) - ذاتی صحت کے ڈیٹا کی حفاظت کرتا ہے۔
* `1998`, [US Children's Online Privacy Protection Act (COPPA)](https://www.ftc.gov/enforcement/rules/rulemaking-regulatory-reform-proceedings/childrens-online-privacy-protection-rule) - 13 سال سے کم عمر بچوں کے ڈیٹا پرائیویسی کی حفاظت کرتا ہے۔
* `2018`, [General Data Protection Regulation (GDPR)](https://gdpr-info.eu/) - صارف کے حقوق، ڈیٹا تحفظ، اور پرائیویسی فراہم کرتا ہے۔
* `2018`, [California Consumer Privacy Act (CCPA)](https://www.oag.ca.gov/privacy/ccpa) صارفین کو ان کے (ذاتی) ڈیٹا پر زیادہ _حقوق_ دیتا ہے۔
* `2021`, چین کا [Personal Information Protection Law](https://www.reuters.com/world/china/china-passes-new-personal-data-privacy-law-take-effect-nov-1-2021-08-20/) ابھی منظور ہوا، جو دنیا بھر میں آن لائن ڈیٹا پرائیویسی کے سب سے مضبوط ضوابط میں سے ایک تخلیق کرتا ہے۔
> 🚨 یورپی یونین کی طرف سے بیان کردہ GDPR (جنرل ڈیٹا پروٹیکشن ریگولیشن) آج ڈیٹا پرائیویسی کے سب سے زیادہ اثر انگیز ضوابط میں سے ایک ہے۔ کیا آپ جانتے ہیں کہ یہ [8 صارف کے حقوق](https://www.freeprivacypolicy.com/blog/8-user-rights-gdpr) بھی بیان کرتا ہے تاکہ شہریوں کی ڈیجیٹل پرائیویسی اور ذاتی ڈیٹا کی حفاظت کی جا سکے؟ ان کے بارے میں جانیں کہ یہ کیا ہیں اور کیوں اہم ہیں۔
> 🚨 یورپی یونین کی طرف سے بیان کردہ GDPR (General Data Protection Regulation) آج ڈیٹا پرائیویسی کے سب سے زیادہ اثر انگیز ضوابط میں سے ایک ہے۔ کیا آپ جانتے ہیں کہ یہ [8 صارف کے حقوق](https://www.freeprivacypolicy.com/blog/8-user-rights-gdpr) بھی بیان کرتا ہے تاکہ شہریوں کی ڈیجیٹل پرائیویسی اور ذاتی ڈیٹا کی حفاظت کی جا سکے؟ ان کے بارے میں جانیں کہ یہ کیا ہیں اور کیوں اہم ہیں۔
### 4. اخلاقیات کی ثقافت
نوٹ کریں کہ _تعمیل_ (قانون کے "حرف" کو پورا کرنے کے لیے کافی کرنا) اور [نظامی مسائل](https://www.coursera.org/learn/data-science-ethics/home/week/4) (جیسے جمود، معلوماتی عدم توازن، اور تقسیماتی غیر منصفانہ) کو حل کرنے کے درمیان ایک غیر محسوس فرق موجود ہے جو AI کے ہتھیاروں کو تیز کر سکتا ہے۔
نوٹ کریں کہ _تعمیل_ (قانون کے "حرف" کو پورا کرنے کے لیے کافی کرنا) اور [نظامی مسائل](https://www.coursera.org/learn/data-science-ethics/home/week/4) (جیسے، جمود، معلوماتی عدم توازن، اور تقسیماتی غیر منصفانہ) کو حل کرنے کے درمیان ایک غیر محسوس فرق موجود ہے جو AI کے ہتھیار بنانے کو تیز کر سکتا ہے۔
بعد والے کو [اخلاقیات کی ثقافتوں کی وضاحت کے لیے تعاون پر مبنی نقطہ نظر](https://towardsdatascience.com/why-ai-ethics-requires-a-culture-driven-approach-26f451afa29f) کی ضرورت ہوتی ہے جو صنعت میں _تنظیموں_ کے درمیان جذباتی تعلقات اور مستقل مشترکہ اقدار کو تشکیل دیتے ہیں۔ اس کے لیے تنظیموں میں زیادہ [باضابطہ ڈیٹا اخلاقیات کی ثقافتیں](https://www.codeforamerica.org/news/formalizing-an-ethical-data-culture/) بنانے کی ضرورت ہوتی ہے - جس سے _کوئی بھی_ [اینڈن کورڈ کھینچ سکتا ہے](https://en.wikipedia.org/wiki/Andon_(manufacturing)) (عمل کے ابتدائی مرحلے میں اخلاقیات کے خدشات کو اٹھانے کے لیے) اور _اخلاقی تشخیصات_ (جیسے، بھرتی میں) کو AI منصوبوں میں ٹیم کی تشکیل کے لیے ایک بنیادی معیار بنا سکتا ہے۔
بعد والے کو [اخلاقیات کی ثقافتوں کی وضاحت کے لیے تعاون پر مبنی نقطہ نظر](https://towardsdatascience.com/why-ai-ethics-requires-a-culture-driven-approach-26f451afa29f) کی ضرورت ہوتی ہے جو صنعت میں تنظیموں کے درمیان جذباتی تعلقات اور مستقل مشترکہ اقدار کو تشکیل دیتے ہیں۔ اس کے لیے تنظیموں میں زیادہ [باضابطہ ڈیٹا اخلاقیات کی ثقافتیں](https://www.codeforamerica.org/news/formalizing-an-ethical-data-culture/) بنانے کی ضرورت ہوتی ہے - جس سے _کوئی بھی_ [Andon cord کھینچ سکتا ہے](https://en.wikipedia.org/wiki/Andon_(manufacturing)) (عمل کے ابتدائی مرحلے میں اخلاقیات کے خدشات کو اٹھانے کے لیے) اور _اخلاقی جائزے_ (جیسے، بھرتی میں) کو AI منصوبوں میں ٹیم کی تشکیل کے لیے ایک بنیادی معیار بنا سکتا ہے۔
---
## [لیکچر کے بعد کا کوئز](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/3) 🎯
## [لیکچر کے بعد کوئز](https://ff-quizzes.netlify.app/en/ds/) 🎯
## جائزہ اور خود مطالعہ
کورسز اور کتابیں اخلاقیات کے بنیادی تصورات اور چیلنجز کو سمجھنے میں مدد کرتی ہیں، جبکہ کیس اسٹڈیز اور ٹولز حقیقی دنیا کے سیاق و سباق میں اطلاقی اخلاقیات کے طریقوں میں مدد کرتے ہیں۔ شروع کرنے کے لیے یہاں کچھ وسائل ہیں۔
کورسز اور کتابیں اخلاقیات کے بنیادی تصورات اور چیلنجز کو سمجھنے میں مدد کرتی ہیں، جبکہ کیس اسٹڈیز اور ٹولز حقیقی دنیا کے سیاق و سباق میں اطلاقی اخلاقیات کے طریقوں میں مدد کرتے ہیں۔ یہاں شروع کرنے کے لیے کچھ وسائل ہیں۔
* [
* [ذمہ دار مصنوعی ذہانت کے اصول](https://docs.microsoft.com/en-us/learn/modules/responsible-ai-principles/) - مائیکروسافٹ لرن سے مفت تعلیمی راستہ۔
* [اخلاقیات اور ڈیٹا سائنس](https://resources.oreilly.com/examples/0636920203964) - او'ریلی ای بک (ایم لوکائیڈز، ایچ میسن وغیرہ)
* [ڈیٹا سائنس اخلاقیات](https://www.coursera.org/learn/data-science-ethics#syllabus) - مشی گن یونیورسٹی کا آن لائن کورس۔
* [اخلاقیات ان ریپڈ](https://ethicsunwrapped.utexas.edu/case-studies) - ٹیکساس یونیورسٹی کے کیس اسٹڈیز۔
* [Machine Learning For Beginners](https://github.com/microsoft/ML-For-Beginners/blob/main/1-Introduction/3-fairness/README.md) - Microsoft کی طرف سے انصاف پر سبق۔
- [ذمہ دار مصنوعی ذہانت کے اصول](https://docs.microsoft.com/en-us/learn/modules/responsible-ai-principles/) - مائیکروسافٹ لرن کا مفت تعلیمی راستہ۔
- [اخلاقیات اور ڈیٹا سائنس](https://resources.oreilly.com/examples/0636920203964) - او'ریلی ای بک (ایم. لوکائیڈز، ایچ. میسن وغیرہ)
- [ڈیٹا سائنس کے اخلاقیات](https://www.coursera.org/learn/data-science-ethics#syllabus) - مشی گن یونیورسٹی کا آن لائن کورس۔
- [اخلاقیات کی وضاحت](https://ethicsunwrapped.utexas.edu/case-studies) - ٹیکساس یونیورسٹی کے کیس اسٹڈیز۔
# اسائنمنٹ
@ -261,4 +263,4 @@ CO_OP_TRANSLATOR_METADATA:
---
**ڈسکلیمر**:
یہ دستاویز AI ترجمہ سروس [Co-op Translator](https://github.com/Azure/co-op-translator) کا استعمال کرتے ہوئے ترجمہ کی گئی ہے۔ ہم درستگی کے لیے کوشش کرتے ہیں، لیکن براہ کرم آگاہ رہیں کہ خودکار ترجمے میں غلطیاں یا عدم درستگی ہو سکتی ہیں۔ اصل دستاویز کو اس کی اصل زبان میں مستند ذریعہ سمجھا جانا چاہیے۔ اہم معلومات کے لیے، پیشہ ور انسانی ترجمہ کی سفارش کی جاتی ہے۔ اس ترجمے کے استعمال سے پیدا ہونے والی کسی بھی غلط فہمی یا غلط تشریح کے لیے ہم ذمہ دار نہیں ہیں۔
یہ دستاویز AI ترجمہ سروس [Co-op Translator](https://github.com/Azure/co-op-translator) کا استعمال کرتے ہوئے ترجمہ کی گئی ہے۔ ہم درستگی کے لیے کوشش کرتے ہیں، لیکن براہ کرم آگاہ رہیں کہ خودکار ترجمے میں غلطیاں یا غیر درستیاں ہو سکتی ہیں۔ اصل دستاویز کو اس کی اصل زبان میں مستند ذریعہ سمجھا جانا چاہیے۔ اہم معلومات کے لیے، پیشہ ور انسانی ترجمہ کی سفارش کی جاتی ہے۔ ہم اس ترجمے کے استعمال سے پیدا ہونے والی کسی بھی غلط فہمی یا غلط تشریح کے ذمہ دار نہیں ہیں۔

@ -1,31 +1,31 @@
<!--
CO_OP_TRANSLATOR_METADATA:
{
"original_hash": "8796f41f566a0a8ebb72863a83d558ed",
"translation_date": "2025-08-28T19:00:53+00:00",
"original_hash": "3a34157cc63516eba97c89a0b2f8c3e6",
"translation_date": "2025-09-03T21:35:50+00:00",
"source_file": "1-Introduction/02-ethics/README.md",
"language_code": "vi"
}
-->
# Giới thiệu về Đạo đức Dữ liệu
|![ Sketchnote bởi [(@sketchthedocs)](https://sketchthedocs.dev) ](../../sketchnotes/02-Ethics.png)|
|![ Sketchnote của [(@sketchthedocs)](https://sketchthedocs.dev) ](../../sketchnotes/02-Ethics.png)|
|:---:|
| Đạo đức Khoa học Dữ liệu - _Sketchnote bởi [@nitya](https://twitter.com/nitya)_ |
| Đạo đức Khoa học Dữ liệu - _Sketchnote của [@nitya](https://twitter.com/nitya)_ |
---
Chúng ta đều là công dân dữ liệu sống trong một thế giới được số hóa bởi dữ liệu.
Xu hướng thị trường cho thấy rằng đến năm 2022, cứ 3 tổ chức lớn thì sẽ có 1 tổ chức mua và bán dữ liệu của họ thông qua các [Thị trường và Sàn giao dịch](https://www.gartner.com/smarterwithgartner/gartner-top-10-trends-in-data-and-analytics-for-2020/). Là **Nhà phát triển ứng dụng**, chúng ta sẽ thấy việc tích hợp các thông tin chi tiết dựa trên dữ liệu và tự động hóa dựa trên thuật toán vào trải nghiệm người dùng hàng ngày trở nên dễ dàng và rẻ hơn. Nhưng khi AI trở nên phổ biến, chúng ta cũng cần hiểu những tác hại tiềm ẩn do [việc vũ khí hóa](https://www.youtube.com/watch?v=TQHs8SA1qpk) các thuật toán này ở quy mô lớn.
Xu hướng thị trường cho thấy rằng đến năm 2022, cứ 3 tổ chức lớn thì sẽ có 1 tổ chức mua và bán dữ liệu của họ thông qua các [Thị trường và Sàn giao dịch trực tuyến](https://www.gartner.com/smarterwithgartner/gartner-top-10-trends-in-data-and-analytics-for-2020/). Là **Nhà phát triển ứng dụng**, chúng ta sẽ thấy việc tích hợp các thông tin chi tiết dựa trên dữ liệu và tự động hóa dựa trên thuật toán vào trải nghiệm người dùng hàng ngày trở nên dễ dàng và rẻ hơn. Nhưng khi AI trở nên phổ biến, chúng ta cũng cần hiểu những tác hại tiềm ẩn do [việc vũ khí hóa](https://www.youtube.com/watch?v=TQHs8SA1qpk) các thuật toán này ở quy mô lớn.
Xu hướng cũng chỉ ra rằng chúng ta sẽ tạo ra và tiêu thụ hơn [180 zettabyte](https://www.statista.com/statistics/871513/worldwide-data-created/) dữ liệu vào năm 2025. Là **Nhà khoa học dữ liệu**, điều này mang lại cho chúng ta mức độ truy cập chưa từng có vào dữ liệu cá nhân. Điều này có nghĩa là chúng ta có thể xây dựng hồ sơ hành vi của người dùng và ảnh hưởng đến việc ra quyết định theo cách tạo ra một [ảo tưởng về sự lựa chọn tự do](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice) trong khi có thể hướng người dùng đến các kết quả mà chúng ta mong muốn. Nó cũng đặt ra các câu hỏi rộng hơn về quyền riêng tư dữ liệu và bảo vệ người dùng.
Xu hướng cũng chỉ ra rằng chúng ta sẽ tạo ra và tiêu thụ hơn [180 zettabyte](https://www.statista.com/statistics/871513/worldwide-data-created/) dữ liệu vào năm 2025. Là **Nhà khoa học dữ liệu**, điều này mang lại cho chúng ta mức độ truy cập chưa từng có vào dữ liệu cá nhân. Điều này có nghĩa là chúng ta có thể xây dựng hồ sơ hành vi của người dùng và ảnh hưởng đến việc ra quyết định theo cách tạo ra [ảo tưởng về sự lựa chọn tự do](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice) trong khi có thể hướng người dùng đến các kết quả mà chúng ta mong muốn. Nó cũng đặt ra các câu hỏi rộng hơn về quyền riêng tư dữ liệu và bảo vệ người dùng.
Đạo đức dữ liệu giờ đây là _hàng rào cần thiết_ cho khoa học và kỹ thuật dữ liệu, giúp chúng ta giảm thiểu các tác hại tiềm ẩn và hậu quả không mong muốn từ các hành động dựa trên dữ liệu của mình. [Chu kỳ Hype của Gartner về AI](https://www.gartner.com/smarterwithgartner/2-megatrends-dominate-the-gartner-hype-cycle-for-artificial-intelligence-2020/) xác định các xu hướng liên quan đến đạo đức kỹ thuật số, AI có trách nhiệm và quản trị AI là các yếu tố thúc đẩy các xu hướng lớn hơn xung quanh _dân chủ hóa__công nghiệp hóa_ AI.
![Chu kỳ Hype của Gartner về AI - 2020](https://images-cdn.newscred.com/Zz1mOWJhNzlkNDA2ZTMxMWViYjRiOGFiM2IyMjQ1YmMwZQ==)
Trong bài học này, chúng ta sẽ khám phá lĩnh vực thú vị về đạo đức dữ liệu - từ các khái niệm và thách thức cốt lõi, đến các nghiên cứu điển hình và các khái niệm AI ứng dụng như quản trị - giúp thiết lập văn hóa đạo đức trong các nhóm và tổ chức làm việc với dữ liệu và AI.
Trong bài học này, chúng ta sẽ khám phá lĩnh vực thú vị của đạo đức dữ liệu - từ các khái niệm và thách thức cốt lõi, đến các nghiên cứu điển hình và các khái niệm AI ứng dụng như quản trị - giúp thiết lập văn hóa đạo đức trong các nhóm và tổ chức làm việc với dữ liệu và AI.
## [Câu hỏi trước bài giảng](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/2) 🎯
@ -41,7 +41,7 @@ Từ "đạo đức" xuất phát từ [từ tiếng Hy Lạp "ethikos"](https:/
**Đạo đức ứng dụng** là [việc áp dụng thực tế các cân nhắc đạo đức](https://en.wikipedia.org/wiki/Applied_ethics). Đây là quá trình điều tra tích cực các vấn đề đạo đức trong bối cảnh _hành động, sản phẩm và quy trình thực tế_, và thực hiện các biện pháp khắc phục để đảm bảo rằng chúng vẫn phù hợp với các giá trị đạo đức đã xác định.
**Văn hóa đạo đức** là về [_hiện thực hóa_ đạo đức ứng dụng](https://hbr.org/2019/05/how-to-design-an-ethical-organization) để đảm bảo rằng các nguyên tắc và thực hành đạo đức của chúng ta được áp dụng một cách nhất quán và có thể mở rộng trên toàn tổ chức. Các văn hóa đạo đức thành công xác định các nguyên tắc đạo đức trên toàn tổ chức, cung cấp các động lực có ý nghĩa cho việc tuân thủ, và củng cố các chuẩn mực đạo đức bằng cách khuyến khích và khuếch đại các hành vi mong muốn ở mọi cấp độ của tổ chức.
**Văn hóa đạo đức** là về [_hoạt động hóa_ đạo đức ứng dụng](https://hbr.org/2019/05/how-to-design-an-ethical-organization) để đảm bảo rằng các nguyên tắc và thực hành đạo đức của chúng ta được áp dụng một cách nhất quán và có thể mở rộng trên toàn tổ chức. Các văn hóa đạo đức thành công xác định các nguyên tắc đạo đức trên toàn tổ chức, cung cấp các động lực có ý nghĩa cho việc tuân thủ, và củng cố các chuẩn mực đạo đức bằng cách khuyến khích và khuếch đại các hành vi mong muốn ở mọi cấp độ của tổ chức.
## Các khái niệm về đạo đức
@ -64,87 +64,87 @@ Hãy cùng khám phá ngắn gọn các nguyên tắc này. _Minh bạch_ và _t
* [**Quyền riêng tư & Bảo mật**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - là về việc hiểu nguồn gốc dữ liệu và cung cấp _quyền riêng tư dữ liệu và các bảo vệ liên quan_ cho người dùng.
* [**Tính bao gồm**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - là về việc thiết kế các giải pháp AI với ý định, điều chỉnh chúng để đáp ứng _một loạt các nhu cầu và khả năng của con người_.
> 🚨 Hãy nghĩ về tuyên bố sứ mệnh đạo đức dữ liệu của bạn có thể là gì. Khám phá các khung đạo đức AI từ các tổ chức khác - đây là các ví dụ từ [IBM](https://www.ibm.com/cloud/learn/ai-ethics), [Google](https://ai.google/principles), và [Facebook](https://ai.facebook.com/blog/facebooks-five-pillars-of-responsible-ai/). Các giá trị chung của họ có điểm gì tương đồng? Các nguyên tắc này liên quan như thế nào đến sản phẩm AI hoặc ngành mà họ hoạt động?
> 🚨 Hãy nghĩ về tuyên bố sứ mệnh đạo đức dữ liệu của bạn có thể là gì. Khám phá các khung đạo đức AI từ các tổ chức khác - đây là các ví dụ từ [IBM](https://www.ibm.com/cloud/learn/ai-ethics), [Google](https://ai.google/principles), và [Facebook](https://ai.facebook.com/blog/facebooks-five-pillars-of-responsible-ai/). Những giá trị chung nào mà họ có điểm tương đồng? Những nguyên tắc này liên quan như thế nào đến sản phẩm AI hoặc ngành mà họ hoạt động?
### 2. Thách thức đạo đức
Khi chúng ta đã xác định các nguyên tắc đạo đức, bước tiếp theo là đánh giá các hành động dữ liệu và AI của chúng ta để xem liệu chúng có phù hợp với các giá trị chung đó hay không. Hãy nghĩ về các hành động của bạn trong hai danh mục: _thu thập dữ liệu__thiết kế thuật toán_.
Với việc thu thập dữ liệu, các hành động có thể liên quan đến **dữ liệu cá nhân** hoặc thông tin nhận dạng cá nhân (PII) cho các cá nhân có thể nhận dạng. Điều này bao gồm [các mục dữ liệu không cá nhân đa dạng](https://ec.europa.eu/info/law/law-topic/data-protection/reform/what-personal-data_en) mà _tập hợp lại_ có thể nhận dạng một cá nhân. Các thách thức đạo đức có thể liên quan đến _quyền riêng tư dữ liệu_, _quyền sở hữu dữ liệu_, và các chủ đề liên quan như _sự đồng ý được thông báo__quyền sở hữu trí tuệ_ của người dùng.
Với việc thu thập dữ liệu, các hành động có thể liên quan đến **dữ liệu cá nhân** hoặc thông tin nhận dạng cá nhân (PII) cho các cá nhân có thể nhận dạng. Điều này bao gồm [các mục dữ liệu không cá nhân đa dạng](https://ec.europa.eu/info/law/law-topic/data-protection/reform/what-personal-data_en) mà _tổng hợp lại_ có thể nhận dạng một cá nhân. Các thách thức đạo đức có thể liên quan đến _quyền riêng tư dữ liệu_, _quyền sở hữu dữ liệu_, và các chủ đề liên quan như _sự đồng ý được thông báo__quyền sở hữu trí tuệ_ của người dùng.
Với thiết kế thuật toán, các hành động sẽ liên quan đến việc thu thập & quản lý **bộ dữ liệu**, sau đó sử dụng chúng để huấn luyện & triển khai **mô hình dữ liệu** dự đoán kết quả hoặc tự động hóa quyết định trong các bối cảnh thực tế. Các thách thức đạo đức có thể phát sinh từ _thiên vị bộ dữ liệu_, _vấn đề chất lượng dữ liệu_, _sự không công bằng_, và _sự sai lệch_ trong thuật toán - bao gồm một số vấn đề mang tính hệ thống.
Với thiết kế thuật toán, các hành động sẽ liên quan đến việc thu thập & quản lý **bộ dữ liệu**, sau đó sử dụng chúng để huấn luyện & triển khai **mô hình dữ liệu** dự đoán kết quả hoặc tự động hóa quyết định trong các bối cảnh thực tế. Các thách thức đạo đức có thể phát sinh từ _thiên vị bộ dữ liệu_, các vấn đề về _chất lượng dữ liệu_, _sự không công bằng_, và _sự sai lệch_ trong thuật toán - bao gồm một số vấn đề mang tính hệ thống.
Trong cả hai trường hợp, các thách thức đạo đức làm nổi bật các lĩnh vực mà hành động của chúng ta có thể gặp xung đột với các giá trị chung. Để phát hiện, giảm thiểu, giảm bớt hoặc loại bỏ các mối quan ngại này - chúng ta cần đặt ra các câu hỏi đạo đức "có/không" liên quan đến hành động của mình, sau đó thực hiện các hành động khắc phục khi cần thiết. Hãy cùng xem xét một số thách thức đạo đức và các câu hỏi đạo đức mà chúng đặt ra:
Trong cả hai trường hợp, các thách thức đạo đức làm nổi bật các lĩnh vực mà hành động của chúng ta có thể gặp xung đột với các giá trị chung. Để phát hiện, giảm thiểu, giảm bớt hoặc loại bỏ những lo ngại này - chúng ta cần đặt ra các câu hỏi đạo đức "có/không" liên quan đến hành động của mình, sau đó thực hiện các biện pháp khắc phục khi cần thiết. Hãy cùng xem một số thách thức đạo đức và các câu hỏi đạo đức mà chúng đặt ra:
#### 2.1 Quyền sở hữu dữ liệu
Việc thu thập dữ liệu thường liên quan đến dữ liệu cá nhân có thể nhận dạng các đối tượng dữ liệu. [Quyền sở hữu dữ liệu](https://permission.io/blog/data-ownership) là về _kiểm soát_ và [_quyền của người dùng_](https://permission.io/blog/data-ownership) liên quan đến việc tạo ra, xử lý và phổ biến dữ liệu.
Việc thu thập dữ liệu thường liên quan đến dữ liệu cá nhân có thể nhận dạng các đối tượng dữ liệu. [Quyền sở hữu dữ liệu](https://permission.io/blog/data-ownership) là về _kiểm soát_ và [_quyền của người dùng_](https://permission.io/blog/data-ownership) liên quan đến việc tạo, xử lý và phổ biến dữ liệu.
Các câu hỏi đạo đức cần đặt ra là:
* Ai sở hữu dữ liệu? (người dùng hay tổ chức)
* Các quyền mà đối tượng dữ liệu có là gì? (ví dụ: truy cập, xóa, di chuyển)
* Các quyền mà tổ chức có là gì? (ví dụ: chỉnh sửa đánh giá người dùng độc hại)
* Ai sở hữu dữ liệu? (người dùng hay tổ chức)
* Các quyền mà đối tượng dữ liệu có là gì? (ví dụ: truy cập, xóa, di chuyển)
* Các quyền mà tổ chức có là gì? (ví dụ: chỉnh sửa đánh giá người dùng độc hại)
#### 2.2 Sự đồng ý được thông báo
[Sự đồng ý được thông báo](https://legaldictionary.net/informed-consent/) định nghĩa hành động người dùng đồng ý với một hành động (như thu thập dữ liệu) với _sự hiểu biết đầy đủ_ về các sự kiện liên quan bao gồm mục đích, rủi ro tiềm ẩn, và các lựa chọn thay thế.
[Sự đồng ý được thông báo](https://legaldictionary.net/informed-consent/) định nghĩa hành động người dùng đồng ý với một hành động (như thu thập dữ liệu) với _sự hiểu biết đầy đủ_ về các sự kiện liên quan bao gồm mục đích, rủi ro tiềm ẩn và các lựa chọn thay thế.
Các câu hỏi cần khám phá ở đây là:
* Người dùng (đối tượng dữ liệu) có cho phép thu thập và sử dụng dữ liệu không?
* Người dùng có hiểu mục đích mà dữ liệu đó được thu thập không?
* Người dùng có hiểu các rủi ro tiềm ẩn từ sự tham gia của họ không?
* Người dùng (đối tượng dữ liệu) có cho phép thu thập và sử dụng dữ liệu không?
* Người dùng có hiểu mục đích mà dữ liệu đó được thu thập không?
* Người dùng có hiểu các rủi ro tiềm ẩn từ sự tham gia của họ không?
#### 2.3 Quyền sở hữu trí tuệ
[Quyền sở hữu trí tuệ](https://en.wikipedia.org/wiki/Intellectual_property) đề cập đến các sáng tạo vô hình xuất phát từ sáng kiến của con người, có thể _có giá trị kinh tế_ đối với cá nhân hoặc doanh nghiệp.
Các câu hỏi cần khám phá ở đây là:
* Dữ liệu được thu thập có giá trị kinh tế đối với người dùng hoặc doanh nghiệp không?
* Người dùng có quyền sở hữu trí tuệ ở đây không?
* Tổ chức có quyền sở hữu trí tuệ ở đây không?
* Nếu các quyền này tồn tại, chúng ta đang bảo vệ chúng như thế nào?
* Dữ liệu được thu thập có giá trị kinh tế đối với người dùng hoặc doanh nghiệp không?
* **Người dùng** có quyền sở hữu trí tuệ ở đây không?
* **Tổ chức** có quyền sở hữu trí tuệ ở đây không?
* Nếu các quyền này tồn tại, chúng ta đang bảo vệ chúng như thế nào?
#### 2.4 Quyền riêng tư dữ liệu
[Quyền riêng tư dữ liệu](https://www.northeastern.edu/graduate/blog/what-is-data-privacy/) hoặc quyền riêng tư thông tin đề cập đến việc bảo vệ quyền riêng tư của người dùng và bảo vệ danh tính của họ liên quan đến thông tin nhận dạng cá nhân.
Các câu hỏi cần khám phá ở đây là:
* Dữ liệu (cá nhân) của người dùng có được bảo mật chống lại các cuộc tấn công và rò rỉ không?
* Dữ liệu của người dùng có chỉ được truy cập bởi các người dùng và bối cảnh được ủy quyền không?
* Tính ẩn danh của người dùng có được bảo tồn khi dữ liệu được chia sẻ hoặc phổ biến không?
* Người dùng có thể được không nhận dạng từ các bộ dữ liệu đã được ẩn danh không?
* Dữ liệu (cá nhân) của người dùng có được bảo mật chống lại các cuộc tấn công và rò rỉ không?
* Dữ liệu của người dùng có chỉ được truy cập bởi các người dùng và bối cảnh được ủy quyền không?
* Tính ẩn danh của người dùng có được bảo tồn khi dữ liệu được chia sẻ hoặc phổ biến không?
* Người dùng có thể được gỡ bỏ nhận dạng khỏi các bộ dữ liệu đã được ẩn danh không?
#### 2.5 Quyền được lãng quên
[Quyền được lãng quên](https://en.wikipedia.org/wiki/Right_to_be_forgotten) hoặc [Quyền xóa bỏ](https://www.gdpreu.org/right-to-be-forgotten/) cung cấp thêm sự bảo vệ dữ liệu cá nhân cho người dùng. Cụ thể, nó cho phép người dùng yêu cầu xóa hoặc loại bỏ dữ liệu cá nhân khỏi các tìm kiếm trên Internet và các địa điểm khác, _trong các trường hợp cụ thể_ - cho phép họ có một khởi đầu mới trực tuyến mà không bị các hành động trong quá khứ chống lại họ.
[Quyền được lãng quên](https://en.wikipedia.org/wiki/Right_to_be_forgotten) hoặc [Quyền xóa bỏ](https://www.gdpreu.org/right-to-be-forgotten/) cung cấp thêm sự bảo vệ dữ liệu cá nhân cho người dùng. Cụ thể, nó cho phép người dùng yêu cầu xóa hoặc loại bỏ dữ liệu cá nhân khỏi các tìm kiếm trên Internet và các vị trí khác, _trong các trường hợp cụ thể_ - cho phép họ có một khởi đầu mới trực tuyến mà không bị các hành động trong quá khứ ảnh hưởng.
Các câu hỏi cần khám phá ở đây là:
* Hệ thống có cho phép đối tượng dữ liệu yêu cầu xóa bỏ không?
* Việc rút lại sự đồng ý của người dùng có nên kích hoạt việc xóa bỏ tự động không?
* Dữ liệu có được thu thập mà không có sự đồng ý hoặc bằng các phương tiện bất hợp pháp không?
* Chúng ta có tuân thủ các quy định của chính phủ về quyền riêng tư dữ liệu không?
* Hệ thống có cho phép đối tượng dữ liệu yêu cầu xóa bỏ không?
* Việc rút lại sự đồng ý của người dùng có nên kích hoạt việc xóa bỏ tự động không?
* Dữ liệu có được thu thập mà không có sự đồng ý hoặc bằng các phương pháp bất hợp pháp không?
* Chúng ta có tuân thủ các quy định của chính phủ về quyền riêng tư dữ liệu không?
#### 2.6 Thiên vị bộ dữ liệu
Thiên vị bộ dữ liệu hoặc [Thiên vị thu thập](http://researcharticles.com/index.php/bias-in-data-collection-in-research/) là về việc chọn một tập hợp con _không đại diện_ của dữ liệu để phát triển thuật toán, tạo ra sự không công bằng tiềm ẩn trong kết quả cho các nhóm đa dạng. Các loại thiên bias bao gồm thiên bias chọn lọc hoặc lấy mẫu, thiên bias tình nguyện, và thiên bias công cụ.
Thiên vị bộ dữ liệu hoặc [Thiên vị thu thập](http://researcharticles.com/index.php/bias-in-data-collection-in-research/) là về việc chọn một tập hợp con _không đại diện_ của dữ liệu để phát triển thuật toán, tạo ra sự không công bằng tiềm ẩn trong kết quả cho các nhóm đa dạng. Các loại thiên vị bao gồm thiên vị chọn lọc hoặc lấy mẫu, thiên vị tình nguyện, và thiên vị công cụ.
Các câu hỏi cần khám phá ở đây là:
* Chúng ta có tuyển chọn một tập hợp đại diện của các đối tượng dữ liệu không?
* Chúng ta có kiểm tra bộ dữ liệu đã thu thập hoặc quản lý để phát hiện các thiên bias khác nhau không?
* Chúng ta có thể giảm thiểu hoặc loại bỏ các thiên bias đã phát hiện không?
* Chúng ta có tuyển chọn một tập hợp đại diện của các đối tượng dữ liệu không?
* Chúng ta có kiểm tra bộ dữ liệu đã thu thập hoặc quản lý để phát hiện các thiên bias khác nhau không?
* Chúng ta có thể giảm thiểu hoặc loại bỏ bất kỳ thiên bias nào đã được phát hiện không?
#### 2.7 Chất lượng dữ liệu
[Chất lượng dữ liệu](https://lakefs.io/data-quality-testing/) xem xét tính hợp lệ của bộ dữ liệu được quản lý để phát triển thuật toán của chúng ta, kiểm tra xem các đặc điểm và bản ghi có đáp ứng yêu cầu về mức độ chính xác và nhất quán cần thiết cho mục đích AI của chúng ta hay không.
[Chất lượng dữ liệu](https://lakefs.io/data-quality-testing/) xem xét tính hợp lệ của bộ dữ liệu được quản lý để phát triển các thuật toán của chúng ta, kiểm tra xem các đặc điểm và bản ghi có đáp ứng yêu cầu về mức độ chính xác và nhất quán cần thiết cho mục đích AI của chúng ta hay không.
Các câu hỏi cần khám phá ở đây là:
* Chúng ta có thu thập các _đặc điểm hợp lệ_ cho trường hợp sử dụng của mình không?
* Dữ liệu có được thu thập _
[Algorithm Fairness](https://towardsdatascience.com/what-is-algorithm-fairness-3182e161cf9f) kiểm tra xem thiết kế thuật toán có phân biệt đối xử một cách hệ thống với các nhóm đối tượng dữ liệu cụ thể hay không, dẫn đến [những tổn hại tiềm tàng](https://docs.microsoft.com/en-us/azure/machine-learning/concept-fairness-ml) trong _phân bổ_ (i tài nguyên bị từ chối hoặc không được cung cấp cho nhóm đó) và _chất lượng dịch vụ_ (i AI không chính xác đối với một số nhóm như đối với các nhóm khác).
* Chúng ta có thu thập các _đặc điểm hợp lệ_ cho trường hợp sử dụng của mình không?
*
[Algorithm Fairness](https://towardsdatascience.com/what-is-algorithm-fairness-3182e161cf9f) kiểm tra xem thiết kế thuật toán có phân biệt đối xử một cách hệ thống với các nhóm đối tượng dữ liệu cụ thể hay không, dẫn đến [những tổn hại tiềm ẩn](https://docs.microsoft.com/en-us/azure/machine-learning/concept-fairness-ml) trong _phân bổ_ (khi tài nguyên bị từ chối hoặc không được cung cấp cho nhóm đó) và _chất lượng dịch vụ_ (khi AI không chính xác đối với một số nhóm như đối với các nhóm khác).
Các câu hỏi cần khám phá ở đây là:
* Chúng ta đã đánh giá độ chính xác của mô hình đối với các nhóm và điều kiện đa dạng chưa?
* Chúng ta đã xem xét hệ thống để tìm các tổn hại tiềm tàng (ví dụ: định kiến) chưa?
* Chúng ta đã xem xét hệ thống để tìm các tổn hại tiềm ẩn (ví dụ: định kiến) chưa?
* Chúng ta có thể sửa đổi dữ liệu hoặc huấn luyện lại mô hình để giảm thiểu các tổn hại đã xác định không?
Khám phá các tài nguyên như [AI Fairness checklists](https://query.prod.cms.rt.microsoft.com/cms/api/am/binary/RE4t6dA) để tìm hiểu thêm.
@ -169,50 +169,50 @@ Các câu hỏi cần khám phá ở đây là:
### 3. Nghiên cứu tình huống
Để đặt những thách thức đạo đức này vào bối cảnh thực tế, việc xem xét các nghiên cứu tình huống giúp làm nổi bật những tổn hại và hậu quả tiềm tàng đối với cá nhân và xã hội khi các vi phạm đạo đức như vậy bị bỏ qua.
Để đặt những thách thức đạo đức này vào bối cảnh thực tế, việc xem xét các nghiên cứu tình huống giúp làm nổi bật những tổn hại và hậu quả tiềm ẩn đối với cá nhân và xã hội khi các vi phạm đạo đức như vậy bị bỏ qua.
Dưới đây là một vài ví dụ:
| Thách thức đạo đức | Nghiên cứu tình huống |
|--- |--- |
| **Sự đồng ý được thông báo** | 1972 - [Tuskegee Syphilis Study](https://en.wikipedia.org/wiki/Tuskegee_Syphilis_Study) - Những người đàn ông Mỹ gốc Phi tham gia nghiên cứu được hứa hẹn chăm sóc y tế miễn phí _nhưng bị lừa dối_ bởi các nhà nghiên cứu không thông báo cho họ về chẩn đoán hoặc sự sẵn có của phương pháp điều trị. Nhiều người đã chết và đối tác hoặc con cái của họ bị ảnh hưởng; nghiên cứu kéo dài 40 năm. |
| **Quyền riêng tư dữ liệu** | 2007 - [Netflix data prize](https://www.wired.com/2007/12/why-anonymous-data-sometimes-isnt/) cung cấp cho các nhà nghiên cứu _10 triệu xếp hạng phim ẩn danh từ 50 nghìn khách hàng_ để cải thiện thuật toán gợi ý. Tuy nhiên, các nhà nghiên cứu đã có thể liên kết dữ liệu ẩn danh với dữ liệu nhận dạng cá nhân trong _các tập dữ liệu bên ngoài_ (ví dụ: bình luận IMDb) - thực tế "giải ẩn danh" một số người dùng Netflix.|
| **Thiên vị trong thu thập dữ liệu** | 2013 - Thành phố Boston [phát triển Street Bump](https://www.boston.gov/transportation/street-bump), một ứng dụng cho phép công dân báo cáo ổ gà, cung cấp cho thành phố dữ liệu đường xá tốt hơn để tìm và sửa chữa các vấn đề. Tuy nhiên, [những người thuộc nhóm thu nhập thấp ít có quyền truy cập vào ô tô và điện thoại hơn](https://hbr.org/2013/04/the-hidden-biases-in-big-data), khiến các vấn đề đường xá của họ trở nên vô hình trong ứng dụng này. Các nhà phát triển đã làm việc với các học giả để giải quyết _vấn đề tiếp cận công bằng và chia rẽ kỹ thuật số_ nhằm đảm bảo tính công bằng. |
| **Công bằng thuật toán** | 2018 - [Gender Shades Study](http://gendershades.org/overview.html) của MIT đánh giá độ chính xác của các sản phẩm AI phân loại giới tính, phơi bày những khoảng cách về độ chính xác đối với phụ nữ và người da màu. Một [Apple Card năm 2019](https://www.wired.com/story/the-apple-card-didnt-see-genderand-thats-the-problem/) dường như cung cấp ít tín dụng hơn cho phụ nữ so với nam giới. Cả hai đều minh họa các vấn đề về thiên vị thuật toán dẫn đến tổn hại kinh tế xã hội.|
| **Sai lệch thông tin dữ liệu** | 2020 - [Sở Y tế Georgia công bố biểu đồ COVID-19](https://www.vox.com/covid-19-coronavirus-us-response-trump/2020/5/18/21262265/georgia-covid-19-cases-declining-reopening) dường như gây hiểu lầm cho ng dân về xu hướng các ca bệnh được xác nhận với thứ tự không theo thời gian trên trục x. Điều này minh họa sự sai lệch thông tin thông qua các thủ thuật trực quan hóa. |
| **Ảo tưởng về quyền tự do lựa chọn** | 2020 - Ứng dụng học tập [ABCmouse trả 10 triệu USD để giải quyết khiếu nại của FTC](https://www.washingtonpost.com/business/2020/09/04/abcmouse-10-million-ftc-settlement/) i phụ huynh bị mắc kẹt trong việc trả tiền cho các gói đăng ký mà họ không thể hủy bỏ. Điều này minh họa các mô hình tối trong kiến trúc lựa chọn, nơi người dùng bị thúc đẩy đến các lựa chọn có thể gây hại. |
| **Quyền riêng tư dữ liệu & Quyền người dùng** | 2021 - [Facebook Data Breach](https://www.npr.org/2021/04/09/986005820/after-data-breach-exposes-530-million-facebook-says-it-will-not-notify-users) làm lộ dữ liệu của 530 triệu người dùng, dẫn đến khoản bồi thường 5 tỷ USD cho FTC. Tuy nhiên, Facebook từ chối thông báo cho người dùng về vi phạm, vi phạm quyền của người dùng liên quan đến tính minh bạch và quyền truy cập dữ liệu. |
| **Sự đồng thuận có thông tin** | 1972 - [Tuskegee Syphilis Study](https://en.wikipedia.org/wiki/Tuskegee_Syphilis_Study) - Những người đàn ông Mỹ gốc Phi tham gia nghiên cứu được hứa hẹn chăm sóc y tế miễn phí _nhưng bị lừa dối_ bởi các nhà nghiên cứu không thông báo cho họ về chẩn đoán hoặc sự tồn tại của phương pháp điều trị. Nhiều người đã chết và đối tác hoặc con cái của họ bị ảnh hưởng; nghiên cứu kéo dài 40 năm. |
| **Quyền riêng tư dữ liệu** | 2007 - [Giải thưởng dữ liệu Netflix](https://www.wired.com/2007/12/why-anonymous-data-sometimes-isnt/) cung cấp cho các nhà nghiên cứu _10 triệu xếp hạng phim ẩn danh từ 50 nghìn khách hàng_ để cải thiện thuật toán gợi ý. Tuy nhiên, các nhà nghiên cứu đã có thể liên kết dữ liệu ẩn danh với dữ liệu nhận dạng cá nhân trong _các tập dữ liệu bên ngoài_ (ví dụ: bình luận IMDb) - thực tế "giải ẩn danh" một số người dùng Netflix.|
| **Thiên vị trong thu thập dữ liệu** | 2013 - Thành phố Boston [phát triển Street Bump](https://www.boston.gov/transportation/street-bump), một ứng dụng cho phép công dân báo cáo ổ gà, cung cấp cho thành phố dữ liệu đường xá tốt hơn để tìm và sửa chữa các vấn đề. Tuy nhiên, [những người thuộc nhóm thu nhập thấp ít có khả năng sở hữu xe hơi và điện thoại](https://hbr.org/2013/04/the-hidden-biases-in-big-data), khiến các vấn đề đường xá của họ trở nên vô hình trong ứng dụng này. Các nhà phát triển đã làm việc với các học giả để giải quyết _vấn đề tiếp cận công bằng và khoảng cách kỹ thuật số_ nhằm đảm bảo tính công bằng. |
| **Công bằng thuật toán** | 2018 - Nghiên cứu [Gender Shades của MIT](http://gendershades.org/overview.html) đánh giá độ chính xác của các sản phẩm AI phân loại giới tính, phát hiện ra sự chênh lệch về độ chính xác đối với phụ nữ và người da màu. Một [thẻ tín dụng Apple năm 2019](https://www.wired.com/story/the-apple-card-didnt-see-genderand-thats-the-problem/) dường như cung cấp hạn mức tín dụng thấp hơn cho phụ nữ so với nam giới. Cả hai đều minh họa các vấn đề về thiên vị thuật toán dẫn đến tổn hại kinh tế xã hội.|
| **Sai lệch thông tin dữ liệu** | 2020 - [Sở Y tế Georgia công bố biểu đồ COVID-19](https://www.vox.com/covid-19-coronavirus-us-response-trump/2020/5/18/21262265/georgia-covid-19-cases-declining-reopening) dường như gây hiểu lầm cho người dân về xu hướng các ca bệnh được xác nhận với trục x không được sắp xếp theo thứ tự thời gian. Điều này minh họa sự sai lệch thông tin thông qua các thủ thuật trực quan hóa. |
| **Ảo tưởng về quyền tự do lựa chọn** | 2020 - Ứng dụng học tập [ABCmouse trả 10 triệu USD để giải quyết khiếu nại của FTC](https://www.washingtonpost.com/business/2020/09/04/abcmouse-10-million-ftc-settlement/) khi phụ huynh bị mắc kẹt trong việc trả tiền cho các gói đăng ký mà họ không thể hủy bỏ. Điều này minh họa các mô hình tối trong kiến trúc lựa chọn, nơi người dùng bị thúc đẩy đến các lựa chọn có thể gây hại. |
| **Quyền riêng tư dữ liệu & Quyền người dùng** | 2021 - [Rò rỉ dữ liệu Facebook](https://www.npr.org/2021/04/09/986005820/after-data-breach-exposes-530-million-facebook-says-it-will-not-notify-users) làm lộ dữ liệu của 530 triệu người dùng, dẫn đến khoản tiền phạt 5 tỷ USD từ FTC. Tuy nhiên, Facebook từ chối thông báo cho người dùng về vụ rò rỉ, vi phạm quyền của người dùng liên quan đến tính minh bạch và quyền truy cập dữ liệu. |
Muốn khám phá thêm các nghiên cứu tình huống? Hãy xem các tài nguyên sau:
* [Ethics Unwrapped](https://ethicsunwrapped.utexas.edu/case-studies) - các tình huống đạo đức trong nhiều ngành công nghiệp.
* [Khóa học Đạo đức Khoa học Dữ liệu](https://www.coursera.org/learn/data-science-ethics#syllabus) - nghiên cứu các tình huống nổi bật.
* [Ethics Unwrapped](https://ethicsunwrapped.utexas.edu/case-studies) - các tình huống đạo đức trong nhiều ngành công nghiệp khác nhau.
* [Khóa học Đạo đức Khoa học Dữ liệu](https://www.coursera.org/learn/data-science-ethics#syllabus) - các nghiên cứu tình huống nổi bật được khám phá.
* [Những nơi đã xảy ra sai sót](https://deon.drivendata.org/examples/) - danh sách kiểm tra Deon với các ví dụ.
> 🚨 Hãy nghĩ về các nghiên cứu tình huống bạn đã thấy - bạn đã từng trải qua hoặc bị ảnh hưởng bởi một thách thức đạo đức tương tự trong cuộc sống chưa? Bạn có thể nghĩ ra ít nhất một nghiên cứu tình huống khác minh họa một trong những thách thức đạo đức mà chúng ta đã thảo luận trong phần này không?
## Đạo đức ứng dụng
Chúng ta đã nói về các khái niệm đạo đức, thách thức và nghiên cứu tình huống trong bối cảnh thực tế. Nhưng làm thế nào để chúng ta bắt đầu _áp dụng_ các nguyên tắc và thực hành đạo đức vào các dự án của mình? Và làm thế nào để chúng ta _hiện thực hóa_ những thực hành này để cải thiện quản trị? Hãy khám phá một số giải pháp thực tế:
Chúng ta đã nói về các khái niệm đạo đức, thách thức và nghiên cứu tình huống trong bối cảnh thực tế. Nhưng làm thế nào để chúng ta bắt đầu _áp dụng_ các nguyên tắc và thực hành đạo đức vào các dự án của mình? Và làm thế nào để chúng ta _vận hành_ những thực hành này để cải thiện quản trị? Hãy khám phá một số giải pháp thực tế:
### 1. Bộ quy tắc nghề nghiệp
Bộ quy tắc nghề nghiệp cung cấp một lựa chọn cho các tổ chức để "khuyến khích" các thành viên hỗ trợ các nguyên tắc đạo đức và tuyên bố sứ mệnh của họ. Các bộ quy tắc là _hướng dẫn đạo đức_ cho hành vi nghề nghiệp, giúp nhân viên hoặc thành viên đưa ra quyết định phù hợp với các nguyên tắc của tổ chức. Chúng chỉ hiệu quả khi có sự tuân thủ tự nguyện từ các thành viên; tuy nhiên, nhiều tổ chức cung cấp thêm phần thưởng và hình phạt để thúc đẩy sự tuân thủ từ các thành viên.
Các ví dụ bao gồm:
Ví dụ bao gồm:
* [Oxford Munich](http://www.code-of-ethics.org/code-of-conduct/) Bộ quy tắc đạo đức
* [Hiệp hội Khoa học Dữ liệu](http://datascienceassn.org/code-of-conduct.html) Bộ quy tắc ứng xử (được tạo năm 2013)
* [ACM Code of Ethics and Professional Conduct](https://www.acm.org/code-of-ethics) (từ năm 1993)
* [Bộ quy tắc đạo đức và ứng xử nghề nghiệp của ACM](https://www.acm.org/code-of-ethics) (từ năm 1993)
> 🚨 Bạn có thuộc một tổ chức kỹ thuật hoặc khoa học dữ liệu chuyên nghiệp không? Hãy khám phá trang web của họ để xem liệu họ có định nghĩa một bộ quy tắc đạo đức nghề nghiệp không. Điều này nói gì về các nguyên tắc đạo đức của họ? Họ đang "khuyến khích" các thành viên tuân theo bộ quy tắc như thế nào?
### 2. Danh sách kiểm tra đạo đức
Trong khi các bộ quy tắc nghề nghiệp định nghĩa hành vi _đạo đức cần thiết_ từ các nhà thực hành, chúng [có những hạn chế đã biết](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md) trong việc thực thi, đặc biệt trong các dự án quy mô lớn. Thay vào đó, nhiều chuyên gia khoa học dữ liệu [ủng hộ danh sách kiểm tra](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md), có thể **kết nối các nguyên tắc với thực hành** theo cách xác định và có thể hành động hơn.
Trong khi các bộ quy tắc nghề nghiệp định nghĩa hành vi _đạo đức cần thiết_ từ các nhà thực hành, chúng [có những hạn chế đã biết](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md) trong việc thực thi, đặc biệt trong các dự án quy mô lớn. Thay vào đó, nhiều chuyên gia khoa học dữ liệu [ủng hộ danh sách kiểm tra](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md), có thể **kết nối các nguyên tắc với thực hành** theo cách xác định và có thể hành động hơn.
Danh sách kiểm tra chuyển đổi các câu hỏi thành các nhiệm vụ "có/không" có thể hiện thực hóa, cho phép chúng được theo dõi như một phần của quy trình phát hành sản phẩm tiêu chuẩn.
Danh sách kiểm tra chuyển đổi các câu hỏi thành các nhiệm vụ "có/không" có thể được vận hành, cho phép chúng được theo dõi như một phần của quy trình phát hành sản phẩm tiêu chuẩn.
Các ví dụ bao gồm:
Ví dụ bao gồm:
* [Deon](https://deon.drivendata.org/) - danh sách kiểm tra đạo đức dữ liệu đa mục đích được tạo từ [khuyến nghị ngành](https://deon.drivendata.org/#checklist-citations) với công cụ dòng lệnh để tích hợp dễ dàng.
* [Danh sách kiểm tra kiểm toán quyền riêng tư](https://cyber.harvard.edu/ecommerce/privacyaudit.html) - cung cấp hướng dẫn chung về thực hành xử lý thông tin từ góc độ pháp lý và xã hội.
* [Danh sách kiểm tra công bằng AI](https://www.microsoft.com/en-us/research/project/ai-fairness-checklist/) - được tạo bởi các nhà thực hành AI để hỗ trợ việc áp dụng và tích hợp các kiểm tra công bằng vào chu kỳ phát triển AI.
@ -220,37 +220,37 @@ Các ví dụ bao gồm:
### 3. Quy định đạo đức
Đạo đức là về việc định nghĩa các giá trị chung và làm điều đúng _một cách tự nguyện_. **Tuân thủ** là về _tuân theo luật pháp_ nếu và nơi được định nghĩa. **Quản trị** bao quát tất cả các cách mà các tổ chức hoạt động để thực thi các nguyên tắc đạo đức và tuân thủ các luật đã được thiết lập.
Đạo đức là về việc định nghĩa các giá trị chung và làm điều đúng đắn _một cách tự nguyện_. **Tuân thủ** là về _tuân theo luật pháp_ nếu và khi được định nghĩa. **Quản trị** bao gồm tất cả các cách mà các tổ chức hoạt động để thực thi các nguyên tắc đạo đức và tuân thủ các luật đã được thiết lập.
Ngày nay, quản trị có hai hình thức trong các tổ chức. Đầu tiên, đó là việc định nghĩa các nguyên tắc **AI đạo đức** và thiết lập các thực hành để hiện thực hóa việc áp dụng trên tất cả các dự án liên quan đến AI trong tổ chức. Thứ hai, đó là việc tuân thủ tất cả các quy định **bảo vệ dữ liệu** do chính phủ quy định cho các khu vực mà tổ chức hoạt động.
Ngày nay, quản trị có hai hình thức trong các tổ chức. Đầu tiên, đó là việc định nghĩa các nguyên tắc **AI đạo đức** và thiết lập các thực hành để vận hành việc áp dụng trên tất cả các dự án liên quan đến AI trong tổ chức. Thứ hai, đó là việc tuân thủ tất cả các quy định **bảo vệ dữ liệu** do chính phủ quy định cho các khu vực mà tổ chức hoạt động.
Các ví dụ về quy định bảo vệ dữ liệu và quyền riêng tư:
Ví dụ về các quy định bảo vệ dữ liệu và quyền riêng tư:
* `1974`, [US Privacy Act](https://www.justice.gov/opcl/privacy-act-1974) - quy định việc thu thập, sử dụng và tiết lộ thông tin cá nhân của _chính phủ liên bang_.
* `1996`, [US Health Insurance Portability & Accountability Act (HIPAA)](https://www.cdc.gov/phlp/publications/topic/hipaa.html) - bảo vệ dữ liệu sức khỏe cá nhân.
* `1998`, [US Children's Online Privacy Protection Act (COPPA)](https://www.ftc.gov/enforcement/rules/rulemaking-regulatory-reform-proceedings/childrens-online-privacy-protection-rule) - bảo vệ quyền riêng tư dữ liệu của trẻ em dưới 13 tuổi.
* `2018`, [General Data Protection Regulation (GDPR)](https://gdpr-info.eu/) - cung cấp quyền người dùng, bảo vệ dữ liệu và quyền riêng tư.
* `2018`, [California Consumer Privacy Act (CCPA)](https://www.oag.ca.gov/privacy/ccpa) cung cấp cho người tiêu dùng nhiều _quyền_ hơn đối với dữ liệu (cá nhân) của họ.
* `1974`, [Đạo luật Quyền riêng tư của Hoa Kỳ](https://www.justice.gov/opcl/privacy-act-1974) - quy định việc thu thập, sử dụng và tiết lộ thông tin cá nhân của _chính phủ liên bang_.
* `1996`, [Đạo luật Bảo mật và Khả năng Chuyển đổi Bảo hiểm Y tế của Hoa Kỳ (HIPAA)](https://www.cdc.gov/phlp/publications/topic/hipaa.html) - bảo vệ dữ liệu sức khỏe cá nhân.
* `1998`, [Đạo luật Bảo vệ Quyền riêng tư Trẻ em Trực tuyến của Hoa Kỳ (COPPA)](https://www.ftc.gov/enforcement/rules/rulemaking-regulatory-reform-proceedings/childrens-online-privacy-protection-rule) - bảo vệ quyền riêng tư dữ liệu của trẻ em dưới 13 tuổi.
* `2018`, [Quy định Bảo vệ Dữ liệu Chung (GDPR)](https://gdpr-info.eu/) - cung cấp quyền người dùng, bảo vệ dữ liệu và quyền riêng tư.
* `2018`, [Đạo luật Quyền riêng tư Người tiêu dùng California (CCPA)](https://www.oag.ca.gov/privacy/ccpa) cung cấp cho người tiêu dùng nhiều _quyền_ hơn đối với dữ liệu (cá nhân) của họ.
* `2021`, [Luật Bảo vệ Thông tin Cá nhân của Trung Quốc](https://www.reuters.com/world/china/china-passes-new-personal-data-privacy-law-take-effect-nov-1-2021-08-20/) vừa được thông qua, tạo ra một trong những quy định bảo vệ quyền riêng tư dữ liệu trực tuyến mạnh nhất trên toàn thế giới.
> 🚨 Liên minh châu Âu đã định nghĩa GDPR (Quy định Bảo vệ Dữ liệu Chung) vẫn là một trong những quy định bảo vệ quyền riêng tư dữ liệu có ảnh hưởng nhất hiện nay. Bạn có biết rằng nó cũng định nghĩa [8 quyền người dùng](https://www.freeprivacypolicy.com/blog/8-user-rights-gdpr) để bảo vệ quyền riêng tư kỹ thuật số và dữ liệu cá nhân của công dân không? Tìm hiểu về những quyền này và tại sao chúng lại quan trọng.
> 🚨 Liên minh Châu Âu đã định nghĩa GDPR (Quy định Bảo vệ Dữ liệu Chung), một trong những quy định bảo vệ quyền riêng tư dữ liệu có ảnh hưởng nhất hiện nay. Bạn có biết rằng nó cũng định nghĩa [8 quyền người dùng](https://www.freeprivacypolicy.com/blog/8-user-rights-gdpr) để bảo vệ quyền riêng tư kỹ thuật số và dữ liệu cá nhân của công dân không? Hãy tìm hiểu về những quyền này và tại sao chúng lại quan trọng.
### 4. Văn hóa đạo đức
Lưu ý rằng vẫn còn một khoảng cách vô hình giữa _tuân thủ_ (làm đủ để đáp ứng "tinh thần của luật pháp") và giải quyết [các vấn đề hệ thống](https://www.coursera.org/learn/data-science-ethics/home/week/4) (như sự cứng nhắc, bất đối xứng thông tin và sự không công bằng trong phân phối) có thể đẩy nhanh việc vũ khí hóa AI.
Lưu ý rằng vẫn còn một khoảng cách vô hình giữa _tuân thủ_ (làm đủ để đáp ứng "tinh thần của luật pháp") và giải quyết [các vấn đề hệ thống](https://www.coursera.org/learn/data-science-ethics/home/week/4) (như sự cứng nhắc, bất cân xứng thông tin và sự không công bằng trong phân phối) có thể đẩy nhanh việc vũ khí hóa AI.
Điều này đòi hỏi [các cách tiếp cận hợp tác để định nghĩa văn hóa đạo đức](https://towardsdatascience.com/why-ai-ethics-requires-a-culture-driven-approach-26f451afa29f) nhằm xây dựng kết nối cảm xúc và các giá trị chung nhất quán _trong các tổ chức_ trong ngành. Điều này kêu gọi [văn hóa đạo đức dữ liệu được chính thức hóa](https://www.codeforamerica.org/news/formalizing-an-ethical-data-culture/) trong các tổ chức - cho phép _bất kỳ ai_ [kéo dây Andon](https://en.wikipedia.org/wiki/Andon_(manufacturing)) (để nêu lên các mối quan ngại về đạo đức sớm trong quy trình) và làm cho _đánh giá đạo đức_ (ví dụ: trong tuyển dụng) trở thành tiêu chí cốt lõi trong việc hình thành nhóm cho các dự án AI.
Điều này đòi hỏi [các cách tiếp cận hợp tác để định nghĩa văn hóa đạo đức](https://towardsdatascience.com/why-ai-ethics-requires-a-culture-driven-approach-26f451afa29f) nhằm xây dựng các kết nối cảm xúc và giá trị chung nhất quán _trong các tổ chức_ trong ngành. Điều này kêu gọi [văn hóa đạo đức dữ liệu được chính thức hóa hơn](https://www.codeforamerica.org/news/formalizing-an-ethical-data-culture/) trong các tổ chức - cho phép _bất kỳ ai_ [kéo dây Andon](https://en.wikipedia.org/wiki/Andon_(manufacturing)) (để nêu lên các mối quan ngại về đạo đức sớm trong quy trình) và làm cho _đánh giá đạo đức_ (ví dụ: trong tuyển dụng) trở thành tiêu chí cốt lõi trong việc hình thành đội ngũ cho các dự án AI.
---
## [Câu hỏi kiểm tra sau bài giảng](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/3) 🎯
## [Câu hỏi kiểm tra sau bài giảng](https://ff-quizzes.netlify.app/en/ds/) 🎯
## Ôn tập & Tự học
Các khóa học và sách giúp hiểu các khái niệm đạo đức cốt lõi và thách thức, trong khi các nghiên cứu tình huống và công cụ giúp thực hành đạo đức trong bối cảnh thực tế. Dưới đây là một vài tài nguyên để bắt đầu.
* [Machine Learning For Beginners](https://github.com/microsoft/ML-For-Beginners/blob/main/1-Introduction/3-fairness/README.md) - bài học về Công bằng, từ Microsoft.
* [Nguyên tắc AI có trách nhiệm](https://docs.microsoft.com/en-us/learn/modules/responsible-ai-principles/) - lộ trình học miễn phí từ Microsoft Learn.
* [Đạo đức và Khoa học Dữ liệu](https://resources.oreilly.com/examples/0636920203964) - Sách điện tử O'Reilly (M. Loukides, H. Mason và các tác giả khác).
* [Đạo đức trong Khoa học Dữ liệu](https://www.coursera.org/learn/data-science-ethics#syllabus) - khóa học trực tuyến từ Đại học Michigan.
* [Đạo đức và Khoa học Dữ liệu](https://resources.oreilly.com/examples/0636920203964) - Sách điện tử O'Reilly (M. Loukides, H. Mason và cộng sự).
* [Đạo đức Khoa học Dữ liệu](https://www.coursera.org/learn/data-science-ethics#syllabus) - khóa học trực tuyến từ Đại học Michigan.
* [Ethics Unwrapped](https://ethicsunwrapped.utexas.edu/case-studies) - các nghiên cứu tình huống từ Đại học Texas.
# Bài tập
@ -260,4 +260,4 @@ Các khóa học và sách giúp hiểu các khái niệm đạo đức cốt l
---
**Tuyên bố miễn trừ trách nhiệm**:
Tài liệu này đã được dịch bằng dịch vụ dịch thuật AI [Co-op Translator](https://github.com/Azure/co-op-translator). Mặc dù chúng tôi cố gắng đảm bảo độ chính xác, xin lưu ý rằng các bản dịch tự động có thể chứa lỗi hoặc không chính xác. Tài liệu gốc bằng ngôn ngữ bản địa nên được coi là nguồn thông tin chính thức. Đối với các thông tin quan trọng, khuyến nghị sử dụng dịch vụ dịch thuật chuyên nghiệp bởi con người. Chúng tôi không chịu trách nhiệm cho bất kỳ sự hiểu lầm hoặc diễn giải sai nào phát sinh từ việc sử dụng bản dịch này.
Tài liệu này đã được dịch bằng dịch vụ dịch thuật AI [Co-op Translator](https://github.com/Azure/co-op-translator). Mặc dù chúng tôi cố gắng đảm bảo độ chính xác, xin lưu ý rằng các bản dịch tự động có thể chứa lỗi hoặc không chính xác. Tài liệu gốc bằng ngôn ngữ bản địa nên được coi là nguồn thông tin chính thức. Đối với các thông tin quan trọng, khuyến nghị sử dụng dịch vụ dịch thuật chuyên nghiệp từ con người. Chúng tôi không chịu trách nhiệm cho bất kỳ sự hiểu lầm hoặc diễn giải sai nào phát sinh từ việc sử dụng bản dịch này.

@ -1,8 +1,8 @@
<!--
CO_OP_TRANSLATOR_METADATA:
{
"original_hash": "8796f41f566a0a8ebb72863a83d558ed",
"translation_date": "2025-08-25T16:38:44+00:00",
"original_hash": "3a34157cc63516eba97c89a0b2f8c3e6",
"translation_date": "2025-09-03T20:58:01+00:00",
"source_file": "1-Introduction/02-ethics/README.md",
"language_code": "zh"
}
@ -17,13 +17,13 @@ CO_OP_TRANSLATOR_METADATA:
我们都是生活在数据化世界中的数据公民。
市场趋势表明到2022年三分之一的大型组织将通过在线[市场和交易所](https://www.gartner.com/smarterwithgartner/gartner-top-10-trends-in-data-and-analytics-for-2020/)买卖数据。作为**应用开发者**,我们会发现将数据驱动的洞察和算法驱动的自动化集成到日常用户体验中变得更加容易和便宜。但随着人工智能的普及,我们也需要了解这种算法在大规模应用时可能带来的[武器化](https://www.youtube.com/watch?v=TQHs8SA1qpk)潜在危害。
市场趋势表明到2022年每三个大型组织中就有一个会通过在线[市场和交易所](https://www.gartner.com/smarterwithgartner/gartner-top-10-trends-in-data-and-analytics-for-2020/)买卖数据。作为**应用开发者**,我们会发现将数据驱动的洞察和算法驱动的自动化集成到日常用户体验中变得更加容易和便宜。但随着人工智能的普及,我们也需要了解这种算法在大规模应用时可能带来的[武器化](https://www.youtube.com/watch?v=TQHs8SA1qpk)潜在危害。
趋势还表明到2025年我们将创造和消费超过[180泽字节](https://www.statista.com/statistics/871513/worldwide-data-created/)的数据。作为**数据科学家**,这使我们能够前所未有地访问个人数据。这意味着我们可以构建用户行为档案,并以某种方式影响决策,创造一种[自由选择的幻觉](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice),同时可能引导用户朝着我们偏好的结果发展。这也引发了关于数据隐私和用户保护的更广泛问题。
趋势还表明到2025年我们将创造和消费超过[180泽字节](https://www.statista.com/statistics/871513/worldwide-data-created/)的数据。作为**数据科学家**,这使我们能够前所未有地访问个人数据。这意味着我们可以构建用户行为画像,并以某种方式影响决策,创造一种[自由选择的幻觉](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice),同时可能将用户引导至我们偏好的结果。这也引发了关于数据隐私和用户保护的更广泛问题。
数据伦理现在是数据科学和工程的_必要护栏_帮助我们尽量减少数据驱动行为可能带来的潜在危害和意外后果。[Gartner人工智能技术成熟度曲线](https://www.gartner.com/smarterwithgartner/2-megatrends-dominate-the-gartner-hype-cycle-for-artificial-intelligence-2020/)将数字伦理、负责任的人工智能和人工智能治理作为推动人工智能_民主化_和_工业化_的关键趋势
数据伦理现在是数据科学和工程的_必要护栏_帮助我们尽量减少数据驱动行为可能带来的潜在危害和意外后果。[Gartner人工智能技术成熟度曲线](https://www.gartner.com/smarterwithgartner/2-megatrends-dominate-the-gartner-hype-cycle-for-artificial-intelligence-2020/)将数字伦理、负责任的人工智能和人工智能治理作为推动人工智能_民主化_和_工业化_的关键驱动因素
![Gartner人工智能技术成熟度曲线 - 2020](https://images-cdn.newscred.com/Zz1mOWJhNzlkNDA2ZTMxMWViYjRiOGFiM2IyMjQ1YmMwZQ==)
![Gartner人工智能技术成熟度曲线 - 2020](https://images-cdn.newscred.com/Zz1mOWJhNzlkNDA2ZTMxMWViYjRiOGFiM2IyMjQ1YmMwZQ==)
在本课程中,我们将探索数据伦理这一迷人的领域——从核心概念和挑战,到案例研究和应用人工智能概念(如治理),帮助团队和组织建立数据和人工智能的伦理文化。
@ -35,13 +35,13 @@ CO_OP_TRANSLATOR_METADATA:
“伦理”一词来源于[希腊词“ethikos”](https://en.wikipedia.org/wiki/Ethics)及其词根“ethos”意为_品格或道德本质_。
**伦理**是关于在社会中规范我们行为的共同价值观和道德原则。伦理不是基于法律,而是基于广泛接受的“对与错”的规范。然而,伦理考虑可以影响企业治理举措和政府法规,从而创造更多的合规激励。
**伦理**是关于在社会中规范我们行为的共同价值观和道德原则。伦理不是基于法律,而是基于广泛接受的“对与错”的规范。然而,伦理考虑可以影响公司治理举措和政府法规,从而创造更多的合规激励。
**数据伦理**是一个[新的伦理分支](https://royalsocietypublishing.org/doi/full/10.1098/rsta.2016.0360#sec-1)研究和评估与_数据、算法及相关实践_相关的道德问题。在这里**“数据”**关注与生成、记录、管理、处理、传播、共享和使用相关的行为,**“算法”**关注人工智能、代理、机器学习和机器人,**“实践”**关注负责任的创新、编程、黑客行为和伦理规范等主题。
**数据伦理**是一个[新的伦理分支](https://royalsocietypublishing.org/doi/full/10.1098/rsta.2016.0360#sec-1)它“研究和评估与_数据、算法及相关实践_相关的道德问题”。其中**“数据”**关注与生成、记录、管理、处理、传播、共享和使用相关的行为,**“算法”**关注人工智能、代理、机器学习和机器人,**“实践”**关注负责任的创新、编程、黑客行为和伦理规范等主题。
**应用伦理**是[道德考虑的实际应用](https://en.wikipedia.org/wiki/Applied_ethics)。它是积极调查_现实世界行为、产品和流程_中的伦理问题并采取纠正措施以确保这些行为与我们定义的伦理价值保持一致的过程。
**伦理文化**是关于[_将应用伦理付诸实践_](https://hbr.org/2019/05/how-to-design-an-ethical-organization),确保我们的伦理原则和实践在整个组织中以一致且可扩展的方式被采。成功的伦理文化定义了全组织范围的伦理原则,提供有意义的合规激励,并通过鼓励和放大组织各级的期望行为来强化伦理规范。
**伦理文化**是关于[_将应用伦理付诸实践_](https://hbr.org/2019/05/how-to-design-an-ethical-organization),确保我们的伦理原则和实践在整个组织中以一致且可扩展的方式被采。成功的伦理文化定义了全组织范围的伦理原则,提供有意义的合规激励,并通过鼓励和放大组织各级的期望行为来强化伦理规范。
## 伦理概念
@ -49,15 +49,15 @@ CO_OP_TRANSLATOR_METADATA:
### 1. 伦理原则
每个数据伦理策略都从定义_伦理原则_开始——这些“共同价值观”描述了可接受的行为并指导我们在数据和人工智能项目中的合规行动。您可以在个人或团队层面定义这些原则。然而大多数大型组织会在企业层面定义一个_伦理人工智能_使命声明或框架并在所有团队中一致执行。
每个数据伦理策略都从定义_伦理原则_开始——这些“共同价值观”描述了可接受的行为并指导我们在数据和人工智能项目中的合规行动。您可以在个人或团队层面定义这些原则。然而大多数大型组织会在公司层面定义一个_伦理人工智能_使命声明或框架并在所有团队中一致执行。
**示例:**微软的[负责任的人工智能](https://www.microsoft.com/en-us/ai/responsible-ai)使命声明写道_“我们致力于推动以伦理原则为驱动的人工智能发展将人放在首位”_并在以下框架中定义了6个伦理原则
**示例:**微软的[负责任的人工智能](https://www.microsoft.com/en-us/ai/responsible-ai)使命声明写道_“我们致力于推动以伦理原则为驱动的人工智能发展这些原则以人为本”_并在以下框架中定义了6个伦理原则
![微软的负责任人工智能](https://docs.microsoft.com/en-gb/azure/cognitive-services/personalizer/media/ethics-and-responsible-use/ai-values-future-computed.png)
让我们简要探讨这些原则。_透明性_和_问责性_是其他原则的基础价值观因此我们从这里开始
* [**问责性**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6)使从业者对其数据和人工智能操作以及遵守这些伦理原则负责。
* [**问责性**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6)使实践者对其数据和人工智能操作以及对这些伦理原则的合规性负责。
* [**透明性**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6)确保数据和人工智能行为对用户是_可理解的_可解释的解释决策背后的内容和原因。
* [**公平性**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1%3aprimaryr6)——关注确保人工智能对_所有人_公平对待解决数据和系统中的任何系统性或隐性社会技术偏见。
* [**可靠性与安全性**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6)——确保人工智能行为与定义的价值观_一致_尽量减少潜在危害或意外后果。
@ -72,7 +72,7 @@ CO_OP_TRANSLATOR_METADATA:
在数据收集方面,行为可能涉及**个人数据**或可识别的个人信息PII这些信息可以识别特定的活体个体。这包括[各种非个人数据](https://ec.europa.eu/info/law/law-topic/data-protection/reform/what-personal-data_en)这些数据_共同_可以识别一个个体。伦理挑战可能涉及_数据隐私_、_数据所有权_以及相关主题如_知情同意_和用户的_知识产权_。
在算法设计方面,行为将涉及收集和管理**数据集**,然后使用它们训练和部署**数据模型**以在现实世界中预测结果或自动化决策。伦理挑战可能源于_数据集偏差_、_数据质量_问题、_不公平性_以及算法中的_误导性_——包括一些系统性问题。
在算法设计方面,行为将涉及收集和管理**数据集**,然后使用它们训练和部署**数据模型**以在现实世界中预测结果或自动化决策。伦理挑战可能源于_数据集偏差_、_数据质量_问题、_不公平性_以及算法中的_误导性_包括一些系统性问题。
在这两种情况下,伦理挑战都突显了我们的行为可能与共同价值观发生冲突的领域。为了检测、缓解、最小化或消除这些问题,我们需要针对我们的行为提出道德“是/否”问题,然后根据需要采取纠正措施。让我们看看一些伦理挑战及其引发的道德问题:
@ -80,14 +80,14 @@ CO_OP_TRANSLATOR_METADATA:
数据收集通常涉及可以识别数据主体的个人数据。[数据所有权](https://permission.io/blog/data-ownership)是关于与数据的创建、处理和传播相关的_控制_和[_用户权利_](https://permission.io/blog/data-ownership)。
我们需要提出的道德问题是
需要提出的道德问题包括
* 谁拥有数据?(用户还是组织)
* 数据主体拥有哪些权利?(例如:访问、删除、可移植性)
* 数据主体拥有哪些权利?(例如:访问、删除、数据可移植性)
* 组织拥有哪些权利?(例如:纠正恶意用户评论)
#### 2.2 知情同意
[知情同意](https://legaldictionary.net/informed-consent/)定义了用户在_充分了解_相关事实(包括目的、潜在风险和替代方案)的情况下同意某项行为(如数据收集)的行为。
[知情同意](https://legaldictionary.net/informed-consent/)定义了用户在充分了解相关事实(包括目的、潜在风险和替代方案)的情况下同意某项行为(如数据收集)的行为。
需要探讨的问题包括:
* 用户(数据主体)是否允许数据的捕获和使用?
@ -109,14 +109,14 @@ CO_OP_TRANSLATOR_METADATA:
[数据隐私](https://www.northeastern.edu/graduate/blog/what-is-data-privacy/)或信息隐私指的是在涉及个人可识别信息时保护用户隐私和身份。
需要探讨的问题包括:
* 用户的(个人)数据是否安全,防止黑客攻击和泄漏?
* 用户的(个人)数据是否免受黑客攻击和泄漏?
* 用户的数据是否仅对授权用户和场景可访问?
* 在数据共享或传播时,用户的匿名性是否得到保护
* 用户是否可以从匿名数据集中被识别?
* 数据共享或传播时是否保留用户的匿名性
* 用户是否可以从匿名数据集中被重新识别?
#### 2.5 被遗忘权
[被遗忘权](https://en.wikipedia.org/wiki/Right_to_be_forgotten)或[删除权](https://www.gdpreu.org/right-to-be-forgotten/)为用户提供了额外的个人数据保护。具体来说,它允许用户在特定情况下请求删除或移除个人数据,从而在网上获得新的开始,不受过去行为的影响。
[被遗忘权](https://en.wikipedia.org/wiki/Right_to_be_forgotten)或[删除权](https://www.gdpreu.org/right-to-be-forgotten/)为用户提供了额外的个人数据保护。具体来说,它允许用户在特定情况下请求删除或移除个人数据,从而在网上获得新的开始,不再因过去的行为而受到影响。
需要探讨的问题包括:
* 系统是否允许数据主体请求删除?
@ -126,46 +126,46 @@ CO_OP_TRANSLATOR_METADATA:
#### 2.6 数据集偏差
数据集或[收集偏差](http://researcharticles.com/index.php/bias-in-data-collection-in-research/)是指为算法开发选择了一个_非代表性_的数据子集从而在结果中对不同群体可能造成不公平。偏差类型包括选择或抽样偏差、志愿者偏差和工具偏差。
数据集或[收集偏差](http://researcharticles.com/index.php/bias-in-data-collection-in-research/)是指为算法开发选择了一个_非代表性_的数据子集从而可能对不同群体的结果产生不公平影响。偏差类型包括选择或抽样偏差、志愿者偏差和工具偏差。
需要探讨的问题包括:
* 我们是否招募了一个具有代表性的数据主体集合?
* 我们是否测试了收集或管理的数据集以发现各种偏差?
* 我们是否可以缓解或消除发现的任何偏差?
* 我们是否可以缓解或消除发现的偏差?
#### 2.7 数据质量
[数据质量](https://lakefs.io/data-quality-testing/)关注用于开发算法的数据集的有效性,检查特征和记录是否满足人工智能目的所需的准确性和一致性要求。
[数据质量](https://lakefs.io/data-quality-testing/)关注用于开发算法的管理数据集的有效性,检查特征和记录是否满足人工智能目的所需的准确性和一致性要求。
需要探讨的问题包括:
* 我们是否捕获了适合我们用例的有效_特征_
* 数据是否在不同数据源之间_一致_地捕获
* 数据集是否_完整_涵盖了不同条件或场景
* 捕获的信息是否_准确_反映了现实
* 捕获的信息是否_准确_反映了现实?
#### 2.8 算法公平性
[算法公平性](https://towardsdatascience.com/what-is-algorithm-fairness-3182e161cf9f)旨在检查算法设计是否系统性地对特定数据主体的子群体存在歧视,从而导致在资源分配(即资源被拒绝或扣留)和服务质量(即人工智能对某些子群体的准确性不如对其他群体)方面的[潜在危害](https://docs.microsoft.com/en-us/azure/machine-learning/concept-fairness-ml)。
需要探讨的问题包括:
* 我们是否评估了模型在不同子群体和条件下的准确性?
* 我们是否仔细审查了系统可能带来的潜在危害(例如刻板印象)?
* 我们是否仔细审查了系统可能带来的潜在危害(例如刻板印象)?
* 我们是否可以通过修订数据或重新训练模型来减轻已识别的危害?
可以探索诸如[AI公平性检查](https://query.prod.cms.rt.microsoft.com/cms/api/am/binary/RE4t6dA)等资源以了解更多信息。
可以探索诸如[AI公平性检查清单](https://query.prod.cms.rt.microsoft.com/cms/api/am/binary/RE4t6dA)等资源以了解更多信息。
#### 2.9 数据误导
[数据误导](https://www.sciencedirect.com/topics/computer-science/misrepresentation)关注我们是否通过诚实报告的数据传递洞察,但以欺骗性方式支持某种期望的叙述。
[数据误导](https://www.sciencedirect.com/topics/computer-science/misrepresentation)是指我们是否通过对诚实报告的数据进行欺骗性解读来支持某种预期叙述。
需要探讨的问题包括:
* 我们是否报告了不完整或不准确的数据?
* 我们是否以误导性结论的方式可视化数据?
* 我们是否使用选择性统计技术操纵结果?
* 是否存在可能提供不同结论的替代解释
* 我们是否以误导性方式可视化数据以得出错误结论
* 我们是否使用选择性统计技术操纵结果?
* 是否存在其他解释可能提供不同结论?
#### 2.10 自由选择
#### 2.10 自由选择的假象
[自由选择的幻觉](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice)发生在系统的“选择架构”使用决策算法引导人们采取偏好的结果,同时看似给予他们选择和控制权。这些[暗模式](https://www.darkpatterns.org/)可能对用户造成社会和经济上的伤害。由于用户的决策会影响行为画像,这些行为可能驱动未来的选择,从而放大或延续这些伤害的影响。
[自由选择的假象](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice)发生在系统的“选择架构”使用决策算法引导人们采取偏好的结果,同时看似给予他们选择和控制权。这些[暗模式](https://www.darkpatterns.org/)可能对用户造成社会和经济上的伤害。由于用户的决策会影响行为画像,这些行为可能驱动未来的选择,从而放大或延续这些伤害的影响。
需要探讨的问题包括:
* 用户是否理解做出该选择的影响?
@ -174,24 +174,24 @@ CO_OP_TRANSLATOR_METADATA:
### 3. 案例研究
为了将这些伦理挑战置于现实世界的背景中,可以查看一些案例研究,这些研究突出了忽视伦理问题时对个人和社会可能造成的潜在危害和后果。
为了将这些伦理挑战置于现实世界的背景中,可以查看一些案例研究,这些研究突出了忽视伦理问题时对个人和社会可能造成的潜在危害和后果。
以下是一些示例:
| 伦理挑战 | 案例研究 |
|--- |--- |
| **知情同意** | 1972年 - [塔斯基吉梅毒研究](https://en.wikipedia.org/wiki/Tuskegee_Syphilis_Study) - 参与研究的非裔美国男性被承诺提供免费医疗服务但研究人员欺骗了他们没有告知他们的诊断或治疗的可用性。许多受试者死亡其伴侣或子女受到影响研究持续了40年。 |
| **数据隐私** | 2007年 - [Netflix数据奖](https://www.wired.com/2007/12/why-anonymous-data-sometimes-isnt/)向研究人员提供了_来自5万客户的1000万匿名电影评分_以帮助改进推荐算法。然而研究人员能够将匿名数据与_外部数据集_例如IMDb评论中的个人身份数据相关联从而有效地“去匿名化”了一些Netflix订阅者。|
| **数据收集偏差** | 2013年 - 波士顿市[开发了Street Bump](https://www.boston.gov/transportation/street-bump),一个让市民报告路面坑洞的应用,为城市提供更好的道路数据以发现和解决问题。然而,[低收入群体的人们较少拥有汽车和手机](https://hbr.org/2013/04/the-hidden-biases-in-big-data)使得他们的道路问题在该应用中不可见。开发人员与学术界合作解决_公平访问和数字鸿沟_问题。 |
| **知情同意** | 1972年 - [塔斯基吉梅毒研究](https://en.wikipedia.org/wiki/Tuskegee_Syphilis_Study) - 参与研究的非裔美国男性被承诺提供免费医疗服务,但研究人员欺骗了他们,没有告知他们的诊断或治疗的可用性。许多受试者死亡,其伴侣或子女受到影响研究持续了40年。 |
| **数据隐私** | 2007年 - [Netflix数据奖](https://www.wired.com/2007/12/why-anonymous-data-sometimes-isnt/)向研究人员提供了_来自5万客户的1000万匿名电影评分_以帮助改进推荐算法。然而研究人员能够将匿名数据与_外部数据集_例如IMDb评论中的个人身份数据相关联从而有效地“去匿名化”了一些Netflix订阅者。|
| **数据收集偏差** | 2013年 - 波士顿市[开发了Street Bump](https://www.boston.gov/transportation/street-bump),一款让市民报告路面坑洞的应用程序,为城市提供更好的道路数据以发现和解决问题。然而,[低收入群体的人们较少拥有汽车和手机](https://hbr.org/2013/04/the-hidden-biases-in-big-data),使得他们的道路问题在该应用程序中不可见。开发人员与学术界合作解决_公平访问和数字鸿沟_问题。|
| **算法公平性** | 2018年 - MIT [Gender Shades研究](http://gendershades.org/overview.html)评估了性别分类AI产品的准确性揭示了对女性和有色人种的准确性差距。[2019年Apple Card](https://www.wired.com/story/the-apple-card-didnt-see-genderand-thats-the-problem/)似乎为女性提供的信用额度低于男性。这两者都说明了算法偏差导致的社会经济危害问题。|
| **数据误导** | 2020年 - [乔治亚州公共卫生部发布的COVID-19图表](https://www.vox.com/covid-19-coronavirus-us-response-trump/2020/5/18/21262265/georgia-covid-19-cases-declining-reopening)通过非时间顺序的x轴排序误导了公民关于确诊病例趋势的认知。这说明了通过可视化技巧进行误导的情况。 |
| **自由选择的幻觉** | 2020年 - 学习应用[ABCmouse支付了1000万美元以解决FTC投诉](https://www.washingtonpost.com/business/2020/09/04/abcmouse-10-million-ftc-settlement/),家长被困于无法取消的订阅费用中。这说明了选择架构中的暗模式,用户被引导做出可能有害的选择。 |
| **数据隐私与用户权利** | 2021年 - Facebook [数据泄露](https://www.npr.org/2021/04/09/986005820/after-data-breach-exposes-530-million-facebook-says-it-will-not-notify-users)暴露了5.3亿用户的数据导致向FTC支付了50亿美元的和解金。然而它拒绝通知用户数据泄露情况,侵犯了用户关于数据透明度和访问的权利。 |
| **数据误导** | 2020年 - [乔治亚州公共卫生部发布的COVID-19图表](https://www.vox.com/covid-19-coronavirus-us-response-trump/2020/5/18/21262265/georgia-covid-19-cases-declining-reopening)似乎通过非时间顺序的x轴排序误导了公民关于确诊病例趋势的信息。这说明了通过可视化技巧进行数据误导。|
| **自由选择的假象** | 2020年 - 学习应用[ABCmouse支付了1000万美元以解决FTC投诉](https://www.washingtonpost.com/business/2020/09/04/abcmouse-10-million-ftc-settlement),家长被迫支付无法取消的订阅费用。这说明了选择架构中的暗模式,用户被引导做出可能有害的选择。|
| **数据隐私与用户权利** | 2021年 - Facebook [数据泄露](https://www.npr.org/2021/04/09/986005820/after-data-breach-exposes-530-million-facebook-says-it-will-not-notify-users)暴露了5.3亿用户的数据导致向FTC支付了50亿美元的和解金。然而它拒绝通知用户数据泄露事件,侵犯了用户关于数据透明度和访问的权利。|
想要探索更多案例研究?可以查看以下资源:
想要探索更多案例研究?查看以下资源:
* [Ethics Unwrapped](https://ethicsunwrapped.utexas.edu/case-studies) - 涉及多个行业的伦理困境。
* [数据科学伦理课程](https://www.coursera.org/learn/data-science-ethics#syllabus) - 探讨标志性案例研究。
* [问题案例](https://deon.drivendata.org/examples/) - Deon检查表中的示例。
* [问题案例](https://deon.drivendata.org/examples/) - Deon清单中的示例。
> 🚨 回想你看到的案例研究——你是否经历过或受到类似伦理挑战的影响?你能想到至少一个其他案例研究来说明我们在本节中讨论的伦理挑战吗?
@ -201,59 +201,59 @@ CO_OP_TRANSLATOR_METADATA:
### 1. 专业准则
专业准则为组织提供了一种选择用以“激励”成员支持其伦理原则和使命声明。准则是专业行为的_道德指南_帮助员工或成员做出符合组织原则的决策。它的效果取决于成员的自愿遵守;然而,许多组织提供额外的奖励和惩罚以激励成员遵守。
专业准则为组织提供了一种选择用以“激励”成员支持其伦理原则和使命声明。准则是专业行为的_道德指南_帮助员工或成员做出符合组织原则的决策。它们的有效性取决于成员的自愿遵守;然而,许多组织提供额外的奖励和惩罚以激励成员遵守。
示例包括:
* [Oxford Munich](http://www.code-of-ethics.org/code-of-conduct/)伦理准则
* [数据科学协会](http://datascienceassn.org/code-of-conduct.html)行为准则创建于2013年
* [ACM伦理准则与专业行为准则](https://www.acm.org/code-of-ethics)自1993年起
* [ACM伦理与专业行为准则](https://www.acm.org/code-of-ethics)自1993年起
> 🚨 你是否属于某个专业工程或数据科学组织?探索他们的网站,看看是否定义了专业伦理准则。这些准则说明了他们的伦理原则是什么?他们如何“激励”成员遵守准则?
### 2. 伦理检查表
### 2. 伦理清单
虽然专业准则定义了从业者所需的_伦理行为_但它们在执行方面[存在已知的局限性](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md),特别是在大型项目中。因此,许多数据科学专家[提倡使用检查表](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md),以**将原则与实践连接**,使其更具确定性和可操作性。
虽然专业准则定义了从业者所需的_伦理行为_但它们在执行方面[存在已知的局限性](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md),特别是在大型项目中。因此,许多数据科学专家[提倡使用清单](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md),以**将原则与实践连接**,使其更具确定性和可操作性。
检查表将问题转化为“是/否”任务,可以被操作化,允许它们作为标准产品发布工作流程的一部分进行跟踪。
清单将问题转化为“是/否”任务,可以被操作化,允许它们作为标准产品发布工作流程的一部分进行跟踪。
示例包括:
* [Deon](https://deon.drivendata.org/) - 一个通用的数据伦理检查表,由[行业建议](https://deon.drivendata.org/#checklist-citations)创建,并配备命令行工具以便于集成。
* [隐私审计检查表](https://cyber.harvard.edu/ecommerce/privacyaudit.html) - 从法律和社会曝光角度提供信息处理实践的一般指导。
* [AI公平性检查表](https://www.microsoft.com/en-us/research/project/ai-fairness-checklist/) - 由AI从业者创建用以支持公平性检查在AI开发周期中的采用和集成。
* [Deon](https://deon.drivendata.org/) - 一个通用的数据伦理清单,由[行业建议](https://deon.drivendata.org/#checklist-citations)创建,并配备命令行工具以便于集成。
* [隐私审计清单](https://cyber.harvard.edu/ecommerce/privacyaudit.html) - 从法律和社会曝光角度提供信息处理实践的一般指导。
* [AI公平性清单](https://www.microsoft.com/en-us/research/project/ai-fairness-checklist/) - 由AI从业者创建用以支持公平性检查在AI开发周期中的采用和集成。
* [数据与AI伦理的22个问题](https://medium.com/the-organization/22-questions-for-ethics-in-data-and-ai-efb68fd19429) - 更开放的框架,结构化用于设计、实施和组织背景下伦理问题的初步探索。
### 3. 伦理法规
伦理是关于定义共享价值并自愿做正确的事情。**合规**是关于_遵守法律_如果有定义。**治理**广泛涵盖了组织为执行伦理原则和遵守既定法律采取的所有方式。
伦理是关于定义共享价值并自愿做正确的事情。**合规**是关于_遵守法律_如果有定义。**治理**广泛涵盖了组织为执行伦理原则和遵守既定法律采取的所有方式。
今天,治理在组织中有两种形式。首先,它是关于定义**伦理AI**原则并建立实践以在组织的所有AI相关项目中实现采用。其次,它是关于遵守组织运营地区所有政府规定的**数据保护法规**。
今天,治理在组织中有两种形式。首先,它是关于定义**伦理AI**原则并建立实践以实现组织中所有与AI相关项目的采用。其次,它是关于遵守组织运营地区所有政府规定的**数据保护法规**。
数据保护和隐私法规的示例:
* `1974年`[美国隐私法案](https://www.justice.gov/opcl/privacy-act-1974) - 规范_联邦政府_对个人信息的收集、使用和披露。
* `1996年`[美国健康保险携带与责任法案HIPAA](https://www.cdc.gov/phlp/publications/topic/hipaa.html) - 保护个人健康数据。
* `1996年`[美国健康保险流通与责任法案HIPAA](https://www.cdc.gov/phlp/publications/topic/hipaa.html) - 保护个人健康数据。
* `1998年`[美国儿童在线隐私保护法案COPPA](https://www.ftc.gov/enforcement/rules/rulemaking-regulatory-reform-proceedings/childrens-online-privacy-protection-rule) - 保护13岁以下儿童的数据隐私。
* `2018年`[通用数据保护条例GDPR](https://gdpr-info.eu/) - 提供用户权利、数据保护和隐私。
* `2018年`[加州消费者隐私法案CCPA](https://www.oag.ca.gov/privacy/ccpa) - 赋予消费者更多关于其个人数据的_权利_。
* `2021年`,中国[个人信息保护法](https://www.reuters.com/world/china/china-passes-new-personal-data-privacy-law-take-effect-nov-1-2021-08-20/)刚刚通过,成为全球最强的在线数据隐私法规之一。
> 🚨 欧盟定义的GDPR通用数据保护条例仍然是今天最具影响力的数据隐私法规之一。你知道它还定义了[8项用户权利](https://www.freeprivacypolicy.com/blog/8-user-rights-gdpr)以保护公民的数字隐私和个人数据吗?了解这些权利是什么以及为什么它们重要。
> 🚨 欧盟定义的GDPR通用数据保护条例仍然是今天最具影响力的数据隐私法规之一。你知道它还定义了[8项用户权利](https://www.freeprivacypolicy.com/blog/8-user-rights-gdpr)以保护公民的数字隐私和个人数据吗?了解这些权利是什么以及为什么它们重要。
### 4. 伦理文化
注意_合规_做到足以满足“法律条文”与解决[系统性问题](https://www.coursera.org/learn/data-science-ethics/home/week/4)如僵化、信息不对称和分配不公平之间仍然存在无形的差距这些问题可能加速AI的武器化。
后者需要[协作定义伦理文化的方法](https://towardsdatascience.com/why-ai-ethics-requires-a-culture-driven-approach-26f451afa29f),以在行业内建立情感联系和一致的共享价值。这需要在组织中[正式化数据伦理文化](https://www.codeforamerica.org/news/formalizing-an-ethical-data-culture/)——允许_任何人_在早期阶段[拉动安灯绳](https://en.wikipedia.org/wiki/Andon_(manufacturing))提出伦理问题并将_伦理评估_例如在招聘中作为AI项目团队组建的核心标准。
后者需要[协作定义伦理文化的方法](https://towardsdatascience.com/why-ai-ethics-requires-a-culture-driven-approach-26f451afa29f),以在行业内建立情感联系和一致的共享价值。这需要在组织中[正式化数据伦理文化](https://www.codeforamerica.org/news/formalizing-an-ethical-data-culture)允许_任何人_在早期阶段[拉动安灯绳](https://en.wikipedia.org/wiki/Andon_(manufacturing))提出伦理问题并将_伦理评估_例如在招聘中作为AI项目团队组建的核心标准。
---
## [课后测验](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/3) 🎯
## [课后测验](https://ff-quizzes.netlify.app/en/ds/) 🎯
## 复习与自学
课程和书籍有助于理解核心伦理概念和挑战,而案例研究和工具有助于在现实世界中应用伦理实践。以下是一些入门资源:
课程和书籍有助于理解核心伦理概念和挑战,而案例研究和工具有助于在现实世界中实践应用伦理。以下是一些入门资源:
* [机器学习初学者](https://github.com/microsoft/ML-For-Beginners/blob/main/1-Introduction/3-fairness/README.md) - 来自微软的公平性课程。
* [负责任人工智能原则](https://docs.microsoft.com/en-us/learn/modules/responsible-ai-principles/) - 来自 Microsoft Learn 的免费学习路径。
* [伦理与数据科学](https://resources.oreilly.com/examples/0636920203964) - O'Reilly 电子书 (M. Loukides, H. Mason 等人)
* [伦理与数据科学](https://resources.oreilly.com/examples/0636920203964) - O'Reilly 电子书 (M. Loukides, H. Mason 等人)
* [数据科学伦理](https://www.coursera.org/learn/data-science-ethics#syllabus) - 密歇根大学的在线课程。
* [伦理解读](https://ethicsunwrapped.utexas.edu/case-studies) - 来自德克萨斯大学的案例研究。
@ -261,5 +261,7 @@ CO_OP_TRANSLATOR_METADATA:
[撰写数据伦理案例研究](assignment.md)
---
**免责声明**
本文档使用AI翻译服务 [Co-op Translator](https://github.com/Azure/co-op-translator) 进行翻译。尽管我们努力确保翻译的准确性,但请注意,自动翻译可能包含错误或不准确之处。应以原始语言的文档作为权威来源。对于关键信息,建议使用专业人工翻译。我们对因使用此翻译而产生的任何误解或误读不承担责任。
本文档使用AI翻译服务 [Co-op Translator](https://github.com/Azure/co-op-translator) 进行翻译。尽管我们努力确保翻译的准确性,但请注意,自动翻译可能包含错误或不准确之处。应以原始语言的文档作为权威来源。对于重要信息,建议使用专业人工翻译。我们不对因使用此翻译而产生的任何误解或误读承担责任。
Loading…
Cancel
Save