You can not select more than 25 topics
Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.
254 lines
56 KiB
254 lines
56 KiB
<!--
|
|
CO_OP_TRANSLATOR_METADATA:
|
|
{
|
|
"original_hash": "1341f6da63d434f5ba31b08ea951b02c",
|
|
"translation_date": "2025-09-06T07:37:37+00:00",
|
|
"source_file": "1-Introduction/02-ethics/README.md",
|
|
"language_code": "mr"
|
|
}
|
|
-->
|
|
# डेटा नैतिकतेची ओळख
|
|
|
|
| ](../../sketchnotes/02-Ethics.png)|
|
|
|:---:|
|
|
| डेटा सायन्स नैतिकता - _Sketchnote by [@nitya](https://twitter.com/nitya)_ |
|
|
|
|
---
|
|
|
|
आपण सर्वजण डेटा-आधारित जगात डेटा नागरिक म्हणून जगत आहोत.
|
|
|
|
मार्केट ट्रेंड्स सांगतात की 2022 पर्यंत, प्रत्येक तीन मोठ्या संस्थांपैकी एक आपला डेटा ऑनलाइन [Marketplaces and Exchanges](https://www.gartner.com/smarterwithgartner/gartner-top-10-trends-in-data-and-analytics-for-2020/) द्वारे खरेदी आणि विक्री करेल. **अॅप डेव्हलपर्स** म्हणून, आपल्याला डेटा-आधारित अंतर्दृष्टी आणि अल्गोरिदम-आधारित ऑटोमेशन रोजच्या वापरकर्ता अनुभवांमध्ये समाविष्ट करणे सोपे आणि स्वस्त होईल. परंतु AI सर्वत्र पसरत असताना, आपल्याला अशा अल्गोरिदमच्या [weaponization](https://www.youtube.com/watch?v=TQHs8SA1qpk) मुळे होणारे संभाव्य नुकसान देखील समजून घेणे आवश्यक आहे.
|
|
|
|
ट्रेंड्स असेही सूचित करतात की 2025 पर्यंत आपण [180 zettabytes](https://www.statista.com/statistics/871513/worldwide-data-created/) डेटा तयार करू आणि वापरू. **डेटा सायंटिस्ट्स** म्हणून, यामुळे आपल्याला वैयक्तिक डेटावर अभूतपूर्व स्तरावर प्रवेश मिळतो. याचा अर्थ असा की आपण वापरकर्त्यांचे वर्तनात्मक प्रोफाइल तयार करू शकतो आणि निर्णय घेण्यावर प्रभाव टाकू शकतो ज्यामुळे [illusion of free choice](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice) निर्माण होतो, तर वापरकर्त्यांना आपल्याला हवे असलेले परिणाम मिळविण्यासाठी प्रेरित करू शकतो. यामुळे डेटा गोपनीयता आणि वापरकर्ता संरक्षण यासंबंधी व्यापक प्रश्न देखील निर्माण होतात.
|
|
|
|
डेटा नैतिकता आता डेटा सायन्स आणि अभियांत्रिकीसाठी _आवश्यक मार्गदर्शक_ बनली आहे, ज्यामुळे आपल्याला डेटा-आधारित कृतींमुळे होणारे संभाव्य नुकसान आणि अनपेक्षित परिणाम कमी करण्यास मदत होते. [Gartner Hype Cycle for AI](https://www.gartner.com/smarterwithgartner/2-megatrends-dominate-the-gartner-hype-cycle-for-artificial-intelligence-2020/) डिजिटल नैतिकता, जबाबदार AI, आणि AI गव्हर्नन्समधील संबंधित ट्रेंड्स ओळखतो, जे AI च्या _लोकशाहीकरण_ आणि _औद्योगिकीकरण_ यासारख्या मोठ्या प्रवृत्तींना चालना देतात.
|
|
|
|

|
|
|
|
या धड्यात, आपण डेटा नैतिकतेच्या आकर्षक क्षेत्राचा अभ्यास करू - मूलभूत संकल्पना आणि आव्हाने, केस स्टडीज आणि गव्हर्नन्ससारख्या लागू केलेल्या AI संकल्पनांपर्यंत - ज्यामुळे डेटा आणि AI सह काम करणाऱ्या संघ आणि संस्थांमध्ये नैतिकतेची संस्कृती निर्माण होण्यास मदत होते.
|
|
|
|
## [पूर्व-व्याख्यान प्रश्नमंजुषा](https://ff-quizzes.netlify.app/en/ds/quiz/2) 🎯
|
|
|
|
## मूलभूत संज्ञा
|
|
|
|
चला मूलभूत शब्दसंग्रह समजून घेण्यापासून सुरुवात करूया.
|
|
|
|
"नैतिकता" हा शब्द [ग्रीक शब्द "ethikos"](https://en.wikipedia.org/wiki/Ethics) (आणि त्याचा मूळ "ethos") यावरून आला आहे, ज्याचा अर्थ _स्वभाव किंवा नैतिक स्वरूप_ असा आहे.
|
|
|
|
**नैतिकता** म्हणजे समाजातील आपल्या वर्तनावर नियंत्रण ठेवणाऱ्या सामायिक मूल्ये आणि नैतिक तत्त्वे. नैतिकता कायद्यांवर आधारित नसून "योग्य विरुद्ध अयोग्य" याबद्दलच्या व्यापकपणे स्वीकारलेल्या मानदंडांवर आधारित असते. तथापि, नैतिक विचार कॉर्पोरेट गव्हर्नन्स उपक्रम आणि सरकारी नियमांवर प्रभाव टाकू शकतात, जे अनुपालनासाठी अधिक प्रोत्साहन निर्माण करतात.
|
|
|
|
**डेटा नैतिकता** ही नैतिकतेची [नवीन शाखा](https://royalsocietypublishing.org/doi/full/10.1098/rsta.2016.0360#sec-1) आहे जी "_डेटा, अल्गोरिदम आणि संबंधित पद्धती_" यांच्याशी संबंधित नैतिक समस्यांचा अभ्यास आणि मूल्यांकन करते. येथे, **"डेटा"** निर्मिती, नोंदणी, व्यवस्थापन, प्रक्रिया, प्रसार, सामायिकरण आणि वापराशी संबंधित क्रियांवर लक्ष केंद्रित करते, **"अल्गोरिदम"** AI, एजंट्स, मशीन लर्निंग आणि रोबोट्सवर लक्ष केंद्रित करते, आणि **"पद्धती"** जबाबदार नवकल्पना, प्रोग्रामिंग, हॅकिंग आणि नैतिकता कोड्स यासारख्या विषयांवर लक्ष केंद्रित करते.
|
|
|
|
**लागू नैतिकता** म्हणजे नैतिक विचारांचा [व्यावहारिक उपयोग](https://en.wikipedia.org/wiki/Applied_ethics). हे _वास्तविक जगातील कृती, उत्पादने आणि प्रक्रिया_ यांच्या संदर्भात नैतिक समस्यांचा सक्रियपणे तपास करण्याची प्रक्रिया आहे आणि परिभाषित नैतिक मूल्यांशी सुसंगत राहण्यासाठी सुधारात्मक उपाययोजना करणे.
|
|
|
|
**नैतिकता संस्कृती** म्हणजे [_लागू नैतिकतेचे_ कार्यान्वयन](https://hbr.org/2019/05/how-to-design-an-ethical-organization) जेणेकरून आपल्या नैतिक तत्त्वे आणि पद्धती संपूर्ण संस्थेत सातत्यपूर्ण आणि प्रमाणित पद्धतीने स्वीकारल्या जातील. यशस्वी नैतिकता संस्कृती संस्थात्मक स्तरावर नैतिक तत्त्वे परिभाषित करतात, अनुपालनासाठी अर्थपूर्ण प्रोत्साहन प्रदान करतात आणि संस्थेच्या प्रत्येक स्तरावर इच्छित वर्तन प्रोत्साहित करून आणि वाढवून नैतिकता मानदंड मजबूत करतात.
|
|
|
|
## नैतिकता संकल्पना
|
|
|
|
या विभागात, आपण **सामायिक मूल्ये** (तत्त्वे) आणि **नैतिक आव्हाने** (समस्या) यासारख्या संकल्पनांवर चर्चा करू - आणि **केस स्टडीज** एक्सप्लोर करू जे आपल्याला वास्तविक जगातील संदर्भांमध्ये या संकल्पना समजून घेण्यास मदत करतात.
|
|
|
|
### 1. नैतिक तत्त्वे
|
|
|
|
प्रत्येक डेटा नैतिकता धोरणाची सुरुवात _नैतिक तत्त्वे_ परिभाषित करण्यापासून होते - "सामायिक मूल्ये" जी स्वीकारार्ह वर्तनाचे वर्णन करतात आणि आपल्या डेटा आणि AI प्रकल्पांमध्ये अनुपालन कृतींना मार्गदर्शन करतात. आपण ही तत्त्वे वैयक्तिक किंवा संघ स्तरावर परिभाषित करू शकता. तथापि, बहुतेक मोठ्या संस्था कॉर्पोरेट स्तरावर परिभाषित केलेल्या आणि सर्व संघांमध्ये सातत्याने लागू केलेल्या _नैतिक AI_ मिशन स्टेटमेंट किंवा फ्रेमवर्कमध्ये याचे वर्णन करतात.
|
|
|
|
**उदाहरण:** Microsoft च्या [Responsible AI](https://www.microsoft.com/en-us/ai/responsible-ai) मिशन स्टेटमेंटमध्ये असे म्हटले आहे: _"आम्ही लोकांना प्रथम स्थान देणाऱ्या नैतिक तत्त्वांद्वारे चालवलेल्या AI च्या प्रगतीसाठी वचनबद्ध आहोत"_ - खालील फ्रेमवर्कमध्ये 6 नैतिक तत्त्वे ओळखली आहेत:
|
|
|
|

|
|
|
|
चला या तत्त्वांचा थोडक्यात अभ्यास करूया. _पारदर्शकता_ आणि _जबाबदारी_ ही मूलभूत मूल्ये आहेत ज्यावर इतर तत्त्वे आधारित आहेत - त्यामुळे तिथून सुरुवात करूया:
|
|
|
|
* [**जबाबदारी**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) डेटा आणि AI ऑपरेशन्ससाठी, तसेच नैतिक तत्त्वांचे अनुपालन सुनिश्चित करण्यासाठी व्यावसायिकांना _जबाबदार_ बनवते.
|
|
* [**पारदर्शकता**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) सुनिश्चित करते की डेटा आणि AI क्रिया वापरकर्त्यांसाठी _समजण्यासारख्या_ (interpretative) असाव्यात, निर्णयांमागील काय आणि का स्पष्ट करते.
|
|
* [**न्याय**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1%3aprimaryr6) - AI सर्व लोकांशी _न्यायाने_ वागते याची खात्री करण्यावर लक्ष केंद्रित करते, डेटा आणि प्रणालींमधील कोणत्याही प्रणालीगत किंवा अप्रत्यक्ष सामाजिक-तांत्रिक पक्षपातांना संबोधित करते.
|
|
* [**विश्वसनीयता आणि सुरक्षा**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - AI _सुसंगतपणे_ परिभाषित मूल्यांसह वागते याची खात्री करते, संभाव्य नुकसान किंवा अनपेक्षित परिणाम कमी करते.
|
|
* [**गोपनीयता आणि सुरक्षा**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - डेटा वंशावळ समजून घेणे आणि वापरकर्त्यांना _डेटा गोपनीयता आणि संबंधित संरक्षण_ प्रदान करणे याबद्दल आहे.
|
|
* [**समावेशकता**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - AI सोल्यूशन्स हेतूनुसार डिझाइन करण्याबद्दल आहे, त्यांना _विविध मानवी गरजा_ आणि क्षमता पूर्ण करण्यासाठी अनुकूलित करणे.
|
|
|
|
> 🚨 आपल्या डेटा नैतिकता मिशन स्टेटमेंट काय असू शकते याचा विचार करा. इतर संस्थांकडून नैतिक AI फ्रेमवर्क एक्सप्लोर करा - येथे [IBM](https://www.ibm.com/cloud/learn/ai-ethics), [Google](https://ai.google/principles), आणि [Facebook](https://ai.facebook.com/blog/facebooks-five-pillars-of-responsible-ai/) चे उदाहरणे आहेत. त्यांच्यात कोणती सामायिक मूल्ये आहेत? ते ज्या AI उत्पादन किंवा उद्योगात कार्य करतात त्यांच्याशी ही तत्त्वे कशी संबंधित आहेत?
|
|
|
|
### 2. नैतिक आव्हाने
|
|
|
|
एकदा आपण नैतिक तत्त्वे परिभाषित केली की, पुढील पायरी म्हणजे आपल्या डेटा आणि AI क्रिया त्या सामायिक मूल्यांशी जुळतात का हे मूल्यांकन करणे. आपल्या कृतींचा विचार दोन श्रेणींमध्ये करा: _डेटा संकलन_ आणि _अल्गोरिदम डिझाइन_.
|
|
|
|
डेटा संकलनासह, कृतींमध्ये **वैयक्तिक डेटा** किंवा ओळखण्यायोग्य जिवंत व्यक्तींसाठी वैयक्तिक ओळखण्यायोग्य माहिती (PII) समाविष्ट असते. यामध्ये [विविध प्रकारचे गैर-वैयक्तिक डेटा](https://ec.europa.eu/info/law/law-topic/data-protection/reform/what-personal-data_en) समाविष्ट असतो जो _सामूहिकपणे_ व्यक्तीला ओळखतो. नैतिक आव्हाने _डेटा गोपनीयता_, _डेटा मालकी_, आणि संबंधित विषय जसे की _सहमती_ आणि _बौद्धिक मालमत्तेचे अधिकार_ यासंबंधी असू शकतात.
|
|
|
|
अल्गोरिदम डिझाइनसह, कृतींमध्ये **डेटासेट्स** गोळा करणे आणि व्यवस्थापित करणे, नंतर त्यांचा वापर करून **डेटा मॉडेल्स** तयार करणे आणि वास्तविक जगातील संदर्भांमध्ये निर्णयांची भविष्यवाणी करणे किंवा स्वयंचलित करणे समाविष्ट असते. नैतिक आव्हाने _डेटासेट पक्षपात_, _डेटा गुणवत्ता_ समस्या, _अन्याय_, आणि अल्गोरिदममधील _चुकीचे प्रतिनिधित्व_ यामुळे उद्भवू शकतात - ज्यामध्ये काही समस्या प्रणालीगत असू शकतात.
|
|
|
|
दोन्ही बाबतीत, नैतिक आव्हाने अशा क्षेत्रांवर प्रकाश टाकतात जिथे आपल्या कृतींमध्ये सामायिक मूल्यांशी संघर्ष होऊ शकतो. या चिंतेचा शोध घेण्यासाठी, कमी करण्यासाठी, कमी करण्यासाठी किंवा दूर करण्यासाठी - आपल्याला आपल्या कृतींशी संबंधित नैतिक "होय/नाही" प्रश्न विचारण्याची आवश्यकता आहे आणि नंतर आवश्यकतेनुसार सुधारात्मक कृती करणे आवश्यक आहे. चला काही नैतिक आव्हाने आणि त्यांनी उपस्थित केलेल्या नैतिक प्रश्नांचा अभ्यास करूया:
|
|
|
|
#### 2.1 डेटा मालकी
|
|
|
|
डेटा संकलनामध्ये अनेकदा डेटा विषयांना ओळखणारा वैयक्तिक डेटा समाविष्ट असतो. [डेटा मालकी](https://permission.io/blog/data-ownership) म्हणजे डेटा निर्मिती, प्रक्रिया आणि प्रसाराशी संबंधित _नियंत्रण_ आणि [_वापरकर्ता अधिकार_](https://permission.io/blog/data-ownership).
|
|
|
|
आपल्याला विचारायचे नैतिक प्रश्न:
|
|
* डेटा कोणाचा आहे? (वापरकर्ता किंवा संस्था)
|
|
* डेटा विषयांना कोणते अधिकार आहेत? (उदा: प्रवेश, विलोपन, पोर्टेबिलिटी)
|
|
* संस्थांना कोणते अधिकार आहेत? (उदा: दुर्भावनायुक्त वापरकर्ता पुनरावलोकने सुधारित करणे)
|
|
|
|
#### 2.2 माहितीपूर्ण सहमती
|
|
|
|
[माहितीपूर्ण सहमती](https://legaldictionary.net/informed-consent/) म्हणजे वापरकर्त्यांनी (डेटा संकलनासारख्या) कृतीसाठी _संपूर्ण समज_ असलेल्या संबंधित तथ्यांसह, जसे की उद्देश, संभाव्य धोके, आणि पर्याय, सहमती देणे.
|
|
|
|
येथे विचारायचे प्रश्न:
|
|
* वापरकर्त्याने (डेटा विषयाने) डेटा कॅप्चर आणि वापरासाठी परवानगी दिली आहे का?
|
|
* वापरकर्त्याला डेटा कॅप्चर करण्याचा उद्देश समजला आहे का?
|
|
* वापरकर्त्याला त्यांच्या सहभागामुळे संभाव्य धोके समजले आहेत का?
|
|
|
|
#### 2.3 बौद्धिक मालमत्ता
|
|
|
|
[बौद्धिक मालमत्ता](https://en.wikipedia.org/wiki/Intellectual_property) म्हणजे मानवी उपक्रमातून निर्माण झालेली अमूर्त निर्मिती, ज्याला व्यक्ती किंवा व्यवसायांसाठी _आर्थिक मूल्य_ असू शकते.
|
|
|
|
येथे विचारायचे प्रश्न:
|
|
* गोळा केलेल्या डेटाला वापरकर्ता किंवा व्यवसायासाठी आर्थिक मूल्य आहे का?
|
|
* येथे **वापरकर्त्याला** बौद्धिक मालमत्ता आहे का?
|
|
* येथे **संस्थेला** बौद्धिक मालमत्ता आहे का?
|
|
* जर हे अधिकार अस्तित्वात असतील, तर आपण त्यांचे संरक्षण कसे करत आहोत?
|
|
|
|
#### 2.4 डेटा गोपनीयता
|
|
|
|
[डेटा गोपनीयता](https://www.northeastern.edu/graduate/blog/what-is-data-privacy/) किंवा माहिती गोपनीयता म्हणजे वैयक्तिक ओळखण्यायोग्य माहितीच्या संदर्भात वापरकर्त्याच्या गोपनीयतेचे संरक्षण आणि ओळख संरक्षण.
|
|
|
|
येथे विचारायचे प्रश्न:
|
|
* वापरकर्त्यांचा (वैयक्तिक) डेटा हॅक आणि लीकपासून सुरक्षित आहे का?
|
|
* वापरकर्त्यांचा डेटा केवळ अधिकृत वापरकर्त्यांना आणि संदर्भांना उपलब्ध आहे का?
|
|
* डेटा सामायिक किंवा प्रसारित करताना वापरकर्त्यांची अनामिकता संरक्षित आहे का?
|
|
* अनामिक डेटासेट्समधून वापरकर्त्याला ओळखण्यायोग्य बनवता येते का?
|
|
|
|
#### 2.5 विस्मरणाचा अधिकार
|
|
|
|
[विस्मरणाचा अधिकार](https://en.wikipedia.org/wiki/Right_to_be_forgotten) किंवा [विलोपनाचा अधिकार](https://www.gdpreu.org/right-to-be-forgotten/) वापरकर्त्यांना अतिरिक्त वैयक्तिक डेटा संरक्षण प्रदान करतो. विशेषतः, हे वापरकर्त्यांना इंटरनेट शोध आणि इतर ठिकाणांमधून वैयक्तिक डेटा हटविण्याची किंवा काढून टाकण्याची विनंती करण्याचा अधिकार देते, _विशिष्ट परिस्थितीत_ - त्यांना ऑनलाइन नवीन सुरुवात करण्याची परवानगी देते ज्यामध्ये त्यांच्या भूतकाळातील कृती त्यांच्याविरुद्ध धरल्या जात नाहीत.
|
|
|
|
येथे विचारायचे प्रश्न:
|
|
* प्रणाली डेटा विषयांना विलोपनाची विनंती करण्याची परवानगी देते का?
|
|
* वापरकर्त्याच्या सहमतीच्या मागे घेण्याने स्वयंचलित विलोपन ट्रिगर करावे का?
|
|
* डेटा सहमतीशिवाय किंवा बेकायदेशीर मार्गाने गोळा केला गेला होता का?
|
|
* डेटा गोपनीयतेसाठी सरकारी नियमांचे पालन केले आहे का?
|
|
|
|
#### 2.6 डेटासेट पक्षपात
|
|
|
|
डेटासेट किंवा [संकलन पक्षपात](http://researcharticles.com/index.php/bias-in-data-collection-in-research/) म्हणजे अल्गोरिदम विकासासाठी _अप्रतिनिधिक_ डेटा उपसंच निवडणे, विविध गटांसाठी संभाव्य अन्याय निर्माण करणे. पक्षपाताचे प्रकार निवड किंवा नमुना पक्षपात, स्वयंसेवक पक्षपात, आणि साधन पक्षपात यांचा समावेश करतात.
|
|
|
|
येथे विचारायचे प्रश्न:
|
|
* आपण डेटा विषयांचा प्रतिनिधिक संच भरती केला आहे का?
|
|
* आपण विविध पक्षपातांसाठी गोळा केलेला किंवा व्यवस्थापित केलेला डेटासेट
|
|
[Algorithm Fairness](https://towardsdatascience.com/what-is-algorithm-fairness-3182e161cf9f) तपासते की अल्गोरिदम डिझाइन विशिष्ट उपसमूहांवर अन्यायकारकपणे भेदभाव करते का, ज्यामुळे _वाटप_ (जिथे संसाधने त्या गटाला नाकारली जातात किंवा रोखली जातात) आणि _सेवेची गुणवत्ता_ (जिथे AI काही उपसमूहांसाठी इतरांइतकी अचूक नसते) यामध्ये [संभाव्य नुकसान](https://docs.microsoft.com/en-us/azure/machine-learning/concept-fairness-ml) होऊ शकते.
|
|
|
|
येथे विचार करण्यासाठी काही प्रश्न:
|
|
* विविध उपसमूह आणि परिस्थितींसाठी मॉडेल अचूकतेचे मूल्यांकन केले का?
|
|
* संभाव्य नुकसान (उदा., रूढीवादी विचारसरणी) तपासले का?
|
|
* ओळखलेल्या नुकसानीस कमी करण्यासाठी डेटा सुधारित किंवा मॉडेल पुन्हा प्रशिक्षित करू शकतो का?
|
|
|
|
[AI Fairness checklists](https://query.prod.cms.rt.microsoft.com/cms/api/am/binary/RE4t6dA) सारख्या संसाधनांचा अभ्यास करा.
|
|
|
|
#### 2.9 चुकीचे प्रतिनिधित्व
|
|
|
|
[Data Misrepresentation](https://www.sciencedirect.com/topics/computer-science/misrepresentation) म्हणजे आपण प्रामाणिकपणे नोंदवलेल्या डेटामधून अंतर्दृष्टी अशा प्रकारे सादर करत आहोत का ज्यामुळे इच्छित कथानकाला पाठिंबा मिळतो, परंतु ते फसवणूक करणारे आहे.
|
|
|
|
येथे विचार करण्यासाठी काही प्रश्न:
|
|
* आम्ही अपूर्ण किंवा अचूक नसलेला डेटा नोंदवत आहोत का?
|
|
* आम्ही डेटा अशा प्रकारे व्हिज्युअलाइज करत आहोत का ज्यामुळे चुकीचे निष्कर्ष काढले जातात?
|
|
* आम्ही निवडक सांख्यिकीय तंत्र वापरून परिणामांमध्ये फेरफार करत आहोत का?
|
|
* वेगळे निष्कर्ष देऊ शकणारे पर्यायी स्पष्टीकरण आहेत का?
|
|
|
|
#### 2.10 स्वातंत्र्याची भ्रमजाल
|
|
|
|
[Illusion of Free Choice](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice) तेव्हा उद्भवते जेव्हा प्रणाली "चॉइस आर्किटेक्चर" निर्णय घेण्याच्या अल्गोरिदमचा वापर लोकांना इच्छित परिणामाकडे वळवण्यासाठी करते, परंतु त्यांना पर्याय आणि नियंत्रण असल्याचे भासवते. हे [डार्क पॅटर्न्स](https://www.darkpatterns.org/) वापरकर्त्यांना सामाजिक आणि आर्थिक नुकसान पोहोचवू शकतात. कारण वापरकर्त्याचे निर्णय वर्तन प्रोफाइलवर परिणाम करतात, त्यामुळे या कृती भविष्यातील निवडींवर परिणाम करू शकतात आणि या नुकसानीचा प्रभाव वाढवू शकतात.
|
|
|
|
येथे विचार करण्यासाठी काही प्रश्न:
|
|
* वापरकर्त्याला त्या निवडीचे परिणाम समजले का?
|
|
* वापरकर्त्याला (पर्यायी) पर्याय आणि प्रत्येकाचे फायदे व तोटे माहित होते का?
|
|
* वापरकर्त्याला स्वयंचलित किंवा प्रभावित निवड नंतर उलटवता येते का?
|
|
|
|
### 3. केस स्टडीज
|
|
|
|
या नैतिक आव्हानांना वास्तविक जीवनातील संदर्भात ठेवण्यासाठी, अशा केस स्टडीजकडे पाहणे उपयुक्त ठरते ज्यामध्ये नैतिक उल्लंघनांकडे दुर्लक्ष केल्यास व्यक्ती आणि समाजावर संभाव्य नुकसान आणि परिणाम कसे होतात हे स्पष्ट होते.
|
|
|
|
येथे काही उदाहरणे आहेत:
|
|
|
|
| नैतिक आव्हान | केस स्टडी |
|
|
|--- |--- |
|
|
| **सहमतीची माहिती** | 1972 - [Tuskegee Syphilis Study](https://en.wikipedia.org/wiki/Tuskegee_Syphilis_Study) - अभ्यासात सहभागी झालेल्या आफ्रिकन अमेरिकन पुरुषांना मोफत वैद्यकीय सेवा देण्याचे आश्वासन दिले गेले _पण फसवले गेले_ कारण संशोधकांनी विषयांना त्यांच्या निदानाची किंवा उपचार उपलब्धतेची माहिती दिली नाही. अनेक विषयांचा मृत्यू झाला आणि त्यांच्या जोडीदार किंवा मुलांवर परिणाम झाला; अभ्यास 40 वर्षे चालला. |
|
|
| **डेटा गोपनीयता** | 2007 - [Netflix data prize](https://www.wired.com/2007/12/why-anonymous-data-sometimes-isnt/) संशोधकांना _50K ग्राहकांकडून 10M अनामित चित्रपट रेटिंग_ प्रदान केले गेले जेणेकरून शिफारस अल्गोरिदम सुधारता येईल. तथापि, संशोधकांनी अनामित डेटा _बाह्य डेटासेट्स_ (उदा., IMDb टिप्पण्या) मधील वैयक्तिक ओळखण्यायोग्य डेटाशी जोडला - काही Netflix सदस्यांना "डि-अनॉनिमाइझ" केले.|
|
|
| **संकलन पक्षपात** | 2013 - बोस्टन शहराने [Street Bump](https://www.boston.gov/transportation/street-bump) विकसित केले, एक अॅप ज्याद्वारे नागरिकांना खड्ड्यांची माहिती देण्याची परवानगी दिली गेली, ज्यामुळे शहराला रस्त्यावरील समस्यांचे निराकरण करण्यासाठी चांगला डेटा मिळाला. तथापि, [कमी उत्पन्न गटातील लोकांना कार आणि फोनचा कमी प्रवेश होता](https://hbr.org/2013/04/the-hidden-biases-in-big-data), ज्यामुळे त्यांच्या रस्त्यावरील समस्या या अॅपमध्ये अदृश्य झाल्या. विकासकांनी _समान प्रवेश आणि डिजिटल विभाग_ समस्यांवर न्याय्यतेसाठी शैक्षणिक संस्थांशी काम केले. |
|
|
| **अल्गोरिदम न्याय** | 2018 - MIT [Gender Shades Study](http://gendershades.org/overview.html) ने लिंग वर्गीकरण AI उत्पादनांची अचूकता मूल्यांकन केली, महिलांसाठी आणि रंगाच्या व्यक्तींसाठी अचूकतेतील अंतर उघड केले. [2019 Apple Card](https://www.wired.com/story/the-apple-card-didnt-see-genderand-thats-the-problem/) पुरुषांपेक्षा महिलांना कमी क्रेडिट देत असल्याचे दिसून आले. दोन्ही उदाहरणांमध्ये अल्गोरिदम पक्षपातामुळे सामाजिक-आर्थिक नुकसान झाले.|
|
|
| **डेटा चुकीचे प्रतिनिधित्व** | 2020 - [Georgia Department of Public Health ने COVID-19 चार्ट्स जारी केले](https://www.vox.com/covid-19-coronavirus-us-response-trump/2020/5/18/21262265/georgia-covid-19-cases-declining-reopening) ज्यामुळे नागरिकांना पुष्टी झालेल्या प्रकरणांतील ट्रेंडबद्दल चुकीचे दिशाभूल करण्याची शक्यता होती, x-अक्षावर गैर-कालक्रमिक क्रमवारीसह. हे व्हिज्युअलायझेशन युक्त्यांद्वारे चुकीचे प्रतिनिधित्व दाखवते. |
|
|
| **स्वातंत्र्याची भ्रमजाल** | 2020 - शिक्षण अॅप [ABCmouse ने FTC तक्रारीचे $10M देऊन सेटलमेंट केले](https://www.washingtonpost.com/business/2020/09/04/abcmouse-10-million-ftc-settlement/) जिथे पालकांना सदस्यता रद्द करता येत नव्हती. हे निवडीच्या आर्किटेक्चरमधील डार्क पॅटर्न्सचे उदाहरण देते, जिथे वापरकर्त्यांना संभाव्य हानिकारक निवडींकडे वळवले गेले. |
|
|
| **डेटा गोपनीयता आणि वापरकर्त्याचे अधिकार** | 2021 - Facebook [Data Breach](https://www.npr.org/2021/04/09/986005820/after-data-breach-exposes-530-million-facebook-says-it-will-not-notify-users) ने 530M वापरकर्त्यांचा डेटा उघड केला, ज्यामुळे FTC ला $5B सेटलमेंट मिळाले. तथापि, वापरकर्त्यांना उल्लंघनाची सूचना देण्यास नकार दिला, डेटा पारदर्शकता आणि प्रवेशाबाबत वापरकर्त्याच्या अधिकारांचे उल्लंघन केले. |
|
|
|
|
अधिक केस स्टडीज शोधू इच्छिता? या संसाधनांचा अभ्यास करा:
|
|
* [Ethics Unwrapped](https://ethicsunwrapped.utexas.edu/case-studies) - विविध उद्योगांमधील नैतिक समस्यांचे उदाहरण.
|
|
* [Data Science Ethics course](https://www.coursera.org/learn/data-science-ethics#syllabus) - महत्त्वाच्या केस स्टडीजचा अभ्यास.
|
|
* [Where things have gone wrong](https://deon.drivendata.org/examples/) - डिऑन चेकलिस्टसह उदाहरणे.
|
|
|
|
> 🚨 तुम्ही पाहिलेल्या केस स्टडीजचा विचार करा - तुमच्या जीवनात तुम्हाला अशाच प्रकारच्या नैतिक आव्हानाचा अनुभव आला आहे का किंवा त्याचा परिणाम झाला आहे का? तुम्ही या विभागात चर्चा केलेल्या नैतिक आव्हानांपैकी एका उदाहरणाचे चित्रण करणारी किमान एक केस स्टडी विचार करू शकता का?
|
|
|
|
## लागू नैतिकता
|
|
|
|
आम्ही नैतिकता संकल्पना, आव्हाने आणि वास्तविक जीवनातील संदर्भातील केस स्टडीजबद्दल चर्चा केली आहे. पण आपल्या प्रकल्पांमध्ये नैतिक तत्त्वे आणि पद्धती _लागू_ करण्यास कसे सुरुवात करावी? आणि चांगल्या प्रशासनासाठी या पद्धती _ऑपरेशनलाइज_ कशा कराव्यात? काही वास्तविक उपाय शोधूया:
|
|
|
|
### 1. व्यावसायिक संहिता
|
|
|
|
व्यावसायिक संहिता संस्थांना त्यांच्या नैतिक तत्त्वांना आणि मिशन स्टेटमेंटला पाठिंबा देण्यासाठी सदस्यांना "प्रोत्साहन" देण्याचा एक पर्याय देते. संहिता व्यावसायिक वर्तनासाठी _नैतिक मार्गदर्शक तत्त्वे_ आहेत, ज्यामुळे कर्मचारी किंवा सदस्य त्यांच्या संस्थेच्या तत्त्वांशी जुळणारे निर्णय घेऊ शकतात. सदस्यांकडून स्वेच्छेने अनुपालन केल्यास ते चांगले असते; तथापि, अनेक संस्था सदस्यांकडून अनुपालन करण्यासाठी अतिरिक्त बक्षिसे आणि दंड देतात.
|
|
|
|
उदाहरणे:
|
|
* [Oxford Munich](http://www.code-of-ethics.org/code-of-conduct/) Code of Ethics
|
|
* [Data Science Association](http://datascienceassn.org/code-of-conduct.html) Code of Conduct (2013 मध्ये तयार केले)
|
|
* [ACM Code of Ethics and Professional Conduct](https://www.acm.org/code-of-ethics) (1993 पासून)
|
|
|
|
> 🚨 तुम्ही व्यावसायिक अभियांत्रिकी किंवा डेटा विज्ञान संस्थेचे सदस्य आहात का? त्यांच्या साइटचा अभ्यास करा की त्यांनी व्यावसायिक नैतिकतेची संहिता परिभाषित केली आहे का. त्यांच्या नैतिक तत्त्वांबद्दल काय सांगते? ते सदस्यांना संहितेचे पालन करण्यासाठी कसे "प्रोत्साहन" देत आहेत?
|
|
|
|
### 2. नैतिकता चेकलिस्ट
|
|
|
|
व्यावसायिक संहिता व्यावसायिकांकडून आवश्यक _नैतिक वर्तन_ परिभाषित करतात, परंतु मोठ्या प्रमाणावर प्रकल्पांमध्ये अंमलबजावणीमध्ये [मर्यादा आहेत](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md). त्याऐवजी, अनेक डेटा विज्ञान तज्ञ [चेकलिस्ट](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md) ची वकिली करतात, ज्यामुळे **तत्त्वे पद्धतींशी जोडली जाऊ शकतात** अधिक ठोस आणि कृतीक्षम मार्गांनी.
|
|
|
|
चेकलिस्ट प्रश्नांना "होय/नाही" कार्यांमध्ये रूपांतरित करतात ज्यांना ऑपरेशनलाइज करता येते, ज्यामुळे त्यांना मानक उत्पादन रिलीज वर्कफ्लोचा भाग म्हणून ट्रॅक करता येते.
|
|
|
|
उदाहरणे:
|
|
* [Deon](https://deon.drivendata.org/) - [उद्योगाच्या शिफारशींमधून](https://deon.drivendata.org/#checklist-citations) तयार केलेली सामान्य-उद्देश डेटा नैतिकता चेकलिस्ट, सोपी एकत्रीकरणासाठी कमांड-लाइन टूलसह.
|
|
* [Privacy Audit Checklist](https://cyber.harvard.edu/ecommerce/privacyaudit.html) - कायदेशीर आणि सामाजिक प्रदर्शनाच्या दृष्टिकोनातून माहिती हाताळण्याच्या पद्धतींसाठी सामान्य मार्गदर्शन प्रदान करते.
|
|
* [AI Fairness Checklist](https://www.microsoft.com/en-us/research/project/ai-fairness-checklist/) - AI विकास चक्रांमध्ये न्याय्यतेच्या तपासणीचा अवलंब आणि समाकलन समर्थन करण्यासाठी AI व्यावसायिकांनी तयार केले.
|
|
* [22 questions for ethics in data and AI](https://medium.com/the-organization/22-questions-for-ethics-in-data-and-ai-efb68fd19429) - अधिक खुले फ्रेमवर्क, डिझाइन, अंमलबजावणी आणि संस्थात्मक संदर्भांमध्ये नैतिक समस्यांच्या प्रारंभिक अन्वेषणासाठी संरचित.
|
|
|
|
### 3. नैतिकता नियम
|
|
|
|
नैतिकता म्हणजे सामायिक मूल्ये परिभाषित करणे आणि _स्वेच्छेने_ योग्य गोष्ट करणे. **अनुपालन** म्हणजे _कायदा पाळणे_ जर आणि जिथे परिभाषित केले असेल. **प्रशासन** म्हणजे संस्थांमध्ये नैतिक तत्त्वे अंमलात आणण्यासाठी आणि स्थापित कायद्यांचे पालन करण्यासाठी कार्य करण्याच्या सर्व मार्गांचा समावेश आहे.
|
|
|
|
आज, संस्थांमध्ये प्रशासन दोन प्रकारे घेतले जाते. प्रथम, हे **नैतिक AI** तत्त्वे परिभाषित करण्याबद्दल आहे आणि संस्थेतील सर्व AI-संबंधित प्रकल्पांमध्ये अवलंबन अंमलात आणण्यासाठी पद्धती स्थापित करण्याबद्दल आहे. दुसरे म्हणजे, ते कार्यरत असलेल्या प्रदेशांसाठी सर्व सरकारी-मंडेटेड **डेटा संरक्षण नियमांचे** पालन करण्याबद्दल आहे.
|
|
|
|
डेटा संरक्षण आणि गोपनीयता नियमांची उदाहरणे:
|
|
|
|
* `1974`, [US Privacy Act](https://www.justice.gov/opcl/privacy-act-1974) - _फेडरल सरकार_ वैयक्तिक माहितीचे संकलन, वापर आणि प्रकटीकरण नियंत्रित करते.
|
|
* `1996`, [US Health Insurance Portability & Accountability Act (HIPAA)](https://www.cdc.gov/phlp/publications/topic/hipaa.html) - वैयक्तिक आरोग्य डेटा संरक्षित करते.
|
|
* `1998`, [US Children's Online Privacy Protection Act (COPPA)](https://www.ftc.gov/enforcement/rules/rulemaking-regulatory-reform-proceedings/childrens-online-privacy-protection-rule) - 13 वर्षांखालील मुलांच्या डेटा गोपनीयतेचे संरक्षण करते.
|
|
* `2018`, [General Data Protection Regulation (GDPR)](https://gdpr-info.eu/) - वापरकर्त्याचे अधिकार, डेटा संरक्षण आणि गोपनीयता प्रदान करते.
|
|
* `2018`, [California Consumer Privacy Act (CCPA)](https://www.oag.ca.gov/privacy/ccpa) ग्राहकांना त्यांच्या (वैयक्तिक) डेटावर अधिक _अधिकार_ देते.
|
|
* `2021`, चीनचे [Personal Information Protection Law](https://www.reuters.com/world/china/china-passes-new-personal-data-privacy-law-take-effect-nov-1-2021-08-20/) नुकतेच मंजूर झाले, जगातील सर्वात मजबूत ऑनलाइन डेटा गोपनीयता नियम तयार करत आहे.
|
|
|
|
> 🚨 युरोपियन युनियनने परिभाषित केलेले GDPR (General Data Protection Regulation) आज सर्वात प्रभावशाली डेटा गोपनीयता नियमांपैकी एक आहे. तुम्हाला माहित आहे का की ते नागरिकांच्या डिजिटल गोपनीयता आणि वैयक्तिक डेटाचे संरक्षण करण्यासाठी [8 वापरकर्ता अधिकार](https://www.freeprivacypolicy.com/blog/8-user-rights-gdpr) देखील परिभाषित करते? हे काय आहेत आणि ते का महत्त्वाचे आहेत याबद्दल जाणून घ्या.
|
|
|
|
### 4. नैतिकता संस्कृती
|
|
|
|
लक्षात घ्या की _अनुपालन_ (कायद्याच्या "अक्षर" पूर्ण करण्यासाठी पुरेसे करणे) आणि [प्रणालीगत समस्यांचे](https://www.coursera.org/learn/data-science-ethics/home/week/4) निराकरण करणे (जसे की ऑसिफिकेशन, माहिती विषमता आणि वितरणात्मक अन्याय) यामध्ये अदृश्य अंतर आहे जे AI च्या शस्त्रीकरणाला गती देऊ शकते.
|
|
|
|
उत्तरार्धासाठी [नैतिकता संस्कृती परिभाषित करण्यासाठी सहयोगात्मक दृष्टिकोन](https://towardsdatascience.com/why-ai-ethics-requires-a-culture-driven-approach-26f451afa29f) आवश्यक आहे जे भावनिक कनेक्शन आणि उद्योगातील _संस्थांमध्ये_ सातत्यपूर्ण सामायिक मूल्ये तयार करतात. यासाठी संस्थांमध्ये अधिक [औपचारिक डेटा नैतिकता संस्कृती](https://www.codeforamerica.org/news/formalizing-an-ethical-data-culture/) आवश्यक आहे - _कोणालाही_ [अँडॉन कॉर्ड खेचण्याची](https://en.wikipedia.org/wiki/Andon_(manufacturing)) परवानगी देणे (प्रक्रियेत लवकर नैतिक चिंता वाढवण्यासाठी) आणि AI प्रकल्पांमध्ये टीम तयार करण्यासाठी _नैतिक मूल्यांकन_ (उदा., भरतीमध्ये) मुख्य निकष बनवणे.
|
|
|
|
---
|
|
## [Post-lecture quiz](https://ff-quizzes.netlify.app/en/ds/quiz/3) 🎯
|
|
## पुनरावलोकन आणि स्व-अभ्यास
|
|
|
|
कोर्सेस आणि पुस्तके मुख्य नैतिकता संकल्पना आणि आव्हाने समजून घेण्यास मदत करतात, तर केस स्टडीज आणि साधने वास्तविक जीवनातील संदर्भात लागू नैतिकता पद्धतींमध्ये मदत करतात. सुरुवात करण्यासाठी येथे काही संसाधने आहेत.
|
|
|
|
* [Machine Learning For Beginners](https://github.com/microsoft/ML-For-Beginners/blob/main/1-Introduction/3-fairness/README.md) - Microsoft
|
|
* [जबाबदार AI च्या तत्त्वांचे मार्गदर्शन](https://docs.microsoft.com/en-us/learn/modules/responsible-ai-principles/) - Microsoft Learn कडून मोफत शिक्षण मार्ग.
|
|
* [नैतिकता आणि डेटा विज्ञान](https://resources.oreilly.com/examples/0636920203964) - O'Reilly ईबुक (M. Loukides, H. Mason इ.)
|
|
* [डेटा विज्ञान नैतिकता](https://www.coursera.org/learn/data-science-ethics#syllabus) - मिशिगन विद्यापीठाचा ऑनलाइन कोर्स.
|
|
* [नैतिकता अनरॅप्ड](https://ethicsunwrapped.utexas.edu/case-studies) - टेक्सास विद्यापीठाकडून केस स्टडीज.
|
|
|
|
# असाइनमेंट
|
|
|
|
[डेटा नैतिकतेसाठी केस स्टडी लिहा](assignment.md)
|
|
|
|
---
|
|
|
|
**अस्वीकरण**:
|
|
हा दस्तऐवज AI भाषांतर सेवा [Co-op Translator](https://github.com/Azure/co-op-translator) वापरून भाषांतरित करण्यात आला आहे. आम्ही अचूकतेसाठी प्रयत्नशील असलो तरी कृपया लक्षात ठेवा की स्वयंचलित भाषांतरे त्रुटी किंवा अचूकतेच्या अभावाने युक्त असू शकतात. मूळ भाषेतील दस्तऐवज हा अधिकृत स्रोत मानला जावा. महत्त्वाच्या माहितीसाठी व्यावसायिक मानवी भाषांतराची शिफारस केली जाते. या भाषांतराचा वापर करून उद्भवलेल्या कोणत्याही गैरसमज किंवा चुकीच्या अर्थासाठी आम्ही जबाबदार राहणार नाही. |