56 KiB

Raw Permalink Blame History

डेटा नैतिकतेची ओळख


डेटा सायन्स नैतिकता - Sketchnote by @nitya

आपण सर्वजण डेटा-आधारित जगात डेटा नागरिक म्हणून जगत आहोत.

मार्केट ट्रेंड्स सांगतात की 2022 पर्यंत, प्रत्येक तीन मोठ्या संस्थांपैकी एक आपला डेटा ऑनलाइन Marketplaces and Exchanges द्वारे खरेदी आणि विक्री करेल. अ‍ॅप डेव्हलपर्स म्हणून, आपल्याला डेटा-आधारित अंतर्दृष्टी आणि अल्गोरिदम-आधारित ऑटोमेशन रोजच्या वापरकर्ता अनुभवांमध्ये समाविष्ट करणे सोपे आणि स्वस्त होईल. परंतु AI सर्वत्र पसरत असताना, आपल्याला अशा अल्गोरिदमच्या weaponization मुळे होणारे संभाव्य नुकसान देखील समजून घेणे आवश्यक आहे.

ट्रेंड्स असेही सूचित करतात की 2025 पर्यंत आपण 180 zettabytes डेटा तयार करू आणि वापरू. डेटा सायंटिस्ट्स म्हणून, यामुळे आपल्याला वैयक्तिक डेटावर अभूतपूर्व स्तरावर प्रवेश मिळतो. याचा अर्थ असा की आपण वापरकर्त्यांचे वर्तनात्मक प्रोफाइल तयार करू शकतो आणि निर्णय घेण्यावर प्रभाव टाकू शकतो ज्यामुळे illusion of free choice निर्माण होतो, तर वापरकर्त्यांना आपल्याला हवे असलेले परिणाम मिळविण्यासाठी प्रेरित करू शकतो. यामुळे डेटा गोपनीयता आणि वापरकर्ता संरक्षण यासंबंधी व्यापक प्रश्न देखील निर्माण होतात.

डेटा नैतिकता आता डेटा सायन्स आणि अभियांत्रिकीसाठी आवश्यक मार्गदर्शक बनली आहे, ज्यामुळे आपल्याला डेटा-आधारित कृतींमुळे होणारे संभाव्य नुकसान आणि अनपेक्षित परिणाम कमी करण्यास मदत होते. Gartner Hype Cycle for AI डिजिटल नैतिकता, जबाबदार AI, आणि AI गव्हर्नन्समधील संबंधित ट्रेंड्स ओळखतो, जे AI च्या लोकशाहीकरण आणि औद्योगिकीकरण यासारख्या मोठ्या प्रवृत्तींना चालना देतात.

या धड्यात, आपण डेटा नैतिकतेच्या आकर्षक क्षेत्राचा अभ्यास करू - मूलभूत संकल्पना आणि आव्हाने, केस स्टडीज आणि गव्हर्नन्ससारख्या लागू केलेल्या AI संकल्पनांपर्यंत - ज्यामुळे डेटा आणि AI सह काम करणाऱ्या संघ आणि संस्थांमध्ये नैतिकतेची संस्कृती निर्माण होण्यास मदत होते.

पूर्व-व्याख्यान प्रश्नमंजुषा 🎯

मूलभूत संज्ञा

चला मूलभूत शब्दसंग्रह समजून घेण्यापासून सुरुवात करूया.

"नैतिकता" हा शब्द ग्रीक शब्द "ethikos" (आणि त्याचा मूळ "ethos") यावरून आला आहे, ज्याचा अर्थ स्वभाव किंवा नैतिक स्वरूप असा आहे.

नैतिकता म्हणजे समाजातील आपल्या वर्तनावर नियंत्रण ठेवणाऱ्या सामायिक मूल्ये आणि नैतिक तत्त्वे. नैतिकता कायद्यांवर आधारित नसून "योग्य विरुद्ध अयोग्य" याबद्दलच्या व्यापकपणे स्वीकारलेल्या मानदंडांवर आधारित असते. तथापि, नैतिक विचार कॉर्पोरेट गव्हर्नन्स उपक्रम आणि सरकारी नियमांवर प्रभाव टाकू शकतात, जे अनुपालनासाठी अधिक प्रोत्साहन निर्माण करतात.

डेटा नैतिकता ही नैतिकतेची नवीन शाखा आहे जी "डेटा, अल्गोरिदम आणि संबंधित पद्धती" यांच्याशी संबंधित नैतिक समस्यांचा अभ्यास आणि मूल्यांकन करते. येथे, "डेटा" निर्मिती, नोंदणी, व्यवस्थापन, प्रक्रिया, प्रसार, सामायिकरण आणि वापराशी संबंधित क्रियांवर लक्ष केंद्रित करते, "अल्गोरिदम" AI, एजंट्स, मशीन लर्निंग आणि रोबोट्सवर लक्ष केंद्रित करते, आणि "पद्धती" जबाबदार नवकल्पना, प्रोग्रामिंग, हॅकिंग आणि नैतिकता कोड्स यासारख्या विषयांवर लक्ष केंद्रित करते.

लागू नैतिकता म्हणजे नैतिक विचारांचा व्यावहारिक उपयोग. हे वास्तविक जगातील कृती, उत्पादने आणि प्रक्रिया यांच्या संदर्भात नैतिक समस्यांचा सक्रियपणे तपास करण्याची प्रक्रिया आहे आणि परिभाषित नैतिक मूल्यांशी सुसंगत राहण्यासाठी सुधारात्मक उपाययोजना करणे.

नैतिकता संस्कृती म्हणजे लागू नैतिकतेचे कार्यान्वयन जेणेकरून आपल्या नैतिक तत्त्वे आणि पद्धती संपूर्ण संस्थेत सातत्यपूर्ण आणि प्रमाणित पद्धतीने स्वीकारल्या जातील. यशस्वी नैतिकता संस्कृती संस्थात्मक स्तरावर नैतिक तत्त्वे परिभाषित करतात, अनुपालनासाठी अर्थपूर्ण प्रोत्साहन प्रदान करतात आणि संस्थेच्या प्रत्येक स्तरावर इच्छित वर्तन प्रोत्साहित करून आणि वाढवून नैतिकता मानदंड मजबूत करतात.

नैतिकता संकल्पना

या विभागात, आपण सामायिक मूल्ये (तत्त्वे) आणि नैतिक आव्हाने (समस्या) यासारख्या संकल्पनांवर चर्चा करू - आणि केस स्टडीज एक्सप्लोर करू जे आपल्याला वास्तविक जगातील संदर्भांमध्ये या संकल्पना समजून घेण्यास मदत करतात.

1. नैतिक तत्त्वे

प्रत्येक डेटा नैतिकता धोरणाची सुरुवात नैतिक तत्त्वे परिभाषित करण्यापासून होते - "सामायिक मूल्ये" जी स्वीकारार्ह वर्तनाचे वर्णन करतात आणि आपल्या डेटा आणि AI प्रकल्पांमध्ये अनुपालन कृतींना मार्गदर्शन करतात. आपण ही तत्त्वे वैयक्तिक किंवा संघ स्तरावर परिभाषित करू शकता. तथापि, बहुतेक मोठ्या संस्था कॉर्पोरेट स्तरावर परिभाषित केलेल्या आणि सर्व संघांमध्ये सातत्याने लागू केलेल्या नैतिक AI मिशन स्टेटमेंट किंवा फ्रेमवर्कमध्ये याचे वर्णन करतात.

उदाहरण: Microsoft च्या Responsible AI मिशन स्टेटमेंटमध्ये असे म्हटले आहे: "आम्ही लोकांना प्रथम स्थान देणाऱ्या नैतिक तत्त्वांद्वारे चालवलेल्या AI च्या प्रगतीसाठी वचनबद्ध आहोत" - खालील फ्रेमवर्कमध्ये 6 नैतिक तत्त्वे ओळखली आहेत:

चला या तत्त्वांचा थोडक्यात अभ्यास करूया. पारदर्शकता आणि जबाबदारी ही मूलभूत मूल्ये आहेत ज्यावर इतर तत्त्वे आधारित आहेत - त्यामुळे तिथून सुरुवात करूया:

जबाबदारी डेटा आणि AI ऑपरेशन्ससाठी, तसेच नैतिक तत्त्वांचे अनुपालन सुनिश्चित करण्यासाठी व्यावसायिकांना जबाबदार बनवते.
पारदर्शकता सुनिश्चित करते की डेटा आणि AI क्रिया वापरकर्त्यांसाठी समजण्यासारख्या (interpretative) असाव्यात, निर्णयांमागील काय आणि का स्पष्ट करते.
न्याय - AI सर्व लोकांशी न्यायाने वागते याची खात्री करण्यावर लक्ष केंद्रित करते, डेटा आणि प्रणालींमधील कोणत्याही प्रणालीगत किंवा अप्रत्यक्ष सामाजिक-तांत्रिक पक्षपातांना संबोधित करते.
विश्वसनीयता आणि सुरक्षा - AI सुसंगतपणे परिभाषित मूल्यांसह वागते याची खात्री करते, संभाव्य नुकसान किंवा अनपेक्षित परिणाम कमी करते.
गोपनीयता आणि सुरक्षा - डेटा वंशावळ समजून घेणे आणि वापरकर्त्यांना डेटा गोपनीयता आणि संबंधित संरक्षण प्रदान करणे याबद्दल आहे.
समावेशकता - AI सोल्यूशन्स हेतूनुसार डिझाइन करण्याबद्दल आहे, त्यांना विविध मानवी गरजा आणि क्षमता पूर्ण करण्यासाठी अनुकूलित करणे.

🚨 आपल्या डेटा नैतिकता मिशन स्टेटमेंट काय असू शकते याचा विचार करा. इतर संस्थांकडून नैतिक AI फ्रेमवर्क एक्सप्लोर करा - येथे IBM, Google, आणि Facebook चे उदाहरणे आहेत. त्यांच्यात कोणती सामायिक मूल्ये आहेत? ते ज्या AI उत्पादन किंवा उद्योगात कार्य करतात त्यांच्याशी ही तत्त्वे कशी संबंधित आहेत?

2. नैतिक आव्हाने

एकदा आपण नैतिक तत्त्वे परिभाषित केली की, पुढील पायरी म्हणजे आपल्या डेटा आणि AI क्रिया त्या सामायिक मूल्यांशी जुळतात का हे मूल्यांकन करणे. आपल्या कृतींचा विचार दोन श्रेणींमध्ये करा: डेटा संकलन आणि अल्गोरिदम डिझाइन.

डेटा संकलनासह, कृतींमध्ये वैयक्तिक डेटा किंवा ओळखण्यायोग्य जिवंत व्यक्तींसाठी वैयक्तिक ओळखण्यायोग्य माहिती (PII) समाविष्ट असते. यामध्ये विविध प्रकारचे गैर-वैयक्तिक डेटा समाविष्ट असतो जो सामूहिकपणे व्यक्तीला ओळखतो. नैतिक आव्हाने डेटा गोपनीयता, डेटा मालकी, आणि संबंधित विषय जसे की सहमती आणि बौद्धिक मालमत्तेचे अधिकार यासंबंधी असू शकतात.

अल्गोरिदम डिझाइनसह, कृतींमध्ये डेटासेट्स गोळा करणे आणि व्यवस्थापित करणे, नंतर त्यांचा वापर करून डेटा मॉडेल्स तयार करणे आणि वास्तविक जगातील संदर्भांमध्ये निर्णयांची भविष्यवाणी करणे किंवा स्वयंचलित करणे समाविष्ट असते. नैतिक आव्हाने डेटासेट पक्षपात, डेटा गुणवत्ता समस्या, अन्याय, आणि अल्गोरिदममधील चुकीचे प्रतिनिधित्व यामुळे उद्भवू शकतात - ज्यामध्ये काही समस्या प्रणालीगत असू शकतात.

दोन्ही बाबतीत, नैतिक आव्हाने अशा क्षेत्रांवर प्रकाश टाकतात जिथे आपल्या कृतींमध्ये सामायिक मूल्यांशी संघर्ष होऊ शकतो. या चिंतेचा शोध घेण्यासाठी, कमी करण्यासाठी, कमी करण्यासाठी किंवा दूर करण्यासाठी - आपल्याला आपल्या कृतींशी संबंधित नैतिक "होय/नाही" प्रश्न विचारण्याची आवश्यकता आहे आणि नंतर आवश्यकतेनुसार सुधारात्मक कृती करणे आवश्यक आहे. चला काही नैतिक आव्हाने आणि त्यांनी उपस्थित केलेल्या नैतिक प्रश्नांचा अभ्यास करूया:

2.1 डेटा मालकी

डेटा संकलनामध्ये अनेकदा डेटा विषयांना ओळखणारा वैयक्तिक डेटा समाविष्ट असतो. डेटा मालकी म्हणजे डेटा निर्मिती, प्रक्रिया आणि प्रसाराशी संबंधित नियंत्रण आणि वापरकर्ता अधिकार.

आपल्याला विचारायचे नैतिक प्रश्न:

डेटा कोणाचा आहे? (वापरकर्ता किंवा संस्था)
डेटा विषयांना कोणते अधिकार आहेत? (उदा: प्रवेश, विलोपन, पोर्टेबिलिटी)
संस्थांना कोणते अधिकार आहेत? (उदा: दुर्भावनायुक्त वापरकर्ता पुनरावलोकने सुधारित करणे)

2.2 माहितीपूर्ण सहमती

माहितीपूर्ण सहमती म्हणजे वापरकर्त्यांनी (डेटा संकलनासारख्या) कृतीसाठी संपूर्ण समज असलेल्या संबंधित तथ्यांसह, जसे की उद्देश, संभाव्य धोके, आणि पर्याय, सहमती देणे.

येथे विचारायचे प्रश्न:

वापरकर्त्याने (डेटा विषयाने) डेटा कॅप्चर आणि वापरासाठी परवानगी दिली आहे का?
वापरकर्त्याला डेटा कॅप्चर करण्याचा उद्देश समजला आहे का?
वापरकर्त्याला त्यांच्या सहभागामुळे संभाव्य धोके समजले आहेत का?

2.3 बौद्धिक मालमत्ता

बौद्धिक मालमत्ता म्हणजे मानवी उपक्रमातून निर्माण झालेली अमूर्त निर्मिती, ज्याला व्यक्ती किंवा व्यवसायांसाठी आर्थिक मूल्य असू शकते.

येथे विचारायचे प्रश्न:

गोळा केलेल्या डेटाला वापरकर्ता किंवा व्यवसायासाठी आर्थिक मूल्य आहे का?
येथे वापरकर्त्याला बौद्धिक मालमत्ता आहे का?
येथे संस्थेला बौद्धिक मालमत्ता आहे का?
जर हे अधिकार अस्तित्वात असतील, तर आपण त्यांचे संरक्षण कसे करत आहोत?

2.4 डेटा गोपनीयता

डेटा गोपनीयता किंवा माहिती गोपनीयता म्हणजे वैयक्तिक ओळखण्यायोग्य माहितीच्या संदर्भात वापरकर्त्याच्या गोपनीयतेचे संरक्षण आणि ओळख संरक्षण.

येथे विचारायचे प्रश्न:

वापरकर्त्यांचा (वैयक्तिक) डेटा हॅक आणि लीकपासून सुरक्षित आहे का?
वापरकर्त्यांचा डेटा केवळ अधिकृत वापरकर्त्यांना आणि संदर्भांना उपलब्ध आहे का?
डेटा सामायिक किंवा प्रसारित करताना वापरकर्त्यांची अनामिकता संरक्षित आहे का?
अनामिक डेटासेट्समधून वापरकर्त्याला ओळखण्यायोग्य बनवता येते का?

2.5 विस्मरणाचा अधिकार

विस्मरणाचा अधिकार किंवा विलोपनाचा अधिकार वापरकर्त्यांना अतिरिक्त वैयक्तिक डेटा संरक्षण प्रदान करतो. विशेषतः, हे वापरकर्त्यांना इंटरनेट शोध आणि इतर ठिकाणांमधून वैयक्तिक डेटा हटविण्याची किंवा काढून टाकण्याची विनंती करण्याचा अधिकार देते, विशिष्ट परिस्थितीत - त्यांना ऑनलाइन नवीन सुरुवात करण्याची परवानगी देते ज्यामध्ये त्यांच्या भूतकाळातील कृती त्यांच्याविरुद्ध धरल्या जात नाहीत.

येथे विचारायचे प्रश्न:

प्रणाली डेटा विषयांना विलोपनाची विनंती करण्याची परवानगी देते का?
वापरकर्त्याच्या सहमतीच्या मागे घेण्याने स्वयंचलित विलोपन ट्रिगर करावे का?
डेटा सहमतीशिवाय किंवा बेकायदेशीर मार्गाने गोळा केला गेला होता का?
डेटा गोपनीयतेसाठी सरकारी नियमांचे पालन केले आहे का?

2.6 डेटासेट पक्षपात

डेटासेट किंवा संकलन पक्षपात म्हणजे अल्गोरिदम विकासासाठी अप्रतिनिधिक डेटा उपसंच निवडणे, विविध गटांसाठी संभाव्य अन्याय निर्माण करणे. पक्षपाताचे प्रकार निवड किंवा नमुना पक्षपात, स्वयंसेवक पक्षपात, आणि साधन पक्षपात यांचा समावेश करतात.

येथे विचारायचे प्रश्न:

आपण डेटा विषयांचा प्रतिनिधिक संच भरती केला आहे का?
आपण विविध पक्षपातांसाठी गोळा केलेला किंवा व्यवस्थापित केलेला डेटासेट Algorithm Fairness तपासते की अल्गोरिदम डिझाइन विशिष्ट उपसमूहांवर अन्यायकारकपणे भेदभाव करते का, ज्यामुळे वाटप (जिथे संसाधने त्या गटाला नाकारली जातात किंवा रोखली जातात) आणि सेवेची गुणवत्ता (जिथे AI काही उपसमूहांसाठी इतरांइतकी अचूक नसते) यामध्ये संभाव्य नुकसान होऊ शकते.

येथे विचार करण्यासाठी काही प्रश्न:

विविध उपसमूह आणि परिस्थितींसाठी मॉडेल अचूकतेचे मूल्यांकन केले का?
संभाव्य नुकसान (उदा., रूढीवादी विचारसरणी) तपासले का?
ओळखलेल्या नुकसानीस कमी करण्यासाठी डेटा सुधारित किंवा मॉडेल पुन्हा प्रशिक्षित करू शकतो का?

AI Fairness checklists सारख्या संसाधनांचा अभ्यास करा.

2.9 चुकीचे प्रतिनिधित्व

Data Misrepresentation म्हणजे आपण प्रामाणिकपणे नोंदवलेल्या डेटामधून अंतर्दृष्टी अशा प्रकारे सादर करत आहोत का ज्यामुळे इच्छित कथानकाला पाठिंबा मिळतो, परंतु ते फसवणूक करणारे आहे.

येथे विचार करण्यासाठी काही प्रश्न:

आम्ही अपूर्ण किंवा अचूक नसलेला डेटा नोंदवत आहोत का?
आम्ही डेटा अशा प्रकारे व्हिज्युअलाइज करत आहोत का ज्यामुळे चुकीचे निष्कर्ष काढले जातात?
आम्ही निवडक सांख्यिकीय तंत्र वापरून परिणामांमध्ये फेरफार करत आहोत का?
वेगळे निष्कर्ष देऊ शकणारे पर्यायी स्पष्टीकरण आहेत का?

2.10 स्वातंत्र्याची भ्रमजाल

Illusion of Free Choice तेव्हा उद्भवते जेव्हा प्रणाली "चॉइस आर्किटेक्चर" निर्णय घेण्याच्या अल्गोरिदमचा वापर लोकांना इच्छित परिणामाकडे वळवण्यासाठी करते, परंतु त्यांना पर्याय आणि नियंत्रण असल्याचे भासवते. हे डार्क पॅटर्न्स वापरकर्त्यांना सामाजिक आणि आर्थिक नुकसान पोहोचवू शकतात. कारण वापरकर्त्याचे निर्णय वर्तन प्रोफाइलवर परिणाम करतात, त्यामुळे या कृती भविष्यातील निवडींवर परिणाम करू शकतात आणि या नुकसानीचा प्रभाव वाढवू शकतात.

येथे विचार करण्यासाठी काही प्रश्न:

वापरकर्त्याला त्या निवडीचे परिणाम समजले का?
वापरकर्त्याला (पर्यायी) पर्याय आणि प्रत्येकाचे फायदे व तोटे माहित होते का?
वापरकर्त्याला स्वयंचलित किंवा प्रभावित निवड नंतर उलटवता येते का?

3. केस स्टडीज

या नैतिक आव्हानांना वास्तविक जीवनातील संदर्भात ठेवण्यासाठी, अशा केस स्टडीजकडे पाहणे उपयुक्त ठरते ज्यामध्ये नैतिक उल्लंघनांकडे दुर्लक्ष केल्यास व्यक्ती आणि समाजावर संभाव्य नुकसान आणि परिणाम कसे होतात हे स्पष्ट होते.

येथे काही उदाहरणे आहेत:

नैतिक आव्हान	केस स्टडी
सहमतीची माहिती	1972 - Tuskegee Syphilis Study - अभ्यासात सहभागी झालेल्या आफ्रिकन अमेरिकन पुरुषांना मोफत वैद्यकीय सेवा देण्याचे आश्वासन दिले गेले पण फसवले गेले कारण संशोधकांनी विषयांना त्यांच्या निदानाची किंवा उपचार उपलब्धतेची माहिती दिली नाही. अनेक विषयांचा मृत्यू झाला आणि त्यांच्या जोडीदार किंवा मुलांवर परिणाम झाला; अभ्यास 40 वर्षे चालला.
डेटा गोपनीयता	2007 - Netflix data prize संशोधकांना 50K ग्राहकांकडून 10M अनामित चित्रपट रेटिंग प्रदान केले गेले जेणेकरून शिफारस अल्गोरिदम सुधारता येईल. तथापि, संशोधकांनी अनामित डेटा बाह्य डेटासेट्स (उदा., IMDb टिप्पण्या) मधील वैयक्तिक ओळखण्यायोग्य डेटाशी जोडला - काही Netflix सदस्यांना "डि-अनॉनिमाइझ" केले.
संकलन पक्षपात	2013 - बोस्टन शहराने Street Bump विकसित केले, एक अॅप ज्याद्वारे नागरिकांना खड्ड्यांची माहिती देण्याची परवानगी दिली गेली, ज्यामुळे शहराला रस्त्यावरील समस्यांचे निराकरण करण्यासाठी चांगला डेटा मिळाला. तथापि, कमी उत्पन्न गटातील लोकांना कार आणि फोनचा कमी प्रवेश होता, ज्यामुळे त्यांच्या रस्त्यावरील समस्या या अॅपमध्ये अदृश्य झाल्या. विकासकांनी समान प्रवेश आणि डिजिटल विभाग समस्यांवर न्याय्यतेसाठी शैक्षणिक संस्थांशी काम केले.
अल्गोरिदम न्याय	2018 - MIT Gender Shades Study ने लिंग वर्गीकरण AI उत्पादनांची अचूकता मूल्यांकन केली, महिलांसाठी आणि रंगाच्या व्यक्तींसाठी अचूकतेतील अंतर उघड केले. 2019 Apple Card पुरुषांपेक्षा महिलांना कमी क्रेडिट देत असल्याचे दिसून आले. दोन्ही उदाहरणांमध्ये अल्गोरिदम पक्षपातामुळे सामाजिक-आर्थिक नुकसान झाले.
डेटा चुकीचे प्रतिनिधित्व	2020 - Georgia Department of Public Health ने COVID-19 चार्ट्स जारी केले ज्यामुळे नागरिकांना पुष्टी झालेल्या प्रकरणांतील ट्रेंडबद्दल चुकीचे दिशाभूल करण्याची शक्यता होती, x-अक्षावर गैर-कालक्रमिक क्रमवारीसह. हे व्हिज्युअलायझेशन युक्त्यांद्वारे चुकीचे प्रतिनिधित्व दाखवते.
स्वातंत्र्याची भ्रमजाल	2020 - शिक्षण अॅप ABCmouse ने FTC तक्रारीचे $10M देऊन सेटलमेंट केले जिथे पालकांना सदस्यता रद्द करता येत नव्हती. हे निवडीच्या आर्किटेक्चरमधील डार्क पॅटर्न्सचे उदाहरण देते, जिथे वापरकर्त्यांना संभाव्य हानिकारक निवडींकडे वळवले गेले.
डेटा गोपनीयता आणि वापरकर्त्याचे अधिकार	2021 - Facebook Data Breach ने 530M वापरकर्त्यांचा डेटा उघड केला, ज्यामुळे FTC ला $5B सेटलमेंट मिळाले. तथापि, वापरकर्त्यांना उल्लंघनाची सूचना देण्यास नकार दिला, डेटा पारदर्शकता आणि प्रवेशाबाबत वापरकर्त्याच्या अधिकारांचे उल्लंघन केले.

अधिक केस स्टडीज शोधू इच्छिता? या संसाधनांचा अभ्यास करा:

Ethics Unwrapped - विविध उद्योगांमधील नैतिक समस्यांचे उदाहरण.
Data Science Ethics course - महत्त्वाच्या केस स्टडीजचा अभ्यास.
Where things have gone wrong - डिऑन चेकलिस्टसह उदाहरणे.

🚨 तुम्ही पाहिलेल्या केस स्टडीजचा विचार करा - तुमच्या जीवनात तुम्हाला अशाच प्रकारच्या नैतिक आव्हानाचा अनुभव आला आहे का किंवा त्याचा परिणाम झाला आहे का? तुम्ही या विभागात चर्चा केलेल्या नैतिक आव्हानांपैकी एका उदाहरणाचे चित्रण करणारी किमान एक केस स्टडी विचार करू शकता का?

लागू नैतिकता

आम्ही नैतिकता संकल्पना, आव्हाने आणि वास्तविक जीवनातील संदर्भातील केस स्टडीजबद्दल चर्चा केली आहे. पण आपल्या प्रकल्पांमध्ये नैतिक तत्त्वे आणि पद्धती लागू करण्यास कसे सुरुवात करावी? आणि चांगल्या प्रशासनासाठी या पद्धती ऑपरेशनलाइज कशा कराव्यात? काही वास्तविक उपाय शोधूया:

1. व्यावसायिक संहिता

व्यावसायिक संहिता संस्थांना त्यांच्या नैतिक तत्त्वांना आणि मिशन स्टेटमेंटला पाठिंबा देण्यासाठी सदस्यांना "प्रोत्साहन" देण्याचा एक पर्याय देते. संहिता व्यावसायिक वर्तनासाठी नैतिक मार्गदर्शक तत्त्वे आहेत, ज्यामुळे कर्मचारी किंवा सदस्य त्यांच्या संस्थेच्या तत्त्वांशी जुळणारे निर्णय घेऊ शकतात. सदस्यांकडून स्वेच्छेने अनुपालन केल्यास ते चांगले असते; तथापि, अनेक संस्था सदस्यांकडून अनुपालन करण्यासाठी अतिरिक्त बक्षिसे आणि दंड देतात.

उदाहरणे:

Oxford Munich Code of Ethics
Data Science Association Code of Conduct (2013 मध्ये तयार केले)
ACM Code of Ethics and Professional Conduct (1993 पासून)

🚨 तुम्ही व्यावसायिक अभियांत्रिकी किंवा डेटा विज्ञान संस्थेचे सदस्य आहात का? त्यांच्या साइटचा अभ्यास करा की त्यांनी व्यावसायिक नैतिकतेची संहिता परिभाषित केली आहे का. त्यांच्या नैतिक तत्त्वांबद्दल काय सांगते? ते सदस्यांना संहितेचे पालन करण्यासाठी कसे "प्रोत्साहन" देत आहेत?

2. नैतिकता चेकलिस्ट

व्यावसायिक संहिता व्यावसायिकांकडून आवश्यक नैतिक वर्तन परिभाषित करतात, परंतु मोठ्या प्रमाणावर प्रकल्पांमध्ये अंमलबजावणीमध्ये मर्यादा आहेत. त्याऐवजी, अनेक डेटा विज्ञान तज्ञ चेकलिस्ट ची वकिली करतात, ज्यामुळे तत्त्वे पद्धतींशी जोडली जाऊ शकतात अधिक ठोस आणि कृतीक्षम मार्गांनी.

चेकलिस्ट प्रश्नांना "होय/नाही" कार्यांमध्ये रूपांतरित करतात ज्यांना ऑपरेशनलाइज करता येते, ज्यामुळे त्यांना मानक उत्पादन रिलीज वर्कफ्लोचा भाग म्हणून ट्रॅक करता येते.

उदाहरणे:

Deon - उद्योगाच्या शिफारशींमधून तयार केलेली सामान्य-उद्देश डेटा नैतिकता चेकलिस्ट, सोपी एकत्रीकरणासाठी कमांड-लाइन टूलसह.
Privacy Audit Checklist - कायदेशीर आणि सामाजिक प्रदर्शनाच्या दृष्टिकोनातून माहिती हाताळण्याच्या पद्धतींसाठी सामान्य मार्गदर्शन प्रदान करते.
AI Fairness Checklist - AI विकास चक्रांमध्ये न्याय्यतेच्या तपासणीचा अवलंब आणि समाकलन समर्थन करण्यासाठी AI व्यावसायिकांनी तयार केले.
22 questions for ethics in data and AI - अधिक खुले फ्रेमवर्क, डिझाइन, अंमलबजावणी आणि संस्थात्मक संदर्भांमध्ये नैतिक समस्यांच्या प्रारंभिक अन्वेषणासाठी संरचित.

3. नैतिकता नियम

नैतिकता म्हणजे सामायिक मूल्ये परिभाषित करणे आणि स्वेच्छेने योग्य गोष्ट करणे. अनुपालन म्हणजे कायदा पाळणे जर आणि जिथे परिभाषित केले असेल. प्रशासन म्हणजे संस्थांमध्ये नैतिक तत्त्वे अंमलात आणण्यासाठी आणि स्थापित कायद्यांचे पालन करण्यासाठी कार्य करण्याच्या सर्व मार्गांचा समावेश आहे.

आज, संस्थांमध्ये प्रशासन दोन प्रकारे घेतले जाते. प्रथम, हे नैतिक AI तत्त्वे परिभाषित करण्याबद्दल आहे आणि संस्थेतील सर्व AI-संबंधित प्रकल्पांमध्ये अवलंबन अंमलात आणण्यासाठी पद्धती स्थापित करण्याबद्दल आहे. दुसरे म्हणजे, ते कार्यरत असलेल्या प्रदेशांसाठी सर्व सरकारी-मंडेटेड डेटा संरक्षण नियमांचे पालन करण्याबद्दल आहे.

डेटा संरक्षण आणि गोपनीयता नियमांची उदाहरणे:

1974, US Privacy Act - फेडरल सरकार वैयक्तिक माहितीचे संकलन, वापर आणि प्रकटीकरण नियंत्रित करते.
1996, US Health Insurance Portability & Accountability Act (HIPAA) - वैयक्तिक आरोग्य डेटा संरक्षित करते.
1998, US Children's Online Privacy Protection Act (COPPA) - 13 वर्षांखालील मुलांच्या डेटा गोपनीयतेचे संरक्षण करते.
2018, General Data Protection Regulation (GDPR) - वापरकर्त्याचे अधिकार, डेटा संरक्षण आणि गोपनीयता प्रदान करते.
2018, California Consumer Privacy Act (CCPA) ग्राहकांना त्यांच्या (वैयक्तिक) डेटावर अधिक अधिकार देते.
2021, चीनचे Personal Information Protection Law नुकतेच मंजूर झाले, जगातील सर्वात मजबूत ऑनलाइन डेटा गोपनीयता नियम तयार करत आहे.

🚨 युरोपियन युनियनने परिभाषित केलेले GDPR (General Data Protection Regulation) आज सर्वात प्रभावशाली डेटा गोपनीयता नियमांपैकी एक आहे. तुम्हाला माहित आहे का की ते नागरिकांच्या डिजिटल गोपनीयता आणि वैयक्तिक डेटाचे संरक्षण करण्यासाठी 8 वापरकर्ता अधिकार देखील परिभाषित करते? हे काय आहेत आणि ते का महत्त्वाचे आहेत याबद्दल जाणून घ्या.

4. नैतिकता संस्कृती

लक्षात घ्या की अनुपालन (कायद्याच्या "अक्षर" पूर्ण करण्यासाठी पुरेसे करणे) आणि प्रणालीगत समस्यांचे निराकरण करणे (जसे की ऑसिफिकेशन, माहिती विषमता आणि वितरणात्मक अन्याय) यामध्ये अदृश्य अंतर आहे जे AI च्या शस्त्रीकरणाला गती देऊ शकते.

उत्तरार्धासाठी नैतिकता संस्कृती परिभाषित करण्यासाठी सहयोगात्मक दृष्टिकोन आवश्यक आहे जे भावनिक कनेक्शन आणि उद्योगातील संस्थांमध्ये सातत्यपूर्ण सामायिक मूल्ये तयार करतात. यासाठी संस्थांमध्ये अधिक औपचारिक डेटा नैतिकता संस्कृती आवश्यक आहे - कोणालाही अँडॉन कॉर्ड खेचण्याची परवानगी देणे (प्रक्रियेत लवकर नैतिक चिंता वाढवण्यासाठी) आणि AI प्रकल्पांमध्ये टीम तयार करण्यासाठी नैतिक मूल्यांकन (उदा., भरतीमध्ये) मुख्य निकष बनवणे.

Post-lecture quiz 🎯

पुनरावलोकन आणि स्व-अभ्यास

कोर्सेस आणि पुस्तके मुख्य नैतिकता संकल्पना आणि आव्हाने समजून घेण्यास मदत करतात, तर केस स्टडीज आणि साधने वास्तविक जीवनातील संदर्भात लागू नैतिकता पद्धतींमध्ये मदत करतात. सुरुवात करण्यासाठी येथे काही संसाधने आहेत.

Machine Learning For Beginners - Microsoft
जबाबदार AI च्या तत्त्वांचे मार्गदर्शन - Microsoft Learn कडून मोफत शिक्षण मार्ग.
नैतिकता आणि डेटा विज्ञान - O'Reilly ईबुक (M. Loukides, H. Mason इ.)
डेटा विज्ञान नैतिकता - मिशिगन विद्यापीठाचा ऑनलाइन कोर्स.
नैतिकता अनरॅप्ड - टेक्सास विद्यापीठाकडून केस स्टडीज.

असाइनमेंट

डेटा नैतिकतेसाठी केस स्टडी लिहा

अस्वीकरण:
हा दस्तऐवज AI भाषांतर सेवा Co-op Translator वापरून भाषांतरित करण्यात आला आहे. आम्ही अचूकतेसाठी प्रयत्नशील असलो तरी कृपया लक्षात ठेवा की स्वयंचलित भाषांतरे त्रुटी किंवा अचूकतेच्या अभावाने युक्त असू शकतात. मूळ भाषेतील दस्तऐवज हा अधिकृत स्रोत मानला जावा. महत्त्वाच्या माहितीसाठी व्यावसायिक मानवी भाषांतराची शिफारस केली जाते. या भाषांतराचा वापर करून उद्भवलेल्या कोणत्याही गैरसमज किंवा चुकीच्या अर्थासाठी आम्ही जबाबदार राहणार नाही.

56 KiB Raw Permalink Blame History

डेटा नैतिकतेची ओळख

पूर्व-व्याख्यान प्रश्नमंजुषा 🎯

मूलभूत संज्ञा

नैतिकता संकल्पना

1. नैतिक तत्त्वे

2. नैतिक आव्हाने

2.1 डेटा मालकी

2.2 माहितीपूर्ण सहमती

2.3 बौद्धिक मालमत्ता

2.4 डेटा गोपनीयता

2.5 विस्मरणाचा अधिकार

2.6 डेटासेट पक्षपात

2.9 चुकीचे प्रतिनिधित्व

2.10 स्वातंत्र्याची भ्रमजाल

3. केस स्टडीज

लागू नैतिकता

1. व्यावसायिक संहिता

2. नैतिकता चेकलिस्ट

3. नैतिकता नियम

4. नैतिकता संस्कृती

Post-lecture quiz 🎯

पुनरावलोकन आणि स्व-अभ्यास

असाइनमेंट

56 KiB

Raw Permalink Blame History