|
|
5 months ago | |
|---|---|---|
| .. | ||
| README.md | 5 months ago | |
| assignment.md | 5 months ago | |
README.md
वास्तविक जगातील डेटा सायन्स
![]() |
|---|
| वास्तविक जगातील डेटा सायन्स - Sketchnote by @nitya |
आपल्या शिकण्याच्या प्रवासाचा शेवट जवळ आला आहे!
आपण डेटा सायन्स आणि नैतिकतेच्या व्याख्यांपासून सुरुवात केली, डेटा विश्लेषण आणि व्हिज्युअलायझेशनसाठी विविध साधने आणि तंत्रे शोधली, डेटा सायन्स जीवनचक्राचा आढावा घेतला आणि क्लाउड संगणन सेवांसह डेटा सायन्स वर्कफ्लो स्केलिंग आणि स्वयंचलित करण्याचा विचार केला. त्यामुळे तुम्ही कदाचित विचार करत असाल: "हे सर्व शिकलेले वास्तविक जगातील संदर्भांशी कसे जोडायचे?"
या धड्यात, आपण उद्योगातील डेटा सायन्सच्या वास्तविक-जगातील अनुप्रयोगांचा शोध घेऊ आणि संशोधन, डिजिटल मानविकी आणि शाश्वतता यासारख्या विशिष्ट उदाहरणांमध्ये डुबकी मारू. आपण विद्यार्थ्यांच्या प्रकल्पांच्या संधींचा विचार करू आणि आपल्या शिकण्याच्या प्रवासाला पुढे नेण्यासाठी उपयुक्त संसाधनांसह समाप्त करू!
पूर्व-व्याख्यान प्रश्नमंजुषा
पूर्व-व्याख्यान प्रश्नमंजुषा
डेटा सायन्स + उद्योग
AI च्या लोकशाहीकरणामुळे, विकसकांना आता AI-चालित निर्णय घेणे आणि डेटा-चालित अंतर्दृष्टी वापरकर्ता अनुभवांमध्ये आणि विकास कार्यप्रवाहांमध्ये डिझाइन करणे आणि समाकलित करणे सोपे झाले आहे. येथे डेटा सायन्स उद्योगभर "लागू" कसा केला जातो याची काही उदाहरणे आहेत:
-
Google Flu Trends ने शोध शब्दांचा फ्लू ट्रेंड्सशी संबंध जोडण्यासाठी डेटा सायन्सचा वापर केला. जरी या दृष्टिकोनात त्रुटी होत्या, तरीही याने डेटा-चालित आरोग्यसेवा अंदाजांच्या शक्यता (आणि आव्हाने) याबद्दल जागरूकता निर्माण केली.
-
UPS Routing Predictions - UPS कसे डेटा सायन्स आणि मशीन लर्निंगचा वापर करून हवामान परिस्थिती, वाहतूक नमुने, वितरणाच्या अंतिम मुदती आणि बरेच काही लक्षात घेऊन वितरणासाठी सर्वोत्तम मार्गांचा अंदाज लावतो हे स्पष्ट करते.
-
NYC Taxicab Route Visualization - माहिती स्वातंत्र्य कायद्यांचा वापर करून गोळा केलेल्या डेटाने NYC कॅब्सच्या एका दिवसाचे व्हिज्युअलायझेशन करण्यात मदत केली, ज्यामुळे आम्हाला समजले की ते व्यस्त शहरात कसे नेव्हिगेट करतात, ते किती पैसे कमवतात आणि प्रत्येक 24-तास कालावधीत प्रवास किती काळ टिकतो.
-
Uber Data Science Workbench - दररोज लाखो उबर ट्रिप्समधून गोळा केलेल्या डेटाचा (पिकअप आणि ड्रॉपऑफ स्थान, प्रवासाचा कालावधी, प्राधान्य दिलेले मार्ग इ.) डेटा विश्लेषण साधन तयार करण्यासाठी वापर केला जातो, ज्यामुळे किंमत निर्धारण, सुरक्षा, फसवणूक शोधणे आणि नेव्हिगेशन निर्णय घेण्यात मदत होते.
-
Sports Analytics - प्रेडिक्टिव अॅनालिटिक्स (संघ आणि खेळाडूंचे विश्लेषण - Moneyball विचार करा - आणि चाहत्यांचे व्यवस्थापन) आणि डेटा व्हिज्युअलायझेशन (संघ आणि चाहत्यांचे डॅशबोर्ड, खेळ इ.) वर लक्ष केंद्रित करते, ज्यामध्ये प्रतिभा शोधणे, क्रीडा जुगार आणि इन्व्हेंटरी/स्थळ व्यवस्थापन यासारख्या अनुप्रयोगांचा समावेश आहे.
-
Data Science in Banking - वित्तीय उद्योगातील डेटा सायन्सच्या मूल्यावर प्रकाश टाकते, ज्यामध्ये जोखीम मॉडेलिंग आणि फसवणूक शोधणे, ग्राहक विभागणी, रिअल-टाइम अंदाज आणि शिफारस प्रणाली यासारख्या अनुप्रयोगांचा समावेश आहे. प्रेडिक्टिव अॅनालिटिक्स देखील क्रेडिट स्कोअर्स यांसारख्या महत्त्वाच्या उपाययोजनांना चालना देते.
-
Data Science in Healthcare - वैद्यकीय प्रतिमा (उदा., एमआरआय, एक्स-रे, सीटी-स्कॅन), जीनोमिक्स (डीएनए अनुक्रमण), औषध विकास (जोखीम मूल्यांकन, यशाचा अंदाज), प्रेडिक्टिव अॅनालिटिक्स (रुग्णांची काळजी आणि पुरवठा लॉजिस्टिक्स), रोग ट्रॅकिंग आणि प्रतिबंध यांसारख्या अनुप्रयोगांवर प्रकाश टाकते.
प्रतिमा क्रेडिट: Data Flair: 6 Amazing Data Science Applications
आकृतीत डेटा सायन्स तंत्रे लागू करण्यासाठी इतर डोमेन आणि उदाहरणे दर्शविली आहेत. इतर अनुप्रयोगांचा शोध घ्यायचा आहे? खालील पुनरावलोकन आणि स्व-अभ्यास विभाग तपासा.
डेटा सायन्स + संशोधन
![]() |
|---|
| डेटा सायन्स आणि संशोधन - Sketchnote by @nitya |
वास्तविक-जगातील अनुप्रयोग प्रामुख्याने उद्योगातील मोठ्या प्रमाणातील वापराच्या प्रकरणांवर लक्ष केंद्रित करतात, तर संशोधन अनुप्रयोग आणि प्रकल्प दोन दृष्टिकोनांमधून उपयुक्त ठरू शकतात:
- नाविन्यपूर्ण संधी - प्रगत संकल्पनांचे जलद प्रोटोटाइपिंग आणि पुढील पिढीच्या अनुप्रयोगांसाठी वापरकर्ता अनुभवांची चाचणी घेणे.
- तैनाती आव्हाने - वास्तविक-जगातील संदर्भांमध्ये डेटा सायन्स तंत्रज्ञानाच्या संभाव्य हानी किंवा अनपेक्षित परिणामांची चौकशी करणे.
विद्यार्थ्यांसाठी, हे संशोधन प्रकल्प शिकण्याच्या आणि सहकार्याच्या संधी प्रदान करू शकतात, ज्यामुळे तुमच्या विषयाची समज सुधारेल आणि संबंधित लोक किंवा स्वारस्य असलेल्या क्षेत्रांमध्ये काम करणाऱ्या संघांशी तुमची जागरूकता आणि सहभाग वाढेल. तर संशोधन प्रकल्प कसे दिसतात आणि ते कसा प्रभाव पाडू शकतात?
चला एका उदाहरणावर नजर टाकूया - MIT Gender Shades Study - Joy Buolamwini (MIT Media Labs) यांचे संशोधन प्रकल्प, ज्यामध्ये Timnit Gebru (त्यावेळी Microsoft Research) सह-लेखक असलेल्या संशोधन पेपर वर लक्ष केंद्रित केले आहे.
- काय: संशोधन प्रकल्पाचा उद्देश लिंग आणि त्वचेच्या प्रकारावर आधारित स्वयंचलित चेहर्यावरील विश्लेषण अल्गोरिदम आणि डेटासेट्समधील पूर्वग्रहांचे मूल्यांकन करणे हा होता.
- का: चेहर्यावरील विश्लेषण कायद्याची अंमलबजावणी, विमानतळ सुरक्षा, भरती प्रणाली आणि बरेच काही यासारख्या क्षेत्रांमध्ये वापरले जाते - जिथे चुकीचे वर्गीकरण (उदा., पूर्वग्रहांमुळे) प्रभावित व्यक्ती किंवा गटांना संभाव्य आर्थिक आणि सामाजिक हानी पोहोचवू शकते. पूर्वग्रह समजून घेणे (आणि काढून टाकणे किंवा कमी करणे) हे वापरातील न्यायतेसाठी महत्त्वाचे आहे.
- कसे: संशोधकांनी ओळखले की विद्यमान बेंचमार्कमध्ये प्रामुख्याने हलक्या त्वचेच्या विषयांचा समावेश आहे आणि त्यांनी एक नवीन डेटासेट (1000+ प्रतिमा) तयार केले जे लिंग आणि त्वचेच्या प्रकारानुसार अधिक संतुलित होते. डेटासेटचा वापर तीन लिंग वर्गीकरण उत्पादनांच्या अचूकतेचे मूल्यांकन करण्यासाठी केला गेला (Microsoft, IBM आणि Face++ कडून).
परिणामांनी दाखवले की एकूण वर्गीकरण अचूकता चांगली असली तरी, विविध उपगटांमधील त्रुटी दरांमध्ये लक्षणीय फरक होता - चुकीचे लिंग वर्गीकरण महिलांसाठी किंवा गडद त्वचेच्या प्रकारांसाठी जास्त होते, जे पूर्वग्रह दर्शविते.
महत्त्वाचे परिणाम: डेटा सायन्सला अधिक प्रतिनिधिक डेटासेट्स (संतुलित उपगट) आणि अधिक समावेशक संघ (विविध पार्श्वभूमी) आवश्यक आहेत हे समजून घेण्यासाठी आणि अशा पूर्वग्रहांना AI सोल्यूशन्समध्ये लवकर ओळखण्यासाठी आणि कमी करण्यासाठी जागरूकता निर्माण केली. अशा संशोधन प्रयत्नांमुळे अनेक संस्थांना त्यांच्या AI उत्पादनांमध्ये आणि प्रक्रियांमध्ये न्याय्यतेसाठी जबाबदार AI साठी तत्त्वे आणि पद्धती परिभाषित करण्यात मदत होते.
Microsoft मधील संबंधित संशोधन प्रयत्नांबद्दल जाणून घ्यायचे आहे?
- Microsoft Research Projects वर कृत्रिम बुद्धिमत्तेवरील प्रकल्प तपासा.
- Microsoft Research Data Science Summer School मधील विद्यार्थी प्रकल्प शोधा.
- Fairlearn प्रकल्प आणि Responsible AI उपक्रम तपासा.
डेटा सायन्स + मानविकी
![]() |
|---|
| डेटा सायन्स आणि डिजिटल मानविकी - Sketchnote by @nitya |
डिजिटल मानविकी असे परिभाषित केले गेले आहे की "मानवीय चौकशीसह संगणकीय पद्धती एकत्रित करणाऱ्या पद्धती आणि दृष्टिकोनांचा संग्रह". स्टॅनफोर्ड प्रकल्प जसे की "इतिहासाचा पुनरुज्जीवन" आणि "काव्यात्मक विचार" डिजिटल मानविकी आणि डेटा सायन्स यांच्यातील दुव्याचे उदाहरण देतात - नेटवर्क विश्लेषण, माहिती व्हिज्युअलायझेशन, स्थानिक आणि मजकूर विश्लेषण यांसारख्या तंत्रांवर भर देऊन, ज्यामुळे ऐतिहासिक आणि साहित्यिक डेटासेट्सचा पुनर्विचार करून नवीन अंतर्दृष्टी आणि दृष्टिकोन मिळवता येतो.
या क्षेत्रातील प्रकल्प शोधायचा आणि विस्तारित करायचा आहे?
"Emily Dickinson and the Meter of Mood" तपासा - Jen Looper यांचे एक उत्कृष्ट उदाहरण, जे विचारते की आपण डेटा सायन्सचा वापर करून परिचित कवितांचा पुनर्विचार कसा करू शकतो आणि नवीन संदर्भांमध्ये त्याचा अर्थ आणि लेखकाचे योगदान पुन्हा कसे मूल्यांकन करू शकतो. उदाहरणार्थ, कवितेच्या टोन किंवा भावना विश्लेषणाद्वारे ती कोणत्या ऋतूमध्ये लिहिली गेली याचा अंदाज लावता येतो का - आणि यामुळे संबंधित कालावधीत लेखकाच्या मानसिक स्थितीबद्दल काय सांगते?
त्या प्रश्नाचे उत्तर देण्यासाठी, आपण डेटा सायन्स जीवनचक्राच्या टप्प्यांचे अनुसरण करतो:
डेटा अधिग्रहण- विश्लेषणासाठी संबंधित डेटासेट गोळा करणे. API (उदा., Poetry DB API) वापरणे किंवा वेब पृष्ठे स्क्रॅप करणे (उदा., Project Gutenberg) यासारखे पर्याय.डेटा स्वच्छता- मजकूर कसा स्वरूपित, स्वच्छ आणि सोपा केला जाऊ शकतो हे मूलभूत साधनांचा वापर करून स्पष्ट करते, जसे की Visual Studio Code आणि Microsoft Excel.डेटा विश्लेषण- डेटासेट "नोटबुक्स" मध्ये आयात करून Python पॅकेजेस (जसे की pandas, numpy आणि matplotlib) चा वापर करून डेटा आयोजित आणि व्हिज्युअलायझेशन कसे करावे हे स्पष्ट करते.भावना विश्लेषण- क्लाउड सेवांचा समावेश कसा करावा हे स्पष्ट करते, जसे की Text Analytics, कमी-कोड साधनांचा वापर करून Power Automate स्वयंचलित डेटा प्रक्रिया कार्यप्रवाहांसाठी.
या कार्यप्रवाहाचा वापर करून, आपण कवितांच्या भावनांवर ऋतूंचा प्रभाव शोधू शकतो आणि लेखकाबद्दल आपले स्वतःचे दृष्टिकोन तयार करू शकतो. स्वतः प्रयत्न करा - मग नोटबुक विस्तारित करा, इतर प्रश्न विचारा किंवा डेटाचे नवीन पद्धतीने व्हिज्युअलायझेशन करा!
तुम्ही डिजिटल मानविकी टूलकिट मधील काही साधनांचा वापर करून या चौकशीच्या मार्गांचा पाठपुरावा करू शकता.
डेटा सायन्स + शाश्वतता
![]() |
|---|
| डेटा सायन्स आणि शाश्वतता - Sketchnote by @nitya |
2030 साठी शाश्वत विकासाचा अजेंडा - 2015 मध्ये सर्व संयुक्त राष्ट्र सदस्यांनी स्वीकारलेला - 17 उद्दिष्टे ओळखतो, ज्यामध्ये ग्रहाचे संरक्षण करण्यावर आणि हवामान बदलाच्या परिणामांपासून संरक्षण करण्यावर लक्ष केंद्रित केले आहे. Microsoft Sustainability उपक्रम या उद्दिष्टांचे समर्थन करतो, तंत्रज्ञानाच्या उपायांनी अधिक शाश्वत भविष्ये कशी तयार करता येतील याचा शोध घेतो, आणि 4 उद्दिष्टांवर लक्ष केंद्रित करतो - 2030 पर्यंत कार्बन नकारात्मक, पाण्याचे सकारात्मक, शून्य कचरा आणि जैवविविधता.
या आव्हानांना स्केलेबल आणि वेळेवर हाताळण्यासाठी क्लाउड-स्केल विचार आवश्यक आहे - आणि मोठ्या प्रमाणात डेटा. Planetary Computer उपक्रम डेटा सायंटिस्ट्स आणि विकसकांना या प्रयत्नात मदत करण्यासाठी 4 घटक प्रदान करतो:
-
डेटा कॅटलॉग - पृथ्वी प्रणाली डेटाचे पेटाबाइट्स (मोफत आणि Azure-होस्ट केलेले).
-
Planetary API - वापरकर्त्यांना जागा आणि वेळेनुसार संबंधित प्लॅनेटरी कॉम्प्युटर प्रोजेक्ट सध्या प्रिव्ह्यूमध्ये आहे (सप्टेंबर 2021 पर्यंत) - डेटा सायन्स वापरून टिकाऊ उपायांमध्ये योगदान देण्यासाठी सुरुवात कशी करावी याबद्दल जाणून घ्या.
-
प्रवेशासाठी विनंती करा आणि शोध सुरू करा तसेच सहकाऱ्यांशी संपर्क साधा.
-
डॉक्युमेंटेशन एक्सप्लोर करा जेणेकरून समर्थित डेटासेट्स आणि API समजून घेता येतील.
-
इकोसिस्टम मॉनिटरिंग सारख्या अनुप्रयोगांचा अभ्यास करा जे अनुप्रयोग कल्पनांसाठी प्रेरणा देऊ शकतात.
डेटा व्हिज्युअलायझेशनचा वापर करून हवामान बदल आणि जंगलतोड यासारख्या क्षेत्रांमध्ये महत्त्वपूर्ण अंतर्दृष्टी कशी उघड करता येईल किंवा ती अधिक प्रभावीपणे कशी मांडता येईल याचा विचार करा. किंवा अशा अंतर्दृष्टींचा वापर करून नवीन वापरकर्ता अनुभव तयार करण्याचा विचार करा जे टिकाऊ जीवनासाठी वर्तनात्मक बदलांना प्रेरित करतात.
डेटा सायन्स + विद्यार्थी
आम्ही उद्योग आणि संशोधनातील वास्तविक-जागतिक अनुप्रयोगांबद्दल चर्चा केली आहे आणि डिजिटल ह्युमॅनिटीज आणि टिकाऊपणामध्ये डेटा सायन्स अनुप्रयोगांचे उदाहरणे पाहिले आहेत. तर, डेटा सायन्स नवशिक्यांप्रमाणे आपले कौशल्य कसे विकसित करावे आणि आपले तज्ज्ञ ज्ञान कसे सामायिक करावे?
येथे काही डेटा सायन्स विद्यार्थी प्रकल्प आहेत जे तुम्हाला प्रेरणा देतील.
- MSR डेटा सायन्स समर स्कूल GitHub प्रोजेक्ट्स सह, खालील विषयांचा अभ्यास करत:
- सामग्री संस्कृतीचे डिजिटायझेशन: सिरकपमधील सामाजिक-आर्थिक वितरणांचा अभ्यास - ऑर्नेला अल्टुन्यान आणि क्लेअरमॉन्टमधील टीमकडून, ArcGIS StoryMaps वापरून.
🚀 आव्हान
डेटा सायन्स प्रकल्पांसाठी लेख शोधा जे नवशिक्यांसाठी सोपे आहेत - जसे हे 50 विषय क्षेत्र किंवा हे 21 प्रकल्प कल्पना किंवा सोर्स कोडसह 16 प्रकल्प जे तुम्ही डी-कॉन्स्ट्रक्ट आणि रीमिक्स करू शकता. आणि तुमच्या शिकण्याच्या प्रवासाबद्दल ब्लॉग लिहायला विसरू नका आणि तुमच्या अंतर्दृष्टी आमच्यासोबत शेअर करा.
पोस्ट-लेक्चर क्विझ
पोस्ट-लेक्चर क्विझ
पुनरावलोकन आणि स्व-अभ्यास
अधिक उपयोग प्रकरणे एक्सप्लोर करू इच्छिता? येथे काही संबंधित लेख आहेत:
- डेटा सायन्सचे 17 अनुप्रयोग आणि उदाहरणे - जुलै 2021
- वास्तविक जगातील 11 आश्चर्यकारक डेटा सायन्स अनुप्रयोग - मे 2021
- वास्तविक जगातील डेटा सायन्स - लेख संग्रह
- डेटा सायन्स मध्ये: शिक्षण, कृषी, वित्त, चित्रपट आणि अधिक.
असाइनमेंट
प्लॅनेटरी कॉम्प्युटर डेटासेट एक्सप्लोर करा
अस्वीकरण:
हा दस्तऐवज AI भाषांतर सेवा Co-op Translator वापरून भाषांतरित करण्यात आला आहे. आम्ही अचूकतेसाठी प्रयत्नशील असलो तरी, कृपया लक्षात ठेवा की स्वयंचलित भाषांतरांमध्ये त्रुटी किंवा अचूकतेचा अभाव असू शकतो. मूळ भाषेतील दस्तऐवज हा अधिकृत स्रोत मानावा. महत्त्वाच्या माहितीसाठी व्यावसायिक मानवी भाषांतराची शिफारस केली जाते. या भाषांतराचा वापर करून उद्भवलेल्या कोणत्याही गैरसमज किंवा चुकीच्या अर्थासाठी आम्ही जबाबदार राहणार नाही.



