|
|
5 months ago | |
|---|---|---|
| .. | ||
| README.md | 5 months ago | |
| assignment.md | 5 months ago | |
README.md
वास्तविक दुनिया में डेटा विज्ञान
![]() |
|---|
| वास्तविक दुनिया में डेटा विज्ञान - Sketchnote by @nitya |
हम इस सीखने की यात्रा के अंत के करीब हैं!
हमने डेटा विज्ञान और नैतिकता की परिभाषाओं से शुरुआत की, डेटा विश्लेषण और विज़ुअलाइज़ेशन के विभिन्न उपकरणों और तकनीकों का पता लगाया, डेटा विज्ञान जीवनचक्र की समीक्षा की, और क्लाउड कंप्यूटिंग सेवाओं के साथ डेटा विज्ञान वर्कफ़्लो को स्केल और स्वचालित करने के तरीकों को देखा। तो, आप शायद सोच रहे हैं: "मैं इन सभी सीखों को वास्तविक दुनिया के संदर्भों में कैसे लागू करूं?"
इस पाठ में, हम उद्योग में डेटा विज्ञान के वास्तविक दुनिया के अनुप्रयोगों का पता लगाएंगे और शोध, डिजिटल मानविकी, और स्थिरता के संदर्भों में विशिष्ट उदाहरणों में गहराई से जाएंगे। हम छात्र परियोजना के अवसरों पर चर्चा करेंगे और आपकी सीखने की यात्रा जारी रखने में मदद करने के लिए उपयोगी संसाधनों के साथ निष्कर्ष निकालेंगे!
प्री-लेक्चर क्विज
प्री-लेक्चर क्विज
डेटा विज्ञान + उद्योग
एआई के लोकतंत्रीकरण के कारण, डेवलपर्स अब एआई-संचालित निर्णय लेने और डेटा-संचालित अंतर्दृष्टि को उपयोगकर्ता अनुभव और विकास वर्कफ़्लो में डिज़ाइन और एकीकृत करना आसान पा रहे हैं। यहां कुछ उदाहरण दिए गए हैं कि कैसे डेटा विज्ञान को उद्योग में "लागू" किया जाता है:
-
Google Flu Trends ने खोज शब्दों को फ्लू ट्रेंड्स के साथ सहसंबंधित करने के लिए डेटा विज्ञान का उपयोग किया। हालांकि इस दृष्टिकोण में खामियां थीं, इसने डेटा-संचालित स्वास्थ्य देखभाल भविष्यवाणियों की संभावनाओं (और चुनौतियों) के बारे में जागरूकता बढ़ाई।
-
UPS Routing Predictions - यह बताता है कि UPS डेटा विज्ञान और मशीन लर्निंग का उपयोग करके मौसम की स्थिति, ट्रैफिक पैटर्न, डिलीवरी की समय सीमा और अधिक को ध्यान में रखते हुए डिलीवरी के लिए इष्टतम मार्गों की भविष्यवाणी कैसे करता है।
-
NYC Taxicab Route Visualization - सूचना की स्वतंत्रता कानूनों का उपयोग करके एकत्रित डेटा ने NYC टैक्सियों के जीवन के एक दिन को विज़ुअलाइज़ करने में मदद की, जिससे हमें यह समझने में मदद मिली कि वे व्यस्त शहर में कैसे नेविगेट करते हैं, वे कितना पैसा कमाते हैं, और प्रत्येक 24 घंटे की अवधि में यात्राओं की अवधि।
-
Uber Data Science Workbench - लाखों दैनिक Uber यात्राओं से एकत्रित डेटा (पिकअप और ड्रॉपऑफ स्थान, यात्रा की अवधि, पसंदीदा मार्ग आदि) का उपयोग करके एक डेटा एनालिटिक्स टूल बनाया गया जो मूल्य निर्धारण, सुरक्षा, धोखाधड़ी का पता लगाने और नेविगेशन निर्णयों में मदद करता है।
-
Sports Analytics - पूर्वानुमानात्मक विश्लेषण (टीम और खिलाड़ी विश्लेषण - जैसे Moneyball - और प्रशंसक प्रबंधन) और डेटा विज़ुअलाइज़ेशन (टीम और प्रशंसक डैशबोर्ड, खेल आदि) पर केंद्रित है, जिसमें प्रतिभा की खोज, खेल सट्टेबाजी और इन्वेंट्री/स्थान प्रबंधन जैसे अनुप्रयोग शामिल हैं।
-
Data Science in Banking - वित्त उद्योग में डेटा विज्ञान के मूल्य को उजागर करता है, जिसमें जोखिम मॉडलिंग और धोखाधड़ी का पता लगाने से लेकर ग्राहक विभाजन, वास्तविक समय की भविष्यवाणी और अनुशंसा प्रणाली तक के अनुप्रयोग शामिल हैं। पूर्वानुमानात्मक विश्लेषण जैसे महत्वपूर्ण उपायों को भी चलाता है क्रेडिट स्कोर।
-
Data Science in Healthcare - चिकित्सा इमेजिंग (जैसे, एमआरआई, एक्स-रे, सीटी-स्कैन), जीनोमिक्स (डीएनए अनुक्रमण), दवा विकास (जोखिम मूल्यांकन, सफलता की भविष्यवाणी), पूर्वानुमानात्मक विश्लेषण (रोगी देखभाल और आपूर्ति रसद), रोग ट्रैकिंग और रोकथाम जैसे अनुप्रयोगों को उजागर करता है।
छवि क्रेडिट: Data Flair: 6 Amazing Data Science Applications
चित्र अन्य डोमेन और डेटा विज्ञान तकनीकों को लागू करने के उदाहरण दिखाता है। क्या आप अन्य अनुप्रयोगों का पता लगाना चाहते हैं? नीचे दिए गए समीक्षा और स्व-अध्ययन अनुभाग को देखें।
डेटा विज्ञान + शोध
![]() |
|---|
| डेटा विज्ञान और शोध - Sketchnote by @nitya |
जबकि वास्तविक दुनिया के अनुप्रयोग अक्सर बड़े पैमाने पर उद्योग उपयोग मामलों पर ध्यान केंद्रित करते हैं, शोध अनुप्रयोग और परियोजनाएं दो दृष्टिकोणों से उपयोगी हो सकती हैं:
- नवाचार के अवसर - उन्नत अवधारणाओं के त्वरित प्रोटोटाइप और अगली पीढ़ी के अनुप्रयोगों के लिए उपयोगकर्ता अनुभवों का परीक्षण करें।
- तैनाती की चुनौतियां - वास्तविक दुनिया के संदर्भों में डेटा विज्ञान प्रौद्योगिकियों के संभावित नुकसान या अनपेक्षित परिणामों की जांच करें।
छात्रों के लिए, ये शोध परियोजनाएं न केवल विषय की समझ को बेहतर बनाने में मदद करती हैं बल्कि संबंधित क्षेत्रों में काम कर रहे लोगों या टीमों के साथ जुड़ने और जागरूकता बढ़ाने का अवसर भी प्रदान करती हैं। तो शोध परियोजनाएं कैसी दिखती हैं और वे कैसे प्रभाव डाल सकती हैं?
आइए एक उदाहरण देखें - MIT Gender Shades Study जॉय बुओलामविनी (MIT Media Labs) द्वारा, जिसमें एक प्रमुख शोध पत्र टिमनिट गेब्रु (तब Microsoft Research में) के साथ सह-लेखित था। यह केंद्रित था:
- क्या: शोध परियोजना का उद्देश्य स्वचालित चेहरे विश्लेषण एल्गोरिदम और डेटासेट में मौजूद पूर्वाग्रह का मूल्यांकन करना था, जो लिंग और त्वचा प्रकार पर आधारित था।
- क्यों: चेहरे का विश्लेषण कानून प्रवर्तन, हवाई अड्डा सुरक्षा, भर्ती प्रणाली और अधिक जैसे क्षेत्रों में उपयोग किया जाता है - ऐसे संदर्भ जहां गलत वर्गीकरण (जैसे, पूर्वाग्रह के कारण) प्रभावित व्यक्तियों या समूहों को संभावित आर्थिक और सामाजिक नुकसान पहुंचा सकता है। उपयोग में निष्पक्षता के लिए पूर्वाग्रहों को समझना (और समाप्त करना या कम करना) महत्वपूर्ण है।
- कैसे: शोधकर्ताओं ने पहचाना कि मौजूदा बेंचमार्क मुख्य रूप से हल्की त्वचा वाले विषयों का उपयोग करते थे, और एक नया डेटा सेट (1000+ छवियां) तैयार किया जो लिंग और त्वचा प्रकार द्वारा अधिक संतुलित था। इस डेटा सेट का उपयोग तीन लिंग वर्गीकरण उत्पादों (Microsoft, IBM और Face++) की सटीकता का मूल्यांकन करने के लिए किया गया।
परिणामों ने दिखाया कि हालांकि समग्र वर्गीकरण सटीकता अच्छी थी, विभिन्न उपसमूहों के बीच त्रुटि दर में ध्यान देने योग्य अंतर था - जिसमें गलत लिंग निर्धारण महिलाओं या गहरे रंग की त्वचा वाले व्यक्तियों के लिए अधिक था, जो पूर्वाग्रह का संकेत देता है।
मुख्य परिणाम: डेटा विज्ञान को अधिक प्रतिनिधि डेटासेट (संतुलित उपसमूह) और अधिक समावेशी टीमों (विविध पृष्ठभूमि) की आवश्यकता है ताकि एआई समाधानों में ऐसे पूर्वाग्रहों को पहले ही पहचानने और समाप्त करने या कम करने में मदद मिल सके। इस तरह के शोध प्रयास कई संगठनों को जिम्मेदार एआई के लिए सिद्धांत और प्रथाओं को परिभाषित करने में भी सहायक होते हैं ताकि उनके एआई उत्पादों और प्रक्रियाओं में निष्पक्षता में सुधार हो सके।
Microsoft में प्रासंगिक शोध प्रयासों के बारे में जानना चाहते हैं?
- Microsoft Research Projects पर कृत्रिम बुद्धिमत्ता के बारे में जानें।
- Microsoft Research Data Science Summer School से छात्र परियोजनाओं का अन्वेषण करें।
- Fairlearn परियोजना और Responsible AI पहलों को देखें।
डेटा विज्ञान + मानविकी
![]() |
|---|
| डेटा विज्ञान और डिजिटल मानविकी - Sketchnote by @nitya |
डिजिटल मानविकी को परिभाषित किया गया है "एक संग्रह के रूप में जो कम्प्यूटेशनल विधियों को मानवतावादी जांच के साथ जोड़ता है।" स्टैनफोर्ड परियोजनाएं जैसे "इतिहास को पुनः आरंभ करना" और "काव्यात्मक सोच" डिजिटल मानविकी और डेटा विज्ञान के बीच संबंध को दर्शाते हैं - नेटवर्क विश्लेषण, सूचना विज़ुअलाइज़ेशन, स्थानिक और पाठ विश्लेषण जैसी तकनीकों पर जोर देते हुए जो हमें ऐतिहासिक और साहित्यिक डेटा सेटों को पुनः देखने और नए दृष्टिकोण प्राप्त करने में मदद कर सकते हैं।
क्या आप इस क्षेत्र में एक परियोजना का अन्वेषण और विस्तार करना चाहते हैं?
"Emily Dickinson and the Meter of Mood" देखें - Jen Looper का एक शानदार उदाहरण जो पूछता है कि हम डेटा विज्ञान का उपयोग करके परिचित कविता को कैसे पुनः देख सकते हैं और इसके अर्थ और इसके लेखक के योगदान को नए संदर्भों में पुनः मूल्यांकन कर सकते हैं। उदाहरण के लिए, क्या हम कविता के स्वर या भावना का विश्लेषण करके यह अनुमान लगा सकते हैं कि कविता किस मौसम में लिखी गई थी - और यह हमें संबंधित अवधि में लेखक की मानसिक स्थिति के बारे में क्या बताता है?
इस प्रश्न का उत्तर देने के लिए, हम अपने डेटा विज्ञान जीवनचक्र के चरणों का पालन करते हैं:
डेटा अधिग्रहण- विश्लेषण के लिए एक प्रासंगिक डेटा सेट एकत्र करने के लिए। विकल्पों में एक एपीआई का उपयोग करना (जैसे, Poetry DB API) या वेब पृष्ठों को स्क्रैप करना (जैसे, Project Gutenberg) शामिल हैं।डेटा सफाई- यह बताता है कि पाठ को कैसे स्वरूपित, स्वच्छ और सरल बनाया जा सकता है, जैसे उपकरणों का उपयोग करके Visual Studio Code और Microsoft Excel।डेटा विश्लेषण- यह बताता है कि हम अब डेटा सेट को "नोटबुक्स" में आयात करके विश्लेषण कर सकते हैं, जैसे Python पैकेज (जैसे pandas, numpy और matplotlib) का उपयोग करके डेटा को व्यवस्थित और विज़ुअलाइज़ करना।भावना विश्लेषण- यह बताता है कि हम क्लाउड सेवाओं जैसे Text Analytics को कैसे एकीकृत कर सकते हैं, जैसे Power Automate जैसे लो-कोड टूल का उपयोग करके स्वचालित डेटा प्रोसेसिंग वर्कफ़्लो के लिए।
इस वर्कफ़्लो का उपयोग करके, हम कविताओं की भावना पर मौसमी प्रभावों का पता लगा सकते हैं और हमें लेखक के बारे में अपनी खुद की दृष्टिकोण बनाने में मदद कर सकते हैं। इसे स्वयं आज़माएं - फिर नोटबुक को अन्य प्रश्न पूछने या डेटा को नए तरीकों से विज़ुअलाइज़ करने के लिए विस्तारित करें!
आप डिजिटल मानविकी टूलकिट में कुछ उपकरणों का उपयोग करके इन जांच के रास्तों को आगे बढ़ा सकते हैं।
डेटा विज्ञान + स्थिरता
![]() |
|---|
| डेटा विज्ञान और स्थिरता - Sketchnote by @nitya |
2030 सतत विकास के लिए एजेंडा - जिसे 2015 में सभी संयुक्त राष्ट्र सदस्यों द्वारा अपनाया गया था - 17 लक्ष्यों की पहचान करता है, जिनमें ग्रह की रक्षा और जलवायु परिवर्तन के प्रभाव पर ध्यान केंद्रित किया गया है। Microsoft Sustainability पहल इन लक्ष्यों का समर्थन करती है और प्रौद्योगिकी समाधानों के माध्यम से अधिक स्थायी भविष्य बनाने के तरीकों का पता लगाती है, जिसमें 4 लक्ष्यों पर ध्यान केंद्रित किया गया है - 2030 तक कार्बन नकारात्मक, जल सकारात्मक, शून्य अपशिष्ट, और जैव-विविध बनना।
इन चुनौतियों को बड़े पैमाने पर और समय पर हल करने के लिए क्लाउड-स्केल सोच और बड़े पैमाने पर डेटा की आवश्यकता होती है। Planetary Computer पहल डेटा वैज्ञानिकों और डेवलपर्स को इस प्रयास में मदद करने के लिए 4 घटक प्रदान करती है:
-
डेटा कैटलॉग - पृथ्वी प्रणाली डेटा के पेटाबाइट्स (मुफ्त और Azure-होस्टेड) के साथ।
-
Planetary API - उपयोगकर्ताओं को स्थान और समय के अनुसार प्रासंगिक डेटा खोजने में मदद करने के लिए।
-
हब - वैज्ञानिकों के लिए विशाल भू-स्थानिक डेटा सेटों को संसाधित करने के लिए प्रबंधित वातावरण।
-
अनुप्रयोग - स्थिरता अंतर्दृष्टि के लिए उपयोग के मामलों और उपकरणों को प्रदर्शित करता है। प्लैनेटरी कंप्यूटर प्रोजेक्ट वर्तमान में प्रीव्यू में है (सितंबर 2021 तक) - यहां बताया गया है कि आप डेटा साइंस का उपयोग करके स्थिरता समाधान में योगदान कैसे शुरू कर सकते हैं।
-
एक्सेस का अनुरोध करें ताकि आप अन्वेषण शुरू कर सकें और अपने साथियों से जुड़ सकें।
-
डॉक्यूमेंटेशन का अन्वेषण करें ताकि आप समर्थित डेटा सेट और APIs को समझ सकें।
-
इकोसिस्टम मॉनिटरिंग जैसे एप्लिकेशन का अन्वेषण करें ताकि एप्लिकेशन आइडियाज के लिए प्रेरणा मिल सके।
सोचें कि आप डेटा विज़ुअलाइज़ेशन का उपयोग कैसे कर सकते हैं ताकि जलवायु परिवर्तन और वनों की कटाई जैसे क्षेत्रों में प्रासंगिक अंतर्दृष्टि को उजागर या बढ़ाया जा सके। या सोचें कि इन अंतर्दृष्टियों का उपयोग कैसे किया जा सकता है ताकि नए उपयोगकर्ता अनुभव बनाए जा सकें जो अधिक स्थायी जीवन के लिए व्यवहारिक बदलावों को प्रेरित करें।
डेटा साइंस + छात्र
हमने उद्योग और शोध में वास्तविक दुनिया के अनुप्रयोगों के बारे में बात की है, और डिजिटल ह्यूमैनिटीज और स्थिरता में डेटा साइंस एप्लिकेशन के उदाहरणों का अन्वेषण किया है। तो आप डेटा साइंस के शुरुआती के रूप में अपने कौशल कैसे बना सकते हैं और अपनी विशेषज्ञता कैसे साझा कर सकते हैं?
यहां कुछ डेटा साइंस छात्र परियोजनाओं के उदाहरण दिए गए हैं जो आपको प्रेरित कर सकते हैं।
- MSR डेटा साइंस समर स्कूल के GitHub प्रोजेक्ट्स जो निम्नलिखित विषयों का अन्वेषण करते हैं:
- सामग्री संस्कृति का डिजिटलीकरण: सर्कप में सामाजिक-आर्थिक वितरण का अन्वेषण - Ornella Altunyan और Claremont की टीम द्वारा, ArcGIS StoryMaps का उपयोग करते हुए।
🚀 चुनौती
ऐसे लेख खोजें जो शुरुआती के लिए उपयुक्त डेटा साइंस प्रोजेक्ट्स की सिफारिश करते हैं - जैसे ये 50 विषय क्षेत्र या ये 21 प्रोजेक्ट आइडियाज या ये 16 प्रोजेक्ट्स सोर्स कोड के साथ जिन्हें आप डीकंस्ट्रक्ट और रीमिक्स कर सकते हैं। और अपनी सीखने की यात्रा के बारे में ब्लॉग लिखना न भूलें और अपनी अंतर्दृष्टि हम सभी के साथ साझा करें।
पोस्ट-लेक्चर क्विज़
पोस्ट-लेक्चर क्विज़
समीक्षा और स्व-अध्ययन
अधिक उपयोग मामलों का अन्वेषण करना चाहते हैं? यहां कुछ प्रासंगिक लेख दिए गए हैं:
- 17 डेटा साइंस एप्लिकेशन और उदाहरण - जुलाई 2021
- वास्तविक दुनिया में 11 अद्भुत डेटा साइंस एप्लिकेशन - मई 2021
- वास्तविक दुनिया में डेटा साइंस - लेख संग्रह
- डेटा साइंस इन: शिक्षा, कृषि, वित्त, फिल्में और अधिक।
असाइनमेंट
प्लैनेटरी कंप्यूटर डेटा सेट का अन्वेषण करें
अस्वीकरण:
यह दस्तावेज़ AI अनुवाद सेवा Co-op Translator का उपयोग करके अनुवादित किया गया है। जबकि हम सटीकता सुनिश्चित करने का प्रयास करते हैं, कृपया ध्यान दें कि स्वचालित अनुवाद में त्रुटियां या अशुद्धियां हो सकती हैं। मूल भाषा में उपलब्ध मूल दस्तावेज़ को प्रामाणिक स्रोत माना जाना चाहिए। महत्वपूर्ण जानकारी के लिए, पेशेवर मानव अनुवाद की सिफारिश की जाती है। इस अनुवाद के उपयोग से उत्पन्न किसी भी गलतफहमी या गलत व्याख्या के लिए हम उत्तरदायी नहीं हैं।



