You can not select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.

36 KiB

वास्तविक दुनिया में डेटा विज्ञान

 Sketchnote by (@sketchthedocs)
वास्तविक दुनिया में डेटा विज्ञान - Sketchnote by @nitya

हम इस सीखने की यात्रा के अंत के करीब हैं!

हमने डेटा विज्ञान और नैतिकता की परिभाषाओं से शुरुआत की, डेटा विश्लेषण और विज़ुअलाइज़ेशन के विभिन्न उपकरणों और तकनीकों का पता लगाया, डेटा विज्ञान जीवनचक्र की समीक्षा की, और क्लाउड कंप्यूटिंग सेवाओं के साथ डेटा विज्ञान वर्कफ़्लो को स्केल और स्वचालित करने के तरीकों को देखा। तो, आप शायद सोच रहे हैं: "मैं इन सभी सीखों को वास्तविक दुनिया के संदर्भों में कैसे लागू करूं?"

इस पाठ में, हम उद्योग में डेटा विज्ञान के वास्तविक दुनिया के अनुप्रयोगों का पता लगाएंगे और शोध, डिजिटल मानविकी और स्थिरता के संदर्भों में विशिष्ट उदाहरणों में गहराई से जाएंगे। हम छात्र परियोजना के अवसरों पर चर्चा करेंगे और आपकी सीखने की यात्रा को जारी रखने में मदद करने के लिए उपयोगी संसाधनों के साथ निष्कर्ष निकालेंगे!

प्री-लेक्चर क्विज

प्री-लेक्चर क्विज

डेटा विज्ञान + उद्योग

AI के लोकतंत्रीकरण के कारण, डेवलपर्स अब AI-संचालित निर्णय लेने और डेटा-संचालित अंतर्दृष्टि को उपयोगकर्ता अनुभवों और विकास वर्कफ़्लो में डिज़ाइन और एकीकृत करना आसान पा रहे हैं। यहां कुछ उदाहरण दिए गए हैं कि कैसे डेटा विज्ञान को उद्योग में "लागू" किया जाता है:

  • Google Flu Trends ने खोज शब्दों को फ्लू ट्रेंड्स के साथ सहसंबद्ध करने के लिए डेटा विज्ञान का उपयोग किया। हालांकि इस दृष्टिकोण में खामियां थीं, इसने डेटा-संचालित स्वास्थ्य देखभाल भविष्यवाणियों की संभावनाओं (और चुनौतियों) के बारे में जागरूकता बढ़ाई।

  • UPS Routing Predictions - UPS डेटा विज्ञान और मशीन लर्निंग का उपयोग करके मौसम की स्थिति, ट्रैफिक पैटर्न, डिलीवरी की समय सीमा और अधिक को ध्यान में रखते हुए डिलीवरी के लिए इष्टतम मार्गों की भविष्यवाणी करता है।

  • NYC Taxicab Route Visualization - Freedom Of Information Laws का उपयोग करके एकत्रित डेटा ने NYC टैक्सियों के जीवन के एक दिन को विज़ुअलाइज़ करने में मदद की, जिससे यह समझने में मदद मिली कि वे व्यस्त शहर में कैसे नेविगेट करते हैं, वे कितना पैसा कमाते हैं, और प्रत्येक 24 घंटे की अवधि में यात्राओं की अवधि।

  • Uber Data Science Workbench - लाखों दैनिक Uber यात्राओं से एकत्रित डेटा (पिकअप और ड्रॉपऑफ स्थान, यात्रा की अवधि, पसंदीदा मार्ग आदि) का उपयोग करके एक डेटा एनालिटिक्स टूल बनाया गया जो मूल्य निर्धारण, सुरक्षा, धोखाधड़ी का पता लगाने और नेविगेशन निर्णयों में मदद करता है।

  • Sports Analytics - पूर्वानुमानात्मक विश्लेषण (टीम और खिलाड़ी विश्लेषण - जैसे Moneyball - और प्रशंसक प्रबंधन) और डेटा विज़ुअलाइज़ेशन (टीम और प्रशंसक डैशबोर्ड, खेल आदि) पर केंद्रित है, जिसमें प्रतिभा की खोज, खेल सट्टेबाजी और इन्वेंट्री/स्थान प्रबंधन जैसे अनुप्रयोग शामिल हैं।

  • Data Science in Banking - वित्त उद्योग में डेटा विज्ञान के मूल्य को उजागर करता है, जिसमें जोखिम मॉडलिंग और धोखाधड़ी का पता लगाने से लेकर ग्राहक विभाजन, वास्तविक समय की भविष्यवाणी और अनुशंसा प्रणाली तक के अनुप्रयोग शामिल हैं। पूर्वानुमानात्मक विश्लेषण क्रेडिट स्कोर जैसे महत्वपूर्ण उपायों को भी संचालित करता है।

  • Data Science in Healthcare - चिकित्सा इमेजिंग (जैसे, MRI, X-Ray, CT-Scan), जीनोमिक्स (DNA अनुक्रमण), दवा विकास (जोखिम मूल्यांकन, सफलता की भविष्यवाणी), पूर्वानुमानात्मक विश्लेषण (रोगी देखभाल और आपूर्ति लॉजिस्टिक्स), रोग ट्रैकिंग और रोकथाम जैसे अनुप्रयोगों को उजागर करता है।

वास्तविक दुनिया में डेटा विज्ञान अनुप्रयोग छवि क्रेडिट: Data Flair: 6 Amazing Data Science Applications

चित्र अन्य डोमेन और डेटा विज्ञान तकनीकों को लागू करने के उदाहरण दिखाता है। क्या आप अन्य अनुप्रयोगों का पता लगाना चाहते हैं? नीचे दिए गए Review & Self Study अनुभाग को देखें।

डेटा विज्ञान + शोध

 Sketchnote by (@sketchthedocs)
डेटा विज्ञान और शोध - Sketchnote by @nitya

जबकि वास्तविक दुनिया के अनुप्रयोग अक्सर बड़े पैमाने पर उद्योग उपयोग मामलों पर ध्यान केंद्रित करते हैं, शोध अनुप्रयोग और परियोजनाएं दो दृष्टिकोणों से उपयोगी हो सकती हैं:

  • नवाचार के अवसर - उन्नत अवधारणाओं के त्वरित प्रोटोटाइप और अगली पीढ़ी के अनुप्रयोगों के लिए उपयोगकर्ता अनुभवों का परीक्षण करें।
  • तैनाती चुनौतियां - वास्तविक दुनिया के संदर्भों में डेटा विज्ञान प्रौद्योगिकियों के संभावित नुकसान या अनपेक्षित परिणामों की जांच करें।

छात्रों के लिए, ये शोध परियोजनाएं सीखने और सहयोग के अवसर प्रदान कर सकती हैं जो आपके विषय की समझ में सुधार कर सकती हैं और आपके रुचि के क्षेत्रों में काम कर रहे प्रासंगिक लोगों या टीमों के साथ आपकी जागरूकता और जुड़ाव को व्यापक बना सकती हैं। तो शोध परियोजनाएं कैसी दिखती हैं और वे प्रभाव कैसे डाल सकती हैं?

आइए एक उदाहरण देखें - MIT Gender Shades Study जॉय बुओलामविनी (MIT Media Labs) द्वारा एक प्रमुख शोध पत्र के साथ सह-लेखक टिमनिट गेब्रु (तब Microsoft Research में) द्वारा:

  • क्या: शोध परियोजना का उद्देश्य स्वचालित चेहरे विश्लेषण एल्गोरिदम और डेटासेट में लिंग और त्वचा प्रकार के आधार पर मौजूद पूर्वाग्रह का मूल्यांकन करना था।
  • क्यों: चेहरे का विश्लेषण कानून प्रवर्तन, हवाई अड्डे की सुरक्षा, भर्ती प्रणाली और अधिक जैसे क्षेत्रों में उपयोग किया जाता है - ऐसे संदर्भ जहां गलत वर्गीकरण (जैसे, पूर्वाग्रह के कारण) प्रभावित व्यक्तियों या समूहों को संभावित आर्थिक और सामाजिक नुकसान पहुंचा सकता है। उपयोग में निष्पक्षता के लिए पूर्वाग्रहों को समझना (और समाप्त करना या कम करना) महत्वपूर्ण है।
  • कैसे: शोधकर्ताओं ने पहचाना कि मौजूदा बेंचमार्क मुख्य रूप से हल्की त्वचा वाले विषयों का उपयोग करते हैं, और एक नया डेटा सेट (1000+ छवियां) तैयार किया जो लिंग और त्वचा प्रकार द्वारा अधिक संतुलित था। डेटा सेट का उपयोग तीन लिंग वर्गीकरण उत्पादों (Microsoft, IBM और Face++ से) की सटीकता का मूल्यांकन करने के लिए किया गया।

परिणामों से पता चला कि हालांकि समग्र वर्गीकरण सटीकता अच्छी थी, विभिन्न उपसमूहों के बीच त्रुटि दर में ध्यान देने योग्य अंतर था - जिसमें गलत लिंग निर्धारण महिलाओं या गहरे रंग की त्वचा वाले व्यक्तियों के लिए अधिक था, जो पूर्वाग्रह का संकेत देता है।

मुख्य परिणाम: डेटा विज्ञान को अधिक प्रतिनिधि डेटासेट (संतुलित उपसमूह) और अधिक समावेशी टीमों (विविध पृष्ठभूमि) की आवश्यकता है ताकि AI समाधानों में ऐसे पूर्वाग्रहों को पहले ही पहचानने और समाप्त करने या कम करने में मदद मिल सके। इस तरह के शोध प्रयास कई संगठनों को जिम्मेदार AI के लिए सिद्धांत और प्रथाओं को परिभाषित करने में भी सहायक होते हैं ताकि उनके AI उत्पादों और प्रक्रियाओं में निष्पक्षता में सुधार हो सके।

Microsoft में प्रासंगिक शोध प्रयासों के बारे में जानना चाहते हैं?

डेटा विज्ञान + मानविकी

 Sketchnote by (@sketchthedocs)
डेटा विज्ञान और डिजिटल मानविकी - Sketchnote by @nitya

डिजिटल मानविकी को परिभाषित किया गया है "कंप्यूटेशनल विधियों को मानवीय जांच के साथ जोड़ने वाले प्रथाओं और दृष्टिकोणों का संग्रह" के रूप में। स्टैनफोर्ड परियोजनाएं जैसे "इतिहास को पुनः आरंभ करना" और "काव्यात्मक सोच" डिजिटल मानविकी और डेटा विज्ञान के बीच संबंध को दर्शाती हैं - नेटवर्क विश्लेषण, सूचना विज़ुअलाइज़ेशन, स्थानिक और पाठ विश्लेषण जैसी तकनीकों पर जोर देते हुए जो हमें ऐतिहासिक और साहित्यिक डेटा सेटों को फिर से देखने और नई अंतर्दृष्टि और दृष्टिकोण प्राप्त करने में मदद कर सकती हैं।

क्या आप इस क्षेत्र में एक परियोजना का अन्वेषण और विस्तार करना चाहते हैं?

"Emily Dickinson and the Meter of Mood" को देखें - Jen Looper का एक शानदार उदाहरण जो पूछता है कि हम डेटा विज्ञान का उपयोग करके परिचित कविता को फिर से कैसे देख सकते हैं और इसे नए संदर्भों में इसके अर्थ और इसके लेखक के योगदान का पुनर्मूल्यांकन कर सकते हैं। उदाहरण के लिए, क्या हम कविता के स्वर या भावना का विश्लेषण करके यह अनुमान लगा सकते हैं कि कविता किस मौसम में लिखी गई थी - और यह हमें संबंधित अवधि में लेखक की मानसिक स्थिति के बारे में क्या बताता है?

इस प्रश्न का उत्तर देने के लिए, हम अपने डेटा विज्ञान जीवनचक्र के चरणों का अनुसरण करते हैं:

  • डेटा अधिग्रहण - विश्लेषण के लिए प्रासंगिक डेटा सेट एकत्र करने के लिए। विकल्पों में API का उपयोग करना (जैसे, Poetry DB API) या वेब पेजों को स्क्रैप करना (जैसे, Project Gutenberg) Scrapy जैसे उपकरणों का उपयोग करके।
  • डेटा सफाई - यह बताता है कि टेक्स्ट को कैसे स्वरूपित, स्वच्छ और सरल बनाया जा सकता है, जैसे उपकरणों का उपयोग करके Visual Studio Code और Microsoft Excel।
  • डेटा विश्लेषण - यह बताता है कि हम अब डेटा सेट को "नोटबुक्स" में आयात करके विश्लेषण कर सकते हैं, जैसे Python पैकेज (pandas, numpy और matplotlib) का उपयोग करके डेटा को व्यवस्थित और विज़ुअलाइज़ करना।
  • भावना विश्लेषण - यह बताता है कि हम Text Analytics जैसे क्लाउड सेवाओं को कैसे एकीकृत कर सकते हैं, जैसे Power Automate जैसे लो-कोड टूल का उपयोग करके स्वचालित डेटा प्रोसेसिंग वर्कफ़्लो के लिए।

इस वर्कफ़्लो का उपयोग करके, हम कविताओं की भावना पर मौसमी प्रभावों का पता लगा सकते हैं और हमें लेखक पर अपनी खुद की दृष्टिकोण बनाने में मदद कर सकते हैं। इसे स्वयं आज़माएं - फिर नोटबुक को अन्य प्रश्न पूछने या डेटा को नए तरीकों से विज़ुअलाइज़ करने के लिए विस्तारित करें!

आप Digital Humanities toolkit में कुछ उपकरणों का उपयोग करके इन जांच के रास्तों को आगे बढ़ा सकते हैं।

डेटा विज्ञान + स्थिरता

 Sketchnote by (@sketchthedocs)
डेटा विज्ञान और स्थिरता - Sketchnote by @nitya

2030 Agenda For Sustainable Development - जिसे 2015 में सभी संयुक्त राष्ट्र सदस्यों द्वारा अपनाया गया था - 17 लक्ष्यों की पहचान करता है, जिनमें ग्रह की रक्षा और जलवायु परिवर्तन के प्रभाव पर ध्यान केंद्रित करना शामिल है। Microsoft Sustainability पहल इन लक्ष्यों का समर्थन करती है और प्रौद्योगिकी समाधानों के माध्यम से अधिक स्थायी भविष्य बनाने के तरीकों का पता लगाती है, जिसमें 4 लक्ष्यों पर ध्यान केंद्रित किया गया है - 2030 तक कार्बन नकारात्मक, जल सकारात्मक, शून्य अपशिष्ट, और जैव-विविध होना।

इन चुनौतियों को बड़े पैमाने पर और समय पर तरीके से हल करने के लिए क्लाउड-स्केल सोच और बड़े पैमाने पर डेटा की आवश्यकता होती है। Planetary Computer पहल डेटा वैज्ञानिकों और डेवलपर्स को इस प्रयास में मदद करने के लिए 4 घटक प्रदान करती है:

  • डेटा कैटलॉग - पृथ्वी प्रणाली डेटा (मुफ्त और Azure-होस्टेड) के पेटाबाइट्स के साथ।

  • Planetary API - उपयोगकर्ताओं को स्थान और समय के अनुसार प्रासंगिक डेटा खोजने में मदद करने के लिए।

  • हब - वैज्ञानिकों के लिए विशाल भू-स्थानिक डेटा सेटों को संसाधित करने के लिए प्रबंधित वातावरण।

  • अनुप्रयोग - स्थिरता अंतर्दृष्टि के लिए उपयोग मामलों और उपकरणों को प्रदर्शित करता है। प्लैनेटरी कंप्यूटर प्रोजेक्ट वर्तमान में प्रीव्यू में है (सितंबर 2021 तक) - डेटा साइंस का उपयोग करके स्थिरता समाधान में योगदान देने की शुरुआत कैसे करें, यह जानें।

  • एक्सेस का अनुरोध करें ताकि आप अन्वेषण शुरू कर सकें और साथियों से जुड़ सकें।

  • डॉक्यूमेंटेशन का अन्वेषण करें ताकि आप समर्थित डेटा सेट्स और APIs को समझ सकें।

  • इकोसिस्टम मॉनिटरिंग जैसे एप्लिकेशन का अन्वेषण करें, जो एप्लिकेशन आइडियाज के लिए प्रेरणा दे सकते हैं।

सोचें कि आप डेटा विज़ुअलाइज़ेशन का उपयोग करके जलवायु परिवर्तन और वनों की कटाई जैसे क्षेत्रों में प्रासंगिक अंतर्दृष्टि को उजागर या बढ़ावा देने के लिए कैसे उपयोग कर सकते हैं। या सोचें कि इन अंतर्दृष्टियों का उपयोग नए उपयोगकर्ता अनुभव बनाने के लिए कैसे किया जा सकता है, जो अधिक स्थायी जीवन के लिए व्यवहारिक बदलावों को प्रेरित करें।

डेटा साइंस + छात्र

हमने उद्योग और शोध में वास्तविक दुनिया के अनुप्रयोगों के बारे में बात की है और डिजिटल ह्यूमैनिटीज और स्थिरता में डेटा साइंस एप्लिकेशन के उदाहरणों का अन्वेषण किया है। तो, डेटा साइंस के शुरुआती छात्रों के रूप में आप अपनी स्किल्स कैसे बना सकते हैं और अपनी विशेषज्ञता कैसे साझा कर सकते हैं?

यहां कुछ डेटा साइंस छात्र प्रोजेक्ट्स के उदाहरण दिए गए हैं जो आपको प्रेरित कर सकते हैं:

🚀 चुनौती

ऐसे लेख खोजें जो शुरुआती लोगों के लिए उपयुक्त डेटा साइंस प्रोजेक्ट्स की सिफारिश करते हैं - जैसे ये 50 विषय क्षेत्र या ये 21 प्रोजेक्ट आइडियाज या सोर्स कोड के साथ ये 16 प्रोजेक्ट्स जिन्हें आप डीकंस्ट्रक्ट और रीमिक्स कर सकते हैं। और अपनी सीखने की यात्रा के बारे में ब्लॉग लिखना न भूलें और अपनी अंतर्दृष्टि हम सभी के साथ साझा करें।

पोस्ट-लेक्चर क्विज़

पोस्ट-लेक्चर क्विज़

समीक्षा और स्व-अध्ययन

क्या आप और उपयोग मामलों का अन्वेषण करना चाहते हैं? यहां कुछ प्रासंगिक लेख दिए गए हैं:

असाइनमेंट

एक प्लैनेटरी कंप्यूटर डेटा सेट का अन्वेषण करें


अस्वीकरण:
यह दस्तावेज़ AI अनुवाद सेवा Co-op Translator का उपयोग करके अनुवादित किया गया है। जबकि हम सटीकता के लिए प्रयास करते हैं, कृपया ध्यान दें कि स्वचालित अनुवाद में त्रुटियां या अशुद्धियां हो सकती हैं। मूल भाषा में उपलब्ध मूल दस्तावेज़ को आधिकारिक स्रोत माना जाना चाहिए। महत्वपूर्ण जानकारी के लिए, पेशेवर मानव अनुवाद की सिफारिश की जाती है। इस अनुवाद के उपयोग से उत्पन्न किसी भी गलतफहमी या गलत व्याख्या के लिए हम उत्तरदायी नहीं हैं।