|
|
5 months ago | |
|---|---|---|
| .. | ||
| README.md | 5 months ago | |
| assignment.md | 5 months ago | |
README.md
वास्तविक संसारमा डेटा विज्ञान
![]() |
|---|
| वास्तविक संसारमा डेटा विज्ञान - Sketchnote by @nitya |
हामी लगभग यो सिकाइ यात्राको अन्त्यमा पुगेका छौं!
हामीले डेटा विज्ञान र नैतिकताको परिभाषाबाट सुरु गर्यौं, डेटा विश्लेषण र दृश्यात्मकताको लागि विभिन्न उपकरण र प्रविधिहरू अन्वेषण गर्यौं, डेटा विज्ञान जीवनचक्रको समीक्षा गर्यौं, र क्लाउड कम्प्युटिङ सेवाहरूको साथ डेटा विज्ञान कार्यप्रवाहलाई स्केल र स्वचालित गर्ने तरिकाहरू हेरेका छौं। त्यसैले, तपाईं सोच्दै हुनुहुन्छ: "कसरी म यी सबै सिकाइलाई वास्तविक संसारको सन्दर्भमा नक्सा बनाउन सक्छु?"
यस पाठमा, हामी उद्योगमा डेटा विज्ञानको वास्तविक संसारको अनुप्रयोगहरू अन्वेषण गर्नेछौं र अनुसन्धान, डिजिटल मानविकी, र स्थिरता सन्दर्भहरूमा विशिष्ट उदाहरणहरूमा डुबुल्की मार्नेछौं। हामी विद्यार्थी परियोजना अवसरहरू हेर्नेछौं र तपाईंको सिकाइ यात्रा जारी राख्न मद्दत गर्न उपयोगी स्रोतहरूसँग निष्कर्ष निकाल्नेछौं!
प्रि-लेक्चर क्विज
प्रि-लेक्चर क्विज
डेटा विज्ञान + उद्योग
AI को लोकतान्त्रिकरणको कारण, विकासकर्ताहरूले अब AI-चालित निर्णय-निर्माण र डेटा-चालित अन्तर्दृष्टिहरूलाई प्रयोगकर्ता अनुभव र विकास कार्यप्रवाहमा डिजाइन र एकीकृत गर्न सजिलो पाएका छन्। यहाँ उद्योगमा डेटा विज्ञान "लागू" गरिएको केही वास्तविक संसारका अनुप्रयोगहरूको उदाहरणहरू छन्:
-
Google Flu Trends ले खोज शब्दहरूलाई फ्लु प्रवृत्तिहरूसँग सम्बन्धित गर्न डेटा विज्ञान प्रयोग गर्यो। यद्यपि यस दृष्टिकोणमा कमजोरीहरू थिए, यसले डेटा-चालित स्वास्थ्य सेवा भविष्यवाणीको सम्भावनाहरू (र चुनौतीहरू) को बारेमा सचेत गरायो।
-
UPS Routing Predictions - UPS ले मौसम अवस्था, ट्राफिक ढाँचा, डेलिभरी समय सीमा र अन्य कुराहरूलाई ध्यानमा राख्दै डेलिभरीको लागि इष्टतम मार्गहरू भविष्यवाणी गर्न डेटा विज्ञान र मेसिन लर्निङ प्रयोग गर्ने तरिका व्याख्या गर्दछ।
-
NYC Taxicab Route Visualization - Freedom Of Information Laws प्रयोग गरेर संकलित डेटा NYC ट्याक्सीहरूको जीवनको एक दिनलाई दृश्यात्मक बनाउन मद्दत गर्यो, जसले व्यस्त शहरमा उनीहरूले कसरी नेभिगेट गर्छन्, उनीहरूले कमाएको पैसा, र प्रत्येक २४-घण्टा अवधिमा यात्राको अवधि बुझ्न मद्दत गर्यो।
-
Uber Data Science Workbench - दैनिक लाखौं उबर यात्राहरूबाट संकलित डेटा (पिकअप र ड्रप अफ स्थानहरू, यात्रा अवधि, प्राथमिक मार्गहरू आदि) प्रयोग गरेर मूल्य निर्धारण, सुरक्षा, ठगी पत्ता लगाउने र नेभिगेसन निर्णयहरूको लागि डेटा एनालिटिक्स उपकरण निर्माण गर्न प्रयोग गरिन्छ।
-
Sports Analytics - पूर्वानुमानात्मक विश्लेषण (टिम र खेलाडी विश्लेषण - Moneyball सोच्नुहोस् - र फ्यान व्यवस्थापन) र डेटा दृश्यात्मकता (टिम र फ्यान ड्यासबोर्ड, खेलहरू आदि) मा केन्द्रित छ। यसले प्रतिभा खोजी, खेल जुवा, र इन्वेन्टरी/स्थल व्यवस्थापन जस्ता अनुप्रयोगहरू समेट्छ।
-
Data Science in Banking - वित्त उद्योगमा डेटा विज्ञानको मूल्यलाई जोखिम मोडेलिङ र ठगी पत्ता लगाउने, ग्राहक विभाजन, वास्तविक-समय भविष्यवाणी र सिफारिस प्रणालीहरू जस्ता अनुप्रयोगहरू सहित हाइलाइट गर्दछ। पूर्वानुमानात्मक विश्लेषणले क्रेडिट स्कोर जस्ता महत्वपूर्ण उपायहरू पनि चलाउँछ।
-
Data Science in Healthcare - चिकित्सा इमेजिङ (जस्तै MRI, X-Ray, CT-Scan), जीनोमिक्स (DNA अनुक्रमण), औषधि विकास (जोखिम मूल्याङ्कन, सफलता भविष्यवाणी), पूर्वानुमानात्मक विश्लेषण (रोगी हेरचाह र आपूर्ति रसद), रोग ट्र्याकिङ र रोकथाम जस्ता अनुप्रयोगहरू हाइलाइट गर्दछ।
छवि क्रेडिट: Data Flair: 6 Amazing Data Science Applications
चित्रले डेटा विज्ञान प्रविधिहरू लागू गर्न अन्य डोमेनहरू र उदाहरणहरू देखाउँछ। अन्य अनुप्रयोगहरू अन्वेषण गर्न चाहनुहुन्छ? तलको Review & Self Study खण्ड जाँच गर्नुहोस्।
डेटा विज्ञान + अनुसन्धान
![]() |
|---|
| डेटा विज्ञान र अनुसन्धान - Sketchnote by @nitya |
वास्तविक संसारको अनुप्रयोगहरू प्रायः उद्योग प्रयोग केसहरूमा केन्द्रित भए पनि, अनुसन्धान अनुप्रयोगहरू र परियोजनाहरू दुई दृष्टिकोणबाट उपयोगी हुन सक्छन्:
- नवाचार अवसरहरू - उन्नत अवधारणाहरूको द्रुत प्रोटोटाइप र अर्को पुस्ताका अनुप्रयोगहरूको लागि प्रयोगकर्ता अनुभव परीक्षण अन्वेषण गर्नुहोस्।
- परिनियोजन चुनौतीहरू - वास्तविक संसारको सन्दर्भमा डेटा विज्ञान प्रविधिहरूको सम्भावित हानि वा अनपेक्षित परिणामहरूको अनुसन्धान गर्नुहोस्।
विद्यार्थीहरूको लागि, यी अनुसन्धान परियोजनाहरूले विषयको तपाईंको समझ सुधार गर्न र चासोका क्षेत्रहरूमा काम गरिरहेका सम्बन्धित व्यक्ति वा टोलीहरूसँग तपाईंको जागरूकता र संलग्नता विस्तार गर्न सिकाइ र सहयोग अवसरहरू प्रदान गर्न सक्छ। त्यसो भए अनुसन्धान परियोजनाहरू कस्तो देखिन्छन् र तिनीहरूले कसरी प्रभाव पार्न सक्छन्?
हामी एउटा उदाहरण हेर्नेछौं - MIT Gender Shades Study Joy Buolamwini (MIT Media Labs) बाट एक महत्वपूर्ण अनुसन्धान पत्र सह-लेखक Timnit Gebru (त्यतिबेला Microsoft Research मा) संग, जसले केन्द्रित गर्यो:
- के: अनुसन्धान परियोजनाको उद्देश्य स्वचालित अनुहार विश्लेषण एल्गोरिदम र डेटासेटहरूमा लिङ्ग र छालाको प्रकारको आधारमा पूर्वाग्रहको मूल्याङ्कन गर्नु थियो।
- किन: अनुहार विश्लेषण कानून प्रवर्तन, एयरपोर्ट सुरक्षा, भर्ती प्रणालीहरू र अन्य क्षेत्रमा प्रयोग गरिन्छ - जहाँ गलत वर्गीकरण (जस्तै, पूर्वाग्रहका कारण) ले प्रभावित व्यक्तिहरू वा समूहहरूलाई सम्भावित आर्थिक र सामाजिक हानि पुर्याउन सक्छ। निष्पक्षताका लागि पूर्वाग्रहहरू बुझ्नु (र हटाउनु वा कम गर्नु) महत्त्वपूर्ण छ।
- कसरी: अनुसन्धानकर्ताहरूले पहिचान गरे कि अवस्थित बेंचमार्कहरूले प्रायः हल्का छालाका विषयहरू प्रयोग गर्थे, र लिङ्ग र छालाको प्रकारद्वारा अधिक सन्तुलित नयाँ डेटा सेट (१०००+ छविहरू) क्युरेट गरे। डेटा सेटलाई तीन लिङ्ग वर्गीकरण उत्पादनहरूको (Microsoft, IBM & Face++ बाट) सटीकता मूल्याङ्कन गर्न प्रयोग गरियो।
परिणामहरूले देखाए कि समग्र वर्गीकरण सटीकता राम्रो भए पनि, विभिन्न उपसमूहहरू बीच त्रुटि दरमा उल्लेखनीय भिन्नता थियो - मिसजेंडरिङ महिलाहरू वा गाढा छालाका व्यक्तिहरूको लागि उच्च थियो, जसले पूर्वाग्रहलाई संकेत गर्दछ।
मुख्य परिणामहरू: डेटा विज्ञानलाई प्रतिनिधि डेटासेटहरू (सन्तुलित उपसमूहहरू) र समावेशी टोलीहरू (विविध पृष्ठभूमि) को आवश्यकता छ भन्ने सचेत गरायो ताकि AI समाधानहरूमा यस्तो पूर्वाग्रहलाई चाँडै पहिचान र हटाउन वा कम गर्न सकियोस्। यस्तो अनुसन्धान प्रयासहरूले धेरै संगठनहरूलाई जिम्मेवार AI को लागि सिद्धान्तहरू र अभ्यासहरू परिभाषित गर्न महत्त्वपूर्ण भूमिका खेल्छन् ताकि उनीहरूको AI उत्पादनहरू र प्रक्रियाहरूमा निष्पक्षता सुधार गर्न सकियोस्।
Microsoft मा सम्बन्धित अनुसन्धान प्रयासहरू सिक्न चाहनुहुन्छ?
- Microsoft Research Projects मा कृत्रिम बुद्धिमत्तामा अनुसन्धान परियोजनाहरू जाँच गर्नुहोस्।
- Microsoft Research Data Science Summer School बाट विद्यार्थी परियोजनाहरू अन्वेषण गर्नुहोस्।
- Fairlearn परियोजना र Responsible AI पहलहरू जाँच गर्नुहोस्।
डेटा विज्ञान + मानविकी
![]() |
|---|
| डेटा विज्ञान र डिजिटल मानविकी - Sketchnote by @nitya |
डिजिटल मानविकी परिभाषित गरिएको छ "कम्प्युटेशनल विधिहरूलाई मानविकी अनुसन्धानसँग संयोजन गर्ने अभ्यासहरूको संग्रह" भनेर। Stanford परियोजनाहरू जस्तै "इतिहासलाई पुनः सुरु गर्दै" र "कवितात्मक सोच" ले डिजिटल मानविकी र डेटा विज्ञान बीचको सम्बन्धलाई चित्रण गर्दछ - नेटवर्क विश्लेषण, सूचना दृश्यात्मकता, स्थानिक र पाठ विश्लेषण जस्ता प्रविधिहरूलाई जोड दिँदै, जसले हामीलाई ऐतिहासिक र साहित्यिक डेटा सेटहरू पुनः अन्वेषण गर्न र नयाँ अन्तर्दृष्टि र दृष्टिकोण प्राप्त गर्न मद्दत गर्दछ।
यस क्षेत्रमा परियोजना अन्वेषण गर्न र विस्तार गर्न चाहनुहुन्छ?
"Emily Dickinson and the Meter of Mood" जाँच गर्नुहोस् - Jen Looper बाट एक उत्कृष्ट उदाहरण, जसले सोध्छ कि हामी कसरी डेटा विज्ञान प्रयोग गरेर परिचित कवितालाई पुनः अन्वेषण गर्न सक्छौं र नयाँ सन्दर्भमा यसको अर्थ र यसको लेखकको योगदान पुनः मूल्याङ्कन गर्न सक्छौं। उदाहरणका लागि, के हामी कविताको टोन वा भावना विश्लेषण गरेर यो लेखिएको मौसमको भविष्यवाणी गर्न सक्छौं - र यसले सम्बन्धित अवधिमा लेखकको मानसिक अवस्थाको बारेमा के बताउँछ?
त्यो प्रश्नको उत्तर दिन, हामी हाम्रो डेटा विज्ञान जीवनचक्रको चरणहरू अनुसरण गर्छौं:
डेटा प्राप्ति- विश्लेषणको लागि सम्बन्धित डेटा सेट सङ्कलन गर्न। विकल्पहरूमा API प्रयोग गर्नु (जस्तै, Poetry DB API) वा वेब पृष्ठहरू स्क्र्यापिङ गर्नु (जस्तै, Project Gutenberg) जस्ता उपकरणहरू प्रयोग गरेर Scrapy समावेश छन्।डेटा सफा गर्नु- पाठलाई आधारभूत उपकरणहरू जस्तै Visual Studio Code र Microsoft Excel प्रयोग गरेर ढाँचा, सफा र सरल बनाउने तरिका व्याख्या गर्दछ।डेटा विश्लेषण- डेटा सेटलाई "नोटबुकहरू" मा आयात गरेर विश्लेषण गर्न, डेटा व्यवस्थित गर्न र दृश्यात्मक बनाउन Python प्याकेजहरू (जस्तै pandas, numpy र matplotlib) प्रयोग गर्ने तरिका व्याख्या गर्दछ।भावना विश्लेषण- क्लाउड सेवाहरू जस्तै Text Analytics एकीकृत गर्ने तरिका व्याख्या गर्दछ, स्वचालित डेटा प्रशोधन कार्यप्रवाहहरूको लागि Power Automate जस्ता कम-कोड उपकरणहरू प्रयोग गरेर।
यस कार्यप्रवाह प्रयोग गरेर, हामी कविताको भावनामा मौसमी प्रभावहरू अन्वेषण गर्न सक्छौं, र लेखकको बारेमा हाम्रो आफ्नै दृष्टिकोण निर्माण गर्न मद्दत गर्न सक्छौं। आफैं प्रयास गर्नुहोस् - त्यसपछि अन्य प्रश्नहरू सोध्न वा डेटा नयाँ तरिकामा दृश्यात्मक बनाउन नोटबुक विस्तार गर्नुहोस्!
तपाईं डिजिटल मानविकी टूलकिट मा केही उपकरणहरू प्रयोग गरेर यी अनुसन्धानका मार्गहरू पछ्याउन सक्नुहुन्छ।
डेटा विज्ञान + स्थिरता
![]() |
|---|
| डेटा विज्ञान र स्थिरता - Sketchnote by @nitya |
2030 Agenda For Sustainable Development - २०१५ मा सबै संयुक्त राष्ट्र सदस्यहरूले अपनाएको - १७ लक्ष्यहरू पहिचान गर्दछ, जसमा ग्रहको संरक्षण र जलवायु परिवर्तनको प्रभावबाट केन्द्रित लक्ष्यहरू समावेश छन्। Microsoft Sustainability पहलले यी लक्ष्यहरूलाई समर्थन गर्दछ र ४ लक्ष्यहरूमा केन्द्रित स्थिर भविष्य निर्माण गर्न प्रविधि समाधानहरूको अन्वेषण गर्दछ - २०३० सम्म कार्बन नकारात्मक, पानी सकारात्मक, शून्य फोहोर, र जैव-विविध।
यी चुनौतीहरूलाई स्केलेबल र समयमै सम्बोधन गर्न क्लाउड-स्केल सोच र ठूलो स्केल डेटा आवश्यक छ। Planetary Computer पहलले डेटा वैज्ञानिकहरू र विकासकर्ताहरूलाई यस प्रयासमा मद्दत गर्न ४ घटकहरू प्रदान गर्दछ:
-
डेटा क्याटलग - पृथ्वी प्रणाली डेटा (नि:शुल्क र Azure-होस्ट गरिएको) को पेटाबाइटहरूसँग।
-
Planetary API - प्रयोगकर्ताहरूलाई स्थान र समयभरि सम्बन्धित डेटा खोज्न मद्दत गर्न।
-
हब - वैज्ञानिकहरूलाई विशाल भू-स्थानिक डेटा सेटहरू प्रशोधन गर्न प्रबन्धित वातावरण।
-
अनुप्रयोगहरू - स्थिरता अन्तर्दृष्टिका लागि प्रयोग केसहरू र उपकरणहरू प्रदर्शन। प्लानेटरी कम्प्युटर प्रोजेक्ट हाल प्रिभ्यूमा छ (सेप्टेम्बर २०२१ को रूपमा) - डाटा साइन्स प्रयोग गरेर दिगो समाधानहरूमा योगदान दिन सुरु गर्न यहाँबाट सुरु गर्न सकिन्छ।
-
एक्सेसको लागि अनुरोध गर्नुहोस् अन्वेषण सुरु गर्न र सहकर्मीहरूसँग जडान गर्न।
-
डकुमेन्टेसन अन्वेषण गर्नुहोस् समर्थित डेटासेट र API हरू बुझ्न।
-
इकोसिस्टम मोनिटरिङ जस्ता एप्लिकेसनहरू अन्वेषण गर्नुहोस् एप्लिकेसन आइडियाहरूको प्रेरणाको लागि।
डाटा भिजुअलाइजेसन प्रयोग गरेर जलवायु परिवर्तन र वन विनाश जस्ता क्षेत्रहरूमा सान्दर्भिक जानकारी उजागर गर्न वा प्रवर्धन गर्न कसरी प्रयोग गर्न सकिन्छ भन्ने सोच्नुहोस्। वा सोच्नुहोस् कि कसरी जानकारीहरू नयाँ प्रयोगकर्ता अनुभवहरू सिर्जना गर्न प्रयोग गर्न सकिन्छ जसले दिगो जीवनशैलीको लागि व्यवहार परिवर्तनलाई प्रेरित गर्दछ।
डाटा साइन्स + विद्यार्थीहरू
हामीले उद्योग र अनुसन्धानमा वास्तविक संसारका एप्लिकेसनहरूको बारेमा कुरा गरेका छौं, र डिजिटल ह्युम्यानिटीज र दिगो विकासमा डाटा साइन्स एप्लिकेसनका उदाहरणहरू अन्वेषण गरेका छौं। त्यसो भए, डाटा साइन्सको शुरुवातकर्ता रूपमा तपाईंले आफ्नो सीप कसरी निर्माण गर्न सक्नुहुन्छ र आफ्नो विशेषज्ञता साझा गर्न सक्नुहुन्छ?
यहाँ डाटा साइन्स विद्यार्थी परियोजनाहरूका केही उदाहरणहरू छन् जसले तपाईंलाई प्रेरित गर्न सक्छ।
- MSR डाटा साइन्स समर स्कूल GitHub परियोजनाहरू सहित, जस्तै:
- सामग्री संस्कृति डिजिटलाइजिङ: सिर्कापमा सामाजिक-आर्थिक वितरण अन्वेषण गर्दै - ओर्नेला अल्टुन्यान र क्लेयरमोन्टको टोलीबाट, ArcGIS StoryMaps प्रयोग गर्दै।
🚀 चुनौती
डाटा साइन्स परियोजनाहरूको लागि लेखहरू खोज्नुहोस् जुन शुरुवातकर्ताहरूको लागि उपयुक्त छन् - जस्तै यी ५० विषय क्षेत्रहरू वा यी २१ परियोजना आइडियाहरू वा यी १६ परियोजनाहरू स्रोत कोडसहित जसलाई तपाईंले डिकन्स्ट्रक्ट र रिमिक्स गर्न सक्नुहुन्छ। र आफ्नो सिकाइ यात्रा ब्लग गर्न नबिर्सनुहोस् र आफ्नो जानकारी हामी सबैसँग साझा गर्नुहोस्।
पोस्ट-लेक्चर क्विज
पोस्ट-लेक्चर क्विज
समीक्षा र आत्म अध्ययन
अझ धेरै प्रयोग केसहरू अन्वेषण गर्न चाहनुहुन्छ? यहाँ केही सान्दर्भिक लेखहरू छन्:
- १७ डाटा साइन्स एप्लिकेसनहरू र उदाहरणहरू - जुलाई २०२१
- वास्तविक संसारमा ११ अद्भुत डाटा साइन्स एप्लिकेसनहरू - मे २०२१
- वास्तविक संसारमा डाटा साइन्स - लेख संग्रह
- डाटा साइन्समा: शिक्षा, कृषि, वित्त, चलचित्रहरू र थप।
असाइनमेन्ट
प्लानेटरी कम्प्युटर डेटासेट अन्वेषण गर्नुहोस्
अस्वीकरण:
यो दस्तावेज़ AI अनुवाद सेवा Co-op Translator प्रयोग गरेर अनुवाद गरिएको छ। हामी शुद्धताको लागि प्रयास गर्छौं, तर कृपया ध्यान दिनुहोस् कि स्वचालित अनुवादहरूमा त्रुटि वा अशुद्धता हुन सक्छ। यसको मूल भाषा मा रहेको मूल दस्तावेज़लाई आधिकारिक स्रोत मानिनुपर्छ। महत्वपूर्ण जानकारीको लागि, व्यावसायिक मानव अनुवाद सिफारिस गरिन्छ। यस अनुवादको प्रयोगबाट उत्पन्न हुने कुनै पनि गलतफहमी वा गलत व्याख्याको लागि हामी जिम्मेवार हुने छैनौं।



