|
2 weeks ago | |
---|---|---|
.. | ||
README.md | 2 weeks ago | |
assignment.md | 3 weeks ago |
README.md
वास्तविक संसारमा डाटा साइन्स
![]() |
---|
वास्तविक संसारमा डाटा साइन्स - Sketchnote by @nitya |
हामी यो सिकाइ यात्राको अन्त्यतिर आइपुगेका छौं!
हामीले डाटा साइन्स र नैतिकताको परिभाषाबाट सुरु गर्यौं, डाटा विश्लेषण र भिजुअलाइजेसनका विभिन्न उपकरण र प्रविधिहरू अन्वेषण गर्यौं, डाटा साइन्स जीवनचक्रको समीक्षा गर्यौं, र क्लाउड कम्प्युटिङ सेवाहरूको प्रयोग गरेर डाटा साइन्स वर्कफ्लोहरूलाई स्केल र स्वचालित गर्ने तरिकाहरू हेर्यौं। त्यसैले, तपाईं सोच्दै हुनुहुन्छ होला: "यी सबै सिकाइहरूलाई वास्तविक संसारको सन्दर्भमा कसरी नक्सा बनाउन सकिन्छ?"
यस पाठमा, हामी उद्योगभरि डाटा साइन्सका वास्तविक संसारका अनुप्रयोगहरू अन्वेषण गर्नेछौं र अनुसन्धान, डिजिटल मानविकी, र दिगोपनका सन्दर्भमा विशिष्ट उदाहरणहरूमा डुबुल्की मार्नेछौं। हामी विद्यार्थी परियोजनाका अवसरहरू हेर्नेछौं र तपाईंको सिकाइ यात्रा जारी राख्न मद्दत गर्ने उपयोगी स्रोतहरूसँग निष्कर्ष निकाल्नेछौं!
पूर्व-पाठ प्रश्नोत्तरी
पूर्व-पाठ प्रश्नोत्तरी
डाटा साइन्स + उद्योग
एआईको लोकतान्त्रिकरणको कारण, विकासकर्ताहरूले एआई-चालित निर्णय-निर्माण र डाटा-आधारित अन्तर्दृष्टिहरूलाई प्रयोगकर्ता अनुभव र विकास वर्कफ्लोहरूमा डिजाइन र एकीकृत गर्न सजिलो पाएका छन्। यहाँ उद्योगभरि डाटा साइन्सलाई "लागू" गर्ने केही उदाहरणहरू छन्:
-
Google Flu Trends ले खोजी शब्दहरूलाई फ्लू प्रवृत्तिहरूसँग सम्बन्धित गर्न डाटा साइन्स प्रयोग गर्यो। यद्यपि यस दृष्टिकोणमा कमजोरीहरू थिए, यसले डाटा-आधारित स्वास्थ्य सेवा भविष्यवाणीहरूको सम्भावनाहरू (र चुनौतीहरू) को बारेमा चेतना बढायो।
-
UPS Routing Predictions - UPS ले मौसम अवस्था, ट्राफिक ढाँचाहरू, डेलिभरी समयसीमाहरू र अन्य कुराहरूलाई ध्यानमा राख्दै डेलिभरीका लागि इष्टतम मार्गहरूको भविष्यवाणी गर्न डाटा साइन्स र मेसिन लर्निङ प्रयोग गर्ने तरिका वर्णन गर्दछ।
-
NYC Taxicab Route Visualization - सूचना स्वतन्त्रता कानूनहरू प्रयोग गरेर सङ्कलित डाटाले NYC ट्याक्सीहरूको जीवनको एक दिनलाई दृश्यात्मक बनायो, जसले व्यस्त शहरमा उनीहरूले कसरी नेभिगेट गर्छन्, उनीहरूले कमाउने पैसा, र प्रत्येक २४-घण्टे अवधिमा यात्राको अवधि बुझ्न मद्दत गर्यो।
-
Uber Data Science Workbench - दैनिक लाखौं उबर यात्राहरूबाट सङ्कलित डाटा (पिकअप र ड्रपअफ स्थानहरू, यात्रा अवधि, रुचाइएको मार्गहरू आदि) प्रयोग गरेर मूल्य निर्धारण, सुरक्षा, ठगी पत्ता लगाउने र नेभिगेसन निर्णयहरूमा मद्दत गर्न डाटा एनालिटिक्स उपकरण निर्माण गर्यो।
-
Sports Analytics - पूर्वानुमानात्मक विश्लेषण (टीम र खेलाडी विश्लेषण - Moneyball सोच्नुहोस् - र प्रशंसक व्यवस्थापन) र डाटा भिजुअलाइजेसन (टीम र प्रशंसक ड्यासबोर्ड, खेलहरू आदि) मा केन्द्रित छ, जसले प्रतिभा खोजी, खेल जुवा र सूची/स्थल व्यवस्थापन जस्ता अनुप्रयोगहरूलाई समर्थन गर्दछ।
-
बैंकिङमा डाटा साइन्स - जोखिम मोडलिङ र ठगी पत्ता लगाउनेदेखि ग्राहक खण्डीकरण, वास्तविक-समय भविष्यवाणी र सिफारिस प्रणालीहरू सम्मका अनुप्रयोगहरूसँग वित्त उद्योगमा डाटा साइन्सको महत्त्वलाई हाइलाइट गर्दछ। पूर्वानुमानात्मक विश्लेषणले क्रेडिट स्कोरहरू जस्ता महत्त्वपूर्ण उपायहरूलाई पनि चलाउँछ।
-
स्वास्थ्य सेवामा डाटा साइन्स - मेडिकल इमेजिङ (जस्तै, MRI, X-Ray, CT-Scan), जीनोमिक्स (DNA अनुक्रमण), औषधि विकास (जोखिम मूल्याङ्कन, सफलता भविष्यवाणी), पूर्वानुमानात्मक विश्लेषण (रोगी हेरचाह र आपूर्ति रसद), रोग ट्र्याकिङ र रोकथाम जस्ता अनुप्रयोगहरूलाई हाइलाइट गर्दछ।
छवि श्रेय: Data Flair: 6 Amazing Data Science Applications
चित्रले डाटा साइन्स प्रविधिहरू लागू गर्नका लागि अन्य डोमेनहरू र उदाहरणहरू देखाउँछ। अन्य अनुप्रयोगहरू अन्वेषण गर्न चाहनुहुन्छ? तलको समीक्षा र आत्म अध्ययन खण्ड जाँच गर्नुहोस्।
डाटा साइन्स + अनुसन्धान
![]() |
---|
डाटा साइन्स र अनुसन्धान - Sketchnote by @nitya |
वास्तविक संसारका अनुप्रयोगहरूले प्रायः उद्योग प्रयोगका केसहरूमा ध्यान केन्द्रित गर्दा, अनुसन्धान अनुप्रयोगहरू र परियोजनाहरू दुई दृष्टिकोणबाट उपयोगी हुन सक्छन्:
- नवीनता अवसरहरू - उन्नत अवधारणाहरूको द्रुत प्रोटोटाइपिङ र अर्को पुस्ताका अनुप्रयोगहरूको प्रयोगकर्ता अनुभव परीक्षण अन्वेषण गर्नुहोस्।
- परिनियोजन चुनौतीहरू - वास्तविक संसारका सन्दर्भहरूमा डाटा साइन्स प्रविधिहरूको सम्भावित हानि वा अनपेक्षित परिणामहरूको अनुसन्धान गर्नुहोस्।
विद्यार्थीहरूको लागि, यी अनुसन्धान परियोजनाहरूले विषयको तपाईंको बुझाइ सुधार गर्न र चासोका क्षेत्रहरूमा काम गरिरहेका सम्बन्धित व्यक्तिहरू वा टोलीहरूसँग तपाईंको जागरूकता र संलग्नता विस्तार गर्न सिकाइ र सहयोगका अवसरहरू प्रदान गर्न सक्छ। त्यसो भए अनुसन्धान परियोजनाहरू कस्तो देखिन्छन् र तिनीहरूले कसरी प्रभाव पार्न सक्छन्?
हामी एउटा उदाहरण हेरौं - MIT Gender Shades Study Joy Buolamwini (MIT Media Labs) बाट, जसले signature research paper Timnit Gebru (त्यतिबेला Microsoft Research मा) सँग सह-लेखक गरेको थियो। यसले केन्द्रित गर्यो:
- के: अनुसन्धान परियोजनाको उद्देश्य लिङ्ग र छालाको प्रकारको आधारमा स्वचालित अनुहार विश्लेषण एल्गोरिदम र डाटासेटहरूमा रहेको पूर्वाग्रहको मूल्याङ्कन गर्नु थियो।
- किन: अनुहार विश्लेषण कानून प्रवर्तन, विमानस्थल सुरक्षा, भर्ती प्रणालीहरू र अन्य क्षेत्रमा प्रयोग गरिन्छ - जहाँ गलत वर्गीकरण (जस्तै, पूर्वाग्रहका कारण) ले प्रभावित व्यक्तिहरू वा समूहहरूलाई सम्भावित आर्थिक र सामाजिक हानि पुर्याउन सक्छ। निष्पक्षताको लागि पूर्वाग्रहहरू बुझ्नु (र हटाउनु वा कम गर्नु) महत्त्वपूर्ण छ।
- कसरी: अनुसन्धानकर्ताहरूले पहिचान गरे कि विद्यमान बेंचमार्कहरूले प्रायः हल्का छालाका विषयहरू प्रयोग गर्थे, र लिङ्ग र छालाको प्रकारद्वारा अधिक सन्तुलित नयाँ डाटासेट (१०००+ छविहरू) क्युरेट गरे। डाटासेटलाई तीन लिङ्ग वर्गीकरण उत्पादनहरूको (Microsoft, IBM & Face++ बाट) सटीकता मूल्याङ्कन गर्न प्रयोग गरियो।
परिणामहरूले देखाए कि समग्र वर्गीकरण सटीकता राम्रो भए पनि, विभिन्न उपसमूहहरू बीच त्रुटि दरमा उल्लेखनीय भिन्नता थियो - गलत लिङ्ग निर्धारण महिलाहरू वा गाढा छालाका व्यक्तिहरूका लागि उच्च थियो, जसले पूर्वाग्रहलाई संकेत गर्दछ।
मुख्य परिणामहरू: डाटा साइन्सलाई प्रतिनिधि डाटासेटहरू (सन्तुलित उपसमूहहरू) र समावेशी टोलीहरू (विविध पृष्ठभूमि) आवश्यक छ भन्ने चेतना बढायो ताकि एआई समाधानहरूमा यस्ता पूर्वाग्रहहरू चाँडै पहिचान र हटाउन वा कम गर्न सकियोस्। यस प्रकारका अनुसन्धान प्रयासहरूले धेरै संगठनहरूलाई उत्तरदायी एआई का लागि सिद्धान्त र अभ्यासहरू परिभाषित गर्न पनि महत्त्वपूर्ण भूमिका खेल्छन्, जसले उनीहरूको एआई उत्पादन र प्रक्रियाहरूमा निष्पक्षता सुधार गर्दछ।
Microsoft मा सम्बन्धित अनुसन्धान प्रयासहरू सिक्न चाहनुहुन्छ?
- Microsoft Research Projects मा कृत्रिम बुद्धिमत्तामा अनुसन्धान परियोजनाहरू जाँच गर्नुहोस्।
- Microsoft Research Data Science Summer School बाट विद्यार्थी परियोजनाहरू अन्वेषण गर्नुहोस्।
- Fairlearn परियोजना र उत्तरदायी एआई पहलहरू जाँच गर्नुहोस्।
डाटा साइन्स + मानविकी
![]() |
---|
डाटा साइन्स र डिजिटल मानविकी - Sketchnote by @nitya |
डिजिटल मानविकीलाई परिभाषित गरिएको छ "गणनात्मक विधिहरूलाई मानविकी अनुसन्धानसँग संयोजन गर्ने अभ्यास र दृष्टिकोणहरूको सङ्ग्रह" भनेर। स्ट्यानफोर्ड परियोजनाहरू जस्तै "इतिहासलाई पुनः सुरु गर्नु" र "कवितात्मक सोच" ले डिजिटल मानविकी र डाटा साइन्स बीचको सम्बन्धलाई चित्रण गर्दछ - जसले नेटवर्क विश्लेषण, सूचना भिजुअलाइजेसन, स्थानिक र पाठ विश्लेषण जस्ता प्रविधिहरूलाई जोड दिन्छ, जसले हामीलाई ऐतिहासिक र साहित्यिक डाटासेटहरू पुनः अन्वेषण गर्न र नयाँ अन्तर्दृष्टि र दृष्टिकोण प्राप्त गर्न मद्दत गर्दछ।
यस क्षेत्रमा परियोजना अन्वेषण र विस्तार गर्न चाहनुहुन्छ?
"Emily Dickinson and the Meter of Mood" जाँच गर्नुहोस् - Jen Looper बाट एक उत्कृष्ट उदाहरण, जसले सोध्छ कि हामी कसरी डाटा साइन्स प्रयोग गरेर परिचित कविताहरूलाई पुनः अन्वेषण गर्न र नयाँ सन्दर्भमा यसको अर्थ र यसको लेखकको योगदान पुनः मूल्याङ्कन गर्न सक्छौं। उदाहरणका लागि, के हामी कविताको टोन वा भावना विश्लेषण गरेर यसको लेखिएको मौसमको भविष्यवाणी गर्न सक्छौं - र यसले सम्बन्धित अवधिमा लेखकको मानसिक अवस्थाको बारेमा के बताउँछ?
त्यस प्रश्नको उत्तर दिन, हामी हाम्रो डाटा साइन्स जीवनचक्रका चरणहरू अनुसरण गर्छौं:
डाटा अधिग्रहण
- विश्लेषणका लागि सम्बन्धित डाटासेट सङ्कलन गर्न। विकल्पहरूमा API (जस्तै, Poetry DB API) प्रयोग गर्ने वा वेब पृष्ठहरू स्क्र्याप गर्ने (जस्तै, Project Gutenberg) उपकरणहरू (जस्तै, Scrapy) प्रयोग गरेर समावेश छन्।डाटा सफा गर्ने
- पाठलाई आधारभूत उपकरणहरू (जस्तै, Visual Studio Code र Microsoft Excel) प्रयोग गरेर ढाँचा, सफा र सरल बनाउने तरिका वर्णन गर्दछ।डाटा विश्लेषण
- डाटासेटलाई "नोटबुकहरू" मा आयात गरेर विश्लेषण गर्न Python प्याकेजहरू (जस्तै, pandas, numpy र matplotlib) प्रयोग गरेर डाटालाई व्यवस्थित र दृश्यात्मक बनाउने तरिका वर्णन गर्दछ।भावना विश्लेषण
- पाठ विश्लेषण जस्ता क्लाउड सेवाहरूलाई एकीकृत गर्ने तरिका वर्णन गर्दछ, जसले Power Automate जस्ता कम-कोड उपकरणहरू प्रयोग गरेर स्वचालित डाटा प्रशोधन वर्कफ्लोहरू सक्षम बनाउँछ।
यस वर्कफ्लो प्रयोग गरेर, हामी कविताहरूको भावनामा मौसमी प्रभावहरूको अन्वेषण गर्न सक्छौं, र सम्बन्धित अवधिमा लेखकको मानसिक अवस्थाको बारेमा हाम्रो आफ्नै दृष्टिकोण निर्माण गर्न सक्छौं। आफैं प्रयास गर्नुहोस् - त्यसपछि अन्य प्रश्नहरू सोध्न वा डाटालाई नयाँ तरिकामा दृश्यात्मक बनाउन नोटबुक विस्तार गर्नुहोस्!
तपाईं डिजिटल मानविकी टूलकिट मा केही उपकरणहरू प्रयोग गरेर यी अनुसन्धानका मार्गहरू पछ्याउन सक्नुहुन्छ।
डाटा साइन्स + दिगोपन
![]() |
---|
डाटा साइन्स र दिगोपन - Sketchnote by @nitya |
२०३० को लागि दिगो विकासको एजेन्डा - जुन २०१५ मा सबै संयुक्त राष्ट्र सदस्यहरूले अपनाएका थिए - ले १७ लक्ष्यहरू पहिचान गर्दछ, जसमा ग्रहलाई जोगाउने र जलवायु परिवर्तनको प्रभावबाट जोगाउने लक्ष्यहरू समावेश छन्। Microsoft Sustainability पहलले यी लक्ष्यहरूलाई समर्थन गर्दछ, जसले प्रविधि समाधानहरूले कसरी दिगो भविष्यहरूलाई समर्थन र निर्माण गर्न सक्छन् भनेर अन्वेषण गर्दछ, ४ लक्ष्यहरूमा ध्यान केन्द्रित गर्दै - २०३० सम्म कार्बन नकारात्मक, पानी सकारात्मक, शून्य फोहोर, र जैव-विविध हुनु।
यी चुनौतीहरूलाई मापनयोग्य र समयमै समाधान गर्न क्लाउड-स्तरको सोच आवश्यक छ - र ठूलो मात्रामा डाटा। Planetary Computer पहलले डाटा वैज्ञानिकहरू र विकासकर्ताहरूलाई यस प्रयासमा मद्दत गर्न ४ घटकहरू प्रदान गर्दछ:
-
डाटा क्याटलग - पृथ्वी प्रणाली डाटाको पेटाबाइट्स (निःशुल्क र Azure-होस्ट गरिएको)।
-
Planetary API - प्रयोगकर्ताहरूलाई स्थान र समयभरि सम्बन्धित डाटा खोज्न मद्दत गर्न।
-
हब - वैज्ञानिकहरूलाई विशाल भू-स्थानिक डाटासेटहरू प्रशोधन गर्न प्रबन्धित वातावरण।
-
अनुप्रयोगहरू - दिगोपन अन्तर्दृष्टिका लागि प्रयोग केसहरू र उपकरणहरू प्रदर्शन। प्लानेटरी कम्प्युटर प्रोजेक्ट हाल प्रिभ्यूमा छ (सेप्टेम्बर २०२१ अनुसार) - डाटा साइन्स प्रयोग गरेर दिगो समाधानहरूमा योगदान दिन सुरु गर्न यहाँबाट थाल्नुहोस्।
-
एक्सेसको लागि अनुरोध गर्नुहोस् अन्वेषण सुरु गर्न र सहकर्मीहरूसँग जडान गर्न।
-
डकुमेन्टेसन अन्वेषण गर्नुहोस् समर्थित डेटासेटहरू र API हरू बुझ्न।
-
इकोसिस्टम मोनिटरिङ जस्ता एप्लिकेसनहरू अन्वेषण गर्नुहोस् एप्लिकेसन आइडियाहरूको प्रेरणाको लागि।
डाटा भिजुअलाइजेसन प्रयोग गरेर जलवायु परिवर्तन र वन विनाश जस्ता क्षेत्रहरूमा सान्दर्भिक जानकारी उजागर गर्न वा प्रवर्धन गर्न कसरी प्रयोग गर्न सकिन्छ भन्ने सोच्नुहोस्। वा, कसरी यी जानकारीहरूलाई प्रयोगकर्ता अनुभव सिर्जना गर्न प्रयोग गर्न सकिन्छ जसले दिगो जीवनशैलीको लागि व्यवहार परिवर्तनलाई प्रेरित गर्छ।
डाटा साइन्स + विद्यार्थीहरू
हामीले उद्योग र अनुसन्धानमा वास्तविक संसारका एप्लिकेसनहरूबारे कुरा गरेका छौं, र डिजिटल ह्युम्यानिटीज र दिगो विकासमा डाटा साइन्स एप्लिकेसनका उदाहरणहरू अन्वेषण गरेका छौं। अब, डाटा साइन्सको शुरुवातीको रूपमा तपाईंले आफ्नो सीप कसरी निर्माण गर्न सक्नुहुन्छ र आफ्नो विशेषज्ञता साझा गर्न सक्नुहुन्छ?
यहाँ डाटा साइन्स विद्यार्थी परियोजनाहरूका केही उदाहरणहरू छन् जसले तपाईंलाई प्रेरित गर्न सक्छ।
- MSR डाटा साइन्स समर स्कूल GitHub परियोजनाहरू सहित, जस्तै:
- सामग्री संस्कृति डिजिटलाइजिङ: सिर्कापमा सामाजिक-आर्थिक वितरण अन्वेषण - Ornella Altunyan र Claremont टिमबाट, ArcGIS StoryMaps प्रयोग गर्दै।
🚀 चुनौती
डाटा साइन्स परियोजनाहरूको लागि लेखहरू खोज्नुहोस् जुन शुरुवातीहरूको लागि उपयुक्त छन् - जस्तै यी ५० विषय क्षेत्रहरू वा यी २१ परियोजना आइडियाहरू वा यी १६ परियोजनाहरू स्रोत कोडसहित जसलाई तपाईंले डिकन्स्ट्रक्ट र रिमिक्स गर्न सक्नुहुन्छ। र आफ्नो सिकाइ यात्रा ब्लग गर्न नबिर्सनुहोस् र आफ्नो जानकारी हामी सबैसँग साझा गर्नुहोस्।
पोस्ट-लेक्चर क्विज
पोस्ट-लेक्चर क्विज
समीक्षा र आत्म-अध्ययन
थप प्रयोग केसहरू अन्वेषण गर्न चाहनुहुन्छ? यहाँ केही सान्दर्भिक लेखहरू छन्:
- १७ डाटा साइन्स एप्लिकेसनहरू र उदाहरणहरू - जुलाई २०२१
- वास्तविक संसारमा ११ अद्भुत डाटा साइन्स एप्लिकेसनहरू - मे २०२१
- वास्तविक संसारमा डाटा साइन्स - लेख संग्रह
- १२ वास्तविक संसारका डाटा साइन्स एप्लिकेसनहरू उदाहरणसहित - मे २०२४
- डाटा साइन्समा: शिक्षा, कृषि, वित्त, चलचित्रहरू, स्वास्थ्य सेवा र थप।
असाइनमेन्ट
प्लानेटरी कम्प्युटर डेटासेट अन्वेषण गर्नुहोस्
अस्वीकरण:
यो दस्तावेज़ AI अनुवाद सेवा Co-op Translator प्रयोग गरेर अनुवाद गरिएको छ। हामी शुद्धताको लागि प्रयास गर्छौं, तर कृपया ध्यान दिनुहोस् कि स्वचालित अनुवादमा त्रुटिहरू वा अशुद्धताहरू हुन सक्छ। यसको मूल भाषा मा रहेको मूल दस्तावेज़लाई आधिकारिक स्रोत मानिनुपर्छ। महत्वपूर्ण जानकारीको लागि, व्यावसायिक मानव अनुवाद सिफारिस गरिन्छ। यस अनुवादको प्रयोगबाट उत्पन्न हुने कुनै पनि गलतफहमी वा गलत व्याख्याको लागि हामी जिम्मेवार हुने छैनौं।