# पोस्टस्क्रिप्ट: वास्तविक दुनिया में मशीन लर्निंग ![वास्तविक दुनिया में मशीन लर्निंग का सारांश एक स्केच नोट में](../../../../sketchnotes/ml-realworld.png) > स्केच नोट: [Tomomi Imura](https://www.twitter.com/girlie_mac) इस पाठ्यक्रम में, आपने डेटा को प्रशिक्षण के लिए तैयार करने और मशीन लर्निंग मॉडल बनाने के कई तरीके सीखे। आपने क्लासिक रिग्रेशन, क्लस्टरिंग, क्लासिफिकेशन, प्राकृतिक भाषा प्रसंस्करण और टाइम सीरीज़ मॉडल की एक श्रृंखला बनाई। बधाई हो! अब, आप सोच रहे होंगे कि यह सब किसके लिए है... इन मॉडलों के वास्तविक दुनिया में क्या उपयोग हैं? हालांकि उद्योग में AI, जो आमतौर पर डीप लर्निंग का उपयोग करता है, ने बहुत रुचि प्राप्त की है, फिर भी क्लासिकल मशीन लर्निंग मॉडलों के लिए मूल्यवान अनुप्रयोग हैं। आप आज भी इनमें से कुछ अनुप्रयोगों का उपयोग कर सकते हैं! इस पाठ में, आप देखेंगे कि कैसे आठ अलग-अलग उद्योग और विषय-विशेष डोमेन इन प्रकार के मॉडलों का उपयोग अपने अनुप्रयोगों को अधिक प्रदर्शनकारी, विश्वसनीय, बुद्धिमान और उपयोगकर्ताओं के लिए मूल्यवान बनाने के लिए करते हैं। ## [प्री-लेक्चर क्विज़](https://ff-quizzes.netlify.app/en/ml/) ## 💰 वित्त वित्तीय क्षेत्र मशीन लर्निंग के लिए कई अवसर प्रदान करता है। इस क्षेत्र की कई समस्याओं को मॉडलिंग और हल करने के लिए एमएल का उपयोग किया जा सकता है। ### क्रेडिट कार्ड धोखाधड़ी का पता लगाना हमने इस पाठ्यक्रम में पहले [k-means क्लस्टरिंग](../../5-Clustering/2-K-Means/README.md) के बारे में सीखा, लेकिन इसे क्रेडिट कार्ड धोखाधड़ी से संबंधित समस्याओं को हल करने के लिए कैसे उपयोग किया जा सकता है? k-means क्लस्टरिंग क्रेडिट कार्ड धोखाधड़ी का पता लगाने की तकनीक में उपयोगी है जिसे **आउटलायर डिटेक्शन** कहा जाता है। आउटलायर, या डेटा के एक सेट के बारे में अवलोकनों में विचलन, हमें बता सकते हैं कि क्रेडिट कार्ड सामान्य रूप से उपयोग किया जा रहा है या कुछ असामान्य हो रहा है। नीचे दिए गए पेपर में दिखाया गया है कि आप k-means क्लस्टरिंग एल्गोरिदम का उपयोग करके क्रेडिट कार्ड डेटा को सॉर्ट कर सकते हैं और प्रत्येक लेनदेन को क्लस्टर में असाइन कर सकते हैं कि यह कितना आउटलायर प्रतीत होता है। फिर, आप धोखाधड़ी और वैध लेनदेन के लिए सबसे जोखिम भरे क्लस्टर का मूल्यांकन कर सकते हैं। [संदर्भ](https://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.680.1195&rep=rep1&type=pdf) ### संपत्ति प्रबंधन संपत्ति प्रबंधन में, एक व्यक्ति या फर्म अपने ग्राहकों की ओर से निवेश संभालता है। उनका काम दीर्घकालिक में संपत्ति को बनाए रखना और बढ़ाना है, इसलिए यह आवश्यक है कि ऐसे निवेश चुने जाएं जो अच्छा प्रदर्शन करें। किसी विशेष निवेश के प्रदर्शन का मूल्यांकन करने का एक तरीका सांख्यिकीय रिग्रेशन के माध्यम से है। [लिनियर रिग्रेशन](../../2-Regression/1-Tools/README.md) यह समझने के लिए एक मूल्यवान उपकरण है कि कोई फंड किसी बेंचमार्क के सापेक्ष कैसा प्रदर्शन करता है। हम यह भी निष्कर्ष निकाल सकते हैं कि रिग्रेशन के परिणाम सांख्यिकीय रूप से महत्वपूर्ण हैं या वे ग्राहक के निवेश को कितना प्रभावित करेंगे। आप अपने विश्लेषण को मल्टीपल रिग्रेशन का उपयोग करके और भी विस्तारित कर सकते हैं, जहां अतिरिक्त जोखिम कारकों को ध्यान में रखा जा सकता है। यह कैसे काम करेगा, इसके एक उदाहरण के लिए, नीचे दिए गए पेपर को देखें जो रिग्रेशन का उपयोग करके फंड प्रदर्शन का मूल्यांकन करता है। [संदर्भ](http://www.brightwoodventures.com/evaluating-fund-performance-using-regression/) ## 🎓 शिक्षा शिक्षा क्षेत्र भी एक बहुत ही दिलचस्प क्षेत्र है जहां एमएल लागू किया जा सकता है। यहां दिलचस्प समस्याएं हैं जैसे परीक्षाओं या निबंधों में धोखाधड़ी का पता लगाना या सुधार प्रक्रिया में पूर्वाग्रह को प्रबंधित करना, चाहे वह जानबूझकर हो या नहीं। ### छात्र व्यवहार की भविष्यवाणी करना [Coursera](https://coursera.com), एक ऑनलाइन ओपन कोर्स प्रदाता, का एक शानदार टेक ब्लॉग है जहां वे कई इंजीनियरिंग निर्णयों पर चर्चा करते हैं। इस केस स्टडी में, उन्होंने एक रिग्रेशन लाइन को प्लॉट किया ताकि यह पता लगाया जा सके कि कम NPS (नेट प्रमोटर स्कोर) रेटिंग और कोर्स रिटेंशन या ड्रॉप-ऑफ के बीच कोई संबंध है या नहीं। [संदर्भ](https://medium.com/coursera-engineering/controlled-regression-quantifying-the-impact-of-course-quality-on-learner-retention-31f956bd592a) ### पूर्वाग्रह को कम करना [Grammarly](https://grammarly.com), एक लेखन सहायक जो वर्तनी और व्याकरण की त्रुटियों की जांच करता है, अपने उत्पादों में परिष्कृत [प्राकृतिक भाषा प्रसंस्करण प्रणालियों](../../6-NLP/README.md) का उपयोग करता है। उन्होंने अपने टेक ब्लॉग में एक दिलचस्प केस स्टडी प्रकाशित की कि उन्होंने मशीन लर्निंग में लिंग पूर्वाग्रह से कैसे निपटा, जिसे आपने हमारे [परिचयात्मक निष्पक्षता पाठ](../../1-Introduction/3-fairness/README.md) में सीखा। [संदर्भ](https://www.grammarly.com/blog/engineering/mitigating-gender-bias-in-autocorrect/) ## 👜 रिटेल रिटेल क्षेत्र निश्चित रूप से एमएल के उपयोग से लाभ उठा सकता है, जिसमें बेहतर ग्राहक यात्रा बनाने से लेकर इन्वेंट्री को इष्टतम तरीके से स्टॉक करना शामिल है। ### ग्राहक यात्रा को व्यक्तिगत बनाना Wayfair, एक कंपनी जो फर्नीचर जैसे घरेलू सामान बेचती है, ग्राहकों को उनके स्वाद और जरूरतों के लिए सही उत्पाद खोजने में मदद करना बहुत महत्वपूर्ण मानती है। इस लेख में, कंपनी के इंजीनियर बताते हैं कि वे एमएल और एनएलपी का उपयोग कैसे करते हैं ताकि "ग्राहकों के लिए सही परिणाम प्रस्तुत किए जा सकें।" विशेष रूप से, उनका क्वेरी इंटेंट इंजन ग्राहक समीक्षाओं पर एंटिटी एक्सट्रैक्शन, क्लासिफायर ट्रेनिंग, एसेट और ओपिनियन एक्सट्रैक्शन, और सेंटिमेंट टैगिंग का उपयोग करता है। यह ऑनलाइन रिटेल में एनएलपी के काम करने का एक क्लासिक उपयोग मामला है। [संदर्भ](https://www.aboutwayfair.com/tech-innovation/how-we-use-machine-learning-and-natural-language-processing-to-empower-search) ### इन्वेंट्री प्रबंधन [StitchFix](https://stitchfix.com) जैसे अभिनव, तेज़ कंपनियां, जो उपभोक्ताओं को कपड़ों की शिपिंग सेवा प्रदान करती हैं, सिफारिशों और इन्वेंट्री प्रबंधन के लिए एमएल पर बहुत अधिक निर्भर करती हैं। उनके स्टाइलिंग टीमें उनके मर्चेंडाइजिंग टीमों के साथ मिलकर काम करती हैं। "हमारे एक डेटा वैज्ञानिक ने एक जेनेटिक एल्गोरिदम के साथ प्रयोग किया और इसे परिधान पर लागू किया ताकि यह भविष्यवाणी की जा सके कि कौन सा कपड़ा सफल होगा जो आज मौजूद नहीं है। हमने इसे मर्चेंडाइज टीम को दिया और अब वे इसे एक उपकरण के रूप में उपयोग कर सकते हैं।" [संदर्भ](https://www.zdnet.com/article/how-stitch-fix-uses-machine-learning-to-master-the-science-of-styling/) ## 🏥 स्वास्थ्य देखभाल स्वास्थ्य देखभाल क्षेत्र एमएल का उपयोग अनुसंधान कार्यों और लॉजिस्टिक समस्याओं जैसे रोगियों को फिर से भर्ती करने या बीमारियों के फैलने को रोकने के लिए कर सकता है। ### क्लिनिकल ट्रायल प्रबंधन क्लिनिकल ट्रायल में विषाक्तता दवा निर्माताओं के लिए एक प्रमुख चिंता का विषय है। कितनी विषाक्तता सहनीय है? इस अध्ययन में, विभिन्न क्लिनिकल ट्रायल विधियों का विश्लेषण करने से क्लिनिकल ट्रायल परिणामों की संभावनाओं की भविष्यवाणी करने के लिए एक नया दृष्टिकोण विकसित हुआ। विशेष रूप से, उन्होंने एक [क्लासिफायर](../../4-Classification/README.md) बनाने के लिए रैंडम फॉरेस्ट का उपयोग किया जो दवाओं के समूहों के बीच अंतर कर सकता है। [संदर्भ](https://www.sciencedirect.com/science/article/pii/S2451945616302914) ### अस्पताल पुनः प्रवेश प्रबंधन अस्पताल देखभाल महंगी है, खासकर जब मरीजों को फिर से भर्ती करना पड़ता है। इस पेपर में एक कंपनी पर चर्चा की गई है जो [क्लस्टरिंग](../../5-Clustering/README.md) एल्गोरिदम का उपयोग करके पुनः प्रवेश की संभावना की भविष्यवाणी करती है। ये क्लस्टर विश्लेषकों को "पुनः प्रवेश के समूहों की खोज करने में मदद करते हैं जो एक सामान्य कारण साझा कर सकते हैं।" [संदर्भ](https://healthmanagement.org/c/healthmanagement/issuearticle/hospital-readmissions-and-machine-learning) ### रोग प्रबंधन हाल ही में महामारी ने यह उजागर किया है कि मशीन लर्निंग रोग के फैलाव को रोकने में कैसे मदद कर सकती है। इस लेख में, आप ARIMA, लॉजिस्टिक कर्व्स, लिनियर रिग्रेशन, और SARIMA का उपयोग पहचानेंगे। "यह कार्य इस वायरस के फैलने की दर की गणना करने और मौतों, रिकवरी, और पुष्टि किए गए मामलों की भविष्यवाणी करने का प्रयास है, ताकि हम बेहतर तैयारी कर सकें और जीवित रह सकें।" [संदर्भ](https://www.ncbi.nlm.nih.gov/pmc/articles/PMC7979218/) ## 🌲 पारिस्थितिकी और ग्रीन टेक प्रकृति और पारिस्थितिकी में कई संवेदनशील प्रणालियां होती हैं जहां जानवरों और प्रकृति के बीच का संबंध ध्यान में आता है। इन प्रणालियों को सटीक रूप से मापना और यदि कुछ होता है तो उचित कार्रवाई करना महत्वपूर्ण है, जैसे जंगल की आग या जानवरों की आबादी में गिरावट। ### जंगल प्रबंधन आपने पिछले पाठों में [रीइन्फोर्समेंट लर्निंग](../../8-Reinforcement/README.md) के बारे में सीखा। यह प्रकृति में पैटर्न की भविष्यवाणी करने की कोशिश करते समय बहुत उपयोगी हो सकता है। विशेष रूप से, इसका उपयोग जंगल की आग और आक्रामक प्रजातियों के फैलाव जैसे पारिस्थितिक समस्याओं को ट्रैक करने के लिए किया जा सकता है। कनाडा में, शोधकर्ताओं के एक समूह ने उपग्रह छवियों से जंगल की आग की गतिशीलता मॉडल बनाने के लिए रीइन्फोर्समेंट लर्निंग का उपयोग किया। एक अभिनव "स्पेशली स्प्रेडिंग प्रोसेस (SSP)" का उपयोग करते हुए, उन्होंने जंगल की आग को "परिदृश्य में किसी भी सेल पर एजेंट" के रूप में देखा। "आग किसी स्थान से किसी भी समय उत्तर, दक्षिण, पूर्व, पश्चिम में फैलने या न फैलने की कार्रवाई कर सकती है।" इस दृष्टिकोण ने सामान्य RL सेटअप को उलट दिया क्योंकि संबंधित मार्कोव निर्णय प्रक्रिया (MDP) की गतिशीलता तत्काल जंगल की आग फैलने के लिए एक ज्ञात कार्य है। इस समूह द्वारा उपयोग किए गए क्लासिक एल्गोरिदम के बारे में अधिक पढ़ें नीचे दिए गए लिंक पर। [संदर्भ](https://www.frontiersin.org/articles/10.3389/fict.2018.00006/full) ### जानवरों की गति का पता लगाना हालांकि डीप लर्निंग ने जानवरों की गतिविधियों को ट्रैक करने में क्रांति ला दी है (आप अपना [पोलर बियर ट्रैकर](https://docs.microsoft.com/learn/modules/build-ml-model-with-azure-stream-analytics/?WT.mc_id=academic-77952-leestott) यहां बना सकते हैं), क्लासिक एमएल अभी भी इस कार्य में अपनी जगह रखता है। फार्म जानवरों की गतिविधियों को ट्रैक करने के लिए सेंसर और IoT इस प्रकार की दृश्य प्रसंस्करण का उपयोग करते हैं, लेकिन डेटा को प्रीप्रोसेस करने के लिए अधिक बुनियादी एमएल तकनीकें उपयोगी होती हैं। उदाहरण के लिए, इस पेपर में, विभिन्न क्लासिफायर एल्गोरिदम का उपयोग करके भेड़ों की मुद्राओं की निगरानी और विश्लेषण किया गया। आप पृष्ठ 335 पर ROC कर्व को पहचान सकते हैं। [संदर्भ](https://druckhaus-hofmann.de/gallery/31-wj-feb-2020.pdf) ### ⚡️ ऊर्जा प्रबंधन हमारे [टाइम सीरीज़ फोरकास्टिंग](../../7-TimeSeries/README.md) पाठों में, हमने स्मार्ट पार्किंग मीटर की अवधारणा को लागू किया ताकि आपूर्ति और मांग को समझकर किसी शहर के लिए राजस्व उत्पन्न किया जा सके। इस लेख में चर्चा की गई है कि क्लस्टरिंग, रिग्रेशन और टाइम सीरीज़ फोरकास्टिंग ने आयरलैंड में भविष्य की ऊर्जा खपत की भविष्यवाणी करने में कैसे मदद की, स्मार्ट मीटरिंग के आधार पर। [संदर्भ](https://www-cdn.knime.com/sites/default/files/inline-images/knime_bigdata_energy_timeseries_whitepaper.pdf) ## 💼 बीमा बीमा क्षेत्र एक और क्षेत्र है जो एमएल का उपयोग करके व्यवहार्य वित्तीय और एक्चुरियल मॉडल बनाने और अनुकूलित करने के लिए करता है। ### अस्थिरता प्रबंधन MetLife, एक जीवन बीमा प्रदाता, अपने वित्तीय मॉडलों में अस्थिरता का विश्लेषण और कम करने के तरीके के बारे में खुला है। इस लेख में आप बाइनरी और ऑर्डिनल क्लासिफिकेशन विज़ुअलाइज़ेशन देखेंगे। आप फोरकास्टिंग विज़ुअलाइज़ेशन भी खोजेंगे। [संदर्भ](https://investments.metlife.com/content/dam/metlifecom/us/investments/insights/research-topics/macro-strategy/pdf/MetLifeInvestmentManagement_MachineLearnedRanking_070920.pdf) ## 🎨 कला, संस्कृति, और साहित्य कला में, उदाहरण के लिए पत्रकारिता में, कई दिलचस्प समस्याएं हैं। फेक न्यूज़ का पता लगाना एक बड़ी समस्या है क्योंकि यह लोगों की राय को प्रभावित करने और यहां तक कि लोकतंत्रों को गिराने के लिए सिद्ध हुआ है। संग्रहालय भी एमएल का उपयोग करके लाभ उठा सकते हैं, जैसे कि कलाकृतियों के बीच लिंक ढूंढना या संसाधन योजना बनाना। ### फेक न्यूज़ का पता लगाना आज की मीडिया में फेक न्यूज़ का पता लगाना बिल्ली और चूहे का खेल बन गया है। इस लेख में, शोधकर्ता सुझाव देते हैं कि एमएल तकनीकों के संयोजन से एक सिस्टम का परीक्षण किया जा सकता है और सबसे अच्छा मॉडल तैनात किया जा सकता है: "यह सिस्टम डेटा से फीचर्स निकालने के लिए प्राकृतिक भाषा प्रसंस्करण पर आधारित है और फिर इन फीचर्स का उपयोग मशीन लर्निंग क्लासिफायर जैसे Naive Bayes, Support Vector Machine (SVM), Random Forest (RF), Stochastic Gradient Descent (SGD), और Logistic Regression (LR) के प्रशिक्षण के लिए किया जाता है।" [संदर्भ](https://www.irjet.net/archives/V7/i6/IRJET-V7I6688.pdf) यह लेख दिखाता है कि कैसे विभिन्न एमएल डोमेन को मिलाकर दिलचस्प परिणाम उत्पन्न किए जा सकते हैं जो फेक न्यूज़ को फैलने और वास्तविक नुकसान पैदा करने से रोकने में मदद कर सकते हैं; इस मामले में, प्रेरणा COVID उपचारों के बारे में अफवाहों के फैलने से हुई थी जिसने भीड़ हिंसा को उकसाया। ### संग्रहालय एमएल संग्रहालय एआई क्रांति के कगार पर हैं, जिसमें संग्रहों को कैटलॉग और डिजिटाइज़ करना और कलाकृतियों के बीच लिंक ढूंढना आसान हो रहा है क्योंकि तकनीक आगे बढ़ रही है। [In Codice Ratio](https://www.sciencedirect.com/science/article/abs/pii/S0306457321001035#:~:text=1.,studies%20over%20large%20historical%20sources.) जैसे प्रोजेक्ट्स वेटिकन आर्काइव्स जैसे दुर्गम संग्रहों के रहस्यों को खोलने में मदद कर रहे हैं। लेकिन, संग्रहालयों का व्यावसायिक पहलू भी एमएल मॉडलों से लाभान्वित होता है। उदाहरण के लिए, शिकागो के आर्ट इंस्टीट्यूट ने मॉडल बनाए ताकि यह भविष्यवाणी की जा सके कि दर्शक किसमें रुचि रखते हैं और वे कब प्रदर्शनियों में भाग लेंगे। लक्ष्य प्रत्येक बार जब उपयोगकर्ता संग्रहालय का दौरा करता है तो व्यक्तिगत और अनुकूलित अनुभव बनाना है। "वित्तीय वर्ष 2017 के दौरान, मॉडल ने उपस्थिति और प्रवेश को 1 प्रतिशत की सटीकता के भीतर भविष्यवाणी की, कहते हैं एंड्रयू सिमनिक, आर्ट इंस्टीट्यूट में वरिष्ठ उपाध्यक्ष।" [संदर्भ](https://www.chicagobusiness.com/article/20180518/ISSUE01/180519840/art-institute-of-chicago-uses-data-to-make-exhibit-choices) ## 🏷 मार्केटिंग ### ग्राहक विभाजन सबसे प्रभावी मार्केटिंग रणनीतियां विभिन्न समूहों के आधार पर ग्राहकों को अलग-अलग तरीकों से लक्षित करती हैं। इस लेख में, क्लस्टरिंग एल्गोरिदम के उपयोग पर चर्चा की गई है ताकि विभेदित मार्केटिंग का समर्थन किया जा सके। विभेदित मार्केटिंग कंपनियों को ब्रांड पहचान में सुधार करने, अधिक ग्राहकों तक पहुंचने, और अधिक पैसा कमाने में मदद करती है। [संदर्भ](https://ai.inqline.com/machine-learning-for-marketing-customer-segmentation/) ## 🚀 चुनौती एक और क्षेत्र की पहचान करें जो आपने इस पाठ्यक्रम में सीखी गई तकनीकों से लाभान्वित होता है ## [पोस्ट-लेक्चर क्विज़](https://ff-quizzes.netlify.app/en/ml/) ## समीक्षा और स्व-अध्ययन Wayfair की डेटा साइंस टीम ने यह दिखाने के लिए कई दिलचस्प वीडियो बनाए हैं कि वे अपनी कंपनी में मशीन लर्निंग का उपयोग कैसे करते हैं। यह [देखने लायक](https://www.youtube.com/channel/UCe2PjkQXqOuwkW1gw6Ameuw/videos) है! ## असाइनमेंट [एक मशीन लर्निंग स्कैवेंजर हंट](assignment.md) --- **अस्वीकरण**: यह दस्तावेज़ AI अनुवाद सेवा [Co-op Translator](https://github.com/Azure/co-op-translator) का उपयोग करके अनुवादित किया गया है। जबकि हम सटीकता के लिए प्रयासरत हैं, कृपया ध्यान दें कि स्वचालित अनुवाद में त्रुटियां या अशुद्धियां हो सकती हैं। मूल भाषा में उपलब्ध मूल दस्तावेज़ को आधिकारिक स्रोत माना जाना चाहिए। महत्वपूर्ण जानकारी के लिए, पेशेवर मानव अनुवाद की सिफारिश की जाती है। इस अनुवाद के उपयोग से उत्पन्न किसी भी गलतफहमी या गलत व्याख्या के लिए हम उत्तरदायी नहीं हैं।