# परिशिष्ट: वास्तविक दुनिया में मशीन लर्निंग ![वास्तविक दुनिया में मशीन लर्निंग का सारांश एक स्केच नोट में](../../../../translated_images/ml-realworld.26ee2746716155771f8076598b6145e6533fe4a9e2e465ea745f46648cbf1b84.hi.png) > स्केच नोट [Tomomi Imura](https://www.twitter.com/girlie_mac) द्वारा इस पाठ्यक्रम में, आपने डेटा को प्रशिक्षण के लिए तैयार करने और मशीन लर्निंग मॉडल बनाने के कई तरीके सीखे हैं। आपने शास्त्रीय रिग्रेशन, क्लस्टरिंग, क्लासिफिकेशन, नेचुरल लैंग्वेज प्रोसेसिंग, और टाइम सीरीज मॉडल की एक श्रृंखला बनाई। बधाई हो! अब, आप सोच रहे होंगे कि यह सब किस लिए है... इन मॉडलों के वास्तविक दुनिया में क्या अनुप्रयोग हैं? जबकि उद्योग में एआई में बहुत रुचि है, जो आमतौर पर डीप लर्निंग का उपयोग करता है, फिर भी क्लासिकल मशीन लर्निंग मॉडलों के लिए मूल्यवान अनुप्रयोग हैं। आप आज इनमें से कुछ अनुप्रयोगों का भी उपयोग कर सकते हैं! इस पाठ में, आप जानेंगे कि आठ विभिन्न उद्योग और विषय-विशेषज्ञता डोमेन इन प्रकार के मॉडलों का उपयोग कैसे करते हैं ताकि उनके अनुप्रयोग अधिक प्रभावी, विश्वसनीय, बुद्धिमान, और उपयोगकर्ताओं के लिए मूल्यवान बन सकें। ## [पूर्व-व्याख्यान क्विज़](https://gray-sand-07a10f403.1.azurestaticapps.net/quiz/49/) ## 💰 वित्त वित्त क्षेत्र में मशीन लर्निंग के कई अवसर हैं। इस क्षेत्र में कई समस्याएं एमएल का उपयोग करके मॉडल और हल की जा सकती हैं। ### क्रेडिट कार्ड धोखाधड़ी का पता लगाना हमने पाठ्यक्रम में पहले [k-means क्लस्टरिंग](../../5-Clustering/2-K-Means/README.md) के बारे में सीखा, लेकिन इसे क्रेडिट कार्ड धोखाधड़ी से संबंधित समस्याओं को हल करने के लिए कैसे उपयोग किया जा सकता है? K-means क्लस्टरिंग क्रेडिट कार्ड धोखाधड़ी का पता लगाने की तकनीक में सहायक होती है जिसे **आउटलायर डिटेक्शन** कहा जाता है। आउटलायर, या डेटा सेट के बारे में अवलोकनों में विचलन, हमें बता सकते हैं कि क्या एक क्रेडिट कार्ड सामान्य क्षमता में उपयोग हो रहा है या कुछ असामान्य हो रहा है। नीचे लिंक किए गए पेपर में दिखाए गए अनुसार, आप k-means क्लस्टरिंग एल्गोरिदम का उपयोग करके क्रेडिट कार्ड डेटा को सॉर्ट कर सकते हैं और प्रत्येक लेनदेन को एक क्लस्टर में असाइन कर सकते हैं कि यह कितना आउटलायर लगता है। फिर, आप धोखाधड़ी और वैध लेनदेन के लिए सबसे जोखिम भरे क्लस्टर का मूल्यांकन कर सकते हैं। [संदर्भ](https://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.680.1195&rep=rep1&type=pdf) ### धन प्रबंधन धन प्रबंधन में, एक व्यक्ति या फर्म अपने ग्राहकों की ओर से निवेश संभालती है। उनका काम दीर्घकालिक में धन को बनाए रखना और बढ़ाना है, इसलिए यह आवश्यक है कि वे निवेशों का चयन करें जो अच्छा प्रदर्शन करें। किसी विशेष निवेश के प्रदर्शन का मूल्यांकन करने का एक तरीका सांख्यिकीय रिग्रेशन के माध्यम से है। [लिनियर रिग्रेशन](../../2-Regression/1-Tools/README.md) यह समझने के लिए एक मूल्यवान उपकरण है कि एक फंड कुछ बेंचमार्क के सापेक्ष कैसा प्रदर्शन करता है। हम यह भी अनुमान लगा सकते हैं कि रिग्रेशन के परिणाम सांख्यिकीय रूप से महत्वपूर्ण हैं या नहीं, या वे ग्राहक के निवेश को कितना प्रभावित करेंगे। आप अपने विश्लेषण को मल्टीपल रिग्रेशन का उपयोग करके और भी विस्तार कर सकते हैं, जहां अतिरिक्त जोखिम कारकों को ध्यान में रखा जा सकता है। एक विशिष्ट फंड के लिए यह कैसे काम करेगा, इसका एक उदाहरण देखने के लिए नीचे दिए गए पेपर को देखें। [संदर्भ](http://www.brightwoodventures.com/evaluating-fund-performance-using-regression/) ## 🎓 शिक्षा शैक्षिक क्षेत्र भी एक बहुत ही दिलचस्प क्षेत्र है जहां एमएल लागू किया जा सकता है। यहां कई दिलचस्प समस्याएं हैं जैसे परीक्षाओं या निबंधों में धोखाधड़ी का पता लगाना या सुधार प्रक्रिया में पूर्वाग्रह का प्रबंधन करना। ### छात्र व्यवहार की भविष्यवाणी [Coursera](https://coursera.com), एक ऑनलाइन ओपन कोर्स प्रोवाइडर, के पास एक शानदार टेक ब्लॉग है जहां वे कई इंजीनियरिंग निर्णयों पर चर्चा करते हैं। इस केस स्टडी में, उन्होंने एक रिग्रेशन लाइन को प्लॉट किया ताकि यह पता लगाया जा सके कि कम एनपीएस (नेट प्रमोटर स्कोर) रेटिंग और कोर्स रिटेंशन या ड्रॉप-ऑफ के बीच कोई संबंध है या नहीं। [संदर्भ](https://medium.com/coursera-engineering/controlled-regression-quantifying-the-impact-of-course-quality-on-learner-retention-31f956bd592a) ### पूर्वाग्रह को कम करना [Grammarly](https://grammarly.com), एक लेखन सहायक जो वर्तनी और व्याकरण की त्रुटियों की जांच करता है, अपने उत्पादों में उन्नत [प्राकृतिक भाषा प्रसंस्करण प्रणालियों](../../6-NLP/README.md) का उपयोग करता है। उन्होंने अपने टेक ब्लॉग में एक दिलचस्प केस स्टडी प्रकाशित की है कि उन्होंने मशीन लर्निंग में जेंडर पूर्वाग्रह से कैसे निपटा, जिसके बारे में आपने हमारे [प्रारंभिक निष्पक्षता पाठ](../../1-Introduction/3-fairness/README.md) में सीखा। [संदर्भ](https://www.grammarly.com/blog/engineering/mitigating-gender-bias-in-autocorrect/) ## 👜 रिटेल रिटेल सेक्टर निश्चित रूप से एमएल के उपयोग से लाभ उठा सकता है, बेहतर ग्राहक यात्रा बनाने से लेकर इन्वेंटरी को इष्टतम तरीके से स्टॉक करने तक। ### ग्राहक यात्रा को व्यक्तिगत बनाना Wayfair, एक कंपनी जो फर्नीचर जैसी घरेलू वस्तुएं बेचती है, के लिए ग्राहकों को उनके स्वाद और आवश्यकताओं के अनुसार सही उत्पाद खोजने में मदद करना महत्वपूर्ण है। इस लेख में, कंपनी के इंजीनियर बताते हैं कि वे एमएल और एनएलपी का उपयोग कैसे करते हैं ताकि "ग्राहकों के लिए सही परिणाम सामने आएं"। विशेष रूप से, उनका क्वेरी इंटेंट इंजन इकाई निष्कर्षण, क्लासिफायर प्रशिक्षण, एसेट और राय निष्कर्षण, और ग्राहक समीक्षाओं पर भावना टैगिंग का उपयोग करने के लिए बनाया गया है। यह ऑनलाइन रिटेल में एनएलपी के काम करने का एक क्लासिक उपयोग मामला है। [संदर्भ](https://www.aboutwayfair.com/tech-innovation/how-we-use-machine-learning-and-natural-language-processing-to-empower-search) ### इन्वेंटरी प्रबंधन [StitchFix](https://stitchfix.com) जैसी अभिनव, फुर्तीली कंपनियां, जो उपभोक्ताओं को कपड़े भेजने वाली एक बॉक्स सेवा है, अनुशंसाओं और इन्वेंटरी प्रबंधन के लिए बड़े पैमाने पर एमएल पर निर्भर करती हैं। उनकी स्टाइलिंग टीमें उनके मर्चेंडाइजिंग टीमों के साथ मिलकर काम करती हैं, वास्तव में: "हमारे एक डेटा वैज्ञानिक ने एक जेनेटिक एल्गोरिदम के साथ छेड़छाड़ की और इसे परिधान पर लागू किया ताकि यह अनुमान लगाया जा सके कि कौन सा कपड़ा आज सफल होगा। हमने इसे मर्चेंडाइज टीम के पास लाया और अब वे इसे एक उपकरण के रूप में उपयोग कर सकते हैं।" [संदर्भ](https://www.zdnet.com/article/how-stitch-fix-uses-machine-learning-to-master-the-science-of-styling/) ## 🏥 स्वास्थ्य देखभाल स्वास्थ्य देखभाल क्षेत्र अनुसंधान कार्यों को अनुकूलित करने और साथ ही रोगियों को फिर से भर्ती करने या रोगों के फैलने से रोकने जैसी लॉजिस्टिक समस्याओं को हल करने के लिए एमएल का लाभ उठा सकता है। ### क्लिनिकल ट्रायल का प्रबंधन क्लिनिकल ट्रायल में विषाक्तता दवा निर्माताओं के लिए एक प्रमुख चिंता है। कितनी विषाक्तता सहनशील है? इस अध्ययन में, विभिन्न क्लिनिकल ट्रायल विधियों का विश्लेषण करने से क्लिनिकल ट्रायल परिणामों की संभावनाओं की भविष्यवाणी के लिए एक नया दृष्टिकोण विकसित हुआ। विशेष रूप से, वे एक [क्लासिफायर](../../4-Classification/README.md) का उपयोग करने में सक्षम थे जो दवाओं के समूहों के बीच अंतर कर सकता है। [संदर्भ](https://www.sciencedirect.com/science/article/pii/S2451945616302914) ### अस्पताल पुन: प्रवेश प्रबंधन अस्पताल देखभाल महंगी है, विशेष रूप से जब मरीजों को फिर से भर्ती करना पड़ता है। इस पेपर में एक कंपनी पर चर्चा की गई है जो [क्लस्टरिंग](../../5-Clustering/README.md) एल्गोरिदम का उपयोग करके पुन: प्रवेश की संभावना की भविष्यवाणी करने के लिए एमएल का उपयोग करती है। ये क्लस्टर विश्लेषकों को "पुन: प्रवेश के समूहों की खोज करने में मदद करते हैं जिनके पास एक सामान्य कारण हो सकता है"। [संदर्भ](https://healthmanagement.org/c/healthmanagement/issuearticle/hospital-readmissions-and-machine-learning) ### रोग प्रबंधन हालिया महामारी ने यह उजागर किया है कि मशीन लर्निंग रोग के फैलाव को रोकने में कैसे मदद कर सकती है। इस लेख में, आप ARIMA, लॉजिस्टिक कर्व्स, लिनियर रिग्रेशन, और SARIMA के उपयोग को पहचानेंगे। "यह काम इस वायरस के फैलाव की दर की गणना करने और इस प्रकार मौतों, रिकवरी, और पुष्टि किए गए मामलों की भविष्यवाणी करने का एक प्रयास है, ताकि यह हमें बेहतर तैयार करने और जीवित रहने में मदद कर सके।" [संदर्भ](https://www.ncbi.nlm.nih.gov/pmc/articles/PMC7979218/) ## 🌲 पारिस्थितिकी और ग्रीन टेक प्रकृति और पारिस्थितिकी में कई संवेदनशील प्रणालियाँ होती हैं जहाँ जानवरों और प्रकृति के बीच का अंतःक्रिया ध्यान में आता है। इन प्रणालियों को सटीक रूप से मापना और कुछ होने पर उचित कार्य करना महत्वपूर्ण है, जैसे कि जंगल की आग या जानवरों की आबादी में गिरावट। ### वन प्रबंधन आपने पिछले पाठों में [रिइनफोर्समेंट लर्निंग](../../8-Reinforcement/README.md) के बारे में सीखा। यह प्रकृति में पैटर्न की भविष्यवाणी करने में बहुत उपयोगी हो सकता है। विशेष रूप से, इसका उपयोग जंगल की आग और आक्रामक प्रजातियों के फैलाव जैसी पारिस्थितिक समस्याओं को ट्रैक करने के लिए किया जा सकता है। कनाडा में, एक समूह ने उपग्रह चित्रों से जंगल की आग की गतिशीलता मॉडल बनाने के लिए रिइनफोर्समेंट लर्निंग का उपयोग किया। एक अभिनव "स्थानिक रूप से फैलने वाली प्रक्रिया (SSP)" का उपयोग करके, उन्होंने एक जंगल की आग को "परिदृश्य में किसी भी सेल में एजेंट" के रूप में देखा। "किसी स्थान से किसी भी समय पर आग द्वारा लिए जा सकने वाले क्रियाओं का सेट उत्तर, दक्षिण, पूर्व, या पश्चिम में फैलना या न फैलना शामिल है। इस दृष्टिकोण ने सामान्य RL सेटअप को उलट दिया क्योंकि संबंधित मार्कोव निर्णय प्रक्रिया (MDP) का गतिशीलता एक ज्ञात कार्य है।" इस समूह द्वारा उपयोग किए गए क्लासिक एल्गोरिदम के बारे में अधिक पढ़ने के लिए नीचे दिए गए लिंक पर जाएं। [संदर्भ](https://www.frontiersin.org/articles/10.3389/fict.2018.00006/full) ### जानवरों की गति का पता लगाना जबकि डीप लर्निंग ने जानवरों की गति को दृश्य रूप से ट्रैक करने में क्रांति ला दी है (आप अपना खुद का [ध्रुवीय भालू ट्रैकर](https://docs.microsoft.com/learn/modules/build-ml-model-with-azure-stream-analytics/?WT.mc_id=academic-77952-leestott) यहाँ बना सकते हैं), क्लासिकल एमएल का इस कार्य में अभी भी एक स्थान है। फार्म जानवरों की गति को ट्रैक करने और आईओटी सेंसर इस प्रकार की दृश्य प्रसंस्करण का उपयोग करते हैं, लेकिन अधिक बुनियादी एमएल तकनीकें डेटा को पूर्व-प्रसंस्करण करने के लिए उपयोगी हैं। उदाहरण के लिए, इस पेपर में, भेड़ों की मुद्राओं की निगरानी और विभिन्न क्लासिफायर एल्गोरिदम का उपयोग करके विश्लेषण किया गया। आप पृष्ठ 335 पर आरओसी कर्व को पहचान सकते हैं। [संदर्भ](https://druckhaus-hofmann.de/gallery/31-wj-feb-2020.pdf) ### ⚡️ ऊर्जा प्रबंधन हमारे [टाइम सीरीज फोरकास्टिंग](../../7-TimeSeries/README.md) पर पाठों में, हमने एक शहर के लिए आपूर्ति और मांग को समझकर राजस्व उत्पन्न करने के लिए स्मार्ट पार्किंग मीटर की अवधारणा को लागू किया। इस लेख में, क्लस्टरिंग, रिग्रेशन और टाइम सीरीज फोरकास्टिंग को मिलाकर आयरलैंड में भविष्य की ऊर्जा उपयोग की भविष्यवाणी करने में कैसे मदद की गई, इसका विवरण दिया गया है, स्मार्ट मीटरिंग पर आधारित। [संदर्भ](https://www-cdn.knime.com/sites/default/files/inline-images/knime_bigdata_energy_timeseries_whitepaper.pdf) ## 💼 बीमा बीमा क्षेत्र एक और क्षेत्र है जो एमएल का उपयोग करके व्यवहार्य वित्तीय और अंकेक्षणीय मॉडल का निर्माण और अनुकूलन करता है। ### अस्थिरता प्रबंधन MetLife, एक जीवन बीमा प्रदाता, अपने वित्तीय मॉडलों में अस्थिरता का विश्लेषण और शमन करने के तरीके के बारे में खुलकर बताता है। इस लेख में आप बाइनरी और ऑर्डिनल क्लासिफिकेशन विज़ुअलाइज़ेशन देखेंगे। आप फोरकास्टिंग विज़ुअलाइज़ेशन भी खोजेंगे। [संदर्भ](https://investments.metlife.com/content/dam/metlifecom/us/investments/insights/research-topics/macro-strategy/pdf/MetLifeInvestmentManagement_MachineLearnedRanking_070920.pdf) ## 🎨 कला, संस्कृति, और साहित्य कला में, उदाहरण के लिए पत्रकारिता में, कई दिलचस्प समस्याएं हैं। फेक न्यूज़ का पता लगाना एक बड़ी समस्या है क्योंकि यह साबित हो चुका है कि यह लोगों की राय को प्रभावित कर सकता है और यहां तक कि लोकतंत्रों को भी गिरा सकता है। संग्रहालय भी एमएल का उपयोग करके लाभ उठा सकते हैं, जैसे कि कलाकृतियों के बीच लिंक खोजने से लेकर संसाधन योजना तक। ### फेक न्यूज़ का पता लगाना आज के मीडिया में फेक न्यूज़ का पता लगाना बिल्ली और चूहे का खेल बन गया है। इस लेख में, शोधकर्ता सुझाव देते हैं कि एक प्रणाली जिसमें हमने अध्ययन किए गए कई एमएल तकनीकों का संयोजन किया जा सकता है और सबसे अच्छा मॉडल तैनात किया जा सकता है: "यह प्रणाली डेटा से विशेषताएं निकालने के लिए प्राकृतिक भाषा प्रसंस्करण पर आधारित है और फिर इन विशेषताओं का उपयोग मशीन लर्निंग क्लासिफायर जैसे Naive Bayes, Support Vector Machine (SVM), Random Forest (RF), Stochastic Gradient Descent (SGD), और Logistic Regression(LR) के प्रशिक्षण के लिए किया जाता है।" [संदर्भ](https://www.irjet.net/archives/V7/i6/IRJET-V7I6688.pdf) यह लेख दिखाता है कि विभिन्न एमएल डोमेन को मिलाकर दिलचस्प परिणाम प्राप्त किए जा सकते हैं जो फेक न्यूज़ को फैलने और वास्तविक नुकसान से बचाने में मदद कर सकते हैं; इस मामले में, प्रेरणा COVID उपचारों के बारे में अफवाहों के फैलाव से हुई हिंसा थी। ### संग्रहालय एमएल संग्रहालय एआई क्रांति के कगार पर हैं जिसमें संग्रहों को सूचीबद्ध और डिजिटाइज़ करना और कलाकृतियों के बीच लिंक खोजना तकनीक के उन्नति के साथ आसान हो रहा है। [In Codice Ratio](https://www.sciencedirect.com/science/article/abs/pii/S0306457321001035#:~:text=1.,studies%20over%20large%20historical%20sources.) जैसे प्रोजेक्ट्स वेटिकन आर्काइव्स जैसी अप्राप्य संग्रहों के रहस्यों को उजागर करने में मदद कर रहे हैं। लेकिन, संग्रहालयों के व्यावसायिक पहलू भी एमएल मॉडल से लाभान्वित होते हैं। उदाहरण के लिए, शिकागो का आर्ट इंस्टीट्यूट मॉडल बनाता है ताकि यह अनुमान लगाया जा सके कि दर्शक किसमें रुचि रखते हैं और वे कब प्रदर्शनियों में आएंगे। लक्ष्य प्रत्येक बार जब उपयोगकर्ता संग्रहालय का दौरा करता है तो व्यक्तिगत और अनुकूलित आगंतुक अनुभव बनाना है। "वित्तीय 2017 के दौरान, मॉडल ने उपस्थिति और प्रवेश को 1 प्रतिशत सटीकता के भीतर भविष्यवाणी की, एंड्रयू सिमनिक, आर्ट इंस्टीट्यूट के वरिष्ठ उपाध्यक्ष कहते हैं।" [Reference](https://www.chicagobusiness.com/article/20180518/ISSUE01/180519840/art-institute-of-chicago-uses-data-to-make-exhibit-choices) ## 🏷 मार्केटिंग ### ग्राहक विभाजन सबसे प्रभावी मार्केटिंग रणनीतियाँ विभिन्न समूहों के आधार पर ग्राहकों को अलग-अलग तरीकों से लक्षित करती हैं। इस लेख में, विभेदित मार्केटिंग का समर्थन करने के लिए क्लस्टरिंग एल्गोरिदम के उपयोगों पर चर्चा की गई है। विभेदित मार्केटिंग कंपनियों को ब्रांड पहचान में सुधार करने, अधिक ग्राहकों तक पहुँचने और अधिक पैसा कमाने में मदद करती है। [Reference](https://ai.inqline.com/machine-learning-for-marketing-customer-segmentation/) ## 🚀 चुनौती उस अन्य क्षेत्र की पहचान करें जो इस पाठ्यक्रम में सीखी गई कुछ तकनीकों से लाभान्वित होता है, और खोजें कि यह ML का उपयोग कैसे करता है। ## [व्याख्यान के बाद का क्विज़](https://gray-sand-07a10f403.1.azurestaticapps.net/quiz/50/) ## समीक्षा और आत्म-अध्ययन Wayfair डेटा साइंस टीम के पास कई दिलचस्प वीडियो हैं कि वे अपनी कंपनी में ML का उपयोग कैसे करते हैं। यह [देखने लायक](https://www.youtube.com/channel/UCe2PjkQXqOuwkW1gw6Ameuw/videos) है! ## असाइनमेंट [A ML scavenger hunt](assignment.md) **अस्वीकरण**: इस दस्तावेज़ का अनुवाद मशीन-आधारित एआई अनुवाद सेवाओं का उपयोग करके किया गया है। जबकि हम सटीकता के लिए प्रयास करते हैं, कृपया ध्यान दें कि स्वचालित अनुवादों में त्रुटियाँ या गलतियाँ हो सकती हैं। मूल दस्तावेज़ को उसकी मूल भाषा में अधिकारिक स्रोत माना जाना चाहिए। महत्वपूर्ण जानकारी के लिए, पेशेवर मानव अनुवाद की सिफारिश की जाती है। इस अनुवाद के उपयोग से उत्पन्न किसी भी गलतफहमी या गलत व्याख्या के लिए हम उत्तरदायी नहीं हैं।