32 KiB
परिशिष्ट: वास्तविक दुनिया में मशीन लर्निंग
स्केच नोट Tomomi Imura द्वारा
इस पाठ्यक्रम में, आपने डेटा को प्रशिक्षण के लिए तैयार करने और मशीन लर्निंग मॉडल बनाने के कई तरीके सीखे हैं। आपने शास्त्रीय रिग्रेशन, क्लस्टरिंग, क्लासिफिकेशन, नेचुरल लैंग्वेज प्रोसेसिंग, और टाइम सीरीज मॉडल की एक श्रृंखला बनाई। बधाई हो! अब, आप सोच रहे होंगे कि यह सब किस लिए है... इन मॉडलों के वास्तविक दुनिया में क्या अनुप्रयोग हैं?
जबकि उद्योग में एआई में बहुत रुचि है, जो आमतौर पर डीप लर्निंग का उपयोग करता है, फिर भी क्लासिकल मशीन लर्निंग मॉडलों के लिए मूल्यवान अनुप्रयोग हैं। आप आज इनमें से कुछ अनुप्रयोगों का भी उपयोग कर सकते हैं! इस पाठ में, आप जानेंगे कि आठ विभिन्न उद्योग और विषय-विशेषज्ञता डोमेन इन प्रकार के मॉडलों का उपयोग कैसे करते हैं ताकि उनके अनुप्रयोग अधिक प्रभावी, विश्वसनीय, बुद्धिमान, और उपयोगकर्ताओं के लिए मूल्यवान बन सकें।
पूर्व-व्याख्यान क्विज़
💰 वित्त
वित्त क्षेत्र में मशीन लर्निंग के कई अवसर हैं। इस क्षेत्र में कई समस्याएं एमएल का उपयोग करके मॉडल और हल की जा सकती हैं।
क्रेडिट कार्ड धोखाधड़ी का पता लगाना
हमने पाठ्यक्रम में पहले k-means क्लस्टरिंग के बारे में सीखा, लेकिन इसे क्रेडिट कार्ड धोखाधड़ी से संबंधित समस्याओं को हल करने के लिए कैसे उपयोग किया जा सकता है?
K-means क्लस्टरिंग क्रेडिट कार्ड धोखाधड़ी का पता लगाने की तकनीक में सहायक होती है जिसे आउटलायर डिटेक्शन कहा जाता है। आउटलायर, या डेटा सेट के बारे में अवलोकनों में विचलन, हमें बता सकते हैं कि क्या एक क्रेडिट कार्ड सामान्य क्षमता में उपयोग हो रहा है या कुछ असामान्य हो रहा है। नीचे लिंक किए गए पेपर में दिखाए गए अनुसार, आप k-means क्लस्टरिंग एल्गोरिदम का उपयोग करके क्रेडिट कार्ड डेटा को सॉर्ट कर सकते हैं और प्रत्येक लेनदेन को एक क्लस्टर में असाइन कर सकते हैं कि यह कितना आउटलायर लगता है। फिर, आप धोखाधड़ी और वैध लेनदेन के लिए सबसे जोखिम भरे क्लस्टर का मूल्यांकन कर सकते हैं। संदर्भ
धन प्रबंधन
धन प्रबंधन में, एक व्यक्ति या फर्म अपने ग्राहकों की ओर से निवेश संभालती है। उनका काम दीर्घकालिक में धन को बनाए रखना और बढ़ाना है, इसलिए यह आवश्यक है कि वे निवेशों का चयन करें जो अच्छा प्रदर्शन करें।
किसी विशेष निवेश के प्रदर्शन का मूल्यांकन करने का एक तरीका सांख्यिकीय रिग्रेशन के माध्यम से है। लिनियर रिग्रेशन यह समझने के लिए एक मूल्यवान उपकरण है कि एक फंड कुछ बेंचमार्क के सापेक्ष कैसा प्रदर्शन करता है। हम यह भी अनुमान लगा सकते हैं कि रिग्रेशन के परिणाम सांख्यिकीय रूप से महत्वपूर्ण हैं या नहीं, या वे ग्राहक के निवेश को कितना प्रभावित करेंगे। आप अपने विश्लेषण को मल्टीपल रिग्रेशन का उपयोग करके और भी विस्तार कर सकते हैं, जहां अतिरिक्त जोखिम कारकों को ध्यान में रखा जा सकता है। एक विशिष्ट फंड के लिए यह कैसे काम करेगा, इसका एक उदाहरण देखने के लिए नीचे दिए गए पेपर को देखें। संदर्भ
🎓 शिक्षा
शैक्षिक क्षेत्र भी एक बहुत ही दिलचस्प क्षेत्र है जहां एमएल लागू किया जा सकता है। यहां कई दिलचस्प समस्याएं हैं जैसे परीक्षाओं या निबंधों में धोखाधड़ी का पता लगाना या सुधार प्रक्रिया में पूर्वाग्रह का प्रबंधन करना।
छात्र व्यवहार की भविष्यवाणी
Coursera, एक ऑनलाइन ओपन कोर्स प्रोवाइडर, के पास एक शानदार टेक ब्लॉग है जहां वे कई इंजीनियरिंग निर्णयों पर चर्चा करते हैं। इस केस स्टडी में, उन्होंने एक रिग्रेशन लाइन को प्लॉट किया ताकि यह पता लगाया जा सके कि कम एनपीएस (नेट प्रमोटर स्कोर) रेटिंग और कोर्स रिटेंशन या ड्रॉप-ऑफ के बीच कोई संबंध है या नहीं। संदर्भ
पूर्वाग्रह को कम करना
Grammarly, एक लेखन सहायक जो वर्तनी और व्याकरण की त्रुटियों की जांच करता है, अपने उत्पादों में उन्नत प्राकृतिक भाषा प्रसंस्करण प्रणालियों का उपयोग करता है। उन्होंने अपने टेक ब्लॉग में एक दिलचस्प केस स्टडी प्रकाशित की है कि उन्होंने मशीन लर्निंग में जेंडर पूर्वाग्रह से कैसे निपटा, जिसके बारे में आपने हमारे प्रारंभिक निष्पक्षता पाठ में सीखा। संदर्भ
👜 रिटेल
रिटेल सेक्टर निश्चित रूप से एमएल के उपयोग से लाभ उठा सकता है, बेहतर ग्राहक यात्रा बनाने से लेकर इन्वेंटरी को इष्टतम तरीके से स्टॉक करने तक।
ग्राहक यात्रा को व्यक्तिगत बनाना
Wayfair, एक कंपनी जो फर्नीचर जैसी घरेलू वस्तुएं बेचती है, के लिए ग्राहकों को उनके स्वाद और आवश्यकताओं के अनुसार सही उत्पाद खोजने में मदद करना महत्वपूर्ण है। इस लेख में, कंपनी के इंजीनियर बताते हैं कि वे एमएल और एनएलपी का उपयोग कैसे करते हैं ताकि "ग्राहकों के लिए सही परिणाम सामने आएं"। विशेष रूप से, उनका क्वेरी इंटेंट इंजन इकाई निष्कर्षण, क्लासिफायर प्रशिक्षण, एसेट और राय निष्कर्षण, और ग्राहक समीक्षाओं पर भावना टैगिंग का उपयोग करने के लिए बनाया गया है। यह ऑनलाइन रिटेल में एनएलपी के काम करने का एक क्लासिक उपयोग मामला है। संदर्भ
इन्वेंटरी प्रबंधन
StitchFix जैसी अभिनव, फुर्तीली कंपनियां, जो उपभोक्ताओं को कपड़े भेजने वाली एक बॉक्स सेवा है, अनुशंसाओं और इन्वेंटरी प्रबंधन के लिए बड़े पैमाने पर एमएल पर निर्भर करती हैं। उनकी स्टाइलिंग टीमें उनके मर्चेंडाइजिंग टीमों के साथ मिलकर काम करती हैं, वास्तव में: "हमारे एक डेटा वैज्ञानिक ने एक जेनेटिक एल्गोरिदम के साथ छेड़छाड़ की और इसे परिधान पर लागू किया ताकि यह अनुमान लगाया जा सके कि कौन सा कपड़ा आज सफल होगा। हमने इसे मर्चेंडाइज टीम के पास लाया और अब वे इसे एक उपकरण के रूप में उपयोग कर सकते हैं।" संदर्भ
🏥 स्वास्थ्य देखभाल
स्वास्थ्य देखभाल क्षेत्र अनुसंधान कार्यों को अनुकूलित करने और साथ ही रोगियों को फिर से भर्ती करने या रोगों के फैलने से रोकने जैसी लॉजिस्टिक समस्याओं को हल करने के लिए एमएल का लाभ उठा सकता है।
क्लिनिकल ट्रायल का प्रबंधन
क्लिनिकल ट्रायल में विषाक्तता दवा निर्माताओं के लिए एक प्रमुख चिंता है। कितनी विषाक्तता सहनशील है? इस अध्ययन में, विभिन्न क्लिनिकल ट्रायल विधियों का विश्लेषण करने से क्लिनिकल ट्रायल परिणामों की संभावनाओं की भविष्यवाणी के लिए एक नया दृष्टिकोण विकसित हुआ। विशेष रूप से, वे एक क्लासिफायर का उपयोग करने में सक्षम थे जो दवाओं के समूहों के बीच अंतर कर सकता है। संदर्भ
अस्पताल पुन: प्रवेश प्रबंधन
अस्पताल देखभाल महंगी है, विशेष रूप से जब मरीजों को फिर से भर्ती करना पड़ता है। इस पेपर में एक कंपनी पर चर्चा की गई है जो क्लस्टरिंग एल्गोरिदम का उपयोग करके पुन: प्रवेश की संभावना की भविष्यवाणी करने के लिए एमएल का उपयोग करती है। ये क्लस्टर विश्लेषकों को "पुन: प्रवेश के समूहों की खोज करने में मदद करते हैं जिनके पास एक सामान्य कारण हो सकता है"। संदर्भ
रोग प्रबंधन
हालिया महामारी ने यह उजागर किया है कि मशीन लर्निंग रोग के फैलाव को रोकने में कैसे मदद कर सकती है। इस लेख में, आप ARIMA, लॉजिस्टिक कर्व्स, लिनियर रिग्रेशन, और SARIMA के उपयोग को पहचानेंगे। "यह काम इस वायरस के फैलाव की दर की गणना करने और इस प्रकार मौतों, रिकवरी, और पुष्टि किए गए मामलों की भविष्यवाणी करने का एक प्रयास है, ताकि यह हमें बेहतर तैयार करने और जीवित रहने में मदद कर सके।" संदर्भ
🌲 पारिस्थितिकी और ग्रीन टेक
प्रकृति और पारिस्थितिकी में कई संवेदनशील प्रणालियाँ होती हैं जहाँ जानवरों और प्रकृति के बीच का अंतःक्रिया ध्यान में आता है। इन प्रणालियों को सटीक रूप से मापना और कुछ होने पर उचित कार्य करना महत्वपूर्ण है, जैसे कि जंगल की आग या जानवरों की आबादी में गिरावट।
वन प्रबंधन
आपने पिछले पाठों में रिइनफोर्समेंट लर्निंग के बारे में सीखा। यह प्रकृति में पैटर्न की भविष्यवाणी करने में बहुत उपयोगी हो सकता है। विशेष रूप से, इसका उपयोग जंगल की आग और आक्रामक प्रजातियों के फैलाव जैसी पारिस्थितिक समस्याओं को ट्रैक करने के लिए किया जा सकता है। कनाडा में, एक समूह ने उपग्रह चित्रों से जंगल की आग की गतिशीलता मॉडल बनाने के लिए रिइनफोर्समेंट लर्निंग का उपयोग किया। एक अभिनव "स्थानिक रूप से फैलने वाली प्रक्रिया (SSP)" का उपयोग करके, उन्होंने एक जंगल की आग को "परिदृश्य में किसी भी सेल में एजेंट" के रूप में देखा। "किसी स्थान से किसी भी समय पर आग द्वारा लिए जा सकने वाले क्रियाओं का सेट उत्तर, दक्षिण, पूर्व, या पश्चिम में फैलना या न फैलना शामिल है।
इस दृष्टिकोण ने सामान्य RL सेटअप को उलट दिया क्योंकि संबंधित मार्कोव निर्णय प्रक्रिया (MDP) का गतिशीलता एक ज्ञात कार्य है।" इस समूह द्वारा उपयोग किए गए क्लासिक एल्गोरिदम के बारे में अधिक पढ़ने के लिए नीचे दिए गए लिंक पर जाएं। संदर्भ
जानवरों की गति का पता लगाना
जबकि डीप लर्निंग ने जानवरों की गति को दृश्य रूप से ट्रैक करने में क्रांति ला दी है (आप अपना खुद का ध्रुवीय भालू ट्रैकर यहाँ बना सकते हैं), क्लासिकल एमएल का इस कार्य में अभी भी एक स्थान है।
फार्म जानवरों की गति को ट्रैक करने और आईओटी सेंसर इस प्रकार की दृश्य प्रसंस्करण का उपयोग करते हैं, लेकिन अधिक बुनियादी एमएल तकनीकें डेटा को पूर्व-प्रसंस्करण करने के लिए उपयोगी हैं। उदाहरण के लिए, इस पेपर में, भेड़ों की मुद्राओं की निगरानी और विभिन्न क्लासिफायर एल्गोरिदम का उपयोग करके विश्लेषण किया गया। आप पृष्ठ 335 पर आरओसी कर्व को पहचान सकते हैं। संदर्भ
⚡️ ऊर्जा प्रबंधन
हमारे टाइम सीरीज फोरकास्टिंग पर पाठों में, हमने एक शहर के लिए आपूर्ति और मांग को समझकर राजस्व उत्पन्न करने के लिए स्मार्ट पार्किंग मीटर की अवधारणा को लागू किया। इस लेख में, क्लस्टरिंग, रिग्रेशन और टाइम सीरीज फोरकास्टिंग को मिलाकर आयरलैंड में भविष्य की ऊर्जा उपयोग की भविष्यवाणी करने में कैसे मदद की गई, इसका विवरण दिया गया है, स्मार्ट मीटरिंग पर आधारित। संदर्भ
💼 बीमा
बीमा क्षेत्र एक और क्षेत्र है जो एमएल का उपयोग करके व्यवहार्य वित्तीय और अंकेक्षणीय मॉडल का निर्माण और अनुकूलन करता है।
अस्थिरता प्रबंधन
MetLife, एक जीवन बीमा प्रदाता, अपने वित्तीय मॉडलों में अस्थिरता का विश्लेषण और शमन करने के तरीके के बारे में खुलकर बताता है। इस लेख में आप बाइनरी और ऑर्डिनल क्लासिफिकेशन विज़ुअलाइज़ेशन देखेंगे। आप फोरकास्टिंग विज़ुअलाइज़ेशन भी खोजेंगे। संदर्भ
🎨 कला, संस्कृति, और साहित्य
कला में, उदाहरण के लिए पत्रकारिता में, कई दिलचस्प समस्याएं हैं। फेक न्यूज़ का पता लगाना एक बड़ी समस्या है क्योंकि यह साबित हो चुका है कि यह लोगों की राय को प्रभावित कर सकता है और यहां तक कि लोकतंत्रों को भी गिरा सकता है। संग्रहालय भी एमएल का उपयोग करके लाभ उठा सकते हैं, जैसे कि कलाकृतियों के बीच लिंक खोजने से लेकर संसाधन योजना तक।
फेक न्यूज़ का पता लगाना
आज के मीडिया में फेक न्यूज़ का पता लगाना बिल्ली और चूहे का खेल बन गया है। इस लेख में, शोधकर्ता सुझाव देते हैं कि एक प्रणाली जिसमें हमने अध्ययन किए गए कई एमएल तकनीकों का संयोजन किया जा सकता है और सबसे अच्छा मॉडल तैनात किया जा सकता है: "यह प्रणाली डेटा से विशेषताएं निकालने के लिए प्राकृतिक भाषा प्रसंस्करण पर आधारित है और फिर इन विशेषताओं का उपयोग मशीन लर्निंग क्लासिफायर जैसे Naive Bayes, Support Vector Machine (SVM), Random Forest (RF), Stochastic Gradient Descent (SGD), और Logistic Regression(LR) के प्रशिक्षण के लिए किया जाता है।" संदर्भ
यह लेख दिखाता है कि विभिन्न एमएल डोमेन को मिलाकर दिलचस्प परिणाम प्राप्त किए जा सकते हैं जो फेक न्यूज़ को फैलने और वास्तविक नुकसान से बचाने में मदद कर सकते हैं; इस मामले में, प्रेरणा COVID उपचारों के बारे में अफवाहों के फैलाव से हुई हिंसा थी।
संग्रहालय एमएल
संग्रहालय एआई क्रांति के कगार पर हैं जिसमें संग्रहों को सूचीबद्ध और डिजिटाइज़ करना और कलाकृतियों के बीच लिंक खोजना तकनीक के उन्नति के साथ आसान हो रहा है। In Codice Ratio जैसे प्रोजेक्ट्स वेटिकन आर्काइव्स जैसी अप्राप्य संग्रहों के रहस्यों को उजागर करने में मदद कर रहे हैं। लेकिन, संग्रहालयों के व्यावसायिक पहलू भी एमएल मॉडल से लाभान्वित होते हैं।
उदाहरण के लिए, शिकागो का आर्ट इंस्टीट्यूट मॉडल बनाता है ताकि यह अनुमान लगाया जा सके कि दर्शक किसमें रुचि रखते हैं और वे कब प्रदर्शनियों में आएंगे। लक्ष्य प्रत्येक बार जब उपयोगकर्ता संग्रहालय का दौरा करता है तो व्यक्तिगत और अनुकूलित आगंतुक अनुभव बनाना है। "वित्तीय 2017 के दौरान, मॉडल ने उपस्थिति और प्रवेश को 1 प्रतिशत सटीकता के भीतर भविष्यवाणी की, एंड्रयू सिमनिक, आर्ट इंस्टीट्यूट के वरिष्ठ उपाध्यक्ष कहते हैं।" Reference
🏷 मार्केटिंग
ग्राहक विभाजन
सबसे प्रभावी मार्केटिंग रणनीतियाँ विभिन्न समूहों के आधार पर ग्राहकों को अलग-अलग तरीकों से लक्षित करती हैं। इस लेख में, विभेदित मार्केटिंग का समर्थन करने के लिए क्लस्टरिंग एल्गोरिदम के उपयोगों पर चर्चा की गई है। विभेदित मार्केटिंग कंपनियों को ब्रांड पहचान में सुधार करने, अधिक ग्राहकों तक पहुँचने और अधिक पैसा कमाने में मदद करती है। Reference
🚀 चुनौती
उस अन्य क्षेत्र की पहचान करें जो इस पाठ्यक्रम में सीखी गई कुछ तकनीकों से लाभान्वित होता है, और खोजें कि यह ML का उपयोग कैसे करता है।
व्याख्यान के बाद का क्विज़
समीक्षा और आत्म-अध्ययन
Wayfair डेटा साइंस टीम के पास कई दिलचस्प वीडियो हैं कि वे अपनी कंपनी में ML का उपयोग कैसे करते हैं। यह देखने लायक है!
असाइनमेंट
अस्वीकरण: इस दस्तावेज़ का अनुवाद मशीन-आधारित एआई अनुवाद सेवाओं का उपयोग करके किया गया है। जबकि हम सटीकता के लिए प्रयास करते हैं, कृपया ध्यान दें कि स्वचालित अनुवादों में त्रुटियाँ या गलतियाँ हो सकती हैं। मूल दस्तावेज़ को उसकी मूल भाषा में अधिकारिक स्रोत माना जाना चाहिए। महत्वपूर्ण जानकारी के लिए, पेशेवर मानव अनुवाद की सिफारिश की जाती है। इस अनुवाद के उपयोग से उत्पन्न किसी भी गलतफहमी या गलत व्याख्या के लिए हम उत्तरदायी नहीं हैं।