32 KiB
पोस्टस्क्रिप्ट: वास्तविक संसारमा मेसिन लर्निङ
स्केच नोट Tomomi Imura द्वारा
यस पाठ्यक्रममा, तपाईंले डाटा प्रशिक्षणको लागि तयार गर्ने र मेसिन लर्निङ मोडेलहरू सिर्जना गर्ने धेरै तरिकाहरू सिक्नुभएको छ। तपाईंले शृंखलाबद्ध रूपमा क्लासिक रिग्रेसन, क्लस्टरिङ, क्लासिफिकेशन, प्राकृतिक भाषा प्रशोधन, र टाइम सिरिज मोडेलहरू निर्माण गर्नुभयो। बधाई छ! अब, तपाईं सोच्दै हुनुहुन्छ होला कि यो सबै केका लागि हो... यी मोडेलहरूको वास्तविक संसारमा प्रयोग के हो?
यद्यपि उद्योगमा एआईले धेरै चासो आकर्षित गरेको छ, जसले प्रायः डीप लर्निङलाई प्रयोग गर्छ, क्लासिकल मेसिन लर्निङ मोडेलहरूको अझै पनि मूल्यवान प्रयोगहरू छन्। तपाईंले आज यी प्रयोगहरू मध्ये केही प्रयोग गरिरहनुभएको हुन सक्छ! यस पाठमा, तपाईंले आठ विभिन्न उद्योगहरू र विषय-वस्तु क्षेत्रहरूले कसरी यी प्रकारका मोडेलहरू प्रयोग गरेर आफ्ना अनुप्रयोगहरूलाई अझ प्रभावकारी, भरपर्दो, बौद्धिक, र प्रयोगकर्ताहरूका लागि मूल्यवान बनाउँछन् भन्ने कुरा अन्वेषण गर्नुहुनेछ।
पाठ अघि क्विज
💰 वित्त
वित्त क्षेत्रले मेसिन लर्निङका लागि धेरै अवसरहरू प्रदान गर्दछ। यस क्षेत्रमा धेरै समस्याहरूलाई मोडेलिङ गरेर समाधान गर्न सकिन्छ।
क्रेडिट कार्ड ठगी पत्ता लगाउने
हामीले यस पाठ्यक्रममा k-means clustering को बारेमा सिक्यौं, तर यसलाई क्रेडिट कार्ड ठगीसँग सम्बन्धित समस्याहरू समाधान गर्न कसरी प्रयोग गर्न सकिन्छ?
k-means clustering क्रेडिट कार्ड ठगी पत्ता लगाउने प्रविधिमा आउटलायर डिटेक्शन नामक प्रविधिमा उपयोगी हुन्छ। आउटलायरहरू, वा डाटाको सेटको अवलोकनमा विचलनहरू, हामीलाई क्रेडिट कार्ड सामान्य रूपमा प्रयोग भइरहेको छ वा असामान्य गतिविधि भइरहेको छ भन्ने कुरा बताउन सक्छ। तलको पेपरमा देखाइए अनुसार, तपाईं k-means clustering एल्गोरिदम प्रयोग गरेर क्रेडिट कार्ड डाटालाई वर्गीकृत गर्न सक्नुहुन्छ र प्रत्येक लेनदेनलाई आउटलायरको आधारमा क्लस्टरमा वर्गीकृत गर्न सक्नुहुन्छ। त्यसपछि, तपाईं जोखिमपूर्ण क्लस्टरहरूको मूल्याङ्कन गर्न सक्नुहुन्छ कि ती ठगी हुन् वा वैध लेनदेन। सन्दर्भ
सम्पत्ति व्यवस्थापन
सम्पत्ति व्यवस्थापनमा, कुनै व्यक्ति वा फर्मले आफ्ना ग्राहकहरूको तर्फबाट लगानीहरू ह्यान्डल गर्छ। तिनीहरूको काम दीर्घकालीन रूपमा सम्पत्ति कायम राख्नु र बढाउनु हो, त्यसैले राम्रो प्रदर्शन गर्ने लगानीहरू छनोट गर्नु आवश्यक छ।
कुनै विशेष लगानी कसरी प्रदर्शन गर्छ भन्ने मूल्याङ्कन गर्ने एउटा तरिका सांख्यिकीय रिग्रेसन हो। लिनियर रिग्रेसन कुनै फन्डले कसरी कुनै बेंचमार्कको तुलनामा प्रदर्शन गर्छ भन्ने कुरा बुझ्नका लागि उपयोगी उपकरण हो। हामी रिग्रेसनको नतिजा सांख्यिकीय रूपमा महत्त्वपूर्ण छ कि छैन भन्ने कुरा पनि जान्न सक्छौं, वा यसले ग्राहकको लगानीमा कति प्रभाव पार्छ। तपाईं आफ्नो विश्लेषणलाई थप विस्तार गर्न सक्नुहुन्छ जहाँ थप जोखिम कारकहरूलाई ध्यानमा राख्न सकिन्छ। यसले कसरी काम गर्छ भन्ने उदाहरणको लागि, तलको पेपरमा हेर्नुहोस्। सन्दर्भ
🎓 शिक्षा
शिक्षा क्षेत्र पनि मेसिन लर्निङ लागू गर्न सकिने धेरै रोचक क्षेत्र हो। यहाँ परीक्षण वा निबन्धमा धोखाधडी पत्ता लगाउने वा सुधार प्रक्रियामा पूर्वाग्रह व्यवस्थापन गर्ने जस्ता रोचक समस्याहरू छन्।
विद्यार्थीको व्यवहारको भविष्यवाणी
Coursera, एक अनलाइन खुला पाठ्यक्रम प्रदायक,सँग धेरै इन्जिनियरिङ निर्णयहरूको बारेमा चर्चा गर्ने उत्कृष्ट टेक ब्लग छ। यस केस स्टडीमा, तिनीहरूले रिग्रेसन लाइन प्लट गरेर कम NPS (नेट प्रमोटर स्कोर) रेटिङ र पाठ्यक्रमको प्रतिधारण वा ड्रप-ऑफ बीचको सम्बन्ध अन्वेषण गर्ने प्रयास गरे। सन्दर्भ
पूर्वाग्रह कम गर्ने
Grammarly, एक लेखन सहायक जसले हिज्जे र व्याकरण त्रुटिहरू जाँच गर्छ,ले आफ्नो उत्पादनहरूमा परिष्कृत प्राकृतिक भाषा प्रशोधन प्रणालीहरू प्रयोग गर्छ। तिनीहरूले आफ्नो टेक ब्लगमा मेसिन लर्निङमा लैंगिक पूर्वाग्रह व्यवस्थापन गर्ने तरिकाको बारेमा रोचक केस स्टडी प्रकाशित गरेका छन्, जुन तपाईंले हाम्रो परिचयात्मक निष्पक्षता पाठ मा सिक्नुभएको थियो। सन्दर्भ
👜 खुद्रा व्यापार
खुद्रा व्यापार क्षेत्रले ग्राहकको यात्रा सुधार गर्ने देखि लिएर इन्वेन्टरीलाई अनुकूलित तरिकामा स्टक गर्ने सम्मका कार्यहरूमा मेसिन लर्निङको प्रयोगबाट लाभ उठाउन सक्छ।
ग्राहकको यात्रा व्यक्तिगत बनाउने
Wayfair, एक कम्पनी जसले फर्निचर जस्ता घरका सामानहरू बेच्छ,का लागि ग्राहकलाई उनीहरूको स्वाद र आवश्यकताका लागि सही उत्पादनहरू फेला पार्न मद्दत गर्नु अत्यन्त महत्वपूर्ण छ। यस लेखमा, कम्पनीका इन्जिनियरहरूले कसरी तिनीहरूले ML र NLP प्रयोग गरेर "ग्राहकहरूको लागि सही नतिजा सतहमा ल्याउँछन्" भन्ने कुरा वर्णन गरेका छन्। विशेष गरी, तिनीहरूको Query Intent Engine ग्राहक समीक्षामा इकाई निकासी, वर्गीकृत प्रशिक्षण, सम्पत्ति र राय निकासी, र भावना ट्यागिङ प्रयोग गर्न निर्माण गरिएको छ। यो अनलाइन खुद्रा व्यापारमा NLP को क्लासिक प्रयोग हो। सन्दर्भ
इन्वेन्टरी व्यवस्थापन
StitchFix जस्ता नवीन, चपल कम्पनीहरू, जो उपभोक्ताहरूलाई कपडा पठाउने बक्स सेवा हो,ले सिफारिस र इन्वेन्टरी व्यवस्थापनका लागि व्यापक रूपमा ML प्रयोग गर्छ। तिनीहरूको स्टाइलिङ टोलीहरू र मर्चेन्डाइजिङ टोलीहरू सँगै काम गर्छन्। "हाम्रो एक डाटा वैज्ञानिकले जेनेटिक एल्गोरिदमसँग टिंकर गरे र यसलाई परिधानमा लागू गरे ताकि आज अस्तित्वमा नभएको कपडाको सफल टुक्रा के हुनेछ भन्ने भविष्यवाणी गर्न सकियो। हामीले यो मर्चेन्डाइज टोलीलाई ल्यायौं र अब तिनीहरूले यसलाई उपकरणको रूपमा प्रयोग गर्न सक्छन्।" सन्दर्भ
🏥 स्वास्थ्य सेवा
स्वास्थ्य सेवा क्षेत्रले अनुसन्धान कार्यहरू अनुकूलन गर्न र रोगीलाई पुनः भर्ना गर्ने वा रोग फैलिन रोक्ने जस्ता रसद समस्याहरूलाई समाधान गर्न ML प्रयोग गर्न सक्छ।
क्लिनिकल परीक्षण व्यवस्थापन
क्लिनिकल परीक्षणमा विषाक्तता औषधि निर्माताहरूका लागि प्रमुख चिन्ता हो। कति विषाक्तता सहन योग्य छ? यस अध्ययनमा, विभिन्न क्लिनिकल परीक्षण विधिहरूको विश्लेषणले क्लिनिकल परीक्षण परिणामहरूको सम्भावनाहरू भविष्यवाणी गर्ने नयाँ दृष्टिकोणको विकास गर्यो। विशेष गरी, तिनीहरूले समूह औषधिहरू बीच भिन्नता छुट्याउन सक्षम क्लासिफायर उत्पादन गर्न र्यान्डम फरेस्ट प्रयोग गरे। सन्दर्भ
अस्पताल पुनः भर्ना व्यवस्थापन
अस्पतालको हेरचाह महँगो छ, विशेष गरी जब बिरामीहरूलाई पुनः भर्ना गर्नुपर्छ। यस पेपरले एक कम्पनीको बारेमा चर्चा गर्छ जसले क्लस्टरिङ एल्गोरिदम प्रयोग गरेर पुनः भर्नाको सम्भावना भविष्यवाणी गर्छ। यी क्लस्टरहरूले विश्लेषकहरूलाई "पुनः भर्नाका समूहहरू पत्ता लगाउन मद्दत गर्छ जुन साझा कारण हुन सक्छ।" सन्दर्भ
रोग व्यवस्थापन
हालको महामारीले रोग फैलिन रोक्न मेसिन लर्निङले कसरी मद्दत गर्न सक्छ भन्ने कुरामा उज्यालो प्रकाश पारेको छ। यस लेखमा, तपाईं ARIMA, लजिस्टिक कर्भहरू, लिनियर रिग्रेसन, र SARIMA को प्रयोग देख्नुहुनेछ। "यो कामले यस भाइरसको फैलावटको दर गणना गर्न र मृत्यु, निको हुने, र पुष्टि भएका केसहरूको भविष्यवाणी गर्न प्रयास गरेको छ ताकि हामी राम्रो तयारी गर्न र बाँच्न सकौं।" सन्दर्भ
🌲 पारिस्थितिकी र हरित प्रविधि
प्रकृति र पारिस्थितिकी धेरै संवेदनशील प्रणालीहरू समावेश गर्दछ जहाँ जनावर र प्रकृतिको अन्तर्क्रिया केन्द्रमा आउँछ। यी प्रणालीहरूलाई सही रूपमा मापन गर्न र केही समस्या भएमा उचित रूपमा कार्य गर्न महत्त्वपूर्ण छ, जस्तै वन आगो वा जनावरको जनसंख्यामा गिरावट।
वन व्यवस्थापन
तपाईंले Reinforcement Learning को बारेमा अघिल्लो पाठहरूमा सिक्नुभएको थियो। यो प्रकृतिमा ढाँचाहरू भविष्यवाणी गर्न प्रयास गर्दा धेरै उपयोगी हुन सक्छ। विशेष गरी, यसलाई वन आगो र आक्रामक प्रजातिहरूको फैलावट जस्ता पारिस्थितिक समस्याहरू ट्र्याक गर्न प्रयोग गर्न सकिन्छ। क्यानडामा, अनुसन्धानकर्ताहरूको समूहले उपग्रह छविहरूबाट वन आगोको गतिशीलता मोडेलहरू निर्माण गर्न Reinforcement Learning प्रयोग गरे। "स्पेसियली स्प्रेडिङ प्रोसेस (SSP)" प्रयोग गरेर, तिनीहरूले वन आगोलाई "परिदृश्यको कुनै पनि सेलमा एजेन्ट" को रूपमा कल्पना गरे। "कुनै पनि समय बिन्दुमा स्थानबाट आगोले उत्तर, दक्षिण, पूर्व, वा पश्चिममा फैलने वा नफैलने कार्यहरू गर्न सक्छ।"
यो दृष्टिकोणले सामान्य RL सेटअपलाई उल्टाउँछ किनकि सम्बन्धित मार्कोभ डिसिजन प्रोसेस (MDP) को गतिशीलता तुरुन्त वन आगो फैलावटको लागि ज्ञात कार्य हो। तलको लिंकमा यस समूहले प्रयोग गरेका क्लासिक एल्गोरिदमहरूको बारेमा थप पढ्नुहोस्। सन्दर्भ
जनावरहरूको गति संवेदन
गहिरो शिक्षाले जनावरहरूको गतिविधि ट्र्याक गर्न दृश्यात्मक क्रान्ति सिर्जना गरेको छ (तपाईं आफ्नो ध्रुवीय भालु ट्र्याकर यहाँ निर्माण गर्न सक्नुहुन्छ), क्लासिक ML अझै पनि यस कार्यमा स्थान राख्छ।
फार्म जनावरहरूको गतिविधि ट्र्याक गर्नका लागि सेन्सरहरू र IoT ले यस प्रकारको दृश्य प्रशोधनको प्रयोग गर्छ, तर डाटा पूर्वप्रशोधन गर्न थप आधारभूत ML प्रविधिहरू उपयोगी छन्। उदाहरणका लागि, यस पेपरमा, भेडाको आसन विभिन्न क्लासिफायर एल्गोरिदमहरू प्रयोग गरेर अनुगमन र विश्लेषण गरिएको थियो। तपाईं पृष्ठ 335 मा ROC कर्भलाई चिन्न सक्नुहुन्छ। सन्दर्भ
⚡️ ऊर्जा व्यवस्थापन
हाम्रो टाइम सिरिज पूर्वानुमान पाठहरूमा, हामीले आपूर्ति र माग बुझेर कुनै सहरको लागि राजस्व उत्पन्न गर्न स्मार्ट पार्किङ मिटरको अवधारणा प्रस्तुत गरेका थियौं। यस लेखले क्लस्टरिङ, रिग्रेसन, र टाइम सिरिज पूर्वानुमानलाई संयोजन गरेर आयरल्यान्डमा स्मार्ट मिटरिङको आधारमा भविष्यको ऊर्जा प्रयोगको भविष्यवाणी गर्न मद्दत गरेको विवरणमा चर्चा गर्छ। सन्दर्भ
💼 बीमा
बीमा क्षेत्र अर्को क्षेत्र हो जसले ML प्रयोग गरेर व्यवहार्य वित्तीय र बीमांक मोडेलहरू निर्माण र अनुकूलन गर्छ।
अस्थिरता व्यवस्थापन
MetLife, एक जीवन बीमा प्रदायक,ले आफ्नो वित्तीय मोडेलहरूमा अस्थिरता विश्लेषण र व्यवस्थापन गर्ने तरिकाको बारेमा खुला छ। यस लेखमा तपाईंले बाइनरी र ओर्डिनल क्लासिफिकेशन भिजुअलाइजेसनहरू देख्नुहुनेछ। तपाईंले पूर्वानुमान भिजुअलाइजेसनहरू पनि पत्ता लगाउनुहुनेछ। सन्दर्भ
🎨 कला, संस्कृति, र साहित्य
कला क्षेत्रमा, उदाहरणका लागि पत्रकारितामा, धेरै रोचक समस्याहरू छन्। नक्कली समाचार पत्ता लगाउनु ठूलो समस्या हो किनकि यसले मानिसहरूको विचारलाई प्रभाव पार्न र लोकतन्त्रलाई कमजोर पार्न प्रमाणित गरिएको छ। संग्रहालयहरूले पनि कलाकृतिहरू बीचको सम्बन्ध पत्ता लगाउनेदेखि लिएर स्रोत योजना बनाउनेसम्मका कार्यहरूमा ML प्रयोगबाट लाभ उठाउन सक्छन्।
नक्कली समाचार पत्ता लगाउने
नक्कली समाचार पत्ता लगाउनु आजको मिडियामा बिरालो र मुसाको खेल बनेको छ। यस लेखमा, अनुसन्धानकर्ताहरूले सुझाव दिएका छन् कि हामीले अध्ययन गरेका धेरै ML प्रविधिहरूलाई संयोजन गरेर प्रणाली परीक्षण गर्न सकिन्छ र उत्कृष्ट मोडेल तैनात गर्न सकिन्छ: "यो प्रणाली प्राकृतिक भाषा प्रशोधनमा आधारित छ जसले डाटाबाट विशेषताहरू निकाल्छ र त्यसपछि यी विशेषताहरू मेसिन लर्निङ क्लासिफायरहरू जस्तै Naive Bayes, Support Vector Machine (SVM), Random Forest (RF), Stochastic Gradient Descent (SGD), र Logistic Regression (LR) को प्रशिक्षणका लागि प्रयोग गरिन्छ।" सन्दर्भ
यस लेखले देखाउँछ कि विभिन्न ML क्षेत्रहरूलाई संयोजन गरेर रोचक नतिजाहरू उत्पादन गर्न सकिन्छ जसले नक्कली समाचार फैलिन रोक्न र वास्तविक क्षति सिर्जना गर्न मद्दत गर्न सक्छ; यस अवस्थामा, प्रेरणा COVID उपचारहरूको बारेमा अफवाह फैलावट थियो जसले भीड हिंसा उत्पन्न गर्यो।
संग्रहालय ML
संग्रहालयहरू एआई क्रान्तिको किनारमा छन् जहाँ संग्रहहरूलाई क्याटलग र डिजिटाइज गर्ने र कलाकृतिहरू बीचको सम्बन्ध पत्ता लगाउने काम प्रविधिको प्रगतिसँगै सजिलो हुँदैछ। In Codice Ratio जस्ता परियोजनाहरूले भ्याटिकन अभिलेखालयहरू जस्ता पहुँचयोग्य नभएका संग्रहहरूको रहस्यहरू अनलक गर्न मद्दत गरिरहेका छन्। तर, संग्रहालयहरूको व्यवसाय पक्षले पनि ML मोडेलहरूबाट लाभ उठाउँछ।
उदाहरणका लागि, शिकागोको कला संस्थानले मोडेलहरू निर्माण गरेर दर्शकहरू केमा रुचि राख्छन् र तिनीहरू कहिले प्रदर्शनीहरूमा सहभागी हुनेछन् भन्ने कुरा भविष्यवाणी गर्यो। लक्ष्य प्रत्येक पटक प्रयोगकर्ताले संग्रहालय भ्रमण गर्दा व्यक्तिगत र अनुकूलित अनुभव सिर्जना गर्नु हो। "आर्थिक वर्ष 2017 को अवधिमा, मोडेलले उपस्थित र प्रवेशलाई 1 प्रतिशतको सटीकताभित्र भविष्यवाणी गर्यो, भन्छन् Andrew Simnick, शिकागोको कला संस्थानका वरिष्ठ उपाध्यक्ष।" सन्दर्भ
🏷 मार्केटिङ
ग्राहक विभाजन
सबैभन्दा प्रभावकारी मार्केटिङ रणनीतिहरू विभिन्न समूहहरूको आधारमा ग्राहकहरूलाई फरक तरिकाले लक्षित गर्छ। यस लेखमा, विभेदित मार्केटिङलाई समर्थन गर्न क्लस्टरिङ एल्गोरिदमहरूको प्रयोगको बारेमा चर्चा गरिएको छ। विभेदित मार्केटिङले कम्पनीहरूलाई ब्रान्ड पहिचान सुधार गर्न, थप ग्राहकहरूमा पुग्न, र थप पैसा कमाउन मद्दत गर्छ। सन्दर्भ
🚀 चुनौती
यस
पोस्ट-व्याख्यान क्विज
समीक्षा र आत्म अध्ययन
Wayfair को डेटा विज्ञान टोलीले आफ्नो कम्पनीमा कसरी ML प्रयोग गर्छन् भन्ने बारेमा केही रोचक भिडियोहरू छन्। हेर्नुहोस् यो हेर्न लायक छ!
असाइनमेन्ट
अस्वीकरण:
यो दस्तावेज़ AI अनुवाद सेवा Co-op Translator प्रयोग गरेर अनुवाद गरिएको छ। हामी यथार्थताको लागि प्रयास गर्छौं, तर कृपया ध्यान दिनुहोस् कि स्वचालित अनुवादहरूमा त्रुटि वा अशुद्धता हुन सक्छ। यसको मूल भाषा मा रहेको मूल दस्तावेज़लाई आधिकारिक स्रोत मानिनुपर्छ। महत्वपूर्ण जानकारीको लागि, व्यावसायिक मानव अनुवाद सिफारिस गरिन्छ। यस अनुवादको प्रयोगबाट उत्पन्न हुने कुनै पनि गलतफहमी वा गलत व्याख्याको लागि हामी जिम्मेवार हुने छैनौं।