# क्लाउड में डेटा साइंस: "लो कोड/नो कोड" तरीका |![ स्केच नोट [(@sketchthedocs)](https://sketchthedocs.dev) द्वारा ](../../sketchnotes/18-DataScience-Cloud.png)| |:---:| | क्लाउड में डेटा साइंस: लो कोड - _[@nitya](https://twitter.com/nitya) द्वारा स्केच नोट_ | सामग्री तालिका: - [क्लाउड में डेटा साइंस: "लो कोड/नो कोड" तरीका](../../../../5-Data-Science-In-Cloud/18-Low-Code) - [प्री-लेक्चर क्विज़](../../../../5-Data-Science-In-Cloud/18-Low-Code) - [1. परिचय](../../../../5-Data-Science-In-Cloud/18-Low-Code) - [1.1 Azure Machine Learning क्या है?](../../../../5-Data-Science-In-Cloud/18-Low-Code) - [1.2 हार्ट फेल्योर प्रेडिक्शन प्रोजेक्ट:](../../../../5-Data-Science-In-Cloud/18-Low-Code) - [1.3 हार्ट फेल्योर डेटासेट:](../../../../5-Data-Science-In-Cloud/18-Low-Code) - [2. Azure ML Studio में लो कोड/नो कोड मॉडल ट्रेनिंग](../../../../5-Data-Science-In-Cloud/18-Low-Code) - [2.1 Azure ML वर्कस्पेस बनाना](../../../../5-Data-Science-In-Cloud/18-Low-Code) - [2.2 कंप्यूट संसाधन](../../../../5-Data-Science-In-Cloud/18-Low-Code) - [2.2.1 अपने कंप्यूट संसाधनों के लिए सही विकल्प चुनना](../../../../5-Data-Science-In-Cloud/18-Low-Code) - [2.2.2 कंप्यूट क्लस्टर बनाना](../../../../5-Data-Science-In-Cloud/18-Low-Code) - [2.3 डेटासेट लोड करना](../../../../5-Data-Science-In-Cloud/18-Low-Code) - [2.4 AutoML के साथ लो कोड/नो कोड ट्रेनिंग](../../../../5-Data-Science-In-Cloud/18-Low-Code) - [3. लो कोड/नो कोड मॉडल डिप्लॉयमेंट और एंडपॉइंट उपयोग](../../../../5-Data-Science-In-Cloud/18-Low-Code) - [3.1 मॉडल डिप्लॉयमेंट](../../../../5-Data-Science-In-Cloud/18-Low-Code) - [3.2 एंडपॉइंट उपयोग](../../../../5-Data-Science-In-Cloud/18-Low-Code) - [🚀 चुनौती](../../../../5-Data-Science-In-Cloud/18-Low-Code) - [पोस्ट-लेक्चर क्विज़](../../../../5-Data-Science-In-Cloud/18-Low-Code) - [समीक्षा और स्व-अध्ययन](../../../../5-Data-Science-In-Cloud/18-Low-Code) - [असाइनमेंट](../../../../5-Data-Science-In-Cloud/18-Low-Code) ## [प्री-लेक्चर क्विज़](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/34) ## 1. परिचय ### 1.1 Azure Machine Learning क्या है? Azure क्लाउड प्लेटफ़ॉर्म 200 से अधिक उत्पादों और क्लाउड सेवाओं का संग्रह है, जो आपको नए समाधान बनाने में मदद करता है। डेटा वैज्ञानिक डेटा का विश्लेषण और पूर्व-प्रसंस्करण करने, और विभिन्न प्रकार के मॉडल-ट्रेनिंग एल्गोरिदम का परीक्षण करने में बहुत समय लगाते हैं ताकि सटीक मॉडल तैयार किए जा सकें। ये कार्य समय लेने वाले होते हैं और अक्सर महंगे कंप्यूट हार्डवेयर का अप्रभावी उपयोग करते हैं। [Azure ML](https://docs.microsoft.com/azure/machine-learning/overview-what-is-azure-machine-learning?WT.mc_id=academic-77958-bethanycheum&ocid=AID3041109) एक क्लाउड-आधारित प्लेटफ़ॉर्म है, जो Azure में मशीन लर्निंग समाधान बनाने और संचालित करने के लिए डिज़ाइन किया गया है। इसमें डेटा तैयार करने, मॉडल ट्रेनिंग, प्रेडिक्टिव सेवाओं को प्रकाशित करने और उनके उपयोग की निगरानी करने के लिए कई सुविधाएँ और क्षमताएँ शामिल हैं। सबसे महत्वपूर्ण बात, यह मॉडल ट्रेनिंग से जुड़े समय लेने वाले कार्यों को स्वचालित करके डेटा वैज्ञानिकों की दक्षता बढ़ाने में मदद करता है। यह बड़े डेटा वॉल्यूम को संभालने के लिए प्रभावी रूप से स्केल करने वाले क्लाउड-आधारित कंप्यूट संसाधनों का उपयोग करने में सक्षम बनाता है, और केवल उपयोग के समय ही लागत लगती है। Azure ML निम्नलिखित टूल्स प्रदान करता है, जो डेवलपर्स और डेटा वैज्ञानिकों के लिए उनके मशीन लर्निंग वर्कफ़्लो को आसान बनाते हैं: - **Azure Machine Learning Studio**: यह एक वेब पोर्टल है, जो मॉडल ट्रेनिंग, डिप्लॉयमेंट, ऑटोमेशन, ट्रैकिंग और एसेट मैनेजमेंट के लिए लो कोड और नो कोड विकल्प प्रदान करता है। यह Azure Machine Learning SDK के साथ एकीकृत है। - **Jupyter Notebooks**: ML मॉडल को जल्दी प्रोटोटाइप और टेस्ट करने के लिए। - **Azure Machine Learning Designer**: मॉड्यूल्स को ड्रैग-एंड-ड्रॉप करके प्रयोग बनाने और लो कोड वातावरण में पाइपलाइन्स डिप्लॉय करने की सुविधा देता है। - **Automated machine learning UI (AutoML)**: मशीन लर्निंग मॉडल विकास के पुनरावृत्त कार्यों को स्वचालित करता है, जिससे उच्च स्केल, दक्षता और उत्पादकता के साथ मॉडल बनाए जा सकते हैं। - **Data Labelling**: डेटा को स्वचालित रूप से लेबल करने के लिए एक सहायक ML टूल। - **Visual Studio Code के लिए मशीन लर्निंग एक्सटेंशन**: ML प्रोजेक्ट्स बनाने और प्रबंधित करने के लिए एक पूर्ण-विशेषताओं वाला विकास वातावरण प्रदान करता है। - **Machine learning CLI**: कमांड लाइन से Azure ML संसाधनों को प्रबंधित करने के लिए कमांड प्रदान करता है। - **ओपन-सोर्स फ्रेमवर्क्स के साथ एकीकरण** जैसे PyTorch, TensorFlow, Scikit-learn आदि, जो ट्रेनिंग, डिप्लॉयमेंट और एंड-टू-एंड मशीन लर्निंग प्रक्रिया को प्रबंधित करने में मदद करते हैं। - **MLflow**: यह आपके मशीन लर्निंग प्रयोगों के जीवन चक्र को प्रबंधित करने के लिए एक ओपन-सोर्स लाइब्रेरी है। **MLFlow Tracking** आपके ट्रेनिंग रन मेट्रिक्स और मॉडल आर्टिफैक्ट्स को लॉग और ट्रैक करता है, चाहे आपका प्रयोग किसी भी वातावरण में हो। ### 1.2 हार्ट फेल्योर प्रेडिक्शन प्रोजेक्ट: प्रोजेक्ट बनाना और उन पर काम करना आपके कौशल और ज्ञान को परखने का सबसे अच्छा तरीका है। इस पाठ में, हम Azure ML Studio में हार्ट फेल्योर अटैक की भविष्यवाणी के लिए डेटा साइंस प्रोजेक्ट बनाने के दो अलग-अलग तरीकों का पता लगाएंगे: लो कोड/नो कोड और Azure ML SDK के माध्यम से, जैसा कि निम्नलिखित आरेख में दिखाया गया है: ![प्रोजेक्ट-आरेख](../../../../translated_images/project-schema.736f6e403f321eb48d10242b3f4334dc6ccf0eabef8ff87daf52b89781389fcb.hi.png) प्रत्येक तरीके के अपने फायदे और नुकसान हैं। लो कोड/नो कोड तरीका शुरू करने के लिए आसान है क्योंकि इसमें GUI (ग्राफिकल यूजर इंटरफेस) के साथ काम करना शामिल है और कोड का कोई पूर्व ज्ञान आवश्यक नहीं है। यह प्रोजेक्ट की व्यवहार्यता का त्वरित परीक्षण करने और POC (प्रूफ ऑफ कॉन्सेप्ट) बनाने में सक्षम बनाता है। हालांकि, जैसे-जैसे प्रोजेक्ट बढ़ता है और चीजों को प्रोडक्शन के लिए तैयार करना होता है, GUI के माध्यम से संसाधन बनाना व्यावहारिक नहीं होता। हमें प्रोग्रामेटिक रूप से सब कुछ स्वचालित करना पड़ता है, जैसे संसाधनों का निर्माण और मॉडल का डिप्लॉयमेंट। यही वह जगह है, जहां Azure ML SDK का उपयोग करना महत्वपूर्ण हो जाता है। | | लो कोड/नो कोड | Azure ML SDK | |-------------------|------------------|---------------------------| | कोड का ज्ञान | आवश्यक नहीं | आवश्यक | | विकास का समय | तेज और आसान | कोड विशेषज्ञता पर निर्भर | | प्रोडक्शन तैयार | नहीं | हाँ | ### 1.3 हार्ट फेल्योर डेटासेट: कार्डियोवैस्कुलर बीमारियाँ (CVDs) वैश्विक स्तर पर मृत्यु का नंबर 1 कारण हैं, जो दुनिया भर में 31% मौतों के लिए जिम्मेदार हैं। तंबाकू का उपयोग, अस्वास्थ्यकर आहार और मोटापा, शारीरिक निष्क्रियता और शराब का हानिकारक उपयोग जैसे पर्यावरणीय और व्यवहारिक जोखिम कारकों का उपयोग अनुमान मॉडल के लिए फीचर्स के रूप में किया जा सकता है। CVD के विकास की संभावना का अनुमान लगाना उच्च जोखिम वाले लोगों में हमलों को रोकने के लिए बहुत उपयोगी हो सकता है। Kaggle ने एक [हार्ट फेल्योर डेटासेट](https://www.kaggle.com/andrewmvd/heart-failure-clinical-data) सार्वजनिक रूप से उपलब्ध कराया है, जिसे हम इस प्रोजेक्ट के लिए उपयोग करेंगे। आप अभी इस डेटासेट को डाउनलोड कर सकते हैं। यह एक टेबलर डेटासेट है, जिसमें 13 कॉलम (12 फीचर्स और 1 टारगेट वेरिएबल) और 299 पंक्तियाँ हैं। | | वेरिएबल नाम | प्रकार | विवरण | उदाहरण | |----|---------------------------|-------------------|---------------------------------------------------------|-------------------| | 1 | age | संख्यात्मक | मरीज की उम्र | 25 | | 2 | anaemia | बूलियन | लाल रक्त कोशिकाओं या हीमोग्लोबिन की कमी | 0 या 1 | | 3 | creatinine_phosphokinase | संख्यात्मक | रक्त में CPK एंजाइम का स्तर | 542 | | 4 | diabetes | बूलियन | क्या मरीज को डायबिटीज है | 0 या 1 | | 5 | ejection_fraction | संख्यात्मक | प्रत्येक संकुचन पर हृदय से निकलने वाले रक्त का प्रतिशत | 45 | | 6 | high_blood_pressure | बूलियन | क्या मरीज को उच्च रक्तचाप है | 0 या 1 | | 7 | platelets | संख्यात्मक | रक्त में प्लेटलेट्स | 149000 | | 8 | serum_creatinine | संख्यात्मक | रक्त में सीरम क्रिएटिनिन का स्तर | 0.5 | | 9 | serum_sodium | संख्यात्मक | रक्त में सीरम सोडियम का स्तर | jun | | 10 | sex | बूलियन | महिला या पुरुष | 0 या 1 | | 11 | smoking | बूलियन | क्या मरीज धूम्रपान करता है | 0 या 1 | | 12 | time | संख्यात्मक | फॉलो-अप अवधि (दिनों में) | 4 | |----|---------------------------|-------------------|---------------------------------------------------------|-------------------| | 21 | DEATH_EVENT [Target] | बूलियन | फॉलो-अप अवधि के दौरान मरीज की मृत्यु हुई या नहीं | 0 या 1 | डेटासेट प्राप्त करने के बाद, हम Azure में प्रोजेक्ट शुरू कर सकते हैं। ## 2. Azure ML Studio में लो कोड/नो कोड मॉडल ट्रेनिंग ### 2.1 Azure ML वर्कस्पेस बनाना Azure ML में मॉडल ट्रेन करने के लिए, आपको पहले एक Azure ML वर्कस्पेस बनाना होगा। वर्कस्पेस Azure Machine Learning के लिए शीर्ष-स्तरीय संसाधन है, जो आपके द्वारा बनाए गए सभी आर्टिफैक्ट्स के साथ काम करने के लिए एक केंद्रीकृत स्थान प्रदान करता है। वर्कस्पेस सभी ट्रेनिंग रन का इतिहास रखता है, जिसमें लॉग्स, मेट्रिक्स, आउटपुट और आपके स्क्रिप्ट्स का स्नैपशॉट शामिल है। आप इस जानकारी का उपयोग यह निर्धारित करने के लिए करते हैं कि कौन सा ट्रेनिंग रन सबसे अच्छा मॉडल तैयार करता है। [अधिक जानें](https://docs.microsoft.com/azure/machine-learning/concept-workspace?WT.mc_id=academic-77958-bethanycheum&ocid=AID3041109) यह अनुशंसा की जाती है कि आप अपने ऑपरेटिंग सिस्टम के साथ संगत सबसे अद्यतन ब्राउज़र का उपयोग करें। निम्नलिखित ब्राउज़र समर्थित हैं: - Microsoft Edge (नया Microsoft Edge, नवीनतम संस्करण। Microsoft Edge लेगेसी नहीं) - Safari (नवीनतम संस्करण, केवल Mac के लिए) - Chrome (नवीनतम संस्करण) - Firefox (नवीनतम संस्करण) Azure Machine Learning का उपयोग करने के लिए, अपने Azure सब्सक्रिप्शन में एक वर्कस्पेस बनाएं। आप इस वर्कस्पेस का उपयोग डेटा, कंप्यूट संसाधन, कोड, मॉडल और मशीन लर्निंग वर्कलोड्स से संबंधित अन्य आर्टिफैक्ट्स को प्रबंधित करने के लिए कर सकते हैं। > **_NOTE:_** जब तक Azure Machine Learning वर्कस्पेस आपके सब्सक्रिप्शन में मौजूद है, आपके Azure सब्सक्रिप्शन से डेटा स्टोरेज के लिए एक छोटी राशि चार्ज की जाएगी। इसलिए, हम अनुशंसा करते हैं कि जब आप इसका उपयोग न कर रहे हों, तो Azure Machine Learning वर्कस्पेस को हटा दें। 1. [Azure पोर्टल](https://ms.portal.azure.com/) में Microsoft क्रेडेंशियल्स का उपयोग करके साइन इन करें, जो आपके Azure सब्सक्रिप्शन से जुड़े हैं। 2. **+Create a resource** चुनें। ![वर्कस्पेस-1](../../../../translated_images/workspace-1.ac8694d60b073ed1ae8333d71244dc8a9b3e439d54593724f98f1beefdd27b08.hi.png) Machine Learning खोजें और Machine Learning टाइल चुनें। ![वर्कस्पेस-2](../../../../translated_images/workspace-2.ae7c486db8796147075e4a56566aa819827dd6c4c8d18d64590317c3be625f17.hi.png) Create बटन पर क्लिक करें। ![वर्कस्पेस-3](../../../../translated_images/workspace-3.398ca4a5858132cce584db9df10c5a011cd9075eb182e647a77d5cac01771eea.hi.png) निम्नलिखित सेटिंग्स भरें: - सब्सक्रिप्शन: आपका Azure सब्सक्रिप्शन - रिसोर्स ग्रुप: एक रिसोर्स ग्रुप बनाएं या चुनें - वर्कस्पेस नाम: अपने वर्कस्पेस के लिए एक अद्वितीय नाम दर्ज करें - क्षेत्र: अपने निकटतम भौगोलिक क्षेत्र का चयन करें - स्टोरेज खाता: ध्यान दें कि आपके वर्कस्पेस के लिए एक नया स्टोरेज खाता बनाया जाएगा - की वॉल्ट: ध्यान दें कि आपके वर्कस्पेस के लिए एक नया की वॉल्ट बनाया जाएगा - एप्लिकेशन इनसाइट्स: ध्यान दें कि आपके वर्कस्पेस के लिए एक नया एप्लिकेशन इनसाइट्स संसाधन बनाया जाएगा - कंटेनर रजिस्ट्री: कोई नहीं (पहली बार जब आप किसी मॉडल को कंटेनर में डिप्लॉय करेंगे, तो एक स्वचालित रूप से बनाया जाएगा) ![वर्कस्पेस-4](../../../../translated_images/workspace-4.bac87f6599c4df63e624fc2608990f965887bee551d9dedc71c687b43b986b6a.hi.png) - Create + Review पर क्लिक करें और फिर Create बटन पर क्लिक करें। 3. अपने वर्कस्पेस के बनने की प्रतीक्षा करें (इसमें कुछ मिनट लग सकते हैं)। फिर इसे पोर्टल में खोलें। आप इसे Machine Learning Azure सेवा के माध्यम से पा सकते हैं। 4. अपने वर्कस्पेस के ओवरव्यू पेज पर, Azure Machine Learning स्टूडियो लॉन्च करें (या एक नया ब्राउज़र टैब खोलें और https://ml.azure.com पर जाएं), और अपने Microsoft खाते का उपयोग करके Azure Machine Learning स्टूडियो में साइन इन करें। यदि संकेत दिया जाए, तो अपना Azure डायरेक्टरी और सब्सक्रिप्शन चुनें, और अपना Azure Machine Learning वर्कस्पेस चुनें। ![वर्कस्पेस-5](../../../../translated_images/workspace-5.a6eb17e0a5e6420018b08bdaf3755ce977f96f1df3ea363d2476a9dce7e15adb.hi.png) 5. Azure Machine Learning स्टूडियो में, इंटरफ़ेस में विभिन्न पृष्ठों को देखने के लिए ऊपर बाईं ओर ☰ आइकन पर टॉगल करें। आप इन पृष्ठों का उपयोग अपने वर्कस्पेस में संसाधनों को प्रबंधित करने के लिए कर सकते हैं। ![वर्कस्पेस-6](../../../../translated_images/workspace-6.8dd81fe841797ee17f8f73916769576260b16c4e17e850d277a49db35fd74a15.hi.png) आप अपने वर्कस्पेस को Azure पोर्टल का उपयोग करके प्रबंधित कर सकते हैं, लेकिन डेटा वैज्ञानिकों और मशीन लर्निंग ऑपरेशंस इंजीनियरों के लिए, Azure Machine Learning स्टूडियो वर्कस्पेस संसाधनों को प्रबंधित करने के लिए एक अधिक केंद्रित उपयोगकर्ता इंटरफ़ेस प्रदान करता है। ### 2.2 कंप्यूट संसाधन कंप्यूट संसाधन क्लाउड-आधारित संसाधन हैं, जिन पर आप मॉडल ट्रेनिंग और डेटा एक्सप्लोरेशन प्रक्रियाएँ चला सकते हैं। आप चार प्रकार के कंप्यूट संसाधन बना सकते हैं: - **कंप्यूट इंस्टेंस**: विकास कार्यस्थल, जिनका उपयोग डेटा वैज्ञानिक डेटा और मॉडलों के साथ काम करने के लिए कर सकते हैं। इसमें एक वर्चुअल मशीन (VM) बनाना और एक नोटबुक इंस्टेंस लॉन्च करना शामिल है। आप फिर नोटबुक से कंप्यूट क्लस्टर को कॉल करके मॉडल ट्रेन कर सकते हैं। - **कंप्यूट क्लस्टर**: प्रयोग कोड के ऑन-डिमांड प्रोसेसिंग के लिए स्केलेबल VMs का क्लस्टर। जब आप मॉडल ट्रेन करते हैं, तो इसकी आवश्यकता होती है। कंप्यूट क्लस्टर विशेष GPU या CPU संसाधनों का भी उपयोग कर सकते हैं। - **इन्फरेंस क्लस्टर**: आपके प्रशिक्षित मॉडलों का उपयोग करने वाली प्रेडिक्टिव सेवाओं के लिए डिप्लॉयमेंट लक्ष्य। - **अटैच्ड कंप्यूट**: मौजूदा Azure कंप्यूट संसाधनों, जैसे वर्चुअल मशीन या Azure Databricks क्लस्टर्स से लिंक करता है। #### 2.2.1 अपने कंप्यूट संसाधनों के लिए सही विकल्प चुनना कंप्यूट संसाधन बनाते समय कुछ महत्वपूर्ण कारकों पर विचार करना चाहिए, और ये विकल्प महत्वपूर्ण निर्णय हो सकते हैं। **क्या आपको CPU या GPU की आवश्यकता है?** CPU (सेंट्रल प्रोसेसिंग यूनिट) एक इलेक्ट्रॉनिक सर्किट्री है जो कंप्यूटर प्रोग्राम के निर्देशों को निष्पादित करती है। GPU (ग्राफिक्स प्रोसेसिंग यूनिट) एक विशेषीकृत इलेक्ट्रॉनिक सर्किट है जो ग्राफिक्स-संबंधित कोड को बहुत तेज़ी से निष्पादित कर सकता है। CPU और GPU आर्किटेक्चर के बीच मुख्य अंतर यह है कि CPU को विभिन्न प्रकार के कार्यों को तेज़ी से संभालने के लिए डिज़ाइन किया गया है (जैसा कि CPU क्लॉक स्पीड द्वारा मापा जाता है), लेकिन यह एक समय में चलने वाले कार्यों की समानांतरता में सीमित है। GPU समानांतर कंप्यूटिंग के लिए डिज़ाइन किए गए हैं और इसलिए गहन शिक्षण (डीप लर्निंग) कार्यों के लिए अधिक उपयुक्त हैं। | CPU | GPU | |-----------------------------------------|-----------------------------| | कम महंगा | अधिक महंगा | | कम समानांतरता | अधिक समानांतरता | | गहन शिक्षण मॉडल को प्रशिक्षित करने में धीमा | गहन शिक्षण के लिए उपयुक्त | **क्लस्टर का आकार** बड़े क्लस्टर अधिक महंगे होते हैं लेकिन बेहतर प्रतिक्रिया समय प्रदान करते हैं। इसलिए, यदि आपके पास समय है लेकिन पर्याप्त पैसा नहीं है, तो आपको छोटे क्लस्टर से शुरुआत करनी चाहिए। इसके विपरीत, यदि आपके पास पैसा है लेकिन समय कम है, तो आपको बड़े क्लस्टर से शुरुआत करनी चाहिए। **VM का आकार** अपने समय और बजट की बाधाओं के आधार पर, आप अपने RAM, डिस्क, कोर की संख्या और क्लॉक स्पीड का आकार बदल सकते हैं। इन सभी मापदंडों को बढ़ाने से लागत बढ़ेगी, लेकिन प्रदर्शन बेहतर होगा। **डेडिकेटेड या लो-प्रायोरिटी इंस्टेंस?** लो-प्रायोरिटी इंस्टेंस का मतलब है कि यह बाधित हो सकता है: मूल रूप से, Microsoft Azure उन संसाधनों को ले सकता है और उन्हें किसी अन्य कार्य को सौंप सकता है, जिससे एक जॉब बाधित हो सकती है। एक डेडिकेटेड इंस्टेंस, या गैर-बाधित, का मतलब है कि जॉब आपकी अनुमति के बिना कभी समाप्त नहीं होगी। यह समय बनाम पैसे का एक और विचार है, क्योंकि बाधित होने वाले इंस्टेंस डेडिकेटेड इंस्टेंस की तुलना में सस्ते होते हैं। #### 2.2.2 कंप्यूट क्लस्टर बनाना [Azure ML वर्कस्पेस](https://ml.azure.com/) में, जिसे हमने पहले बनाया था, "कंप्यूट" पर जाएं और आप विभिन्न कंप्यूट संसाधन देख पाएंगे जिन पर हमने चर्चा की थी (जैसे कंप्यूट इंस्टेंस, कंप्यूट क्लस्टर, इन्फरेंस क्लस्टर और अटैच्ड कंप्यूट)। इस प्रोजेक्ट के लिए, हमें मॉडल प्रशिक्षण के लिए एक कंप्यूट क्लस्टर की आवश्यकता होगी। स्टूडियो में, "कंप्यूट" मेनू पर क्लिक करें, फिर "कंप्यूट क्लस्टर" टैब पर जाएं और "+ New" बटन पर क्लिक करें। ![22](../../../../translated_images/cluster-1.b78cb630bb543729b11f60c34d97110a263f8c27b516ba4dc47807b3cee5579f.hi.png) 1. अपने विकल्प चुनें: डेडिकेटेड बनाम लो प्रायोरिटी, CPU या GPU, VM का आकार और कोर की संख्या (आप इस प्रोजेक्ट के लिए डिफ़ॉल्ट सेटिंग्स रख सकते हैं)। 2. "Next" बटन पर क्लिक करें। ![23](../../../../translated_images/cluster-2.ea30cdbc9f926bb9e05af3fdbc1f679811c796dc2a6847f935290aec15526e88.hi.png) 3. क्लस्टर को एक नाम दें। 4. अपने विकल्प चुनें: न्यूनतम/अधिकतम नोड्स की संख्या, स्केल डाउन से पहले निष्क्रिय सेकंड, SSH एक्सेस। ध्यान दें कि यदि न्यूनतम नोड्स की संख्या 0 है, तो क्लस्टर निष्क्रिय होने पर आप पैसे बचा सकते हैं। ध्यान दें कि अधिकतम नोड्स की संख्या जितनी अधिक होगी, प्रशिक्षण उतना ही कम समय लेगा। अधिकतम 3 नोड्स की सिफारिश की जाती है। 5. "Create" बटन पर क्लिक करें। यह चरण कुछ मिनट लग सकता है। ![29](../../../../translated_images/cluster-3.8a334bc070ec173a329ce5abd2a9d727542e83eb2347676c9af20f2c8870b3e7.hi.png) शानदार! अब जब हमारे पास एक कंप्यूट क्लस्टर है, तो हमें डेटा को Azure ML स्टूडियो में लोड करना होगा। ### 2.3 डेटासेट लोड करना 1. [Azure ML वर्कस्पेस](https://ml.azure.com/) में, जिसे हमने पहले बनाया था, बाईं ओर के मेनू में "Datasets" पर क्लिक करें और "+ Create dataset" बटन पर क्लिक करें। "From local files" विकल्प चुनें और पहले डाउनलोड किए गए Kaggle डेटासेट को चुनें। ![24](../../../../translated_images/dataset-1.e86ab4e10907a6e9c2a72577b51db35f13689cb33702337b8b7032f2ef76dac2.hi.png) 2. अपने डेटासेट को एक नाम, प्रकार और विवरण दें। "Next" पर क्लिक करें। फाइलों से डेटा अपलोड करें। "Next" पर क्लिक करें। ![25](../../../../translated_images/dataset-2.f58de1c435d5bf9ccb16ccc5f5d4380eb2b50affca85cfbf4f97562bdab99f77.hi.png) 3. स्कीमा में, निम्नलिखित विशेषताओं के लिए डेटा प्रकार को Boolean में बदलें: anaemia, diabetes, high blood pressure, sex, smoking, और DEATH_EVENT। "Next" पर क्लिक करें और "Create" पर क्लिक करें। ![26](../../../../translated_images/dataset-3.58db8c0eb783e89236a02bbce5bb4ba808d081a87d994d5284b1ae59928c95bf.hi.png) बहुत बढ़िया! अब जब डेटासेट तैयार है और कंप्यूट क्लस्टर बनाया गया है, तो हम मॉडल का प्रशिक्षण शुरू कर सकते हैं! ### 2.4 लो कोड/नो कोड प्रशिक्षण AutoML के साथ पारंपरिक मशीन लर्निंग मॉडल विकास संसाधन-गहन होता है, जिसमें महत्वपूर्ण डोमेन ज्ञान और दर्जनों मॉडलों को बनाने और तुलना करने के लिए समय की आवश्यकता होती है। ऑटोमेटेड मशीन लर्निंग (AutoML) मशीन लर्निंग मॉडल विकास के समय लेने वाले, पुनरावृत्त कार्यों को स्वचालित करने की प्रक्रिया है। यह डेटा वैज्ञानिकों, विश्लेषकों और डेवलपर्स को उच्च पैमाने, दक्षता और उत्पादकता के साथ ML मॉडल बनाने की अनुमति देता है, जबकि मॉडल की गुणवत्ता बनाए रखता है। यह उत्पादन-तैयार ML मॉडल प्राप्त करने में लगने वाले समय को कम करता है, वह भी बड़ी आसानी और दक्षता के साथ। [अधिक जानें](https://docs.microsoft.com/azure/machine-learning/concept-automated-ml?WT.mc_id=academic-77958-bethanycheum&ocid=AID3041109) 1. [Azure ML वर्कस्पेस](https://ml.azure.com/) में, जिसे हमने पहले बनाया था, बाईं ओर के मेनू में "Automated ML" पर क्लिक करें और अभी-अभी अपलोड किए गए डेटासेट का चयन करें। "Next" पर क्लिक करें। ![27](../../../../translated_images/aml-1.67281a85d3a1e2f34eb367b2d0f74e1039d13396e510f363cd8766632106d1ec.hi.png) 2. एक नया प्रयोग नाम, लक्ष्य कॉलम (DEATH_EVENT) और हमने जो कंप्यूट क्लस्टर बनाया था, उसे दर्ज करें। "Next" पर क्लिक करें। ![28](../../../../translated_images/aml-2.c9fb9cffb39ccbbe21ab9810ae937195d41a489744e15cff2b8477ed4dcae1ec.hi.png) 3. "Classification" चुनें और "Finish" पर क्लिक करें। यह चरण आपके कंप्यूट क्लस्टर के आकार के आधार पर 30 मिनट से 1 घंटे तक लग सकता है। ![30](../../../../translated_images/aml-3.a7952e4295f38cc6cdb0c7ed6dc71ea756b7fb5697ec126bc1220f87c5fa9231.hi.png) 4. रन पूरा होने के बाद, "Automated ML" टैब पर क्लिक करें, अपने रन पर क्लिक करें, और "Best model summary" कार्ड में एल्गोरिदम पर क्लिक करें। ![31](../../../../translated_images/aml-4.7a627e09cb6f16d0aa246059d9faee3d1725cc4258d0c8df15e801f73afc7e2c.hi.png) यहां आप AutoML द्वारा उत्पन्न सर्वश्रेष्ठ मॉडल का विस्तृत विवरण देख सकते हैं। आप "Models" टैब में अन्य मॉडल भी देख सकते हैं। "Explanations (preview)" बटन में मॉडल का विश्लेषण करने के लिए कुछ समय लें। जब आप उस मॉडल को चुन लें जिसे आप उपयोग करना चाहते हैं (यहां हम AutoML द्वारा चुने गए सर्वश्रेष्ठ मॉडल का चयन करेंगे), तो हम देखेंगे कि इसे कैसे तैनात किया जा सकता है। ## 3. लो कोड/नो कोड मॉडल डिप्लॉयमेंट और एंडपॉइंट उपभोग ### 3.1 मॉडल डिप्लॉयमेंट ऑटोमेटेड मशीन लर्निंग इंटरफेस आपको कुछ चरणों में सर्वश्रेष्ठ मॉडल को एक वेब सेवा के रूप में तैनात करने की अनुमति देता है। डिप्लॉयमेंट का मतलब है मॉडल का एकीकरण ताकि यह नए डेटा के आधार पर भविष्यवाणियां कर सके और संभावित अवसर क्षेत्रों की पहचान कर सके। इस प्रोजेक्ट के लिए, एक वेब सेवा पर डिप्लॉयमेंट का मतलब है कि चिकित्सा अनुप्रयोग मॉडल का उपयोग कर सकेंगे ताकि वे अपने मरीजों के दिल के दौरे के जोखिम की लाइव भविष्यवाणी कर सकें। सर्वश्रेष्ठ मॉडल विवरण में, "Deploy" बटन पर क्लिक करें। ![deploy-1](../../../../translated_images/deploy-1.ddad725acadc84e34553c3d09e727160faeb32527a9fb8b904c0f99235a34bb6.hi.png) 15. इसे एक नाम, विवरण, कंप्यूट प्रकार (Azure Container Instance) दें, प्रमाणीकरण सक्षम करें और "Deploy" पर क्लिक करें। इस चरण को पूरा होने में लगभग 20 मिनट लग सकते हैं। डिप्लॉयमेंट प्रक्रिया में मॉडल को पंजीकृत करना, संसाधन उत्पन्न करना और उन्हें वेब सेवा के लिए कॉन्फ़िगर करना शामिल है। "Deploy status" के तहत एक स्थिति संदेश दिखाई देता है। स्थिति की जांच के लिए समय-समय पर "Refresh" पर क्लिक करें। जब स्थिति "Healthy" हो, तो इसका मतलब है कि यह तैनात और चल रहा है। ![deploy-2](../../../../translated_images/deploy-2.94dbb13f239086473aa4bf814342fd40483d136849b080f02bafbb995383940e.hi.png) 16. एक बार तैनात हो जाने के बाद, "Endpoint" टैब पर क्लिक करें और उस एंडपॉइंट पर क्लिक करें जिसे आपने अभी तैनात किया है। यहां आप एंडपॉइंट के बारे में सभी विवरण पा सकते हैं। ![deploy-3](../../../../translated_images/deploy-3.fecefef070e8ef3b28e802326d107f61ac4e672d20bf82d05f78d025f9e6c611.hi.png) शानदार! अब जब हमारे पास एक मॉडल तैनात है, तो हम एंडपॉइंट का उपभोग शुरू कर सकते हैं। ### 3.2 एंडपॉइंट उपभोग "Consume" टैब पर क्लिक करें। यहां आपको REST एंडपॉइंट और उपभोग विकल्प में एक पायथन स्क्रिप्ट मिलेगी। पायथन कोड को पढ़ने के लिए कुछ समय लें। यह स्क्रिप्ट सीधे आपके लोकल मशीन से चलाई जा सकती है और आपके एंडपॉइंट का उपभोग करेगी। ![35](../../../../translated_images/consumption-1.700abd196452842a020c7d745908637a6e4c5c50494ad1217be80e283e0de154.hi.png) इन दो कोड लाइनों को ध्यान से देखें: ```python url = 'http://98e3715f-xxxx-xxxx-xxxx-9ec22d57b796.centralus.azurecontainer.io/score' api_key = '' # Replace this with the API key for the web service ``` `url` वेरिएबल उपभोग टैब में पाया गया REST एंडपॉइंट है और `api_key` वेरिएबल प्राथमिक कुंजी है जो उपभोग टैब में भी पाई जाती है (केवल तभी जब आपने प्रमाणीकरण सक्षम किया हो)। यही वह तरीका है जिससे स्क्रिप्ट एंडपॉइंट का उपभोग कर सकती है। 18. स्क्रिप्ट चलाने पर, आपको निम्नलिखित आउटपुट दिखाई देना चाहिए: ```python b'"{\\"result\\": [true]}"' ``` इसका मतलब है कि दिए गए डेटा के लिए दिल की विफलता की भविष्यवाणी सही है। यह समझ में आता है क्योंकि यदि आप स्क्रिप्ट में स्वचालित रूप से उत्पन्न डेटा को अधिक बारीकी से देखते हैं, तो सब कुछ डिफ़ॉल्ट रूप से 0 और false पर सेट है। आप निम्नलिखित इनपुट नमूने के साथ डेटा बदल सकते हैं: ```python data = { "data": [ { 'age': "0", 'anaemia': "false", 'creatinine_phosphokinase': "0", 'diabetes': "false", 'ejection_fraction': "0", 'high_blood_pressure': "false", 'platelets': "0", 'serum_creatinine': "0", 'serum_sodium': "0", 'sex': "false", 'smoking': "false", 'time': "0", }, { 'age': "60", 'anaemia': "false", 'creatinine_phosphokinase': "500", 'diabetes': "false", 'ejection_fraction': "38", 'high_blood_pressure': "false", 'platelets': "260000", 'serum_creatinine': "1.40", 'serum_sodium': "137", 'sex': "false", 'smoking': "false", 'time': "130", }, ], } ``` स्क्रिप्ट को यह रिटर्न करना चाहिए: ```python b'"{\\"result\\": [true, false]}"' ``` बधाई हो! आपने मॉडल को तैनात किया, उपभोग किया और इसे Azure ML पर प्रशिक्षित किया! > **_NOTE:_** प्रोजेक्ट पूरा होने के बाद, सभी संसाधनों को हटाना न भूलें। ## 🚀 चुनौती AutoML द्वारा शीर्ष मॉडलों के लिए उत्पन्न मॉडल स्पष्टीकरण और विवरण को ध्यान से देखें। यह समझने की कोशिश करें कि सर्वश्रेष्ठ मॉडल अन्य मॉडलों की तुलना में बेहतर क्यों है। किन एल्गोरिदम की तुलना की गई? उनके बीच क्या अंतर हैं? इस मामले में सर्वश्रेष्ठ मॉडल बेहतर प्रदर्शन क्यों कर रहा है? ## [पोस्ट-लेक्चर क्विज़](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/35) ## समीक्षा और स्व-अध्ययन इस पाठ में, आपने क्लाउड में लो कोड/नो कोड तरीके से दिल की विफलता के जोखिम की भविष्यवाणी करने के लिए एक मॉडल को प्रशिक्षित, तैनात और उपभोग करना सीखा। यदि आपने अभी तक ऐसा नहीं किया है, तो AutoML द्वारा शीर्ष मॉडलों के लिए उत्पन्न मॉडल स्पष्टीकरण में गहराई से जाएं और यह समझने की कोशिश करें कि सर्वश्रेष्ठ मॉडल अन्य मॉडलों की तुलना में बेहतर क्यों है। आप लो कोड/नो कोड AutoML के बारे में और अधिक जानने के लिए इस [डॉक्यूमेंटेशन](https://docs.microsoft.com/azure/machine-learning/tutorial-first-experiment-automated-ml?WT.mc_id=academic-77958-bethanycheum&ocid=AID3041109) को पढ़ सकते हैं। ## असाइनमेंट [Azure ML पर लो कोड/नो कोड डेटा साइंस प्रोजेक्ट](assignment.md) **अस्वीकरण**: यह दस्तावेज़ AI अनुवाद सेवा [Co-op Translator](https://github.com/Azure/co-op-translator) का उपयोग करके अनुवादित किया गया है। जबकि हम सटीकता के लिए प्रयासरत हैं, कृपया ध्यान दें कि स्वचालित अनुवाद में त्रुटियां या अशुद्धियां हो सकती हैं। मूल भाषा में उपलब्ध मूल दस्तावेज़ को प्रामाणिक स्रोत माना जाना चाहिए। महत्वपूर्ण जानकारी के लिए, पेशेवर मानव अनुवाद की सिफारिश की जाती है। इस अनुवाद के उपयोग से उत्पन्न किसी भी गलतफहमी या गलत व्याख्या के लिए हम उत्तरदायी नहीं हैं।