You can not select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.
Data-Science-For-Beginners/translations/ne/5-Data-Science-In-Cloud/17-Introduction
leestott 8029ff828a
🌐 Update translations via Co-op Translator
2 weeks ago
..
README.md 🌐 Update translations via Co-op Translator 2 weeks ago
assignment.md 🌐 Update translations via Co-op Translator 3 weeks ago

README.md

क्लाउडमा डाटा साइन्सको परिचय

 (@sketchthedocs) द्वारा स्केच नोट
क्लाउडमा डाटा साइन्स: परिचय - @nitya द्वारा स्केच नोट

यस पाठमा, तपाईं क्लाउडका आधारभूत सिद्धान्तहरू सिक्नुहुनेछ, त्यसपछि तपाईंले किन क्लाउड सेवाहरू प्रयोग गरेर आफ्नो डाटा साइन्स प्रोजेक्टहरू सञ्चालन गर्नु रोचक हुन सक्छ भन्ने कुरा बुझ्नुहुनेछ, र हामी क्लाउडमा सञ्चालन गरिएका केही डाटा साइन्स प्रोजेक्टहरूको उदाहरणहरू हेर्नेछौं।

पाठ अघि क्विज

क्लाउड के हो?

क्लाउड, वा क्लाउड कम्प्युटिङ, इन्टरनेटमा होस्ट गरिएको पूर्वाधारमार्फत विभिन्न प्रकारका पे-एज-यू-गो कम्प्युटिङ सेवाहरूको डेलिभरी हो। यी सेवाहरूमा भण्डारण, डाटाबेस, नेटवर्किङ, सफ्टवेयर, एनालिटिक्स, र बौद्धिक सेवाहरू जस्ता समाधानहरू समावेश छन्।

हामी सामान्यतया सार्वजनिक, निजी र हाइब्रिड क्लाउडलाई यसरी फरक पार्छौं:

  • सार्वजनिक क्लाउड: सार्वजनिक क्लाउड तेस्रो-पक्ष क्लाउड सेवा प्रदायकद्वारा स्वामित्व र सञ्चालन गरिन्छ, जसले आफ्नो कम्प्युटिङ स्रोतहरू इन्टरनेटमार्फत सार्वजनिकलाई प्रदान गर्दछ।
  • निजी क्लाउड: निजी क्लाउड भनेको एकल व्यवसाय वा संगठनद्वारा मात्र प्रयोग गरिने क्लाउड कम्प्युटिङ स्रोतहरू हो, जसमा सेवाहरू र पूर्वाधार निजी नेटवर्कमा कायम गरिन्छ।
  • हाइब्रिड क्लाउड: हाइब्रिड क्लाउड भनेको सार्वजनिक र निजी क्लाउडहरूको संयोजन हो। प्रयोगकर्ताहरूले अन-प्रिमाइस डाटासेन्टर रोज्छन्, जबकि डेटा र एप्लिकेसनहरू एक वा बढी सार्वजनिक क्लाउडहरूमा सञ्चालन गर्न अनुमति दिन्छन्।

धेरैजसो क्लाउड कम्प्युटिङ सेवाहरू तीन श्रेणीमा पर्दछन्: Infrastructure as a Service (IaaS), Platform as a Service (PaaS), र Software as a Service (SaaS)

  • Infrastructure as a Service (IaaS): प्रयोगकर्ताहरूले सर्भर, भर्चुअल मेसिन (VMs), भण्डारण, नेटवर्क, अपरेटिङ सिस्टम जस्ता आईटी पूर्वाधार भाडामा लिन्छन्।
  • Platform as a Service (PaaS): प्रयोगकर्ताहरूले सफ्टवेयर एप्लिकेसनहरू विकास, परीक्षण, डेलिभर र व्यवस्थापन गर्न वातावरण भाडामा लिन्छन्। प्रयोगकर्ताहरूले सर्भर, भण्डारण, नेटवर्क र डाटाबेसहरूको पूर्वाधार सेटअप वा व्यवस्थापनको चिन्ता लिनु पर्दैन।
  • Software as a Service (SaaS): प्रयोगकर्ताहरूले इन्टरनेटमार्फत सफ्टवेयर एप्लिकेसनहरूमा पहुँच पाउँछन्, प्रायः माग अनुसार र सदस्यता आधारमा। प्रयोगकर्ताहरूले सफ्टवेयर होस्टिङ, व्यवस्थापन, पूर्वाधार वा मर्मतसम्भार (जस्तै सफ्टवेयर अपग्रेड र सुरक्षा प्याचिङ) को चिन्ता लिनु पर्दैन।

सबैभन्दा ठूला क्लाउड प्रदायकहरूमा Amazon Web Services, Google Cloud Platform र Microsoft Azure पर्छन्।

डाटा साइन्सका लागि क्लाउड किन रोज्ने?

डेभलपरहरू र आईटी पेशेवरहरूले विभिन्न कारणले क्लाउडसँग काम गर्न रोज्छन्, जसमध्ये केही निम्न छन्:

  • नवीनता: तपाईं आफ्नो एप्लिकेसनहरूलाई क्लाउड प्रदायकहरूले सिर्जना गरेका नवीन सेवाहरूलाई सिधै एकीकृत गरेर सशक्त बनाउन सक्नुहुन्छ।
  • लचिलोपन: तपाईंलाई आवश्यक सेवाहरू मात्र प्रयोग गर्न सक्नुहुन्छ र सेवाहरूको विस्तृत दायरा रोज्न सक्नुहुन्छ। तपाईं सामान्यतया प्रयोग अनुसार तिर्नुहुन्छ र आफ्नो आवश्यकताहरू अनुसार सेवाहरू अनुकूलन गर्न सक्नुहुन्छ।
  • बजेट: तपाईंलाई हार्डवेयर र सफ्टवेयर किन्न, सेटअप गर्न र अन-साइट डाटासेन्टरहरू सञ्चालन गर्न प्रारम्भिक लगानी गर्न आवश्यक पर्दैन। तपाईंले प्रयोग गरे अनुसार मात्र तिर्न सक्नुहुन्छ।
  • स्केलेबिलिटी: तपाईंको स्रोतहरू परियोजनाको आवश्यकताहरू अनुसार स्केल गर्न सकिन्छ, जसको अर्थ तपाईंको एप्सले कुनै पनि समयमा बाह्य कारकहरू अनुसार बढी वा कम कम्प्युटिङ पावर, भण्डारण र ब्यान्डविथ प्रयोग गर्न सक्छ।
  • उत्पादकता: तपाईं आफ्नो व्यवसायमा ध्यान केन्द्रित गर्न सक्नुहुन्छ, जस्तै डाटासेन्टर व्यवस्थापन जस्ता कार्यहरू अरूले व्यवस्थापन गर्न सक्छन्।
  • विश्वसनीयता: क्लाउड कम्प्युटिङले तपाईंको डेटा निरन्तर ब्याकअप गर्नका लागि विभिन्न तरिकाहरू प्रदान गर्दछ, र तपाईं आपतकालीन पुन:प्राप्ति योजनाहरू सेटअप गर्न सक्नुहुन्छ।
  • सुरक्षा: तपाईं आफ्नो परियोजनाको सुरक्षालाई बलियो बनाउने नीतिहरू, प्रविधिहरू र नियन्त्रणहरूको फाइदा लिन सक्नुहुन्छ।

यी क्लाउड सेवाहरू प्रयोग गर्नका लागि सबैभन्दा सामान्य कारणहरू हुन्। अब हामीले क्लाउड के हो र यसको मुख्य फाइदाहरू के हुन् भन्ने राम्रोसँग बुझेका छौं, अब हामी डाटा वैज्ञानिक र डाटासँग काम गर्ने डेभलपरहरूको काममा ध्यान केन्द्रित गरौं, र क्लाउडले उनीहरूलाई सामना गर्नुपर्ने विभिन्न चुनौतीहरूमा कसरी सहयोग गर्न सक्छ:

  • ठूलो मात्रामा डेटा भण्डारण: ठूला सर्भरहरू किन्न, व्यवस्थापन गर्न र सुरक्षित गर्नुभन्दा, तपाईं आफ्नो डेटा सिधै क्लाउडमा भण्डारण गर्न सक्नुहुन्छ, जस्तै Azure Cosmos DB, Azure SQL Database र Azure Data Lake Storage जस्ता समाधानहरूसँग।
  • डेटा एकीकरण प्रदर्शन गर्नु: डेटा एकीकरण डाटा साइन्सको एक महत्त्वपूर्ण भाग हो, जसले तपाईंलाई डेटा सङ्कलनबाट कार्यमा रूपान्तरण गर्न मद्दत गर्दछ। क्लाउडमा प्रस्ताव गरिएका डेटा एकीकरण सेवाहरूको साथ, तपाईं विभिन्न स्रोतहरूबाट डेटा सङ्कलन, रूपान्तरण र एकल डेटा वेयरहाउसमा एकीकृत गर्न सक्नुहुन्छ, Data Factory प्रयोग गरेर।
  • डेटा प्रशोधन गर्नु: ठूलो मात्रामा डेटा प्रशोधन गर्न धेरै कम्प्युटिङ पावर आवश्यक पर्छ, र सबैसँग त्यसका लागि पर्याप्त शक्तिशाली मेसिनहरू हुँदैनन्। त्यसैले धेरै मानिसहरूले आफ्नो समाधानहरू सञ्चालन र परिनियोजन गर्न सिधै क्लाउडको विशाल कम्प्युटिङ पावर प्रयोग गर्न रोज्छन्।
  • डेटा एनालिटिक्स सेवाहरू प्रयोग गर्नु: Azure Synapse Analytics, Azure Stream Analytics र Azure Databricks जस्ता क्लाउड सेवाहरूले तपाईंलाई आफ्नो डेटा कार्यात्मक अन्तर्दृष्टिमा रूपान्तरण गर्न मद्दत गर्दछ।
  • मेसिन लर्निङ र डेटा बौद्धिक सेवाहरू प्रयोग गर्नु: सुरुबाट सुरु गर्नुभन्दा, तपाईं क्लाउड प्रदायकद्वारा प्रस्ताव गरिएका मेसिन लर्निङ एल्गोरिदमहरू प्रयोग गर्न सक्नुहुन्छ, AzureML जस्ता सेवाहरूको साथ। तपाईंले स्पीच-टु-टेक्स्ट, टेक्स्ट-टु-स्पीच, कम्प्युटर भिजन र अन्य जस्ता संज्ञानात्मक सेवाहरू पनि प्रयोग गर्न सक्नुहुन्छ।

क्लाउडमा डाटा साइन्सका उदाहरणहरू

अब केही परिदृश्यहरू हेरेर यसलाई अझ स्पष्ट बनाऔं।

वास्तविक-समय सामाजिक सञ्जाल भावना विश्लेषण

हामी मेसिन लर्निङ सुरु गर्ने व्यक्तिहरूले सामान्यतया अध्ययन गर्ने परिदृश्यबाट सुरु गर्नेछौं: वास्तविक-समय सामाजिक सञ्जाल भावना विश्लेषण।

मानौं तपाईं एउटा समाचार मिडिया वेबसाइट सञ्चालन गर्नुहुन्छ र तपाईं आफ्नो पाठकहरूलाई चासो लाग्न सक्ने सामग्री बुझ्न प्रत्यक्ष डेटा प्रयोग गर्न चाहनुहुन्छ। यसबारे थप जान्न, तपाईंले ट्विटर प्रकाशनहरूबाट वास्तविक-समय भावना विश्लेषण गर्ने कार्यक्रम बनाउन सक्नुहुन्छ, जुन तपाईंका पाठकहरूका लागि सान्दर्भिक विषयहरूमा केन्द्रित हुन्छ।

तपाईंले हेर्ने मुख्य सूचकहरू हुन्: विशेष विषयहरू (ह्यासट्यागहरू) मा ट्वीटहरूको मात्रा र भावना, जुन निर्दिष्ट विषयहरू वरिपरि भावना विश्लेषण गर्ने एनालिटिक्स उपकरणहरूको प्रयोगबाट स्थापित गरिन्छ।

यो परियोजना सिर्जना गर्न आवश्यक चरणहरू निम्न छन्:

  • इनपुट स्ट्रिमिङका लागि इभेन्ट हब सिर्जना गर्नु, जसले ट्विटरबाट डेटा सङ्कलन गर्नेछ।
  • ट्विटर स्ट्रिमिङ APIs कल गर्ने ट्विटर क्लाइन्ट एप्लिकेसन कन्फिगर र सुरु गर्नु।
  • स्ट्रिम एनालिटिक्स काम सिर्जना गर्नु।
  • कामको इनपुट र क्वेरी निर्दिष्ट गर्नु।
  • आउटपुट सङ्क र कामको आउटपुट निर्दिष्ट गर्नु।
  • काम सुरु गर्नु।

पूरा प्रक्रिया हेर्न, डकुमेन्टेसन हेर्नुहोस्।

वैज्ञानिक कागजातहरूको विश्लेषण

अब यस पाठ्यक्रमका लेखकहरूमध्ये एक दिमित्री सश्निकोभ द्वारा सिर्जना गरिएको अर्को परियोजनाको उदाहरण लिऔं।

दिमित्रीले COVID कागजातहरूको विश्लेषण गर्ने उपकरण सिर्जना गरे। यो परियोजना समीक्षा गरेर, तपाईंले कसरी वैज्ञानिक कागजातहरूबाट ज्ञान निकाल्ने, अन्तर्दृष्टि प्राप्त गर्ने र अनुसन्धानकर्ताहरूलाई ठूलो सङ्कलनहरू प्रभावकारी रूपमा नेभिगेट गर्न मद्दत गर्ने उपकरण सिर्जना गर्न सकिन्छ भन्ने देख्नुहुनेछ।

यसका लागि प्रयोग गरिएका विभिन्न चरणहरू हेर्नुहोस्:

  • Text Analytics for Health प्रयोग गरेर जानकारी निकाल्ने र पूर्व-प्रशोधन गर्ने।
  • Azure ML प्रयोग गरेर प्रशोधनलाई समानान्तर बनाउने।
  • Cosmos DB प्रयोग गरेर जानकारी भण्डारण र क्वेरी गर्ने।
  • Power BI प्रयोग गरेर डेटा अन्वेषण र भिजुअलाइजेसनका लागि अन्तरक्रियात्मक ड्यासबोर्ड सिर्जना गर्ने।

पूरा प्रक्रिया हेर्न, दिमित्रीको ब्लग भ्रमण गर्नुहोस्।

जसरी तपाईंले देख्नुभयो, हामी डाटा साइन्स प्रदर्शन गर्न धेरै तरिकामा क्लाउड सेवाहरूको फाइदा लिन सक्छौं।

फुटनोट

स्रोतहरू:

पाठपछि क्विज

पाठपछि क्विज

असाइनमेन्ट

बजार अनुसन्धान


अस्वीकरण:
यो दस्तावेज़ AI अनुवाद सेवा Co-op Translator प्रयोग गरेर अनुवाद गरिएको छ। हामी शुद्धताको लागि प्रयास गर्छौं, तर कृपया ध्यान दिनुहोस् कि स्वचालित अनुवादहरूमा त्रुटि वा अशुद्धता हुन सक्छ। यसको मूल भाषा मा रहेको मूल दस्तावेज़लाई आधिकारिक स्रोत मानिनुपर्छ। महत्वपूर्ण जानकारीको लागि, व्यावसायिक मानव अनुवाद सिफारिस गरिन्छ। यस अनुवादको प्रयोगबाट उत्पन्न हुने कुनै पनि गलतफहमी वा गलत व्याख्याको लागि हामी जिम्मेवार हुने छैनौं।