|
|
4 months ago | |
|---|---|---|
| .. | ||
| README.md | 4 months ago | |
| assignment.md | 4 months ago | |
README.md
மேகத்தில் தரவியல் அறிவியல் அறிமுகம்
![]() |
|---|
| மேகத்தில் தரவியல் அறிவியல்: அறிமுகம் - Sketchnote by @nitya |
இந்த பாடத்தில், மேகத்தின் அடிப்படை கொள்கைகளை நீங்கள் கற்றுக்கொள்வீர்கள், பின்னர் உங்கள் தரவியல் அறிவியல் திட்டங்களை இயக்க மேக சேவைகளை பயன்படுத்துவது ஏன் உங்களுக்கு சுவாரஸ்யமாக இருக்க முடியும் என்பதை பார்ப்போம், மேலும் மேகத்தில் இயக்கப்படும் சில தரவியல் அறிவியல் திட்டங்களின் உதாரணங்களைப் பார்ப்போம்.
பாடத்திற்கு முன் வினாடி வினா
மேகம் என்றால் என்ன?
மேகம், அல்லது மேக கணினி, இணையத்தின் மூலம் வழங்கப்படும் பல்வேறு கட்டண அடிப்படையிலான கணினி சேவைகளை வழங்கும் ஒரு அமைப்பு. சேவைகள் சேமிப்பு, தரவுத்தொகுப்புகள், நெட்வொர்க்கிங், மென்பொருள், பகுப்பாய்வு மற்றும் நுண்ணறிவு சேவைகள் போன்ற தீர்வுகளை உள்ளடக்கியவை.
பொதுவாக, பொதுவான மேகம், தனிப்பட்ட மேகம் மற்றும் கலப்பு மேகங்களை பின்வருமாறு வேறுபடுத்துகிறோம்:
- பொது மேகம்: பொதுவான மேகம் என்பது மூன்றாம் தரப்பு மேக சேவை வழங்குநரால் சொந்தமாகவும் இயக்கப்படுவதுடன், அதன் கணினி வளங்களை இணையத்தின் மூலம் பொதுமக்களுக்கு வழங்குகிறது.
- தனிப்பட்ட மேகம்: தனிப்பட்ட மேகம் என்பது ஒரு தனிப்பட்ட வணிகம் அல்லது அமைப்பால் மட்டுமே பயன்படுத்தப்படும் மேக கணினி வளங்களை குறிக்கிறது, சேவைகள் மற்றும் ஒரு தனிப்பட்ட நெட்வொர்க்கில் பராமரிக்கப்படும் ஒரு அமைப்புடன்.
- கலப்பு மேகம்: கலப்பு மேகம் என்பது பொதுவான மற்றும் தனிப்பட்ட மேகங்களை இணைக்கும் ஒரு அமைப்பு. பயனர்கள் ஒரு இடத்தில் தரவுத்தொகுப்பை தேர்ந்தெடுக்கிறார்கள், அதே நேரத்தில் தரவுகள் மற்றும் பயன்பாடுகளை ஒரு அல்லது அதற்கு மேற்பட்ட பொதுவான மேகங்களில் இயக்க அனுமதிக்கிறார்கள்.
பெரும்பாலான மேக கணினி சேவைகள் மூன்று வகைகளில் அடங்கும்: சூழமைப்பு சேவை (IaaS), மேடையில் சேவை (PaaS) மற்றும் மென்பொருள் சேவை (SaaS).
- சூழமைப்பு சேவை (IaaS): பயனர்கள் சேவர்கள் மற்றும் மெய்நிகர் இயந்திரங்கள் (VMs), சேமிப்பு, நெட்வொர்க்குகள், இயக்க முறைமைகள் போன்ற IT சூழமைப்புகளை வாடகைக்கு எடுக்கிறார்கள்.
- மேடையில் சேவை (PaaS): பயனர்கள் மென்பொருள் பயன்பாடுகளை உருவாக்க, சோதிக்க, வழங்க மற்றும் நிர்வகிக்க ஒரு சூழலை வாடகைக்கு எடுக்கிறார்கள். பயனர்கள் மேடையின் அடிப்படை சூழமைப்புகளை அமைப்பது அல்லது நிர்வகிப்பது பற்றி கவலைப்பட வேண்டிய அவசியமில்லை.
- மென்பொருள் சேவை (SaaS): பயனர்கள் இணையத்தின் மூலம், தேவையான நேரத்தில் மற்றும் பொதுவாக சந்தா அடிப்படையில் மென்பொருள் பயன்பாடுகளுக்கு அணுகல் பெறுகிறார்கள். மென்பொருள் பயன்பாட்டை ஹோஸ்ட் செய்வது மற்றும் நிர்வகிப்பது, அடிப்படை சூழமைப்பு அல்லது பராமரிப்பு போன்றவற்றை கவலைப்பட வேண்டிய அவசியமில்லை.
பெரிய மேக சேவை வழங்குநர்கள் Amazon Web Services, Google Cloud Platform மற்றும் Microsoft Azure ஆகும்.
தரவியல் அறிவியலுக்காக மேகத்தை ஏன் தேர்ந்தெடுக்க வேண்டும்?
மேகத்துடன் வேலை செய்ய, டெவலப்பர்கள் மற்றும் IT நிபுணர்கள் பல காரணங்களுக்காக தேர்ந்தெடுக்கிறார்கள், அவற்றில் சில:
- புதுமை: மேக வழங்குநர்களால் உருவாக்கப்பட்ட புதுமையான சேவைகளை உங்கள் பயன்பாடுகளில் நேரடியாக இணைத்து உங்கள் பயன்பாடுகளை இயக்கலாம்.
- நெகிழ்வுத்தன்மை: உங்களுக்கு தேவையான சேவைகளுக்கு மட்டுமே பணம் செலுத்தலாம், மேலும் பல்வேறு சேவைகளில் இருந்து தேர்வு செய்யலாம். பொதுவாக, நீங்கள் பயன்படுத்தும் அளவுக்கு பணம் செலுத்தி உங்கள் தேவைகளுக்கு ஏற்ப சேவைகளை மாற்றலாம்.
- பட்ஜெட்: ஹார்ட்வேர்கள் மற்றும் மென்பொருட்களை வாங்க, அமைக்க மற்றும் இயக்குவதற்கான ஆரம்ப முதலீடுகளை செய்ய தேவையில்லை; நீங்கள் பயன்படுத்தும் அளவுக்கு மட்டுமே பணம் செலுத்தலாம்.
- அளவீடு: உங்கள் திட்டத்தின் தேவைகளுக்கு ஏற்ப உங்கள் வளங்கள் அளவீடு செய்யப்படலாம், இது உங்கள் பயன்பாடுகள் அதிகம் அல்லது குறைவாக கணினி சக்தி, சேமிப்பு மற்றும் பாண்ட்விட்த் பயன்படுத்த முடியும் என்பதைக் குறிக்கிறது.
- உற்பத்தி திறன்: தரவுத்தொகுப்புகளை நிர்வகிப்பது போன்ற பணிகளை மற்றொருவரால் நிர்வகிக்க அனுமதித்து, உங்கள் வணிகத்தில் கவனம் செலுத்தலாம்.
- நம்பகத்தன்மை: மேக கணினி உங்கள் தரவுகளை தொடர்ந்து காப்புப்பிரதி எடுக்கும் பல வழிகளை வழங்குகிறது, மேலும் உங்கள் வணிகம் மற்றும் சேவைகள் தொடர்ச்சியாக செயல்பட, பேரழிவுகளை மீட்டெடுக்கும் திட்டங்களை அமைக்கலாம்.
- பாதுகாப்பு: உங்கள் திட்டத்தின் பாதுகாப்பை மேம்படுத்தும் கொள்கைகள், தொழில்நுட்பங்கள் மற்றும் கட்டுப்பாடுகளைப் பெறலாம்.
மேக சேவைகளை பயன்படுத்துவதற்கான சில பொதுவான காரணங்கள் இவை. இப்போது மேகம் என்ன, அதன் முக்கிய நன்மைகள் என்ன என்பதை நன்கு புரிந்துகொண்ட பிறகு, தரவியல் அறிவியல் மற்றும் தரவுடன் வேலை செய்யும் டெவலப்பர்கள் சந்திக்கும் சவால்களை மேகம் எப்படி உதவுகிறது என்பதைப் பார்ப்போம்:
- பெரிய அளவிலான தரவுகளை சேமித்தல்: பெரிய சேவர்களை வாங்கி, நிர்வகித்து, பாதுகாக்காமல், உங்கள் தரவுகளை நேரடியாக மேகத்தில் சேமிக்கலாம், Azure Cosmos DB, Azure SQL Database மற்றும் Azure Data Lake Storage போன்ற தீர்வுகளுடன்.
- தரவு ஒருங்கிணைப்பு செய்யுதல்: தரவியல் அறிவியலின் முக்கியமான பகுதி தரவுகளை சேகரிப்பதில் இருந்து நடவடிக்கைகளை எடுப்பதற்கு மாற்றம் செய்யும் தரவு ஒருங்கிணைப்பு ஆகும். மேகத்தில் வழங்கப்படும் தரவு ஒருங்கிணைப்பு சேவைகளுடன், Data Factory மூலம் பல்வேறு மூலங்களிலிருந்து தரவுகளை சேகரித்து, மாற்றி, ஒருங்கிணைத்து ஒரு தனித்த தரவுத்தொகுப்பில் சேர்க்கலாம்.
- தரவை செயலாக்குதல்: பெரிய அளவிலான தரவுகளை செயலாக்க அதிக கணினி சக்தி தேவைப்படுகிறது, மேலும் பலருக்கு அதற்கான சக்திவாய்ந்த இயந்திரங்கள் கிடைக்காது. அதனால், பலர் நேரடியாக மேகத்தின் பெரிய கணினி சக்தியை பயன்படுத்தி தங்கள் தீர்வுகளை இயக்க மற்றும் வெளியிட தேர்ந்தெடுக்கிறார்கள்.
- தரவு பகுப்பாய்வு சேவைகளை பயன்படுத்துதல்: Azure Synapse Analytics, Azure Stream Analytics மற்றும் Azure Databricks போன்ற மேக சேவைகள் உங்கள் தரவுகளை செயல்படக்கூடிய தகவல்களாக மாற்ற உதவுகிறது.
- இயந்திர கற்றல் மற்றும் தரவுத்தொகுப்பு நுண்ணறிவு சேவைகளை பயன்படுத்துதல்: ஆரம்பத்தில் இருந்து தொடங்காமல், மேக வழங்குநரால் வழங்கப்படும் இயந்திர கற்றல் ஆல்காரிதங்களை AzureML போன்ற சேவைகளுடன் பயன்படுத்தலாம். மேலும், பேச்சை எழுத்தாக மாற்றுதல், எழுத்தை பேச்சாக மாற்றுதல், கணினி பார்வை போன்ற நுண்ணறிவு சேவைகளைப் பயன்படுத்தலாம்.
மேகத்தில் தரவியல் அறிவியல் உதாரணங்கள்
இதை மேலும் தெளிவாக புரிந்துகொள்ள சில சூழல்களைப் பார்ப்போம்.
நேரடி சமூக ஊடக உணர்வு பகுப்பாய்வு
இயந்திர கற்றலுடன் தொடங்கும் பலரால் பொதுவாக ஆய்வு செய்யப்படும் ஒரு சூழல்: நேரடி சமூக ஊடக உணர்வு பகுப்பாய்வு.
நீங்கள் ஒரு செய்தி ஊடக வலைத்தளத்தை இயக்குகிறீர்கள் என்று கூறுங்கள், மேலும் உங்கள் வாசகர்கள் ஆர்வமாக இருக்கக்கூடிய உள்ளடக்கத்தை புரிந்துகொள்ள நேரடி தரவுகளை பயன்படுத்த விரும்புகிறீர்கள். அதைப் பற்றி மேலும் அறிய, நீங்கள் Twitter வெளியீடுகளிலிருந்து தரவின் நேரடி உணர்வு பகுப்பாய்வு செய்யும் ஒரு திட்டத்தை உருவாக்கலாம்.
நீங்கள் பார்க்கும் முக்கிய குறியீடுகள் குறிப்பிட்ட தலைப்புகளில் (ஹாஷ்டேக்குகள்) ட்வீட்டுகளின் அளவு மற்றும் உணர்வு ஆகும், இது குறிப்பிட்ட தலைப்புகளைச் சுற்றியுள்ள உணர்வு பகுப்பாய்வு செய்யும் பகுப்பாய்வு கருவிகளைப் பயன்படுத்தி நிறுவப்படுகிறது.
இந்த திட்டத்தை உருவாக்க தேவையான படிகள் பின்வருமாறு:
- உள்ளீட்டை ஸ்ட்ரீம் செய்ய ஒரு நிகழ்வு மையத்தை உருவாக்குதல், இது Twitter-இல் இருந்து தரவுகளை சேகரிக்கும்.
- Twitter Streaming APIs-ஐ அழைக்கும் Twitter கிளையண்ட் பயன்பாட்டை அமைத்து தொடங்குதல்.
- ஒரு ஸ்ட்ரீம் அனலிடிக்ஸ் வேலை உருவாக்குதல்.
- வேலை உள்ளீடு மற்றும் கேள்வியை குறிப்பிடுதல்.
- வெளியீடு சிங்க் உருவாக்கி வேலை வெளியீட்டை குறிப்பிடுதல்.
- வேலை தொடங்குதல்.
முழு செயல்முறையைப் பார்க்க, ஆவணங்களை பாருங்கள்.
அறிவியல் ஆவணங்கள் பகுப்பாய்வு
இந்த பாடத்திட்டத்தின் ஆசிரியர்களில் ஒருவரான Dmitry Soshnikov உருவாக்கிய ஒரு திட்டத்தின் மற்றொரு உதாரணத்தைப் பார்ப்போம்.
Dmitry COVID ஆவணங்களை பகுப்பாய்வு செய்யும் ஒரு கருவியை உருவாக்கினார். இந்த திட்டத்தை ஆய்வு செய்வதன் மூலம், நீங்கள் அறிவியல் ஆவணங்களில் இருந்து அறிவை எடுக்கும், தகவல்களைப் பெறும் மற்றும் ஆராய்ச்சியாளர்கள் பெரிய ஆவண தொகுப்புகளை திறமையாக வழிநடத்த உதவும் ஒரு கருவியை உருவாக்குவது எப்படி என்பதைப் பார்ப்பீர்கள்.
இதற்கான பல்வேறு படிகளைப் பார்ப்போம்:
- Text Analytics for Health மூலம் தகவல்களை எடுத்து முன் செயலாக்குதல்.
- Azure ML பயன்படுத்தி செயலாக்கத்தை ஒரே நேரத்தில் செய்யுதல்.
- Cosmos DB மூலம் தகவல்களை சேமித்து கேள்வி கேட்குதல்.
- Power BI-யை பயன்படுத்தி தரவுகளை ஆராய்வதற்கும் காட்சிப்படுத்துவதற்கும் ஒரு இடைமுக டாஷ்போர்டை உருவாக்குதல்.
முழு செயல்முறையைப் பார்க்க, Dmitry-யின் வலைப்பதிவை பாருங்கள்.
மேக சேவைகளைப் பயன்படுத்தி தரவியல் அறிவியலை பல வழிகளில் செய்ய முடியும் என்பதை நீங்கள் காணலாம்.
குறிப்பு
மூலங்கள்:
- https://azure.microsoft.com/overview/what-is-cloud-computing?ocid=AID3041109
- https://docs.microsoft.com/azure/stream-analytics/stream-analytics-twitter-sentiment-analysis-trends?ocid=AID3041109
- https://soshnikov.com/science/analyzing-medical-papers-with-azure-and-text-analytics-for-health/
பாடத்திற்குப் பின் வினாடி வினா
பாடத்திற்குப் பின் வினாடி வினா
பணிக்கட்டளை
அறிவிப்பு:
இந்த ஆவணம் Co-op Translator என்ற AI மொழிபெயர்ப்பு சேவையை பயன்படுத்தி மொழிபெயர்க்கப்பட்டுள்ளது. நாங்கள் துல்லியத்திற்காக முயற்சிக்கிறோம், ஆனால் தானியங்கி மொழிபெயர்ப்புகளில் பிழைகள் அல்லது தவறுகள் இருக்கக்கூடும் என்பதை தயவுசெய்து கவனத்தில் கொள்ளவும். அதன் சொந்த மொழியில் உள்ள மூல ஆவணம் அதிகாரப்பூர்வ ஆதாரமாக கருதப்பட வேண்டும். முக்கியமான தகவல்களுக்கு, தொழில்முறை மனித மொழிபெயர்ப்பு பரிந்துரைக்கப்படுகிறது. இந்த மொழிபெயர்ப்பைப் பயன்படுத்துவதால் ஏற்படும் எந்த தவறான புரிதல்களுக்கும் அல்லது தவறான விளக்கங்களுக்கும் நாங்கள் பொறுப்பல்ல.
