You can not select more than 25 topics
Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.
113 lines
22 KiB
113 lines
22 KiB
<!--
|
|
CO_OP_TRANSLATOR_METADATA:
|
|
{
|
|
"original_hash": "5f8e7cdefa096664ae86f795be571580",
|
|
"translation_date": "2025-09-06T07:06:38+00:00",
|
|
"source_file": "5-Data-Science-In-Cloud/17-Introduction/README.md",
|
|
"language_code": "bn"
|
|
}
|
|
-->
|
|
# ক্লাউডে ডেটা সায়েন্সের পরিচিতি
|
|
|
|
| এর স্কেচনোট ](../../sketchnotes/17-DataScience-Cloud.png)|
|
|
|:---:|
|
|
| ক্লাউডে ডেটা সায়েন্স: পরিচিতি - _[@nitya](https://twitter.com/nitya) এর স্কেচনোট_ |
|
|
|
|
এই পাঠে, আপনি ক্লাউডের মৌলিক নীতিগুলি শিখবেন, তারপর আপনি দেখবেন কেন ক্লাউড পরিষেবাগুলি ব্যবহার করে আপনার ডেটা সায়েন্স প্রকল্প চালানো আপনার জন্য আকর্ষণীয় হতে পারে এবং আমরা ক্লাউডে চালিত কিছু ডেটা সায়েন্স প্রকল্পের উদাহরণ দেখব।
|
|
|
|
## [পূর্ব-পাঠ কুইজ](https://ff-quizzes.netlify.app/en/ds/quiz/32)
|
|
|
|
## ক্লাউড কী?
|
|
|
|
ক্লাউড, বা ক্লাউড কম্পিউটিং, ইন্টারনেটের মাধ্যমে একটি পরিকাঠামোতে হোস্ট করা পে-অ্যাজ-ইউ-গো কম্পিউটিং পরিষেবাগুলির বিস্তৃত পরিসরের সরবরাহ। পরিষেবাগুলির মধ্যে রয়েছে স্টোরেজ, ডেটাবেস, নেটওয়ার্কিং, সফটওয়্যার, অ্যানালিটিক্স এবং বুদ্ধিমত্তা পরিষেবার মতো সমাধান।
|
|
|
|
আমরা সাধারণত পাবলিক, প্রাইভেট এবং হাইব্রিড ক্লাউডকে নিম্নরূপে আলাদা করি:
|
|
|
|
* পাবলিক ক্লাউড: একটি পাবলিক ক্লাউড একটি তৃতীয় পক্ষের ক্লাউড পরিষেবা প্রদানকারীর মালিকানাধীন এবং পরিচালিত হয়, যা তার কম্পিউটিং সম্পদ ইন্টারনেটের মাধ্যমে জনসাধারণের কাছে সরবরাহ করে।
|
|
* প্রাইভেট ক্লাউড: প্রাইভেট ক্লাউড বলতে বোঝায় একটি একক ব্যবসা বা সংস্থার দ্বারা একচেটিয়াভাবে ব্যবহৃত ক্লাউড কম্পিউটিং সম্পদ, যেখানে পরিষেবা এবং পরিকাঠামো একটি ব্যক্তিগত নেটওয়ার্কে রক্ষণাবেক্ষণ করা হয়।
|
|
* হাইব্রিড ক্লাউড: হাইব্রিড ক্লাউড একটি সিস্টেম যা পাবলিক এবং প্রাইভেট ক্লাউডকে একত্রিত করে। ব্যবহারকারীরা একটি অন-প্রিমাইস ডেটাসেন্টার বেছে নেন, যখন ডেটা এবং অ্যাপ্লিকেশনগুলি এক বা একাধিক পাবলিক ক্লাউডে চালানোর অনুমতি দেন।
|
|
|
|
বেশিরভাগ ক্লাউড কম্পিউটিং পরিষেবা তিনটি বিভাগে পড়ে: ইনফ্রাস্ট্রাকচার অ্যাজ আ সার্ভিস (IaaS), প্ল্যাটফর্ম অ্যাজ আ সার্ভিস (PaaS) এবং সফটওয়্যার অ্যাজ আ সার্ভিস (SaaS)।
|
|
|
|
* ইনফ্রাস্ট্রাকচার অ্যাজ আ সার্ভিস (IaaS): ব্যবহারকারীরা সার্ভার এবং ভার্চুয়াল মেশিন (VMs), স্টোরেজ, নেটওয়ার্ক, অপারেটিং সিস্টেমের মতো আইটি পরিকাঠামো ভাড়া নেন।
|
|
* প্ল্যাটফর্ম অ্যাজ আ সার্ভিস (PaaS): ব্যবহারকারীরা সফটওয়্যার অ্যাপ্লিকেশনগুলি বিকাশ, পরীক্ষা, সরবরাহ এবং পরিচালনা করার জন্য একটি পরিবেশ ভাড়া নেন। ব্যবহারকারীদের বিকাশের জন্য প্রয়োজনীয় সার্ভার, স্টোরেজ, নেটওয়ার্ক এবং ডেটাবেসের অন্তর্নিহিত পরিকাঠামো সেট আপ বা পরিচালনা করার বিষয়ে চিন্তা করতে হয় না।
|
|
* সফটওয়্যার অ্যাজ আ সার্ভিস (SaaS): ব্যবহারকারীরা ইন্টারনেটের মাধ্যমে সফটওয়্যার অ্যাপ্লিকেশনগুলিতে চাহিদা অনুযায়ী এবং সাধারণত সাবস্ক্রিপশন ভিত্তিতে অ্যাক্সেস পান। ব্যবহারকারীদের সফটওয়্যার অ্যাপ্লিকেশন হোস্টিং এবং পরিচালনা, অন্তর্নিহিত পরিকাঠামো বা রক্ষণাবেক্ষণ, যেমন সফটওয়্যার আপগ্রেড এবং সিকিউরিটি প্যাচিং নিয়ে চিন্তা করতে হয় না।
|
|
|
|
ক্লাউডের বৃহত্তম প্রদানকারীদের মধ্যে রয়েছে Amazon Web Services, Google Cloud Platform এবং Microsoft Azure।
|
|
|
|
## কেন ডেটা সায়েন্সের জন্য ক্লাউড বেছে নেবেন?
|
|
|
|
ডেভেলপার এবং আইটি পেশাদাররা বিভিন্ন কারণে ক্লাউডের সাথে কাজ করতে পছন্দ করেন, যার মধ্যে রয়েছে:
|
|
|
|
* উদ্ভাবন: আপনি ক্লাউড প্রদানকারীদের দ্বারা তৈরি উদ্ভাবনী পরিষেবাগুলি সরাসরি আপনার অ্যাপ্লিকেশনে সংযুক্ত করে আপনার অ্যাপ্লিকেশনগুলিকে শক্তিশালী করতে পারেন।
|
|
* নমনীয়তা: আপনি শুধুমাত্র আপনার প্রয়োজনীয় পরিষেবাগুলির জন্য অর্থ প্রদান করেন এবং পরিষেবাগুলির একটি বিস্তৃত পরিসর থেকে বেছে নিতে পারেন। সাধারণত আপনি পে-অ্যাজ-ইউ-গো ভিত্তিতে অর্থ প্রদান করেন এবং আপনার পরিবর্তিত প্রয়োজন অনুসারে পরিষেবাগুলি মানিয়ে নিতে পারেন।
|
|
* বাজেট: হার্ডওয়্যার এবং সফটওয়্যার কেনার, অন-সাইট ডেটাসেন্টার সেট আপ এবং চালানোর জন্য প্রাথমিক বিনিয়োগ করার প্রয়োজন নেই এবং আপনি শুধুমাত্র আপনার ব্যবহারের জন্য অর্থ প্রদান করতে পারেন।
|
|
* স্কেলযোগ্যতা: আপনার প্রকল্পের প্রয়োজন অনুসারে আপনার সম্পদ স্কেল করতে পারে, যার অর্থ আপনার অ্যাপ্লিকেশনগুলি আরও বা কম কম্পিউটিং শক্তি, স্টোরেজ এবং ব্যান্ডউইথ ব্যবহার করতে পারে, যেকোনো সময় বাহ্যিক কারণগুলির সাথে মানিয়ে নিতে পারে।
|
|
* উৎপাদনশীলতা: আপনি ডেটাসেন্টার পরিচালনার মতো কাজগুলি অন্য কেউ পরিচালনা করতে পারে এমন কাজগুলিতে সময় ব্যয় না করে আপনার ব্যবসায় মনোনিবেশ করতে পারেন।
|
|
* নির্ভরযোগ্যতা: ক্লাউড কম্পিউটিং আপনার ডেটা ক্রমাগত ব্যাক আপ করার জন্য বেশ কয়েকটি উপায় অফার করে এবং আপনি আপনার ব্যবসা এবং পরিষেবাগুলি চালিয়ে যাওয়ার জন্য দুর্যোগ পুনরুদ্ধার পরিকল্পনা সেট আপ করতে পারেন, এমনকি সংকটের সময়েও।
|
|
* নিরাপত্তা: আপনি এমন নীতিমালা, প্রযুক্তি এবং নিয়ন্ত্রণের সুবিধা নিতে পারেন যা আপনার প্রকল্পের নিরাপত্তা জোরদার করে।
|
|
|
|
এগুলি ক্লাউড পরিষেবাগুলি ব্যবহার করার সবচেয়ে সাধারণ কারণগুলির মধ্যে কয়েকটি। এখন যেহেতু আমরা ক্লাউড কী এবং এর প্রধান সুবিধাগুলি সম্পর্কে আরও ভালভাবে বুঝতে পেরেছি, আসুন ডেটা বিজ্ঞানী এবং ডেটা নিয়ে কাজ করা ডেভেলপারদের কাজগুলি আরও নির্দিষ্টভাবে দেখি এবং ক্লাউড কীভাবে তাদের মুখোমুখি হওয়া বিভিন্ন চ্যালেঞ্জগুলিতে সহায়তা করতে পারে:
|
|
|
|
* বড় পরিমাণে ডেটা সংরক্ষণ: বড় সার্ভার কেনা, পরিচালনা এবং সুরক্ষিত করার পরিবর্তে, আপনি সরাসরি ক্লাউডে আপনার ডেটা সংরক্ষণ করতে পারেন, যেমন Azure Cosmos DB, Azure SQL Database এবং Azure Data Lake Storage-এর সমাধানগুলির সাথে।
|
|
* ডেটা ইন্টিগ্রেশন সম্পাদন: ডেটা ইন্টিগ্রেশন ডেটা সায়েন্সের একটি অপরিহার্য অংশ, যা আপনাকে ডেটা সংগ্রহ থেকে পদক্ষেপ নেওয়ার দিকে রূপান্তর করতে দেয়। ক্লাউডে দেওয়া ডেটা ইন্টিগ্রেশন পরিষেবাগুলির সাথে, আপনি বিভিন্ন উৎস থেকে ডেটা সংগ্রহ, রূপান্তর এবং একটি একক ডেটা ওয়্যারহাউসে সংহত করতে পারেন, Data Factory ব্যবহার করে।
|
|
* ডেটা প্রক্রিয়াকরণ: বিশাল পরিমাণে ডেটা প্রক্রিয়াকরণে প্রচুর কম্পিউটিং শক্তি প্রয়োজন, এবং প্রত্যেকের কাছে এত শক্তিশালী মেশিনের অ্যাক্সেস নেই, এজন্য অনেকেই তাদের সমাধান চালানোর এবং মোতায়েন করার জন্য সরাসরি ক্লাউডের বিশাল কম্পিউটিং শক্তি ব্যবহার করতে পছন্দ করেন।
|
|
* ডেটা অ্যানালিটিক্স পরিষেবা ব্যবহার করা: Azure Synapse Analytics, Azure Stream Analytics এবং Azure Databricks-এর মতো ক্লাউড পরিষেবাগুলি আপনার ডেটাকে কার্যকরী অন্তর্দৃষ্টিতে রূপান্তর করতে সহায়তা করে।
|
|
* মেশিন লার্নিং এবং ডেটা ইন্টেলিজেন্স পরিষেবা ব্যবহার করা: শুরু থেকে শুরু করার পরিবর্তে, আপনি ক্লাউড প্রদানকারীর দ্বারা দেওয়া মেশিন লার্নিং অ্যালগরিদম ব্যবহার করতে পারেন, যেমন AzureML পরিষেবাগুলির সাথে। আপনি স্পিচ-টু-টেক্সট, টেক্সট-টু-স্পিচ, কম্পিউটার ভিশন এবং আরও অনেক কিছু সহ কগনিটিভ পরিষেবাগুলি ব্যবহার করতে পারেন।
|
|
|
|
## ক্লাউডে ডেটা সায়েন্সের উদাহরণ
|
|
|
|
আসুন কয়েকটি পরিস্থিতি দেখে এটি আরও স্পষ্ট করি।
|
|
|
|
### রিয়েল-টাইম সোশ্যাল মিডিয়া সেন্টিমেন্ট অ্যানালাইসিস
|
|
আমরা একটি সাধারণ পরিস্থিতি দিয়ে শুরু করব যা মেশিন লার্নিং শুরু করা লোকেরা প্রায়ই অধ্যয়ন করে: রিয়েল-টাইম সোশ্যাল মিডিয়া সেন্টিমেন্ট অ্যানালাইসিস।
|
|
|
|
ধরা যাক আপনি একটি নিউজ মিডিয়া ওয়েবসাইট চালান এবং আপনি লাইভ ডেটা ব্যবহার করে বুঝতে চান যে আপনার পাঠকরা কোন বিষয়বস্তুতে আগ্রহী হতে পারেন। এটি আরও জানতে, আপনি একটি প্রোগ্রাম তৈরি করতে পারেন যা টুইটারের প্রকাশনা থেকে প্রাসঙ্গিক বিষয়গুলিতে রিয়েল-টাইম সেন্টিমেন্ট অ্যানালাইসিস সম্পাদন করে।
|
|
|
|
আপনার দেখার মূল সূচকগুলি হল নির্দিষ্ট বিষয়গুলিতে (হ্যাশট্যাগ) টুইটের পরিমাণ এবং সেন্টিমেন্ট, যা নির্দিষ্ট বিষয়গুলির চারপাশে সেন্টিমেন্ট অ্যানালাইসিস সম্পাদনকারী অ্যানালিটিক্স টুল ব্যবহার করে প্রতিষ্ঠিত হয়।
|
|
|
|
এই প্রকল্পটি তৈরি করতে প্রয়োজনীয় পদক্ষেপগুলি নিম্নরূপ:
|
|
|
|
* ইনপুট স্ট্রিমিংয়ের জন্য একটি ইভেন্ট হাব তৈরি করুন, যা টুইটার থেকে ডেটা সংগ্রহ করবে।
|
|
* একটি টুইটার ক্লায়েন্ট অ্যাপ্লিকেশন কনফিগার এবং শুরু করুন, যা টুইটার স্ট্রিমিং APIs-কে কল করবে।
|
|
* একটি স্ট্রিম অ্যানালিটিক্স জব তৈরি করুন।
|
|
* জব ইনপুট এবং কোয়েরি নির্দিষ্ট করুন।
|
|
* একটি আউটপুট সিঙ্ক তৈরি করুন এবং জব আউটপুট নির্দিষ্ট করুন।
|
|
* জব শুরু করুন।
|
|
|
|
সম্পূর্ণ প্রক্রিয়া দেখতে, [ডকুমেন্টেশন](https://docs.microsoft.com/azure/stream-analytics/stream-analytics-twitter-sentiment-analysis-trends?WT.mc_id=academic-77958-bethanycheum&ocid=AID30411099) দেখুন।
|
|
|
|
### বৈজ্ঞানিক গবেষণাপত্র বিশ্লেষণ
|
|
আসুন এই পাঠ্যক্রমের একজন লেখক [দিমিত্রি সশনিকভ](http://soshnikov.com) দ্বারা তৈরি একটি প্রকল্পের আরেকটি উদাহরণ দেখি।
|
|
|
|
দিমিত্রি একটি টুল তৈরি করেছেন যা COVID গবেষণাপত্র বিশ্লেষণ করে। এই প্রকল্পটি পর্যালোচনা করে, আপনি দেখতে পাবেন কীভাবে একটি টুল তৈরি করা যায় যা বৈজ্ঞানিক গবেষণাপত্র থেকে জ্ঞান বের করে, অন্তর্দৃষ্টি অর্জন করে এবং গবেষকদের দক্ষতার সাথে গবেষণাপত্রের বড় সংগ্রহগুলি নেভিগেট করতে সহায়তা করে।
|
|
|
|
আসুন এই প্রকল্পে ব্যবহৃত বিভিন্ন পদক্ষেপগুলি দেখি:
|
|
* [Text Analytics for Health](https://docs.microsoft.com/azure/cognitive-services/text-analytics/how-tos/text-analytics-for-health?WT.mc_id=academic-77958-bethanycheum&ocid=AID3041109) দিয়ে তথ্য বের করা এবং প্রি-প্রসেসিং।
|
|
* [Azure ML](https://azure.microsoft.com/services/machine-learning?WT.mc_id=academic-77958-bethanycheum&ocid=AID3041109) ব্যবহার করে প্রক্রিয়াকরণকে প্যারালালাইজ করা।
|
|
* [Cosmos DB](https://azure.microsoft.com/services/cosmos-db?WT.mc_id=academic-77958-bethanycheum&ocid=AID3041109) দিয়ে তথ্য সংরক্ষণ এবং কোয়েরি করা।
|
|
* Power BI ব্যবহার করে ডেটা এক্সপ্লোরেশন এবং ভিজ্যুয়ালাইজেশনের জন্য একটি ইন্টারঅ্যাকটিভ ড্যাশবোর্ড তৈরি করা।
|
|
|
|
সম্পূর্ণ প্রক্রিয়া দেখতে, [দিমিত্রির ব্লগ](https://soshnikov.com/science/analyzing-medical-papers-with-azure-and-text-analytics-for-health/) দেখুন।
|
|
|
|
যেমনটি আপনি দেখতে পাচ্ছেন, আমরা ডেটা সায়েন্স সম্পাদনের জন্য বিভিন্ন উপায়ে ক্লাউড পরিষেবাগুলি ব্যবহার করতে পারি।
|
|
|
|
## ফুটনোট
|
|
|
|
উৎস:
|
|
* https://azure.microsoft.com/overview/what-is-cloud-computing?ocid=AID3041109
|
|
* https://docs.microsoft.com/azure/stream-analytics/stream-analytics-twitter-sentiment-analysis-trends?ocid=AID3041109
|
|
* https://soshnikov.com/science/analyzing-medical-papers-with-azure-and-text-analytics-for-health/
|
|
|
|
## পোস্ট-পাঠ কুইজ
|
|
|
|
## [পোস্ট-পাঠ কুইজ](https://ff-quizzes.netlify.app/en/ds/quiz/33)
|
|
|
|
## অ্যাসাইনমেন্ট
|
|
|
|
[মার্কেট রিসার্চ](assignment.md)
|
|
|
|
---
|
|
|
|
**অস্বীকৃতি**:
|
|
এই নথিটি AI অনুবাদ পরিষেবা [Co-op Translator](https://github.com/Azure/co-op-translator) ব্যবহার করে অনুবাদ করা হয়েছে। আমরা যথাসাধ্য সঠিকতার জন্য চেষ্টা করি, তবে অনুগ্রহ করে মনে রাখবেন যে স্বয়ংক্রিয় অনুবাদে ত্রুটি বা অসঙ্গতি থাকতে পারে। মূল ভাষায় থাকা নথিটিকে প্রামাণিক উৎস হিসেবে বিবেচনা করা উচিত। গুরুত্বপূর্ণ তথ্যের জন্য, পেশাদার মানব অনুবাদ সুপারিশ করা হয়। এই অনুবাদ ব্যবহারের ফলে কোনো ভুল বোঝাবুঝি বা ভুল ব্যাখ্যা হলে আমরা দায়বদ্ধ থাকব না। |