# مقدمة إلى علم البيانات في السحابة |![رسم توضيحي من [(@sketchthedocs)](https://sketchthedocs.dev)](../../sketchnotes/17-DataScience-Cloud.png)| |:---:| | علم البيانات في السحابة: مقدمة - _رسم توضيحي من [@nitya](https://twitter.com/nitya)_ | في هذا الدرس، ستتعلم المبادئ الأساسية للسحابة، ثم ستتعرف على الأسباب التي تجعل استخدام خدمات السحابة مثيرًا للاهتمام لإدارة مشاريع علم البيانات الخاصة بك، وسنلقي نظرة على بعض الأمثلة لمشاريع علم البيانات التي تُدار في السحابة. ## [اختبار ما قبل المحاضرة](https://ff-quizzes.netlify.app/en/ds/quiz/32) ## ما هي السحابة؟ السحابة، أو الحوسبة السحابية، هي تقديم مجموعة واسعة من خدمات الحوسبة بنظام الدفع حسب الاستخدام، والتي تستضيفها بنية تحتية عبر الإنترنت. تشمل الخدمات حلولًا مثل التخزين، قواعد البيانات، الشبكات، البرمجيات، التحليلات، والخدمات الذكية. عادةً ما نميز بين السحابة العامة، السحابة الخاصة، والسحابة الهجينة على النحو التالي: * السحابة العامة: السحابة العامة مملوكة ومدارة من قبل مزود خدمة سحابية تابع لطرف ثالث، والذي يقدم موارده الحاسوبية عبر الإنترنت للجمهور. * السحابة الخاصة: تشير إلى موارد الحوسبة السحابية التي تُستخدم حصريًا من قبل شركة أو منظمة واحدة، مع خدمات وبنية تحتية تُدار على شبكة خاصة. * السحابة الهجينة: السحابة الهجينة هي نظام يجمع بين السحابات العامة والخاصة. يختار المستخدمون مركز بيانات داخليًا، مع السماح بتشغيل البيانات والتطبيقات على سحابة عامة واحدة أو أكثر. معظم خدمات الحوسبة السحابية تندرج تحت ثلاث فئات: البنية التحتية كخدمة (IaaS)، المنصة كخدمة (PaaS)، والبرمجيات كخدمة (SaaS). * البنية التحتية كخدمة (IaaS): يستأجر المستخدمون بنية تحتية لتكنولوجيا المعلومات مثل الخوادم والآلات الافتراضية (VMs)، التخزين، الشبكات، وأنظمة التشغيل. * المنصة كخدمة (PaaS): يستأجر المستخدمون بيئة لتطوير، اختبار، تسليم، وإدارة تطبيقات البرمجيات. لا يحتاج المستخدمون للقلق بشأن إعداد أو إدارة البنية التحتية الأساسية للخوادم، التخزين، الشبكات، وقواعد البيانات اللازمة للتطوير. * البرمجيات كخدمة (SaaS): يحصل المستخدمون على الوصول إلى تطبيقات البرمجيات عبر الإنترنت، عند الطلب وعادةً على أساس الاشتراك. لا يحتاج المستخدمون للقلق بشأن استضافة وإدارة تطبيق البرمجيات، البنية التحتية الأساسية أو الصيانة، مثل ترقيات البرمجيات وتصحيحات الأمان. بعض أكبر مزودي السحابة هم Amazon Web Services، Google Cloud Platform، وMicrosoft Azure. ## لماذا نختار السحابة لعلم البيانات؟ يختار المطورون والمحترفون في مجال تكنولوجيا المعلومات العمل مع السحابة لأسباب عديدة، بما في ذلك: * الابتكار: يمكنك تعزيز تطبيقاتك من خلال دمج خدمات مبتكرة تقدمها مزودو السحابة مباشرة في تطبيقاتك. * المرونة: تدفع فقط مقابل الخدمات التي تحتاجها ويمكنك الاختيار من بين مجموعة واسعة من الخدمات. عادةً ما تدفع حسب الاستخدام وتتكيف مع احتياجاتك المتغيرة. * الميزانية: لا تحتاج إلى استثمارات أولية لشراء الأجهزة والبرمجيات، إعداد وتشغيل مراكز البيانات الداخلية، ويمكنك فقط دفع ما تستخدمه. * القابلية للتوسع: يمكن لمواردك التوسع وفقًا لاحتياجات مشروعك، مما يعني أن تطبيقاتك يمكنها استخدام المزيد أو أقل من قوة الحوسبة، التخزين وعرض النطاق الترددي، من خلال التكيف مع العوامل الخارجية في أي وقت. * الإنتاجية: يمكنك التركيز على عملك بدلاً من قضاء الوقت في مهام يمكن إدارتها من قبل شخص آخر، مثل إدارة مراكز البيانات. * الموثوقية: تقدم الحوسبة السحابية عدة طرق لنسخ بياناتك احتياطيًا بشكل مستمر، ويمكنك إعداد خطط لاستعادة البيانات في حالات الكوارث للحفاظ على استمرارية عملك وخدماتك حتى في أوقات الأزمات. * الأمان: يمكنك الاستفادة من السياسات، التقنيات، والضوابط التي تعزز أمان مشروعك. هذه بعض الأسباب الأكثر شيوعًا التي تجعل الناس يختارون استخدام خدمات السحابة. الآن بعد أن أصبح لدينا فهم أفضل لماهية السحابة وما هي فوائدها الرئيسية، دعونا نلقي نظرة أكثر تحديدًا على وظائف علماء البيانات والمطورين الذين يعملون مع البيانات، وكيف يمكن للسحابة مساعدتهم في مواجهة التحديات المختلفة التي قد يواجهونها: * تخزين كميات كبيرة من البيانات: بدلاً من شراء، إدارة وحماية خوادم كبيرة، يمكنك تخزين بياناتك مباشرة في السحابة، باستخدام حلول مثل Azure Cosmos DB، Azure SQL Database وAzure Data Lake Storage. * تنفيذ تكامل البيانات: تكامل البيانات هو جزء أساسي من علم البيانات، يسمح لك بالانتقال من جمع البيانات إلى اتخاذ الإجراءات. مع خدمات تكامل البيانات المقدمة في السحابة، يمكنك جمع، تحويل ودمج البيانات من مصادر مختلفة في مستودع بيانات واحد باستخدام Data Factory. * معالجة البيانات: تتطلب معالجة كميات هائلة من البيانات الكثير من قوة الحوسبة، وليس لدى الجميع إمكانية الوصول إلى أجهزة قوية بما يكفي لذلك، ولهذا السبب يختار الكثيرون الاستفادة مباشرة من قوة الحوسبة الهائلة للسحابة لتشغيل ونشر حلولهم. * استخدام خدمات تحليل البيانات: خدمات السحابة مثل Azure Synapse Analytics، Azure Stream Analytics وAzure Databricks تساعدك على تحويل بياناتك إلى رؤى قابلة للتنفيذ. * استخدام خدمات التعلم الآلي والذكاء الاصطناعي: بدلاً من البدء من الصفر، يمكنك استخدام خوارزميات التعلم الآلي التي يقدمها مزود السحابة، مع خدمات مثل AzureML. يمكنك أيضًا استخدام الخدمات الذكية مثل تحويل النص إلى كلام، تحويل الكلام إلى نص، الرؤية الحاسوبية والمزيد. ## أمثلة على علم البيانات في السحابة دعونا نجعل هذا أكثر وضوحًا من خلال النظر في بعض السيناريوهات. ### تحليل المشاعر في وسائل التواصل الاجتماعي في الوقت الفعلي سنبدأ بسيناريو شائع يتم دراسته من قبل الأشخاص الذين يبدأون مع التعلم الآلي: تحليل المشاعر في وسائل التواصل الاجتماعي في الوقت الفعلي. لنفترض أنك تدير موقعًا إخباريًا وترغب في الاستفادة من البيانات الحية لفهم المحتوى الذي قد يهتم به قراؤك. لمعرفة المزيد عن ذلك، يمكنك بناء برنامج يقوم بتحليل المشاعر في الوقت الفعلي للبيانات من منشورات تويتر حول المواضيع ذات الصلة بقرائك. المؤشرات الرئيسية التي ستنظر إليها هي حجم التغريدات حول مواضيع محددة (الهاشتاغات) والمشاعر، التي يتم تحديدها باستخدام أدوات التحليل التي تقوم بتحليل المشاعر حول المواضيع المحددة. الخطوات اللازمة لإنشاء هذا المشروع هي كما يلي: * إنشاء مركز أحداث لجمع البيانات من تويتر * إعداد وتشغيل تطبيق عميل تويتر، الذي سيستدعي واجهات برمجة التطبيقات لتدفق تويتر * إنشاء وظيفة تحليل تدفق البيانات * تحديد مدخلات الوظيفة والاستعلام * إنشاء مخرج وتحديد مخرجات الوظيفة * تشغيل الوظيفة للاطلاع على العملية الكاملة، تحقق من [التوثيق](https://docs.microsoft.com/azure/stream-analytics/stream-analytics-twitter-sentiment-analysis-trends?WT.mc_id=academic-77958-bethanycheum&ocid=AID30411099). ### تحليل الأوراق العلمية لنأخذ مثالًا آخر لمشروع أنشأه [ديمتري سوشنيكوف](http://soshnikov.com)، أحد مؤلفي هذا المنهج. أنشأ ديمتري أداة لتحليل الأوراق العلمية المتعلقة بـ COVID. من خلال مراجعة هذا المشروع، ستتعلم كيفية إنشاء أداة تستخرج المعرفة من الأوراق العلمية، وتكتسب رؤى، وتساعد الباحثين على التنقل عبر مجموعات كبيرة من الأوراق بكفاءة. دعونا نرى الخطوات المختلفة المستخدمة لهذا: * استخراج ومعالجة المعلومات باستخدام [تحليل النصوص للصحة](https://docs.microsoft.com/azure/cognitive-services/text-analytics/how-tos/text-analytics-for-health?WT.mc_id=academic-77958-bethanycheum&ocid=AID3041109) * استخدام [Azure ML](https://azure.microsoft.com/services/machine-learning?WT.mc_id=academic-77958-bethanycheum&ocid=AID3041109) لتوزيع المعالجة * تخزين واستعلام المعلومات باستخدام [Cosmos DB](https://azure.microsoft.com/services/cosmos-db?WT.mc_id=academic-77958-bethanycheum&ocid=AID3041109) * إنشاء لوحة تحكم تفاعلية لاستكشاف البيانات وتصويرها باستخدام Power BI لرؤية العملية الكاملة، قم بزيارة [مدونة ديمتري](https://soshnikov.com/science/analyzing-medical-papers-with-azure-and-text-analytics-for-health/). كما ترى، يمكننا الاستفادة من خدمات السحابة بطرق عديدة لتنفيذ علم البيانات. ## الحاشية المصادر: * https://azure.microsoft.com/overview/what-is-cloud-computing?ocid=AID3041109 * https://docs.microsoft.com/azure/stream-analytics/stream-analytics-twitter-sentiment-analysis-trends?ocid=AID3041109 * https://soshnikov.com/science/analyzing-medical-papers-with-azure-and-text-analytics-for-health/ ## اختبار ما بعد المحاضرة ## [اختبار ما بعد المحاضرة](https://ff-quizzes.netlify.app/en/ds/quiz/33) ## الواجب [أبحاث السوق](assignment.md) --- **إخلاء المسؤولية**: تمت ترجمة هذا المستند باستخدام خدمة الترجمة الآلية [Co-op Translator](https://github.com/Azure/co-op-translator). بينما نسعى لتحقيق الدقة، يرجى العلم أن الترجمات الآلية قد تحتوي على أخطاء أو معلومات غير دقيقة. يجب اعتبار المستند الأصلي بلغته الأصلية هو المصدر الموثوق. للحصول على معلومات حساسة أو هامة، يُوصى بالاستعانة بترجمة بشرية احترافية. نحن غير مسؤولين عن أي سوء فهم أو تفسيرات خاطئة تنشأ عن استخدام هذه الترجمة.