13 KiB
مقدمة إلى علم البيانات في السحابة
![]() |
---|
علم البيانات في السحابة: مقدمة - رسم توضيحي من @nitya |
في هذه الدرس، ستتعلم المبادئ الأساسية للسحابة، ثم ستتعرف على الأسباب التي تجعل استخدام خدمات السحابة مثيرًا للاهتمام لتشغيل مشاريع علم البيانات الخاصة بك، وسنستعرض بعض الأمثلة على مشاريع علم البيانات التي يتم تشغيلها في السحابة.
اختبار ما قبل المحاضرة
ما هي السحابة؟
السحابة، أو الحوسبة السحابية، هي تقديم مجموعة واسعة من خدمات الحوسبة المدفوعة حسب الاستخدام والمستضافة على بنية تحتية عبر الإنترنت. تشمل الخدمات حلولًا مثل التخزين، قواعد البيانات، الشبكات، البرمجيات، التحليلات، والخدمات الذكية.
عادةً ما نفرق بين السحابة العامة، الخاصة، والهجينة كما يلي:
- السحابة العامة: السحابة العامة مملوكة ومدارة من قبل مزود خدمة سحابية طرف ثالث يقدم موارده الحاسوبية عبر الإنترنت للجمهور.
- السحابة الخاصة: تشير إلى موارد الحوسبة السحابية المستخدمة حصريًا من قبل شركة أو منظمة واحدة، مع خدمات وبنية تحتية يتم الحفاظ عليها على شبكة خاصة.
- السحابة الهجينة: السحابة الهجينة هي نظام يجمع بين السحابات العامة والخاصة. يختار المستخدمون مركز بيانات داخلي، مع السماح بتشغيل البيانات والتطبيقات على واحدة أو أكثر من السحابات العامة.
معظم خدمات الحوسبة السحابية تقع ضمن ثلاث فئات: البنية التحتية كخدمة (IaaS)، المنصة كخدمة (PaaS)، والبرمجيات كخدمة (SaaS).
- البنية التحتية كخدمة (IaaS): يقوم المستخدمون باستئجار بنية تحتية لتكنولوجيا المعلومات مثل الخوادم والآلات الافتراضية (VMs)، التخزين، الشبكات، أنظمة التشغيل.
- المنصة كخدمة (PaaS): يقوم المستخدمون باستئجار بيئة لتطوير، اختبار، تقديم، وإدارة تطبيقات البرمجيات. لا يحتاج المستخدمون للقلق بشأن إعداد أو إدارة البنية التحتية الأساسية للخوادم، التخزين، الشبكة، وقواعد البيانات اللازمة للتطوير.
- البرمجيات كخدمة (SaaS): يحصل المستخدمون على الوصول إلى تطبيقات البرمجيات عبر الإنترنت، عند الطلب وعادةً على أساس الاشتراك. لا يحتاج المستخدمون للقلق بشأن استضافة وإدارة تطبيق البرمجيات، البنية التحتية الأساسية أو الصيانة، مثل ترقيات البرمجيات وتصحيحات الأمان.
بعض أكبر مزودي السحابة هم Amazon Web Services، Google Cloud Platform، وMicrosoft Azure.
لماذا تختار السحابة لعلم البيانات؟
يختار المطورون ومحترفو تكنولوجيا المعلومات العمل مع السحابة لأسباب عديدة، بما في ذلك:
- الابتكار: يمكنك تعزيز تطبيقاتك من خلال دمج خدمات مبتكرة تم إنشاؤها بواسطة مزودي السحابة مباشرةً في تطبيقاتك.
- المرونة: تدفع فقط مقابل الخدمات التي تحتاجها ويمكنك الاختيار من بين مجموعة واسعة من الخدمات. عادةً ما تدفع حسب الاستخدام وتكيف خدماتك وفقًا لاحتياجاتك المتغيرة.
- الميزانية: لا تحتاج إلى القيام باستثمارات أولية لشراء الأجهزة والبرمجيات، إعداد وتشغيل مراكز البيانات الداخلية، ويمكنك فقط الدفع مقابل ما تستخدمه.
- القابلية للتوسع: يمكن أن تتكيف مواردك وفقًا لاحتياجات مشروعك، مما يعني أن تطبيقاتك يمكن أن تستخدم المزيد أو أقل من قوة الحوسبة، التخزين وعرض النطاق الترددي، من خلال التكيف مع العوامل الخارجية في أي وقت.
- الإنتاجية: يمكنك التركيز على عملك بدلاً من قضاء الوقت في مهام يمكن إدارتها من قبل شخص آخر، مثل إدارة مراكز البيانات.
- الموثوقية: تقدم الحوسبة السحابية عدة طرق لنسخ بياناتك احتياطيًا باستمرار ويمكنك إعداد خطط استرداد الكوارث للحفاظ على عملك وخدماتك حتى في أوقات الأزمات.
- الأمان: يمكنك الاستفادة من السياسات، التقنيات، والضوابط التي تعزز أمان مشروعك.
هذه بعض الأسباب الأكثر شيوعًا التي تجعل الناس يختارون استخدام خدمات السحابة. الآن بعد أن فهمنا بشكل أفضل ما هي السحابة وما هي فوائدها الرئيسية، دعونا نلقي نظرة أكثر تحديدًا على وظائف علماء البيانات والمطورين الذين يعملون مع البيانات، وكيف يمكن للسحابة مساعدتهم في مواجهة العديد من التحديات التي قد يواجهونها:
- تخزين كميات كبيرة من البيانات: بدلاً من شراء، إدارة وحماية خوادم كبيرة، يمكنك تخزين بياناتك مباشرةً في السحابة، مع حلول مثل Azure Cosmos DB، Azure SQL Database وAzure Data Lake Storage.
- تنفيذ تكامل البيانات: تكامل البيانات هو جزء أساسي من علم البيانات، يسمح لك بالانتقال من جمع البيانات إلى اتخاذ الإجراءات. مع خدمات تكامل البيانات المقدمة في السحابة، يمكنك جمع، تحويل ودمج البيانات من مصادر مختلفة في مستودع بيانات واحد، باستخدام Data Factory.
- معالجة البيانات: معالجة كميات كبيرة من البيانات تتطلب الكثير من قوة الحوسبة، وليس لدى الجميع إمكانية الوصول إلى آلات قوية بما يكفي لذلك، ولهذا السبب يختار الكثيرون الاستفادة مباشرةً من قوة الحوسبة الهائلة للسحابة لتشغيل ونشر حلولهم.
- استخدام خدمات تحليل البيانات: خدمات السحابة مثل Azure Synapse Analytics، Azure Stream Analytics وAzure Databricks تساعدك على تحويل بياناتك إلى رؤى قابلة للتنفيذ.
- استخدام خدمات التعلم الآلي والذكاء البياني: بدلاً من البدء من الصفر، يمكنك استخدام خوارزميات التعلم الآلي المقدمة من مزود السحابة، مع خدمات مثل AzureML. يمكنك أيضًا استخدام الخدمات الذكية مثل تحويل الكلام إلى نص، النص إلى كلام، الرؤية الحاسوبية والمزيد.
أمثلة على علم البيانات في السحابة
دعونا نجعل هذا أكثر واقعية من خلال النظر في بعض السيناريوهات.
تحليل المشاعر في وسائل التواصل الاجتماعي في الوقت الحقيقي
سنبدأ بسيناريو يدرسه عادةً الأشخاص الذين يبدأون مع التعلم الآلي: تحليل المشاعر في وسائل التواصل الاجتماعي في الوقت الحقيقي.
لنفترض أنك تدير موقعًا إخباريًا وترغب في الاستفادة من البيانات الحية لفهم المحتوى الذي قد يكون قراءك مهتمين به. لمعرفة المزيد عن ذلك، يمكنك بناء برنامج يقوم بتحليل المشاعر في الوقت الحقيقي لبيانات منشورات تويتر، حول المواضيع ذات الصلة بقرائك.
المؤشرات الرئيسية التي ستنظر إليها هي حجم التغريدات حول مواضيع محددة (الوسوم) والمشاعر، التي يتم تحديدها باستخدام أدوات تحليلية تقوم بتحليل المشاعر حول المواضيع المحددة.
الخطوات اللازمة لإنشاء هذا المشروع هي كما يلي:
- إنشاء مركز أحداث لجمع المدخلات، والذي سيجمع البيانات من تويتر.
- إعداد وتشغيل تطبيق عميل تويتر، والذي سيقوم باستدعاء واجهات برمجة التطبيقات لتدفق تويتر.
- إنشاء وظيفة تحليل التدفق.
- تحديد مدخل الوظيفة والاستعلام.
- إنشاء مخرج وتحديد مخرجات الوظيفة.
- تشغيل الوظيفة.
للاطلاع على العملية الكاملة، تحقق من التوثيق.
تحليل الأوراق العلمية
لنأخذ مثالًا آخر على مشروع تم إنشاؤه بواسطة ديمتري سوشنيكوف، أحد مؤلفي هذا المنهج.
قام ديمتري بإنشاء أداة تحلل أوراق COVID. من خلال مراجعة هذا المشروع، سترى كيف يمكنك إنشاء أداة تستخرج المعرفة من الأوراق العلمية، تكتسب رؤى، وتساعد الباحثين على التنقل عبر مجموعات كبيرة من الأوراق بكفاءة.
دعونا نرى الخطوات المختلفة المستخدمة لهذا:
- استخراج ومعالجة المعلومات باستخدام تحليل النصوص للصحة.
- استخدام Azure ML لتوزيع المعالجة.
- تخزين واستعلام المعلومات باستخدام Cosmos DB.
- إنشاء لوحة معلومات تفاعلية لاستكشاف البيانات وتصورها باستخدام Power BI.
لرؤية العملية الكاملة، قم بزيارة مدونة ديمتري.
كما ترى، يمكننا الاستفادة من خدمات السحابة بطرق عديدة لتنفيذ علم البيانات.
الحاشية
المصادر:
- https://azure.microsoft.com/overview/what-is-cloud-computing?ocid=AID3041109
- https://docs.microsoft.com/azure/stream-analytics/stream-analytics-twitter-sentiment-analysis-trends?ocid=AID3041109
- https://soshnikov.com/science/analyzing-medical-papers-with-azure-and-text-analytics-for-health/
اختبار ما بعد المحاضرة
المهمة
إخلاء المسؤولية:
تمت ترجمة هذا المستند باستخدام خدمة الترجمة الآلية Co-op Translator. بينما نسعى لتحقيق الدقة، يرجى العلم أن الترجمات الآلية قد تحتوي على أخطاء أو عدم دقة. يجب اعتبار المستند الأصلي بلغته الأصلية هو المصدر الموثوق. للحصول على معلومات حساسة أو هامة، يُوصى بالاستعانة بترجمة بشرية احترافية. نحن غير مسؤولين عن أي سوء فهم أو تفسيرات خاطئة تنشأ عن استخدام هذه الترجمة.