24 KiB
علم البيانات في العالم الحقيقي
![]() |
---|
علم البيانات في العالم الحقيقي - رسم توضيحي من @nitya |
نحن على وشك إنهاء هذه الرحلة التعليمية!
بدأنا بتعريفات علم البيانات والأخلاقيات، واستكشفنا أدوات وتقنيات مختلفة لتحليل البيانات وتصويرها، وراجعنا دورة حياة علم البيانات، واطلعنا على كيفية توسيع وأتمتة سير العمل في علم البيانات باستخدام خدمات الحوسبة السحابية. لذا، ربما تتساءل: "كيف يمكنني تطبيق كل هذه المعارف في سياقات العالم الحقيقي؟"
في هذا الدرس، سنستكشف تطبيقات علم البيانات في الصناعة ونغوص في أمثلة محددة في مجالات البحث، العلوم الإنسانية الرقمية، والاستدامة. سنلقي نظرة على فرص مشاريع الطلاب ونختتم بموارد مفيدة لمساعدتك على مواصلة رحلتك التعليمية!
اختبار ما قبل المحاضرة
اختبار ما قبل المحاضرة
علم البيانات + الصناعة
بفضل ديمقراطية الذكاء الاصطناعي، أصبح من السهل على المطورين تصميم ودمج اتخاذ القرارات المدعوم بالذكاء الاصطناعي والرؤى المستندة إلى البيانات في تجارب المستخدم وسير العمل التطويري. إليك بعض الأمثلة على كيفية تطبيق علم البيانات في العالم الحقيقي عبر الصناعة:
-
Google Flu Trends استخدم علم البيانات لربط مصطلحات البحث باتجاهات الإنفلونزا. على الرغم من وجود عيوب في النهج، إلا أنه أثار الوعي بالإمكانات (والتحديات) للتنبؤات الصحية المستندة إلى البيانات.
-
توقعات مسارات UPS - يوضح كيف تستخدم UPS علم البيانات والتعلم الآلي للتنبؤ بالمسارات المثلى للتوصيل، مع الأخذ في الاعتبار ظروف الطقس، أنماط المرور، المواعيد النهائية للتسليم والمزيد.
-
تصوير مسارات سيارات الأجرة في نيويورك - البيانات التي تم جمعها باستخدام قوانين حرية المعلومات ساعدت في تصور يوم في حياة سيارات الأجرة في نيويورك، مما يساعدنا على فهم كيفية تنقلها في المدينة المزدحمة، الأموال التي تحققها، ومدة الرحلات على مدار 24 ساعة.
-
منصة علم البيانات في أوبر - تستخدم البيانات (مثل مواقع الالتقاط والتوصيل، مدة الرحلة، المسارات المفضلة، إلخ) التي يتم جمعها من ملايين الرحلات اليومية لبناء أداة تحليل بيانات تساعد في التسعير، السلامة، اكتشاف الاحتيال واتخاذ قرارات التنقل.
-
تحليلات الرياضة - تركز على التحليلات التنبؤية (تحليل الفرق واللاعبين - مثل Moneyball - وإدارة الجماهير) و_تصوير البيانات_ (لوحات التحكم للفرق والجماهير، الألعاب، إلخ) مع تطبيقات مثل اكتشاف المواهب، المراهنات الرياضية وإدارة المخزون/الملاعب.
-
علم البيانات في البنوك - يبرز قيمة علم البيانات في صناعة التمويل مع تطبيقات تتراوح من نمذجة المخاطر واكتشاف الاحتيال، إلى تقسيم العملاء، التنبؤ في الوقت الحقيقي وأنظمة التوصية. التحليلات التنبؤية تدفع أيضًا تدابير حاسمة مثل درجات الائتمان.
-
علم البيانات في الرعاية الصحية - يبرز تطبيقات مثل التصوير الطبي (مثل التصوير بالرنين المغناطيسي، الأشعة السينية، التصوير المقطعي)، الجينوميات (تسلسل الحمض النووي)، تطوير الأدوية (تقييم المخاطر، التنبؤ بالنجاح)، التحليلات التنبؤية (رعاية المرضى ولوجستيات الإمداد)، تتبع الأمراض والوقاية منها، إلخ.
مصدر الصورة: Data Flair: 6 Amazing Data Science Applications
تُظهر الصورة مجالات وأمثلة أخرى لتطبيق تقنيات علم البيانات. هل تريد استكشاف تطبيقات أخرى؟ تحقق من قسم المراجعة والدراسة الذاتية أدناه.
علم البيانات + البحث
![]() |
---|
علم البيانات والبحث - رسم توضيحي من @nitya |
بينما تركز التطبيقات الواقعية غالبًا على حالات الاستخدام الصناعي على نطاق واسع، يمكن أن تكون تطبيقات ومشاريع البحث مفيدة من منظورين:
- فرص الابتكار - استكشاف النماذج الأولية السريعة للمفاهيم المتقدمة واختبار تجارب المستخدم للتطبيقات المستقبلية.
- تحديات النشر - التحقيق في الأضرار المحتملة أو العواقب غير المقصودة لتقنيات علم البيانات في السياقات الواقعية.
بالنسبة للطلاب، يمكن أن توفر هذه المشاريع البحثية فرصًا للتعلم والتعاون تعزز فهمك للموضوع، وتوسع وعيك وتفاعلك مع الأشخاص أو الفرق ذات الصلة التي تعمل في مجالات اهتمامك. فما هي المشاريع البحثية وكيف يمكن أن تحدث تأثيرًا؟
دعونا نلقي نظرة على مثال واحد - دراسة Gender Shades من MIT التي أجرتها جوي بولامويني (مختبرات MIT Media) مع ورقة بحثية مميزة شاركت في تأليفها مع تيمنيت جيبرو (حينها في Microsoft Research) والتي ركزت على:
- ما الهدف: كان الهدف من المشروع البحثي هو تقييم التحيز الموجود في خوارزميات وتحليلات الوجه الآلية بناءً على النوع ولون البشرة.
- لماذا: تُستخدم تحليلات الوجه في مجالات مثل إنفاذ القانون، أمن المطارات، أنظمة التوظيف والمزيد - وهي سياقات يمكن أن تسبب فيها التصنيفات غير الدقيقة (مثلًا بسبب التحيز) أضرارًا اقتصادية واجتماعية محتملة للأفراد أو المجموعات المتأثرة. فهم (والتخلص أو التخفيف من) التحيزات هو المفتاح لتحقيق العدالة في الاستخدام.
- كيف: أدرك الباحثون أن المعايير الحالية استخدمت في الغالب موضوعات ذات بشرة فاتحة، وقاموا بتجميع مجموعة بيانات جديدة (1000+ صورة) كانت أكثر توازنًا من حيث النوع ولون البشرة. تم استخدام مجموعة البيانات لتقييم دقة ثلاثة منتجات لتصنيف النوع (من Microsoft، IBM وFace++).
أظهرت النتائج أنه على الرغم من أن دقة التصنيف الإجمالية كانت جيدة، إلا أن هناك فرقًا ملحوظًا في معدلات الخطأ بين المجموعات الفرعية المختلفة - حيث كان الخطأ في تحديد النوع أعلى للإناث أو الأشخاص ذوي البشرة الداكنة، مما يشير إلى وجود تحيز.
النتائج الرئيسية: أثارت الدراسة الوعي بأن علم البيانات يحتاج إلى مجموعات بيانات تمثيلية أكثر (مجموعات فرعية متوازنة) وفرق أكثر شمولية (خلفيات متنوعة) للتعرف على مثل هذه التحيزات والقضاء عليها أو التخفيف منها في وقت مبكر في حلول الذكاء الاصطناعي. كما أن الجهود البحثية مثل هذه تلعب دورًا أساسيًا في تعريف العديد من المؤسسات بالمبادئ والممارسات الخاصة بـ الذكاء الاصطناعي المسؤول لتحسين العدالة عبر منتجاتها وعملياتها.
هل تريد معرفة المزيد عن الجهود البحثية ذات الصلة في Microsoft؟
- تحقق من مشاريع Microsoft Research في مجال الذكاء الاصطناعي.
- استكشف مشاريع الطلاب من مدرسة Microsoft Research Data Science الصيفية.
- تحقق من مشروع Fairlearn ومبادرات الذكاء الاصطناعي المسؤول.
علم البيانات + العلوم الإنسانية
![]() |
---|
علم البيانات والعلوم الإنسانية الرقمية - رسم توضيحي من @nitya |
تم تعريف العلوم الإنسانية الرقمية على أنها "مجموعة من الممارسات والأساليب التي تجمع بين الطرق الحاسوبية والاستفسارات الإنسانية". مشاريع Stanford مثل "إعادة تشغيل التاريخ" و_"التفكير الشعري"_ توضح العلاقة بين العلوم الإنسانية الرقمية وعلم البيانات - مع التركيز على تقنيات مثل تحليل الشبكات، تصور المعلومات، التحليل المكاني والنصي التي يمكن أن تساعدنا في إعادة النظر في مجموعات البيانات التاريخية والأدبية لاستخلاص رؤى ومنظورات جديدة.
هل تريد استكشاف وتوسيع مشروع في هذا المجال؟
تحقق من "إميلي ديكنسون ومقياس المزاج" - مثال رائع من جين لوبر يسأل كيف يمكننا استخدام علم البيانات لإعادة النظر في الشعر المألوف وإعادة تقييم معناه ومساهمات مؤلفه في سياقات جديدة. على سبيل المثال، هل يمكننا التنبؤ بالموسم الذي كتب فيه القصيدة من خلال تحليل نغمتها أو مشاعرها - وماذا يخبرنا هذا عن الحالة النفسية للمؤلف خلال الفترة ذات الصلة؟
للإجابة على هذا السؤال، نتبع خطوات دورة حياة علم البيانات:
اكتساب البيانات
- لجمع مجموعة بيانات ذات صلة للتحليل. الخيارات تشمل استخدام واجهة برمجة التطبيقات (مثل Poetry DB API) أو استخراج صفحات الويب (مثل Project Gutenberg) باستخدام أدوات مثل Scrapy.تنظيف البيانات
- يوضح كيفية تنسيق النصوص وتنقيتها وتبسيطها باستخدام أدوات أساسية مثل Visual Studio Code وMicrosoft Excel.تحليل البيانات
- يوضح كيفية استيراد مجموعة البيانات إلى "دفاتر الملاحظات" لتحليلها باستخدام حزم Python (مثل pandas، numpy وmatplotlib) لتنظيم البيانات وتصويرها.تحليل المشاعر
- يوضح كيفية دمج الخدمات السحابية مثل Text Analytics، باستخدام أدوات منخفضة الكود مثل Power Automate لأتمتة سير العمل لمعالجة البيانات.
باستخدام هذا النهج، يمكننا استكشاف التأثيرات الموسمية على مشاعر القصائد، ومساعدتنا في تشكيل وجهات نظرنا الخاصة حول المؤلف. جربها بنفسك - ثم قم بتوسيع دفتر الملاحظات لطرح أسئلة أخرى أو تصور البيانات بطرق جديدة!
يمكنك استخدام بعض الأدوات الموجودة في مجموعة أدوات العلوم الإنسانية الرقمية لمتابعة هذه الاستفسارات.
علم البيانات + الاستدامة
![]() |
---|
علم البيانات والاستدامة - رسم توضيحي من @nitya |
أجندة 2030 للتنمية المستدامة - التي اعتمدها جميع أعضاء الأمم المتحدة في 2015 - تحدد 17 هدفًا بما في ذلك الأهداف التي تركز على حماية الكوكب من التدهور وتأثير تغير المناخ. تدعم مبادرة Microsoft Sustainability هذه الأهداف من خلال استكشاف الطرق التي يمكن أن تدعم بها الحلول التكنولوجية بناء مستقبل أكثر استدامة مع التركيز على 4 أهداف - أن تكون سلبية الكربون، إيجابية المياه، صفر نفايات، ومتنوعة بيولوجيًا بحلول عام 2030.
معالجة هذه التحديات بطريقة قابلة للتوسع وفي الوقت المناسب تتطلب تفكيرًا على مستوى السحابة - وبيانات ضخمة. توفر مبادرة Planetary Computer 4 مكونات لمساعدة علماء البيانات والمطورين في هذا الجهد:
-
كتالوج البيانات - يحتوي على بيتابايت من بيانات أنظمة الأرض (مجانية ومستضافة على Azure).
-
واجهة برمجة التطبيقات الكوكبية - لمساعدة المستخدمين على البحث عن البيانات ذات الصلة عبر الزمان والمكان.
-
المحور - بيئة مُدارة للعلماء لمعالجة مجموعات البيانات الجغرافية الضخمة.
-
التطبيقات - تعرض حالات الاستخدام والأدوات للحصول على رؤى حول الاستدامة. مشروع الكمبيوتر الكوكبي حاليًا في مرحلة المعاينة (اعتبارًا من سبتمبر 2021) - إليك كيفية البدء بالمساهمة في حلول الاستدامة باستخدام علم البيانات.
-
طلب الوصول لبدء الاستكشاف والتواصل مع الزملاء.
-
استكشاف الوثائق لفهم مجموعات البيانات وواجهات البرمجة المدعومة.
-
استكشاف تطبيقات مثل مراقبة النظم البيئية للحصول على الإلهام لأفكار التطبيقات.
فكر في كيفية استخدام تصور البيانات للكشف عن أو تعزيز رؤى ذات صلة في مجالات مثل تغير المناخ وإزالة الغابات. أو فكر في كيفية استخدام هذه الرؤى لإنشاء تجارب مستخدم جديدة تحفز تغييرات سلوكية نحو حياة أكثر استدامة.
علم البيانات + الطلاب
لقد تحدثنا عن التطبيقات الواقعية في الصناعة والبحث، واستكشفنا أمثلة لتطبيقات علم البيانات في العلوم الإنسانية الرقمية والاستدامة. إذن كيف يمكنك بناء مهاراتك ومشاركة خبراتك كمبتدئين في علم البيانات؟
إليك بعض الأمثلة لمشاريع الطلاب في علم البيانات لإلهامك.
- مدرسة الصيف لعلم البيانات MSR مع مشاريع على GitHub تستكشف مواضيع مثل:
- رقمنة الثقافة المادية: استكشاف التوزيعات الاجتماعية والاقتصادية في سيركاب - من أورنيلا ألتونيان وفريقها في كليرمونت، باستخدام ArcGIS StoryMaps.
🚀 التحدي
ابحث عن مقالات توصي بمشاريع علم البيانات المناسبة للمبتدئين - مثل هذه 50 فكرة موضوعية أو هذه 21 فكرة مشروع أو هذه 16 مشروعًا مع كود المصدر التي يمكنك تفكيكها وإعادة مزجها. ولا تنسَ التدوين عن رحلاتك التعليمية ومشاركة رؤاك معنا جميعًا.
اختبار ما بعد المحاضرة
اختبار ما بعد المحاضرة
المراجعة والدراسة الذاتية
هل تريد استكشاف المزيد من حالات الاستخدام؟ إليك بعض المقالات ذات الصلة:
- 17 تطبيقًا وأمثلة لعلم البيانات - يوليو 2021
- 11 تطبيقًا مذهلًا لعلم البيانات في العالم الواقعي - مايو 2021
- علم البيانات في العالم الواقعي - مجموعة مقالات
- 12 تطبيقًا واقعيًا لعلم البيانات مع أمثلة - مايو 2024
- علم البيانات في: التعليم، الزراعة، التمويل، الأفلام، الرعاية الصحية والمزيد.
الواجب
استكشاف مجموعة بيانات الكمبيوتر الكوكبي
إخلاء المسؤولية:
تم ترجمة هذا المستند باستخدام خدمة الترجمة بالذكاء الاصطناعي Co-op Translator. بينما نسعى لتحقيق الدقة، يرجى العلم أن الترجمات الآلية قد تحتوي على أخطاء أو معلومات غير دقيقة. يجب اعتبار المستند الأصلي بلغته الأصلية المصدر الرسمي. للحصول على معلومات حاسمة، يُوصى بالاستعانة بترجمة بشرية احترافية. نحن غير مسؤولين عن أي سوء فهم أو تفسيرات خاطئة تنشأ عن استخدام هذه الترجمة.