|
|
5 months ago | |
|---|---|---|
| .. | ||
| README.md | 5 months ago | |
| assignment.md | 5 months ago | |
README.md
علم البيانات في العالم الحقيقي
![]() |
|---|
| علم البيانات في العالم الحقيقي - رسم توضيحي بواسطة @nitya |
نحن على وشك إنهاء هذه الرحلة التعليمية!
بدأنا بتعريف علم البيانات والأخلاقيات، واستكشفنا أدوات وتقنيات مختلفة لتحليل البيانات وتصويرها، وراجعنا دورة حياة علم البيانات، وتعرفنا على كيفية توسيع وأتمتة سير العمل في علم البيانات باستخدام خدمات الحوسبة السحابية. لذا، ربما تتساءل: "كيف يمكنني تطبيق كل هذه المعرفة في سياقات العالم الحقيقي؟"
في هذه الدرس، سنستكشف تطبيقات علم البيانات في الصناعة ونغوص في أمثلة محددة في مجالات البحث، العلوم الإنسانية الرقمية، والاستدامة. سننظر في فرص مشاريع الطلاب ونختتم بموارد مفيدة لمساعدتك على مواصلة رحلتك التعليمية!
اختبار ما قبل المحاضرة
اختبار ما قبل المحاضرة
علم البيانات + الصناعة
بفضل ديمقراطية الذكاء الاصطناعي، أصبح من السهل على المطورين تصميم ودمج اتخاذ القرارات المدعومة بالذكاء الاصطناعي والرؤى المستندة إلى البيانات في تجارب المستخدم وسير العمل التطويري. إليك بعض الأمثلة على كيفية تطبيق علم البيانات في العالم الحقيقي عبر الصناعة:
-
Google Flu Trends استخدم علم البيانات لربط مصطلحات البحث باتجاهات الإنفلونزا. على الرغم من وجود عيوب في النهج، إلا أنه أثار الوعي بالإمكانيات (والتحديات) للتنبؤات الصحية المستندة إلى البيانات.
-
تنبؤات مسارات UPS - يشرح كيف تستخدم UPS علم البيانات والتعلم الآلي للتنبؤ بالمسارات المثلى للتسليم، مع الأخذ في الاعتبار ظروف الطقس، أنماط المرور، المواعيد النهائية للتسليم والمزيد.
-
تصوير مسارات سيارات الأجرة في نيويورك - البيانات التي تم جمعها باستخدام قوانين حرية المعلومات ساعدت في تصوير يوم في حياة سيارات الأجرة في نيويورك، مما يساعدنا على فهم كيفية تنقلها في المدينة المزدحمة، الأموال التي تجنيها، ومدة الرحلات خلال كل فترة 24 ساعة.
-
منصة علم البيانات في Uber - تستخدم البيانات (مثل مواقع الالتقاط والتوصيل، مدة الرحلة، المسارات المفضلة، إلخ) التي يتم جمعها من ملايين الرحلات اليومية لبناء أداة تحليل بيانات تساعد في التسعير، السلامة، اكتشاف الاحتيال واتخاذ قرارات التنقل.
-
تحليلات الرياضة - تركز على التحليلات التنبؤية (تحليل الفرق واللاعبين - مثل Moneyball - وإدارة المشجعين) و_تصوير البيانات_ (لوحات الفرق والمشجعين، الألعاب، إلخ) مع تطبيقات مثل اكتشاف المواهب، المراهنات الرياضية وإدارة المخزون/المكان.
-
علم البيانات في البنوك - يبرز قيمة علم البيانات في صناعة التمويل مع تطبيقات تتراوح من نمذجة المخاطر واكتشاف الاحتيال، إلى تقسيم العملاء، التنبؤ في الوقت الحقيقي وأنظمة التوصية. التحليلات التنبؤية تدفع أيضًا تدابير حاسمة مثل درجات الائتمان.
-
علم البيانات في الرعاية الصحية - يبرز تطبيقات مثل التصوير الطبي (مثل MRI، الأشعة السينية، التصوير المقطعي)، الجينوميات (تسلسل الحمض النووي)، تطوير الأدوية (تقييم المخاطر، التنبؤ بالنجاح)، التحليلات التنبؤية (رعاية المرضى ولوجستيات الإمداد)، تتبع الأمراض والوقاية منها، إلخ.
حقوق الصورة: Data Flair: 6 Amazing Data Science Applications
تُظهر الصورة مجالات أخرى وأمثلة لتطبيق تقنيات علم البيانات. هل تريد استكشاف تطبيقات أخرى؟ تحقق من قسم المراجعة والدراسة الذاتية أدناه.
علم البيانات + البحث
![]() |
|---|
| علم البيانات والبحث - رسم توضيحي بواسطة @nitya |
بينما تركز التطبيقات الواقعية غالبًا على حالات الاستخدام الصناعي على نطاق واسع، يمكن أن تكون تطبيقات ومشاريع البحث مفيدة من منظورين:
- فرص الابتكار - استكشاف النماذج الأولية السريعة للمفاهيم المتقدمة واختبار تجارب المستخدم للتطبيقات المستقبلية.
- تحديات النشر - التحقيق في الأضرار المحتملة أو العواقب غير المقصودة لتقنيات علم البيانات في سياقات العالم الحقيقي.
بالنسبة للطلاب، يمكن أن توفر هذه المشاريع البحثية فرصًا للتعلم والتعاون التي تحسن فهمك للموضوع، وتوسع وعيك وتفاعلك مع الأشخاص أو الفرق ذات الصلة التي تعمل في مجالات الاهتمام. فما هي شكل المشاريع البحثية وكيف يمكن أن تحدث تأثيرًا؟
لننظر إلى مثال واحد - دراسة MIT Gender Shades من Joy Buolamwini (MIT Media Labs) مع ورقة بحثية مميزة شاركت في تأليفها مع Timnit Gebru (حينها في Microsoft Research) التي ركزت على:
- ما الهدف: كان الهدف من المشروع البحثي هو تقييم التحيز الموجود في خوارزميات تحليل الوجه الآلية ومجموعات البيانات بناءً على النوع ولون البشرة.
- لماذا: يتم استخدام تحليل الوجه في مجالات مثل إنفاذ القانون، أمن المطارات، أنظمة التوظيف والمزيد - سياقات حيث يمكن أن تؤدي التصنيفات غير الدقيقة (مثل التحيز) إلى أضرار اقتصادية واجتماعية محتملة للأفراد أو المجموعات المتأثرة. فهم (والقضاء أو التخفيف من) التحيزات هو المفتاح للعدالة في الاستخدام.
- كيف: أدرك الباحثون أن المعايير الحالية تستخدم بشكل رئيسي موضوعات ذات بشرة فاتحة، وقاموا بتجميع مجموعة بيانات جديدة (1000+ صورة) كانت أكثر توازنًا من حيث النوع ولون البشرة. تم استخدام مجموعة البيانات لتقييم دقة ثلاثة منتجات لتصنيف النوع (من Microsoft، IBM وFace++).
أظهرت النتائج أنه على الرغم من أن دقة التصنيف العامة كانت جيدة، إلا أن هناك فرقًا ملحوظًا في معدلات الخطأ بين المجموعات الفرعية المختلفة - مع ارتفاع معدلات التصنيف الخاطئ للإناث أو الأشخاص ذوي البشرة الداكنة، مما يشير إلى وجود تحيز.
النتائج الرئيسية: أثارت الوعي بأن علم البيانات يحتاج إلى المزيد من مجموعات البيانات الممثلة (مجموعات فرعية متوازنة) والمزيد من الفرق الشاملة (خلفيات متنوعة) للتعرف على هذه التحيزات والقضاء عليها أو التخفيف منها في وقت مبكر في حلول الذكاء الاصطناعي. جهود البحث مثل هذه تلعب أيضًا دورًا رئيسيًا في تعريف العديد من المؤسسات بمبادئ وممارسات الذكاء الاصطناعي المسؤول لتحسين العدالة عبر منتجات وعمليات الذكاء الاصطناعي الخاصة بها.
هل تريد معرفة المزيد عن جهود البحث ذات الصلة في Microsoft؟
- تحقق من مشاريع Microsoft Research في مجال الذكاء الاصطناعي.
- استكشف مشاريع الطلاب من مدرسة Microsoft Research Data Science الصيفية.
- تحقق من مشروع Fairlearn ومبادرات الذكاء الاصطناعي المسؤول.
علم البيانات + العلوم الإنسانية
![]() |
|---|
| علم البيانات والعلوم الإنسانية الرقمية - رسم توضيحي بواسطة @nitya |
تم تعريف العلوم الإنسانية الرقمية على أنها "مجموعة من الممارسات والمناهج التي تجمع بين الأساليب الحاسوبية والاستفسارات الإنسانية". مشاريع Stanford مثل "إعادة تشغيل التاريخ" و_"التفكير الشعري"_ توضح العلاقة بين العلوم الإنسانية الرقمية وعلم البيانات - مع التركيز على تقنيات مثل تحليل الشبكات، تصوير المعلومات، التحليل المكاني والنصي التي يمكن أن تساعدنا في إعادة النظر في مجموعات البيانات التاريخية والأدبية لاستخلاص رؤى جديدة ومنظورات.
هل تريد استكشاف وتوسيع مشروع في هذا المجال؟
تحقق من "إميلي ديكنسون ومقياس المزاج" - مثال رائع من Jen Looper يسأل كيف يمكننا استخدام علم البيانات لإعادة النظر في الشعر المألوف وإعادة تقييم معناه ومساهمات مؤلفه في سياقات جديدة. على سبيل المثال، هل يمكننا التنبؤ بالموسم الذي كتب فيه القصيدة من خلال تحليل نغمتها أو مشاعرها - وماذا يخبرنا هذا عن حالة المؤلف النفسية خلال الفترة ذات الصلة؟
للإجابة على هذا السؤال، نتبع خطوات دورة حياة علم البيانات:
اكتساب البيانات- لجمع مجموعة بيانات ذات صلة للتحليل. الخيارات تشمل استخدام واجهة برمجة التطبيقات (مثل Poetry DB API) أو استخراج صفحات الويب (مثل Project Gutenberg) باستخدام أدوات مثل Scrapy.تنظيف البيانات- يشرح كيفية تنسيق النص، تنظيفه وتبسيطه باستخدام أدوات أساسية مثل Visual Studio Code وMicrosoft Excel.تحليل البيانات- يشرح كيفية استيراد مجموعة البيانات إلى "دفاتر الملاحظات" لتحليلها باستخدام حزم Python (مثل pandas، numpy وmatplotlib) لتنظيم البيانات وتصويرها.تحليل المشاعر- يشرح كيفية دمج خدمات السحابة مثل Text Analytics، باستخدام أدوات منخفضة الكود مثل Power Automate لأتمتة سير العمل لمعالجة البيانات.
باستخدام هذا سير العمل، يمكننا استكشاف التأثيرات الموسمية على مشاعر القصائد، ومساعدتنا في تشكيل وجهات نظرنا الخاصة حول المؤلف. جربه بنفسك - ثم قم بتوسيع دفتر الملاحظات لطرح أسئلة أخرى أو تصور البيانات بطرق جديدة!
يمكنك استخدام بعض الأدوات في مجموعة أدوات العلوم الإنسانية الرقمية لمتابعة هذه المسارات البحثية.
علم البيانات + الاستدامة
![]() |
|---|
| علم البيانات والاستدامة - رسم توضيحي بواسطة @nitya |
أجندة 2030 للتنمية المستدامة - التي اعتمدها جميع أعضاء الأمم المتحدة في عام 2015 - تحدد 17 هدفًا بما في ذلك تلك التي تركز على حماية الكوكب من التدهور وتأثير تغير المناخ. تدعم مبادرة Microsoft Sustainability هذه الأهداف من خلال استكشاف الطرق التي يمكن أن تدعم بها الحلول التقنية بناء مستقبل أكثر استدامة مع التركيز على 4 أهداف - أن تكون سلبية الكربون، إيجابية المياه، صفر نفايات، ومتنوعة بيولوجيًا بحلول عام 2030.
معالجة هذه التحديات بطريقة قابلة للتوسع وفي الوقت المناسب تتطلب تفكيرًا على نطاق السحابة - وبيانات ضخمة. توفر مبادرة Planetary Computer 4 مكونات لمساعدة علماء البيانات والمطورين في هذا الجهد:
-
كتالوج البيانات - يحتوي على بيتابايت من بيانات أنظمة الأرض (مجانية ومستضافة على Azure).
-
واجهة برمجة تطبيقات الكوكب - لمساعدة المستخدمين في البحث عن البيانات ذات الصلة عبر المكان والزمان.
-
المركز - بيئة مُدارة للعلماء لمعالجة مجموعات البيانات الجغرافية الضخمة.
-
التطبيقات - تعرض حالات الاستخدام والأدوات للحصول على رؤى حول الاستدامة. مشروع الكمبيوتر الكوكبي حاليًا في مرحلة المعاينة (اعتبارًا من سبتمبر 2021) - إليك كيفية البدء بالمساهمة في حلول الاستدامة باستخدام علم البيانات.
-
طلب الوصول لبدء الاستكشاف والتواصل مع الزملاء.
-
استكشاف الوثائق لفهم مجموعات البيانات وواجهات البرمجة المدعومة.
-
استكشاف تطبيقات مثل مراقبة النظم البيئية للحصول على الإلهام لأفكار التطبيقات.
فكر في كيفية استخدام تصور البيانات للكشف عن أو تعزيز رؤى ذات صلة في مجالات مثل تغير المناخ وإزالة الغابات. أو فكر في كيفية استخدام هذه الرؤى لإنشاء تجارب مستخدم جديدة تحفز تغييرات سلوكية نحو حياة أكثر استدامة.
علم البيانات + الطلاب
لقد تحدثنا عن تطبيقات العالم الحقيقي في الصناعة والبحث، واستكشفنا أمثلة لتطبيقات علم البيانات في العلوم الإنسانية الرقمية والاستدامة. إذًا كيف يمكنك بناء مهاراتك ومشاركة خبرتك كمبتدئين في علم البيانات؟
إليك بعض الأمثلة على مشاريع الطلاب في علم البيانات لإلهامك.
- مدرسة الصيف لعلم البيانات MSR مع مشاريع على GitHub تستكشف موضوعات مثل:
- رقمنة الثقافة المادية: استكشاف التوزيعات الاجتماعية والاقتصادية في سيركاب - من أورنيلا ألتونيان وفريقها في كليرمونت، باستخدام ArcGIS StoryMaps.
🚀 التحدي
ابحث عن مقالات توصي بمشاريع علم البيانات المناسبة للمبتدئين - مثل هذه 50 فكرة موضوعية أو هذه 21 فكرة مشروع أو هذه 16 مشروعًا مع كود المصدر التي يمكنك تحليلها وإعادة تشكيلها. ولا تنسَ التدوين عن رحلاتك التعليمية ومشاركة رؤاك معنا جميعًا.
اختبار ما بعد المحاضرة
اختبار ما بعد المحاضرة
المراجعة والدراسة الذاتية
هل ترغب في استكشاف المزيد من حالات الاستخدام؟ إليك بعض المقالات ذات الصلة:
- 17 تطبيقًا وأمثلة لعلم البيانات - يوليو 2021
- 11 تطبيقًا مذهلًا لعلم البيانات في العالم الحقيقي - مايو 2021
- علم البيانات في العالم الحقيقي - مجموعة مقالات
- علم البيانات في: التعليم، الزراعة، المالية، الأفلام والمزيد.
الواجب
استكشاف مجموعة بيانات الكمبيوتر الكوكبي
إخلاء المسؤولية:
تم ترجمة هذا المستند باستخدام خدمة الترجمة بالذكاء الاصطناعي Co-op Translator. بينما نسعى لتحقيق الدقة، يرجى العلم أن الترجمات الآلية قد تحتوي على أخطاء أو معلومات غير دقيقة. يجب اعتبار المستند الأصلي بلغته الأصلية المصدر الموثوق. للحصول على معلومات حاسمة، يُوصى بالاستعانة بترجمة بشرية احترافية. نحن غير مسؤولين عن أي سوء فهم أو تفسيرات خاطئة ناتجة عن استخدام هذه الترجمة.



