|
|
<!--
|
|
|
CO_OP_TRANSLATOR_METADATA:
|
|
|
{
|
|
|
"original_hash": "67076ed50f54e7d26ba1ba378d6078f1",
|
|
|
"translation_date": "2025-08-27T09:19:35+00:00",
|
|
|
"source_file": "6-Data-Science-In-Wild/20-Real-World-Examples/README.md",
|
|
|
"language_code": "ar"
|
|
|
}
|
|
|
-->
|
|
|
# علم البيانات في العالم الحقيقي
|
|
|
|
|
|
|  ](../../sketchnotes/20-DataScience-RealWorld.png) |
|
|
|
| :--------------------------------------------------------------------------------------------------------------: |
|
|
|
| علم البيانات في العالم الحقيقي - _رسم توضيحي بواسطة [@nitya](https://twitter.com/nitya)_ |
|
|
|
|
|
|
نحن على وشك إنهاء هذه الرحلة التعليمية!
|
|
|
|
|
|
بدأنا بتعريفات علم البيانات والأخلاقيات، واستكشفنا أدوات وتقنيات مختلفة لتحليل البيانات وتصويرها، وراجعنا دورة حياة علم البيانات، واطلعنا على كيفية توسيع وأتمتة سير العمل في علم البيانات باستخدام خدمات الحوسبة السحابية. لذا، ربما تتساءل: _"كيف يمكنني تطبيق كل هذه التعلميات في سياقات العالم الحقيقي؟"_
|
|
|
|
|
|
في هذه الدرس، سنستكشف تطبيقات علم البيانات في الصناعة ونغوص في أمثلة محددة في مجالات البحث، العلوم الإنسانية الرقمية، والاستدامة. سننظر في فرص مشاريع الطلاب ونختتم بموارد مفيدة لمساعدتك على مواصلة رحلتك التعليمية!
|
|
|
|
|
|
## اختبار ما قبل المحاضرة
|
|
|
|
|
|
[اختبار ما قبل المحاضرة](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/38)
|
|
|
|
|
|
## علم البيانات + الصناعة
|
|
|
|
|
|
بفضل ديمقراطية الذكاء الاصطناعي، أصبح من السهل على المطورين تصميم ودمج اتخاذ القرارات المدعومة بالذكاء الاصطناعي والرؤى المستندة إلى البيانات في تجارب المستخدم وسير العمل التطويري. إليك بعض الأمثلة على كيفية "تطبيق" علم البيانات في تطبيقات العالم الحقيقي عبر الصناعة:
|
|
|
|
|
|
* [اتجاهات الإنفلونزا من Google](https://www.wired.com/2015/10/can-learn-epic-failure-google-flu-trends/) استخدمت علم البيانات لربط مصطلحات البحث باتجاهات الإنفلونزا. رغم أن النهج كان به عيوب، إلا أنه أثار الوعي بالإمكانيات (والتحديات) للتنبؤات الصحية المستندة إلى البيانات.
|
|
|
|
|
|
* [تنبؤات مسارات UPS](https://www.technologyreview.com/2018/11/21/139000/how-ups-uses-ai-to-outsmart-bad-weather/) - يشرح كيف تستخدم UPS علم البيانات والتعلم الآلي للتنبؤ بالمسارات المثلى للتوصيل، مع الأخذ في الاعتبار ظروف الطقس، أنماط المرور، مواعيد التسليم والمزيد.
|
|
|
|
|
|
* [تصوير مسارات سيارات الأجرة في نيويورك](http://chriswhong.github.io/nyctaxi/) - البيانات التي تم جمعها باستخدام [قوانين حرية المعلومات](https://chriswhong.com/open-data/foil_nyc_taxi/) ساعدت في تصوير يوم في حياة سيارات الأجرة في نيويورك، مما يساعدنا على فهم كيفية تنقلها في المدينة المزدحمة، الأموال التي تجنيها، ومدة الرحلات على مدار 24 ساعة.
|
|
|
|
|
|
* [منصة علم البيانات في Uber](https://eng.uber.com/dsw/) - تستخدم البيانات (مثل مواقع الالتقاط والتوصيل، مدة الرحلة، المسارات المفضلة، إلخ) التي يتم جمعها من ملايين الرحلات اليومية لبناء أداة تحليل بيانات تساعد في التسعير، السلامة، اكتشاف الاحتيال واتخاذ قرارات التنقل.
|
|
|
|
|
|
* [تحليلات الرياضة](https://towardsdatascience.com/scope-of-analytics-in-sports-world-37ed09c39860) - تركز على _التحليلات التنبؤية_ (تحليل الفرق واللاعبين - مثل [Moneyball](https://datasciencedegree.wisconsin.edu/blog/moneyball-proves-importance-big-data-big-ideas/) - وإدارة المشجعين) و_تصوير البيانات_ (لوحات الفرق والمشجعين، الألعاب، إلخ) مع تطبيقات مثل اكتشاف المواهب، المراهنات الرياضية وإدارة المخزون/الملاعب.
|
|
|
|
|
|
* [علم البيانات في البنوك](https://data-flair.training/blogs/data-science-in-banking/) - يبرز قيمة علم البيانات في صناعة التمويل مع تطبيقات تتراوح بين نمذجة المخاطر واكتشاف الاحتيال، إلى تقسيم العملاء، التنبؤ الفوري وأنظمة التوصية. التحليلات التنبؤية تدفع أيضًا تدابير حاسمة مثل [درجات الائتمان](https://dzone.com/articles/using-big-data-and-predictive-analytics-for-credit).
|
|
|
|
|
|
* [علم البيانات في الرعاية الصحية](https://data-flair.training/blogs/data-science-in-healthcare/) - يبرز تطبيقات مثل التصوير الطبي (مثل MRI، الأشعة السينية، التصوير المقطعي)، الجينوميات (تسلسل الحمض النووي)، تطوير الأدوية (تقييم المخاطر، التنبؤ بالنجاح)، التحليلات التنبؤية (رعاية المرضى ولوجستيات الإمداد)، تتبع الأمراض والوقاية منها، إلخ.
|
|
|
|
|
|
 حقوق الصورة: [Data Flair: 6 Amazing Data Science Applications ](https://data-flair.training/blogs/data-science-applications/)
|
|
|
|
|
|
تُظهر الصورة مجالات وأمثلة أخرى لتطبيق تقنيات علم البيانات. هل تريد استكشاف تطبيقات أخرى؟ تحقق من قسم [المراجعة والدراسة الذاتية](../../../../6-Data-Science-In-Wild/20-Real-World-Examples) أدناه.
|
|
|
|
|
|
## علم البيانات + البحث
|
|
|
|
|
|
|  ](../../sketchnotes/20-DataScience-Research.png) |
|
|
|
| :---------------------------------------------------------------------------------------------------------------: |
|
|
|
| علم البيانات والبحث - _رسم توضيحي بواسطة [@nitya](https://twitter.com/nitya)_ |
|
|
|
|
|
|
بينما تركز تطبيقات العالم الحقيقي غالبًا على حالات الاستخدام الصناعي على نطاق واسع، يمكن أن تكون تطبيقات ومشاريع _البحث_ مفيدة من منظورين:
|
|
|
|
|
|
* _فرص الابتكار_ - استكشاف النماذج الأولية السريعة للمفاهيم المتقدمة واختبار تجارب المستخدم للتطبيقات المستقبلية.
|
|
|
* _تحديات النشر_ - التحقيق في الأضرار المحتملة أو العواقب غير المقصودة لتقنيات علم البيانات في سياقات العالم الحقيقي.
|
|
|
|
|
|
بالنسبة للطلاب، يمكن أن توفر هذه المشاريع البحثية فرصًا للتعلم والتعاون التي تحسن فهمك للموضوع، وتوسع وعيك وتفاعلك مع الأشخاص أو الفرق ذات الصلة التي تعمل في مجالات الاهتمام. فما هي شكل المشاريع البحثية وكيف يمكن أن تحدث تأثيرًا؟
|
|
|
|
|
|
لننظر إلى مثال واحد - [دراسة MIT Gender Shades](http://gendershades.org/overview.html) من Joy Buolamwini (MIT Media Labs) مع [ورقة بحثية مميزة](http://proceedings.mlr.press/v81/buolamwini18a/buolamwini18a.pdf) شاركت في تأليفها مع Timnit Gebru (حينها في Microsoft Research) التي ركزت على:
|
|
|
|
|
|
* **ما الهدف:** كان هدف المشروع البحثي هو _تقييم التحيز الموجود في خوارزميات تحليل الوجه التلقائي ومجموعات البيانات_ بناءً على النوع ولون البشرة.
|
|
|
* **لماذا:** يتم استخدام تحليل الوجه في مجالات مثل تطبيق القانون، أمن المطارات، أنظمة التوظيف والمزيد - وهي سياقات يمكن أن تسبب فيها التصنيفات غير الدقيقة (مثل التحيز) أضرارًا اقتصادية واجتماعية محتملة للأفراد أو المجموعات المتأثرة. فهم (والقضاء أو التخفيف من) التحيزات هو المفتاح للعدالة في الاستخدام.
|
|
|
* **كيف:** أدرك الباحثون أن المعايير الحالية تستخدم بشكل رئيسي موضوعات ذات بشرة فاتحة، وقاموا بتجميع مجموعة بيانات جديدة (1000+ صورة) كانت _أكثر توازنًا_ من حيث النوع ولون البشرة. تم استخدام مجموعة البيانات لتقييم دقة ثلاثة منتجات لتصنيف النوع (من Microsoft، IBM وFace++).
|
|
|
|
|
|
أظهرت النتائج أنه رغم أن دقة التصنيف الإجمالية كانت جيدة، إلا أن هناك فرقًا ملحوظًا في معدلات الخطأ بين المجموعات الفرعية المختلفة - مع ارتفاع معدلات **التصنيف الخاطئ** للإناث أو الأشخاص ذوي البشرة الداكنة، مما يشير إلى وجود تحيز.
|
|
|
|
|
|
**النتائج الرئيسية:** أثارت الوعي بأن علم البيانات يحتاج إلى المزيد من _مجموعات البيانات الممثلة_ (المجموعات الفرعية المتوازنة) والمزيد من _الفرق الشاملة_ (الخلفيات المتنوعة) للتعرف على هذه التحيزات والقضاء عليها أو التخفيف منها في وقت مبكر في حلول الذكاء الاصطناعي. جهود البحث مثل هذه تلعب أيضًا دورًا رئيسيًا في تعريف العديد من المؤسسات بمبادئ وممارسات _الذكاء الاصطناعي المسؤول_ لتحسين العدالة عبر منتجات وعمليات الذكاء الاصطناعي الخاصة بها.
|
|
|
|
|
|
**هل تريد معرفة المزيد عن جهود البحث ذات الصلة في Microsoft؟**
|
|
|
|
|
|
* تحقق من [مشاريع Microsoft Research](https://www.microsoft.com/research/research-area/artificial-intelligence/?facet%5Btax%5D%5Bmsr-research-area%5D%5B%5D=13556&facet%5Btax%5D%5Bmsr-content-type%5D%5B%5D=msr-project) في مجال الذكاء الاصطناعي.
|
|
|
* استكشف مشاريع الطلاب من [مدرسة Microsoft Research Data Science الصيفية](https://www.microsoft.com/en-us/research/academic-program/data-science-summer-school/).
|
|
|
* تحقق من مشروع [Fairlearn](https://fairlearn.org/) ومبادرات [الذكاء الاصطناعي المسؤول](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1%3aprimaryr6).
|
|
|
|
|
|
## علم البيانات + العلوم الإنسانية
|
|
|
|
|
|
|  ](../../sketchnotes/20-DataScience-Humanities.png) |
|
|
|
| :---------------------------------------------------------------------------------------------------------------: |
|
|
|
| علم البيانات والعلوم الإنسانية الرقمية - _رسم توضيحي بواسطة [@nitya](https://twitter.com/nitya)_ |
|
|
|
|
|
|
تم تعريف العلوم الإنسانية الرقمية [على أنها](https://digitalhumanities.stanford.edu/about-dh-stanford) "مجموعة من الممارسات والمناهج التي تجمع بين الأساليب الحاسوبية والتحقيق الإنساني". مشاريع [Stanford](https://digitalhumanities.stanford.edu/projects) مثل _"إعادة تشغيل التاريخ"_ و_"التفكير الشعري"_ توضح العلاقة بين [العلوم الإنسانية الرقمية وعلم البيانات](https://digitalhumanities.stanford.edu/digital-humanities-and-data-science) - مع التركيز على تقنيات مثل تحليل الشبكات، تصوير المعلومات، التحليل المكاني والنصي التي يمكن أن تساعدنا في إعادة النظر في مجموعات البيانات التاريخية والأدبية لاستخلاص رؤى جديدة ومنظورات.
|
|
|
|
|
|
*هل تريد استكشاف وتوسيع مشروع في هذا المجال؟*
|
|
|
|
|
|
تحقق من ["إميلي ديكنسون ومقياس المزاج"](https://gist.github.com/jlooper/ce4d102efd057137bc000db796bfd671) - مثال رائع من [Jen Looper](https://twitter.com/jenlooper) يسأل كيف يمكننا استخدام علم البيانات لإعادة النظر في الشعر المألوف وإعادة تقييم معناه ومساهمات مؤلفه في سياقات جديدة. على سبيل المثال، _هل يمكننا التنبؤ بالموسم الذي كتب فيه القصيدة من خلال تحليل نغمتها أو مشاعرها_ - وماذا يخبرنا هذا عن حالة المؤلف النفسية خلال الفترة ذات الصلة؟
|
|
|
|
|
|
للإجابة على هذا السؤال، نتبع خطوات دورة حياة علم البيانات:
|
|
|
* [`اكتساب البيانات`](https://gist.github.com/jlooper/ce4d102efd057137bc000db796bfd671#acquiring-the-dataset) - لجمع مجموعة بيانات ذات صلة للتحليل. الخيارات تشمل استخدام واجهة برمجة التطبيقات (مثل [Poetry DB API](https://poetrydb.org/index.html)) أو استخراج صفحات الويب (مثل [مشروع غوتنبرغ](https://www.gutenberg.org/files/12242/12242-h/12242-h.htm)) باستخدام أدوات مثل [Scrapy](https://scrapy.org/).
|
|
|
* [`تنظيف البيانات`](https://gist.github.com/jlooper/ce4d102efd057137bc000db796bfd671#clean-the-data) - يشرح كيف يمكن تنسيق النص، تنظيفه وتبسيطه باستخدام أدوات أساسية مثل Visual Studio Code وMicrosoft Excel.
|
|
|
* [`تحليل البيانات`](https://gist.github.com/jlooper/ce4d102efd057137bc000db796bfd671#working-with-the-data-in-a-notebook) - يشرح كيف يمكننا الآن استيراد مجموعة البيانات إلى "دفاتر الملاحظات" للتحليل باستخدام حزم Python (مثل pandas، numpy وmatplotlib) لتنظيم البيانات وتصويرها.
|
|
|
* [`تحليل المشاعر`](https://gist.github.com/jlooper/ce4d102efd057137bc000db796bfd671#sentiment-analysis-using-cognitive-services) - يشرح كيف يمكننا دمج خدمات السحابة مثل Text Analytics، باستخدام أدوات منخفضة الكود مثل [Power Automate](https://flow.microsoft.com/en-us/) لأتمتة سير العمل لمعالجة البيانات.
|
|
|
|
|
|
باستخدام هذا سير العمل، يمكننا استكشاف تأثيرات المواسم على مشاعر القصائد، ومساعدتنا في تشكيل وجهات نظرنا الخاصة حول المؤلف. جربه بنفسك - ثم قم بتوسيع دفتر الملاحظات لطرح أسئلة أخرى أو تصوير البيانات بطرق جديدة!
|
|
|
|
|
|
> يمكنك استخدام بعض الأدوات في [مجموعة أدوات العلوم الإنسانية الرقمية](https://github.com/Digital-Humanities-Toolkit) لمتابعة هذه مسارات البحث.
|
|
|
|
|
|
## علم البيانات + الاستدامة
|
|
|
|
|
|
|  ](../../sketchnotes/20-DataScience-Sustainability.png) |
|
|
|
| :---------------------------------------------------------------------------------------------------------------: |
|
|
|
| علم البيانات والاستدامة - _رسم توضيحي بواسطة [@nitya](https://twitter.com/nitya)_ |
|
|
|
|
|
|
[أجندة 2030 للتنمية المستدامة](https://sdgs.un.org/2030agenda) - التي اعتمدها جميع أعضاء الأمم المتحدة في عام 2015 - تحدد 17 هدفًا بما في ذلك تلك التي تركز على **حماية الكوكب** من التدهور وتأثير تغير المناخ. تدعم مبادرة [Microsoft Sustainability](https://www.microsoft.com/en-us/sustainability) هذه الأهداف من خلال استكشاف الطرق التي يمكن أن تدعم بها الحلول التكنولوجية بناء مستقبل أكثر استدامة مع [التركيز على 4 أهداف](https://dev.to/azure/a-visual-guide-to-sustainable-software-engineering-53hh) - أن تكون سلبية الكربون، إيجابية المياه، صفر نفايات، ومتنوعة بيولوجيًا بحلول عام 2030.
|
|
|
|
|
|
معالجة هذه التحديات بطريقة قابلة للتوسع وفي الوقت المناسب تتطلب تفكيرًا على مستوى السحابة - وبيانات ضخمة. توفر مبادرة [Planetary Computer](https://planetarycomputer.microsoft.com/) 4 مكونات لمساعدة علماء البيانات والمطورين في هذا الجهد:
|
|
|
|
|
|
* [كتالوج البيانات](https://planetarycomputer.microsoft.com/catalog) - يحتوي على بيتابايت من بيانات أنظمة الأرض (مجانية ومستضافة على Azure).
|
|
|
* [واجهة برمجة تطبيقات الكوكب](https://planetarycomputer.microsoft.com/docs/reference/stac/) - لمساعدة المستخدمين في البحث عن البيانات ذات الصلة عبر المكان والزمان.
|
|
|
* [المركز](https://planetarycomputer.microsoft.com/docs/overview/environment/) - بيئة مُدارة للعلماء لمعالجة مجموعات البيانات الجغرافية الضخمة.
|
|
|
* [التطبيقات](https://planetarycomputer.microsoft.com/applications) - تعرض حالات الاستخدام والأدوات للحصول على رؤى حول الاستدامة.
|
|
|
**مشروع الحاسوب الكوكبي حاليًا في مرحلة المعاينة (اعتبارًا من سبتمبر 2021)** - إليك كيفية البدء بالمساهمة في حلول الاستدامة باستخدام علم البيانات.
|
|
|
|
|
|
* [طلب الوصول](https://planetarycomputer.microsoft.com/account/request) لبدء الاستكشاف والتواصل مع الزملاء.
|
|
|
* [استكشاف الوثائق](https://planetarycomputer.microsoft.com/docs/overview/about) لفهم مجموعات البيانات وواجهات برمجة التطبيقات المدعومة.
|
|
|
* استكشاف تطبيقات مثل [مراقبة النظم البيئية](https://analytics-lab.org/ecosystemmonitoring/) للحصول على الإلهام حول أفكار التطبيقات.
|
|
|
|
|
|
فكر في كيفية استخدام تصور البيانات للكشف عن رؤى ذات صلة أو تعزيزها في مجالات مثل تغير المناخ وإزالة الغابات. أو فكر في كيفية استخدام هذه الرؤى لإنشاء تجارب مستخدم جديدة تحفز التغييرات السلوكية نحو حياة أكثر استدامة.
|
|
|
|
|
|
## علم البيانات + الطلاب
|
|
|
|
|
|
لقد تحدثنا عن تطبيقات العالم الحقيقي في الصناعة والبحث، واستكشفنا أمثلة لتطبيقات علم البيانات في العلوم الإنسانية الرقمية والاستدامة. إذًا، كيف يمكنك بناء مهاراتك ومشاركة خبراتك كمبتدئين في علم البيانات؟
|
|
|
|
|
|
إليك بعض الأمثلة على مشاريع علم البيانات للطلاب لإلهامك.
|
|
|
|
|
|
* [مدرسة مايكروسوفت الصيفية لعلم البيانات](https://www.microsoft.com/en-us/research/academic-program/data-science-summer-school/#!projects) مع [مشاريع](https://github.com/msr-ds3) على GitHub تستكشف موضوعات مثل:
|
|
|
- [التحيز العرقي في استخدام الشرطة للقوة](https://www.microsoft.com/en-us/research/video/data-science-summer-school-2019-replicating-an-empirical-analysis-of-racial-differences-in-police-use-of-force/) | [Github](https://github.com/msr-ds3/stop-question-frisk)
|
|
|
- [موثوقية نظام مترو الأنفاق في نيويورك](https://www.microsoft.com/en-us/research/video/data-science-summer-school-2018-exploring-the-reliability-of-the-nyc-subway-system/) | [Github](https://github.com/msr-ds3/nyctransit)
|
|
|
* [رقمنة الثقافة المادية: استكشاف التوزيعات الاجتماعية والاقتصادية في سيركاب](https://claremont.maps.arcgis.com/apps/Cascade/index.html?appid=bdf2aef0f45a4674ba41cd373fa23afc) - من [أورنيلا ألتونيان](https://twitter.com/ornelladotcom) وفريقها في كليرمونت، باستخدام [ArcGIS StoryMaps](https://storymaps.arcgis.com/).
|
|
|
|
|
|
## 🚀 التحدي
|
|
|
|
|
|
ابحث عن مقالات توصي بمشاريع علم البيانات المناسبة للمبتدئين - مثل [هذه 50 فكرة](https://www.upgrad.com/blog/data-science-project-ideas-topics-beginners/) أو [هذه 21 فكرة مشروع](https://www.intellspot.com/data-science-project-ideas) أو [هذه 16 مشروعًا مع الكود المصدري](https://data-flair.training/blogs/data-science-project-ideas/) التي يمكنك تحليلها وإعادة تشكيلها. ولا تنسَ التدوين حول رحلاتك التعليمية ومشاركة رؤاك معنا جميعًا.
|
|
|
|
|
|
## اختبار ما بعد المحاضرة
|
|
|
|
|
|
[اختبار ما بعد المحاضرة](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/39)
|
|
|
|
|
|
## المراجعة والدراسة الذاتية
|
|
|
|
|
|
هل تريد استكشاف المزيد من حالات الاستخدام؟ إليك بعض المقالات ذات الصلة:
|
|
|
* [17 تطبيقًا ومثالًا لعلم البيانات](https://builtin.com/data-science/data-science-applications-examples) - يوليو 2021
|
|
|
* [11 تطبيقًا مذهلًا لعلم البيانات في العالم الحقيقي](https://myblindbird.com/data-science-applications-real-world/) - مايو 2021
|
|
|
* [علم البيانات في العالم الحقيقي](https://towardsdatascience.com/data-science-in-the-real-world/home) - مجموعة مقالات
|
|
|
* علم البيانات في: [التعليم](https://data-flair.training/blogs/data-science-in-education/)، [الزراعة](https://data-flair.training/blogs/data-science-in-agriculture/)، [التمويل](https://data-flair.training/blogs/data-science-in-finance/)، [الأفلام](https://data-flair.training/blogs/data-science-at-movies/) والمزيد.
|
|
|
|
|
|
## الواجب
|
|
|
|
|
|
[استكشاف مجموعة بيانات من الحاسوب الكوكبي](assignment.md)
|
|
|
|
|
|
---
|
|
|
|
|
|
**إخلاء المسؤولية**:
|
|
|
تمت ترجمة هذا المستند باستخدام خدمة الترجمة الآلية [Co-op Translator](https://github.com/Azure/co-op-translator). بينما نسعى لتحقيق الدقة، يرجى العلم أن الترجمات الآلية قد تحتوي على أخطاء أو معلومات غير دقيقة. يجب اعتبار المستند الأصلي بلغته الأصلية هو المصدر الموثوق. للحصول على معلومات حساسة أو هامة، يُوصى بالاستعانة بترجمة بشرية احترافية. نحن غير مسؤولين عن أي سوء فهم أو تفسيرات خاطئة تنشأ عن استخدام هذه الترجمة. |