You can not select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.
Data-Science-For-Beginners/translations/ar/6-Data-Science-In-Wild/20-Real-World-Examples
leestott e2b90108bb
🌐 Update translations via Co-op Translator
3 weeks ago
..
README.md 🌐 Update translations via Co-op Translator 3 weeks ago
assignment.md 🌐 Update translations via Co-op Translator 3 weeks ago

README.md

علم البيانات في العالم الحقيقي

 رسم توضيحي بواسطة (@sketchthedocs)
علم البيانات في العالم الحقيقي - رسم توضيحي بواسطة @nitya

نحن على وشك إنهاء هذه الرحلة التعليمية!

بدأنا بتعريفات علم البيانات والأخلاقيات، واستكشفنا أدوات وتقنيات مختلفة لتحليل البيانات وتصويرها، وراجعنا دورة حياة علم البيانات، واطلعنا على كيفية توسيع وأتمتة سير العمل في علم البيانات باستخدام خدمات الحوسبة السحابية. لذا، ربما تتساءل: "كيف يمكنني تطبيق كل هذه التعلميات في سياقات العالم الحقيقي؟"

في هذه الدرس، سنستكشف تطبيقات علم البيانات في الصناعة ونغوص في أمثلة محددة في مجالات البحث، العلوم الإنسانية الرقمية، والاستدامة. سننظر في فرص مشاريع الطلاب ونختتم بموارد مفيدة لمساعدتك على مواصلة رحلتك التعليمية!

اختبار ما قبل المحاضرة

اختبار ما قبل المحاضرة

علم البيانات + الصناعة

بفضل ديمقراطية الذكاء الاصطناعي، أصبح من السهل على المطورين تصميم ودمج اتخاذ القرارات المدعومة بالذكاء الاصطناعي والرؤى المستندة إلى البيانات في تجارب المستخدم وسير العمل التطويري. إليك بعض الأمثلة على كيفية "تطبيق" علم البيانات في تطبيقات العالم الحقيقي عبر الصناعة:

  • اتجاهات الإنفلونزا من Google استخدمت علم البيانات لربط مصطلحات البحث باتجاهات الإنفلونزا. رغم أن النهج كان به عيوب، إلا أنه أثار الوعي بالإمكانيات (والتحديات) للتنبؤات الصحية المستندة إلى البيانات.

  • تنبؤات مسارات UPS - يشرح كيف تستخدم UPS علم البيانات والتعلم الآلي للتنبؤ بالمسارات المثلى للتوصيل، مع الأخذ في الاعتبار ظروف الطقس، أنماط المرور، مواعيد التسليم والمزيد.

  • تصوير مسارات سيارات الأجرة في نيويورك - البيانات التي تم جمعها باستخدام قوانين حرية المعلومات ساعدت في تصوير يوم في حياة سيارات الأجرة في نيويورك، مما يساعدنا على فهم كيفية تنقلها في المدينة المزدحمة، الأموال التي تجنيها، ومدة الرحلات على مدار 24 ساعة.

  • منصة علم البيانات في Uber - تستخدم البيانات (مثل مواقع الالتقاط والتوصيل، مدة الرحلة، المسارات المفضلة، إلخ) التي يتم جمعها من ملايين الرحلات اليومية لبناء أداة تحليل بيانات تساعد في التسعير، السلامة، اكتشاف الاحتيال واتخاذ قرارات التنقل.

  • تحليلات الرياضة - تركز على التحليلات التنبؤية (تحليل الفرق واللاعبين - مثل Moneyball - وإدارة المشجعين) و_تصوير البيانات_ (لوحات الفرق والمشجعين، الألعاب، إلخ) مع تطبيقات مثل اكتشاف المواهب، المراهنات الرياضية وإدارة المخزون/الملاعب.

  • علم البيانات في البنوك - يبرز قيمة علم البيانات في صناعة التمويل مع تطبيقات تتراوح بين نمذجة المخاطر واكتشاف الاحتيال، إلى تقسيم العملاء، التنبؤ الفوري وأنظمة التوصية. التحليلات التنبؤية تدفع أيضًا تدابير حاسمة مثل درجات الائتمان.

  • علم البيانات في الرعاية الصحية - يبرز تطبيقات مثل التصوير الطبي (مثل MRI، الأشعة السينية، التصوير المقطعي)، الجينوميات (تسلسل الحمض النووي)، تطوير الأدوية (تقييم المخاطر، التنبؤ بالنجاح)، التحليلات التنبؤية (رعاية المرضى ولوجستيات الإمداد)، تتبع الأمراض والوقاية منها، إلخ.

تطبيقات علم البيانات في العالم الحقيقي حقوق الصورة: Data Flair: 6 Amazing Data Science Applications

تُظهر الصورة مجالات وأمثلة أخرى لتطبيق تقنيات علم البيانات. هل تريد استكشاف تطبيقات أخرى؟ تحقق من قسم المراجعة والدراسة الذاتية أدناه.

علم البيانات + البحث

 رسم توضيحي بواسطة (@sketchthedocs)
علم البيانات والبحث - رسم توضيحي بواسطة @nitya

بينما تركز تطبيقات العالم الحقيقي غالبًا على حالات الاستخدام الصناعي على نطاق واسع، يمكن أن تكون تطبيقات ومشاريع البحث مفيدة من منظورين:

  • فرص الابتكار - استكشاف النماذج الأولية السريعة للمفاهيم المتقدمة واختبار تجارب المستخدم للتطبيقات المستقبلية.
  • تحديات النشر - التحقيق في الأضرار المحتملة أو العواقب غير المقصودة لتقنيات علم البيانات في سياقات العالم الحقيقي.

بالنسبة للطلاب، يمكن أن توفر هذه المشاريع البحثية فرصًا للتعلم والتعاون التي تحسن فهمك للموضوع، وتوسع وعيك وتفاعلك مع الأشخاص أو الفرق ذات الصلة التي تعمل في مجالات الاهتمام. فما هي شكل المشاريع البحثية وكيف يمكن أن تحدث تأثيرًا؟

لننظر إلى مثال واحد - دراسة MIT Gender Shades من Joy Buolamwini (MIT Media Labs) مع ورقة بحثية مميزة شاركت في تأليفها مع Timnit Gebru (حينها في Microsoft Research) التي ركزت على:

  • ما الهدف: كان هدف المشروع البحثي هو تقييم التحيز الموجود في خوارزميات تحليل الوجه التلقائي ومجموعات البيانات بناءً على النوع ولون البشرة.
  • لماذا: يتم استخدام تحليل الوجه في مجالات مثل تطبيق القانون، أمن المطارات، أنظمة التوظيف والمزيد - وهي سياقات يمكن أن تسبب فيها التصنيفات غير الدقيقة (مثل التحيز) أضرارًا اقتصادية واجتماعية محتملة للأفراد أو المجموعات المتأثرة. فهم (والقضاء أو التخفيف من) التحيزات هو المفتاح للعدالة في الاستخدام.
  • كيف: أدرك الباحثون أن المعايير الحالية تستخدم بشكل رئيسي موضوعات ذات بشرة فاتحة، وقاموا بتجميع مجموعة بيانات جديدة (1000+ صورة) كانت أكثر توازنًا من حيث النوع ولون البشرة. تم استخدام مجموعة البيانات لتقييم دقة ثلاثة منتجات لتصنيف النوع (من Microsoft، IBM وFace++).

أظهرت النتائج أنه رغم أن دقة التصنيف الإجمالية كانت جيدة، إلا أن هناك فرقًا ملحوظًا في معدلات الخطأ بين المجموعات الفرعية المختلفة - مع ارتفاع معدلات التصنيف الخاطئ للإناث أو الأشخاص ذوي البشرة الداكنة، مما يشير إلى وجود تحيز.

النتائج الرئيسية: أثارت الوعي بأن علم البيانات يحتاج إلى المزيد من مجموعات البيانات الممثلة (المجموعات الفرعية المتوازنة) والمزيد من الفرق الشاملة (الخلفيات المتنوعة) للتعرف على هذه التحيزات والقضاء عليها أو التخفيف منها في وقت مبكر في حلول الذكاء الاصطناعي. جهود البحث مثل هذه تلعب أيضًا دورًا رئيسيًا في تعريف العديد من المؤسسات بمبادئ وممارسات الذكاء الاصطناعي المسؤول لتحسين العدالة عبر منتجات وعمليات الذكاء الاصطناعي الخاصة بها.

هل تريد معرفة المزيد عن جهود البحث ذات الصلة في Microsoft؟

علم البيانات + العلوم الإنسانية

 رسم توضيحي بواسطة (@sketchthedocs)
علم البيانات والعلوم الإنسانية الرقمية - رسم توضيحي بواسطة @nitya

تم تعريف العلوم الإنسانية الرقمية على أنها "مجموعة من الممارسات والمناهج التي تجمع بين الأساليب الحاسوبية والتحقيق الإنساني". مشاريع Stanford مثل "إعادة تشغيل التاريخ" و_"التفكير الشعري"_ توضح العلاقة بين العلوم الإنسانية الرقمية وعلم البيانات - مع التركيز على تقنيات مثل تحليل الشبكات، تصوير المعلومات، التحليل المكاني والنصي التي يمكن أن تساعدنا في إعادة النظر في مجموعات البيانات التاريخية والأدبية لاستخلاص رؤى جديدة ومنظورات.

هل تريد استكشاف وتوسيع مشروع في هذا المجال؟

تحقق من "إميلي ديكنسون ومقياس المزاج" - مثال رائع من Jen Looper يسأل كيف يمكننا استخدام علم البيانات لإعادة النظر في الشعر المألوف وإعادة تقييم معناه ومساهمات مؤلفه في سياقات جديدة. على سبيل المثال، هل يمكننا التنبؤ بالموسم الذي كتب فيه القصيدة من خلال تحليل نغمتها أو مشاعرها - وماذا يخبرنا هذا عن حالة المؤلف النفسية خلال الفترة ذات الصلة؟

للإجابة على هذا السؤال، نتبع خطوات دورة حياة علم البيانات:

  • اكتساب البيانات - لجمع مجموعة بيانات ذات صلة للتحليل. الخيارات تشمل استخدام واجهة برمجة التطبيقات (مثل Poetry DB API) أو استخراج صفحات الويب (مثل مشروع غوتنبرغ) باستخدام أدوات مثل Scrapy.
  • تنظيف البيانات - يشرح كيف يمكن تنسيق النص، تنظيفه وتبسيطه باستخدام أدوات أساسية مثل Visual Studio Code وMicrosoft Excel.
  • تحليل البيانات - يشرح كيف يمكننا الآن استيراد مجموعة البيانات إلى "دفاتر الملاحظات" للتحليل باستخدام حزم Python (مثل pandas، numpy وmatplotlib) لتنظيم البيانات وتصويرها.
  • تحليل المشاعر - يشرح كيف يمكننا دمج خدمات السحابة مثل Text Analytics، باستخدام أدوات منخفضة الكود مثل Power Automate لأتمتة سير العمل لمعالجة البيانات.

باستخدام هذا سير العمل، يمكننا استكشاف تأثيرات المواسم على مشاعر القصائد، ومساعدتنا في تشكيل وجهات نظرنا الخاصة حول المؤلف. جربه بنفسك - ثم قم بتوسيع دفتر الملاحظات لطرح أسئلة أخرى أو تصوير البيانات بطرق جديدة!

يمكنك استخدام بعض الأدوات في مجموعة أدوات العلوم الإنسانية الرقمية لمتابعة هذه مسارات البحث.

علم البيانات + الاستدامة

 رسم توضيحي بواسطة (@sketchthedocs)
علم البيانات والاستدامة - رسم توضيحي بواسطة @nitya

أجندة 2030 للتنمية المستدامة - التي اعتمدها جميع أعضاء الأمم المتحدة في عام 2015 - تحدد 17 هدفًا بما في ذلك تلك التي تركز على حماية الكوكب من التدهور وتأثير تغير المناخ. تدعم مبادرة Microsoft Sustainability هذه الأهداف من خلال استكشاف الطرق التي يمكن أن تدعم بها الحلول التكنولوجية بناء مستقبل أكثر استدامة مع التركيز على 4 أهداف - أن تكون سلبية الكربون، إيجابية المياه، صفر نفايات، ومتنوعة بيولوجيًا بحلول عام 2030.

معالجة هذه التحديات بطريقة قابلة للتوسع وفي الوقت المناسب تتطلب تفكيرًا على مستوى السحابة - وبيانات ضخمة. توفر مبادرة Planetary Computer 4 مكونات لمساعدة علماء البيانات والمطورين في هذا الجهد:

  • كتالوج البيانات - يحتوي على بيتابايت من بيانات أنظمة الأرض (مجانية ومستضافة على Azure).

  • واجهة برمجة تطبيقات الكوكب - لمساعدة المستخدمين في البحث عن البيانات ذات الصلة عبر المكان والزمان.

  • المركز - بيئة مُدارة للعلماء لمعالجة مجموعات البيانات الجغرافية الضخمة.

  • التطبيقات - تعرض حالات الاستخدام والأدوات للحصول على رؤى حول الاستدامة. مشروع الحاسوب الكوكبي حاليًا في مرحلة المعاينة (اعتبارًا من سبتمبر 2021) - إليك كيفية البدء بالمساهمة في حلول الاستدامة باستخدام علم البيانات.

  • طلب الوصول لبدء الاستكشاف والتواصل مع الزملاء.

  • استكشاف الوثائق لفهم مجموعات البيانات وواجهات برمجة التطبيقات المدعومة.

  • استكشاف تطبيقات مثل مراقبة النظم البيئية للحصول على الإلهام حول أفكار التطبيقات.

فكر في كيفية استخدام تصور البيانات للكشف عن رؤى ذات صلة أو تعزيزها في مجالات مثل تغير المناخ وإزالة الغابات. أو فكر في كيفية استخدام هذه الرؤى لإنشاء تجارب مستخدم جديدة تحفز التغييرات السلوكية نحو حياة أكثر استدامة.

علم البيانات + الطلاب

لقد تحدثنا عن تطبيقات العالم الحقيقي في الصناعة والبحث، واستكشفنا أمثلة لتطبيقات علم البيانات في العلوم الإنسانية الرقمية والاستدامة. إذًا، كيف يمكنك بناء مهاراتك ومشاركة خبراتك كمبتدئين في علم البيانات؟

إليك بعض الأمثلة على مشاريع علم البيانات للطلاب لإلهامك.

🚀 التحدي

ابحث عن مقالات توصي بمشاريع علم البيانات المناسبة للمبتدئين - مثل هذه 50 فكرة أو هذه 21 فكرة مشروع أو هذه 16 مشروعًا مع الكود المصدري التي يمكنك تحليلها وإعادة تشكيلها. ولا تنسَ التدوين حول رحلاتك التعليمية ومشاركة رؤاك معنا جميعًا.

اختبار ما بعد المحاضرة

اختبار ما بعد المحاضرة

المراجعة والدراسة الذاتية

هل تريد استكشاف المزيد من حالات الاستخدام؟ إليك بعض المقالات ذات الصلة:

الواجب

استكشاف مجموعة بيانات من الحاسوب الكوكبي


إخلاء المسؤولية:
تمت ترجمة هذا المستند باستخدام خدمة الترجمة الآلية Co-op Translator. بينما نسعى لتحقيق الدقة، يرجى العلم أن الترجمات الآلية قد تحتوي على أخطاء أو معلومات غير دقيقة. يجب اعتبار المستند الأصلي بلغته الأصلية هو المصدر الموثوق. للحصول على معلومات حساسة أو هامة، يُوصى بالاستعانة بترجمة بشرية احترافية. نحن غير مسؤولين عن أي سوء فهم أو تفسيرات خاطئة تنشأ عن استخدام هذه الترجمة.