You can not select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.
Data-Science-For-Beginners/translations/ar/6-Data-Science-In-Wild/20-Real-World-Examples
leestott 8029ff828a
🌐 Update translations via Co-op Translator
5 months ago
..
README.md 🌐 Update translations via Co-op Translator 5 months ago
assignment.md 🌐 Update translations via Co-op Translator 5 months ago

README.md

علم البيانات في العالم الحقيقي

 رسم توضيحي بواسطة (@sketchthedocs)
علم البيانات في العالم الحقيقي - رسم توضيحي بواسطة @nitya

نحن على وشك إنهاء هذه الرحلة التعليمية!

بدأنا بتعريف علم البيانات والأخلاقيات، واستكشفنا أدوات وتقنيات مختلفة لتحليل البيانات وتصويرها، وراجعنا دورة حياة علم البيانات، وتعرفنا على كيفية توسيع وأتمتة سير العمل في علم البيانات باستخدام خدمات الحوسبة السحابية. لذا، ربما تتساءل: "كيف يمكنني تطبيق كل هذه المعرفة في سياقات العالم الحقيقي؟"

في هذه الدرس، سنستكشف تطبيقات علم البيانات في الصناعة ونغوص في أمثلة محددة في مجالات البحث، العلوم الإنسانية الرقمية، والاستدامة. سننظر في فرص مشاريع الطلاب ونختتم بموارد مفيدة لمساعدتك على مواصلة رحلتك التعليمية!

اختبار ما قبل المحاضرة

اختبار ما قبل المحاضرة

علم البيانات + الصناعة

بفضل ديمقراطية الذكاء الاصطناعي، أصبح من السهل على المطورين تصميم ودمج اتخاذ القرارات المدعومة بالذكاء الاصطناعي والرؤى المستندة إلى البيانات في تجارب المستخدم وسير العمل التطويري. إليك بعض الأمثلة على كيفية تطبيق علم البيانات في العالم الحقيقي عبر الصناعة:

  • Google Flu Trends استخدم علم البيانات لربط مصطلحات البحث باتجاهات الإنفلونزا. على الرغم من وجود عيوب في النهج، إلا أنه أثار الوعي بالإمكانيات (والتحديات) للتنبؤات الصحية المستندة إلى البيانات.

  • تنبؤات مسارات UPS - يشرح كيف تستخدم UPS علم البيانات والتعلم الآلي للتنبؤ بالمسارات المثلى للتسليم، مع الأخذ في الاعتبار ظروف الطقس، أنماط المرور، المواعيد النهائية للتسليم والمزيد.

  • تصوير مسارات سيارات الأجرة في نيويورك - البيانات التي تم جمعها باستخدام قوانين حرية المعلومات ساعدت في تصوير يوم في حياة سيارات الأجرة في نيويورك، مما يساعدنا على فهم كيفية تنقلها في المدينة المزدحمة، الأموال التي تجنيها، ومدة الرحلات خلال كل فترة 24 ساعة.

  • منصة علم البيانات في Uber - تستخدم البيانات (مثل مواقع الالتقاط والتوصيل، مدة الرحلة، المسارات المفضلة، إلخ) التي يتم جمعها من ملايين الرحلات اليومية لبناء أداة تحليل بيانات تساعد في التسعير، السلامة، اكتشاف الاحتيال واتخاذ قرارات التنقل.

  • تحليلات الرياضة - تركز على التحليلات التنبؤية (تحليل الفرق واللاعبين - مثل Moneyball - وإدارة المشجعين) و_تصوير البيانات_ (لوحات الفرق والمشجعين، الألعاب، إلخ) مع تطبيقات مثل اكتشاف المواهب، المراهنات الرياضية وإدارة المخزون/المكان.

  • علم البيانات في البنوك - يبرز قيمة علم البيانات في صناعة التمويل مع تطبيقات تتراوح من نمذجة المخاطر واكتشاف الاحتيال، إلى تقسيم العملاء، التنبؤ في الوقت الحقيقي وأنظمة التوصية. التحليلات التنبؤية تدفع أيضًا تدابير حاسمة مثل درجات الائتمان.

  • علم البيانات في الرعاية الصحية - يبرز تطبيقات مثل التصوير الطبي (مثل MRI، الأشعة السينية، التصوير المقطعي)، الجينوميات (تسلسل الحمض النووي)، تطوير الأدوية (تقييم المخاطر، التنبؤ بالنجاح)، التحليلات التنبؤية (رعاية المرضى ولوجستيات الإمداد)، تتبع الأمراض والوقاية منها، إلخ.

تطبيقات علم البيانات في العالم الحقيقي حقوق الصورة: Data Flair: 6 Amazing Data Science Applications

تُظهر الصورة مجالات أخرى وأمثلة لتطبيق تقنيات علم البيانات. هل تريد استكشاف تطبيقات أخرى؟ تحقق من قسم المراجعة والدراسة الذاتية أدناه.

علم البيانات + البحث

 رسم توضيحي بواسطة (@sketchthedocs)
علم البيانات والبحث - رسم توضيحي بواسطة @nitya

بينما تركز التطبيقات الواقعية غالبًا على حالات الاستخدام الصناعي على نطاق واسع، يمكن أن تكون تطبيقات ومشاريع البحث مفيدة من منظورين:

  • فرص الابتكار - استكشاف النماذج الأولية السريعة للمفاهيم المتقدمة واختبار تجارب المستخدم للتطبيقات المستقبلية.
  • تحديات النشر - التحقيق في الأضرار المحتملة أو العواقب غير المقصودة لتقنيات علم البيانات في سياقات العالم الحقيقي.

بالنسبة للطلاب، يمكن أن توفر هذه المشاريع البحثية فرصًا للتعلم والتعاون التي تحسن فهمك للموضوع، وتوسع وعيك وتفاعلك مع الأشخاص أو الفرق ذات الصلة التي تعمل في مجالات الاهتمام. فما هي شكل المشاريع البحثية وكيف يمكن أن تحدث تأثيرًا؟

لننظر إلى مثال واحد - دراسة MIT Gender Shades من Joy Buolamwini (MIT Media Labs) مع ورقة بحثية مميزة شاركت في تأليفها مع Timnit Gebru (حينها في Microsoft Research) التي ركزت على:

  • ما الهدف: كان الهدف من المشروع البحثي هو تقييم التحيز الموجود في خوارزميات تحليل الوجه الآلية ومجموعات البيانات بناءً على النوع ولون البشرة.
  • لماذا: يتم استخدام تحليل الوجه في مجالات مثل إنفاذ القانون، أمن المطارات، أنظمة التوظيف والمزيد - سياقات حيث يمكن أن تؤدي التصنيفات غير الدقيقة (مثل التحيز) إلى أضرار اقتصادية واجتماعية محتملة للأفراد أو المجموعات المتأثرة. فهم (والقضاء أو التخفيف من) التحيزات هو المفتاح للعدالة في الاستخدام.
  • كيف: أدرك الباحثون أن المعايير الحالية تستخدم بشكل رئيسي موضوعات ذات بشرة فاتحة، وقاموا بتجميع مجموعة بيانات جديدة (1000+ صورة) كانت أكثر توازنًا من حيث النوع ولون البشرة. تم استخدام مجموعة البيانات لتقييم دقة ثلاثة منتجات لتصنيف النوع (من Microsoft، IBM وFace++).

أظهرت النتائج أنه على الرغم من أن دقة التصنيف العامة كانت جيدة، إلا أن هناك فرقًا ملحوظًا في معدلات الخطأ بين المجموعات الفرعية المختلفة - مع ارتفاع معدلات التصنيف الخاطئ للإناث أو الأشخاص ذوي البشرة الداكنة، مما يشير إلى وجود تحيز.

النتائج الرئيسية: أثارت الوعي بأن علم البيانات يحتاج إلى المزيد من مجموعات البيانات الممثلة (مجموعات فرعية متوازنة) والمزيد من الفرق الشاملة (خلفيات متنوعة) للتعرف على هذه التحيزات والقضاء عليها أو التخفيف منها في وقت مبكر في حلول الذكاء الاصطناعي. جهود البحث مثل هذه تلعب أيضًا دورًا رئيسيًا في تعريف العديد من المؤسسات بمبادئ وممارسات الذكاء الاصطناعي المسؤول لتحسين العدالة عبر منتجات وعمليات الذكاء الاصطناعي الخاصة بها.

هل تريد معرفة المزيد عن جهود البحث ذات الصلة في Microsoft؟

علم البيانات + العلوم الإنسانية

 رسم توضيحي بواسطة (@sketchthedocs)
علم البيانات والعلوم الإنسانية الرقمية - رسم توضيحي بواسطة @nitya

تم تعريف العلوم الإنسانية الرقمية على أنها "مجموعة من الممارسات والمناهج التي تجمع بين الأساليب الحاسوبية والاستفسارات الإنسانية". مشاريع Stanford مثل "إعادة تشغيل التاريخ" و_"التفكير الشعري"_ توضح العلاقة بين العلوم الإنسانية الرقمية وعلم البيانات - مع التركيز على تقنيات مثل تحليل الشبكات، تصوير المعلومات، التحليل المكاني والنصي التي يمكن أن تساعدنا في إعادة النظر في مجموعات البيانات التاريخية والأدبية لاستخلاص رؤى جديدة ومنظورات.

هل تريد استكشاف وتوسيع مشروع في هذا المجال؟

تحقق من "إميلي ديكنسون ومقياس المزاج" - مثال رائع من Jen Looper يسأل كيف يمكننا استخدام علم البيانات لإعادة النظر في الشعر المألوف وإعادة تقييم معناه ومساهمات مؤلفه في سياقات جديدة. على سبيل المثال، هل يمكننا التنبؤ بالموسم الذي كتب فيه القصيدة من خلال تحليل نغمتها أو مشاعرها - وماذا يخبرنا هذا عن حالة المؤلف النفسية خلال الفترة ذات الصلة؟

للإجابة على هذا السؤال، نتبع خطوات دورة حياة علم البيانات:

  • اكتساب البيانات - لجمع مجموعة بيانات ذات صلة للتحليل. الخيارات تشمل استخدام واجهة برمجة التطبيقات (مثل Poetry DB API) أو استخراج صفحات الويب (مثل Project Gutenberg) باستخدام أدوات مثل Scrapy.
  • تنظيف البيانات - يشرح كيفية تنسيق النص، تنظيفه وتبسيطه باستخدام أدوات أساسية مثل Visual Studio Code وMicrosoft Excel.
  • تحليل البيانات - يشرح كيفية استيراد مجموعة البيانات إلى "دفاتر الملاحظات" لتحليلها باستخدام حزم Python (مثل pandas، numpy وmatplotlib) لتنظيم البيانات وتصويرها.
  • تحليل المشاعر - يشرح كيفية دمج خدمات السحابة مثل Text Analytics، باستخدام أدوات منخفضة الكود مثل Power Automate لأتمتة سير العمل لمعالجة البيانات.

باستخدام هذا سير العمل، يمكننا استكشاف التأثيرات الموسمية على مشاعر القصائد، ومساعدتنا في تشكيل وجهات نظرنا الخاصة حول المؤلف. جربه بنفسك - ثم قم بتوسيع دفتر الملاحظات لطرح أسئلة أخرى أو تصور البيانات بطرق جديدة!

يمكنك استخدام بعض الأدوات في مجموعة أدوات العلوم الإنسانية الرقمية لمتابعة هذه المسارات البحثية.

علم البيانات + الاستدامة

 رسم توضيحي بواسطة (@sketchthedocs)
علم البيانات والاستدامة - رسم توضيحي بواسطة @nitya

أجندة 2030 للتنمية المستدامة - التي اعتمدها جميع أعضاء الأمم المتحدة في عام 2015 - تحدد 17 هدفًا بما في ذلك تلك التي تركز على حماية الكوكب من التدهور وتأثير تغير المناخ. تدعم مبادرة Microsoft Sustainability هذه الأهداف من خلال استكشاف الطرق التي يمكن أن تدعم بها الحلول التقنية بناء مستقبل أكثر استدامة مع التركيز على 4 أهداف - أن تكون سلبية الكربون، إيجابية المياه، صفر نفايات، ومتنوعة بيولوجيًا بحلول عام 2030.

معالجة هذه التحديات بطريقة قابلة للتوسع وفي الوقت المناسب تتطلب تفكيرًا على نطاق السحابة - وبيانات ضخمة. توفر مبادرة Planetary Computer 4 مكونات لمساعدة علماء البيانات والمطورين في هذا الجهد:

  • كتالوج البيانات - يحتوي على بيتابايت من بيانات أنظمة الأرض (مجانية ومستضافة على Azure).

  • واجهة برمجة تطبيقات الكوكب - لمساعدة المستخدمين في البحث عن البيانات ذات الصلة عبر المكان والزمان.

  • المركز - بيئة مُدارة للعلماء لمعالجة مجموعات البيانات الجغرافية الضخمة.

  • التطبيقات - تعرض حالات الاستخدام والأدوات للحصول على رؤى حول الاستدامة. مشروع الكمبيوتر الكوكبي حاليًا في مرحلة المعاينة (اعتبارًا من سبتمبر 2021) - إليك كيفية البدء بالمساهمة في حلول الاستدامة باستخدام علم البيانات.

  • طلب الوصول لبدء الاستكشاف والتواصل مع الزملاء.

  • استكشاف الوثائق لفهم مجموعات البيانات وواجهات البرمجة المدعومة.

  • استكشاف تطبيقات مثل مراقبة النظم البيئية للحصول على الإلهام لأفكار التطبيقات.

فكر في كيفية استخدام تصور البيانات للكشف عن أو تعزيز رؤى ذات صلة في مجالات مثل تغير المناخ وإزالة الغابات. أو فكر في كيفية استخدام هذه الرؤى لإنشاء تجارب مستخدم جديدة تحفز تغييرات سلوكية نحو حياة أكثر استدامة.

علم البيانات + الطلاب

لقد تحدثنا عن تطبيقات العالم الحقيقي في الصناعة والبحث، واستكشفنا أمثلة لتطبيقات علم البيانات في العلوم الإنسانية الرقمية والاستدامة. إذًا كيف يمكنك بناء مهاراتك ومشاركة خبرتك كمبتدئين في علم البيانات؟

إليك بعض الأمثلة على مشاريع الطلاب في علم البيانات لإلهامك.

🚀 التحدي

ابحث عن مقالات توصي بمشاريع علم البيانات المناسبة للمبتدئين - مثل هذه 50 فكرة موضوعية أو هذه 21 فكرة مشروع أو هذه 16 مشروعًا مع كود المصدر التي يمكنك تحليلها وإعادة تشكيلها. ولا تنسَ التدوين عن رحلاتك التعليمية ومشاركة رؤاك معنا جميعًا.

اختبار ما بعد المحاضرة

اختبار ما بعد المحاضرة

المراجعة والدراسة الذاتية

هل ترغب في استكشاف المزيد من حالات الاستخدام؟ إليك بعض المقالات ذات الصلة:

الواجب

استكشاف مجموعة بيانات الكمبيوتر الكوكبي


إخلاء المسؤولية:
تم ترجمة هذا المستند باستخدام خدمة الترجمة بالذكاء الاصطناعي Co-op Translator. بينما نسعى لتحقيق الدقة، يرجى العلم أن الترجمات الآلية قد تحتوي على أخطاء أو معلومات غير دقيقة. يجب اعتبار المستند الأصلي بلغته الأصلية المصدر الموثوق. للحصول على معلومات حاسمة، يُوصى بالاستعانة بترجمة بشرية احترافية. نحن غير مسؤولين عن أي سوء فهم أو تفسيرات خاطئة ناتجة عن استخدام هذه الترجمة.