From 0f1def896e2631fbc01926e29ff0190081784760 Mon Sep 17 00:00:00 2001 From: leestott Date: Sat, 6 Sep 2025 18:50:51 +0000 Subject: [PATCH] =?UTF-8?q?=F0=9F=8C=90=20Update=20translations=20via=20Co?= =?UTF-8?q?-op=20Translator?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit --- .../20-Real-World-Examples/README.md | 111 +++++++------- .../20-Real-World-Examples/README.md | 97 ++++++------ .../20-Real-World-Examples/README.md | 114 +++++++------- .../20-Real-World-Examples/README.md | 63 ++++---- .../20-Real-World-Examples/README.md | 53 +++---- .../20-Real-World-Examples/README.md | 103 ++++++------- .../20-Real-World-Examples/README.md | 53 +++---- .../20-Real-World-Examples/README.md | 37 ++--- .../20-Real-World-Examples/README.md | 79 +++++----- .../20-Real-World-Examples/README.md | 35 ++--- .../20-Real-World-Examples/README.md | 99 +++++++------ .../20-Real-World-Examples/README.md | 113 +++++++------- .../20-Real-World-Examples/README.md | 66 ++++----- .../20-Real-World-Examples/README.md | 87 +++++------ .../20-Real-World-Examples/README.md | 101 ++++++------- .../20-Real-World-Examples/README.md | 71 ++++----- .../20-Real-World-Examples/README.md | 49 +++--- .../20-Real-World-Examples/README.md | 61 ++++---- .../20-Real-World-Examples/README.md | 81 +++++----- .../20-Real-World-Examples/README.md | 97 ++++++------ .../20-Real-World-Examples/README.md | 95 ++++++------ .../20-Real-World-Examples/README.md | 97 ++++++------ .../20-Real-World-Examples/README.md | 59 ++++---- .../20-Real-World-Examples/README.md | 87 +++++------ .../20-Real-World-Examples/README.md | 95 ++++++------ .../20-Real-World-Examples/README.md | 85 +++++------ .../20-Real-World-Examples/README.md | 105 ++++++------- .../20-Real-World-Examples/README.md | 139 +++++++++--------- .../20-Real-World-Examples/README.md | 113 +++++++------- .../20-Real-World-Examples/README.md | 105 ++++++------- .../20-Real-World-Examples/README.md | 71 ++++----- .../20-Real-World-Examples/README.md | 85 +++++------ .../20-Real-World-Examples/README.md | 53 +++---- .../20-Real-World-Examples/README.md | 83 +++++------ .../20-Real-World-Examples/README.md | 123 ++++++++-------- .../20-Real-World-Examples/README.md | 59 ++++---- .../20-Real-World-Examples/README.md | 51 +++---- .../20-Real-World-Examples/README.md | 43 +++--- .../20-Real-World-Examples/README.md | 85 +++++------ .../20-Real-World-Examples/README.md | 79 +++++----- .../20-Real-World-Examples/README.md | 78 +++++----- .../20-Real-World-Examples/README.md | 113 +++++++------- .../20-Real-World-Examples/README.md | 73 ++++----- .../20-Real-World-Examples/README.md | 87 +++++------ .../20-Real-World-Examples/README.md | 115 +++++++-------- .../20-Real-World-Examples/README.md | 107 +++++++------- .../20-Real-World-Examples/README.md | 111 +++++++------- .../20-Real-World-Examples/README.md | 117 +++++++-------- 48 files changed, 2071 insertions(+), 2012 deletions(-) diff --git a/translations/ar/6-Data-Science-In-Wild/20-Real-World-Examples/README.md b/translations/ar/6-Data-Science-In-Wild/20-Real-World-Examples/README.md index 72806171..57ce280a 100644 --- a/translations/ar/6-Data-Science-In-Wild/20-Real-World-Examples/README.md +++ b/translations/ar/6-Data-Science-In-Wild/20-Real-World-Examples/README.md @@ -1,23 +1,23 @@ # علم البيانات في العالم الحقيقي -| ![ رسم توضيحي بواسطة [(@sketchthedocs)](https://sketchthedocs.dev) ](../../sketchnotes/20-DataScience-RealWorld.png) | +| ![رسم توضيحي من [(@sketchthedocs)](https://sketchthedocs.dev)](../../sketchnotes/20-DataScience-RealWorld.png) | | :--------------------------------------------------------------------------------------------------------------: | -| علم البيانات في العالم الحقيقي - _رسم توضيحي بواسطة [@nitya](https://twitter.com/nitya)_ | +| علم البيانات في العالم الحقيقي - _رسم توضيحي من [@nitya](https://twitter.com/nitya)_ | نحن على وشك إنهاء هذه الرحلة التعليمية! -بدأنا بتعريف علم البيانات والأخلاقيات، واستكشفنا أدوات وتقنيات مختلفة لتحليل البيانات وتصويرها، وراجعنا دورة حياة علم البيانات، وتعرفنا على كيفية توسيع وأتمتة سير العمل في علم البيانات باستخدام خدمات الحوسبة السحابية. لذا، ربما تتساءل: _"كيف يمكنني تطبيق كل هذه المعرفة في سياقات العالم الحقيقي؟"_ +بدأنا بتعريفات علم البيانات والأخلاقيات، واستكشفنا أدوات وتقنيات مختلفة لتحليل البيانات وتصويرها، وراجعنا دورة حياة علم البيانات، واطلعنا على كيفية توسيع وأتمتة سير العمل في علم البيانات باستخدام خدمات الحوسبة السحابية. لذا، ربما تتساءل: _"كيف يمكنني تطبيق كل هذه المعارف في سياقات العالم الحقيقي؟"_ -في هذه الدرس، سنستكشف تطبيقات علم البيانات في الصناعة ونغوص في أمثلة محددة في مجالات البحث، العلوم الإنسانية الرقمية، والاستدامة. سننظر في فرص مشاريع الطلاب ونختتم بموارد مفيدة لمساعدتك على مواصلة رحلتك التعليمية! +في هذا الدرس، سنستكشف تطبيقات علم البيانات في الصناعة ونغوص في أمثلة محددة في مجالات البحث، العلوم الإنسانية الرقمية، والاستدامة. سنلقي نظرة على فرص مشاريع الطلاب ونختتم بموارد مفيدة لمساعدتك على مواصلة رحلتك التعليمية! ## اختبار ما قبل المحاضرة @@ -25,50 +25,50 @@ CO_OP_TRANSLATOR_METADATA: ## علم البيانات + الصناعة -بفضل ديمقراطية الذكاء الاصطناعي، أصبح من السهل على المطورين تصميم ودمج اتخاذ القرارات المدعومة بالذكاء الاصطناعي والرؤى المستندة إلى البيانات في تجارب المستخدم وسير العمل التطويري. إليك بعض الأمثلة على كيفية تطبيق علم البيانات في العالم الحقيقي عبر الصناعة: +بفضل ديمقراطية الذكاء الاصطناعي، أصبح من السهل على المطورين تصميم ودمج اتخاذ القرارات المدعوم بالذكاء الاصطناعي والرؤى المستندة إلى البيانات في تجارب المستخدم وسير العمل التطويري. إليك بعض الأمثلة على كيفية تطبيق علم البيانات في العالم الحقيقي عبر الصناعة: - * [Google Flu Trends](https://www.wired.com/2015/10/can-learn-epic-failure-google-flu-trends/) استخدم علم البيانات لربط مصطلحات البحث باتجاهات الإنفلونزا. على الرغم من وجود عيوب في النهج، إلا أنه أثار الوعي بالإمكانيات (والتحديات) للتنبؤات الصحية المستندة إلى البيانات. +* [Google Flu Trends](https://www.wired.com/2015/10/can-learn-epic-failure-google-flu-trends/) استخدم علم البيانات لربط مصطلحات البحث باتجاهات الإنفلونزا. على الرغم من وجود عيوب في النهج، إلا أنه أثار الوعي بالإمكانات (والتحديات) للتنبؤات الصحية المستندة إلى البيانات. - * [تنبؤات مسارات UPS](https://www.technologyreview.com/2018/11/21/139000/how-ups-uses-ai-to-outsmart-bad-weather/) - يشرح كيف تستخدم UPS علم البيانات والتعلم الآلي للتنبؤ بالمسارات المثلى للتسليم، مع الأخذ في الاعتبار ظروف الطقس، أنماط المرور، المواعيد النهائية للتسليم والمزيد. +* [توقعات مسارات UPS](https://www.technologyreview.com/2018/11/21/139000/how-ups-uses-ai-to-outsmart-bad-weather/) - يوضح كيف تستخدم UPS علم البيانات والتعلم الآلي للتنبؤ بالمسارات المثلى للتوصيل، مع الأخذ في الاعتبار ظروف الطقس، أنماط المرور، المواعيد النهائية للتسليم والمزيد. - * [تصوير مسارات سيارات الأجرة في نيويورك](http://chriswhong.github.io/nyctaxi/) - البيانات التي تم جمعها باستخدام [قوانين حرية المعلومات](https://chriswhong.com/open-data/foil_nyc_taxi/) ساعدت في تصوير يوم في حياة سيارات الأجرة في نيويورك، مما يساعدنا على فهم كيفية تنقلها في المدينة المزدحمة، الأموال التي تجنيها، ومدة الرحلات خلال كل فترة 24 ساعة. +* [تصوير مسارات سيارات الأجرة في نيويورك](http://chriswhong.github.io/nyctaxi/) - البيانات التي تم جمعها باستخدام [قوانين حرية المعلومات](https://chriswhong.com/open-data/foil_nyc_taxi/) ساعدت في تصور يوم في حياة سيارات الأجرة في نيويورك، مما يساعدنا على فهم كيفية تنقلها في المدينة المزدحمة، الأموال التي تحققها، ومدة الرحلات على مدار 24 ساعة. - * [منصة علم البيانات في Uber](https://eng.uber.com/dsw/) - تستخدم البيانات (مثل مواقع الالتقاط والتوصيل، مدة الرحلة، المسارات المفضلة، إلخ) التي يتم جمعها من ملايين الرحلات اليومية لبناء أداة تحليل بيانات تساعد في التسعير، السلامة، اكتشاف الاحتيال واتخاذ قرارات التنقل. +* [منصة علم البيانات في أوبر](https://eng.uber.com/dsw/) - تستخدم البيانات (مثل مواقع الالتقاط والتوصيل، مدة الرحلة، المسارات المفضلة، إلخ) التي يتم جمعها من ملايين الرحلات اليومية لبناء أداة تحليل بيانات تساعد في التسعير، السلامة، اكتشاف الاحتيال واتخاذ قرارات التنقل. - * [تحليلات الرياضة](https://towardsdatascience.com/scope-of-analytics-in-sports-world-37ed09c39860) - تركز على _التحليلات التنبؤية_ (تحليل الفرق واللاعبين - مثل [Moneyball](https://datasciencedegree.wisconsin.edu/blog/moneyball-proves-importance-big-data-big-ideas/) - وإدارة المشجعين) و_تصوير البيانات_ (لوحات الفرق والمشجعين، الألعاب، إلخ) مع تطبيقات مثل اكتشاف المواهب، المراهنات الرياضية وإدارة المخزون/المكان. +* [تحليلات الرياضة](https://towardsdatascience.com/scope-of-analytics-in-sports-world-37ed09c39860) - تركز على _التحليلات التنبؤية_ (تحليل الفرق واللاعبين - مثل [Moneyball](https://datasciencedegree.wisconsin.edu/blog/moneyball-proves-importance-big-data-big-ideas/) - وإدارة الجماهير) و_تصوير البيانات_ (لوحات التحكم للفرق والجماهير، الألعاب، إلخ) مع تطبيقات مثل اكتشاف المواهب، المراهنات الرياضية وإدارة المخزون/الملاعب. - * [علم البيانات في البنوك](https://data-flair.training/blogs/data-science-in-banking/) - يبرز قيمة علم البيانات في صناعة التمويل مع تطبيقات تتراوح من نمذجة المخاطر واكتشاف الاحتيال، إلى تقسيم العملاء، التنبؤ في الوقت الحقيقي وأنظمة التوصية. التحليلات التنبؤية تدفع أيضًا تدابير حاسمة مثل [درجات الائتمان](https://dzone.com/articles/using-big-data-and-predictive-analytics-for-credit). +* [علم البيانات في البنوك](https://data-flair.training/blogs/data-science-in-banking/) - يبرز قيمة علم البيانات في صناعة التمويل مع تطبيقات تتراوح من نمذجة المخاطر واكتشاف الاحتيال، إلى تقسيم العملاء، التنبؤ في الوقت الحقيقي وأنظمة التوصية. التحليلات التنبؤية تدفع أيضًا تدابير حاسمة مثل [درجات الائتمان](https://dzone.com/articles/using-big-data-and-predictive-analytics-for-credit). - * [علم البيانات في الرعاية الصحية](https://data-flair.training/blogs/data-science-in-healthcare/) - يبرز تطبيقات مثل التصوير الطبي (مثل MRI، الأشعة السينية، التصوير المقطعي)، الجينوميات (تسلسل الحمض النووي)، تطوير الأدوية (تقييم المخاطر، التنبؤ بالنجاح)، التحليلات التنبؤية (رعاية المرضى ولوجستيات الإمداد)، تتبع الأمراض والوقاية منها، إلخ. +* [علم البيانات في الرعاية الصحية](https://data-flair.training/blogs/data-science-in-healthcare/) - يبرز تطبيقات مثل التصوير الطبي (مثل التصوير بالرنين المغناطيسي، الأشعة السينية، التصوير المقطعي)، الجينوميات (تسلسل الحمض النووي)، تطوير الأدوية (تقييم المخاطر، التنبؤ بالنجاح)، التحليلات التنبؤية (رعاية المرضى ولوجستيات الإمداد)، تتبع الأمراض والوقاية منها، إلخ. -![تطبيقات علم البيانات في العالم الحقيقي](../../../../6-Data-Science-In-Wild/20-Real-World-Examples/images/data-science-applications.png) حقوق الصورة: [Data Flair: 6 Amazing Data Science Applications ](https://data-flair.training/blogs/data-science-applications/) +![تطبيقات علم البيانات في العالم الحقيقي](../../../../translated_images/data-science-applications.4e5019cd8790ebac2277ff5f08af386f8727cac5d30f77727c7090677e6adb9c.ar.png) مصدر الصورة: [Data Flair: 6 Amazing Data Science Applications](https://data-flair.training/blogs/data-science-applications/) -تُظهر الصورة مجالات أخرى وأمثلة لتطبيق تقنيات علم البيانات. هل تريد استكشاف تطبيقات أخرى؟ تحقق من قسم [المراجعة والدراسة الذاتية](../../../../6-Data-Science-In-Wild/20-Real-World-Examples) أدناه. +تُظهر الصورة مجالات وأمثلة أخرى لتطبيق تقنيات علم البيانات. هل تريد استكشاف تطبيقات أخرى؟ تحقق من قسم [المراجعة والدراسة الذاتية](../../../../6-Data-Science-In-Wild/20-Real-World-Examples) أدناه. ## علم البيانات + البحث -| ![ رسم توضيحي بواسطة [(@sketchthedocs)](https://sketchthedocs.dev) ](../../sketchnotes/20-DataScience-Research.png) | +| ![رسم توضيحي من [(@sketchthedocs)](https://sketchthedocs.dev)](../../sketchnotes/20-DataScience-Research.png) | | :---------------------------------------------------------------------------------------------------------------: | -| علم البيانات والبحث - _رسم توضيحي بواسطة [@nitya](https://twitter.com/nitya)_ | +| علم البيانات والبحث - _رسم توضيحي من [@nitya](https://twitter.com/nitya)_ | بينما تركز التطبيقات الواقعية غالبًا على حالات الاستخدام الصناعي على نطاق واسع، يمكن أن تكون تطبيقات ومشاريع _البحث_ مفيدة من منظورين: * _فرص الابتكار_ - استكشاف النماذج الأولية السريعة للمفاهيم المتقدمة واختبار تجارب المستخدم للتطبيقات المستقبلية. -* _تحديات النشر_ - التحقيق في الأضرار المحتملة أو العواقب غير المقصودة لتقنيات علم البيانات في سياقات العالم الحقيقي. +* _تحديات النشر_ - التحقيق في الأضرار المحتملة أو العواقب غير المقصودة لتقنيات علم البيانات في السياقات الواقعية. -بالنسبة للطلاب، يمكن أن توفر هذه المشاريع البحثية فرصًا للتعلم والتعاون التي تحسن فهمك للموضوع، وتوسع وعيك وتفاعلك مع الأشخاص أو الفرق ذات الصلة التي تعمل في مجالات الاهتمام. فما هي شكل المشاريع البحثية وكيف يمكن أن تحدث تأثيرًا؟ +بالنسبة للطلاب، يمكن أن توفر هذه المشاريع البحثية فرصًا للتعلم والتعاون تعزز فهمك للموضوع، وتوسع وعيك وتفاعلك مع الأشخاص أو الفرق ذات الصلة التي تعمل في مجالات اهتمامك. فما هي المشاريع البحثية وكيف يمكن أن تحدث تأثيرًا؟ -لننظر إلى مثال واحد - [دراسة MIT Gender Shades](http://gendershades.org/overview.html) من Joy Buolamwini (MIT Media Labs) مع [ورقة بحثية مميزة](http://proceedings.mlr.press/v81/buolamwini18a/buolamwini18a.pdf) شاركت في تأليفها مع Timnit Gebru (حينها في Microsoft Research) التي ركزت على: +دعونا نلقي نظرة على مثال واحد - [دراسة Gender Shades من MIT](http://gendershades.org/overview.html) التي أجرتها جوي بولامويني (مختبرات MIT Media) مع [ورقة بحثية مميزة](http://proceedings.mlr.press/v81/buolamwini18a/buolamwini18a.pdf) شاركت في تأليفها مع تيمنيت جيبرو (حينها في Microsoft Research) والتي ركزت على: - * **ما الهدف:** كان الهدف من المشروع البحثي هو _تقييم التحيز الموجود في خوارزميات تحليل الوجه الآلية ومجموعات البيانات_ بناءً على النوع ولون البشرة. - * **لماذا:** يتم استخدام تحليل الوجه في مجالات مثل إنفاذ القانون، أمن المطارات، أنظمة التوظيف والمزيد - سياقات حيث يمكن أن تؤدي التصنيفات غير الدقيقة (مثل التحيز) إلى أضرار اقتصادية واجتماعية محتملة للأفراد أو المجموعات المتأثرة. فهم (والقضاء أو التخفيف من) التحيزات هو المفتاح للعدالة في الاستخدام. - * **كيف:** أدرك الباحثون أن المعايير الحالية تستخدم بشكل رئيسي موضوعات ذات بشرة فاتحة، وقاموا بتجميع مجموعة بيانات جديدة (1000+ صورة) كانت _أكثر توازنًا_ من حيث النوع ولون البشرة. تم استخدام مجموعة البيانات لتقييم دقة ثلاثة منتجات لتصنيف النوع (من Microsoft، IBM وFace++). +* **ما الهدف:** كان الهدف من المشروع البحثي هو _تقييم التحيز الموجود في خوارزميات وتحليلات الوجه الآلية_ بناءً على النوع ولون البشرة. +* **لماذا:** تُستخدم تحليلات الوجه في مجالات مثل إنفاذ القانون، أمن المطارات، أنظمة التوظيف والمزيد - وهي سياقات يمكن أن تسبب فيها التصنيفات غير الدقيقة (مثلًا بسبب التحيز) أضرارًا اقتصادية واجتماعية محتملة للأفراد أو المجموعات المتأثرة. فهم (والتخلص أو التخفيف من) التحيزات هو المفتاح لتحقيق العدالة في الاستخدام. +* **كيف:** أدرك الباحثون أن المعايير الحالية استخدمت في الغالب موضوعات ذات بشرة فاتحة، وقاموا بتجميع مجموعة بيانات جديدة (1000+ صورة) كانت _أكثر توازنًا_ من حيث النوع ولون البشرة. تم استخدام مجموعة البيانات لتقييم دقة ثلاثة منتجات لتصنيف النوع (من Microsoft، IBM وFace++). -أظهرت النتائج أنه على الرغم من أن دقة التصنيف العامة كانت جيدة، إلا أن هناك فرقًا ملحوظًا في معدلات الخطأ بين المجموعات الفرعية المختلفة - مع ارتفاع معدلات **التصنيف الخاطئ** للإناث أو الأشخاص ذوي البشرة الداكنة، مما يشير إلى وجود تحيز. +أظهرت النتائج أنه على الرغم من أن دقة التصنيف الإجمالية كانت جيدة، إلا أن هناك فرقًا ملحوظًا في معدلات الخطأ بين المجموعات الفرعية المختلفة - حيث كان **الخطأ في تحديد النوع** أعلى للإناث أو الأشخاص ذوي البشرة الداكنة، مما يشير إلى وجود تحيز. -**النتائج الرئيسية:** أثارت الوعي بأن علم البيانات يحتاج إلى المزيد من _مجموعات البيانات الممثلة_ (مجموعات فرعية متوازنة) والمزيد من _الفرق الشاملة_ (خلفيات متنوعة) للتعرف على هذه التحيزات والقضاء عليها أو التخفيف منها في وقت مبكر في حلول الذكاء الاصطناعي. جهود البحث مثل هذه تلعب أيضًا دورًا رئيسيًا في تعريف العديد من المؤسسات بمبادئ وممارسات _الذكاء الاصطناعي المسؤول_ لتحسين العدالة عبر منتجات وعمليات الذكاء الاصطناعي الخاصة بها. +**النتائج الرئيسية:** أثارت الدراسة الوعي بأن علم البيانات يحتاج إلى _مجموعات بيانات تمثيلية أكثر_ (مجموعات فرعية متوازنة) وفرق _أكثر شمولية_ (خلفيات متنوعة) للتعرف على مثل هذه التحيزات والقضاء عليها أو التخفيف منها في وقت مبكر في حلول الذكاء الاصطناعي. كما أن الجهود البحثية مثل هذه تلعب دورًا أساسيًا في تعريف العديد من المؤسسات بالمبادئ والممارسات الخاصة بـ _الذكاء الاصطناعي المسؤول_ لتحسين العدالة عبر منتجاتها وعملياتها. -**هل تريد معرفة المزيد عن جهود البحث ذات الصلة في Microsoft؟** +**هل تريد معرفة المزيد عن الجهود البحثية ذات الصلة في Microsoft؟** * تحقق من [مشاريع Microsoft Research](https://www.microsoft.com/research/research-area/artificial-intelligence/?facet%5Btax%5D%5Bmsr-research-area%5D%5B%5D=13556&facet%5Btax%5D%5Bmsr-content-type%5D%5B%5D=msr-project) في مجال الذكاء الاصطناعي. * استكشف مشاريع الطلاب من [مدرسة Microsoft Research Data Science الصيفية](https://www.microsoft.com/en-us/research/academic-program/data-science-summer-school/). @@ -76,40 +76,40 @@ CO_OP_TRANSLATOR_METADATA: ## علم البيانات + العلوم الإنسانية -| ![ رسم توضيحي بواسطة [(@sketchthedocs)](https://sketchthedocs.dev) ](../../sketchnotes/20-DataScience-Humanities.png) | +| ![رسم توضيحي من [(@sketchthedocs)](https://sketchthedocs.dev)](../../sketchnotes/20-DataScience-Humanities.png) | | :---------------------------------------------------------------------------------------------------------------: | -| علم البيانات والعلوم الإنسانية الرقمية - _رسم توضيحي بواسطة [@nitya](https://twitter.com/nitya)_ | +| علم البيانات والعلوم الإنسانية الرقمية - _رسم توضيحي من [@nitya](https://twitter.com/nitya)_ | -تم تعريف العلوم الإنسانية الرقمية [على أنها](https://digitalhumanities.stanford.edu/about-dh-stanford) "مجموعة من الممارسات والمناهج التي تجمع بين الأساليب الحاسوبية والاستفسارات الإنسانية". مشاريع [Stanford](https://digitalhumanities.stanford.edu/projects) مثل _"إعادة تشغيل التاريخ"_ و_"التفكير الشعري"_ توضح العلاقة بين [العلوم الإنسانية الرقمية وعلم البيانات](https://digitalhumanities.stanford.edu/digital-humanities-and-data-science) - مع التركيز على تقنيات مثل تحليل الشبكات، تصوير المعلومات، التحليل المكاني والنصي التي يمكن أن تساعدنا في إعادة النظر في مجموعات البيانات التاريخية والأدبية لاستخلاص رؤى جديدة ومنظورات. +تم تعريف العلوم الإنسانية الرقمية [على أنها](https://digitalhumanities.stanford.edu/about-dh-stanford) "مجموعة من الممارسات والأساليب التي تجمع بين الطرق الحاسوبية والاستفسارات الإنسانية". مشاريع [Stanford](https://digitalhumanities.stanford.edu/projects) مثل _"إعادة تشغيل التاريخ"_ و_"التفكير الشعري"_ توضح العلاقة بين [العلوم الإنسانية الرقمية وعلم البيانات](https://digitalhumanities.stanford.edu/digital-humanities-and-data-science) - مع التركيز على تقنيات مثل تحليل الشبكات، تصور المعلومات، التحليل المكاني والنصي التي يمكن أن تساعدنا في إعادة النظر في مجموعات البيانات التاريخية والأدبية لاستخلاص رؤى ومنظورات جديدة. *هل تريد استكشاف وتوسيع مشروع في هذا المجال؟* -تحقق من ["إميلي ديكنسون ومقياس المزاج"](https://gist.github.com/jlooper/ce4d102efd057137bc000db796bfd671) - مثال رائع من [Jen Looper](https://twitter.com/jenlooper) يسأل كيف يمكننا استخدام علم البيانات لإعادة النظر في الشعر المألوف وإعادة تقييم معناه ومساهمات مؤلفه في سياقات جديدة. على سبيل المثال، _هل يمكننا التنبؤ بالموسم الذي كتب فيه القصيدة من خلال تحليل نغمتها أو مشاعرها_ - وماذا يخبرنا هذا عن حالة المؤلف النفسية خلال الفترة ذات الصلة؟ +تحقق من ["إميلي ديكنسون ومقياس المزاج"](https://gist.github.com/jlooper/ce4d102efd057137bc000db796bfd671) - مثال رائع من [جين لوبر](https://twitter.com/jenlooper) يسأل كيف يمكننا استخدام علم البيانات لإعادة النظر في الشعر المألوف وإعادة تقييم معناه ومساهمات مؤلفه في سياقات جديدة. على سبيل المثال، _هل يمكننا التنبؤ بالموسم الذي كتب فيه القصيدة من خلال تحليل نغمتها أو مشاعرها_ - وماذا يخبرنا هذا عن الحالة النفسية للمؤلف خلال الفترة ذات الصلة؟ للإجابة على هذا السؤال، نتبع خطوات دورة حياة علم البيانات: - * [`اكتساب البيانات`](https://gist.github.com/jlooper/ce4d102efd057137bc000db796bfd671#acquiring-the-dataset) - لجمع مجموعة بيانات ذات صلة للتحليل. الخيارات تشمل استخدام واجهة برمجة التطبيقات (مثل [Poetry DB API](https://poetrydb.org/index.html)) أو استخراج صفحات الويب (مثل [Project Gutenberg](https://www.gutenberg.org/files/12242/12242-h/12242-h.htm)) باستخدام أدوات مثل [Scrapy](https://scrapy.org/). - * [`تنظيف البيانات`](https://gist.github.com/jlooper/ce4d102efd057137bc000db796bfd671#clean-the-data) - يشرح كيفية تنسيق النص، تنظيفه وتبسيطه باستخدام أدوات أساسية مثل Visual Studio Code وMicrosoft Excel. - * [`تحليل البيانات`](https://gist.github.com/jlooper/ce4d102efd057137bc000db796bfd671#working-with-the-data-in-a-notebook) - يشرح كيفية استيراد مجموعة البيانات إلى "دفاتر الملاحظات" لتحليلها باستخدام حزم Python (مثل pandas، numpy وmatplotlib) لتنظيم البيانات وتصويرها. - * [`تحليل المشاعر`](https://gist.github.com/jlooper/ce4d102efd057137bc000db796bfd671#sentiment-analysis-using-cognitive-services) - يشرح كيفية دمج خدمات السحابة مثل Text Analytics، باستخدام أدوات منخفضة الكود مثل [Power Automate](https://flow.microsoft.com/en-us/) لأتمتة سير العمل لمعالجة البيانات. +* [`اكتساب البيانات`](https://gist.github.com/jlooper/ce4d102efd057137bc000db796bfd671#acquiring-the-dataset) - لجمع مجموعة بيانات ذات صلة للتحليل. الخيارات تشمل استخدام واجهة برمجة التطبيقات (مثل [Poetry DB API](https://poetrydb.org/index.html)) أو استخراج صفحات الويب (مثل [Project Gutenberg](https://www.gutenberg.org/files/12242/12242-h/12242-h.htm)) باستخدام أدوات مثل [Scrapy](https://scrapy.org/). +* [`تنظيف البيانات`](https://gist.github.com/jlooper/ce4d102efd057137bc000db796bfd671#clean-the-data) - يوضح كيفية تنسيق النصوص وتنقيتها وتبسيطها باستخدام أدوات أساسية مثل Visual Studio Code وMicrosoft Excel. +* [`تحليل البيانات`](https://gist.github.com/jlooper/ce4d102efd057137bc000db796bfd671#working-with-the-data-in-a-notebook) - يوضح كيفية استيراد مجموعة البيانات إلى "دفاتر الملاحظات" لتحليلها باستخدام حزم Python (مثل pandas، numpy وmatplotlib) لتنظيم البيانات وتصويرها. +* [`تحليل المشاعر`](https://gist.github.com/jlooper/ce4d102efd057137bc000db796bfd671#sentiment-analysis-using-cognitive-services) - يوضح كيفية دمج الخدمات السحابية مثل Text Analytics، باستخدام أدوات منخفضة الكود مثل [Power Automate](https://flow.microsoft.com/en-us/) لأتمتة سير العمل لمعالجة البيانات. -باستخدام هذا سير العمل، يمكننا استكشاف التأثيرات الموسمية على مشاعر القصائد، ومساعدتنا في تشكيل وجهات نظرنا الخاصة حول المؤلف. جربه بنفسك - ثم قم بتوسيع دفتر الملاحظات لطرح أسئلة أخرى أو تصور البيانات بطرق جديدة! +باستخدام هذا النهج، يمكننا استكشاف التأثيرات الموسمية على مشاعر القصائد، ومساعدتنا في تشكيل وجهات نظرنا الخاصة حول المؤلف. جربها بنفسك - ثم قم بتوسيع دفتر الملاحظات لطرح أسئلة أخرى أو تصور البيانات بطرق جديدة! -> يمكنك استخدام بعض الأدوات في [مجموعة أدوات العلوم الإنسانية الرقمية](https://github.com/Digital-Humanities-Toolkit) لمتابعة هذه المسارات البحثية. +> يمكنك استخدام بعض الأدوات الموجودة في [مجموعة أدوات العلوم الإنسانية الرقمية](https://github.com/Digital-Humanities-Toolkit) لمتابعة هذه الاستفسارات. ## علم البيانات + الاستدامة -| ![ رسم توضيحي بواسطة [(@sketchthedocs)](https://sketchthedocs.dev) ](../../sketchnotes/20-DataScience-Sustainability.png) | +| ![رسم توضيحي من [(@sketchthedocs)](https://sketchthedocs.dev)](../../sketchnotes/20-DataScience-Sustainability.png) | | :---------------------------------------------------------------------------------------------------------------: | -| علم البيانات والاستدامة - _رسم توضيحي بواسطة [@nitya](https://twitter.com/nitya)_ | +| علم البيانات والاستدامة - _رسم توضيحي من [@nitya](https://twitter.com/nitya)_ | -[أجندة 2030 للتنمية المستدامة](https://sdgs.un.org/2030agenda) - التي اعتمدها جميع أعضاء الأمم المتحدة في عام 2015 - تحدد 17 هدفًا بما في ذلك تلك التي تركز على **حماية الكوكب** من التدهور وتأثير تغير المناخ. تدعم مبادرة [Microsoft Sustainability](https://www.microsoft.com/en-us/sustainability) هذه الأهداف من خلال استكشاف الطرق التي يمكن أن تدعم بها الحلول التقنية بناء مستقبل أكثر استدامة مع [التركيز على 4 أهداف](https://dev.to/azure/a-visual-guide-to-sustainable-software-engineering-53hh) - أن تكون سلبية الكربون، إيجابية المياه، صفر نفايات، ومتنوعة بيولوجيًا بحلول عام 2030. +[أجندة 2030 للتنمية المستدامة](https://sdgs.un.org/2030agenda) - التي اعتمدها جميع أعضاء الأمم المتحدة في 2015 - تحدد 17 هدفًا بما في ذلك الأهداف التي تركز على **حماية الكوكب** من التدهور وتأثير تغير المناخ. تدعم مبادرة [Microsoft Sustainability](https://www.microsoft.com/en-us/sustainability) هذه الأهداف من خلال استكشاف الطرق التي يمكن أن تدعم بها الحلول التكنولوجية بناء مستقبل أكثر استدامة مع [التركيز على 4 أهداف](https://dev.to/azure/a-visual-guide-to-sustainable-software-engineering-53hh) - أن تكون سلبية الكربون، إيجابية المياه، صفر نفايات، ومتنوعة بيولوجيًا بحلول عام 2030. -معالجة هذه التحديات بطريقة قابلة للتوسع وفي الوقت المناسب تتطلب تفكيرًا على نطاق السحابة - وبيانات ضخمة. توفر مبادرة [Planetary Computer](https://planetarycomputer.microsoft.com/) 4 مكونات لمساعدة علماء البيانات والمطورين في هذا الجهد: +معالجة هذه التحديات بطريقة قابلة للتوسع وفي الوقت المناسب تتطلب تفكيرًا على مستوى السحابة - وبيانات ضخمة. توفر مبادرة [Planetary Computer](https://planetarycomputer.microsoft.com/) 4 مكونات لمساعدة علماء البيانات والمطورين في هذا الجهد: - * [كتالوج البيانات](https://planetarycomputer.microsoft.com/catalog) - يحتوي على بيتابايت من بيانات أنظمة الأرض (مجانية ومستضافة على Azure). - * [واجهة برمجة تطبيقات الكوكب](https://planetarycomputer.microsoft.com/docs/reference/stac/) - لمساعدة المستخدمين في البحث عن البيانات ذات الصلة عبر المكان والزمان. - * [المركز](https://planetarycomputer.microsoft.com/docs/overview/environment/) - بيئة مُدارة للعلماء لمعالجة مجموعات البيانات الجغرافية الضخمة. - * [التطبيقات](https://planetarycomputer.microsoft.com/applications) - تعرض حالات الاستخدام والأدوات للحصول على رؤى حول الاستدامة. +* [كتالوج البيانات](https://planetarycomputer.microsoft.com/catalog) - يحتوي على بيتابايت من بيانات أنظمة الأرض (مجانية ومستضافة على Azure). +* [واجهة برمجة التطبيقات الكوكبية](https://planetarycomputer.microsoft.com/docs/reference/stac/) - لمساعدة المستخدمين على البحث عن البيانات ذات الصلة عبر الزمان والمكان. +* [المحور](https://planetarycomputer.microsoft.com/docs/overview/environment/) - بيئة مُدارة للعلماء لمعالجة مجموعات البيانات الجغرافية الضخمة. +* [التطبيقات](https://planetarycomputer.microsoft.com/applications) - تعرض حالات الاستخدام والأدوات للحصول على رؤى حول الاستدامة. **مشروع الكمبيوتر الكوكبي حاليًا في مرحلة المعاينة (اعتبارًا من سبتمبر 2021)** - إليك كيفية البدء بالمساهمة في حلول الاستدامة باستخدام علم البيانات. * [طلب الوصول](https://planetarycomputer.microsoft.com/account/request) لبدء الاستكشاف والتواصل مع الزملاء. @@ -120,18 +120,18 @@ CO_OP_TRANSLATOR_METADATA: ## علم البيانات + الطلاب -لقد تحدثنا عن تطبيقات العالم الحقيقي في الصناعة والبحث، واستكشفنا أمثلة لتطبيقات علم البيانات في العلوم الإنسانية الرقمية والاستدامة. إذًا كيف يمكنك بناء مهاراتك ومشاركة خبرتك كمبتدئين في علم البيانات؟ +لقد تحدثنا عن التطبيقات الواقعية في الصناعة والبحث، واستكشفنا أمثلة لتطبيقات علم البيانات في العلوم الإنسانية الرقمية والاستدامة. إذن كيف يمكنك بناء مهاراتك ومشاركة خبراتك كمبتدئين في علم البيانات؟ -إليك بعض الأمثلة على مشاريع الطلاب في علم البيانات لإلهامك. +إليك بعض الأمثلة لمشاريع الطلاب في علم البيانات لإلهامك. - * [مدرسة الصيف لعلم البيانات MSR](https://www.microsoft.com/en-us/research/academic-program/data-science-summer-school/#!projects) مع [مشاريع](https://github.com/msr-ds3) على GitHub تستكشف موضوعات مثل: - - [التحيز العنصري في استخدام الشرطة للقوة](https://www.microsoft.com/en-us/research/video/data-science-summer-school-2019-replicating-an-empirical-analysis-of-racial-differences-in-police-use-of-force/) | [Github](https://github.com/msr-ds3/stop-question-frisk) + * [مدرسة الصيف لعلم البيانات MSR](https://www.microsoft.com/en-us/research/academic-program/data-science-summer-school/#!projects) مع [مشاريع](https://github.com/msr-ds3) على GitHub تستكشف مواضيع مثل: + - [التحيز العرقي في استخدام الشرطة للقوة](https://www.microsoft.com/en-us/research/video/data-science-summer-school-2019-replicating-an-empirical-analysis-of-racial-differences-in-police-use-of-force/) | [Github](https://github.com/msr-ds3/stop-question-frisk) - [موثوقية نظام مترو الأنفاق في نيويورك](https://www.microsoft.com/en-us/research/video/data-science-summer-school-2018-exploring-the-reliability-of-the-nyc-subway-system/) | [Github](https://github.com/msr-ds3/nyctransit) * [رقمنة الثقافة المادية: استكشاف التوزيعات الاجتماعية والاقتصادية في سيركاب](https://claremont.maps.arcgis.com/apps/Cascade/index.html?appid=bdf2aef0f45a4674ba41cd373fa23afc) - من [أورنيلا ألتونيان](https://twitter.com/ornelladotcom) وفريقها في كليرمونت، باستخدام [ArcGIS StoryMaps](https://storymaps.arcgis.com/). ## 🚀 التحدي -ابحث عن مقالات توصي بمشاريع علم البيانات المناسبة للمبتدئين - مثل [هذه 50 فكرة موضوعية](https://www.upgrad.com/blog/data-science-project-ideas-topics-beginners/) أو [هذه 21 فكرة مشروع](https://www.intellspot.com/data-science-project-ideas) أو [هذه 16 مشروعًا مع كود المصدر](https://data-flair.training/blogs/data-science-project-ideas/) التي يمكنك تحليلها وإعادة تشكيلها. ولا تنسَ التدوين عن رحلاتك التعليمية ومشاركة رؤاك معنا جميعًا. +ابحث عن مقالات توصي بمشاريع علم البيانات المناسبة للمبتدئين - مثل [هذه 50 فكرة موضوعية](https://www.upgrad.com/blog/data-science-project-ideas-topics-beginners/) أو [هذه 21 فكرة مشروع](https://www.intellspot.com/data-science-project-ideas) أو [هذه 16 مشروعًا مع كود المصدر](https://data-flair.training/blogs/data-science-project-ideas/) التي يمكنك تفكيكها وإعادة مزجها. ولا تنسَ التدوين عن رحلاتك التعليمية ومشاركة رؤاك معنا جميعًا. ## اختبار ما بعد المحاضرة @@ -139,11 +139,12 @@ CO_OP_TRANSLATOR_METADATA: ## المراجعة والدراسة الذاتية -هل ترغب في استكشاف المزيد من حالات الاستخدام؟ إليك بعض المقالات ذات الصلة: +هل تريد استكشاف المزيد من حالات الاستخدام؟ إليك بعض المقالات ذات الصلة: * [17 تطبيقًا وأمثلة لعلم البيانات](https://builtin.com/data-science/data-science-applications-examples) - يوليو 2021 - * [11 تطبيقًا مذهلًا لعلم البيانات في العالم الحقيقي](https://myblindbird.com/data-science-applications-real-world/) - مايو 2021 - * [علم البيانات في العالم الحقيقي](https://towardsdatascience.com/data-science-in-the-real-world/home) - مجموعة مقالات - * علم البيانات في: [التعليم](https://data-flair.training/blogs/data-science-in-education/)، [الزراعة](https://data-flair.training/blogs/data-science-in-agriculture/)، [المالية](https://data-flair.training/blogs/data-science-in-finance/)، [الأفلام](https://data-flair.training/blogs/data-science-at-movies/) والمزيد. + * [11 تطبيقًا مذهلًا لعلم البيانات في العالم الواقعي](https://myblindbird.com/data-science-applications-real-world/) - مايو 2021 + * [علم البيانات في العالم الواقعي](https://towardsdatascience.com/data-science-in-the-real-world/home) - مجموعة مقالات + * [12 تطبيقًا واقعيًا لعلم البيانات مع أمثلة](https://www.scaler.com/blog/data-science-applications/) - مايو 2024 + * علم البيانات في: [التعليم](https://data-flair.training/blogs/data-science-in-education/)، [الزراعة](https://data-flair.training/blogs/data-science-in-agriculture/)، [التمويل](https://data-flair.training/blogs/data-science-in-finance/)، [الأفلام](https://data-flair.training/blogs/data-science-at-movies/)، [الرعاية الصحية](https://onlinedegrees.sandiego.edu/data-science-health-care/) والمزيد. ## الواجب @@ -152,4 +153,4 @@ CO_OP_TRANSLATOR_METADATA: --- **إخلاء المسؤولية**: -تم ترجمة هذا المستند باستخدام خدمة الترجمة بالذكاء الاصطناعي [Co-op Translator](https://github.com/Azure/co-op-translator). بينما نسعى لتحقيق الدقة، يرجى العلم أن الترجمات الآلية قد تحتوي على أخطاء أو معلومات غير دقيقة. يجب اعتبار المستند الأصلي بلغته الأصلية المصدر الموثوق. للحصول على معلومات حاسمة، يُوصى بالاستعانة بترجمة بشرية احترافية. نحن غير مسؤولين عن أي سوء فهم أو تفسيرات خاطئة ناتجة عن استخدام هذه الترجمة. \ No newline at end of file +تم ترجمة هذا المستند باستخدام خدمة الترجمة بالذكاء الاصطناعي [Co-op Translator](https://github.com/Azure/co-op-translator). بينما نسعى لتحقيق الدقة، يرجى العلم أن الترجمات الآلية قد تحتوي على أخطاء أو معلومات غير دقيقة. يجب اعتبار المستند الأصلي بلغته الأصلية المصدر الرسمي. للحصول على معلومات حاسمة، يُوصى بالاستعانة بترجمة بشرية احترافية. نحن غير مسؤولين عن أي سوء فهم أو تفسيرات خاطئة تنشأ عن استخدام هذه الترجمة. \ No newline at end of file diff --git a/translations/bg/6-Data-Science-In-Wild/20-Real-World-Examples/README.md b/translations/bg/6-Data-Science-In-Wild/20-Real-World-Examples/README.md index 29bcc8d0..d1399b2d 100644 --- a/translations/bg/6-Data-Science-In-Wild/20-Real-World-Examples/README.md +++ b/translations/bg/6-Data-Science-In-Wild/20-Real-World-Examples/README.md @@ -1,8 +1,8 @@ -# বাস্তব জীবনে ডেটা সায়েন্স +# বাস্তব জীবনে ডেটা সায়েন্স | ![ Sketchnote by [(@sketchthedocs)](https://sketchthedocs.dev) ](../../sketchnotes/20-DataScience-RealWorld.png) | | :--------------------------------------------------------------------------------------------------------------: | -| বাস্তব জীবনে ডেটা সায়েন্স - _Sketchnote by [@nitya](https://twitter.com/nitya)_ | +| বাস্তব জীবনে ডেটা সায়েন্স - _Sketchnote by [@nitya](https://twitter.com/nitya)_ | -আমরা এই শেখার যাত্রার প্রায় শেষ প্রান্তে পৌঁছে গেছি! +আমরা এই শেখার যাত্রার প্রায় শেষ প্রান্তে পৌঁছে গেছি! -আমরা ডেটা সায়েন্স এবং নৈতিকতার সংজ্ঞা দিয়ে শুরু করেছি, ডেটা বিশ্লেষণ এবং ভিজ্যুয়ালাইজেশনের বিভিন্ন টুল ও কৌশল অন্বেষণ করেছি, ডেটা সায়েন্স লাইফসাইকেল পর্যালোচনা করেছি এবং ক্লাউড কম্পিউটিং পরিষেবার মাধ্যমে ডেটা সায়েন্স ওয়ার্কফ্লো স্কেলিং এবং অটোমেশন নিয়ে আলোচনা করেছি। তাই, আপনি হয়তো ভাবছেন: _"এই শেখাগুলোকে বাস্তব জীবনের প্রেক্ষাপটে কীভাবে প্রয়োগ করব?"_ +আমরা ডেটা সায়েন্স এবং নীতিশাস্ত্রের সংজ্ঞা দিয়ে শুরু করেছিলাম, ডেটা বিশ্লেষণ এবং ভিজ্যুয়ালাইজেশনের বিভিন্ন সরঞ্জাম ও কৌশল অন্বেষণ করেছি, ডেটা সায়েন্স লাইফসাইকেল পর্যালোচনা করেছি এবং ক্লাউড কম্পিউটিং পরিষেবাগুলির মাধ্যমে ডেটা সায়েন্স ওয়ার্কফ্লো স্কেল এবং স্বয়ংক্রিয় করার উপায় দেখেছি। তাই, আপনি হয়তো ভাবছেন: _"এই সমস্ত শেখাগুলো বাস্তব জীবনের প্রেক্ষাপটে কীভাবে প্রয়োগ করব?"_ -এই পাঠে, আমরা শিল্পে ডেটা সায়েন্সের বাস্তব জীবনের প্রয়োগ নিয়ে আলোচনা করব এবং গবেষণা, ডিজিটাল মানবিকতা এবং টেকসই উন্নয়নের নির্দিষ্ট উদাহরণগুলোতে গভীরভাবে প্রবেশ করব। আমরা শিক্ষার্থীদের প্রকল্পের সুযোগগুলো দেখব এবং আপনার শেখার যাত্রা চালিয়ে যাওয়ার জন্য দরকারী রিসোর্স দিয়ে শেষ করব! +এই পাঠে, আমরা শিল্পে ডেটা সায়েন্সের বাস্তব জীবনের প্রয়োগগুলি অন্বেষণ করব এবং গবেষণা, ডিজিটাল মানবিকতা এবং টেকসই উন্নয়নের নির্দিষ্ট উদাহরণগুলিতে গভীরভাবে প্রবেশ করব। আমরা শিক্ষার্থীদের প্রকল্পের সুযোগগুলি দেখব এবং আপনার শেখার যাত্রা চালিয়ে যেতে সহায়ক কিছু সম্পদ দিয়ে শেষ করব! -## প্রি-লেকচার কুইজ +## প্রাক-পাঠ কুইজ -## [প্রি-লেকচার কুইজ](https://ff-quizzes.netlify.app/en/ds/quiz/38) +## [প্রাক-পাঠ কুইজ](https://ff-quizzes.netlify.app/en/ds/quiz/38) -## ডেটা সায়েন্স + শিল্প +## ডেটা সায়েন্স + শিল্প -এআই-এর গণতান্ত্রিকরণের জন্য ধন্যবাদ, এখন ডেভেলপাররা এআই-চালিত সিদ্ধান্ত গ্রহণ এবং ডেটা-চালিত অন্তর্দৃষ্টি ব্যবহারকারীর অভিজ্ঞতা এবং ডেভেলপমেন্ট ওয়ার্কফ্লোতে ডিজাইন এবং সংযুক্ত করা সহজতর করে তুলছেন। এখানে শিল্পে ডেটা সায়েন্সের বাস্তব জীবনের প্রয়োগের কিছু উদাহরণ দেওয়া হলো: +এআই-এর গণতন্ত্রীকরণের জন্য ধন্যবাদ, এখন ডেভেলপাররা এআই-চালিত সিদ্ধান্ত গ্রহণ এবং ডেটা-চালিত অন্তর্দৃষ্টি ব্যবহারকারীর অভিজ্ঞতা এবং ডেভেলপমেন্ট ওয়ার্কফ্লোতে ডিজাইন এবং সংহত করা সহজতর করছে। এখানে শিল্পে ডেটা সায়েন্সের "প্রয়োগ" এর কয়েকটি উদাহরণ দেওয়া হলো: - * [গুগল ফ্লু ট্রেন্ডস](https://www.wired.com/2015/10/can-learn-epic-failure-google-flu-trends/) ডেটা সায়েন্স ব্যবহার করে সার্চ টার্মগুলোর সাথে ফ্লু ট্রেন্ডের সম্পর্ক স্থাপন করেছিল। যদিও এই পদ্ধতিতে ত্রুটি ছিল, এটি ডেটা-চালিত স্বাস্থ্যসেবা পূর্বাভাসের সম্ভাবনা (এবং চ্যালেঞ্জ) সম্পর্কে সচেতনতা বৃদ্ধি করেছিল। + * [গুগল ফ্লু ট্রেন্ডস](https://www.wired.com/2015/10/can-learn-epic-failure-google-flu-trends/) ডেটা সায়েন্স ব্যবহার করে সার্চ টার্মগুলিকে ফ্লু প্রবণতার সাথে সম্পর্কিত করেছিল। যদিও এই পদ্ধতিতে ত্রুটি ছিল, এটি ডেটা-চালিত স্বাস্থ্যসেবা পূর্বাভাসের সম্ভাবনা (এবং চ্যালেঞ্জ) সম্পর্কে সচেতনতা বাড়িয়েছিল। - * [ইউপিএস রাউটিং পূর্বাভাস](https://www.technologyreview.com/2018/11/21/139000/how-ups-uses-ai-to-outsmart-bad-weather/) - ইউপিএস ডেটা সায়েন্স এবং মেশিন লার্নিং ব্যবহার করে আবহাওয়ার অবস্থা, ট্রাফিক প্যাটার্ন, ডেলিভারি সময়সীমা এবং আরও অনেক কিছু বিবেচনা করে ডেলিভারির জন্য সর্বোত্তম রুট পূর্বাভাস দেয়। + * [ইউপিএস রাউটিং পূর্বাভাস](https://www.technologyreview.com/2018/11/21/139000/how-ups-uses-ai-to-outsmart-bad-weather/) - ইউপিএস কীভাবে আবহাওয়া পরিস্থিতি, ট্রাফিক প্যাটার্ন, ডেলিভারি সময়সীমা এবং আরও অনেক কিছু বিবেচনায় নিয়ে ডেলিভারির জন্য সর্বোত্তম রুট পূর্বাভাস দিতে ডেটা সায়েন্স এবং মেশিন লার্নিং ব্যবহার করে তা ব্যাখ্যা করে। - * [এনওয়াইসি ট্যাক্সিক্যাব রুট ভিজ্যুয়ালাইজেশন](http://chriswhong.github.io/nyctaxi/) - [Freedom Of Information Laws](https://chriswhong.com/open-data/foil_nyc_taxi/) ব্যবহার করে সংগৃহীত ডেটা এনওয়াইসি ট্যাক্সিক্যাবের এক দিনের জীবনকে ভিজ্যুয়ালাইজ করতে সাহায্য করেছে, যা আমাদের ব্যস্ত শহরে তাদের চলাচল, আয় এবং ২৪ ঘণ্টার প্রতিটি ট্রিপের সময়কাল বুঝতে সাহায্য করে। + * [এনওয়াইসি ট্যাক্সিক্যাব রুট ভিজ্যুয়ালাইজেশন](http://chriswhong.github.io/nyctaxi/) - [তথ্য স্বাধীনতা আইন](https://chriswhong.com/open-data/foil_nyc_taxi/) ব্যবহার করে সংগৃহীত ডেটা এনওয়াইসি ক্যাবগুলোর দৈনন্দিন জীবনকে ভিজ্যুয়ালাইজ করতে সাহায্য করেছিল, যা আমাদের ব্যস্ত শহরে তাদের নেভিগেশন, উপার্জন এবং প্রতিদিনের ২৪ ঘণ্টার ভ্রমণের সময়কাল বুঝতে সাহায্য করে। - * [উবার ডেটা সায়েন্স ওয়ার্কবেঞ্চ](https://eng.uber.com/dsw/) - প্রতিদিন লক্ষ লক্ষ উবার ট্রিপ থেকে সংগৃহীত ডেটা (পিকআপ ও ড্রপঅফ লোকেশন, ট্রিপের সময়কাল, পছন্দের রুট ইত্যাদি) ব্যবহার করে একটি ডেটা অ্যানালিটিক্স টুল তৈরি করে যা প্রাইসিং, নিরাপত্তা, প্রতারণা সনাক্তকরণ এবং নেভিগেশন সিদ্ধান্তে সাহায্য করে। + * [উবার ডেটা সায়েন্স ওয়ার্কবেঞ্চ](https://eng.uber.com/dsw/) - প্রতিদিন লক্ষ লক্ষ উবার ট্রিপ থেকে সংগৃহীত ডেটা (যেমন পিকআপ এবং ড্রপঅফ লোকেশন, ট্রিপের সময়কাল, পছন্দের রুট ইত্যাদি) ব্যবহার করে একটি ডেটা অ্যানালিটিক্স টুল তৈরি করে যা মূল্য নির্ধারণ, নিরাপত্তা, প্রতারণা সনাক্তকরণ এবং নেভিগেশন সিদ্ধান্তে সহায়তা করে। - * [স্পোর্টস অ্যানালিটিক্স](https://towardsdatascience.com/scope-of-analytics-in-sports-world-37ed09c39860) - _প্রেডিকটিভ অ্যানালিটিক্স_ (টিম এবং প্লেয়ার বিশ্লেষণ - যেমন [Moneyball](https://datasciencedegree.wisconsin.edu/blog/moneyball-proves-importance-big-data-big-ideas/) - এবং ফ্যান ম্যানেজমেন্ট) এবং _ডেটা ভিজ্যুয়ালাইজেশন_ (টিম ও ফ্যান ড্যাশবোর্ড, গেমস ইত্যাদি) এর উপর গুরুত্ব দেয়, যার প্রয়োগ রয়েছে ট্যালেন্ট স্কাউটিং, স্পোর্টস গ্যাম্বলিং এবং ইনভেন্টরি/ভেন্যু ম্যানেজমেন্টে। + * [স্পোর্টস অ্যানালিটিক্স](https://towardsdatascience.com/scope-of-analytics-in-sports-world-37ed09c39860) - _পূর্বাভাসমূলক বিশ্লেষণ_ (দল এবং খেলোয়াড় বিশ্লেষণ - যেমন [মানিবল](https://datasciencedegree.wisconsin.edu/blog/moneyball-proves-importance-big-data-big-ideas/) - এবং ভক্ত ব্যবস্থাপনা) এবং _ডেটা ভিজ্যুয়ালাইজেশন_ (দল এবং ভক্ত ড্যাশবোর্ড, গেম ইত্যাদি) এর উপর দৃষ্টি নিবদ্ধ করে, যা প্রতিভা অনুসন্ধান, ক্রীড়া জুয়া এবং ভেন্যু ব্যবস্থাপনার মতো ক্ষেত্রে প্রয়োগ করা হয়। - * [ব্যাংকিংয়ে ডেটা সায়েন্স](https://data-flair.training/blogs/data-science-in-banking/) - ঝুঁকি মডেলিং এবং প্রতারণা সনাক্তকরণ থেকে শুরু করে গ্রাহক সেগমেন্টেশন, রিয়েল-টাইম পূর্বাভাস এবং রিকমেন্ডার সিস্টেম পর্যন্ত ফাইন্যান্স ইন্ডাস্ট্রিতে ডেটা সায়েন্সের মূল্য তুলে ধরে। প্রেডিকটিভ অ্যানালিটিক্স গুরুত্বপূর্ণ মাপকাঠি যেমন [ক্রেডিট স্কোর](https://dzone.com/articles/using-big-data-and-predictive-analytics-for-credit) চালিত করে। + * [ব্যাংকিংয়ে ডেটা সায়েন্স](https://data-flair.training/blogs/data-science-in-banking/) - ঝুঁকি মডেলিং এবং প্রতারণা সনাক্তকরণ থেকে শুরু করে গ্রাহক বিভাজন, রিয়েল-টাইম পূর্বাভাস এবং রিকমেন্ডার সিস্টেম পর্যন্ত আর্থিক শিল্পে ডেটা সায়েন্সের মূল্য তুলে ধরে। পূর্বাভাসমূলক বিশ্লেষণ [ক্রেডিট স্কোর](https://dzone.com/articles/using-big-data-and-predictive-analytics-for-credit) এর মতো গুরুত্বপূর্ণ ব্যবস্থাগুলোকেও চালিত করে। - * [স্বাস্থ্যসেবায় ডেটা সায়েন্স](https://data-flair.training/blogs/data-science-in-healthcare/) - মেডিকেল ইমেজিং (যেমন, এমআরআই, এক্স-রে, সিটি-স্ক্যান), জেনোমিক্স (ডিএনএ সিকোয়েন্সিং), ড্রাগ ডেভেলপমেন্ট (ঝুঁকি মূল্যায়ন, সফলতার পূর্বাভাস), প্রেডিকটিভ অ্যানালিটিক্স (রোগীর যত্ন ও সরবরাহের লজিস্টিকস), রোগ ট্র্যাকিং ও প্রতিরোধ ইত্যাদি প্রয়োগ তুলে ধরে। + * [স্বাস্থ্যসেবায় ডেটা সায়েন্স](https://data-flair.training/blogs/data-science-in-healthcare/) - মেডিকেল ইমেজিং (যেমন এমআরআই, এক্স-রে, সিটি-স্ক্যান), জিনোমিক্স (ডিএনএ সিকোয়েন্সিং), ওষুধ উন্নয়ন (ঝুঁকি মূল্যায়ন, সাফল্যের পূর্বাভাস), পূর্বাভাসমূলক বিশ্লেষণ (রোগীর যত্ন এবং সরবরাহ লজিস্টিকস), রোগ ট্র্যাকিং এবং প্রতিরোধ ইত্যাদির মতো প্রয়োগ তুলে ধরে। -![বাস্তব জীবনে ডেটা সায়েন্সের প্রয়োগ](../../../../6-Data-Science-In-Wild/20-Real-World-Examples/images/data-science-applications.png) ইমেজ ক্রেডিট: [Data Flair: 6 Amazing Data Science Applications ](https://data-flair.training/blogs/data-science-applications/) +![বাস্তব জীবনে ডেটা সায়েন্সের প্রয়োগ](../../../../translated_images/data-science-applications.4e5019cd8790ebac2277ff5f08af386f8727cac5d30f77727c7090677e6adb9c.bn.png) চিত্র ক্রেডিট: [ডেটা ফ্লেয়ার: ৬টি অসাধারণ ডেটা সায়েন্স প্রয়োগ](https://data-flair.training/blogs/data-science-applications/) -চিত্রটি ডেটা সায়েন্স কৌশল প্রয়োগের অন্যান্য ক্ষেত্র এবং উদাহরণ দেখায়। আরও প্রয়োগ অন্বেষণ করতে চান? নিচের [পর্যালোচনা ও স্ব-অধ্যয়ন](../../../../6-Data-Science-In-Wild/20-Real-World-Examples) বিভাগটি দেখুন। +চিত্রটি ডেটা সায়েন্স কৌশল প্রয়োগের অন্যান্য ডোমেইন এবং উদাহরণ দেখায়। আরও প্রয়োগ অন্বেষণ করতে চান? নীচের [পর্যালোচনা এবং স্ব-অধ্যয়ন](../../../../6-Data-Science-In-Wild/20-Real-World-Examples) বিভাগটি দেখুন। -## ডেটা সায়েন্স + গবেষণা +## ডেটা সায়েন্স + গবেষণা | ![ Sketchnote by [(@sketchthedocs)](https://sketchthedocs.dev) ](../../sketchnotes/20-DataScience-Research.png) | | :---------------------------------------------------------------------------------------------------------------: | -| ডেটা সায়েন্স ও গবেষণা - _Sketchnote by [@nitya](https://twitter.com/nitya)_ | +| ডেটা সায়েন্স এবং গবেষণা - _Sketchnote by [@nitya](https://twitter.com/nitya)_ | -যদিও বাস্তব জীবনের প্রয়োগ প্রায়শই শিল্পের বৃহৎ পরিসরের ব্যবহারকে কেন্দ্র করে থাকে, _গবেষণা_ প্রয়োগ এবং প্রকল্পগুলো দুটি দৃষ্টিকোণ থেকে উপকারী হতে পারে: +যদিও বাস্তব জীবনের প্রয়োগ প্রায়শই শিল্পের বৃহৎ পরিসরের ব্যবহারিক ক্ষেত্রে মনোযোগ দেয়, _গবেষণা_ প্রয়োগ এবং প্রকল্প দুটি দৃষ্টিকোণ থেকে কার্যকর হতে পারে: -* _উদ্ভাবনের সুযোগ_ - উন্নত ধারণার দ্রুত প্রোটোটাইপিং এবং পরবর্তী প্রজন্মের অ্যাপ্লিকেশনের জন্য ব্যবহারকারীর অভিজ্ঞতা পরীক্ষা করা। -* _প্রয়োগের চ্যালেঞ্জ_ - বাস্তব জীবনের প্রেক্ষাপটে ডেটা সায়েন্স প্রযুক্তির সম্ভাব্য ক্ষতি বা অনিচ্ছাকৃত পরিণতি তদন্ত করা। +* _উদ্ভাবনের সুযোগ_ - পরবর্তী প্রজন্মের অ্যাপ্লিকেশনের জন্য উন্নত ধারণাগুলির দ্রুত প্রোটোটাইপিং এবং ব্যবহারকারীর অভিজ্ঞতা পরীক্ষা করা। +* _প্রয়োগের চ্যালেঞ্জ_ - বাস্তব জীবনের প্রেক্ষাপটে ডেটা সায়েন্স প্রযুক্তির সম্ভাব্য ক্ষতি বা অনিচ্ছাকৃত পরিণতি তদন্ত করা। -শিক্ষার্থীদের জন্য, এই গবেষণা প্রকল্পগুলো শেখার এবং সহযোগিতার সুযোগ প্রদান করতে পারে যা আপনার বিষয়ের বোঝাপড়া উন্নত করতে পারে এবং প্রাসঙ্গিক ক্ষেত্রগুলোতে কাজ করা ব্যক্তিদের বা টিমের সাথে সচেতনতা এবং সম্পৃক্ততা বৃদ্ধি করতে পারে। তাহলে গবেষণা প্রকল্পগুলো দেখতে কেমন এবং কীভাবে তারা প্রভাব ফেলতে পারে? +শিক্ষার্থীদের জন্য, এই গবেষণা প্রকল্পগুলি শেখার এবং সহযোগিতার সুযোগ প্রদান করতে পারে যা বিষয়টির প্রতি আপনার বোঝাপড়া উন্নত করতে পারে এবং আগ্রহের ক্ষেত্রে কাজ করা প্রাসঙ্গিক ব্যক্তি বা দলের সাথে আপনার সচেতনতা এবং সম্পৃক্ততা বাড়াতে পারে। তাহলে গবেষণা প্রকল্পগুলি দেখতে কেমন এবং কীভাবে তারা প্রভাব ফেলতে পারে? -চলুন একটি উদাহরণ দেখি - [MIT Gender Shades Study](http://gendershades.org/overview.html) যা জয় বুয়োলামউইনি (MIT Media Labs) দ্বারা পরিচালিত এবং একটি [গবেষণা পেপার](http://proceedings.mlr.press/v81/buolamwini18a/buolamwini18a.pdf) সহ-লেখক টিমনিট গেব্রু (তৎকালীন Microsoft Research) দ্বারা সহ-লেখা হয়েছিল যা নিম্নলিখিত বিষয়ের উপর কেন্দ্রীভূত ছিল: +চলুন একটি উদাহরণ দেখি - [এমআইটি জেন্ডার শেডস স্টাডি](http://gendershades.org/overview.html) যা জয় বুয়োলামউইনি (এমআইটি মিডিয়া ল্যাবস) দ্বারা পরিচালিত এবং একটি [স্বাক্ষর গবেষণা পত্র](http://proceedings.mlr.press/v81/buolamwini18a/buolamwini18a.pdf) সহ-লিখিত হয়েছিল টিমনিট গেব্রু (তখন মাইক্রোসফট রিসার্চে) দ্বারা। গবেষণার লক্ষ্য ছিল: - * **কী:** গবেষণা প্রকল্পের উদ্দেশ্য ছিল _লিঙ্গ এবং ত্বকের রঙের উপর ভিত্তি করে স্বয়ংক্রিয় মুখ বিশ্লেষণ অ্যালগরিদম এবং ডেটাসেটগুলোর মধ্যে বিদ্যমান পক্ষপাত মূল্যায়ন করা।_ - * **কেন:** মুখ বিশ্লেষণ আইন প্রয়োগ, বিমানবন্দর নিরাপত্তা, নিয়োগ ব্যবস্থা এবং আরও অনেক ক্ষেত্রে ব্যবহৃত হয় - যেখানে ভুল শ্রেণীবিভাগ (যেমন, পক্ষপাতের কারণে) প্রভাবিত ব্যক্তি বা গোষ্ঠীর জন্য সম্ভাব্য অর্থনৈতিক এবং সামাজিক ক্ষতি সৃষ্টি করতে পারে। পক্ষপাত দূর করা বা কমানো ন্যায্য ব্যবহারের জন্য গুরুত্বপূর্ণ। - * **কীভাবে:** গবেষকরা স্বীকৃতি দেন যে বিদ্যমান বেঞ্চমার্কগুলো প্রধানত হালকা ত্বকের বিষয়গুলো ব্যবহার করে এবং একটি নতুন ডেটাসেট (১০০০+ ইমেজ) তৈরি করেন যা লিঙ্গ এবং ত্বকের রঙের উপর ভিত্তি করে _আরও ভারসাম্যপূর্ণ_। এই ডেটাসেটটি তিনটি লিঙ্গ শ্রেণীবিভাগ পণ্য (Microsoft, IBM এবং Face++) এর সঠিকতা মূল্যায়নের জন্য ব্যবহার করা হয়েছিল। + * **কী:** লিঙ্গ এবং ত্বকের রঙের উপর ভিত্তি করে স্বয়ংক্রিয় মুখ বিশ্লেষণ অ্যালগরিদম এবং ডেটাসেটগুলিতে বিদ্যমান পক্ষপাত মূল্যায়ন করা। + * **কেন:** মুখ বিশ্লেষণ আইন প্রয়োগ, বিমানবন্দর নিরাপত্তা, নিয়োগ ব্যবস্থা এবং আরও অনেক ক্ষেত্রে ব্যবহৃত হয় - যেখানে পক্ষপাতের কারণে ভুল শ্রেণীবিভাগ (যেমন, ভুল লিঙ্গ নির্ধারণ) প্রভাবিত ব্যক্তি বা গোষ্ঠীর জন্য সম্ভাব্য অর্থনৈতিক এবং সামাজিক ক্ষতি ঘটাতে পারে। ন্যায্যতার জন্য পক্ষপাত বোঝা এবং তা দূর করা বা হ্রাস করা গুরুত্বপূর্ণ। + * **কীভাবে:** গবেষকরা লক্ষ্য করেছিলেন যে বিদ্যমান বেঞ্চমার্কগুলি প্রধানত হালকা ত্বকের বিষয়গুলিকে অন্তর্ভুক্ত করে এবং একটি নতুন ডেটাসেট (১০০০+ চিত্র) তৈরি করেছিলেন যা লিঙ্গ এবং ত্বকের রঙের ভিত্তিতে _আরও ভারসাম্যপূর্ণ_ ছিল। এই ডেটাসেটটি তিনটি লিঙ্গ শ্রেণীবিভাগ পণ্যের (মাইক্রোসফট, আইবিএম এবং ফেস++) নির্ভুলতা মূল্যায়নের জন্য ব্যবহৃত হয়েছিল। -ফলাফল দেখিয়েছে যে যদিও সামগ্রিক শ্রেণীবিভাগের সঠিকতা ভালো ছিল, বিভিন্ন উপগোষ্ঠীর মধ্যে ত্রুটির হার উল্লেখযোগ্য পার্থক্য ছিল - যেখানে **মিসজেন্ডারিং** নারীদের বা গাঢ় ত্বকের ব্যক্তিদের জন্য বেশি ছিল, যা পক্ষপাতের ইঙ্গিত দেয়। +ফলাফল দেখিয়েছে যে সামগ্রিক শ্রেণীবিভাগ নির্ভুলতা ভাল হলেও, বিভিন্ন উপগোষ্ঠীর মধ্যে ত্রুটির হারে একটি উল্লেখযোগ্য পার্থক্য ছিল - যেখানে **ভুল লিঙ্গ নির্ধারণ** মহিলাদের বা গাঢ় ত্বকের ব্যক্তিদের জন্য বেশি ছিল, যা পক্ষপাত নির্দেশ করে। -**মূল ফলাফল:** সচেতনতা বৃদ্ধি করেছে যে ডেটা সায়েন্সের জন্য আরও _প্রতিনিধিত্বমূলক ডেটাসেট_ (ভারসাম্যপূর্ণ উপগোষ্ঠী) এবং আরও _অন্তর্ভুক্তিমূলক টিম_ (বৈচিত্র্যময় পটভূমি) প্রয়োজন যাতে এআই সমাধানগুলোতে এই ধরনের পক্ষপাত আগেই স্বীকৃতি এবং দূর করা বা কমানো যায়। এই ধরনের গবেষণা প্রচেষ্টা অনেক সংস্থাকে তাদের এআই পণ্য এবং প্রক্রিয়াগুলোর ন্যায্যতা উন্নত করতে _দায়িত্বশীল এআই_ এর জন্য নীতিমালা এবং অনুশীলন সংজ্ঞায়িত করতে সহায়ক। +**মূল ফলাফল:** ডেটা সায়েন্সে আরও _প্রতিনিধিত্বমূলক ডেটাসেট_ (ভারসাম্যপূর্ণ উপগোষ্ঠী) এবং আরও _অন্তর্ভুক্তিমূলক দল_ (বৈচিত্র্যময় পটভূমি) প্রয়োজনীয়তা সম্পর্কে সচেতনতা বৃদ্ধি করেছে, যাতে এআই সমাধানগুলিতে এই ধরনের পক্ষপাতগুলি আগেই চিহ্নিত এবং হ্রাস করা যায়। এই ধরনের গবেষণা প্রচেষ্টা অনেক সংস্থাকে তাদের এআই পণ্য এবং প্রক্রিয়াগুলিতে ন্যায্যতা উন্নত করতে _দায়িত্বশীল এআই_ নীতিমালা এবং অনুশীলন সংজ্ঞায়িত করতে সহায়ক। -**Microsoft-এ প্রাসঙ্গিক গবেষণা প্রচেষ্টা সম্পর্কে জানতে চান?** +**মাইক্রোসফটের প্রাসঙ্গিক গবেষণা প্রচেষ্টা সম্পর্কে জানতে চান?** -* [Microsoft Research Projects](https://www.microsoft.com/research/research-area/artificial-intelligence/?facet%5Btax%5D%5Bmsr-research-area%5D%5B%5D=13556&facet%5Btax%5D%5Bmsr-content-type%5D%5B%5D=msr-project) এআই সম্পর্কিত গবেষণা প্রকল্পগুলো দেখুন। -* [Microsoft Research Data Science Summer School](https://www.microsoft.com/en-us/research/academic-program/data-science-summer-school/) থেকে শিক্ষার্থীদের প্রকল্পগুলো অন্বেষণ করুন। -* [Fairlearn](https://fairlearn.org/) প্রকল্প এবং [Responsible AI](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1%3aprimaryr6) উদ্যোগগুলো দেখুন। +* [মাইক্রোসফট রিসার্চ প্রকল্প](https://www.microsoft.com/research/research-area/artificial-intelligence/?facet%5Btax%5D%5Bmsr-research-area%5D%5B%5D=13556&facet%5Btax%5D%5Bmsr-content-type%5D%5B%5D=msr-project) এআই সম্পর্কিত প্রকল্পগুলি দেখুন। +* [মাইক্রোসফট রিসার্চ ডেটা সায়েন্স সামার স্কুল](https://www.microsoft.com/en-us/research/academic-program/data-science-summer-school/) থেকে শিক্ষার্থীদের প্রকল্পগুলি অন্বেষণ করুন। +* [ফেয়ারলার্ন](https://fairlearn.org/) প্রকল্প এবং [দায়িত্বশীল এআই](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1%3aprimaryr6) উদ্যোগগুলি দেখুন। -## ডেটা সায়েন্স + মানবিকতা + +## ডেটা সায়েন্স + মানবিকতা | ![ Sketchnote by [(@sketchthedocs)](https://sketchthedocs.dev) ](../../sketchnotes/20-DataScience-Humanities.png) | | :---------------------------------------------------------------------------------------------------------------: | -| ডেটা সায়েন্স ও ডিজিটাল মানবিকতা - _Sketchnote by [@nitya](https://twitter.com/nitya)_ | +| ডেটা সায়েন্স এবং ডিজিটাল মানবিকতা - _Sketchnote by [@nitya](https://twitter.com/nitya)_ | -ডিজিটাল মানবিকতা [সংজ্ঞায়িত করা হয়েছে](https://digitalhumanities.stanford.edu/about-dh-stanford) "কম্পিউটেশনাল পদ্ধতি এবং মানবিক অনুসন্ধানের সমন্বয়ে গঠিত একটি অনুশীলন এবং পদ্ধতির সংগ্রহ" হিসেবে। [স্ট্যানফোর্ড প্রকল্পগুলো](https://digitalhumanities.stanford.edu/projects) যেমন _"rebooting history"_ এবং _"poetic thinking"_ [ডিজিটাল মানবিকতা এবং ডেটা সায়েন্সের](https://digitalhumanities.stanford.edu/digital-humanities-and-data-science) সংযোগকে চিত্রিত করে - নেটওয়ার্ক বিশ্লেষণ, তথ্য ভিজ্যুয়ালাইজেশন, স্থানিক এবং পাঠ বিশ্লেষণের মতো কৌশলগুলোকে গুরুত্ব দেয় যা আমাদের ঐতিহাসিক এবং সাহিত্যিক ডেটাসেটগুলো পুনর্বিবেচনা করতে এবং নতুন অন্তর্দৃষ্টি এবং দৃষ্টিভঙ্গি অর্জন করতে সাহায্য করে। +ডিজিটাল মানবিকতা [সংজ্ঞায়িত করা হয়েছে](https://digitalhumanities.stanford.edu/about-dh-stanford) "কম্পিউটেশনাল পদ্ধতি এবং মানবিক অনুসন্ধানের সমন্বয়ে গঠিত একটি অনুশীলন এবং পদ্ধতির সংগ্রহ" হিসাবে। [স্ট্যানফোর্ড প্রকল্পগুলি](https://digitalhumanities.stanford.edu/projects) যেমন _"ইতিহাস পুনরায় চালু করা"_ এবং _"কাব্যিক চিন্তা"_ [ডিজিটাল মানবিকতা এবং ডেটা সায়েন্সের](https://digitalhumanities.stanford.edu/digital-humanities-and-data-science) মধ্যে সংযোগকে চিত্রিত করে - নেটওয়ার্ক বিশ্লেষণ, তথ্য ভিজ্যুয়ালাইজেশন, স্থানিক এবং পাঠ বিশ্লেষণের মতো কৌশলগুলির উপর জোর দেয় যা আমাদের ঐতিহাসিক এবং সাহিত্যিক ডেটাসেটগুলি পুনর্বিবেচনা করতে এবং নতুন অন্তর্দৃষ্টি এবং দৃষ্টিভঙ্গি অর্জন করতে সাহায্য করে। *এই ক্ষেত্রে একটি প্রকল্প অন্বেষণ এবং প্রসারিত করতে চান?* -["Emily Dickinson and the Meter of Mood"](https://gist.github.com/jlooper/ce4d102efd057137bc000db796bfd671) দেখুন - [Jen Looper](https://twitter.com/jenlooper) এর একটি চমৎকার উদাহরণ যা প্রশ্ন করে কীভাবে আমরা ডেটা সায়েন্স ব্যবহার করে পরিচিত কবিতাগুলো পুনর্বিবেচনা করতে পারি এবং নতুন প্রেক্ষাপটে এর অর্থ এবং এর লেখকের অবদান পুনর্মূল্যায়ন করতে পারি। উদাহরণস্বরূপ, _কবিতার টোন বা অনুভূতি বিশ্লেষণ করে আমরা কি অনুমান করতে পারি যে এটি কোন ঋতুতে লেখা হয়েছিল_ - এবং এটি লেখকের মানসিক অবস্থার উপর প্রাসঙ্গিক সময়কালে কী বলে? +["এমিলি ডিকিনসন এবং মুডের মিটার"](https://gist.github.com/jlooper/ce4d102efd057137bc000db796bfd671) দেখুন - [জেন লুপার](https://twitter.com/jenlooper) এর একটি চমৎকার উদাহরণ যা জিজ্ঞাসা করে যে আমরা কীভাবে ডেটা সায়েন্স ব্যবহার করে পরিচিত কবিতাগুলিকে পুনর্বিবেচনা করতে পারি এবং নতুন প্রেক্ষাপটে এর অর্থ এবং এর লেখকের অবদান পুনর্মূল্যায়ন করতে পারি। উদাহরণস্বরূপ, _কবিতার সুর বা অনুভূতি বিশ্লেষণ করে আমরা কি অনুমান করতে পারি যে এটি কোন ঋতুতে লেখা হয়েছিল_ - এবং এটি সংশ্লিষ্ট সময়কালে লেখকের মানসিক অবস্থার সম্পর্কে আমাদের কী বলে? -এই প্রশ্নের উত্তর দিতে, আমরা আমাদের ডেটা সায়েন্স লাইফসাইকেলের ধাপগুলো অনুসরণ করি: - * [`ডেটা সংগ্রহ`](https://gist.github.com/jlooper/ce4d102efd057137bc000db796bfd671#acquiring-the-dataset) - বিশ্লেষণের জন্য একটি প্রাসঙ্গিক ডেটাসেট সংগ্রহ করা। অপশনগুলোতে একটি এপিআই ব্যবহার করা (যেমন, [Poetry DB API](https://poetrydb.org/index.html)) বা ওয়েব পেজ স্ক্র্যাপ করা (যেমন, [Project Gutenberg](https://www.gutenberg.org/files/12242/12242-h/12242-h.htm)) টুল ব্যবহার করে [Scrapy](https://scrapy.org/) অন্তর্ভুক্ত। - * [`ডেটা পরিষ্কার করা`](https://gist.github.com/jlooper/ce4d102efd057137bc000db796bfd671#clean-the-data) - ব্যাখ্যা করে কীভাবে টেক্সট ফরম্যাট করা, স্যানিটাইজ করা এবং সরলীকৃত করা যায় Visual Studio Code এবং Microsoft Excel এর মতো মৌলিক টুল ব্যবহার করে। - * [`ডেটা বিশ্লেষণ`](https://gist.github.com/jlooper/ce4d102efd057137bc000db796bfd671#working-with-the-data-in-a-notebook) - ব্যাখ্যা করে কীভাবে আমরা এখন ডেটাসেটটি "নোটবুক" এ আমদানি করতে পারি বিশ্লেষণের জন্য, Python প্যাকেজ (যেমন pandas, numpy এবং matplotlib) ব্যবহার করে ডেটা সংগঠিত এবং ভিজ্যুয়ালাইজ করতে। - * [`অনুভূতি বিশ্লেষণ`](https://gist.github.com/jlooper/ce4d102efd057137bc000db796bfd671#sentiment-analysis-using-cognitive-services) - ব্যাখ্যা করে কীভাবে আমরা Text Analytics এর মতো ক্লাউড পরিষেবাগুলো সংযুক্ত করতে পারি, [Power Automate](https://flow.microsoft.com/en-us/) এর মতো লো-কোড টুল ব্যবহার করে স্বয়ংক্রিয় ডেটা প্রসেসিং ওয়ার্কফ্লো তৈরি করতে। +এই প্রশ্নের উত্তর দিতে, আমরা আমাদের ডেটা সায়েন্স লাইফসাইকেলের ধাপগুলি অনুসরণ করি: + * [`ডেটা সংগ্রহ`](https://gist.github.com/jlooper/ce4d102efd057137bc000db796bfd671#acquiring-the-dataset) - বিশ্লেষণের জন্য একটি প্রাসঙ্গিক ডেটাসেট সংগ্রহ করা। বিকল্পগুলির মধ্যে একটি এপিআই (যেমন [পোয়েট্রি ডিবি এপিআই](https://poetrydb.org/index.html)) ব্যবহার করা বা ওয়েব পৃষ্ঠাগুলি স্ক্র্যাপ করা (যেমন [প্রজেক্ট গুটেনবার্গ](https://www.gutenberg.org/files/12242/12242-h/12242-h.htm)) অন্তর্ভুক্ত। + * [`ডেটা পরিষ্কার করা`](https://gist.github.com/jlooper/ce4d102efd057137bc000db796bfd671#clean-the-data) - ব্যাখ্যা করে কীভাবে পাঠ্য ফর্ম্যাট করা, পরিষ্কার করা এবং সরলীকৃত করা যায়, যেমন ভিজ্যুয়াল স্টুডিও কোড এবং মাইক্রোসফট এক্সেল ব্যবহার করে। + * [`ডেটা বিশ্লেষণ`](https://gist.github.com/jlooper/ce4d102efd057137bc000db796bfd671#working-with-the-data-in-a-notebook) - ব্যাখ্যা করে কীভাবে আমরা এখন ডেটাসেটটি "নোটবুক"-এ আমদানি করতে পারি এবং পাইথন প্যাকেজ (যেমন pandas, numpy এবং matplotlib) ব্যবহার করে ডেটা সংগঠিত এবং ভিজ্যুয়ালাইজ করতে পারি। + * [`অনুভূতি বিশ্লেষণ`](https://gist.github.com/jlooper/ce4d102efd057137bc000db796bfd671#sentiment-analysis-using-cognitive-services) - ব্যাখ্যা করে কীভাবে আমরা টেক্সট অ্যানালিটিক্সের মতো ক্লাউড পরিষেবাগুলিকে সংহত করতে পারি, স্বয়ংক্রিয় ডেটা প্রসেসিং ওয়ার্কফ্লোর জন্য [পাওয়ার অটোমেট](https://flow.microsoft.com/en-us/) এর মতো লো-কোড সরঞ্জাম ব্যবহার করে। -এই ওয়ার্কফ্লো ব্যবহার করে, আমরা কবিতার অনুভূতির উপর ঋতুর প্রভাবগুলো অন্বেষণ করতে পারি এবং লেখকের উপর আমাদের নিজস্ব দৃষ্টিভঙ্গি তৈরি করতে সাহায্য করতে পারি। নিজে চেষ্টা করুন - তারপর নোটবুকটি প্রসারিত করুন অন্য প্রশ্ন জিজ্ঞাসা করতে বা ডেটা নতুনভাবে ভিজ্যুয়ালাইজ করতে! +এই ওয়ার্কফ্লো ব্যবহার করে, আমরা কবিতার অনুভূতির উপর ঋতুগুলির প্রভাব অন্বেষণ করতে পারি এবং লেখকের উপর আমাদের নিজস্ব দৃষ্টিভঙ্গি তৈরি করতে পারি। নিজেই চেষ্টা করুন - তারপর নোটবুকটি প্রসারিত করুন অন্য প্রশ্ন জিজ্ঞাসা করতে বা নতুন উপায়ে ডেটা ভিজ্যুয়ালাইজ করতে! -> [ডিজিটাল মানবিকতার টুলকিট](https://github.com/Digital-Humanities-Toolkit) এর কিছু টুল ব্যবহার করে এই অনুসন্ধানের পথগুলো অনুসরণ করতে পারেন। +> আপনি [ডিজিটাল মানবিকতা টুলকিট](https://github.com/Digital-Humanities-Toolkit)-এর কিছু সরঞ্জাম ব্যবহার করে এই অনুসন্ধানের পথগুলি অনুসরণ করতে পারেন। -## ডেটা সায়েন্স + টেকসই উন্নয়ন +## ডেটা সায়েন্স + টেকসই উন্নয়ন | ![ Sketchnote by [(@sketchthedocs)](https://sketchthedocs.dev) ](../../sketchnotes/20-DataScience-Sustainability.png) | | :---------------------------------------------------------------------------------------------------------------: | -| ডেটা সায়েন্স ও টেকসই উন্নয়ন - _Sketchnote by [@nitya](https://twitter.com/nitya)_ | +| ডেটা সায়েন্স এবং টেকসই উন্নয়ন - _Sketchnote by [@nitya](https://twitter.com/nitya)_ | -[টেকসই উন্নয়নের জন্য ২০৩০ এজেন্ডা](https://sdgs.un.org/2030agenda) - যা ২০১৫ সালে সমস্ত জাতিসংঘ সদস্যদের দ্বারা গৃহীত হয়েছিল - ১৭টি লক্ষ্য চিহ্নিত করে, যার মধ্যে **গ্রহকে রক্ষা করা** এবং জলবায়ু পরিবর্তনের প্রভাব থেকে রক্ষা করার উপর গুরুত্ব দেয়। [Microsoft Sustainability](https://www.microsoft.com/en-us/sustainability) উদ্যোগ এই লক্ষ্যগুলোকে সমর্থন করে এবং প্রযুক্তি সমাধানগুলো কীভাবে আরও টেকসই ভবিষ্যত তৈরি করতে সাহায্য করতে পারে তা অন্বেষণ করে, [৪টি লক্ষ্য](https://dev.to/azure/a-visual-guide-to-sustainable-software-engineering-53hh) এর উপর ফোকাস করে - ২০৩০ সালের মধ্যে কার্বন নেগেটিভ, জল পজিটিভ, শূন্য বর্জ্য এবং জীববৈচিত্র্যম +[২০৩০ টেকসই উন্নয়নের এজেন্ডা](https://sdgs.un.org/2030agenda) - যা ২০১৫ সালে জাতিসংঘের সমস্ত সদস্য দ্বারা গৃহীত হয়েছিল - ১৭টি লক্ষ্য চিহ **প্ল্যানেটারি কম্পিউটার প্রকল্প বর্তমানে প্রিভিউ পর্যায়ে রয়েছে (সেপ্টেম্বর ২০২১ অনুযায়ী)** - ডেটা সায়েন্স ব্যবহার করে টেকসই সমাধানে অবদান রাখার জন্য কীভাবে শুরু করবেন তা এখানে দেওয়া হলো। * [অ্যাক্সেসের জন্য অনুরোধ করুন](https://planetarycomputer.microsoft.com/account/request) যাতে অনুসন্ধান শুরু করতে পারেন এবং সহকর্মীদের সাথে সংযোগ স্থাপন করতে পারেন। * [ডকুমেন্টেশন অন্বেষণ করুন](https://planetarycomputer.microsoft.com/docs/overview/about) যাতে সমর্থিত ডেটাসেট এবং API সম্পর্কে বুঝতে পারেন। * [ইকোসিস্টেম মনিটরিং](https://analytics-lab.org/ecosystemmonitoring/) এর মতো অ্যাপ্লিকেশন অন্বেষণ করুন, যা অ্যাপ্লিকেশন আইডিয়ার জন্য অনুপ্রেরণা দিতে পারে। -ভাবুন কীভাবে আপনি ডেটা ভিজ্যুয়ালাইজেশন ব্যবহার করে জলবায়ু পরিবর্তন এবং বন উজাড়ের মতো ক্ষেত্রগুলিতে প্রাসঙ্গিক অন্তর্দৃষ্টি প্রকাশ বা বাড়িয়ে তুলতে পারেন। অথবা ভাবুন কীভাবে এই অন্তর্দৃষ্টি ব্যবহার করে নতুন ব্যবহারকারীর অভিজ্ঞতা তৈরি করা যেতে পারে যা আরও টেকসই জীবনযাপনের জন্য আচরণগত পরিবর্তনকে উৎসাহিত করে। +ভাবুন কীভাবে আপনি ডেটা ভিজ্যুয়ালাইজেশন ব্যবহার করে জলবায়ু পরিবর্তন এবং বন উজাড়ের মতো বিষয়গুলিতে প্রাসঙ্গিক অন্তর্দৃষ্টি প্রকাশ বা জোর দিতে পারেন। অথবা ভাবুন কীভাবে এই অন্তর্দৃষ্টিগুলি নতুন ব্যবহারকারীর অভিজ্ঞতা তৈরি করতে ব্যবহার করা যেতে পারে, যা আরও টেকসই জীবনযাপনের জন্য আচরণগত পরিবর্তনকে উৎসাহিত করে। ## ডেটা সায়েন্স + শিক্ষার্থীরা @@ -120,11 +121,11 @@ CO_OP_TRANSLATOR_METADATA: * [MSR Data Science Summer School](https://www.microsoft.com/en-us/research/academic-program/data-science-summer-school/#!projects) এর GitHub [প্রকল্পগুলি](https://github.com/msr-ds3) যা নিম্নলিখিত বিষয়গুলি অন্বেষণ করে: - [পুলিশের বলপ্রয়োগে জাতিগত পক্ষপাত](https://www.microsoft.com/en-us/research/video/data-science-summer-school-2019-replicating-an-empirical-analysis-of-racial-differences-in-police-use-of-force/) | [Github](https://github.com/msr-ds3/stop-question-frisk) - [NYC সাবওয়ে সিস্টেমের নির্ভরযোগ্যতা](https://www.microsoft.com/en-us/research/video/data-science-summer-school-2018-exploring-the-reliability-of-the-nyc-subway-system/) | [Github](https://github.com/msr-ds3/nyctransit) - * [ডিজিটালাইজিং ম্যাটেরিয়াল কালচার: সিরকাপে সামাজিক-অর্থনৈতিক বিতরণ অন্বেষণ](https://claremont.maps.arcgis.com/apps/Cascade/index.html?appid=bdf2aef0f45a4674ba41cd373fa23afc) - [Ornella Altunyan](https://twitter.com/ornelladotcom) এবং Claremont টিমের দ্বারা, [ArcGIS StoryMaps](https://storymaps.arcgis.com/) ব্যবহার করে। + * [ডিজিটালাইজিং ম্যাটেরিয়াল কালচার: সিরকাপে সামাজিক-অর্থনৈতিক বিতরণ অন্বেষণ](https://claremont.maps.arcgis.com/apps/Cascade/index.html?appid=bdf2aef0f45a4674ba41cd373fa23afc)- [Ornella Altunyan](https://twitter.com/ornelladotcom) এবং Claremont টিমের দ্বারা, [ArcGIS StoryMaps](https://storymaps.arcgis.com/) ব্যবহার করে। ## 🚀 চ্যালেঞ্জ -ডেটা সায়েন্স প্রকল্পের জন্য এমন প্রবন্ধ অনুসন্ধান করুন যা শিক্ষার্থীদের জন্য সহজ এবং শুরু করার উপযোগী - যেমন [এই ৫০টি বিষয়](https://www.upgrad.com/blog/data-science-project-ideas-topics-beginners/), [এই ২১টি প্রকল্প আইডিয়া](https://www.intellspot.com/data-science-project-ideas), অথবা [এই ১৬টি প্রকল্পের সোর্স কোড সহ](https://data-flair.training/blogs/data-science-project-ideas/) যা আপনি বিশ্লেষণ এবং পুনর্গঠন করতে পারেন। এবং আপনার শেখার যাত্রা সম্পর্কে ব্লগ লিখতে ভুলবেন না এবং আপনার অন্তর্দৃষ্টি আমাদের সবার সাথে শেয়ার করুন। +ডেটা সায়েন্স প্রকল্পের জন্য এমন প্রবন্ধ খুঁজুন যা শিক্ষার্থীদের জন্য সহজ এবং শুরু করার উপযোগী - যেমন [এই ৫০টি বিষয়](https://www.upgrad.com/blog/data-science-project-ideas-topics-beginners/) বা [এই ২১টি প্রকল্প আইডিয়া](https://www.intellspot.com/data-science-project-ideas) বা [এই ১৬টি প্রকল্প সোর্স কোড সহ](https://data-flair.training/blogs/data-science-project-ideas/) যা আপনি বিশ্লেষণ এবং পুনর্গঠন করতে পারেন। এবং আপনার শেখার যাত্রা সম্পর্কে ব্লগ লিখতে ভুলবেন না এবং আপনার অন্তর্দৃষ্টি আমাদের সবার সাথে শেয়ার করুন। ## পোস্ট-লেকচার কুইজ @@ -132,11 +133,12 @@ CO_OP_TRANSLATOR_METADATA: ## পর্যালোচনা এবং স্ব-অধ্যয়ন -আরও ব্যবহারিক ক্ষেত্র অন্বেষণ করতে চান? এখানে কিছু প্রাসঙ্গিক প্রবন্ধ দেওয়া হলো: +আরও ব্যবহারিক উদাহরণ অন্বেষণ করতে চান? এখানে কিছু প্রাসঙ্গিক প্রবন্ধ দেওয়া হলো: * [ডেটা সায়েন্সের ১৭টি প্রয়োগ এবং উদাহরণ](https://builtin.com/data-science/data-science-applications-examples) - জুলাই ২০২১ * [বাস্তব জগতে ডেটা সায়েন্সের ১১টি চমকপ্রদ প্রয়োগ](https://myblindbird.com/data-science-applications-real-world/) - মে ২০২১ * [বাস্তব জগতে ডেটা সায়েন্স](https://towardsdatascience.com/data-science-in-the-real-world/home) - প্রবন্ধ সংগ্রহ - * ডেটা সায়েন্স: [শিক্ষা](https://data-flair.training/blogs/data-science-in-education/), [কৃষি](https://data-flair.training/blogs/data-science-in-agriculture/), [অর্থনীতি](https://data-flair.training/blogs/data-science-in-finance/), [চলচ্চিত্র](https://data-flair.training/blogs/data-science-at-movies/) এবং আরও অনেক কিছু। + * [ডেটা সায়েন্সের ১২টি বাস্তব উদাহরণ](https://www.scaler.com/blog/data-science-applications/) - মে ২০২৪ + * ডেটা সায়েন্স: [শিক্ষা](https://data-flair.training/blogs/data-science-in-education/), [কৃষি](https://data-flair.training/blogs/data-science-in-agriculture/), [অর্থনীতি](https://data-flair.training/blogs/data-science-in-finance/), [চলচ্চিত্র](https://data-flair.training/blogs/data-science-at-movies/), [স্বাস্থ্যসেবা](https://onlinedegrees.sandiego.edu/data-science-health-care/) এবং আরও অনেক কিছু। ## অ্যাসাইনমেন্ট @@ -145,4 +147,4 @@ CO_OP_TRANSLATOR_METADATA: --- **অস্বীকৃতি**: -এই নথিটি AI অনুবাদ পরিষেবা [Co-op Translator](https://github.com/Azure/co-op-translator) ব্যবহার করে অনুবাদ করা হয়েছে। আমরা যথাসাধ্য সঠিকতার জন্য চেষ্টা করি, তবে অনুগ্রহ করে মনে রাখবেন যে স্বয়ংক্রিয় অনুবাদে ত্রুটি বা অসঙ্গতি থাকতে পারে। মূল ভাষায় থাকা নথিটিকে প্রামাণিক উৎস হিসেবে বিবেচনা করা উচিত। গুরুত্বপূর্ণ তথ্যের জন্য, পেশাদার মানব অনুবাদ সুপারিশ করা হয়। এই অনুবাদ ব্যবহারের ফলে কোনো ভুল বোঝাবুঝি বা ভুল ব্যাখ্যা হলে আমরা তার জন্য দায়ী থাকব না। \ No newline at end of file +এই নথিটি AI অনুবাদ পরিষেবা [Co-op Translator](https://github.com/Azure/co-op-translator) ব্যবহার করে অনুবাদ করা হয়েছে। আমরা যথাসম্ভব সঠিক অনুবাদের চেষ্টা করি, তবে অনুগ্রহ করে মনে রাখবেন যে স্বয়ংক্রিয় অনুবাদে ত্রুটি বা অসঙ্গতি থাকতে পারে। নথিটির মূল ভাষায় রচিত সংস্করণটিকেই প্রামাণিক উৎস হিসেবে বিবেচনা করা উচিত। গুরুত্বপূর্ণ তথ্যের জন্য পেশাদার মানব অনুবাদ সুপারিশ করা হয়। এই অনুবাদ ব্যবহারের ফলে সৃষ্ট কোনো ভুল বোঝাবুঝি বা ভুল ব্যাখ্যার জন্য আমরা দায়ী নই। \ No newline at end of file diff --git a/translations/br/6-Data-Science-In-Wild/20-Real-World-Examples/README.md b/translations/br/6-Data-Science-In-Wild/20-Real-World-Examples/README.md index 1a12bb24..fdb18ccc 100644 --- a/translations/br/6-Data-Science-In-Wild/20-Real-World-Examples/README.md +++ b/translations/br/6-Data-Science-In-Wild/20-Real-World-Examples/README.md @@ -1,8 +1,8 @@ # علم داده در دنیای واقعی -| ![تصویر طراحی شده توسط [(@sketchthedocs)](https://sketchthedocs.dev)](../../sketchnotes/20-DataScience-RealWorld.png) | +| ![ Sketchnote by [(@sketchthedocs)](https://sketchthedocs.dev) ](../../sketchnotes/20-DataScience-RealWorld.png) | | :--------------------------------------------------------------------------------------------------------------: | -| علم داده در دنیای واقعی - _تصویر طراحی شده توسط [@nitya](https://twitter.com/nitya)_ | +| علم داده در دنیای واقعی - _Sketchnote by [@nitya](https://twitter.com/nitya)_ | -ما تقریباً به پایان این مسیر یادگیری رسیده‌ایم! +ما تقریباً به پایان این سفر آموزشی رسیده‌ایم! -ما با تعریف‌های علم داده و اخلاق شروع کردیم، ابزارها و تکنیک‌های مختلف برای تحلیل و بصری‌سازی داده‌ها را بررسی کردیم، چرخه عمر علم داده را مرور کردیم و به مقیاس‌پذیری و خودکارسازی جریان‌های کاری علم داده با خدمات رایانش ابری پرداختیم. بنابراین، احتمالاً از خود می‌پرسید: _"چطور می‌توانم همه این یادگیری‌ها را به زمینه‌های دنیای واقعی مرتبط کنم؟"_ +ما با تعریف‌های علم داده و اخلاق شروع کردیم، ابزارها و تکنیک‌های مختلف برای تحلیل و مصورسازی داده‌ها را بررسی کردیم، چرخه عمر علم داده را مرور کردیم و به مقیاس‌پذیری و خودکارسازی جریان‌های کاری علم داده با خدمات رایانش ابری پرداختیم. بنابراین احتمالاً از خود می‌پرسید: _"چطور می‌توانم همه این آموخته‌ها را به زمینه‌های واقعی مرتبط کنم؟"_ در این درس، کاربردهای واقعی علم داده در صنعت را بررسی می‌کنیم و به مثال‌های خاص در زمینه‌های تحقیق، علوم انسانی دیجیتال و پایداری می‌پردازیم. همچنین فرصت‌های پروژه‌های دانشجویی را مرور کرده و با منابع مفیدی برای ادامه مسیر یادگیری شما به پایان می‌رسیم! @@ -25,48 +25,48 @@ CO_OP_TRANSLATOR_METADATA: ## علم داده + صنعت -به لطف دموکراتیزه شدن هوش مصنوعی، توسعه‌دهندگان اکنون راحت‌تر می‌توانند تصمیم‌گیری‌های مبتنی بر هوش مصنوعی و بینش‌های مبتنی بر داده را در تجربه‌های کاربری و جریان‌های کاری توسعه ادغام کنند. در اینجا چند مثال از نحوه "کاربرد" علم داده در دنیای واقعی در صنعت آورده شده است: +به لطف دموکراتیزه شدن هوش مصنوعی، توسعه‌دهندگان اکنون راحت‌تر می‌توانند تصمیم‌گیری‌های مبتنی بر هوش مصنوعی و بینش‌های مبتنی بر داده را در تجربه‌های کاربری و جریان‌های کاری توسعه ادغام کنند. در اینجا چند مثال از نحوه "کاربرد" علم داده در زمینه‌های واقعی صنعت آورده شده است: -* [Google Flu Trends](https://www.wired.com/2015/10/can-learn-epic-failure-google-flu-trends/) از علم داده برای ارتباط دادن اصطلاحات جستجو با روندهای آنفولانزا استفاده کرد. اگرچه این روش دارای نقص‌هایی بود، اما آگاهی از امکانات (و چالش‌های) پیش‌بینی‌های بهداشتی مبتنی بر داده را افزایش داد. + * [Google Flu Trends](https://www.wired.com/2015/10/can-learn-epic-failure-google-flu-trends/) از علم داده برای ارتباط دادن اصطلاحات جستجو با روندهای آنفولانزا استفاده کرد. اگرچه این روش دارای نقص‌هایی بود، اما آگاهی از امکانات (و چالش‌های) پیش‌بینی‌های بهداشتی مبتنی بر داده را افزایش داد. -* [پیش‌بینی مسیرهای UPS](https://www.technologyreview.com/2018/11/21/139000/how-ups-uses-ai-to-outsmart-bad-weather/) - توضیح می‌دهد که چگونه UPS از علم داده و یادگیری ماشین برای پیش‌بینی مسیرهای بهینه برای تحویل استفاده می‌کند، با در نظر گرفتن شرایط آب و هوایی، الگوهای ترافیکی، مهلت‌های تحویل و موارد دیگر. + * [پیش‌بینی مسیرهای UPS](https://www.technologyreview.com/2018/11/21/139000/how-ups-uses-ai-to-outsmart-bad-weather/) - توضیح می‌دهد که چگونه UPS از علم داده و یادگیری ماشین برای پیش‌بینی مسیرهای بهینه برای تحویل استفاده می‌کند، با در نظر گرفتن شرایط آب و هوایی، الگوهای ترافیکی، مهلت‌های تحویل و موارد دیگر. -* [بصری‌سازی مسیر تاکسی‌های نیویورک](http://chriswhong.github.io/nyctaxi/) - داده‌های جمع‌آوری شده با استفاده از [قوانین آزادی اطلاعات](https://chriswhong.com/open-data/foil_nyc_taxi/) به ما کمک کرد تا یک روز از زندگی تاکسی‌های نیویورک را بصری‌سازی کنیم، و بفهمیم چگونه در شهر شلوغ حرکت می‌کنند، چقدر درآمد دارند و مدت زمان سفرهایشان در هر دوره ۲۴ ساعته چقدر است. + * [مصورسازی مسیر تاکسی‌های NYC](http://chriswhong.github.io/nyctaxi/) - داده‌های جمع‌آوری شده با استفاده از [قوانین آزادی اطلاعات](https://chriswhong.com/open-data/foil_nyc_taxi/) به مصورسازی یک روز از زندگی تاکسی‌های NYC کمک کرد، و به ما نشان داد که چگونه در شهر شلوغ حرکت می‌کنند، چقدر درآمد دارند و مدت زمان سفرها در هر دوره ۲۴ ساعته چقدر است. -* [محیط کاری علم داده Uber](https://eng.uber.com/dsw/) - از داده‌های جمع‌آوری شده از میلیون‌ها سفر روزانه Uber (مانند مکان‌های سوار شدن و پیاده شدن، مدت زمان سفر، مسیرهای ترجیحی و غیره) برای ساخت یک ابزار تحلیل داده استفاده می‌کند که به تصمیم‌گیری‌های مربوط به قیمت‌گذاری، ایمنی، تشخیص تقلب و مسیریابی کمک می‌کند. + * [محیط کار علم داده Uber](https://eng.uber.com/dsw/) - از داده‌های جمع‌آوری شده از میلیون‌ها سفر روزانه Uber (مانند مکان‌های سوار شدن و پیاده شدن، مدت زمان سفر، مسیرهای ترجیحی و غیره) برای ساخت ابزار تحلیل داده استفاده می‌کند که به تصمیم‌گیری‌های مربوط به قیمت‌گذاری، ایمنی، تشخیص تقلب و ناوبری کمک می‌کند. -* [تحلیل‌های ورزشی](https://towardsdatascience.com/scope-of-analytics-in-sports-world-37ed09c39860) - بر تحلیل‌های پیش‌بینی‌کننده (تحلیل تیم و بازیکن - مانند [Moneyball](https://datasciencedegree.wisconsin.edu/blog/moneyball-proves-importance-big-data-big-ideas/) - و مدیریت طرفداران) و بصری‌سازی داده‌ها (داشبوردهای تیم و طرفداران، بازی‌ها و غیره) تمرکز دارد، با کاربردهایی مانند استعدادیابی، شرط‌بندی ورزشی و مدیریت موجودی/مکان. + * [تحلیل‌های ورزشی](https://towardsdatascience.com/scope-of-analytics-in-sports-world-37ed09c39860) - بر تحلیل‌های پیش‌بینی‌کننده (تحلیل تیم و بازیکن - مانند [Moneyball](https://datasciencedegree.wisconsin.edu/blog/moneyball-proves-importance-big-data-big-ideas/) - و مدیریت طرفداران) و مصورسازی داده‌ها (داشبوردهای تیم و طرفداران، بازی‌ها و غیره) تمرکز دارد، با کاربردهایی مانند استعدادیابی، شرط‌بندی ورزشی و مدیریت موجودی/محل برگزاری. -* [علم داده در بانکداری](https://data-flair.training/blogs/data-science-in-banking/) - ارزش علم داده در صنعت مالی را با کاربردهایی از مدل‌سازی ریسک و تشخیص تقلب گرفته تا تقسیم‌بندی مشتریان، پیش‌بینی‌های لحظه‌ای و سیستم‌های توصیه‌کننده برجسته می‌کند. تحلیل‌های پیش‌بینی‌کننده همچنین اقدامات حیاتی مانند [امتیازات اعتباری](https://dzone.com/articles/using-big-data-and-predictive-analytics-for-credit) را هدایت می‌کنند. + * [علم داده در بانکداری](https://data-flair.training/blogs/data-science-in-banking/) - ارزش علم داده در صنعت مالی را با کاربردهایی از مدل‌سازی ریسک و تشخیص تقلب گرفته تا تقسیم‌بندی مشتریان، پیش‌بینی‌های لحظه‌ای و سیستم‌های توصیه‌کننده برجسته می‌کند. تحلیل‌های پیش‌بینی‌کننده همچنین اقدامات حیاتی مانند [امتیازات اعتباری](https://dzone.com/articles/using-big-data-and-predictive-analytics-for-credit) را هدایت می‌کنند. -* [علم داده در مراقبت‌های بهداشتی](https://data-flair.training/blogs/data-science-in-healthcare/) - کاربردهایی مانند تصویربرداری پزشکی (مانند MRI، اشعه ایکس، سی‌تی‌اسکن)، ژنومیک (توالی‌یابی DNA)، توسعه دارو (ارزیابی ریسک، پیش‌بینی موفقیت)، تحلیل‌های پیش‌بینی‌کننده (مراقبت از بیمار و لجستیک تامین)، ردیابی و پیشگیری از بیماری و غیره را برجسته می‌کند. + * [علم داده در مراقبت‌های بهداشتی](https://data-flair.training/blogs/data-science-in-healthcare/) - کاربردهایی مانند تصویربرداری پزشکی (مانند MRI، اشعه ایکس، سی‌تی‌اسکن)، ژنومیک (توالی‌یابی DNA)، توسعه دارو (ارزیابی ریسک، پیش‌بینی موفقیت)، تحلیل‌های پیش‌بینی‌کننده (مراقبت از بیمار و لجستیک تامین)، ردیابی و پیشگیری از بیماری و غیره را برجسته می‌کند. -![کاربردهای علم داده در دنیای واقعی](../../../../6-Data-Science-In-Wild/20-Real-World-Examples/images/data-science-applications.png) اعتبار تصویر: [Data Flair: 6 Amazing Data Science Applications ](https://data-flair.training/blogs/data-science-applications/) +![کاربردهای علم داده در دنیای واقعی](../../../../translated_images/data-science-applications.4e5019cd8790ebac2277ff5f08af386f8727cac5d30f77727c7090677e6adb9c.fa.png) اعتبار تصویر: [Data Flair: 6 Amazing Data Science Applications ](https://data-flair.training/blogs/data-science-applications/) این شکل حوزه‌ها و مثال‌های دیگری برای کاربرد تکنیک‌های علم داده را نشان می‌دهد. آیا می‌خواهید کاربردهای دیگری را بررسی کنید؟ بخش [مرور و مطالعه خود](../../../../6-Data-Science-In-Wild/20-Real-World-Examples) را در زیر ببینید. ## علم داده + تحقیق -| ![تصویر طراحی شده توسط [(@sketchthedocs)](https://sketchthedocs.dev)](../../sketchnotes/20-DataScience-Research.png) | +| ![ Sketchnote by [(@sketchthedocs)](https://sketchthedocs.dev) ](../../sketchnotes/20-DataScience-Research.png) | | :---------------------------------------------------------------------------------------------------------------: | -| علم داده و تحقیق - _تصویر طراحی شده توسط [@nitya](https://twitter.com/nitya)_ | +| علم داده و تحقیق - _Sketchnote by [@nitya](https://twitter.com/nitya)_ | -در حالی که کاربردهای دنیای واقعی اغلب بر موارد استفاده صنعتی در مقیاس بزرگ تمرکز دارند، پروژه‌ها و کاربردهای تحقیقاتی می‌توانند از دو منظر مفید باشند: +در حالی که کاربردهای واقعی اغلب بر موارد استفاده صنعتی در مقیاس بزرگ تمرکز دارند، پروژه‌ها و کاربردهای تحقیقاتی می‌توانند از دو منظر مفید باشند: * _فرصت‌های نوآوری_ - بررسی نمونه‌سازی سریع مفاهیم پیشرفته و آزمایش تجربه‌های کاربری برای کاربردهای نسل بعدی. -* _چالش‌های استقرار_ - تحقیق در مورد آسیب‌های احتمالی یا پیامدهای ناخواسته فناوری‌های علم داده در زمینه‌های دنیای واقعی. +* _چالش‌های استقرار_ - تحقیق در مورد آسیب‌های احتمالی یا پیامدهای ناخواسته فناوری‌های علم داده در زمینه‌های واقعی. -برای دانشجویان، این پروژه‌های تحقیقاتی می‌توانند فرصت‌های یادگیری و همکاری فراهم کنند که درک شما از موضوع را بهبود بخشیده و آگاهی و تعامل شما با افراد یا تیم‌های مرتبط در حوزه‌های مورد علاقه را گسترش دهند. پس پروژه‌های تحقیقاتی چگونه به نظر می‌رسند و چگونه می‌توانند تاثیرگذار باشند؟ +برای دانشجویان، این پروژه‌های تحقیقاتی می‌توانند فرصت‌های یادگیری و همکاری فراهم کنند که درک شما از موضوع را بهبود بخشند و آگاهی و تعامل شما با افراد یا تیم‌های مرتبط در حوزه‌های مورد علاقه را گسترش دهند. پس پروژه‌های تحقیقاتی چگونه به نظر می‌رسند و چگونه می‌توانند تأثیرگذار باشند؟ -بیایید یک مثال را بررسی کنیم - [مطالعه Gender Shades MIT](http://gendershades.org/overview.html) از Joy Buolamwini (آزمایشگاه‌های رسانه‌ای MIT) با یک [مقاله تحقیقاتی برجسته](http://proceedings.mlr.press/v81/buolamwini18a/buolamwini18a.pdf) که با همکاری Timnit Gebru (در آن زمان در Microsoft Research) نوشته شده است و بر موارد زیر تمرکز دارد: +بیایید یک مثال را بررسی کنیم - [مطالعه Gender Shades MIT](http://gendershades.org/overview.html) از Joy Buolamwini (MIT Media Labs) با یک [مقاله تحقیقاتی برجسته](http://proceedings.mlr.press/v81/buolamwini18a/buolamwini18a.pdf) که با همکاری Timnit Gebru (در آن زمان در Microsoft Research) نوشته شده است و بر موارد زیر تمرکز دارد: -* **چه چیزی:** هدف پروژه تحقیقاتی _ارزیابی تعصب موجود در الگوریتم‌ها و مجموعه داده‌های تحلیل خودکار چهره_ بر اساس جنسیت و نوع پوست بود. -* **چرا:** تحلیل چهره در زمینه‌هایی مانند اجرای قانون، امنیت فرودگاه، سیستم‌های استخدام و موارد دیگر استفاده می‌شود - زمینه‌هایی که طبقه‌بندی‌های نادرست (مثلاً به دلیل تعصب) می‌توانند آسیب‌های اقتصادی و اجتماعی بالقوه‌ای به افراد یا گروه‌های متاثر وارد کنند. درک (و حذف یا کاهش) تعصب‌ها کلید عدالت در استفاده است. -* **چگونه:** محققان تشخیص دادند که معیارهای موجود عمدتاً از افراد با پوست روشن‌تر استفاده می‌کنند و یک مجموعه داده جدید (بیش از ۱۰۰۰ تصویر) ایجاد کردند که _متعادل‌تر_ از نظر جنسیت و نوع پوست بود. این مجموعه داده برای ارزیابی دقت سه محصول طبقه‌بندی جنسیت (از Microsoft، IBM و Face++) استفاده شد. + * **چه چیزی:** هدف پروژه تحقیقاتی _ارزیابی تعصب موجود در الگوریتم‌ها و مجموعه داده‌های تحلیل خودکار چهره_ بر اساس جنسیت و نوع پوست بود. + * **چرا:** تحلیل چهره در زمینه‌هایی مانند اجرای قانون، امنیت فرودگاه، سیستم‌های استخدام و موارد دیگر استفاده می‌شود - زمینه‌هایی که طبقه‌بندی‌های نادرست (مثلاً به دلیل تعصب) می‌توانند آسیب‌های اقتصادی و اجتماعی بالقوه‌ای به افراد یا گروه‌های تحت تأثیر وارد کنند. درک (و حذف یا کاهش) تعصب‌ها کلید عدالت در استفاده است. + * **چگونه:** محققان تشخیص دادند که معیارهای موجود عمدتاً از افراد با پوست روشن‌تر استفاده می‌کنند و یک مجموعه داده جدید (بیش از ۱۰۰۰ تصویر) ایجاد کردند که _متعادل‌تر_ از نظر جنسیت و نوع پوست بود. این مجموعه داده برای ارزیابی دقت سه محصول طبقه‌بندی جنسیت (از Microsoft، IBM و Face++) استفاده شد. -نتایج نشان داد که اگرچه دقت کلی طبقه‌بندی خوب بود، تفاوت قابل توجهی در نرخ خطا بین گروه‌های مختلف وجود داشت - با **اشتباه در تشخیص جنسیت** بیشتر برای زنان یا افراد با پوست تیره‌تر، که نشان‌دهنده تعصب بود. +نتایج نشان داد که اگرچه دقت کلی طبقه‌بندی خوب بود، تفاوت قابل توجهی در نرخ خطا بین گروه‌های مختلف وجود داشت - با **اشتباه در جنسیت** بیشتر برای زنان یا افراد با پوست تیره‌تر، که نشان‌دهنده تعصب بود. -**نتایج کلیدی:** آگاهی را افزایش داد که علم داده به مجموعه داده‌های _نماینده‌تر_ (گروه‌های متعادل) و تیم‌های _فراگیرتر_ (پیشینه‌های متنوع) نیاز دارد تا این تعصب‌ها را زودتر در راه‌حل‌های هوش مصنوعی شناسایی و حذف یا کاهش دهد. تلاش‌های تحقیقاتی مانند این همچنین در تعریف اصول و شیوه‌های _هوش مصنوعی مسئولانه_ توسط بسیاری از سازمان‌ها برای بهبود عدالت در محصولات و فرآیندهای هوش مصنوعی آن‌ها نقش اساسی دارند. +**نتایج کلیدی:** آگاهی را افزایش داد که علم داده نیاز به مجموعه داده‌های _نماینده‌تر_ (گروه‌های متعادل) و تیم‌های _فراگیرتر_ (پیشینه‌های متنوع) دارد تا بتوان چنین تعصب‌هایی را زودتر در راه‌حل‌های هوش مصنوعی شناسایی و حذف یا کاهش داد. تلاش‌های تحقیقاتی مانند این همچنین در تعریف اصول و شیوه‌ها برای _هوش مصنوعی مسئولانه_ در بسیاری از سازمان‌ها برای بهبود عدالت در محصولات و فرآیندهای هوش مصنوعی آن‌ها نقش اساسی دارند. **آیا می‌خواهید درباره تلاش‌های تحقیقاتی مرتبط در Microsoft اطلاعات کسب کنید؟** @@ -76,53 +76,53 @@ CO_OP_TRANSLATOR_METADATA: ## علم داده + علوم انسانی -| ![تصویر طراحی شده توسط [(@sketchthedocs)](https://sketchthedocs.dev)](../../sketchnotes/20-DataScience-Humanities.png) | +| ![ Sketchnote by [(@sketchthedocs)](https://sketchthedocs.dev) ](../../sketchnotes/20-DataScience-Humanities.png) | | :---------------------------------------------------------------------------------------------------------------: | -| علم داده و علوم انسانی دیجیتال - _تصویر طراحی شده توسط [@nitya](https://twitter.com/nitya)_ | +| علم داده و علوم انسانی دیجیتال - _Sketchnote by [@nitya](https://twitter.com/nitya)_ | -علوم انسانی دیجیتال [تعریف شده است](https://digitalhumanities.stanford.edu/about-dh-stanford) به عنوان "مجموعه‌ای از شیوه‌ها و رویکردها که روش‌های محاسباتی را با تحقیق انسانی ترکیب می‌کنند". پروژه‌های [Stanford](https://digitalhumanities.stanford.edu/projects) مانند _"بازنگری تاریخ"_ و _"تفکر شاعرانه"_ ارتباط بین [علوم انسانی دیجیتال و علم داده](https://digitalhumanities.stanford.edu/digital-humanities-and-data-science) را نشان می‌دهند - تاکید بر تکنیک‌هایی مانند تحلیل شبکه، بصری‌سازی اطلاعات، تحلیل فضایی و متنی که می‌توانند به ما کمک کنند مجموعه داده‌های تاریخی و ادبی را بازنگری کنیم تا بینش‌ها و دیدگاه‌های جدیدی به دست آوریم. +علوم انسانی دیجیتال [تعریف شده است](https://digitalhumanities.stanford.edu/about-dh-stanford) به عنوان "مجموعه‌ای از شیوه‌ها و رویکردها که روش‌های محاسباتی را با تحقیق انسانی ترکیب می‌کنند". پروژه‌های [Stanford](https://digitalhumanities.stanford.edu/projects) مانند _"بازنگری تاریخ"_ و _"تفکر شاعرانه"_ ارتباط بین [علوم انسانی دیجیتال و علم داده](https://digitalhumanities.stanford.edu/digital-humanities-and-data-science) را نشان می‌دهند - تأکید بر تکنیک‌هایی مانند تحلیل شبکه، مصورسازی اطلاعات، تحلیل فضایی و متنی که می‌توانند به ما کمک کنند مجموعه داده‌های تاریخی و ادبی را بازنگری کنیم تا بینش‌ها و دیدگاه‌های جدیدی به دست آوریم. *آیا می‌خواهید پروژه‌ای در این زمینه را بررسی و گسترش دهید؟* -پروژه ["امیلی دیکینسون و وزن احساسات"](https://gist.github.com/jlooper/ce4d102efd057137bc000db796bfd671) را بررسی کنید - یک مثال عالی از [Jen Looper](https://twitter.com/jenlooper) که می‌پرسد چگونه می‌توانیم از علم داده برای بازنگری در شعرهای آشنا و ارزیابی مجدد معنای آن‌ها و مشارکت‌های نویسنده در زمینه‌های جدید استفاده کنیم. برای مثال، _آیا می‌توانیم فصل سرودن یک شعر را با تحلیل لحن یا احساسات آن پیش‌بینی کنیم_ - و این چه چیزی درباره وضعیت ذهنی نویسنده در دوره مربوطه به ما می‌گوید؟ +پروژه ["امیلی دیکینسون و وزن احساسات"](https://gist.github.com/jlooper/ce4d102efd057137bc000db796bfd671) را بررسی کنید - یک مثال عالی از [Jen Looper](https://twitter.com/jenlooper) که می‌پرسد چگونه می‌توانیم از علم داده برای بازنگری در شعرهای آشنا و ارزیابی مجدد معنای آن‌ها و مشارکت‌های نویسنده در زمینه‌های جدید استفاده کنیم. برای مثال، _آیا می‌توانیم فصل سرودن یک شعر را با تحلیل لحن یا احساسات آن پیش‌بینی کنیم_ - و این چه چیزی درباره حالت ذهن نویسنده در دوره مربوطه به ما می‌گوید؟ برای پاسخ به این سوال، مراحل چرخه عمر علم داده را دنبال می‌کنیم: -* [`جمع‌آوری داده‌ها`](https://gist.github.com/jlooper/ce4d102efd057137bc000db796bfd671#acquiring-the-dataset) - برای جمع‌آوری مجموعه داده مرتبط برای تحلیل. گزینه‌ها شامل استفاده از API (مانند [Poetry DB API](https://poetrydb.org/index.html)) یا استخراج صفحات وب (مانند [Project Gutenberg](https://www.gutenberg.org/files/12242/12242-h/12242-h.htm)) با استفاده از ابزارهایی مانند [Scrapy](https://scrapy.org/). -* [`پاک‌سازی داده‌ها`](https://gist.github.com/jlooper/ce4d102efd057137bc000db796bfd671#clean-the-data) - توضیح می‌دهد که چگونه متن می‌تواند با ابزارهای ساده‌ای مانند Visual Studio Code و Microsoft Excel قالب‌بندی، بهینه‌سازی و ساده شود. -* [`تحلیل داده‌ها`](https://gist.github.com/jlooper/ce4d102efd057137bc000db796bfd671#working-with-the-data-in-a-notebook) - توضیح می‌دهد که چگونه می‌توانیم اکنون مجموعه داده را برای تحلیل وارد "دفترچه‌ها" کنیم، با استفاده از بسته‌های پایتون (مانند pandas، numpy و matplotlib) برای سازماندهی و بصری‌سازی داده‌ها. -* [`تحلیل احساسات`](https://gist.github.com/jlooper/ce4d102efd057137bc000db796bfd671#sentiment-analysis-using-cognitive-services) - توضیح می‌دهد که چگونه می‌توانیم خدمات ابری مانند Text Analytics را با استفاده از ابزارهای کم‌کد مانند [Power Automate](https://flow.microsoft.com/en-us/) برای جریان‌های کاری پردازش داده خودکار ادغام کنیم. + * [`جمع‌آوری داده‌ها`](https://gist.github.com/jlooper/ce4d102efd057137bc000db796bfd671#acquiring-the-dataset) - برای جمع‌آوری مجموعه داده‌های مرتبط برای تحلیل. گزینه‌ها شامل استفاده از API (مانند [Poetry DB API](https://poetrydb.org/index.html)) یا استخراج صفحات وب (مانند [Project Gutenberg](https://www.gutenberg.org/files/12242/12242-h/12242-h.htm)) با استفاده از ابزارهایی مانند [Scrapy](https://scrapy.org/). + * [`پاک‌سازی داده‌ها`](https://gist.github.com/jlooper/ce4d102efd057137bc000db796bfd671#clean-the-data) - توضیح می‌دهد که چگونه متن می‌تواند با ابزارهای ساده‌ای مانند Visual Studio Code و Microsoft Excel قالب‌بندی، بهینه‌سازی و ساده شود. + * [`تحلیل داده‌ها`](https://gist.github.com/jlooper/ce4d102efd057137bc000db796bfd671#working-with-the-data-in-a-notebook) - توضیح می‌دهد که چگونه می‌توانیم اکنون مجموعه داده را برای تحلیل وارد "دفترچه‌ها" کنیم و با استفاده از بسته‌های پایتون (مانند pandas، numpy و matplotlib) داده‌ها را سازماندهی و مصورسازی کنیم. + * [`تحلیل احساسات`](https://gist.github.com/jlooper/ce4d102efd057137bc000db796bfd671#sentiment-analysis-using-cognitive-services) - توضیح می‌دهد که چگونه می‌توانیم خدمات ابری مانند Text Analytics را با استفاده از ابزارهای کم‌کد مانند [Power Automate](https://flow.microsoft.com/en-us/) برای جریان‌های کاری پردازش داده خودکار ادغام کنیم. -با استفاده از این جریان کاری، می‌توانیم تاثیرات فصلی بر احساسات شعرها را بررسی کنیم و به ما کمک کنیم دیدگاه‌های خودمان را درباره نویسنده شکل دهیم. خودتان امتحان کنید - سپس دفترچه را گسترش دهید تا سوالات دیگری بپرسید یا داده‌ها را به روش‌های جدید بصری‌سازی کنید! +با استفاده از این جریان کاری، می‌توانیم تأثیرات فصلی بر احساسات شعرها را بررسی کنیم و به ما کمک کنیم دیدگاه‌های خود را درباره نویسنده شکل دهیم. خودتان امتحان کنید - سپس دفترچه را گسترش دهید تا سوالات دیگری بپرسید یا داده‌ها را به روش‌های جدید مصورسازی کنید! > می‌توانید از برخی ابزارهای موجود در [جعبه ابزار علوم انسانی دیجیتال](https://github.com/Digital-Humanities-Toolkit) برای دنبال کردن این مسیرهای تحقیقاتی استفاده کنید. ## علم داده + پایداری -| ![تصویر طراحی شده توسط [(@sketchthedocs)](https://sketchthedocs.dev)](../../sketchnotes/20-DataScience-Sustainability.png) | +| ![ Sketchnote by [(@sketchthedocs)](https://sketchthedocs.dev) ](../../sketchnotes/20-DataScience-Sustainability.png) | | :---------------------------------------------------------------------------------------------------------------: | -| علم داده و پایداری - _تصویر طراحی شده توسط [@nitya](https://twitter.com/nitya)_ | +| علم داده و پایداری - _Sketchnote by [@nitya](https://twitter.com/nitya)_ | -[دستور کار ۲۰۳۰ برای توسعه پایدار](https://sdgs.un.org/2030agenda) - که توسط همه اعضای سازمان ملل در سال ۲۰۱۵ تصویب شد - ۱۷ هدف را شناسایی می‌کند، از جمله اهدافی که بر **حفاظت از سیاره** در برابر تخریب و تاثیر تغییرات اقلیمی تمرکز دارند. ابتکار [پایداری Microsoft](https://www.microsoft.com/en-us/sustainability) از این اهداف حمایت می‌کند و راه‌هایی را بررسی می‌کند که راه‌حل‌های فناوری می‌توانند آینده‌های پایدارتر را پشتیبانی و ایجاد کنند، با [تمرکز بر ۴ هدف](https://dev.to/azure/a-visual-guide-to-sustainable-software-engineering-53hh) - کربن منفی، آب مثبت، صفر زباله و تنوع زیستی تا سال ۲۰۳۰. +[دستور کار ۲۰۳۰ برای توسعه پایدار](https://sdgs.un.org/2030agenda) - که توسط همه اعضای سازمان ملل در سال ۲۰۱۵ تصویب شد - ۱۷ هدف را شناسایی می‌کند، از جمله اهدافی که بر **حفاظت از سیاره** در برابر تخریب و تأثیر تغییرات اقلیمی تمرکز دارند. ابتکار [پایداری Microsoft](https://www.microsoft.com/en-us/sustainability) از این اهداف حمایت می‌کند و راه‌هایی را بررسی می‌کند که راه‌حل‌های فناوری می‌توانند آینده‌های پایدارتر را پشتیبانی و ایجاد کنند، با [تمرکز بر ۴ هدف](https://dev.to/azure/a-visual-guide-to-sustainable-software-engineering-53hh) - کربن منفی، آب مثبت، صفر زباله و تنوع زیستی تا سال ۲۰۳۰. مقابله با این چالش‌ها به صورت مقیاس‌پذیر و به موقع نیازمند تفکر در مقیاس ابری - و داده‌های بزرگ است. ابتکار [Planetary Computer](https://planetarycomputer.microsoft.com/) ۴ مؤلفه را برای کمک به دانشمندان داده و توسعه‌دهندگان در این تلاش ارائه می‌دهد: -* [کاتالوگ داده‌ها](https://planetarycomputer.microsoft.com/catalog) - با پتابایت‌های داده‌های سیستم‌های زمین (رایگان و میزبانی شده در Azure). -* [API سیاره‌ای](https://planetarycomputer.microsoft.com/docs/reference/stac/) - برای کمک به کاربران در جستجوی داده‌های مرتبط در فضا و زمان. -* [مرکز](https://planetarycomputer.microsoft.com/docs/overview/environment/) - محیط مدیریت شده برای دانشمندان برای پردازش مجموعه داده‌های عظیم جغرافیایی. -* [برنامه‌ها](https://planetarycomputer.microsoft.com/applications) - نمایش موارد استفاده و ابزارهایی برای بینش‌های پایداری. + * [کاتالوگ داده‌ها](https://planetarycomputer.microsoft.com/catalog) - با پتابایت‌های داده‌های سیستم‌های زمین (رایگان و میزبانی شده در Azure). + * [API سیاره‌ای](https://planetarycomputer.microsoft.com/docs/reference/stac/) - برای کمک به کاربران در جستجوی داده‌های مرتبط در سراسر فضا و زمان. + * [مرکز](https://planetarycomputer.microsoft.com/docs/overview/environment/) - محیط مدیریت شده برای دانشمندان برای پردازش مجموعه داده‌های عظیم جغرافیایی. + * [برنامه‌ها](https://planetarycomputer.microsoft.com/applications) - نمایش موارد استفاده و ابزارهایی برای بینش‌های پایداری. **پروژه کامپیوتر سیاره‌ای در حال حاضر در مرحله پیش‌نمایش است (از سپتامبر 2021)** - در اینجا نحوه شروع مشارکت در راه‌حل‌های پایداری با استفاده از علم داده توضیح داده شده است. * [درخواست دسترسی](https://planetarycomputer.microsoft.com/account/request) برای شروع کاوش و ارتباط با همتایان. -* [بررسی مستندات](https://planetarycomputer.microsoft.com/docs/overview/about) برای درک مجموعه داده‌ها و API‌های پشتیبانی‌شده. +* [کاوش مستندات](https://planetarycomputer.microsoft.com/docs/overview/about) برای درک مجموعه داده‌ها و API‌های پشتیبانی‌شده. * برنامه‌هایی مانند [پایش اکوسیستم](https://analytics-lab.org/ecosystemmonitoring/) را برای الهام گرفتن از ایده‌های کاربردی بررسی کنید. -به این فکر کنید که چگونه می‌توانید از تجسم داده‌ها برای آشکار کردن یا تقویت بینش‌های مرتبط در زمینه‌هایی مانند تغییرات اقلیمی و جنگل‌زدایی استفاده کنید. یا به این فکر کنید که چگونه می‌توان از این بینش‌ها برای ایجاد تجربیات کاربری جدید استفاده کرد که تغییرات رفتاری را برای زندگی پایدارتر انگیزه دهد. +به این فکر کنید که چگونه می‌توانید از تجسم داده‌ها برای آشکار کردن یا تقویت بینش‌های مرتبط در زمینه‌هایی مانند تغییرات اقلیمی و جنگل‌زدایی استفاده کنید. یا به این فکر کنید که چگونه می‌توان از این بینش‌ها برای ایجاد تجربیات جدید کاربری که تغییرات رفتاری را برای زندگی پایدارتر انگیزه می‌دهد، استفاده کرد. ## علم داده + دانشجویان -ما درباره کاربردهای واقعی در صنعت و پژوهش صحبت کرده‌ایم و نمونه‌هایی از کاربرد علم داده در علوم انسانی دیجیتال و پایداری را بررسی کرده‌ایم. حالا چگونه می‌توانید مهارت‌های خود را بسازید و تخصص خود را به عنوان مبتدیان علم داده به اشتراک بگذارید؟ +ما درباره کاربردهای واقعی در صنعت و پژوهش صحبت کرده‌ایم و نمونه‌هایی از کاربرد علم داده در علوم انسانی دیجیتال و پایداری را بررسی کرده‌ایم. حالا چگونه می‌توانید مهارت‌های خود را توسعه دهید و تخصص خود را به عنوان مبتدیان علم داده به اشتراک بگذارید؟ -در اینجا چند نمونه از پروژه‌های دانشجویی علم داده برای الهام گرفتن آورده شده است. +در اینجا چند نمونه از پروژه‌های دانشجویی علم داده برای الهام گرفتن آورده شده است: * [مدرسه تابستانی علم داده MSR](https://www.microsoft.com/en-us/research/academic-program/data-science-summer-school/#!projects) با [پروژه‌های GitHub](https://github.com/msr-ds3) که موضوعاتی مانند: - [تعصب نژادی در استفاده از زور توسط پلیس](https://www.microsoft.com/en-us/research/video/data-science-summer-school-2019-replicating-an-empirical-analysis-of-racial-differences-in-police-use-of-force/) | [Github](https://github.com/msr-ds3/stop-question-frisk) @@ -137,13 +137,14 @@ CO_OP_TRANSLATOR_METADATA: ## [آزمون پس از سخنرانی](https://ff-quizzes.netlify.app/en/ds/quiz/39) -## مرور و مطالعه شخصی +## مرور و مطالعه خودآموز می‌خواهید موارد استفاده بیشتری را بررسی کنید؟ در اینجا چند مقاله مرتبط آورده شده است: * [17 کاربرد و مثال علم داده](https://builtin.com/data-science/data-science-applications-examples) - جولای 2021 * [11 کاربرد شگفت‌انگیز علم داده در دنیای واقعی](https://myblindbird.com/data-science-applications-real-world/) - مه 2021 * [علم داده در دنیای واقعی](https://towardsdatascience.com/data-science-in-the-real-world/home) - مجموعه مقالات -* علم داده در: [آموزش](https://data-flair.training/blogs/data-science-in-education/)، [کشاورزی](https://data-flair.training/blogs/data-science-in-agriculture/)، [مالی](https://data-flair.training/blogs/data-science-in-finance/)، [فیلم‌ها](https://data-flair.training/blogs/data-science-at-movies/) و موارد دیگر. +* [12 کاربرد واقعی علم داده با مثال‌ها](https://www.scaler.com/blog/data-science-applications/) - مه 2024 +* علم داده در: [آموزش](https://data-flair.training/blogs/data-science-in-education/)، [کشاورزی](https://data-flair.training/blogs/data-science-in-agriculture/)، [مالی](https://data-flair.training/blogs/data-science-in-finance/)، [فیلم‌ها](https://data-flair.training/blogs/data-science-at-movies/)، [مراقبت‌های بهداشتی](https://onlinedegrees.sandiego.edu/data-science-health-care/) و موارد دیگر. ## تکلیف @@ -152,4 +153,4 @@ CO_OP_TRANSLATOR_METADATA: --- **سلب مسئولیت**: -این سند با استفاده از سرویس ترجمه هوش مصنوعی [Co-op Translator](https://github.com/Azure/co-op-translator) ترجمه شده است. در حالی که ما برای دقت تلاش می‌کنیم، لطفاً توجه داشته باشید که ترجمه‌های خودکار ممکن است شامل خطاها یا نادقتی‌هایی باشند. سند اصلی به زبان اصلی آن باید به عنوان منبع معتبر در نظر گرفته شود. برای اطلاعات حساس، ترجمه حرفه‌ای انسانی توصیه می‌شود. ما هیچ مسئولیتی در قبال سوءتفاهم‌ها یا تفسیرهای نادرست ناشی از استفاده از این ترجمه نداریم. \ No newline at end of file +این سند با استفاده از سرویس ترجمه هوش مصنوعی [Co-op Translator](https://github.com/Azure/co-op-translator) ترجمه شده است. در حالی که ما تلاش می‌کنیم دقت را حفظ کنیم، لطفاً توجه داشته باشید که ترجمه‌های خودکار ممکن است شامل خطاها یا نادرستی‌ها باشند. سند اصلی به زبان اصلی آن باید به عنوان منبع معتبر در نظر گرفته شود. برای اطلاعات حساس، توصیه می‌شود از ترجمه حرفه‌ای انسانی استفاده کنید. ما مسئولیتی در قبال سوء تفاهم‌ها یا تفسیرهای نادرست ناشی از استفاده از این ترجمه نداریم. \ No newline at end of file diff --git a/translations/fi/6-Data-Science-In-Wild/20-Real-World-Examples/README.md b/translations/fi/6-Data-Science-In-Wild/20-Real-World-Examples/README.md index 7e2b8a06..2b0623a2 100644 --- a/translations/fi/6-Data-Science-In-Wild/20-Real-World-Examples/README.md +++ b/translations/fi/6-Data-Science-In-Wild/20-Real-World-Examples/README.md @@ -1,115 +1,115 @@ -# Data Science todellisessa maailmassa +# Data Science tosielämässä | ![ Sketchnote by [(@sketchthedocs)](https://sketchthedocs.dev) ](../../sketchnotes/20-DataScience-RealWorld.png) | | :--------------------------------------------------------------------------------------------------------------: | -| Data Science todellisessa maailmassa - _Sketchnote by [@nitya](https://twitter.com/nitya)_ | +| Data Science tosielämässä - _Sketchnote by [@nitya](https://twitter.com/nitya)_ | Olemme melkein tämän oppimismatkan lopussa! -Aloitimme määrittelemällä data-analytiikan ja etiikan, tutkimme erilaisia työkaluja ja tekniikoita data-analyysiin ja visualisointiin, kävimme läpi data-analytiikan elinkaaren ja tarkastelimme, miten pilvipalvelut voivat auttaa skaalaamaan ja automatisoimaan data-analytiikan työnkulkuja. Saatat nyt miettiä: _"Miten voin soveltaa näitä oppeja todellisiin tilanteisiin?"_ +Aloitimme määritelmistä, jotka koskivat data sciencea ja etiikkaa, tutkimme erilaisia työkaluja ja tekniikoita data-analyysiin ja visualisointiin, kävimme läpi data sciencen elinkaaren ja tarkastelimme, miten data science -työnkulkuja voidaan laajentaa ja automatisoida pilvipalveluiden avulla. Joten saatat miettiä: _"Miten tarkalleen ottaen voin soveltaa näitä oppeja tosielämän tilanteisiin?"_ -Tässä oppitunnissa tutkimme data-analytiikan sovelluksia eri toimialoilla ja sukellamme tarkemmin esimerkkeihin tutkimuksen, digitaalisten humanististen tieteiden ja kestävän kehityksen konteksteissa. Tarkastelemme opiskelijaprojektimahdollisuuksia ja päätämme hyödyllisiin resursseihin, jotka auttavat sinua jatkamaan oppimismatkaasi! +Tässä oppitunnissa tutkimme data sciencen tosielämän sovelluksia eri toimialoilla ja sukellamme erityisiin esimerkkeihin tutkimuksen, digitaalisten humanististen tieteiden ja kestävän kehityksen konteksteissa. Tarkastelemme opiskelijaprojektimahdollisuuksia ja päätämme hyödyllisiin resursseihin, jotka auttavat sinua jatkamaan oppimismatkaasi! ## Ennakkokysely ## [Ennakkokysely](https://ff-quizzes.netlify.app/en/ds/quiz/38) -## Data-analytiikka + Teollisuus +## Data Science + Teollisuus -Tekoälyn demokratisoinnin ansiosta kehittäjien on nyt helpompaa suunnitella ja integroida tekoälypohjaista päätöksentekoa ja dataan perustuvia oivalluksia käyttäjäkokemuksiin ja kehitysprosesseihin. Tässä muutamia esimerkkejä siitä, miten data-analytiikkaa sovelletaan todellisiin käyttötapauksiin eri toimialoilla: +AI:n demokratisoinnin ansiosta kehittäjien on nyt helpompi suunnitella ja integroida AI-pohjaista päätöksentekoa ja dataan perustuvia oivalluksia käyttäjäkokemuksiin ja kehitystyönkulkuihin. Tässä muutamia esimerkkejä siitä, miten data sciencea "sovelletaan" tosielämän sovelluksiin eri toimialoilla: - * [Google Flu Trends](https://www.wired.com/2015/10/can-learn-epic-failure-google-flu-trends/) käytti data-analytiikkaa yhdistääkseen hakutermit influenssatrendeihin. Vaikka lähestymistavassa oli puutteita, se lisäsi tietoisuutta dataan perustuvien terveydenhuollon ennusteiden mahdollisuuksista (ja haasteista). + * [Google Flu Trends](https://www.wired.com/2015/10/can-learn-epic-failure-google-flu-trends/) käytti data sciencea korreloimaan hakutermit influenssatrendien kanssa. Vaikka lähestymistavassa oli puutteita, se lisäsi tietoisuutta dataan perustuvien terveydenhuollon ennusteiden mahdollisuuksista (ja haasteista). - * [UPS:n reittien ennustaminen](https://www.technologyreview.com/2018/11/21/139000/how-ups-uses-ai-to-outsmart-bad-weather/) - selittää, miten UPS käyttää data-analytiikkaa ja koneoppimista ennustaakseen optimaaliset toimitusreitit ottaen huomioon sääolosuhteet, liikennemallit, toimitusaikataulut ja paljon muuta. + * [UPS Reittiennusteet](https://www.technologyreview.com/2018/11/21/139000/how-ups-uses-ai-to-outsmart-bad-weather/) - selittää, miten UPS käyttää data sciencea ja koneoppimista ennustamaan optimaalisia toimitusreittejä huomioiden sääolosuhteet, liikennemallit, toimitusaikataulut ja paljon muuta. - * [NYC:n taksireittien visualisointi](http://chriswhong.github.io/nyctaxi/) - data, joka kerättiin [tietopyyntölakien](https://chriswhong.com/open-data/foil_nyc_taxi/) avulla, auttoi visualisoimaan yhden päivän NYC:n taksien elämästä, mikä auttaa ymmärtämään, miten ne navigoivat kiireisessä kaupungissa, kuinka paljon rahaa ne ansaitsevat ja kuinka kauan matkat kestävät 24 tunnin aikana. + * [NYC Taksireittien visualisointi](http://chriswhong.github.io/nyctaxi/) - data, joka kerättiin [Freedom Of Information Laws](https://chriswhong.com/open-data/foil_nyc_taxi/) avulla, auttoi visualisoimaan yhden päivän NYC:n taksien elämästä, auttaen ymmärtämään, miten ne navigoivat vilkkaassa kaupungissa, kuinka paljon rahaa ne ansaitsevat ja matkojen keston 24 tunnin aikana. - * [Uber Data Science Workbench](https://eng.uber.com/dsw/) - käyttää dataa (nouto- ja jättöpaikat, matkan kesto, suosikkireitit jne.), joka kerätään miljoonista Uber-matkoista *päivittäin*, rakentaakseen data-analytiikkatyökalun, joka auttaa hinnoittelussa, turvallisuudessa, petosten havaitsemisessa ja navigointipäätöksissä. + * [Uber Data Science Workbench](https://eng.uber.com/dsw/) - käyttää dataa (nouto- ja jättöpaikat, matkan kesto, suosituimmat reitit jne.), joka kerätään miljoonista Uber-matkoista *päivittäin*, rakentaakseen data-analytiikkatyökalun hinnoittelun, turvallisuuden, petosten havaitsemisen ja navigointipäätösten tueksi. - * [Urheiluanalytiikka](https://towardsdatascience.com/scope-of-analytics-in-sports-world-37ed09c39860) - keskittyy _ennakoivaan analytiikkaan_ (joukkue- ja pelaaja-analyysi - ajattele [Moneyball](https://datasciencedegree.wisconsin.edu/blog/moneyball-proves-importance-big-data-big-ideas/) - ja fanien hallinta) sekä _datavisualisointiin_ (joukkue- ja fanidashboardit, pelit jne.) sovelluksilla, kuten kykyjenetsintä, urheiluvedonlyönti ja varaston/tilojen hallinta. + * [Urheiluanalytiikka](https://towardsdatascience.com/scope-of-analytics-in-sports-world-37ed09c39860) - keskittyy _ennustavaan analytiikkaan_ (joukkue- ja pelaaja-analyysi - ajattele [Moneyball](https://datasciencedegree.wisconsin.edu/blog/moneyball-proves-importance-big-data-big-ideas/) - ja fanien hallinta) ja _datavisualisointiin_ (joukkue- ja fanien hallintapaneelit, pelit jne.) sovelluksilla, kuten kykyjenetsintä, urheilupelaaminen ja varaston/tilojen hallinta. - * [Data-analytiikka pankkialalla](https://data-flair.training/blogs/data-science-in-banking/) - korostaa data-analytiikan arvoa rahoitusalalla sovelluksilla, jotka vaihtelevat riskimallinnuksesta ja petosten havaitsemisesta asiakassegmentointiin, reaaliaikaisiin ennusteisiin ja suosittelujärjestelmiin. Ennakoiva analytiikka ohjaa myös kriittisiä mittareita, kuten [luottoluokituksia](https://dzone.com/articles/using-big-data-and-predictive-analytics-for-credit). + * [Data Science pankkialalla](https://data-flair.training/blogs/data-science-in-banking/) - korostaa data sciencen arvoa rahoitusalalla sovelluksilla, jotka vaihtelevat riskimallinnuksesta ja petosten havaitsemisesta asiakassegmentointiin, reaaliaikaisiin ennusteisiin ja suosittelujärjestelmiin. Ennustava analytiikka ohjaa myös kriittisiä mittareita, kuten [luottopisteet](https://dzone.com/articles/using-big-data-and-predictive-analytics-for-credit). - * [Data-analytiikka terveydenhuollossa](https://data-flair.training/blogs/data-science-in-healthcare/) - korostaa sovelluksia, kuten lääketieteellinen kuvantaminen (esim. MRI, röntgen, CT-skannaus), genomiikka (DNA-sekvensointi), lääkekehitys (riskinarviointi, onnistumisen ennustaminen), ennakoiva analytiikka (potilashoito ja toimituslogistiikka), tautien seuranta ja ehkäisy jne. + * [Data Science terveydenhuollossa](https://data-flair.training/blogs/data-science-in-healthcare/) - korostaa sovelluksia, kuten lääketieteellinen kuvantaminen (esim. MRI, röntgen, CT-skannaus), genomiikka (DNA-sekvensointi), lääkekehitys (riskinarviointi, onnistumisen ennustaminen), ennustava analytiikka (potilashoito ja toimituslogistiikka), tautien seuranta ja ehkäisy jne. -![Data-analytiikan sovellukset todellisessa maailmassa](../../../../6-Data-Science-In-Wild/20-Real-World-Examples/images/data-science-applications.png) Kuvalähde: [Data Flair: 6 Amazing Data Science Applications ](https://data-flair.training/blogs/data-science-applications/) +![Data Science -sovellukset tosielämässä](../../../../translated_images/data-science-applications.4e5019cd8790ebac2277ff5f08af386f8727cac5d30f77727c7090677e6adb9c.fi.png) Kuva: [Data Flair: 6 Amazing Data Science Applications ](https://data-flair.training/blogs/data-science-applications/) -Kuvassa esitetään muita aloja ja esimerkkejä data-analytiikan tekniikoiden soveltamisesta. Haluatko tutkia muita sovelluksia? Katso [Review & Self Study](../../../../6-Data-Science-In-Wild/20-Real-World-Examples) -osio alta. +Kuvassa näkyy muita aloja ja esimerkkejä data science -tekniikoiden soveltamisesta. Haluatko tutkia muita sovelluksia? Katso [Review & Self Study](../../../../6-Data-Science-In-Wild/20-Real-World-Examples) -osio alta. -## Data-analytiikka + Tutkimus +## Data Science + Tutkimus | ![ Sketchnote by [(@sketchthedocs)](https://sketchthedocs.dev) ](../../sketchnotes/20-DataScience-Research.png) | | :---------------------------------------------------------------------------------------------------------------: | -| Data-analytiikka & Tutkimus - _Sketchnote by [@nitya](https://twitter.com/nitya)_ | +| Data Science & Tutkimus - _Sketchnote by [@nitya](https://twitter.com/nitya)_ | -Vaikka todelliset sovellukset keskittyvät usein teollisuuden käyttötapauksiin laajassa mittakaavassa, _tutkimus_-sovellukset ja -projektit voivat olla hyödyllisiä kahdesta näkökulmasta: +Vaikka tosielämän sovellukset keskittyvät usein teollisuuden käyttötapauksiin laajassa mittakaavassa, _tutkimus_ sovellukset ja projektit voivat olla hyödyllisiä kahdesta näkökulmasta: -* _innovaatiomahdollisuudet_ - tutkia edistyneiden konseptien nopeaa prototyyppausta ja käyttäjäkokemusten testausta seuraavan sukupolven sovelluksille. -* _käyttöönoton haasteet_ - tutkia mahdollisia haittoja tai tahattomia seurauksia data-analytiikan teknologioiden käytöstä todellisissa konteksteissa. +* _innovointimahdollisuudet_ - tutkia edistyneiden konseptien nopeaa prototyyppausta ja käyttäjäkokemusten testausta seuraavan sukupolven sovelluksille. +* _käyttöönoton haasteet_ - tutkia mahdollisia haittoja tai tahattomia seurauksia data science -teknologioiden käytöstä tosielämän konteksteissa. -Opiskelijoille nämä tutkimusprojektit voivat tarjota sekä oppimis- että yhteistyömahdollisuuksia, jotka parantavat ymmärrystä aiheesta ja laajentavat tietoisuutta ja vuorovaikutusta asiaankuuluvien ihmisten tai tiimien kanssa kiinnostuksen kohteena olevilla alueilla. Miltä tutkimusprojektit näyttävät ja miten ne voivat vaikuttaa? +Opiskelijoille nämä tutkimusprojektit voivat tarjota sekä oppimis- että yhteistyömahdollisuuksia, jotka parantavat ymmärrystä aiheesta ja laajentavat tietoisuutta ja vuorovaikutusta asiaankuuluvien ihmisten tai tiimien kanssa, jotka työskentelevät kiinnostuksen kohteena olevilla alueilla. Miltä tutkimusprojektit näyttävät ja miten ne voivat vaikuttaa? -Tarkastellaan yhtä esimerkkiä - [MIT Gender Shades Study](http://gendershades.org/overview.html) Joy Buolamwinilta (MIT Media Labs) ja [tutkimuspaperi](http://proceedings.mlr.press/v81/buolamwini18a/buolamwini18a.pdf), jonka hän kirjoitti yhdessä Timnit Gebrun (silloin Microsoft Research) kanssa: +Tarkastellaan yhtä esimerkkiä - [MIT Gender Shades Study](http://gendershades.org/overview.html) Joy Buolamwinilta (MIT Media Labs) ja [merkittävä tutkimuspaperi](http://proceedings.mlr.press/v81/buolamwini18a/buolamwini18a.pdf), jonka hän kirjoitti yhdessä Timnit Gebrun (silloin Microsoft Research) kanssa. Tutkimus keskittyi: - * **Mitä:** Tutkimusprojektin tavoitteena oli _arvioida sukupuoleen ja ihonväriin perustuvaa puolueellisuutta automaattisissa kasvoanalyysialgoritmeissa ja -datanäytteissä_. - * **Miksi:** Kasvoanalyysiä käytetään esimerkiksi lainvalvonnassa, lentokenttien turvallisuudessa ja rekrytointijärjestelmissä - konteksteissa, joissa virheelliset luokitukset (esim. puolueellisuuden vuoksi) voivat aiheuttaa taloudellisia ja sosiaalisia haittoja yksilöille tai ryhmille. Puolueellisuuden ymmärtäminen (ja sen poistaminen tai lieventäminen) on avain oikeudenmukaisuuteen käytössä. - * **Miten:** Tutkijat huomasivat, että olemassa olevat vertailuarvot käyttivät pääasiassa vaaleaihoisia henkilöitä, ja he loivat uuden datasarjan (yli 1000 kuvaa), joka oli _tasapainoisempi_ sukupuolen ja ihonvärin suhteen. Datasarjaa käytettiin arvioimaan kolmen sukupuolen luokittelutuotteen (Microsoft, IBM ja Face++) tarkkuutta. + * **Mitä:** Tutkimusprojektin tavoitteena oli _arvioida sukupuoleen ja ihonväriin perustuvaa vinoutta automaattisissa kasvoanalyysialgoritmeissa ja -datalähteissä_. + * **Miksi:** Kasvoanalyysiä käytetään esimerkiksi lainvalvonnassa, lentokenttien turvallisuudessa, rekrytointijärjestelmissä ja muissa konteksteissa, joissa epätarkat luokitukset (esim. vinoutumisen vuoksi) voivat aiheuttaa taloudellisia ja sosiaalisia haittoja asianomaisille yksilöille tai ryhmille. Vinoumien ymmärtäminen (ja niiden poistaminen tai lieventäminen) on avain oikeudenmukaisuuteen käytössä. + * **Miten:** Tutkijat huomasivat, että olemassa olevat vertailuarvot käyttivät pääasiassa vaaleaihoisia henkilöitä, ja he loivat uuden datasarjan (yli 1000 kuvaa), joka oli _tasapainoisempi_ sukupuolen ja ihonvärin suhteen. Datasarjaa käytettiin arvioimaan kolmen sukupuoliluokittelutuotteen (Microsoft, IBM & Face++) tarkkuutta. -Tulokset osoittivat, että vaikka yleinen luokittelutarkkuus oli hyvä, virheprosentit vaihtelivat huomattavasti eri alaryhmien välillä - **väärinsukupuolittaminen** oli yleisempää naisilla tai tummemman ihonvärin omaavilla henkilöillä, mikä viittaa puolueellisuuteen. +Tulokset osoittivat, että vaikka yleinen luokittelutarkkuus oli hyvä, virheprosenttien ero eri alaryhmien välillä oli huomattava - **väärä sukupuoliluokittelu** oli yleisempää naisilla tai tummaihoisilla henkilöillä, mikä viittasi vinoumaan. -**Keskeiset tulokset:** Lisäsi tietoisuutta siitä, että data-analytiikka tarvitsee _edustavampia datasarjoja_ (tasapainoiset alaryhmät) ja _inklusiivisempia tiimejä_ (monimuotoiset taustat) tunnistamaan ja poistamaan tai lieventämään tällaisia puolueellisuuksia AI-ratkaisuissa. Tällaiset tutkimusponnistelut ovat myös keskeisiä monille organisaatioille, kun ne määrittelevät periaatteita ja käytäntöjä _vastuulliselle tekoälylle_ oikeudenmukaisuuden parantamiseksi AI-tuotteissaan ja -prosesseissaan. +**Keskeiset tulokset:** Lisäsi tietoisuutta siitä, että data science tarvitsee enemmän _edustavia datasarjoja_ (tasapainoiset alaryhmät) ja enemmän _inklusiivisia tiimejä_ (monipuoliset taustat) tunnistamaan ja poistamaan tai lieventämään tällaisia vinoumia AI-ratkaisujen kehityksen alkuvaiheessa. Tällaiset tutkimusponnistelut ovat myös keskeisiä monille organisaatioille, jotka määrittelevät periaatteita ja käytäntöjä _vastuulliselle AI:lle_ parantaakseen oikeudenmukaisuutta AI-tuotteissaan ja -prosesseissaan. -**Haluatko oppia lisää Microsoftin tutkimusponnisteluista?** +**Haluatko oppia Microsoftin tutkimusponnisteluista?** * Tutustu [Microsoft Research Projects](https://www.microsoft.com/research/research-area/artificial-intelligence/?facet%5Btax%5D%5Bmsr-research-area%5D%5B%5D=13556&facet%5Btax%5D%5Bmsr-content-type%5D%5B%5D=msr-project) tekoälyn alalla. * Tutki opiskelijaprojekteja [Microsoft Research Data Science Summer School](https://www.microsoft.com/en-us/research/academic-program/data-science-summer-school/). -* Katso [Fairlearn](https://fairlearn.org/) -projekti ja [Responsible AI](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1%3aprimaryr6) -aloitteet. +* Tutustu [Fairlearn](https://fairlearn.org/) projektiin ja [Responsible AI](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1%3aprimaryr6) aloitteisiin. -## Data-analytiikka + Humanistiset tieteet +## Data Science + Humanistiset tieteet | ![ Sketchnote by [(@sketchthedocs)](https://sketchthedocs.dev) ](../../sketchnotes/20-DataScience-Humanities.png) | | :---------------------------------------------------------------------------------------------------------------: | -| Data-analytiikka & Digitaaliset humanistiset tieteet - _Sketchnote by [@nitya](https://twitter.com/nitya)_ | +| Data Science & Digitaaliset humanistiset tieteet - _Sketchnote by [@nitya](https://twitter.com/nitya)_ | -Digitaaliset humanistiset tieteet [on määritelty](https://digitalhumanities.stanford.edu/about-dh-stanford) "kokoelmaksi käytäntöjä ja lähestymistapoja, jotka yhdistävät laskennalliset menetelmät humanistiseen tutkimukseen". [Stanfordin projektit](https://digitalhumanities.stanford.edu/projects), kuten _"rebooting history"_ ja _"poetic thinking"_, havainnollistavat yhteyttä [digitaalisten humanististen tieteiden ja data-analytiikan](https://digitalhumanities.stanford.edu/digital-humanities-and-data-science) välillä - korostaen tekniikoita, kuten verkkoanalyysi, informaatiovisualisointi, spatiaalinen ja tekstianalyysi, jotka voivat auttaa meitä tarkastelemaan historiallisia ja kirjallisia datasarjoja uusista näkökulmista. +Digitaaliset humanistiset tieteet [on määritelty](https://digitalhumanities.stanford.edu/about-dh-stanford) "kokoelmaksi käytäntöjä ja lähestymistapoja, jotka yhdistävät laskennalliset menetelmät humanistiseen tutkimukseen". [Stanfordin projektit](https://digitalhumanities.stanford.edu/projects), kuten _"rebooting history"_ ja _"poetic thinking"_ havainnollistavat yhteyttä [digitaalisten humanististen tieteiden ja data sciencen välillä](https://digitalhumanities.stanford.edu/digital-humanities-and-data-science) - korostaen tekniikoita, kuten verkkoanalyysi, informaation visualisointi, spatiaalinen ja tekstianalyysi, jotka voivat auttaa meitä tarkastelemaan historiallisia ja kirjallisia datasarjoja uusien oivallusten ja näkökulmien saamiseksi. -*Haluatko tutkia ja laajentaa projektia tällä alalla?* +*Haluatko tutkia ja laajentaa projektia tällä alueella?* -Tutustu ["Emily Dickinson and the Meter of Mood"](https://gist.github.com/jlooper/ce4d102efd057137bc000db796bfd671) -projektiin, joka on loistava esimerkki [Jen Looperilta](https://twitter.com/jenlooper). Se kysyy, miten voimme käyttää data-analytiikkaa tarkastellaksemme uudelleen tuttua runoutta ja arvioidaksemme sen merkitystä ja tekijän panosta uusissa konteksteissa. Esimerkiksi, _voimmeko ennustaa vuodenajan, jolloin runo on kirjoitettu, analysoimalla sen sävyä tai tunnetta_ - ja mitä tämä kertoo meille tekijän mielentilasta kyseisenä ajanjaksona? +Tutustu ["Emily Dickinson and the Meter of Mood"](https://gist.github.com/jlooper/ce4d102efd057137bc000db796bfd671) - loistava esimerkki [Jen Looperilta](https://twitter.com/jenlooper), joka kysyy, miten voimme käyttää data sciencea tarkastelemaan uudelleen tuttua runoutta ja arvioimaan sen merkitystä ja tekijän panosta uusissa konteksteissa. Esimerkiksi, _voimmeko ennustaa vuodenajan, jolloin runo on kirjoitettu, analysoimalla sen sävyä tai tunnetta_ - ja mitä tämä kertoo tekijän mielentilasta kyseisenä ajanjaksona? -Vastataksemme tähän kysymykseen seuraamme data-analytiikan elinkaaren vaiheita: - * [`Datan hankinta`](https://gist.github.com/jlooper/ce4d102efd057137bc000db796bfd671#acquiring-the-dataset) - kerätäksemme analyysiin sopivan datasarjan. Vaihtoehtoihin kuuluu API:n käyttö (esim. [Poetry DB API](https://poetrydb.org/index.html)) tai verkkosivujen kaavinta (esim. [Project Gutenberg](https://www.gutenberg.org/files/12242/12242-h/12242-h.htm)) työkaluilla, kuten [Scrapy](https://scrapy.org/). - * [`Datan puhdistus`](https://gist.github.com/jlooper/ce4d102efd057137bc000db796bfd671#clean-the-data) - selittää, miten teksti voidaan muotoilla, puhdistaa ja yksinkertaistaa perustyökaluilla, kuten Visual Studio Code ja Microsoft Excel. - * [`Datan analyysi`](https://gist.github.com/jlooper/ce4d102efd057137bc000db796bfd671#working-with-the-data-in-a-notebook) - selittää, miten voimme nyt tuoda datasarjan "Notebooks"-ympäristöön analysointia varten Python-pakettien (kuten pandas, numpy ja matplotlib) avulla datan järjestämiseksi ja visualisoimiseksi. - * [`Tunneanalyysi`](https://gist.github.com/jlooper/ce4d102efd057137bc000db796bfd671#sentiment-analysis-using-cognitive-services) - selittää, miten voimme integroida pilvipalveluita, kuten Text Analytics, käyttämällä vähäkoodisia työkaluja, kuten [Power Automate](https://flow.microsoft.com/en-us/) automatisoituihin datankäsittelytyönkulkuihin. +Vastataksemme tähän kysymykseen seuraamme data sciencen elinkaaren vaiheita: + * [`Data Acquisition`](https://gist.github.com/jlooper/ce4d102efd057137bc000db796bfd671#acquiring-the-dataset) - kerätäksemme relevantin datasarjan analysointia varten. Vaihtoehtoja ovat esimerkiksi API:n käyttö (esim. [Poetry DB API](https://poetrydb.org/index.html)) tai verkkosivujen kaavinta (esim. [Project Gutenberg](https://www.gutenberg.org/files/12242/12242-h/12242-h.htm)) työkaluilla, kuten [Scrapy](https://scrapy.org/). + * [`Data Cleaning`](https://gist.github.com/jlooper/ce4d102efd057137bc000db796bfd671#clean-the-data) - selittää, miten tekstiä voidaan muotoilla, puhdistaa ja yksinkertaistaa perusvälineillä, kuten Visual Studio Code ja Microsoft Excel. + * [`Data Analysis`](https://gist.github.com/jlooper/ce4d102efd057137bc000db796bfd671#working-with-the-data-in-a-notebook) - selittää, miten voimme tuoda datasarjan "Notebooks"-ympäristöön analysointia varten Python-pakettien (kuten pandas, numpy ja matplotlib) avulla datan järjestämiseksi ja visualisoimiseksi. + * [`Sentiment Analysis`](https://gist.github.com/jlooper/ce4d102efd057137bc000db796bfd671#sentiment-analysis-using-cognitive-services) - selittää, miten voimme integroida pilvipalvelut, kuten Text Analytics, käyttämällä vähäkoodisia työkaluja, kuten [Power Automate](https://flow.microsoft.com/en-us/) automatisoitujen datankäsittelytyönkulkujen luomiseen. -Tämän työnkulun avulla voimme tutkia vuodenaikojen vaikutuksia runojen tunnesisältöön ja auttaa meitä muodostamaan omia näkemyksiämme tekijästä. Kokeile itse - ja laajenna notebookia kysyäksesi muita kysymyksiä tai visualisoidaksesi dataa uusilla tavoilla! +Tämän työnkulun avulla voimme tutkia vuodenaikojen vaikutuksia runojen sentimenttiin ja auttaa meitä muodostamaan omia näkemyksiämme tekijästä. Kokeile itse - ja laajenna notebookia kysyäksesi muita kysymyksiä tai visualisoidaksesi dataa uusilla tavoilla! -> Voit käyttää joitakin työkaluja [Digital Humanities toolkit](https://github.com/Digital-Humanities-Toolkit) -kokoelmasta tutkiaksesi näitä kysymyksiä. +> Voit käyttää joitakin työkaluja [Digital Humanities toolkit](https://github.com/Digital-Humanities-Toolkit) -kokoelmasta näiden tutkimuspolkujen edistämiseksi. -## Data-analytiikka + Kestävä kehitys +## Data Science + Kestävä kehitys | ![ Sketchnote by [(@sketchthedocs)](https://sketchthedocs.dev) ](../../sketchnotes/20-DataScience-Sustainability.png) | | :---------------------------------------------------------------------------------------------------------------: | -| Data-analytiikka & Kestävä kehitys - _Sketchnote by [@nitya](https://twitter.com/nitya)_ | +| Data Science & Kestävä kehitys - _Sketchnote by [@nitya](https://twitter.com/nitya)_ | -[2030 Agenda For Sustainable Development](https://sdgs.un.org/2030agenda) - jonka kaikki YK:n jäsenet hyväksyivät vuonna 2015 - määrittelee 17 tavoitetta, joista osa keskittyy **planeetan suojelemiseen** rappeutumiselta ja ilmastonmuutoksen vaikutuksilta. [Microsoft Sustainability](https://www.microsoft.com/en-us/sustainability) -aloite tukee näitä tavoitteita tutkimalla, miten teknologiaratkaisut voivat tukea ja rakentaa kestävämpiä tulevaisuuksia [keskittyen neljään tavoitteeseen](https://dev.to/azure/a-visual-guide-to-sustainable-software-engineering-53hh) - olla hiilinegatiivinen, vesipositiivinen, jätteetön ja biologisesti monimuotoinen vuoteen 2030 mennessä. +[2030 Agenda For Sustainable Development](https://sdgs.un.org/2030agenda) - jonka kaikki Yhdistyneiden Kansakuntien jäsenet hyväksyivät vuonna 2015 - tunnistaa 17 tavoitetta, mukaan lukien tavoitteet, jotka keskittyvät **planeetan suojelemiseen** rappeutumiselta ja ilmastonmuutoksen vaikutuksilta. [Microsoft Sustainability](https://www.microsoft.com/en-us/sustainability) -aloite tukee näitä tavoitteita tutkimalla, miten teknologiaratkaisut voivat tukea ja rakentaa kestävämpiä tulevaisuuksia [keskittyen neljään tavoitteeseen](https://dev.to/azure/a-visual-guide-to-sustainable-software-engineering-53hh) - olla hiilinegatiivinen, vesipositiivinen, nollajäte ja biologisesti monimuotoinen vuoteen 2030 mennessä. -Näiden haasteiden ratkaiseminen skaalautuvasti ja ajallaan vaatii pilvipohjaista ajattelua - ja suuria määriä dataa. [Planetary Computer](https://planetarycomputer.microsoft.com/) -aloite tarjoaa neljä komponenttia, jotka auttavat data-analyytikkoja ja kehittäjiä tässä työssä: +Näiden haasteiden ratkaiseminen skaalautuvasti ja ajallaan vaatii pilvipohjaista ajattelua - ja suuria datamääriä. [Planetary Computer](https://planetarycomputer.microsoft.com/) -aloite tarjoaa neljä komponenttia, jotka auttavat data sciencen asiantuntijoita ja kehittäjiä tässä työssä: - * [Data Catalog](https://planetarycomputer.microsoft.com/catalog) - sisältää petatavuja maapallon järjestelmien dataa (ilmainen ja Azure-isännöity). - * [Planetary API](https://planetarycomputer.microsoft.com/docs/reference/stac/) - auttaa käyttäjiä etsimään relevanttia dataa ajassa ja paikassa. + * [Data Catalog](https://planetarycomputer.microsoft.com/catalog) - sisältää petatavujen verran Earth Systems -dataa (ilmainen ja Azure-isännöity). + * [Planetary API](https://planetarycomputer.microsoft.com/docs/reference/stac/) - auttaa käyttäjiä etsimään relevanttia dataa ajan ja paikan mukaan. * [Hub](https://planetarycomputer.microsoft.com/docs/overview/environment/) - hallittu ympäristö tutkijoille massiivisten paikkatietoaineistojen käsittelyyn. - * [Applications](https://planetarycomputer.microsoft.com/applications) - esittelee käyttötapauksia ja työkaluja kestävän kehityksen oivallusten saamiseksi. + * [Applications](https://planetarycomputer.microsoft.com/applications) - esittelee käyttötapauksia ja työkaluja kestävän kehityksen oivallusten tueksi. **Planetary Computer -projekti on tällä hetkellä esikatseluvaiheessa (syyskuu 2021)** - näin pääset alkuun ja voit osallistua kestävän kehityksen ratkaisuihin datatieteen avulla. * [Pyydä käyttöoikeutta](https://planetarycomputer.microsoft.com/account/request) aloittaaksesi tutkimisen ja verkostoitumisen muiden kanssa. @@ -120,12 +120,12 @@ Pohdi, kuinka voit käyttää datavisualisointia tuomaan esiin tai korostamaan m ## Datatiede + Opiskelijat -Olemme keskustelleet tosielämän sovelluksista teollisuudessa ja tutkimuksessa sekä tutkineet datatieteen sovellusesimerkkejä digitaalisten humanististen tieteiden ja kestävän kehityksen parissa. Kuinka siis voit kehittää taitojasi ja jakaa asiantuntemustasi datatieteen aloittelijana? +Olemme keskustelleet tosielämän sovelluksista teollisuudessa ja tutkimuksessa sekä tutkineet datatieteen sovellusesimerkkejä digitaalisen humanismin ja kestävän kehityksen aloilla. Kuinka siis voit kehittää taitojasi ja jakaa asiantuntemustasi datatieteen aloittelijana? Tässä muutamia esimerkkejä datatieteen opiskelijaprojekteista inspiraatioksi. * [MSR Data Science Summer School](https://www.microsoft.com/en-us/research/academic-program/data-science-summer-school/#!projects) ja GitHub [projektit](https://github.com/msr-ds3), joissa tutkitaan aiheita kuten: - - [Rotusyrjintä poliisin voimankäytössä](https://www.microsoft.com/en-us/research/video/data-science-summer-school-2019-replicating-an-empirical-analysis-of-racial-differences-in-police-use-of-force/) | [Github](https://github.com/msr-ds3/stop-question-frisk) + - [Rasistinen puolueellisuus poliisin voimankäytössä](https://www.microsoft.com/en-us/research/video/data-science-summer-school-2019-replicating-an-empirical-analysis-of-racial-differences-in-police-use-of-force/) | [Github](https://github.com/msr-ds3/stop-question-frisk) - [NYC:n metrojärjestelmän luotettavuus](https://www.microsoft.com/en-us/research/video/data-science-summer-school-2018-exploring-the-reliability-of-the-nyc-subway-system/) | [Github](https://github.com/msr-ds3/nyctransit) * [Materiaalisen kulttuurin digitalisointi: Sirkapin sosioekonomisten jakautumien tutkiminen](https://claremont.maps.arcgis.com/apps/Cascade/index.html?appid=bdf2aef0f45a4674ba41cd373fa23afc) - [Ornella Altunyan](https://twitter.com/ornelladotcom) ja Claremont-tiimi käyttivät [ArcGIS StoryMaps](https://storymaps.arcgis.com/). @@ -140,10 +140,11 @@ Etsi artikkeleita, jotka suosittelevat datatieteen projekteja aloittelijoille - ## Kertaus & Itseopiskelu Haluatko tutkia lisää käyttötapauksia? Tässä muutamia aiheeseen liittyviä artikkeleita: -* [17 datatieteen sovellusta ja esimerkkiä](https://builtin.com/data-science/data-science-applications-examples) - heinäkuu 2021 -* [11 hämmästyttävää datatieteen sovellusta tosielämässä](https://myblindbird.com/data-science-applications-real-world/) - toukokuu 2021 +* [17 Datatieteen sovellusta ja esimerkkiä](https://builtin.com/data-science/data-science-applications-examples) - heinäkuu 2021 +* [11 Henkeäsalpaavaa datatieteen sovellusta tosielämässä](https://myblindbird.com/data-science-applications-real-world/) - toukokuu 2021 * [Datatiede tosielämässä](https://towardsdatascience.com/data-science-in-the-real-world/home) - artikkelikokoelma -* Datatiede: [Koulutus](https://data-flair.training/blogs/data-science-in-education/), [Maatalous](https://data-flair.training/blogs/data-science-in-agriculture/), [Rahoitus](https://data-flair.training/blogs/data-science-in-finance/), [Elokuvat](https://data-flair.training/blogs/data-science-at-movies/) ja paljon muuta. +* [12 Tosielämän datatieteen sovellusta esimerkein](https://www.scaler.com/blog/data-science-applications/) - toukokuu 2024 +* Datatiede: [Koulutuksessa](https://data-flair.training/blogs/data-science-in-education/), [Maataloudessa](https://data-flair.training/blogs/data-science-in-agriculture/), [Rahoituksessa](https://data-flair.training/blogs/data-science-in-finance/), [Elokuvissa](https://data-flair.training/blogs/data-science-at-movies/), [Terveydenhuollossa](https://onlinedegrees.sandiego.edu/data-science-health-care/) ja muualla. ## Tehtävä @@ -152,4 +153,4 @@ Haluatko tutkia lisää käyttötapauksia? Tässä muutamia aiheeseen liittyviä --- **Vastuuvapauslauseke**: -Tämä asiakirja on käännetty käyttämällä tekoälypohjaista käännöspalvelua [Co-op Translator](https://github.com/Azure/co-op-translator). Vaikka pyrimme tarkkuuteen, huomioithan, että automaattiset käännökset voivat sisältää virheitä tai epätarkkuuksia. Alkuperäistä asiakirjaa sen alkuperäisellä kielellä tulee pitää ensisijaisena lähteenä. Kriittisen tiedon osalta suositellaan ammattimaista ihmiskääntämistä. Emme ole vastuussa tämän käännöksen käytöstä johtuvista väärinkäsityksistä tai virhetulkinnoista. \ No newline at end of file +Tämä asiakirja on käännetty käyttämällä tekoälypohjaista käännöspalvelua [Co-op Translator](https://github.com/Azure/co-op-translator). Vaikka pyrimme tarkkuuteen, huomioithan, että automaattiset käännökset voivat sisältää virheitä tai epätarkkuuksia. Alkuperäistä asiakirjaa sen alkuperäisellä kielellä tulee pitää ensisijaisena lähteenä. Kriittisen tiedon osalta suositellaan ammattimaista ihmiskääntämistä. Emme ole vastuussa väärinkäsityksistä tai virhetulkinnoista, jotka johtuvat tämän käännöksen käytöstä. \ No newline at end of file diff --git a/translations/fr/6-Data-Science-In-Wild/20-Real-World-Examples/README.md b/translations/fr/6-Data-Science-In-Wild/20-Real-World-Examples/README.md index 4c10a74c..0f9822c0 100644 --- a/translations/fr/6-Data-Science-In-Wild/20-Real-World-Examples/README.md +++ b/translations/fr/6-Data-Science-In-Wild/20-Real-World-Examples/README.md @@ -1,8 +1,8 @@ -# La Scienza dei Dati nel Mondo Reale +# Data Science nel Mondo Reale | ![ Sketchnote di [(@sketchthedocs)](https://sketchthedocs.dev) ](../../sketchnotes/20-DataScience-RealWorld.png) | | :--------------------------------------------------------------------------------------------------------------: | -| La Scienza dei Dati nel Mondo Reale - _Sketchnote di [@nitya](https://twitter.com/nitya)_ | +| Data Science nel Mondo Reale - _Sketchnote di [@nitya](https://twitter.com/nitya)_ | Siamo quasi alla fine di questo percorso di apprendimento! -Abbiamo iniziato con le definizioni di scienza dei dati ed etica, esplorato vari strumenti e tecniche per l'analisi e la visualizzazione dei dati, esaminato il ciclo di vita della scienza dei dati e analizzato come scalare e automatizzare i flussi di lavoro della scienza dei dati con i servizi di cloud computing. Quindi, probabilmente ti starai chiedendo: _"Come posso applicare tutto ciò che ho imparato ai contesti del mondo reale?"_ +Abbiamo iniziato con le definizioni di data science ed etica, esplorato vari strumenti e tecniche per l'analisi e la visualizzazione dei dati, esaminato il ciclo di vita della data science e analizzato come scalare e automatizzare i flussi di lavoro di data science con i servizi di cloud computing. Quindi, probabilmente ti starai chiedendo: _"Come posso applicare tutto ciò che ho imparato ai contesti del mondo reale?"_ -In questa lezione, esploreremo le applicazioni reali della scienza dei dati nei vari settori e approfondiremo esempi specifici nei contesti della ricerca, delle scienze umane digitali e della sostenibilità. Esamineremo opportunità di progetti per studenti e concluderemo con risorse utili per continuare il tuo percorso di apprendimento! +In questa lezione, esploreremo le applicazioni reali della data science in diversi settori e approfondiremo esempi specifici nei contesti della ricerca, delle discipline umanistiche digitali e della sostenibilità. Esamineremo le opportunità di progetti per studenti e concluderemo con risorse utili per continuare il tuo percorso di apprendimento! -## Quiz Pre-Lezione +## Quiz Pre-Lettura -## [Quiz Pre-Lezione](https://ff-quizzes.netlify.app/en/ds/quiz/38) +## [Quiz pre-lettura](https://ff-quizzes.netlify.app/en/ds/quiz/38) -## Scienza dei Dati + Industria +## Data Science + Industria -Grazie alla democratizzazione dell'IA, gli sviluppatori trovano sempre più facile progettare e integrare decisioni guidate dall'IA e intuizioni basate sui dati nelle esperienze utente e nei flussi di lavoro di sviluppo. Ecco alcuni esempi di come la scienza dei dati viene "applicata" a contesti reali nell'industria: +Grazie alla democratizzazione dell'AI, gli sviluppatori trovano sempre più facile progettare e integrare decisioni basate sull'intelligenza artificiale e intuizioni basate sui dati nelle esperienze utente e nei flussi di lavoro di sviluppo. Ecco alcuni esempi di come la data science viene "applicata" a contesti reali nell'industria: - * [Google Flu Trends](https://www.wired.com/2015/10/can-learn-epic-failure-google-flu-trends/) ha utilizzato la scienza dei dati per correlare i termini di ricerca con le tendenze dell'influenza. Sebbene l'approccio avesse delle lacune, ha sollevato consapevolezza sulle possibilità (e sfide) delle previsioni sanitarie basate sui dati. + * [Google Flu Trends](https://www.wired.com/2015/10/can-learn-epic-failure-google-flu-trends/) ha utilizzato la data science per correlare i termini di ricerca con le tendenze influenzali. Sebbene l'approccio avesse dei difetti, ha aumentato la consapevolezza sulle possibilità (e sfide) delle previsioni sanitarie basate sui dati. - * [Previsioni di Routing di UPS](https://www.technologyreview.com/2018/11/21/139000/how-ups-uses-ai-to-outsmart-bad-weather/) - spiega come UPS utilizza la scienza dei dati e il machine learning per prevedere i percorsi ottimali per le consegne, tenendo conto delle condizioni meteorologiche, dei modelli di traffico, delle scadenze di consegna e altro ancora. + * [Previsioni di Routing UPS](https://www.technologyreview.com/2018/11/21/139000/how-ups-uses-ai-to-outsmart-bad-weather/) - spiega come UPS utilizza la data science e il machine learning per prevedere i percorsi ottimali per le consegne, tenendo conto delle condizioni meteorologiche, dei modelli di traffico, delle scadenze di consegna e altro ancora. * [Visualizzazione dei Percorsi dei Taxi di NYC](http://chriswhong.github.io/nyctaxi/) - i dati raccolti utilizzando le [Leggi sulla Libertà di Informazione](https://chriswhong.com/open-data/foil_nyc_taxi/) hanno aiutato a visualizzare una giornata nella vita dei taxi di NYC, permettendoci di capire come navigano nella città affollata, i guadagni e la durata dei viaggi in un periodo di 24 ore. - * [Uber Data Science Workbench](https://eng.uber.com/dsw/) - utilizza i dati (su luoghi di prelievo e rilascio, durata dei viaggi, percorsi preferiti, ecc.) raccolti da milioni di viaggi Uber *quotidianamente* per costruire uno strumento di analisi dei dati utile per prezzi, sicurezza, rilevamento delle frodi e decisioni di navigazione. + * [Uber Data Science Workbench](https://eng.uber.com/dsw/) - utilizza i dati (su luoghi di prelievo e consegna, durata dei viaggi, percorsi preferiti ecc.) raccolti da milioni di viaggi Uber *quotidianamente* per costruire uno strumento di analisi dei dati utile per prezzi, sicurezza, rilevamento delle frodi e decisioni di navigazione. - * [Analisi Sportiva](https://towardsdatascience.com/scope-of-analytics-in-sports-world-37ed09c39860) - si concentra su _analisi predittiva_ (analisi di squadra e giocatori - pensa a [Moneyball](https://datasciencedegree.wisconsin.edu/blog/moneyball-proves-importance-big-data-big-ideas/) - e gestione dei fan) e _visualizzazione dei dati_ (dashboard per squadre e fan, giochi, ecc.) con applicazioni come scouting di talenti, scommesse sportive e gestione di inventari/luoghi. + * [Analisi Sportiva](https://towardsdatascience.com/scope-of-analytics-in-sports-world-37ed09c39860) - si concentra su _analisi predittiva_ (analisi di squadra e giocatori - pensa a [Moneyball](https://datasciencedegree.wisconsin.edu/blog/moneyball-proves-importance-big-data-big-ideas/) - e gestione dei fan) e _visualizzazione dei dati_ (dashboard di squadra e fan, giochi ecc.) con applicazioni come scouting di talenti, scommesse sportive e gestione di inventari/luoghi. - * [Scienza dei Dati nel Settore Bancario](https://data-flair.training/blogs/data-science-in-banking/) - evidenzia il valore della scienza dei dati nel settore finanziario con applicazioni che vanno dalla modellazione del rischio e rilevamento delle frodi, alla segmentazione dei clienti, previsioni in tempo reale e sistemi di raccomandazione. L'analisi predittiva guida anche misure critiche come i [credit scores](https://dzone.com/articles/using-big-data-and-predictive-analytics-for-credit). + * [Data Science nel Settore Bancario](https://data-flair.training/blogs/data-science-in-banking/) - evidenzia il valore della data science nel settore finanziario con applicazioni che vanno dalla modellazione del rischio e rilevamento delle frodi, alla segmentazione dei clienti, previsioni in tempo reale e sistemi di raccomandazione. L'analisi predittiva guida anche misure critiche come i [credit scores](https://dzone.com/articles/using-big-data-and-predictive-analytics-for-credit). - * [Scienza dei Dati nella Sanità](https://data-flair.training/blogs/data-science-in-healthcare/) - evidenzia applicazioni come imaging medico (es. MRI, radiografie, TAC), genomica (sequenziamento del DNA), sviluppo di farmaci (valutazione del rischio, previsione del successo), analisi predittiva (cura dei pazienti e logistica delle forniture), monitoraggio e prevenzione delle malattie, ecc. + * [Data Science nella Sanità](https://data-flair.training/blogs/data-science-in-healthcare/) - evidenzia applicazioni come imaging medico (ad esempio, MRI, raggi X, TAC), genomica (sequenziamento del DNA), sviluppo di farmaci (valutazione del rischio, previsione del successo), analisi predittiva (cura dei pazienti e logistica delle forniture), monitoraggio e prevenzione delle malattie ecc. -![Applicazioni della Scienza dei Dati nel Mondo Reale](../../../../6-Data-Science-In-Wild/20-Real-World-Examples/images/data-science-applications.png) Crediti Immagine: [Data Flair: 6 Amazing Data Science Applications ](https://data-flair.training/blogs/data-science-applications/) +![Applicazioni della Data Science nel Mondo Reale](../../../../translated_images/data-science-applications.4e5019cd8790ebac2277ff5f08af386f8727cac5d30f77727c7090677e6adb9c.it.png) Crediti Immagine: [Data Flair: 6 Amazing Data Science Applications ](https://data-flair.training/blogs/data-science-applications/) -La figura mostra altri domini ed esempi di applicazione delle tecniche di scienza dei dati. Vuoi esplorare altre applicazioni? Dai un'occhiata alla sezione [Review & Self Study](../../../../6-Data-Science-In-Wild/20-Real-World-Examples) qui sotto. +La figura mostra altri domini ed esempi per l'applicazione delle tecniche di data science. Vuoi esplorare altre applicazioni? Dai un'occhiata alla sezione [Review & Self Study](../../../../6-Data-Science-In-Wild/20-Real-World-Examples) qui sotto. -## Scienza dei Dati + Ricerca +## Data Science + Ricerca | ![ Sketchnote di [(@sketchthedocs)](https://sketchthedocs.dev) ](../../sketchnotes/20-DataScience-Research.png) | | :---------------------------------------------------------------------------------------------------------------: | -| Scienza dei Dati & Ricerca - _Sketchnote di [@nitya](https://twitter.com/nitya)_ | +| Data Science & Ricerca - _Sketchnote di [@nitya](https://twitter.com/nitya)_ | Mentre le applicazioni reali spesso si concentrano su casi d'uso industriali su larga scala, le applicazioni e i progetti di _ricerca_ possono essere utili da due prospettive: * _opportunità di innovazione_ - esplorare prototipi rapidi di concetti avanzati e testare esperienze utente per applicazioni di nuova generazione. -* _sfide di implementazione_ - indagare i potenziali danni o le conseguenze non intenzionali delle tecnologie di scienza dei dati nei contesti reali. +* _sfide di implementazione_ - indagare i potenziali danni o conseguenze indesiderate delle tecnologie di data science nei contesti reali. -Per gli studenti, questi progetti di ricerca possono offrire opportunità di apprendimento e collaborazione che migliorano la comprensione dell'argomento e ampliano la consapevolezza e il coinvolgimento con persone o team rilevanti che lavorano in aree di interesse. Ma come sono i progetti di ricerca e quale impatto possono avere? +Per gli studenti, questi progetti di ricerca possono offrire opportunità di apprendimento e collaborazione che migliorano la comprensione dell'argomento e ampliano la consapevolezza e il coinvolgimento con persone o team rilevanti che lavorano in aree di interesse. Ma come sono i progetti di ricerca e come possono avere un impatto? -Esaminiamo un esempio: lo [Studio Gender Shades del MIT](http://gendershades.org/overview.html) di Joy Buolamwini (MIT Media Labs) con un [articolo di ricerca](http://proceedings.mlr.press/v81/buolamwini18a/buolamwini18a.pdf) co-autore con Timnit Gebru (all'epoca presso Microsoft Research) che si è concentrato su: +Esaminiamo un esempio: lo [Studio MIT Gender Shades](http://gendershades.org/overview.html) di Joy Buolamwini (MIT Media Labs) con un [articolo di ricerca significativo](http://proceedings.mlr.press/v81/buolamwini18a/buolamwini18a.pdf) co-autore con Timnit Gebru (all'epoca presso Microsoft Research) che si concentra su: - * **Cosa:** L'obiettivo del progetto di ricerca era _valutare i bias presenti negli algoritmi e nei dataset di analisi facciale automatizzata_ in base al genere e al tipo di pelle. - * **Perché:** L'analisi facciale è utilizzata in contesti come forze dell'ordine, sicurezza aeroportuale, sistemi di assunzione e altro - contesti in cui classificazioni inaccurate (es. a causa di bias) possono causare potenziali danni economici e sociali agli individui o ai gruppi interessati. Comprendere (ed eliminare o mitigare) i bias è fondamentale per un uso equo. + * **Cosa:** L'obiettivo del progetto di ricerca era _valutare i bias presenti negli algoritmi e nei dataset di analisi facciale automatizzata_ basati su genere e tipo di pelle. + * **Perché:** L'analisi facciale è utilizzata in contesti come forze dell'ordine, sicurezza aeroportuale, sistemi di assunzione e altro - contesti in cui classificazioni inaccurate (ad esempio, a causa di bias) possono causare potenziali danni economici e sociali agli individui o ai gruppi interessati. Comprendere (ed eliminare o mitigare) i bias è fondamentale per l'equità nell'uso. * **Come:** I ricercatori hanno riconosciuto che i benchmark esistenti utilizzavano prevalentemente soggetti con pelle chiara e hanno curato un nuovo dataset (oltre 1000 immagini) _più bilanciato_ per genere e tipo di pelle. Il dataset è stato utilizzato per valutare l'accuratezza di tre prodotti di classificazione di genere (di Microsoft, IBM e Face++). -I risultati hanno mostrato che, sebbene l'accuratezza complessiva della classificazione fosse buona, c'era una differenza evidente nei tassi di errore tra i vari sottogruppi - con un **misgendering** più elevato per le donne o le persone con pelle più scura, indicativo di bias. +I risultati hanno mostrato che, sebbene l'accuratezza complessiva della classificazione fosse buona, c'era una differenza evidente nei tassi di errore tra vari sottogruppi - con **errori di classificazione di genere** più alti per donne o persone con pelle più scura, indicativi di bias. -**Risultati Chiave:** Ha sollevato consapevolezza sul fatto che la scienza dei dati necessita di _dataset più rappresentativi_ (sottogruppi bilanciati) e di _team più inclusivi_ (background diversificati) per riconoscere ed eliminare o mitigare tali bias nelle soluzioni di IA. Sforzi di ricerca come questo sono anche fondamentali per molte organizzazioni nella definizione di principi e pratiche per un'IA _responsabile_ per migliorare l'equità nei loro prodotti e processi di IA. +**Risultati Chiave:** Ha aumentato la consapevolezza che la data science necessita di _dataset più rappresentativi_ (sottogruppi bilanciati) e _team più inclusivi_ (background diversificati) per riconoscere ed eliminare o mitigare tali bias nelle soluzioni AI. Sforzi di ricerca come questo sono anche fondamentali per molte organizzazioni nella definizione di principi e pratiche per _AI responsabile_ per migliorare l'equità nei loro prodotti e processi AI. **Vuoi conoscere gli sforzi di ricerca rilevanti in Microsoft?** * Dai un'occhiata ai [Progetti di Ricerca Microsoft](https://www.microsoft.com/research/research-area/artificial-intelligence/?facet%5Btax%5D%5Bmsr-research-area%5D%5B%5D=13556&facet%5Btax%5D%5Bmsr-content-type%5D%5B%5D=msr-project) sull'Intelligenza Artificiale. * Esplora i progetti per studenti della [Microsoft Research Data Science Summer School](https://www.microsoft.com/en-us/research/academic-program/data-science-summer-school/). -* Dai un'occhiata al progetto [Fairlearn](https://fairlearn.org/) e alle iniziative di [IA Responsabile](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1%3aprimaryr6). +* Dai un'occhiata al progetto [Fairlearn](https://fairlearn.org/) e alle iniziative [AI Responsabile](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1%3aprimaryr6). -## Scienza dei Dati + Scienze Umane +## Data Science + Discipline Umanistiche | ![ Sketchnote di [(@sketchthedocs)](https://sketchthedocs.dev) ](../../sketchnotes/20-DataScience-Humanities.png) | | :---------------------------------------------------------------------------------------------------------------: | -| Scienza dei Dati & Scienze Umane Digitali - _Sketchnote di [@nitya](https://twitter.com/nitya)_ | +| Data Science & Discipline Umanistiche Digitali - _Sketchnote di [@nitya](https://twitter.com/nitya)_ | -Le Scienze Umane Digitali [sono state definite](https://digitalhumanities.stanford.edu/about-dh-stanford) come "una raccolta di pratiche e approcci che combinano metodi computazionali con l'indagine umanistica". Progetti [Stanford](https://digitalhumanities.stanford.edu/projects) come _"rebooting history"_ e _"poetic thinking"_ illustrano il legame tra [Scienze Umane Digitali e Scienza dei Dati](https://digitalhumanities.stanford.edu/digital-humanities-and-data-science) - enfatizzando tecniche come l'analisi delle reti, la visualizzazione delle informazioni, l'analisi spaziale e testuale che possono aiutarci a rivisitare dataset storici e letterari per trarre nuove intuizioni e prospettive. +Le Discipline Umanistiche Digitali [sono state definite](https://digitalhumanities.stanford.edu/about-dh-stanford) come "una raccolta di pratiche e approcci che combinano metodi computazionali con l'indagine umanistica". I [progetti di Stanford](https://digitalhumanities.stanford.edu/projects) come _"rebooting history"_ e _"poetic thinking"_ illustrano il collegamento tra [Discipline Umanistiche Digitali e Data Science](https://digitalhumanities.stanford.edu/digital-humanities-and-data-science) - enfatizzando tecniche come analisi di rete, visualizzazione delle informazioni, analisi spaziale e testuale che possono aiutarci a rivisitare dataset storici e letterari per derivare nuove intuizioni e prospettive. -*Vuoi esplorare ed estendere un progetto in questo ambito?* +*Vuoi esplorare e ampliare un progetto in questo ambito?* -Dai un'occhiata a ["Emily Dickinson and the Meter of Mood"](https://gist.github.com/jlooper/ce4d102efd057137bc000db796bfd671) - un ottimo esempio di [Jen Looper](https://twitter.com/jenlooper) che si chiede come possiamo utilizzare la scienza dei dati per rivisitare poesie familiari e rivalutare il loro significato e il contributo dell'autore in nuovi contesti. Ad esempio, _possiamo prevedere la stagione in cui una poesia è stata scritta analizzandone il tono o il sentimento_ - e cosa ci dice questo sullo stato d'animo dell'autore nel periodo rilevante? +Dai un'occhiata a ["Emily Dickinson and the Meter of Mood"](https://gist.github.com/jlooper/ce4d102efd057137bc000db796bfd671) - un ottimo esempio di [Jen Looper](https://twitter.com/jenlooper) che si chiede come possiamo utilizzare la data science per rivisitare poesie familiari e rivalutare il loro significato e i contributi del loro autore in nuovi contesti. Ad esempio, _possiamo prevedere la stagione in cui una poesia è stata scritta analizzandone il tono o il sentimento_ - e cosa ci dice questo sullo stato d'animo dell'autore nel periodo rilevante? -Per rispondere a questa domanda, seguiamo i passaggi del ciclo di vita della scienza dei dati: - * [`Acquisizione dei Dati`](https://gist.github.com/jlooper/ce4d102efd057137bc000db796bfd671#acquiring-the-dataset) - per raccogliere un dataset rilevante per l'analisi. Le opzioni includono l'uso di un'API (es. [Poetry DB API](https://poetrydb.org/index.html)) o il web scraping (es. [Project Gutenberg](https://www.gutenberg.org/files/12242/12242-h/12242-h.htm)) utilizzando strumenti come [Scrapy](https://scrapy.org/). - * [`Pulizia dei Dati`](https://gist.github.com/jlooper/ce4d102efd057137bc000db796bfd671#clean-the-data) - spiega come i testi possono essere formattati, sanitizzati e semplificati utilizzando strumenti di base come Visual Studio Code e Microsoft Excel. - * [`Analisi dei Dati`](https://gist.github.com/jlooper/ce4d102efd057137bc000db796bfd671#working-with-the-data-in-a-notebook) - spiega come possiamo ora importare il dataset nei "Notebooks" per l'analisi utilizzando pacchetti Python (come pandas, numpy e matplotlib) per organizzare e visualizzare i dati. +Per rispondere a questa domanda, seguiamo i passaggi del ciclo di vita della data science: + * [`Acquisizione dei Dati`](https://gist.github.com/jlooper/ce4d102efd057137bc000db796bfd671#acquiring-the-dataset) - per raccogliere un dataset rilevante per l'analisi. Le opzioni includono l'uso di un'API (ad esempio, [Poetry DB API](https://poetrydb.org/index.html)) o il scraping di pagine web (ad esempio, [Project Gutenberg](https://www.gutenberg.org/files/12242/12242-h/12242-h.htm)) utilizzando strumenti come [Scrapy](https://scrapy.org/). + * [`Pulizia dei Dati`](https://gist.github.com/jlooper/ce4d102efd057137bc000db796bfd671#clean-the-data) - spiega come il testo può essere formattato, sanitizzato e semplificato utilizzando strumenti di base come Visual Studio Code e Microsoft Excel. + * [`Analisi dei Dati`](https://gist.github.com/jlooper/ce4d102efd057137bc000db796bfd671#working-with-the-data-in-a-notebook) - spiega come possiamo ora importare il dataset in "Notebooks" per l'analisi utilizzando pacchetti Python (come pandas, numpy e matplotlib) per organizzare e visualizzare i dati. * [`Analisi del Sentimento`](https://gist.github.com/jlooper/ce4d102efd057137bc000db796bfd671#sentiment-analysis-using-cognitive-services) - spiega come possiamo integrare servizi cloud come Text Analytics, utilizzando strumenti low-code come [Power Automate](https://flow.microsoft.com/en-us/) per flussi di lavoro automatizzati di elaborazione dei dati. -Seguendo questo flusso di lavoro, possiamo esplorare gli impatti stagionali sul sentimento delle poesie e aiutarci a formare le nostre prospettive sull'autore. Provalo tu stesso - poi estendi il notebook per porre altre domande o visualizzare i dati in modi nuovi! +Seguendo questo workflow, possiamo esplorare gli impatti stagionali sul sentimento delle poesie e aiutarci a formare le nostre prospettive sull'autore. Provalo tu stesso - poi estendi il notebook per porre altre domande o visualizzare i dati in nuovi modi! > Puoi utilizzare alcuni degli strumenti nel [Digital Humanities toolkit](https://github.com/Digital-Humanities-Toolkit) per perseguire queste linee di indagine. -## Scienza dei Dati + Sostenibilità +## Data Science + Sostenibilità | ![ Sketchnote di [(@sketchthedocs)](https://sketchthedocs.dev) ](../../sketchnotes/20-DataScience-Sustainability.png) | | :---------------------------------------------------------------------------------------------------------------: | -| Scienza dei Dati & Sostenibilità - _Sketchnote di [@nitya](https://twitter.com/nitya)_ | +| Data Science & Sostenibilità - _Sketchnote di [@nitya](https://twitter.com/nitya)_ | -L'[Agenda 2030 per lo Sviluppo Sostenibile](https://sdgs.un.org/2030agenda) - adottata da tutti i membri delle Nazioni Unite nel 2015 - identifica 17 obiettivi, tra cui quelli che si concentrano su **Proteggere il Pianeta** dal degrado e dall'impatto dei cambiamenti climatici. L'iniziativa [Microsoft Sustainability](https://www.microsoft.com/en-us/sustainability) supporta questi obiettivi esplorando modi in cui le soluzioni tecnologiche possono sostenere e costruire futuri più sostenibili con un [focus su 4 obiettivi](https://dev.to/azure/a-visual-guide-to-sustainable-software-engineering-53hh) - essere carbon negative, water positive, zero waste e biodiversi entro il 2030. +L'[Agenda 2030 per lo Sviluppo Sostenibile](https://sdgs.un.org/2030agenda) - adottata da tutti i membri delle Nazioni Unite nel 2015 - identifica 17 obiettivi, inclusi quelli che si concentrano su **Proteggere il Pianeta** dalla degradazione e dall'impatto del cambiamento climatico. L'iniziativa [Microsoft Sustainability](https://www.microsoft.com/en-us/sustainability) supporta questi obiettivi esplorando modi in cui le soluzioni tecnologiche possono sostenere e costruire futuri più sostenibili con un [focus su 4 obiettivi](https://dev.to/azure/a-visual-guide-to-sustainable-software-engineering-53hh) - essere carbon negative, water positive, zero waste e bio-diverse entro il 2030. Affrontare queste sfide in modo scalabile e tempestivo richiede un pensiero su scala cloud - e dati su larga scala. L'iniziativa [Planetary Computer](https://planetarycomputer.microsoft.com/) fornisce 4 componenti per aiutare i data scientist e gli sviluppatori in questo sforzo: * [Catalogo Dati](https://planetarycomputer.microsoft.com/catalog) - con petabyte di dati sui sistemi terrestri (gratuiti e ospitati su Azure). - * [Planetary API](https://planetarycomputer.microsoft.com/docs/reference/stac/) - per aiutare gli utenti a cercare dati rilevanti nello spazio e nel tempo. + * [API Planetary](https://planetarycomputer.microsoft.com/docs/reference/stac/) - per aiutare gli utenti a cercare dati rilevanti nello spazio e nel tempo. * [Hub](https://planetarycomputer.microsoft.com/docs/overview/environment/) - ambiente gestito per gli scienziati per elaborare enormi dataset geospaziali. - * [Applicazioni](https://planetarycomputer.microsoft.com/applications) - mostra casi d'uso e strumenti per intuizioni sulla sostenibilità. + * [Applicazioni](https://planetarycomputer.microsoft.com/applications) - mostrano casi d'uso e strumenti per intuizioni sulla sostenibilità. **Il progetto Planetary Computer è attualmente in anteprima (a partire da settembre 2021)** - ecco come puoi iniziare a contribuire a soluzioni sostenibili utilizzando la data science. * [Richiedi l'accesso](https://planetarycomputer.microsoft.com/account/request) per iniziare l'esplorazione e connetterti con altri utenti. -* [Esplora la documentazione](https://planetarycomputer.microsoft.com/docs/overview/about) per comprendere i dataset e le API supportate. +* [Esplora la documentazione](https://planetarycomputer.microsoft.com/docs/overview/about) per comprendere i dataset e le API supportati. * Esplora applicazioni come [Ecosystem Monitoring](https://analytics-lab.org/ecosystemmonitoring/) per trovare ispirazione su idee applicative. -Pensa a come puoi utilizzare la visualizzazione dei dati per evidenziare o amplificare intuizioni rilevanti su temi come il cambiamento climatico e la deforestazione. Oppure considera come queste intuizioni possano essere utilizzate per creare nuove esperienze utente che motivino cambiamenti comportamentali verso uno stile di vita più sostenibile. +Pensa a come puoi utilizzare la visualizzazione dei dati per rivelare o amplificare intuizioni rilevanti su temi come il cambiamento climatico e la deforestazione. Oppure considera come queste intuizioni possano essere utilizzate per creare nuove esperienze utente che motivino cambiamenti comportamentali per uno stile di vita più sostenibile. ## Data Science + Studenti -Abbiamo parlato di applicazioni reali nell'industria e nella ricerca, ed esplorato esempi di applicazioni di data science nelle discipline umanistiche digitali e nella sostenibilità. Quindi, come puoi sviluppare le tue competenze e condividere la tua esperienza come principianti nella data science? +Abbiamo parlato di applicazioni reali nell'industria e nella ricerca, ed esplorato esempi di applicazioni di data science nelle discipline umanistiche digitali e nella sostenibilità. Quindi, come puoi sviluppare le tue competenze e condividere la tua esperienza come principiante in data science? Ecco alcuni esempi di progetti di data science per studenti che possono ispirarti. @@ -141,9 +141,10 @@ Cerca articoli che raccomandano progetti di data science adatti ai principianti Vuoi esplorare altri casi d'uso? Ecco alcuni articoli rilevanti: * [17 Applicazioni ed esempi di Data Science](https://builtin.com/data-science/data-science-applications-examples) - Luglio 2021 - * [11 Applicazioni straordinarie della Data Science nel mondo reale](https://myblindbird.com/data-science-applications-real-world/) - Maggio 2021 + * [11 Straordinarie applicazioni di Data Science nel mondo reale](https://myblindbird.com/data-science-applications-real-world/) - Maggio 2021 * [Data Science nel mondo reale](https://towardsdatascience.com/data-science-in-the-real-world/home) - Raccolta di articoli - * Data Science in: [Educazione](https://data-flair.training/blogs/data-science-in-education/), [Agricoltura](https://data-flair.training/blogs/data-science-in-agriculture/), [Finanza](https://data-flair.training/blogs/data-science-in-finance/), [Cinema](https://data-flair.training/blogs/data-science-at-movies/) e altro. + * [12 Applicazioni di Data Science nel mondo reale con esempi](https://www.scaler.com/blog/data-science-applications/) - Maggio 2024 + * Data Science in: [Educazione](https://data-flair.training/blogs/data-science-in-education/), [Agricoltura](https://data-flair.training/blogs/data-science-in-agriculture/), [Finanza](https://data-flair.training/blogs/data-science-in-finance/), [Cinema](https://data-flair.training/blogs/data-science-at-movies/), [Sanità](https://onlinedegrees.sandiego.edu/data-science-health-care/) e altro. ## Compito diff --git a/translations/ja/6-Data-Science-In-Wild/20-Real-World-Examples/README.md b/translations/ja/6-Data-Science-In-Wild/20-Real-World-Examples/README.md index b31806b1..2b12e994 100644 --- a/translations/ja/6-Data-Science-In-Wild/20-Real-World-Examples/README.md +++ b/translations/ja/6-Data-Science-In-Wild/20-Real-World-Examples/README.md @@ -1,23 +1,23 @@ -# 現実世界におけるデータサイエンス +# 現実世界のデータサイエンス | ![ Sketchnote by [(@sketchthedocs)](https://sketchthedocs.dev) ](../../sketchnotes/20-DataScience-RealWorld.png) | | :--------------------------------------------------------------------------------------------------------------: | -| 現実世界におけるデータサイエンス - _スケッチノート by [@nitya](https://twitter.com/nitya)_ | +| 現実世界のデータサイエンス - _スケッチノート by [@nitya](https://twitter.com/nitya)_ | 学習の旅もいよいよ終盤です! -私たちはデータサイエンスと倫理の定義から始まり、データ分析と可視化のためのさまざまなツールと技術を探り、データサイエンスのライフサイクルをレビューし、クラウドコンピューティングサービスを使ったデータサイエンスワークフローの拡張と自動化について学びました。そこで、次の疑問が浮かぶかもしれません: _「これらの学びを現実世界の文脈にどう結びつければいいの?」_ +データサイエンスと倫理の定義から始まり、データ分析と可視化のためのさまざまなツールや技術を探り、データサイエンスのライフサイクルをレビューし、クラウドコンピューティングサービスを使ったデータサイエンスワークフローのスケーリングと自動化について学びました。そこで、次の疑問が湧くかもしれません: _「これらの学びを現実世界の文脈にどう結びつけるのか?」_ -このレッスンでは、業界におけるデータサイエンスの現実的な応用を探り、研究、デジタル人文学、持続可能性の具体的な例を掘り下げます。また、学生プロジェクトの機会を紹介し、学習の旅を続けるための役立つリソースで締めくくります! +このレッスンでは、業界におけるデータサイエンスの現実世界での応用を探り、研究、デジタル人文学、持続可能性の具体的な例を掘り下げます。また、学生プロジェクトの機会を紹介し、学習の旅を続けるための役立つリソースで締めくくります。 ## 講義前クイズ @@ -25,25 +25,25 @@ CO_OP_TRANSLATOR_METADATA: ## データサイエンス + 業界 -AIの民主化のおかげで、開発者はAI駆動の意思決定やデータ駆動の洞察をユーザー体験や開発ワークフローに設計・統合することが以前よりも容易になっています。以下は、業界全体でデータサイエンスが「応用」されている現実的な例のいくつかです: +AIの民主化のおかげで、開発者はAI駆動の意思決定やデータ駆動の洞察をユーザー体験や開発ワークフローに設計・統合することが以前よりも容易になっています。以下は、業界全体でデータサイエンスが「応用」されているいくつかの例です: * [Google Flu Trends](https://www.wired.com/2015/10/can-learn-epic-failure-google-flu-trends/) は検索語とインフルエンザの傾向を関連付けるためにデータサイエンスを使用しました。このアプローチには欠点がありましたが、データ駆動型の医療予測の可能性(および課題)についての認識を高めました。 * [UPSのルート予測](https://www.technologyreview.com/2018/11/21/139000/how-ups-uses-ai-to-outsmart-bad-weather/) - UPSがデータサイエンスと機械学習を使用して、天候条件、交通パターン、配達期限などを考慮した最適な配達ルートを予測する方法を説明しています。 - * [NYCタクシーのルート可視化](http://chriswhong.github.io/nyctaxi/) - [情報公開法](https://chriswhong.com/open-data/foil_nyc_taxi/) を使用して収集されたデータを活用し、NYCタクシーの日常を可視化。忙しい都市をどのように移動し、どれだけの収益を上げ、各24時間の間にどれだけの時間を費やしているかを理解するのに役立ちます。 + * [NYCタクシーのルート可視化](http://chriswhong.github.io/nyctaxi/) - [情報公開法](https://chriswhong.com/open-data/foil_nyc_taxi/)を使用して収集されたデータを使用して、NYCタクシーの日常を可視化し、忙しい都市をどのように移動するか、稼ぐ金額、各24時間の旅行時間を理解するのに役立ちました。 - * [Uber Data Science Workbench](https://eng.uber.com/dsw/) - 毎日数百万件のUberの乗車データ(ピックアップ&ドロップオフの場所、乗車時間、好まれるルートなど)を活用して、価格設定、安全性、不正検出、ナビゲーションの意思決定を支援するデータ分析ツールを構築。 + * [Uber Data Science Workbench](https://eng.uber.com/dsw/) - 毎日数百万件のUberの乗車データ(ピックアップ&ドロップオフの場所、旅行時間、好まれるルートなど)を使用して、価格設定、安全性、不正検出、ナビゲーションの意思決定を支援するデータ分析ツールを構築しています。 - * [スポーツ分析](https://towardsdatascience.com/scope-of-analytics-in-sports-world-37ed09c39860) - _予測分析_(チームや選手の分析 - [Moneyball](https://datasciencedegree.wisconsin.edu/blog/moneyball-proves-importance-big-data-big-ideas/) を想像してください - およびファン管理)と _データ可視化_(チーム&ファンダッシュボード、ゲームなど)に焦点を当て、才能スカウト、スポーツ賭博、在庫/会場管理などの応用例を提供。 + * [スポーツ分析](https://towardsdatascience.com/scope-of-analytics-in-sports-world-37ed09c39860) - _予測分析_(チームや選手の分析 - [Moneyball](https://datasciencedegree.wisconsin.edu/blog/moneyball-proves-importance-big-data-big-ideas/) を想像してください - およびファン管理)と _データ可視化_(チーム&ファンダッシュボード、ゲームなど)に焦点を当て、才能のスカウト、スポーツギャンブル、在庫/会場管理などの応用があります。 - * [銀行業界におけるデータサイエンス](https://data-flair.training/blogs/data-science-in-banking/) - リスクモデリングや不正検出から顧客セグメンテーション、リアルタイム予測、レコメンダーシステムまで、金融業界におけるデータサイエンスの価値を強調。予測分析は、[信用スコア](https://dzone.com/articles/using-big-data-and-predictive-analytics-for-credit) のような重要な指標を推進。 + * [銀行業界におけるデータサイエンス](https://data-flair.training/blogs/data-science-in-banking/) - リスクモデリングや不正検出から顧客セグメンテーション、リアルタイム予測、レコメンダーシステムまで、金融業界におけるデータサイエンスの価値を強調しています。予測分析は、[信用スコア](https://dzone.com/articles/using-big-data-and-predictive-analytics-for-credit) のような重要な指標を推進します。 - * [医療におけるデータサイエンス](https://data-flair.training/blogs/data-science-in-healthcare/) - 医療画像(例: MRI、X線、CTスキャン)、ゲノミクス(DNA配列解析)、薬剤開発(リスク評価、成功予測)、予測分析(患者ケア&供給物流)、疾病追跡&予防などの応用例を強調。 + * [医療におけるデータサイエンス](https://data-flair.training/blogs/data-science-in-healthcare/) - 医療画像(例: MRI、X線、CTスキャン)、ゲノミクス(DNAシーケンシング)、薬剤開発(リスク評価、成功予測)、予測分析(患者ケア&供給物流)、疾病追跡&予防などの応用を強調しています。 -![現実世界におけるデータサイエンスの応用](../../../../6-Data-Science-In-Wild/20-Real-World-Examples/images/data-science-applications.png) 画像提供: [Data Flair: 6 Amazing Data Science Applications ](https://data-flair.training/blogs/data-science-applications/) +![現実世界におけるデータサイエンスの応用](../../../../translated_images/data-science-applications.4e5019cd8790ebac2277ff5f08af386f8727cac5d30f77727c7090677e6adb9c.ja.png) 画像提供: [Data Flair: 6 Amazing Data Science Applications ](https://data-flair.training/blogs/data-science-applications/) -この図は、データサイエンス技術を応用する他の分野と例を示しています。他の応用例を探りたいですか?以下の [レビュー&自己学習](../../../../6-Data-Science-In-Wild/20-Real-World-Examples) セクションをチェックしてください。 +この図は、データサイエンス技術を応用する他の分野と例を示しています。他の応用を探りたいですか?以下の [レビュー&自己学習](../../../../6-Data-Science-In-Wild/20-Real-World-Examples) セクションをチェックしてください。 ## データサイエンス + 研究 @@ -54,17 +54,17 @@ AIの民主化のおかげで、開発者はAI駆動の意思決定やデータ 現実世界の応用はしばしば業界の大規模なユースケースに焦点を当てますが、_研究_ の応用とプロジェクトは以下の2つの観点から有益です: * _イノベーションの機会_ - 次世代アプリケーションのための高度な概念の迅速なプロトタイピングとユーザー体験のテストを探る。 -* _展開の課題_ - 現実世界の文脈でデータサイエンス技術が引き起こす可能性のある害や意図しない結果を調査。 +* _展開の課題_ - 現実世界の文脈でデータサイエンス技術の潜在的な害や意図しない結果を調査する。 -学生にとって、これらの研究プロジェクトは学習と協力の機会を提供し、トピックの理解を深め、関連する分野で活動する人々やチームとの認識と関与を広げることができます。それでは、研究プロジェクトはどのようなものか、そしてそれがどのように影響を与えることができるのかを見てみましょう。 +学生にとって、これらの研究プロジェクトは学習と協力の機会を提供し、トピックの理解を深め、関連する分野で活動する人々やチームとの認識と関与を広げることができます。では、研究プロジェクトはどのようなものか、そしてそれがどのように影響を与えることができるのかを見てみましょう。 -一例として、Joy Buolamwini(MIT Media Labs)による [MIT Gender Shades Study](http://gendershades.org/overview.html) を見てみましょう。この研究は、Timnit Gebru(当時Microsoft Research所属)との共著による[代表的な研究論文](http://proceedings.mlr.press/v81/buolamwini18a/buolamwini18a.pdf)を伴い、以下に焦点を当てました: +一例として、Joy Buolamwini(MIT Media Labs)による [MIT Gender Shades Study](http://gendershades.org/overview.html) を見てみましょう。この研究は、Timnit Gebru(当時Microsoft Research所属)との共著による[代表的な研究論文](http://proceedings.mlr.press/v81/buolamwini18a/buolamwini18a.pdf)を伴っています。この研究は以下に焦点を当てています: - * **何を:** 研究プロジェクトの目的は、_性別と肌の色に基づく自動顔分析アルゴリズムとデータセットに存在するバイアスを評価すること_ でした。 + * **何を:** 研究プロジェクトの目的は、_性別や肌の色に基づく自動顔分析アルゴリズムとデータセットに存在するバイアスを評価する_ ことでした。 * **なぜ:** 顔分析は、法執行機関、空港のセキュリティ、採用システムなどの分野で使用されており、不正確な分類(例: バイアスによる)が影響を受ける個人やグループに経済的および社会的な害を引き起こす可能性があります。バイアスを理解し、それを排除または軽減することは、公平な使用の鍵です。 - * **どのように:** 研究者は、既存のベンチマークが主に肌の色が明るい被験者を使用していることを認識し、性別と肌の色でよりバランスの取れた新しいデータセット(1000以上の画像)を作成しました。このデータセットを使用して、3つの性別分類製品(Microsoft、IBM、Face++)の精度を評価しました。 + * **どのように:** 研究者は、既存のベンチマークが主に肌の色が明るい被験者を使用していることを認識し、性別と肌の色でよりバランスの取れた新しいデータセット(1000以上の画像)を作成しました。このデータセットを使用して、Microsoft、IBM、Face++の3つの性別分類製品の精度を評価しました。 -結果は、全体的な分類精度は良好であるものの、さまざまなサブグループ間でエラー率に顕著な違いがあることを示しました。特に、**性別誤認識**が女性や肌の色が濃い人々で高く、バイアスを示唆していました。 +結果は、全体的な分類精度は良好であるものの、さまざまなサブグループ間でエラー率に顕著な差があることを示しました。特に、**性別誤認**が女性や肌の色が濃い人々で高く、バイアスを示唆していました。 **主な成果:** データサイエンスには、より_代表的なデータセット_(バランスの取れたサブグループ)と、より_包括的なチーム_(多様な背景)が必要であり、AIソリューションでのバイアスを早期に認識し排除または軽減することが重要であるという認識を高めました。このような研究努力は、多くの組織がAI製品とプロセスの公平性を向上させるための_責任あるAI_ の原則と実践を定義する上で重要です。 @@ -80,21 +80,21 @@ AIの民主化のおかげで、開発者はAI駆動の意思決定やデータ | :---------------------------------------------------------------------------------------------------------------: | | データサイエンス&デジタル人文学 - _スケッチノート by [@nitya](https://twitter.com/nitya)_ | -デジタル人文学は、「計算方法と人文学的探求を組み合わせた実践とアプローチの集合」と[定義されています](https://digitalhumanities.stanford.edu/about-dh-stanford)。[スタンフォードのプロジェクト](https://digitalhumanities.stanford.edu/projects) では、_「歴史の再起動」_ や _「詩的思考」_ のような例が示されており、[デジタル人文学とデータサイエンス](https://digitalhumanities.stanford.edu/digital-humanities-and-data-science) の関連性を強調しています。これらは、ネットワーク分析、情報可視化、空間およびテキスト分析などの技術を活用し、歴史的および文学的データセットを再検討して新たな洞察や視点を得ることを目的としています。 +デジタル人文学は、「計算方法と人文学的探求を組み合わせた実践とアプローチの集合」として[定義されています](https://digitalhumanities.stanford.edu/about-dh-stanford)。[スタンフォードのプロジェクト](https://digitalhumanities.stanford.edu/projects) では、_「歴史の再起動」_ や _「詩的思考」_ などが、[デジタル人文学とデータサイエンス](https://digitalhumanities.stanford.edu/digital-humanities-and-data-science) の関連性を示しており、ネットワーク分析、情報可視化、空間およびテキスト分析などの技術が、歴史的および文学的データセットを再検討し、新たな洞察と視点を導き出すのに役立つことを強調しています。 *この分野でプロジェクトを探求し拡張したいですか?* -["Emily Dickinson and the Meter of Mood"](https://gist.github.com/jlooper/ce4d102efd057137bc000db796bfd671) をチェックしてください。これは、[Jen Looper](https://twitter.com/jenlooper) による素晴らしい例で、データサイエンスを使って馴染みのある詩を再検討し、その意味や作者の貢献を新しい文脈で評価する方法を問うものです。例えば、_詩のトーンや感情を分析することで、その詩が書かれた季節を予測できるか_ - そしてそれが関連する期間における作者の精神状態について何を教えてくれるのか? +["Emily Dickinson and the Meter of Mood"](https://gist.github.com/jlooper/ce4d102efd057137bc000db796bfd671) をチェックしてください。これは、[Jen Looper](https://twitter.com/jenlooper) による素晴らしい例で、データサイエンスを使用して馴染みのある詩を再検討し、その意味や作者の貢献を新しい文脈で評価する方法を問うものです。例えば、_詩のトーンや感情を分析することで、その詩が書かれた季節を予測できるか_ - そしてそれが関連する期間における作者の精神状態について何を教えてくれるのか? その質問に答えるために、データサイエンスライフサイクルのステップをたどります: - * [`データ取得`](https://gist.github.com/jlooper/ce4d102efd057137bc000db796bfd671#acquiring-the-dataset) - 分析のための関連データセットを収集します。API(例: [Poetry DB API](https://poetrydb.org/index.html))を使用するか、ウェブページをスクレイピング(例: [Project Gutenberg](https://www.gutenberg.org/files/12242/12242-h/12242-h.htm))するオプションがあります。 - * [`データクリーニング`](https://gist.github.com/jlooper/ce4d102efd057137bc000db796bfd671#clean-the-data) - テキストをフォーマット、整理、簡素化する方法を基本ツール(Visual Studio CodeやMicrosoft Excelなど)を使って説明します。 - * [`データ分析`](https://gist.github.com/jlooper/ce4d102efd057137bc000db796bfd671#working-with-the-data-in-a-notebook) - データセットを「ノートブック」にインポートし、Pythonパッケージ(pandas、numpy、matplotlibなど)を使用してデータを整理・可視化する方法を説明します。 + * [`データ取得`](https://gist.github.com/jlooper/ce4d102efd057137bc000db796bfd671#acquiring-the-dataset) - 分析のための関連データセットを収集します。API(例: [Poetry DB API](https://poetrydb.org/index.html))を使用するか、ウェブページ(例: [Project Gutenberg](https://www.gutenberg.org/files/12242/12242-h/12242-h.htm))をスクレイピングするツール(例: [Scrapy](https://scrapy.org/))を使用するオプションがあります。 + * [`データクリーニング`](https://gist.github.com/jlooper/ce4d102efd057137bc000db796bfd671#clean-the-data) - テキストをフォーマット、整理、簡素化する方法を基本ツール(Visual Studio CodeやMicrosoft Excelなど)を使用して説明します。 + * [`データ分析`](https://gist.github.com/jlooper/ce4d102efd057137bc000db796bfd671#working-with-the-data-in-a-notebook) - データセットを「ノートブック」にインポートし、Pythonパッケージ(pandas、numpy、matplotlibなど)を使用してデータを整理し可視化する方法を説明します。 * [`感情分析`](https://gist.github.com/jlooper/ce4d102efd057137bc000db796bfd671#sentiment-analysis-using-cognitive-services) - Text Analyticsのようなクラウドサービスを統合し、[Power Automate](https://flow.microsoft.com/en-us/) のようなローコードツールを使用して自動データ処理ワークフローを実現する方法を説明します。 -このワークフローを使用して、詩の感情に季節が与える影響を探り、作者に対する独自の視点を形成することができます。ぜひ試してみてください - その後、ノートブックを拡張して他の質問を投げかけたり、新しい方法でデータを可視化してみてください! +このワークフローを使用して、詩の感情に季節が与える影響を探り、作者に対する独自の視点を形成することができます。ぜひ試してみてください - その後、ノートブックを拡張して他の質問をしたり、新しい方法でデータを可視化してみてください! -> [Digital Humanities toolkit](https://github.com/Digital-Humanities-Toolkit) のツールを使ってこれらの探求を進めることができます。 +> [デジタル人文学ツールキット](https://github.com/Digital-Humanities-Toolkit) のいくつかのツールを使用して、これらの探求の道を追求することができます。 ## データサイエンス + 持続可能性 @@ -102,54 +102,55 @@ AIの民主化のおかげで、開発者はAI駆動の意思決定やデータ | :---------------------------------------------------------------------------------------------------------------: | | データサイエンス&持続可能性 - _スケッチノート by [@nitya](https://twitter.com/nitya)_ | -[2030年持続可能な開発のためのアジェンダ](https://sdgs.un.org/2030agenda) - 2015年にすべての国連加盟国によって採択されたこのアジェンダは、**気候変動の影響から地球を保護する**ことに焦点を当てた目標を含む17の目標を特定しています。[Microsoft Sustainability](https://www.microsoft.com/en-us/sustainability) イニシアチブはこれらの目標を支援し、技術ソリューションを活用してより持続可能な未来を構築する方法を探ることで、[4つの目標](https://dev.to/azure/a-visual-guide-to-sustainable-software-engineering-53hh) に焦点を当てています - 2030年までに炭素ネガティブ、水ポジティブ、ゼロ廃棄物、生物多様性を実現すること。 +[2030年持続可能な開発のためのアジェンダ](https://sdgs.un.org/2030agenda) - 2015年にすべての国連加盟国によって採択されたこのアジェンダは、気候変動の影響から地球を保護することに焦点を当てた目標を含む17の目標を特定しています。[Microsoft Sustainability](https://www.microsoft.com/en-us/sustainability) イニシアチブは、2030年までに炭素負債、水のポジティブ化、廃棄物ゼロ、生物多様性の4つの目標に焦点を当て、技術ソリューションがより持続可能な未来を支援し構築する方法を探ることでこれらの目標をサポートしています。 これらの課題にスケーラブルかつタイムリーに取り組むには、クラウドスケールの思考と大規模なデータが必要です。[Planetary Computer](https://planetarycomputer.microsoft.com/) イニシアチブは、データサイエンティストや開発者を支援するために以下の4つのコンポーネントを提供しています: * [データカタログ](https://planetarycomputer.microsoft.com/catalog) - 地球システムデータのペタバイト(無料&Azureホスト)。 - * [Planetary API](https://planetarycomputer.microsoft.com/docs/reference/stac/) - 空間と時間を超えて関連データを検索するためのAPI。 - * [ハブ](https://planetarycomputer.microsoft.com/docs/overview/environment/) - 科学者が大規模な地理空間データセットを処理するための管理環境。 - * [アプリケーション](https://planetarycomputer.microsoft.com/applications) - 持続可能性の洞 -**現在、Planetary Computerプロジェクトはプレビュー段階です(2021年9月時点)** - データサイエンスを活用して持続可能性の解決策に貢献する方法をご紹介します。 + * [Planetary API](https://planetarycomputer.microsoft.com/docs/reference/stac/) - ユーザーが空間と時間を超えて関連データを検索するのを支援。 + * [ハブ](https://planetarycomputer.microsoft.com/docs/overview/environment/) - 科学者が巨大な地理空間データセットを処理するための管理環境。 + * [アプリケーション](https://planetarycomputer.microsoft.com/applications) - 持続可能性の洞察のためのユースケースとツールを紹介。 +**Planetary Computerプロジェクトは現在プレビュー段階です(2021年9月時点)** - データサイエンスを活用して持続可能性の解決策に貢献する方法を始めましょう。 * [アクセスをリクエスト](https://planetarycomputer.microsoft.com/account/request)して、探索を開始し、仲間とつながりましょう。 * [ドキュメントを探索](https://planetarycomputer.microsoft.com/docs/overview/about)して、サポートされているデータセットやAPIを理解しましょう。 -* [Ecosystem Monitoring](https://analytics-lab.org/ecosystemmonitoring/)のようなアプリケーションを探索して、アプリケーションのアイデアにインスピレーションを得ましょう。 +* [Ecosystem Monitoring](https://analytics-lab.org/ecosystemmonitoring/)のようなアプリケーションを探索して、アプリケーションアイデアのインスピレーションを得ましょう。 -気候変動や森林破壊といった分野で、データ可視化を活用して関連する洞察を明らかにしたり、強調したりする方法を考えてみてください。また、洞察を活用して、より持続可能な生活を促す行動変容を促進する新しいユーザー体験を生み出す方法についても考えてみましょう。 +データ可視化を活用して、気候変動や森林破壊などの分野における関連する洞察を明らかにしたり、強調したりする方法を考えてみてください。また、洞察を活用して、より持続可能な生活を促す行動変化を動機付ける新しいユーザー体験を創造する方法についても考えてみましょう。 ## データサイエンス + 学生 -私たちは、産業界や研究における実際の応用について話し合い、デジタル人文学や持続可能性におけるデータサイエンスの応用例を探求しました。それでは、データサイエンス初心者としてスキルを磨き、専門知識を共有するにはどうすればよいでしょうか? +私たちは、業界や研究における実世界の応用について話し、デジタル人文学や持続可能性におけるデータサイエンスの応用例を探りました。それでは、データサイエンス初心者としてスキルを磨き、専門知識を共有するにはどうすればよいでしょうか? -以下は、学生向けのデータサイエンスプロジェクトの例です。ぜひ参考にしてください。 +以下は、学生向けデータサイエンスプロジェクトの例です。ぜひ参考にしてください。 - * [MSR Data Science Summer School](https://www.microsoft.com/en-us/research/academic-program/data-science-summer-school/#!projects)では、以下のようなトピックを探求するGitHubの[プロジェクト](https://github.com/msr-ds3)があります: + * [MSR Data Science Summer School](https://www.microsoft.com/en-us/research/academic-program/data-science-summer-school/#!projects)では、GitHubの[プロジェクト](https://github.com/msr-ds3)を通じて以下のようなトピックを探求しています: - [警察の武力行使における人種的偏見](https://www.microsoft.com/en-us/research/video/data-science-summer-school-2019-replicating-an-empirical-analysis-of-racial-differences-in-police-use-of-force/) | [Github](https://github.com/msr-ds3/stop-question-frisk) - - [ニューヨーク市地下鉄システムの信頼性](https://www.microsoft.com/en-us/research/video/data-science-summer-school-2018-exploring-the-reliability-of-the-nyc-subway-system/) | [Github](https://github.com/msr-ds3/nyctransit) - * [物質文化のデジタル化:Sirkapにおける社会経済的分布の探求](https://claremont.maps.arcgis.com/apps/Cascade/index.html?appid=bdf2aef0f45a4674ba41cd373fa23afc) - [Ornella Altunyan](https://twitter.com/ornelladotcom)氏とClaremontのチームによるプロジェクトで、[ArcGIS StoryMaps](https://storymaps.arcgis.com/)を使用。 + - [NYC地下鉄システムの信頼性](https://www.microsoft.com/en-us/research/video/data-science-summer-school-2018-exploring-the-reliability-of-the-nyc-subway-system/) | [Github](https://github.com/msr-ds3/nyctransit) + * [物質文化のデジタル化:Sirkapにおける社会経済的分布の探求](https://claremont.maps.arcgis.com/apps/Cascade/index.html?appid=bdf2aef0f45a4674ba41cd373fa23afc) - [Ornella Altunyan](https://twitter.com/ornelladotcom)とClaremontのチームによるプロジェクトで、[ArcGIS StoryMaps](https://storymaps.arcgis.com/)を使用しています。 ## 🚀 チャレンジ -初心者向けのデータサイエンスプロジェクトを推奨する記事を探してみましょう。例えば、[これらの50のトピックエリア](https://www.upgrad.com/blog/data-science-project-ideas-topics-beginners/)や[これらの21のプロジェクトアイデア](https://www.intellspot.com/data-science-project-ideas)、[ソースコード付きの16のプロジェクト](https://data-flair.training/blogs/data-science-project-ideas/)などがあります。これらを分解して再構築してみてください。そして、学習の過程をブログに書き、私たちと洞察を共有するのを忘れないでください。 +初心者向けのデータサイエンスプロジェクトを推奨する記事を探してみましょう。例えば、[これらの50のトピック](https://www.upgrad.com/blog/data-science-project-ideas-topics-beginners/)や[これらの21のプロジェクトアイデア](https://www.intellspot.com/data-science-project-ideas)、または[ソースコード付きの16のプロジェクト](https://data-flair.training/blogs/data-science-project-ideas/)などを分解してリミックスしてみてください。そして、学習の旅についてブログを書き、洞察を私たちと共有することを忘れないでください。 ## 講義後のクイズ ## [講義後のクイズ](https://ff-quizzes.netlify.app/en/ds/quiz/39) -## 復習と自己学習 +## レビューと自己学習 -さらにユースケースを探求したいですか?以下の関連する記事をご覧ください: +さらにユースケースを探求したいですか?以下の記事をご覧ください: * [17のデータサイエンスの応用例](https://builtin.com/data-science/data-science-applications-examples) - 2021年7月 - * [現実世界における11の驚くべきデータサイエンスの応用](https://myblindbird.com/data-science-applications-real-world/) - 2021年5月 - * [現実世界のデータサイエンス](https://towardsdatascience.com/data-science-in-the-real-world/home) - 記事コレクション - * データサイエンスの応用: [教育](https://data-flair.training/blogs/data-science-in-education/)、[農業](https://data-flair.training/blogs/data-science-in-agriculture/)、[金融](https://data-flair.training/blogs/data-science-in-finance/)、[映画](https://data-flair.training/blogs/data-science-at-movies/)など。 + * [実世界における11の驚くべきデータサイエンスの応用例](https://myblindbird.com/data-science-applications-real-world/) - 2021年5月 + * [実世界におけるデータサイエンス](https://towardsdatascience.com/data-science-in-the-real-world/home) - 記事コレクション + * [12の実世界のデータサイエンス応用例](https://www.scaler.com/blog/data-science-applications/) - 2024年5月 + * データサイエンスの応用例:[教育](https://data-flair.training/blogs/data-science-in-education/)、[農業](https://data-flair.training/blogs/data-science-in-agriculture/)、[金融](https://data-flair.training/blogs/data-science-in-finance/)、[映画](https://data-flair.training/blogs/data-science-at-movies/)、[医療](https://onlinedegrees.sandiego.edu/data-science-health-care/)など。 ## 課題 -[Planetary Computerのデータセットを探索する](assignment.md) +[Planetary Computerデータセットを探索する](assignment.md) --- **免責事項**: -この文書は、AI翻訳サービス [Co-op Translator](https://github.com/Azure/co-op-translator) を使用して翻訳されています。正確性を追求しておりますが、自動翻訳には誤りや不正確さが含まれる可能性があります。元の言語で記載された原文が正式な情報源と見なされるべきです。重要な情報については、専門の人間による翻訳を推奨します。この翻訳の使用に起因する誤解や誤認について、当社は一切の責任を負いません。 \ No newline at end of file +この文書はAI翻訳サービス[Co-op Translator](https://github.com/Azure/co-op-translator)を使用して翻訳されています。正確性を追求しておりますが、自動翻訳には誤りや不正確な部分が含まれる可能性があります。元の言語で記載された文書が正式な情報源とみなされるべきです。重要な情報については、専門の人間による翻訳を推奨します。この翻訳の使用に起因する誤解や誤解釈について、当社は責任を負いません。 \ No newline at end of file diff --git a/translations/ko/6-Data-Science-In-Wild/20-Real-World-Examples/README.md b/translations/ko/6-Data-Science-In-Wild/20-Real-World-Examples/README.md index fff606a8..c807114c 100644 --- a/translations/ko/6-Data-Science-In-Wild/20-Real-World-Examples/README.md +++ b/translations/ko/6-Data-Science-In-Wild/20-Real-World-Examples/README.md @@ -1,8 +1,8 @@ # 數據科學在現實世界中的應用 -| ![ Sketchnote by [(@sketchthedocs)](https://sketchthedocs.dev) ](../../sketchnotes/20-DataScience-RealWorld.png) | +| ![由 [(@sketchthedocs)](https://sketchthedocs.dev) 繪製的速寫筆記](../../sketchnotes/20-DataScience-RealWorld.png) | | :--------------------------------------------------------------------------------------------------------------: | -| 數據科學在現實世界中的應用 - _Sketchnote by [@nitya](https://twitter.com/nitya)_ | +| 數據科學在現實世界中的應用 - _由 [@nitya](https://twitter.com/nitya) 繪製的速寫筆記_ | -我們的學習旅程即將結束! +我們的學習旅程即將接近尾聲! 我們從數據科學和倫理的定義開始,探索了各種數據分析和可視化工具與技術,回顧了數據科學的生命周期,並研究了如何利用雲端計算服務擴展和自動化數據科學工作流程。所以,你可能會想:_"如何將這些學到的知識應用到現實世界中?"_ -在這節課中,我們將探討數據科學在各行業中的實際應用,並深入研究在研究、數字人文和可持續性方面的具體例子。我們還會介紹學生項目機會,並提供一些有用的資源,幫助你繼續學習旅程! +在這節課中,我們將探討數據科學在各行業中的現實應用,並深入研究在研究、數字人文和可持續性等背景中的具體案例。我們還會介紹學生項目機會,並提供一些有用的資源,幫助你繼續你的學習旅程! ## 課前測驗 @@ -25,7 +25,7 @@ CO_OP_TRANSLATOR_METADATA: ## 數據科學 + 行業 -隨著人工智能的普及化,開發者現在更容易設計和整合基於人工智能的決策和數據驅動的洞察到用戶體驗和開發工作流程中。以下是數據科學在各行業中的一些實際應用例子: +隨著人工智能的普及化,開發者現在可以更輕鬆地設計和整合基於人工智能的決策和數據驅動的洞察到用戶體驗和開發工作流程中。以下是數據科學在各行業中的一些現實應用案例: * [Google Flu Trends](https://www.wired.com/2015/10/can-learn-epic-failure-google-flu-trends/) 使用數據科學將搜索詞與流感趨勢相關聯。雖然這種方法存在缺陷,但它提高了人們對數據驅動的醫療預測可能性(以及挑戰)的認識。 @@ -33,58 +33,58 @@ CO_OP_TRANSLATOR_METADATA: * [紐約市出租車路線可視化](http://chriswhong.github.io/nyctaxi/) - 使用[信息自由法](https://chriswhong.com/open-data/foil_nyc_taxi/)收集的數據幫助可視化紐約市出租車一天的運行情況,幫助我們了解它們如何在繁忙的城市中穿梭、賺取的收入以及每24小時內行程的持續時間。 - * [Uber 數據科學工作台](https://eng.uber.com/dsw/) - 利用每天從數百萬次 Uber 行程中收集的數據(如接送地點、行程時長、偏好路線等),構建數據分析工具,用於定價、安全、欺詐檢測和導航決策。 + * [Uber 數據科學工作台](https://eng.uber.com/dsw/) - 利用每天數百萬次 Uber 行程收集的數據(如接送地點、行程時長、偏好路線等),構建數據分析工具以幫助定價、安全、欺詐檢測和導航決策。 - * [體育分析](https://towardsdatascience.com/scope-of-analytics-in-sports-world-37ed09c39860) - 專注於_預測分析_(團隊和球員分析,例如[Moneyball](https://datasciencedegree.wisconsin.edu/blog/moneyball-proves-importance-big-data-big-ideas/))和_數據可視化_(團隊和粉絲儀表板、比賽等),應用於人才挖掘、體育博彩和場地管理。 + * [體育分析](https://towardsdatascience.com/scope-of-analytics-in-sports-world-37ed09c39860) - 專注於_預測分析_(團隊和球員分析,例如 [Moneyball](https://datasciencedegree.wisconsin.edu/blog/moneyball-proves-importance-big-data-big-ideas/))和粉絲管理,以及_數據可視化_(團隊和粉絲儀表板、比賽等),應用於人才選拔、體育博彩和場地管理。 - * [銀行業中的數據科學](https://data-flair.training/blogs/data-science-in-banking/) - 強調數據科學在金融行業的價值,應用包括風險建模和欺詐檢測、客戶分群、實時預測和推薦系統。預測分析還推動了關鍵指標,如[信用評分](https://dzone.com/articles/using-big-data-and-predictive-analytics-for-credit)。 + * [銀行業中的數據科學](https://data-flair.training/blogs/data-science-in-banking/) - 強調數據科學在金融行業中的價值,應用包括風險建模和欺詐檢測、客戶分群、實時預測和推薦系統。預測分析還推動了關鍵指標,如[信用評分](https://dzone.com/articles/using-big-data-and-predictive-analytics-for-credit)。 - * [醫療中的數據科學](https://data-flair.training/blogs/data-science-in-healthcare/) - 強調應用包括醫學影像(如 MRI、X光、CT掃描)、基因組學(DNA測序)、藥物開發(風險評估、成功預測)、預測分析(患者護理和供應物流)、疾病追蹤和預防等。 + * [醫療保健中的數據科學](https://data-flair.training/blogs/data-science-in-healthcare/) - 強調應用如醫學影像(例如 MRI、X光、CT掃描)、基因組學(DNA測序)、藥物開發(風險評估、成功預測)、預測分析(患者護理和供應物流)、疾病追蹤和預防等。 -![數據科學在現實世界中的應用](../../../../6-Data-Science-In-Wild/20-Real-World-Examples/images/data-science-applications.png) 圖片來源:[Data Flair: 6 Amazing Data Science Applications ](https://data-flair.training/blogs/data-science-applications/) +![數據科學在現實世界中的應用](../../../../translated_images/data-science-applications.4e5019cd8790ebac2277ff5f08af386f8727cac5d30f77727c7090677e6adb9c.mo.png) 圖片來源:[Data Flair: 6 Amazing Data Science Applications ](https://data-flair.training/blogs/data-science-applications/) 該圖展示了其他領域和應用數據科學技術的例子。想探索更多應用?請查看下面的[回顧與自學](../../../../6-Data-Science-In-Wild/20-Real-World-Examples)部分。 ## 數據科學 + 研究 -| ![ Sketchnote by [(@sketchthedocs)](https://sketchthedocs.dev) ](../../sketchnotes/20-DataScience-Research.png) | +| ![由 [(@sketchthedocs)](https://sketchthedocs.dev) 繪製的速寫筆記](../../sketchnotes/20-DataScience-Research.png) | | :---------------------------------------------------------------------------------------------------------------: | -| 數據科學與研究 - _Sketchnote by [@nitya](https://twitter.com/nitya)_ | +| 數據科學與研究 - _由 [@nitya](https://twitter.com/nitya) 繪製的速寫筆記_ | 雖然現實世界的應用通常專注於行業中的大規模使用案例,_研究_應用和項目可以從兩個角度提供價值: * _創新機會_ - 探索先進概念的快速原型設計以及下一代應用的用戶體驗測試。 * _部署挑戰_ - 調查數據科學技術在現實世界中的潛在危害或意外後果。 -對於學生來說,這些研究項目既能提供學習機會,也能促進合作,幫助你加深對主題的理解,並擴展你與相關領域的專家或團隊的接觸和參與。那麼研究項目是什麼樣的?它們如何產生影響? +對於學生而言,這些研究項目既能提供學習機會,也能提供合作機會,幫助你加深對主題的理解,並擴展你與相關領域中工作的人或團隊的接觸和參與。那麼研究項目是什麼樣的?它們如何產生影響? -讓我們看一個例子——[MIT Gender Shades Study](http://gendershades.org/overview.html),由 Joy Buolamwini(MIT Media Labs)領導,並與 Timnit Gebru(當時在 Microsoft Research)共同撰寫了一篇[重要研究論文](http://proceedings.mlr.press/v81/buolamwini18a/buolamwini18a.pdf),該研究專注於: +讓我們看一個例子——[MIT Gender Shades Study](http://gendershades.org/overview.html),由 Joy Buolamwini(MIT 媒體實驗室)進行,並與 Timnit Gebru(當時在微軟研究院)共同撰寫了一篇[標誌性研究論文](http://proceedings.mlr.press/v81/buolamwini18a/buolamwini18a.pdf),該研究專注於: * **什麼:** 該研究項目的目的是_評估基於性別和膚色的自動面部分析算法和數據集中的偏差_。 - * **為什麼:** 面部分析被用於執法、機場安檢、招聘系統等領域——在這些情境中,由於偏差導致的不準確分類可能對受影響的個人或群體造成潛在的經濟和社會危害。理解(並消除或減輕)偏差是使用公平性的關鍵。 - * **如何:** 研究人員認識到現有基準主要使用膚色較淺的受試者,並策劃了一個新的數據集(1000+圖像),該數據集在性別和膚色方面更加平衡。該數據集被用於評估三個性別分類產品(來自 Microsoft、IBM 和 Face++)的準確性。 + * **為什麼:** 面部分析被用於執法、機場安檢、招聘系統等領域——在這些背景下,由於偏差導致的不準確分類可能對受影響的個人或群體造成潛在的經濟和社會危害。理解(並消除或減輕)偏差是使用公平性的關鍵。 + * **如何:** 研究人員認識到現有基準主要使用膚色較淺的受試者,並策劃了一個新的數據集(1000+圖像),該數據集在性別和膚色方面更加平衡。該數據集被用於評估三個性別分類產品(來自微軟、IBM 和 Face++)的準確性。 結果顯示,雖然整體分類準確性良好,但不同子群體之間的錯誤率存在顯著差異——女性或膚色較深的人群的**性別錯誤分類**更高,表明存在偏差。 -**主要成果:** 提高了人們對數據科學需要更多_代表性數據集_(平衡的子群體)和更多_包容性團隊_(多樣化背景)的認識,以便在人工智能解決方案中更早地識別並消除或減輕這些偏差。像這樣的研究努力對許多組織制定負責任人工智能的原則和實踐也至關重要,以改善其人工智能產品和流程的公平性。 +**主要成果:** 提高了人們對數據科學需要更多_代表性數據集_(平衡的子群體)和更多_包容性團隊_(多樣化背景)的認識,以便在人工智能解決方案中更早地識別並消除或減輕這些偏差。像這樣的研究努力也促使許多組織制定負責任人工智能的原則和實踐,以改善其人工智能產品和流程的公平性。 -**想了解 Microsoft 的相關研究工作?** +**想了解微軟相關的研究工作?** -* 查看 [Microsoft Research Projects](https://www.microsoft.com/research/research-area/artificial-intelligence/?facet%5Btax%5D%5Bmsr-research-area%5D%5B%5D=13556&facet%5Btax%5D%5Bmsr-content-type%5D%5B%5D=msr-project) 中的人工智能研究項目。 -* 探索 [Microsoft Research Data Science Summer School](https://www.microsoft.com/en-us/research/academic-program/data-science-summer-school/) 的學生項目。 -* 查看 [Fairlearn](https://fairlearn.org/) 項目和 [Responsible AI](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1%3aprimaryr6) 的倡議。 +* 查看[微軟研究項目](https://www.microsoft.com/research/research-area/artificial-intelligence/?facet%5Btax%5D%5Bmsr-research-area%5D%5B%5D=13556&facet%5Btax%5D%5Bmsr-content-type%5D%5B%5D=msr-project)中的人工智能研究。 +* 探索[微軟研究數據科學暑期學校](https://www.microsoft.com/en-us/research/academic-program/data-science-summer-school/)的學生項目。 +* 查看[Fairlearn](https://fairlearn.org/)項目和[負責任人工智能](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1%3aprimaryr6)倡議。 ## 數據科學 + 人文 -| ![ Sketchnote by [(@sketchthedocs)](https://sketchthedocs.dev) ](../../sketchnotes/20-DataScience-Humanities.png) | +| ![由 [(@sketchthedocs)](https://sketchthedocs.dev) 繪製的速寫筆記](../../sketchnotes/20-DataScience-Humanities.png) | | :---------------------------------------------------------------------------------------------------------------: | -| 數據科學與數字人文 - _Sketchnote by [@nitya](https://twitter.com/nitya)_ | +| 數據科學與數字人文 - _由 [@nitya](https://twitter.com/nitya) 繪製的速寫筆記_ | 數字人文[被定義為](https://digitalhumanities.stanford.edu/about-dh-stanford)“結合計算方法與人文探究的一系列實踐和方法”。[斯坦福項目](https://digitalhumanities.stanford.edu/projects)如_“重啟歷史”_和_“詩意思考”_展示了[數字人文與數據科學](https://digitalhumanities.stanford.edu/digital-humanities-and-data-science)之間的聯繫——強調網絡分析、信息可視化、空間和文本分析等技術,幫助我們重新審視歷史和文學數據集,從中獲得新的洞察和視角。 *想探索並擴展這一領域的項目?* -查看 ["Emily Dickinson and the Meter of Mood"](https://gist.github.com/jlooper/ce4d102efd057137bc000db796bfd671)——一個來自 [Jen Looper](https://twitter.com/jenlooper) 的精彩例子,探討如何利用數據科學重新審視熟悉的詩歌,並在新的背景下重新評估其意義及作者的貢獻。例如,_我們能否通過分析詩歌的語氣或情感來預測其創作季節_——這對於作者在相關時期的心理狀態有何啟示? +查看["Emily Dickinson 和情感的韻律"](https://gist.github.com/jlooper/ce4d102efd057137bc000db796bfd671)——這是一個由[Jen Looper](https://twitter.com/jenlooper)提供的精彩案例,探討如何利用數據科學重新審視熟悉的詩歌,並在新的背景下重新評估其意義及作者的貢獻。例如,_我們能否通過分析詩歌的語氣或情感來預測詩歌創作的季節_——這對於作者在相關時期的心理狀態有什麼啟示? 為了回答這個問題,我們遵循數據科學生命周期的步驟: * [`數據獲取`](https://gist.github.com/jlooper/ce4d102efd057137bc000db796bfd671#acquiring-the-dataset) - 收集相關數據集進行分析。選項包括使用 API(例如 [Poetry DB API](https://poetrydb.org/index.html))或使用工具(如 [Scrapy](https://scrapy.org/))抓取網頁(例如 [Project Gutenberg](https://www.gutenberg.org/files/12242/12242-h/12242-h.htm))。 @@ -94,35 +94,35 @@ CO_OP_TRANSLATOR_METADATA: 通過這一工作流程,我們可以探索季節對詩歌情感的影響,並幫助我們形成對作者的獨特視角。自己試試看——然後擴展筆記本,提出其他問題或以新的方式可視化數據! -> 你可以使用 [Digital Humanities toolkit](https://github.com/Digital-Humanities-Toolkit) 中的一些工具來探索這些研究方向。 +> 你可以使用[數字人文工具包](https://github.com/Digital-Humanities-Toolkit)中的一些工具來進行這些探究。 ## 數據科學 + 可持續性 -| ![ Sketchnote by [(@sketchthedocs)](https://sketchthedocs.dev) ](../../sketchnotes/20-DataScience-Sustainability.png) | +| ![由 [(@sketchthedocs)](https://sketchthedocs.dev) 繪製的速寫筆記](../../sketchnotes/20-DataScience-Sustainability.png) | | :---------------------------------------------------------------------------------------------------------------: | -| 數據科學與可持續性 - _Sketchnote by [@nitya](https://twitter.com/nitya)_ | +| 數據科學與可持續性 - _由 [@nitya](https://twitter.com/nitya) 繪製的速寫筆記_ | -[2030可持續發展議程](https://sdgs.un.org/2030agenda)——由所有聯合國成員於2015年通過——確定了17個目標,其中包括專注於**保護地球**免受退化和氣候變化影響的目標。[Microsoft Sustainability](https://www.microsoft.com/en-us/sustainability)倡議支持這些目標,探索技術解決方案如何支持並構建更可持續的未來,並專注於[四個目標](https://dev.to/azure/a-visual-guide-to-sustainable-software-engineering-53hh)——到2030年實現碳負、正水、零廢物和生物多樣性。 +[2030年可持續發展議程](https://sdgs.un.org/2030agenda)——由所有聯合國成員於2015年通過——確定了17個目標,其中包括**保護地球**免受退化和氣候變化影響的目標。[微軟可持續性](https://www.microsoft.com/en-us/sustainability)倡議支持這些目標,探索技術解決方案如何支持並構建更可持續的未來,並專注於[四個目標](https://dev.to/azure/a-visual-guide-to-sustainable-software-engineering-53hh):到2030年實現碳負排放、積極用水、零廢物和生物多樣性。 -以可擴展和及時的方式應對這些挑戰需要雲端規模的思維——以及大規模數據。[Planetary Computer](https://planetarycomputer.microsoft.com/)倡議提供了四個組件,幫助數據科學家和開發者應對這一努力: +以可擴展和及時的方式應對這些挑戰需要雲端規模的思維——以及大規模數據。[Planetary Computer](https://planetarycomputer.microsoft.com/)倡議提供了四個組件,幫助數據科學家和開發者應對這一挑戰: - * [數據目錄](https://planetarycomputer.microsoft.com/catalog) - 提供地球系統數據的PB級數據(免費且托管於Azure)。 + * [數據目錄](https://planetarycomputer.microsoft.com/catalog) - 提供數百萬兆字節的地球系統數據(免費且托管於 Azure)。 * [Planetary API](https://planetarycomputer.microsoft.com/docs/reference/stac/) - 幫助用戶在空間和時間上搜索相關數據。 - * [Hub](https://planetarycomputer.microsoft.com/docs/overview/environment/) - 為科學家提供處理大規模地理空間數據集的管理環境。 - * [應用](https://planetarycomputer.microsoft.com/applications) - 展示可持續性洞察的使用案例和工具。 + * [Hub](https://planetarycomputer.microsoft.com/docs/overview/environment/) - 為科學家提供管理環境以處理大規模地理空間數據集。 + * [應用程序](https://planetarycomputer.microsoft.com/applications) - 展示可持續性洞察的使用案例和工具。 **Planetary Computer Project 目前處於預覽階段(截至 2021 年 9 月)** - 以下是如何開始使用數據科學為可持續性解決方案做出貢獻的指南。 * [申請訪問權限](https://planetarycomputer.microsoft.com/account/request),開始探索並與同行建立聯繫。 * [探索文件](https://planetarycomputer.microsoft.com/docs/overview/about),了解支持的數據集和 API。 -* 探索像 [生態系統監測](https://analytics-lab.org/ecosystemmonitoring/) 這樣的應用,尋找應用創意的靈感。 +* 探索像 [生態系統監測](https://analytics-lab.org/ecosystemmonitoring/) 這樣的應用程式,尋找應用靈感。 -思考如何利用數據可視化揭示或放大與氣候變化和森林砍伐等相關的洞察。或者思考如何利用洞察創造新的用戶體驗,激勵行為改變以實現更可持續的生活。 +思考如何利用數據可視化揭示或放大與氣候變化和森林砍伐等領域相關的洞察力。或者思考如何利用洞察力創造新的用戶體驗,激勵行為改變以實現更可持續的生活。 ## 數據科學 + 學生 -我們已經討論了行業和研究中的實際應用,並探索了數字人文和可持續性中的數據科學應用示例。那麼,作為數據科學初學者,你如何提升技能並分享專業知識呢? +我們已經討論了行業和研究中的實際應用,並探索了數字人文和可持續性中的數據科學應用範例。那麼,作為數據科學初學者,你如何提升技能並分享專業知識呢? -以下是一些數據科學學生項目示例,供你參考。 +以下是一些數據科學學生項目範例,供你參考。 * [MSR 數據科學夏季學校](https://www.microsoft.com/en-us/research/academic-program/data-science-summer-school/#!projects) 的 GitHub [項目](https://github.com/msr-ds3),探索以下主題: - [警察使用武力中的種族偏見](https://www.microsoft.com/en-us/research/video/data-science-summer-school-2019-replicating-an-empirical-analysis-of-racial-differences-in-police-use-of-force/) | [Github](https://github.com/msr-ds3/stop-question-frisk) @@ -131,7 +131,7 @@ CO_OP_TRANSLATOR_METADATA: ## 🚀 挑戰 -搜尋推薦適合初學者的數據科學項目文章,例如 [這 50 個主題領域](https://www.upgrad.com/blog/data-science-project-ideas-topics-beginners/)、[這 21 個項目創意](https://www.intellspot.com/data-science-project-ideas) 或 [這 16 個帶有源代碼的項目](https://data-flair.training/blogs/data-science-project-ideas/),你可以拆解並重新組合。別忘了記錄你的學習旅程,並與大家分享你的洞察。 +搜尋推薦初學者友好的數據科學項目文章,例如 [這 50 個主題領域](https://www.upgrad.com/blog/data-science-project-ideas-topics-beginners/)、[這 21 個項目想法](https://www.intellspot.com/data-science-project-ideas) 或 [這 16 個帶有源代碼的項目](https://data-flair.training/blogs/data-science-project-ideas/),你可以拆解並重新組合。別忘了記錄你的學習旅程並與大家分享你的洞察力。 ## 課後測驗 @@ -140,10 +140,11 @@ CO_OP_TRANSLATOR_METADATA: ## 回顧與自學 想探索更多用例嗎?以下是一些相關文章: - * [17 個數據科學應用和示例](https://builtin.com/data-science/data-science-applications-examples) - 2021 年 7 月 + * [17 個數據科學應用及範例](https://builtin.com/data-science/data-science-applications-examples) - 2021 年 7 月 * [11 個令人驚嘆的數據科學實際應用](https://myblindbird.com/data-science-applications-real-world/) - 2021 年 5 月 - * [數據科學在現實世界中的應用](https://towardsdatascience.com/data-science-in-the-real-world/home) - 文章合集 - * 數據科學在:[教育](https://data-flair.training/blogs/data-science-in-education/)、[農業](https://data-flair.training/blogs/data-science-in-agriculture/)、[金融](https://data-flair.training/blogs/data-science-in-finance/)、[電影](https://data-flair.training/blogs/data-science-at-movies/) 等領域。 + * [現實世界中的數據科學](https://towardsdatascience.com/data-science-in-the-real-world/home) - 文章合集 + * [12 個帶有範例的現實世界數據科學應用](https://www.scaler.com/blog/data-science-applications/) - 2024 年 5 月 + * 數據科學在以下領域的應用:[教育](https://data-flair.training/blogs/data-science-in-education/)、[農業](https://data-flair.training/blogs/data-science-in-agriculture/)、[金融](https://data-flair.training/blogs/data-science-in-finance/)、[電影](https://data-flair.training/blogs/data-science-at-movies/)、[醫療保健](https://onlinedegrees.sandiego.edu/data-science-health-care/) 等。 ## 作業 @@ -152,4 +153,4 @@ CO_OP_TRANSLATOR_METADATA: --- **免責聲明**: -本文件使用 AI 翻譯服務 [Co-op Translator](https://github.com/Azure/co-op-translator) 進行翻譯。儘管我們努力確保翻譯的準確性,但請注意,自動翻譯可能包含錯誤或不準確之處。原始文件的母語版本應被視為權威來源。對於關鍵信息,建議使用專業人工翻譯。我們對因使用此翻譯而引起的任何誤解或誤釋不承擔責任。 \ No newline at end of file +本文件已使用 AI 翻譯服務 [Co-op Translator](https://github.com/Azure/co-op-translator) 進行翻譯。儘管我們努力確保翻譯的準確性,但請注意,自動翻譯可能包含錯誤或不準確之處。原始文件的母語版本應被視為權威來源。對於關鍵資訊,建議使用專業人工翻譯。我們對因使用此翻譯而引起的任何誤解或錯誤解釋不承擔責任。 \ No newline at end of file diff --git a/translations/mr/6-Data-Science-In-Wild/20-Real-World-Examples/README.md b/translations/mr/6-Data-Science-In-Wild/20-Real-World-Examples/README.md index bb6c12bf..d132c0c4 100644 --- a/translations/mr/6-Data-Science-In-Wild/20-Real-World-Examples/README.md +++ b/translations/mr/6-Data-Science-In-Wild/20-Real-World-Examples/README.md @@ -1,8 +1,8 @@ -# အမှန်တကယ်ကမ္ဘာတွင် ဒေတာသိပ္ပံ +# အမှန်တကယ်ကမ္ဘာကြီးထဲက ဒေတာသိပ္ပံ | ![ Sketchnote by [(@sketchthedocs)](https://sketchthedocs.dev) ](../../sketchnotes/20-DataScience-RealWorld.png) | | :--------------------------------------------------------------------------------------------------------------: | -| အမှန်တကယ်ကမ္ဘာတွင် ဒေတာသိပ္ပံ - _Sketchnote by [@nitya](https://twitter.com/nitya)_ | +| အမှန်တကယ်ကမ္ဘာကြီးထဲက ဒေတာသိပ္ပံ - _Sketchnote by [@nitya](https://twitter.com/nitya)_ | -ကျွန်ုပ်တို့၏သင်ယူခရီးစဉ်၏အဆုံးသို့ရောက်လာပြီ! +ကျွန်တော်တို့ သင်ယူမှုခရီးလမ်းရဲ့ နောက်ဆုံးအပိုင်းကို ရောက်လာပြီ! -ကျွန်ုပ်တို့သည် ဒေတာသိပ္ပံနှင့် အကျင့်သိက္ခာ၏ အဓိပ္ပါယ်များနှင့် စတင်ခဲ့ပြီး၊ ဒေတာခွဲခြမ်းစိတ်ဖြာခြင်းနှင့် အမြင်အာရုံဖော်ပြခြင်းအတွက် အမျိုးမျိုးသောကိရိယာများနှင့်နည်းလမ်းများကိုလေ့လာခဲ့ပြီး၊ ဒေတာသိပ္ပံ၏ အသက်တာစဉ်ကို ပြန်လည်သုံးသပ်ခဲ့ပြီး၊ cloud computing services များဖြင့် ဒေတာသိပ္ပံ workflow များကို အတိုင်းအတာချဲ့ထွင်ခြင်းနှင့် အလိုအလျောက်လုပ်ဆောင်ခြင်းကိုလေ့လာခဲ့သည်။ ထို့ကြောင့် သင်မေးမိနိုင်သည် - _"ဒီသင်ယူမှုအားလုံးကို အမှန်တကယ်ကမ္ဘာ့အခြေအနေများနှင့် ဘယ်လိုချိတ်ဆက်ရမလဲ?"_ +ကျွန်တော်တို့ ဒေတာသိပ္ပံနဲ့ ကျင့်ဝတ်များအကြောင်း အဓိပ္ပါယ်ဖွင့်ဆိုမှုများနဲ့ စတင်ခဲ့ပြီး ဒေတာခွဲခြမ်းစိတ်ဖြာခြင်းနဲ့ အမြင်အာရုံဖော်ပြခြင်းအတွက် အမျိုးမျိုးသော ကိရိယာများနဲ့ နည်းလမ်းများကို လေ့လာခဲ့ပါတယ်။ ဒေတာသိပ္ပံ၏ အသက်တာလှိုင်းကို ပြန်လည်သုံးသပ်ပြီး cloud computing services ကို အသုံးပြု၍ ဒေတာသိပ္ပံ workflow များကို အတိုင်းအတာချဲ့ထွင်ခြင်းနှင့် အလိုအလျောက်လုပ်ဆောင်ခြင်းကို လေ့လာခဲ့ပါတယ်။ ဒါကြောင့် သင်မေးနိုင်ပါတယ် - _"ဒီသင်ယူမှုအားလုံးကို အမှန်တကယ်ကမ္ဘာကြီးထဲမှာ ဘယ်လိုသုံးနိုင်မလဲ?"_ -ဒီသင်ခန်းစာမှာ၊ ကျွန်ုပ်တို့သည် စက်မှုလုပ်ငန်းများတွင် ဒေတာသိပ္ပံ၏ အမှန်တကယ်အသုံးချမှုများကိုလေ့လာပြီး၊ သုတေသန၊ ဒစ်ဂျစ်တယ် လူ့ကျမ်းစာများနှင့် တာရှည်ခံမှုဆိုင်ရာ အခြေအနေများတွင် အထူးနမူနာများကို ဆွေးနွေးပါမည်။ ကျောင်းသား project အခွင့်အလမ်းများကိုလေ့လာပြီး၊ သင်၏သင်ယူခရီးစဉ်ကို ဆက်လက်တိုးတက်စေရန် အသုံးဝင်သော အရင်းအမြစ်များနှင့်အတူ အဆုံးသတ်ပါမည်။ +ဒီသင်ခန်းစာမှာ ကျွန်တော်တို့ စက်မှုလုပ်ငန်းများအတွင်း ဒေတာသိပ္ပံ၏ အမှန်တကယ်အသုံးချမှုများကို လေ့လာပြီး သုတေသန၊ ဒစ်ဂျစ်တယ် လူ့ကျမ်းစာများ၊ နှင့် တည်တံ့မှုဆိုင်ရာ အထူးနမူနာများကို ဆွေးနွေးပါမယ်။ ကျောင်းသား project အခွင့်အလမ်းများကို လေ့လာပြီး သင့်ရဲ့ သင်ယူမှုခရီးလမ်းကို ဆက်လက်တိုးတက်စေဖို့ အသုံးဝင်သော အရင်းအမြစ်များနဲ့ အဆုံးသတ်ပါမယ်။ ## သင်ခန်းစာမတိုင်မီမေးခွန်း @@ -25,25 +25,25 @@ CO_OP_TRANSLATOR_METADATA: ## ဒေတာသိပ္ပံ + စက်မှုလုပ်ငန်း -AI ကို လူတိုင်းအသုံးပြုနိုင်စေရန် အခွင့်အရေးများပေးထားသောကြောင့်၊ developer များသည် ယခုအခါ AI အခြေပြုဆုံးဖြတ်မှုများနှင့် ဒေတာအခြေပြု အမြင်အာရုံများကို user experience များနှင့် development workflow များတွင် ပိုမိုလွယ်ကူစွာ ဒီဇိုင်းဆွဲခြင်းနှင့် ပေါင်းစပ်နိုင်ကြသည်။ ဒေတာသိပ္ပံကို စက်မှုလုပ်ငန်းများတွင် "အသုံးချ" နေသည့် နမူနာအချို့ကို အောက်တွင်ဖော်ပြထားသည် - +AI ကို လူတိုင်းအသုံးပြုနိုင်အောင် လွယ်ကူလာတာကြောင့် developer များအတွက် AI အခြေပြု ဆုံးဖြတ်ချက်များနှင့် ဒေတာအခြေပြု အမြင်များကို user experience နှင့် development workflow များထဲသို့ ပေါင်းစပ်ထည့်သွင်းဖန်တီးရန် ပိုမိုလွယ်ကူလာပါတယ်။ ဒေတာသိပ္ပံကို စက်မှုလုပ်ငန်းအတွင်း "အသုံးချ" နေတဲ့ နမူနာအချို့ကို အောက်မှာ ဖော်ပြထားပါတယ်- - * [Google Flu Trends](https://www.wired.com/2015/10/can-learn-epic-failure-google-flu-trends/) သည် search term များကို flu trends နှင့် ဆက်စပ်ရန် ဒေတာသိပ္ပံကို အသုံးပြုခဲ့သည်။ နည်းလမ်းတွင် အားနည်းချက်များရှိသော်လည်း၊ ဒေတာအခြေပြု ကျန်းမာရေးခန့်မှန်းမှုများ၏ အခွင့်အလမ်းများ (နှင့် စိန်ခေါ်မှုများ) အပေါ် သတိပေးခဲ့သည်။ + * [Google Flu Trends](https://www.wired.com/2015/10/can-learn-epic-failure-google-flu-trends/) က search term များကို flu trends နဲ့ ဆက်စပ်ဖို့ ဒေတာသိပ္ပံကို အသုံးပြုခဲ့ပါတယ်။ နည်းလမ်းမှာ အားနည်းချက်များရှိခဲ့ပေမယ့် ဒေတာအခြေပြု ကျန်းမာရေးခန့်မှန်းမှုများ၏ အခွင့်အလမ်းများ (နှင့် စိန်ခေါ်မှုများ) အပေါ် သတိပေးမှုကို တိုးမြှင့်ပေးခဲ့ပါတယ်။ - * [UPS Routing Predictions](https://www.technologyreview.com/2018/11/21/139000/how-ups-uses-ai-to-outsmart-bad-weather/) - UPS သည် ဒေတာသိပ္ပံနှင့် machine learning ကို အသုံးပြု၍ ရာသီဥတုအခြေအနေများ၊ လမ်းပိတ်ဆို့မှုများ၊ ပို့ဆောင်ရမည့်အချိန်များနှင့် အခြားအချက်အလက်များကို ထည့်သွင်းပြီး ပို့ဆောင်မှုအတွက် အကောင်းဆုံးလမ်းကြောင်းများကို ခန့်မှန်းသည်။ + * [UPS Routing Predictions](https://www.technologyreview.com/2018/11/21/139000/how-ups-uses-ai-to-outsmart-bad-weather/) - UPS က ဒေတာသိပ္ပံနှင့် machine learning ကို အသုံးပြု၍ ရေရှည်ပို့ဆောင်မှုအတွက် ရွေးချယ်မှုအကောင်းဆုံးလမ်းကြောင်းများကို ခန့်မှန်းခဲ့ပါတယ်။ ဒါတွင် ရာသီဥတုအခြေအနေများ၊ လမ်းပိတ်ဆို့မှု pattern များ၊ ပို့ဆောင်မှုအချိန်ကန့်သတ်ချက်များ စသည်တို့ကို ထည့်သွင်းစဉ်းစားခဲ့ပါတယ်။ - * [NYC Taxicab Route Visualization](http://chriswhong.github.io/nyctaxi/) - [Freedom Of Information Laws](https://chriswhong.com/open-data/foil_nyc_taxi/) ကို အသုံးပြု၍ ရရှိသော ဒေတာများကို အသုံးပြု၍ NYC taxi များ၏ နေ့စဉ်လှုပ်ရှားမှုများကို visualization ပြုလုပ်ခဲ့သည်။ ဒါဟာ မြို့ကြီးမှာ ဘယ်လို navigation လုပ်သလဲ၊ ဘယ်လောက်ငွေရှာသလဲ၊ ၂၄ နာရီအတွင်း ခရီးစဉ်များ၏ အချိန်ကာလကို နားလည်စေခဲ့သည်။ + * [NYC Taxicab Route Visualization](http://chriswhong.github.io/nyctaxi/) - [Freedom Of Information Laws](https://chriswhong.com/open-data/foil_nyc_taxi/) ကို အသုံးပြု၍ ရရှိသော ဒေတာများက NYC taxi များ၏ နေ့စဉ်လှုပ်ရှားမှုကို visualization ပြုလုပ်ပေးခဲ့ပြီး မြို့ကြီးအတွင်းမှာ ဘယ်လို navigation လုပ်သလဲ၊ ဘယ်လောက်ငွေရှာရသလဲ၊ နှင့် ၂၄ နာရီအတွင်း ခရီးစဉ်များ၏ အချိန်ကာလကို နားလည်စေခဲ့ပါတယ်။ - * [Uber Data Science Workbench](https://eng.uber.com/dsw/) - Uber ခရီးစဉ်များ၏ pickup & dropoff location များ၊ ခရီးစဉ်အချိန်ကာလ၊ နှစ်သက်သောလမ်းကြောင်းများစသည့် ဒေတာများကို *နေ့စဉ်* စုဆောင်းပြီး၊ ဈေးနှုန်းချမှတ်ခြင်း၊ လုံခြုံရေး၊ လိမ်လည်မှုရှာဖွေခြင်းနှင့် navigation ဆုံးဖြတ်ချက်များအတွက် data analytics tool တစ်ခုကို တည်ဆောက်သည်။ + * [Uber Data Science Workbench](https://eng.uber.com/dsw/) - Uber က နေ့စဉ် သန်းပေါင်းများစွာသော ခရီးစဉ်များမှ ရရှိသော pickup & dropoff location, ခရီးစဉ်အချိန်ကာလ၊ နှစ်သက်သောလမ်းကြောင်းများ စသည်တို့ကို အသုံးပြု၍ ဒေတာအာနိသင် tool တစ်ခုကို ဖန်တီးခဲ့ပြီး ဈေးနှုန်းချမှတ်ခြင်း၊ လုံခြုံရေး၊ လိမ်လည်မှုရှာဖွေခြင်း၊ နှင့် navigation ဆုံးဖြတ်ချက်များအတွက် အထောက်အကူပြုခဲ့ပါတယ်။ - * [Sports Analytics](https://towardsdatascience.com/scope-of-analytics-in-sports-world-37ed09c39860) - _predictive analytics_ (အသင်းနှင့် ကစားသမားခန့်မှန်းခြင်း - [Moneyball](https://datasciencedegree.wisconsin.edu/blog/moneyball-proves-importance-big-data-big-ideas/) ကိုစဉ်းစားပါ - နှင့် ပရိသတ်စီမံခန့်ခွဲမှု) နှင့် _data visualization_ (အသင်းနှင့် ပရိသတ် dashboard များ၊ ကစားပွဲများစသည်) ကို အဓိကထားပြီး၊ တက်လှမ်းမှုရှာဖွေခြင်း၊ အားကစားလောင်းကစားနှင့် inventory/venue စီမံခန့်ခွဲမှုတို့တွင် အသုံးချသည်။ + * [Sports Analytics](https://towardsdatascience.com/scope-of-analytics-in-sports-world-37ed09c39860) - _predictive analytics_ (အသင်းနှင့် ကစားသမားခန့်မှန်းခြင်း - [Moneyball](https://datasciencedegree.wisconsin.edu/blog/moneyball-proves-importance-big-data-big-ideas/) ကို စဉ်းစားပါ - နှင့် ပရိသတ်စီမံခန့်ခွဲမှု) နှင့် _data visualization_ (အသင်းနှင့် ပရိသတ် dashboard များ၊ ကစားပွဲများ စသည်တို့) ကို အဓိကထားပြီး talent scouting, sports gambling, inventory/venue management စသည်တို့တွင် အသုံးချနိုင်ပါတယ်။ - * [Data Science in Banking](https://data-flair.training/blogs/data-science-in-banking/) - ဘဏ္ဍာရေးလုပ်ငန်းတွင် ဒေတာသိပ္ပံ၏ တန်ဖိုးကို အဓိကထားပြီး၊ အန္တရာယ်မော်ဒယ်ဖော်ခြင်းနှင့် လိမ်လည်မှုရှာဖွေခြင်း၊ customer segmentation၊ အချိန်နှင့်တပြေးညီ ခန့်မှန်းခြင်းနှင့် recommender systems များအထိ အသုံးချသည်။ Predictive analytics သည် [credit scores](https://dzone.com/articles/using-big-data-and-predictive-analytics-for-credit) ကဲ့သို့သော အရေးကြီးသောအတိုင်းအတာများကိုလည်း အားပေးသည်။ + * [Data Science in Banking](https://data-flair.training/blogs/data-science-in-banking/) - ဘဏ္ဍာရေးလုပ်ငန်းတွင် ဒေတာသိပ္ပံ၏ တန်ဖိုးကို ဖော်ပြပြီး risk modeling, fraud detection, customer segmentation, real-time prediction, recommender systems စသည်တို့မှ applications များကို ဖော်ပြထားပါတယ်။ Predictive analytics က [credit scores](https://dzone.com/articles/using-big-data-and-predictive-analytics-for-credit) ကဲ့သို့သော အရေးကြီးသော အတိုင်းအတာများကိုလည်း drive လုပ်ပေးပါတယ်။ - * [Data Science in Healthcare](https://data-flair.training/blogs/data-science-in-healthcare/) - medical imaging (ဥပမာ MRI, X-Ray, CT-Scan), genomics (DNA sequencing), ဆေးဝါးဖွံ့ဖြိုးမှု (အန္တရာယ်ခန့်မှန်းခြင်း၊ အောင်မြင်မှုခန့်မှန်းခြင်း), predictive analytics (လူနာစောင့်ရှောက်မှုနှင့် ပစ္စည်းထောက်ပံ့မှု logistics), ရောဂါခြေရာခံခြင်းနှင့် ကာကွယ်ခြင်းစသည်တို့ကဲ့သို့သော လျှောက်လွှာများကို အဓိကထားသည်။ + * [Data Science in Healthcare](https://data-flair.training/blogs/data-science-in-healthcare/) - medical imaging (ဥပမာ MRI, X-Ray, CT-Scan), genomics (DNA sequencing), drug development (risk assessment, success prediction), predictive analytics (patient care & supply logistics), disease tracking & prevention စသည်တို့ကဲ့သို့သော applications များကို ဖော်ပြထားပါတယ်။ -![Data Science Applications in The Real World](../../../../6-Data-Science-In-Wild/20-Real-World-Examples/images/data-science-applications.png) Image Credit: [Data Flair: 6 Amazing Data Science Applications ](https://data-flair.training/blogs/data-science-applications/) +![Data Science Applications in The Real World](../../../../translated_images/data-science-applications.4e5019cd8790ebac2277ff5f08af386f8727cac5d30f77727c7090677e6adb9c.my.png) Image Credit: [Data Flair: 6 Amazing Data Science Applications ](https://data-flair.training/blogs/data-science-applications/) -ဤပုံသည် ဒေတာသိပ္ပံနည်းလမ်းများကို အသုံးချနိုင်သော အခြားနယ်ပယ်များနှင့် နမူနာများကို ဖော်ပြထားသည်။ အခြားလျှောက်လွှာများကို လေ့လာလိုပါသလား? [Review & Self Study](../../../../6-Data-Science-In-Wild/20-Real-World-Examples) အပိုင်းကို ကြည့်ပါ။ +ဤပုံသည် ဒေတာသိပ္ပံနည်းလမ်းများကို အသုံးချနိုင်သော အခြား domains နှင့် နမူနာများကို ဖော်ပြထားသည်။ အခြား applications များကို လေ့လာလိုပါသလား? [Review & Self Study](../../../../6-Data-Science-In-Wild/20-Real-World-Examples) အပိုင်းကို ကြည့်ပါ။ ## ဒေတာသိပ္ပံ + သုတေသန @@ -51,28 +51,28 @@ AI ကို လူတိုင်းအသုံးပြုနိုင်စ | :---------------------------------------------------------------------------------------------------------------: | | ဒေတာသိပ္ပံနှင့် သုတေသန - _Sketchnote by [@nitya](https://twitter.com/nitya)_ | -အမှန်တကယ်ကမ္ဘာ့လျှောက်လွှာများသည် အများအားဖြင့် စက်မှုလုပ်ငန်းများတွင် အတိုင်းအတာချဲ့ထွင်မှုကို အဓိကထားသော်လည်း၊ _သုတေသန_ လျှောက်လွှာများနှင့် project များသည် အောက်ပါနှစ်မျိုးသော ရှုထောင့်များမှ အသုံးဝင်နိုင်သည် - +အမှန်တကယ်အသုံးချမှုများသည် အများအားဖြင့် စက်မှုလုပ်ငန်းအတွင်း အတိုင်းအတာချဲ့ထွင်မှုများကို အဓိကထားသော်လည်း _သုတေသန_ applications နှင့် project များသည် အောက်ပါနှစ်ခုအမြင်မှ အသုံးဝင်နိုင်သည်- -* _ဆန်းသစ်မှုအခွင့်အလမ်းများ_ - အဆင့်မြင့်အယူအဆများကို prototype လုပ်ခြင်းနှင့် နောက်မျိုးဆက်လျှောက်လွှာများအတွက် user experience များကို စမ်းသပ်ခြင်း။ -* _တပ်ဆင်မှုစိန်ခေါ်မှုများ_ - အမှန်တကယ်ကမ္ဘာ့အခြေအနေများတွင် ဒေတာသိပ္ပံနည်းပညာများ၏ အန္တရာယ်များ သို့မဟုတ် မျှော်လင့်မထားသော အကျိုးဆက်များကို စုံစမ်းခြင်း။ +* _innovation opportunities_ - အဆင့်မြင့် concepts များကို prototype လုပ်ခြင်းနှင့် နောက်မျိုးဆက် applications များအတွက် user experience များကို စမ်းသပ်ခြင်း။ +* _deployment challenges_ - အမှန်တကယ်ကမ္ဘာကြီးထဲတွင် ဒေတာသိပ္ပံနည်းပညာများ၏ အန္တရာယ်များ သို့မဟုတ် မျှော်လင့်မထားသော အကျိုးဆက်များကို စုံစမ်းလေ့လာခြင်း။ -ကျောင်းသားများအတွက်၊ ဤသုတေသန project များသည် သင်ယူမှုနှင့် ပူးပေါင်းဆောင်ရွက်မှုအခွင့်အလမ်းများကို ပေးနိုင်ပြီး၊ သင်၏အကြောင်းအရာကို နားလည်မှုတိုးတက်စေခြင်းနှင့် သက်ဆိုင်ရာလူများ သို့မဟုတ် အဖွဲ့များနှင့် ပိုမိုကျယ်ပြန့်သော ဆက်ဆံရေးနှင့် ပါဝင်မှုကို တိုးတက်စေပါသည်။ ထို့ကြောင့် သုတေသန project များသည် ဘယ်လိုပုံစံရှိပြီး၊ ဘယ်လိုအကျိုးသက်ရောက်မှုရှိနိုင်သလဲ? +ကျောင်းသားများအတွက် သုတေသန project များသည် သင်ယူမှုနှင့် ပူးပေါင်းဆောင်ရွက်မှုအခွင့်အလမ်းများကို ပေးစွမ်းနိုင်ပြီး သင့်ရဲ့ ချက်ချင်းနားလည်မှုကို တိုးတက်စေပြီး သက်ဆိုင်ရာလူများ သို့မဟုတ် အဖွဲ့များနှင့် ပိုမိုနီးကပ်စေပါမယ်။ ဒါဆို သုတေသန project များက ဘယ်လိုပုံစံရှိပြီး ဘယ်လို အကျိုးသက်ရောက်မှုရှိနိုင်မလဲ? -နမူနာတစ်ခုကို ကြည့်ပါ - Joy Buolamwini (MIT Media Labs) မှ [MIT Gender Shades Study](http://gendershades.org/overview.html) နှင့် Timnit Gebru (Microsoft Research) တို့၏ [signature research paper](http://proceedings.mlr.press/v81/buolamwini18a/buolamwini18a.pdf) ကို အဓိကထားပါမည်။ +နမူနာတစ်ခုကို ကြည့်ကြမယ် - Joy Buolamwini (MIT Media Labs) ရဲ့ [MIT Gender Shades Study](http://gendershades.org/overview.html) နှင့် Timnit Gebru (Microsoft Research) တို့ကရေးသားခဲ့သော [signature research paper](http://proceedings.mlr.press/v81/buolamwini18a/buolamwini18a.pdf) ကို အခြေခံထားသည်။ - * **ဘာလဲ:** သုတေသန project ၏ ရည်ရွယ်ချက်မှာ _gender နှင့် skin type အပေါ် automated facial analysis algorithm များနှင့် dataset များတွင် bias ရှိမှုကို အကဲဖြတ်ရန်_ ဖြစ်သည်။ - * **ဘာကြောင့်:** Facial analysis ကို ရဲတပ်ဖွဲ့၊ လေဆိပ်လုံခြုံရေး၊ အလုပ်ခန့်ထားမှုစနစ်များနှင့် အခြားသောနေရာများတွင် အသုံးပြုသည် - အမှန်မမှန်သော ခွဲခြားမှုများ (ဥပမာ bias ကြောင့်) သည် ထိခိုက်သောလူများ သို့မဟုတ် အုပ်စုများအတွက် စီးပွားရေးနှင့် လူမှုရေးအန္တရာယ်များ ဖြစ်စေနိုင်သည်။ Bias များကို နားလည်ခြင်း (နှင့် ဖယ်ရှားခြင်း သို့မဟုတ် လျှော့ချခြင်း) သည် အသုံးပြုမှုတွင် တရားမျှတမှုအတွက် အရေးကြီးသည်။ - * **ဘယ်လို:** သုတေသနသူများသည် ရှိပြီးသား benchmark များသည် အများအားဖြင့် အရောင်နုသောအကြောင်းအရာများကို အသုံးပြုထားသည်ကို သတိပြုခဲ့ပြီး၊ gender နှင့် skin type အပေါ်ပိုမိုချိန်ညှိထားသော dataset (1000+ ပုံများ) ကို curate လုပ်ခဲ့သည်။ dataset ကို Microsoft, IBM နှင့် Face++ တို့၏ gender classification product သုံးခု၏ တိကျမှုကို အကဲဖြတ်ရန် အသုံးပြုခဲ့သည်။ + * **ဘာလဲ:** သုတေသန project ရဲ့ ရည်ရွယ်ချက်မှာ _gender နှင့် skin type အပေါ် automated facial analysis algorithm များနှင့် dataset များတွင် bias ရှိမှုကို အကဲဖြတ်ရန်_ ဖြစ်သည်။ + * **ဘာကြောင့်:** Facial analysis ကို ရဲတပ်ဖွဲ့၊ လေဆိပ်လုံခြုံရေး၊ အလုပ်ခန့်ထားမှုစနစ်များ စသည်တို့တွင် အသုံးပြုသည် - အမှားအယွင်းများ (ဥပမာ bias ကြောင့်) သည် သက်ဆိုင်သော လူများ သို့မဟုတ် အုပ်စုများအပေါ် စီးပွားရေးနှင့် လူမှုရေးအကျိုးသက်ရောက်မှုများ ဖြစ်စေနိုင်သည်။ Bias များကို နားလည်ခြင်း (နှင့် ဖယ်ရှားခြင်း သို့မဟုတ် လျှော့ချခြင်း) သည် အသုံးပြုမှုတွင် တရားမျှတမှုအတွက် အရေးကြီးသည်။ + * **ဘယ်လို:** သုတေသနသူများသည် ရှိပြီးသား benchmark များသည် အဓိကအားဖြင့် အရောင်နုသော subject များကို အသုံးပြုသည်ကို သတိပြုခဲ့ပြီး gender နှင့် skin type အပေါ် _ပိုမိုထိန်းညှိထားသော_ dataset (1000+ images) ကို curate လုပ်ခဲ့သည်။ dataset ကို Microsoft, IBM, Face++ တို့၏ gender classification product သုံးခု၏ တိကျမှုကို အကဲဖြတ်ရန် အသုံးပြုခဲ့သည်။ -ရလဒ်များအရ classification accuracy သည် အထူးသဖြင့်ကောင်းမွန်သော်လည်း၊ အုပ်စုခွဲခြားမှုများအကြား error rate တွင် ထင်ရှားသောကွာခြားမှုရှိသည်ကို ပြသခဲ့သည် - **misgendering** သည် အမျိုးသမီးများ သို့မဟုတ် အရောင်မည်းသော skin type များတွင် ပိုမိုမြင့်မားသည်ကို ပြသခဲ့ပြီး၊ bias ရှိမှုကို ဖော်ပြခဲ့သည်။ +ရလဒ်များအရ classification accuracy သည် စုစုပေါင်းအားဖြင့် ကောင်းမွန်သော်လည်း အုပ်စုခွဲခြားမှုများအကြား error rate တွင် အထင်အရှားကွာခြားမှုရှိသည်ကို ပြသခဲ့သည် - **misgendering** သည် အမျိုးသမီးများ သို့မဟုတ် အရောင်နက်သော skin type များတွင် ပိုမိုမြင့်မားသည်ကို ပြသခဲ့ပြီး bias ရှိမှုကို ဖော်ပြခဲ့သည်။ -**အဓိကရလဒ်များ:** ဒေတာသိပ္ပံသည် ပိုမို _ကိုယ်စားပြုသော dataset များ_ (subgroup များကို balance လုပ်ထားသော) နှင့် ပိုမို _ပါဝင်မှုရှိသောအဖွဲ့များ_ (background များကွဲပြားသော) ကိုလိုအပ်သည်ကို သတိပေးခဲ့ပြီး၊ AI solution များတွင် bias များကို စောစောဖယ်ရှားခြင်း သို့မဟုတ် လျှော့ချခြင်းအတွက် အရေးကြီးသည်ကို ပြသခဲ့သည်။ ဤသုတေသနများသည် _responsible AI_ ကို အဖွဲ့အစည်းများတွင် သတ်မှတ်ရန်နှင့် AI product များနှင့် process များတွင် တရားမျှတမှုကို တိုးတက်စေရန် အရေးကြီးသည်။ +**အဓိကရလဒ်များ:** ဒေတာသိပ္ပံသည် _အထောက်အထားပြည့်စုံသော dataset များ_ (subgroup များကို ထိန်းညှိထားသော) နှင့် _ပါဝင်မှုများစွာသော အဖွဲ့များ_ (နောက်ခံအမျိုးမျိုး) ကို ပိုမိုလိုအပ်သည်ကို သတိပေးခဲ့ပြီး AI solution များတွင် bias များကို စောစောဖယ်ရှားရန် သို့မဟုတ် လျှော့ချရန် အရေးကြီးသည်ကို ပြသခဲ့သည်။ ဒီလိုသုတေသနများသည် _တရားမျှတသော AI_ ကို တိုးတက်စေပြီး AI product နှင့် process များတွင် တရားမျှတမှုကို တိုးတက်စေဖို့ အဖွဲ့အစည်းများအတွက် principle နှင့် practice များကို သတ်မှတ်ရန် အရေးကြီးသည်။ -**Microsoft တွင် သက်ဆိုင်သော သုတေသနများကို လေ့လာလိုပါသလား?** +**Microsoft ရဲ့ သက်ဆိုင်သော သုတေသနများကို လေ့လာလိုပါသလား?** -* Artificial Intelligence အပေါ် [Microsoft Research Projects](https://www.microsoft.com/research/research-area/artificial-intelligence/?facet%5Btax%5D%5Bmsr-research-area%5D%5B%5D=13556&facet%5Btax%5D%5Bmsr-content-type%5D%5B%5D=msr-project) ကိုကြည့်ပါ။ -* [Microsoft Research Data Science Summer School](https://www.microsoft.com/en-us/research/academic-program/data-science-summer-school/) မှ ကျောင်းသား project များကိုလေ့လာပါ။ -* [Fairlearn](https://fairlearn.org/) project နှင့် [Responsible AI](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1%3aprimaryr6) အစီအစဉ်များကိုကြည့်ပါ။ +* Artificial Intelligence အပေါ် [Microsoft Research Projects](https://www.microsoft.com/research/research-area/artificial-intelligence/?facet%5Btax%5D%5Bmsr-research-area%5D%5B%5D=13556&facet%5Btax%5D%5Bmsr-content-type%5D%5B%5D=msr-project) ကို ကြည့်ပါ။ +* [Microsoft Research Data Science Summer School](https://www.microsoft.com/en-us/research/academic-program/data-science-summer-school/) မှ ကျောင်းသား project များကို လေ့လာပါ။ +* [Fairlearn](https://fairlearn.org/) project နှင့် [Responsible AI](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1%3aprimaryr6) အစီအစဉ်များကို ကြည့်ပါ။ ## ဒေတာသိပ္ပံ + လူ့ကျမ်းစာ @@ -80,33 +80,37 @@ AI ကို လူတိုင်းအသုံးပြုနိုင်စ | :---------------------------------------------------------------------------------------------------------------: | | ဒေတာသိပ္ပံနှင့် ဒစ်ဂျစ်တယ် လူ့ကျမ်းစာ - _Sketchnote by [@nitya](https://twitter.com/nitya)_ | -Digital Humanities [ကိုအဓိပ္ပာယ်ဖော်ပြထားသည်](https://digitalhumanities.stanford.edu/about-dh-stanford) သည် "computational methods များနှင့် humanistic inquiry ကိုပေါင်းစပ်ထားသော လက်တွေ့ကျသောနည်းလမ်းများနှင့် လုပ်ဆောင်မှုများ" ဟုဆိုသည်။ [Stanford projects](https://digitalhumanities.stanford.edu/projects) ကဲ့သို့သော _"rebooting history"_ နှင့် _"poetic thinking"_ သည် [Digital Humanities နှင့် Data Science](https://digitalhumanities.stanford.edu/digital-humanities-and-data-science) တို့အကြားဆက်နွယ်မှုကို ဖော်ပြထားပြီး၊ network analysis, information visualization, spatial analysis နှင့် text analysis ကဲ့သို့သောနည်းလမ်းများကို အဓိကထားသည်။ ဤနည်းလမ်းများသည် သမိုင်းနှင့် စာပေဒေတာ set များကို ပြန်လည်သုံးသပ်ရန်နှင့် အမြင်အသစ်များကို ရယူရန် အထောက်အကူပြုသည်။ +ဒစ်ဂျစ်တယ် လူ့ကျမ်းစာ [ကို အဓိပ္ပါယ်ဖွင့်ဆိုထားသည်](https://digitalhumanities.stanford.edu/about-dh-stanford) - "computational methods နှင့် humanistic inquiry ကို ပေါင်းစပ်ထားသော လုပ်ဆောင်မှုများနှင့် နည်းလမ်းများစုစည်းမှု" ဟု။ [Stanford projects](https://digitalhumanities.stanford.edu/projects) ကဲ့သို့သော _"rebooting history"_ နှင့် _"poetic thinking"_ သည် [Digital Humanities နှင့် Data Science](https://digitalhumanities.stanford.edu/digital-humanities-and-data-science) အကြား ဆက်နွယ်မှုကို ဖော်ပြထားပြီး network analysis, information visualization, spatial နှင့် text analysis ကဲ့သို့သော နည်းလမ်းများကို အဓိကထားသည်။ ဒါက ကျမ်းစာနှင့် စာပေဒေတာများကို ပြန်လည်သုံးသပ်ပြီး အမြင်အသစ်များနှင့် အနက်အဓိပ္ပါယ်များကို ရယူရန် အထောက်အကူပြုသည်။ -*ဤနယ်ပယ်တွင် project တစ်ခုကို လေ့လာလိုပါသလား?* +*ဒီနယ်ပယ်မှာ project တစ်ခုကို လေ့လာပြီး တိုးတက်စေလိုပါသလား?* -["Emily Dickinson and the Meter of Mood"](https://gist.github.com/jlooper/ce4d102efd057137bc000db796bfd671) ကိုကြည့်ပါ - [Jen Looper](https://twitter.com/jenlooper) မှ အလွန်ကောင်းမွန်သော နမူနာတစ်ခုဖြစ်ပြီး၊ ဒေတာသိပ္ပံကို အသုံးပြု၍ ရင်းနှီးပြီးသားကဗျာများကို ပြန်လည်သုံးသပ်ပြီး၊ ၎င်း၏ အဓိပ္ပါယ်နှင့် ကဗျာရေးသူ၏ အထောက်အပံ့ကို အခြေအနေအသစ်များတွင် ပြန်လည်အကဲဖြတ်ရန် မေးခွန်းထုတ်ထားသည်။ ဥပမာအားဖြင့် - _ကဗျာ၏ tone သို့မဟုတ် sentiment ကိုခန့်မှန်းခြ -**Planetary Computer Project သည် (Sep 2021 အခြေအနေဖြင့်) စမ်းသပ်မှုအဆင့်တွင်ရှိနေပါသည်** - ဒေတာသိပ္ပံကို အသုံးပြု၍ တာဆောင်မှုဖြေရှင်းမှုများကို အထောက်အကူပြုရန် စတင်ပါ။ +["Emily Dickinson and the Meter of Mood"](https://gist.github.com/jlooper/ce4d102efd057137bc000db796bfd671) ကို ကြည့်ပါ - [Jen Looper](https://twitter.com/jenlooper) မှ ဖန်တီးထားသော project တစ်ခုဖြစ်ပြီး ဒေတာသိပ္ပံကို အသုံးပြု၍ ကဗျာများကို ပြန်လည်သုံးသပ်ပြီး အရေးအသား၏ အနက်အဓိပ္ပါယ်နှင့် စာရေးသူ၏ အထောက်အပံ့ကို အသစ်သောအမြင်များဖြင့် ပြန်လည်သုံးသပ်ရန် မေးခွန်းထုတ်ထားသည်။ ဥပမာ - _ကဗျာ၏ tone သို့မဟုတ် sentiment ကို ခွဲခြားခြင်းဖြင့် ကဗျာရေးသားခဲ့သော ရာသီဥတုကို ခန့်မှန်းနိုင်မလား_ - ဒါက စာရေးသူ၏ အချိန်ကာလအတွင်း စိတ်နေစိတ်ထားအပေါ် ဘာကို ပြောပြနိုင်မလဲ? -* [Access တောင်းဆိုရန်](https://planetarycomputer.microsoft.com/account/request) စတင်လေ့လာပြီး အခြားသူများနှင့် ချိတ်ဆက်ပါ။ -* [Documentation ကိုလေ့လာရန်](https://planetarycomputer.microsoft.com/docs/overview/about) ပံ့ပိုးထားသော ဒေတာများနှင့် API များကို နားလည်ပါ။ -* [Ecosystem Monitoring](https://analytics-lab.org/ecosystemmonitoring/) ကဲ့သို့သော အက်ပလီကေးရှင်းများကို လေ့လာပြီး အကြံဉာဏ်ရယူပါ။ +ဒီမေးခွန်းကို ဖြေရှင်းဖို့ ဒေတာသိပ္ပံ၏ အသက်တာလှိုင်းကို လိုက်နာရမယ်- -ဒေတာကို အသုံးပြု၍ ရှုထောင့်များကို ဖော်ထုတ်ခြင်း သို့မဟုတ် သက်ဆိုင်ရာ အချက်အလက်များကို ပိုမိုထင်ရှားစေရန် visualization ကို အသုံးပြုနိုင်မည်ကို စဉ်းစားပါ။ ဒါမှမဟုတ် အချက်အလက်များကို အသုံးပြု၍ သက်ဆိုင်ရာ အပြုအမူများကို အားပေးရန် အသစ်သော အသုံးပြုသူ အတွေ့အကြုံများ ဖန်တီးနိုင်မည်ကို စဉ်းစားပါ။ + * [`Data Acquisition`](https://gist.github.com/jlooper/ce4d102efd057137bc000db796bfd671#acquiring-the-dataset) - analysis အတွက် သက်ဆိုင်သော dataset ကို စုဆောင်းရန်။ API (ဥပမာ [Poetry DB API](https://poetrydb.org/index.html)) သို့မဟုတ် web page များကို scraping +**Planetary Computer Project သည် (စက်တင်ဘာ 2021 အခြေအနေဖြင့်) စမ်းသပ်မှုအဆင့်တွင်ရှိနေပါသည်** - ဒေတာသိပ္ပံကို အသုံးပြု၍ တာရှည်ခံဖြေရှင်းနည်းများကို အထောက်အကူပြုရန် စတင်ပါ။ + +* [Request access](https://planetarycomputer.microsoft.com/account/request) ကို အသုံးပြု၍ စတင်လေ့လာပြီး မိတ်ဆွေများနှင့် ချိတ်ဆက်ပါ။ +* [Explore documentation](https://planetarycomputer.microsoft.com/docs/overview/about) ကို လေ့လာပြီး ပံ့ပိုးထားသော ဒေတာများနှင့် API များကို နားလည်ပါ။ +* [Ecosystem Monitoring](https://analytics-lab.org/ecosystemmonitoring/) ကဲ့သို့သော အက်ပလီကေးရှင်းများကို လေ့လာပြီး အက်ပလီကေးရှင်းအကြံဉာဏ်များအတွက် အားရစရာ ရှာဖွေပါ။ + +ဒေတာကို အသုံးပြု၍ ရှာဖွေတွေ့ရှိမှုများကို ရှင်းလင်းစွာ ဖော်ပြရန် သို့မဟုတ် ရှာဖွေတွေ့ရှိမှုများကို တိုးမြှင့်ရန် အကောင်းဆုံးနည်းလမ်းများကို စဉ်းစားပါ။ ဥပမာအားဖြင့် ရာသီဥတုပြောင်းလဲမှုနှင့် သစ်တောများဖျက်ဆီးမှုကဲ့သို့သော နယ်ပယ်များတွင် အသုံးပြုနိုင်သော ရှာဖွေတွေ့ရှိမှုများကို စဉ်းစားပါ။ ဒါမှမဟုတ် တာရှည်ခံနေထိုင်မှုအတွက် အပြုသဘောဆောင်သော အပြုအမူပြောင်းလဲမှုများကို လှုံ့ဆော်နိုင်သော အသုံးပြုသူအတွေ့အကြုံအသစ်များ ဖန်တီးရန် ရှာဖွေတွေ့ရှိမှုများကို အသုံးပြုနိုင်သည့် နည်းလမ်းများကို စဉ်းစားပါ။ ## ဒေတာသိပ္ပံ + ကျောင်းသားများ -စက်မှုလုပ်ငန်းနှင့် သုတေသနတွင် အမှန်တကယ် အသုံးချမှုများကို ပြောခဲ့ပြီး၊ ဒစ်ဂျစ်တယ် လူ့ဘာသာရပ်များနှင့် တာဆောင်မှုဆိုင်ရာ ဒေတာသိပ္ပံ အက်ပလီကေးရှင်း ဥပမာများကို လေ့လာခဲ့ပါသည်။ ဒါဆိုရင် ဒေတာသိပ္ပံ စတင်လေ့လာသူများအနေဖြင့် သင်၏ ကျွမ်းကျင်မှုများကို တိုးတက်စေပြီး အတတ်ပညာများကို မျှဝေမည်ကဲ့သို့လုပ်နိုင်မလဲ? +စက်မှုလုပ်ငန်းနှင့် သုတေသနတွင် အမှန်တကယ်အသုံးချနိုင်သော အက်ပလီကေးရှင်းများကို ပြောခဲ့ပြီး၊ ဒစ်ဂျစ်တယ် လူ့ဘာသာရပ်များနှင့် တာရှည်ခံမှုတွင် ဒေတာသိပ္ပံအက်ပလီကေးရှင်း ဥပမာများကို လေ့လာခဲ့ပါသည်။ ဒါဆိုရင် ဒေတာသိပ္ပံအစတန်းကျောင်းသားများအနေဖြင့် သင်၏ ကျွမ်းကျင်မှုများကို တိုးတက်စေရန်နှင့် သင်၏ အတတ်ပညာများကို မျှဝေရန် ဘယ်လိုလုပ်နိုင်မလဲ? -ဒီမှာ ကျောင်းသားများအတွက် ဒေတာသိပ္ပံ ပရောဂျက်များ၏ ဥပမာများကို ဖော်ပြထားသည်။ +ဒီမှာ ကျောင်းသားများအတွက် ဒေတာသိပ္ပံပရောဂျက်များ၏ ဥပမာများကို ဖော်ပြထားပြီး သင့်အား အားရစရာပေးနိုင်ပါသည်။ -* [MSR Data Science Summer School](https://www.microsoft.com/en-us/research/academic-program/data-science-summer-school/#!projects) GitHub [projects](https://github.com/msr-ds3) တွင် အောက်ပါအကြောင်းအရာများကို လေ့လာပါ။ +* [MSR Data Science Summer School](https://www.microsoft.com/en-us/research/academic-program/data-science-summer-school/#!projects) နှင့် GitHub [projects](https://github.com/msr-ds3) တွင် အောက်ပါအကြောင်းအရာများကို လေ့လာပါ။ - [Racial Bias in Police Use of Force](https://www.microsoft.com/en-us/research/video/data-science-summer-school-2019-replicating-an-empirical-analysis-of-racial-differences-in-police-use-of-force/) | [Github](https://github.com/msr-ds3/stop-question-frisk) - [Reliability of NYC Subway System](https://www.microsoft.com/en-us/research/video/data-science-summer-school-2018-exploring-the-reliability-of-the-nyc-subway-system/) | [Github](https://github.com/msr-ds3/nyctransit) -* [Digitizing Material Culture: Exploring socio-economic distributions in Sirkap](https://claremont.maps.arcgis.com/apps/Cascade/index.html?appid=bdf2aef0f45a4674ba41cd373fa23afc) - [Ornella Altunyan](https://twitter.com/ornelladotcom) နှင့် Claremont မှ အဖွဲ့က [ArcGIS StoryMaps](https://storymaps.arcgis.com/) ကို အသုံးပြု၍ ဖန်တီးထားသည်။ +* [Digitizing Material Culture: Exploring socio-economic distributions in Sirkap](https://claremont.maps.arcgis.com/apps/Cascade/index.html?appid=bdf2aef0f45a4674ba41cd373fa23afc) - [Ornella Altunyan](https://twitter.com/ornelladotcom) နှင့် Claremont မှ အဖွဲ့၏ [ArcGIS StoryMaps](https://storymaps.arcgis.com/) ကို အသုံးပြု၍ ဖန်တီးထားသည်။ ## 🚀 စိန်ခေါ်မှု -ဒေတာသိပ္ပံ စတင်လေ့လာသူများအတွက် သင့်လျော်သော ပရောဂျက်များကို အကြံပြုထားသော ဆောင်းပါးများကို ရှာဖွေပါ - [ဒီ 50 အကြောင်းအရာများ](https://www.upgrad.com/blog/data-science-project-ideas-topics-beginners/) သို့မဟုတ် [ဒီ 21 ပရောဂျက် အကြံဉာဏ်များ](https://www.intellspot.com/data-science-project-ideas) သို့မဟုတ် [ဒီ 16 ပရောဂျက်များနှင့် အရင်းအမြစ်ကုဒ်](https://data-flair.training/blogs/data-science-project-ideas/) ကို ဖွင့်လှစ်ပြီး ပြန်လည်ဖန်တီးပါ။ သင်၏ လေ့လာမှု ခရီးစဉ်များကို ဘလော့ဂ်ရေးပြီး အတွေ့အကြုံများကို မျှဝေဖို့ မမေ့ပါနှင့်။ +ဒေတာသိပ္ပံအစတန်းကျောင်းသားများအတွက် အဆင်ပြေသော ပရောဂျက်များကို အကြံပြုထားသော ဆောင်းပါးများကို ရှာဖွေပါ - ဥပမာအားဖြင့် [ဒီ 50 ခေါင်းစဉ်](https://www.upgrad.com/blog/data-science-project-ideas-topics-beginners/) သို့မဟုတ် [ဒီ 21 ပရောဂျက်အကြံများ](https://www.intellspot.com/data-science-project-ideas) သို့မဟုတ် [ဒီ 16 ပရောဂျက်များနှင့် အရင်းအမြစ်ကုဒ်](https://data-flair.training/blogs/data-science-project-ideas/) ကို လေ့လာပြီး ပြန်လည်ဖန်တီးပါ။ သင်၏ သင်ယူမှုခရီးစဉ်များကို ဘလော့ဂ်ရေးပြီး သင့်ရှာဖွေတွေ့ရှိမှုများကို ကျွန်ုပ်တို့အား မျှဝေပါ။ ## Post-Lecture Quiz @@ -114,17 +118,18 @@ Digital Humanities [ကိုအဓိပ္ပာယ်ဖော်ပြထာ ## ပြန်လည်သုံးသပ်ခြင်းနှင့် ကိုယ်တိုင်လေ့လာခြင်း -အသုံးချမှုများကို ပိုမိုလေ့လာလိုပါသလား? သက်ဆိုင်ရာ ဆောင်းပါးအချို့ကို ဖော်ပြထားသည်။ -* [17 Data Science Applications and Examples](https://builtin.com/data-science/data-science-applications-examples) - Jul 2021 -* [11 Breathtaking Data Science Applications in Real World](https://myblindbird.com/data-science-applications-real-world/) - May 2021 +အသုံးချနိုင်သော နေရာများကို ပိုမိုလေ့လာလိုပါသလား? အောက်ပါ ဆောင်းပါးများကို ကြည့်ပါ။ +* [17 Data Science Applications and Examples](https://builtin.com/data-science/data-science-applications-examples) - ဇူလိုင် 2021 +* [11 Breathtaking Data Science Applications in Real World](https://myblindbird.com/data-science-applications-real-world/) - မေ 2021 * [Data Science In The Real World](https://towardsdatascience.com/data-science-in-the-real-world/home) - ဆောင်းပါးစုစည်းမှု -* ဒေတာသိပ္ပံ: [ပညာရေး](https://data-flair.training/blogs/data-science-in-education/), [လယ်ယာ](https://data-flair.training/blogs/data-science-in-agriculture/), [ဘဏ္ဍာရေး](https://data-flair.training/blogs/data-science-in-finance/), [ရုပ်ရှင်](https://data-flair.training/blogs/data-science-at-movies/) နှင့် အခြားများ။ +* [12 Real-World Data Science Applications with Examples](https://www.scaler.com/blog/data-science-applications/) - မေ 2024 +* ဒေတာသိပ္ပံတွင်: [ပညာရေး](https://data-flair.training/blogs/data-science-in-education/), [လယ်ယာစိုက်ပျိုးရေး](https://data-flair.training/blogs/data-science-in-agriculture/), [ဘဏ္ဍာရေး](https://data-flair.training/blogs/data-science-in-finance/), [ရုပ်ရှင်](https://data-flair.training/blogs/data-science-at-movies/), [ကျန်းမာရေးစောင့်ရှောက်မှု](https://onlinedegrees.sandiego.edu/data-science-health-care/) နှင့် အခြားများ။ -## လုပ်ငန်းတာဝန် +## အလုပ်ပေးစာ [Explore A Planetary Computer Dataset](assignment.md) --- **အကြောင်းကြားချက်**: -ဤစာရွက်စာတမ်းကို AI ဘာသာပြန်ဝန်ဆောင်မှု [Co-op Translator](https://github.com/Azure/co-op-translator) ကို အသုံးပြု၍ ဘာသာပြန်ထားပါသည်။ ကျွန်ုပ်တို့သည် တိကျမှုအတွက် ကြိုးစားနေသော်လည်း၊ အလိုအလျောက် ဘာသာပြန်မှုများတွင် အမှားများ သို့မဟုတ် မတိကျမှုများ ပါဝင်နိုင်သည်ကို သတိပြုပါ။ မူရင်းဘာသာစကားဖြင့် ရေးသားထားသော စာရွက်စာတမ်းကို အာဏာရှိသော ရင်းမြစ်အဖြစ် သတ်မှတ်သင့်ပါသည်။ အရေးကြီးသော အချက်အလက်များအတွက် လူ့ဘာသာပြန်ပညာရှင်များမှ ပရော်ဖက်ရှင်နယ် ဘာသာပြန်မှုကို အကြံပြုပါသည်။ ဤဘာသာပြန်မှုကို အသုံးပြုခြင်းမှ ဖြစ်ပေါ်လာသော အလွဲအမှားများ သို့မဟုတ် အနားလွဲမှုများအတွက် ကျွန်ုပ်တို့သည် တာဝန်မယူပါ။ \ No newline at end of file +ဤစာရွက်စာတမ်းကို AI ဘာသာပြန်ဝန်ဆောင်မှု [Co-op Translator](https://github.com/Azure/co-op-translator) ကို အသုံးပြု၍ ဘာသာပြန်ထားပါသည်။ ကျွန်ုပ်တို့သည် တိကျမှုအတွက် ကြိုးစားနေပါသော်လည်း၊ အလိုအလျောက် ဘာသာပြန်ခြင်းတွင် အမှားများ သို့မဟုတ် မတိကျမှုများ ပါဝင်နိုင်သည်ကို ကျေးဇူးပြု၍ သိရှိထားပါ။ မူရင်းဘာသာစကားဖြင့် ရေးသားထားသော စာရွက်စာတမ်းကို အာဏာတရ အရင်းအမြစ်အဖြစ် သတ်မှတ်သင့်ပါသည်။ အရေးကြီးသော အချက်အလက်များအတွက် လူ့ဘာသာပြန်ပညာရှင်များမှ ပရော်ဖက်ရှင်နယ် ဘာသာပြန်ခြင်းကို အကြံပြုပါသည်။ ဤဘာသာပြန်ကို အသုံးပြုခြင်းမှ ဖြစ်ပေါ်လာသော အလွဲအလွတ်များ သို့မဟုတ် အနားလွဲမှုများအတွက် ကျွန်ုပ်တို့သည် တာဝန်မယူပါ။ \ No newline at end of file diff --git a/translations/ne/6-Data-Science-In-Wild/20-Real-World-Examples/README.md b/translations/ne/6-Data-Science-In-Wild/20-Real-World-Examples/README.md index 13c711e4..e874d366 100644 --- a/translations/ne/6-Data-Science-In-Wild/20-Real-World-Examples/README.md +++ b/translations/ne/6-Data-Science-In-Wild/20-Real-World-Examples/README.md @@ -1,149 +1,152 @@ -# वास्तविक संसारमा डेटा विज्ञान +# वास्तविक संसारमा डाटा साइन्स | ![ Sketchnote by [(@sketchthedocs)](https://sketchthedocs.dev) ](../../sketchnotes/20-DataScience-RealWorld.png) | | :--------------------------------------------------------------------------------------------------------------: | -| वास्तविक संसारमा डेटा विज्ञान - _Sketchnote by [@nitya](https://twitter.com/nitya)_ | +| वास्तविक संसारमा डाटा साइन्स - _Sketchnote by [@nitya](https://twitter.com/nitya)_ | -हामी लगभग यो सिकाइ यात्राको अन्त्यमा पुगेका छौं! +हामी यो सिकाइ यात्राको अन्त्यतिर आइपुगेका छौं! -हामीले डेटा विज्ञान र नैतिकताको परिभाषाबाट सुरु गर्यौं, डेटा विश्लेषण र दृश्यात्मकताको लागि विभिन्न उपकरण र प्रविधिहरू अन्वेषण गर्यौं, डेटा विज्ञान जीवनचक्रको समीक्षा गर्यौं, र क्लाउड कम्प्युटिङ सेवाहरूको साथ डेटा विज्ञान कार्यप्रवाहलाई स्केल र स्वचालित गर्ने तरिकाहरू हेरेका छौं। त्यसैले, तपाईं सोच्दै हुनुहुन्छ: _"कसरी म यी सबै सिकाइलाई वास्तविक संसारको सन्दर्भमा नक्सा बनाउन सक्छु?"_ +हामीले डाटा साइन्स र नैतिकताको परिभाषाबाट सुरु गर्यौं, डाटा विश्लेषण र भिजुअलाइजेसनका विभिन्न उपकरण र प्रविधिहरू अन्वेषण गर्यौं, डाटा साइन्स जीवनचक्रको समीक्षा गर्यौं, र क्लाउड कम्प्युटिङ सेवाहरूको प्रयोग गरेर डाटा साइन्स वर्कफ्लोहरूलाई स्केल र स्वचालित गर्ने तरिकाहरू हेर्यौं। त्यसैले, तपाईं सोच्दै हुनुहुन्छ होला: _"यी सबै सिकाइहरूलाई वास्तविक संसारको सन्दर्भमा कसरी नक्सा बनाउन सकिन्छ?"_ -यस पाठमा, हामी उद्योगमा डेटा विज्ञानको वास्तविक संसारको अनुप्रयोगहरू अन्वेषण गर्नेछौं र अनुसन्धान, डिजिटल मानविकी, र स्थिरता सन्दर्भहरूमा विशिष्ट उदाहरणहरूमा डुबुल्की मार्नेछौं। हामी विद्यार्थी परियोजना अवसरहरू हेर्नेछौं र तपाईंको सिकाइ यात्रा जारी राख्न मद्दत गर्न उपयोगी स्रोतहरूसँग निष्कर्ष निकाल्नेछौं! +यस पाठमा, हामी उद्योगभरि डाटा साइन्सका वास्तविक संसारका अनुप्रयोगहरू अन्वेषण गर्नेछौं र अनुसन्धान, डिजिटल मानविकी, र दिगोपनका सन्दर्भमा विशिष्ट उदाहरणहरूमा डुबुल्की मार्नेछौं। हामी विद्यार्थी परियोजनाका अवसरहरू हेर्नेछौं र तपाईंको सिकाइ यात्रा जारी राख्न मद्दत गर्ने उपयोगी स्रोतहरूसँग निष्कर्ष निकाल्नेछौं! -## प्रि-लेक्चर क्विज +## पूर्व-पाठ प्रश्नोत्तरी -## [प्रि-लेक्चर क्विज](https://ff-quizzes.netlify.app/en/ds/quiz/38) +## [पूर्व-पाठ प्रश्नोत्तरी](https://ff-quizzes.netlify.app/en/ds/quiz/38) -## डेटा विज्ञान + उद्योग +## डाटा साइन्स + उद्योग -AI को लोकतान्त्रिकरणको कारण, विकासकर्ताहरूले अब AI-चालित निर्णय-निर्माण र डेटा-चालित अन्तर्दृष्टिहरूलाई प्रयोगकर्ता अनुभव र विकास कार्यप्रवाहमा डिजाइन र एकीकृत गर्न सजिलो पाएका छन्। यहाँ उद्योगमा डेटा विज्ञान "लागू" गरिएको केही वास्तविक संसारका अनुप्रयोगहरूको उदाहरणहरू छन्: +एआईको लोकतान्त्रिकरणको कारण, विकासकर्ताहरूले एआई-चालित निर्णय-निर्माण र डाटा-आधारित अन्तर्दृष्टिहरूलाई प्रयोगकर्ता अनुभव र विकास वर्कफ्लोहरूमा डिजाइन र एकीकृत गर्न सजिलो पाएका छन्। यहाँ उद्योगभरि डाटा साइन्सलाई "लागू" गर्ने केही उदाहरणहरू छन्: - * [Google Flu Trends](https://www.wired.com/2015/10/can-learn-epic-failure-google-flu-trends/) ले खोज शब्दहरूलाई फ्लु प्रवृत्तिहरूसँग सम्बन्धित गर्न डेटा विज्ञान प्रयोग गर्यो। यद्यपि यस दृष्टिकोणमा कमजोरीहरू थिए, यसले डेटा-चालित स्वास्थ्य सेवा भविष्यवाणीको सम्भावनाहरू (र चुनौतीहरू) को बारेमा सचेत गरायो। + * [Google Flu Trends](https://www.wired.com/2015/10/can-learn-epic-failure-google-flu-trends/) ले खोजी शब्दहरूलाई फ्लू प्रवृत्तिहरूसँग सम्बन्धित गर्न डाटा साइन्स प्रयोग गर्‍यो। यद्यपि यस दृष्टिकोणमा कमजोरीहरू थिए, यसले डाटा-आधारित स्वास्थ्य सेवा भविष्यवाणीहरूको सम्भावनाहरू (र चुनौतीहरू) को बारेमा चेतना बढायो। - * [UPS Routing Predictions](https://www.technologyreview.com/2018/11/21/139000/how-ups-uses-ai-to-outsmart-bad-weather/) - UPS ले मौसम अवस्था, ट्राफिक ढाँचा, डेलिभरी समय सीमा र अन्य कुराहरूलाई ध्यानमा राख्दै डेलिभरीको लागि इष्टतम मार्गहरू भविष्यवाणी गर्न डेटा विज्ञान र मेसिन लर्निङ प्रयोग गर्ने तरिका व्याख्या गर्दछ। + * [UPS Routing Predictions](https://www.technologyreview.com/2018/11/21/139000/how-ups-uses-ai-to-outsmart-bad-weather/) - UPS ले मौसम अवस्था, ट्राफिक ढाँचाहरू, डेलिभरी समयसीमाहरू र अन्य कुराहरूलाई ध्यानमा राख्दै डेलिभरीका लागि इष्टतम मार्गहरूको भविष्यवाणी गर्न डाटा साइन्स र मेसिन लर्निङ प्रयोग गर्ने तरिका वर्णन गर्दछ। - * [NYC Taxicab Route Visualization](http://chriswhong.github.io/nyctaxi/) - [Freedom Of Information Laws](https://chriswhong.com/open-data/foil_nyc_taxi/) प्रयोग गरेर संकलित डेटा NYC ट्याक्सीहरूको जीवनको एक दिनलाई दृश्यात्मक बनाउन मद्दत गर्यो, जसले व्यस्त शहरमा उनीहरूले कसरी नेभिगेट गर्छन्, उनीहरूले कमाएको पैसा, र प्रत्येक २४-घण्टा अवधिमा यात्राको अवधि बुझ्न मद्दत गर्यो। + * [NYC Taxicab Route Visualization](http://chriswhong.github.io/nyctaxi/) - [सूचना स्वतन्त्रता कानूनहरू](https://chriswhong.com/open-data/foil_nyc_taxi/) प्रयोग गरेर सङ्कलित डाटाले NYC ट्याक्सीहरूको जीवनको एक दिनलाई दृश्यात्मक बनायो, जसले व्यस्त शहरमा उनीहरूले कसरी नेभिगेट गर्छन्, उनीहरूले कमाउने पैसा, र प्रत्येक २४-घण्टे अवधिमा यात्राको अवधि बुझ्न मद्दत गर्‍यो। - * [Uber Data Science Workbench](https://eng.uber.com/dsw/) - दैनिक लाखौं उबर यात्राहरूबाट संकलित डेटा (पिकअप र ड्रप अफ स्थानहरू, यात्रा अवधि, प्राथमिक मार्गहरू आदि) प्रयोग गरेर मूल्य निर्धारण, सुरक्षा, ठगी पत्ता लगाउने र नेभिगेसन निर्णयहरूको लागि डेटा एनालिटिक्स उपकरण निर्माण गर्न प्रयोग गरिन्छ। + * [Uber Data Science Workbench](https://eng.uber.com/dsw/) - दैनिक लाखौं उबर यात्राहरूबाट सङ्कलित डाटा (पिकअप र ड्रपअफ स्थानहरू, यात्रा अवधि, रुचाइएको मार्गहरू आदि) प्रयोग गरेर मूल्य निर्धारण, सुरक्षा, ठगी पत्ता लगाउने र नेभिगेसन निर्णयहरूमा मद्दत गर्न डाटा एनालिटिक्स उपकरण निर्माण गर्‍यो। - * [Sports Analytics](https://towardsdatascience.com/scope-of-analytics-in-sports-world-37ed09c39860) - _पूर्वानुमानात्मक विश्लेषण_ (टिम र खेलाडी विश्लेषण - [Moneyball](https://datasciencedegree.wisconsin.edu/blog/moneyball-proves-importance-big-data-big-ideas/) सोच्नुहोस् - र फ्यान व्यवस्थापन) र _डेटा दृश्यात्मकता_ (टिम र फ्यान ड्यासबोर्ड, खेलहरू आदि) मा केन्द्रित छ। यसले प्रतिभा खोजी, खेल जुवा, र इन्वेन्टरी/स्थल व्यवस्थापन जस्ता अनुप्रयोगहरू समेट्छ। + * [Sports Analytics](https://towardsdatascience.com/scope-of-analytics-in-sports-world-37ed09c39860) - _पूर्वानुमानात्मक विश्लेषण_ (टीम र खेलाडी विश्लेषण - [Moneyball](https://datasciencedegree.wisconsin.edu/blog/moneyball-proves-importance-big-data-big-ideas/) सोच्नुहोस् - र प्रशंसक व्यवस्थापन) र _डाटा भिजुअलाइजेसन_ (टीम र प्रशंसक ड्यासबोर्ड, खेलहरू आदि) मा केन्द्रित छ, जसले प्रतिभा खोजी, खेल जुवा र सूची/स्थल व्यवस्थापन जस्ता अनुप्रयोगहरूलाई समर्थन गर्दछ। - * [Data Science in Banking](https://data-flair.training/blogs/data-science-in-banking/) - वित्त उद्योगमा डेटा विज्ञानको मूल्यलाई जोखिम मोडेलिङ र ठगी पत्ता लगाउने, ग्राहक विभाजन, वास्तविक-समय भविष्यवाणी र सिफारिस प्रणालीहरू जस्ता अनुप्रयोगहरू सहित हाइलाइट गर्दछ। पूर्वानुमानात्मक विश्लेषणले [क्रेडिट स्कोर](https://dzone.com/articles/using-big-data-and-predictive-analytics-for-credit) जस्ता महत्वपूर्ण उपायहरू पनि चलाउँछ। + * [बैंकिङमा डाटा साइन्स](https://data-flair.training/blogs/data-science-in-banking/) - जोखिम मोडलिङ र ठगी पत्ता लगाउनेदेखि ग्राहक खण्डीकरण, वास्तविक-समय भविष्यवाणी र सिफारिस प्रणालीहरू सम्मका अनुप्रयोगहरूसँग वित्त उद्योगमा डाटा साइन्सको महत्त्वलाई हाइलाइट गर्दछ। पूर्वानुमानात्मक विश्लेषणले [क्रेडिट स्कोरहरू](https://dzone.com/articles/using-big-data-and-predictive-analytics-for-credit) जस्ता महत्त्वपूर्ण उपायहरूलाई पनि चलाउँछ। - * [Data Science in Healthcare](https://data-flair.training/blogs/data-science-in-healthcare/) - चिकित्सा इमेजिङ (जस्तै MRI, X-Ray, CT-Scan), जीनोमिक्स (DNA अनुक्रमण), औषधि विकास (जोखिम मूल्याङ्कन, सफलता भविष्यवाणी), पूर्वानुमानात्मक विश्लेषण (रोगी हेरचाह र आपूर्ति रसद), रोग ट्र्याकिङ र रोकथाम जस्ता अनुप्रयोगहरू हाइलाइट गर्दछ। + * [स्वास्थ्य सेवामा डाटा साइन्स](https://data-flair.training/blogs/data-science-in-healthcare/) - मेडिकल इमेजिङ (जस्तै, MRI, X-Ray, CT-Scan), जीनोमिक्स (DNA अनुक्रमण), औषधि विकास (जोखिम मूल्याङ्कन, सफलता भविष्यवाणी), पूर्वानुमानात्मक विश्लेषण (रोगी हेरचाह र आपूर्ति रसद), रोग ट्र्याकिङ र रोकथाम जस्ता अनुप्रयोगहरूलाई हाइलाइट गर्दछ। -![वास्तविक संसारमा डेटा विज्ञान अनुप्रयोगहरू](../../../../6-Data-Science-In-Wild/20-Real-World-Examples/images/data-science-applications.png) छवि क्रेडिट: [Data Flair: 6 Amazing Data Science Applications ](https://data-flair.training/blogs/data-science-applications/) +![वास्तविक संसारमा डाटा साइन्स अनुप्रयोगहरू](../../../../translated_images/data-science-applications.4e5019cd8790ebac2277ff5f08af386f8727cac5d30f77727c7090677e6adb9c.ne.png) छवि श्रेय: [Data Flair: 6 Amazing Data Science Applications ](https://data-flair.training/blogs/data-science-applications/) -चित्रले डेटा विज्ञान प्रविधिहरू लागू गर्न अन्य डोमेनहरू र उदाहरणहरू देखाउँछ। अन्य अनुप्रयोगहरू अन्वेषण गर्न चाहनुहुन्छ? तलको [Review & Self Study](../../../../6-Data-Science-In-Wild/20-Real-World-Examples) खण्ड जाँच गर्नुहोस्। +चित्रले डाटा साइन्स प्रविधिहरू लागू गर्नका लागि अन्य डोमेनहरू र उदाहरणहरू देखाउँछ। अन्य अनुप्रयोगहरू अन्वेषण गर्न चाहनुहुन्छ? तलको [समीक्षा र आत्म अध्ययन](../../../../6-Data-Science-In-Wild/20-Real-World-Examples) खण्ड जाँच गर्नुहोस्। -## डेटा विज्ञान + अनुसन्धान +## डाटा साइन्स + अनुसन्धान | ![ Sketchnote by [(@sketchthedocs)](https://sketchthedocs.dev) ](../../sketchnotes/20-DataScience-Research.png) | | :---------------------------------------------------------------------------------------------------------------: | -| डेटा विज्ञान र अनुसन्धान - _Sketchnote by [@nitya](https://twitter.com/nitya)_ | +| डाटा साइन्स र अनुसन्धान - _Sketchnote by [@nitya](https://twitter.com/nitya)_ | -वास्तविक संसारको अनुप्रयोगहरू प्रायः उद्योग प्रयोग केसहरूमा केन्द्रित भए पनि, _अनुसन्धान_ अनुप्रयोगहरू र परियोजनाहरू दुई दृष्टिकोणबाट उपयोगी हुन सक्छन्: +वास्तविक संसारका अनुप्रयोगहरूले प्रायः उद्योग प्रयोगका केसहरूमा ध्यान केन्द्रित गर्दा, _अनुसन्धान_ अनुप्रयोगहरू र परियोजनाहरू दुई दृष्टिकोणबाट उपयोगी हुन सक्छन्: -* _नवाचार अवसरहरू_ - उन्नत अवधारणाहरूको द्रुत प्रोटोटाइप र अर्को पुस्ताका अनुप्रयोगहरूको लागि प्रयोगकर्ता अनुभव परीक्षण अन्वेषण गर्नुहोस्। -* _परिनियोजन चुनौतीहरू_ - वास्तविक संसारको सन्दर्भमा डेटा विज्ञान प्रविधिहरूको सम्भावित हानि वा अनपेक्षित परिणामहरूको अनुसन्धान गर्नुहोस्। +* _नवीनता अवसरहरू_ - उन्नत अवधारणाहरूको द्रुत प्रोटोटाइपिङ र अर्को पुस्ताका अनुप्रयोगहरूको प्रयोगकर्ता अनुभव परीक्षण अन्वेषण गर्नुहोस्। +* _परिनियोजन चुनौतीहरू_ - वास्तविक संसारका सन्दर्भहरूमा डाटा साइन्स प्रविधिहरूको सम्भावित हानि वा अनपेक्षित परिणामहरूको अनुसन्धान गर्नुहोस्। -विद्यार्थीहरूको लागि, यी अनुसन्धान परियोजनाहरूले विषयको तपाईंको समझ सुधार गर्न र चासोका क्षेत्रहरूमा काम गरिरहेका सम्बन्धित व्यक्ति वा टोलीहरूसँग तपाईंको जागरूकता र संलग्नता विस्तार गर्न सिकाइ र सहयोग अवसरहरू प्रदान गर्न सक्छ। त्यसो भए अनुसन्धान परियोजनाहरू कस्तो देखिन्छन् र तिनीहरूले कसरी प्रभाव पार्न सक्छन्? +विद्यार्थीहरूको लागि, यी अनुसन्धान परियोजनाहरूले विषयको तपाईंको बुझाइ सुधार गर्न र चासोका क्षेत्रहरूमा काम गरिरहेका सम्बन्धित व्यक्तिहरू वा टोलीहरूसँग तपाईंको जागरूकता र संलग्नता विस्तार गर्न सिकाइ र सहयोगका अवसरहरू प्रदान गर्न सक्छ। त्यसो भए अनुसन्धान परियोजनाहरू कस्तो देखिन्छन् र तिनीहरूले कसरी प्रभाव पार्न सक्छन्? -हामी एउटा उदाहरण हेर्नेछौं - [MIT Gender Shades Study](http://gendershades.org/overview.html) Joy Buolamwini (MIT Media Labs) बाट एक [महत्वपूर्ण अनुसन्धान पत्र](http://proceedings.mlr.press/v81/buolamwini18a/buolamwini18a.pdf) सह-लेखक Timnit Gebru (त्यतिबेला Microsoft Research मा) संग, जसले केन्द्रित गर्यो: +हामी एउटा उदाहरण हेरौं - [MIT Gender Shades Study](http://gendershades.org/overview.html) Joy Buolamwini (MIT Media Labs) बाट, जसले [signature research paper](http://proceedings.mlr.press/v81/buolamwini18a/buolamwini18a.pdf) Timnit Gebru (त्यतिबेला Microsoft Research मा) सँग सह-लेखक गरेको थियो। यसले केन्द्रित गर्‍यो: - * **के:** अनुसन्धान परियोजनाको उद्देश्य _स्वचालित अनुहार विश्लेषण एल्गोरिदम र डेटासेटहरूमा लिङ्ग र छालाको प्रकारको आधारमा पूर्वाग्रहको मूल्याङ्कन गर्नु_ थियो। - * **किन:** अनुहार विश्लेषण कानून प्रवर्तन, एयरपोर्ट सुरक्षा, भर्ती प्रणालीहरू र अन्य क्षेत्रमा प्रयोग गरिन्छ - जहाँ गलत वर्गीकरण (जस्तै, पूर्वाग्रहका कारण) ले प्रभावित व्यक्तिहरू वा समूहहरूलाई सम्भावित आर्थिक र सामाजिक हानि पुर्‍याउन सक्छ। निष्पक्षताका लागि पूर्वाग्रहहरू बुझ्नु (र हटाउनु वा कम गर्नु) महत्त्वपूर्ण छ। - * **कसरी:** अनुसन्धानकर्ताहरूले पहिचान गरे कि अवस्थित बेंचमार्कहरूले प्रायः हल्का छालाका विषयहरू प्रयोग गर्थे, र लिङ्ग र छालाको प्रकारद्वारा _अधिक सन्तुलित_ नयाँ डेटा सेट (१०००+ छविहरू) क्युरेट गरे। डेटा सेटलाई तीन लिङ्ग वर्गीकरण उत्पादनहरूको (Microsoft, IBM & Face++ बाट) सटीकता मूल्याङ्कन गर्न प्रयोग गरियो। + * **के:** अनुसन्धान परियोजनाको उद्देश्य _लिङ्ग र छालाको प्रकारको आधारमा स्वचालित अनुहार विश्लेषण एल्गोरिदम र डाटासेटहरूमा रहेको पूर्वाग्रहको मूल्याङ्कन गर्नु_ थियो। + * **किन:** अनुहार विश्लेषण कानून प्रवर्तन, विमानस्थल सुरक्षा, भर्ती प्रणालीहरू र अन्य क्षेत्रमा प्रयोग गरिन्छ - जहाँ गलत वर्गीकरण (जस्तै, पूर्वाग्रहका कारण) ले प्रभावित व्यक्तिहरू वा समूहहरूलाई सम्भावित आर्थिक र सामाजिक हानि पुर्‍याउन सक्छ। निष्पक्षताको लागि पूर्वाग्रहहरू बुझ्नु (र हटाउनु वा कम गर्नु) महत्त्वपूर्ण छ। + * **कसरी:** अनुसन्धानकर्ताहरूले पहिचान गरे कि विद्यमान बेंचमार्कहरूले प्रायः हल्का छालाका विषयहरू प्रयोग गर्थे, र लिङ्ग र छालाको प्रकारद्वारा _अधिक सन्तुलित_ नयाँ डाटासेट (१०००+ छविहरू) क्युरेट गरे। डाटासेटलाई तीन लिङ्ग वर्गीकरण उत्पादनहरूको (Microsoft, IBM & Face++ बाट) सटीकता मूल्याङ्कन गर्न प्रयोग गरियो। -परिणामहरूले देखाए कि समग्र वर्गीकरण सटीकता राम्रो भए पनि, विभिन्न उपसमूहहरू बीच त्रुटि दरमा उल्लेखनीय भिन्नता थियो - **मिसजेंडरिङ** महिलाहरू वा गाढा छालाका व्यक्तिहरूको लागि उच्च थियो, जसले पूर्वाग्रहलाई संकेत गर्दछ। +परिणामहरूले देखाए कि समग्र वर्गीकरण सटीकता राम्रो भए पनि, विभिन्न उपसमूहहरू बीच त्रुटि दरमा उल्लेखनीय भिन्नता थियो - **गलत लिङ्ग निर्धारण** महिलाहरू वा गाढा छालाका व्यक्तिहरूका लागि उच्च थियो, जसले पूर्वाग्रहलाई संकेत गर्दछ। -**मुख्य परिणामहरू:** डेटा विज्ञानलाई _प्रतिनिधि डेटासेटहरू_ (सन्तुलित उपसमूहहरू) र _समावेशी टोलीहरू_ (विविध पृष्ठभूमि) को आवश्यकता छ भन्ने सचेत गरायो ताकि AI समाधानहरूमा यस्तो पूर्वाग्रहलाई चाँडै पहिचान र हटाउन वा कम गर्न सकियोस्। यस्तो अनुसन्धान प्रयासहरूले धेरै संगठनहरूलाई _जिम्मेवार AI_ को लागि सिद्धान्तहरू र अभ्यासहरू परिभाषित गर्न महत्त्वपूर्ण भूमिका खेल्छन् ताकि उनीहरूको AI उत्पादनहरू र प्रक्रियाहरूमा निष्पक्षता सुधार गर्न सकियोस्। +**मुख्य परिणामहरू:** डाटा साइन्सलाई _प्रतिनिधि डाटासेटहरू_ (सन्तुलित उपसमूहहरू) र _समावेशी टोलीहरू_ (विविध पृष्ठभूमि) आवश्यक छ भन्ने चेतना बढायो ताकि एआई समाधानहरूमा यस्ता पूर्वाग्रहहरू चाँडै पहिचान र हटाउन वा कम गर्न सकियोस्। यस प्रकारका अनुसन्धान प्रयासहरूले धेरै संगठनहरूलाई _उत्तरदायी एआई_ का लागि सिद्धान्त र अभ्यासहरू परिभाषित गर्न पनि महत्त्वपूर्ण भूमिका खेल्छन्, जसले उनीहरूको एआई उत्पादन र प्रक्रियाहरूमा निष्पक्षता सुधार गर्दछ। **Microsoft मा सम्बन्धित अनुसन्धान प्रयासहरू सिक्न चाहनुहुन्छ?** * [Microsoft Research Projects](https://www.microsoft.com/research/research-area/artificial-intelligence/?facet%5Btax%5D%5Bmsr-research-area%5D%5B%5D=13556&facet%5Btax%5D%5Bmsr-content-type%5D%5B%5D=msr-project) मा कृत्रिम बुद्धिमत्तामा अनुसन्धान परियोजनाहरू जाँच गर्नुहोस्। * [Microsoft Research Data Science Summer School](https://www.microsoft.com/en-us/research/academic-program/data-science-summer-school/) बाट विद्यार्थी परियोजनाहरू अन्वेषण गर्नुहोस्। -* [Fairlearn](https://fairlearn.org/) परियोजना र [Responsible AI](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1%3aprimaryr6) पहलहरू जाँच गर्नुहोस्। +* [Fairlearn](https://fairlearn.org/) परियोजना र [उत्तरदायी एआई](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1%3aprimaryr6) पहलहरू जाँच गर्नुहोस्। -## डेटा विज्ञान + मानविकी + +## डाटा साइन्स + मानविकी | ![ Sketchnote by [(@sketchthedocs)](https://sketchthedocs.dev) ](../../sketchnotes/20-DataScience-Humanities.png) | | :---------------------------------------------------------------------------------------------------------------: | -| डेटा विज्ञान र डिजिटल मानविकी - _Sketchnote by [@nitya](https://twitter.com/nitya)_ | +| डाटा साइन्स र डिजिटल मानविकी - _Sketchnote by [@nitya](https://twitter.com/nitya)_ | -डिजिटल मानविकी [परिभाषित गरिएको छ](https://digitalhumanities.stanford.edu/about-dh-stanford) "कम्प्युटेशनल विधिहरूलाई मानविकी अनुसन्धानसँग संयोजन गर्ने अभ्यासहरूको संग्रह" भनेर। [Stanford परियोजनाहरू](https://digitalhumanities.stanford.edu/projects) जस्तै _"इतिहासलाई पुनः सुरु गर्दै"_ र _"कवितात्मक सोच"_ ले [डिजिटल मानविकी र डेटा विज्ञान](https://digitalhumanities.stanford.edu/digital-humanities-and-data-science) बीचको सम्बन्धलाई चित्रण गर्दछ - नेटवर्क विश्लेषण, सूचना दृश्यात्मकता, स्थानिक र पाठ विश्लेषण जस्ता प्रविधिहरूलाई जोड दिँदै, जसले हामीलाई ऐतिहासिक र साहित्यिक डेटा सेटहरू पुनः अन्वेषण गर्न र नयाँ अन्तर्दृष्टि र दृष्टिकोण प्राप्त गर्न मद्दत गर्दछ। +डिजिटल मानविकीलाई [परिभाषित गरिएको छ](https://digitalhumanities.stanford.edu/about-dh-stanford) "गणनात्मक विधिहरूलाई मानविकी अनुसन्धानसँग संयोजन गर्ने अभ्यास र दृष्टिकोणहरूको सङ्ग्रह" भनेर। [स्ट्यानफोर्ड परियोजनाहरू](https://digitalhumanities.stanford.edu/projects) जस्तै _"इतिहासलाई पुनः सुरु गर्नु"_ र _"कवितात्मक सोच"_ ले [डिजिटल मानविकी र डाटा साइन्स](https://digitalhumanities.stanford.edu/digital-humanities-and-data-science) बीचको सम्बन्धलाई चित्रण गर्दछ - जसले नेटवर्क विश्लेषण, सूचना भिजुअलाइजेसन, स्थानिक र पाठ विश्लेषण जस्ता प्रविधिहरूलाई जोड दिन्छ, जसले हामीलाई ऐतिहासिक र साहित्यिक डाटासेटहरू पुनः अन्वेषण गर्न र नयाँ अन्तर्दृष्टि र दृष्टिकोण प्राप्त गर्न मद्दत गर्दछ। -*यस क्षेत्रमा परियोजना अन्वेषण गर्न र विस्तार गर्न चाहनुहुन्छ?* +*यस क्षेत्रमा परियोजना अन्वेषण र विस्तार गर्न चाहनुहुन्छ?* -["Emily Dickinson and the Meter of Mood"](https://gist.github.com/jlooper/ce4d102efd057137bc000db796bfd671) जाँच गर्नुहोस् - [Jen Looper](https://twitter.com/jenlooper) बाट एक उत्कृष्ट उदाहरण, जसले सोध्छ कि हामी कसरी डेटा विज्ञान प्रयोग गरेर परिचित कवितालाई पुनः अन्वेषण गर्न सक्छौं र नयाँ सन्दर्भमा यसको अर्थ र यसको लेखकको योगदान पुनः मूल्याङ्कन गर्न सक्छौं। उदाहरणका लागि, _के हामी कविताको टोन वा भावना विश्लेषण गरेर यो लेखिएको मौसमको भविष्यवाणी गर्न सक्छौं_ - र यसले सम्बन्धित अवधिमा लेखकको मानसिक अवस्थाको बारेमा के बताउँछ? +["Emily Dickinson and the Meter of Mood"](https://gist.github.com/jlooper/ce4d102efd057137bc000db796bfd671) जाँच गर्नुहोस् - [Jen Looper](https://twitter.com/jenlooper) बाट एक उत्कृष्ट उदाहरण, जसले सोध्छ कि हामी कसरी डाटा साइन्स प्रयोग गरेर परिचित कविताहरूलाई पुनः अन्वेषण गर्न र नयाँ सन्दर्भमा यसको अर्थ र यसको लेखकको योगदान पुनः मूल्याङ्कन गर्न सक्छौं। उदाहरणका लागि, _के हामी कविताको टोन वा भावना विश्लेषण गरेर यसको लेखिएको मौसमको भविष्यवाणी गर्न सक्छौं_ - र यसले सम्बन्धित अवधिमा लेखकको मानसिक अवस्थाको बारेमा के बताउँछ? -त्यो प्रश्नको उत्तर दिन, हामी हाम्रो डेटा विज्ञान जीवनचक्रको चरणहरू अनुसरण गर्छौं: - * [`डेटा प्राप्ति`](https://gist.github.com/jlooper/ce4d102efd057137bc000db796bfd671#acquiring-the-dataset) - विश्लेषणको लागि सम्बन्धित डेटा सेट सङ्कलन गर्न। विकल्पहरूमा API प्रयोग गर्नु (जस्तै, [Poetry DB API](https://poetrydb.org/index.html)) वा वेब पृष्ठहरू स्क्र्यापिङ गर्नु (जस्तै, [Project Gutenberg](https://www.gutenberg.org/files/12242/12242-h/12242-h.htm)) जस्ता उपकरणहरू प्रयोग गरेर [Scrapy](https://scrapy.org/) समावेश छन्। - * [`डेटा सफा गर्नु`](https://gist.github.com/jlooper/ce4d102efd057137bc000db796bfd671#clean-the-data) - पाठलाई आधारभूत उपकरणहरू जस्तै Visual Studio Code र Microsoft Excel प्रयोग गरेर ढाँचा, सफा र सरल बनाउने तरिका व्याख्या गर्दछ। - * [`डेटा विश्लेषण`](https://gist.github.com/jlooper/ce4d102efd057137bc000db796bfd671#working-with-the-data-in-a-notebook) - डेटा सेटलाई "नोटबुकहरू" मा आयात गरेर विश्लेषण गर्न, डेटा व्यवस्थित गर्न र दृश्यात्मक बनाउन Python प्याकेजहरू (जस्तै pandas, numpy र matplotlib) प्रयोग गर्ने तरिका व्याख्या गर्दछ। - * [`भावना विश्लेषण`](https://gist.github.com/jlooper/ce4d102efd057137bc000db796bfd671#sentiment-analysis-using-cognitive-services) - क्लाउड सेवाहरू जस्तै Text Analytics एकीकृत गर्ने तरिका व्याख्या गर्दछ, स्वचालित डेटा प्रशोधन कार्यप्रवाहहरूको लागि [Power Automate](https://flow.microsoft.com/en-us/) जस्ता कम-कोड उपकरणहरू प्रयोग गरेर। +त्यस प्रश्नको उत्तर दिन, हामी हाम्रो डाटा साइन्स जीवनचक्रका चरणहरू अनुसरण गर्छौं: + * [`डाटा अधिग्रहण`](https://gist.github.com/jlooper/ce4d102efd057137bc000db796bfd671#acquiring-the-dataset) - विश्लेषणका लागि सम्बन्धित डाटासेट सङ्कलन गर्न। विकल्पहरूमा API (जस्तै, [Poetry DB API](https://poetrydb.org/index.html)) प्रयोग गर्ने वा वेब पृष्ठहरू स्क्र्याप गर्ने (जस्तै, [Project Gutenberg](https://www.gutenberg.org/files/12242/12242-h/12242-h.htm)) उपकरणहरू (जस्तै, [Scrapy](https://scrapy.org/)) प्रयोग गरेर समावेश छन्। + * [`डाटा सफा गर्ने`](https://gist.github.com/jlooper/ce4d102efd057137bc000db796bfd671#clean-the-data) - पाठलाई आधारभूत उपकरणहरू (जस्तै, Visual Studio Code र Microsoft Excel) प्रयोग गरेर ढाँचा, सफा र सरल बनाउने तरिका वर्णन गर्दछ। + * [`डाटा विश्लेषण`](https://gist.github.com/jlooper/ce4d102efd057137bc000db796bfd671#working-with-the-data-in-a-notebook) - डाटासेटलाई "नोटबुकहरू" मा आयात गरेर विश्लेषण गर्न Python प्याकेजहरू (जस्तै, pandas, numpy र matplotlib) प्रयोग गरेर डाटालाई व्यवस्थित र दृश्यात्मक बनाउने तरिका वर्णन गर्दछ। + * [`भावना विश्लेषण`](https://gist.github.com/jlooper/ce4d102efd057137bc000db796bfd671#sentiment-analysis-using-cognitive-services) - पाठ विश्लेषण जस्ता क्लाउड सेवाहरूलाई एकीकृत गर्ने तरिका वर्णन गर्दछ, जसले [Power Automate](https://flow.microsoft.com/en-us/) जस्ता कम-कोड उपकरणहरू प्रयोग गरेर स्वचालित डाटा प्रशोधन वर्कफ्लोहरू सक्षम बनाउँछ। -यस कार्यप्रवाह प्रयोग गरेर, हामी कविताको भावनामा मौसमी प्रभावहरू अन्वेषण गर्न सक्छौं, र लेखकको बारेमा हाम्रो आफ्नै दृष्टिकोण निर्माण गर्न मद्दत गर्न सक्छौं। आफैं प्रयास गर्नुहोस् - त्यसपछि अन्य प्रश्नहरू सोध्न वा डेटा नयाँ तरिकामा दृश्यात्मक बनाउन नोटबुक विस्तार गर्नुहोस्! +यस वर्कफ्लो प्रयोग गरेर, हामी कविताहरूको भावनामा मौसमी प्रभावहरूको अन्वेषण गर्न सक्छौं, र सम्बन्धित अवधिमा लेखकको मानसिक अवस्थाको बारेमा हाम्रो आफ्नै दृष्टिकोण निर्माण गर्न सक्छौं। आफैं प्रयास गर्नुहोस् - त्यसपछि अन्य प्रश्नहरू सोध्न वा डाटालाई नयाँ तरिकामा दृश्यात्मक बनाउन नोटबुक विस्तार गर्नुहोस्! > तपाईं [डिजिटल मानविकी टूलकिट](https://github.com/Digital-Humanities-Toolkit) मा केही उपकरणहरू प्रयोग गरेर यी अनुसन्धानका मार्गहरू पछ्याउन सक्नुहुन्छ। -## डेटा विज्ञान + स्थिरता + +## डाटा साइन्स + दिगोपन | ![ Sketchnote by [(@sketchthedocs)](https://sketchthedocs.dev) ](../../sketchnotes/20-DataScience-Sustainability.png) | | :---------------------------------------------------------------------------------------------------------------: | -| डेटा विज्ञान र स्थिरता - _Sketchnote by [@nitya](https://twitter.com/nitya)_ | - -[2030 Agenda For Sustainable Development](https://sdgs.un.org/2030agenda) - २०१५ मा सबै संयुक्त राष्ट्र सदस्यहरूले अपनाएको - १७ लक्ष्यहरू पहिचान गर्दछ, जसमा **ग्रहको संरक्षण** र जलवायु परिवर्तनको प्रभावबाट केन्द्रित लक्ष्यहरू समावेश छन्। [Microsoft Sustainability](https://www.microsoft.com/en-us/sustainability) पहलले यी लक्ष्यहरूलाई समर्थन गर्दछ र [४ लक्ष्यहरूमा केन्द्रित](https://dev.to/azure/a-visual-guide-to-sustainable-software-engineering-53hh) स्थिर भविष्य निर्माण गर्न प्रविधि समाधानहरूको अन्वेषण गर्दछ - २०३० सम्म कार्बन नकारात्मक, पानी सकारात्मक, शून्य फोहोर, र जैव-विविध। +| डाटा साइन्स र दिगोपन - _Sketchnote by [@nitya](https://twitter.com/nitya)_ | -यी चुनौतीहरूलाई स्केलेबल र समयमै सम्बोधन गर्न क्लाउड-स्केल सोच र ठूलो स्केल डेटा आवश्यक छ। [Planetary Computer](https://planetarycomputer.microsoft.com/) पहलले डेटा वैज्ञानिकहरू र विकासकर्ताहरूलाई यस प्रयासमा मद्दत गर्न ४ घटकहरू प्रदान गर्दछ: +[२०३० को लागि दिगो विकासको एजेन्डा](https://sdgs.un.org/2030agenda) - जुन २०१५ मा सबै संयुक्त राष्ट्र सदस्यहरूले अपनाएका थिए - ले १७ लक्ष्यहरू पहिचान गर्दछ, जसमा **ग्रहलाई जोगाउने** र जलवायु परिवर्तनको प्रभावबाट जोगाउने लक्ष्यहरू समावेश छन्। [Microsoft Sustainability](https://www.microsoft.com/en-us/sustainability) पहलले यी लक्ष्यहरूलाई समर्थन गर्दछ, जसले प्रविधि समाधानहरूले कसरी दिगो भविष्यहरूलाई समर्थन र निर्माण गर्न सक्छन् भनेर अन्वेषण गर्दछ, [४ लक्ष्यहरूमा ध्यान केन्द्रित गर्दै](https://dev.to/azure/a-visual-guide-to-sustainable-software-engineering-53hh) - २०३० सम्म कार्बन नकारात्मक, पानी सकारात्मक, शून्य फोहोर, र जैव-विविध हुनु। - * [डेटा क्याटलग](https://planetarycomputer.microsoft.com/catalog) - पृथ्वी प्रणाली डेटा (नि:शुल्क र Azure-होस्ट गरिएको) को पेटाबाइटहरूसँग। - * [Planetary API](https://planetarycomputer.microsoft.com/docs/reference/stac/) - प्रयोगकर्ताहरूलाई स्थान र समयभरि सम्बन्धित डेटा खोज्न मद्दत गर्न। - * [हब](https://planetarycomputer.microsoft.com/docs/overview/environment/) - वैज्ञानिकहरूलाई विशाल भू-स्थानिक डेटा सेटहरू प्रशोधन गर्न प्रबन्धित वातावरण। - * [अनुप्रयोगहरू](https://planetarycomputer.microsoft.com/applications) - स्थिरता अन्तर्दृष्टिका लागि प्रयोग केसहरू र उपकरणहरू प्रदर्शन। -**प्लानेटरी कम्प्युटर प्रोजेक्ट हाल प्रिभ्यूमा छ (सेप्टेम्बर २०२१ को रूपमा)** - डाटा साइन्स प्रयोग गरेर दिगो समाधानहरूमा योगदान दिन सुरु गर्न यहाँबाट सुरु गर्न सकिन्छ। +यी चुनौतीहरूलाई मापनयोग्य र समयमै समाधान गर्न क्लाउड-स्तरको सोच आवश्यक छ - र ठूलो मात्रामा डाटा। [Planetary Computer](https://planetarycomputer.microsoft.com/) पहलले डाटा वैज्ञानिकहरू र विकासकर्ताहरूलाई यस प्रयासमा मद्दत गर्न ४ घटकहरू प्रदान गर्दछ: + + * [डाटा क्याटलग](https://planetarycomputer.microsoft.com/catalog) - पृथ्वी प्रणाली डाटाको पेटाबाइट्स (निःशुल्क र Azure-होस्ट गरिएको)। + * [Planetary API](https://planetarycomputer.microsoft.com/docs/reference/stac/) - प्रयोगकर्ताहरूलाई स्थान र समयभरि सम्बन्धित डाटा खोज्न मद्दत गर्न। + * [हब](https://planetarycomputer.microsoft.com/docs/overview/environment/) - वैज्ञानिकहरूलाई विशाल भू-स्थानिक डाटासेटहरू प्रशोधन गर्न प्रबन्धित वातावरण। + * [अनुप्रयोगहरू](https://planetarycomputer.microsoft.com/applications) - दिगोपन अन्तर्दृष्टिका लागि प्रयोग केसहरू र उपकरणहरू प्रदर्शन। +**प्लानेटरी कम्प्युटर प्रोजेक्ट हाल प्रिभ्यूमा छ (सेप्टेम्बर २०२१ अनुसार)** - डाटा साइन्स प्रयोग गरेर दिगो समाधानहरूमा योगदान दिन सुरु गर्न यहाँबाट थाल्नुहोस्। * [एक्सेसको लागि अनुरोध गर्नुहोस्](https://planetarycomputer.microsoft.com/account/request) अन्वेषण सुरु गर्न र सहकर्मीहरूसँग जडान गर्न। -* [डकुमेन्टेसन अन्वेषण गर्नुहोस्](https://planetarycomputer.microsoft.com/docs/overview/about) समर्थित डेटासेट र API हरू बुझ्न। +* [डकुमेन्टेसन अन्वेषण गर्नुहोस्](https://planetarycomputer.microsoft.com/docs/overview/about) समर्थित डेटासेटहरू र API हरू बुझ्न। * [इकोसिस्टम मोनिटरिङ](https://analytics-lab.org/ecosystemmonitoring/) जस्ता एप्लिकेसनहरू अन्वेषण गर्नुहोस् एप्लिकेसन आइडियाहरूको प्रेरणाको लागि। -डाटा भिजुअलाइजेसन प्रयोग गरेर जलवायु परिवर्तन र वन विनाश जस्ता क्षेत्रहरूमा सान्दर्भिक जानकारी उजागर गर्न वा प्रवर्धन गर्न कसरी प्रयोग गर्न सकिन्छ भन्ने सोच्नुहोस्। वा सोच्नुहोस् कि कसरी जानकारीहरू नयाँ प्रयोगकर्ता अनुभवहरू सिर्जना गर्न प्रयोग गर्न सकिन्छ जसले दिगो जीवनशैलीको लागि व्यवहार परिवर्तनलाई प्रेरित गर्दछ। +डाटा भिजुअलाइजेसन प्रयोग गरेर जलवायु परिवर्तन र वन विनाश जस्ता क्षेत्रहरूमा सान्दर्भिक जानकारी उजागर गर्न वा प्रवर्धन गर्न कसरी प्रयोग गर्न सकिन्छ भन्ने सोच्नुहोस्। वा, कसरी यी जानकारीहरूलाई प्रयोगकर्ता अनुभव सिर्जना गर्न प्रयोग गर्न सकिन्छ जसले दिगो जीवनशैलीको लागि व्यवहार परिवर्तनलाई प्रेरित गर्छ। ## डाटा साइन्स + विद्यार्थीहरू -हामीले उद्योग र अनुसन्धानमा वास्तविक संसारका एप्लिकेसनहरूको बारेमा कुरा गरेका छौं, र डिजिटल ह्युम्यानिटीज र दिगो विकासमा डाटा साइन्स एप्लिकेसनका उदाहरणहरू अन्वेषण गरेका छौं। त्यसो भए, डाटा साइन्सको शुरुवातकर्ता रूपमा तपाईंले आफ्नो सीप कसरी निर्माण गर्न सक्नुहुन्छ र आफ्नो विशेषज्ञता साझा गर्न सक्नुहुन्छ? +हामीले उद्योग र अनुसन्धानमा वास्तविक संसारका एप्लिकेसनहरूबारे कुरा गरेका छौं, र डिजिटल ह्युम्यानिटीज र दिगो विकासमा डाटा साइन्स एप्लिकेसनका उदाहरणहरू अन्वेषण गरेका छौं। अब, डाटा साइन्सको शुरुवातीको रूपमा तपाईंले आफ्नो सीप कसरी निर्माण गर्न सक्नुहुन्छ र आफ्नो विशेषज्ञता साझा गर्न सक्नुहुन्छ? यहाँ डाटा साइन्स विद्यार्थी परियोजनाहरूका केही उदाहरणहरू छन् जसले तपाईंलाई प्रेरित गर्न सक्छ। - * [MSR डाटा साइन्स समर स्कूल](https://www.microsoft.com/en-us/research/academic-program/data-science-summer-school/#!projects) GitHub [परियोजनाहरू](https://github.com/msr-ds3) सहित, जस्तै: - - [प्रहरीको बल प्रयोगमा जातीय पक्षपात](https://www.microsoft.com/en-us/research/video/data-science-summer-school-2019-replicating-an-empirical-analysis-of-racial-differences-in-police-use-of-force/) | [Github](https://github.com/msr-ds3/stop-question-frisk) +* [MSR डाटा साइन्स समर स्कूल](https://www.microsoft.com/en-us/research/academic-program/data-science-summer-school/#!projects) GitHub [परियोजनाहरू](https://github.com/msr-ds3) सहित, जस्तै: + - [प्रहरीको बल प्रयोगमा जातीय पूर्वाग्रह](https://www.microsoft.com/en-us/research/video/data-science-summer-school-2019-replicating-an-empirical-analysis-of-racial-differences-in-police-use-of-force/) | [Github](https://github.com/msr-ds3/stop-question-frisk) - [NYC सबवे प्रणालीको विश्वसनीयता](https://www.microsoft.com/en-us/research/video/data-science-summer-school-2018-exploring-the-reliability-of-the-nyc-subway-system/) | [Github](https://github.com/msr-ds3/nyctransit) - * [सामग्री संस्कृति डिजिटलाइजिङ: सिर्कापमा सामाजिक-आर्थिक वितरण अन्वेषण गर्दै](https://claremont.maps.arcgis.com/apps/Cascade/index.html?appid=bdf2aef0f45a4674ba41cd373fa23afc) - [ओर्नेला अल्टुन्यान](https://twitter.com/ornelladotcom) र क्लेयरमोन्टको टोलीबाट, [ArcGIS StoryMaps](https://storymaps.arcgis.com/) प्रयोग गर्दै। +* [सामग्री संस्कृति डिजिटलाइजिङ: सिर्कापमा सामाजिक-आर्थिक वितरण अन्वेषण](https://claremont.maps.arcgis.com/apps/Cascade/index.html?appid=bdf2aef0f45a4674ba41cd373fa23afc) - [Ornella Altunyan](https://twitter.com/ornelladotcom) र Claremont टिमबाट, [ArcGIS StoryMaps](https://storymaps.arcgis.com/) प्रयोग गर्दै। ## 🚀 चुनौती -डाटा साइन्स परियोजनाहरूको लागि लेखहरू खोज्नुहोस् जुन शुरुवातकर्ताहरूको लागि उपयुक्त छन् - जस्तै [यी ५० विषय क्षेत्रहरू](https://www.upgrad.com/blog/data-science-project-ideas-topics-beginners/) वा [यी २१ परियोजना आइडियाहरू](https://www.intellspot.com/data-science-project-ideas) वा [यी १६ परियोजनाहरू स्रोत कोडसहित](https://data-flair.training/blogs/data-science-project-ideas/) जसलाई तपाईंले डिकन्स्ट्रक्ट र रिमिक्स गर्न सक्नुहुन्छ। र आफ्नो सिकाइ यात्रा ब्लग गर्न नबिर्सनुहोस् र आफ्नो जानकारी हामी सबैसँग साझा गर्नुहोस्। +डाटा साइन्स परियोजनाहरूको लागि लेखहरू खोज्नुहोस् जुन शुरुवातीहरूको लागि उपयुक्त छन् - जस्तै [यी ५० विषय क्षेत्रहरू](https://www.upgrad.com/blog/data-science-project-ideas-topics-beginners/) वा [यी २१ परियोजना आइडियाहरू](https://www.intellspot.com/data-science-project-ideas) वा [यी १६ परियोजनाहरू स्रोत कोडसहित](https://data-flair.training/blogs/data-science-project-ideas/) जसलाई तपाईंले डिकन्स्ट्रक्ट र रिमिक्स गर्न सक्नुहुन्छ। र आफ्नो सिकाइ यात्रा ब्लग गर्न नबिर्सनुहोस् र आफ्नो जानकारी हामी सबैसँग साझा गर्नुहोस्। ## पोस्ट-लेक्चर क्विज ## [पोस्ट-लेक्चर क्विज](https://ff-quizzes.netlify.app/en/ds/quiz/39) -## समीक्षा र आत्म अध्ययन +## समीक्षा र आत्म-अध्ययन -अझ धेरै प्रयोग केसहरू अन्वेषण गर्न चाहनुहुन्छ? यहाँ केही सान्दर्भिक लेखहरू छन्: - * [१७ डाटा साइन्स एप्लिकेसनहरू र उदाहरणहरू](https://builtin.com/data-science/data-science-applications-examples) - जुलाई २०२१ - * [वास्तविक संसारमा ११ अद्भुत डाटा साइन्स एप्लिकेसनहरू](https://myblindbird.com/data-science-applications-real-world/) - मे २०२१ - * [वास्तविक संसारमा डाटा साइन्स](https://towardsdatascience.com/data-science-in-the-real-world/home) - लेख संग्रह - * डाटा साइन्समा: [शिक्षा](https://data-flair.training/blogs/data-science-in-education/), [कृषि](https://data-flair.training/blogs/data-science-in-agriculture/), [वित्त](https://data-flair.training/blogs/data-science-in-finance/), [चलचित्रहरू](https://data-flair.training/blogs/data-science-at-movies/) र थप। +थप प्रयोग केसहरू अन्वेषण गर्न चाहनुहुन्छ? यहाँ केही सान्दर्भिक लेखहरू छन्: +* [१७ डाटा साइन्स एप्लिकेसनहरू र उदाहरणहरू](https://builtin.com/data-science/data-science-applications-examples) - जुलाई २०२१ +* [वास्तविक संसारमा ११ अद्भुत डाटा साइन्स एप्लिकेसनहरू](https://myblindbird.com/data-science-applications-real-world/) - मे २०२१ +* [वास्तविक संसारमा डाटा साइन्स](https://towardsdatascience.com/data-science-in-the-real-world/home) - लेख संग्रह +* [१२ वास्तविक संसारका डाटा साइन्स एप्लिकेसनहरू उदाहरणसहित](https://www.scaler.com/blog/data-science-applications/) - मे २०२४ +* डाटा साइन्समा: [शिक्षा](https://data-flair.training/blogs/data-science-in-education/), [कृषि](https://data-flair.training/blogs/data-science-in-agriculture/), [वित्त](https://data-flair.training/blogs/data-science-in-finance/), [चलचित्रहरू](https://data-flair.training/blogs/data-science-at-movies/), [स्वास्थ्य सेवा](https://onlinedegrees.sandiego.edu/data-science-health-care/) र थप। ## असाइनमेन्ट @@ -152,4 +155,4 @@ AI को लोकतान्त्रिकरणको कारण, वि --- **अस्वीकरण**: -यो दस्तावेज़ AI अनुवाद सेवा [Co-op Translator](https://github.com/Azure/co-op-translator) प्रयोग गरेर अनुवाद गरिएको छ। हामी शुद्धताको लागि प्रयास गर्छौं, तर कृपया ध्यान दिनुहोस् कि स्वचालित अनुवादहरूमा त्रुटि वा अशुद्धता हुन सक्छ। यसको मूल भाषा मा रहेको मूल दस्तावेज़लाई आधिकारिक स्रोत मानिनुपर्छ। महत्वपूर्ण जानकारीको लागि, व्यावसायिक मानव अनुवाद सिफारिस गरिन्छ। यस अनुवादको प्रयोगबाट उत्पन्न हुने कुनै पनि गलतफहमी वा गलत व्याख्याको लागि हामी जिम्मेवार हुने छैनौं। \ No newline at end of file +यो दस्तावेज़ AI अनुवाद सेवा [Co-op Translator](https://github.com/Azure/co-op-translator) प्रयोग गरेर अनुवाद गरिएको छ। हामी शुद्धताको लागि प्रयास गर्छौं, तर कृपया ध्यान दिनुहोस् कि स्वचालित अनुवादमा त्रुटिहरू वा अशुद्धताहरू हुन सक्छ। यसको मूल भाषा मा रहेको मूल दस्तावेज़लाई आधिकारिक स्रोत मानिनुपर्छ। महत्वपूर्ण जानकारीको लागि, व्यावसायिक मानव अनुवाद सिफारिस गरिन्छ। यस अनुवादको प्रयोगबाट उत्पन्न हुने कुनै पनि गलतफहमी वा गलत व्याख्याको लागि हामी जिम्मेवार हुने छैनौं। \ No newline at end of file diff --git a/translations/nl/6-Data-Science-In-Wild/20-Real-World-Examples/README.md b/translations/nl/6-Data-Science-In-Wild/20-Real-World-Examples/README.md index e1c896f8..27d5cf79 100644 --- a/translations/nl/6-Data-Science-In-Wild/20-Real-World-Examples/README.md +++ b/translations/nl/6-Data-Science-In-Wild/20-Real-World-Examples/README.md @@ -1,8 +1,8 @@ -# Data Science i den Virkelige Verden +# Data Science i den virkelige verden | ![ Sketchnote av [(@sketchthedocs)](https://sketchthedocs.dev) ](../../sketchnotes/20-DataScience-RealWorld.png) | | :--------------------------------------------------------------------------------------------------------------: | -| Data Science i den Virkelige Verden - _Sketchnote av [@nitya](https://twitter.com/nitya)_ | +| Data Science i den virkelige verden - _Sketchnote av [@nitya](https://twitter.com/nitya)_ | Vi nærmer oss slutten av denne læringsreisen! -Vi startet med definisjoner av data science og etikk, utforsket ulike verktøy og teknikker for dataanalyse og visualisering, gjennomgikk livssyklusen for data science, og så på hvordan man kan skalere og automatisere arbeidsflyter for data science med skytjenester. Så du lurer kanskje: _"Hvordan kan jeg egentlig koble alt dette til virkelige sammenhenger?"_ +Vi startet med definisjoner av data science og etikk, utforsket ulike verktøy og teknikker for dataanalyse og visualisering, gjennomgikk livssyklusen for data science, og så på hvordan man kan skalere og automatisere arbeidsflyter for data science med skytjenester. Så du lurer kanskje: _"Hvordan kan jeg egentlig koble all denne læringen til virkelige kontekster?"_ -I denne leksjonen skal vi utforske virkelige anvendelser av data science på tvers av bransjer og dykke ned i spesifikke eksempler innen forskning, digitale humaniora og bærekraft. Vi skal også se på studentprosjektmuligheter og avslutte med nyttige ressurser som kan hjelpe deg med å fortsette læringsreisen din! +I denne leksjonen skal vi utforske virkelige anvendelser av data science på tvers av ulike bransjer og dykke ned i spesifikke eksempler innen forskning, digitale humaniora og bærekraft. Vi skal se på studentprosjektmuligheter og avslutte med nyttige ressurser som kan hjelpe deg med å fortsette din læringsreise! ## Quiz før forelesning @@ -25,25 +25,25 @@ I denne leksjonen skal vi utforske virkelige anvendelser av data science på tve ## Data Science + Industri -Takket være demokratiseringen av AI, finner utviklere det nå enklere å designe og integrere AI-drevne beslutningsprosesser og datadrevne innsikter i brukeropplevelser og utviklingsarbeidsflyter. Her er noen eksempler på hvordan data science "brukes" i virkelige applikasjoner på tvers av bransjer: +Takket være demokratiseringen av AI, finner utviklere det nå enklere å designe og integrere AI-drevne beslutningsprosesser og datadrevne innsikter i brukeropplevelser og utviklingsarbeidsflyter. Her er noen eksempler på hvordan data science "anvendes" i virkelige applikasjoner på tvers av bransjer: - * [Google Flu Trends](https://www.wired.com/2015/10/can-learn-epic-failure-google-flu-trends/) brukte data science for å korrelere søketermer med influensatrender. Selv om tilnærmingen hadde svakheter, skapte den bevissthet om mulighetene (og utfordringene) ved datadrevne helseprediksjoner. + * [Google Flu Trends](https://www.wired.com/2015/10/can-learn-epic-failure-google-flu-trends/) brukte data science for å korrelere søketermer med influensatrender. Selv om tilnærmingen hadde svakheter, skapte den oppmerksomhet rundt mulighetene (og utfordringene) med datadrevne helseprediksjoner. * [UPS Routing Predictions](https://www.technologyreview.com/2018/11/21/139000/how-ups-uses-ai-to-outsmart-bad-weather/) - forklarer hvordan UPS bruker data science og maskinlæring for å forutsi optimale leveringsruter, med hensyn til værforhold, trafikkmønstre, leveringsfrister og mer. - * [NYC Taxicab Route Visualization](http://chriswhong.github.io/nyctaxi/) - data samlet inn ved hjelp av [Freedom Of Information Laws](https://chriswhong.com/open-data/foil_nyc_taxi/) bidro til å visualisere en dag i livet til NYC-taxier, og hjalp oss med å forstå hvordan de navigerer i den travle byen, hvor mye de tjener, og varigheten av turer over en 24-timers periode. + * [NYC Taxicab Route Visualization](http://chriswhong.github.io/nyctaxi/) - data samlet inn ved hjelp av [Freedom Of Information Laws](https://chriswhong.com/open-data/foil_nyc_taxi/) hjalp med å visualisere en dag i livet til NYC-taxier, og ga innsikt i hvordan de navigerer i den travle byen, pengene de tjener, og varigheten av turer over en 24-timers periode. - * [Uber Data Science Workbench](https://eng.uber.com/dsw/) - bruker data (om hente- og leveringssteder, turvarighet, foretrukne ruter osv.) samlet fra millioner av Uber-turer *daglig* for å bygge et dataanalytisk verktøy som hjelper med prissetting, sikkerhet, svindeldeteksjon og navigasjonsbeslutninger. + * [Uber Data Science Workbench](https://eng.uber.com/dsw/) - bruker data (om hente- og leveringssteder, turvarighet, foretrukne ruter osv.) samlet fra millioner av Uber-turer *daglig* for å bygge et dataanalyseverktøy som hjelper med prissetting, sikkerhet, svindeldeteksjon og navigasjonsbeslutninger. * [Sports Analytics](https://towardsdatascience.com/scope-of-analytics-in-sports-world-37ed09c39860) - fokuserer på _prediktiv analyse_ (lag- og spilleranalyse - tenk [Moneyball](https://datasciencedegree.wisconsin.edu/blog/moneyball-proves-importance-big-data-big-ideas/) - og fanhåndtering) og _datavisualisering_ (lag- og fandashboards, spill osv.) med applikasjoner som talentspeiding, sportsbetting og inventar-/arenaadministrasjon. - * [Data Science i Banksektoren](https://data-flair.training/blogs/data-science-in-banking/) - fremhever verdien av data science i finansindustrien med applikasjoner som risikomodellering og svindeldeteksjon, kundesegmentering, sanntidsprediksjon og anbefalingssystemer. Prediktiv analyse driver også kritiske tiltak som [kredittscore](https://dzone.com/articles/using-big-data-and-predictive-analytics-for-credit). + * [Data Science i banksektoren](https://data-flair.training/blogs/data-science-in-banking/) - fremhever verdien av data science i finansindustrien med applikasjoner som risikomodellering og svindeldeteksjon, kundesegmentering, sanntidsprediksjon og anbefalingssystemer. Prediktiv analyse driver også kritiske tiltak som [kredittscore](https://dzone.com/articles/using-big-data-and-predictive-analytics-for-credit). - * [Data Science i Helsevesenet](https://data-flair.training/blogs/data-science-in-healthcare/) - fremhever applikasjoner som medisinsk bildediagnostikk (f.eks. MR, røntgen, CT-skanning), genomikk (DNA-sekvensering), legemiddelutvikling (risikovurdering, suksessprediksjon), prediktiv analyse (pasientbehandling og logistikk), sykdomssporing og forebygging. + * [Data Science i helsevesenet](https://data-flair.training/blogs/data-science-in-healthcare/) - fremhever applikasjoner som medisinsk bildediagnostikk (f.eks. MR, røntgen, CT-skanning), genomikk (DNA-sekvensering), legemiddelutvikling (risikovurdering, suksessprediksjon), prediktiv analyse (pasientomsorg og logistikk), sykdomssporing og forebygging osv. -![Data Science Applications in The Real World](../../../../6-Data-Science-In-Wild/20-Real-World-Examples/images/data-science-applications.png) Bildekreditt: [Data Flair: 6 Amazing Data Science Applications ](https://data-flair.training/blogs/data-science-applications/) +![Data Science-applikasjoner i den virkelige verden](../../../../translated_images/data-science-applications.4e5019cd8790ebac2277ff5f08af386f8727cac5d30f77727c7090677e6adb9c.no.png) Bildekreditt: [Data Flair: 6 Amazing Data Science Applications ](https://data-flair.training/blogs/data-science-applications/) -Figuren viser andre domener og eksempler på bruk av data science-teknikker. Vil du utforske andre applikasjoner? Sjekk ut [Gjennomgang og Selvstudium](../../../../6-Data-Science-In-Wild/20-Real-World-Examples)-seksjonen nedenfor. +Figuren viser andre domener og eksempler på anvendelse av data science-teknikker. Vil du utforske andre applikasjoner? Sjekk ut [Gjennomgang og selvstudium](../../../../6-Data-Science-In-Wild/20-Real-World-Examples)-seksjonen nedenfor. ## Data Science + Forskning @@ -51,28 +51,28 @@ Figuren viser andre domener og eksempler på bruk av data science-teknikker. Vil | :---------------------------------------------------------------------------------------------------------------: | | Data Science & Forskning - _Sketchnote av [@nitya](https://twitter.com/nitya)_ | -Mens virkelige applikasjoner ofte fokuserer på bruksområder i industrien i stor skala, kan _forskningsapplikasjoner_ og prosjekter være nyttige fra to perspektiver: +Mens virkelige applikasjoner ofte fokuserer på bruksområder i stor skala, kan _forskningsprosjekter_ være nyttige fra to perspektiver: * _innovasjonsmuligheter_ - utforske rask prototyping av avanserte konsepter og testing av brukeropplevelser for neste generasjons applikasjoner. -* _utfordringer ved implementering_ - undersøke potensielle skader eller utilsiktede konsekvenser av data science-teknologier i virkelige sammenhenger. +* _utfordringer ved implementering_ - undersøke potensielle skader eller utilsiktede konsekvenser av data science-teknologier i virkelige kontekster. -For studenter kan disse forskningsprosjektene gi både lærings- og samarbeidsmuligheter som kan forbedre forståelsen av emnet og utvide bevisstheten og engasjementet med relevante personer eller team som jobber innen interesseområder. Hvordan ser forskningsprosjekter ut, og hvordan kan de ha en innvirkning? +For studenter kan disse forskningsprosjektene gi både lærings- og samarbeidsmuligheter som kan forbedre forståelsen av emnet og utvide bevisstheten og engasjementet med relevante personer eller team som jobber innen interesseområder. Så hvordan ser forskningsprosjekter ut, og hvordan kan de ha en innvirkning? -La oss se på ett eksempel - [MIT Gender Shades Study](http://gendershades.org/overview.html) av Joy Buolamwini (MIT Media Labs) med en [signaturforskningsartikkel](http://proceedings.mlr.press/v81/buolamwini18a/buolamwini18a.pdf) medforfattet av Timnit Gebru (den gang ved Microsoft Research) som fokuserte på: +La oss se på ett eksempel - [MIT Gender Shades Study](http://gendershades.org/overview.html) fra Joy Buolamwini (MIT Media Labs) med en [signatur forskningsartikkel](http://proceedings.mlr.press/v81/buolamwini18a/buolamwini18a.pdf) medforfattet av Timnit Gebru (da ved Microsoft Research) som fokuserte på: - * **Hva:** Målet med forskningsprosjektet var å _evaluere skjevheter i automatiserte ansiktsanalysealgoritmer og datasett_ basert på kjønn og hudtype. - * **Hvorfor:** Ansiktsanalyse brukes i områder som rettshåndhevelse, flyplassikkerhet, ansettelsessystemer og mer - sammenhenger der unøyaktige klassifiseringer (f.eks. på grunn av skjevheter) kan forårsake økonomiske og sosiale skader for berørte individer eller grupper. Å forstå (og eliminere eller redusere) skjevheter er nøkkelen til rettferdighet i bruk. - * **Hvordan:** Forskerne oppdaget at eksisterende referansedata hovedsakelig brukte personer med lysere hud, og kuraterte et nytt datasett (1000+ bilder) som var _mer balansert_ med hensyn til kjønn og hudtype. Datasettet ble brukt til å evaluere nøyaktigheten til tre kjønnsklassifiseringsprodukter (fra Microsoft, IBM og Face++). + * **Hva:** Målet med forskningsprosjektet var å _evaluere bias i automatiserte ansiktsanalysealgoritmer og datasett_ basert på kjønn og hudtype. + * **Hvorfor:** Ansiktsanalyse brukes i områder som rettshåndhevelse, flyplassikkerhet, ansettelsessystemer og mer - kontekster der unøyaktige klassifiseringer (f.eks. på grunn av bias) kan forårsake potensielle økonomiske og sosiale skader for berørte individer eller grupper. Å forstå (og eliminere eller redusere) bias er nøkkelen til rettferdighet i bruk. + * **Hvordan:** Forskerne anerkjente at eksisterende benchmarks hovedsakelig brukte lysere hudtoner, og kuraterte et nytt datasett (1000+ bilder) som var _mer balansert_ etter kjønn og hudtype. Datasettet ble brukt til å evaluere nøyaktigheten til tre kjønnsklassifiseringsprodukter (fra Microsoft, IBM & Face++). -Resultatene viste at selv om den generelle klassifiseringsnøyaktigheten var god, var det en merkbar forskjell i feilrater mellom ulike undergrupper - med **feilkjønning** som var høyere for kvinner eller personer med mørkere hudtyper, noe som indikerte skjevheter. +Resultatene viste at selv om den totale klassifiseringsnøyaktigheten var god, var det en merkbar forskjell i feilrater mellom ulike undergrupper - med **feilkjønning** som var høyere for kvinner eller personer med mørkere hudtoner, noe som indikerer bias. -**Viktige Resultater:** Økt bevissthet om at data science trenger mer _representative datasett_ (balanserte undergrupper) og mer _inkluderende team_ (mangfoldige bakgrunner) for å oppdage og eliminere eller redusere slike skjevheter tidligere i AI-løsninger. Forskningsinnsatser som dette er også avgjørende for at mange organisasjoner kan definere prinsipper og praksiser for _ansvarlig AI_ for å forbedre rettferdighet i deres AI-produkter og prosesser. +**Viktige resultater:** Skapte oppmerksomhet rundt behovet for _representative datasett_ (balanserte undergrupper) og _inkluderende team_ (mangfoldige bakgrunner) for å gjenkjenne og eliminere eller redusere slike bias tidlig i AI-løsninger. Forskningsinnsats som dette er også avgjørende for at mange organisasjoner kan definere prinsipper og praksis for _ansvarlig AI_ for å forbedre rettferdighet i deres AI-produkter og prosesser. **Vil du lære om relevante forskningsinnsatser hos Microsoft?** * Sjekk ut [Microsoft Research Projects](https://www.microsoft.com/research/research-area/artificial-intelligence/?facet%5Btax%5D%5Bmsr-research-area%5D%5B%5D=13556&facet%5Btax%5D%5Bmsr-content-type%5D%5B%5D=msr-project) innen kunstig intelligens. * Utforsk studentprosjekter fra [Microsoft Research Data Science Summer School](https://www.microsoft.com/en-us/research/academic-program/data-science-summer-school/). -* Sjekk ut [Fairlearn](https://fairlearn.org/)-prosjektet og [Ansvarlig AI](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1%3aprimaryr6)-initiativene. +* Sjekk ut [Fairlearn](https://fairlearn.org/) prosjektet og [Responsible AI](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1%3aprimaryr6) initiativer. ## Data Science + Humaniora @@ -80,21 +80,21 @@ Resultatene viste at selv om den generelle klassifiseringsnøyaktigheten var god | :---------------------------------------------------------------------------------------------------------------: | | Data Science & Digitale Humaniora - _Sketchnote av [@nitya](https://twitter.com/nitya)_ | -Digitale Humaniora [er definert](https://digitalhumanities.stanford.edu/about-dh-stanford) som "en samling av praksiser og tilnærminger som kombinerer beregningsmetoder med humanistisk undersøkelse". [Stanford-prosjekter](https://digitalhumanities.stanford.edu/projects) som _"rebooting history"_ og _"poetic thinking"_ illustrerer koblingen mellom [Digitale Humaniora og Data Science](https://digitalhumanities.stanford.edu/digital-humanities-and-data-science) - med vekt på teknikker som nettverksanalyse, informasjonsvisualisering, romlig og tekstanalyse som kan hjelpe oss med å gjenbesøke historiske og litterære datasett for å utlede nye innsikter og perspektiver. +Digitale humaniora [er definert](https://digitalhumanities.stanford.edu/about-dh-stanford) som "en samling av praksiser og tilnærminger som kombinerer beregningsmetoder med humanistisk forskning". [Stanford-prosjekter](https://digitalhumanities.stanford.edu/projects) som _"rebooting history"_ og _"poetic thinking"_ illustrerer koblingen mellom [Digitale Humaniora og Data Science](https://digitalhumanities.stanford.edu/digital-humanities-and-data-science) - med vekt på teknikker som nettverksanalyse, informasjonsvisualisering, romlig og tekstanalyse som kan hjelpe oss med å gjenbesøke historiske og litterære datasett for å utlede nye innsikter og perspektiver. *Vil du utforske og utvide et prosjekt innen dette området?* -Sjekk ut ["Emily Dickinson and the Meter of Mood"](https://gist.github.com/jlooper/ce4d102efd057137bc000db796bfd671) - et flott eksempel fra [Jen Looper](https://twitter.com/jenlooper) som spør hvordan vi kan bruke data science til å gjenbesøke kjent poesi og revurdere dens betydning og bidragene fra forfatteren i nye sammenhenger. For eksempel, _kan vi forutsi hvilken årstid et dikt ble skrevet i ved å analysere tonen eller sentimentet_ - og hva forteller dette oss om forfatterens sinnstilstand i den aktuelle perioden? +Sjekk ut ["Emily Dickinson and the Meter of Mood"](https://gist.github.com/jlooper/ce4d102efd057137bc000db796bfd671) - et flott eksempel fra [Jen Looper](https://twitter.com/jenlooper) som spør hvordan vi kan bruke data science til å gjenbesøke kjent poesi og revurdere dens betydning og bidrag fra forfatteren i nye kontekster. For eksempel, _kan vi forutsi hvilken sesong et dikt ble skrevet i ved å analysere tonen eller sentimentet_ - og hva forteller dette oss om forfatterens sinnstilstand i den aktuelle perioden? For å svare på det spørsmålet følger vi trinnene i livssyklusen for data science: - * [`Dataanskaffelse`](https://gist.github.com/jlooper/ce4d102efd057137bc000db796bfd671#acquiring-the-dataset) - for å samle inn et relevant datasett for analyse. Alternativer inkluderer bruk av en API (f.eks. [Poetry DB API](https://poetrydb.org/index.html)) eller skraping av nettsider (f.eks. [Project Gutenberg](https://www.gutenberg.org/files/12242/12242-h/12242-h.htm)) ved hjelp av verktøy som [Scrapy](https://scrapy.org/). - * [`Datavask`](https://gist.github.com/jlooper/ce4d102efd057137bc000db796bfd671#clean-the-data) - forklarer hvordan tekst kan formateres, renses og forenkles ved hjelp av grunnleggende verktøy som Visual Studio Code og Microsoft Excel. - * [`Dataanalyse`](https://gist.github.com/jlooper/ce4d102efd057137bc000db796bfd671#working-with-the-data-in-a-notebook) - forklarer hvordan vi nå kan importere datasettet til "Notebooks" for analyse ved hjelp av Python-pakker (som pandas, numpy og matplotlib) for å organisere og visualisere dataene. - * [`Sentimentanalyse`](https://gist.github.com/jlooper/ce4d102efd057137bc000db796bfd671#sentiment-analysis-using-cognitive-services) - forklarer hvordan vi kan integrere skytjenester som Text Analytics, ved hjelp av lavkodeverktøy som [Power Automate](https://flow.microsoft.com/en-us/) for automatiserte databehandlingsarbeidsflyter. + * [`Data Acquisition`](https://gist.github.com/jlooper/ce4d102efd057137bc000db796bfd671#acquiring-the-dataset) - for å samle inn et relevant datasett for analyse. Alternativer inkluderer bruk av en API (f.eks. [Poetry DB API](https://poetrydb.org/index.html)) eller scraping av nettsider (f.eks. [Project Gutenberg](https://www.gutenberg.org/files/12242/12242-h/12242-h.htm)) ved hjelp av verktøy som [Scrapy](https://scrapy.org/). + * [`Data Cleaning`](https://gist.github.com/jlooper/ce4d102efd057137bc000db796bfd671#clean-the-data) - forklarer hvordan tekst kan formateres, renses og forenkles ved hjelp av grunnleggende verktøy som Visual Studio Code og Microsoft Excel. + * [`Data Analysis`](https://gist.github.com/jlooper/ce4d102efd057137bc000db796bfd671#working-with-the-data-in-a-notebook) - forklarer hvordan vi nå kan importere datasettet til "Notebooks" for analyse ved hjelp av Python-pakker (som pandas, numpy og matplotlib) for å organisere og visualisere dataene. + * [`Sentiment Analysis`](https://gist.github.com/jlooper/ce4d102efd057137bc000db796bfd671#sentiment-analysis-using-cognitive-services) - forklarer hvordan vi kan integrere skytjenester som Text Analytics, ved hjelp av lavkodeverktøy som [Power Automate](https://flow.microsoft.com/en-us/) for automatiserte databehandlingsarbeidsflyter. -Ved å bruke denne arbeidsflyten kan vi utforske sesongmessige påvirkninger på sentimentet i diktene og hjelpe oss med å forme våre egne perspektiver på forfatteren. Prøv det selv - og utvid deretter notatboken for å stille andre spørsmål eller visualisere dataene på nye måter! +Ved å bruke denne arbeidsflyten kan vi utforske sesongmessige påvirkninger på sentimentet i diktene, og hjelpe oss med å forme våre egne perspektiver på forfatteren. Prøv det selv - og utvid deretter notatboken for å stille andre spørsmål eller visualisere dataene på nye måter! -> Du kan bruke noen av verktøyene i [Digital Humanities Toolkit](https://github.com/Digital-Humanities-Toolkit) for å forfølge disse undersøkelsene. +> Du kan bruke noen av verktøyene i [Digital Humanities toolkit](https://github.com/Digital-Humanities-Toolkit) for å forfølge disse undersøkelsesområdene. ## Data Science + Bærekraft @@ -102,48 +102,49 @@ Ved å bruke denne arbeidsflyten kan vi utforske sesongmessige påvirkninger på | :---------------------------------------------------------------------------------------------------------------: | | Data Science & Bærekraft - _Sketchnote av [@nitya](https://twitter.com/nitya)_ | -[2030 Agenda for Bærekraftig Utvikling](https://sdgs.un.org/2030agenda) - vedtatt av alle FN-medlemmer i 2015 - identifiserer 17 mål, inkludert mål som fokuserer på **å beskytte planeten** mot degradering og virkningen av klimaendringer. [Microsoft Sustainability](https://www.microsoft.com/en-us/sustainability)-initiativet støtter disse målene ved å utforske måter teknologiløsninger kan støtte og bygge mer bærekraftige fremtider med et [fokus på 4 mål](https://dev.to/azure/a-visual-guide-to-sustainable-software-engineering-53hh) - å være karbonnegative, vannpositive, null avfall og biologisk mangfoldige innen 2030. +[2030 Agenda For Sustainable Development](https://sdgs.un.org/2030agenda) - vedtatt av alle FN-medlemmer i 2015 - identifiserer 17 mål, inkludert de som fokuserer på **beskytte planeten** mot nedbrytning og virkningen av klimaendringer. [Microsoft Sustainability](https://www.microsoft.com/en-us/sustainability)-initiativet støtter disse målene ved å utforske måter teknologiløsninger kan bidra til å bygge mer bærekraftige fremtider med et [fokus på 4 mål](https://dev.to/azure/a-visual-guide-to-sustainable-software-engineering-53hh) - være karbonnegative, vannpositive, null avfall og biologisk mangfoldige innen 2030. -Å takle disse utfordringene på en skalerbar og tidsriktig måte krever tenkning i skyskala - og store mengder data. [Planetary Computer](https://planetarycomputer.microsoft.com/)-initiativet gir 4 komponenter for å hjelpe dataforskere og utviklere i denne innsatsen: - - * [Data Catalog](https://planetarycomputer.microsoft.com/catalog) - med petabyte av data om jordens systemer (gratis og Azure-hostet). +Å takle disse utfordringene på en skalerbar og tidsriktig måte krever tenkning i sky-skala - og store mengder data. [Planetary Computer](https://planetarycomputer.microsoft.com/)-initiativet gir 4 komponenter for å hjelpe dataforskere og utviklere i denne innsatsen: + + * [Data Catalog](https://planetarycomputer.microsoft.com/catalog) - med petabyte av Earth Systems-data (gratis og Azure-hostet). * [Planetary API](https://planetarycomputer.microsoft.com/docs/reference/stac/) - for å hjelpe brukere med å søke etter relevante data på tvers av rom og tid. - * [Hub](https://planetarycomputer.microsoft.com/docs/overview/environment/) - et administrert miljø for forskere til å behandle massive geospatiale datasett. - * [Applikasjoner](https://planetarycomputer.microsoft.com/applications) - viser bruksområder og verktøy for bærekraftige innsikter. -**Planetary Computer-prosjektet er for øyeblikket i forhåndsvisning (per september 2021)** – her er hvordan du kan komme i gang med å bidra til bærekraftige løsninger ved hjelp av dataanalyse. + * [Hub](https://planetarycomputer.microsoft.com/docs/overview/environment/) - administrert miljø for forskere til å behandle massive geospatiale datasett. + * [Applications](https://planetarycomputer.microsoft.com/applications) - viser bruksområder og verktøy for bærekraftige innsikter. +**Planetary Computer-prosjektet er for øyeblikket i forhåndsvisning (per september 2021)** - her er hvordan du kan komme i gang med å bidra til bærekraftige løsninger ved hjelp av dataanalyse. -* [Be om tilgang](https://planetarycomputer.microsoft.com/account/request) for å starte utforskningen og koble deg til andre. -* [Utforsk dokumentasjonen](https://planetarycomputer.microsoft.com/docs/overview/about) for å forstå hvilke datasett og API-er som støttes. +* [Be om tilgang](https://planetarycomputer.microsoft.com/account/request) for å starte utforskning og koble deg til andre. +* [Utforsk dokumentasjon](https://planetarycomputer.microsoft.com/docs/overview/about) for å forstå støttede datasett og API-er. * Utforsk applikasjoner som [Ecosystem Monitoring](https://analytics-lab.org/ecosystemmonitoring/) for inspirasjon til applikasjonsideer. Tenk på hvordan du kan bruke datavisualisering for å avdekke eller forsterke relevante innsikter innen områder som klimaendringer og avskoging. Eller vurder hvordan innsikter kan brukes til å skape nye brukeropplevelser som motiverer til atferdsendringer for et mer bærekraftig liv. ## Dataanalyse + Studenter -Vi har snakket om virkelige applikasjoner i industrien og forskningen, og utforsket eksempler på dataanalyseapplikasjoner innen digital humaniora og bærekraft. Så hvordan kan du bygge ferdighetene dine og dele ekspertisen din som nybegynner innen dataanalyse? +Vi har snakket om virkelige applikasjoner i industri og forskning, og utforsket eksempler på dataanalyseapplikasjoner innen digitale humaniora og bærekraft. Så hvordan kan du bygge ferdighetene dine og dele ekspertisen din som nybegynner innen dataanalyse? -Her er noen eksempler på studentprosjekter innen dataanalyse for å inspirere deg. +Her er noen eksempler på studentprosjekter innen dataanalyse for inspirasjon. * [MSR Data Science Summer School](https://www.microsoft.com/en-us/research/academic-program/data-science-summer-school/#!projects) med GitHub [prosjekter](https://github.com/msr-ds3) som utforsker temaer som: - - [Rasistisk skjevhet i politiets bruk av makt](https://www.microsoft.com/en-us/research/video/data-science-summer-school-2019-replicating-an-empirical-analysis-of-racial-differences-in-police-use-of-force/) | [Github](https://github.com/msr-ds3/stop-question-frisk) + - [Rasistisk bias i politiets bruk av makt](https://www.microsoft.com/en-us/research/video/data-science-summer-school-2019-replicating-an-empirical-analysis-of-racial-differences-in-police-use-of-force/) | [Github](https://github.com/msr-ds3/stop-question-frisk) - [Påliteligheten til New Yorks T-banesystem](https://www.microsoft.com/en-us/research/video/data-science-summer-school-2018-exploring-the-reliability-of-the-nyc-subway-system/) | [Github](https://github.com/msr-ds3/nyctransit) -* [Digitalisering av materiell kultur: Utforsking av sosioøkonomiske fordelinger i Sirkap](https://claremont.maps.arcgis.com/apps/Cascade/index.html?appid=bdf2aef0f45a4674ba41cd373fa23afc) – fra [Ornella Altunyan](https://twitter.com/ornelladotcom) og teamet ved Claremont, ved bruk av [ArcGIS StoryMaps](https://storymaps.arcgis.com/). +* [Digitalisering av materiell kultur: Utforsking av sosioøkonomiske fordelinger i Sirkap](https://claremont.maps.arcgis.com/apps/Cascade/index.html?appid=bdf2aef0f45a4674ba41cd373fa23afc) - fra [Ornella Altunyan](https://twitter.com/ornelladotcom) og teamet ved Claremont, ved bruk av [ArcGIS StoryMaps](https://storymaps.arcgis.com/). ## 🚀 Utfordring -Søk etter artikler som anbefaler nybegynnervennlige dataanalyseprosjekter – som [disse 50 temaområdene](https://www.upgrad.com/blog/data-science-project-ideas-topics-beginners/) eller [disse 21 prosjektideene](https://www.intellspot.com/data-science-project-ideas) eller [disse 16 prosjektene med kildekode](https://data-flair.training/blogs/data-science-project-ideas/) som du kan dekonstruere og remikse. Og ikke glem å blogge om læringsreisen din og dele innsiktene dine med oss alle. +Søk etter artikler som anbefaler dataanalyseprosjekter som er nybegynnervennlige - som [disse 50 temaområdene](https://www.upgrad.com/blog/data-science-project-ideas-topics-beginners/) eller [disse 21 prosjektideene](https://www.intellspot.com/data-science-project-ideas) eller [disse 16 prosjektene med kildekode](https://data-flair.training/blogs/data-science-project-ideas/) som du kan dekonstruere og remikse. Og ikke glem å blogge om læringsreisen din og dele innsiktene dine med oss alle. ## Quiz etter forelesning ## [Quiz etter forelesning](https://ff-quizzes.netlify.app/en/ds/quiz/39) -## Gjennomgang og selvstudium +## Gjennomgang & Selvstudium Vil du utforske flere bruksområder? Her er noen relevante artikler: -* [17 Data Science Applications and Examples](https://builtin.com/data-science/data-science-applications-examples) – juli 2021 -* [11 Breathtaking Data Science Applications in Real World](https://myblindbird.com/data-science-applications-real-world/) – mai 2021 -* [Data Science In The Real World](https://towardsdatascience.com/data-science-in-the-real-world/home) – Artikkelsamling -* Dataanalyse innen: [Utdanning](https://data-flair.training/blogs/data-science-in-education/), [Landbruk](https://data-flair.training/blogs/data-science-in-agriculture/), [Finans](https://data-flair.training/blogs/data-science-in-finance/), [Film](https://data-flair.training/blogs/data-science-at-movies/) og mer. +* [17 applikasjoner og eksempler innen dataanalyse](https://builtin.com/data-science/data-science-applications-examples) - juli 2021 +* [11 imponerende applikasjoner innen dataanalyse i den virkelige verden](https://myblindbird.com/data-science-applications-real-world/) - mai 2021 +* [Dataanalyse i den virkelige verden](https://towardsdatascience.com/data-science-in-the-real-world/home) - artikkelsamling +* [12 virkelige applikasjoner innen dataanalyse med eksempler](https://www.scaler.com/blog/data-science-applications/) - mai 2024 +* Dataanalyse innen: [Utdanning](https://data-flair.training/blogs/data-science-in-education/), [Landbruk](https://data-flair.training/blogs/data-science-in-agriculture/), [Finans](https://data-flair.training/blogs/data-science-in-finance/), [Film](https://data-flair.training/blogs/data-science-at-movies/), [Helsevesen](https://onlinedegrees.sandiego.edu/data-science-health-care/) og mer. ## Oppgave @@ -152,4 +153,4 @@ Vil du utforske flere bruksområder? Her er noen relevante artikler: --- **Ansvarsfraskrivelse**: -Dette dokumentet er oversatt ved hjelp av AI-oversettelsestjenesten [Co-op Translator](https://github.com/Azure/co-op-translator). Selv om vi tilstreber nøyaktighet, vennligst vær oppmerksom på at automatiske oversettelser kan inneholde feil eller unøyaktigheter. Det originale dokumentet på sitt opprinnelige språk bør anses som den autoritative kilden. For kritisk informasjon anbefales profesjonell menneskelig oversettelse. Vi er ikke ansvarlige for eventuelle misforståelser eller feiltolkninger som oppstår ved bruk av denne oversettelsen. \ No newline at end of file +Dette dokumentet er oversatt ved hjelp av AI-oversettelsestjenesten [Co-op Translator](https://github.com/Azure/co-op-translator). Selv om vi streber etter nøyaktighet, vær oppmerksom på at automatiserte oversettelser kan inneholde feil eller unøyaktigheter. Det originale dokumentet på sitt opprinnelige språk bør anses som den autoritative kilden. For kritisk informasjon anbefales profesjonell menneskelig oversettelse. Vi er ikke ansvarlige for misforståelser eller feiltolkninger som oppstår ved bruk av denne oversettelsen. \ No newline at end of file diff --git a/translations/pa/6-Data-Science-In-Wild/20-Real-World-Examples/README.md b/translations/pa/6-Data-Science-In-Wild/20-Real-World-Examples/README.md index 04603a0e..4c8e7f8c 100644 --- a/translations/pa/6-Data-Science-In-Wild/20-Real-World-Examples/README.md +++ b/translations/pa/6-Data-Science-In-Wild/20-Real-World-Examples/README.md @@ -1,8 +1,8 @@ # Data Science w Rzeczywistym Świecie -| ![ Sketchnote by [(@sketchthedocs)](https://sketchthedocs.dev) ](../../sketchnotes/20-DataScience-RealWorld.png) | +| ![ Sketchnote autorstwa [(@sketchthedocs)](https://sketchthedocs.dev) ](../../sketchnotes/20-DataScience-RealWorld.png) | | :--------------------------------------------------------------------------------------------------------------: | -| Data Science w Rzeczywistym Świecie - _Sketchnote by [@nitya](https://twitter.com/nitya)_ | +| Data Science w Rzeczywistym Świecie - _Sketchnote autorstwa [@nitya](https://twitter.com/nitya)_ | Jesteśmy prawie na końcu tej podróży edukacyjnej! -Zaczęliśmy od definicji data science i etyki, zgłębiliśmy różne narzędzia i techniki analizy oraz wizualizacji danych, przeanalizowaliśmy cykl życia data science, a także omówiliśmy skalowanie i automatyzację procesów data science za pomocą usług chmurowych. Pewnie zastanawiasz się: _"Jak dokładnie mogę przełożyć te wszystkie nauki na rzeczywiste konteksty?"_ +Zaczęliśmy od definicji data science i etyki, zgłębiliśmy różne narzędzia i techniki analizy oraz wizualizacji danych, przeanalizowaliśmy cykl życia data science, a także przyjrzeliśmy się skalowaniu i automatyzacji procesów data science za pomocą usług chmurowych. Pewnie zastanawiasz się: _"Jak dokładnie przełożyć te wszystkie nauki na rzeczywiste konteksty?"_ W tej lekcji przyjrzymy się zastosowaniom data science w różnych branżach i zagłębimy się w konkretne przykłady z obszarów badań, humanistyki cyfrowej i zrównoważonego rozwoju. Omówimy również możliwości projektów studenckich i zakończymy przydatnymi zasobami, które pomogą Ci kontynuować naukę! @@ -25,48 +25,48 @@ W tej lekcji przyjrzymy się zastosowaniom data science w różnych branżach i ## Data Science + Przemysł -Dzięki demokratyzacji AI, programistom jest teraz łatwiej projektować i integrować decyzje oparte na sztucznej inteligencji oraz wgląd w dane w doświadczenia użytkowników i procesy rozwojowe. Oto kilka przykładów, jak data science jest "stosowane" w rzeczywistych aplikacjach w przemyśle: +Dzięki demokratyzacji AI, programistom jest teraz łatwiej projektować i integrować decyzje oparte na sztucznej inteligencji oraz wgląd w dane w doświadczenia użytkowników i procesy deweloperskie. Oto kilka przykładów, jak data science jest "stosowane" w rzeczywistych aplikacjach w przemyśle: - * [Google Flu Trends](https://www.wired.com/2015/10/can-learn-epic-failure-google-flu-trends/) wykorzystało data science do korelacji wyszukiwanych haseł z trendami grypy. Choć podejście miało swoje wady, zwróciło uwagę na możliwości (i wyzwania) związane z prognozowaniem zdrowotnym opartym na danych. + * [Google Flu Trends](https://www.wired.com/2015/10/can-learn-epic-failure-google-flu-trends/) wykorzystało data science do korelacji wyszukiwanych haseł z trendami grypy. Choć podejście miało swoje wady, zwróciło uwagę na możliwości (i wyzwania) związane z predykcjami zdrowotnymi opartymi na danych. * [UPS Routing Predictions](https://www.technologyreview.com/2018/11/21/139000/how-ups-uses-ai-to-outsmart-bad-weather/) - opisuje, jak UPS wykorzystuje data science i uczenie maszynowe do przewidywania optymalnych tras dostaw, uwzględniając warunki pogodowe, wzorce ruchu, terminy dostaw i inne czynniki. * [NYC Taxicab Route Visualization](http://chriswhong.github.io/nyctaxi/) - dane zebrane dzięki [Freedom Of Information Laws](https://chriswhong.com/open-data/foil_nyc_taxi/) pomogły zwizualizować dzień z życia nowojorskich taksówek, pokazując, jak poruszają się po zatłoczonym mieście, ile zarabiają i jak długo trwają ich kursy w ciągu 24 godzin. - * [Uber Data Science Workbench](https://eng.uber.com/dsw/) - wykorzystuje dane (o miejscach odbioru i wysiadania, czasie trwania podróży, preferowanych trasach itp.) zebrane z milionów codziennych przejazdów Ubera do budowy narzędzia analitycznego wspierającego wyceny, bezpieczeństwo, wykrywanie oszustw i decyzje nawigacyjne. + * [Uber Data Science Workbench](https://eng.uber.com/dsw/) - wykorzystuje dane (o miejscach odbioru i wysiadania, czasie trwania podróży, preferowanych trasach itp.) zbierane codziennie z milionów przejazdów Ubera do budowy narzędzia analitycznego wspierającego wyceny, bezpieczeństwo, wykrywanie oszustw i decyzje nawigacyjne. - * [Sports Analytics](https://towardsdatascience.com/scope-of-analytics-in-sports-world-37ed09c39860) - koncentruje się na _analizie predykcyjnej_ (analiza drużyn i zawodników - np. [Moneyball](https://datasciencedegree.wisconsin.edu/blog/moneyball-proves-importance-big-data-big-ideas/) - oraz zarządzanie fanami) i _wizualizacji danych_ (dashboardy drużyn i fanów, gry itp.) z zastosowaniami takimi jak scouting talentów, zakłady sportowe i zarządzanie obiektami/wydarzeniami. + * [Analiza Sportowa](https://towardsdatascience.com/scope-of-analytics-in-sports-world-37ed09c39860) - koncentruje się na _analizie predykcyjnej_ (analiza drużyn i zawodników - np. [Moneyball](https://datasciencedegree.wisconsin.edu/blog/moneyball-proves-importance-big-data-big-ideas/) - oraz zarządzanie fanami) i _wizualizacji danych_ (pulpity drużyn i fanów, gry itp.) z zastosowaniami takimi jak scouting talentów, zakłady sportowe i zarządzanie obiektami/wydarzeniami. - * [Data Science w Bankowości](https://data-flair.training/blogs/data-science-in-banking/) - podkreśla wartość data science w branży finansowej, z zastosowaniami od modelowania ryzyka i wykrywania oszustw, po segmentację klientów, prognozowanie w czasie rzeczywistym i systemy rekomendacji. Analiza predykcyjna napędza również kluczowe wskaźniki, takie jak [oceny kredytowe](https://dzone.com/articles/using-big-data-and-predictive-analytics-for-credit). + * [Data Science w Bankowości](https://data-flair.training/blogs/data-science-in-banking/) - podkreśla wartość data science w branży finansowej, z zastosowaniami od modelowania ryzyka i wykrywania oszustw, po segmentację klientów, predykcję w czasie rzeczywistym i systemy rekomendacyjne. Analiza predykcyjna napędza również kluczowe wskaźniki, takie jak [oceny kredytowe](https://dzone.com/articles/using-big-data-and-predictive-analytics-for-credit). - * [Data Science w Ochronie Zdrowia](https://data-flair.training/blogs/data-science-in-healthcare/) - podkreśla zastosowania takie jak obrazowanie medyczne (np. MRI, RTG, tomografia komputerowa), genomika (sekwencjonowanie DNA), rozwój leków (ocena ryzyka, prognozowanie sukcesu), analiza predykcyjna (opieka nad pacjentem i logistyka dostaw), śledzenie i zapobieganie chorobom itp. + * [Data Science w Ochronie Zdrowia](https://data-flair.training/blogs/data-science-in-healthcare/) - podkreśla zastosowania takie jak obrazowanie medyczne (np. MRI, RTG, tomografia komputerowa), genomika (sekwencjonowanie DNA), rozwój leków (ocena ryzyka, przewidywanie sukcesu), analiza predykcyjna (opieka nad pacjentem i logistyka dostaw), śledzenie i zapobieganie chorobom itp. -![Zastosowania Data Science w Rzeczywistym Świecie](../../../../6-Data-Science-In-Wild/20-Real-World-Examples/images/data-science-applications.png) Źródło obrazu: [Data Flair: 6 Amazing Data Science Applications ](https://data-flair.training/blogs/data-science-applications/) +![Zastosowania Data Science w Rzeczywistym Świecie](../../../../translated_images/data-science-applications.4e5019cd8790ebac2277ff5f08af386f8727cac5d30f77727c7090677e6adb9c.pl.png) Źródło obrazu: [Data Flair: 6 Amazing Data Science Applications ](https://data-flair.training/blogs/data-science-applications/) -Grafika pokazuje inne dziedziny i przykłady zastosowania technik data science. Chcesz odkryć inne zastosowania? Sprawdź sekcję [Przegląd i Samodzielna Nauka](../../../../6-Data-Science-In-Wild/20-Real-World-Examples) poniżej. +Rysunek pokazuje inne dziedziny i przykłady zastosowania technik data science. Chcesz odkryć inne zastosowania? Sprawdź sekcję [Przegląd i Samodzielna Nauka](../../../../6-Data-Science-In-Wild/20-Real-World-Examples) poniżej. ## Data Science + Badania -| ![ Sketchnote by [(@sketchthedocs)](https://sketchthedocs.dev) ](../../sketchnotes/20-DataScience-Research.png) | +| ![ Sketchnote autorstwa [(@sketchthedocs)](https://sketchthedocs.dev) ](../../sketchnotes/20-DataScience-Research.png) | | :---------------------------------------------------------------------------------------------------------------: | -| Data Science i Badania - _Sketchnote by [@nitya](https://twitter.com/nitya)_ | +| Data Science & Badania - _Sketchnote autorstwa [@nitya](https://twitter.com/nitya)_ | -Podczas gdy rzeczywiste zastosowania często koncentrują się na przypadkach użycia w przemyśle na dużą skalę, zastosowania i projekty badawcze mogą być przydatne z dwóch perspektyw: +Podczas gdy rzeczywiste zastosowania często koncentrują się na przypadkach użycia w przemyśle na dużą skalę, zastosowania i projekty badawcze mogą być użyteczne z dwóch perspektyw: -* _możliwości innowacji_ - eksploracja szybkiego prototypowania zaawansowanych koncepcji i testowanie doświadczeń użytkowników dla aplikacji nowej generacji. +* _możliwości innowacji_ - eksploracja szybkiego prototypowania zaawansowanych koncepcji i testowanie doświadczeń użytkowników dla aplikacji przyszłości. * _wyzwania wdrożeniowe_ - badanie potencjalnych szkód lub niezamierzonych konsekwencji technologii data science w rzeczywistych kontekstach. -Dla studentów projekty badawcze mogą dostarczyć zarówno możliwości nauki, jak i współpracy, które poprawią zrozumienie tematu oraz poszerzą świadomość i zaangażowanie w pracę z odpowiednimi ludźmi lub zespołami działającymi w obszarach zainteresowań. Jak więc wyglądają projekty badawcze i jaki mogą mieć wpływ? +Dla studentów projekty badawcze mogą dostarczyć zarówno możliwości nauki, jak i współpracy, które poprawią zrozumienie tematu oraz poszerzą świadomość i zaangażowanie w pracę z odpowiednimi ludźmi lub zespołami w obszarach zainteresowań. Jak więc wyglądają projekty badawcze i jaki mogą mieć wpływ? Przyjrzyjmy się jednemu przykładowi - [MIT Gender Shades Study](http://gendershades.org/overview.html) autorstwa Joy Buolamwini (MIT Media Labs) z [kluczowym artykułem badawczym](http://proceedings.mlr.press/v81/buolamwini18a/buolamwini18a.pdf) współautorstwa Timnit Gebru (wówczas w Microsoft Research), który koncentrował się na: - * **Co:** Celem projektu badawczego była _ocena uprzedzeń obecnych w algorytmach i zbiorach danych do analizy twarzy_ w zależności od płci i koloru skóry. + * **Co:** Celem projektu badawczego była _ocena uprzedzeń obecnych w algorytmach i zbiorach danych do analizy twarzy_ w oparciu o płeć i typ skóry. * **Dlaczego:** Analiza twarzy jest wykorzystywana w takich obszarach jak egzekwowanie prawa, bezpieczeństwo na lotniskach, systemy rekrutacyjne i inne - konteksty, w których błędne klasyfikacje (np. z powodu uprzedzeń) mogą powodować potencjalne szkody ekonomiczne i społeczne dla dotkniętych osób lub grup. Zrozumienie (i eliminacja lub łagodzenie) uprzedzeń jest kluczowe dla sprawiedliwego użytkowania. - * **Jak:** Badacze zauważyli, że istniejące benchmarki wykorzystywały głównie osoby o jaśniejszej karnacji, i stworzyli nowy zbiór danych (ponad 1000 obrazów), który był _bardziej zrównoważony_ pod względem płci i koloru skóry. Zbiór danych został użyty do oceny dokładności trzech produktów do klasyfikacji płci (od Microsoft, IBM i Face++). + * **Jak:** Badacze zauważyli, że istniejące benchmarki wykorzystywały głównie osoby o jaśniejszej karnacji, i stworzyli nowy zbiór danych (ponad 1000 obrazów), który był _bardziej zrównoważony_ pod względem płci i typu skóry. Zbiór danych został wykorzystany do oceny dokładności trzech produktów do klasyfikacji płci (od Microsoft, IBM i Face++). -Wyniki pokazały, że choć ogólna dokładność klasyfikacji była dobra, zauważono znaczną różnicę w wskaźnikach błędów między różnymi podgrupami - z **większym błędem w klasyfikacji płci** dla kobiet i osób o ciemniejszej karnacji, co wskazuje na obecność uprzedzeń. +Wyniki pokazały, że choć ogólna dokładność klasyfikacji była dobra, zauważono znaczną różnicę w wskaźnikach błędów między różnymi podgrupami - z **błędnym przypisaniem płci** częściej występującym u kobiet lub osób o ciemniejszej karnacji, co wskazuje na uprzedzenia. -**Kluczowe Wyniki:** Zwrócono uwagę na to, że data science potrzebuje bardziej _reprezentatywnych zbiorów danych_ (zrównoważonych podgrup) i bardziej _inkluzjiwnych zespołów_ (zróżnicowane tła), aby wcześniej rozpoznawać i eliminować lub łagodzić takie uprzedzenia w rozwiązaniach AI. Takie badania są również kluczowe dla organizacji w definiowaniu zasad i praktyk dotyczących _odpowiedzialnej AI_, aby poprawić sprawiedliwość w ich produktach i procesach AI. +**Kluczowe Wyniki:** Zwrócono uwagę na to, że data science potrzebuje bardziej _reprezentatywnych zbiorów danych_ (zrównoważone podgrupy) i bardziej _inkluzji w zespołach_ (różnorodne tła), aby wcześniej rozpoznawać i eliminować lub łagodzić takie uprzedzenia w rozwiązaniach AI. Takie badania są również kluczowe dla wielu organizacji w definiowaniu zasad i praktyk dla _odpowiedzialnej AI_, aby poprawić sprawiedliwość w ich produktach i procesach AI. **Chcesz dowiedzieć się więcej o badaniach w Microsoft?** @@ -76,20 +76,20 @@ Wyniki pokazały, że choć ogólna dokładność klasyfikacji była dobra, zauw ## Data Science + Humanistyka -| ![ Sketchnote by [(@sketchthedocs)](https://sketchthedocs.dev) ](../../sketchnotes/20-DataScience-Humanities.png) | +| ![ Sketchnote autorstwa [(@sketchthedocs)](https://sketchthedocs.dev) ](../../sketchnotes/20-DataScience-Humanities.png) | | :---------------------------------------------------------------------------------------------------------------: | -| Data Science i Humanistyka Cyfrowa - _Sketchnote by [@nitya](https://twitter.com/nitya)_ | +| Data Science & Humanistyka Cyfrowa - _Sketchnote autorstwa [@nitya](https://twitter.com/nitya)_ | Humanistyka Cyfrowa [została zdefiniowana](https://digitalhumanities.stanford.edu/about-dh-stanford) jako "zbiór praktyk i podejść łączących metody obliczeniowe z badaniami humanistycznymi". [Projekty Stanforda](https://digitalhumanities.stanford.edu/projects) takie jak _"rebooting history"_ i _"poetic thinking"_ ilustrują powiązanie między [Humanistyką Cyfrową a Data Science](https://digitalhumanities.stanford.edu/digital-humanities-and-data-science) - podkreślając techniki takie jak analiza sieci, wizualizacja informacji, analiza przestrzenna i tekstowa, które mogą pomóc nam ponownie przeanalizować historyczne i literackie zbiory danych, aby uzyskać nowe wglądy i perspektywy. -*Chcesz odkryć i rozwinąć projekt w tej dziedzinie?* +*Chcesz zbadać i rozwinąć projekt w tej dziedzinie?* -Sprawdź ["Emily Dickinson and the Meter of Mood"](https://gist.github.com/jlooper/ce4d102efd057137bc000db796bfd671) - świetny przykład od [Jen Looper](https://twitter.com/jenlooper), który zadaje pytanie, jak możemy wykorzystać data science, aby ponownie przeanalizować znaną poezję i ocenić jej znaczenie oraz wkład autora w nowych kontekstach. Na przykład, _czy możemy przewidzieć porę roku, w której wiersz został napisany, analizując jego ton lub nastrój_ - i co to mówi nam o stanie umysłu autora w danym okresie? +Sprawdź ["Emily Dickinson and the Meter of Mood"](https://gist.github.com/jlooper/ce4d102efd057137bc000db796bfd671) - świetny przykład od [Jen Looper](https://twitter.com/jenlooper), który pyta, jak możemy wykorzystać data science, aby ponownie przeanalizować znaną poezję i zrewidować jej znaczenie oraz wkład autora w nowych kontekstach. Na przykład, _czy możemy przewidzieć porę roku, w której wiersz został napisany, analizując jego ton lub nastrój_ - i co to mówi nam o stanie umysłu autora w danym okresie? Aby odpowiedzieć na to pytanie, podążamy za krokami cyklu życia data science: * [`Pozyskiwanie Danych`](https://gist.github.com/jlooper/ce4d102efd057137bc000db796bfd671#acquiring-the-dataset) - aby zebrać odpowiedni zbiór danych do analizy. Opcje obejmują korzystanie z API (np. [Poetry DB API](https://poetrydb.org/index.html)) lub skrobanie stron internetowych (np. [Project Gutenberg](https://www.gutenberg.org/files/12242/12242-h/12242-h.htm)) za pomocą narzędzi takich jak [Scrapy](https://scrapy.org/). * [`Czyszczenie Danych`](https://gist.github.com/jlooper/ce4d102efd057137bc000db796bfd671#clean-the-data) - wyjaśnia, jak tekst może być formatowany, oczyszczany i upraszczany za pomocą podstawowych narzędzi, takich jak Visual Studio Code i Microsoft Excel. - * [`Analiza Danych`](https://gist.github.com/jlooper/ce4d102efd057137bc000db796bfd671#working-with-the-data-in-a-notebook) - wyjaśnia, jak możemy teraz zaimportować zbiór danych do "Notebooks" w celu analizy za pomocą pakietów Python (takich jak pandas, numpy i matplotlib) do organizowania i wizualizacji danych. + * [`Analiza Danych`](https://gist.github.com/jlooper/ce4d102efd057137bc000db796bfd671#working-with-the-data-in-a-notebook) - wyjaśnia, jak możemy teraz zaimportować zbiór danych do "Notebooks" w celu analizy za pomocą pakietów Python (takich jak pandas, numpy i matplotlib) do organizacji i wizualizacji danych. * [`Analiza Nastroju`](https://gist.github.com/jlooper/ce4d102efd057137bc000db796bfd671#sentiment-analysis-using-cognitive-services) - wyjaśnia, jak możemy zintegrować usługi chmurowe, takie jak Text Analytics, używając narzędzi niskokodowych, takich jak [Power Automate](https://flow.microsoft.com/en-us/) do automatyzacji przepływów pracy związanych z przetwarzaniem danych. Korzystając z tego przepływu pracy, możemy zbadać sezonowe wpływy na nastrój wierszy i pomóc nam wyrobić własne perspektywy na temat autora. Wypróbuj to sam - a następnie rozbuduj notebook, aby zadać inne pytania lub zwizualizować dane w nowy sposób! @@ -98,21 +98,21 @@ Korzystając z tego przepływu pracy, możemy zbadać sezonowe wpływy na nastr ## Data Science + Zrównoważony Rozwój -| ![ Sketchnote by [(@sketchthedocs)](https://sketchthedocs.dev) ](../../sketchnotes/20-DataScience-Sustainability.png) | +| ![ Sketchnote autorstwa [(@sketchthedocs)](https://sketchthedocs.dev) ](../../sketchnotes/20-DataScience-Sustainability.png) | | :---------------------------------------------------------------------------------------------------------------: | -| Data Science i Zrównoważony Rozwój - _Sketchnote by [@nitya](https://twitter.com/nitya)_ | +| Data Science & Zrównoważony Rozwój - _Sketchnote autorstwa [@nitya](https://twitter.com/nitya)_ | -[Agenda 2030 na rzecz Zrównoważonego Rozwoju](https://sdgs.un.org/2030agenda) - przyjęta przez wszystkich członków ONZ w 2015 roku - identyfikuje 17 celów, w tym te, które koncentrują się na **ochronie planety** przed degradacją i skutkami zmian klimatycznych. Inicjatywa [Microsoft Sustainability](https://www.microsoft.com/en-us/sustainability) wspiera te cele, badając, w jaki sposób rozwiązania technologiczne mogą wspierać i budować bardziej zrównoważoną przyszłość, koncentrując się na [4 głównych celach](https://dev.to/azure/a-visual-guide-to-sustainable-software-engineering-53hh) - bycie neutralnym węglowo, dodatnim pod względem wody, bezodpadowym i bioróżnorodnym do 2030 roku. +[Agenda 2030 na rzecz Zrównoważonego Rozwoju](https://sdgs.un.org/2030agenda) - przyjęta przez wszystkich członków ONZ w 2015 roku - identyfikuje 17 celów, w tym te, które koncentrują się na **Ochronie Planety** przed degradacją i skutkami zmian klimatycznych. Inicjatywa [Microsoft Sustainability](https://www.microsoft.com/en-us/sustainability) wspiera te cele, badając, w jaki sposób rozwiązania technologiczne mogą wspierać i budować bardziej zrównoważoną przyszłość, koncentrując się na [4 celach](https://dev.to/azure/a-visual-guide-to-sustainable-software-engineering-53hh) - bycie neutralnym węglowo, dodatnim pod względem wody, bezodpadowym i bioróżnorodnym do 2030 roku. -Rozwiązywanie tych wyzwań w sposób skalowalny i terminowy wymaga myślenia w skali chmurowej - i dużych zbiorów danych. Inicjatywa [Planetary Computer](https://planetarycomputer.microsoft.com/) oferuje 4 komponenty, które pomagają data scientistom i programistom w tym wysiłku: +Rozwiązywanie tych wyzwań w sposób skalowalny i terminowy wymaga myślenia na skalę chmury - i dużych zbiorów danych. Inicjatywa [Planetary Computer](https://planetarycomputer.microsoft.com/) oferuje 4 komponenty, które pomagają data scientistom i deweloperom w tym wysiłku: - * [Katalog Danych](https://planetarycomputer.microsoft.com/catalog) - z petabajtami danych o systemach Ziemi (dostępnych za darmo i hostowanych na Azure). - * [Planetary API](https://planetarycomputer.microsoft.com/docs/reference/stac/) - umożliwiające użytkownikom wyszukiwanie odpowiednich danych w przestrzeni i czasie. + * [Katalog Danych](https://planetarycomputer.microsoft.com/catalog) - z petabajtami danych o systemach Ziemi (darmowe i hostowane na Azure). + * [Planetary API](https://planetarycomputer.microsoft.com/docs/reference/stac/) - aby pomóc użytkownikom w wyszukiwaniu odpowiednich danych w przestrzeni i czasie. * [Hub](https://planetarycomputer.microsoft.com/docs/overview/environment/) - zarządzane środowisko dla naukowców do przetwarzania ogromnych zbiorów danych geoprzestrzennych. - * [Aplikacje](https://planetarycomputer.microsoft.com/applications) - prezentujące przypadki użycia i narzędzia do uzyskiwania wglądu w zrównoważony rozwój. + * [Aplikacje](https://planetarycomputer.microsoft.com/applications) - prezentują przypadki użycia i narzędzia do uzyskiwania wglądu w zrównoważony rozwój. **Projekt Planetary Computer jest obecnie w fazie podglądu (stan na wrzesień 2021)** - oto jak możesz zacząć przyczyniać się do rozwiązań na rzecz zrównoważonego rozwoju, korzystając z nauki o danych. -* [Poproś o dostęp](https://planetarycomputer.microsoft.com/account/request), aby rozpocząć eksplorację i nawiązać kontakt z innymi. +* [Poproś o dostęp](https://planetarycomputer.microsoft.com/account/request), aby rozpocząć eksplorację i nawiązać kontakt z innymi użytkownikami. * [Przeglądaj dokumentację](https://planetarycomputer.microsoft.com/docs/overview/about), aby zrozumieć obsługiwane zestawy danych i interfejsy API. * Odkrywaj aplikacje, takie jak [Monitorowanie Ekosystemów](https://analytics-lab.org/ecosystemmonitoring/), aby znaleźć inspirację do tworzenia własnych pomysłów na aplikacje. @@ -124,10 +124,10 @@ Rozmawialiśmy o rzeczywistych zastosowaniach w przemyśle i badaniach oraz przy Oto kilka przykładów projektów studenckich z zakresu nauki o danych, które mogą Cię zainspirować. - * [Letnia Szkoła Nauki o Danych MSR](https://www.microsoft.com/en-us/research/academic-program/data-science-summer-school/#!projects) z projektami na GitHubie [projects](https://github.com/msr-ds3), które eksplorują tematy takie jak: +* [Letnia Szkoła Nauki o Danych MSR](https://www.microsoft.com/en-us/research/academic-program/data-science-summer-school/#!projects) z projektami na GitHubie [projects](https://github.com/msr-ds3), które eksplorują tematy takie jak: - [Rasowe uprzedzenia w użyciu siły przez policję](https://www.microsoft.com/en-us/research/video/data-science-summer-school-2019-replicating-an-empirical-analysis-of-racial-differences-in-police-use-of-force/) | [Github](https://github.com/msr-ds3/stop-question-frisk) - [Niezawodność systemu metra w Nowym Jorku](https://www.microsoft.com/en-us/research/video/data-science-summer-school-2018-exploring-the-reliability-of-the-nyc-subway-system/) | [Github](https://github.com/msr-ds3/nyctransit) - * [Cyfryzacja kultury materialnej: Badanie rozkładów społeczno-ekonomicznych w Sirkap](https://claremont.maps.arcgis.com/apps/Cascade/index.html?appid=bdf2aef0f45a4674ba41cd373fa23afc) - projekt [Ornelli Altunyan](https://twitter.com/ornelladotcom) i zespołu z Claremont, wykorzystujący [ArcGIS StoryMaps](https://storymaps.arcgis.com/). +* [Cyfryzacja kultury materialnej: Badanie rozkładów społeczno-ekonomicznych w Sirkap](https://claremont.maps.arcgis.com/apps/Cascade/index.html?appid=bdf2aef0f45a4674ba41cd373fa23afc) - projekt [Ornelli Altunyan](https://twitter.com/ornelladotcom) i zespołu z Claremont, wykorzystujący [ArcGIS StoryMaps](https://storymaps.arcgis.com/). ## 🚀 Wyzwanie @@ -140,10 +140,11 @@ Poszukaj artykułów, które polecają projekty z zakresu nauki o danych przyjaz ## Przegląd i samodzielna nauka Chcesz poznać więcej przypadków użycia? Oto kilka odpowiednich artykułów: - * [17 zastosowań i przykładów nauki o danych](https://builtin.com/data-science/data-science-applications-examples) - lipiec 2021 - * [11 zapierających dech w piersiach zastosowań nauki o danych w rzeczywistości](https://myblindbird.com/data-science-applications-real-world/) - maj 2021 - * [Nauka o danych w rzeczywistym świecie](https://towardsdatascience.com/data-science-in-the-real-world/home) - kolekcja artykułów - * Nauka o danych w: [Edukacji](https://data-flair.training/blogs/data-science-in-education/), [Rolnictwie](https://data-flair.training/blogs/data-science-in-agriculture/), [Finansach](https://data-flair.training/blogs/data-science-in-finance/), [Filmach](https://data-flair.training/blogs/data-science-at-movies/) i innych. +* [17 zastosowań i przykładów nauki o danych](https://builtin.com/data-science/data-science-applications-examples) - lipiec 2021 +* [11 zapierających dech w piersiach zastosowań nauki o danych w rzeczywistym świecie](https://myblindbird.com/data-science-applications-real-world/) - maj 2021 +* [Nauka o danych w rzeczywistym świecie](https://towardsdatascience.com/data-science-in-the-real-world/home) - kolekcja artykułów +* [12 rzeczywistych zastosowań nauki o danych z przykładami](https://www.scaler.com/blog/data-science-applications/) - maj 2024 +* Nauka o danych w: [Edukacji](https://data-flair.training/blogs/data-science-in-education/), [Rolnictwie](https://data-flair.training/blogs/data-science-in-agriculture/), [Finansach](https://data-flair.training/blogs/data-science-in-finance/), [Filmach](https://data-flair.training/blogs/data-science-at-movies/), [Opiece zdrowotnej](https://onlinedegrees.sandiego.edu/data-science-health-care/) i innych. ## Zadanie @@ -152,4 +153,4 @@ Chcesz poznać więcej przypadków użycia? Oto kilka odpowiednich artykułów: --- **Zastrzeżenie**: -Ten dokument został przetłumaczony za pomocą usługi tłumaczenia AI [Co-op Translator](https://github.com/Azure/co-op-translator). Chociaż dokładamy wszelkich starań, aby tłumaczenie było precyzyjne, prosimy pamiętać, że automatyczne tłumaczenia mogą zawierać błędy lub nieścisłości. Oryginalny dokument w jego języku źródłowym powinien być uznawany za autorytatywne źródło. W przypadku informacji o kluczowym znaczeniu zaleca się skorzystanie z profesjonalnego tłumaczenia przez człowieka. Nie ponosimy odpowiedzialności za jakiekolwiek nieporozumienia lub błędne interpretacje wynikające z użycia tego tłumaczenia. \ No newline at end of file +Ten dokument został przetłumaczony za pomocą usługi tłumaczenia AI [Co-op Translator](https://github.com/Azure/co-op-translator). Chociaż dokładamy wszelkich starań, aby tłumaczenie było precyzyjne, prosimy pamiętać, że automatyczne tłumaczenia mogą zawierać błędy lub nieścisłości. Oryginalny dokument w jego rodzimym języku powinien być uznawany za źródło autorytatywne. W przypadku informacji o kluczowym znaczeniu zaleca się skorzystanie z profesjonalnego tłumaczenia przez człowieka. Nie ponosimy odpowiedzialności za jakiekolwiek nieporozumienia lub błędne interpretacje wynikające z użycia tego tłumaczenia. \ No newline at end of file diff --git a/translations/pt/6-Data-Science-In-Wild/20-Real-World-Examples/README.md b/translations/pt/6-Data-Science-In-Wild/20-Real-World-Examples/README.md index d7fc2ba1..e43390ab 100644 --- a/translations/pt/6-Data-Science-In-Wild/20-Real-World-Examples/README.md +++ b/translations/pt/6-Data-Science-In-Wild/20-Real-World-Examples/README.md @@ -1,8 +1,8 @@ # Data Science в реальном мире -| ![ Sketchnote от [(@sketchthedocs)](https://sketchthedocs.dev) ](../../sketchnotes/20-DataScience-RealWorld.png) | +| ![ Скетчноут от [(@sketchthedocs)](https://sketchthedocs.dev) ](../../sketchnotes/20-DataScience-RealWorld.png) | | :--------------------------------------------------------------------------------------------------------------: | -| Data Science в реальном мире - _Sketchnote от [@nitya](https://twitter.com/nitya)_ | +| Data Science в реальном мире - _Скетчноут от [@nitya](https://twitter.com/nitya)_ | Мы почти подошли к концу этого учебного путешествия! -Мы начали с определения Data Science и этики, изучили различные инструменты и методы анализа и визуализации данных, рассмотрели жизненный цикл Data Science и узнали, как масштабировать и автоматизировать рабочие процессы Data Science с помощью облачных сервисов. И теперь вы, вероятно, задаетесь вопросом: _"Как именно применить все эти знания в реальных контекстах?"_ +Мы начали с определения науки о данных и этики, изучили различные инструменты и методы анализа и визуализации данных, рассмотрели жизненный цикл науки о данных и узнали, как масштабировать и автоматизировать рабочие процессы науки о данных с помощью облачных сервисов. Вероятно, вы задаетесь вопросом: _"Как именно применить все эти знания в реальных контекстах?"_ -В этом уроке мы исследуем реальные приложения Data Science в различных отраслях, а также рассмотрим конкретные примеры в области исследований, цифровых гуманитарных наук и устойчивого развития. Мы обсудим возможности студенческих проектов и завершим полезными ресурсами, которые помогут вам продолжить обучение! +В этом уроке мы исследуем реальные приложения науки о данных в различных отраслях и рассмотрим конкретные примеры в области исследований, цифровых гуманитарных наук и устойчивого развития. Мы также обсудим возможности студенческих проектов и завершим полезными ресурсами, которые помогут вам продолжить обучение! ## Предварительный тест @@ -25,50 +25,50 @@ CO_OP_TRANSLATOR_METADATA: ## Data Science + Индустрия -Благодаря демократизации ИИ разработчикам стало проще проектировать и интегрировать решения на основе ИИ и данные для принятия решений в пользовательские интерфейсы и рабочие процессы разработки. Вот несколько примеров того, как Data Science применяется в реальных задачах в различных отраслях: +Благодаря демократизации ИИ разработчикам стало проще проектировать и интегрировать решения на основе ИИ и инсайты, основанные на данных, в пользовательский опыт и рабочие процессы разработки. Вот несколько примеров того, как наука о данных применяется в реальных приложениях в различных отраслях: - * [Google Flu Trends](https://www.wired.com/2015/10/can-learn-epic-failure-google-flu-trends/) использовал Data Science для корреляции поисковых запросов с трендами гриппа. Несмотря на недостатки подхода, проект привлек внимание к возможностям (и вызовам) прогнозирования в здравоохранении на основе данных. + * [Google Flu Trends](https://www.wired.com/2015/10/can-learn-epic-failure-google-flu-trends/) использовал науку о данных для корреляции поисковых запросов с тенденциями распространения гриппа. Хотя подход имел недостатки, он привлек внимание к возможностям (и вызовам) прогнозирования в области здравоохранения на основе данных. - * [Прогнозирование маршрутов UPS](https://www.technologyreview.com/2018/11/21/139000/how-ups-uses-ai-to-outsmart-bad-weather/) - объясняет, как UPS использует Data Science и машинное обучение для прогнозирования оптимальных маршрутов доставки с учетом погодных условий, трафика, сроков доставки и других факторов. + * [Прогнозирование маршрутов UPS](https://www.technologyreview.com/2018/11/21/139000/how-ups-uses-ai-to-outsmart-bad-weather/) - объясняет, как UPS использует науку о данных и машинное обучение для прогнозирования оптимальных маршрутов доставки с учетом погодных условий, трафика, сроков доставки и других факторов. - * [Визуализация маршрутов такси в Нью-Йорке](http://chriswhong.github.io/nyctaxi/) - данные, собранные с использованием [законов о свободе информации](https://chriswhong.com/open-data/foil_nyc_taxi/), помогли визуализировать день из жизни такси Нью-Йорка, что позволило понять, как они передвигаются по городу, сколько зарабатывают и какова продолжительность поездок за 24 часа. + * [Визуализация маршрутов такси в Нью-Йорке](http://chriswhong.github.io/nyctaxi/) - данные, собранные с использованием [Законов о свободе информации](https://chriswhong.com/open-data/foil_nyc_taxi/), помогли визуализировать день из жизни такси Нью-Йорка, показывая, как они перемещаются по городу, сколько зарабатывают и сколько времени занимают поездки за 24 часа. - * [Uber Data Science Workbench](https://eng.uber.com/dsw/) - использует данные (о местах посадки и высадки, продолжительности поездок, предпочтительных маршрутах и т.д.), собранные с миллионов поездок Uber ежедневно, для создания аналитического инструмента, помогающего в ценообразовании, обеспечении безопасности, обнаружении мошенничества и принятии навигационных решений. + * [Рабочая платформа Uber для науки о данных](https://eng.uber.com/dsw/) - использует данные (о местах посадки и высадки, продолжительности поездок, предпочтительных маршрутах и т.д.), собранные ежедневно из миллионов поездок Uber, для создания аналитического инструмента, который помогает в ценообразовании, обеспечении безопасности, обнаружении мошенничества и навигационных решениях. - * [Аналитика в спорте](https://towardsdatascience.com/scope-of-analytics-in-sports-world-37ed09c39860) - включает _предиктивную аналитику_ (анализ команд и игроков - например, [Moneyball](https://datasciencedegree.wisconsin.edu/blog/moneyball-proves-importance-big-data-big-ideas/) - и управление фанатами) и _визуализацию данных_ (дашборды команд и фанатов, игры и т.д.) с применением в таких областях, как поиск талантов, спортивные ставки и управление инвентарем/местами проведения. + * [Аналитика в спорте](https://towardsdatascience.com/scope-of-analytics-in-sports-world-37ed09c39860) - сосредоточена на _предиктивной аналитике_ (анализ команд и игроков - например, [Moneyball](https://datasciencedegree.wisconsin.edu/blog/moneyball-proves-importance-big-data-big-ideas/) - и управление фанатами) и _визуализации данных_ (панели управления для команд и фанатов, игры и т.д.) с приложениями, такими как поиск талантов, спортивные ставки и управление инвентарем/местами проведения. - * [Data Science в банковской сфере](https://data-flair.training/blogs/data-science-in-banking/) - подчеркивает ценность Data Science в финансовой индустрии с применением от моделирования рисков и обнаружения мошенничества до сегментации клиентов, прогнозирования в реальном времени и рекомендательных систем. Предиктивная аналитика также используется для таких критически важных показателей, как [кредитные рейтинги](https://dzone.com/articles/using-big-data-and-predictive-analytics-for-credit). + * [Наука о данных в банковской сфере](https://data-flair.training/blogs/data-science-in-banking/) - подчеркивает ценность науки о данных в финансовой отрасли с приложениями, начиная от моделирования рисков и обнаружения мошенничества, до сегментации клиентов, прогнозирования в реальном времени и рекомендательных систем. Предиктивная аналитика также играет ключевую роль в таких мерах, как [кредитные рейтинги](https://dzone.com/articles/using-big-data-and-predictive-analytics-for-credit). - * [Data Science в здравоохранении](https://data-flair.training/blogs/data-science-in-healthcare/) - включает такие приложения, как медицинская визуализация (например, МРТ, рентген, КТ), геномика (секвенирование ДНК), разработка лекарств (оценка рисков, прогнозирование успеха), предиктивная аналитика (уход за пациентами и логистика поставок), отслеживание и предотвращение заболеваний и т.д. + * [Наука о данных в здравоохранении](https://data-flair.training/blogs/data-science-in-healthcare/) - выделяет такие приложения, как медицинская визуализация (например, МРТ, рентген, КТ-сканирование), геномика (секвенирование ДНК), разработка лекарств (оценка рисков, прогнозирование успеха), предиктивная аналитика (уход за пациентами и логистика поставок), отслеживание и предотвращение заболеваний и т.д. -![Приложения Data Science в реальном мире](../../../../6-Data-Science-In-Wild/20-Real-World-Examples/images/data-science-applications.png) Источник изображения: [Data Flair: 6 Amazing Data Science Applications ](https://data-flair.training/blogs/data-science-applications/) +![Приложения науки о данных в реальном мире](../../../../translated_images/data-science-applications.4e5019cd8790ebac2277ff5f08af386f8727cac5d30f77727c7090677e6adb9c.ru.png) Источник изображения: [Data Flair: 6 Amazing Data Science Applications ](https://data-flair.training/blogs/data-science-applications/) -На рисунке показаны другие области и примеры применения методов Data Science. Хотите изучить другие приложения? Ознакомьтесь с разделом [Обзор и самостоятельное изучение](../../../../6-Data-Science-In-Wild/20-Real-World-Examples) ниже. +На рисунке показаны другие области и примеры применения методов науки о данных. Хотите изучить другие приложения? Ознакомьтесь с разделом [Обзор и самостоятельное изучение](../../../../6-Data-Science-In-Wild/20-Real-World-Examples) ниже. ## Data Science + Исследования -| ![ Sketchnote от [(@sketchthedocs)](https://sketchthedocs.dev) ](../../sketchnotes/20-DataScience-Research.png) | +| ![ Скетчноут от [(@sketchthedocs)](https://sketchthedocs.dev) ](../../sketchnotes/20-DataScience-Research.png) | | :---------------------------------------------------------------------------------------------------------------: | -| Data Science и исследования - _Sketchnote от [@nitya](https://twitter.com/nitya)_ | +| Наука о данных и исследования - _Скетчноут от [@nitya](https://twitter.com/nitya)_ | -Хотя реальные приложения часто сосредоточены на масштабных задачах индустрии, _исследовательские_ проекты могут быть полезны с двух точек зрения: +Хотя реальные приложения часто сосредоточены на масштабных отраслевых кейсах, _исследовательские_ приложения и проекты могут быть полезны с двух точек зрения: -* _возможности для инноваций_ - исследование прототипирования передовых концепций и тестирование пользовательского опыта для приложений следующего поколения. -* _вызовы внедрения_ - изучение потенциального вреда или непредвиденных последствий технологий Data Science в реальных контекстах. +* _возможности для инноваций_ - исследование быстрого прототипирования передовых концепций и тестирование пользовательского опыта для приложений следующего поколения. +* _вызовы внедрения_ - изучение потенциальных вредных последствий или непреднамеренных эффектов технологий науки о данных в реальных контекстах. -Для студентов такие исследовательские проекты могут предоставить как возможности для обучения, так и для сотрудничества, что улучшит понимание темы и расширит осведомленность и взаимодействие с людьми или командами, работающими в интересующих областях. Как выглядят исследовательские проекты и как они могут повлиять? +Для студентов такие исследовательские проекты могут предоставить возможности для обучения и сотрудничества, которые улучшат ваше понимание темы и расширят ваше осознание и взаимодействие с людьми или командами, работающими в интересующих вас областях. Как выглядят исследовательские проекты и как они могут повлиять на мир? -Рассмотрим один пример - [MIT Gender Shades Study](http://gendershades.org/overview.html) от Джой Буоламвини (MIT Media Labs) с [основной исследовательской статьей](http://proceedings.mlr.press/v81/buolamwini18a/buolamwini18a.pdf), написанной в соавторстве с Тимнит Гебру (тогда в Microsoft Research), которая сосредоточилась на: +Рассмотрим один пример - [MIT Gender Shades Study](http://gendershades.org/overview.html) от Джой Буоламвини (MIT Media Labs) с [знаковым исследовательским документом](http://proceedings.mlr.press/v81/buolamwini18a/buolamwini18a.pdf), написанным в соавторстве с Тимнит Гебру (тогда в Microsoft Research), который сосредоточен на: - * **Что:** Целью исследования было _оценить предвзятость в алгоритмах и наборах данных для автоматического анализа лиц_ на основе пола и типа кожи. - * **Почему:** Анализ лиц используется в таких областях, как правоохранительные органы, безопасность в аэропортах, системы найма и другие - контексты, где неточные классификации (например, из-за предвзятости) могут нанести экономический и социальный вред затронутым лицам или группам. Понимание (и устранение или смягчение) предвзятости является ключом к справедливости в использовании. - * **Как:** Исследователи обнаружили, что существующие эталоны в основном использовали светлокожих субъектов, и создали новый набор данных (1000+ изображений), который был _более сбалансирован_ по полу и типу кожи. Этот набор данных использовался для оценки точности трех продуктов классификации пола (от Microsoft, IBM и Face++). + * **Что:** Целью исследовательского проекта было _оценить предвзятость, присутствующую в алгоритмах и наборах данных автоматического анализа лиц_ на основе пола и типа кожи. + * **Почему:** Анализ лиц используется в таких областях, как правоохранительные органы, безопасность в аэропортах, системы найма и другие - контексты, где неточные классификации (например, из-за предвзятости) могут причинить экономический и социальный вред затронутым лицам или группам. Понимание (и устранение или смягчение) предвзятости является ключом к справедливости в использовании. + * **Как:** Исследователи заметили, что существующие эталонные наборы данных использовали преимущественно светлокожих субъектов, и создали новый набор данных (1000+ изображений), который был _более сбалансирован_ по полу и типу кожи. Этот набор данных использовался для оценки точности трех продуктов классификации пола (от Microsoft, IBM и Face++). -Результаты показали, что, хотя общая точность классификации была хорошей, наблюдалась заметная разница в уровне ошибок между различными подгруппами - с **ошибками определения пола**, которые были выше для женщин или людей с более темным типом кожи, что указывает на предвзятость. +Результаты показали, что хотя общая точность классификации была хорошей, наблюдалась заметная разница в уровнях ошибок между различными подгруппами - с **ошибками определения пола**, которые были выше для женщин или людей с более темным типом кожи, что указывает на предвзятость. -**Ключевые результаты:** Исследование подчеркнуло необходимость более _репрезентативных наборов данных_ (сбалансированных подгрупп) и более _инклюзивных команд_ (разнообразных по происхождению), чтобы распознавать и устранять или смягчать такие предвзятости на ранних этапах разработки решений на основе ИИ. Такие исследования также способствуют разработке принципов и практик _ответственного ИИ_ в организациях для повышения справедливости их продуктов и процессов. +**Основные результаты:** Исследование подчеркнуло необходимость более _репрезентативных наборов данных_ (сбалансированных подгрупп) и более _инклюзивных команд_ (разнообразных по происхождению), чтобы распознавать и устранять или смягчать такие предвзятости на ранних этапах разработки решений на основе ИИ. Такие исследовательские усилия также играют важную роль в определении принципов и практик _ответственного ИИ_ для повышения справедливости в продуктах и процессах ИИ. -**Хотите узнать о соответствующих исследованиях в Microsoft?** +**Хотите узнать о соответствующих исследовательских усилиях в Microsoft?** * Ознакомьтесь с [исследовательскими проектами Microsoft](https://www.microsoft.com/research/research-area/artificial-intelligence/?facet%5Btax%5D%5Bmsr-research-area%5D%5B%5D=13556&facet%5Btax%5D%5Bmsr-content-type%5D%5B%5D=msr-project) в области искусственного интеллекта. * Изучите студенческие проекты из [Microsoft Research Data Science Summer School](https://www.microsoft.com/en-us/research/academic-program/data-science-summer-school/). @@ -76,62 +76,62 @@ CO_OP_TRANSLATOR_METADATA: ## Data Science + Гуманитарные науки -| ![ Sketchnote от [(@sketchthedocs)](https://sketchthedocs.dev) ](../../sketchnotes/20-DataScience-Humanities.png) | +| ![ Скетчноут от [(@sketchthedocs)](https://sketchthedocs.dev) ](../../sketchnotes/20-DataScience-Humanities.png) | | :---------------------------------------------------------------------------------------------------------------: | -| Data Science и цифровые гуманитарные науки - _Sketchnote от [@nitya](https://twitter.com/nitya)_ | +| Наука о данных и цифровые гуманитарные науки - _Скетчноут от [@nitya](https://twitter.com/nitya)_ | -Цифровые гуманитарные науки [определяются](https://digitalhumanities.stanford.edu/about-dh-stanford) как "набор практик и подходов, сочетающих вычислительные методы с гуманитарным исследованием". [Проекты Стэнфорда](https://digitalhumanities.stanford.edu/projects), такие как _"перезагрузка истории"_ и _"поэтическое мышление"_, иллюстрируют связь между [цифровыми гуманитарными науками и Data Science](https://digitalhumanities.stanford.edu/digital-humanities-and-data-science) - подчеркивая такие методы, как анализ сетей, визуализация информации, пространственный и текстовый анализ, которые помогают нам пересматривать исторические и литературные наборы данных, чтобы извлекать новые инсайты и перспективы. +Цифровые гуманитарные науки [определяются](https://digitalhumanities.stanford.edu/about-dh-stanford) как "совокупность практик и подходов, объединяющих вычислительные методы с гуманитарным исследованием". [Проекты Стэнфорда](https://digitalhumanities.stanford.edu/projects), такие как _"перезагрузка истории"_ и _"поэтическое мышление"_, иллюстрируют связь между [цифровыми гуманитарными науками и наукой о данных](https://digitalhumanities.stanford.edu/digital-humanities-and-data-science) - подчеркивая такие методы, как анализ сетей, визуализация информации, пространственный и текстовый анализ, которые помогают нам переосмыслить исторические и литературные наборы данных, чтобы получить новые инсайты и перспективы. *Хотите изучить и расширить проект в этой области?* -Ознакомьтесь с ["Эмили Дикинсон и метр настроения"](https://gist.github.com/jlooper/ce4d102efd057137bc000db796bfd671) - отличным примером от [Джен Лупер](https://twitter.com/jenlooper), который задается вопросом, как мы можем использовать Data Science, чтобы пересмотреть знакомую поэзию и переоценить ее значение и вклад автора в новых контекстах. Например, _можем ли мы предсказать сезон, в который было написано стихотворение, анализируя его тон или настроение_ - и что это говорит нам о состоянии автора в соответствующий период? +Ознакомьтесь с ["Эмили Дикинсон и метром настроения"](https://gist.github.com/jlooper/ce4d102efd057137bc000db796bfd671) - отличным примером от [Джен Лупер](https://twitter.com/jenlooper), который задается вопросом, как мы можем использовать науку о данных, чтобы переосмыслить знакомую поэзию и переоценить ее значение и вклад автора в новых контекстах. Например, _можем ли мы предсказать сезон, в который было написано стихотворение, анализируя его тон или настроение_ - и что это говорит нам о состоянии автора в соответствующий период? -Чтобы ответить на этот вопрос, мы следуем шагам жизненного цикла Data Science: - * [`Сбор данных`](https://gist.github.com/jlooper/ce4d102efd057137bc000db796bfd671#acquiring-the-dataset) - для сбора релевантного набора данных для анализа. Варианты включают использование API (например, [Poetry DB API](https://poetrydb.org/index.html)) или парсинг веб-страниц (например, [Project Gutenberg](https://www.gutenberg.org/files/12242/12242-h/12242-h.htm)) с помощью инструментов, таких как [Scrapy](https://scrapy.org/). +Чтобы ответить на этот вопрос, мы следуем шагам жизненного цикла науки о данных: + * [`Получение данных`](https://gist.github.com/jlooper/ce4d102efd057137bc000db796bfd671#acquiring-the-dataset) - сбор релевантного набора данных для анализа. Варианты включают использование API (например, [Poetry DB API](https://poetrydb.org/index.html)) или скрапинг веб-страниц (например, [Project Gutenberg](https://www.gutenberg.org/files/12242/12242-h/12242-h.htm)) с помощью инструментов, таких как [Scrapy](https://scrapy.org/). * [`Очистка данных`](https://gist.github.com/jlooper/ce4d102efd057137bc000db796bfd671#clean-the-data) - объясняет, как текст может быть отформатирован, очищен и упрощен с использованием базовых инструментов, таких как Visual Studio Code и Microsoft Excel. - * [`Анализ данных`](https://gist.github.com/jlooper/ce4d102efd057137bc000db796bfd671#working-with-the-data-in-a-notebook) - объясняет, как мы можем импортировать набор данных в "ноутбуки" для анализа с использованием Python-библиотек (таких как pandas, numpy и matplotlib) для организации и визуализации данных. - * [`Анализ настроений`](https://gist.github.com/jlooper/ce4d102efd057137bc000db796bfd671#sentiment-analysis-using-cognitive-services) - объясняет, как мы можем интегрировать облачные сервисы, такие как Text Analytics, используя инструменты с низким кодом, такие как [Power Automate](https://flow.microsoft.com/en-us/) для автоматизации рабочих процессов обработки данных. + * [`Анализ данных`](https://gist.github.com/jlooper/ce4d102efd057137bc000db796bfd671#working-with-the-data-in-a-notebook) - объясняет, как мы можем импортировать набор данных в "ноутбуки" для анализа с использованием Python-пакетов (таких как pandas, numpy и matplotlib) для организации и визуализации данных. + * [`Анализ настроений`](https://gist.github.com/jlooper/ce4d102efd057137bc000db796bfd671#sentiment-analysis-using-cognitive-services) - объясняет, как мы можем интегрировать облачные сервисы, такие как Text Analytics, используя инструменты с низким кодом, такие как [Power Automate](https://flow.microsoft.com/en-us/) для автоматизированных рабочих процессов обработки данных. Используя этот рабочий процесс, мы можем исследовать сезонные влияния на настроение стихотворений и помочь нам сформировать собственные взгляды на автора. Попробуйте сами - затем расширьте ноутбук, чтобы задать другие вопросы или визуализировать данные новыми способами! -> Вы можете использовать некоторые инструменты из [набор инструментов цифровых гуманитарных наук](https://github.com/Digital-Humanities-Toolkit) для изучения этих направлений. +> Вы можете использовать некоторые инструменты из [набор инструментов цифровых гуманитарных наук](https://github.com/Digital-Humanities-Toolkit), чтобы продолжить исследование. ## Data Science + Устойчивое развитие -| ![ Sketchnote от [(@sketchthedocs)](https://sketchthedocs.dev) ](../../sketchnotes/20-DataScience-Sustainability.png) | +| ![ Скетчноут от [(@sketchthedocs)](https://sketchthedocs.dev) ](../../sketchnotes/20-DataScience-Sustainability.png) | | :---------------------------------------------------------------------------------------------------------------: | -| Data Science и устойчивое развитие - _Sketchnote от [@nitya](https://twitter.com/nitya)_ | +| Наука о данных и устойчивое развитие - _Скетчноут от [@nitya](https://twitter.com/nitya)_ | -[Повестка дня на 2030 год в области устойчивого развития](https://sdgs.un.org/2030agenda) - принятая всеми членами ООН в 2015 году - определяет 17 целей, включая те, которые направлены на **защиту планеты** от деградации и воздействия изменения климата. Инициатива [Microsoft Sustainability](https://www.microsoft.com/en-us/sustainability) поддерживает эти цели, исследуя способы, которыми технологические решения могут способствовать созданию более устойчивого будущего, с [фокусом на 4 цели](https://dev.to/azure/a-visual-guide-to-sustainable-software-engineering-53hh) - быть углеродно-отрицательными, водоположительными, безотходными и биоразнообразными к 2030 году. +[Повестка дня на 2030 год в области устойчивого развития](https://sdgs.un.org/2030agenda) - принятая всеми членами ООН в 2015 году - определяет 17 целей, включая те, которые сосредоточены на **защите планеты** от деградации и воздействия изменения климата. Инициатива [Microsoft Sustainability](https://www.microsoft.com/en-us/sustainability) поддерживает эти цели, исследуя способы, которыми технологические решения могут способствовать созданию более устойчивого будущего с [фокусом на 4 цели](https://dev.to/azure/a-visual-guide-to-sustainable-software-engineering-53hh) - быть углеродно-отрицательными, водоположительными, безотходными и биоразнообразными к 2030 году. -Решение этих задач в масштабах и в срок требует облачного подхода и работы с большими данными. Инициатива [Planetary Computer](https://planetarycomputer.microsoft.com/) предоставляет 4 компонента, которые помогут специалистам по данным и разработчикам в этом направлении: +Решение этих задач в масштабах и в своевременной манере требует облачного мышления и больших объемов данных. Инициатива [Planetary Computer](https://planetarycomputer.microsoft.com/) предоставляет 4 компонента, которые помогают ученым данных и разработчикам в этом усилии: - * [Каталог данных](https://planetarycomputer.microsoft.com/catalog) - с петабайтами данных об экосистемах Земли (бесплатно и размещено в Azure). - * [Planetary API](https://planetarycomputer.microsoft.com/docs/reference/stac/) - для поиска релевантных данных по пространству и времени. - * [Hub](https://planetarycomputer.microsoft.com/docs/overview/environment/) - управляемая среда для ученых для обработки массивных геопространственных наборов данных. - * [Приложения](https://planetarycomputer.microsoft.com/applications) - демонстрируют примеры использования и инструменты для получения инсайтов в области устойчивого развития. -**Проект Planetary Computer находится в стадии предварительного просмотра (по состоянию на сентябрь 2021 года)** - вот как вы можете начать вносить вклад в устойчивые решения с помощью науки о данных. + * [Каталог данных](https://planetarycomputer.microsoft.com/catalog) - с петабайтами данных о системах Земли (бесплатно и размещено на Azure). + * [Planetary API](https://planetarycomputer.microsoft.com/docs/reference/stac/) - помогает пользователям искать релевантные данные по пространству и времени. + * [Hub](https://planetarycomputer.microsoft.com/docs/overview/environment/) - управляемая среда для ученых, чтобы обрабатывать массивные геопространственные наборы данных. + * [Приложения](https://planetarycomputer.microsoft.com/applications) - демонстрируют кейсы использования и инструменты для получения инсайтов в области устойчивого развития. +**Проект Planetary Computer находится в стадии предварительного просмотра (по состоянию на сентябрь 2021 года)** - вот как вы можете начать вносить вклад в устойчивые решения с помощью анализа данных. -* [Запросите доступ](https://planetarycomputer.microsoft.com/account/request), чтобы начать исследование и наладить связь с единомышленниками. +* [Запросите доступ](https://planetarycomputer.microsoft.com/account/request), чтобы начать исследование и взаимодействовать с коллегами. * [Изучите документацию](https://planetarycomputer.microsoft.com/docs/overview/about), чтобы понять, какие наборы данных и API поддерживаются. -* Ознакомьтесь с приложениями, такими как [Мониторинг экосистем](https://analytics-lab.org/ecosystemmonitoring/), чтобы найти вдохновение для идей приложений. +* Ознакомьтесь с приложениями, такими как [Мониторинг экосистем](https://analytics-lab.org/ecosystemmonitoring/), чтобы вдохновиться идеями для приложений. -Подумайте, как вы можете использовать визуализацию данных, чтобы выявить или усилить важные инсайты в таких областях, как изменение климата и вырубка лесов. Или подумайте, как эти инсайты могут быть использованы для создания новых пользовательских опытов, которые мотивируют на изменения поведения для более устойчивого образа жизни. +Подумайте, как вы можете использовать визуализацию данных, чтобы выявить или усилить важные инсайты в таких областях, как изменение климата и вырубка лесов. Или подумайте, как эти инсайты могут быть использованы для создания новых пользовательских интерфейсов, которые мотивируют изменения поведения для более устойчивого образа жизни. -## Наука о данных + студенты +## Анализ данных + студенты -Мы обсудили реальные приложения в индустрии и исследованиях, а также рассмотрели примеры применения науки о данных в цифровых гуманитарных науках и устойчивом развитии. Так как же вам развивать свои навыки и делиться своим опытом, если вы только начинаете изучать науку о данных? +Мы обсудили реальные приложения в индустрии и исследованиях, а также рассмотрели примеры использования анализа данных в цифровых гуманитарных науках и устойчивом развитии. Так как же вы можете развивать свои навыки и делиться своим опытом как начинающие специалисты в области анализа данных? -Вот несколько примеров студенческих проектов в области науки о данных, которые могут вас вдохновить. +Вот несколько примеров студенческих проектов в области анализа данных, которые могут вас вдохновить. -* [Летняя школа науки о данных MSR](https://www.microsoft.com/en-us/research/academic-program/data-science-summer-school/#!projects) с проектами на [GitHub](https://github.com/msr-ds3), исследующими такие темы, как: + * [Летняя школа анализа данных MSR](https://www.microsoft.com/en-us/research/academic-program/data-science-summer-school/#!projects) с проектами на [GitHub](https://github.com/msr-ds3), исследующими такие темы, как: - [Расовая предвзятость в применении силы полицией](https://www.microsoft.com/en-us/research/video/data-science-summer-school-2019-replicating-an-empirical-analysis-of-racial-differences-in-police-use-of-force/) | [Github](https://github.com/msr-ds3/stop-question-frisk) - [Надежность системы метро Нью-Йорка](https://www.microsoft.com/en-us/research/video/data-science-summer-school-2018-exploring-the-reliability-of-the-nyc-subway-system/) | [Github](https://github.com/msr-ds3/nyctransit) -* [Оцифровка материальной культуры: исследование социально-экономических распределений в Сиркапе](https://claremont.maps.arcgis.com/apps/Cascade/index.html?appid=bdf2aef0f45a4674ba41cd373fa23afc) - проект [Орнеллы Алтуньян](https://twitter.com/ornelladotcom) и команды из Клермонта, выполненный с использованием [ArcGIS StoryMaps](https://storymaps.arcgis.com/). + * [Оцифровка материальной культуры: исследование социально-экономических распределений в Сиркапе](https://claremont.maps.arcgis.com/apps/Cascade/index.html?appid=bdf2aef0f45a4674ba41cd373fa23afc) - от [Орнеллы Алтуньян](https://twitter.com/ornelladotcom) и команды из Клермонта, с использованием [ArcGIS StoryMaps](https://storymaps.arcgis.com/). -## 🚀 Задание +## 🚀 Задача -Найдите статьи, которые рекомендуют проекты по науке о данных для начинающих, например, [эти 50 тем](https://www.upgrad.com/blog/data-science-project-ideas-topics-beginners/), [эти 21 идею проекта](https://www.intellspot.com/data-science-project-ideas) или [эти 16 проектов с исходным кодом](https://data-flair.training/blogs/data-science-project-ideas/), которые вы можете разобрать и переработать. И не забудьте вести блог о своем обучении и делиться своими инсайтами с нами. +Ищите статьи, которые рекомендуют проекты в области анализа данных, подходящие для начинающих, например [эти 50 тем](https://www.upgrad.com/blog/data-science-project-ideas-topics-beginners/) или [эти 21 идея проекта](https://www.intellspot.com/data-science-project-ideas) или [эти 16 проектов с исходным кодом](https://data-flair.training/blogs/data-science-project-ideas/), которые вы можете разобрать и переработать. И не забудьте вести блог о своем обучении и делиться своими инсайтами с нами. ## Викторина после лекции @@ -140,10 +140,11 @@ CO_OP_TRANSLATOR_METADATA: ## Обзор и самостоятельное изучение Хотите изучить больше примеров использования? Вот несколько полезных статей: -* [17 примеров и приложений науки о данных](https://builtin.com/data-science/data-science-applications-examples) - июль 2021 -* [11 впечатляющих примеров применения науки о данных в реальном мире](https://myblindbird.com/data-science-applications-real-world/) - май 2021 -* [Наука о данных в реальном мире](https://towardsdatascience.com/data-science-in-the-real-world/home) - сборник статей -* Наука о данных в: [образовании](https://data-flair.training/blogs/data-science-in-education/), [сельском хозяйстве](https://data-flair.training/blogs/data-science-in-agriculture/), [финансах](https://data-flair.training/blogs/data-science-in-finance/), [кино](https://data-flair.training/blogs/data-science-at-movies/) и других областях. + * [17 приложений и примеров анализа данных](https://builtin.com/data-science/data-science-applications-examples) - июль 2021 + * [11 впечатляющих приложений анализа данных в реальном мире](https://myblindbird.com/data-science-applications-real-world/) - май 2021 + * [Анализ данных в реальном мире](https://towardsdatascience.com/data-science-in-the-real-world/home) - коллекция статей + * [12 реальных приложений анализа данных с примерами](https://www.scaler.com/blog/data-science-applications/) - май 2024 + * Анализ данных в: [образовании](https://data-flair.training/blogs/data-science-in-education/), [сельском хозяйстве](https://data-flair.training/blogs/data-science-in-agriculture/), [финансах](https://data-flair.training/blogs/data-science-in-finance/), [киноиндустрии](https://data-flair.training/blogs/data-science-at-movies/), [здравоохранении](https://onlinedegrees.sandiego.edu/data-science-health-care/) и других областях. ## Задание diff --git a/translations/sk/6-Data-Science-In-Wild/20-Real-World-Examples/README.md b/translations/sk/6-Data-Science-In-Wild/20-Real-World-Examples/README.md index 9fc66b28..4465dc26 100644 --- a/translations/sk/6-Data-Science-In-Wild/20-Real-World-Examples/README.md +++ b/translations/sk/6-Data-Science-In-Wild/20-Real-World-Examples/README.md @@ -1,8 +1,8 @@ -# Наука про дані в реальному світі +# Наука про дані у реальному світі | ![ Скетчноут від [(@sketchthedocs)](https://sketchthedocs.dev) ](../../sketchnotes/20-DataScience-RealWorld.png) | | :--------------------------------------------------------------------------------------------------------------: | -| Наука про дані в реальному світі - _Скетчноут від [@nitya](https://twitter.com/nitya)_ | +| Наука про дані у реальному світі - _Скетчноут від [@nitya](https://twitter.com/nitya)_ | -Ми майже завершили цей навчальний шлях! +Ми майже завершили цю навчальну подорож! -Ми почали з визначень науки про дані та етики, дослідили різні інструменти та методи аналізу і візуалізації даних, розглянули життєвий цикл науки про дані та вивчили масштабування і автоматизацію робочих процесів науки про дані за допомогою хмарних обчислювальних сервісів. Тож, ви, мабуть, запитуєте: _"Як саме я можу застосувати всі ці знання в реальних контекстах?"_ +Ми почали з визначень науки про дані та етики, дослідили різні інструменти та техніки для аналізу й візуалізації даних, розглянули життєвий цикл науки про дані та вивчили масштабування й автоматизацію робочих процесів науки про дані за допомогою хмарних обчислювальних сервісів. Тож, ви, мабуть, запитуєте: _"Як саме я можу застосувати всі ці знання у реальних контекстах?"_ -У цьому уроці ми дослідимо реальні застосування науки про дані в різних галузях і заглибимося в конкретні приклади в дослідженнях, цифрових гуманітарних науках та сталому розвитку. Ми розглянемо можливості студентських проєктів і завершимо корисними ресурсами, які допоможуть вам продовжити навчальний шлях! +У цьому уроці ми дослідимо реальні застосування науки про дані в різних галузях і розглянемо конкретні приклади у дослідженнях, цифрових гуманітарних науках та сталому розвитку. Ми також розглянемо можливості студентських проєктів і завершимо корисними ресурсами, які допоможуть вам продовжити навчання! -## Передлекційний тест +## Передлекційна вікторина -## [Передлекційний тест](https://ff-quizzes.netlify.app/en/ds/quiz/38) +## [Передлекційна вікторина](https://ff-quizzes.netlify.app/en/ds/quiz/38) ## Наука про дані + Індустрія -Завдяки демократизації штучного інтелекту розробникам стало легше створювати та інтегрувати рішення на основі штучного інтелекту і даних у користувацький досвід та робочі процеси розробки. Ось кілька прикладів того, як наука про дані "застосовується" в реальних галузях: +Завдяки демократизації штучного інтелекту розробникам стало легше проєктувати та інтегрувати рішення на основі ШІ та інсайти, отримані з даних, у користувацький досвід і робочі процеси розробки. Ось кілька прикладів того, як наука про дані "застосовується" у реальних додатках в індустрії: - * [Google Flu Trends](https://www.wired.com/2015/10/can-learn-epic-failure-google-flu-trends/) використовував науку про дані для кореляції пошукових запитів із тенденціями грипу. Хоча підхід мав недоліки, він привернув увагу до можливостей (і викликів) прогнозування в галузі охорони здоров'я на основі даних. +* [Google Flu Trends](https://www.wired.com/2015/10/can-learn-epic-failure-google-flu-trends/) використовував науку про дані для кореляції пошукових запитів із тенденціями грипу. Хоча підхід мав недоліки, він привернув увагу до можливостей (і викликів) прогнозування у сфері охорони здоров’я на основі даних. - * [Прогнози маршрутів UPS](https://www.technologyreview.com/2018/11/21/139000/how-ups-uses-ai-to-outsmart-bad-weather/) - пояснює, як UPS використовує науку про дані та машинне навчання для прогнозування оптимальних маршрутів доставки, враховуючи погодні умови, трафік, терміни доставки тощо. +* [Прогнози маршрутів UPS](https://www.technologyreview.com/2018/11/21/139000/how-ups-uses-ai-to-outsmart-bad-weather/) - пояснює, як UPS використовує науку про дані та машинне навчання для прогнозування оптимальних маршрутів доставки, враховуючи погодні умови, трафік, терміни доставки тощо. - * [Візуалізація маршрутів таксі в Нью-Йорку](http://chriswhong.github.io/nyctaxi/) - дані, зібрані за допомогою [законів про свободу інформації](https://chriswhong.com/open-data/foil_nyc_taxi/), допомогли візуалізувати день із життя таксі Нью-Йорка, показуючи, як вони пересуваються містом, заробляють гроші та тривалість поїздок протягом кожної доби. +* [Візуалізація маршрутів таксі в Нью-Йорку](http://chriswhong.github.io/nyctaxi/) - дані, зібрані за допомогою [законів про свободу інформації](https://chriswhong.com/open-data/foil_nyc_taxi/), допомогли візуалізувати день із життя таксі Нью-Йорка, що дозволило зрозуміти, як вони пересуваються містом, скільки заробляють і скільки часу тривають поїздки протягом доби. - * [Робоча платформа Uber Data Science](https://eng.uber.com/dsw/) - використовує дані (про місця посадки та висадки, тривалість поїздок, переваги маршрутів тощо), зібрані з мільйонів щоденних поїздок Uber, для створення аналітичного інструменту, який допомагає з ціноутворенням, безпекою, виявленням шахрайства та навігаційними рішеннями. +* [Uber Data Science Workbench](https://eng.uber.com/dsw/) - використовує дані (про місця посадки та висадки, тривалість поїздок, переваги маршрутів тощо), зібрані з мільйонів поїздок Uber *щодня*, для створення інструменту аналітики даних, який допомагає з ціноутворенням, безпекою, виявленням шахрайства та навігаційними рішеннями. - * [Аналітика у спорті](https://towardsdatascience.com/scope-of-analytics-in-sports-world-37ed09c39860) - зосереджується на _прогнозній аналітиці_ (аналіз команд і гравців - наприклад, [Moneyball](https://datasciencedegree.wisconsin.edu/blog/moneyball-proves-importance-big-data-big-ideas/) - і управління фанатами) та _візуалізації даних_ (панелі команд і фанатів, ігри тощо) з такими застосуваннями, як пошук талантів, спортивні ставки та управління інвентарем/місцем проведення. +* [Аналітика у спорті](https://towardsdatascience.com/scope-of-analytics-in-sports-world-37ed09c39860) - зосереджується на _прогнозній аналітиці_ (аналіз команд і гравців - наприклад, [Moneyball](https://datasciencedegree.wisconsin.edu/blog/moneyball-proves-importance-big-data-big-ideas/) - і управління фанатами) та _візуалізації даних_ (панелі управління командами та фанатами, ігри тощо) з додатками, такими як пошук талантів, спортивні ставки та управління інвентарем/місцями проведення. - * [Наука про дані в банківській сфері](https://data-flair.training/blogs/data-science-in-banking/) - підкреслює цінність науки про дані у фінансовій галузі з такими застосуваннями, як моделювання ризиків і виявлення шахрайства, сегментація клієнтів, прогнозування в реальному часі та системи рекомендацій. Прогнозна аналітика також сприяє критичним заходам, таким як [кредитні рейтинги](https://dzone.com/articles/using-big-data-and-predictive-analytics-for-credit). +* [Наука про дані у банківській сфері](https://data-flair.training/blogs/data-science-in-banking/) - підкреслює цінність науки про дані у фінансовій індустрії з додатками, що варіюються від моделювання ризиків і виявлення шахрайства до сегментації клієнтів, прогнозування в реальному часі та рекомендаційних систем. Прогнозна аналітика також керує критичними показниками, такими як [кредитні рейтинги](https://dzone.com/articles/using-big-data-and-predictive-analytics-for-credit). - * [Наука про дані в охороні здоров'я](https://data-flair.training/blogs/data-science-in-healthcare/) - підкреслює такі застосування, як медична візуалізація (наприклад, МРТ, рентген, КТ-сканування), геноміка (секвенування ДНК), розробка ліків (оцінка ризиків, прогноз успіху), прогнозна аналітика (догляд за пацієнтами та логістика постачання), відстеження та профілактика захворювань тощо. +* [Наука про дані у сфері охорони здоров’я](https://data-flair.training/blogs/data-science-in-healthcare/) - підкреслює такі додатки, як медична візуалізація (наприклад, МРТ, рентген, КТ-сканування), геноміка (секвенування ДНК), розробка ліків (оцінка ризиків, прогноз успіху), прогнозна аналітика (догляд за пацієнтами та логістика постачання), відстеження та профілактика захворювань тощо. -![Застосування науки про дані в реальному світі](../../../../6-Data-Science-In-Wild/20-Real-World-Examples/images/data-science-applications.png) Джерело зображення: [Data Flair: 6 Amazing Data Science Applications ](https://data-flair.training/blogs/data-science-applications/) +![Застосування науки про дані у реальному світі](../../../../translated_images/data-science-applications.4e5019cd8790ebac2277ff5f08af386f8727cac5d30f77727c7090677e6adb9c.uk.png) Джерело зображення: [Data Flair: 6 Amazing Data Science Applications ](https://data-flair.training/blogs/data-science-applications/) -На рисунку показано інші галузі та приклади застосування методів науки про дані. Хочете дослідити інші застосування? Перегляньте розділ [Огляд і самостійне навчання](../../../../6-Data-Science-In-Wild/20-Real-World-Examples) нижче. +На малюнку показані інші галузі та приклади застосування технік науки про дані. Хочете дослідити інші застосування? Ознайомтеся з розділом [Огляд і самостійне навчання](../../../../6-Data-Science-In-Wild/20-Real-World-Examples) нижче. ## Наука про дані + Дослідження @@ -51,28 +51,28 @@ CO_OP_TRANSLATOR_METADATA: | :---------------------------------------------------------------------------------------------------------------: | | Наука про дані та дослідження - _Скетчноут від [@nitya](https://twitter.com/nitya)_ | -Хоча реальні застосування часто зосереджуються на галузевих кейсах у масштабі, _дослідницькі_ застосування та проєкти можуть бути корисними з двох перспектив: +Хоча реальні застосування часто зосереджуються на масштабних індустріальних кейсах, _дослідницькі_ застосування та проєкти можуть бути корисними з двох точок зору: * _можливості для інновацій_ - дослідження швидкого прототипування передових концепцій і тестування користувацького досвіду для додатків наступного покоління. -* _виклики впровадження_ - вивчення потенційних шкод або непередбачених наслідків технологій науки про дані в реальних контекстах. +* _виклики впровадження_ - вивчення потенційних шкод або непередбачених наслідків технологій науки про дані у реальних контекстах. -Для студентів ці дослідницькі проєкти можуть забезпечити як навчальні, так і можливості для співпраці, що покращить ваше розуміння теми та розширить вашу обізнаність і взаємодію з відповідними людьми або командами, які працюють у цікавих для вас сферах. Тож як виглядають дослідницькі проєкти і як вони можуть вплинути? +Для студентів ці дослідницькі проєкти можуть забезпечити як навчальні, так і колаборативні можливості, які покращать ваше розуміння теми та розширять вашу обізнаність і взаємодію з відповідними людьми чи командами, що працюють у цікавих для вас галузях. Тож, як виглядають дослідницькі проєкти і як вони можуть вплинути? -Розглянемо один приклад - [Дослідження Gender Shades MIT](http://gendershades.org/overview.html) від Джой Буоламвіні (MIT Media Labs) із [знаковою дослідницькою статтею](http://proceedings.mlr.press/v81/buolamwini18a/buolamwini18a.pdf), співавтором якої була Тімніт Гебру (тоді в Microsoft Research), що зосереджувалася на: +Розглянемо один приклад - [Дослідження Gender Shades від MIT](http://gendershades.org/overview.html) Джой Буоламвіні (MIT Media Labs) із [знаковою дослідницькою статтею](http://proceedings.mlr.press/v81/buolamwini18a/buolamwini18a.pdf), співавтором якої була Тімніт Гебру (тоді в Microsoft Research), що зосереджувалася на: - * **Що:** Метою дослідницького проєкту було _оцінити упередження, присутні в алгоритмах і наборах даних автоматизованого аналізу облич_, на основі статі та типу шкіри. - * **Чому:** Аналіз облич використовується в таких сферах, як правоохоронні органи, безпека в аеропортах, системи найму тощо - контексти, де неточні класифікації (наприклад, через упередження) можуть спричинити потенційні економічні та соціальні шкоди для постраждалих осіб або груп. Розуміння (та усунення або пом'якшення) упереджень є ключовим для справедливості у використанні. - * **Як:** Дослідники визнали, що існуючі еталони використовували переважно світлошкірих суб'єктів, і створили новий набір даних (1000+ зображень), який був _більш збалансованим_ за статтю та типом шкіри. Набір даних використовувався для оцінки точності трьох продуктів класифікації статі (від Microsoft, IBM і Face++). +* **Що:** Метою дослідницького проєкту було _оцінити упередження, присутні в алгоритмах і наборах даних автоматизованого аналізу облич_, на основі статі та типу шкіри. +* **Чому:** Аналіз облич використовується у таких сферах, як правоохоронні органи, безпека в аеропортах, системи найму тощо - контексти, де неточні класифікації (наприклад, через упередження) можуть спричинити потенційні економічні та соціальні шкоди для постраждалих осіб або груп. Розуміння (та усунення або пом’якшення) упереджень є ключем до справедливості у використанні. +* **Як:** Дослідники виявили, що існуючі еталони використовували переважно суб’єктів зі світлішою шкірою, і створили новий набір даних (1000+ зображень), який був _більш збалансованим_ за статтю та типом шкіри. Цей набір даних використовувався для оцінки точності трьох продуктів класифікації за статтю (від Microsoft, IBM і Face++). -Результати показали, що хоча загальна точність класифікації була хорошою, спостерігалася помітна різниця в рівнях помилок між різними підгрупами - з **помилковою класифікацією статі**, яка була вищою для жінок або осіб із темнішим типом шкіри, що свідчить про упередження. +Результати показали, що хоча загальна точність класифікації була хорошою, спостерігалася помітна різниця у рівнях помилок між різними підгрупами - з **помилковою ідентифікацією статі**, яка була вищою для жінок або осіб із темнішою шкірою, що свідчить про упередження. -**Основні результати:** Підвищення обізнаності про те, що наука про дані потребує _репрезентативних наборів даних_ (збалансованих підгруп) і _інклюзивних команд_ (різноманітних за походженням), щоб раніше розпізнавати та усувати або пом'якшувати такі упередження в рішеннях штучного інтелекту. Такі дослідницькі зусилля також є важливими для багатьох організацій, які визначають принципи та практики _відповідального штучного інтелекту_ для покращення справедливості у своїх продуктах і процесах штучного інтелекту. +**Ключові результати:** Підвищення обізнаності про те, що наука про дані потребує _репрезентативніших наборів даних_ (збалансованих підгруп) і _інклюзивніших команд_ (різноманітних за походженням), щоб раніше розпізнавати та усувати або пом’якшувати такі упередження у рішеннях на основі ШІ. Такі дослідницькі зусилля також є ключовими для багатьох організацій у визначенні принципів і практик _відповідального ШІ_ для покращення справедливості у їхніх продуктах і процесах ШІ. **Хочете дізнатися про відповідні дослідницькі зусилля в Microsoft?** -* Ознайомтеся з [Дослідницькими проєктами Microsoft](https://www.microsoft.com/research/research-area/artificial-intelligence/?facet%5Btax%5D%5Bmsr-research-area%5D%5B%5D=13556&facet%5Btax%5D%5Bmsr-content-type%5D%5B%5D=msr-project) у галузі штучного інтелекту. -* Досліджуйте студентські проєкти з [Літньої школи науки про дані Microsoft Research](https://www.microsoft.com/en-us/research/academic-program/data-science-summer-school/). -* Ознайомтеся з проєктом [Fairlearn](https://fairlearn.org/) та ініціативами [Відповідального штучного інтелекту](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1%3aprimaryr6). +* Ознайомтеся з [дослідницькими проєктами Microsoft](https://www.microsoft.com/research/research-area/artificial-intelligence/?facet%5Btax%5D%5Bmsr-research-area%5D%5B%5D=13556&facet%5Btax%5D%5Bmsr-content-type%5D%5B%5D=msr-project) у галузі штучного інтелекту. +* Дослідіть студентські проєкти з [Літньої школи науки про дані Microsoft Research](https://www.microsoft.com/en-us/research/academic-program/data-science-summer-school/). +* Ознайомтеся з проєктом [Fairlearn](https://fairlearn.org/) та ініціативами [Відповідального ШІ](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1%3aprimaryr6). ## Наука про дані + Гуманітарні науки @@ -80,17 +80,17 @@ CO_OP_TRANSLATOR_METADATA: | :---------------------------------------------------------------------------------------------------------------: | | Наука про дані та цифрові гуманітарні науки - _Скетчноут від [@nitya](https://twitter.com/nitya)_ | -Цифрові гуманітарні науки [визначаються](https://digitalhumanities.stanford.edu/about-dh-stanford) як "сукупність практик і підходів, що поєднують обчислювальні методи з гуманітарними дослідженнями". [Проєкти Стенфорда](https://digitalhumanities.stanford.edu/projects), такі як _"перезавантаження історії"_ та _"поетичне мислення"_, ілюструють зв'язок між [цифровими гуманітарними науками та наукою про дані](https://digitalhumanities.stanford.edu/digital-humanities-and-data-science) - підкреслюючи такі методи, як аналіз мереж, візуалізація інформації, просторовий і текстовий аналіз, які допомагають нам переглядати історичні та літературні набори даних, щоб отримати нові інсайти та перспективи. +Цифрові гуманітарні науки [визначаються](https://digitalhumanities.stanford.edu/about-dh-stanford) як "сукупність практик і підходів, що поєднують обчислювальні методи з гуманітарними дослідженнями". [Проєкти Стенфорда](https://digitalhumanities.stanford.edu/projects), такі як _"перезавантаження історії"_ та _"поетичне мислення"_, ілюструють зв’язок між [цифровими гуманітарними науками та наукою про дані](https://digitalhumanities.stanford.edu/digital-humanities-and-data-science) - підкреслюючи техніки, такі як аналіз мереж, візуалізація інформації, просторовий і текстовий аналіз, які можуть допомогти нам переосмислити історичні та літературні набори даних для отримання нових інсайтів і перспектив. -*Хочете дослідити та розширити проєкт у цій сфері?* +*Хочете дослідити та розширити проєкт у цій галузі?* -Ознайомтеся з ["Емілі Дікінсон і метр настрою"](https://gist.github.com/jlooper/ce4d102efd057137bc000db796bfd671) - чудовим прикладом від [Джен Лупер](https://twitter.com/jenlooper), який запитує, як ми можемо використовувати науку про дані, щоб переглянути знайому поезію та переоцінити її значення і внесок автора в нових контекстах. Наприклад, _чи можемо ми передбачити сезон, у який був написаний вірш, аналізуючи його тон або настрій_ - і що це говорить нам про стан автора в той період? +Ознайомтеся з ["Емілі Дікінсон і метр настрою"](https://gist.github.com/jlooper/ce4d102efd057137bc000db796bfd671) - чудовим прикладом від [Джен Лупер](https://twitter.com/jenlooper), який запитує, як ми можемо використовувати науку про дані, щоб переосмислити знайому поезію та переоцінити її значення й внесок автора в нових контекстах. Наприклад, _чи можемо ми передбачити сезон, у який був написаний вірш, аналізуючи його тон або настрій_ - і що це говорить нам про стан розуму автора у відповідний період? -Щоб відповісти на це запитання, ми слідуємо етапам життєвого циклу науки про дані: - * [`Отримання даних`](https://gist.github.com/jlooper/ce4d102efd057137bc000db796bfd671#acquiring-the-dataset) - для збору відповідного набору даних для аналізу. Варіанти включають використання API (наприклад, [Poetry DB API](https://poetrydb.org/index.html)) або скрапінг веб-сторінок (наприклад, [Проєкт Гутенберг](https://www.gutenberg.org/files/12242/12242-h/12242-h.htm)) за допомогою інструментів, таких як [Scrapy](https://scrapy.org/). - * [`Очищення даних`](https://gist.github.com/jlooper/ce4d102efd057137bc000db796bfd671#clean-the-data) - пояснює, як текст може бути відформатований, очищений і спрощений за допомогою базових інструментів, таких як Visual Studio Code і Microsoft Excel. - * [`Аналіз даних`](https://gist.github.com/jlooper/ce4d102efd057137bc000db796bfd671#working-with-the-data-in-a-notebook) - пояснює, як ми можемо імпортувати набір даних у "ноутбуки" для аналізу за допомогою Python-пакетів (таких як pandas, numpy і matplotlib) для організації та візуалізації даних. - * [`Аналіз настрою`](https://gist.github.com/jlooper/ce4d102efd057137bc000db796bfd671#sentiment-analysis-using-cognitive-services) - пояснює, як ми можемо інтегрувати хмарні сервіси, такі як Text Analytics, використовуючи низькокодові інструменти, такі як [Power Automate](https://flow.microsoft.com/en-us/) для автоматизованих робочих процесів обробки даних. +Щоб відповісти на це запитання, ми дотримуємося етапів життєвого циклу науки про дані: +* [`Отримання даних`](https://gist.github.com/jlooper/ce4d102efd057137bc000db796bfd671#acquiring-the-dataset) - для збору відповідного набору даних для аналізу. Варіанти включають використання API (наприклад, [Poetry DB API](https://poetrydb.org/index.html)) або скрапінг вебсторінок (наприклад, [Проєкт Гутенберг](https://www.gutenberg.org/files/12242/12242-h/12242-h.htm)) за допомогою інструментів, таких як [Scrapy](https://scrapy.org/). +* [`Очищення даних`](https://gist.github.com/jlooper/ce4d102efd057137bc000db796bfd671#clean-the-data) - пояснює, як текст може бути відформатований, очищений і спрощений за допомогою базових інструментів, таких як Visual Studio Code і Microsoft Excel. +* [`Аналіз даних`](https://gist.github.com/jlooper/ce4d102efd057137bc000db796bfd671#working-with-the-data-in-a-notebook) - пояснює, як ми можемо імпортувати набір даних у "ноутбуки" для аналізу за допомогою Python-пакетів (таких як pandas, numpy і matplotlib) для організації та візуалізації даних. +* [`Аналіз настроїв`](https://gist.github.com/jlooper/ce4d102efd057137bc000db796bfd671#sentiment-analysis-using-cognitive-services) - пояснює, як ми можемо інтегрувати хмарні сервіси, такі як Text Analytics, використовуючи інструменти з низьким кодом, такі як [Power Automate](https://flow.microsoft.com/en-us/) для автоматизованих робочих процесів обробки даних. Використовуючи цей робочий процес, ми можемо дослідити сезонні впливи на настрій віршів і допомогти нам сформувати власні перспективи щодо автора. Спробуйте самі - а потім розширте ноутбук, щоб поставити інші запитання або візуалізувати дані новими способами! @@ -102,49 +102,48 @@ CO_OP_TRANSLATOR_METADATA: | :---------------------------------------------------------------------------------------------------------------: | | Наука про дані та сталий розвиток - _Скетчноут від [@nitya](https://twitter.com/nitya)_ | -[Порядок денний сталого розвитку до 2030 року](https://sdgs.un.org/2030agenda) - прийнятий усіма членами ООН у 2015 році - визначає 17 цілей, включаючи ті, що зосереджуються на **захисті планети** від деградації та впливу кліматичних змін. Ініціатива [Microsoft Sustainability](https://www.microsoft.com/en-us/sustainability) підтримує ці цілі, досліджуючи способи, якими технологічні рішення можуть сприяти створенню більш сталого майбутнього з [фокусом на 4 цілі](https://dev.to/azure/a-visual-guide-to-sustainable-software-engineering-53hh) - бути вуглецево негативними, водно позитивними, безвідходними та біорізноманітними до 2030 року. - -Вирішення цих викликів у масштабі та своєчасно потребує мислення в масштабах хмари - і великих обсягів даних. -**Проєкт Planetary Computer наразі перебуває у попередньому перегляді (станом на вересень 2021 року)** - ось як ви можете почати роботу, сприяючи створенню рішень для сталого розвитку за допомогою науки про дані. +[Порядок денний на 2030 рік для сталого розвитку](https://sdgs.un.org/2030agenda) - ухвалений усіма членами ООН у 2015 році - визначає 17 цілей, включаючи ті, що зосереджені на **захисті планети** від деградації та впливу зміни клімату. Ініціатива [Microsoft Sustainability](https://www.microsoft.com/en-us/sustainability) підтримує ці цілі, досліджуючи способи, якими технологічні рішення можуть сприяти створенню більш сталого майбутнього, з [фокусом на 4 цілях](https://dev.to/azure/a-visual-guide-to-sustainable-software-engineering-53hh) - бути вуглецево негативними, водно позитивними, безвідходними та біорізноманітними +**Проєкт Planetary Computer наразі перебуває у стадії попереднього перегляду (станом на вересень 2021 року)** – ось як ви можете почати долучатися до створення рішень для сталого розвитку за допомогою науки про дані. * [Запитайте доступ](https://planetarycomputer.microsoft.com/account/request), щоб розпочати дослідження та зв’язатися з однодумцями. -* [Ознайомтеся з документацією](https://planetarycomputer.microsoft.com/docs/overview/about), щоб зрозуміти підтримувані набори даних та API. -* Досліджуйте застосунки, такі як [Моніторинг екосистем](https://analytics-lab.org/ecosystemmonitoring/), щоб отримати натхнення для ідей застосунків. +* [Ознайомтеся з документацією](https://planetarycomputer.microsoft.com/docs/overview/about), щоб зрозуміти, які набори даних і API підтримуються. +* Досліджуйте застосунки, такі як [Моніторинг екосистем](https://analytics-lab.org/ecosystemmonitoring/), для натхнення на створення власних ідей. -Подумайте, як ви можете використовувати візуалізацію даних, щоб виявити або підсилити важливі інсайти в таких сферах, як зміна клімату та вирубка лісів. Або подумайте, як ці інсайти можуть бути використані для створення нових користувацьких досвідів, які мотивують до змін у поведінці для більш сталого способу життя. +Подумайте, як ви можете використовувати візуалізацію даних, щоб виявляти або підсилювати важливі інсайти у таких сферах, як зміна клімату та вирубка лісів. Або ж подумайте, як ці інсайти можуть бути використані для створення нових користувацьких досвідів, які мотивують до змін у поведінці для більш сталого способу життя. ## Наука про дані + Студенти -Ми говорили про реальні застосування в індустрії та дослідженнях, а також розглядали приклади застосування науки про дані в цифрових гуманітарних науках і сталому розвитку. Тож як ви можете розвивати свої навички та ділитися своїм досвідом як початківці в науці про дані? +Ми говорили про реальні застосування в індустрії та дослідженнях, а також розглядали приклади застосування науки про дані у цифрових гуманітарних науках і сталому розвитку. Тож як ви можете розвивати свої навички та ділитися своїм досвідом як початківці у науці про дані? Ось кілька прикладів студентських проєктів у сфері науки про дані, які можуть вас надихнути. -* [Літня школа науки про дані MSR](https://www.microsoft.com/en-us/research/academic-program/data-science-summer-school/#!projects) із GitHub [проєктами](https://github.com/msr-ds3), що досліджують такі теми, як: +* [Літня школа науки про дані MSR](https://www.microsoft.com/en-us/research/academic-program/data-science-summer-school/#!projects) із [проєктами](https://github.com/msr-ds3) на GitHub, які досліджують такі теми, як: - [Расова упередженість у застосуванні сили поліцією](https://www.microsoft.com/en-us/research/video/data-science-summer-school-2019-replicating-an-empirical-analysis-of-racial-differences-in-police-use-of-force/) | [Github](https://github.com/msr-ds3/stop-question-frisk) - [Надійність системи метро Нью-Йорка](https://www.microsoft.com/en-us/research/video/data-science-summer-school-2018-exploring-the-reliability-of-the-nyc-subway-system/) | [Github](https://github.com/msr-ds3/nyctransit) -* [Оцифрування матеріальної культури: Дослідження соціально-економічних розподілів у Сіркапі](https://claremont.maps.arcgis.com/apps/Cascade/index.html?appid=bdf2aef0f45a4674ba41cd373fa23afc) - від [Орнелли Алтунян](https://twitter.com/ornelladotcom) та команди з Клермонта, використовуючи [ArcGIS StoryMaps](https://storymaps.arcgis.com/). +* [Оцифровування матеріальної культури: Дослідження соціально-економічних розподілів у Сиркапі](https://claremont.maps.arcgis.com/apps/Cascade/index.html?appid=bdf2aef0f45a4674ba41cd373fa23afc) – від [Орнелли Алтунян](https://twitter.com/ornelladotcom) та команди з Клермонта, використовуючи [ArcGIS StoryMaps](https://storymaps.arcgis.com/). ## 🚀 Виклик -Шукайте статті, які рекомендують проєкти з науки про дані, що підходять для початківців, наприклад [ці 50 тем](https://www.upgrad.com/blog/data-science-project-ideas-topics-beginners/) або [ці 21 ідея проєктів](https://www.intellspot.com/data-science-project-ideas) чи [ці 16 проєктів із вихідним кодом](https://data-flair.training/blogs/data-science-project-ideas/), які ви можете розібрати та адаптувати. І не забудьте вести блог про свої навчальні подорожі та ділитися своїми інсайтами з усіма нами. +Шукайте статті, які рекомендують проєкти з науки про дані, що підходять для початківців, наприклад, [ці 50 тем](https://www.upgrad.com/blog/data-science-project-ideas-topics-beginners/), [ці 21 ідею проєктів](https://www.intellspot.com/data-science-project-ideas) або [ці 16 проєктів із вихідним кодом](https://data-flair.training/blogs/data-science-project-ideas/), які ви можете розібрати та адаптувати. І не забудьте вести блог про свої навчальні подорожі та ділитися своїми інсайтами з усіма нами. -## Тест після лекції +## Післялекційний тест -## [Тест після лекції](https://ff-quizzes.netlify.app/en/ds/quiz/39) +## [Післялекційний тест](https://ff-quizzes.netlify.app/en/ds/quiz/39) ## Огляд і самостійне навчання Хочете дослідити більше варіантів використання? Ось кілька відповідних статей: -* [17 застосувань і прикладів науки про дані](https://builtin.com/data-science/data-science-applications-examples) - липень 2021 -* [11 захоплюючих застосувань науки про дані в реальному світі](https://myblindbird.com/data-science-applications-real-world/) - травень 2021 -* [Наука про дані в реальному світі](https://towardsdatascience.com/data-science-in-the-real-world/home) - збірка статей -* Наука про дані в: [освіті](https://data-flair.training/blogs/data-science-in-education/), [сільському господарстві](https://data-flair.training/blogs/data-science-in-agriculture/), [фінансах](https://data-flair.training/blogs/data-science-in-finance/), [кіноіндустрії](https://data-flair.training/blogs/data-science-at-movies/) та інших сферах. +* [17 застосувань і прикладів науки про дані](https://builtin.com/data-science/data-science-applications-examples) – липень 2021 +* [11 вражаючих застосувань науки про дані у реальному світі](https://myblindbird.com/data-science-applications-real-world/) – травень 2021 +* [Наука про дані у реальному світі](https://towardsdatascience.com/data-science-in-the-real-world/home) – збірка статей +* [12 реальних застосувань науки про дані з прикладами](https://www.scaler.com/blog/data-science-applications/) – травень 2024 +* Наука про дані у: [освіті](https://data-flair.training/blogs/data-science-in-education/), [сільському господарстві](https://data-flair.training/blogs/data-science-in-agriculture/), [фінансах](https://data-flair.training/blogs/data-science-in-finance/), [кіноіндустрії](https://data-flair.training/blogs/data-science-at-movies/), [охороні здоров’я](https://onlinedegrees.sandiego.edu/data-science-health-care/) та інших сферах. ## Завдання -[Досліджуйте набір даних Planetary Computer](assignment.md) +[Дослідіть набір даних Planetary Computer](assignment.md) --- **Відмова від відповідальності**: -Цей документ був перекладений за допомогою сервісу автоматичного перекладу [Co-op Translator](https://github.com/Azure/co-op-translator). Хоча ми прагнемо до точності, будь ласка, майте на увазі, що автоматичні переклади можуть містити помилки або неточності. Оригінальний документ на його рідній мові слід вважати авторитетним джерелом. Для критичної інформації рекомендується професійний людський переклад. Ми не несемо відповідальності за будь-які непорозуміння або неправильні тлумачення, що виникають внаслідок використання цього перекладу. \ No newline at end of file +Цей документ було перекладено за допомогою сервісу автоматичного перекладу [Co-op Translator](https://github.com/Azure/co-op-translator). Хоча ми прагнемо до точності, зверніть увагу, що автоматичні переклади можуть містити помилки або неточності. Оригінальний документ мовою оригіналу слід вважати авторитетним джерелом. Для критично важливої інформації рекомендується професійний людський переклад. Ми не несемо відповідальності за будь-які непорозуміння або неправильні тлумачення, що виникли внаслідок використання цього перекладу. \ No newline at end of file diff --git a/translations/ur/6-Data-Science-In-Wild/20-Real-World-Examples/README.md b/translations/ur/6-Data-Science-In-Wild/20-Real-World-Examples/README.md index f15d473c..ea74926e 100644 --- a/translations/ur/6-Data-Science-In-Wild/20-Real-World-Examples/README.md +++ b/translations/ur/6-Data-Science-In-Wild/20-Real-World-Examples/README.md @@ -1,23 +1,23 @@ # ڈیٹا سائنس حقیقی دنیا میں -| ![ Sketchnote by [(@sketchthedocs)](https://sketchthedocs.dev) ](../../sketchnotes/20-DataScience-RealWorld.png) | +| ![ [(@sketchthedocs)](https://sketchthedocs.dev) کی اسکیچ نوٹ ](../../sketchnotes/20-DataScience-RealWorld.png) | | :--------------------------------------------------------------------------------------------------------------: | -| ڈیٹا سائنس حقیقی دنیا میں - _Sketchnote by [@nitya](https://twitter.com/nitya)_ | +| حقیقی دنیا میں ڈیٹا سائنس - _اسکیچ نوٹ از [@nitya](https://twitter.com/nitya)_ | -ہم اس تعلیمی سفر کے اختتام کے قریب پہنچ چکے ہیں! +ہم اس سیکھنے کے سفر کے اختتام کے قریب پہنچ چکے ہیں! ہم نے ڈیٹا سائنس اور اخلاقیات کی تعریفوں سے آغاز کیا، ڈیٹا تجزیہ اور بصریات کے مختلف آلات اور تکنیکوں کو دریافت کیا، ڈیٹا سائنس کے لائف سائیکل کا جائزہ لیا، اور کلاؤڈ کمپیوٹنگ سروسز کے ذریعے ڈیٹا سائنس ورک فلو کو بڑھانے اور خودکار کرنے کے طریقے دیکھے۔ تو آپ شاید سوچ رہے ہوں گے: _"میں ان تمام سیکھنے کو حقیقی دنیا کے سیاق و سباق میں کیسے نقشہ بنا سکتا ہوں؟"_ -اس سبق میں، ہم صنعت میں ڈیٹا سائنس کے حقیقی دنیا کے اطلاقات کو دریافت کریں گے اور تحقیق، ڈیجیٹل ہیومینٹیز، اور پائیداری کے سیاق و سباق میں مخصوص مثالوں پر غور کریں گے۔ ہم طلباء کے پروجیکٹ کے مواقع پر نظر ڈالیں گے اور آپ کے تعلیمی سفر کو جاری رکھنے میں مدد کے لیے مفید وسائل کے ساتھ اختتام کریں گے! +اس سبق میں، ہم صنعت میں ڈیٹا سائنس کے حقیقی دنیا کے اطلاقات کا جائزہ لیں گے اور تحقیق، ڈیجیٹل ہیومینٹیز، اور پائیداری کے سیاق و سباق میں مخصوص مثالوں پر غور کریں گے۔ ہم طلباء کے پروجیکٹ کے مواقع پر نظر ڈالیں گے اور آپ کے سیکھنے کے سفر کو جاری رکھنے میں مدد کے لیے مفید وسائل کے ساتھ اختتام کریں گے! ## لیکچر سے پہلے کا کوئز @@ -27,107 +27,107 @@ CO_OP_TRANSLATOR_METADATA: AI کی جمہوریت کی بدولت، ڈویلپرز کے لیے AI سے چلنے والے فیصلے سازی اور ڈیٹا سے چلنے والے بصیرت کو صارف کے تجربات اور ترقیاتی ورک فلو میں ڈیزائن اور شامل کرنا آسان ہو گیا ہے۔ یہاں کچھ مثالیں ہیں کہ ڈیٹا سائنس کو صنعت میں حقیقی دنیا کے اطلاقات میں کیسے "لاگو" کیا جاتا ہے: - * [Google Flu Trends](https://www.wired.com/2015/10/can-learn-epic-failure-google-flu-trends/) نے ڈیٹا سائنس کا استعمال کرتے ہوئے تلاش کے الفاظ کو فلو کے رجحانات سے جوڑا۔ اگرچہ اس طریقہ کار میں خامیاں تھیں، لیکن اس نے ڈیٹا سے چلنے والی صحت کی پیش گوئیوں کے امکانات (اور چیلنجز) کے بارے میں آگاہی پیدا کی۔ + * [گوگل فلو ٹرینڈز](https://www.wired.com/2015/10/can-learn-epic-failure-google-flu-trends/) نے ڈیٹا سائنس کا استعمال کرتے ہوئے تلاش کے الفاظ کو فلو ٹرینڈز کے ساتھ جوڑا۔ اگرچہ اس طریقہ کار میں خامیاں تھیں، لیکن اس نے ڈیٹا سے چلنے والی صحت کی پیش گوئیوں کے امکانات (اور چیلنجز) کے بارے میں آگاہی پیدا کی۔ - * [UPS Routing Predictions](https://www.technologyreview.com/2018/11/21/139000/how-ups-uses-ai-to-outsmart-bad-weather/) - وضاحت کرتا ہے کہ UPS ڈیٹا سائنس اور مشین لرننگ کا استعمال کرتے ہوئے موسم کی حالت، ٹریفک کے نمونے، ڈیلیوری کی آخری تاریخ اور مزید کو مدنظر رکھتے ہوئے ڈیلیوری کے لیے بہترین راستوں کی پیش گوئی کیسے کرتا ہے۔ + * [UPS روٹنگ پیش گوئیاں](https://www.technologyreview.com/2018/11/21/139000/how-ups-uses-ai-to-outsmart-bad-weather/) - وضاحت کرتا ہے کہ UPS ڈیٹا سائنس اور مشین لرننگ کا استعمال کرتے ہوئے موسم کی حالت، ٹریفک کے نمونے، ڈیلیوری کی آخری تاریخ اور مزید کو مدنظر رکھتے ہوئے ڈیلیوری کے لیے بہترین راستوں کی پیش گوئی کیسے کرتا ہے۔ - * [NYC Taxicab Route Visualization](http://chriswhong.github.io/nyctaxi/) - [Freedom Of Information Laws](https://chriswhong.com/open-data/foil_nyc_taxi/) کے ذریعے جمع کردہ ڈیٹا نے NYC ٹیکسیوں کی زندگی کے ایک دن کو بصری طور پر پیش کیا، جس سے ہمیں یہ سمجھنے میں مدد ملی کہ وہ مصروف شہر میں کیسے نیویگیٹ کرتے ہیں، وہ کتنی رقم کماتے ہیں، اور ہر 24 گھنٹے کی مدت میں سفر کا دورانیہ۔ + * [NYC ٹیکسی کیب روٹ بصریات](http://chriswhong.github.io/nyctaxi/) - [آزادی معلومات کے قوانین](https://chriswhong.com/open-data/foil_nyc_taxi/) کا استعمال کرتے ہوئے جمع کردہ ڈیٹا نے NYC کیبس کی زندگی کے ایک دن کو بصری بنایا، جس سے ہمیں یہ سمجھنے میں مدد ملی کہ وہ مصروف شہر میں کیسے نیویگیٹ کرتے ہیں، وہ کتنی رقم کماتے ہیں، اور ہر 24 گھنٹے کی مدت میں سفر کا دورانیہ۔ - * [Uber Data Science Workbench](https://eng.uber.com/dsw/) - روزانہ لاکھوں اوبر سفر سے جمع کردہ ڈیٹا (پک اپ اور ڈراپ آف مقامات، سفر کا دورانیہ، ترجیحی راستے وغیرہ) کا استعمال کرتے ہوئے ڈیٹا اینالیٹکس ٹول بنایا گیا جو قیمتوں، حفاظت، دھوکہ دہی کی شناخت اور نیویگیشن کے فیصلوں میں مدد کرتا ہے۔ + * [اوبر ڈیٹا سائنس ورک بینچ](https://eng.uber.com/dsw/) - روزانہ لاکھوں اوبر سفر سے جمع کردہ ڈیٹا (پک اپ اور ڈراپ آف مقامات، سفر کا دورانیہ، ترجیحی راستے وغیرہ) کا استعمال کرتے ہوئے ڈیٹا تجزیاتی ٹول بنایا گیا جو قیمتوں، حفاظت، دھوکہ دہی کی شناخت اور نیویگیشن کے فیصلوں میں مدد کرتا ہے۔ - * [Sports Analytics](https://towardsdatascience.com/scope-of-analytics-in-sports-world-37ed09c39860) - _پیش گوئی کے تجزیے_ (ٹیم اور کھلاڑی کا تجزیہ - جیسے [Moneyball](https://datasciencedegree.wisconsin.edu/blog/moneyball-proves-importance-big-data-big-ideas/) - اور مداحوں کا انتظام) اور _ڈیٹا بصریات_ (ٹیم اور مداحوں کے ڈیش بورڈز، کھیل وغیرہ) پر توجہ مرکوز کرتا ہے، جیسے ٹیلنٹ اسکاؤٹنگ، کھیلوں کی شرط بندی اور انوینٹری/مقام کا انتظام۔ + * [کھیلوں کی تجزیات](https://towardsdatascience.com/scope-of-analytics-in-sports-world-37ed09c39860) - _پیش گوئی تجزیات_ (ٹیم اور کھلاڑی کا تجزیہ - جیسے [منی بال](https://datasciencedegree.wisconsin.edu/blog/moneyball-proves-importance-big-data-big-ideas/) - اور مداحوں کا انتظام) اور _ڈیٹا بصریات_ (ٹیم اور مداحوں کے ڈیش بورڈز، کھیل وغیرہ) پر توجہ مرکوز کرتا ہے، جیسے ٹیلنٹ اسکاؤٹنگ، کھیلوں کی جوا بازی اور انوینٹری/مقام کا انتظام۔ - * [Data Science in Banking](https://data-flair.training/blogs/data-science-in-banking/) - مالی صنعت میں ڈیٹا سائنس کی قدر کو اجاگر کرتا ہے، جس میں خطرے کی ماڈلنگ اور دھوکہ دہی کی شناخت سے لے کر کسٹمر کی تقسیم، حقیقی وقت کی پیش گوئی اور سفارش کرنے والے نظام شامل ہیں۔ پیش گوئی کے تجزیے اہم اقدامات جیسے [کریڈٹ اسکورز](https://dzone.com/articles/using-big-data-and-predictive-analytics-for-credit) کو بھی چلاتے ہیں۔ + * [بینکنگ میں ڈیٹا سائنس](https://data-flair.training/blogs/data-science-in-banking/) - مالی صنعت میں ڈیٹا سائنس کی قدر کو اجاگر کرتا ہے، جس میں خطرے کی ماڈلنگ اور دھوکہ دہی کی شناخت سے لے کر کسٹمر کی تقسیم، حقیقی وقت کی پیش گوئی اور سفارش کرنے والے نظام شامل ہیں۔ پیش گوئی تجزیات بھی اہم اقدامات جیسے [کریڈٹ اسکورز](https://dzone.com/articles/using-big-data-and-predictive-analytics-for-credit) کو چلاتے ہیں۔ - * [Data Science in Healthcare](https://data-flair.training/blogs/data-science-in-healthcare/) - طبی امیجنگ (جیسے MRI، ایکس رے، CT-Scan)، جینومکس (DNA سیکوینسنگ)، دوا کی ترقی (خطرے کی تشخیص، کامیابی کی پیش گوئی)، پیش گوئی کے تجزیے (مریض کی دیکھ بھال اور سپلائی لاجسٹکس)، بیماری کی نگرانی اور روک تھام وغیرہ جیسے اطلاقات کو اجاگر کرتا ہے۔ + * [صحت کی دیکھ بھال میں ڈیٹا سائنس](https://data-flair.training/blogs/data-science-in-healthcare/) - طبی امیجنگ (جیسے MRI، ایکس رے، CT-Scan)، جینومکس (DNA سیکوینسنگ)، دوا کی ترقی (خطرے کی تشخیص، کامیابی کی پیش گوئی)، پیش گوئی تجزیات (مریض کی دیکھ بھال اور سپلائی لاجسٹکس)، بیماری کی ٹریکنگ اور روک تھام وغیرہ جیسے اطلاقات کو اجاگر کرتا ہے۔ -![Data Science Applications in The Real World](../../../../6-Data-Science-In-Wild/20-Real-World-Examples/images/data-science-applications.png) تصویر کا کریڈٹ: [Data Flair: 6 Amazing Data Science Applications ](https://data-flair.training/blogs/data-science-applications/) +![حقیقی دنیا میں ڈیٹا سائنس کے اطلاقات](../../../../translated_images/data-science-applications.4e5019cd8790ebac2277ff5f08af386f8727cac5d30f77727c7090677e6adb9c.ur.png) تصویر کا کریڈٹ: [Data Flair: 6 Amazing Data Science Applications ](https://data-flair.training/blogs/data-science-applications/) -یہ تصویر دیگر شعبوں اور ڈیٹا سائنس تکنیکوں کے اطلاقات کی مثالیں دکھاتی ہے۔ کیا آپ دیگر اطلاقات کو دریافت کرنا چاہتے ہیں؟ نیچے [Review & Self Study](../../../../6-Data-Science-In-Wild/20-Real-World-Examples) سیکشن دیکھیں۔ +یہ شکل دیگر ڈومینز اور ڈیٹا سائنس تکنیکوں کے اطلاقات کی مثالیں دکھاتی ہے۔ کیا آپ دیگر اطلاقات کو دریافت کرنا چاہتے ہیں؟ نیچے [جائزہ اور خود مطالعہ](../../../../6-Data-Science-In-Wild/20-Real-World-Examples) سیکشن دیکھیں۔ ## ڈیٹا سائنس + تحقیق -| ![ Sketchnote by [(@sketchthedocs)](https://sketchthedocs.dev) ](../../sketchnotes/20-DataScience-Research.png) | +| ![ [(@sketchthedocs)](https://sketchthedocs.dev) کی اسکیچ نوٹ ](../../sketchnotes/20-DataScience-Research.png) | | :---------------------------------------------------------------------------------------------------------------: | -| ڈیٹا سائنس اور تحقیق - _Sketchnote by [@nitya](https://twitter.com/nitya)_ | +| ڈیٹا سائنس اور تحقیق - _اسکیچ نوٹ از [@nitya](https://twitter.com/nitya)_ | جبکہ حقیقی دنیا کے اطلاقات اکثر صنعت کے استعمال کے معاملات پر توجہ مرکوز کرتے ہیں، _تحقیق_ کے اطلاقات اور پروجیکٹس دو نقطہ نظر سے مفید ہو سکتے ہیں: -* _جدت کے مواقع_ - جدید تصورات کے تیز پروٹوٹائپنگ اور اگلی نسل کے اطلاقات کے لیے صارف کے تجربات کی جانچ کریں۔ -* _تعیناتی کے چیلنجز_ - حقیقی دنیا کے سیاق و سباق میں ڈیٹا سائنس ٹیکنالوجیز کے ممکنہ نقصانات یا غیر ارادی نتائج کی تحقیقات کریں۔ +* _جدت کے مواقع_ - جدید تصورات کے تیز پروٹوٹائپنگ اور اگلی نسل کے اطلاقات کے لیے صارف کے تجربات کی جانچ کرنا۔ +* _تعیناتی کے چیلنجز_ - حقیقی دنیا کے سیاق و سباق میں ڈیٹا سائنس ٹیکنالوجیز کے ممکنہ نقصانات یا غیر ارادی نتائج کی تحقیقات کرنا۔ طلباء کے لیے، یہ تحقیقی پروجیکٹس سیکھنے اور تعاون کے مواقع فراہم کر سکتے ہیں جو آپ کی موضوع کی سمجھ کو بہتر بنا سکتے ہیں، اور دلچسپی کے شعبوں میں کام کرنے والے متعلقہ افراد یا ٹیموں کے ساتھ آپ کی آگاہی اور مشغولیت کو وسیع کر سکتے ہیں۔ تو تحقیقی پروجیکٹس کیسے نظر آتے ہیں اور وہ کیسے اثر ڈال سکتے ہیں؟ -آئیے ایک مثال دیکھتے ہیں - [MIT Gender Shades Study](http://gendershades.org/overview.html) جوائے بولااموینی (MIT میڈیا لیبز) کی طرف سے ایک [نمایاں تحقیقی مقالہ](http://proceedings.mlr.press/v81/buolamwini18a/buolamwini18a.pdf) کے ساتھ، جسے ٹمنیت گیبرو (اس وقت مائیکروسافٹ ریسرچ میں) کے ساتھ شریک تحریر کیا گیا تھا، جس نے توجہ مرکوز کی: +آئیے ایک مثال دیکھتے ہیں - [MIT جنس شیڈز اسٹڈی](http://gendershades.org/overview.html) جوائے بولااموینی (MIT میڈیا لیبز) کی جانب سے ایک [دستخطی تحقیقی مقالہ](http://proceedings.mlr.press/v81/buolamwini18a/buolamwini18a.pdf) کے ساتھ، جو ٹم نٹ گیبرو (اس وقت مائیکروسافٹ ریسرچ میں) کے ساتھ شریک مصنف تھا، جس نے توجہ مرکوز کی: - * **کیا:** تحقیقی پروجیکٹ کا مقصد _خودکار چہرے کے تجزیے کے الگورتھمز اور ڈیٹا سیٹس میں موجود تعصب کا جائزہ لینا_ تھا، جنس اور جلد کی قسم کی بنیاد پر۔ - * **کیوں:** چہرے کا تجزیہ قانون نافذ کرنے، ہوائی اڈے کی حفاظت، ہائرنگ سسٹمز اور مزید جیسے شعبوں میں استعمال ہوتا ہے - ایسے سیاق و سباق جہاں غلط درجہ بندی (جیسے تعصب کی وجہ سے) متاثرہ افراد یا گروہوں کو ممکنہ اقتصادی اور سماجی نقصانات پہنچا سکتی ہے۔ استعمال میں انصاف کے لیے تعصبات کو سمجھنا (اور ختم یا کم کرنا) کلیدی ہے۔ - * **کیسے:** محققین نے تسلیم کیا کہ موجودہ بینچ مارکس نے زیادہ تر ہلکی جلد والے مضامین کو استعمال کیا، اور ایک نیا ڈیٹا سیٹ (1000+ تصاویر) تیار کیا جو جنس اور جلد کی قسم کے لحاظ سے _زیادہ متوازن_ تھا۔ ڈیٹا سیٹ کو تین جنس کی درجہ بندی کی مصنوعات (مائیکروسافٹ، IBM اور Face++) کی درستگی کا جائزہ لینے کے لیے استعمال کیا گیا۔ + * **کیا:** تحقیقی پروجیکٹ کا مقصد _خودکار چہرے کے تجزیہ کے الگورتھمز اور ڈیٹا سیٹس میں موجود تعصب کا جائزہ لینا_ تھا، جنس اور جلد کی قسم کی بنیاد پر۔ + * **کیوں:** چہرے کا تجزیہ قانون نافذ کرنے، ہوائی اڈے کی حفاظت، ہائرنگ سسٹمز اور مزید جیسے شعبوں میں استعمال ہوتا ہے - ایسے سیاق و سباق جہاں غلط درجہ بندی (جیسے تعصب کی وجہ سے) متاثرہ افراد یا گروہوں کو ممکنہ اقتصادی اور سماجی نقصانات پہنچا سکتی ہے۔ استعمال میں انصاف کو بہتر بنانے کے لیے تعصبات کو سمجھنا (اور ختم یا کم کرنا) کلیدی ہے۔ + * **کیسے:** محققین نے تسلیم کیا کہ موجودہ بینچ مارکس زیادہ تر ہلکی جلد والے مضامین استعمال کرتے ہیں، اور ایک نیا ڈیٹا سیٹ (1000+ تصاویر) تیار کیا جو جنس اور جلد کی قسم کے لحاظ سے _زیادہ متوازن_ تھا۔ ڈیٹا سیٹ کو تین جنس کی درجہ بندی کی مصنوعات (مائیکروسافٹ، IBM اور Face++ سے) کی درستگی کا جائزہ لینے کے لیے استعمال کیا گیا۔ -نتائج نے ظاہر کیا کہ اگرچہ مجموعی طور پر درجہ بندی کی درستگی اچھی تھی، مختلف ذیلی گروپوں کے درمیان غلطی کی شرح میں نمایاں فرق تھا - **غلط جنس کی شناخت** خواتین یا گہری جلد والے افراد کے لیے زیادہ تھی، جو تعصب کی نشاندہی کرتی ہے۔ +نتائج نے ظاہر کیا کہ اگرچہ مجموعی طور پر درجہ بندی کی درستگی اچھی تھی، مختلف ذیلی گروپوں کے درمیان غلطی کی شرح میں نمایاں فرق تھا - **غلط جنس کی شناخت** خواتین یا گہرے جلد والے افراد کے لیے زیادہ تھی، جو تعصب کی نشاندہی کرتی ہے۔ **اہم نتائج:** یہ آگاہی پیدا کی کہ ڈیٹا سائنس کو زیادہ _نمائندہ ڈیٹا سیٹس_ (متوازن ذیلی گروپ) اور زیادہ _جامع ٹیموں_ (متنوع پس منظر) کی ضرورت ہے تاکہ AI حل میں ایسے تعصبات کو جلد پہچاننے اور ختم یا کم کرنے میں مدد ملے۔ اس طرح کی تحقیقی کوششیں بہت سی تنظیموں کے لیے _ذمہ دار AI_ کے اصولوں اور طریقوں کی وضاحت میں بھی اہم ہیں تاکہ ان کے AI مصنوعات اور عمل میں انصاف کو بہتر بنایا جا سکے۔ **مائیکروسافٹ میں متعلقہ تحقیقی کوششوں کے بارے میں جاننا چاہتے ہیں؟** -* [Microsoft Research Projects](https://www.microsoft.com/research/research-area/artificial-intelligence/?facet%5Btax%5D%5Bmsr-research-area%5D%5B%5D=13556&facet%5Btax%5D%5Bmsr-content-type%5D%5B%5D=msr-project) پر مصنوعی ذہانت کے بارے میں تحقیق کریں۔ -* [Microsoft Research Data Science Summer School](https://www.microsoft.com/en-us/research/academic-program/data-science-summer-school/) سے طلباء کے پروجیکٹس کو دریافت کریں۔ -* [Fairlearn](https://fairlearn.org/) پروجیکٹ اور [Responsible AI](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1%3aprimaryr6) اقدامات کو دیکھیں۔ +* [مائیکروسافٹ ریسرچ پروجیکٹس](https://www.microsoft.com/research/research-area/artificial-intelligence/?facet%5Btax%5D%5Bmsr-research-area%5D%5B%5D=13556&facet%5Btax%5D%5Bmsr-content-type%5D%5B%5D=msr-project) پر AI کے بارے میں دیکھیں۔ +* [مائیکروسافٹ ریسرچ ڈیٹا سائنس سمر اسکول](https://www.microsoft.com/en-us/research/academic-program/data-science-summer-school/) سے طلباء کے پروجیکٹس کو دریافت کریں۔ +* [Fairlearn](https://fairlearn.org/) پروجیکٹ اور [ذمہ دار AI](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1%3aprimaryr6) اقدامات کو دیکھیں۔ ## ڈیٹا سائنس + ہیومینٹیز -| ![ Sketchnote by [(@sketchthedocs)](https://sketchthedocs.dev) ](../../sketchnotes/20-DataScience-Humanities.png) | +| ![ [(@sketchthedocs)](https://sketchthedocs.dev) کی اسکیچ نوٹ ](../../sketchnotes/20-DataScience-Humanities.png) | | :---------------------------------------------------------------------------------------------------------------: | -| ڈیٹا سائنس اور ڈیجیٹل ہیومینٹیز - _Sketchnote by [@nitya](https://twitter.com/nitya)_ | +| ڈیٹا سائنس اور ڈیجیٹل ہیومینٹیز - _اسکیچ نوٹ از [@nitya](https://twitter.com/nitya)_ | -ڈیجیٹل ہیومینٹیز [کی تعریف کی گئی ہے](https://digitalhumanities.stanford.edu/about-dh-stanford) "ایک مجموعہ طریقوں اور نقطہ نظر کے طور پر جو کمپیوٹیشنل طریقوں کو انسانی تحقیق کے ساتھ جوڑتا ہے"۔ [اسٹینفورڈ پروجیکٹس](https://digitalhumanities.stanford.edu/projects) جیسے _"تاریخ کو دوبارہ شروع کرنا"_ اور _"شاعرانہ سوچ"_ ڈیجیٹل ہیومینٹیز اور ڈیٹا سائنس کے درمیان تعلق کو ظاہر کرتے ہیں - نیٹ ورک تجزیہ، معلومات کی بصریات، مکانی اور متن تجزیہ جیسی تکنیکوں پر زور دیتے ہیں جو ہمیں تاریخی اور ادبی ڈیٹا سیٹس کو دوبارہ دیکھنے اور نئے بصیرت اور نقطہ نظر حاصل کرنے میں مدد دے سکتے ہیں۔ +ڈیجیٹل ہیومینٹیز [کی تعریف کی گئی ہے](https://digitalhumanities.stanford.edu/about-dh-stanford) بطور "طریقوں اور نقطہ نظر کا مجموعہ جو کمپیوٹیشنل طریقوں کو انسانی تحقیق کے ساتھ جوڑتا ہے"۔ [اسٹینفورڈ پروجیکٹس](https://digitalhumanities.stanford.edu/projects) جیسے _"تاریخ کو دوبارہ شروع کرنا"_ اور _"شاعرانہ سوچ"_ ڈیجیٹل ہیومینٹیز اور ڈیٹا سائنس کے درمیان تعلق کو ظاہر کرتے ہیں - نیٹ ورک تجزیہ، معلومات کی بصریات، مکانی اور متن تجزیہ جیسی تکنیکوں پر زور دیتے ہیں جو ہمیں تاریخی اور ادبی ڈیٹا سیٹس کو دوبارہ دیکھنے اور نئے بصیرت اور نقطہ نظر حاصل کرنے میں مدد دے سکتے ہیں۔ *کیا آپ اس شعبے میں کسی پروجیکٹ کو دریافت اور بڑھانا چاہتے ہیں؟* -["Emily Dickinson and the Meter of Mood"](https://gist.github.com/jlooper/ce4d102efd057137bc000db796bfd671) کو دیکھیں - [Jen Looper](https://twitter.com/jenlooper) کی طرف سے ایک بہترین مثال جو پوچھتی ہے کہ ہم ڈیٹا سائنس کا استعمال کرتے ہوئے مانوس شاعری کو دوبارہ دیکھ سکتے ہیں اور اس کے معنی اور اس کے مصنف کی شراکت کو نئے سیاق و سباق میں دوبارہ جانچ سکتے ہیں۔ مثال کے طور پر، _کیا ہم شاعری کے لہجے یا جذبات کا تجزیہ کرکے اس موسم کی پیش گوئی کر سکتے ہیں جس میں ایک نظم لکھی گئی تھی_ - اور اس سے متعلقہ مدت کے دوران مصنف کی ذہنی حالت کے بارے میں ہمیں کیا بتاتا ہے؟ +["ایملی ڈکنسن اور موڈ کے میٹر"](https://gist.github.com/jlooper/ce4d102efd057137bc000db796bfd671) کو دیکھیں - [جن لوپر](https://twitter.com/jenlooper) کی ایک بہترین مثال جو پوچھتی ہے کہ ہم ڈیٹا سائنس کا استعمال کرتے ہوئے مانوس شاعری کو دوبارہ دیکھ سکتے ہیں اور اس کے معنی اور اس کے مصنف کی شراکت کو نئے سیاق و سباق میں دوبارہ جانچ سکتے ہیں۔ مثال کے طور پر، _کیا ہم ایک نظم کے لہجے یا جذبات کا تجزیہ کرکے اس موسم کی پیش گوئی کر سکتے ہیں جس میں یہ لکھی گئی تھی_ - اور اس سے متعلقہ مدت کے دوران مصنف کی ذہنی حالت کے بارے میں ہمیں کیا پتہ چلتا ہے؟ اس سوال کا جواب دینے کے لیے، ہم اپنے ڈیٹا سائنس لائف سائیکل کے مراحل پر عمل کرتے ہیں: - * [`ڈیٹا حاصل کرنا`](https://gist.github.com/jlooper/ce4d102efd057137bc000db796bfd671#acquiring-the-dataset) - تجزیے کے لیے متعلقہ ڈیٹا سیٹ جمع کرنے کے لیے۔ اختیارات میں API کا استعمال (جیسے [Poetry DB API](https://poetrydb.org/index.html)) یا ویب صفحات کو اسکریپ کرنا شامل ہیں (جیسے [Project Gutenberg](https://www.gutenberg.org/files/12242/12242-h/12242-h.htm)) جیسے ٹولز کا استعمال کرتے ہوئے [Scrapy](https://scrapy.org/)۔ - * [`ڈیٹا صاف کرنا`](https://gist.github.com/jlooper/ce4d102efd057137bc000db796bfd671#clean-the-data) - وضاحت کرتا ہے کہ متن کو بنیادی ٹولز جیسے Visual Studio Code اور Microsoft Excel کا استعمال کرتے ہوئے فارمیٹ، صاف اور آسان بنایا جا سکتا ہے۔ - * [`ڈیٹا تجزیہ`](https://gist.github.com/jlooper/ce4d102efd057137bc000db796bfd671#working-with-the-data-in-a-notebook) - وضاحت کرتا ہے کہ ہم اب ڈیٹا سیٹ کو "نوٹ بکس" میں تجزیے کے لیے درآمد کر سکتے ہیں، Python پیکجز (جیسے pandas، numpy اور matplotlib) کا استعمال کرتے ہوئے ڈیٹا کو منظم اور بصری بنانے کے لیے۔ - * [`جذبات کا تجزیہ`](https://gist.github.com/jlooper/ce4d102efd057137bc000db796bfd671#sentiment-analysis-using-cognitive-services) - وضاحت کرتا ہے کہ ہم کلاؤڈ سروسز جیسے Text Analytics کو کم کوڈ ٹولز جیسے [Power Automate](https://flow.microsoft.com/en-us/) کے ساتھ خودکار ڈیٹا پروسیسنگ ورک فلو کے لیے کیسے مربوط کر سکتے ہیں۔ + * [`ڈیٹا حاصل کرنا`](https://gist.github.com/jlooper/ce4d102efd057137bc000db796bfd671#acquiring-the-dataset) - تجزیہ کے لیے متعلقہ ڈیٹا سیٹ جمع کرنا۔ اختیارات میں API کا استعمال (جیسے [Poetry DB API](https://poetrydb.org/index.html)) یا ویب صفحات کو سکریپ کرنا (جیسے [پروجیکٹ گٹنبرگ](https://www.gutenberg.org/files/12242/12242-h/12242-h.htm)) شامل ہیں، جیسے [Scrapy](https://scrapy.org/) جیسے آلات کا استعمال۔ + * [`ڈیٹا صاف کرنا`](https://gist.github.com/jlooper/ce4d102efd057137bc000db796bfd671#clean-the-data) - وضاحت کرتا ہے کہ متن کو بنیادی آلات جیسے Visual Studio Code اور Microsoft Excel کا استعمال کرتے ہوئے فارمیٹ، صاف اور آسان بنایا جا سکتا ہے۔ + * [`ڈیٹا تجزیہ`](https://gist.github.com/jlooper/ce4d102efd057137bc000db796bfd671#working-with-the-data-in-a-notebook) - وضاحت کرتا ہے کہ ہم اب ڈیٹا سیٹ کو "نوٹ بکس" میں تجزیہ کے لیے درآمد کر سکتے ہیں، Python پیکجز (جیسے pandas، numpy اور matplotlib) کا استعمال کرتے ہوئے ڈیٹا کو منظم اور بصری بنانے کے لیے۔ + * [`جذبات کا تجزیہ`](https://gist.github.com/jlooper/ce4d102efd057137bc000db796bfd671#sentiment-analysis-using-cognitive-services) - وضاحت کرتا ہے کہ ہم کلاؤڈ سروسز جیسے Text Analytics کو کم کوڈ آلات جیسے [Power Automate](https://flow.microsoft.com/en-us/) کے ساتھ خودکار ڈیٹا پروسیسنگ ورک فلو کے لیے کیسے شامل کر سکتے ہیں۔ اس ورک فلو کا استعمال کرتے ہوئے، ہم نظموں کے جذبات پر موسمی اثرات کو دریافت کر سکتے ہیں، اور ہمیں مصنف کے بارے میں اپنے نقطہ نظر کو تشکیل دینے میں مدد دے سکتے ہیں۔ خود اسے آزمائیں - پھر نوٹ بک کو بڑھائیں تاکہ دیگر سوالات پوچھ سکیں یا ڈیٹا کو نئے طریقوں سے بصری بنا سکیں! -> آپ [ڈیجیٹل ہیومینٹیز ٹول کٹ](https://github.com/Digital-Humanities-Toolkit) میں موجود کچھ ٹولز کا استعمال کرتے ہوئے ان تحقیقات کے راستوں کو آگے بڑھا سکتے ہیں۔ +> آپ [ڈیجیٹل ہیومینٹیز ٹول کٹ](https://github.com/Digital-Humanities-Toolkit) میں موجود کچھ آلات کا استعمال کرتے ہوئے ان تحقیقات کے راستوں کو آگے بڑھا سکتے ہیں۔ ## ڈیٹا سائنس + پائیداری -| ![ Sketchnote by [(@sketchthedocs)](https://sketchthedocs.dev) ](../../sketchnotes/20-DataScience-Sustainability.png) | +| ![ [(@sketchthedocs)](https://sketchthedocs.dev) کی اسکیچ نوٹ ](../../sketchnotes/20-DataScience-Sustainability.png) | | :---------------------------------------------------------------------------------------------------------------: | -| ڈیٹا سائنس اور پائیداری - _Sketchnote by [@nitya](https://twitter.com/nitya)_ | +| ڈیٹا سائنس اور پائیداری - _اسکیچ نوٹ از [@nitya](https://twitter.com/nitya)_ | -[2030 ایجنڈا برائے پائیدار ترقی](https://sdgs.un.org/2030agenda) - جو 2015 میں تمام اقوام متحدہ کے اراکین نے اپنایا - 17 اہداف کی نشاندہی کرتا ہے، جن میں **سیارے کی حفاظت** کو انحطاط اور موسمیاتی تبدیلی کے اثرات سے شامل کیا گیا ہے۔ [Microsoft Sustainability](https://www.microsoft.com/en-us/sustainability) اقدام ان اہداف کی حمایت کرتا ہے، یہ دریافت کرتے ہوئے کہ ٹیکنالوجی کے حل کس طرح زیادہ پائیدار مستقبل کی تعمیر میں مدد کر سکتے ہیں، [4 اہداف پر توجہ مرکوز کرتے ہوئے](https://dev.to/azure/a-visual-guide-to-sustainable-software-engineering-53hh) - 2030 تک کاربن منفی، پانی مثبت، صفر فضلہ، اور حیاتیاتی تنوع۔ +[2030 کے پائیدار ترقی کے ایجنڈا](https://sdgs.un.org/2030agenda) - جو 2015 میں تمام اقوام متحدہ کے اراکین نے اپنایا - 17 اہداف کی نشاندہی کرتا ہے، جن میں **سیارے کی حفاظت** کو انحطاط اور موسمی تبدیلی کے اثرات سے شامل کیا گیا ہے۔ [مائیکروسافٹ پائیداری](https://www.microsoft.com/en-us/sustainability) اقدام ان اہداف کی حمایت کرتا ہے، ٹیکنالوجی کے حل کے ذریعے زیادہ پائیدار مستقبل کی تعمیر کے طریقوں کو تلاش کرتا ہے، اور [4 اہداف پر توجہ مرکوز کرتا ہے](https://dev.to/azure/a-visual-guide-to-sustainable-software-engineering-53hh) - 2030 تک کاربن منفی، پانی مثبت، صفر فضلہ، اور حیاتیاتی تنوع۔ -ان چیلنجوں کو قابل پیمائش اور بروقت انداز میں حل کرنے کے لیے کلاؤڈ پیمانے کی سوچ اور بڑے پیمانے پر ڈیٹا کی ضرورت ہے۔ [Planetary Computer](https://planetarycomputer.microsoft.com/) اقدام ڈیٹا سائنسدانوں اور ڈویلپرز کو اس کوشش میں مدد کے لیے 4 اجزاء فراہم کرتا ہے: +ان چیلنجز کو قابل پیمائش اور بروقت انداز میں حل کرنے کے لیے کلاؤڈ پیمانے کی سوچ اور بڑے پیمانے پر ڈیٹا کی ضرورت ہے۔ [سیاروی کمپیوٹر](https://planetarycomputer.microsoft.com/) اقدام ڈیٹا سائنسدانوں اور ڈویلپرز کی مدد کے لیے 4 اجزاء فراہم کرتا ہے: - * [ڈیٹا کیٹلاگ](https://planetarycomputer.microsoft.com/catalog) - زمین کے نظام کے ڈیٹا کے پیٹا بائٹس (مفت اور Azure پر میزبانی شدہ)۔ - * [Planetary API](https://planetarycomputer.microsoft.com/docs/reference/stac/) - صارفین کو جگہ اور وقت کے لحاظ سے متعلقہ ڈیٹا تلاش کرنے میں مدد کرنے کے لیے۔ + * [ڈیٹا کیٹلاگ](https://planetarycomputer.microsoft.com/catalog) - زمین کے نظام کے ڈیٹا کے پیٹا بائٹس (مفت اور Azure پر میزبانی شدہ) کے ساتھ۔ + * [سیاروی API](https://planetarycomputer.microsoft.com/docs/reference/stac/) - صارفین کو جگہ اور وقت کے لحاظ سے متعلقہ ڈیٹا تلاش کرنے میں مدد کرنے کے لیے۔ * [ہب](https://planetarycomputer.microsoft.com/docs/overview/environment/) - سائنسدانوں کے لیے بڑے جغرافیائی ڈیٹا سیٹس کو پروسیس کرنے کے لیے منظم ماحول۔ - * [ایپلیکیشنز](https://planetarycomputer.microsoft.com/applications) - پائیداری کے بصیرت کے لیے استعمال کے معاملات اور ٹولز کو ظاہر کرنے کے لیے۔ -**سیاروی کمپیوٹر پروجیکٹ فی الحال پیش نظارہ میں ہے (ستمبر 2021 تک)** - یہاں بتایا گیا ہے کہ آپ ڈیٹا سائنس کا استعمال کرتے ہوئے پائیداری کے حل میں تعاون کیسے شروع کر سکتے ہیں۔ + * [اطلاقات](https://planetarycomputer.microsoft.com/applications) - پائیداری کے بصیرت کے لیے استعمال کے معاملات اور آلات کو ظاہر کرنے کے لیے۔ +**سیاروی کمپیوٹر پروجیکٹ فی الحال پیش نظارہ میں ہے (ستمبر 2021 تک)** - یہاں یہ بتایا گیا ہے کہ آپ ڈیٹا سائنس کا استعمال کرتے ہوئے پائیداری کے حل میں تعاون کیسے شروع کر سکتے ہیں۔ -* [رسائی کی درخواست کریں](https://planetarycomputer.microsoft.com/account/request) تاکہ تحقیق شروع کریں اور ساتھیوں سے جڑیں۔ -* [دستاویزات کا جائزہ لیں](https://planetarycomputer.microsoft.com/docs/overview/about) تاکہ معاون ڈیٹا سیٹس اور APIs کو سمجھ سکیں۔ -* [ایکو سسٹم مانیٹرنگ](https://analytics-lab.org/ecosystemmonitoring/) جیسے ایپلیکیشنز کا جائزہ لیں تاکہ ایپلیکیشن آئیڈیاز کے لیے تحریک حاصل ہو۔ +* [رسائی کی درخواست کریں](https://planetarycomputer.microsoft.com/account/request) تاکہ تحقیق شروع کی جا سکے اور ساتھیوں سے رابطہ قائم کیا جا سکے۔ +* [دستاویزات کا جائزہ لیں](https://planetarycomputer.microsoft.com/docs/overview/about) تاکہ معاون ڈیٹا سیٹس اور APIs کو سمجھا جا سکے۔ +* [ایکو سسٹم مانیٹرنگ](https://analytics-lab.org/ecosystemmonitoring/) جیسے ایپلیکیشنز کو دریافت کریں تاکہ ایپلیکیشن آئیڈیاز کے لیے تحریک حاصل ہو۔ -سوچیں کہ آپ ڈیٹا ویژولائزیشن کا استعمال کیسے کر سکتے ہیں تاکہ موسمیاتی تبدیلی اور جنگلات کی کٹائی جیسے موضوعات میں متعلقہ بصیرت کو اجاگر یا بڑھا سکیں۔ یا یہ سوچیں کہ بصیرت کو کیسے استعمال کیا جا سکتا ہے تاکہ نئے صارف تجربات تخلیق کیے جا سکیں جو زیادہ پائیدار زندگی کے لیے رویوں میں تبدیلی کی ترغیب دیں۔ +سوچیں کہ آپ ڈیٹا ویژولائزیشن کا استعمال کیسے کر سکتے ہیں تاکہ موسمیاتی تبدیلی اور جنگلات کی کٹائی جیسے موضوعات میں متعلقہ بصیرت کو اجاگر یا بڑھایا جا سکے۔ یا یہ سوچیں کہ بصیرت کو کیسے استعمال کیا جا سکتا ہے تاکہ نئے صارف تجربات تخلیق کیے جا سکیں جو زیادہ پائیدار زندگی کے لیے رویوں میں تبدیلی کی ترغیب دیں۔ ## ڈیٹا سائنس + طلباء -ہم نے صنعت اور تحقیق میں حقیقی دنیا کی ایپلیکیشنز کے بارے میں بات کی ہے، اور ڈیجیٹل ہیومینٹیز اور پائیداری میں ڈیٹا سائنس ایپلیکیشن کی مثالوں کا جائزہ لیا ہے۔ تو آپ بطور ڈیٹا سائنس کے ابتدائی افراد اپنی مہارت کیسے بنا سکتے ہیں اور اپنی قابلیت کیسے بانٹ سکتے ہیں؟ +ہم نے صنعت اور تحقیق میں حقیقی دنیا کی ایپلیکیشنز کے بارے میں بات کی ہے، اور ڈیجیٹل ہیومینٹیز اور پائیداری میں ڈیٹا سائنس ایپلیکیشن کی مثالوں کو دریافت کیا ہے۔ تو آپ بطور ڈیٹا سائنس کے ابتدائی افراد اپنی مہارت کیسے بنا سکتے ہیں اور اپنی قابلیت کیسے بانٹ سکتے ہیں؟ یہاں ڈیٹا سائنس کے طلباء کے پروجیکٹس کی کچھ مثالیں ہیں جو آپ کو تحریک دے سکتی ہیں۔ * [MSR ڈیٹا سائنس سمر اسکول](https://www.microsoft.com/en-us/research/academic-program/data-science-summer-school/#!projects) کے GitHub [پروجیکٹس](https://github.com/msr-ds3) جو درج ذیل موضوعات کو دریافت کرتے ہیں: - [پولیس کے طاقت کے استعمال میں نسلی تعصب](https://www.microsoft.com/en-us/research/video/data-science-summer-school-2019-replicating-an-empirical-analysis-of-racial-differences-in-police-use-of-force/) | [Github](https://github.com/msr-ds3/stop-question-frisk) - [NYC سب وے سسٹم کی قابل اعتمادیت](https://www.microsoft.com/en-us/research/video/data-science-summer-school-2018-exploring-the-reliability-of-the-nyc-subway-system/) | [Github](https://github.com/msr-ds3/nyctransit) -* [مادی ثقافت کو ڈیجیٹائز کرنا: سرکپ میں سماجی و اقتصادی تقسیمات کا جائزہ](https://claremont.maps.arcgis.com/apps/Cascade/index.html?appid=bdf2aef0f45a4674ba41cd373fa23afc) - [اورنیلا آلٹونیان](https://twitter.com/ornelladotcom) اور کلیرمونٹ کی ٹیم کی جانب سے، [ArcGIS StoryMaps](https://storymaps.arcgis.com/) کا استعمال کرتے ہوئے۔ +* [مادی ثقافت کو ڈیجیٹل بنانا: سرکاپ میں سماجی و اقتصادی تقسیمات کا جائزہ](https://claremont.maps.arcgis.com/apps/Cascade/index.html?appid=bdf2aef0f45a4674ba41cd373fa23afc) - [اورنیلا آلٹونیان](https://twitter.com/ornelladotcom) اور کلیرمونٹ کی ٹیم کی جانب سے، [ArcGIS StoryMaps](https://storymaps.arcgis.com/) کا استعمال کرتے ہوئے۔ ## 🚀 چیلنج @@ -143,13 +143,14 @@ AI کی جمہوریت کی بدولت، ڈویلپرز کے لیے AI سے چل * [17 ڈیٹا سائنس ایپلیکیشنز اور مثالیں](https://builtin.com/data-science/data-science-applications-examples) - جولائی 2021 * [حقیقی دنیا میں 11 حیرت انگیز ڈیٹا سائنس ایپلیکیشنز](https://myblindbird.com/data-science-applications-real-world/) - مئی 2021 * [حقیقی دنیا میں ڈیٹا سائنس](https://towardsdatascience.com/data-science-in-the-real-world/home) - مضامین کا مجموعہ -* ڈیٹا سائنس میں: [تعلیم](https://data-flair.training/blogs/data-science-in-education/)، [زراعت](https://data-flair.training/blogs/data-science-in-agriculture/)، [مالیات](https://data-flair.training/blogs/data-science-in-finance/)، [فلمیں](https://data-flair.training/blogs/data-science-at-movies/) اور مزید۔ +* [12 حقیقی دنیا کی ڈیٹا سائنس ایپلیکیشنز مثالوں کے ساتھ](https://www.scaler.com/blog/data-science-applications/) - مئی 2024 +* ڈیٹا سائنس میں: [تعلیم](https://data-flair.training/blogs/data-science-in-education/)، [زراعت](https://data-flair.training/blogs/data-science-in-agriculture/)، [مالیات](https://data-flair.training/blogs/data-science-in-finance/)، [فلمیں](https://data-flair.training/blogs/data-science-at-movies/)، [صحت کی دیکھ بھال](https://onlinedegrees.sandiego.edu/data-science-health-care/) اور مزید۔ ## اسائنمنٹ -[سیاروی کمپیوٹر ڈیٹا سیٹ کا جائزہ لیں](assignment.md) +[سیاروی کمپیوٹر ڈیٹا سیٹ کو دریافت کریں](assignment.md) --- **ڈسکلیمر**: -یہ دستاویز AI ترجمہ سروس [Co-op Translator](https://github.com/Azure/co-op-translator) کا استعمال کرتے ہوئے ترجمہ کی گئی ہے۔ ہم درستگی کے لیے کوشش کرتے ہیں، لیکن براہ کرم آگاہ رہیں کہ خودکار ترجمے میں غلطیاں یا غیر درستیاں ہو سکتی ہیں۔ اصل دستاویز کو اس کی اصل زبان میں مستند ذریعہ سمجھا جانا چاہیے۔ اہم معلومات کے لیے، پیشہ ور انسانی ترجمہ کی سفارش کی جاتی ہے۔ ہم اس ترجمے کے استعمال سے پیدا ہونے والی کسی بھی غلط فہمی یا غلط تشریح کے ذمہ دار نہیں ہیں۔ \ No newline at end of file +یہ دستاویز AI ترجمہ سروس [Co-op Translator](https://github.com/Azure/co-op-translator) کا استعمال کرتے ہوئے ترجمہ کی گئی ہے۔ ہم درستگی کے لیے کوشش کرتے ہیں، لیکن براہ کرم آگاہ رہیں کہ خودکار ترجمے میں غلطیاں یا عدم درستگی ہو سکتی ہیں۔ اصل دستاویز کو اس کی اصل زبان میں مستند ذریعہ سمجھا جانا چاہیے۔ اہم معلومات کے لیے، پیشہ ور انسانی ترجمہ کی سفارش کی جاتی ہے۔ اس ترجمے کے استعمال سے پیدا ہونے والی کسی بھی غلط فہمی یا غلط تشریح کے لیے ہم ذمہ دار نہیں ہیں۔ \ No newline at end of file diff --git a/translations/vi/6-Data-Science-In-Wild/20-Real-World-Examples/README.md b/translations/vi/6-Data-Science-In-Wild/20-Real-World-Examples/README.md index b374e82f..5ed44c42 100644 --- a/translations/vi/6-Data-Science-In-Wild/20-Real-World-Examples/README.md +++ b/translations/vi/6-Data-Science-In-Wild/20-Real-World-Examples/README.md @@ -1,126 +1,126 @@ -# Khoa Học Dữ Liệu Trong Thế Giới Thực +# Khoa học Dữ liệu trong Thế giới Thực | ![ Sketchnote của [(@sketchthedocs)](https://sketchthedocs.dev) ](../../sketchnotes/20-DataScience-RealWorld.png) | | :--------------------------------------------------------------------------------------------------------------: | -| Khoa Học Dữ Liệu Trong Thế Giới Thực - _Sketchnote của [@nitya](https://twitter.com/nitya)_ | +| Khoa học Dữ liệu trong Thế giới Thực - _Sketchnote của [@nitya](https://twitter.com/nitya)_ | Chúng ta gần như đã hoàn thành hành trình học tập này! -Chúng ta đã bắt đầu với các định nghĩa về khoa học dữ liệu và đạo đức, khám phá các công cụ và kỹ thuật phân tích và trực quan hóa dữ liệu, xem xét vòng đời khoa học dữ liệu, và tìm hiểu cách mở rộng và tự động hóa quy trình làm việc khoa học dữ liệu với các dịch vụ điện toán đám mây. Vì vậy, bạn có thể đang tự hỏi: _"Làm thế nào để áp dụng tất cả những kiến thức này vào các bối cảnh thực tế?"_ +Chúng ta đã bắt đầu với các định nghĩa về khoa học dữ liệu và đạo đức, khám phá các công cụ và kỹ thuật phân tích và trực quan hóa dữ liệu, xem xét vòng đời khoa học dữ liệu, và tìm hiểu cách mở rộng và tự động hóa quy trình khoa học dữ liệu với các dịch vụ điện toán đám mây. Vì vậy, bạn có thể đang tự hỏi: _"Làm thế nào để áp dụng tất cả những kiến thức này vào các bối cảnh thực tế?"_ -Trong bài học này, chúng ta sẽ khám phá các ứng dụng thực tế của khoa học dữ liệu trong ngành công nghiệp và đi sâu vào các ví dụ cụ thể trong nghiên cứu, nhân văn số và bền vững. Chúng ta sẽ xem xét các cơ hội dự án cho sinh viên và kết thúc với các tài nguyên hữu ích để giúp bạn tiếp tục hành trình học tập của mình! +Trong bài học này, chúng ta sẽ khám phá các ứng dụng thực tế của khoa học dữ liệu trong ngành công nghiệp và đi sâu vào các ví dụ cụ thể trong nghiên cứu, nhân văn số, và bền vững. Chúng ta sẽ xem xét các cơ hội dự án dành cho sinh viên và kết thúc với các tài nguyên hữu ích để giúp bạn tiếp tục hành trình học tập của mình! -## Câu Hỏi Trước Bài Giảng +## Câu hỏi trước bài giảng ## [Câu hỏi trước bài giảng](https://ff-quizzes.netlify.app/en/ds/quiz/38) -## Khoa Học Dữ Liệu + Ngành Công Nghiệp +## Khoa học Dữ liệu + Ngành Công nghiệp -Nhờ vào sự dân chủ hóa AI, các nhà phát triển hiện nay dễ dàng hơn trong việc thiết kế và tích hợp các quyết định dựa trên AI và các thông tin chi tiết dựa trên dữ liệu vào trải nghiệm người dùng và quy trình phát triển. Dưới đây là một vài ví dụ về cách khoa học dữ liệu được "ứng dụng" vào các bối cảnh thực tế trong ngành công nghiệp: +Nhờ sự phổ biến của AI, các nhà phát triển hiện nay dễ dàng hơn trong việc thiết kế và tích hợp các quyết định dựa trên AI và các thông tin chi tiết dựa trên dữ liệu vào trải nghiệm người dùng và quy trình phát triển. Dưới đây là một vài ví dụ về cách khoa học dữ liệu được "áp dụng" vào các ứng dụng thực tế trong ngành công nghiệp: - * [Google Flu Trends](https://www.wired.com/2015/10/can-learn-epic-failure-google-flu-trends/) đã sử dụng khoa học dữ liệu để liên kết các thuật ngữ tìm kiếm với xu hướng cúm. Mặc dù cách tiếp cận này có những sai sót, nó đã nâng cao nhận thức về các khả năng (và thách thức) của dự đoán y tế dựa trên dữ liệu. + * [Google Flu Trends](https://www.wired.com/2015/10/can-learn-epic-failure-google-flu-trends/) đã sử dụng khoa học dữ liệu để liên kết các thuật ngữ tìm kiếm với xu hướng bệnh cúm. Mặc dù phương pháp này có những hạn chế, nó đã nâng cao nhận thức về khả năng (và thách thức) của dự đoán y tế dựa trên dữ liệu. - * [Dự đoán Tuyến Đường của UPS](https://www.technologyreview.com/2018/11/21/139000/how-ups-uses-ai-to-outsmart-bad-weather/) - giải thích cách UPS sử dụng khoa học dữ liệu và học máy để dự đoán các tuyến đường tối ưu cho việc giao hàng, tính đến điều kiện thời tiết, lưu lượng giao thông, thời hạn giao hàng và nhiều yếu tố khác. + * [Dự đoán tuyến đường của UPS](https://www.technologyreview.com/2018/11/21/139000/how-ups-uses-ai-to-outsmart-bad-weather/) - giải thích cách UPS sử dụng khoa học dữ liệu và học máy để dự đoán các tuyến đường tối ưu cho việc giao hàng, bao gồm điều kiện thời tiết, lưu lượng giao thông, thời hạn giao hàng và nhiều yếu tố khác. - * [Trực Quan Hóa Tuyến Đường Taxi NYC](http://chriswhong.github.io/nyctaxi/) - dữ liệu thu thập được thông qua [Luật Tự Do Thông Tin](https://chriswhong.com/open-data/foil_nyc_taxi/) đã giúp trực quan hóa một ngày làm việc của các taxi ở NYC, giúp chúng ta hiểu cách họ di chuyển trong thành phố bận rộn, số tiền họ kiếm được, và thời gian của các chuyến đi trong mỗi 24 giờ. + * [Trực quan hóa tuyến đường taxi NYC](http://chriswhong.github.io/nyctaxi/) - dữ liệu thu thập được thông qua [Luật Tự do Thông tin](https://chriswhong.com/open-data/foil_nyc_taxi/) đã giúp trực quan hóa một ngày làm việc của taxi NYC, giúp chúng ta hiểu cách họ di chuyển trong thành phố bận rộn, số tiền họ kiếm được, và thời gian của các chuyến đi trong mỗi khoảng thời gian 24 giờ. - * [Uber Data Science Workbench](https://eng.uber.com/dsw/) - sử dụng dữ liệu (về địa điểm đón & trả khách, thời gian chuyến đi, tuyến đường ưa thích, v.v.) thu thập từ hàng triệu chuyến đi Uber *hàng ngày* để xây dựng một công cụ phân tích dữ liệu giúp định giá, đảm bảo an toàn, phát hiện gian lận và đưa ra quyết định điều hướng. + * [Uber Data Science Workbench](https://eng.uber.com/dsw/) - sử dụng dữ liệu (về địa điểm đón & trả khách, thời gian chuyến đi, tuyến đường ưa thích, v.v.) thu thập từ hàng triệu chuyến đi Uber *hàng ngày* để xây dựng công cụ phân tích dữ liệu hỗ trợ định giá, an toàn, phát hiện gian lận và quyết định điều hướng. - * [Phân Tích Dữ Liệu Trong Thể Thao](https://towardsdatascience.com/scope-of-analytics-in-sports-world-37ed09c39860) - tập trung vào _phân tích dự đoán_ (phân tích đội và cầu thủ - nghĩ đến [Moneyball](https://datasciencedegree.wisconsin.edu/blog/moneyball-proves-importance-big-data-big-ideas/) - và quản lý người hâm mộ) và _trực quan hóa dữ liệu_ (bảng điều khiển đội & người hâm mộ, trò chơi, v.v.) với các ứng dụng như tìm kiếm tài năng, cá cược thể thao và quản lý hàng tồn kho/địa điểm. + * [Phân tích thể thao](https://towardsdatascience.com/scope-of-analytics-in-sports-world-37ed09c39860) - tập trung vào _phân tích dự đoán_ (phân tích đội và cầu thủ - như [Moneyball](https://datasciencedegree.wisconsin.edu/blog/moneyball-proves-importance-big-data-big-ideas/) - và quản lý người hâm mộ) và _trực quan hóa dữ liệu_ (bảng điều khiển đội & người hâm mộ, trò chơi, v.v.) với các ứng dụng như tìm kiếm tài năng, cá cược thể thao và quản lý hàng tồn kho/địa điểm. - * [Khoa Học Dữ Liệu Trong Ngân Hàng](https://data-flair.training/blogs/data-science-in-banking/) - nhấn mạnh giá trị của khoa học dữ liệu trong ngành tài chính với các ứng dụng từ mô hình rủi ro và phát hiện gian lận, đến phân khúc khách hàng, dự đoán thời gian thực và hệ thống gợi ý. Phân tích dự đoán cũng thúc đẩy các biện pháp quan trọng như [điểm tín dụng](https://dzone.com/articles/using-big-data-and-predictive-analytics-for-credit). + * [Khoa học Dữ liệu trong Ngân hàng](https://data-flair.training/blogs/data-science-in-banking/) - nhấn mạnh giá trị của khoa học dữ liệu trong ngành tài chính với các ứng dụng từ mô hình rủi ro và phát hiện gian lận, đến phân khúc khách hàng, dự đoán thời gian thực và hệ thống gợi ý. Phân tích dự đoán cũng thúc đẩy các biện pháp quan trọng như [điểm tín dụng](https://dzone.com/articles/using-big-data-and-predictive-analytics-for-credit). - * [Khoa Học Dữ Liệu Trong Y Tế](https://data-flair.training/blogs/data-science-in-healthcare/) - nhấn mạnh các ứng dụng như hình ảnh y tế (ví dụ: MRI, X-Ray, CT-Scan), gen học (giải trình tự DNA), phát triển thuốc (đánh giá rủi ro, dự đoán thành công), phân tích dự đoán (chăm sóc bệnh nhân & hậu cần cung ứng), theo dõi & phòng ngừa dịch bệnh, v.v. + * [Khoa học Dữ liệu trong Y tế](https://data-flair.training/blogs/data-science-in-healthcare/) - nhấn mạnh các ứng dụng như hình ảnh y tế (ví dụ: MRI, X-Ray, CT-Scan), genomics (giải trình tự DNA), phát triển thuốc (đánh giá rủi ro, dự đoán thành công), phân tích dự đoán (chăm sóc bệnh nhân & hậu cần cung cấp), theo dõi & phòng ngừa bệnh, v.v. -![Ứng Dụng Khoa Học Dữ Liệu Trong Thế Giới Thực](../../../../6-Data-Science-In-Wild/20-Real-World-Examples/images/data-science-applications.png) Nguồn Hình Ảnh: [Data Flair: 6 Amazing Data Science Applications ](https://data-flair.training/blogs/data-science-applications/) +![Ứng dụng Khoa học Dữ liệu trong Thế giới Thực](../../../../translated_images/data-science-applications.4e5019cd8790ebac2277ff5f08af386f8727cac5d30f77727c7090677e6adb9c.vi.png) Nguồn hình ảnh: [Data Flair: 6 Amazing Data Science Applications ](https://data-flair.training/blogs/data-science-applications/) -Hình minh họa các lĩnh vực và ví dụ khác về việc áp dụng các kỹ thuật khoa học dữ liệu. Muốn khám phá thêm các ứng dụng khác? Hãy xem phần [Ôn Tập & Tự Học](../../../../6-Data-Science-In-Wild/20-Real-World-Examples) bên dưới. +Hình minh họa cho thấy các lĩnh vực và ví dụ khác về việc áp dụng các kỹ thuật khoa học dữ liệu. Muốn khám phá thêm các ứng dụng khác? Hãy xem phần [Ôn tập & Tự học](../../../../6-Data-Science-In-Wild/20-Real-World-Examples) bên dưới. -## Khoa Học Dữ Liệu + Nghiên Cứu +## Khoa học Dữ liệu + Nghiên cứu | ![ Sketchnote của [(@sketchthedocs)](https://sketchthedocs.dev) ](../../sketchnotes/20-DataScience-Research.png) | | :---------------------------------------------------------------------------------------------------------------: | -| Khoa Học Dữ Liệu & Nghiên Cứu - _Sketchnote của [@nitya](https://twitter.com/nitya)_ | +| Khoa học Dữ liệu & Nghiên cứu - _Sketchnote của [@nitya](https://twitter.com/nitya)_ | Trong khi các ứng dụng thực tế thường tập trung vào các trường hợp sử dụng trong ngành công nghiệp ở quy mô lớn, các ứng dụng và dự án _nghiên cứu_ có thể hữu ích từ hai góc độ: -* _cơ hội đổi mới_ - khám phá nguyên mẫu nhanh các khái niệm tiên tiến và thử nghiệm trải nghiệm người dùng cho các ứng dụng thế hệ tiếp theo. -* _thách thức triển khai_ - điều tra các tác hại tiềm ẩn hoặc hậu quả không mong muốn của các công nghệ khoa học dữ liệu trong bối cảnh thực tế. +* _cơ hội đổi mới_ - khám phá nguyên mẫu nhanh của các khái niệm tiên tiến và thử nghiệm trải nghiệm người dùng cho các ứng dụng thế hệ tiếp theo. +* _thách thức triển khai_ - điều tra các tác hại tiềm ẩn hoặc hậu quả không mong muốn của các công nghệ khoa học dữ liệu trong các bối cảnh thực tế. Đối với sinh viên, các dự án nghiên cứu này có thể cung cấp cả cơ hội học tập và hợp tác, giúp cải thiện sự hiểu biết của bạn về chủ đề, và mở rộng nhận thức cũng như sự tham gia của bạn với những người hoặc nhóm làm việc trong các lĩnh vực quan tâm. Vậy các dự án nghiên cứu trông như thế nào và chúng có thể tạo ra tác động ra sao? -Hãy xem một ví dụ - [Nghiên Cứu Gender Shades của MIT](http://gendershades.org/overview.html) từ Joy Buolamwini (MIT Media Labs) với một [bài báo nghiên cứu nổi bật](http://proceedings.mlr.press/v81/buolamwini18a/buolamwini18a.pdf) đồng tác giả với Timnit Gebru (khi đó tại Microsoft Research) tập trung vào: +Hãy xem một ví dụ - [Nghiên cứu Gender Shades của MIT](http://gendershades.org/overview.html) từ Joy Buolamwini (MIT Media Labs) với một [bài báo nghiên cứu nổi bật](http://proceedings.mlr.press/v81/buolamwini18a/buolamwini18a.pdf) đồng tác giả với Timnit Gebru (khi đó tại Microsoft Research) tập trung vào: - * **Cái gì:** Mục tiêu của dự án nghiên cứu là _đánh giá sự thiên vị trong các thuật toán và tập dữ liệu phân tích khuôn mặt tự động_ dựa trên giới tính và màu da. + * **Cái gì:** Mục tiêu của dự án nghiên cứu là _đánh giá sự thiên vị hiện diện trong các thuật toán và tập dữ liệu phân tích khuôn mặt tự động_ dựa trên giới tính và loại da. * **Tại sao:** Phân tích khuôn mặt được sử dụng trong các lĩnh vực như thực thi pháp luật, an ninh sân bay, hệ thống tuyển dụng và nhiều lĩnh vực khác - những bối cảnh mà phân loại không chính xác (ví dụ: do thiên vị) có thể gây ra các tác hại kinh tế và xã hội tiềm ẩn cho các cá nhân hoặc nhóm bị ảnh hưởng. Hiểu (và loại bỏ hoặc giảm thiểu) sự thiên vị là chìa khóa để đảm bảo công bằng trong việc sử dụng. - * **Làm thế nào:** Các nhà nghiên cứu nhận ra rằng các tiêu chuẩn hiện có chủ yếu sử dụng các đối tượng có màu da sáng hơn, và đã tạo ra một tập dữ liệu mới (hơn 1000 hình ảnh) _cân bằng hơn_ về giới tính và màu da. Tập dữ liệu này được sử dụng để đánh giá độ chính xác của ba sản phẩm phân loại giới tính (từ Microsoft, IBM & Face++). + * **Cách thực hiện:** Các nhà nghiên cứu nhận ra rằng các tiêu chuẩn hiện tại chủ yếu sử dụng các đối tượng có làn da sáng hơn, và đã tạo ra một tập dữ liệu mới (hơn 1000 hình ảnh) _cân bằng hơn_ theo giới tính và loại da. Tập dữ liệu này được sử dụng để đánh giá độ chính xác của ba sản phẩm phân loại giới tính (từ Microsoft, IBM & Face++). -Kết quả cho thấy mặc dù độ chính xác phân loại tổng thể là tốt, nhưng có sự khác biệt đáng kể về tỷ lệ lỗi giữa các nhóm phụ khác nhau - với **sai sót nhận diện giới tính** cao hơn đối với nữ giới hoặc người có màu da tối hơn, cho thấy sự thiên vị. +Kết quả cho thấy mặc dù độ chính xác phân loại tổng thể là tốt, có sự khác biệt đáng kể về tỷ lệ lỗi giữa các nhóm phụ khác nhau - với **sai sót phân loại giới tính** cao hơn đối với nữ giới hoặc người có làn da tối màu, cho thấy sự thiên vị. -**Kết Quả Chính:** Nâng cao nhận thức rằng khoa học dữ liệu cần có các _tập dữ liệu đại diện hơn_ (các nhóm phụ cân bằng) và các _nhóm làm việc bao gồm hơn_ (nhiều nền tảng đa dạng) để nhận ra và loại bỏ hoặc giảm thiểu các thiên vị như vậy sớm hơn trong các giải pháp AI. Các nỗ lực nghiên cứu như thế này cũng đóng vai trò quan trọng trong việc nhiều tổ chức định nghĩa các nguyên tắc và thực hành cho _AI có trách nhiệm_ nhằm cải thiện tính công bằng trong các sản phẩm và quy trình AI của họ. +**Kết quả chính:** Nâng cao nhận thức rằng khoa học dữ liệu cần có các _tập dữ liệu đại diện hơn_ (các nhóm phụ cân bằng) và các _đội ngũ đa dạng hơn_ (nền tảng phong phú) để nhận ra và loại bỏ hoặc giảm thiểu các thiên vị như vậy sớm hơn trong các giải pháp AI. Các nỗ lực nghiên cứu như thế này cũng đóng vai trò quan trọng trong việc nhiều tổ chức định nghĩa các nguyên tắc và thực hành cho _AI có trách nhiệm_ nhằm cải thiện sự công bằng trong các sản phẩm và quy trình AI của họ. **Muốn tìm hiểu về các nỗ lực nghiên cứu liên quan tại Microsoft?** -* Xem [Dự Án Nghiên Cứu Microsoft](https://www.microsoft.com/research/research-area/artificial-intelligence/?facet%5Btax%5D%5Bmsr-research-area%5D%5B%5D=13556&facet%5Btax%5D%5Bmsr-content-type%5D%5B%5D=msr-project) về Trí Tuệ Nhân Tạo. -* Khám phá các dự án sinh viên từ [Trường Hè Khoa Học Dữ Liệu Microsoft Research](https://www.microsoft.com/en-us/research/academic-program/data-science-summer-school/). -* Xem dự án [Fairlearn](https://fairlearn.org/) và các sáng kiến [AI Có Trách Nhiệm](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1%3aprimaryr6). +* Xem [Các dự án nghiên cứu của Microsoft](https://www.microsoft.com/research/research-area/artificial-intelligence/?facet%5Btax%5D%5Bmsr-research-area%5D%5B%5D=13556&facet%5Btax%5D%5Bmsr-content-type%5D%5B%5D=msr-project) về Trí tuệ Nhân tạo. +* Khám phá các dự án sinh viên từ [Trường Hè Khoa học Dữ liệu của Microsoft Research](https://www.microsoft.com/en-us/research/academic-program/data-science-summer-school/). +* Xem dự án [Fairlearn](https://fairlearn.org/) và các sáng kiến [AI có trách nhiệm](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1%3aprimaryr6). -## Khoa Học Dữ Liệu + Nhân Văn +## Khoa học Dữ liệu + Nhân văn | ![ Sketchnote của [(@sketchthedocs)](https://sketchthedocs.dev) ](../../sketchnotes/20-DataScience-Humanities.png) | | :---------------------------------------------------------------------------------------------------------------: | -| Khoa Học Dữ Liệu & Nhân Văn Số - _Sketchnote của [@nitya](https://twitter.com/nitya)_ | +| Khoa học Dữ liệu & Nhân văn số - _Sketchnote của [@nitya](https://twitter.com/nitya)_ | -Nhân Văn Số [được định nghĩa](https://digitalhumanities.stanford.edu/about-dh-stanford) là "một tập hợp các thực hành và cách tiếp cận kết hợp các phương pháp tính toán với nghiên cứu nhân văn". Các dự án [Stanford](https://digitalhumanities.stanford.edu/projects) như _"tái khởi động lịch sử"_ và _"tư duy thơ ca"_ minh họa mối liên kết giữa [Nhân Văn Số và Khoa Học Dữ Liệu](https://digitalhumanities.stanford.edu/digital-humanities-and-data-science) - nhấn mạnh các kỹ thuật như phân tích mạng, trực quan hóa thông tin, phân tích không gian và văn bản có thể giúp chúng ta xem xét lại các tập dữ liệu lịch sử và văn học để rút ra những hiểu biết và góc nhìn mới. +Nhân văn số [được định nghĩa](https://digitalhumanities.stanford.edu/about-dh-stanford) là "một tập hợp các thực hành và cách tiếp cận kết hợp các phương pháp tính toán với nghiên cứu nhân văn". Các dự án [Stanford](https://digitalhumanities.stanford.edu/projects) như _"rebooting history"_ và _"poetic thinking"_ minh họa mối liên kết giữa [Nhân văn số và Khoa học Dữ liệu](https://digitalhumanities.stanford.edu/digital-humanities-and-data-science) - nhấn mạnh các kỹ thuật như phân tích mạng, trực quan hóa thông tin, phân tích không gian và văn bản, giúp chúng ta xem xét lại các tập dữ liệu lịch sử và văn học để rút ra những hiểu biết và góc nhìn mới. *Muốn khám phá và mở rộng một dự án trong lĩnh vực này?* -Hãy xem ["Emily Dickinson và Nhịp Điệu Cảm Xúc"](https://gist.github.com/jlooper/ce4d102efd057137bc000db796bfd671) - một ví dụ tuyệt vời từ [Jen Looper](https://twitter.com/jenlooper) đặt câu hỏi làm thế nào chúng ta có thể sử dụng khoa học dữ liệu để xem xét lại thơ ca quen thuộc và đánh giá lại ý nghĩa cũng như đóng góp của tác giả trong các bối cảnh mới. Ví dụ, _chúng ta có thể dự đoán mùa mà một bài thơ được sáng tác bằng cách phân tích giọng điệu hoặc cảm xúc của nó không_ - và điều này nói lên điều gì về trạng thái tinh thần của tác giả trong giai đoạn đó? +Hãy xem ["Emily Dickinson and the Meter of Mood"](https://gist.github.com/jlooper/ce4d102efd057137bc000db796bfd671) - một ví dụ tuyệt vời từ [Jen Looper](https://twitter.com/jenlooper) đặt câu hỏi làm thế nào chúng ta có thể sử dụng khoa học dữ liệu để xem xét lại thơ ca quen thuộc và đánh giá lại ý nghĩa cũng như đóng góp của tác giả trong các bối cảnh mới. Ví dụ, _chúng ta có thể dự đoán mùa mà một bài thơ được sáng tác bằng cách phân tích giọng điệu hoặc cảm xúc của nó không_ - và điều này nói lên điều gì về trạng thái tâm trí của tác giả trong khoảng thời gian liên quan? Để trả lời câu hỏi đó, chúng ta làm theo các bước của vòng đời khoa học dữ liệu: - * [`Thu Thập Dữ Liệu`](https://gist.github.com/jlooper/ce4d102efd057137bc000db796bfd671#acquiring-the-dataset) - để thu thập một tập dữ liệu phù hợp để phân tích. Các lựa chọn bao gồm sử dụng API (ví dụ: [Poetry DB API](https://poetrydb.org/index.html)) hoặc thu thập dữ liệu từ các trang web (ví dụ: [Project Gutenberg](https://www.gutenberg.org/files/12242/12242-h/12242-h.htm)) bằng các công cụ như [Scrapy](https://scrapy.org/). - * [`Làm Sạch Dữ Liệu`](https://gist.github.com/jlooper/ce4d102efd057137bc000db796bfd671#clean-the-data) - giải thích cách văn bản có thể được định dạng, làm sạch và đơn giản hóa bằng các công cụ cơ bản như Visual Studio Code và Microsoft Excel. - * [`Phân Tích Dữ Liệu`](https://gist.github.com/jlooper/ce4d102efd057137bc000db796bfd671#working-with-the-data-in-a-notebook) - giải thích cách chúng ta có thể nhập tập dữ liệu vào "Notebooks" để phân tích bằng các gói Python (như pandas, numpy và matplotlib) để tổ chức và trực quan hóa dữ liệu. - * [`Phân Tích Cảm Xúc`](https://gist.github.com/jlooper/ce4d102efd057137bc000db796bfd671#sentiment-analysis-using-cognitive-services) - giải thích cách chúng ta có thể tích hợp các dịch vụ đám mây như Text Analytics, sử dụng các công cụ low-code như [Power Automate](https://flow.microsoft.com/en-us/) cho các quy trình xử lý dữ liệu tự động. + * [`Thu thập dữ liệu`](https://gist.github.com/jlooper/ce4d102efd057137bc000db796bfd671#acquiring-the-dataset) - để thu thập một tập dữ liệu phù hợp cho phân tích. Các tùy chọn bao gồm sử dụng API (ví dụ: [Poetry DB API](https://poetrydb.org/index.html)) hoặc quét các trang web (ví dụ: [Project Gutenberg](https://www.gutenberg.org/files/12242/12242-h/12242-h.htm)) bằng các công cụ như [Scrapy](https://scrapy.org/). + * [`Làm sạch dữ liệu`](https://gist.github.com/jlooper/ce4d102efd057137bc000db796bfd671#clean-the-data) - giải thích cách văn bản có thể được định dạng, làm sạch và đơn giản hóa bằng các công cụ cơ bản như Visual Studio Code và Microsoft Excel. + * [`Phân tích dữ liệu`](https://gist.github.com/jlooper/ce4d102efd057137bc000db796bfd671#working-with-the-data-in-a-notebook) - giải thích cách chúng ta có thể nhập tập dữ liệu vào "Notebooks" để phân tích bằng các gói Python (như pandas, numpy và matplotlib) để tổ chức và trực quan hóa dữ liệu. + * [`Phân tích cảm xúc`](https://gist.github.com/jlooper/ce4d102efd057137bc000db796bfd671#sentiment-analysis-using-cognitive-services) - giải thích cách chúng ta có thể tích hợp các dịch vụ đám mây như Text Analytics, sử dụng các công cụ mã thấp như [Power Automate](https://flow.microsoft.com/en-us/) cho các quy trình xử lý dữ liệu tự động. -Sử dụng quy trình này, chúng ta có thể khám phá tác động của mùa đối với cảm xúc của các bài thơ, và giúp chúng ta hình thành quan điểm riêng về tác giả. Hãy thử tự mình thực hiện - sau đó mở rộng notebook để đặt các câu hỏi khác hoặc trực quan hóa dữ liệu theo những cách mới! +Sử dụng quy trình này, chúng ta có thể khám phá tác động của mùa đối với cảm xúc của các bài thơ, và giúp chúng ta hình thành quan điểm riêng về tác giả. Hãy thử nghiệm - sau đó mở rộng notebook để đặt các câu hỏi khác hoặc trực quan hóa dữ liệu theo cách mới! -> Bạn có thể sử dụng một số công cụ trong [Bộ Công Cụ Nhân Văn Số](https://github.com/Digital-Humanities-Toolkit) để theo đuổi các hướng nghiên cứu này. +> Bạn có thể sử dụng một số công cụ trong [bộ công cụ Nhân văn số](https://github.com/Digital-Humanities-Toolkit) để theo đuổi các hướng nghiên cứu này. -## Khoa Học Dữ Liệu + Bền Vững +## Khoa học Dữ liệu + Bền vững | ![ Sketchnote của [(@sketchthedocs)](https://sketchthedocs.dev) ](../../sketchnotes/20-DataScience-Sustainability.png) | | :---------------------------------------------------------------------------------------------------------------: | -| Khoa Học Dữ Liệu & Bền Vững - _Sketchnote của [@nitya](https://twitter.com/nitya)_ | +| Khoa học Dữ liệu & Bền vững - _Sketchnote của [@nitya](https://twitter.com/nitya)_ | -[Chương Trình Nghị Sự 2030 Vì Phát Triển Bền Vững](https://sdgs.un.org/2030agenda) - được tất cả các thành viên Liên Hợp Quốc thông qua vào năm 2015 - xác định 17 mục tiêu bao gồm các mục tiêu tập trung vào **Bảo Vệ Hành Tinh** khỏi sự suy thoái và tác động của biến đổi khí hậu. Sáng kiến [Bền Vững của Microsoft](https://www.microsoft.com/en-us/sustainability) hỗ trợ các mục tiêu này bằng cách khám phá cách các giải pháp công nghệ có thể hỗ trợ và xây dựng các tương lai bền vững hơn với [trọng tâm vào 4 mục tiêu](https://dev.to/azure/a-visual-guide-to-sustainable-software-engineering-53hh) - trở thành tiêu cực carbon, tích cực nước, không rác thải, và đa dạng sinh học vào năm 2030. +[Chương trình Nghị sự 2030 về Phát triển Bền vững](https://sdgs.un.org/2030agenda) - được tất cả các thành viên Liên Hợp Quốc thông qua vào năm 2015 - xác định 17 mục tiêu bao gồm các mục tiêu tập trung vào **Bảo vệ Hành tinh** khỏi sự suy thoái và tác động của biến đổi khí hậu. Sáng kiến [Bền vững của Microsoft](https://www.microsoft.com/en-us/sustainability) hỗ trợ các mục tiêu này bằng cách khám phá cách các giải pháp công nghệ có thể hỗ trợ và xây dựng tương lai bền vững hơn với [tập trung vào 4 mục tiêu](https://dev.to/azure/a-visual-guide-to-sustainable-software-engineering-53hh) - trở thành carbon âm, nước dương, không rác thải, và đa dạng sinh học vào năm 2030. -Để giải quyết các thách thức này một cách có quy mô và kịp thời, cần có tư duy quy mô đám mây - và dữ liệu quy mô lớn. Sáng kiến [Máy Tính Hành Tinh](https://planetarycomputer.microsoft.com/) cung cấp 4 thành phần để giúp các nhà khoa học dữ liệu và nhà phát triển trong nỗ lực này: +Để giải quyết các thách thức này một cách quy mô và kịp thời, cần có tư duy quy mô đám mây - và dữ liệu quy mô lớn. Sáng kiến [Máy tính Hành tinh](https://planetarycomputer.microsoft.com/) cung cấp 4 thành phần để giúp các nhà khoa học dữ liệu và nhà phát triển trong nỗ lực này: - * [Danh Mục Dữ Liệu](https://planetarycomputer.microsoft.com/catalog) - với hàng petabyte dữ liệu Hệ Thống Trái Đất (miễn phí & được lưu trữ trên Azure). - * [API Hành Tinh](https://planetarycomputer.microsoft.com/docs/reference/stac/) - để giúp người dùng tìm kiếm dữ liệu liên quan theo không gian và thời gian. + * [Danh mục Dữ liệu](https://planetarycomputer.microsoft.com/catalog) - với hàng petabyte dữ liệu Hệ thống Trái Đất (miễn phí & được lưu trữ trên Azure). + * [API Máy tính Hành tinh](https://planetarycomputer.microsoft.com/docs/reference/stac/) - giúp người dùng tìm kiếm dữ liệu liên quan theo không gian và thời gian. * [Hub](https://planetarycomputer.microsoft.com/docs/overview/environment/) - môi trường được quản lý cho các nhà khoa học xử lý các tập dữ liệu địa lý lớn. - * [Ứng Dụng](https://planetarycomputer.microsoft.com/applications) - trình bày các trường hợp sử dụng & công cụ để có được thông tin chi tiết về bền vững. -**Dự án Planetary Computer hiện đang trong giai đoạn xem trước (tính đến tháng 9 năm 2021)** - đây là cách bạn có thể bắt đầu đóng góp vào các giải pháp bền vững bằng cách sử dụng khoa học dữ liệu. + * [Ứng dụng](https://planetarycomputer.microsoft.com/applications) - trình bày các trường hợp sử dụng & công cụ để có những hiểu biết về bền vững. +**Dự án Planetary Computer hiện đang trong giai đoạn thử nghiệm (tính đến tháng 9 năm 2021)** - đây là cách bạn có thể bắt đầu đóng góp vào các giải pháp bền vững bằng cách sử dụng khoa học dữ liệu. -* [Yêu cầu quyền truy cập](https://planetarycomputer.microsoft.com/account/request) để bắt đầu khám phá và kết nối với các đồng nghiệp. +* [Yêu cầu quyền truy cập](https://planetarycomputer.microsoft.com/account/request) để bắt đầu khám phá và kết nối với cộng đồng. * [Khám phá tài liệu](https://planetarycomputer.microsoft.com/docs/overview/about) để hiểu các tập dữ liệu và API được hỗ trợ. * Khám phá các ứng dụng như [Ecosystem Monitoring](https://analytics-lab.org/ecosystemmonitoring/) để tìm cảm hứng cho các ý tưởng ứng dụng. -Hãy suy nghĩ về cách bạn có thể sử dụng trực quan hóa dữ liệu để làm nổi bật hoặc khuếch đại những hiểu biết liên quan đến các lĩnh vực như biến đổi khí hậu và nạn phá rừng. Hoặc suy nghĩ về cách những hiểu biết này có thể được sử dụng để tạo ra các trải nghiệm người dùng mới nhằm thúc đẩy thay đổi hành vi hướng tới lối sống bền vững hơn. +Hãy suy nghĩ về cách bạn có thể sử dụng trực quan hóa dữ liệu để làm nổi bật hoặc khuếch đại những hiểu biết quan trọng về các lĩnh vực như biến đổi khí hậu và nạn phá rừng. Hoặc suy nghĩ về cách những hiểu biết này có thể được sử dụng để tạo ra trải nghiệm người dùng mới, thúc đẩy thay đổi hành vi hướng tới lối sống bền vững hơn. ## Khoa học dữ liệu + Sinh viên -Chúng ta đã nói về các ứng dụng thực tế trong ngành công nghiệp và nghiên cứu, đồng thời khám phá các ví dụ ứng dụng khoa học dữ liệu trong nhân văn số và bền vững. Vậy làm thế nào bạn có thể xây dựng kỹ năng và chia sẻ chuyên môn của mình khi là người mới bắt đầu với khoa học dữ liệu? +Chúng ta đã thảo luận về các ứng dụng thực tế trong ngành công nghiệp và nghiên cứu, cũng như khám phá các ví dụ ứng dụng khoa học dữ liệu trong nhân văn số và bền vững. Vậy làm thế nào bạn có thể xây dựng kỹ năng và chia sẻ chuyên môn của mình khi là người mới bắt đầu trong khoa học dữ liệu? Dưới đây là một số ví dụ về các dự án khoa học dữ liệu của sinh viên để truyền cảm hứng cho bạn. @@ -131,7 +131,7 @@ Dưới đây là một số ví dụ về các dự án khoa học dữ liệu ## 🚀 Thử thách -Tìm kiếm các bài viết gợi ý các dự án khoa học dữ liệu phù hợp cho người mới bắt đầu - như [50 lĩnh vực chủ đề này](https://www.upgrad.com/blog/data-science-project-ideas-topics-beginners/) hoặc [21 ý tưởng dự án này](https://www.intellspot.com/data-science-project-ideas) hoặc [16 dự án với mã nguồn này](https://data-flair.training/blogs/data-science-project-ideas/) mà bạn có thể phân tích và tái sử dụng. Và đừng quên viết blog về hành trình học tập của bạn và chia sẻ những hiểu biết của bạn với tất cả chúng tôi. +Tìm kiếm các bài viết gợi ý các dự án khoa học dữ liệu thân thiện với người mới bắt đầu - như [50 lĩnh vực chủ đề này](https://www.upgrad.com/blog/data-science-project-ideas-topics-beginners/) hoặc [21 ý tưởng dự án này](https://www.intellspot.com/data-science-project-ideas) hoặc [16 dự án với mã nguồn này](https://data-flair.training/blogs/data-science-project-ideas/) mà bạn có thể phân tích và tái sử dụng. Và đừng quên viết blog về hành trình học tập của bạn và chia sẻ những hiểu biết của bạn với tất cả chúng tôi. ## Câu hỏi kiểm tra sau bài giảng @@ -139,11 +139,12 @@ Tìm kiếm các bài viết gợi ý các dự án khoa học dữ liệu phù ## Ôn tập & Tự học -Muốn khám phá thêm các trường hợp sử dụng? Dưới đây là một số bài viết liên quan: +Muốn khám phá thêm các trường hợp sử dụng? Dưới đây là một vài bài viết liên quan: * [17 Ứng dụng và Ví dụ về Khoa học Dữ liệu](https://builtin.com/data-science/data-science-applications-examples) - Tháng 7 năm 2021 * [11 Ứng dụng Khoa học Dữ liệu Đáng Kinh Ngạc trong Thế Giới Thực](https://myblindbird.com/data-science-applications-real-world/) - Tháng 5 năm 2021 * [Khoa học Dữ liệu Trong Thế Giới Thực](https://towardsdatascience.com/data-science-in-the-real-world/home) - Bộ sưu tập bài viết - * Khoa học Dữ liệu Trong: [Giáo dục](https://data-flair.training/blogs/data-science-in-education/), [Nông nghiệp](https://data-flair.training/blogs/data-science-in-agriculture/), [Tài chính](https://data-flair.training/blogs/data-science-in-finance/), [Phim ảnh](https://data-flair.training/blogs/data-science-at-movies/) & nhiều lĩnh vực khác. + * [12 Ứng dụng Khoa học Dữ liệu Thực Tế với Ví dụ](https://www.scaler.com/blog/data-science-applications/) - Tháng 5 năm 2024 + * Khoa học Dữ liệu Trong: [Giáo dục](https://data-flair.training/blogs/data-science-in-education/), [Nông nghiệp](https://data-flair.training/blogs/data-science-in-agriculture/), [Tài chính](https://data-flair.training/blogs/data-science-in-finance/), [Phim ảnh](https://data-flair.training/blogs/data-science-at-movies/), [Chăm sóc sức khỏe](https://onlinedegrees.sandiego.edu/data-science-health-care/) & nhiều lĩnh vực khác. ## Bài tập @@ -152,4 +153,4 @@ Muốn khám phá thêm các trường hợp sử dụng? Dưới đây là mộ --- **Tuyên bố miễn trừ trách nhiệm**: -Tài liệu này đã được dịch bằng dịch vụ dịch thuật AI [Co-op Translator](https://github.com/Azure/co-op-translator). Mặc dù chúng tôi cố gắng đảm bảo độ chính xác, xin lưu ý rằng các bản dịch tự động có thể chứa lỗi hoặc không chính xác. Tài liệu gốc bằng ngôn ngữ bản địa nên được coi là nguồn tham khảo chính thức. Đối với các thông tin quan trọng, chúng tôi khuyến nghị sử dụng dịch vụ dịch thuật chuyên nghiệp từ con người. Chúng tôi không chịu trách nhiệm cho bất kỳ sự hiểu lầm hoặc diễn giải sai nào phát sinh từ việc sử dụng bản dịch này. \ No newline at end of file +Tài liệu này đã được dịch bằng dịch vụ dịch thuật AI [Co-op Translator](https://github.com/Azure/co-op-translator). Mặc dù chúng tôi cố gắng đảm bảo độ chính xác, xin lưu ý rằng các bản dịch tự động có thể chứa lỗi hoặc không chính xác. Tài liệu gốc bằng ngôn ngữ bản địa nên được coi là nguồn thông tin chính thức. Đối với các thông tin quan trọng, khuyến nghị sử dụng dịch vụ dịch thuật chuyên nghiệp bởi con người. Chúng tôi không chịu trách nhiệm cho bất kỳ sự hiểu lầm hoặc diễn giải sai nào phát sinh từ việc sử dụng bản dịch này. \ No newline at end of file diff --git a/translations/zh/6-Data-Science-In-Wild/20-Real-World-Examples/README.md b/translations/zh/6-Data-Science-In-Wild/20-Real-World-Examples/README.md index d30ea478..7b249ea3 100644 --- a/translations/zh/6-Data-Science-In-Wild/20-Real-World-Examples/README.md +++ b/translations/zh/6-Data-Science-In-Wild/20-Real-World-Examples/README.md @@ -1,23 +1,23 @@ # 数据科学在现实世界中的应用 -| ![ 由 [(@sketchthedocs)](https://sketchthedocs.dev) 绘制的草图笔记 ](../../sketchnotes/20-DataScience-RealWorld.png) | +| ![ Sketchnote by [(@sketchthedocs)](https://sketchthedocs.dev) ](../../sketchnotes/20-DataScience-RealWorld.png) | | :--------------------------------------------------------------------------------------------------------------: | -| 数据科学在现实世界中的应用 - _由 [@nitya](https://twitter.com/nitya) 绘制的草图笔记_ | +| 数据科学在现实世界中的应用 - _Sketchnote by [@nitya](https://twitter.com/nitya)_ | -我们的学习旅程即将接近尾声! +我们即将完成这段学习旅程! -我们从数据科学和伦理的定义开始,探索了数据分析和可视化的各种工具和技术,回顾了数据科学生命周期,并研究了如何通过云计算服务扩展和自动化数据科学工作流。那么,你可能会问:_“如何将这些学习内容映射到现实世界的情境中?”_ +我们从数据科学和伦理的定义开始,探索了各种数据分析和可视化工具与技术,回顾了数据科学生命周期,并研究了如何通过云计算服务扩展和自动化数据科学工作流程。那么,你可能会问:_"如何将这些学习内容映射到现实世界的场景中?"_ -在本课中,我们将探讨数据科学在各行业中的实际应用,并深入研究在科研、数字人文和可持续发展等领域的具体案例。我们还将介绍学生项目的机会,并以一些有助于你继续学习的资源作为总结! +在本课中,我们将探讨数据科学在各行业中的实际应用,并深入研究在科研、数字人文和可持续发展领域的具体案例。我们还将讨论学生项目的机会,并提供一些有用的资源,帮助你继续学习之旅! ## 课前测验 @@ -25,98 +25,98 @@ CO_OP_TRANSLATOR_METADATA: ## 数据科学 + 行业 -随着人工智能的普及化,开发者现在可以更轻松地设计和整合基于人工智能的决策和数据驱动的洞察到用户体验和开发工作流中。以下是数据科学在行业中“实际应用”的一些例子: +随着人工智能的普及,开发者现在可以更轻松地设计和集成基于人工智能的决策和数据驱动的洞察到用户体验和开发工作流程中。以下是数据科学在各行业中“应用”的一些实际案例: - * [Google Flu Trends](https://www.wired.com/2015/10/can-learn-epic-failure-google-flu-trends/) 使用数据科学将搜索词与流感趋势相关联。尽管这种方法存在缺陷,但它提高了人们对数据驱动的医疗预测可能性(以及挑战)的认识。 + * [Google Flu Trends](https://www.wired.com/2015/10/can-learn-epic-failure-google-flu-trends/) 使用数据科学将搜索词与流感趋势相关联。尽管方法存在缺陷,但它提高了人们对数据驱动的医疗预测可能性(以及挑战)的认识。 - * [UPS 路线预测](https://www.technologyreview.com/2018/11/21/139000/how-ups-uses-ai-to-outsmart-bad-weather/) - 解释了 UPS 如何利用数据科学和机器学习预测最优配送路线,考虑天气状况、交通模式、配送截止时间等因素。 + * [UPS 路线预测](https://www.technologyreview.com/2018/11/21/139000/how-ups-uses-ai-to-outsmart-bad-weather/) - 解释了 UPS 如何利用数据科学和机器学习预测最佳配送路线,考虑天气状况、交通模式、配送截止时间等因素。 - * [纽约出租车路线可视化](http://chriswhong.github.io/nyctaxi/) - 使用[信息自由法](https://chriswhong.com/open-data/foil_nyc_taxi/)收集的数据帮助可视化纽约出租车一天的运行情况,帮助我们了解它们如何穿梭于繁忙的城市、赚取的收入以及每24小时内行程的持续时间。 + * [纽约出租车路线可视化](http://chriswhong.github.io/nyctaxi/) - 使用[信息自由法](https://chriswhong.com/open-data/foil_nyc_taxi/)收集的数据帮助可视化纽约出租车一天的运行情况,帮助我们了解它们如何在繁忙的城市中导航、赚取的收入以及每24小时内的行程时长。 - * [Uber 数据科学工作台](https://eng.uber.com/dsw/) - 每天从数百万次 Uber 行程中收集数据(如上下车地点、行程时长、首选路线等),构建数据分析工具以帮助定价、安全、欺诈检测和导航决策。 + * [Uber 数据科学工作台](https://eng.uber.com/dsw/) - 每天从数百万次 Uber 行程中收集数据(如上下车地点、行程时长、偏好路线等),构建数据分析工具,用于定价、安全、欺诈检测和导航决策。 - * [体育分析](https://towardsdatascience.com/scope-of-analytics-in-sports-world-37ed09c39860) - 专注于_预测分析_(团队和球员分析 - 想想[点球成金](https://datasciencedegree.wisconsin.edu/blog/moneyball-proves-importance-big-data-big-ideas/) - 以及粉丝管理)和_数据可视化_(团队和粉丝仪表盘、比赛等),应用于人才挖掘、体育博彩和库存/场馆管理。 + * [体育分析](https://towardsdatascience.com/scope-of-analytics-in-sports-world-37ed09c39860) - 关注_预测分析_(团队和球员分析 - 想想[点球成金](https://datasciencedegree.wisconsin.edu/blog/moneyball-proves-importance-big-data-big-ideas/) - 以及粉丝管理)和_数据可视化_(团队和粉丝仪表盘、比赛等),应用包括人才选拔、体育博彩和库存/场馆管理。 - * [银行业中的数据科学](https://data-flair.training/blogs/data-science-in-banking/) - 强调数据科学在金融行业的价值,包括风险建模、欺诈检测、客户细分、实时预测和推荐系统等应用。预测分析还推动了诸如[信用评分](https://dzone.com/articles/using-big-data-and-predictive-analytics-for-credit)等关键指标。 + * [银行业中的数据科学](https://data-flair.training/blogs/data-science-in-banking/) - 强调数据科学在金融行业的价值,应用包括风险建模和欺诈检测、客户细分、实时预测和推荐系统。预测分析还推动了关键指标,如[信用评分](https://dzone.com/articles/using-big-data-and-predictive-analytics-for-credit)。 - * [医疗保健中的数据科学](https://data-flair.training/blogs/data-science-in-healthcare/) - 强调了医学影像(如 MRI、X 光、CT 扫描)、基因组学(DNA 测序)、药物开发(风险评估、成功预测)、预测分析(患者护理和供应物流)、疾病追踪与预防等应用。 + * [医疗领域的数据科学](https://data-flair.training/blogs/data-science-in-healthcare/) - 强调应用包括医学影像(如 MRI、X光、CT扫描)、基因组学(DNA测序)、药物开发(风险评估、成功预测)、预测分析(患者护理和供应物流)、疾病追踪与预防等。 -![现实世界中的数据科学应用](../../../../6-Data-Science-In-Wild/20-Real-World-Examples/images/data-science-applications.png) 图片来源:[Data Flair: 6 Amazing Data Science Applications ](https://data-flair.training/blogs/data-science-applications/) +![数据科学在现实世界中的应用](../../../../translated_images/data-science-applications.4e5019cd8790ebac2277ff5f08af386f8727cac5d30f77727c7090677e6adb9c.zh.png) 图片来源:[Data Flair: 6 Amazing Data Science Applications ](https://data-flair.training/blogs/data-science-applications/) -该图展示了其他领域和数据科学技术的应用实例。想探索更多应用?请查看下面的[复习与自学](../../../../6-Data-Science-In-Wild/20-Real-World-Examples)部分。 +图中展示了其他领域和数据科学技术的应用案例。想探索更多应用?查看下面的[复习与自学](../../../../6-Data-Science-In-Wild/20-Real-World-Examples)部分。 ## 数据科学 + 科研 -| ![ 由 [(@sketchthedocs)](https://sketchthedocs.dev) 绘制的草图笔记 ](../../sketchnotes/20-DataScience-Research.png) | +| ![ Sketchnote by [(@sketchthedocs)](https://sketchthedocs.dev) ](../../sketchnotes/20-DataScience-Research.png) | | :---------------------------------------------------------------------------------------------------------------: | -| 数据科学与科研 - _由 [@nitya](https://twitter.com/nitya) 绘制的草图笔记_ | +| 数据科学与科研 - _Sketchnote by [@nitya](https://twitter.com/nitya)_ | -尽管现实世界的应用通常专注于大规模的行业用例,_科研_应用和项目可以从两个角度提供价值: +虽然现实世界的应用通常关注行业规模的用例,_科研_应用和项目可以从两个角度提供价值: -* _创新机会_ - 快速原型化先进概念并测试下一代应用的用户体验。 +* _创新机会_ - 探索先进概念的快速原型设计以及下一代应用的用户体验测试。 * _部署挑战_ - 调查数据科学技术在现实世界中的潜在危害或意外后果。 -对于学生来说,这些研究项目不仅能提供学习和协作的机会,还能加深对主题的理解,并拓宽与相关领域的人员或团队的接触和参与。那研究项目是什么样的?它们如何产生影响? +对于学生来说,这些科研项目不仅提供学习和协作的机会,还能加深对主题的理解,并拓宽与相关领域的人员或团队的接触和参与。科研项目是什么样的?它们如何产生影响? -让我们来看一个例子 - [MIT Gender Shades Study](http://gendershades.org/overview.html),由 Joy Buolamwini(MIT 媒体实验室)发起,并与 Timnit Gebru(当时在微软研究院)共同撰写了一篇[标志性研究论文](http://proceedings.mlr.press/v81/buolamwini18a/buolamwini18a.pdf),该研究聚焦于: +让我们看一个例子 - [MIT Gender Shades Study](http://gendershades.org/overview.html),由 Joy Buolamwini(MIT Media Labs)发起,与 Timnit Gebru(当时在微软研究院)共同撰写了一篇[标志性研究论文](http://proceedings.mlr.press/v81/buolamwini18a/buolamwini18a.pdf),重点研究: - * **研究内容:** 评估基于性别和肤色的自动化面部分析算法和数据集中的偏差。 - * **研究原因:** 面部分析被用于执法、机场安检、招聘系统等领域——这些场景中,由于偏差导致的不准确分类可能对受影响的个人或群体造成经济和社会危害。理解(并消除或减轻)偏差是确保公平使用的关键。 - * **研究方法:** 研究人员发现现有基准主要使用肤色较浅的受试者,因此创建了一个新的数据集(1000+ 图像),在性别和肤色上更加平衡。该数据集被用于评估三个性别分类产品(来自微软、IBM 和 Face++)的准确性。 + * **什么:** 研究项目的目标是_评估基于性别和肤色的自动化面部分析算法和数据集中的偏差_。 + * **为什么:** 面部分析被用于执法、机场安检、招聘系统等领域——这些场景中由于偏差导致的不准确分类可能对受影响的个人或群体造成经济和社会损害。理解(并消除或减轻)偏差是使用公平的关键。 + * **如何:** 研究人员发现现有基准主要使用肤色较浅的主体,并策划了一个新的数据集(1000+张图片),在性别和肤色上更加平衡。该数据集用于评估三个性别分类产品(来自微软、IBM和Face++)的准确性。 -研究结果显示,尽管总体分类准确性较高,但不同子群体之间的错误率存在显著差异——女性或肤色较深的人群的**性别误判**率更高,表明存在偏差。 +结果显示,尽管总体分类准确性较高,但不同子群体之间的错误率存在显著差异——**性别错误分类**在女性或肤色较深的人群中更高,表明存在偏差。 -**关键成果:** 提高了对数据科学需要更多_代表性数据集_(平衡的子群体)和更多_包容性团队_(多样化背景)的认识,以便在 AI 解决方案中更早地识别并消除或减轻这些偏差。这样的研究努力也促使许多组织定义了_负责任 AI_的原则和实践,以提高其 AI 产品和流程的公平性。 +**关键成果:** 提高了对数据科学需要更多_代表性数据集_(平衡子群体)和更多_包容性团队_(多样化背景)的认识,以便在人工智能解决方案中更早地识别并消除或减轻这些偏差。像这样的研究努力对于许多组织定义_负责任的人工智能_原则和实践以提高其人工智能产品和流程的公平性也至关重要。 -**想了解微软的相关研究工作?** +**想了解微软相关的研究工作?** -* 查看 [Microsoft Research Projects](https://www.microsoft.com/research/research-area/artificial-intelligence/?facet%5Btax%5D%5Bmsr-research-area%5D%5B%5D=13556&facet%5Btax%5D%5Bmsr-content-type%5D%5B%5D=msr-project) 中的人工智能研究项目。 -* 探索 [Microsoft Research Data Science Summer School](https://www.microsoft.com/en-us/research/academic-program/data-science-summer-school/) 的学生项目。 -* 查看 [Fairlearn](https://fairlearn.org/) 项目和 [Responsible AI](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1%3aprimaryr6) 计划。 +* 查看[微软研究项目](https://www.microsoft.com/research/research-area/artificial-intelligence/?facet%5Btax%5D%5Bmsr-research-area%5D%5B%5D=13556&facet%5Btax%5D%5Bmsr-content-type%5D%5B%5D=msr-project)中的人工智能领域。 +* 探索[微软研究数据科学暑期学校](https://www.microsoft.com/en-us/research/academic-program/data-science-summer-school/)的学生项目。 +* 查看[Fairlearn](https://fairlearn.org/)项目和[负责任的人工智能](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1%3aprimaryr6)倡议。 ## 数据科学 + 人文学科 -| ![ 由 [(@sketchthedocs)](https://sketchthedocs.dev) 绘制的草图笔记 ](../../sketchnotes/20-DataScience-Humanities.png) | +| ![ Sketchnote by [(@sketchthedocs)](https://sketchthedocs.dev) ](../../sketchnotes/20-DataScience-Humanities.png) | | :---------------------------------------------------------------------------------------------------------------: | -| 数据科学与数字人文 - _由 [@nitya](https://twitter.com/nitya) 绘制的草图笔记_ | +| 数据科学与数字人文学科 - _Sketchnote by [@nitya](https://twitter.com/nitya)_ | -数字人文[被定义为](https://digitalhumanities.stanford.edu/about-dh-stanford)“结合计算方法与人文探究的一系列实践和方法”。[斯坦福大学的项目](https://digitalhumanities.stanford.edu/projects)如_“重启历史”_和_“诗意思维”_展示了[数字人文与数据科学](https://digitalhumanities.stanford.edu/digital-humanities-and-data-science)之间的联系——强调了网络分析、信息可视化、空间和文本分析等技术,这些技术可以帮助我们重新审视历史和文学数据集,从而获得新的见解和视角。 +数字人文学科[被定义为](https://digitalhumanities.stanford.edu/about-dh-stanford)“结合计算方法与人文研究的一系列实践和方法”。[斯坦福项目](https://digitalhumanities.stanford.edu/projects)如_“重启历史”_和_“诗意思维”_展示了[数字人文学科与数据科学](https://digitalhumanities.stanford.edu/digital-humanities-and-data-science)之间的联系——强调网络分析、信息可视化、空间和文本分析等技术,这些技术可以帮助我们重新审视历史和文学数据集,从而获得新的洞察和视角。 *想探索并扩展这一领域的项目?* -查看 ["Emily Dickinson and the Meter of Mood"](https://gist.github.com/jlooper/ce4d102efd057137bc000db796bfd671) - 这是 [Jen Looper](https://twitter.com/jenlooper) 的一个优秀案例,探讨如何利用数据科学重新审视熟悉的诗歌,并在新的背景下重新评估其意义及作者的贡献。例如,_我们能否通过分析诗歌的语气或情感来预测其创作的季节_——这又能告诉我们作者在相关时期的心境如何? +查看["Emily Dickinson and the Meter of Mood"](https://gist.github.com/jlooper/ce4d102efd057137bc000db796bfd671)——这是一个来自[Jen Looper](https://twitter.com/jenlooper)的优秀案例,探讨如何利用数据科学重新审视熟悉的诗歌,并在新的背景下重新评估其意义及作者的贡献。例如,_我们能否通过分析诗歌的语气或情感来预测其创作的季节_——这又能告诉我们作者在相关时期的心境如何? 为回答这个问题,我们遵循数据科学生命周期的步骤: - * [`数据获取`](https://gist.github.com/jlooper/ce4d102efd057137bc000db796bfd671#acquiring-the-dataset) - 收集相关数据集进行分析。选项包括使用 API(如 [Poetry DB API](https://poetrydb.org/index.html))或通过工具(如 [Scrapy](https://scrapy.org/))抓取网页(如 [Project Gutenberg](https://www.gutenberg.org/files/12242/12242-h/12242-h.htm))。 - * [`数据清理`](https://gist.github.com/jlooper/ce4d102efd057137bc000db796bfd671#clean-the-data) - 解释如何使用基本工具(如 Visual Studio Code 和 Microsoft Excel)对文本进行格式化、清理和简化。 - * [`数据分析`](https://gist.github.com/jlooper/ce4d102efd057137bc000db796bfd671#working-with-the-data-in-a-notebook) - 解释如何将数据集导入“笔记本”中,使用 Python 包(如 pandas、numpy 和 matplotlib)组织和可视化数据。 - * [`情感分析`](https://gist.github.com/jlooper/ce4d102efd057137bc000db796bfd671#sentiment-analysis-using-cognitive-services) - 解释如何集成云服务(如文本分析),使用低代码工具(如 [Power Automate](https://flow.microsoft.com/en-us/))实现自动化数据处理工作流。 + * [`数据获取`](https://gist.github.com/jlooper/ce4d102efd057137bc000db796bfd671#acquiring-the-dataset) - 收集相关数据集进行分析。选项包括使用 API(如[Poetry DB API](https://poetrydb.org/index.html))或使用工具(如[Scrapy](https://scrapy.org/))抓取网页(如[Project Gutenberg](https://www.gutenberg.org/files/12242/12242-h/12242-h.htm))。 + * [`数据清理`](https://gist.github.com/jlooper/ce4d102efd057137bc000db796bfd671#clean-the-data) - 解释如何使用基本工具(如 Visual Studio Code 和 Microsoft Excel)格式化、清理和简化文本。 + * [`数据分析`](https://gist.github.com/jlooper/ce4d102efd057137bc000db796bfd671#working-with-the-data-in-a-notebook) - 解释如何将数据集导入“笔记本”进行分析,使用 Python 包(如 pandas、numpy 和 matplotlib)组织和可视化数据。 + * [`情感分析`](https://gist.github.com/jlooper/ce4d102efd057137bc000db796bfd671#sentiment-analysis-using-cognitive-services) - 解释如何集成云服务(如文本分析),使用低代码工具(如[Power Automate](https://flow.microsoft.com/en-us/))实现自动化数据处理工作流程。 -通过这一工作流,我们可以探索季节对诗歌情感的影响,并帮助我们形成对作者的独特见解。试试看,然后扩展笔记本以提出其他问题或以新的方式可视化数据! +通过这一工作流程,我们可以探索季节对诗歌情感的影响,并帮助我们形成对作者的独特视角。自己试试吧——然后扩展笔记本,提出其他问题或以新的方式可视化数据! -> 你可以使用 [Digital Humanities Toolkit](https://github.com/Digital-Humanities-Toolkit) 中的一些工具来探索这些研究方向。 +> 你可以使用[数字人文学科工具包](https://github.com/Digital-Humanities-Toolkit)中的一些工具来探索这些研究方向。 ## 数据科学 + 可持续发展 -| ![ 由 [(@sketchthedocs)](https://sketchthedocs.dev) 绘制的草图笔记 ](../../sketchnotes/20-DataScience-Sustainability.png) | +| ![ Sketchnote by [(@sketchthedocs)](https://sketchthedocs.dev) ](../../sketchnotes/20-DataScience-Sustainability.png) | | :---------------------------------------------------------------------------------------------------------------: | -| 数据科学与可持续发展 - _由 [@nitya](https://twitter.com/nitya) 绘制的草图笔记_ | +| 数据科学与可持续发展 - _Sketchnote by [@nitya](https://twitter.com/nitya)_ | -[2030 年可持续发展议程](https://sdgs.un.org/2030agenda) - 于 2015 年由所有联合国成员国通过,确定了包括**保护地球**免受退化和气候变化影响在内的 17 项目标。[微软可持续发展](https://www.microsoft.com/en-us/sustainability) 计划支持这些目标,探索技术解决方案如何支持并构建更可持续的未来,重点关注[四大目标](https://dev.to/azure/a-visual-guide-to-sustainable-software-engineering-53hh) - 到 2030 年实现碳负排放、正水效、零废弃物和生物多样性。 +[2030年可持续发展议程](https://sdgs.un.org/2030agenda)——由所有联合国成员国于2015年通过——确定了17个目标,其中包括**保护地球**免受退化和气候变化影响。[微软可持续发展](https://www.microsoft.com/en-us/sustainability)倡议支持这些目标,探索技术解决方案如何支持并构建更可持续的未来,重点关注[四个目标](https://dev.to/azure/a-visual-guide-to-sustainable-software-engineering-53hh)——到2030年实现碳负、水正、零废物和生物多样性。 -以可扩展和及时的方式应对这些挑战需要云规模的思维——以及大规模数据。[Planetary Computer](https://planetarycomputer.microsoft.com/) 计划提供了四个组件,帮助数据科学家和开发者应对这些挑战: +以可扩展和及时的方式解决这些挑战需要云规模的思维——以及大规模数据。[Planetary Computer](https://planetarycomputer.microsoft.com/)倡议为数据科学家和开发者提供了四个组件来支持这一努力: - * [数据目录](https://planetarycomputer.microsoft.com/catalog) - 提供数拍字节的地球系统数据(免费且托管于 Azure)。 - * [Planetary API](https://planetarycomputer.microsoft.com/docs/reference/stac/) - 帮助用户跨空间和时间搜索相关数据。 - * [Hub](https://planetarycomputer.microsoft.com/docs/overview/environment/) - 为科学家提供处理大规模地理空间数据集的托管环境。 - * [应用程序](https://planetarycomputer.microsoft.com/applications) - 展示可持续发展洞察的用例和工具。 -**Planetary Computer 项目目前处于预览阶段(截至 2021 年 9 月)** - 以下是如何通过数据科学为可持续发展解决方案做出贡献的入门指南。 + * [数据目录](https://planetarycomputer.microsoft.com/catalog) - 提供数PB的地球系统数据(免费且托管于 Azure)。 + * [Planetary API](https://planetarycomputer.microsoft.com/docs/reference/stac/) - 帮助用户在空间和时间范围内搜索相关数据。 + * [Hub](https://planetarycomputer.microsoft.com/docs/overview/environment/) - 为科学家提供处理海量地理空间数据集的托管环境。 + * [应用](https://planetarycomputer.microsoft.com/applications) - 展示可持续发展洞察的用例和工具。 +**Planetary Computer 项目目前处于预览阶段(截至 2021 年 9 月)** - 以下是如何通过数据科学开始为可持续发展解决方案做出贡献的指南。 -* [申请访问权限](https://planetarycomputer.microsoft.com/account/request),开始探索并与同行交流。 -* [浏览文档](https://planetarycomputer.microsoft.com/docs/overview/about),了解支持的数据集和 API。 +* [申请访问权限](https://planetarycomputer.microsoft.com/account/request),开始探索并与同行建立联系。 +* [查看文档](https://planetarycomputer.microsoft.com/docs/overview/about),了解支持的数据集和 API。 * 探索像 [生态系统监测](https://analytics-lab.org/ecosystemmonitoring/) 这样的应用,寻找应用创意的灵感。 -思考如何利用数据可视化揭示或放大与气候变化和森林砍伐等领域相关的洞察力。或者思考如何利用这些洞察力创造新的用户体验,激励行为改变以实现更可持续的生活。 +思考如何利用数据可视化揭示或放大与气候变化和森林砍伐等领域相关的洞察。或者思考如何利用这些洞察来创造新的用户体验,激励行为改变以实现更可持续的生活。 ## 数据科学 + 学生 @@ -124,14 +124,14 @@ CO_OP_TRANSLATOR_METADATA: 以下是一些数据科学学生项目的示例,供你参考。 - * [MSR 数据科学夏季学校](https://www.microsoft.com/en-us/research/academic-program/data-science-summer-school/#!projects) 的 GitHub [项目](https://github.com/msr-ds3),探索以下主题: + * [MSR 数据科学夏季学校](https://www.microsoft.com/en-us/research/academic-program/data-science-summer-school/#!projects),以及 GitHub 上的 [项目](https://github.com/msr-ds3),探索以下主题: - [警察使用武力中的种族偏见](https://www.microsoft.com/en-us/research/video/data-science-summer-school-2019-replicating-an-empirical-analysis-of-racial-differences-in-police-use-of-force/) | [Github](https://github.com/msr-ds3/stop-question-frisk) - [纽约地铁系统的可靠性](https://www.microsoft.com/en-us/research/video/data-science-summer-school-2018-exploring-the-reliability-of-the-nyc-subway-system/) | [Github](https://github.com/msr-ds3/nyctransit) * [数字化物质文化:探索 Sirkap 的社会经济分布](https://claremont.maps.arcgis.com/apps/Cascade/index.html?appid=bdf2aef0f45a4674ba41cd373fa23afc) - 来自 [Ornella Altunyan](https://twitter.com/ornelladotcom) 和 Claremont 团队,使用 [ArcGIS StoryMaps](https://storymaps.arcgis.com/)。 ## 🚀 挑战 -寻找推荐适合初学者的数据科学项目的文章,例如 [这 50 个主题领域](https://www.upgrad.com/blog/data-science-project-ideas-topics-beginners/)、[这 21 个项目创意](https://www.intellspot.com/data-science-project-ideas) 或 [这 16 个带源码的项目](https://data-flair.training/blogs/data-science-project-ideas/),你可以拆解并重新组合这些项目。别忘了记录你的学习历程,并与我们分享你的见解。 +寻找推荐适合初学者的数据科学项目的文章,例如 [这 50 个主题领域](https://www.upgrad.com/blog/data-science-project-ideas-topics-beginners/)、[这 21 个项目创意](https://www.intellspot.com/data-science-project-ideas) 或 [这 16 个带源码的项目](https://data-flair.training/blogs/data-science-project-ideas/),你可以拆解并重新组合这些项目。别忘了记录你的学习历程,并与我们分享你的洞察。 ## 课后测验 @@ -140,10 +140,11 @@ CO_OP_TRANSLATOR_METADATA: ## 复习与自学 想要探索更多用例?以下是一些相关的文章: - * [17 个数据科学应用与示例](https://builtin.com/data-science/data-science-applications-examples) - 2021 年 7 月 + * [17 个数据科学应用及示例](https://builtin.com/data-science/data-science-applications-examples) - 2021 年 7 月 * [11 个令人惊叹的现实世界数据科学应用](https://myblindbird.com/data-science-applications-real-world/) - 2021 年 5 月 * [现实世界中的数据科学](https://towardsdatascience.com/data-science-in-the-real-world/home) - 文章合集 - * 数据科学在以下领域的应用:[教育](https://data-flair.training/blogs/data-science-in-education/)、[农业](https://data-flair.training/blogs/data-science-in-agriculture/)、[金融](https://data-flair.training/blogs/data-science-in-finance/)、[电影](https://data-flair.training/blogs/data-science-at-movies/) 等。 + * [12 个现实世界数据科学应用及示例](https://www.scaler.com/blog/data-science-applications/) - 2024 年 5 月 + * 数据科学在以下领域的应用:[教育](https://data-flair.training/blogs/data-science-in-education/)、[农业](https://data-flair.training/blogs/data-science-in-agriculture/)、[金融](https://data-flair.training/blogs/data-science-in-finance/)、[电影](https://data-flair.training/blogs/data-science-at-movies/)、[医疗保健](https://onlinedegrees.sandiego.edu/data-science-health-care/) 等。 ## 作业