|
4 weeks ago | |
---|---|---|
.. | ||
README.md | 4 weeks ago | |
assignment.md | 4 weeks ago |
README.md
علم داده در دنیای واقعی
![]() |
---|
علم داده در دنیای واقعی - اسکیچنوت توسط @nitya |
ما تقریباً به پایان این مسیر یادگیری رسیدهایم!
ما با تعریفهای علم داده و اخلاقیات شروع کردیم، ابزارها و تکنیکهای مختلف برای تحلیل و مصورسازی دادهها را بررسی کردیم، چرخه عمر علم داده را مرور کردیم و به مقیاسپذیری و خودکارسازی جریانهای کاری علم داده با استفاده از خدمات رایانش ابری پرداختیم. بنابراین احتمالاً از خود میپرسید: "چطور میتوانم تمام این آموختهها را به زمینههای دنیای واقعی مرتبط کنم؟"
در این درس، به کاربردهای دنیای واقعی علم داده در صنایع مختلف میپردازیم و مثالهای خاصی در زمینههای تحقیقاتی، علوم انسانی دیجیتال و پایداری بررسی میکنیم. همچنین فرصتهای پروژههای دانشجویی را بررسی کرده و با منابع مفیدی برای ادامه مسیر یادگیری شما به پایان میرسیم.
آزمون پیش از درس
علم داده + صنعت
به لطف دموکراتیزه شدن هوش مصنوعی، توسعهدهندگان اکنون راحتتر میتوانند تصمیمگیریهای مبتنی بر هوش مصنوعی و بینشهای مبتنی بر داده را در تجربههای کاربری و جریانهای کاری توسعه ادغام کنند. در اینجا چند مثال از چگونگی "کاربرد" علم داده در دنیای واقعی در صنایع مختلف آورده شده است:
-
Google Flu Trends از علم داده برای ارتباط دادن اصطلاحات جستجو با روندهای آنفولانزا استفاده کرد. اگرچه این روش نقصهایی داشت، اما آگاهی از امکانات (و چالشهای) پیشبینیهای بهداشتی مبتنی بر داده را افزایش داد.
-
پیشبینی مسیرهای UPS - توضیح میدهد که چگونه UPS از علم داده و یادگیری ماشین برای پیشبینی مسیرهای بهینه تحویل استفاده میکند، با در نظر گرفتن شرایط آب و هوایی، الگوهای ترافیکی، مهلتهای تحویل و موارد دیگر.
-
مصورسازی مسیرهای تاکسیهای نیویورک - دادههای جمعآوریشده با استفاده از قوانین آزادی اطلاعات به ما کمک کرد تا یک روز از زندگی تاکسیهای نیویورک را مصور کنیم و بفهمیم چگونه در شهر شلوغ حرکت میکنند، چقدر درآمد دارند و مدت زمان سفرهایشان در هر دوره ۲۴ ساعته چقدر است.
-
محیط کار علم داده اوبر - از دادههای جمعآوریشده از میلیونها سفر اوبر روزانه (مانند مکانهای سوار و پیاده شدن، مدت زمان سفر، مسیرهای ترجیحی و غیره) برای ساخت یک ابزار تحلیل داده استفاده میکند که به تصمیمگیری در مورد قیمتگذاری، ایمنی، تشخیص تقلب و مسیریابی کمک میکند.
-
تحلیلهای ورزشی - بر تحلیلهای پیشبینیکننده (تحلیل تیم و بازیکن - مانند Moneyball - و مدیریت هواداران) و مصورسازی دادهها (داشبوردهای تیم و هواداران، بازیها و غیره) تمرکز دارد، با کاربردهایی مانند استعدادیابی، شرطبندی ورزشی و مدیریت موجودی/مکان.
-
علم داده در بانکداری - ارزش علم داده در صنعت مالی را با کاربردهایی از مدلسازی ریسک و تشخیص تقلب گرفته تا تقسیمبندی مشتریان، پیشبینیهای بلادرنگ و سیستمهای توصیهگر برجسته میکند. تحلیلهای پیشبینیکننده همچنین اقدامات حیاتی مانند امتیازات اعتباری را هدایت میکنند.
-
علم داده در مراقبتهای بهداشتی - کاربردهایی مانند تصویربرداری پزشکی (مانند MRI، اشعه ایکس، سیتیاسکن)، ژنومیک (توالییابی DNA)، توسعه دارو (ارزیابی ریسک، پیشبینی موفقیت)، تحلیلهای پیشبینیکننده (مراقبت از بیمار و لجستیک تأمین)، ردیابی و پیشگیری از بیماری و غیره را برجسته میکند.
اعتبار تصویر: Data Flair: 6 Amazing Data Science Applications
این تصویر حوزهها و مثالهای دیگری برای کاربرد تکنیکهای علم داده را نشان میدهد. میخواهید کاربردهای دیگری را کشف کنید؟ به بخش مرور و مطالعه خودآموز زیر مراجعه کنید.
علم داده + تحقیق
![]() |
---|
علم داده و تحقیق - اسکیچنوت توسط @nitya |
در حالی که کاربردهای دنیای واقعی اغلب بر موارد استفاده صنعتی در مقیاس بزرگ تمرکز دارند، کاربردها و پروژههای تحقیقاتی میتوانند از دو منظر مفید باشند:
- فرصتهای نوآوری - بررسی نمونهسازی سریع مفاهیم پیشرفته و آزمایش تجربههای کاربری برای برنامههای نسل بعدی.
- چالشهای پیادهسازی - بررسی آسیبهای احتمالی یا پیامدهای ناخواسته فناوریهای علم داده در زمینههای دنیای واقعی.
برای دانشجویان، این پروژههای تحقیقاتی میتوانند فرصتهای یادگیری و همکاری فراهم کنند که درک شما از موضوع را بهبود بخشیده و آگاهی و تعامل شما با افراد یا تیمهای مرتبط در حوزههای مورد علاقه را گسترش دهند. بنابراین پروژههای تحقیقاتی چگونه به نظر میرسند و چگونه میتوانند تأثیرگذار باشند؟
بیایید یک مثال را بررسی کنیم - مطالعه Gender Shades MIT از جوی بوالاموینی (آزمایشگاههای رسانهای MIT) با یک مقاله تحقیقاتی برجسته که با تیمنیت گبرو (در آن زمان در مایکروسافت ریسرچ) همنویسنده شده بود و بر موارد زیر تمرکز داشت:
- چه چیزی: هدف پروژه تحقیقاتی ارزیابی تعصب موجود در الگوریتمها و مجموعه دادههای تحلیل خودکار چهره بر اساس جنسیت و نوع پوست بود.
- چرا: تحلیل چهره در زمینههایی مانند اجرای قانون، امنیت فرودگاه، سیستمهای استخدام و موارد دیگر استفاده میشود - زمینههایی که طبقهبندیهای نادرست (مثلاً به دلیل تعصب) میتوانند آسیبهای اقتصادی و اجتماعی بالقوهای به افراد یا گروههای تحت تأثیر وارد کنند. درک (و حذف یا کاهش) تعصبها برای عدالت در استفاده کلیدی است.
- چگونه: محققان دریافتند که معیارهای موجود عمدتاً از افراد با پوست روشنتر استفاده میکنند و یک مجموعه داده جدید (بیش از ۱۰۰۰ تصویر) ایجاد کردند که از نظر جنسیت و نوع پوست متعادلتر بود. این مجموعه داده برای ارزیابی دقت سه محصول طبقهبندی جنسیت (از مایکروسافت، IBM و Face++) استفاده شد.
نتایج نشان داد که اگرچه دقت کلی طبقهبندی خوب بود، اما تفاوت قابل توجهی در نرخ خطا بین زیرگروههای مختلف وجود داشت - با اشتباه در تشخیص جنسیت که برای زنان یا افراد با پوست تیرهتر بیشتر بود، که نشاندهنده تعصب است.
نتایج کلیدی: این تحقیق آگاهی را افزایش داد که علم داده به مجموعه دادههای نمایندهتر (زیرگروههای متعادل) و تیمهای فراگیرتر (پیشینههای متنوع) نیاز دارد تا این تعصبها را زودتر در راهحلهای هوش مصنوعی شناسایی و حذف یا کاهش دهد. تلاشهای تحقیقاتی مانند این همچنین در تعریف اصول و شیوههای هوش مصنوعی مسئولانه در بسیاری از سازمانها برای بهبود عدالت در محصولات و فرآیندهای هوش مصنوعی آنها نقش اساسی دارند.
میخواهید درباره تلاشهای تحقیقاتی مرتبط در مایکروسافت بیشتر بدانید؟
- پروژههای تحقیقات مایکروسافت در زمینه هوش مصنوعی را بررسی کنید.
- پروژههای دانشجویی مدرسه تابستانی علم داده مایکروسافت ریسرچ را کاوش کنید.
- پروژه Fairlearn و ابتکارات هوش مصنوعی مسئولانه را بررسی کنید.
علم داده + علوم انسانی
![]() |
---|
علم داده و علوم انسانی دیجیتال - اسکیچنوت توسط @nitya |
علوم انسانی دیجیتال به این صورت تعریف شده است: "مجموعهای از شیوهها و رویکردها که روشهای محاسباتی را با پژوهشهای انسانی ترکیب میکند". پروژههای استنفورد مانند "بازنگری تاریخ" و "تفکر شاعرانه" پیوند بین علوم انسانی دیجیتال و علم داده را نشان میدهند - با تأکید بر تکنیکهایی مانند تحلیل شبکه، مصورسازی اطلاعات، تحلیل فضایی و متنی که میتوانند به ما کمک کنند مجموعه دادههای تاریخی و ادبی را بازنگری کرده و بینشها و دیدگاههای جدیدی به دست آوریم.
میخواهید پروژهای در این حوزه را کاوش و گسترش دهید؟
پروژه "امیلی دیکینسون و وزن احساس" را بررسی کنید - مثالی عالی از جن لوپر که میپرسد چگونه میتوانیم از علم داده برای بازنگری در اشعار آشنا و ارزیابی مجدد معنای آنها و مشارکتهای نویسنده در زمینههای جدید استفاده کنیم. برای مثال، آیا میتوانیم با تحلیل لحن یا احساسات یک شعر، فصل نگارش آن را پیشبینی کنیم - و این موضوع چه چیزی درباره حالت ذهنی نویسنده در دوره مربوطه به ما میگوید؟
برای پاسخ به این سؤال، مراحل چرخه عمر علم داده را دنبال میکنیم:
جمعآوری داده
- برای جمعآوری یک مجموعه داده مرتبط برای تحلیل. گزینهها شامل استفاده از یک API (مانند Poetry DB API) یا خزش صفحات وب (مانند پروژه گوتنبرگ) با استفاده از ابزارهایی مانند Scrapy است.پاکسازی داده
- توضیح میدهد که چگونه متن میتواند با استفاده از ابزارهای سادهای مانند Visual Studio Code و Microsoft Excel قالببندی، بهینهسازی و ساده شود.تحلیل داده
- توضیح میدهد که چگونه میتوانیم اکنون مجموعه داده را برای تحلیل با استفاده از بستههای پایتون (مانند pandas، numpy و matplotlib) وارد "دفترچهها" کنیم تا دادهها را سازماندهی و مصور کنیم.تحلیل احساسات
- توضیح میدهد که چگونه میتوانیم خدمات ابری مانند Text Analytics را با استفاده از ابزارهای کمکد مانند Power Automate برای جریانهای کاری پردازش داده خودکار ادغام کنیم.
با استفاده از این جریان کاری، میتوانیم تأثیرات فصلی بر احساسات اشعار را بررسی کنیم و به ما کمک کنیم دیدگاههای خود را درباره نویسنده شکل دهیم. خودتان امتحان کنید - سپس دفترچه را گسترش دهید تا سؤالات دیگری بپرسید یا دادهها را به روشهای جدید مصور کنید!
میتوانید از برخی ابزارهای موجود در جعبهابزار علوم انسانی دیجیتال برای پیگیری این مسیرهای تحقیقاتی استفاده کنید.
علم داده + پایداری
![]() |
---|
علم داده و پایداری - اسکیچنوت توسط @nitya |
دستور کار ۲۰۳۰ برای توسعه پایدار - که در سال ۲۰۱۵ توسط تمام اعضای سازمان ملل متحد تصویب شد - ۱۷ هدف را شناسایی میکند که شامل اهدافی برای حفاظت از سیاره در برابر تخریب و تأثیر تغییرات اقلیمی است. ابتکار پایداری مایکروسافت از این اهداف حمایت میکند و راههایی را بررسی میکند که راهحلهای فناوری میتوانند آیندههای پایدارتر را پشتیبانی و ایجاد کنند، با تمرکز بر ۴ هدف - کربن منفی، آب مثبت، بدون زباله و تنوع زیستی تا سال ۲۰۳۰.
مقابله با این چالشها به صورت مقیاسپذیر و بهموقع نیازمند تفکر در مقیاس ابری و دادههای بزرگ است. ابتکار کامپیوتر سیارهای ۴ مؤلفه را برای کمک به دانشمندان داده و توسعهدهندگان در این تلاش ارائه میدهد:
- کاتالوگ داده - با پتابایتهایی از دادههای سیستمهای زمین (رایگان و میزبانیشده در Azure).
- API سیارهای - برای کمک به کاربران در جستجوی دادههای مرتبط در فضا و زمان.
- هاب - محیط مدیریتشده برای دانشمندان برای پردازش مجموعه دادههای عظیم جغرافیایی.
- برنامهها - نمایش موارد استفاده و ابزارهایی برای بینشهای پایداری. پروژه کامپیوتر سیارهای در حال حاضر در مرحله پیشنمایش است (از سپتامبر 2021) - در اینجا نحوه شروع مشارکت در راهحلهای پایداری با استفاده از علم داده آورده شده است.
- درخواست دسترسی برای شروع کاوش و ارتباط با همتایان.
- کاوش مستندات برای درک مجموعه دادهها و APIهای پشتیبانیشده.
- برنامههایی مانند پایش اکوسیستم را برای الهام گرفتن از ایدههای کاربردی بررسی کنید.
به این فکر کنید که چگونه میتوانید از تجسم دادهها برای آشکار کردن یا تقویت بینشهای مرتبط در زمینههایی مانند تغییرات اقلیمی و جنگلزدایی استفاده کنید. یا به این فکر کنید که چگونه میتوان از این بینشها برای ایجاد تجربیات کاربری جدید استفاده کرد که تغییرات رفتاری را برای زندگی پایدارتر انگیزه میبخشد.
علم داده + دانشجویان
ما درباره کاربردهای دنیای واقعی در صنعت و پژوهش صحبت کردهایم و نمونههایی از کاربردهای علم داده در علوم انسانی دیجیتال و پایداری را بررسی کردهایم. حالا چگونه میتوانید مهارتهای خود را بسازید و تخصص خود را به عنوان مبتدیان علم داده به اشتراک بگذارید؟
در اینجا چند نمونه از پروژههای دانشجویی علم داده برای الهام گرفتن آورده شده است.
- مدرسه تابستانی علم داده MSR با پروژههای گیتهاب که موضوعاتی مانند موارد زیر را بررسی میکنند:
- دیجیتالی کردن فرهنگ مادی: بررسی توزیعهای اجتماعی-اقتصادی در سیرکاپ - از اورنلا آلتونیان و تیمش در کلرمونت، با استفاده از ArcGIS StoryMaps.
🚀 چالش
به دنبال مقالاتی بگردید که پروژههای علم داده مناسب برای مبتدیان را توصیه میکنند - مانند این 50 حوزه موضوعی یا این 21 ایده پروژه یا این 16 پروژه با کد منبع که میتوانید آنها را تجزیه و تحلیل و بازسازی کنید. و فراموش نکنید که درباره سفرهای یادگیری خود وبلاگ بنویسید و بینشهای خود را با همه ما به اشتراک بگذارید.
آزمون پس از سخنرانی
مرور و مطالعه شخصی
میخواهید موارد استفاده بیشتری را بررسی کنید؟ در اینجا چند مقاله مرتبط آورده شده است:
- 17 کاربرد و مثال علم داده - جولای 2021
- 11 کاربرد شگفتانگیز علم داده در دنیای واقعی - مه 2021
- علم داده در دنیای واقعی - مجموعه مقالات
- علم داده در: آموزش، کشاورزی، مالی، فیلمها و موارد دیگر.
تکلیف
یک مجموعه داده از کامپیوتر سیارهای را بررسی کنید
سلب مسئولیت:
این سند با استفاده از سرویس ترجمه هوش مصنوعی Co-op Translator ترجمه شده است. در حالی که ما تلاش میکنیم دقت را حفظ کنیم، لطفاً توجه داشته باشید که ترجمههای خودکار ممکن است حاوی خطاها یا نادرستیهایی باشند. سند اصلی به زبان اصلی آن باید به عنوان منبع معتبر در نظر گرفته شود. برای اطلاعات حساس، ترجمه حرفهای انسانی توصیه میشود. ما هیچ مسئولیتی در قبال سوءتفاهمها یا تفسیرهای نادرست ناشی از استفاده از این ترجمه نداریم.