You can not select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.
Data-Science-For-Beginners/translations/fa/6-Data-Science-In-Wild/20-Real-World-Examples
leestott 0f1def896e
🌐 Update translations via Co-op Translator
2 weeks ago
..
README.md 🌐 Update translations via Co-op Translator 2 weeks ago
assignment.md 🌐 Update translations via Co-op Translator 4 weeks ago

README.md

علم داده در دنیای واقعی

 Sketchnote by (@sketchthedocs)
علم داده در دنیای واقعی - Sketchnote by @nitya

ما تقریباً به پایان این سفر آموزشی رسیده‌ایم!

ما با تعریف‌های علم داده و اخلاق شروع کردیم، ابزارها و تکنیک‌های مختلف برای تحلیل و مصورسازی داده‌ها را بررسی کردیم، چرخه عمر علم داده را مرور کردیم و به مقیاس‌پذیری و خودکارسازی جریان‌های کاری علم داده با خدمات رایانش ابری پرداختیم. بنابراین احتمالاً از خود می‌پرسید: "چطور می‌توانم همه این آموخته‌ها را به زمینه‌های واقعی مرتبط کنم؟"

در این درس، کاربردهای واقعی علم داده در صنعت را بررسی می‌کنیم و به مثال‌های خاص در زمینه‌های تحقیق، علوم انسانی دیجیتال و پایداری می‌پردازیم. همچنین فرصت‌های پروژه‌های دانشجویی را مرور کرده و با منابع مفیدی برای ادامه مسیر یادگیری شما به پایان می‌رسیم!

آزمون پیش از درس

آزمون پیش از درس

علم داده + صنعت

به لطف دموکراتیزه شدن هوش مصنوعی، توسعه‌دهندگان اکنون راحت‌تر می‌توانند تصمیم‌گیری‌های مبتنی بر هوش مصنوعی و بینش‌های مبتنی بر داده را در تجربه‌های کاربری و جریان‌های کاری توسعه ادغام کنند. در اینجا چند مثال از نحوه "کاربرد" علم داده در زمینه‌های واقعی صنعت آورده شده است:

  • Google Flu Trends از علم داده برای ارتباط دادن اصطلاحات جستجو با روندهای آنفولانزا استفاده کرد. اگرچه این روش دارای نقص‌هایی بود، اما آگاهی از امکانات (و چالش‌های) پیش‌بینی‌های بهداشتی مبتنی بر داده را افزایش داد.

  • پیش‌بینی مسیرهای UPS - توضیح می‌دهد که چگونه UPS از علم داده و یادگیری ماشین برای پیش‌بینی مسیرهای بهینه برای تحویل استفاده می‌کند، با در نظر گرفتن شرایط آب و هوایی، الگوهای ترافیکی، مهلت‌های تحویل و موارد دیگر.

  • مصورسازی مسیر تاکسی‌های NYC - داده‌های جمع‌آوری شده با استفاده از قوانین آزادی اطلاعات به مصورسازی یک روز از زندگی تاکسی‌های NYC کمک کرد، و به ما نشان داد که چگونه در شهر شلوغ حرکت می‌کنند، چقدر درآمد دارند و مدت زمان سفرها در هر دوره ۲۴ ساعته چقدر است.

  • محیط کار علم داده Uber - از داده‌های جمع‌آوری شده از میلیون‌ها سفر روزانه Uber (مانند مکان‌های سوار شدن و پیاده شدن، مدت زمان سفر، مسیرهای ترجیحی و غیره) برای ساخت ابزار تحلیل داده استفاده می‌کند که به تصمیم‌گیری‌های مربوط به قیمت‌گذاری، ایمنی، تشخیص تقلب و ناوبری کمک می‌کند.

  • تحلیل‌های ورزشی - بر تحلیل‌های پیش‌بینی‌کننده (تحلیل تیم و بازیکن - مانند Moneyball - و مدیریت طرفداران) و مصورسازی داده‌ها (داشبوردهای تیم و طرفداران، بازی‌ها و غیره) تمرکز دارد، با کاربردهایی مانند استعدادیابی، شرط‌بندی ورزشی و مدیریت موجودی/محل برگزاری.

  • علم داده در بانکداری - ارزش علم داده در صنعت مالی را با کاربردهایی از مدل‌سازی ریسک و تشخیص تقلب گرفته تا تقسیم‌بندی مشتریان، پیش‌بینی‌های لحظه‌ای و سیستم‌های توصیه‌کننده برجسته می‌کند. تحلیل‌های پیش‌بینی‌کننده همچنین اقدامات حیاتی مانند امتیازات اعتباری را هدایت می‌کنند.

  • علم داده در مراقبت‌های بهداشتی - کاربردهایی مانند تصویربرداری پزشکی (مانند MRI، اشعه ایکس، سی‌تی‌اسکن)، ژنومیک (توالی‌یابی DNA)، توسعه دارو (ارزیابی ریسک، پیش‌بینی موفقیت)، تحلیل‌های پیش‌بینی‌کننده (مراقبت از بیمار و لجستیک تامین)، ردیابی و پیشگیری از بیماری و غیره را برجسته می‌کند.

کاربردهای علم داده در دنیای واقعی اعتبار تصویر: Data Flair: 6 Amazing Data Science Applications

این شکل حوزه‌ها و مثال‌های دیگری برای کاربرد تکنیک‌های علم داده را نشان می‌دهد. آیا می‌خواهید کاربردهای دیگری را بررسی کنید؟ بخش مرور و مطالعه خود را در زیر ببینید.

علم داده + تحقیق

 Sketchnote by (@sketchthedocs)
علم داده و تحقیق - Sketchnote by @nitya

در حالی که کاربردهای واقعی اغلب بر موارد استفاده صنعتی در مقیاس بزرگ تمرکز دارند، پروژه‌ها و کاربردهای تحقیقاتی می‌توانند از دو منظر مفید باشند:

  • فرصت‌های نوآوری - بررسی نمونه‌سازی سریع مفاهیم پیشرفته و آزمایش تجربه‌های کاربری برای کاربردهای نسل بعدی.
  • چالش‌های استقرار - تحقیق در مورد آسیب‌های احتمالی یا پیامدهای ناخواسته فناوری‌های علم داده در زمینه‌های واقعی.

برای دانشجویان، این پروژه‌های تحقیقاتی می‌توانند فرصت‌های یادگیری و همکاری فراهم کنند که درک شما از موضوع را بهبود بخشند و آگاهی و تعامل شما با افراد یا تیم‌های مرتبط در حوزه‌های مورد علاقه را گسترش دهند. پس پروژه‌های تحقیقاتی چگونه به نظر می‌رسند و چگونه می‌توانند تأثیرگذار باشند؟

بیایید یک مثال را بررسی کنیم - مطالعه Gender Shades MIT از Joy Buolamwini (MIT Media Labs) با یک مقاله تحقیقاتی برجسته که با همکاری Timnit Gebru (در آن زمان در Microsoft Research) نوشته شده است و بر موارد زیر تمرکز دارد:

  • چه چیزی: هدف پروژه تحقیقاتی ارزیابی تعصب موجود در الگوریتم‌ها و مجموعه داده‌های تحلیل خودکار چهره بر اساس جنسیت و نوع پوست بود.
  • چرا: تحلیل چهره در زمینه‌هایی مانند اجرای قانون، امنیت فرودگاه، سیستم‌های استخدام و موارد دیگر استفاده می‌شود - زمینه‌هایی که طبقه‌بندی‌های نادرست (مثلاً به دلیل تعصب) می‌توانند آسیب‌های اقتصادی و اجتماعی بالقوه‌ای به افراد یا گروه‌های تحت تأثیر وارد کنند. درک (و حذف یا کاهش) تعصب‌ها کلید عدالت در استفاده است.
  • چگونه: محققان تشخیص دادند که معیارهای موجود عمدتاً از افراد با پوست روشن‌تر استفاده می‌کنند و یک مجموعه داده جدید (بیش از ۱۰۰۰ تصویر) ایجاد کردند که متعادل‌تر از نظر جنسیت و نوع پوست بود. این مجموعه داده برای ارزیابی دقت سه محصول طبقه‌بندی جنسیت (از Microsoft، IBM و Face++) استفاده شد.

نتایج نشان داد که اگرچه دقت کلی طبقه‌بندی خوب بود، تفاوت قابل توجهی در نرخ خطا بین گروه‌های مختلف وجود داشت - با اشتباه در جنسیت بیشتر برای زنان یا افراد با پوست تیره‌تر، که نشان‌دهنده تعصب بود.

نتایج کلیدی: آگاهی را افزایش داد که علم داده نیاز به مجموعه داده‌های نماینده‌تر (گروه‌های متعادل) و تیم‌های فراگیرتر (پیشینه‌های متنوع) دارد تا بتوان چنین تعصب‌هایی را زودتر در راه‌حل‌های هوش مصنوعی شناسایی و حذف یا کاهش داد. تلاش‌های تحقیقاتی مانند این همچنین در تعریف اصول و شیوه‌ها برای هوش مصنوعی مسئولانه در بسیاری از سازمان‌ها برای بهبود عدالت در محصولات و فرآیندهای هوش مصنوعی آن‌ها نقش اساسی دارند.

آیا می‌خواهید درباره تلاش‌های تحقیقاتی مرتبط در Microsoft اطلاعات کسب کنید؟

علم داده + علوم انسانی

 Sketchnote by (@sketchthedocs)
علم داده و علوم انسانی دیجیتال - Sketchnote by @nitya

علوم انسانی دیجیتال تعریف شده است به عنوان "مجموعه‌ای از شیوه‌ها و رویکردها که روش‌های محاسباتی را با تحقیق انسانی ترکیب می‌کنند". پروژه‌های Stanford مانند "بازنگری تاریخ" و "تفکر شاعرانه" ارتباط بین علوم انسانی دیجیتال و علم داده را نشان می‌دهند - تأکید بر تکنیک‌هایی مانند تحلیل شبکه، مصورسازی اطلاعات، تحلیل فضایی و متنی که می‌توانند به ما کمک کنند مجموعه داده‌های تاریخی و ادبی را بازنگری کنیم تا بینش‌ها و دیدگاه‌های جدیدی به دست آوریم.

آیا می‌خواهید پروژه‌ای در این زمینه را بررسی و گسترش دهید؟

پروژه "امیلی دیکینسون و وزن احساسات" را بررسی کنید - یک مثال عالی از Jen Looper که می‌پرسد چگونه می‌توانیم از علم داده برای بازنگری در شعرهای آشنا و ارزیابی مجدد معنای آن‌ها و مشارکت‌های نویسنده در زمینه‌های جدید استفاده کنیم. برای مثال، آیا می‌توانیم فصل سرودن یک شعر را با تحلیل لحن یا احساسات آن پیش‌بینی کنیم - و این چه چیزی درباره حالت ذهن نویسنده در دوره مربوطه به ما می‌گوید؟

برای پاسخ به این سوال، مراحل چرخه عمر علم داده را دنبال می‌کنیم:

  • جمع‌آوری داده‌ها - برای جمع‌آوری مجموعه داده‌های مرتبط برای تحلیل. گزینه‌ها شامل استفاده از API (مانند Poetry DB API) یا استخراج صفحات وب (مانند Project Gutenberg) با استفاده از ابزارهایی مانند Scrapy.
  • پاک‌سازی داده‌ها - توضیح می‌دهد که چگونه متن می‌تواند با ابزارهای ساده‌ای مانند Visual Studio Code و Microsoft Excel قالب‌بندی، بهینه‌سازی و ساده شود.
  • تحلیل داده‌ها - توضیح می‌دهد که چگونه می‌توانیم اکنون مجموعه داده را برای تحلیل وارد "دفترچه‌ها" کنیم و با استفاده از بسته‌های پایتون (مانند pandas، numpy و matplotlib) داده‌ها را سازماندهی و مصورسازی کنیم.
  • تحلیل احساسات - توضیح می‌دهد که چگونه می‌توانیم خدمات ابری مانند Text Analytics را با استفاده از ابزارهای کم‌کد مانند Power Automate برای جریان‌های کاری پردازش داده خودکار ادغام کنیم.

با استفاده از این جریان کاری، می‌توانیم تأثیرات فصلی بر احساسات شعرها را بررسی کنیم و به ما کمک کنیم دیدگاه‌های خود را درباره نویسنده شکل دهیم. خودتان امتحان کنید - سپس دفترچه را گسترش دهید تا سوالات دیگری بپرسید یا داده‌ها را به روش‌های جدید مصورسازی کنید!

می‌توانید از برخی ابزارهای موجود در جعبه ابزار علوم انسانی دیجیتال برای دنبال کردن این مسیرهای تحقیقاتی استفاده کنید.

علم داده + پایداری

 Sketchnote by (@sketchthedocs)
علم داده و پایداری - Sketchnote by @nitya

دستور کار ۲۰۳۰ برای توسعه پایدار - که توسط همه اعضای سازمان ملل در سال ۲۰۱۵ تصویب شد - ۱۷ هدف را شناسایی می‌کند، از جمله اهدافی که بر حفاظت از سیاره در برابر تخریب و تأثیر تغییرات اقلیمی تمرکز دارند. ابتکار پایداری Microsoft از این اهداف حمایت می‌کند و راه‌هایی را بررسی می‌کند که راه‌حل‌های فناوری می‌توانند آینده‌های پایدارتر را پشتیبانی و ایجاد کنند، با تمرکز بر ۴ هدف - کربن منفی، آب مثبت، صفر زباله و تنوع زیستی تا سال ۲۰۳۰.

مقابله با این چالش‌ها به صورت مقیاس‌پذیر و به موقع نیازمند تفکر در مقیاس ابری - و داده‌های بزرگ است. ابتکار Planetary Computer ۴ مؤلفه را برای کمک به دانشمندان داده و توسعه‌دهندگان در این تلاش ارائه می‌دهد:

  • کاتالوگ داده‌ها - با پتابایت‌های داده‌های سیستم‌های زمین (رایگان و میزبانی شده در Azure).

  • API سیاره‌ای - برای کمک به کاربران در جستجوی داده‌های مرتبط در سراسر فضا و زمان.

  • مرکز - محیط مدیریت شده برای دانشمندان برای پردازش مجموعه داده‌های عظیم جغرافیایی.

  • برنامه‌ها - نمایش موارد استفاده و ابزارهایی برای بینش‌های پایداری. پروژه کامپیوتر سیاره‌ای در حال حاضر در مرحله پیش‌نمایش است (از سپتامبر 2021) - در اینجا نحوه شروع مشارکت در راه‌حل‌های پایداری با استفاده از علم داده توضیح داده شده است.

  • درخواست دسترسی برای شروع کاوش و ارتباط با همتایان.

  • کاوش مستندات برای درک مجموعه داده‌ها و APIهای پشتیبانی‌شده.

  • برنامه‌هایی مانند پایش اکوسیستم را برای الهام گرفتن از ایده‌های کاربردی بررسی کنید.

به این فکر کنید که چگونه می‌توانید از تجسم داده‌ها برای آشکار کردن یا تقویت بینش‌های مرتبط در زمینه‌هایی مانند تغییرات اقلیمی و جنگل‌زدایی استفاده کنید. یا به این فکر کنید که چگونه می‌توان از این بینش‌ها برای ایجاد تجربیات جدید کاربری که تغییرات رفتاری را برای زندگی پایدارتر انگیزه می‌دهد، استفاده کرد.

علم داده + دانشجویان

ما درباره کاربردهای واقعی در صنعت و پژوهش صحبت کرده‌ایم و نمونه‌هایی از کاربرد علم داده در علوم انسانی دیجیتال و پایداری را بررسی کرده‌ایم. حالا چگونه می‌توانید مهارت‌های خود را توسعه دهید و تخصص خود را به عنوان مبتدیان علم داده به اشتراک بگذارید؟

در اینجا چند نمونه از پروژه‌های دانشجویی علم داده برای الهام گرفتن آورده شده است:

🚀 چالش

مقالات را جستجو کنید که پروژه‌های علم داده مناسب برای مبتدیان را توصیه می‌کنند - مانند این 50 موضوع یا این 21 ایده پروژه یا این 16 پروژه با کد منبع که می‌توانید آن‌ها را تجزیه و تحلیل کنید و دوباره ترکیب کنید. و فراموش نکنید که درباره سفرهای یادگیری خود وبلاگ بنویسید و بینش‌های خود را با همه ما به اشتراک بگذارید.

آزمون پس از سخنرانی

آزمون پس از سخنرانی

مرور و مطالعه خودآموز

می‌خواهید موارد استفاده بیشتری را بررسی کنید؟ در اینجا چند مقاله مرتبط آورده شده است:

تکلیف

یک مجموعه داده کامپیوتر سیاره‌ای را بررسی کنید


سلب مسئولیت:
این سند با استفاده از سرویس ترجمه هوش مصنوعی Co-op Translator ترجمه شده است. در حالی که ما تلاش می‌کنیم دقت را حفظ کنیم، لطفاً توجه داشته باشید که ترجمه‌های خودکار ممکن است شامل خطاها یا نادرستی‌ها باشند. سند اصلی به زبان اصلی آن باید به عنوان منبع معتبر در نظر گرفته شود. برای اطلاعات حساس، توصیه می‌شود از ترجمه حرفه‌ای انسانی استفاده کنید. ما مسئولیتی در قبال سوء تفاهم‌ها یا تفسیرهای نادرست ناشی از استفاده از این ترجمه نداریم.