You can not select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.
ML-For-Beginners/translations/fa/9-Real-World/1-Applications/README.md

23 KiB

پس‌نوشت: یادگیری ماشین در دنیای واقعی

خلاصه‌ای از یادگیری ماشین در دنیای واقعی در یک اسکچ‌نوت

اسکچ‌نوت توسط Tomomi Imura

در این دوره آموزشی، شما روش‌های مختلفی برای آماده‌سازی داده‌ها جهت آموزش و ایجاد مدل‌های یادگیری ماشین آموختید. شما مجموعه‌ای از مدل‌های کلاسیک رگرسیون، خوشه‌بندی، طبقه‌بندی، پردازش زبان طبیعی و سری‌های زمانی را ساختید. تبریک! حالا ممکن است از خود بپرسید که هدف از این همه چیست... کاربردهای واقعی این مدل‌ها چیست؟

در حالی که علاقه زیادی در صنعت به هوش مصنوعی، که معمولاً از یادگیری عمیق استفاده می‌کند، وجود دارد، هنوز هم کاربردهای ارزشمندی برای مدل‌های کلاسیک یادگیری ماشین وجود دارد. ممکن است حتی برخی از این کاربردها را امروز استفاده کنید! در این درس، بررسی خواهید کرد که چگونه هشت صنعت و حوزه مختلف از این نوع مدل‌ها برای بهبود عملکرد، قابلیت اطمینان، هوشمندی و ارزشمندی برنامه‌هایشان برای کاربران استفاده می‌کنند.

پیش‌آزمون درس

💰 امور مالی

بخش مالی فرصت‌های زیادی برای یادگیری ماشین ارائه می‌دهد. بسیاری از مشکلات در این حوزه به خوبی با استفاده از یادگیری ماشین مدل‌سازی و حل می‌شوند.

تشخیص تقلب در کارت‌های اعتباری

ما قبلاً در این دوره درباره خوشه‌بندی k-means یاد گرفتیم، اما چگونه می‌توان از آن برای حل مشکلات مربوط به تقلب در کارت‌های اعتباری استفاده کرد؟

خوشه‌بندی k-means در تکنیکی برای تشخیص تقلب در کارت‌های اعتباری به نام تشخیص نقاط دورافتاده بسیار مفید است. نقاط دورافتاده، یا انحرافات در مشاهدات مربوط به مجموعه‌ای از داده‌ها، می‌توانند به ما بگویند که آیا یک کارت اعتباری به صورت عادی استفاده می‌شود یا اتفاق غیرعادی رخ داده است. همان‌طور که در مقاله زیر نشان داده شده است، می‌توانید داده‌های کارت اعتباری را با استفاده از الگوریتم خوشه‌بندی k-means مرتب کنید و هر تراکنش را بر اساس میزان دورافتادگی آن به یک خوشه اختصاص دهید. سپس می‌توانید خوشه‌های پرریسک‌تر را برای تراکنش‌های تقلبی یا قانونی ارزیابی کنید. منبع

مدیریت ثروت

در مدیریت ثروت، یک فرد یا شرکت سرمایه‌گذاری‌ها را به نمایندگی از مشتریان خود مدیریت می‌کند. وظیفه آن‌ها حفظ و رشد ثروت در بلندمدت است، بنابراین انتخاب سرمایه‌گذاری‌هایی که عملکرد خوبی دارند ضروری است.

یکی از روش‌های ارزیابی عملکرد یک سرمایه‌گذاری خاص استفاده از رگرسیون آماری است. رگرسیون خطی ابزاری ارزشمند برای درک نحوه عملکرد یک صندوق نسبت به یک معیار است. همچنین می‌توانیم نتیجه‌گیری کنیم که آیا نتایج رگرسیون از نظر آماری معنادار هستند یا اینکه چقدر بر سرمایه‌گذاری‌های مشتری تأثیر می‌گذارند. حتی می‌توانید تحلیل خود را با استفاده از رگرسیون چندگانه گسترش دهید، جایی که عوامل خطر اضافی می‌توانند در نظر گرفته شوند. برای مثال نحوه عملکرد این روش برای یک صندوق خاص، مقاله زیر را درباره ارزیابی عملکرد صندوق با استفاده از رگرسیون بررسی کنید. منبع

🎓 آموزش

بخش آموزش نیز حوزه‌ای بسیار جالب است که می‌توان یادگیری ماشین را در آن به کار برد. مشکلات جالبی برای حل وجود دارند، مانند تشخیص تقلب در آزمون‌ها یا مقالات و مدیریت تعصب، چه عمدی و چه غیرعمدی، در فرآیند تصحیح.

پیش‌بینی رفتار دانش‌آموزان

Coursera، یک ارائه‌دهنده دوره‌های آنلاین باز، یک وبلاگ فنی عالی دارد که در آن بسیاری از تصمیمات مهندسی را مورد بحث قرار می‌دهد. در این مطالعه موردی، آن‌ها یک خط رگرسیون را ترسیم کردند تا هرگونه ارتباط بین امتیاز پایین NPS (Net Promoter Score) و حفظ یا ترک دوره را بررسی کنند. منبع

کاهش تعصب

Grammarly، یک دستیار نوشتاری که خطاهای املایی و گرامری را بررسی می‌کند، از سیستم‌های پیشرفته پردازش زبان طبیعی در محصولات خود استفاده می‌کند. آن‌ها یک مطالعه موردی جالب در وبلاگ فنی خود منتشر کردند که در آن نحوه مقابله با تعصب جنسیتی در یادگیری ماشین را توضیح دادند، که شما در درس مقدمه‌ای بر عدالت ما درباره آن یاد گرفتید. منبع

👜 خرده‌فروشی

بخش خرده‌فروشی قطعاً می‌تواند از استفاده یادگیری ماشین بهره‌مند شود، از ایجاد تجربه بهتر برای مشتری گرفته تا مدیریت بهینه موجودی.

شخصی‌سازی سفر مشتری

در Wayfair، شرکتی که کالاهای خانگی مانند مبلمان می‌فروشد، کمک به مشتریان برای یافتن محصولات مناسب برای سلیقه و نیازهایشان بسیار مهم است. در این مقاله، مهندسان شرکت توضیح می‌دهند که چگونه از یادگیری ماشین و پردازش زبان طبیعی برای "نمایش نتایج مناسب برای مشتریان" استفاده می‌کنند. به طور خاص، موتور هدف‌گذاری پرس‌وجو آن‌ها برای استخراج موجودیت‌ها، آموزش طبقه‌بندی‌کننده‌ها، استخراج دارایی‌ها و نظرات، و برچسب‌گذاری احساسات در بررسی‌های مشتری ساخته شده است. این یک مورد استفاده کلاسیک از نحوه عملکرد NLP در خرده‌فروشی آنلاین است. منبع

مدیریت موجودی

شرکت‌های نوآور و چابک مانند StitchFix، یک سرویس جعبه که لباس به مصرف‌کنندگان ارسال می‌کند، به شدت به یادگیری ماشین برای توصیه‌ها و مدیریت موجودی متکی هستند. تیم‌های استایلینگ آن‌ها با تیم‌های خرید همکاری می‌کنند، در واقع: "یکی از دانشمندان داده ما با یک الگوریتم ژنتیکی کار کرد و آن را به پوشاک اعمال کرد تا پیش‌بینی کند که چه قطعه‌ای از لباس که امروز وجود ندارد موفق خواهد بود. ما آن را به تیم خرید ارائه دادیم و اکنون آن‌ها می‌توانند از آن به عنوان یک ابزار استفاده کنند." منبع

🏥 مراقبت‌های بهداشتی

بخش مراقبت‌های بهداشتی می‌تواند از یادگیری ماشین برای بهینه‌سازی وظایف تحقیقاتی و همچنین مشکلات لجستیکی مانند پذیرش مجدد بیماران یا جلوگیری از گسترش بیماری‌ها استفاده کند.

مدیریت آزمایش‌های بالینی

سمیت در آزمایش‌های بالینی یک نگرانی عمده برای سازندگان دارو است. چه مقدار سمیت قابل تحمل است؟ در این مطالعه، تجزیه و تحلیل روش‌های مختلف آزمایش بالینی منجر به توسعه یک رویکرد جدید برای پیش‌بینی احتمال نتایج آزمایش‌های بالینی شد. به طور خاص، آن‌ها توانستند از جنگل تصادفی برای تولید یک طبقه‌بندی‌کننده استفاده کنند که قادر به تمایز بین گروه‌های دارویی است. منبع

مدیریت پذیرش مجدد بیمارستان

مراقبت بیمارستانی هزینه‌بر است، به ویژه زمانی که بیماران مجبور به پذیرش مجدد شوند. این مقاله شرکتی را مورد بحث قرار می‌دهد که از یادگیری ماشین برای پیش‌بینی احتمال پذیرش مجدد با استفاده از الگوریتم‌های خوشه‌بندی استفاده می‌کند. این خوشه‌ها به تحلیل‌گران کمک می‌کنند تا "گروه‌هایی از پذیرش‌های مجدد را کشف کنند که ممکن است علت مشترکی داشته باشند." منبع

مدیریت بیماری‌ها

همه‌گیری اخیر توجه زیادی به روش‌هایی که یادگیری ماشین می‌تواند در جلوگیری از گسترش بیماری کمک کند، جلب کرده است. در این مقاله، شما استفاده از ARIMA، منحنی‌های لجستیک، رگرسیون خطی و SARIMA را خواهید شناخت. "این کار تلاشی است برای محاسبه نرخ گسترش این ویروس و در نتیجه پیش‌بینی مرگ‌ها، بهبودی‌ها و موارد تأیید شده، تا بتوانیم بهتر آماده شویم و زنده بمانیم." منبع

🌲 اکولوژی و فناوری سبز

طبیعت و اکولوژی شامل بسیاری از سیستم‌های حساس است که تعامل بین حیوانات و طبیعت را در کانون توجه قرار می‌دهد. مهم است که بتوان این سیستم‌ها را به دقت اندازه‌گیری کرد و در صورت وقوع اتفاقی، مانند آتش‌سوزی جنگل یا کاهش جمعیت حیوانات، به درستی عمل کرد.

مدیریت جنگل

شما در درس‌های قبلی درباره یادگیری تقویتی یاد گرفتید. این روش می‌تواند هنگام تلاش برای پیش‌بینی الگوها در طبیعت بسیار مفید باشد. به طور خاص، می‌توان از آن برای ردیابی مشکلات اکولوژیکی مانند آتش‌سوزی جنگل‌ها و گسترش گونه‌های مهاجم استفاده کرد. در کانادا، گروهی از محققان از یادگیری تقویتی برای ساخت مدل‌های دینامیک آتش‌سوزی جنگل از تصاویر ماهواره‌ای استفاده کردند. با استفاده از یک "فرآیند گسترش فضایی (SSP)" نوآورانه، آن‌ها آتش‌سوزی جنگل را به عنوان "عامل در هر سلول در چشم‌انداز" تصور کردند. "مجموعه اقدامات آتش در هر مکان در هر لحظه شامل گسترش به شمال، جنوب، شرق یا غرب یا عدم گسترش است."

این رویکرد تنظیم معمول RL را معکوس می‌کند زیرا دینامیک فرآیند تصمیم‌گیری مارکوف (MDP) مربوطه یک تابع شناخته شده برای گسترش فوری آتش‌سوزی است." درباره الگوریتم‌های کلاسیک استفاده شده توسط این گروه در لینک زیر بیشتر بخوانید. منبع

حسگر حرکت حیوانات

در حالی که یادگیری عمیق انقلابی در ردیابی بصری حرکات حیوانات ایجاد کرده است (می‌توانید ردیاب خرس قطبی خود را بسازید اینجا)، یادگیری ماشین کلاسیک هنوز جایگاهی در این وظیفه دارد.

حسگرها برای ردیابی حرکات حیوانات مزرعه و اینترنت اشیا از این نوع پردازش بصری استفاده می‌کنند، اما تکنیک‌های یادگیری ماشین پایه‌تر برای پیش‌پردازش داده‌ها مفید هستند. به عنوان مثال، در این مقاله، وضعیت‌های گوسفندان با استفاده از الگوریتم‌های مختلف طبقه‌بندی‌کننده نظارت و تحلیل شدند. ممکن است منحنی ROC در صفحه 335 را بشناسید. منبع

مدیریت انرژی

در درس‌های ما درباره پیش‌بینی سری‌های زمانی، مفهوم پارکینگ‌های هوشمند برای تولید درآمد برای یک شهر بر اساس درک عرضه و تقاضا مطرح شد. این مقاله به تفصیل بحث می‌کند که چگونه خوشه‌بندی، رگرسیون و پیش‌بینی سری‌های زمانی ترکیب شدند تا به پیش‌بینی استفاده آینده از انرژی در ایرلند، بر اساس اندازه‌گیری‌های هوشمند، کمک کنند. منبع

💼 بیمه

بخش بیمه یکی دیگر از بخش‌هایی است که از یادگیری ماشین برای ساخت و بهینه‌سازی مدل‌های مالی و اکچوئری استفاده می‌کند.

مدیریت نوسانات

MetLife، یک ارائه‌دهنده بیمه عمر، در مورد نحوه تحلیل و کاهش نوسانات در مدل‌های مالی خود شفاف است. در این مقاله، شما تجسم‌های طبقه‌بندی باینری و ترتیبی را مشاهده خواهید کرد. همچنین تجسم‌های پیش‌بینی را کشف خواهید کرد. منبع

🎨 هنر، فرهنگ و ادبیات

در هنر، به عنوان مثال در روزنامه‌نگاری، مشکلات جالب زیادی وجود دارند. تشخیص اخبار جعلی یک مشکل بزرگ است زیرا ثابت شده است که می‌تواند بر نظر مردم تأثیر بگذارد و حتی دموکراسی‌ها را سرنگون کند. موزه‌ها نیز می‌توانند از یادگیری ماشین در همه چیز از یافتن ارتباط بین آثار تا برنامه‌ریزی منابع بهره‌مند شوند.

تشخیص اخبار جعلی

تشخیص اخبار جعلی به یک بازی موش و گربه در رسانه‌های امروز تبدیل شده است. در این مقاله، محققان پیشنهاد می‌کنند که یک سیستم ترکیبی از چندین تکنیک یادگیری ماشین که ما مطالعه کرده‌ایم آزمایش شود و بهترین مدل به کار گرفته شود: "این سیستم بر اساس پردازش زبان طبیعی برای استخراج ویژگی‌ها از داده‌ها است و سپس این ویژگی‌ها برای آموزش طبقه‌بندی‌کننده‌های یادگیری ماشین مانند Naive Bayes، Support Vector Machine (SVM)، Random Forest (RF)، Stochastic Gradient Descent (SGD)، و Logistic Regression(LR) استفاده می‌شوند." منبع

این مقاله نشان می‌دهد که چگونه ترکیب حوزه‌های مختلف یادگیری ماشین می‌تواند نتایج جالبی تولید کند که به جلوگیری از گسترش اخبار جعلی و ایجاد آسیب واقعی کمک کند؛ در این مورد، انگیزه گسترش شایعات درباره درمان‌های COVID بود که خشونت جمعی را تحریک کرد.

یادگیری ماشین در موزه‌ها

موزه‌ها در آستانه یک انقلاب هوش مصنوعی هستند که در آن فهرست‌بندی و دیجیتالی کردن مجموعه‌ها و یافتن ارتباط بین آثار آسان‌تر می‌شود زیرا فناوری پیشرفت می‌کند. پروژه‌هایی مانند In Codice Ratio به باز کردن رمز و راز مجموعه‌های غیرقابل دسترس مانند آرشیو واتیکان کمک می‌کنند. اما، جنبه تجاری موزه‌ها نیز از مدل‌های یادگیری ماشین بهره‌مند می‌شود.

به عنوان مثال، مؤسسه هنر شیکاگو مدل‌هایی برای پیش‌بینی اینکه مخاطبان به چه چیزی علاقه دارند و چه زمانی به نمایشگاه‌ها خواهند رفت، ساخته است. هدف ایجاد تجربیات بازدیدکننده فردی و بهینه‌شده در هر بار بازدید کاربر از موزه است. "در سال مالی 2017، مدل حضور و پذیرش را با دقت 1 درصد پیش‌بینی کرد، می‌گوید Andrew Simnick، معاون ارشد مؤسسه هنر." منبع

🏷 بازاریابی

تقسیم‌بندی مشتریان

موثرترین استراتژی‌های بازاریابی مشتریان را به روش‌های مختلف بر اساس گروه‌بندی‌های مختلف هدف قرار می‌دهند. در این مقاله، استفاده از الگوریتم‌های خوشه‌بندی برای حمایت از بازاریابی متمایز مورد بحث قرار گرفته است. بازاریابی متمایز به شرکت‌ها کمک می‌کند تا شناخت برند را بهبود بخشند، به مشتریان بیشتری دست یابند و درآمد بیشتری کسب کنند. منبع

🚀 چالش

یک بخش دیگر را شناسایی کنید که از برخی تکنیک‌هایی که در این دوره آموزشی آموختید بهره‌مند می‌شود و کشف کنید که چگونه از یادگیری ماشین استفاده می‌کند.

آزمون پس از سخنرانی

مرور و مطالعه شخصی

تیم علوم داده Wayfair چندین ویدئوی جالب درباره نحوه استفاده از یادگیری ماشین در شرکت خود دارد. ارزش دارد که نگاهی بیندازید!

تکلیف

یک شکار گنج یادگیری ماشین


سلب مسئولیت:
این سند با استفاده از سرویس ترجمه هوش مصنوعی Co-op Translator ترجمه شده است. در حالی که ما تلاش می‌کنیم دقت را حفظ کنیم، لطفاً توجه داشته باشید که ترجمه‌های خودکار ممکن است شامل خطاها یا نادرستی‌ها باشند. سند اصلی به زبان اصلی آن باید به عنوان منبع معتبر در نظر گرفته شود. برای اطلاعات حساس، توصیه می‌شود از ترجمه حرفه‌ای انسانی استفاده کنید. ما مسئولیتی در قبال سوءتفاهم‌ها یا تفسیرهای نادرست ناشی از استفاده از این ترجمه نداریم.