23 KiB
Постскриптум: Машинне навчання у реальному світі
Скетчноут від Tomomi Imura
У цьому курсі ви дізналися багато способів підготовки даних для навчання та створення моделей машинного навчання. Ви побудували серію класичних моделей регресії, кластеризації, класифікації, обробки природної мови та аналізу часових рядів. Вітаємо! Тепер ви, можливо, замислюєтеся, для чого це все... які реальні застосування цих моделей?
Хоча в індустрії багато уваги приділяється штучному інтелекту, який зазвичай використовує глибоке навчання, класичні моделі машинного навчання також мають цінні застосування. Ви навіть можете використовувати деякі з них уже сьогодні! У цьому уроці ви дізнаєтеся, як вісім різних галузей та предметних сфер використовують ці моделі, щоб зробити свої додатки більш ефективними, надійними, інтелектуальними та корисними для користувачів.
Тест перед лекцією
💰 Фінанси
Фінансовий сектор пропонує багато можливостей для машинного навчання. Багато задач у цій галузі можна моделювати та вирішувати за допомогою ML.
Виявлення шахрайства з кредитними картками
Ми вивчали кластеризацію методом k-середніх раніше в курсі, але як її можна використовувати для вирішення проблем, пов'язаних із шахрайством з кредитними картками?
Метод k-середніх корисний у техніці виявлення шахрайства, яка називається виявленням аномалій. Аномалії, або відхилення в спостереженнях за набором даних, можуть показати, чи використовується кредитна картка у звичайному режимі, чи відбувається щось незвичайне. Як показано в статті за посиланням нижче, ви можете сортувати дані кредитних карток за допомогою алгоритму кластеризації k-середніх і призначати кожну транзакцію до кластера залежно від того, наскільки вона є аномальною. Потім можна оцінити найбільш ризиковані кластери для визначення шахрайських або легітимних транзакцій.
Джерело
Управління капіталом
Управління капіталом передбачає, що особа або компанія керує інвестиціями від імені своїх клієнтів. Їхнє завдання — зберігати та примножувати капітал у довгостроковій перспективі, тому важливо обирати інвестиції, які добре себе проявляють.
Один зі способів оцінити ефективність інвестиції — це статистична регресія. Лінійна регресія є цінним інструментом для розуміння того, як фонд працює відносно певного еталону. Ми також можемо визначити, чи є результати регресії статистично значущими, або наскільки вони вплинуть на інвестиції клієнта. Ви навіть можете розширити аналіз за допомогою множинної регресії, враховуючи додаткові фактори ризику. Для прикладу того, як це працює для конкретного фонду, ознайомтеся зі статтею нижче про оцінку ефективності фонду за допомогою регресії.
Джерело
🎓 Освіта
Освітній сектор також є дуже цікавим напрямком для застосування ML. Тут можна вирішувати цікаві задачі, такі як виявлення шахрайства під час тестів або есе, а також управління упередженнями, свідомими чи несвідомими, у процесі оцінювання.
Прогнозування поведінки студентів
Coursera, провайдер онлайн-курсів, має чудовий технічний блог, де вони обговорюють багато інженерних рішень. У цьому кейсі вони побудували лінію регресії, щоб дослідити кореляцію між низьким рейтингом NPS (Net Promoter Score) і утриманням студентів або їх відсівом.
Джерело
Зменшення упереджень
Grammarly, помічник для перевірки правопису та граматики, використовує складні системи обробки природної мови у своїх продуктах. У своєму технічному блозі вони опублікували цікавий кейс про те, як вони боролися з гендерними упередженнями в машинному навчанні, про що ви дізналися у нашому вступному уроці про справедливість.
Джерело
👜 Роздрібна торгівля
Роздрібна торгівля може значно виграти від використання ML, починаючи від створення кращого клієнтського досвіду до оптимального управління запасами.
Персоналізація клієнтського шляху
У Wayfair, компанії, що продає товари для дому, допомога клієнтам у пошуку відповідних продуктів є пріоритетом. У цій статті інженери компанії описують, як вони використовують ML і NLP для "підбору правильних результатів для клієнтів". Зокрема, їхній Query Intent Engine використовує вилучення сутностей, навчання класифікаторів, вилучення активів і думок, а також тегування настроїв у відгуках клієнтів. Це класичний приклад використання NLP в онлайн-роздрібній торгівлі.
Джерело
Управління запасами
Інноваційні компанії, такі як StitchFix, сервіс коробкових поставок одягу, значною мірою покладаються на ML для рекомендацій і управління запасами. Їхні стилісти співпрацюють із командами мерчандайзингу: "один із наших дата-сайєнтистів експериментував із генетичним алгоритмом і застосував його до одягу, щоб передбачити, який одяг буде успішним, хоча ще не існує. Ми передали це команді мерчандайзингу, і тепер вони можуть використовувати це як інструмент".
Джерело
🏥 Охорона здоров'я
Сектор охорони здоров'я може використовувати ML для оптимізації дослідницьких завдань, а також для вирішення логістичних проблем, таких як повторна госпіталізація пацієнтів або зупинка поширення хвороб.
Управління клінічними випробуваннями
Токсичність у клінічних випробуваннях є серйозною проблемою для виробників ліків. Скільки токсичності є допустимим? У цьому дослідженні аналіз різних методів клінічних випробувань привів до розробки нового підходу для прогнозування результатів клінічних випробувань. Зокрема, вони змогли використати random forest для створення класифікатора, який розрізняє групи ліків.
Джерело
Управління повторними госпіталізаціями
Госпіталізація є дорогою, особливо коли пацієнтів доводиться госпіталізувати повторно. У цій статті обговорюється компанія, яка використовує ML для прогнозування ймовірності повторної госпіталізації за допомогою кластеризації. Ці кластери допомагають аналітикам "виявляти групи повторних госпіталізацій, які можуть мати спільну причину".
Джерело
Управління хворобами
Нещодавня пандемія яскраво продемонструвала, як машинне навчання може допомогти зупинити поширення хвороб. У цій статті ви побачите використання ARIMA, логістичних кривих, лінійної регресії та SARIMA. "Ця робота є спробою розрахувати темпи поширення цього вірусу та, таким чином, передбачити кількість смертей, одужань і підтверджених випадків, щоб допомогти нам краще підготуватися та вижити".
Джерело
🌲 Екологія та зелена енергетика
Природа та екологія складаються з багатьох чутливих систем, де взаємодія між тваринами та природою виходить на перший план. Важливо точно вимірювати ці системи та діяти відповідно, якщо щось трапляється, наприклад, лісова пожежа або зменшення популяції тварин.
Управління лісами
Ви вивчали підкріплювальне навчання у попередніх уроках. Воно може бути дуже корисним для прогнозування природних явищ. Зокрема, його можна використовувати для відстеження екологічних проблем, таких як лісові пожежі та поширення інвазивних видів. У Канаді група дослідників використала підкріплювальне навчання для створення моделей динаміки лісових пожеж на основі супутникових знімків. Використовуючи інноваційний "процес просторового поширення (SSP)", вони уявили лісову пожежу як "агента в будь-якій клітинці ландшафту".
Джерело
Відстеження руху тварин
Хоча глибоке навчання створило революцію у візуальному відстеженні руху тварин (ви можете створити власний трекер полярних ведмедів тут), класичне ML все ще має своє місце в цьому завданні.
Датчики для відстеження руху сільськогосподарських тварин та IoT використовують цей тип візуальної обробки, але більш базові техніки ML корисні для попередньої обробки даних. Наприклад, у цій статті аналізувалися пози вівців за допомогою різних алгоритмів класифікації. Ви можете впізнати ROC-криву на сторінці 335.
Джерело
⚡️ Управління енергетикою
У наших уроках про прогнозування часових рядів ми розглядали концепцію розумних паркувальних лічильників для генерації доходу для міста на основі розуміння попиту та пропозиції. У цій статті детально обговорюється, як кластеризація, регресія та прогнозування часових рядів допомогли передбачити майбутнє споживання енергії в Ірландії на основі даних розумних лічильників.
Джерело
💼 Страхування
Сектор страхування також використовує ML для створення та оптимізації фінансових і актуарних моделей.
Управління волатильністю
MetLife, постачальник страхування життя, відкрито розповідає про те, як вони аналізують і зменшують волатильність у своїх фінансових моделях. У цій статті ви побачите візуалізації бінарної та порядкової класифікації, а також прогнозування.
Джерело
🎨 Мистецтво, культура та література
У мистецтві, наприклад у журналістиці, існує багато цікавих задач. Виявлення фейкових новин є великою проблемою, оскільки доведено, що вони впливають на думку людей і навіть можуть підривати демократії. Музеї також можуть отримати користь від використання ML у всьому, від пошуку зв'язків між артефактами до планування ресурсів.
Виявлення фейкових новин
Виявлення фейкових новин стало грою в кішки-мишки в сучасних медіа. У цій статті дослідники пропонують систему, яка поєднує кілька технік ML, які ми вивчали, і дозволяє тестувати та впроваджувати найкращу модель: "Ця система базується на обробці природної мови для вилучення ознак із даних, а потім ці ознаки використовуються для навчання класифікаторів машинного навчання, таких як Naive Bayes, Support Vector Machine (SVM), Random Forest (RF), Stochastic Gradient Descent (SGD) і Logistic Regression (LR)".
Джерело
Ця стаття показує, як поєднання різних доменів ML може дати цікаві результати, які допоможуть зупинити поширення фейкових новин і запобігти реальній шкоді; у цьому випадку імпульсом стало поширення чуток про лікування COVID, що спричинило насильство.
ML у музеях
Музеї перебувають на порозі революції штучного інтелекту, у якій каталогізація та оцифрування колекцій, а також пошук зв'язків між артефактами стають простішими завдяки розвитку технологій. Проєкти, такі як In Codice Ratio, допомагають розкрити таємниці недоступних колекцій, таких як Ватиканські архіви. Але бізнес-аспект музеїв також отримує вигоду від моделей ML.
Наприклад, Інститут мистецтв Чикаго створив моделі для прогнозування інтересів аудиторії та часу відвідування виставок. Мета — створити індивідуалізований і оптимізований досвід для кожного відвідувача музею. "Протягом 2017 фінансового року модель передбачила відвідуваність і доходи з точністю до 1%, каже Ендрю Сімнік, старший віцепрезидент Інституту мистецтв".
Джерело
🏷 Маркетинг
Сегментація клієнтів
Найефективніші маркетингові стратегії орієнтуються на клієнтів по-різному залежно від різних груп. У цій статті обговорюється використання алгоритмів кластеризації для підтримки диференційованого маркетингу. Диференційований маркетинг допомагає компаніям покращити впізнаваність бренду, охопити більше клієнтів і заробити більше грошей.
[Джерело](https://ai.inqline.com
Післялекційна вікторина
Огляд і самостійне навчання
Команда з науки про дані Wayfair має кілька цікавих відео про те, як вони використовують машинне навчання у своїй компанії. Варто переглянути!
Завдання
Полювання за скарбами з машинного навчання
Відмова від відповідальності:
Цей документ було перекладено за допомогою сервісу автоматичного перекладу Co-op Translator. Хоча ми прагнемо до точності, будь ласка, майте на увазі, що автоматичні переклади можуть містити помилки або неточності. Оригінальний документ на його рідній мові слід вважати авторитетним джерелом. Для критичної інформації рекомендується професійний людський переклад. Ми не несемо відповідальності за будь-які непорозуміння або неправильні тлумачення, що виникають у результаті використання цього перекладу.