pull/91/head
Peeeaje 3 years ago
commit feee6a63da

@ -0,0 +1,22 @@
# Введение в машинное обучение
В этом разделе учебной программы вы познакомитесь с базовыми концепциями, лежащими в основе области машинного обучения, что это такое, и узнаете о его истории и методах, которые исследователи используют для работы с ним. Давайте вместе исследуем этот новый мир машинного обучения!
! [глобус](images/global.jpg)
> Фото <a href="https://unsplash.com/@bill_oxford?utm_source=unsplash&utm_medium=referral&utm_content=creditCopyText"> Билла Оксфорда </a> на <a href="https://unsplash.com/s/ photos / global? utm_source = unsplash & utm_medium = referral & utm_content = creditCopyText "> Unsplash </a>
### Уроки
1. [Введение в машинное обучение](1-intro-to-ML/README.md)
1. [История машинного обучения и искусственного интеллекта](2-history-of-ML/README.md)
1. [Справедливость и машинное обучение](3-fairness/README.md)
1. [Приемы машинного обучения](4-techniques-of-ML/README.md)
### Благодарности
«Введение в машинное обучение» было написано с ♥ ️группой людей, включая [Мухаммад Сакиб Хан Инан](https://twitter.com/Sakibinan), [Орнелла Алтунян](https://twitter.com/ornelladotcom) и [Джен Лупер](https://twitter.com/jenlooper)
«История машинного обучения» была написана с[Джен Лупер](https://twitter.com/jenlooper) и [Эми Бойд](https://twitter.com/AmyKateNicho)
«Справедливость и машинное обучение» написано с[Томоми Имура](https://twitter.com/girliemac)
«Методы машинного обучения» были написаны с[Джен Лупер](https://twitter.com/jenlooper) и [Крис Норинг](https://twitter.com/softchris)

@ -0,0 +1,33 @@
# Модели регрессии для машинного обучения
## Региональная тема: модели регрессии для цен на тыкву в Северной Америке 🎃
В Северной Америке на Хэллоуин из тыкв часто вырезают страшные лица. Давайте узнаем больше об этих восхитительных овощах!
! [jack-o-lanterns](./images/jack-o-lanterns.jpg)
> Фото <a href="https://unsplash.com/@teutschmann?utm_source=unsplash&utm_medium=referral&utm_content=creditCopyText"> Бет Тойчманн </a> на <a href="https://unsplash.com/s/photos/jack-o-lanterns?utm_source=unsplash&utm_medium=referral&utm_content=creditCopyText"> Unsplash </a>
## Что вы узнаете
Уроки в этом разделе охватывают типы регрессии в контексте машинного обучения. Модели регрессии могут помочь определить отношения между переменными. Этот тип модели может предсказывать такие значения, как длина, температура или возраст, тем самым выявляя взаимосвязи между переменными при анализе точек данных.
В этой серии уроков вы обнаружите разницу между линейной регрессией и логистической регрессией, а также когда вам следует использовать ту или иную регрессию.
В этой группе уроков вы будете настроены, чтобы приступить к задачам машинного обучения, включая настройку кода Visual Studio для управления записными книжками, общей средой для специалистов по данным. Вы откроете для себя Scikit-learn, библиотеку для машинного обучения, и создадите свои первые модели, уделяя особое внимание моделям регрессии в этой главе.
> Существуют полезные инструменты с небольшим количеством кода, которые могут помочь вам узнать о работе с моделями регрессии. Попробуйте [Azure ML для этой задачи](https://docs.microsoft.com/learn/modules/create-regression-model-azure-machine-learning-designer/?WT.mc_id=academic-15963-cxa)
### Уроки
1. [Инструменты торговли](1-Tools/README.md)
2. [Управление данными](2-Data/README.md)
3. [Линейная и полиномиальная регрессия](3-Linear/README.md)
4. [Логистическая регрессия](4-Logistic/README.md)
---
### Благодарности
«ML с регрессией» был написан с помощью ♥ [Джен Лупер](https://twitter.com/jenlooper)
Среди участников викторины: [Мухаммад Сакиб Хан Инан](https://twitter.com/Sakibinan) и [Орнелла Алтунян](https://twitter.com/ornelladotcom)
Набор данных по тыкве предлагается [этот проект на Kaggle](https://www.kaggle.com/usda/a-year-of-pumpkin-prices), а его данные взяты из [Стандартных отчетов по рынкам специальных культур на терминалах](https://www.marketnews.usda.gov/mnp/fv-report-config-step1?type=termPrice) распространяется Министерством сельского хозяйства США. Мы добавили несколько точек вокруг цвета на основе разнообразия, чтобы нормализовать распределение. Эти данные находятся в открытом доступе.

@ -0,0 +1,22 @@
# Создайте веб-приложение для использования вашей модели машинного обучения
В этом разделе учебной программы вы познакомитесь с прикладной темой машинного обучения: как сохранить модель Scikit-learn в виде файла, который можно использовать для прогнозирования в веб-приложении. После сохранения модели вы узнаете, как использовать ее в веб-приложении, созданном во Flask. Сначала вы создадите модель, используя некоторые данные о наблюдениях НЛО! Затем вы создадите веб-приложение, которое позволит вам ввести количество секунд с широтой и долготой, чтобы предсказать, какая страна сообщила о видении НЛО.
! [Парковка НЛО](images/ufo.jpg)
Фото <a href="https://unsplash.com/@mdherren?utm_source=unsplash&utm_medium=referral&utm_content=creditCopyText"> Майкла Херрена </a> на <a href="https://unsplash.com/s/photos/ufo?utm_source=unsplash&utm_medium=referral&utm_content=creditCopyText"> Unsplash </a>
## Уроки
1. [Создайте веб-приложение](1-Web-App/README.md)
## Благодарности
«Создайте веб-приложение» было написано с помощью ♥ [Джен Лупер](https://twitter.com/jenlooper).
Тесты были написаны Роханом Раджем.
Набор данных взят из [Kaggle](https://www.kaggle.com/NUFORC/ufo-sightings).
Архитектура веб-приложения была частично предложена в [этой статье](https://towardsdatascience.com/how-to-easily-deploy-machine-learning-models-using-flask-b95af8fe34d4) и [этой репозитории](https://github.com/abhinavsagar/machine-learning-deployment) Абхинава Сагара.

@ -0,0 +1,25 @@
# Начало работы с классификацией
## Региональная тема: Вкусные блюда азиатской и индийской кухни 🍜
В Азии и Индии традиции кухни чрезвычайно разнообразны и очень вкусны! Давайте посмотрим на данные о региональных кухнях, чтобы попытаться понять их состав.
! [Продавец тайской еды](./images/thai-food.jpg)
> Фото <a href="https://unsplash.com/@changlisheng?utm_source=unsplash&utm_medium=referral&utm_content=creditCopyText"> Лишенг Чанг </a> на <a href="https://unsplash.com/s/photos/asian-food?utm_source=unsplash&utm_medium=referral&utm_content=creditCopyText "> Unsplash </a>
## Что вы узнаете
В этом разделе вы воспользуетесь навыками, полученными в первой части учебной программы, посвященными регрессии, и узнаете о других классификаторах, которые вы можете использовать и которые помогут вам изучить свои данные.
> Существуют полезные инструменты с небольший количеством кода, которые могут помочь вам узнать о работе с моделями классификации. Попробуйте [Azure ML для этой задачи](https://docs.microsoft.com/learn/modules/create-classification-model-azure-machine-learning-designer/?WT.mc_id=academic-15963-cxa)
## Уроки
1. [Введение в классификацию](1-Introduction/README.md)
2. [Другие классификаторы](2-Classifiers-1/README.md)
3. [Еще классификаторы](3-Classifiers-2/README.md)
4. [Прикладное машинное обучение: создание веб-приложения](4-Applied/README.md)
## Благодарности
«Начало работы с классификацией» было написано с[Кэсси Бревиу](https://www.twitter.com/cassieview) и [Джен Лупер](https://www.twitter.com/jenlooper)
Набор данных о вкусных блюдах взят из [Kaggle](https://www.kaggle.com/hoandan/asian-and-indian-cuisines)

@ -0,0 +1,26 @@
# Модели кластеризации для машинного обучения
Кластеризация - это задача машинного обучения, при которой она ищет объекты, которые похожи друг на друга, и группирует их в группы, называемые кластерами. Что отличает кластеризацию от других подходов в машинном обучении, так это то, что все происходит автоматически, и справедливо сказать, что это противоположность supervised learning.
## Региональная тема: модели кластеризации для музыкальных вкусов нигерийской публики 🎧
У разнообразной публики Нигерии самые разные музыкальные вкусы. Использование данных, извлеченных из Spotify (на основе [этой статьи](https://towardsdatascience.com/country-wise-visual-analysis-of-music-taste-using-spotify-api-seaborn-in-python-77f5b749b421), давайте посмотрим на музыку, популярную в Нигерии. Этот набор данных включает данные о различных песнях "танцевальность", "акустичность", "громкость", "речевость", "популярность" и "энергия". Будет интересно обнаружить закономерности в этих данных!
![Поворотный стол](./images/turntable.jpg)
Фото <a href="https://unsplash.com/@marcelalaskoski?utm_source=unsplash&utm_medium=referral&utm_content=creditCopyText"> Марсела Ласкоски </a> на <a href="https://unsplash.com/s/photos/nigerian-music?utm_source=unsplash&utm_medium=referral&utm_content=creditCopyText"> Unsplash </a>
В этой серии уроков вы откроете для себя новые способы анализа данных с помощью методов кластеризации. Кластеризация особенно полезна, когда в наборе данных отсутствуют метки. Если на нем есть ярлыки, тогда могут быть более полезными методы классификации, подобные тем, которые вы изучили на предыдущих уроках. Но в случаях, когда вы хотите сгруппировать немаркированные данные, кластеризация - отличный способ обнаружить закономерности.
> Существуют полезные инструменты с небольшим количеством кода, которые могут помочь вам узнать о работе с моделями кластеризации. Попробуйте [Azure ML для этой задачи](https://docs.microsoft.com/learn/modules/create-clustering-model-azure-machine-learning-designer/?WT.mc_id=academic-15963-cxa)
## Уроки
1. [Введение в кластеризацию](1-Visualize/README.md)
2. [Кластеризация K-Means](2-K-Means/README.md)
## Благодарности
Эти уроки были написаны с помощью 🎶 [Джен Лупер](https://www.twitter.com/jenlooper) с полезными отзывами [Ришит Дагли](https://rishit_dagli) и [Мухаммад Сакиб Хан Инан](https://twitter.com/Sakibinan).
Набор данных [Нигерийские песни](https://www.kaggle.com/sootersaalu/nigerian-songs-spotify) был получен из Kaggle, как и из Spotify.
Полезные примеры K-Means, которые помогли в создании этого урока, включают [исследование радужной оболочки глаза](https://www.kaggle.com/bburns/iris-exploration-pca-k-means-and-gmm-clustering), [вводный блокнот](https://www.kaggle.com/prashant111/k-means-clustering-with-python) и [пример гипотетической НПО](https://www.kaggle.com/ankandash/pca-k-means-clustering-hierarchical-clustering).

@ -0,0 +1,24 @@
# Начало работы с обработкой естественного языка
Обработка естественного языка, NLP, - это область искусственного интеллекта. Вся эта область направлена ​​на то, чтобы помочь машинам понимать и обрабатывать человеческий язык. Затем это можно использовать для выполнения таких задач, как проверка орфографии или машинный перевод.
## Региональная тема: европейские языки и литература и романтические отели Европы ❤️
В этом разделе учебной программы вы познакомитесь с одним из наиболее распространенных способов использования машинного обучения: обработкой естественного языка (NLP). Эта категория искусственного интеллекта, выведенная из компьютерной лингвистики, является мостом между людьми и машинами посредством голосовой или текстовой коммуникации.
На этих уроках мы изучим основы NLP, создав небольших диалоговых ботов, чтобы узнать, как машинное обучение помогает сделать эти разговоры все более и более «умными». Вы отправитесь в прошлое, болтая с Элизабет Беннетт и мистером Дарси из классического романа Джейн Остин **Гордость и предубеждение**, опубликованного в 1813 году. Затем вы расширите свои знания, узнав об анализе настроений из отзывов об отелях в Европе.
![Книга о гордости и предубеждениях и чай](images/p&p.jpg)
> Фото <a href="https://unsplash.com/@elaineh?utm_source=unsplash&utm_medium=referral&utm_content=creditCopyText"> Элейн Хоулин </a> на <a href="https://unsplash.com/s/photos/pride-and-prejudice?utm_source=unsplash&utm_medium=referral&utm_content=creditCopyText"> Unsplash </a>
## Уроки
1. [Введение в обработку естественного языка](1-Introduction-to-NLP/README.md)
2. [Общие задачи и техники NLP](2-Tasks/README.md)
3. [Перевод и анализ тональности с помощью машинного обучения](3-Translation-Sentiment/README.md)
4. [Подготовка данных](4-Hotel-Reviews-1/README.md)
5. [NLTK для анализа настроений](5-Hotel-Reviews-2/README.md)
## Благодарности
Эти уроки обработки естественного языка были написаны с помощью ☕ [Стивен Хауэлл](https://twitter.com/Howell_MSFT)

@ -0,0 +1,22 @@
# Введение в прогнозирование временных серий
Что такое прогнозирование временных серий? Речь идет о предсказании будущих событий, анализируя тенденции прошлого.
## Региональная тема: потребление электроэнергии во всем мире ✨
В этих двух уроках вы познакомитесь с прогнозированием временных серий, несколько менее известной областью машинного обучения, которая, тем не менее, чрезвычайно ценна для промышленности и бизнес-приложений, среди других областей. Хотя нейронные сети можно использовать для повышения полезности этих моделей, мы будем изучать их в контексте классического машинного обучения, поскольку модели помогают прогнозировать будущую производительность на основе прошлого.
Наш региональный фокус - использование электроэнергии в мире, интересный набор данных, позволяющий узнать о прогнозировании будущего использования энергии на основе моделей прошлой нагрузки. Вы можете увидеть, насколько такое прогнозирование может быть чрезвычайно полезным в деловой среде.
![электрическая сеть](images / electric-grid.jpg)
Автор фотографии <a href="https://unsplash.com/@shutter_log?utm_source=unsplash&utm_medium=referral&utm_content=creditCopyText"> Педди Саи Хритика </a> электрических башен на дороге в Раджастане на <a href="https://unsplash.com/s/photos/electric-india?utm_source=unsplash&utm_medium=referral&utm_content=creditCopyText">Unsplash </a>
## Уроки
1. [Введение в прогнозирование временных рядов](1-Introduction/README.md)
2. [Построение моделей временных рядов ARIMA](2-ARIMA/README.md)
## Благодарности
«Введение в прогнозирование временных рядов» было написано с ⚡️ [Франческа Лазерри](https://twitter.com/frlazzeri) и [Джен Лупер](https://twitter.com/jenlooper)

@ -0,0 +1,52 @@
# Введение в reinforcement learning
Reinforcement learning (обучение с подкреплением), RL, рассматривается как одна из основных парадигм машинного обучения, наряду с supervised learning и unsupervised learning. RL - это все о решениях: принятие правильных решений или, по крайней мере, извлечение уроков из них.
Представьте, что у вас есть смоделированная среда, такая как фондовый рынок. Что произойдет, если вы введете определенное правило. Имеет ли это положительный или отрицательный эффект? Если происходит что-то негативное, вам нужно принять это егативное подкрепление_, извлечь из него урок и изменить курс. Если это положительный результат, вам нужно использовать это _положительное подкрепление_.
![peter and the wolf](images/peter.png)
> Петьке и его друзьям нужно спастись от голодного волка! Автор изображения [Jen Looper](https://twitter.com/jenlooper)
## Региональная тема: Петя и Волк (Россия)
[Петя и Волк](https://en.wikipedia.org/wiki/Peter_and_the_Wolf) - музыкальная сказка русского композитора [Сергея Прокофьева] (https://en.wikipedia.org/wiki/Sergei_Prokofiev). Это история о юном пионере Пете, который смело выходит из своего дома на лесную поляну, чтобы преследовать волка. В этом разделе мы обучим алгоритмы машинного обучения, которые помогут Пете:
- **Исследуйте** окрестности и создайте оптимальную навигационную карту.
- **Учитесь** пользоваться скейтбордом и балансировать на нем, чтобы двигаться быстрее.
[![Петя и Волк](https://img.youtube.com/vi/Fmi5zHg4QSM/0.jpg)] (https://www.youtube.com/watch?v=Fmi5zHg4QSM)
> 🎥 Нажмите на изображение выше, чтобы послушать Петю и Волка Прокофьева
## Обучение с подкреплением
В предыдущих разделах вы видели два примера проблем машинного обучения:
- **Supervised**, где у нас есть наборы данных, которые предлагают примеры решений проблемы, которую мы хотим решить. [Классификация](../4-Classification/README.md) и [регрессия] (../ 2-Регрессия / README.md) являются контролируемыми учебными задачами.
- **Unsupervised**, в котором у нас нет помеченных данных обучения. Основным примером unsupervised learning является [Кластеризация](../5-Clustering/README.md).
В этом разделе мы познакомим вас с новым типом задач обучения, которые не требуют маркированных данных обучения. Есть несколько типов таких проблем:
- **[Semi-supervised learning](https://wikipedia.org/wiki/Semi-supervised_learning)**, где у нас есть много немаркированных данных, которые можно использовать для предварительного обучения модели.
- **[Reinforcement learning](https://wikipedia.org/wiki/Reinforcement_learning)**, в котором агент учится вести себя, проводя эксперименты в некоторой моделируемой среде.
### Пример - компьютерная игра
Предположим, вы хотите научить компьютер играть в игру, например, в шахматы или [Супер Марио](https://wikipedia.org/wiki/Super_Mario). Чтобы компьютер мог играть в игру, нам нужно, чтобы он предсказывал, какой ход сделать в каждом из игровых состояний. Хотя это может показаться проблемой классификации, это не так - потому что у нас нет набора данных с состояниями и соответствующими действиями. Хотя у нас могут быть некоторые данные, такие как существующие шахматные матчи или записи игроков, играющих в Super Mario, вполне вероятно, что эти данные не будут в достаточной степени охватывать достаточно большое количество возможных состояний.
Вместо поиска существующих игровых данных **Обучение с подкреплением** (RL) основано на идее *заставить компьютер играть* много раз и наблюдать за результатом. Таким образом, чтобы применить обучение с подкреплением, нам нужны две вещи:
- **Среда** и **симулятор**, которые позволяют нам играть в игру много раз. Этот симулятор будет определять все правила игры, а также возможные состояния и действия.
- **Функция вознаграждения**, которая сообщит нам, насколько хорошо мы сделали каждый ход или игру.
Основное различие между другими типами машинного обучения и RL заключается в том, что в RL мы обычно не знаем, выиграем мы или проиграем, пока не закончим игру. Таким образом, мы не можем сказать, является ли конкретный ход хорошим или нет - мы получаем награду только в конце игры. И наша цель - разработать алгоритмы, которые позволят нам обучать модель в неопределенных условиях. Мы узнаем об одном алгоритме RL под названием **Q-Learning**.
## Уроки
1. [Введение в обучение с подкреплением и Q-Learning](1-QLearning/README.md)
2. [Использование тренажерного зала](2-Gym/README.md)
## Благодарности
«Введение в обучение с подкреплением» написано с[Дмитрием Сошниковым](http://soshnikov.com)

@ -0,0 +1,14 @@
# Постскриптум: реальные приложения классического машинного обучения
В этом разделе учебной программы вы познакомитесь с некоторыми реальными приложениями классического машинного обучения. Мы обыскали Интернет в поисках технических документов и статей о приложениях, которые использовали эти стратегии, избегая, насколько это возможно, нейронных сетей, глубокого обучения и искусственного интеллекта. Узнайте о том, как машинное обучение используется в бизнес-системах, экологических приложениях, финансах, искусстве и культуре и многом другом.
![chess](images/chess.jpg)
> Фото сделано <a href="https://unsplash.com/@childeye?utm_source=unsplash&utm_medium=referral&utm_content=creditCopyText">Alexis Fauvet</a> на <a href="https://unsplash.com/s/photos/artificial-intelligence?utm_source=unsplash&utm_medium=referral&utm_content=creditCopyText">Unsplash</a>
## Урок
1. [Реальные приложения для машинного обучения](1-Applications/README.md)
## Благодарности
"Реальные приложения для машинного обучения" была написана группой людей, включая [Джен Лупер](https://twitter.com/jenlooper) и [Орнелла Алтунян](https://twitter.com/ornelladotcom).
Loading…
Cancel
Save