20 KiB
Наука о данных для начинающих - Учебный план
Команда Azure Cloud Advocates от компании Microsoft рада представить вам десятинедельный учебный курс по науке о данным, разбитый на 20 уроков. Каждый урок содержит вступительный и проверочный тесты, инструкции для прохождения, решение и домашнее задание. Мы выбрали методику проектно-ориентированного обучения как проверенный способ освоения новых навыков. Она помогает Вам учиться в процессе работы над проектом.
Выражаем благодарность нашим авторам: Jasmine Greenaway, Dmitry Soshnikov, Nitya Narasimhan, Jalen McGee, Jen Looper, Maud Levy, Tiffany Souterre, Christopher Harrison.
🙏 Отдельная благодарность 🙏 нашей команде авторов Microsoft Student Ambassador и редакторам, в особенности Raymond Wangsa Putra, Ankita Singh, Rohit Yadav, Arpita Das, Mohamma Iftekher (Iftu) Ebne Jalal, Dishita Bhasin, Miguel Correa, Nawrin Tabassum, Sanya Sinha, Majd Safi, Sheena Narula, Anupam Mishra, Dibri Nsofor, Aditya Garg, Alondra Sanchez, Yogendrasingh Pawar, Max Blum, Samridhi Sharma, Tauqeer Ahmad, Aaryan Arora, ChhailBihari Dubey
Наука о данных для начинающих - Рисунок @nitya |
Начало работы
Дорогие учителя, мы добавили наши рекомендации по работе с курсом. Мы будем рады получить ваши отзывы на нашем форуме!
Дорогие студенты, для самостоятельного прохождения курса сделайте форк всего репозитория, выполните задания самостоятельно, начиная со вступительных тестов, а после прочтения лекции, выполните оставшуюся часть урока. Постарайтесь достигнуть понимания при выполнении заданий и избегайте копирования решения, несмотря на то, что решение доступно в папке
/solutions
для каждого мини-проекта. Отличной идеей также является организовать учебную группу со своими друзьями и пройти этот курс вместе. Для дальнейшего обучения мы рекомендуем портал Microsoft Learn.
О методике обучения
Мы выбрали два ключевых пункта при разработке данного учебного курса: проектоориентированность и частая проверка знаний. К концу занятий учащиеся изучат основные принципы науки о данных, среди которых этические аспекты работы с данными, подготовку данных, различные способы обработки данных, визуализация данных, анализ данных, примеры практического использования науки о данных и многое другое.
В дополнение к этому, незначительные тесты перед началом урока поможет мотивировать учеников к изучению темы, а заключительный тест проверит усвоение материала. Мы постарались сделать данный курс гибким и нескучным, поэтому вы можете пройти его полностью или только некоторые разделы. По мере прохождения десятинедельного курса, проекты будут становиться всё сложнее.
Ознакомьтесь с нашими правилами поведения, сотрудничества, перевода. Мы приветствуем конструктивную критику.
Каждый урок включает в себя:
- Небольшой скетч (необязательно)
- Вспомогательное видео (необязательно)
- Вступительный тест
- Учебный материал
- Пошаговую инструкцию для выполнения проекта (для проектно-ориентированных уроков)
- Проверку знаний
- Задачу для выполнения
- Дополнительные материалы
- Домашнее задание
- Проверочный тест
О тестах: Все тесты Вы можете найти в этом приложении, их всего 40 по три вопроса в каждом. Ссылки на них находятся внутри уроков, однако приложение не может быть запущено локально. Следуйте инструкциям в папке
quiz-app
. Постепенно тесты будут локализованы.
Содержание уроков
Наука о данных: Дорожная карта - Рисунок @nitya |
Номер урока | Тема | Раздел | Цели | Ссылка | Автор |
---|---|---|---|---|---|
01 | Что такое наука о данных | Введение | Изучить основные понятия науки о данных и её связь с искусственным интеллектом, машинным обучением и большими данными. | урок видео | Dmitry |
02 | Этика и наука о данных | Введение | Этические аспекты в области науки о данных. | урок | Nitya |
03 | Что такое данные | Введение | Классификация данных и их источники. | урок | Jasmine |
04 | Введение в статистику и теорию вероятности | Введение | Вероятностные и статистические приёмы для изучения данных. | урок видео | Dmitry |
05 | Работа с реляционными данными | Работа с данными | Введение в реляционные данные, основы изучения и анализа реляционных данных при помощи структурированного языка запросов, также известного как SQL (произносится “си-квел”). | урок | Christopher |
06 | Работа с NoSQL данными | Работа с данными | Введение в нереляционные данные, их разнообразие и основы работы с документоориентированными базами данных. | урок | Jasmine |
07 | Работа с языком программирования Python | Работа с данными | Основы использования языка Python при исследовании данных на примере библиотеки Pandas. Рекомендуется предварительно познакомиться с Python. | урок видео | Dmitry |
08 | Подготовка данных | Работа с данными | Методы очистки и трансформации данных для работы с пропусками, ошибками и неполными данными. | урок | Jasmine |
09 | Визуализация количественных данных | Визуализация данных | Использование библиотеки Matplotlib для визуализации данных о разнообразии птиц 🦆 | урок | Jen |
10 | Визуализация распределения данных | Визуализация данных | Визуализация наблюдений и трендов на временнóм интервале | урок | Jen |
11 | Визуализация пропорций | Визуализация данных | Визуализация дискретных и сгруппированных процентных соотношений. | урок | Jen |
12 | Визуализация связей | Визуализация данных | Визуализация связей и корреляций между наборами данных и их переменными. | урок | Jen |
13 | Выразительная визуализация | Визуализация данных | Методы и инструкция для построения визуализации для эффективного решения проблем и получения инсайтов. | урок | Jen |
14 | Введение в жизненный цикл проекта в области науки о данных | Жизненный цикл проекта | Введение в жизненный цикл проекта в области науки о данных и его первый этап получения и извлечения данных. | урок | Jasmine |
15 | Анализ данных | Жизненный цикл проекта | Данный этап жизненного цикла сосредоточен на методах анализа данных. | урок | Jasmine |
16 | Взаимодействие на основе данных | Жизненный цикл проекта | Данный этап жизненного цикла сфокусирован на презентацию инсайтов в данных в виде, легком для понимания лицам, принимающим решения. | урок | Jalen |
17 | Преимущества облачной инфраструктуры для науки о данных. | Облачные данные | Данная серия уроков знакомит с применением облачных технологии в науке о данных и его преимуществах. | урок | Tiffany and Maud |
18 | Наука о данных в облачной инфраструктуре: подходы с минимальным использованием программирования и без него. | Облачные данные | Обучение моделей с минимальным использованием программирования. | урок | Tiffany and Maud |
19 | Наука о данных в облачной инфраструктуре: применение Azure ML SDK | Облачные данные | Развёртывание моделей с использованием Azure Machine Learning Studio. | урок | Tiffany and Maud |
20 | Наука о данных на практике | На практике | Проекты в области науки о данных на практике. | урок | Nitya |
Оффлайн доступ
Вы можете запустить данную документацию используя Docsify. Сделайте форк данного репозитория, установите Docsify на Вашем компьютере, и затем введите команду docsify serve
в корневом разделе репозитория. Веб-сайт будет доступен на порте 3000 Вашей локальной машины: localhost:3000
.
Отмечаем, что Docsify не поддерживает Jupyter-ноутбуки. Для работы с ними используйте VS Code с запуском ядра Python.
PDF файлы
PDF файлы всех уроков Вы можете найти здесь.
Ищем помощников!
Если вы хотите поучаствовать в перевода курса, прочтите нашу инструкцию по переводу.
Другие учебные курсы
Наша команда разрабатывает и другие курсы. Познакомьтесь с ними: