You can not select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.
Data-Science-For-Beginners/translations/README.ru.md

20 KiB

Наука о данных для начинающих - Учебный план

GitHub license GitHub contributors GitHub issues GitHub pull-requests PRs Welcome

GitHub watchers GitHub forks GitHub stars

Команда Azure Cloud Advocates от компании Microsoft рада представить вам десятинедельный учебный курс по науке о данным, разбитый на 20 уроков. Каждый урок содержит вступительный и проверочный тесты, инструкции для прохождения, решение и домашнее задание. Мы выбрали методику проектно-ориентированного обучения как проверенный способ освоения новых навыков. Она помогает Вам учиться в процессе работы над проектом.

Выражаем благодарность нашим авторам: Jasmine Greenaway, Dmitry Soshnikov, Nitya Narasimhan, Jalen McGee, Jen Looper, Maud Levy, Tiffany Souterre, Christopher Harrison.

🙏 Отдельная благодарность 🙏 нашей команде авторов Microsoft Student Ambassador и редакторам, в особенности Raymond Wangsa Putra, Ankita Singh, Rohit Yadav, Arpita Das, Mohamma Iftekher (Iftu) Ebne Jalal, Dishita Bhasin, Miguel Correa, Nawrin Tabassum, Sanya Sinha, Majd Safi, Sheena Narula, Anupam Mishra, Dibri Nsofor, Aditya Garg, Alondra Sanchez, Yogendrasingh Pawar, Max Blum, Samridhi Sharma, Tauqeer Ahmad, Aaryan Arora, ChhailBihari Dubey

 Sketchnote by (@sketchthedocs)
Наука о данных для начинающих - Рисунок @nitya

Начало работы

Дорогие учителя, мы добавили наши рекомендации по работе с курсом. Мы будем рады получить ваши отзывы на нашем форуме!

Дорогие студенты, для самостоятельного прохождения курса сделайте форк всего репозитория, выполните задания самостоятельно, начиная со вступительных тестов, а после прочтения лекции, выполните оставшуюся часть урока. Постарайтесь достигнуть понимания при выполнении заданий и избегайте копирования решения, несмотря на то, что решение доступно в папке /solutions для каждого мини-проекта. Отличной идеей также является организовать учебную группу со своими друзьями и пройти этот курс вместе. Для дальнейшего обучения мы рекомендуем портал Microsoft Learn.

О методике обучения

Мы выбрали два ключевых пункта при разработке данного учебного курса: проектоориентированность и частая проверка знаний. К концу занятий учащиеся изучат основные принципы науки о данных, среди которых этические аспекты работы с данными, подготовку данных, различные способы обработки данных, визуализация данных, анализ данных, примеры практического использования науки о данных и многое другое.

В дополнение к этому, незначительные тесты перед началом урока поможет мотивировать учеников к изучению темы, а заключительный тест проверит усвоение материала. Мы постарались сделать данный курс гибким и нескучным, поэтому вы можете пройти его полностью или только некоторые разделы. По мере прохождения десятинедельного курса, проекты будут становиться всё сложнее.

Ознакомьтесь с нашими правилами поведения, сотрудничества, перевода. Мы приветствуем конструктивную критику.

Каждый урок включает в себя:

  • Небольшой скетч (необязательно)
  • Вспомогательное видео (необязательно)
  • Вступительный тест
  • Учебный материал
  • Пошаговую инструкцию для выполнения проекта (для проектно-ориентированных уроков)
  • Проверку знаний
  • Задачу для выполнения
  • Дополнительные материалы
  • Домашнее задание
  • Проверочный тест

О тестах: Все тесты Вы можете найти в этом приложении, их всего 40 по три вопроса в каждом. Ссылки на них находятся внутри уроков, однако приложение не может быть запущено локально. Следуйте инструкциям в папке quiz-app. Постепенно тесты будут локализованы.

Содержание уроков

 Sketchnote by (@sketchthedocs)
Наука о данных: Дорожная карта - Рисунок @nitya
Номер урока Тема Раздел Цели Ссылка Автор
01 Что такое наука о данных Введение Изучить основные понятия науки о данных и её связь с искусственным интеллектом, машинным обучением и большими данными. урок видео Dmitry
02 Этика и наука о данных Введение Этические аспекты в области науки о данных. урок Nitya
03 Что такое данные Введение Классификация данных и их источники. урок Jasmine
04 Введение в статистику и теорию вероятности Введение Вероятностные и статистические приёмы для изучения данных. урок видео Dmitry
05 Работа с реляционными данными Работа с данными Введение в реляционные данные, основы изучения и анализа реляционных данных при помощи структурированного языка запросов, также известного как SQL (произносится “си-квел”). урок Christopher
06 Работа с NoSQL данными Работа с данными Введение в нереляционные данные, их разнообразие и основы работы с документоориентированными базами данных. урок Jasmine
07 Работа с языком программирования Python Работа с данными Основы использования языка Python при исследовании данных на примере библиотеки Pandas. Рекомендуется предварительно познакомиться с Python. урок видео Dmitry
08 Подготовка данных Работа с данными Методы очистки и трансформации данных для работы с пропусками, ошибками и неполными данными. урок Jasmine
09 Визуализация количественных данных Визуализация данных Использование библиотеки Matplotlib для визуализации данных о разнообразии птиц 🦆 урок Jen
10 Визуализация распределения данных Визуализация данных Визуализация наблюдений и трендов на временнóм интервале урок Jen
11 Визуализация пропорций Визуализация данных Визуализация дискретных и сгруппированных процентных соотношений. урок Jen
12 Визуализация связей Визуализация данных Визуализация связей и корреляций между наборами данных и их переменными. урок Jen
13 Выразительная визуализация Визуализация данных Методы и инструкция для построения визуализации для эффективного решения проблем и получения инсайтов. урок Jen
14 Введение в жизненный цикл проекта в области науки о данных Жизненный цикл проекта Введение в жизненный цикл проекта в области науки о данных и его первый этап получения и извлечения данных. урок Jasmine
15 Анализ данных Жизненный цикл проекта Данный этап жизненного цикла сосредоточен на методах анализа данных. урок Jasmine
16 Взаимодействие на основе данных Жизненный цикл проекта Данный этап жизненного цикла сфокусирован на презентацию инсайтов в данных в виде, легком для понимания лицам, принимающим решения. урок Jalen
17 Преимущества облачной инфраструктуры для науки о данных. Облачные данные Данная серия уроков знакомит с применением облачных технологии в науке о данных и его преимуществах. урок Tiffany and Maud
18 Наука о данных в облачной инфраструктуре: подходы с минимальным использованием программирования и без него. Облачные данные Обучение моделей с минимальным использованием программирования. урок Tiffany and Maud
19 Наука о данных в облачной инфраструктуре: применение Azure ML SDK Облачные данные Развёртывание моделей с использованием Azure Machine Learning Studio. урок Tiffany and Maud
20 Наука о данных на практике На практике Проекты в области науки о данных на практике. урок Nitya

Оффлайн доступ

Вы можете запустить данную документацию используя Docsify. Сделайте форк данного репозитория, установите Docsify на Вашем компьютере, и затем введите команду docsify serve в корневом разделе репозитория. Веб-сайт будет доступен на порте 3000 Вашей локальной машины: localhost:3000.

Отмечаем, что Docsify не поддерживает Jupyter-ноутбуки. Для работы с ними используйте VS Code с запуском ядра Python.

PDF файлы

PDF файлы всех уроков Вы можете найти здесь.

Ищем помощников!

Если вы хотите поучаствовать в перевода курса, прочтите нашу инструкцию по переводу.

Другие учебные курсы

Наша команда разрабатывает и другие курсы. Познакомьтесь с ними: