37 KiB
Data Science для начинающих — Учебная программа
Адвокаты Azure Cloud в Microsoft рады предложить 10-недельную учебную программу из 20 уроков, посвящённую Data Science. Каждый урок включает в себя викторины до и после урока, письменные инструкции по выполнению, решение и задание. Наша проектно-ориентированная методика позволяет учиться, создавая проекты, что доказало свою эффективность в закреплении новых навыков.
Большое спасибо нашим авторам: Jasmine Greenaway, Dmitry Soshnikov, Nitya Narasimhan, Jalen McGee, Jen Looper, Maud Levy, Tiffany Souterre, Christopher Harrison.
🙏 Особая благодарность 🙏 нашим авторам, рецензентам и контент-создателям из Microsoft Student Ambassador, в частности Aaryan Arora, Aditya Garg, Alondra Sanchez, Ankita Singh, Anupam Mishra, Arpita Das, ChhailBihari Dubey, Dibri Nsofor, Dishita Bhasin, Majd Safi, Max Blum, Miguel Correa, Mohamma Iftekher (Iftu) Ebne Jalal, Nawrin Tabassum, Raymond Wangsa Putra, Rohit Yadav, Samridhi Sharma, Sanya Sinha, Sheena Narula, Tauqeer Ahmad, Yogendrasingh Pawar, Vidushi Gupta, Jasleen Sondhi
![]() |
|---|
| Data Science для начинающих — Скетчноут от @nitya |
🌐 Поддержка нескольких языков
Поддерживается через GitHub Action (автоматически и всегда актуально)
Арабский | Бенгальский | Болгарский | Бирманский (Мьянма) | Китайский (упрощённый) | Китайский (традиционный, Гонконг) | Китайский (традиционный, Макао) | Китайский (традиционный, Тайвань) | Хорватский | Чешский | Датский | Нидерландский | Эстонский | Финский | Французский | Немецкий | Греческий | Иврит | Хинди | Венгерский | Индонезийский | Итальянский | Японский | Каннада | Корейский | Литовский | Малайский | Малаялам | Маратхи | Непальский | Нигерийский пиджин | Норвежский | Персидский (фарси) | Польский | Португальский (Бразилия) | Португальский (Португалия) | Пенджаби (Гурмукхи) | Румынский | Русский | Сербский (кириллица) | Словацкий | Словенский | Испанский | Суахили | Шведский | Тагалог (Филиппины) | Тамильский | Телугу | Тайский | Турецкий | Украинский | Урду | Вьетнамский
Хотите клонировать локально?
Этот репозиторий содержит более 50 переводов, что значительно увеличивает размер загрузки. Чтобы клонировать без переводов, используйте sparse checkout:
git clone --filter=blob:none --sparse https://github.com/microsoft/Data-Science-For-Beginners.git cd Data-Science-For-Beginners git sparse-checkout set --no-cone '/*' '!translations' '!translated_images'Это даст вам всё необходимое для прохождения курса при гораздо более быстрой загрузке.
Если вы хотите добавить поддержку других языков, см. список здесь
Присоединяйтесь к нашему сообществу
У нас проходит серия по обучению с AI в Discord, узнайте больше и присоединяйтесь на Learn with AI Series с 18 по 30 сентября 2025 года. Вы получите советы и рекомендации по использованию GitHub Copilot для Data Science.
Вы студент?
Начните с следующих ресурсов:
- Страница Student Hub На этой странице вы найдёте материалы для начинающих, студенческие наборы и даже способы получить бесплатный ваучер на сертификацию. Это страница, которую стоит добавить в закладки и периодически проверять, так как контент обновляется как минимум раз в месяц.
- Microsoft Learn Student Ambassadors Присоединяйтесь к глобальному сообществу студенческих амбассадоров — это может стать вашим путём в Microsoft.
Начало работы
📚 Документация
- Руководство по установке — Поэтапные инструкции по настройке для начинающих
- Руководство по использованию — Примеры и распространённые сценарии работы
- Руководство по устранению неполадок — Решения типичных проблем
- Руководство по участию — Как внести вклад в этот проект
- Для преподавателей — Методические рекомендации и материалы для занятий
👨🎓 Для студентов
Совершенно новые пользователи: новичок в data science? Начните с наших простых примеров для начинающих! Эти простые и хорошо прокомментированные примеры помогут понять основы, прежде чем перейти к полной программе. Студенты: чтобы использовать эту программу самостоятельно, создайте форк всего репозитория и выполняйте упражнения самостоятельно, начиная с викторины перед лекцией. Затем прочитайте лекцию и выполните остальные задания. Старайтесь создавать проекты, осмысленно усваивая уроки, а не просто копируя код решений; однако код решений доступен в папках /solutions каждого проектно-ориентированного урока. Другой вариант — собрать учебную группу с друзьями и изучать материал вместе. Для дальнейшего обучения рекомендуем Microsoft Learn.
Быстрый старт:
- Ознакомьтесь с Руководством по установке для настройки среды
- Изучите Руководство по использованию, чтобы узнать, как работать с программой
- Начинайте с урока 1 и проходите последовательно
- Присоединяйтесь к нашему Discord-сообществу за поддержкой
👩🏫 Для преподавателей
Преподаватели: мы включили некоторые рекомендации по использованию этой программы. Будем рады вашим отзывам в нашем форуме обсуждений!
Встречайте команду
Гифка от Mohit Jaisal
🎥 Нажмите на изображение выше, чтобы посмотреть видео о проекте и людях, которые его создали!
Педагогика
Мы выбрали два педагогических принципа при создании этой учебной программы: обеспечение проектной направленности и включение частых викторин. К концу этой серии студенты узнают основные принципы науки о данных, включая этические концепции, подготовку данных, различные способы работы с данными, визуализацию данных, анализ данных, реальные случаи использования науки о данных и многое другое.
Кроме того, викторина с низкой ставкой перед занятием задаёт намерение студента на изучение темы, а вторая викторина после занятия обеспечивает лучшее закрепление материала. Эта учебная программа была разработана так, чтобы быть гибкой и интересной, и её можно проходить полностью или частично. Проекты начинаются с простых и становятся всё более сложными к концу 10-недельного цикла.
Ознакомьтесь с нашим Кодексом поведения, правилами участия, переводческими рекомендациями. Мы приветствуем ваши конструктивные отзывы!
Каждое занятие включает:
- Опциональную скетчноут
- Опциональное дополнительное видео
- Разминку-викторину перед занятием
- Письменный урок
- Для проектных уроков — пошаговые руководства по созданию проекта
- Проверки знаний
- Задание
- Дополнительное чтение
- Викторину после урока
Примечание о викторинах: Все викторины находятся в папке Quiz-App, всего 40 викторин по три вопроса каждая. Они связаны из уроков, но приложение викторин можно запускать локально или размещать в Azure; следуйте инструкциям в папке
quiz-app. Они постепенно локализуются.
🎓 Примеры для начинающих
Новички в науке о данных? Мы создали специальный каталог примеров с простым, хорошо прокомментированным кодом, чтобы помочь вам начать:
- 🌟 Hello World — ваша первая программа по науке о данных
- 📂 Загрузка данных — научитесь читать и исследовать наборы данных
- 📊 Простой анализ — вычисляйте статистику и находите закономерности
- 📈 Базовая визуализация — создавайте диаграммы и графики
- 🔬 Реальный проект — полный рабочий процесс от начала до конца
Каждый пример включает подробные комментарии, объясняющие каждый шаг, что идеально подходит для абсолютных новичков!
Уроки
![]() |
|---|
| Наука о данных для начинающих: Дорожная карта - Скетчноут от @nitya |
| Номер урока | Тема | Группа уроков | Цели обучения | Связанный урок | Автор |
|---|---|---|---|---|---|
| 01 | Определение науки о данных | Введение | Изучить основные концепции науки о данных и её связи с искусственным интеллектом, машинным обучением и большими данными. | урок видео | Дмитрий |
| 02 | Этика в науке о данных | Введение | Концепции этики данных, вызовы и рамочные подходы. | урок | Нития |
| 03 | Определение данных | Введение | Как классифицируются данные и их распространённые источники. | урок | Жасмин |
| 04 | Введение в статистику и вероятность | Введение | Математические методы вероятности и статистики для понимания данных. | урок видео | Дмитрий |
| 05 | Работа с реляционными данными | Работа с данными | Введение в реляционные данные и основы изучения и анализа реляционных данных с помощью языка структурированных запросов SQL (произносится «си-квел»). | урок | Кристофер |
| 06 | Работа с NoSQL данными | Работа с данными | Введение в нереляционные данные, их типы и основы изучения и анализа документных баз данных. | урок | Жасмин |
| 07 | Работа с Python | Работа с данными | Основы использования Python для исследования данных с библиотеками, такими как Pandas. Рекомендуются базовые знания Python. | урок видео | Дмитрий |
| 08 | Подготовка данных | Работа с данными | Темы по очистке и преобразованию данных для решения проблем с отсутствующими, неточными или неполными данными. | урок | Жасмин |
| 09 | Визуализация количеств | Визуализация данных | Изучите использование Matplotlib для визуализации данных о птицах 🦆 | урок | Джен |
| 10 | Визуализация распределения данных | Визуализация данных | Визуализация наблюдений и тенденций в интервале. | урок | Джен |
| 11 | Визуализация пропорций | Визуализация данных | Визуализация дискретных и сгруппированных процентов. | урок | Джен |
| 12 | Визуализация связей | Визуализация данных | Визуализация связей и корреляций между наборами данных и их переменными. | урок | Джен |
| 13 | Значимые визуализации | Визуализация данных | Приёмы и рекомендации для создания ценных визуализаций для эффективного решения задач и получения инсайтов. | урок | Джен |
| 14 | Введение в жизненный цикл науки о данных | Жизненный цикл | Введение в жизненный цикл науки о данных и его первый этап — получение и извлечение данных. | урок | Жасмин |
| 15 | Анализ | Жизненный цикл | Этот этап жизненного цикла науки о данных фокусируется на техниках анализа данных. | урок | Жасмин |
| 16 | Коммуникация | Жизненный цикл | Этот этап жизненного цикла науки о данных фокусируется на представлении инсайтов из данных так, чтобы решениям было легче их понять. | урок | Джейлен |
| 17 | Наука о данных в облаке | Облачные данные | Эта серия уроков знакомит с наукой о данных в облаке и её преимуществами. | урок | Тиффани и Мод |
| 18 | Наука о данных в облаке | Облачные данные | Обучение моделей с использованием Low Code инструментов. | урок | Тиффани и Мод |
| 19 | Наука о данных в облаке | Облачные данные | Развёртывание моделей с помощью Azure Machine Learning Studio. | урок | Тиффани и Мод |
| 20 | Наука о данных в реальной жизни | В реальной жизни | Проекты по науке о данных в реальном мире. | урок | Нития |
GitHub Codespaces
Выполните следующие шаги, чтобы открыть этот пример в Codespace:
- Нажмите на меню Code и выберите опцию Open with Codespaces.
- Внизу панели выберите + New codespace. Для получения дополнительной информации ознакомьтесь с документацией GitHub.
VSCode Remote - Containers
Выполните следующие шаги, чтобы открыть этот репозиторий в контейнере на вашем локальном компьютере с помощью VSCode и расширения VS Code Remote - Containers:
- Если вы впервые используете контейнер для разработки, убедитесь, что ваша система соответствует требованиям (например, установлен Docker) в руководстве по началу работы.
Для использования этого репозитория вы можете либо открыть репозиторий в изолированном Docker volume:
Примечание: Под капотом будет использоваться команда Remote-Containers: Clone Repository in Container Volume... для клонирования исходного кода в Docker volume вместо локальной файловой системы. Volumes — предпочтительный механизм для сохранения данных контейнера.
Или открыть локально клонированную или скачанную версию репозитория:
- Клонируйте этот репозиторий на локальный диск.
- Нажмите F1 и выберите команду Remote-Containers: Open Folder in Container....
- Выберите клонированную копию этой папки, дождитесь запуска контейнера и приступайте к работе.
Офлайн-доступ
Вы можете просматривать эту документацию офлайн с помощью Docsify. Форкайте этот репозиторий, установите Docsify на локальной машине, затем в корневой папке репозитория введите docsify serve. Сайт будет доступен на порту 3000 на вашем localhost: localhost:3000.
Обратите внимание, что ноутбуки не будут отображаться через Docsify, поэтому для работы с ноутбуками запускайте их отдельно в VS Code с поддержкой Python ядра.
Другие учебные программы
Наша команда создаёт и другие учебные программы! Ознакомьтесь с:
LangChain
Azure / Edge / MCP / Агенты
Серия по генеративному ИИ
Основное обучение
Серия Copilot
Получение помощи
Возникли проблемы? Ознакомьтесь с нашим руководством по устранению неполадок для решения распространённых проблем.
Если вы застряли или у вас есть вопросы по созданию AI-приложений, присоединяйтесь к другим учащимся и опытным разработчикам для обсуждения MCP. Это поддерживающее сообщество, где вопросы приветствуются, а знания свободно делятся.
Если у вас есть отзывы о продукте или вы столкнулись с ошибками при создании, посетите:
Отказ от ответственности:
Этот документ был переведен с помощью сервиса автоматического перевода Co-op Translator. Несмотря на наши усилия обеспечить точность, просим учитывать, что автоматический перевод может содержать ошибки или неточности. Оригинальный документ на исходном языке следует считать авторитетным источником. Для критически важной информации рекомендуется обращаться к профессиональному переводчику. Мы не несем ответственности за любые недоразумения или неправильные толкования, возникшие в результате использования данного перевода.



