|
|
7 days ago | |
|---|---|---|
| .. | ||
| 1-Introduction | 7 days ago | |
| 2-Working-With-Data | 7 days ago | |
| 3-Data-Visualization | 7 days ago | |
| 4-Data-Science-Lifecycle | 7 days ago | |
| 5-Data-Science-In-Cloud | 7 days ago | |
| 6-Data-Science-In-Wild | 7 days ago | |
| docs | 1 month ago | |
| examples | 1 month ago | |
| quiz-app | 1 month ago | |
| sketchnotes | 7 days ago | |
| .co-op-translator.json | 7 days ago | |
| AGENTS.md | 1 month ago | |
| CODE_OF_CONDUCT.md | 1 month ago | |
| CONTRIBUTING.md | 1 month ago | |
| INSTALLATION.md | 1 month ago | |
| README.md | 7 days ago | |
| SECURITY.md | 1 month ago | |
| SUPPORT.md | 1 month ago | |
| TROUBLESHOOTING.md | 1 month ago | |
| USAGE.md | 1 month ago | |
| for-teachers.md | 1 month ago | |
README.md
Data Science для начинающих - учебная программа
Azure Cloud Advocates в Microsoft рады предложить 10-недельную программу из 20 уроков полностью посвящённую Data Science. Каждый урок включает викторины до и после урока, письменные инструкции для выполнения урока, решение и задание. Наш проектно-ориентированный подход позволяет учиться, одновременно создавая проекты — доказанный способ лучше усваивать новые навыки.
Большая благодарность нашим авторам: Jasmine Greenaway, Dmitry Soshnikov, Nitya Narasimhan, Jalen McGee, Jen Looper, Maud Levy, Tiffany Souterre, Christopher Harrison.
🙏 Особая благодарность 🙏 нашим авторам, рецензентам и контентным участникам из Microsoft Student Ambassador, в частности Aaryan Arora, Aditya Garg, Alondra Sanchez, Ankita Singh, Anupam Mishra, Arpita Das, ChhailBihari Dubey, Dibri Nsofor, Dishita Bhasin, Majd Safi, Max Blum, Miguel Correa, Mohamma Iftekher (Iftu) Ebne Jalal, Nawrin Tabassum, Raymond Wangsa Putra, Rohit Yadav, Samridhi Sharma, Sanya Sinha, Sheena Narula, Tauqeer Ahmad, Yogendrasingh Pawar , Vidushi Gupta, Jasleen Sondhi
![]() |
|---|
| Data Science для начинающих - Скетчноут от @nitya |
🌐 Многоязычная поддержка
Поддерживается через GitHub Action (Автоматически и всегда актуально)
Арабский | Бенгали | Болгарский | Бирманский (Мьянма) | Китайский (упрощённый) | Китайский (традиционный, Гонконг) | Китайский (традиционный, Макао) | Китайский (традиционный, Тайвань) | Хорватский | Чешский | Датский | Нидерландский | Эстонский | Финский | Французский | Немецкий | Греческий | Иврит | Хинди | Венгерский | Индонезийский | Итальянский | Японский | Каннада | Корейский | Литовский | Малазийский | Малаялам | Марати | Непальский | Нигерийский пиджин | Норвежский | Персидский (фарси) | Польский | Португальский (Бразилия) | Португальский (Португалия) | Пенджаби (Гурмукхи) | Румынский | Русский | Сербский (кириллица) | Словацкий | Словенский | Испанский | Свахили | Шведский | Тагальский (филиппинский) | Тамильский | Телугу | Тайский | Турецкий | Украинский | Урду | Вьетнамский
Предпочитаете клонировать локально?
В этом репозитории есть более 50 языковых переводов, что значительно увеличивает размер скачивания. Чтобы клонировать без переводов, используйте sparse checkout:
Bash / macOS / Linux:
git clone --filter=blob:none --sparse https://github.com/microsoft/Data-Science-For-Beginners.git cd Data-Science-For-Beginners git sparse-checkout set --no-cone '/*' '!translations' '!translated_images'CMD (Windows):
git clone --filter=blob:none --sparse https://github.com/microsoft/Data-Science-For-Beginners.git cd Data-Science-For-Beginners git sparse-checkout set --no-cone "/*" "!translations" "!translated_images"Это даст вам всё, что нужно для прохождения курса с гораздо более быстрой загрузкой.
Если вы хотите, чтобы дополнительные языки переводов были поддержаны, они перечислены здесь
Присоединяйтесь к нашему сообществу
У нас продолжается серия занятий в Discord с обучением с помощью ИИ, узнайте больше и присоединяйтесь к нам на Learn with AI Series с 18 по 30 сентября 2025 года. Вы получите советы и хитрости по использованию GitHub Copilot для Data Science.
Вы студент?
Начните с следующих ресурсов:
- Страница Student Hub На этой странице вы найдете ресурсы для начинающих, студенческие наборы и даже способы получить бесплатный сертификат. Это страница, которую стоит добавить в закладки и время от времени проверять, поскольку мы обновляем контент как минимум раз в месяц.
- Microsoft Learn Student Ambassadors Присоединяйтесь к глобальному сообществу студенческих амбассадоров, это может стать вашим путём в Microsoft.
Начало работы
📚 Документация
- Руководство по установке - Пошаговые инструкции по настройке для начинающих
- Руководство по использованию - Примеры и распространённые сценарии работы
- Устранение неисправностей - Решения распространённых проблем
- Руководство по внесению вклада - Как внести вклад в этот проект
- Для преподавателей - Методические указания и материалы для занятий
👨🎓 Для студентов
Полные новички: Новички в Data Science? Начните с наших примеров для начинающих! Эти простые, хорошо прокомментированные примеры помогут вам разобраться с основами перед изучением всей программы. Студенты: чтобы использовать эту программу самостоятельно, форкните весь репозиторий и выполняйте упражнения самостоятельно, начиная с викторины до лекции. Затем прочитайте лекцию и выполните остальные задания. Старайтесь создавать проекты, понимая уроки, а не просто копируя решения; однако код решений доступен в папках /solutions для каждого урока с проектами. Ещё одна идея — сформировать учебную группу с друзьями и проходить материал вместе. Для дополнительного обучения рекомендуем Microsoft Learn.
Быстрый старт:
- Ознакомьтесь с Руководством по установке для настройки среды
- Изучите Руководство по использованию, чтобы понять работу с программой
- Начинайте с урока 1 и проходите последовательно
- Присоединяйтесь к нашему сообществу Discord для поддержки
👩🏫 Для преподавателей
Преподаватели: мы включили некоторые рекомендации по использованию этой учебной программы. Будем рады вашим отзывам в нашем форуме для обсуждений!
Познакомьтесь с командой
Гифка от Mohit Jaisal
🎥 Нажмите на изображение выше для просмотра видео о проекте и людях, которые его создали!
Педагогика
Мы выбрали два педагогических принципа при создании этой учебной программы: сделать её проектно-ориентированной и включить частые викторины. К концу серии студенты изучат основные принципы науки о данных, включая этические концепции, подготовку данных, различные способы работы с данными, визуализацию данных, анализ данных, реальные случаи применения науки о данных и многое другое.
Кроме того, викторина с низкой степенью сложности перед занятием задаёт настрой студента на изучение темы, а вторая викторина после занятия помогает закрепить материал. Эта учебная программа разработана, чтобы быть гибкой и увлекательной, её можно пройти целиком или частично. Проекты начинаются с простых и становятся всё более сложными к концу 10-недельного цикла.
Посмотрите наши Правила поведения, Правила внесения изменений, Руководство по переводу. Мы приветствуем ваши конструктивные отзывы!
В каждом уроке есть:
- Опциональная зарисовка
- Опциональное дополнительное видео
- Разминка-викторина перед уроком
- Текст урока
- Для проектно-ориентированных уроков — пошаговые инструкции по созданию проекта
- Проверки знаний
- Задание вызова
- Дополнительное чтение
- Домашнее задание
- Викторина после урока
Примечание о викторинах: Все викторины находятся в папке Quiz-App, всего 40 викторин по три вопроса каждая. Они связаны из уроков, но приложение викторин можно запускать локально или развернуть в Azure; следуйте инструкциям в папке
quiz-app. Они постепенно локализуются.
🎓 Примеры для начинающих
Новый в науке о данных? Мы создали специальный каталог с примерами с простым, хорошо комментированным кодом, чтобы помочь вам начать:
- 🌟 Hello World — Ваша первая программа по науке о данных
- 📂 Загрузка данных — Учитесь читать и исследовать наборы данных
- 📊 Простой анализ — Рассчитывайте статистику и находите закономерности
- 📈 Базовая визуализация — Создавайте диаграммы и графики
- 🔬 Реальный проект — Полный рабочий процесс от начала до конца
Каждый пример содержит подробные комментарии, объясняющие каждый шаг, что идеально подходит для абсолютных начинающих!
Уроки
![]() |
|---|
| Наука о данных для начинающих: план - Зарисовка от @nitya |
| Номер урока | Тема | Группа уроков | Цели обучения | Связанный урок | Автор |
|---|---|---|---|---|---|
| 01 | Определение науки о данных | Введение | Изучить базовые концепции науки о данных и её связь с искусственным интеллектом, машинным обучением и большими данными. | урок видео | Дмитрий |
| 02 | Этика в науке о данных | Введение | Концепции этики данных, вызовы и рамки. | урок | Нитья |
| 03 | Определение данных | Введение | Как классифицируются данные и их основные источники. | урок | Жасмин |
| 04 | Введение в статистику и вероятность | Введение | Математические методы вероятности и статистики для понимания данных. | урок видео | Дмитрий |
| 05 | Работа с реляционными данными | Работа с данными | Введение в реляционные данные и основы исследования и анализа реляционных данных с помощью языка структурированных запросов, известного как SQL (произносится «си-кью-эл»). | урок | Кристофер |
| 06 | Работа с NoSQL данными | Работа с данными | Введение в нереляционные данные, их различные типы и основы исследования и анализа документальных баз данных. | урок | Жасмин |
| 07 | Работа с Python | Работа с данными | Основы использования Python для исследования данных с библиотеками, такими как Pandas. Рекомендуется базовое понимание программирования на Python. | урок видео | Дмитрий |
| 08 | Подготовка данных | Работа с данными | Темы, касающиеся техник очистки и преобразования данных для решения проблем с отсутствующими, неточными или неполными данными. | урок | Жасмин |
| 09 | Визуализация количеств | Визуализация данных | Изучите, как использовать Matplotlib для визуализации данных о птицах 🦆 | урок | Джен |
| 10 | Визуализация распределений данных | Визуализация данных | Визуализация наблюдений и тенденций в интервале. | урок | Джен |
| 11 | Визуализация пропорций | Визуализация данных | Визуализация дискретных и групповых процентов. | урок | Джен |
| 12 | Визуализация связей | Визуализация данных | Визуализация связей и корреляций между наборами данных и их переменными. | урок | Джен |
| 13 | Значимые визуализации | Визуализация данных | Техники и рекомендации для создания визуализаций, которые ценны для эффективного решения задач и получения инсайтов. | урок | Джен |
| 14 | Введение в жизненный цикл науки о данных | Жизненный цикл | Введение в жизненный цикл науки о данных и его первый этап — сбор и извлечение данных. | урок | Жасмин |
| 15 | Анализ | Жизненный цикл | Этот этап жизненного цикла науки о данных сосредоточен на техниках анализа данных. | урок | Жасмин |
| 16 | Коммуникация | Жизненный цикл | Этот этап жизненного цикла науки о данных сосредоточен на представлении выводов из данных таким образом, чтобы обусловить лучшее понимание у принимающих решения. | урок | Джейлен |
| 17 | Наука о данных в облаке | Данные в облаке | Эта серия уроков знакомит с наукой о данных в облаке и её преимуществами. | урок | Тиффани и Мод |
| 18 | Наука о данных в облаке | Данные в облаке | Обучение моделей с использованием Low Code инструментов. | урок | Тиффани и Мод |
| 19 | Наука о данных в облаке | Данные в облаке | Развёртывание моделей с помощью Azure Machine Learning Studio. | урок | Тиффани и Мод |
| 20 | Наука о данных в реальной жизни | В реальной жизни | Проекты, основанные на науке о данных в реальном мире. | урок | Нитья |
GitHub Codespaces
Выполните следующие шаги, чтобы открыть этот пример в Codespace:
- Нажмите на выпадающее меню Code и выберите опцию Open with Codespaces.
- Выберите + New codespace внизу панели. Для дополнительной информации смотрите документацию GitHub.
VSCode Remote - Контейнеры
Выполните следующие шаги, чтобы открыть этот репозиторий в контейнере на локальной машине с помощью VSCode и расширения VS Code Remote - Containers:
- Если вы используете контейнер разработки впервые, убедитесь, что ваша система соответствует требованиям (например, установлен Docker) в документации по началу работы.
Чтобы использовать этот репозиторий, вы можете открыть репозиторий в изолированном Docker томе:
Примечание: В основе этого используется команда Remote-Containers: Clone Repository in Container Volume..., которая клонирует исходный код в Docker том вместо файловой системы локального компьютера. Тома — предпочтительный механизм для сохранения данных контейнера.
Или открыть локально клонированную или загруженную версию репозитория:
- Клонируйте этот репозиторий на свой локальный диск.
- Нажмите F1 и выберите команду Remote-Containers: Open Folder in Container....
- Выберите клонированную копию этой папки, дождитесь запуска контейнера и приступайте к работе.
Офлайн-доступ
Вы можете запускать эту документацию офлайн, используя Docsify. Форкните этот репозиторий, установите Docsify на свой локальный компьютер, затем в корневой папке репозитория введите docsify serve. Веб-сайт будет доступен на порту 3000 на вашем локальном хосте: localhost:3000.
Обратите внимание, что ноутбуки не будут отображаться через Docsify, поэтому для работы с ноутбуками используйте VS Code с Python ядром отдельно.
Другие учебные программы
Наша команда выпускает и другие учебные программы! Ознакомьтесь с:
LangChain
Azure / Edge / MCP / Агенты
Серия по генеративному ИИ
Основное обучение
Серия Copilot
Получение помощи
Возникли проблемы? Ознакомьтесь с нашим Руководством по устранению неполадок для поиска решений распространённых проблем.
Если вы застряли или у вас есть вопросы по созданию ИИ-приложений, присоединяйтесь к другим учащимся и опытным разработчикам для обсуждений по MCP. Это поддерживающее сообщество, где вопросы приветствуются, а знания свободно делятся.
Если у вас есть отзывы по продукту или вы обнаружили ошибки при разработке, посетите:
Отказ от ответственности: Данный документ был переведен с помощью сервиса машинного перевода Co-op Translator. Несмотря на наши усилия по обеспечению точности, имейте в виду, что автоматический перевод может содержать ошибки или неточности. Исходный документ на его оригинальном языке следует считать авторитетным источником. Для получения критически важной информации рекомендуется обратиться к профессиональному человеческому переводу. Мы не несем ответственности за любые недоразумения или искажения смысла, возникающие в результате использования данного перевода.



