24 KiB
Основи науки про дані - Навчальна програма
Azure Cloud Advocates у Microsoft раді запропонувати 10-тижневу, 20-урокову навчальну програму, присвячену науці про дані. Кожен урок включає тести перед і після заняття, письмові інструкції для виконання уроку, рішення та завдання. Наш підхід, заснований на проєктах, дозволяє навчатися через створення, що є перевіреним способом закріплення нових навичок.
Щиро дякуємо нашим авторам: Jasmine Greenaway, Dmitry Soshnikov, Nitya Narasimhan, Jalen McGee, Jen Looper, Maud Levy, Tiffany Souterre, Christopher Harrison.
🙏 Особлива подяка 🙏 нашим Microsoft Student Ambassador авторам, рецензентам та учасникам контенту, зокрема Aaryan Arora, Aditya Garg, Alondra Sanchez, Ankita Singh, Anupam Mishra, Arpita Das, ChhailBihari Dubey, Dibri Nsofor, Dishita Bhasin, Majd Safi, Max Blum, Miguel Correa, Mohamma Iftekher (Iftu) Ebne Jalal, Nawrin Tabassum, Raymond Wangsa Putra, Rohit Yadav, Samridhi Sharma, Sanya Sinha, Sheena Narula, Tauqeer Ahmad, Yogendrasingh Pawar , Vidushi Gupta, Jasleen Sondhi
![]() |
---|
Наука про дані для початківців - Скетчнот від @nitya |
🌐 Підтримка багатомовності
Підтримується через GitHub Action (Автоматично та завжди актуально)
French | Spanish | German | Russian | Arabic | Persian (Farsi) | Urdu | Chinese (Simplified) | Chinese (Traditional, Macau) | Chinese (Traditional, Hong Kong) | Chinese (Traditional, Taiwan) | Japanese | Korean | Hindi | Bengali | Marathi | Nepali | Punjabi (Gurmukhi) | Portuguese (Portugal) | Portuguese (Brazil) | Italian | Polish | Turkish | Greek | Thai | Swedish | Danish | Norwegian | Finnish | Dutch | Hebrew | Vietnamese | Indonesian | Malay | Tagalog (Filipino) | Swahili | Hungarian | Czech | Slovak | Romanian | Bulgarian | Serbian (Cyrillic) | Croatian | Slovenian | Ukrainian | Burmese (Myanmar)
Якщо ви хочете додати підтримку інших мов, список доступних мов наведено тут
Приєднуйтесь до нашої спільноти
Ви студент?
Почніть з наступних ресурсів:
- Сторінка Student Hub На цій сторінці ви знайдете ресурси для початківців, студентські пакети та навіть способи отримати безкоштовний сертифікат. Це сторінка, яку варто додати в закладки та час від часу перевіряти, оскільки ми змінюємо контент щонайменше щомісяця.
- Microsoft Learn Student Ambassadors Приєднуйтесь до глобальної спільноти студентів-амбасадорів, це може бути вашим шляхом до Microsoft.
Початок роботи
Вчителі: ми додали кілька пропозицій щодо використання цієї навчальної програми. Нам буде цікаво отримати ваші відгуки у нашому форумі обговорень!
Студенти: щоб використовувати цю навчальну програму самостійно, зробіть форк усього репозиторію та виконуйте вправи самостійно, починаючи з тесту перед лекцією. Потім прочитайте лекцію та виконайте решту завдань. Спробуйте створювати проєкти, розуміючи уроки, а не копіюючи код рішення; однак цей код доступний у папках /solutions у кожному проєктно-орієнтованому уроці. Ще одна ідея — створити навчальну групу з друзями та проходити контент разом. Для подальшого навчання ми рекомендуємо Microsoft Learn.
Знайомтесь із командою
Gif створено Mohit Jaisal
🎥 Натисніть на зображення вище, щоб переглянути відео про проєкт і людей, які його створили!
Педагогіка
Ми обрали два педагогічні принципи під час створення цієї навчальної програми: забезпечення її орієнтованості на проєкти та включення частих тестів. До кінця цієї серії студенти засвоять основні принципи науки про дані, включаючи етичні концепції, підготовку даних, різні способи роботи з даними, візуалізацію даних, аналіз даних, реальні приклади використання науки про дані тощо.
Крім того, тест з низькими ставками перед заняттям налаштовує студента на вивчення теми, а другий тест після заняття забезпечує подальше закріплення матеріалу. Ця навчальна програма була розроблена як гнучка та цікава і може бути пройдена повністю або частково. Проєкти починаються з простих і стають дедалі складнішими до кінця 10-тижневого циклу.
Знайдіть наші Правила поведінки, Рекомендації щодо внеску, Рекомендації щодо перекладу. Ми раді вашим конструктивним відгукам!
Кожен урок включає:
- Опціональний скетчноут
- Опціональне додаткове відео
- Розігрівний тест перед уроком
- Письмовий урок
- Для уроків, заснованих на проєктах, покрокові інструкції зі створення проєкту
- Перевірка знань
- Виклик
- Додаткове читання
- Завдання
- Тест після уроку
Примітка щодо тестів: Усі тести знаходяться в папці Quiz-App, загалом 40 тестів по три запитання кожен. Вони пов’язані з уроками, але додаток для тестів можна запустити локально або розгорнути в Azure; дотримуйтесь інструкцій у папці
quiz-app
. Тести поступово локалізуються.
Уроки
![]() |
---|
Data Science For Beginners: Дорожня карта - Скетчноут від @nitya |
Номер уроку | Тема | Групування уроків | Навчальні цілі | Посилання на урок | Автор |
---|---|---|---|---|---|
01 | Визначення науки про дані | Вступ | Вивчення основних концепцій науки про дані та її зв’язку зі штучним інтелектом, машинним навчанням і великими даними. | урок відео | Dmitry |
02 | Етика науки про дані | Вступ | Концепції, виклики та рамки етики даних. | урок | Nitya |
03 | Визначення даних | Вступ | Як класифікуються дані та їхні основні джерела. | урок | Jasmine |
04 | Вступ до статистики та ймовірності | Вступ | Математичні методи ймовірності та статистики для розуміння даних. | урок відео | Dmitry |
05 | Робота з реляційними даними | Робота з даними | Вступ до реляційних даних і основи їх дослідження та аналізу за допомогою мови SQL (вимовляється як "сі-квел"). | урок | Christopher |
06 | Робота з NoSQL-даними | Робота з даними | Вступ до нереляційних даних, їх різновидів і основи аналізу документних баз даних. | урок | Jasmine |
07 | Робота з Python | Робота з даними | Основи використання Python для дослідження даних за допомогою бібліотек, таких як Pandas. Рекомендується базове розуміння програмування на Python. | урок відео | Dmitry |
08 | Підготовка даних | Робота з даними | Теми щодо методів очищення та трансформації даних для вирішення проблем із відсутніми, неточними або неповними даними. | урок | Jasmine |
09 | Візуалізація кількісних даних | Візуалізація даних | Як використовувати Matplotlib для візуалізації даних про птахів 🦆 | урок | Jen |
10 | Візуалізація розподілу даних | Візуалізація даних | Візуалізація спостережень і трендів у межах інтервалу. | урок | Jen |
11 | Візуалізація пропорцій | Візуалізація даних | Візуалізація дискретних і згрупованих відсотків. | урок | Jen |
12 | Візуалізація взаємозв’язків | Візуалізація даних | Візуалізація зв’язків і кореляцій між наборами даних і їх змінними. | урок | Jen |
13 | Змістовні візуалізації | Візуалізація даних | Техніки та рекомендації для створення візуалізацій, які допомагають ефективно вирішувати проблеми та отримувати інсайти. | урок | Jen |
14 | Вступ до життєвого циклу науки про дані | Життєвий цикл | Вступ до життєвого циклу науки про дані та його першого етапу — отримання та вилучення даних. | урок | Jasmine |
15 | Аналіз | Життєвий цикл | Ця фаза життєвого циклу науки про дані зосереджена на методах аналізу даних. | урок | Jasmine |
16 | Комунікація | Життєвий цикл | Ця фаза життєвого циклу науки про дані зосереджена на представленні інсайтів із даних у зрозумілому для прийняття рішень форматі. | урок | Jalen |
17 | Наука про дані в хмарі | Хмарні дані | Ця серія уроків знайомить із наукою про дані в хмарі та її перевагами. | урок | Tiffany та Maud |
18 | Наука про дані в хмарі | Хмарні дані | Навчання моделей за допомогою інструментів Low Code. | урок | Tiffany та Maud |
19 | Наука про дані в хмарі | Хмарні дані | Розгортання моделей за допомогою Azure Machine Learning Studio. | урок | Tiffany та Maud |
20 | Наука про дані в реальному світі | У реальному світі | Проєкти, засновані на науці про дані, у реальному світі. | урок | Nitya |
GitHub Codespaces
Дотримуйтесь цих кроків, щоб відкрити цей приклад у Codespace:
- Натисніть на випадаюче меню Code і виберіть опцію Open with Codespaces.
- Виберіть + New codespace внизу панелі. Для отримання додаткової інформації ознайомтеся з документацією GitHub.
VSCode Remote - Containers
Дотримуйтесь цих кроків, щоб відкрити цей репозиторій у контейнері за допомогою вашого локального комп’ютера та VSCode, використовуючи розширення VS Code Remote - Containers:
- Якщо ви вперше використовуєте контейнер для розробки, переконайтеся, що ваша система відповідає вимогам (наприклад, встановлено Docker) у документації для початківців.
Щоб використовувати цей репозиторій, ви можете або відкрити його в ізольованому томі Docker:
Примітка: У фоновому режимі буде використано команду Remote-Containers: Clone Repository in Container Volume..., щоб клонувати вихідний код у том Docker замість локальної файлової системи. Томи є рекомендованим механізмом для збереження даних контейнера.
Або відкрийте локально клоновану чи завантажену версію репозиторію:
- Клонуйте цей репозиторій у вашу локальну файлову систему.
- Натисніть F1 і виберіть команду Remote-Containers: Open Folder in Container....
- Виберіть клоновану копію цієї папки, дочекайтеся запуску контейнера та спробуйте.
Офлайн-доступ
Ви можете запустити цю документацію офлайн за допомогою Docsify. Форкніть цей репозиторій, встановіть Docsify на ваш локальний комп’ютер, а потім у кореневій папці цього репозиторію введіть docsify serve
. Вебсайт буде доступний на порту 3000 вашого localhost: localhost:3000
.
Примітка: блокноти не будуть відображатися через Docsify, тому, якщо вам потрібно запустити блокнот, зробіть це окремо у VS Code, використовуючи Python kernel.
Інші навчальні програми
Наша команда створює інші навчальні програми! Ознайомтеся з:
- Generative AI for Beginners
- Generative AI for Beginners .NET
- Generative AI with JavaScript
- Generative AI with Java
- AI for Beginners
- Data Science for Beginners
- ML for Beginners
- Cybersecurity for Beginners
- Web Dev for Beginners
- IoT for Beginners
- XR Development for Beginners
- Mastering GitHub Copilot for Paired Programming
- Mastering GitHub Copilot for C#/.NET Developers
- Choose Your Own Copilot Adventure
Відмова від відповідальності:
Цей документ був перекладений за допомогою сервісу автоматичного перекладу Co-op Translator. Хоча ми прагнемо до точності, будь ласка, майте на увазі, що автоматичні переклади можуть містити помилки або неточності. Оригінальний документ на його рідній мові слід вважати авторитетним джерелом. Для критичної інформації рекомендується професійний людський переклад. Ми не несемо відповідальності за будь-які непорозуміння або неправильні тлумачення, що виникають внаслідок використання цього перекладу.