24 KiB
Наука за данни за начинаещи - Учебна програма
Azure Cloud Advocates в Microsoft с удоволствие предлагат 10-седмична, 20-урочна учебна програма, посветена на науката за данни. Всеки урок включва предварителни и последващи тестове, писмени инструкции за изпълнение на урока, решение и задача. Нашият подход, базиран на проекти, ви позволява да учите, докато създавате, доказан начин за усвояване на нови умения.
Сърдечни благодарности на нашите автори: Jasmine Greenaway, Dmitry Soshnikov, Nitya Narasimhan, Jalen McGee, Jen Looper, Maud Levy, Tiffany Souterre, Christopher Harrison.
🙏 Специални благодарности 🙏 на нашите Microsoft Student Ambassador автори, рецензенти и сътрудници на съдържание, включително Aaryan Arora, Aditya Garg, Alondra Sanchez, Ankita Singh, Anupam Mishra, Arpita Das, ChhailBihari Dubey, Dibri Nsofor, Dishita Bhasin, Majd Safi, Max Blum, Miguel Correa, Mohamma Iftekher (Iftu) Ebne Jalal, Nawrin Tabassum, Raymond Wangsa Putra, Rohit Yadav, Samridhi Sharma, Sanya Sinha, Sheena Narula, Tauqeer Ahmad, Yogendrasingh Pawar , Vidushi Gupta, Jasleen Sondhi
![]() |
---|
Наука за данни за начинаещи - Скетч от @nitya |
Съобщение - Нова учебна програма за Генеративен AI е вече налична!
Току-що пуснахме 12-урочна учебна програма за генеративен AI. Научете неща като:
- създаване на заявки и инженеринг на заявки
- генериране на текстови и визуални приложения
- приложения за търсене
Както обикновено, има урок, задачи за изпълнение, проверки на знанията и предизвикателства.
Вижте тук:
Студент ли сте?
Започнете с тези ресурси:
- Студентска страница На тази страница ще намерите ресурси за начинаещи, студентски пакети и дори начини да получите безплатен ваучер за сертификат. Това е страница, която си струва да запазите и проверявате редовно, тъй като съдържанието се обновява поне веднъж месечно.
- Microsoft Learn Student Ambassadors Присъединете се към глобална общност от студентски посланици, това може да бъде вашият път към Microsoft.
Започнете
Учители: включили сме някои предложения за това как да използвате тази учебна програма. Ще се радваме на вашата обратна връзка в нашия форум за дискусии!
Студенти: за да използвате тази учебна програма самостоятелно, клонирайте цялото хранилище и изпълнете упражненията самостоятелно, започвайки с предварителен тест. След това прочетете урока и завършете останалите дейности. Опитайте се да създадете проектите, като разбирате уроците, вместо да копирате кода на решенията; въпреки това, този код е наличен в папките /solutions във всеки проектно-ориентиран урок. Друга идея е да създадете учебна група с приятели и да преминете през съдържанието заедно. За допълнително обучение препоръчваме Microsoft Learn.
Запознайте се с екипа
Gif от Mohit Jaisal
🎥 Кликнете върху изображението по-горе за видео за проекта и хората, които го създадоха!
Педагогика
Избрахме два педагогически принципа при създаването на тази учебна програма: да гарантираме, че тя е базирана на проекти и че включва чести тестове. До края на тази серия студентите ще са научили основни принципи на науката за данни, включително етични концепции, подготовка на данни, различни начини за работа с данни, визуализация на данни, анализ на данни, реални приложения на науката за данни и други.
Освен това, тест с нисък риск преди урока насочва вниманието на студента към изучаването на дадена тема, докато втори тест след урока гарантира по-добро запаметяване. Тази учебна програма е проектирана да бъде гъвкава и забавна и може да бъде взета изцяло или частично. Проектите започват малки и стават все по-сложни до края на 10-седмичния цикъл.
Намерете нашите Правила за поведение, Принос, Превод насоки. Ще се радваме на вашата конструктивна обратна връзка!
Всеки урок включва:
- По избор скетч
- По избор допълнително видео
- Предварителен тест за загряване
- Писмен урок
- За уроци, базирани на проекти, ръководства стъпка по стъпка за изграждане на проекта
- Проверки на знанията
- Предизвикателство
- Допълнително четене
- Задача
- Последващ тест
Бележка за тестовете: Всички тестове се намират в папката Quiz-App, за общо 40 теста с по три въпроса всеки. Те са свързани от уроците, но приложението за тестове може да се изпълнява локално или да се разположи в Azure; следвайте инструкциите в папката
quiz-app
. Постепенно се локализират.
Уроци
![]() |
---|
Наука за данни за начинаещи: Пътна карта - Скетч от @nitya |
Номер на урока | Тема | Групиране на урока | Цели на обучението | Свързан урок | Автор |
---|---|---|---|---|---|
01 | Определяне на науката за данни | Въведение | Научете основните концепции зад науката за данни и как тя е свързана с изкуствения интелект, машинното обучение и големите данни. | урок видео | Dmitry |
02 | Етика в науката за данни | Въведение | Концепции за етика на данните, предизвикателства и рамки. | урок | Nitya |
03 | Определяне на данни | Въведение | Как се класифицират данните и техните общи източници. | урок | Jasmine |
04 | Въведение в статистиката и вероятността | Въведение | Математическите техники на вероятността и статистиката за разбиране на данни. | урок видео | Dmitry |
05 | Работа с релационни данни | Работа с данни | Въведение в релационните данни и основите на изследването и анализа на релационни данни със Structured Query Language, известен като SQL (произнася се „си-квел“). | урок | Christopher |
06 | Работа с NoSQL данни | Работа с данни | Въведение в нерелационните данни, техните различни типове и основите на изследването и анализа на документни бази данни. | урок | Jasmine |
07 | Работа с Python | Работа с данни | Основи на използването на Python за изследване на данни с библиотеки като Pandas. Препоръчва се основно разбиране на програмирането с Python. | урок видео | Dmitry |
08 | Подготовка на данни | Работа с данни | Теми за техники за почистване и трансформиране на данни, за справяне с предизвикателства като липсващи, неточни или непълни данни. | урок | Jasmine |
09 | Визуализиране на количества | Визуализация на данни | Научете как да използвате Matplotlib за визуализиране на данни за птици 🦆 | урок | Jen |
10 | Визуализиране на разпределения на данни | Визуализация на данни | Визуализиране на наблюдения и тенденции в рамките на интервал. | урок | Jen |
11 | Визуализиране на пропорции | Визуализация на данни | Визуализиране на дискретни и групирани проценти. | урок | Jen |
12 | Визуализиране на взаимоотношения | Визуализация на данни | Визуализиране на връзки и корелации между набори от данни и техните променливи. | урок | Jen |
13 | Значими визуализации | Визуализация на данни | Техники и насоки за създаване на визуализации, които са ценни за ефективно решаване на проблеми и извличане на прозрения. | урок | Jen |
14 | Въведение в жизнения цикъл на науката за данни | Жизнен цикъл | Въведение в жизнения цикъл на науката за данни и първата му стъпка - придобиване и извличане на данни. | урок | Jasmine |
15 | Анализиране | Жизнен цикъл | Тази фаза от жизнения цикъл на науката за данни се фокусира върху техники за анализ на данни. | урок | Jasmine |
16 | Комуникация | Жизнен цикъл | Тази фаза от жизнения цикъл на науката за данни се фокусира върху представянето на прозренията от данните по начин, който улеснява разбирането от страна на вземащите решения. | урок | Jalen |
17 | Наука за данни в облака | Облачни данни | Тази серия от уроци представя науката за данни в облака и нейните предимства. | урок | Tiffany и Maud |
18 | Наука за данни в облака | Облачни данни | Обучение на модели с помощта на инструменти за нисък код. | урок | Tiffany и Maud |
19 | Наука за данни в облака | Облачни данни | Деплойване на модели с Azure Machine Learning Studio. | урок | Tiffany и Maud |
20 | Наука за данни в реалния свят | В реалния свят | Проекти, базирани на науката за данни, в реалния свят. | урок | Nitya |
GitHub Codespaces
Следвайте тези стъпки, за да отворите този пример в Codespace:
- Кликнете върху падащото меню Code и изберете опцията Open with Codespaces.
- Изберете + New codespace в долната част на панела. За повече информация, вижте документацията на GitHub.
VSCode Remote - Containers
Следвайте тези стъпки, за да отворите това хранилище в контейнер, използвайки вашата локална машина и VSCode с разширението VS Code Remote - Containers:
- Ако за първи път използвате контейнер за разработка, уверете се, че вашата система отговаря на предварителните изисквания (например, инсталиран Docker) в документацията за започване.
За да използвате това хранилище, можете да го отворите в изолиран Docker обем:
Забележка: В основата си това ще използва командата Remote-Containers: Clone Repository in Container Volume..., за да клонира изходния код в Docker обем вместо в локалната файлова система. Обемите са предпочитаният механизъм за запазване на данни в контейнера.
Или да отворите локално клонирана или изтеглена версия на хранилището:
- Клонирайте това хранилище на вашата локална файлова система.
- Натиснете F1 и изберете командата Remote-Containers: Open Folder in Container....
- Изберете клонираното копие на тази папка, изчакайте контейнерът да стартира и опитайте.
Офлайн достъп
Можете да стартирате тази документация офлайн, използвайки Docsify. Форкнете това хранилище, инсталирайте Docsify на вашата локална машина, след това в основната папка на това хранилище въведете docsify serve
. Уебсайтът ще бъде достъпен на порт 3000 на вашия localhost: localhost:3000
.
Забележка: тетрадките няма да бъдат визуализирани чрез Docsify, така че когато трябва да стартирате тетрадка, направете го отделно в VS Code, използвайки Python kernel.
Търсим помощ!
Ако искате да преведете цялата или част от учебната програма, моля, следвайте нашето ръководство Translations.
Други учебни програми
Нашият екип създава и други учебни програми! Вижте:
- Generative AI for Beginners
- Generative AI for Beginners .NET
- Generative AI with JavaScript
- Generative AI with Java
- AI for Beginners
- Data Science for Beginners
- ML for Beginners
- Cybersecurity for Beginners
- Web Dev for Beginners
- IoT for Beginners
- XR Development for Beginners
- Mastering GitHub Copilot for Paired Programming
- Mastering GitHub Copilot for C#/.NET Developers
- Choose Your Own Copilot Adventure
Отказ от отговорност:
Този документ е преведен с помощта на AI услуга за превод Co-op Translator. Въпреки че се стремим към точност, моля, имайте предвид, че автоматизираните преводи може да съдържат грешки или неточности. Оригиналният документ на неговия роден език трябва да се счита за авторитетен източник. За критична информация се препоръчва професионален човешки превод. Ние не носим отговорност за каквито и да било недоразумения или погрешни интерпретации, произтичащи от използването на този превод.