|
3 days ago | |
---|---|---|
.. | ||
1-Introduction | 2 weeks ago | |
2-Working-With-Data | 2 weeks ago | |
3-Data-Visualization | 2 weeks ago | |
4-Data-Science-Lifecycle | 2 weeks ago | |
5-Data-Science-In-Cloud | 2 weeks ago | |
6-Data-Science-In-Wild | 2 weeks ago | |
docs | 3 weeks ago | |
quiz-app | 3 weeks ago | |
sketchnotes | 3 weeks ago | |
CODE_OF_CONDUCT.md | 3 weeks ago | |
CONTRIBUTING.md | 3 weeks ago | |
README.md | 3 days ago | |
SECURITY.md | 3 weeks ago | |
SUPPORT.md | 3 weeks ago | |
for-teachers.md | 2 weeks ago |
README.md
Duomenų mokslas pradedantiesiems - Mokymo programa
Azure Cloud Advocates iš Microsoft džiaugiasi galėdami pasiūlyti 10 savaičių, 20 pamokų mokymo programą apie duomenų mokslą. Kiekviena pamoka apima prieš pamoką ir po pamokos pateikiamus testus, rašytines instrukcijas pamokai atlikti, sprendimą ir užduotį. Mūsų projektinis mokymosi metodas leidžia mokytis kuriant, o tai yra patikrintas būdas įsisavinti naujus įgūdžius.
Nuoširdžiai dėkojame mūsų autoriams: Jasmine Greenaway, Dmitry Soshnikov, Nitya Narasimhan, Jalen McGee, Jen Looper, Maud Levy, Tiffany Souterre, Christopher Harrison.
🙏 Speciali padėka 🙏 mūsų Microsoft Student Ambassador autoriams, recenzentams ir turinio kūrėjams, ypač Aaryan Arora, Aditya Garg, Alondra Sanchez, Ankita Singh, Anupam Mishra, Arpita Das, ChhailBihari Dubey, Dibri Nsofor, Dishita Bhasin, Majd Safi, Max Blum, Miguel Correa, Mohamma Iftekher (Iftu) Ebne Jalal, Nawrin Tabassum, Raymond Wangsa Putra, Rohit Yadav, Samridhi Sharma, Sanya Sinha, Sheena Narula, Tauqeer Ahmad, Yogendrasingh Pawar, Vidushi Gupta, Jasleen Sondhi
![]() |
---|
Duomenų mokslas pradedantiesiems - Sketchnote by @nitya |
🌐 Daugiakalbė palaikymas
Palaikoma per GitHub Action (Automatizuota ir visada atnaujinta)
Prancūzų | Ispanų | Vokiečių | Rusų | Arabų | Persų (Farsi) | Urdu | Kinų (Supaprastinta) | Kinų (Tradicinė, Makao) | Kinų (Tradicinė, Honkongas) | Kinų (Tradicinė, Taivanas) | Japonų | Korėjiečių | Hindi | Bengalų | Marathi | Nepalų | Pundžabi (Gurmukhi) | Portugalų (Portugalija) | Portugalų (Brazilija) | Italų | Lenkų | Turkų | Graikų | Tajų | Švedų | Danų | Norvegų | Suomių | Olandų | Hebrajų | Vietnamiečių | Indoneziečių | Malajų | Tagalog (Filipiniečių) | Svahilių | Vengrų | Čekų | Slovakų | Rumunų | Bulgarų | Serbų (Kirilica) | Kroatų | Slovėnų | Ukrainiečių | Birmos (Mianmaras)
Jei norite, kad būtų palaikomos papildomos kalbos, sąrašą rasite čia
Prisijunkite prie mūsų bendruomenės
Turime Discord mokymų su AI seriją, sužinokite daugiau ir prisijunkite prie mūsų Learn with AI Series nuo 2025 m. rugsėjo 18 iki 25 d. Čia gausite patarimų ir gudrybių, kaip naudoti GitHub Copilot duomenų mokslui.
Ar esate studentas?
Pradėkite nuo šių išteklių:
- Studentų centras Šiame puslapyje rasite pradedančiųjų išteklius, studentų paketus ir net būdus, kaip gauti nemokamą sertifikato kuponą. Tai puslapis, kurį verta pažymėti ir kartkartėmis patikrinti, nes turinį keičiame bent kartą per mėnesį.
- Microsoft Learn Student Ambassadors Prisijunkite prie pasaulinės studentų ambasadorių bendruomenės, tai gali būti jūsų kelias į Microsoft.
Pradžia
Mokytojai: mes įtraukėme keletą pasiūlymų, kaip naudoti šią mokymo programą. Laukiame jūsų atsiliepimų mūsų diskusijų forume!
Studentai: norėdami naudoti šią mokymo programą savarankiškai, nukopijuokite visą saugyklą ir atlikite užduotis savarankiškai, pradėdami nuo prieš pamoką pateikiamo testo. Tada perskaitykite pamoką ir atlikite likusias veiklas. Stenkitės kurti projektus suprasdami pamokas, o ne kopijuodami sprendimo kodą; tačiau tas kodas yra prieinamas /solutions aplankuose kiekvienoje projektinėje pamokoje. Kita idėja būtų sukurti mokymosi grupę su draugais ir kartu peržiūrėti turinį. Tolimesniam mokymuisi rekomenduojame Microsoft Learn.
Susipažinkite su komanda
Gif sukūrė Mohit Jaisal
🎥 Spustelėkite aukščiau esančią nuotrauką, kad pamatytumėte vaizdo įrašą apie projektą ir žmones, kurie jį sukūrė!
Pedagogika
Kuriant šią mokymo programą, mes pasirinkome du pedagoginius principus: užtikrinti, kad ji būtų projektinė, ir įtraukti dažnus testus. Baigę šią seriją, studentai išmoks pagrindinius duomenų mokslo principus, įskaitant etikos koncepcijas, duomenų paruošimą, skirtingus darbo su duomenimis būdus, duomenų vizualizaciją, duomenų analizę, realaus pasaulio duomenų mokslo panaudojimo atvejus ir daugiau.
Be to, mažos rizikos testas prieš pamoką nustato studento ketinimą mokytis temos, o antrasis testas po pamokos užtikrina geresnį įsisavinimą. Ši mokymo programa buvo sukurta taip, kad būtų lanksti ir įdomi, ją galima naudoti visą arba dalimis. Projektai prasideda nuo mažų ir tampa vis sudėtingesni iki 10 savaičių ciklo pabaigos.
Rasite mūsų Elgesio kodeksą, Prisidėjimo, Vertimo gaires. Laukiame jūsų konstruktyvių atsiliepimų!
Kiekviena pamoka apima:
- Pasirenkamą eskizą
- Pasirenkamą papildomą vaizdo įrašą
- Įžanginį testą prieš pamoką
- Rašytinę pamoką
- Projektinėms pamokoms – žingsnis po žingsnio vadovus, kaip sukurti projektą
- Žinių patikrinimus
- Iššūkį
- Papildomą skaitymą
- Užduotį
- Testą po pamokos
Pastaba apie testus: Visi testai yra „Quiz-App“ aplanke, iš viso 40 testų, kiekviename po tris klausimus. Jie yra susieti su pamokomis, tačiau testų programėlę galima paleisti lokaliai arba įdiegti „Azure“; sekite instrukcijas „quiz-app“ aplanke. Testai palaipsniui lokalizuojami.
Pamokos
![]() |
---|
Duomenų mokslas pradedantiesiems: Planas - Eskizas @nitya |
Pamokos numeris | Tema | Pamokų grupavimas | Mokymosi tikslai | Susieta pamoka | Autorius |
---|---|---|---|---|---|
01 | Duomenų mokslo apibrėžimas | Įvadas | Sužinokite pagrindines duomenų mokslo sąvokas ir kaip jis susijęs su dirbtiniu intelektu, mašininio mokymosi ir didžiųjų duomenų sritimis. | pamoka vaizdo įrašas | Dmitry |
02 | Duomenų mokslo etika | Įvadas | Duomenų etikos sąvokos, iššūkiai ir struktūros. | pamoka | Nitya |
03 | Duomenų apibrėžimas | Įvadas | Kaip klasifikuojami duomenys ir kokie yra jų dažniausi šaltiniai. | pamoka | Jasmine |
04 | Įvadas į statistiką ir tikimybes | Įvadas | Matematiniai tikimybių ir statistikos metodai duomenims suprasti. | pamoka vaizdo įrašas | Dmitry |
05 | Darbas su reliaciniais duomenimis | Darbas su duomenimis | Įvadas į reliacinius duomenis ir pagrindai, kaip tyrinėti ir analizuoti reliacinius duomenis naudojant struktūrinės užklausos kalbą (SQL). | pamoka | Christopher |
06 | Darbas su NoSQL duomenimis | Darbas su duomenimis | Įvadas į nereliacinius duomenis, jų įvairius tipus ir pagrindai, kaip tyrinėti ir analizuoti dokumentų duomenų bazes. | pamoka | Jasmine |
07 | Darbas su Python | Darbas su duomenimis | Python naudojimo pagrindai duomenų tyrinėjimui su tokiomis bibliotekomis kaip Pandas. Rekomenduojama turėti pagrindinį Python programavimo supratimą. | pamoka vaizdo įrašas | Dmitry |
08 | Duomenų paruošimas | Darbas su duomenimis | Temos apie duomenų valymo ir transformavimo technikas, siekiant spręsti trūkstamų, netikslių ar neišsamių duomenų problemas. | pamoka | Jasmine |
09 | Kiekių vizualizavimas | Duomenų vizualizacija | Sužinokite, kaip naudoti Matplotlib vizualizuojant paukščių duomenis 🦆 | pamoka | Jen |
10 | Duomenų pasiskirstymo vizualizavimas | Duomenų vizualizacija | Vizualizuojant stebėjimus ir tendencijas intervale. | pamoka | Jen |
11 | Proporcijų vizualizavimas | Duomenų vizualizacija | Vizualizuojant diskrečius ir grupuotus procentus. | pamoka | Jen |
12 | Ryšių vizualizavimas | Duomenų vizualizacija | Vizualizuojant ryšius ir koreliacijas tarp duomenų rinkinių ir jų kintamųjų. | pamoka | Jen |
13 | Reikšmingos vizualizacijos | Duomenų vizualizacija | Technikos ir gairės, kaip padaryti vizualizacijas vertingas efektyviam problemų sprendimui ir įžvalgoms. | pamoka | Jen |
14 | Įvadas į duomenų mokslo gyvavimo ciklą | Gyvavimo ciklas | Įvadas į duomenų mokslo gyvavimo ciklą ir pirmąjį jo etapą – duomenų gavimą ir išskyrimą. | pamoka | Jasmine |
15 | Analizavimas | Gyvavimo ciklas | Ši duomenų mokslo gyvavimo ciklo fazė orientuota į duomenų analizės technikas. | pamoka | Jasmine |
16 | Komunikacija | Gyvavimo ciklas | Ši duomenų mokslo gyvavimo ciklo fazė orientuota į įžvalgų iš duomenų pateikimą taip, kad sprendimų priėmėjams būtų lengviau suprasti. | pamoka | Jalen |
17 | Duomenų mokslas debesyje | Debesų duomenys | Ši pamokų serija pristato duomenų mokslą debesyje ir jo privalumus. | pamoka | Tiffany ir Maud |
18 | Duomenų mokslas debesyje | Debesų duomenys | Modelių mokymas naudojant mažo kodo įrankius. | pamoka | Tiffany ir Maud |
19 | Duomenų mokslas debesyje | Debesų duomenys | Modelių diegimas naudojant „Azure Machine Learning Studio“. | pamoka | Tiffany ir Maud |
20 | Duomenų mokslas realiame pasaulyje | Realiame pasaulyje | Duomenų mokslo projektai realiame pasaulyje. | pamoka | Nitya |
GitHub Codespaces
Sekite šiuos žingsnius, kad atidarytumėte šį pavyzdį „Codespace“:
- Spustelėkite „Code“ išskleidžiamąjį meniu ir pasirinkite „Open with Codespaces“ parinktį.
- Pasirinkite + Naujas „Codespace“ apačioje. Daugiau informacijos rasite GitHub dokumentacijoje.
VSCode Remote - Containers
Sekite šiuos žingsnius, kad atidarytumėte šį repo konteineryje naudodami savo vietinį kompiuterį ir VSCode su VS Code Remote - Containers plėtiniu:
- Jei tai jūsų pirmas kartas naudojant vystymo konteinerį, įsitikinkite, kad jūsų sistema atitinka reikalavimus (pvz., įdiegta „Docker“) pradžios dokumentacijoje.
Norėdami naudoti šį repo, galite jį atidaryti izoliuotame „Docker“ tūryje:
Pastaba: Viduje tai naudos „Remote-Containers: Clone Repository in Container Volume...“ komandą, kad nukopijuotų šaltinio kodą į „Docker“ tūrį, o ne vietinį failų sistemą. Tūriai yra rekomenduojamas mechanizmas konteinerio duomenims išsaugoti.
Arba atidarykite vietoje nukopijuotą ar atsisiųstą repo versiją:
- Nukopijuokite šį repo į savo vietinę failų sistemą.
- Paspauskite F1 ir pasirinkite Remote-Containers: Open Folder in Container... komandą.
- Pasirinkite nukopijuotą šio aplanko kopiją, palaukite, kol konteineris pradės veikti, ir išbandykite.
Prieiga neprisijungus
Šią dokumentaciją galite paleisti neprisijungus naudodami Docsify. Nukopijuokite šį repo, įdiekite Docsify savo vietiniame kompiuteryje, tada šio repo šakniniame aplanke įveskite docsify serve
. Svetainė bus paleista 3000 prievade jūsų vietiniame kompiuteryje: localhost:3000
.
Pastaba, užrašų knygelės nebus rodomos per Docsify, todėl, kai reikia paleisti užrašų knygelę, tai darykite atskirai VS Code naudojant Python branduolį.
Kiti mokymo planai
Mūsų komanda kuria kitus mokymo planus! Peržiūrėkite:
- Generatyvus AI pradedantiesiems
- Generatyvus AI pradedantiesiems .NET
- Generatyvus AI su JavaScript
- Generatyvus AI su Java
- AI pradedantiesiems
- Duomenų mokslas pradedantiesiems
- Bash pradedantiesiems
- ML pradedantiesiems
- Kibernetinis saugumas pradedantiesiems
- Web kūrimas pradedantiesiems
- IoT pradedantiesiems
- Mašininis mokymasis pradedantiesiems
- XR kūrimas pradedantiesiems
- GitHub Copilot įvaldymas AI poriniam programavimui
- XR kūrimas pradedantiesiems
- GitHub Copilot įvaldymas C#/.NET programuotojams
- Pasirinkite savo Copilot nuotykį
Atsakomybės apribojimas:
Šis dokumentas buvo išverstas naudojant AI vertimo paslaugą Co-op Translator. Nors siekiame tikslumo, prašome atkreipti dėmesį, kad automatiniai vertimai gali turėti klaidų ar netikslumų. Originalus dokumentas jo gimtąja kalba turėtų būti laikomas autoritetingu šaltiniu. Dėl svarbios informacijos rekomenduojama profesionali žmogaus vertimo paslauga. Mes neprisiimame atsakomybės už nesusipratimus ar klaidingus interpretavimus, atsiradusius naudojant šį vertimą.