|
|
1 month ago | |
|---|---|---|
| .. | ||
| 1-Introduction | 3 months ago | |
| 2-Working-With-Data | 1 month ago | |
| 3-Data-Visualization | 5 months ago | |
| 4-Data-Science-Lifecycle | 5 months ago | |
| 5-Data-Science-In-Cloud | 5 months ago | |
| 6-Data-Science-In-Wild | 5 months ago | |
| docs | 5 months ago | |
| examples | 4 months ago | |
| quiz-app | 5 months ago | |
| sketchnotes | 5 months ago | |
| AGENTS.md | 4 months ago | |
| CODE_OF_CONDUCT.md | 5 months ago | |
| CONTRIBUTING.md | 4 months ago | |
| INSTALLATION.md | 4 months ago | |
| README.md | 1 month ago | |
| SECURITY.md | 5 months ago | |
| SUPPORT.md | 5 months ago | |
| TROUBLESHOOTING.md | 4 months ago | |
| USAGE.md | 4 months ago | |
| for-teachers.md | 5 months ago | |
README.md
Duomenų mokslas pradedantiesiems - Mokymo programa
Azure Cloud Advocates komanda Microsoft didžiuojasi galėdama pasiūlyti 10 savaičių, 20 pamokų mokymo programą, skirtą Duomenų mokslui. Kiekvienoje pamokoje yra priešpamokos ir popamokos testai, rašytinės instrukcijos pamokos atlikimui, sprendimas ir užduotis. Mūsų projektinė pedagogika leidžia mokytis statant projektus — tai patikrintas būdas, kad nauji įgūdžiai „įsikibtų“.
Nuoširdus ačiū mūsų autoriams: Jasmine Greenaway, Dmitry Soshnikov, Nitya Narasimhan, Jalen McGee, Jen Looper, Maud Levy, Tiffany Souterre, Christopher Harrison.
🙏 Ypatingas ačiū 🙏 mūsų Microsoft Student Ambassador autoriams, recenzentams ir turinio prisidėjusiems, išskirtinai Aaryan Arora, Aditya Garg, Alondra Sanchez, Ankita Singh, Anupam Mishra, Arpita Das, ChhailBihari Dubey, Dibri Nsofor, Dishita Bhasin, Majd Safi, Max Blum, Miguel Correa, Mohamma Iftekher (Iftu) Ebne Jalal, Nawrin Tabassum, Raymond Wangsa Putra, Rohit Yadav, Samridhi Sharma, Sanya Sinha, Sheena Narula, Tauqeer Ahmad, Yogendrasingh Pawar , Vidushi Gupta, Jasleen Sondhi
![]() |
|---|
| Duomenų mokslas pradedantiesiems - Sketchnote sukūrė @nitya |
🌐 Daugiakalbis palaikymas
Palaikoma per GitHub Action (automatizuota ir visada atnaujinta)
Arabic | Bengali | Bulgarian | Burmese (Myanmar) | Chinese (Simplified) | Chinese (Traditional, Hong Kong) | Chinese (Traditional, Macau) | Chinese (Traditional, Taiwan) | Croatian | Czech | Danish | Dutch | Estonian | Finnish | French | German | Greek | Hebrew | Hindi | Hungarian | Indonesian | Italian | Japanese | Kannada | Korean | Lithuanian | Malay | Malayalam | Marathi | Nepali | Nigerian Pidgin | Norwegian | Persian (Farsi) | Polish | Portuguese (Brazil) | Portuguese (Portugal) | Punjabi (Gurmukhi) | Romanian | Russian | Serbian (Cyrillic) | Slovak | Slovenian | Spanish | Swahili | Swedish | Tagalog (Filipino) | Tamil | Telugu | Thai | Turkish | Ukrainian | Urdu | Vietnamese
Jei norite, kad būtų palaikomos papildomos vertimo kalbos, jų sąrašas pateiktas čia
Prisijunkite prie mūsų bendruomenės
Mes vykdome Discord seriją „Mokykitės su AI“, sužinokite daugiau ir prisijunkite prie mūsų per Learn with AI Series nuo 2025 m. rugsėjo 18 d. iki 30 d. Ten gausite patarimų ir gudrybių, kaip naudoti GitHub Copilot Duomenų mokslui.
Ar esi studentas?
Pradėkite naudodamiesi šiais ištekliais:
- Student Hub page Šiame puslapyje rasite pradedančiųjų išteklius, studentų rinkinius ir net būdus gauti nemokamą sertifikato kuponą. Tai puslapis, kurį verta išsaugoti žymėje ir kartais patikrinti, nes mes atnaujiname turinį bent kartą per mėnesį.
- Microsoft Learn Student Ambassadors Prisijunkite prie pasaulinės studentų ambasadorių bendruomenės — tai gali būti jūsų kelias į Microsoft.
Kaip pradėti
📚 Dokumentacija
- Įdiegimo vadovas - žingsnis po žingsnio nustatymo instrukcijos pradedantiesiems
- Naudojimo vadovas - pavyzdžiai ir dažniausiai naudojamos darbo eigos
- Trikčių šalinimas - sprendimai dažniausioms problemoms
- Bendradarbiavimo vadovas - kaip prisidėti prie šio projekto
- Mokytojams - pedagoginė medžiaga ir klasės ištekliai
👨🎓 Studentams
Visiškai pradedantieji: naujas duomenų moksle? Pradėkite nuo mūsų pradedantiesiems tinkamų pavyzdžių! Šie paprasti, gerai komentuoti pavyzdžiai padės suprasti pagrindus prieš pradėdami visą mokymo programą. Studentams: jei norite naudoti šią mokymo programą savarankiškai, suforkinkite visą saugyklą ir atlikite pratimus patys, pradėdami nuo priešpamokos testo. Tada perskaitykite paskaitą ir atlikite likusias veiklas. Stenkitės kurti projektus suprasdami pamokas, o ne kopijuodami sprendimų kodą; vis dėlto tas kodas yra pateiktas /solutions aplankuose kiekvienoje projektinėje pamokoje. Kita idėja — suformuoti mokymosi grupę su draugais ir kartu peržiūrėti turinį. Tolimesniam mokymuisi rekomenduojame Microsoft Learn.
Greitas pradėjimas:
- Patikrinkite Įdiegimo vadovą, kad sukonfigūruotumėte savo aplinką
- Peržiūrėkite Naudojimo vadovą, kad sužinotumėte, kaip naudotis mokymo programa
- Pradėkite nuo 1 pamokos ir eikite nuosekliai
- Prisijunkite prie mūsų Discord bendruomenės dėl pagalbos
👩🏫 Mokytojams
Mokytojams: mes įtraukėme keletą pasiūlymų apie tai, kaip naudoti šią mokymo programą. Būtume dėkingi už jūsų atsiliepimus mūsų diskusijų forume!
Susipažinkite su komanda
Gif sukūrė Mohit Jaisal
🎥 Spustelėkite aukščiau esantį paveikslėlį, kad pažiūrėtumėte vaizdo įrašą apie projektą žmones, kurie jį sukūrė!
Pedagogika
Kurdami šią mokymo programą mes pasirinkome du pedagoginius principus: užtikrinti, kad ji būtų paremta projektais ir kad joje būtų dažnos viktorinos. Iki šios serijos pabaigos studentai išmoks pagrindinius duomenų mokslo principus, įskaitant etines sąvokas, duomenų paruošimą, skirtingus duomenų apdorojimo būdus, duomenų vizualizaciją, duomenų analizę, duomenų mokslo realaus pasaulio panaudojimo atvejus ir daugiau.
Be to, mažos reikšmės viktorina prieš pamoką nukreipia studentą į temos mokymąsi, o antra viktorina po pamokos padeda geriau išsaugoti informaciją. Ši mokymo programa sukurta būti lanksčia ir smagia — ją galima studijuoti visą arba dalimis. Projektai prasideda nuo mažų užduočių ir tampa vis sudėtingesni per 10 savaičių ciklą.
Raskite mūsų Code of Conduct, Contributing, Translation gaires. Laukiame jūsų konstruktyvių atsiliepimų!
Kiekviena pamoka apima:
- Neprivaloma sketchnote
- Neprivalomas papildomas vaizdo įrašas
- Priešpamokinė apšilimo viktorina
- Rašytinė pamoka
- Projektinėms pamokoms, žingsnis po žingsnio vadovai, kaip sukurti projektą
- Žinių patikrinimai
- Iššūkis
- Papildoma skaitymo medžiaga
- Užduotis
- Viktorina po pamokos
Pastaba apie viktorinas: Visos viktorinos yra Quiz-App aplanke, iš viso 40 viktorinų po tris klausimus kiekvienoje. Jos yra susietos iš pamokų, tačiau viktorinų programėlę galima paleisti vietoje arba diegti į Azure; vykdykite nurodymus
quiz-appaplanke. Jos pamažu lokalizuojamos.
🎓 Pavyzdžiai pradedantiesiems
Pradedate duomenų moksle? Sukūrėme specialų pavyzdžių katalogą su paprastu, gerai komentaruotu kodu, kad padėtume jums pradėti:
- 🌟 Hello World - Jūsų pirmoji duomenų mokslo programa
- 📂 Loading Data - Išnagrinėkite, kaip skaityti ir tyrinėti duomenų rinkinius
- 📊 Simple Analysis - Apskaičiuokite statistinius rodiklius ir raskite dėsningumus
- 📈 Basic Visualization - Kurkite diagramas ir grafikus
- 🔬 Real-World Project - Pilnas darbo eiga nuo pradžios iki pabaigos
Kiekvienas pavyzdys turi detalių komentarų, paaiškinančių kiekvieną žingsnį, todėl puikiai tinka visiškiems pradedantiesiems!
Pamokos
![]() |
|---|
| Duomenų mokslas pradedantiesiems: kelio žemėlapis - Sketchnote autorius @nitya |
| Lesson Number | Topic | Lesson Grouping | Learning Objectives | Linked Lesson | Author |
|---|---|---|---|---|---|
| 01 | Duomenų mokslo apibrėžimas | Įvadas | Suprasti pagrindines duomenų mokslo sąvokas ir kaip jis susijęs su dirbtiniu intelektu, mašininiu mokymusi ir didžiaisiais duomenimis. | pamoka vaizdo įrašas | Dmitry |
| 02 | Duomenų mokslo etika | Įvadas | Duomenų etikos sąvokos, iššūkiai ir sistemos. | pamoka | Nitya |
| 03 | Duomenų apibrėžimas | Įvadas | Kaip klasifikuojami duomenys ir jų dažniausi šaltiniai. | pamoka | Jasmine |
| 04 | Įvadas į statistiką ir tikimybių teoriją | Įvadas | Matematinės tikimybių ir statistikos technikos duomenims suprasti. | pamoka vaizdo įrašas | Dmitry |
| 05 | Darbas su reliaciniais duomenimis | Darbas su duomenimis | Įvadas į reliacinius duomenis ir pagrindai, kaip tyrinėti ir analizuoti reliacinius duomenis naudojant struktūrinę užklausų kalbą, dar vadinamą SQL (tariama „si-kvel“). | pamoka | Christopher |
| 06 | Darbas su NoSQL duomenimis | Darbas su duomenimis | Įvadas į nereliacinius duomenis, jų tipus ir pagrindus, kaip tyrinėti ir analizuoti dokumentų duomenų bazes. | pamoka | Jasmine |
| 07 | Darbas su Python | Darbas su duomenimis | Pagrindai, kaip naudoti Python duomenų tyrinėjimui su bibliotekomis, tokiomis kaip Pandas. Rekomenduojama turėti pagrindines Python programavimo žinias. | pamoka vaizdo įrašas | Dmitry |
| 08 | Duomenų paruošimas | Darbas su duomenimis | Teminės sritys apie duomenų valymo ir transformavimo technikas, kaip spręsti trūkstamų, netikslių ar neišsamių duomenų problemas. | pamoka | Jasmine |
| 09 | Kiekių vizualizavimas | Duomenų vizualizacija | Sužinokite, kaip naudoti Matplotlib paukščių duomenims vizualizuoti 🦆 | pamoka | Jen |
| 10 | Duomenų pasiskirstymo vizualizavimas | Duomenų vizualizacija | Observacijų ir tendencijų intervale vizualizavimas. | pamoka | Jen |
| 11 | Proporcijų vizualizavimas | Duomenų vizualizacija | Diskretinių ir sugrupuotų procentų vizualizavimas. | pamoka | Jen |
| 12 | Santykių vizualizavimas | Duomenų vizualizacija | Ryšių ir koreliacijų tarp duomenų rinkinių ir jų kintamųjų vizualizavimas. | pamoka | Jen |
| 13 | Reikšmingos vizualizacijos | Duomenų vizualizacija | Technikos ir gairės, kaip padaryti vizualizacijas naudingas sprendimų priėmimui ir įžvalgoms. | pamoka | Jen |
| 14 | Įvadas į duomenų mokslo gyvavimo ciklą | Gyvavimo ciklas | Įvadas į duomenų mokslo gyvavimo ciklą ir jo pirmą žingsnį — duomenų surinkimą ir išgavimą. | pamoka | Jasmine |
| 15 | Analizė | Gyvavimo ciklas | Ši duomenų mokslo gyvavimo ciklo fazė orientuota į duomenų analizės technikas. | pamoka | Jasmine |
| 16 | Komunikacija | Gyvavimo ciklas | Ši gyvavimo ciklo fazė skirta pateikti duomenų įžvalgas tokiu būdu, kad sprendimus priimantys asmenys jas lengviau suprastų. | pamoka | Jalen |
| 17 | Duomenų mokslas debesyje | Debesų duomenys | Ši pamokų serija pristato duomenų mokslą debesyje ir jo privalumus. | pamoka | Tiffany and Maud |
| 18 | Duomenų mokslas debesyje | Debesų duomenys | Modelių treniravimas naudojant Low Code įrankius. | pamoka | Tiffany and Maud |
| 19 | Duomenų mokslas debesyje | Debesų duomenys | Modelių diegimas naudojant Azure Machine Learning Studio. | pamoka | Tiffany and Maud |
| 20 | Duomenų mokslas realiame pasaulyje | Realiame pasaulyje | Duomenų mokslo varomos realaus pasaulio projektų apžvalga. | pamoka | Nitya |
GitHub Codespaces
Atlikite šiuos veiksmus, kad atidarytumėte šį pavyzdį Codespace aplinkoje:
- Spustelėkite išskleidžiamąjį meniu Code ir pasirinkite parinktį Open with Codespaces.
- Pasirinkite + New codespace lange apačioje. Daugiau informacijos rasite GitHub dokumentacijoje.
VSCode Remote - Containers
Atlikite šiuos veiksmus, kad atidarytumėte šį repozitorijų konteineryje naudodami savo vietinę mašiną ir VS Code Remote - Containers plėtinį:
- Jei pirmą kartą naudojate vystymo konteinerį, įsitikinkite, kad jūsų sistema atitinka išankstines sąlygas (pvz., turi įdiegtą Docker) nurodytas pradžios dokumentacijoje.
Norėdami naudoti šį repozitorijų, galite atidaryti saugyklą izoliuotame Docker volume:
Note: Under the hood, this will use the Remote-Containers: Clone Repository in Container Volume... command to clone the source code in a Docker volume instead of the local filesystem. Volumes are the preferred mechanism for persisting container data.
Arba atidarykite vietoje nuklonuotą arba atsisiųstą saugyklos kopiją:
- Klonuokite šį repozitorijų į savo vietinę failų sistemą.
- Paspauskite F1 ir pasirinkite komandą Remote-Containers: Open Folder in Container....
- Pasirinkite nuklonuotą šio aplanko kopiją, palaukite, kol konteineris paleis, ir išbandykite.
Neprisijungus prieigos galimybė
Galite paleisti šią dokumentaciją neprisijungę naudodami Docsify. Sukurkite fork šio repozitorijaus, įdiekite Docsify savo vietinėje mašinoje, tada šio repozitorijaus šakninėje aplanke įvykdykite docsify serve. Svetainė bus pasiekiama per portą 3000 jūsų localhost: localhost:3000.
Pastaba: Jupyter užrašų knygelės (notebook) nebus atvaizduojamos per Docsify, todėl jei reikia paleisti notebook'ą, darykite tai atskirai VS Code suveikusio Python branduolio aplinkoje.
Kiti kursai
Mūsų komanda rengia ir kitus kursus! Peržiūrėkite:
LangChain
Azure / Edge / MCP / Agents
Generatyvinės AI serijos
Pagrindiniai mokymai
Copilot serija
Pagalba
Susiduriate su problemomis? Peržiūrėkite mūsų Gedimų šalinimo vadovą dėl sprendimų dažniausiai pasitaikančioms problemoms.
Jei įstringate arba turite klausimų apie AI programėlių kūrimą, prisijunkite prie kitų besimokančiųjų ir patyrusių kūrėjų diskusijų apie MCP. Tai palaikanti bendruomenė, kurioje klausimai laukiami ir žinios dalijamos laisvai.
Jei turite atsiliepimų apie produktą arba radote klaidų kuriant, apsilankykite:
Atsakomybės apribojimas: Šis dokumentas buvo išverstas naudojant dirbtinio intelekto vertimo paslaugą Co-op Translator. Nors stengiamės užtikrinti tikslumą, atkreipkite dėmesį, kad automatizuoti vertimai gali turėti klaidų ar netikslumų. Originalus dokumentas jo gimtąja (originalia) kalba turėtų būti laikomas autoritetingu šaltiniu. Esant kritinei informacijai rekomenduojama pasinaudoti profesionalaus vertėjo paslaugomis. Mes neatsakome už jokius nesusipratimus ar neteisingus aiškinimus, kilusius dėl šio vertimo naudojimo.



