28 KiB
Duomenų mokslas pradedantiesiems – Mokymo programa
„Azure Cloud Advocates“ komanda „Microsoft“ džiaugiasi galėdama pasiūlyti 10 savaičių, 20 pamokų mokymo programą, skirtą Duomenų mokslui. Kiekviena pamoka apima priešpamokos ir popamokos testus, rašytines instrukcijas pamokos atlikimui, sprendimą ir užduotį. Mūsų projektams pagrįstas mokymo metodas leidžia mokytis dirbant, kas yra patikrintas būdas įgyti naujų įgūdžių, kurie išlieka.
Nuoširdus ačiū mūsų autoriams: Jasmine Greenaway, Dmitry Soshnikov, Nitya Narasimhan, Jalen McGee, Jen Looper, Maud Levy, Tiffany Souterre, Christopher Harrison.
🙏 Ypatingas ačiū 🙏 mūsų Microsoft Student Ambassador autoriams, recenzentams ir turinio kūrėjams, ypač Aaryan Arora, Aditya Garg, Alondra Sanchez, Ankita Singh, Anupam Mishra, Arpita Das, ChhailBihari Dubey, Dibri Nsofor, Dishita Bhasin, Majd Safi, Max Blum, Miguel Correa, Mohamma Iftekher (Iftu) Ebne Jalal, Nawrin Tabassum, Raymond Wangsa Putra, Rohit Yadav, Samridhi Sharma, Sanya Sinha, Sheena Narula, Tauqeer Ahmad, Yogendrasingh Pawar , Vidushi Gupta, Jasleen Sondhi
![]() |
|---|
| Duomenų mokslas pradedantiesiems – Sketchnote autorius @nitya |
🌐 Daugiakalbė palaikymas
Palaikoma per GitHub Action (automatizuotas ir visada atnaujinamas)
Arabic | Bengali | Bulgarian | Burmese (Myanmar) | Chinese (Simplified) | Chinese (Traditional, Hong Kong) | Chinese (Traditional, Macau) | Chinese (Traditional, Taiwan) | Croatian | Czech | Danish | Dutch | Estonian | Finnish | French | German | Greek | Hebrew | Hindi | Hungarian | Indonesian | Italian | Japanese | Kannada | Korean | Lithuanian | Malay | Malayalam | Marathi | Nepali | Nigerian Pidgin | Norwegian | Persian (Farsi) | Polish | Portuguese (Brazil) | Portuguese (Portugal) | Punjabi (Gurmukhi) | Romanian | Russian | Serbian (Cyrillic) | Slovak | Slovenian | Spanish | Swahili | Swedish | Tagalog (Filipino) | Tamil | Telugu | Thai | Turkish | Ukrainian | Urdu | Vietnamese
Norite klonuoti vietoje?
Šiame repozitorijoje yra daugiau nei 50 kalbų vertimų, dėl ko ženkliai padidėja atsisiuntimo dydis. Norėdami klonuoti be vertimų, naudokite mažo užimtumo atsisiuntimą (sparse checkout):
git clone --filter=blob:none --sparse https://github.com/microsoft/Data-Science-For-Beginners.git cd Data-Science-For-Beginners git sparse-checkout set --no-cone '/*' '!translations' '!translated_images'Tai suteiks viską, ko reikia kursui užbaigti, žymiai greičiau atsisiunčiant.
Jei norite, kad būtų palaikomos papildomos vertimo kalbos, jų sąrašas yra čia
Prisijunkite prie mūsų bendruomenės
Turime vykstančią „Discord“ mokymosi su DI seriją, daugiau sužinokite ir prisijunkite prie mūsų Learn with AI Series nuo 2025 m. rugsėjo 18 d. iki 30 d. Jūs gausite patarimų ir triukų, kaip naudotis „GitHub Copilot“ duomenų moksle.
Ar esi studentas?
Pradėkite naudodamiesi šiais ištekliais:
- Studentų centras Šiame puslapyje rasite pradedančiųjų išteklius, studentų paketus ir net būdus gauti nemokamą sertifikavimo kuponą. Tai vienas puslapis, kurį norėsite įsidėti į žymes ir periodiškai tikrinti, nes mes bent kartą per mėnesį keičiam turinį.
- Microsoft Learn Student Ambassadors Prisijunkite prie pasaulinės studentų ambasadorių bendruomenės, tai gali būti jūsų kelias į Microsoft.
Pradžia
📚 Dokumentacija
- Įdiegimo vadovas – žingsnis po žingsnio instrukcijos pradedantiesiems
- Naudojimo vadovas – pavyzdžiai ir dažniausios darbo eigų naudojimo instrukcijos
- Problemų sprendimas – dažniausių problemų sprendimai
- Prisidėjimo vadovas – kaip prisidėti prie šio projekto
- Mokytojams – mokymo gairės ir klasės ištekliai
👨🎓 Studentams
Visiškai pradedantiesiems: Naujokas duomenų moksle? Pradėkite nuo mūsų pradedančiųjų draugiškų pavyzdžių! Šie paprasti, gerai komentuoti pavyzdžiai padės jums suprasti pagrindus prieš gilinatės į visą mokymo programą. Studentams: kad naudotumėte šią programą savarankiškai, šaknykite visą repozitoriją ir atlikite pratimus savarankiškai, pradėdami nuo priešpaskaitos testo. Tada skaitykite paskaitą ir atlikite likusias užduotis. Stenkitės kurti projektus suprasdami pamokas, o ne tiesiog kopijuodami sprendimų kodą; tačiau tas kodas yra prieinamas /solutions aplankuose kiekvienoje projekto orientuotoje pamokoje. Kita idėja būtų sukurti studijų grupę su draugais ir kartu pereiti turinį. Tolimesniam mokymuisi rekomenduojame Microsoft Learn.
Greitas pradžios planas:
- Patikrinkite Įdiegimo vadovą, kaip nustatyti savo aplinką
- Peržiūrėkite Naudojimo vadovą, kad sužinotumėte, kaip dirbti su mokymo programa
- Pradėkite nuo 1 pamokos ir dirbkite nuosekliai
- Prisijunkite prie mūsų Discord bendruomenės pagalbai
👩🏫 Mokytojams
Mokytojams: mes pateikėme kai kuriuos pasiūlymus, kaip naudoti šią mokymo programą. Mielai lauksime jūsų atsiliepimų mūsų diskusijų forume!
Susipažinkite su komanda
Gif sukūrė Mohit Jaisal
🎥 Spustelėkite aukščiau esantį paveikslėlį, kad pamatytumėte vaizdo įrašą apie projektą ir žmones, kurie jį sukūrė!
Pedagogika
Kuriant šią programą pasirinkome du pedagoginius principus: užtikrinti, kad ji būtų projektinė, ir kad būtų dažni testai. Šios serijos pabaigoje studentai išmoks pagrindines duomenų mokslo sąvokas, įskaitant etinius principus, duomenų paruošimą, įvairius būdus dirbti su duomenimis, duomenų vizualizaciją, duomenų analizę, realaus pasaulio duomenų mokslo panaudojimo atvejus ir dar daugiau.
Be to, lengvas testas prieš paskaitą nustato studento tikslą mokytis temos, o antras testas po paskaitos užtikrina geresnį įsiminimą. Ši programa sukurta būti lanksčia ir smagia, ją galima įveikti visą arba atskiras dalis. Projektai prasideda nuo mažų ir tampa vis sudėtingesni iki 10 savaičių ciklo pabaigos.
Raskite mūsų Elgesio kodeksą, Dalyvavimo taisykles, Vertimo gaires. Laukiame jūsų konstruktyvių atsiliepimų!
Kiekviena pamoka apima:
- Neprivalomą eskizo užrašą
- Neprivalomą papildomą vaizdo įrašą
- Apšilimo testą prieš pamoką
- Rašytinę pamoką
- Projekto pamokose – žingsnis po žingsnio vadovus, kaip sukurti projektą
- Žinių patikrinimus
- Iššūkį
- Papildomą skaitymą
- Užduotį
- Po pamokos testą
Pastaba apie testus: Visi testai yra Quiz-App aplanke, iš viso 40 testų po tris klausimus kiekviename. Jie susieti iš pamokų, tačiau testų programėlę galima paleisti vietoje arba įdiegti į Azure; vykdykite nurodymus
quiz-appaplanke. Jie palaipsniui lokalizuojami.
🎓 Draugiški pradedantiesiems pavyzdžiai
Naujas duomenų moksle? Mes sukūrėme specialų pavyzdžių katalogą su paprastu, gerai komentuotu kodu, kad padėtume jums pradėti:
- 🌟 Sveikas Pasauli! – Jūsų pirmoji duomenų mokslo programa
- 📂 Duomenų užkėlimas – Išmokite skaityti ir tyrinėti duomenų rinkinius
- 📊 Paprasta analizė – Skaičiuokite statistiką ir ieškokite modelių
- 📈 Pagrindinė vizualizacija – Kurkite diagramas ir grafikus
- 🔬 Realaus pasaulio projektas – Pilnas darbo eiga nuo pradžios iki pabaigos
Kiekviename pavyzdyje pateikiami išsamūs komentarai, kurie paaiškina kiekvieną žingsnį, todėl jis puikiai tinka visiškiems pradedantiesiems!
Pamokos
![]() |
|---|
| Duomenų mokslas pradedantiesiems: kelias - Eskizo užrašas autorius @nitya |
| Pamokos numeris | Tema | Pamokos grupė | Mokymosi tikslai | Susieta pamoka | Autorius |
|---|---|---|---|---|---|
| 01 | Duomenų mokslo apibrėžimas | Įvadas | Išmokti pagrindines duomenų mokslo sąvokas ir kaip jis susijęs su dirbtiniu intelektu, mašininio mokymosi ir didžiųjų duomenų koncepcijomis. | pamoka vaizdo įrašas | Dmitry |
| 02 | Duomenų mokslo etika | Įvadas | Duomenų etikos sąvokos, iššūkiai ir struktūros. | pamoka | Nitya |
| 03 | Duomenų apibrėžimas | Įvadas | Kaip duomenys klasifikuojami ir jų įprasti šaltiniai. | pamoka | Jasmine |
| 04 | Statistika ir tikimybė | Įvadas | Matematiniai tikimybės ir statistikos metodai duomenų supratimui. | pamoka vaizdo įrašas | Dmitry |
| 05 | Darbas su reliaciniais duomenimis | Darbas su duomenimis | Įvadas į reliacinius duomenis ir jų tyrinėjimo bei analizės pagrindus naudojant struktūruotąjį užklausų kalbą SQL (tarimas „sidžel“). | pamoka | Christopher |
| 06 | Darbas su NoSQL duomenimis | Darbas su duomenimis | Įvadas į nerealiacinius duomenis, jų tipus ir pagrindus nagrinėti bei analizuoti dokumentų duomenų bazes. | pamoka | Jasmine |
| 07 | Darbas su Python | Darbas su duomenimis | Pagrindai naudoti Python duomenų tyrinėjimui su bibliotekomis, tokiomis kaip Pandas. Rekomenduojamos pagrindinės Python programavimo žinios. | pamoka vaizdo įrašas | Dmitry |
| 08 | Duomenų paruošimas | Darbas su duomenimis | Temos apie duomenų valymo ir transformavimo metodus, sprendžiant trūkstamų, netikslių ar neišsamių duomenų problemas. | pamoka | Jasmine |
| 09 | Kiekybinių duomenų vizualizavimas | Duomenų vizualizacija | Išmokite naudoti Matplotlib paukščių duomenų vizualizavimui 🦆 | pamoka | Jen |
| 10 | Duomenų pasiskirstymo vizualizacija | Duomenų vizualizacija | Šioje pamokoje vizualizuojami stebėjimai ir tendencijos intervale. | pamoka | Jen |
| 11 | Proporcijų vizualizavimas | Duomenų vizualizacija | Diskrečių ir grupuotų procentų vizualizavimas. | pamoka | Jen |
| 12 | Santykių vizualizavimas | Duomenų vizualizacija | Vizualizuojame duomenų rinkinių ir jų kintamųjų ryšius bei koreliacijas. | pamoka | Jen |
| 13 | Tikslinga vizualizacija | Duomenų vizualizacija | Metodai ir patarimai, kaip sukurti vertingas vizualizacijas efektyviam problemų sprendimui ir įžvalgoms. | pamoka | Jen |
| 14 | Duomenų mokslo gyvavimo ciklo įvadas | Gyvavimo ciklas | Duomenų mokslo gyvavimo ciklo įvadas ir pirmasis žingsnis – duomenų gavimas ir išgavimas. | pamoka | Jasmine |
| 15 | Duomenų analizė | Gyvavimo ciklas | Ši duomenų mokslo gyvavimo ciklo fazė skiriama duomenų analizės metodams. | pamoka | Jasmine |
| 16 | Komunikacija | Gyvavimo ciklas | Ši duomenų mokslo gyvavimo ciklo fazė skirta išvadų iš duomenų pristatymui taip, kad sprendimų priėmėjams būtų lengviau suprasti. | pamoka | Jalen |
| 17 | Duomenų mokslas debesyje | Debesų duomenys | Šios pamokos supažindina su duomenų mokslo debesyje koncepcija ir jo privalumais. | pamoka | Tiffany ir Maud |
| 18 | Duomenų mokslas debesyje | Debesų duomenys | Modelių treniravimas naudojant Low Code įrankius. | pamoka | Tiffany ir Maud |
| 19 | Duomenų mokslas debesyje | Debesų duomenys | Modelių diegimas naudojant Azure Machine Learning Studio. | pamoka | Tiffany ir Maud |
| 20 | Duomenų mokslas realiame pasaulyje | Realiame pasaulyje | Duomenų mokslu pagrįsti projektai realiame pasaulyje. | pamoka | Nitya |
GitHub Codespaces
Atlikite šiuos veiksmus, kad atidarytumėte šį pavyzdį Codespace:
- Spustelėkite Code išskleidžiamąjį meniu ir pasirinkite Open with Codespaces parinktį.
- Pasirinkite + New codespace lango apačioje. Norėdami sužinoti daugiau, peržiūrėkite GitHub dokumentaciją.
VSCode Remote - konteineriai
Atlikite šiuos veiksmus, kad atidarytumėte šį repozitoriją konteineryje naudodami vietinę mašiną ir VSCode su VS Code Remote - Containers plėtiniu:
- Jei tai pirmas kartas, kai naudojate kūrimo konteinerį, įsitikinkite, kad jūsų sistema atitinka reikalavimus (pvz., įdiegta Docker), vadovaudamiesi pradžios dokumentacija.
Norėdami naudoti šį repozitoriją, galite jį atidaryti izoliuotame Docker tūryje:
Pastaba: Po gaubtu tai naudos Remote-Containers: Clone Repository in Container Volume... komandą klonuoti šaltinio kodą Docker tūryje vietoj vietinio failų sistemos. Tūriai yra pageidaujamas duomenų konteineryje išlaikymo būdas.
Arba atidarykite vietoje klonuotą arba atsisiųstą repozitorijos kopiją:
- Nuklonuokite šią repozitoriją į savo vietinę failų sistemą.
- Paspauskite F1 ir pasirinkite Remote-Containers: Open Folder in Container... komandą.
- Pasirinkite šios aplanko nuklonuotą kopiją, palaukite kol konteineris startuos ir išbandykite funkcijas.
Offline prieiga
Galite vykdyti šią dokumentaciją neprisijungę naudodami Docsify. Nuklonuokite šią repozitoriją, įdiekite Docsify savo vietinėje mašinoje, tada pagrindiniame repozitorijos aplanke įvykdykite docsify serve. Svetainė bus pateikta 3000 prievade jūsų localhost adresu: localhost:3000.
Pastebėkite, kad užrašai nebus atvaizduojami Docsify, todėl kai reikės paleisti užrašą, darykite tai atskirai VS Code su Python branduoliu.
Kitos programos
Mūsų komanda kuria kitas programas! Peržiūrėkite:
LangChain
Azure / Edge / MCP / Agentai
Kartojamosios AI serijos
Pagrindiniai mokymai
Copilot serijos
Pagalbos gavimas
Susiduriate su problemomis? Peržiūrėkite mūsų Gedimų šalinimo vadovą, kad rastumėte sprendimus dažniausiai pasitaikančioms problemoms.
Jei užstrigote arba turite klausimų apie AI programų kūrimą, prisijunkite prie kitų mokymosi entuziastų ir patyrusių programuotojų diskusijose apie MCP. Tai palaikanti bendruomenė, kurioje klausimai yra laukiami, o žinios laisvai dalijamos.
Jei turite atsiliepimų apie produktą arba radote klaidų kurdami lankykitės:
Atsakomybės apribojimas: Šis dokumentas buvo išverstas naudojant dirbtinio intelekto vertimo paslaugą Co-op Translator. Nors stengiamės užtikrinti tikslumą, prašome atkreipti dėmesį, kad automatiniai vertimai gali turėti klaidų ar netikslumų. Originalus dokumentas jo gimtąja kalba turėtų būti laikomas pagrindiniu šaltiniu. Svarbiai informacijai rekomenduojamas profesionalus vertimas žmogaus. Mes neprisiimame atsakomybės už bet kokius nesusipratimus ar neteisingus aiškinimus, kylančius dėl šio vertimo naudojimo.



