|
|
1 week ago | |
|---|---|---|
| .. | ||
| 1-Introduction | 1 week ago | |
| 2-Working-With-Data | 1 week ago | |
| 3-Data-Visualization | 1 week ago | |
| 4-Data-Science-Lifecycle | 1 week ago | |
| 5-Data-Science-In-Cloud | 1 week ago | |
| 6-Data-Science-In-Wild | 1 week ago | |
| docs | 1 week ago | |
| examples | 1 week ago | |
| quiz-app | 1 week ago | |
| sketchnotes | 1 week ago | |
| .co-op-translator.json | 1 week ago | |
| AGENTS.md | 1 week ago | |
| CODE_OF_CONDUCT.md | 1 week ago | |
| CONTRIBUTING.md | 1 week ago | |
| INSTALLATION.md | 1 week ago | |
| README.md | 1 week ago | |
| SECURITY.md | 1 week ago | |
| SUPPORT.md | 1 week ago | |
| TROUBLESHOOTING.md | 1 week ago | |
| USAGE.md | 1 week ago | |
| for-teachers.md | 1 week ago | |
README.md
Duomenų mokslas pradedantiesiems – Mokymo programa
„Azure Cloud Advocates“ komanda iš Microsoft su malonumu siūlo 10 savaičių, 20 pamokų mokymo programą, skirtą Duomenų mokslui. Kiekvienoje pamokoje rasite ir prieš, ir po pamokos testus, rašytines instrukcijas užduočiai atlikti, sprendimą bei namų darbą. Mūsų projektus pagrįsta pedagogika leidžia mokytis kuriant – tai patikrintas būdas įsisavinti naujus įgūdžius.
Nuoširdus ačiū mūsų autoriams: Jasmine Greenaway, Dmitry Soshnikov, Nitya Narasimhan, Jalen McGee, Jen Looper, Maud Levy, Tiffany Souterre, Christopher Harrison.
🙏 Ypatingas ačiū 🙏 mūsų Microsoft Student Ambassador autoriams, peržiūrėtojams ir turinio bendradarbiautojams, ypač Aaryan Arora, Aditya Garg, Alondra Sanchez, Ankita Singh, Anupam Mishra, Arpita Das, ChhailBihari Dubey, Dibri Nsofor, Dishita Bhasin, Majd Safi, Max Blum, Miguel Correa, Mohamma Iftekher (Iftu) Ebne Jalal, Nawrin Tabassum, Raymond Wangsa Putra, Rohit Yadav, Samridhi Sharma, Sanya Sinha, Sheena Narula, Tauqeer Ahmad, Yogendrasingh Pawar , Vidushi Gupta, Jasleen Sondhi
![]() |
|---|
| Duomenų mokslas pradedantiesiems – Sketchnote by @nitya |
🌐 Daugiakalbystės palaikymas
Palaikoma per GitHub Action (automatinis ir visada atnaujinamas)
Arabic | Bengali | Bulgarian | Burmese (Myanmar) | Chinese (Simplified) | Chinese (Traditional, Hong Kong) | Chinese (Traditional, Macau) | Chinese (Traditional, Taiwan) | Croatian | Czech | Danish | Dutch | Estonian | Finnish | French | German | Greek | Hebrew | Hindi | Hungarian | Indonesian | Italian | Japanese | Kannada | Korean | Lithuanian | Malay | Malayalam | Marathi | Nepali | Nigerian Pidgin | Norwegian | Persian (Farsi) | Polish | Portuguese (Brazil) | Portuguese (Portugal) | Punjabi (Gurmukhi) | Romanian | Russian | Serbian (Cyrillic) | Slovak | Slovenian | Spanish | Swahili | Swedish | Tagalog (Filipino) | Tamil | Telugu | Thai | Turkish | Ukrainian | Urdu | Vietnamese
Labiau norite klonuoti lokaliai?
Šiame saugykloje yra 50+ kalbų vertimų, todėl atsisiuntimas yra ženkliai didesnis. Norėdami klonuoti be vertimų, naudokite retinimo checkout (sparse checkout):
git clone --filter=blob:none --sparse https://github.com/microsoft/Data-Science-For-Beginners.git cd Data-Science-For-Beginners git sparse-checkout set --no-cone '/*' '!translations' '!translated_images'Tai suteiksite jums viską, ką reikia kursui atlikti su daug greitesniu atsisiuntimu.
Jei norite papildomų palaikomų vertimų kalbų, jos pateiktos čia
Prisijunkite prie mūsų bendruomenės
Turime vykdomą „Discord“ mokymų su DI seriją, sužinokite daugiau ir prisijunkite prie mūsų adresu Learn with AI Series nuo 2025 m. rugsėjo 18 - 30 dienos. Gaunate patarimus ir triukus, kaip naudoti GitHub Copilot Duomenų mokslui.
Ar esi studentas?
Pradėkite nuo šių išteklių:
- Studentų Centras puslapis Šiame puslapyje rasite pradedančiųjų išteklius, studentų paketus ir net būdus gauti nemokamą sertifikato kuponą. Tai puslapis, kurį verta pridėti prie žymių ir kartkartėmis tikrinti, nes turinys atnaujinamas bent jau kas mėnesį.
- Microsoft Learn Student Ambassadors Prisijunkite prie pasaulinės studentų ambasadorių bendruomenės, tai gali būti jūsų kelias į Microsoft.
Pradžia
📚 Dokumentacija
- Įdiegimo vadovas – žingsnis po žingsnio naujokams
- Naudojimo vadovas – pavyzdžiai ir įprasti darbo procesai
- Trikčių šalinimas – sprendimai dažniausioms problemoms
- Prisidėjimo vadovas – kaip prisidėti prie šio projekto
- Mokytojams – mokymo gairės ir klasių ištekliai
👨🎓 Studentams
Visiškai pradedantiesiems: naujokas duomenų moksle? Pradėkite nuo mūsų pradedantiesiems skirtų pavyzdžių! Šie paprasti ir gerai paaiškinti pavyzdžiai padės suprasti pagrindus prieš peržiūrint visą mokymo programą. Studentams: norėdami naudotis šia mokymo programa savarankiškai, fork‘inkite visą repozitoriją ir atlikite užduotis savarankiškai, pradėdami nuo priešpaskaitinio testo. Tada perskaitykite paskaitą ir atlikite likusias veiklas. Stenkitės projektus kurti suprasdami pamokas, o ne kopijuodami sprendimų kodus; tačiau jie yra prieinami /solutions aplankuose kiekvienoje projekto orientuotoje pamokoje. Kita idėja – sudaryti mokymosi grupę su draugais ir kartu peržiūrėti turinį. Tolimesniam mokymuisi rekomenduojame Microsoft Learn.
Greitas pradėjimas:
- Patikrinkite Įdiegimo vadovą, kad pasiruoštumėte aplinką
- Peržiūrėkite Naudojimo vadovą, kad sužinotumėte, kaip dirbti su mokymo programa
- Pradėkite nuo 1 pamokos ir atlikite seką
- Prisijunkite prie mūsų Discord bendruomenės pagalbai
👩🏫 Mokytojams
Mokytojams: mes įtraukėme keletą pasiūlymų, kaip naudoti šią mokymo programą. Laukiame jūsų atsiliepimų mūsų diskusijų forume!
Susipažinkite su komanda
Gif sukūrė Mohit Jaisal
🎥 Spustelėkite aukščiau esančią nuotrauką, kad pamatytumėte vaizdo įrašą apie projektą ir žmones, kurie jį sukūrė!
Pedagogika
Kuriant šią mokymo programą pasirinkome du pedagoginius principus: užtikrinti, kad ji būtų projektų pagrindu ir apimtų dažnai pasitaikančius testus. Baigę šią seriją studentai išmoks duomenų mokslo pagrindinius principus, įskaitant etinius konceptus, duomenų paruošimą, skirtingus duomenų apdorojimo būdus, duomenų vizualizaciją, duomenų analizę, realius duomenų mokslo panaudojimo atvejus ir dar daugiau.
Be to, žemas rizikos lygis turintis testas prieš pamoką nustato studentų ketinimą mokytis tam tikros temos, o antras testas po pamokos užtikrina papildomą medžiagos įsisavinimą. Ši mokymo programa buvo sukurta būti lanksti ir smagi, ją galima atlikti visą arba dalimis. Projektai prasideda nuo paprastų ir palaipsniui tampa sudėtingesni per 10 savaičių ciklą.
Raskite mūsų Elgesio kodeksą, Prisidėjimo taisykles, Vertimo gaires. Laukiame jūsų konstruktyvaus atsiliepimo!
Kiekviena pamoka apima:
- Pasirinktinį eskizų užrašą
- Pasirinktinį papildomą vaizdo įrašą
- Apšilimo testą prieš pamoką
- Rašytinę pamoką
- Projektų pagrindu sudarytose pamokose – žingsnis po žingsnio vadovus, kaip sukurti projektą
- Žinių patikrinimus
- Iššūkį
- Papildomą skaitymą
- Užduotį
- Testą po pamokos
Pastaba apie testus: Visi testai yra Quiz-App aplanke, iš viso yra 40 testų po tris klausimus kiekviename. Jie susieti iš pamokų, tačiau testų programą galima paleisti vietoje arba publikuoti Azure; vadovaukitės „quiz-app“ aplanko instrukcijomis. Jie palaipsniui lokalizuojami.
🎓 Pradedančiajam draugiški pavyzdžiai
Naujas duomenų moksle? Sukūrėme specialų pavyzdžių katalogą su paprastu, aiškiai komentuotu kodu, kad padėtų jums pradėti:
- 🌟 Sveikas pasauli! – Jūsų pirmoji duomenų mokslo programa
- 📂 Duomenų įkėlimas – Išmokite skaityti ir tyrinėti duomenų rinkinius
- 📊 Paprasta analizė – Apskaičiuokite statistiką ir raskite modelius
- 📈 Pagrindinė vizualizacija – Kurkite diagramas ir grafikus
- 🔬 Realaus pasaulio projektas – Pilnas darbo eiga nuo pradžios iki pabaigos
Kiekvienas pavyzdys apima išsamius komentarus, paaiškinančius kiekvieną žingsnį, todėl ypač tinka visiškiems pradedantiesiems!
Pamokos
![]() |
|---|
| Duomenų mokslas pradedantiesiems: kelio žemėlapis - Eskizo užrašas @nitya |
| Pamokos numeris | Tema | Pamokos grupė | Mokymosi tikslai | Susieta pamoka | Autorius |
|---|---|---|---|---|---|
| 01 | Duomenų mokslo apibrėžimas | Įvadas | Sužinokite pagrindines duomenų mokslo sąvokas ir kaip tai susiję su dirbtiniu intelektu, mašininio mokymosi ir didžiaisiais duomenimis. | pamoka vaizdo įrašas | Dmitry |
| 02 | Duomenų mokslo etika | Įvadas | Duomenų etikos sąvokos, iššūkiai ir pagrindai. | pamoka | Nitya |
| 03 | Duomenų apibrėžimas | Įvadas | Kaip klasifikuojami duomenys ir jų įprasti šaltiniai. | pamoka | Jasmine |
| 04 | Statistikos ir tikimybių įvadas | Įvadas | Matematiniai tikimybių ir statistikos metodai duomenims suprasti. | pamoka vaizdo įrašas | Dmitry |
| 05 | Darbas su reliaciniais duomenimis | Darbas su duomenimis | Įvadas į reliacinius duomenis ir pagrindus, kaip tyrinėti ir analizuoti reliacinius duomenis naudojant struktūrizuotųjų užklausų kalbą, dar vadinamą SQL (tar. „si-kvel“). | pamoka | Christopher |
| 06 | Darbas su NoSQL duomenimis | Darbas su duomenimis | Įvadas į nerealiacinius duomenis, jų įvairias rūšis ir pagrindus, kaip tyrinėti ir analizuoti dokumentų duomenų bazes. | pamoka | Jasmine |
| 07 | Darbas su Python | Darbas su duomenimis | Python naudojimo duomenų tyrinėjimui pagrindai su tokiomis bibliotekomis kaip Pandas. Rekomenduojamas Python programavimo pagrindų supratimas. | pamoka vaizdo įrašas | Dmitry |
| 08 | Duomenų paruošimas | Darbas su duomenimis | Temų apžvalga apie duomenų valymą ir transformavimą, kad būtų galima spręsti trūkstamų, netikslių ar neišsamių duomenų problemas. | pamoka | Jasmine |
| 09 | Kiekybinių duomenų vizualizavimas | Duomenų vizualizacija | Išmokite naudoti Matplotlib paukščių duomenų vizualizavimui 🦆 | pamoka | Jen |
| 10 | Duomenų pasiskirstymo vizualizavimas | Duomenų vizualizacija | Stebėjimų ir tendencijų intervalo viduje vizualizavimas. | pamoka | Jen |
| 11 | Proporcijų vizualizavimas | Duomenų vizualizacija | Diskrečios ir sugrupuotos proporcijos vizualizavimas. | pamoka | Jen |
| 12 | Ryšių vizualizavimas | Duomenų vizualizacija | Ryšių ir koreliacijų tarp duomenų rinkinių ir jų kintamųjų vizualizavimas. | pamoka | Jen |
| 13 | Reikšmingos vizualizacijos | Duomenų vizualizacija | Technika ir vadovai, padedantys padaryti jūsų vizualizacijas vertingas efektyviam problemų sprendimui ir įžvalgoms. | pamoka | Jen |
| 14 | Duomenų mokslo ciklo įvadas | Ciklas | Įvadas į duomenų mokslo gyvenimo ciklą ir jo pirmąjį etapą – duomenų gavimą ir išgavimą. | pamoka | Jasmine |
| 15 | Duomenų analizė | Ciklas | Šis duomenų mokslo ciklo etapas skiria dėmesį duomenų analizės technikoms. | pamoka | Jasmine |
| 16 | Komunikacija | Ciklas | Šis duomenų mokslo ciklo etapas skiria dėmesį duomenų įžvalgų pateikimui taip, kad sprendimų priėmėjams būtų lengviau suprasti. | pamoka | Jalen |
| 17 | Duomenų mokslas debesyje | Debesų duomenys | Ši pamokų serija pristato duomenų mokslą debesyje ir jo privalumus. | pamoka | Tiffany ir Maud |
| 18 | Duomenų mokslas debesyje | Debesų duomenys | Modelių mokymas naudojant Low Code įrankius. | pamoka | Tiffany ir Maud |
| 19 | Duomenų mokslas debesyje | Debesų duomenys | Modelių dislokavimas naudojant Azure Machine Learning Studio. | pamoka | Tiffany ir Maud |
| 20 | Duomenų mokslas gamtoje | Gamtoje | Duomenų mokslo projektai realiame pasaulyje. | pamoka | Nitya |
GitHub Codespaces
Atlikite šiuos veiksmus, kad atidarytumėte šį pavyzdį Codespace aplinkoje:
- Spustelėkite mygtuką Code ir pasirinkite Open with Codespaces parinktį.
- Pasirinkite + New codespace apačioje esančioje srityje. Daugiau informacijos rasite GitHub dokumentacijoje.
VSCode Remote - Containers
Atlikite šiuos veiksmus, kad atidarytumėte šį saugyklą konteineryje naudodami savo kompiuterį ir VSCode naudojant VS Code Remote - Containers plėtinį:
- Jei pirmą kartą naudojate kūrimo konteinerį, įsitikinkite, kad jūsų sistema atitinka reikalavimus (pvz., įdiegėte Docker) pagal pradžios dokumentaciją.
Norėdami naudoti šią saugyklą, galite atidaryti ją izoliuoto Docker tūrio viduje:
Pastaba: Tam naudojama Remote-Containers: Clone Repository in Container Volume... komanda, kuri duomenų kodą nukopijuoja į Docker tūrį, o ne į vietinę failų sistemą. Tūriai yra pageidautinas būdas išsaugoti konteinerio duomenis.
Arba atidarykite vietinę klonuotą ar parsisiųstą saugyklos versiją:
- Nuklonuokite šią saugyklą į savo kompiuterį.
- Paspauskite F1 ir pasirinkite komandą Remote-Containers: Open Folder in Container....
- Pasirinkite šios aplanko nuklonuotą kopiją, palaukite kol konteineris užsikraus ir išbandykite.
Darbas neprisijungus
Galite naudoti šią dokumentaciją neprisijungę naudodami Docsify. Nuklonuokite šią saugyklą, įdiekite Docsify savo kompiuteryje, tada šios saugyklos šakninėje aplanke paleiskite komandą docsify serve. Svetainė bus pasiekiama per 3000 prievadą jūsų vietiniame serveryje: localhost:3000.
Pastaba, užrašų knygelės nebus rodomos Docsify platformoje, tad kai reikės paleisti užrašų knygelę, darykite tai atskirai VS Code su Python branduoliu.
Kitos mokymo programos
Mūsų komanda kuria ir kitas mokymo programas! Pažiūrėkite:
LangChain
Azure / Edge / MCP / Agentai
Generatyvinė AI mokymų serija
Pagrindinis mokymasis
Copilot serija
Pagalbos gavimas
Susiduriate su problemomis? Peržiūrėkite mūsų Trikčių šalinimo vadovą su dažnų problemų sprendimais.
Jei įstringate ar turite klausimų apie AI programų kūrimą, prisijunkite prie kitų besimokančių ir patyrusių kūrėjų diskusijų apie MCP. Tai palaikanti bendruomenė, kurioje klausimai yra laukiamí ir žinios dalijamasi laisvai.
Jei turite produktų atsiliepimų arba susiduriate su klaidomis kūrimo metu, apsilankykite:
Atsakomybės apribojimas: Šis dokumentas buvo išverstas naudojant dirbtinio intelekto vertimo paslaugą Co-op Translator. Nors stengiamės užtikrinti tikslumą, prašome atkreipti dėmesį, kad automatiniai vertimai gali turėti klaidų ar netikslumų. Originalus dokumentas jo gimtąja kalba turi būti laikomas autoritetingu šaltiniu. Kritinei informacijai rekomenduojamas profesionalus žmogaus vertimas. Mes neatsakom už bet kokius nesusipratimus ar neteisingus aiškinimus, kilusius naudojant šį vertimą.



