|
|
5 days ago | |
|---|---|---|
| .. | ||
| 1-Introduction | 2 months ago | |
| 2-Working-With-Data | 5 days ago | |
| 3-Data-Visualization | 4 months ago | |
| 4-Data-Science-Lifecycle | 4 months ago | |
| 5-Data-Science-In-Cloud | 4 months ago | |
| 6-Data-Science-In-Wild | 4 months ago | |
| docs | 4 months ago | |
| examples | 3 months ago | |
| quiz-app | 4 months ago | |
| sketchnotes | 4 months ago | |
| AGENTS.md | 3 months ago | |
| CODE_OF_CONDUCT.md | 4 months ago | |
| CONTRIBUTING.md | 3 months ago | |
| INSTALLATION.md | 3 months ago | |
| README.md | 5 days ago | |
| SECURITY.md | 4 months ago | |
| SUPPORT.md | 4 months ago | |
| TROUBLESHOOTING.md | 3 months ago | |
| USAGE.md | 3 months ago | |
| for-teachers.md | 4 months ago | |
README.md
Duomenų mokslas pradedantiesiems – mokymo programa
„Microsoft“ Azure Cloud Advocates džiaugiasi galėdami pasiūlyti 10 savaičių, 20 pamokų mokymo programą, skirtą Duomenų mokslui. Kiekviena pamoka apima priešpamokinius ir popamokinius testus, rašytines instrukcijas pamokos atlikimui, sprendimą ir užduotį. Mūsų projektinė pedagogika leidžia mokytis kuriant, o tai yra patikrintas būdas naujiems įgūdžiams įsisavinti.
Nuoširdus ačiū mūsų autoriams: Jasmine Greenaway, Dmitry Soshnikov, Nitya Narasimhan, Jalen McGee, Jen Looper, Maud Levy, Tiffany Souterre, Christopher Harrison.
🙏 Ypatingas ačiū 🙏 mūsų Microsoft Student Ambassador autoriams, recenzentams ir turinio bendradarbiams, ypač Aaryan Arora, Aditya Garg, Alondra Sanchez, Ankita Singh, Anupam Mishra, Arpita Das, ChhailBihari Dubey, Dibri Nsofor, Dishita Bhasin, Majd Safi, Max Blum, Miguel Correa, Mohamma Iftekher (Iftu) Ebne Jalal, Nawrin Tabassum, Raymond Wangsa Putra, Rohit Yadav, Samridhi Sharma, Sanya Sinha, Sheena Narula, Tauqeer Ahmad, Yogendrasingh Pawar , Vidushi Gupta, Jasleen Sondhi
![]() |
|---|
| Duomenų mokslas pradedantiesiems – Sketchnote by @nitya |
🌐 Daugiakalbė palaikymas
Palaikoma per GitHub Action (automatizuota ir visada atnaujinta)
Arabic | Bengali | Bulgarian | Burmese (Myanmar) | Chinese (Simplified) | Chinese (Traditional, Hong Kong) | Chinese (Traditional, Macau) | Chinese (Traditional, Taiwan) | Croatian | Czech | Danish | Dutch | Estonian | Finnish | French | German | Greek | Hebrew | Hindi | Hungarian | Indonesian | Italian | Japanese | Kannada | Korean | Lithuanian | Malay | Malayalam | Marathi | Nepali | Nigerian Pidgin | Norwegian | Persian (Farsi) | Polish | Portuguese (Brazil) | Portuguese (Portugal) | Punjabi (Gurmukhi) | Romanian | Russian | Serbian (Cyrillic) | Slovak | Slovenian | Spanish | Swahili | Swedish | Tagalog (Filipino) | Tamil | Telugu | Thai | Turkish | Ukrainian | Urdu | Vietnamese
Jei norite, kad būtų palaikomos papildomos vertimų kalbos, jos išvardytos čia
Prisijunkite prie mūsų bendruomenės
Mes turime vykdomą Discord mokymosi su DI seriją, sužinokite daugiau ir prisijunkite prie mūsų Learn with AI Series nuo 2025 m. rugsėjo 18 iki 30 d. Ten gausite patarimų ir gudrybių, kaip naudoti GitHub Copilot Duomenų mokslui.
Ar esi studentas?
Pradėkite naudodamiesi šiais ištekliais:
- Studentų centras Šiame puslapyje rasite pradedančiųjų išteklius, studentų paketus ir net būdus gauti nemokamą sertifikato kuponą. Tai puslapis, kurį verta įsidėti į žymes ir kartais peržiūrėti, nes mes bent kartą per mėnesį atnaujiname turinį.
- Microsoft Learn Student Ambassadors Prisijunkite prie pasaulinės studentų ambasadorių bendruomenės, tai gali būti jūsų kelias į Microsoft.
Pradžia
📚 Dokumentacija
- Įdiegimo vadovas – žingsnis po žingsnio nustatymo instrukcijos pradedantiesiems
- Naudojimo vadovas – pavyzdžiai ir dažniausiai naudojami darbo procesai
- Trikčių šalinimas – sprendimai dažniausioms problemoms
- Prisidėjimo vadovas – kaip prisidėti prie šio projekto
- Mokytojams – mokymo gairės ir klasės ištekliai
👨🎓 Studentams
Visiškai pradedantiesiems: naujas duomenų moksle? Pradėkite nuo mūsų pradedančiųjų draugiškų pavyzdžių! Šie paprasti, gerai paaiškinti pavyzdžiai padės suprasti pagrindus prieš pradedant visą mokymo programą. Studentams: norėdami naudoti šią mokymo programą savarankiškai, padarykite viso repozitorija šaką (fork) ir atlikite pratimus savarankiškai, pradėdami nuo priešpaskaitinio testo. Tada perskaitykite paskaitą ir atlikite likusias veiklas. Stenkitės kurti projektus suprasdami pamokas, o ne kopijuodami sprendimo kodą; tačiau šis kodas yra prieinamas /solutions aplankuose kiekvienoje projektui skirtose pamokoje. Kita idėja – suformuoti mokymosi grupę su draugais ir kartu peržiūrėti turinį. Tolimesniam mokymuisi rekomenduojame Microsoft Learn.
Greitas pradėjimas:
- Peržiūrėkite Įdiegimo vadovą, kad nustatytumėte savo aplinką
- Susipažinkite su Naudojimo vadovu, kad sužinotumėte, kaip dirbti su mokymo programa
- Pradėkite nuo 1 pamokos ir dirbkite nuosekliai
- Prisijunkite prie mūsų Discord bendruomenės pagalbai
👩🏫 Mokytojams
Mokytojams: mes įtraukėme keletą pasiūlymų, kaip naudoti šią mokymo programą. Labai laukiame jūsų atsiliepimų mūsų diskusijų forume!
Susipažinkite su komanda
Gif sukūrė Mohit Jaisal
🎥 Spustelėkite aukščiau esantį paveikslėlį, kad pamatytumėte vaizdo įrašą apie projektą ir žmones, kurie jį sukūrė!
Pedagogika
Kuriant šią mokymo programą pasirinkome du pedagoginius principus: užtikrinti, kad ji būtų paremta projektais ir kad joje būtų dažnai atliekami testai. Šios serijos pabaigoje studentai išmoks pagrindinius duomenų mokslo principus, įskaitant etikos sąvokas, duomenų paruošimą, skirtingus duomenų apdorojimo būdus, duomenų vizualizaciją, duomenų analizę, realaus pasaulio duomenų mokslo panaudojimo atvejus ir dar daugiau.
Be to, žemo rizikos testo atlikimas prieš pamoką nukreipia studentą į mokymąsi, o antras testas po pamokos užtikrina geresnį įsisavinimą. Ši mokymo programa sukurta būti lanksti ir smagi, ją galima atlikti visą arba dalimis. Projektai prasideda nuo mažų užduočių ir tampa vis sudėtingesni per 10 savaičių ciklą.
Raskite mūsų Elgesio kodeksą, Indėlio, Vertimo gaires. Laukiame jūsų konstruktyvios grįžtamosios informacijos!
Kiekviena pamoka apima:
- Pasirenkamą eskizą
- Pasirenkamą papildomą vaizdo įrašą
- Apšilimo testą prieš pamoką
- Rašytinę pamoką
- Projektinėms pamokoms – žingsnis po žingsnio gaires, kaip sukurti projektą
- Žinių patikrinimus
- Iššūkį
- Papildomą skaitymą
- Užduotį
- Testą po pamokos
Pastaba apie testus: Visi testai yra Quiz-App aplanke, iš viso 40 testų po tris klausimus kiekviename. Jie susieti pamokose, tačiau testų programėlę galima paleisti vietoje arba diegti Azure; vadovaukitės instrukcijomis
quiz-appaplanke. Testai palaipsniui lokalizuojami.
🎓 Pradedančiųjų draugiški pavyzdžiai
Naujas duomenų moksle? Sukūrėme specialų pavyzdžių katalogą su paprastu, gerai paaiškintu kodu, kuris padės jums pradėti:
- 🌟 Sveikas pasauli! – Jūsų pirmoji duomenų mokslo programa
- 📂 Duomenų įkėlimas – Išmokite skaityti ir tyrinėti duomenų rinkinius
- 📊 Paprasta analizė – Apskaičiuokite statistiką ir raskite dėsningumus
- 📈 Pagrindinė vizualizacija – Kurkite diagramas ir grafikus
- 🔬 Realaus pasaulio projektas – Pilnas darbo eiga nuo pradžios iki pabaigos
Kiekviename pavyzdyje yra išsamūs komentarai, paaiškinantys kiekvieną žingsnį, todėl jis puikiai tinka visiškiems pradedantiesiems!
Pamokos
![]() |
|---|
| Duomenų mokslas pradedantiesiems: kelio žemėlapis - Eskizas @nitya |
| Pamokos numeris | Tema | Pamokos grupė | Mokymosi tikslai | Susieta pamoka | Autorius |
|---|---|---|---|---|---|
| 01 | Duomenų mokslo apibrėžimas | Įvadas | Sužinokite pagrindines duomenų mokslo sąvokas ir kaip jis susijęs su dirbtiniu intelektu, mašininiu mokymusi ir didžiaisiais duomenimis. | pamoka vaizdo įrašas | Dmitry |
| 02 | Duomenų mokslo etika | Įvadas | Duomenų etikos sąvokos, iššūkiai ir sistemos. | pamoka | Nitya |
| 03 | Duomenų apibrėžimas | Įvadas | Kaip klasifikuojami duomenys ir jų įprasti šaltiniai. | pamoka | Jasmine |
| 04 | Įvadas į statistiką ir tikimybes | Įvadas | Matematiniai tikimybių ir statistikos metodai duomenims suprasti. | pamoka vaizdo įrašas | Dmitry |
| 05 | Darbas su reliaciniais duomenimis | Darbas su duomenimis | Įvadas į reliacinius duomenis ir pagrindai, kaip tyrinėti ir analizuoti reliacinius duomenis naudojant struktūrizuotą užklausų kalbą, dar vadinamą SQL (iš tariama „si-kvel“). | pamoka | Christopher |
| 06 | Darbas su NoSQL duomenimis | Darbas su duomenimis | Įvadas į nereliacinius duomenis, jų įvairius tipus ir pagrindus, kaip tyrinėti ir analizuoti dokumentų duomenų bazes. | pamoka | Jasmine |
| 07 | Darbas su Python | Darbas su duomenimis | Python naudojimo duomenų tyrinėjimui pagrindai su bibliotekomis, tokiomis kaip Pandas. Rekomenduojama turėti pagrindines Python programavimo žinias. | pamoka vaizdo įrašas | Dmitry |
| 08 | Duomenų paruošimas | Darbas su duomenimis | Temų apie duomenų valymo ir transformavimo technikas, skirtas spręsti trūkstamų, netikslių ar neišsamių duomenų problemas. | pamoka | Jasmine |
| 09 | Kiekybių vizualizavimas | Duomenų vizualizacija | Išmokite naudoti Matplotlib paukščių duomenų vizualizavimui 🦆 | pamoka | Jen |
| 10 | Duomenų pasiskirstymo vizualizavimas | Duomenų vizualizacija | Stebėjimų ir tendencijų intervale vizualizavimas. | pamoka | Jen |
| 11 | Proporcijų vizualizavimas | Duomenų vizualizacija | Diskrečių ir grupuotų procentų vizualizavimas. | pamoka | Jen |
| 12 | Ryšių vizualizavimas | Duomenų vizualizacija | Ryšių ir koreliacijų tarp duomenų rinkinių ir jų kintamųjų vizualizavimas. | pamoka | Jen |
| 13 | Reikšmingos vizualizacijos | Duomenų vizualizacija | Technikos ir gairės, kaip padaryti vizualizacijas vertingas efektyviam problemų sprendimui ir įžvalgoms. | pamoka | Jen |
| 14 | Įvadas į duomenų mokslo gyvavimo ciklą | Gyvavimo ciklas | Įvadas į duomenų mokslo gyvavimo ciklą ir jo pirmą žingsnį – duomenų gavimą ir išgavimą. | pamoka | Jasmine |
| 15 | Analizė | Gyvavimo ciklas | Ši duomenų mokslo gyvavimo ciklo fazė skirta duomenų analizės technikoms. | pamoka | Jasmine |
| 16 | Komunikacija | Gyvavimo ciklas | Ši duomenų mokslo gyvavimo ciklo fazė skirta pateikti duomenų įžvalgas taip, kad sprendimų priėmėjams būtų lengviau jas suprasti. | pamoka | Jalen |
| 17 | Duomenų mokslas debesyje | Debesų duomenys | Ši pamokų serija supažindina su duomenų mokslo pritaikymu debesyje ir jo privalumais. | pamoka | Tiffany ir Maud |
| 18 | Duomenų mokslas debesyje | Debesų duomenys | Modelių mokymas naudojant Low Code įrankius. | pamoka | Tiffany ir Maud |
| 19 | Duomenų mokslas debesyje | Debesų duomenys | Modelių diegimas naudojant Azure Machine Learning Studio. | pamoka | Tiffany ir Maud |
| 20 | Duomenų mokslas realiame pasaulyje | Realiame pasaulyje | Duomenų mokslo projektai realiame pasaulyje. | pamoka | Nitya |
GitHub Codespaces
Atlikite šiuos veiksmus, kad atidarytumėte šį pavyzdį Codespace aplinkoje:
- Spustelėkite Code išskleidžiamąjį meniu ir pasirinkite Open with Codespaces parinktį.
- Pasirinkite + New codespace apačioje esančiame lange. Daugiau informacijos rasite GitHub dokumentacijoje.
VSCode Remote - Containers
Atlikite šiuos veiksmus, kad atidarytumėte šį saugyklą konteineryje naudodami savo vietinę mašiną ir VSCode su VS Code Remote - Containers plėtiniu:
- Jei tai pirmas kartas, kai naudojate kūrimo konteinerį, įsitikinkite, kad jūsų sistema atitinka reikalavimus (pvz., įdiegtas Docker) pagal pradžios dokumentaciją.
Norėdami naudoti šią saugyklą, galite atidaryti ją izoliuotame Docker tūryje:
Pastaba: Po gaubtu bus naudojama Remote-Containers: Clone Repository in Container Volume... komanda, kuri klonuos šaltinio kodą į Docker tūrį vietoje vietinės failų sistemos. Tūriai yra pageidaujamas mechanizmas konteinerių duomenims išsaugoti.
Arba atidarykite vietoje klonuotą arba atsisiųstą saugyklos versiją:
- Nuklonuokite šią saugyklą į savo vietinę failų sistemą.
- Paspauskite F1 ir pasirinkite Remote-Containers: Open Folder in Container... komandą.
- Pasirinkite šio aplanko klonuotą kopiją, palaukite, kol konteineris paleis, ir išbandykite.
Offline prieiga
Galite naudoti šią dokumentaciją neprisijungę naudodami Docsify. Šakinkite šią saugyklą, įdiekite Docsify savo vietinėje mašinoje, tada šios saugyklos šakninėje aplanke įveskite docsify serve. Svetainė bus pasiekiama per 3000 prievadą jūsų localhost: localhost:3000.
Pastaba, kad užrašų knygelės nebus atvaizduojamos per Docsify, todėl kai reikės paleisti užrašų knygelę, darykite tai atskirai VS Code su Python branduoliu.
Kitos mokymo programos
Mūsų komanda kuria ir kitas mokymo programas! Peržiūrėkite:
LangChain
Azure / Edge / MCP / Agents
Generatyvinio AI serija
Pagrindinis mokymasis
Copilot serija
Pagalbos gavimas
Susiduriate su problemomis? Peržiūrėkite mūsų Trikčių šalinimo vadovą, kuriame rasite sprendimus dažniausiai pasitaikančioms problemoms.
Jei užstringate arba turite klausimų apie AI programėlių kūrimą, prisijunkite prie kitų besimokančiųjų ir patyrusių kūrėjų diskusijų apie MCP. Tai palaikanti bendruomenė, kurioje klausimai yra laukiami, o žinios dalijamos laisvai.
Jei turite atsiliepimų apie produktą arba radote klaidų kūrimo metu, apsilankykite:
Atsakomybės apribojimas:
Šis dokumentas buvo išverstas naudojant dirbtinio intelekto vertimo paslaugą Co-op Translator. Nors stengiamės užtikrinti tikslumą, prašome atkreipti dėmesį, kad automatiniai vertimai gali turėti klaidų ar netikslumų. Originalus dokumentas gimtąja kalba turėtų būti laikomas autoritetingu šaltiniu. Svarbiai informacijai rekomenduojamas profesionalus žmogaus vertimas. Mes neatsakome už bet kokius nesusipratimus ar neteisingus aiškinimus, kilusius dėl šio vertimo naudojimo.



