|
|
2 months ago | |
|---|---|---|
| .. | ||
| 1-Introduction | 3 months ago | |
| 2-Working-With-Data | 2 months ago | |
| 3-Data-Visualization | 4 months ago | |
| 4-Data-Science-Lifecycle | 4 months ago | |
| 5-Data-Science-In-Cloud | 4 months ago | |
| 6-Data-Science-In-Wild | 4 months ago | |
| docs | 4 months ago | |
| examples | 3 months ago | |
| quiz-app | 4 months ago | |
| sketchnotes | 4 months ago | |
| AGENTS.md | 3 months ago | |
| CODE_OF_CONDUCT.md | 4 months ago | |
| CONTRIBUTING.md | 3 months ago | |
| INSTALLATION.md | 3 months ago | |
| README.md | 2 months ago | |
| SECURITY.md | 4 months ago | |
| SUPPORT.md | 4 months ago | |
| TROUBLESHOOTING.md | 3 months ago | |
| USAGE.md | 3 months ago | |
| for-teachers.md | 4 months ago | |
README.md
Duomenų mokslas pradedantiesiems - Mokymo programa
Azure Cloud Advocates iš Microsoft džiaugiasi galėdami pasiūlyti 10 savaičių, 20 pamokų mokymo programą apie duomenų mokslą. Kiekvienoje pamokoje yra prieš pamoką ir po pamokos pateikiami testai, rašytinės instrukcijos, kaip atlikti pamoką, sprendimas ir užduotis. Mūsų projektinis mokymosi metodas leidžia mokytis kuriant, o tai yra patikrintas būdas įgyti naujų įgūdžių.
Nuoširdžiai dėkojame mūsų autoriams: Jasmine Greenaway, Dmitry Soshnikov, Nitya Narasimhan, Jalen McGee, Jen Looper, Maud Levy, Tiffany Souterre, Christopher Harrison.
🙏 Ypatinga padėka 🙏 mūsų Microsoft Student Ambassador autoriams, recenzentams ir turinio kūrėjams, ypač Aaryan Arora, Aditya Garg, Alondra Sanchez, Ankita Singh, Anupam Mishra, Arpita Das, ChhailBihari Dubey, Dibri Nsofor, Dishita Bhasin, Majd Safi, Max Blum, Miguel Correa, Mohamma Iftekher (Iftu) Ebne Jalal, Nawrin Tabassum, Raymond Wangsa Putra, Rohit Yadav, Samridhi Sharma, Sanya Sinha, Sheena Narula, Tauqeer Ahmad, Yogendrasingh Pawar , Vidushi Gupta, Jasleen Sondhi
![]() |
|---|
| Duomenų mokslas pradedantiesiems - Sketchnote by @nitya |
🌐 Daugiakalbė parama
Palaikoma per GitHub Action (Automatizuota ir visada atnaujinta)
Arabų | Bengalų | Bulgarų | Birmos (Mianmaras) | Kinų (supaprastinta) | Kinų (tradicinė, Honkongas) | Kinų (tradicinė, Makao) | Kinų (tradicinė, Taivanas) | Kroatų | Čekų | Danų | Olandų | Estų | Suomių | Prancūzų | Vokiečių | Graikų | Hebrajų | Hindi | Vengrų | Indoneziečių | Italų | Japonų | Korėjiečių | Lietuvių | Malajų | Maratų | Nepalų | Norvegų | Persų (farsi) | Lenkų | Portugalų (Brazilija) | Portugalų (Portugalija) | Pandžabų (Gurmukhi) | Rumunų | Rusų | Serbų (kirilica) | Slovakų | Slovėnų | Ispanų | Svahilių | Švedų | Tagalogų (filipiniečių) | Tamilų | Tajų | Turkų | Ukrainiečių | Urdu | Vietnamiečių
Jei norite, kad būtų palaikomos papildomos kalbos, sąrašą rasite čia
Prisijunkite prie mūsų bendruomenės
Turime Discord mokymosi su AI seriją, sužinokite daugiau ir prisijunkite prie mūsų Learn with AI Series nuo 2025 m. rugsėjo 18 iki 30 d. Sužinosite patarimų ir gudrybių, kaip naudoti GitHub Copilot duomenų mokslui.
Ar esate studentas?
Pradėkite nuo šių išteklių:
- Studentų centras Šiame puslapyje rasite pradedančiųjų išteklius, studentų paketus ir net būdus, kaip gauti nemokamą sertifikato kuponą. Tai puslapis, kurį verta įsiminti ir reguliariai tikrinti, nes turinys keičiamas bent kartą per mėnesį.
- Microsoft Learn Student Ambassadors Prisijunkite prie pasaulinės studentų ambasadorių bendruomenės, tai gali būti jūsų kelias į Microsoft.
Pradžia
📚 Dokumentacija
- Diegimo vadovas - Žingsnis po žingsnio instrukcijos pradedantiesiems
- Naudojimo vadovas - Pavyzdžiai ir dažniausiai naudojami darbo procesai
- Trikčių šalinimas - Sprendimai dažniausiai pasitaikančioms problemoms
- Prisidėjimo vadovas - Kaip prisidėti prie šio projekto
- Mokytojams - Mokymo gairės ir klasės ištekliai
👨🎓 Studentams
Visiški pradedantieji: Nauji duomenų mokslui? Pradėkite nuo mūsų pradedantiesiems skirtų pavyzdžių! Šie paprasti, gerai paaiškinti pavyzdžiai padės jums suprasti pagrindus prieš gilindamiesi į visą mokymo programą. Studentai: norėdami savarankiškai naudotis šia mokymo programa, nukopijuokite visą repozitoriją ir atlikite užduotis savarankiškai, pradėdami nuo testo prieš paskaitą. Tada perskaitykite paskaitą ir atlikite likusias veiklas. Stenkitės kurti projektus suprasdami pamokas, o ne kopijuodami sprendimo kodą; tačiau tas kodas yra prieinamas /solutions aplankuose kiekvienoje projektui skirtoje pamokoje. Kita idėja būtų sukurti studijų grupę su draugais ir kartu peržiūrėti turinį. Dėl tolesnių studijų rekomenduojame Microsoft Learn.
Greitas startas:
- Peržiūrėkite Diegimo vadovą, kad nustatytumėte savo aplinką
- Perskaitykite Naudojimo vadovą, kad sužinotumėte, kaip dirbti su mokymo programa
- Pradėkite nuo 1 pamokos ir tęskite iš eilės
- Prisijunkite prie mūsų Discord bendruomenės pagalbai
👩🏫 Mokytojams
Mokytojai: mes įtraukėme keletą pasiūlymų, kaip naudoti šią mokymo programą. Norėtume gauti jūsų atsiliepimus mūsų diskusijų forume!
Susipažinkite su komanda
Gif sukūrė Mohit Jaisal
🎥 Spustelėkite aukščiau esančią nuotrauką, kad pamatytumėte vaizdo įrašą apie projektą ir žmones, kurie jį sukūrė!
Pedagogika
Mes pasirinkome du pedagoginius principus kurdami šią mokymo programą: užtikrinti, kad ji būtų projektinė ir kad joje būtų dažni testai. Iki šios serijos pabaigos studentai išmoks pagrindinius duomenų mokslo principus, įskaitant etikos koncepcijas, duomenų paruošimą, įvairius darbo su duomenimis būdus, duomenų vizualizaciją, duomenų analizę, realaus pasaulio duomenų mokslo pritaikymą ir dar daugiau.
Be to, mažos rizikos testas prieš pamoką padeda studentui susikoncentruoti į mokymosi temą, o antrasis testas po pamokos užtikrina geresnį informacijos išlaikymą. Ši mokymo programa buvo sukurta taip, kad būtų lanksti ir įdomi, ją galima studijuoti pilnai arba dalimis. Projektai prasideda nuo paprastų ir tampa vis sudėtingesni iki 10 savaičių ciklo pabaigos.
Raskite mūsų Elgesio kodeksą, Prisidėjimo, Vertimo gaires. Laukiame jūsų konstruktyvios nuomonės!
Kiekviena pamoka apima:
- Pasirenkamą eskizą
- Pasirenkamą papildomą vaizdo įrašą
- Testą prieš pamoką
- Rašytinę pamoką
- Projektinėms pamokoms – žingsnis po žingsnio vadovus, kaip sukurti projektą
- Žinių patikrinimus
- Iššūkį
- Papildomą skaitymą
- Užduotį
- Testą po pamokos
Pastaba apie testus: Visi testai yra „Quiz-App“ aplanke, iš viso 40 testų, kiekviename po tris klausimus. Jie yra susieti su pamokomis, tačiau testų programėlę galima paleisti vietoje arba įdiegti Azure; sekite instrukcijas „quiz-app“ aplanke. Testai palaipsniui lokalizuojami.
🎓 Pavyzdžiai pradedantiesiems
Naujokas duomenų moksle? Mes sukūrėme specialų pavyzdžių katalogą su paprastu, gerai paaiškintu kodu, kuris padės jums pradėti:
- 🌟 Hello World - Jūsų pirmoji duomenų mokslo programa
- 📂 Duomenų įkėlimas - Išmokite skaityti ir tyrinėti duomenų rinkinius
- 📊 Paprasta analizė - Skaičiuokite statistiką ir raskite dėsningumus
- 📈 Pagrindinė vizualizacija - Kurkite diagramas ir grafikus
- 🔬 Realaus pasaulio projektas - Pilnas darbo procesas nuo pradžios iki pabaigos
Kiekviename pavyzdyje yra išsamūs komentarai, paaiškinantys kiekvieną žingsnį, todėl jie puikiai tinka visiškai pradedantiesiems!
Pamokos
![]() |
|---|
| Duomenų mokslas pradedantiesiems: Planas - Eskizas @nitya |
| Pamokos numeris | Tema | Pamokų grupavimas | Mokymosi tikslai | Susieta pamoka | Autorius |
|---|---|---|---|---|---|
| 01 | Duomenų mokslo apibrėžimas | Įvadas | Sužinokite pagrindines duomenų mokslo sąvokas ir kaip jis susijęs su dirbtiniu intelektu, mašininiu mokymusi ir dideliais duomenimis. | pamoka vaizdo įrašas | Dmitry |
| 02 | Duomenų mokslo etika | Įvadas | Duomenų etikos koncepcijos, iššūkiai ir struktūros. | pamoka | Nitya |
| 03 | Duomenų apibrėžimas | Įvadas | Kaip klasifikuojami duomenys ir jų bendri šaltiniai. | pamoka | Jasmine |
| 04 | Įvadas į statistiką ir tikimybes | Įvadas | Matematiniai tikimybių ir statistikos metodai duomenims suprasti. | pamoka vaizdo įrašas | Dmitry |
| 05 | Darbas su reliaciniais duomenimis | Darbas su duomenimis | Įvadas į reliacinius duomenis ir pagrindai, kaip tyrinėti ir analizuoti reliacinius duomenis naudojant struktūrinę užklausų kalbą, dar žinomą kaip SQL (tariama „si-kvel“). | pamoka | Christopher |
| 06 | Darbas su NoSQL duomenimis | Darbas su duomenimis | Įvadas į nereliacinius duomenis, jų įvairius tipus ir pagrindai, kaip tyrinėti ir analizuoti dokumentų duomenų bazes. | pamoka | Jasmine |
| 07 | Darbas su Python | Darbas su duomenimis | Pagrindai, kaip naudoti Python duomenų tyrinėjimui su bibliotekomis, tokiomis kaip Pandas. Rekomenduojama turėti pagrindinį Python programavimo supratimą. | pamoka vaizdo įrašas | Dmitry |
| 08 | Duomenų paruošimas | Darbas su duomenimis | Temos apie duomenų valymo ir transformavimo technikas, siekiant spręsti trūkstamų, netikslių ar neišsamių duomenų problemas. | pamoka | Jasmine |
| 09 | Kiekių vizualizavimas | Duomenų vizualizacija | Išmokite naudoti Matplotlib vizualizuojant paukščių duomenis 🦆 | pamoka | Jen |
| 10 | Duomenų pasiskirstymo vizualizavimas | Duomenų vizualizacija | Vizualizuojant stebėjimus ir tendencijas intervale. | pamoka | Jen |
| 11 | Proporcijų vizualizavimas | Duomenų vizualizacija | Vizualizuojant diskrečius ir grupuotus procentus. | pamoka | Jen |
| 12 | Ryšių vizualizavimas | Duomenų vizualizacija | Vizualizuojant ryšius ir koreliacijas tarp duomenų rinkinių ir jų kintamųjų. | pamoka | Jen |
| 13 | Reikšmingos vizualizacijos | Duomenų vizualizacija | Technikos ir gairės, kaip padaryti jūsų vizualizacijas vertingas efektyviam problemų sprendimui ir įžvalgoms. | pamoka | Jen |
| 14 | Įvadas į duomenų mokslo gyvavimo ciklą | Gyvavimo ciklas | Įvadas į duomenų mokslo gyvavimo ciklą ir jo pirmąjį žingsnį – duomenų įsigijimą ir išgavimą. | pamoka | Jasmine |
| 15 | Analizavimas | Gyvavimo ciklas | Ši duomenų mokslo gyvavimo ciklo fazė orientuota į duomenų analizės technikas. | pamoka | Jasmine |
| 16 | Komunikacija | Gyvavimo ciklas | Ši duomenų mokslo gyvavimo ciklo fazė orientuota į duomenų įžvalgų pateikimą taip, kad sprendimų priėmėjams būtų lengviau suprasti. | pamoka | Jalen |
| 17 | Duomenų mokslas debesyje | Debesų duomenys | Ši pamokų serija supažindina su duomenų mokslu debesyje ir jo privalumais. | pamoka | Tiffany ir Maud |
| 18 | Duomenų mokslas debesyje | Debesų duomenys | Modelių mokymas naudojant mažo kodo įrankius. | pamoka | Tiffany ir Maud |
| 19 | Duomenų mokslas debesyje | Debesų duomenys | Modelių diegimas naudojant Azure Machine Learning Studio. | pamoka | Tiffany ir Maud |
| 20 | Duomenų mokslas laukinėje aplinkoje | Laukinėje aplinkoje | Duomenų mokslo projektai realiame pasaulyje. | pamoka | Nitya |
GitHub Codespaces
Sekite šiuos žingsnius, kad atidarytumėte šį pavyzdį Codespace:
- Spustelėkite Code išskleidžiamąjį meniu ir pasirinkite Open with Codespaces parinktį.
- Pasirinkite + New codespace apačioje. Daugiau informacijos rasite GitHub dokumentacijoje.
VSCode Remote - Containers
Sekite šiuos žingsnius, kad atidarytumėte šį repo konteineryje naudodami savo vietinį kompiuterį ir VSCode su VS Code Remote - Containers plėtiniu:
- Jei tai jūsų pirmas kartas naudojant vystymo konteinerį, įsitikinkite, kad jūsų sistema atitinka reikalavimus (pvz., įdiegta Docker) pradžios dokumentacijoje.
Norėdami naudoti šį repo, galite jį atidaryti izoliuotame Docker tūryje:
Pastaba: Viduje tai naudos Remote-Containers: Clone Repository in Container Volume... komandą, kad nukopijuotų šaltinio kodą į Docker tūrį, o ne vietinę failų sistemą. Tūriai yra pageidaujamas mechanizmas konteinerio duomenims išsaugoti.
Arba atidarykite vietoje nukopijuotą ar atsisiųstą repo versiją:
- Nukopijuokite šį repo į savo vietinę failų sistemą.
- Paspauskite F1 ir pasirinkite Remote-Containers: Open Folder in Container... komandą.
- Pasirinkite nukopijuotą šio aplanko kopiją, palaukite, kol konteineris bus paleistas, ir išbandykite.
Prieiga be interneto
Šią dokumentaciją galite peržiūrėti be interneto naudodami Docsify. Fork'inkite šį repo, įdiekite Docsify savo vietiniame kompiuteryje, tada repo šakniniame aplanke įveskite docsify serve. Svetainė bus pasiekiama per 3000 portą jūsų localhost: localhost:3000.
Pastaba, užrašų knygelės nebus rodomos per Docsify, todėl kai reikia paleisti užrašų knygelę, tai darykite atskirai VS Code naudojant Python branduolį.
Kitos mokymo programos
Mūsų komanda kuria ir kitas mokymo programas! Peržiūrėkite:
Azure / Edge / MCP / Agentai
Generatyvaus dirbtinio intelekto serija
Pagrindinis mokymasis
Copilot serija
Pagalbos gavimas
Susidūrėte su problemomis? Peržiūrėkite mūsų Trikčių šalinimo vadovą, kuriame rasite sprendimus dažniausiai pasitaikančioms problemoms.
Jei susiduriate su sunkumais ar turite klausimų apie dirbtinio intelekto programų kūrimą, prisijunkite:
Jei turite atsiliepimų apie produktą arba susiduriate su klaidomis kurdami, apsilankykite:
Atsakomybės apribojimas:
Šis dokumentas buvo išverstas naudojant AI vertimo paslaugą Co-op Translator. Nors siekiame tikslumo, prašome atkreipti dėmesį, kad automatiniai vertimai gali turėti klaidų ar netikslumų. Originalus dokumentas jo gimtąja kalba turėtų būti laikomas autoritetingu šaltiniu. Dėl svarbios informacijos rekomenduojama profesionali žmogaus vertimo paslauga. Mes neprisiimame atsakomybės už nesusipratimus ar neteisingus interpretavimus, atsiradusius naudojant šį vertimą.



