|
|
4 days ago | |
|---|---|---|
| .. | ||
| 1-Introduction | 4 days ago | |
| 2-Working-With-Data | 4 days ago | |
| 3-Data-Visualization | 4 days ago | |
| 4-Data-Science-Lifecycle | 4 days ago | |
| 5-Data-Science-In-Cloud | 4 days ago | |
| 6-Data-Science-In-Wild | 4 days ago | |
| docs | 1 month ago | |
| examples | 1 month ago | |
| quiz-app | 1 month ago | |
| sketchnotes | 4 days ago | |
| .co-op-translator.json | 4 days ago | |
| AGENTS.md | 1 month ago | |
| CODE_OF_CONDUCT.md | 1 month ago | |
| CONTRIBUTING.md | 1 month ago | |
| INSTALLATION.md | 1 month ago | |
| README.md | 4 days ago | |
| SECURITY.md | 1 month ago | |
| SUPPORT.md | 1 month ago | |
| TROUBLESHOOTING.md | 1 month ago | |
| USAGE.md | 1 month ago | |
| for-teachers.md | 1 month ago | |
README.md
Duomenų mokslas pradedantiesiems – mokymo programa
„Microsoft“ Azure Cloud advokatai džiaugiasi galėdami pasiūlyti 10 savaičių, 20 pamokų mokymo programą apie duomenų mokslą. Kiekviena pamoka apima priešpamokinius ir po pamokinius testus, rašytines pamokos vykdymo instrukcijas, sprendimą ir užduotį. Mūsų projektinis mokymo metodas leidžia mokytis darant, o tai yra patikrintas būdas naujoms žinioms įsisavinti.
Nuoširdus ačiū mūsų autoriams: Jasmine Greenaway, Dmitry Soshnikov, Nitya Narasimhan, Jalen McGee, Jen Looper, Maud Levy, Tiffany Souterre, Christopher Harrison.
🙏 Specialūs ačiū 🙏 mūsų Microsoft Student Ambassador autoriams, recenzentams ir turinio bendradarbiautojams, ypač Aaryan Arora, Aditya Garg, Alondra Sanchez, Ankita Singh, Anupam Mishra, Arpita Das, ChhailBihari Dubey, Dibri Nsofor, Dishita Bhasin, Majd Safi, Max Blum, Miguel Correa, Mohamma Iftekher (Iftu) Ebne Jalal, Nawrin Tabassum, Raymond Wangsa Putra, Rohit Yadav, Samridhi Sharma, Sanya Sinha, Sheena Narula, Tauqeer Ahmad, Yogendrasingh Pawar , Vidushi Gupta, Jasleen Sondhi
![]() |
|---|
| Duomenų mokslas pradedantiesiems – Sketchnote by @nitya |
🌐 Daugiakalbė palaikymas
Palaikoma per GitHub Action (automatizuota ir visada atnaujinta)
Arabic | Bengali | Bulgarian | Burmese (Myanmar) | Chinese (Simplified) | Chinese (Traditional, Hong Kong) | Chinese (Traditional, Macau) | Chinese (Traditional, Taiwan) | Croatian | Czech | Danish | Dutch | Estonian | Finnish | French | German | Greek | Hebrew | Hindi | Hungarian | Indonesian | Italian | Japanese | Kannada | Korean | Lithuanian | Malay | Malayalam | Marathi | Nepali | Nigerian Pidgin | Norwegian | Persian (Farsi) | Polish | Portuguese (Brazil) | Portuguese (Portugal) | Punjabi (Gurmukhi) | Romanian | Russian | Serbian (Cyrillic) | Slovak | Slovenian | Spanish | Swahili | Swedish | Tagalog (Filipino) | Tamil | Telugu | Thai | Turkish | Ukrainian | Urdu | Vietnamese
Norite klonuoti vietoje?
Ši saugykla apima daugiau nei 50 kalbų vertimų, dėl ko žymiai išauga atsisiuntimo dydis. Norėdami klonuoti be vertimų, naudokite sparse checkout:
Bash / macOS / Linux:
git clone --filter=blob:none --sparse https://github.com/microsoft/Data-Science-For-Beginners.git cd Data-Science-For-Beginners git sparse-checkout set --no-cone '/*' '!translations' '!translated_images'CMD (Windows):
git clone --filter=blob:none --sparse https://github.com/microsoft/Data-Science-For-Beginners.git cd Data-Science-For-Beginners git sparse-checkout set --no-cone "/*" "!translations" "!translated_images"Tai suteikia jums viską, ko reikia norint baigti kursą daug greičiau atsisiunčiant.
Jei norite papildomų palaikomų vertimų kalbų, sąrašas pateikiamas čia
Prisijunkite prie mūsų bendruomenės
Turime vykstančią Discord mokymosi su AI seriją, sužinokite daugiau ir prisijunkite prie mūsų adresu Learn with AI Series nuo 2025 m. rugsėjo 18 iki 30 dienos. Gaunate patarimus ir gudrybes, kaip naudoti GitHub Copilot duomenų mokslui.
Ar esate studentas?
Pradėkite naudodamiesi šiais ištekliais:
- Studentų hub puslapis Šiame puslapyje rasite pradedančiųjų išteklius, studentų paketus ir net būdus gauti nemokamą sertifikato kuponą. Tai puslapis, kurį verta įsidėti į žymes ir patikrinti kartas nuo karto, nes mums kas mėnesį atnaujinamas turinys.
- Microsoft Learn Student Ambassadors Prisijunkite prie pasaulinės studentų ambasadorių bendruomenės – tai gali būti jūsų kelias į Microsoft.
Pradžia
📚 Dokumentacija
- Įdiegimo gidas – žingsnis po žingsnio įdiegimo instrukcijos pradedantiesiems
- Naudojimo gidas – pavyzdžiai ir dažni darbo procesai
- Problemų sprendimas – sprendimai dažniausioms problemoms
- Prisidėjimo gidas – Kaip prisidėti prie šio projekto
- Mokytojams – Mokymo gairės ir klasės ištekliai
👨🎓 Studentams
Visiškai pradedantiesiems: Naujokas duomenų moksle? Pradėkite nuo mūsų pradedančiųjų draugiškų pavyzdžių! Šie paprasti ir gerai paaiškinti pavyzdžiai padės suprasti pagrindus prieš imantis visos mokymo programos. Studentams: norint naudoti šią mokymo programą savarankiškai, sukurkite viso saugyklos forką ir savarankiškai atlikite pratimus, pradedant priešpaskaitos testu. Tada perskaitykite paskaitą ir atlikite likusias užduotis. Stenkitės kurti projektus suprasdami pamokas, o ne kopijuodami sprendimų kodą; tačiau šis kodas prieinamas /solutions aplankuose kiekvienoje projektų orientuotoje pamokoje. Kita idėja – sukurti mokymosi grupę su draugais ir kartu peržiūrėti turinį. Tolimesniam mokymuisi rekomenduojame Microsoft Learn.
Greitas startas:
- Peržiūrėkite Įdiegimo gidą savo aplinkos paruošimui
- Susipažinkite su Naudojimo gidu, kaip dirbti su mokymo programa
- Pradėkite nuo 1-os pamokos ir dirbkite paeiliui
- Prisijunkite prie mūsų Discord bendruomenės pagalbai
👩🏫 Mokytojams
Mokytojams: mes įtraukėme keletą pasiūlymų, kaip naudoti šią mokymo programą. Laukiame jūsų atsiliepimų mūsų diskusijų forume!
Susipažinkite su komanda
Gif sukūrė Mohit Jaisal
🎥 Spauskite paveikslėlį aukščiau, kad pamatytumėte vaizdo įrašą apie projektą ir jį sukūrusius žmones!
Pedagogika
Kuriant šią mokymo programą pasirinkome dvi pedagogines nuostatas: užtikrinti, kad ji būtų pagrįsta projektais ir kad būtų dažnai atliekami testai. Šios serijos pabaigoje studentai išmoks pagrindines duomenų mokslo principus, įskaitant etikos sąvokas, duomenų paruošimą, įvairius būdus dirbti su duomenimis, duomenų vizualizaciją, duomenų analizę, realaus pasaulio duomenų mokslo panaudojimo atvejus ir daug daugiau.
Be to, žemos rizikos testas prieš pamoką nustato studento ketinimą mokytis tam tikros temos, o antras testas po pamokos užtikrina geresnį žinių įsisavinimą. Ši mokymo programa sukurta būti lanksti ir įdomi, ją galima atlikti visiškai arba dalimis. Projektai prasideda nuo mažų ir tampa vis sudėtingesni per 10 savaičių ciklą.
Raskite mūsų Elgesio kodeksą, Indėlio, Vertimo gaires. Laukiame jūsų konstruktyvios kritikos!
Kiekviena pamoka apima:
- Pasirinktinį eskizo užrašą
- Pasirinktinį papildomą video
- Priešpamokos apšilimo testą
- Rašytinę pamoką
- Projektais pagrįstose pamokose – žingsnis po žingsnio vadovus, kaip kurti projektą
- Žinių patikrinimus
- Iššūkį
- Papildomą literatūrą
- Užduotį
- Poklasinį testą
Pastaba apie testus: visi testai yra Quiz-App aplanke, kur yra 40 testų po tris klausimus kiekviename. Jie yra susieti iš pamokų, bet testų programėlę galima paleisti vietoje arba diegti Azure; sekite instrukcijas
quiz-appaplanke. Testai palaipsniui lokalizuojami.
🎓 Pradedančiųjų draugiški pavyzdžiai
Naujas duomenų moksle? Mes sukūrėme specialų pavyzdžių katalogą su paprastu, gerai paaiškintu kodu, kad padėtume jums pradėti:
- 🌟 Hello World – jūsų pirmoji duomenų mokslo programa
- 📂 Duomenų įkėlimas – sužinokite, kaip skaityti ir tyrinėti duomenų rinkinius
- 📊 Paprasta analizė – apskaičiuokite statistiką ir suraskite dėsningumus
- 📈 Pagrindinė vizualizacija – kurkite diagramas ir grafikus
- 🔬 Realaus pasaulio projektas – baigtinis darbo eiga nuo pradžios iki pabaigos
Kiekvienas pavyzdys apima detalius komentarus, paaiškinančius kiekvieną žingsnį, todėl jis puikiai tinka absoliučioms pradedančiųjų pamokoms!
Pamokos
![]() |
|---|
| Duomenų mokslas pradedantiesiems: kelias - Eskizo užrašas autoriaus @nitya |
| Pamokos numeris | Tema | Pamokų grupė | Mokymosi tikslai | Susieta pamoka | Autorius |
|---|---|---|---|---|---|
| 01 | Duomenų mokslo apibrėžimas | Įvadas | Sužinoti pagrindines duomenų mokslo sampratas ir kaip jis siejasi su dirbtiniu intelektu, mašininiu mokymusi ir didžiaisiais duomenimis. | pamoka video | Dmitrijus |
| 02 | Duomenų mokslo etika | Įvadas | Duomenų etikos sampratos, iššūkiai ir sistemos. | pamoka | Nitya |
| 03 | Duomenų apibrėžimas | Įvadas | Kaip klasifikuojami duomenys ir jų dažniausios kilmės. | pamoka | Jasmine |
| 04 | Įvadas į statistiką ir tikimybes | Įvadas | Matematiniai tikimybės ir statistikos metodai duomenų supratimui. | pamoka video | Dmitrijus |
| 05 | Darbas su reliaciniais duomenimis | Darbas su duomenimis | Įvadas į reliacinius duomenis ir pagrindai, kaip tyrinėti ir analizuoti reliacinius duomenis naudojant struktūrinę užklausų kalbą, žinomą kaip SQL (išreiškiama „ši-kvel“). | pamoka | Christopher |
| 06 | Darbas su NoSQL duomenimis | Darbas su duomenimis | Įvadas į neleriacinius duomenis, jų tipus ir pagrindus, kaip tyrinėti ir analizuoti dokumentų duombazes. | pamoka | Jasmine |
| 07 | Darbas su Python | Darbas su duomenimis | Pagrindai, kaip naudoti Python duomenų tyrimui su bibliotekomis, tokiomis kaip Pandas. Rekomenduojama turėti pagrindines Python programavimo žinias. | pamoka video | Dmitrijus |
| 08 | Duomenų paruošimas | Darbas su duomenimis | Temų apie duomenų valymo ir transformavimo metodus, kaip spręsti praleistų, netikslių ar neišsamių duomenų problemas. | pamoka | Jasmine |
| 09 | Kiekių vizualizavimas | Duomenų vizualizacija | Sužinokite, kaip naudoti Matplotlib paukščių duomenų vizualizavimui 🦆 | pamoka | Jen |
| 10 | Duomenų pasiskirstymo vizualizavimas | Duomenų vizualizacija | Stebėjimų ir tendencijų intervale vizualizavimas. | pamoka | Jen |
| 11 | Proporcijų vizualizavimas | Duomenų vizualizacija | Diskrečios ir grupuotos procentinės dalys vizualizuojamos. | pamoka | Jen |
| 12 | Ryšių vizualizavimas | Duomenų vizualizacija | Ryšių ir koreliacijų tarp duomenų rinkinių ir jų kintamųjų vizualizavimas. | pamoka | Jen |
| 13 | Reikšmingos vizualizacijos | Duomenų vizualizacija | Technikos ir gairės, kaip jūsų vizualizacijas padaryti vertingas efektyviam problemų sprendimui ir įžvalgoms. | pamoka | Jen |
| 14 | Įvadas į duomenų mokslo ciklą | Ciklas | Įvadas į duomenų mokslo ciklą ir jo pirmą žingsnį – duomenų gavimą ir išgavimą. | pamoka | Jasmine |
| 15 | Duomenų analizė | Ciklas | Ši duomenų mokslo ciklo fazė koncentruojasi į technikas, skirtas duomenų analizei. | pamoka | Jasmine |
| 16 | Komunikacija | Ciklas | Ši duomenų mokslo ciklo fazė akcentuoja įžvalgų iš duomenų pateikimą taip, kad sprendimų priėmėjams būtų lengviau suprasti. | pamoka | Jalen |
| 17 | Duomenų mokslas debesyje | Debesų duomenys | Ši pamokų serija supažindina su duomenų mokslo naudojimu debesyje ir jo privalumais. | pamoka | Tiffany ir Maud |
| 18 | Duomenų mokslas debesyje | Debesų duomenys | Modelių mokymas naudojant Low Code įrankius. | pamoka | Tiffany ir Maud |
| 19 | Duomenų mokslas debesyje | Debesų duomenys | Modelių diegimas su Azure Machine Learning Studio. | pamoka | Tiffany ir Maud |
| 20 | Duomenų mokslas realiame pasaulyje | Realiame pasaulyje | Duomenų mokslo valdomi projektai realiame pasaulyje. | pamoka | Nitya |
GitHub Codespaces
Sekite šiuos žingsnius, kad atidarytumėte šį pavyzdį Codespace aplinkoje:
- Spauskite Code išskleidžiamą meniu ir pasirinkite Open with Codespaces parinktį.
- Pasirinkite + New codespace apačioje. Daugiau informacijos rasite GitHub dokumentacijoje.
VSCode nuotoliniai konteineriai
Sekite šiuos žingsnius, kad atidarytumėte šį saugyklą konteineryje naudodami savo vietinę mašiną ir VSCode su VS Code Remote - Containers plėtiniu:
- Jei tai pirmas kartas naudojant vystymo konteinerį, įsitikinkite, kad sistema atitinka reikalavimus (pvz., įdiegta Docker) pradžios gide.
Norėdami naudoti šią saugyklą, galite atidaryti ją izoliuotame Docker tūryje:
Pastaba: viduje bus naudojamas Remote-Containers: Clone Repository in Container Volume... komanda, kuri klonavimo kodeksą saugo Docker tūryje vietoje vietinio failų sistemos. Tūriai yra pageidaujamas būdas saugoti konteinerio duomenis.
Arba atidarykite vietinę nuklonuotą ar atsisiųstą šios saugyklos kopiją:
- Nuklonuokite šią saugyklą į savo vietinę failų sistemą.
- Paspauskite F1 ir pasirinkite Remote-Containers: Open Folder in Container... komandą.
- Pasirinkite šio aplanko nuklonuotą kopiją, palaukite kol konteineris užsikraus, ir išbandykite.
Offline prieiga
Šią dokumentaciją galite naudoti neprisijungę naudodami Docsify. Nuklonuokite šią saugyklą, įdiekite Docsify vietinėje mašinoje, tada šios saugyklos šakiniame aplanke įveskite docsify serve. Svetainė bus pasiekiama per 3000 prievadą adresu localhost:3000.
Pastaba, užrašų knygelės (notebooks) nebus rodomos Docsify, todėl kai reikės paleisti užrašų knygelę, darykite tai atskirai VS Code su Python branduoliu.
Kitos mokymo programos
Mūsų komanda kuria ir kitas mokymo programas! Pažiūrėkite:
LangChain
Azure / Edge / MCP / Agentai
Generatyvinis AI serija
Pagrindinis mokymasis
Copilot serija
Pagalbos gavimas
Susiduriate su problemomis? Patikrinkite mūsų Trikčių šalinimo vadovą dažniausių problemų sprendimams.
Jei įstrigote arba turite klausimų apie AI programėlių kūrimą, prisijunkite prie bendraminčių mokinių ir patyrusių kūrėjų diskusijų apie MCP. Tai palaikanti bendruomenė, kurioje klausimai yra laukiamai ir žinios dalijamos laisvai.
Jei turite atsiliepimų apie produktą arba susidūrėte su klaidomis kurdami, apsilankykite:
Atsakomybės apribojimas:
Šis dokumentas buvo išverstas naudojant dirbtinio intelekto vertimo paslaugą Co-op Translator. Nors siekiame tikslumo, prašome atkreipti dėmesį, kad automatizuotuose vertimuose gali būti klaidų ar netikslumų. Originalus dokumentas jo gimtąja kalba turėtų būti laikomas autoritetingu šaltiniu. Svarbiai informacijai rekomenduojama naudoti profesionalų žmogaus vertimą. Mes neatsakome už bet kokius nesusipratimus ar neteisingus suvokimus, kilusius dėl šio vertimo naudojimo.



