|
|
2 weeks ago | |
|---|---|---|
| .. | ||
| 1-Introduction | 2 weeks ago | |
| 2-Working-With-Data | 2 weeks ago | |
| 3-Data-Visualization | 2 weeks ago | |
| 4-Data-Science-Lifecycle | 2 weeks ago | |
| 5-Data-Science-In-Cloud | 2 weeks ago | |
| 6-Data-Science-In-Wild | 2 weeks ago | |
| docs | 5 months ago | |
| examples | 4 months ago | |
| quiz-app | 5 months ago | |
| sketchnotes | 2 weeks ago | |
| AGENTS.md | 4 months ago | |
| CODE_OF_CONDUCT.md | 5 months ago | |
| CONTRIBUTING.md | 2 weeks ago | |
| INSTALLATION.md | 4 months ago | |
| README.md | 2 weeks ago | |
| SECURITY.md | 5 months ago | |
| SUPPORT.md | 5 months ago | |
| TROUBLESHOOTING.md | 4 months ago | |
| USAGE.md | 4 months ago | |
| for-teachers.md | 5 months ago | |
README.md
Duomenų Mokslas Pradedantiesiems – Mokymo Programa
Azure Cloud advokatai Microsoft’e džiaugiasi galėdami pasiūlyti 10 savaičių, 20 pamokų mokymo programą, skirtą Duomenų Mokslui. Kiekviena pamoka apima priešpamokinius ir popamokinius testus, parašytas instrukcijas pamokos atlikimui, sprendimą ir užduotį. Mūsų projektinė pedagogika leidžia mokytis per praktinius darbus, patikrintas būdas naujiems įgūdžiams „įsimesti“.
Nuoširdus ačiū mūsų autoriams: Jasmine Greenaway, Dmitry Soshnikov, Nitya Narasimhan, Jalen McGee, Jen Looper, Maud Levy, Tiffany Souterre, Christopher Harrison.
🙏 Ypatingas ačiū 🙏 mūsų Microsoft Student Ambassador autoriams, peržiūrėtojams ir turinio bendradarbiams, išskirtinai Aaryan Arora, Aditya Garg, Alondra Sanchez, Ankita Singh, Anupam Mishra, Arpita Das, ChhailBihari Dubey, Dibri Nsofor, Dishita Bhasin, Majd Safi, Max Blum, Miguel Correa, Mohamma Iftekher (Iftu) Ebne Jalal, Nawrin Tabassum, Raymond Wangsa Putra, Rohit Yadav, Samridhi Sharma, Sanya Sinha, Sheena Narula, Tauqeer Ahmad, Yogendrasingh Pawar , Vidushi Gupta, Jasleen Sondhi
![]() |
|---|
| Duomenų Mokslas Pradedantiesiems - Sketchnote autorius @nitya |
🌐 Daugiakalbės Galimybės
Palaikoma naudojant GitHub Action (automatinis ir visada atnaujintas)
Arabic | Bengali | Bulgarian | Burmese (Myanmar) | Chinese (Simplified) | Chinese (Traditional, Hong Kong) | Chinese (Traditional, Macau) | Chinese (Traditional, Taiwan) | Croatian | Czech | Danish | Dutch | Estonian | Finnish | French | German | Greek | Hebrew | Hindi | Hungarian | Indonesian | Italian | Japanese | Kannada | Korean | Lithuanian | Malay | Malayalam | Marathi | Nepali | Nigerian Pidgin | Norwegian | Persian (Farsi) | Polish | Portuguese (Brazil) | Portuguese (Portugal) | Punjabi (Gurmukhi) | Romanian | Russian | Serbian (Cyrillic) | Slovak | Slovenian | Spanish | Swahili | Swedish | Tagalog (Filipino) | Tamil | Telugu | Thai | Turkish | Ukrainian | Urdu | Vietnamese
Norite Klonuoti Vietoje?
Šiame repozitorijoje yra daugiau nei 50 kalbų vertimų, kurie žymiai padidina atsisiuntimo dydį. Norėdami klonuoti be vertimų, naudokite sąrašo išrinkimą (sparse checkout):
git clone --filter=blob:none --sparse https://github.com/microsoft/Data-Science-For-Beginners.git cd Data-Science-For-Beginners git sparse-checkout set --no-cone '/*' '!translations' '!translated_images'Tai suteiks jums viską, ko reikia kursui atlikti, su daug greitesniu atsisiuntimu.
Jei norite turėti daugiau palaikomų vertimų kalbų, jas rasite čia
Prisijunkite prie mūsų bendruomenės
Turime vykdomą Discord mokymosi su DI seriją, sužinokite daugiau ir prisijunkite prie mūsų Mokymosi su DI serijoje nuo 2025 m. rugsėjo 18 iki 30 dienos. Gaunate patarimus ir gudrybes, kaip naudoti GitHub Copilot Duomenų Mokslui.
Ar esi studentas?
Pradėk su šiais ištekliais:
- Studentų centras Šiame puslapyje rasite pradedančiųjų išteklius, Studentų paketus ir net būdus gauti nemokamą sertifikato kuponą. Tai puslapis, kurį verta įsidėti į mėgstamiausius ir periodiškai peržiūrėti, nes mes bent kartą per mėnesį atnaujiname turinį.
- Microsoft Learn Student Ambassadors Prisijunk prie pasaulinės studentų ambasadorių bendruomenės, tai galėtų būti tavo kelias į Microsoft.
Pradžia
📚 Dokumentacija
- Įdiegimo Vadovas – Žingsnis po žingsnio diegimo instrukcijos pradedantiesiems
- Naudojimo Vadovas – Pavyzdžiai ir dažni darbo metodai
- Trikčių šalinimas – Dažnų problemų sprendimai
- Indėlio Vadovas – Kaip prisidėti prie šio projekto
- Mokytojams – Mokymo gairės ir klasės ištekliai
👨🎓 Studentams
Visiškai pradedantiesiems: Naujas duomenų moksle? Pradėk nuo mūsų prieinamų pradedantiesiems pavyzdžių! Šie paprasti, gerai paaiškinti pavyzdžiai padės suprasti pagrindus prieš pradedant visą mokymo programą. Studentams: norint naudoti šią mokymo programą savarankiškai, šakinkite visą repozitoriją ir savarankiškai atlikite pratimus, pradėdami nuo priešpaskaitinio testo. Tada perskaitykite paskaitą ir atlikite likusias veiklas. Stenkitės kurti projektus per pamokų supratimą, o ne kopijuojant sprendimo kodą; tačiau pastarasis yra prieinamas kiekvienos projekto orientuotos pamokos /solutions aplankuose. Kita idėja galėtų būti sudaryti studijų grupę su draugais ir kartu peržiūrėti turinį. Papildomam mokymuisi rekomenduojame Microsoft Learn.
Greita pradžia:
- Pasitikrinkite Įdiegimo Vadovą, kad nustatytumėte savo aplinką
- Peržiūrėkite Naudojimo Vadovą, kad sužinotumėte, kaip dirbti su mokymo programa
- Pradėkite nuo 1 pamokos ir eikite nuosekliai
- Prisijunkite prie mūsų Discord bendruomenės pagalbai
👩🏫 Mokytojams
Mokytojams: mes įtraukėme keletą pasiūlymų, kaip naudoti šią mokymo programą. Būtume dėkingi už jūsų atsiliepimus mūsų diskusijų forume!
Susipažinkite su komanda
Gif’as sukurtas Mohit Jaisal
🎥 Spustelėkite paveikslėlį aukščiau, norėdami peržiūrėti vaizdo įrašą apie projektą ir žmones, kurie jį sukūrė!
Pedagogika
Kuriant šią programą pasirinkome du pedagoginius principus: užtikrinti, kad mokymasis vyktų per projektus ir kad būtų dažnai atliekami testai. Šios serijos pabaigoje studentai išmoks duomenų mokslo pagrindus, įskaitant etikos sampratas, duomenų paruošimą, įvairius darbų su duomenimis būdus, duomenų vizualizaciją, duomenų analizę, realaus pasaulio duomenų mokslo panaudojimo atvejus ir daugiau.
Be to, mažos svarbos testas prieš pamoką nukreipia studentų dėmesį į temos mokymąsi, o antras testas po pamokos užtikrina geresnį įsisavinimą. Ši programa sukurta būti lanksčia ir smagia, ją galima atlikti visą iš karto arba dalimis. Projektai prasideda nuo paprastų ir tampa vis sudėtingesni per 10 savaičių ciklą.
Rasite mūsų Elgesio kodeksą, Indėlio į taisykles gaires, Vertimo gaires. Laukiame jūsų konstruktyvios grįžtamosios informacijos!
Kiekviena pamoka apima:
- Pasirenkamą sketchnote (piešinį-užrašą)
- Pasirenkamą papildomą vaizdo įrašą
- Įžanginį testą prieš pamoką
- Rašytinę pamoką
- Projektiniu pagrindu rengiamose pamokose – žingsnis po žingsnio gaires, kaip sukurti projektą
- Žinių patikrinimus
- Iššūkį
- Papildomą skaitymą
- Užduotį
- Testą po pamokos
Pastaba apie testus: Visi testai yra Quiz-App kataloge, kuriuose yra iš viso 40 testų, kiekvienas su trimis klausimais. Jie yra susieti pamokose, tačiau testų programėlę galima paleisti vietoje arba išplėsti į Azure; instrukcijas rasite
quiz-appkataloge. Testai palaipsniui lokalizuojami.
🎓 Mokiniai pradedantiesiems
Naujas duomenų moksle? Sukūrėme specialų pavyzdžių katalogą su paprastu, gerai paaiškintu kodu, kad padėtume pradėti:
- 🌟 Hello World – Jūsų pirmoji duomenų mokslo programa
- 📂 Duomenų įkėlimas – Išmokite skaityti ir tirti duomenų rinkinius
- 📊 Paprasta analizė – Apskaičiuokite statistiką ir raskite dėsningumus
- 📈 Pagrindinė vizualizacija – Kurkite diagramas ir grafikus
- 🔬 Realus projektas – Pilnas darbo eiga nuo pradžios iki pabaigos
Kiekviename pavyzdyje yra išsamūs komentarai, paaiškinantys kiekvieną žingsnį, todėl tai puiku absoliučioms pradedantiesiems!
Pamokos
![]() |
|---|
| Duomenų mokslas pradedantiesiems: Žemėlapis - Piešinys-užrašas autorius @nitya |
| Pamokos numeris | Tema | Pamokos grupė | Mokymosi tikslai | Susieta pamoka | Autorius |
|---|---|---|---|---|---|
| 01 | Duomenų mokslo apibrėžimas | Įvadas | Sužinokite pagrindines duomenų mokslo sąvokas ir kaip jis susijęs su dirbtiniu intelektu, mašininiu mokymusi ir didžiaisiais duomenimis. | pamoka vaizdo įrašas | Dmitry |
| 02 | Duomenų mokslo etika | Įvadas | Duomenų etikos sąvokos, iššūkiai ir metodikos. | pamoka | Nitya |
| 03 | Duomenų apibrėžimas | Įvadas | Kaip klasifikuojami duomenys ir dažniausios jų kilmės. | pamoka | Jasmine |
| 04 | Įvadas į statistiką ir tikimybes | Įvadas | Tikimybių ir statistikos matematiniai metodai duomenims suvokti. | pamoka vaizdo įrašas | Dmitry |
| 05 | Darbas su reliaciniais duomenimis | Darbas su duomenimis | Įvadas į reliacinius duomenis ir pagrindus, kaip tirti ir analizuoti reliacinius duomenis naudojant struktūrizuotą užklausų kalbą, žinomą kaip SQL (tarimas „si-kwel“). | pamoka | Christopher |
| 06 | Darbas su NoSQL duomenimis | Darbas su duomenimis | Įvadas į nereliacinius duomenis, jų tipus ir pagrindus, kaip tirti ir analizuoti dokumentų duomenų bazes. | pamoka | Jasmine |
| 07 | Darbas su Python | Darbas su duomenimis | Python pagrindai duomenų tyrimui su bibliotekomis, tokiomis kaip Pandas. Rekomenduojama turėti pagrindinių Python programavimo žinių. | pamoka vaizdo įrašas | Dmitry |
| 08 | Duomenų paruošimas | Darbas su duomenimis | Duomenų valymo ir transformavimo technikos, skirtos spręsti trūkstamų, netikslių arba neišsamių duomenų problemas. | pamoka | Jasmine |
| 09 | Kiekių vizualizavimas | Duomenų vizualizacija | Išmokite naudoti Matplotlib paukščių duomenų vizualizavimui 🦆 | pamoka | Jen |
| 10 | Duomenų pasiskirstymo vizualizavimas | Duomenų vizualizacija | Stebėjimų ir tendencijų fiksavimas intervale. | pamoka | Jen |
| 11 | Proporcijų vizualizavimas | Duomenų vizualizacija | Diskrečių ir grupuotų procentų vizualizavimas. | pamoka | Jen |
| 12 | Ryšių vizualizavimas | Duomenų vizualizacija | Sąsajų ir koreliacijų tarp duomenų rinkinių ir jų kintamųjų vizualizavimas. | pamoka | Jen |
| 13 | Prasmingos vizualizacijos | Duomenų vizualizacija | Technikos ir gairės, kaip padaryti vizualizacijas vertingas efektyviai problemų sprendimui ir įžvalgoms. | pamoka | Jen |
| 14 | Įvadas į duomenų mokslo gyvavimo ciklą | Gyvavimo ciklas | Įvadas į duomenų mokslo gyvavimo ciklą ir jo pirmą žingsnį – duomenų gavimą ir išgavimą. | pamoka | Jasmine |
| 15 | Analizė | Gyvavimo ciklas | Šio duomenų mokslo gyvavimo ciklo etapo dėmesys – duomenų analizės technikos. | pamoka | Jasmine |
| 16 | Komunikacija | Gyvavimo ciklas | Šio duomenų mokslo gyvavimo ciklo etapo dėmesys – pateikti duomenų įžvalgas taip, kad sprendimų priėmėjams būtų lengviau jas suprasti. | pamoka | Jalen |
| 17 | Duomenų mokslas debesyje | Debesis duomenyse | Ši pamokų serija supažindina su duomenų mokslu debesyje ir jo privalumais. | pamoka | Tiffany ir Maud |
| 18 | Duomenų mokslas debesyje | Debesis duomenyse | Modelių mokymas naudojant Low Code įrankius. | pamoka | Tiffany ir Maud |
| 19 | Duomenų mokslas debesyje | Debesis duomenyse | Modelių diegimas naudojant Azure Machine Learning Studio. | pamoka | Tiffany ir Maud |
| 20 | Duomenų mokslas realiame gyvenime | Realiame gyvenime | Duomenų mokslo projektai tikrame pasaulyje. | pamoka | Nitya |
GitHub Codespaces
Norėdami atidaryti šį pavyzdį Codespace aplinkoje, atlikite šiuos veiksmus:
- Spustelėkite išskleidžiamą meniu Code ir pasirinkite Open with Codespaces.
- Apačioje pasirinkite + New codespace. Daugiau informacijos rasite GitHub dokumentacijoje.
VSCode Remote - Containers
Norėdami atidaryti šį saugyklą konteineryje savo vietiniame kompiuteryje naudodami VSCode per VS Code Remote - Containers plėtinį, atlikite šiuos veiksmus:
- Jei tai pirmas kartas, kai naudojate vystymo konteinerį, įsitikinkite, kad jūsų sistema atitinka priešreikalavimus (pavyzdžiui, įdiegta Docker) pagal pradžiamokslį.
Norėdami naudoti šią saugyklą, galite arba atidaryti saugyklą izoliuotame Docker tūryje:
Pastaba: Paviršutiniškai šis procesas naudoja Remote-Containers komandą: Clone Repository in Container Volume..., kad kodą klo-ninuotų Docker tūryje, o ne vietiniame failų sistemos kataloge. Tūriai yra pageidaujamas duomenų konteinerio saugojimo mechanizmas.
Arba atidarykite vietoje klo-ninuotą ar į jūsų kompiuterį atsisiųstą saugyklą:
- Klo-ninuokite šią saugyklą savo vietiniame failų sistemos kataloge.
- Paspauskite F1 ir pasirinkite komandą Remote-Containers: Open Folder in Container....
- Pasirinkite įkeltą šio katalogo kopiją, palaukite, kol konteineris užsikraus, ir išbandykite.
Offline prieiga
Šią dokumentaciją galite naudoti ir offline režimu su Docsify. Forkinkite šią saugyklą, įdiekite Docsify savo kompiuteryje, tada šios saugyklos šakniniame kataloge įvykdykite komandą docsify serve. Svetainė bus pasiekiama per prievadą 3000 jūsų localhost adresu: localhost:3000.
Pastaba: užrašinai (notebooks) nebus atvaizduojami naudojant Docsify, todėl norėdami paleisti užrašinį paleiskite jį atskirai VS Code, naudodami Python branduolį.
Kitos studijų programos
Mūsų komanda kuria ir kitas studijų programas! Peržiūrėkite:
LangChain
Azure / Edge / MCP / Agentai
Generatyvinis AI serija
Pagrindinis mokymasis
Copilot serija
Pagalbos gavimas
Susidūrėte su problemomis? Peržiūrėkite mūsų Trikčių šalinimo gidą su dažniausiai pasitaikančių problemų sprendimais.
Jei įstringate arba turite klausimų apie AI programų kūrimą. Prisijunkite prie kitų besimokančiųjų ir patyrusių kūrėjų diskusijų apie MCP. Tai palaikanti bendruomenė, kurioje klausimai yra laukiami ir žinios dalijamos laisvai.
Jei turite produkto atsiliepimų arba pastebite klaidų kūrimo metu, apsilankykite:
Atsakomybės apribojimas: Šis dokumentas buvo išverstas naudojant dirbtinio intelekto vertimo paslaugą Co-op Translator. Nors siekiame tikslumo, prašome atkreipti dėmesį, kad automatizuoti vertimai gali turėti klaidų ar netikslumų. Originalus dokumentas jo gimtąja kalba turėtų būti laikomas autoritetingu šaltiniu. Svarbiai informacijai rekomenduojamas profesionalus žmogiškas vertimas. Mes neatsakome už bet kokius nesusipratimus ar klaidingas interpretacijas, kylančias dėl šio vertimo naudojimo.



