|
|
2 weeks ago | |
|---|---|---|
| .. | ||
| 1-Introduction | 2 weeks ago | |
| 2-Working-With-Data | 2 weeks ago | |
| 3-Data-Visualization | 2 weeks ago | |
| 4-Data-Science-Lifecycle | 2 weeks ago | |
| 5-Data-Science-In-Cloud | 2 weeks ago | |
| 6-Data-Science-In-Wild | 2 weeks ago | |
| docs | 5 months ago | |
| examples | 4 months ago | |
| quiz-app | 5 months ago | |
| sketchnotes | 2 weeks ago | |
| AGENTS.md | 4 months ago | |
| CODE_OF_CONDUCT.md | 5 months ago | |
| CONTRIBUTING.md | 2 weeks ago | |
| INSTALLATION.md | 4 months ago | |
| README.md | 2 weeks ago | |
| SECURITY.md | 5 months ago | |
| SUPPORT.md | 5 months ago | |
| TROUBLESHOOTING.md | 4 months ago | |
| USAGE.md | 4 months ago | |
| for-teachers.md | 5 months ago | |
README.md
Data Science for Beginners - A Curriculum
Microsoftin Azure Cloud Advocates -tiimi tarjoaa mielellään 10 viikon, 20 oppitunnin opetussuunnitelman, joka käsittelee datatiedettä. Jokainen oppitunti sisältää ennakko- ja jälkitehtävät, kirjalliset ohjeet oppitunnin suorittamiseen, ratkaisun ja tehtävän. Projektipohjainen pedagogiikkamme antaa sinun oppia rakentamalla — todistettu tapa, jonka avulla uudet taidot "juurtuvat".
Sydämellinen kiitos tekijöillemme: Jasmine Greenaway, Dmitry Soshnikov, Nitya Narasimhan, Jalen McGee, Jen Looper, Maud Levy, Tiffany Souterre, Christopher Harrison.
🙏 Erityiskiitos 🙏 Microsoft Student Ambassador -kirjoittajille, tarkistajille ja sisällönavustajille, erityisesti Aaryan Arora, Aditya Garg, Alondra Sanchez, Ankita Singh, Anupam Mishra, Arpita Das, ChhailBihari Dubey, Dibri Nsofor, Dishita Bhasin, Majd Safi, Max Blum, Miguel Correa, Mohamma Iftekher (Iftu) Ebne Jalal, Nawrin Tabassum, Raymond Wangsa Putra, Rohit Yadav, Samridhi Sharma, Sanya Sinha, Sheena Narula, Tauqeer Ahmad, Yogendrasingh Pawar , Vidushi Gupta, Jasleen Sondhi
![]() |
|---|
| Data Science For Beginners - Sketchnote tekijältä @nitya |
🌐 Monikielinen tuki
Tuettu GitHub Actionin kautta (automaattinen ja aina ajan tasalla)
Arabic | Bengali | Bulgarian | Burmese (Myanmar) | Chinese (Simplified) | Chinese (Traditional, Hong Kong) | Chinese (Traditional, Macau) | Chinese (Traditional, Taiwan) | Croatian | Czech | Danish | Dutch | Estonian | Finnish | French | German | Greek | Hebrew | Hindi | Hungarian | Indonesian | Italian | Japanese | Kannada | Korean | Lithuanian | Malay | Malayalam | Marathi | Nepali | Nigerian Pidgin | Norwegian | Persian (Farsi) | Polish | Portuguese (Brazil) | Portuguese (Portugal) | Punjabi (Gurmukhi) | Romanian | Russian | Serbian (Cyrillic) | Slovak | Slovenian | Spanish | Swahili | Swedish | Tagalog (Filipino) | Tamil | Telugu | Thai | Turkish | Ukrainian | Urdu | Vietnamese
Jos haluat lisätä tuettuja käännöskieliä, käytössä olevat kielet löytyvät täältä
Liity yhteisöömme
Meillä on käynnissä Discordissa Learn with AI -sarja; lisätietoja ja liity mukaan osoitteessa Learn with AI -sarja ajanjaksolla 18.–30. syyskuuta 2025. Saat vinkkejä ja niksejä GitHub Copilotin käyttämiseen datatieteessä.
Oletko opiskelija?
Aloita seuraavista resursseista:
- Student Hub -sivu Tältä sivulta löydät aloittelijoille suunnattuja resursseja, opiskelijapaketit ja jopa tapoja saada ilmainen sertifikaattivoucher. Tämä on yksi sivu, jonka haluat lisätä kirjanmerkkeihin ja tarkistaa säännöllisesti, sillä päivitämme sisältöä vähintään kuukausittain.
- Microsoft Learn Student Ambassadors -ohjelma Liity globaalin opiskelija-ambassadoreiden yhteisöön — tämä voi olla porttisi Microsoftiin.
Aloittaminen
📚 Dokumentaatio
- Asennusopas - Askel askeleelta -ohjeet ympäristön pystyttämiseen aloittelijoille
- Käyttöohje - Esimerkkejä ja yleisiä työnkulkumalleja
- Vianmääritys - Ratkaisuja yleisiin ongelmiin
- Osallistumisohjeet - Kuinka osallistua tähän projektiin
- Opettajille - Opetukseen liittyviä ohjeita ja luokkahuoneen resursseja
👨🎓 Opiskelijoille
Täydelliset aloittelijat: Uusi datatieteessä? Aloita aloittelijoille sopivista esimerkeistämme! Nämä yksinkertaiset, hyvin kommentoidut esimerkit auttavat sinua ymmärtämään perusteet ennen kuin sukellat koko opetussuunnitelmaan. Opiskelijat: käyttääksesi tätä opetussuunnitelmaa itsenäisesti, tee fork koko repositoriosta ja suorita harjoitukset itse, aloittaen ennakkokyselyllä. Lue sitten luentomateriaali ja suorita loput aktiviteeteista. Yritä luoda projektit ymmärtämällä oppitunnit sen sijaan, että kopioit ratkaisukoodin; ratkaisukoodit löytyvät kuitenkin /solutions-kansioista jokaisessa projektilähtöisessä oppitunnissa. Toinen idea on muodostaa opiskeluryhmä ystävien kanssa ja käydä sisältö yhdessä läpi. Lisäopiskelua varten suosittelemme Microsoft Learnia.
Pika-aloitus:
- Tarkista Asennusopas asettaaksesi ympäristösi
- Lue läpi Käyttöohje oppiaksesi työskentelemään opetussuunnitelman kanssa
- Aloita Oppitunnista 1 ja etene järjestyksessä
- Liity Discord-yhteisöömme saadaksesi tukea
👩🏫 Opettajille
Opettajat: olemme lisänneet joitain ehdotuksia siitä, miten tätä opetussuunnitelmaa voi käyttää. Haluaisimme kuulla palautteesi keskustelufoorumissamme!
Tutustu tiimiin
Gif tekijältä Mohit Jaisal
🎥 Klikkaa yllä olevaa kuvaa katsoaksesi videon projektista ja ihmisistä, jotka loivat sen!
Pedagogiikka
Olemme valinneet kaksi pedagogista periaatetta tämän opetussuunnitelman rakentamisessa: varmistaa, että se perustuu projekteihin, ja että siihen sisältyy usein quiz-testejä. Tämän sarjan lopussa opiskelijat ovat oppineet data-analytiikan perusperiaatteet, mukaan lukien eettiset käsitteet, datan valmistelun, erilaiset tavat työskennellä datan kanssa, datan visualisoinnin, data-analyysin, data-analytiikan todelliset käyttötapaukset ja muuta.
Lisäksi matalan panoksen quiz ennen tuntia suuntaa opiskelijan aikomusta oppia aihetta, kun taas toinen quiz tunnin jälkeen varmistaa paremman mieleenpainumisen. Tämä opetussuunnitelma on suunniteltu joustavaksi ja hauskoiksi ja sen voi suorittaa kokonaan tai osittain. Projektit alkavat pienestä ja kasvavat yhä monimutkaisemmiksi 10 viikon syklin loppuun mennessä.
Löydät meidän Käyttäytymissäännöt, Osallistuminen, Käännökset ohjeet. Otamme mielellämme vastaan rakentavaa palautettasi!
Jokainen oppitunti sisältää:
- Valinnainen sketchnote
- Valinnainen lisävideon
- Ennen oppituntia oleva lämmittelyquiz
- Kirjallinen oppitunti
- Projektiperusteisissa oppitunneissa vaiheittaiset ohjeet projektin rakentamiseen
- Tiedon tarkistuksia
- Haasteen
- Lisälukemista
- Tehtävän
- Oppitunnon jälkeinen quiz
Huomautus quizeistä: Kaikki quizit sijaitsevat Quiz-App-kansiossa, yhteensä 40 quizia, joissa jokaisessa on kolme kysymystä. Ne on linkitetty oppitunneista, mutta quiz-sovellusta voi ajaa paikallisesti tai ottaa käyttöön Azureen; seuraa ohjeita
quiz-app-kansiossa. Niitä lokalisoidaan vähitellen.
🎓 Aloittelijaystävälliset esimerkit
Uusi data-analytiikassa? Olemme luoneet erityisen esimerkkihakemiston, jossa on yksinkertaista ja hyvin kommentoitua koodia auttamaan sinua alkuun:
- 🌟 Hello World - Ensimmäinen data-analytiikkaohjelmasi
- 📂 Datan lataaminen - Opi lukemaan ja tutkimaan datasettejä
- 📊 Yksinkertainen analyysi - Laske tilastot ja löydä malleja
- 📈 Perusvisualisointi - Luo kaavioita ja diagrammeja
- 🔬 Todellinen projekti - Täysi työnkulku alusta loppuun
Jokainen esimerkki sisältää yksityiskohtaisia kommentteja, jotka selittävät jokaisen vaiheen, joten ne sopivat erinomaisesti aivan aloitteleville!
Oppitunnit
![]() |
|---|
| Data-analytiikka aloittelijoille: Tiekartta - Sketchnote by @nitya |
| Lesson Number | Topic | Lesson Grouping | Learning Objectives | Linked Lesson | Author |
|---|---|---|---|---|---|
| 01 | Data-analytiikan määrittely | Introduction | Tutustu data-analytiikan peruskäsitteisiin ja siihen, miten se liittyy tekoälyyn, koneoppimiseen ja big dataan. | lesson video | Dmitry |
| 02 | Datan etiikka | Introduction | Datan etiikan käsitteet, haasteet ja viitekehykset. | lesson | Nitya |
| 03 | Datan määrittely | Introduction | Miten dataa luokitellaan ja sen yleiset lähteet. | lesson | Jasmine |
| 04 | Johdatus tilastotieteeseen ja todennäköisyyslaskentaan | Introduction | Todennäköisyys- ja tilastomenetelmät datan ymmärtämiseksi. | lesson video | Dmitry |
| 05 | Relaatiotietojen käsittely | Working With Data | Johdanto relaatiotietoihin ja perustiedot relaatiotietojen tutkimisesta ja analysoinnista Structured Query Language -kielen (tunnetaan myös nimellä SQL, lausutaan “see-quell”) avulla. | lesson | Christopher |
| 06 | NoSQL-datan käsittely | Working With Data | Johdatus ei-relaatiotyyppiseen dataan, sen eri tyyppeihin ja dokumenttitietokantojen tutkimisen ja analysoinnin perusteisiin. | lesson | Jasmine |
| 07 | Pythonin käyttö | Working With Data | Perusteet Pythonin käytöstä datan tutkimiseen kirjastoilla kuten Pandas. Suositellaan perustietämystä Python-ohjelmoinnista. | lesson video | Dmitry |
| 08 | Datan valmistelu | Working With Data | Aiheita datan puhdistus- ja muuntelutekniikoista, jotta voidaan käsitellä puuttuvan, epätarkan tai keskeneräisen datan haasteita. | lesson | Jasmine |
| 09 | Määrien visualisointi | Data Visualization | Opi käyttämään Matplotlibia lintudatan visualisointiin 🦆 | lesson | Jen |
| 10 | Datan jakaumien visualisointi | Data Visualization | Havaintojen ja trendien visualisointi tietyllä välillä. | lesson | Jen |
| 11 | Osuuksien visualisointi | Data Visualization | Diskreettien ja ryhmiteltyjen prosenttiosuuksien visualisointi. | lesson | Jen |
| 12 | Suhteiden visualisointi | Data Visualization | Yhteyksien ja korrelaatioiden visualisointi eri datakokonaisuuksien ja niiden muuttujien välillä. | lesson | Jen |
| 13 | Merkitykselliset visualisoinnit | Data Visualization | Tekniikat ja ohjeet, joiden avulla visualisoinnista tulee arvokas tehokkaaseen ongelmanratkaisuun ja oivalluksiin. | lesson | Jen |
| 14 | Johdanto data-analytiikan elinkaareen | Lifecycle | Johdatus data-analytiikan elinkaareen ja sen ensimmäiseen vaiheeseen, datan hankintaan ja uuttamiseen. | lesson | Jasmine |
| 15 | Analysointi | Lifecycle | Tämä vaihe data-analytiikan elinkaaresta keskittyy datan analysointitekniikoihin. | lesson | Jasmine |
| 16 | Viestintä | Lifecycle | Tämä vaihe data-analytiikan elinkaaresta keskittyy datasta saatujen oivallusten esittämiseen tavalla, joka helpottaa päätöksentekijöiden ymmärtämistä. | lesson | Jalen |
| 17 | Data-analytiikka pilvessä | Cloud Data | Tämä oppituntisarja esittelee pilvipohjaista data-analytiikkaa ja sen etuja. | lesson | Tiffany and Maud |
| 18 | Data-analytiikka pilvessä | Cloud Data | Mallien kouluttaminen Low Code -työkaluilla. | lesson | Tiffany and Maud |
| 19 | Data-analytiikka pilvessä | Cloud Data | Mallien käyttöönotto Azure Machine Learning Studiolla. | lesson | Tiffany and Maud |
| 20 | Data-analytiikka käytännössä | In the Wild | Data-analytiikkaan perustuvat projektit tosielämässä. | lesson | Nitya |
GitHub Codespaces
Noudata näitä ohjeita avataksesi tämän mallin Codespacessa:
- Klikkaa Code-pudotusvalikkoa ja valitse Open with Codespaces -vaihtoehto.
- Valitse + New codespace paneelin alareunasta. Lisätietoja saat GitHubin dokumentaatiosta.
VSCode Remote - Containers
Noudata näitä ohjeita avataksesi tämän repositorion kontissa käyttämällä paikallista konettasi ja VS Codea VS Code Remote - Containers -laajennuksen avulla:
- Jos käytät kehityssäilöä (development container) ensimmäistä kertaa, varmista, että järjestelmäsi täyttää ennakkoedellytykset (esim. Docker on asennettu) kohdassa aloitusohjeet.
Käyttääksesi tätä repositoriota voit joko avata repositorion eristetyssä Docker-volyymissa:
Huom. Taustalla tämä käyttää Remote-Containers: Clone Repository in Container Volume... -komentoa kloonaamaan lähdekoodin Docker-volyymiin paikallisen tiedostojärjestelmän sijaan. Volyymit ovat suositeltu tapa säilyttää säilön dataa.
Tai avaa paikallisesti kloonattu tai ladattu versio repositoriosta:
- Kloonaa tämä repositorio paikalliselle tiedostojärjestelmällesi.
- Paina F1 ja valitse Remote-Containers: Open Folder in Container... -komento.
- Valitse kloonattu kopio tästä kansiosta, odota säilön käynnistymistä ja kokeile.
Offline-käyttö
Voit ajaa tämän dokumentaation offline-tilassa käyttämällä Docsify. Forkkaa tämä repo, asenna Docsify paikalliselle koneellesi, sitten tämän repositorion juurihakemistossa kirjoita docsify serve. Sivusto palvelee osoitteessa portti 3000 paikallisessa koneessasi: localhost:3000.
Huomaa, muistikirjoja (notebookeja) ei renderöidä Docsifyllä, joten kun tarvitset notebookin suorittamista, suorita se erikseen VS Codessa Python-ytimen kanssa.
Muut opetussuunnitelmat
Tiimimme tuottaa muitakin opetussuunnitelmia! Tutustu:
LangChain
Azure / Edge / MCP / Agents
Generatiivinen tekoäly -sarja
Perusopinnot
Copilot-sarja
Hanki apua
Koetko ongelmia? Katso Vianmääritysopas saadaksesi ratkaisuja yleisiin ongelmiin.
Jos jumitut tai sinulla on kysyttävää AI‑sovellusten rakentamisesta, liity muiden oppijoiden ja kokeneiden kehittäjien keskusteluihin MCP:stä. Se on kannustava yhteisö, jossa kysymyksiin suhtaudutaan avoimesti ja tietoa jaetaan vapaasti.
Jos sinulla on tuotepalautetta tai kohtaat virheitä rakentamisen aikana, käy:
Vastuuvapauslauseke: Tämä asiakirja on käännetty käyttämällä tekoälypohjaista käännöspalvelua Co-op Translator (https://github.com/Azure/co-op-translator). Vaikka pyrimme tarkkuuteen, huomioithan, että automaattikäännöksissä saattaa esiintyä virheitä tai epätarkkuuksia. Alkuperäistä asiakirjaa sen alkuperäisellä kielellä on pidettävä virallisena lähteenä. Tärkeiden tietojen osalta suosittelemme ammattimaista ihmiskäännöstä. Emme ole vastuussa tämän käännöksen käytöstä aiheutuvista väärinymmärryksistä tai virheellisistä tulkinnoista.



