# Pradedančiųjų duomenų mokslas: Pavyzdžiai Sveiki atvykę į pavyzdžių katalogą! Ši paprastų, gerai paaiškintų pavyzdžių kolekcija sukurta tam, kad padėtų jums pradėti mokytis duomenų mokslo, net jei esate visiškas naujokas. ## 📚 Ką rasite čia Kiekvienas pavyzdys yra savarankiškas ir apima: - **Aiškius komentarus**, paaiškinančius kiekvieną žingsnį - **Paprastą, lengvai skaitomą kodą**, kuris demonstruoja vieną koncepciją vienu metu - **Realią kontekstą**, padedantį suprasti, kada ir kodėl naudoti šiuos metodus - **Tikėtiną rezultatą**, kad žinotumėte, ko ieškoti ## 🚀 Pradžia ### Reikalavimai Prieš paleisdami šiuos pavyzdžius, įsitikinkite, kad turite: - Įdiegtą Python 3.7 ar naujesnę versiją - Pagrindines žinias, kaip paleisti Python skriptus ### Reikalingų bibliotekų įdiegimas ```bash pip install pandas numpy matplotlib ``` ## 📖 Pavyzdžių apžvalga ### 1. Sveikas pasauli - Duomenų mokslo stilius **Failas:** `01_hello_world_data_science.py` Jūsų pirmoji duomenų mokslo programa! Sužinokite, kaip: - Įkelti paprastą duomenų rinkinį - Rodyti pagrindinę informaciją apie savo duomenis - Atspausdinti pirmąjį duomenų mokslo rezultatą Puikiai tinka visiškiems naujokams, norintiems pamatyti savo pirmąją duomenų mokslo programą veikiančią. --- ### 2. Duomenų įkėlimas ir tyrinėjimas **Failas:** `02_loading_data.py` Išmokite pagrindus, kaip dirbti su duomenimis: - Skaityti duomenis iš CSV failų - Peržiūrėti pirmas kelias duomenų rinkinio eilutes - Gauti pagrindinę statistiką apie savo duomenis - Suprasti duomenų tipus Tai dažnai yra pirmasis žingsnis bet kuriame duomenų mokslo projekte! --- ### 3. Paprasta duomenų analizė **Failas:** `03_simple_analysis.py` Atlikite savo pirmąją duomenų analizę: - Apskaičiuokite pagrindinę statistiką (vidurkį, medianą, modą) - Raskite maksimalias ir minimalias reikšmes - Suskaičiuokite reikšmių pasikartojimus - Filtruokite duomenis pagal sąlygas Sužinokite, kaip atsakyti į paprastus klausimus apie savo duomenis. --- ### 4. Duomenų vizualizacijos pagrindai **Failas:** `04_basic_visualization.py` Sukurkite savo pirmąsias vizualizacijas: - Sukurkite paprastą stulpelinę diagramą - Sukurkite linijinį grafiką - Sukurkite pyrago diagramą - Išsaugokite savo vizualizacijas kaip paveikslėlius Išmokite vizualiai perteikti savo išvadas! --- ### 5. Darbas su realiais duomenimis **Failas:** `05_real_world_example.py` Sujunkite viską į vieną pilną pavyzdį: - Įkelkite realius duomenis iš saugyklos - Išvalykite ir paruoškite duomenis - Atlikite analizę - Sukurkite prasmingas vizualizacijas - Padarykite išvadas Šis pavyzdys parodo visą darbo eigą nuo pradžios iki pabaigos. --- ## 🎯 Kaip naudotis šiais pavyzdžiais 1. **Pradėkite nuo pradžių**: Pavyzdžiai sunumeruoti pagal sudėtingumą. Pradėkite nuo `01_hello_world_data_science.py` ir eikite toliau. 2. **Skaitykite komentarus**: Kiekviename faile yra išsamūs komentarai, paaiškinantys, ką kodas daro ir kodėl. Skaitykite juos atidžiai! 3. **Eksperimentuokite**: Bandykite keisti kodą. Kas nutinka, jei pakeičiate reikšmę? Sugadinkite ir pataisykite - taip mokomasi! 4. **Paleiskite kodą**: Vykdykite kiekvieną pavyzdį ir stebėkite rezultatą. Palyginkite jį su tuo, ko tikėjotės. 5. **Plėskite**: Kai suprasite pavyzdį, bandykite jį praplėsti savo idėjomis. ## 💡 Patarimai pradedantiesiems - **Neskubėkite**: Skirkite laiko suprasti kiekvieną pavyzdį prieš pereidami prie kito - **Rašykite kodą patys**: Nekopijuokite ir neįklijuokite. Rašymas padeda mokytis ir prisiminti - **Ieškokite nežinomų sąvokų**: Jei matote ką nors nesuprantamo, ieškokite informacijos internete arba pagrindinėse pamokose - **Klauskite**: Prisijunkite prie [diskusijų forumo](https://github.com/microsoft/Data-Science-For-Beginners/discussions), jei jums reikia pagalbos - **Praktikuokitės reguliariai**: Bandykite programuoti šiek tiek kiekvieną dieną, o ne ilgomis sesijomis kartą per savaitę ## 🔗 Kiti žingsniai Baigę šiuos pavyzdžius, būsite pasiruošę: - Dirbti su pagrindinėmis mokymo programos pamokomis - Bandykite užduotis kiekviename pamokų aplanke - Tyrinėkite Jupyter užrašų knygeles, kad mokytumėtės giliau - Kurkite savo duomenų mokslo projektus ## 📚 Papildomi ištekliai - [Pagrindinė mokymo programa](../README.md) - Pilnas 20 pamokų kursas - [Mokytojams](../for-teachers.md) - Kaip naudoti šią mokymo programą klasėje - [Microsoft Learn](https://docs.microsoft.com/learn/) - Nemokami internetiniai mokymosi ištekliai - [Python dokumentacija](https://docs.python.org/3/) - Oficialus Python vadovas ## 🤝 Prisidėjimas Radote klaidą ar turite idėją naujam pavyzdžiui? Mes laukiame jūsų indėlio! Prašome peržiūrėti mūsų [Prisidėjimo vadovą](../CONTRIBUTING.md). --- **Sėkmės mokantis! 🎉** Prisiminkite: Kiekvienas ekspertas kadaise buvo pradedantysis. Ženkite po vieną žingsnį ir nebijokite daryti klaidų - jos yra mokymosi proceso dalis! --- **Atsakomybės atsisakymas**: Šis dokumentas buvo išverstas naudojant AI vertimo paslaugą [Co-op Translator](https://github.com/Azure/co-op-translator). Nors siekiame tikslumo, prašome atkreipti dėmesį, kad automatiniai vertimai gali turėti klaidų ar netikslumų. Originalus dokumentas jo gimtąja kalba turėtų būti laikomas autoritetingu šaltiniu. Dėl svarbios informacijos rekomenduojama profesionali žmogaus vertimo paslauga. Mes neprisiimame atsakomybės už nesusipratimus ar neteisingus aiškinimus, atsiradusius naudojant šį vertimą.