diff --git a/translations/lt/1-Introduction/01-defining-data-science/README.md b/translations/lt/1-Introduction/01-defining-data-science/README.md index e418d322..76bd6c3e 100644 --- a/translations/lt/1-Introduction/01-defining-data-science/README.md +++ b/translations/lt/1-Introduction/01-defining-data-science/README.md @@ -1,8 +1,8 @@ -# Apibrėžiant duomenis +# Duomenų Apibrėžimas |![ Sketchnote by [(@sketchthedocs)](https://sketchthedocs.dev) ](../../sketchnotes/03-DefiningData.png)| |:---:| |Duomenų apibrėžimas - _Sketchnote by [@nitya](https://twitter.com/nitya)_ | -Duomenys yra faktai, informacija, stebėjimai ir matavimai, kurie naudojami atradimams daryti ir pagrįstiems sprendimams priimti. Duomenų taškas yra vienetas duomenų rinkinyje, kuris yra duomenų taškų kolekcija. Duomenų rinkiniai gali būti įvairių formatų ir struktūrų, dažniausiai priklausomai nuo jų šaltinio arba vietos, iš kur duomenys buvo gauti. Pavyzdžiui, įmonės mėnesio pajamos gali būti pateiktos skaičiuoklėje, o išmaniojo laikrodžio valandiniai širdies ritmo duomenys gali būti [JSON](https://stackoverflow.com/a/383699) formatu. Duomenų mokslininkai dažnai dirba su skirtingais duomenų tipais viename duomenų rinkinyje. +Duomenys – tai faktai, informacija, stebėjimai ir matavimai, naudojami atradimams daryti ir pagrįstiems sprendimams priimti. Duomenų taškas yra vienas duomenų vienetas duomenų rinkinyje, kuris yra duomenų taškų kolekcija. Duomenų rinkiniai gali būti įvairių formatų ir struktūrų, dažniausiai priklausomai nuo jų šaltinio arba vietos, iš kur jie buvo gauti. Pavyzdžiui, įmonės mėnesinės pajamos gali būti pateiktos skaičiuoklėje, o išmaniojo laikrodžio valandinis širdies ritmo duomenys gali būti [JSON](https://stackoverflow.com/a/383699) formatu. Duomenų mokslininkai dažnai dirba su skirtingų tipų duomenimis viename duomenų rinkinyje. Ši pamoka skirta duomenų identifikavimui ir klasifikavimui pagal jų savybes ir šaltinius. -## [Prieš paskaitą: testas](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/4) +## [Prieš paskaitą: testas](https://ff-quizzes.netlify.app/en/ds/quiz/4) ## Kaip apibūdinami duomenys ### Pirminiai duomenys -Pirminiai duomenys yra duomenys, kurie gauti iš šaltinio pradinėje būsenoje ir dar nebuvo analizuoti ar organizuoti. Kad būtų galima suprasti, kas vyksta su duomenų rinkiniu, jis turi būti organizuotas į formatą, kurį suprastų žmonės ir technologijos, naudojamos tolimesnei analizei. Duomenų rinkinio struktūra apibūdina, kaip jis organizuotas, ir gali būti klasifikuojama kaip struktūrizuota, nestruktūrizuota ir pusiau struktūrizuota. Šios struktūros tipai skiriasi priklausomai nuo šaltinio, tačiau galiausiai telpa į šias tris kategorijas. +Pirminiai duomenys yra duomenys, kurie gaunami tiesiai iš šaltinio savo pradinėje būsenoje ir dar nėra analizuoti ar organizuoti. Kad būtų galima suprasti, kas vyksta su duomenų rinkiniu, jis turi būti organizuotas į formatą, kurį suprastų tiek žmonės, tiek technologijos, naudojamos tolesnei analizei. Duomenų rinkinio struktūra apibūdina, kaip jis yra organizuotas, ir gali būti klasifikuojama kaip struktūrizuota, nestruktūrizuota arba pusiau struktūrizuota. Šios struktūros tipai skirsis priklausomai nuo šaltinio, tačiau galiausiai atitiks vieną iš šių trijų kategorijų. ### Kiekybiniai duomenys -Kiekybiniai duomenys yra skaitiniai stebėjimai duomenų rinkinyje, kuriuos paprastai galima analizuoti, matuoti ir naudoti matematiškai. Kai kurie kiekybinių duomenų pavyzdžiai: šalies gyventojų skaičius, žmogaus ūgis ar įmonės ketvirčio pajamos. Su papildoma analize kiekybiniai duomenys galėtų būti naudojami sezoninėms oro kokybės indekso (AQI) tendencijoms atrasti arba numatyti tikimybę, kad darbo dienos piko metu bus eismas. +Kiekybiniai duomenys yra skaitiniai stebėjimai duomenų rinkinyje, kuriuos paprastai galima analizuoti, matuoti ir naudoti matematiškai. Kai kurie kiekybinių duomenų pavyzdžiai: šalies gyventojų skaičius, žmogaus ūgis ar įmonės ketvirčio pajamos. Atlikus papildomą analizę, kiekybiniai duomenys galėtų būti naudojami sezoninėms oro kokybės indekso (AQI) tendencijoms nustatyti arba spėti, kokia tikimybė, kad darbo dienos piko metu bus eismas. ### Kokybiniai duomenys -Kokybiniai duomenys, dar vadinami kategoriniais duomenimis, yra duomenys, kurių negalima objektyviai išmatuoti, kaip kiekybinių duomenų stebėjimų. Tai paprastai yra įvairūs subjektyvūs duomenys, kurie fiksuoja kažko kokybę, pavyzdžiui, produkto ar proceso. Kartais kokybiniai duomenys yra skaitiniai, tačiau paprastai nenaudojami matematiškai, kaip telefono numeriai ar laiko žymos. Kai kurie kokybinių duomenų pavyzdžiai: vaizdo įrašų komentarai, automobilio markė ir modelis arba artimiausių draugų mėgstamiausia spalva. Kokybiniai duomenys galėtų būti naudojami suprasti, kurie produktai vartotojams patinka labiausiai, arba identifikuoti populiarius raktažodžius darbo paraiškų gyvenimo aprašymuose. +Kokybiniai duomenys, dar vadinami kategoriniais duomenimis, yra duomenys, kurių negalima objektyviai išmatuoti, kaip kiekybinių duomenų stebėjimų. Tai dažniausiai įvairių formatų subjektyvūs duomenys, kurie atspindi kažko kokybę, pavyzdžiui, produkto ar proceso. Kartais kokybiniai duomenys yra skaitiniai, tačiau paprastai nenaudojami matematiškai, pavyzdžiui, telefono numeriai ar laiko žymos. Kai kurie kokybinių duomenų pavyzdžiai: vaizdo įrašų komentarai, automobilio markė ir modelis arba artimiausių draugų mėgstamiausia spalva. Kokybiniai duomenys galėtų būti naudojami norint suprasti, kurie produktai vartotojams patinka labiausiai, arba nustatyti populiarius raktinius žodžius darbo paraiškų gyvenimo aprašymuose. ### Struktūrizuoti duomenys -Struktūrizuoti duomenys yra duomenys, kurie organizuoti į eilutes ir stulpelius, kur kiekviena eilutė turi tą patį stulpelių rinkinį. Stulpeliai atspindi tam tikro tipo vertę ir yra identifikuojami pavadinimu, apibūdinančiu, ką vertė reiškia, o eilutės turi faktines vertes. Stulpeliai dažnai turi specifines taisykles ar apribojimus vertėms, kad būtų užtikrinta, jog vertės tiksliai atspindi stulpelį. Pavyzdžiui, įsivaizduokite klientų skaičiuoklę, kur kiekviena eilutė turi turėti telefono numerį, o telefono numeriai niekada neturi turėti abėcėlinių simbolių. Gali būti taikomos taisyklės, kad telefono numerio stulpelis niekada nebūtų tuščias ir turėtų tik skaičius. +Struktūrizuoti duomenys yra organizuoti į eilutes ir stulpelius, kur kiekviena eilutė turi tą patį stulpelių rinkinį. Stulpeliai atspindi tam tikro tipo reikšmę ir bus identifikuojami pavadinimu, apibūdinančiu, ką ta reikšmė reiškia, o eilutės turės faktines reikšmes. Stulpeliai dažnai turi specifines taisykles ar apribojimus reikšmėms, kad būtų užtikrinta, jog reikšmės tiksliai atspindi stulpelį. Pavyzdžiui, įsivaizduokite klientų skaičiuoklę, kur kiekviena eilutė privalo turėti telefono numerį, o telefono numeriai niekada neturi raidžių. Gali būti taikomos taisyklės, užtikrinančios, kad telefono numerio stulpelis niekada nebūtų tuščias ir jame būtų tik skaičiai. -Struktūrizuotų duomenų privalumas yra tas, kad jie gali būti organizuoti taip, kad būtų susiję su kitais struktūrizuotais duomenimis. Tačiau, kadangi duomenys sukurti būti organizuoti specifiniu būdu, jų bendros struktūros keitimas gali pareikalauti daug pastangų. Pavyzdžiui, pridėti el. pašto stulpelį klientų skaičiuoklėje, kuris negali būti tuščias, reiškia, kad reikės sugalvoti, kaip pridėti šias vertes esamoms klientų eilutėms duomenų rinkinyje. +Struktūrizuotų duomenų privalumas yra tas, kad jie gali būti organizuoti taip, kad būtų susiję su kitais struktūrizuotais duomenimis. Tačiau dėl to, kad duomenys yra sukurti būti organizuoti konkrečiu būdu, jų bendros struktūros keitimas gali pareikalauti daug pastangų. Pavyzdžiui, pridėjus el. pašto stulpelį klientų skaičiuoklėje, kuris negali būti tuščias, reikės nuspręsti, kaip pridėti šias reikšmes prie esamų klientų eilučių duomenų rinkinyje. Struktūrizuotų duomenų pavyzdžiai: skaičiuoklės, reliacinės duomenų bazės, telefono numeriai, banko išrašai. ### Nestruktūrizuoti duomenys -Nestruktūrizuoti duomenys paprastai negali būti suskirstyti į eilutes ar stulpelius ir neturi formato ar taisyklių rinkinio, kurio reikia laikytis. Kadangi nestruktūrizuoti duomenys turi mažiau apribojimų savo struktūrai, lengviau pridėti naują informaciją, palyginti su struktūrizuotu duomenų rinkiniu. Jei jutiklis, fiksuojantis duomenis apie barometrinį slėgį kas 2 minutes, gauna atnaujinimą, leidžiantį matuoti ir registruoti temperatūrą, nereikia keisti esamų duomenų, jei jie yra nestruktūrizuoti. Tačiau tai gali užtrukti ilgiau analizuojant ar tiriant tokius duomenis. Pavyzdžiui, mokslininkas, norintis rasti vidutinę temperatūrą praėjusį mėnesį iš jutiklio duomenų, gali pastebėti, kad jutiklis kai kuriuose duomenyse įrašė "e", kad pažymėtų, jog jis buvo sugedęs, o ne įprastą skaičių, todėl duomenys yra neišsamūs. +Nestruktūrizuoti duomenys paprastai negali būti suskirstyti į eilutes ar stulpelius ir neturi formato ar taisyklių rinkinio, kurio reikėtų laikytis. Kadangi nestruktūrizuoti duomenys turi mažiau apribojimų savo struktūrai, juos lengviau papildyti nauja informacija, palyginti su struktūrizuotu duomenų rinkiniu. Jei jutiklis, fiksuojantis barometrinį slėgį kas 2 minutes, gauna atnaujinimą, leidžiantį matuoti ir registruoti temperatūrą, nereikia keisti esamų duomenų, jei jie yra nestruktūrizuoti. Tačiau tai gali apsunkinti šių duomenų analizę ar tyrimą. Pavyzdžiui, mokslininkas, norintis rasti vidutinę praėjusio mėnesio temperatūrą pagal jutiklio duomenis, gali pastebėti, kad jutiklis kai kuriuose įrašuose užfiksavo „e“, nurodydamas, kad jis buvo sugedęs, o tai reiškia, kad duomenys yra neišsamūs. Nestruktūrizuotų duomenų pavyzdžiai: tekstiniai failai, tekstinės žinutės, vaizdo failai. ### Pusiau struktūrizuoti duomenys -Pusiau struktūrizuoti duomenys turi savybių, kurios daro juos struktūrizuotų ir nestruktūrizuotų duomenų deriniu. Jie paprastai neatitinka eilutėms ir stulpeliams būdingo formato, tačiau yra organizuoti taip, kad laikomi struktūrizuotais ir gali laikytis fiksuoto formato ar taisyklių rinkinio. Struktūra skiriasi priklausomai nuo šaltinio, pavyzdžiui, nuo gerai apibrėžtos hierarchijos iki lankstesnės, leidžiančios lengvai integruoti naują informaciją. Metaduomenys yra indikatoriai, padedantys nuspręsti, kaip duomenys organizuojami ir saugomi, ir turi įvairius pavadinimus, priklausomai nuo duomenų tipo. Kai kurie dažni metaduomenų pavadinimai yra žymos, elementai, subjektai ir atributai. Pavyzdžiui, tipinis el. laiškas turės temą, turinį ir gavėjų rinkinį, ir gali būti organizuotas pagal tai, kas ar kada jis buvo išsiųstas. +Pusiau struktūrizuoti duomenys turi savybių, dėl kurių jie yra struktūrizuotų ir nestruktūrizuotų duomenų derinys. Jie paprastai neatitinka eilučių ir stulpelių formato, tačiau yra organizuoti taip, kad būtų laikomi struktūrizuotais ir gali laikytis nustatyto formato ar taisyklių rinkinio. Struktūra skirsis priklausomai nuo šaltinio, pavyzdžiui, nuo gerai apibrėžtos hierarchijos iki lankstesnės, leidžiančios lengvai integruoti naują informaciją. Metaduomenys yra indikatoriai, padedantys nuspręsti, kaip duomenys yra organizuoti ir saugomi, ir turės įvairius pavadinimus, priklausomai nuo duomenų tipo. Kai kurie įprasti metaduomenų pavadinimai yra žymos, elementai, subjektai ir atributai. Pavyzdžiui, tipinė el. laiško žinutė turės temą, turinį ir gavėjų rinkinį ir gali būti organizuota pagal tai, kas ar kada ją išsiuntė. Pusiau struktūrizuotų duomenų pavyzdžiai: HTML, CSV failai, JavaScript Object Notation (JSON). ## Duomenų šaltiniai -Duomenų šaltinis yra pradinė vieta, kurioje duomenys buvo sugeneruoti arba kur jie "gyvena", ir skiriasi priklausomai nuo to, kaip ir kada jie buvo surinkti. Duomenys, sugeneruoti jų vartotojų, vadinami pirminiais duomenimis, o antriniai duomenys gaunami iš šaltinio, kuris surinko duomenis bendram naudojimui. Pavyzdžiui, mokslininkų grupė, renkantys stebėjimus atogrąžų miške, būtų laikomi pirminiais, o jei jie nuspręstų pasidalinti jais su kitais mokslininkais, tai būtų laikoma antriniais tiems, kurie juos naudoja. +Duomenų šaltinis yra pradinė vieta, kurioje duomenys buvo sugeneruoti arba „gyvena“, ir skirsis priklausomai nuo to, kaip ir kada jie buvo surinkti. Duomenys, sugeneruoti jų naudotojų, vadinami pirminiais duomenimis, o antriniai duomenys gaunami iš šaltinio, kuris surinko duomenis bendram naudojimui. Pavyzdžiui, mokslininkų grupė, renkantys stebėjimus atogrąžų miške, būtų laikomi pirminiais, o jei jie nuspręstų pasidalinti šiais duomenimis su kitais mokslininkais, jie būtų laikomi antriniais tiems, kurie juos naudoja. -Duomenų bazės yra dažnas šaltinis ir remiasi duomenų bazių valdymo sistema, kad talpintų ir prižiūrėtų duomenis, kur vartotojai naudoja komandas, vadinamas užklausomis, duomenims tyrinėti. Failai kaip duomenų šaltiniai gali būti garso, vaizdo ir vaizdo failai, taip pat skaičiuoklės, tokios kaip Excel. Interneto šaltiniai yra dažna vieta duomenims talpinti, kur galima rasti tiek duomenų bazių, tiek failų. Programų programavimo sąsajos, dar vadinamos API, leidžia programuotojams kurti būdus dalintis duomenimis su išoriniais vartotojais per internetą, o procesas, vadinamas interneto duomenų išgavimo, ištraukia duomenis iš tinklalapio. [Pamokos apie darbą su duomenimis](../../../../../../../../../2-Working-With-Data) yra skirtos tam, kaip naudoti įvairius duomenų šaltinius. +Duomenų bazės yra dažnas šaltinis ir remiasi duomenų bazių valdymo sistema, kuri talpina ir prižiūri duomenis, kur naudotojai naudoja užklausas duomenims tyrinėti. Failai kaip duomenų šaltiniai gali būti garso, vaizdo ir vaizdo failai, taip pat skaičiuoklės, tokios kaip Excel. Interneto šaltiniai yra dažna vieta duomenims talpinti, kur galima rasti tiek duomenų bazių, tiek failų. Programų programavimo sąsajos, dar žinomos kaip API, leidžia programuotojams kurti būdus dalintis duomenimis su išoriniais naudotojais per internetą, o interneto duomenų nuskaitymas išgauna duomenis iš tinklalapio. [Pamokos apie darbą su duomenimis](../../../../../../../../../2-Working-With-Data) yra skirtos įvairių duomenų šaltinių naudojimui. ## Išvada @@ -63,16 +63,16 @@ Duomenų bazės yra dažnas šaltinis ir remiasi duomenų bazių valdymo sistema ## 🚀 Iššūkis -Kaggle yra puikus atvirų duomenų rinkinių šaltinis. Naudokite [duomenų rinkinių paieškos įrankį](https://www.kaggle.com/datasets), kad surastumėte įdomių duomenų rinkinių ir klasifikuokite 3–5 rinkinius pagal šiuos kriterijus: +Kaggle yra puikus atvirų duomenų rinkinių šaltinis. Naudokite [duomenų rinkinių paieškos įrankį](https://www.kaggle.com/datasets), kad rastumėte įdomių duomenų rinkinių ir klasifikuokite 3–5 rinkinius pagal šiuos kriterijus: - Ar duomenys yra kiekybiniai ar kokybiniai? - Ar duomenys yra struktūrizuoti, nestruktūrizuoti ar pusiau struktūrizuoti? -## [Po paskaitos: testas](https://ff-quizzes.netlify.app/en/ds/) +## [Po paskaitos: testas](https://ff-quizzes.netlify.app/en/ds/quiz/5) -## Apžvalga ir savarankiškas mokymasis +## Peržiūra ir savarankiškas mokymasis -- Šis Microsoft Learn modulis, pavadintas [Klasifikuokite savo duomenis](https://docs.microsoft.com/en-us/learn/modules/choose-storage-approach-in-azure/2-classify-data), turi išsamų struktūrizuotų, pusiau struktūrizuotų ir nestruktūrizuotų duomenų aprašymą. +- Šis „Microsoft Learn“ modulis, pavadintas [Klasifikuokite savo duomenis](https://docs.microsoft.com/en-us/learn/modules/choose-storage-approach-in-azure/2-classify-data), išsamiai aprašo struktūrizuotus, pusiau struktūrizuotus ir nestruktūrizuotus duomenis. ## Užduotis @@ -81,4 +81,4 @@ Kaggle yra puikus atvirų duomenų rinkinių šaltinis. Naudokite [duomenų rink --- **Atsakomybės apribojimas**: -Šis dokumentas buvo išverstas naudojant AI vertimo paslaugą [Co-op Translator](https://github.com/Azure/co-op-translator). Nors siekiame tikslumo, prašome atkreipti dėmesį, kad automatiniai vertimai gali turėti klaidų ar netikslumų. Originalus dokumentas jo gimtąja kalba turėtų būti laikomas autoritetingu šaltiniu. Kritinei informacijai rekomenduojama profesionali žmogaus vertimo paslauga. Mes neprisiimame atsakomybės už nesusipratimus ar klaidingus interpretavimus, atsiradusius naudojant šį vertimą. \ No newline at end of file +Šis dokumentas buvo išverstas naudojant AI vertimo paslaugą [Co-op Translator](https://github.com/Azure/co-op-translator). Nors siekiame tikslumo, prašome atkreipti dėmesį, kad automatiniai vertimai gali turėti klaidų ar netikslumų. Originalus dokumentas jo gimtąja kalba turėtų būti laikomas autoritetingu šaltiniu. Kritinei informacijai rekomenduojama profesionali žmogaus vertimo paslauga. Mes neprisiimame atsakomybės už nesusipratimus ar klaidingus interpretavimus, atsiradusius dėl šio vertimo naudojimo. \ No newline at end of file diff --git a/translations/lt/1-Introduction/04-stats-and-probability/README.md b/translations/lt/1-Introduction/04-stats-and-probability/README.md index 25c731a8..7f969427 100644 --- a/translations/lt/1-Introduction/04-stats-and-probability/README.md +++ b/translations/lt/1-Introduction/04-stats-and-probability/README.md @@ -1,8 +1,8 @@ -# Vizualizuojant duomenų pasiskirstymą +# Vizualizuojame pasiskirstymus |![ Sketchnote by [(@sketchthedocs)](https://sketchthedocs.dev) ](../../sketchnotes/10-Visualizing-Distributions.png)| |:---:| -| Vizualizuojant duomenų pasiskirstymą - _Sketchnote by [@nitya](https://twitter.com/nitya)_ | +| Vizualizuojame pasiskirstymus - _Sketchnote by [@nitya](https://twitter.com/nitya)_ | -Ankstesnėje pamokoje sužinojote keletą įdomių faktų apie Minesotos paukščių duomenų rinkinį. Vizualizuodami išskirtis aptikote klaidingus duomenis ir išnagrinėjote paukščių kategorijų skirtumus pagal jų maksimalų ilgį. +Ankstesnėje pamokoje sužinojote keletą įdomių faktų apie Minesotos paukščių duomenų rinkinį. Aptikote klaidingų duomenų vizualizuodami išskirtis ir išanalizavote paukščių kategorijų skirtumus pagal jų maksimalų ilgį. -## [Prieš paskaitos testą](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/18) -## Tyrinėkite paukščių duomenų rinkinį +## [Prieš paskaitą vykdomas testas](https://ff-quizzes.netlify.app/en/ds/quiz/18) +## Tyrinėjame paukščių duomenų rinkinį -Kitas būdas gilintis į duomenis yra analizuoti jų pasiskirstymą, arba kaip duomenys yra organizuoti pagal ašį. Pavyzdžiui, galbūt norėtumėte sužinoti bendrą pasiskirstymą šiame duomenų rinkinyje pagal maksimalų sparnų ilgį ar maksimalų kūno masę Minesotos paukščiams. +Kitas būdas gilintis į duomenis yra pažvelgti į jų pasiskirstymą arba kaip duomenys yra organizuoti pagal ašį. Pavyzdžiui, galbūt norėtumėte sužinoti apie bendrą maksimalios sparnų amplitudės ar maksimalios kūno masės pasiskirstymą Minesotos paukščių duomenų rinkinyje. -Atraskime keletą faktų apie duomenų pasiskirstymą šiame duomenų rinkinyje. _notebook.ipynb_ faile, esančiame šios pamokos aplanko šaknyje, importuokite Pandas, Matplotlib ir savo duomenis: +Atraskime keletą faktų apie šio duomenų rinkinio pasiskirstymus. _notebook.ipynb_ faile, esančiame šios pamokos aplanko šaknyje, importuokite Pandas, Matplotlib ir savo duomenis: ```python import pandas as pd @@ -29,15 +29,15 @@ birds = pd.read_csv('../../data/birds.csv') birds.head() ``` -| | Pavadinimas | Mokslinis pavadinimas | Kategorija | Būrys | Šeima | Gentis | Apsaugos statusas | MinIlgis | MaxIlgis | MinKūnoMasa | MaxKūnoMasa | MinSparnųIlgis | MaxSparnųIlgis | -| ---: | :--------------------------- | :--------------------- | :-------------------- | :----------- | :------- | :---------- | :----------------- | --------: | --------: | ----------: | ----------: | ----------: | ----------: | -| 0 | Juodapilvis švilpikas | Dendrocygna autumnalis | Antys/Giesmininkai | Anseriformes | Anatidae | Dendrocygna | LC | 47 | 56 | 652 | 1020 | 76 | 94 | -| 1 | Rudasis švilpikas | Dendrocygna bicolor | Antys/Giesmininkai | Anseriformes | Anatidae | Dendrocygna | LC | 45 | 53 | 712 | 1050 | 85 | 93 | -| 2 | Sniego žąsis | Anser caerulescens | Antys/Giesmininkai | Anseriformes | Anatidae | Anser | LC | 64 | 79 | 2050 | 4050 | 135 | 165 | -| 3 | Roso žąsis | Anser rossii | Antys/Giesmininkai | Anseriformes | Anatidae | Anser | LC | 57.3 | 64 | 1066 | 1567 | 113 | 116 | -| 4 | Didžioji baltakaktė žąsis | Anser albifrons | Antys/Giesmininkai | Anseriformes | Anatidae | Anser | LC | 64 | 81 | 1930 | 3310 | 130 | 165 | +| | Pavadinimas | MokslinisPavadinimas | Kategorija | Būrys | Šeima | Gentis | ApsaugosStatusas | MinIlgis | MaxIlgis | MinKūnoMasa | MaxKūnoMasa | MinSparnųAmplitudė | MaxSparnųAmplitudė | +| ---: | :--------------------------- | :--------------------- | :-------------------- | :----------- | :------- | :---------- | :----------------- | --------: | --------: | ----------: | ----------: | -----------------: | -----------------: | +| 0 | Juodapilvė švilpiko antis | Dendrocygna autumnalis | Antys/Žąsys/Vandenspaukščiai | Anseriformes | Anatidae | Dendrocygna | LC | 47 | 56 | 652 | 1020 | 76 | 94 | +| 1 | Rudašvilpė antis | Dendrocygna bicolor | Antys/Žąsys/Vandenspaukščiai | Anseriformes | Anatidae | Dendrocygna | LC | 45 | 53 | 712 | 1050 | 85 | 93 | +| 2 | Snieginė žąsis | Anser caerulescens | Antys/Žąsys/Vandenspaukščiai | Anseriformes | Anatidae | Anser | LC | 64 | 79 | 2050 | 4050 | 135 | 165 | +| 3 | Roso žąsis | Anser rossii | Antys/Žąsys/Vandenspaukščiai | Anseriformes | Anatidae | Anser | LC | 57.3 | 64 | 1066 | 1567 | 113 | 116 | +| 4 | Didžioji baltakaktė žąsis | Anser albifrons | Antys/Žąsys/Vandenspaukščiai | Anseriformes | Anatidae | Anser | LC | 64 | 81 | 1930 | 3310 | 130 | 165 | -Apskritai, greitai pažvelgti į duomenų pasiskirstymą galima naudojant sklaidos diagramą, kaip tai darėme ankstesnėje pamokoje: +Apskritai, greitai galite pažvelgti į duomenų pasiskirstymą naudodami sklaidos diagramą, kaip darėme ankstesnėje pamokoje: ```python birds.plot(kind='scatter',x='MaxLength',y='Order',figsize=(12,8)) @@ -50,11 +50,11 @@ plt.show() ``` ![maksimalus ilgis pagal būrį](../../../../3-Data-Visualization/10-visualization-distributions/images/scatter-wb.png) -Tai suteikia bendrą kūno ilgio pasiskirstymo per paukščių būrius apžvalgą, tačiau tai nėra optimalus būdas parodyti tikrąjį pasiskirstymą. Šią užduotį paprastai atlieka histograma. +Tai suteikia bendrą paukščių kūno ilgio pasiskirstymo pagal būrį apžvalgą, tačiau tai nėra optimalus būdas tikriems pasiskirstymams parodyti. Šią užduotį paprastai atlieka histograma. ## Darbas su histogramomis -Matplotlib siūlo puikius būdus vizualizuoti duomenų pasiskirstymą naudojant histogramas. Šio tipo diagrama yra panaši į stulpelinę diagramą, kur pasiskirstymas matomas per stulpelių kilimą ir kritimą. Norint sukurti histogramą, reikia skaitinių duomenų. Histogramą galima sukurti nurodant diagramos tipą kaip 'hist'. Ši diagrama rodo MaxBodyMass pasiskirstymą visame duomenų rinkinyje. Padalindama jai pateiktą duomenų masyvą į mažesnius intervalus, ji gali parodyti duomenų reikšmių pasiskirstymą: +Matplotlib siūlo puikius būdus vizualizuoti duomenų pasiskirstymą naudojant histogramas. Šio tipo diagrama yra panaši į stulpelinę diagramą, kur pasiskirstymas matomas per stulpelių kilimą ir kritimą. Norint sukurti histogramą, reikia skaitinių duomenų. Histogramą galite sukurti, nurodydami diagramos tipą kaip 'hist'. Ši diagrama rodo MaxBodyMass pasiskirstymą visame duomenų rinkinyje. Padalindama jai pateiktą duomenų masyvą į mažesnius intervalus, ji gali parodyti duomenų reikšmių pasiskirstymą: ```python birds['MaxBodyMass'].plot(kind = 'hist', bins = 10, figsize = (12,12)) @@ -62,15 +62,15 @@ plt.show() ``` ![pasiskirstymas visame duomenų rinkinyje](../../../../3-Data-Visualization/10-visualization-distributions/images/dist1-wb.png) -Kaip matote, dauguma iš 400+ paukščių šiame duomenų rinkinyje patenka į mažesnę nei 2000 Max Kūno Masės kategoriją. Gaukite daugiau įžvalgų apie duomenis pakeisdami `bins` parametrą į didesnį skaičių, pavyzdžiui, 30: +Kaip matote, dauguma iš 400+ paukščių šiame duomenų rinkinyje patenka į mažesnę nei 2000 Max Kūno Masės ribą. Gaukite daugiau įžvalgų apie duomenis pakeisdami `bins` parametrą į didesnį skaičių, pavyzdžiui, 30: ```python birds['MaxBodyMass'].plot(kind = 'hist', bins = 30, figsize = (12,12)) plt.show() ``` -![pasiskirstymas visame duomenų rinkinyje su didesniu bins parametru](../../../../3-Data-Visualization/10-visualization-distributions/images/dist2-wb.png) +![pasiskirstymas su didesniu bins parametru](../../../../3-Data-Visualization/10-visualization-distributions/images/dist2-wb.png) -Ši diagrama rodo pasiskirstymą šiek tiek detaliau. Mažiau į kairę pasvirusią diagramą galima sukurti užtikrinant, kad pasirinksite duomenis tik tam tikrame intervale: +Ši diagrama rodo pasiskirstymą šiek tiek detaliau. Mažiau į kairę pasvirusią diagramą galima sukurti užtikrinant, kad pasirinktumėte tik duomenis tam tikrame diapazone: Filtruokite savo duomenis, kad gautumėte tik tuos paukščius, kurių kūno masė yra mažesnė nei 60, ir parodykite 40 `bins`: @@ -83,9 +83,9 @@ plt.show() ✅ Išbandykite kitus filtrus ir duomenų taškus. Norėdami pamatyti visą duomenų pasiskirstymą, pašalinkite `['MaxBodyMass']` filtrą, kad parodytumėte pažymėtus pasiskirstymus. -Histograma siūlo keletą gražių spalvų ir žymėjimo patobulinimų, kuriuos verta išbandyti: +Histogramoje taip pat galima išbandyti spalvų ir žymėjimo patobulinimus: -Sukurkite 2D histogramą, kad palygintumėte dviejų pasiskirstymų santykį. Palyginkime `MaxBodyMass` ir `MaxLength`. Matplotlib siūlo įmontuotą būdą parodyti susikirtimą naudojant ryškesnes spalvas: +Sukurkite 2D histogramą, kad palygintumėte dviejų pasiskirstymų santykį. Palyginkime `MaxBodyMass` ir `MaxLength`. Matplotlib siūlo įmontuotą būdą parodyti susiliejimą naudojant ryškesnes spalvas: ```python x = filteredBirds['MaxBodyMass'] @@ -94,25 +94,25 @@ y = filteredBirds['MaxLength'] fig, ax = plt.subplots(tight_layout=True) hist = ax.hist2d(x, y) ``` -Atrodo, kad yra tikėtinas ryšys tarp šių dviejų elementų pagal numatomą ašį, su vienu ypač stipriu susikirtimo tašku: +Atrodo, kad tarp šių dviejų elementų yra tikėtinas koreliavimas pagal numatomą ašį, su viena ypač stipria susiliejimo vieta: ![2D diagrama](../../../../3-Data-Visualization/10-visualization-distributions/images/2D-wb.png) -Histogramos gerai veikia pagal numatytąją skaitinių duomenų funkciją. O kas, jei reikia pamatyti pasiskirstymus pagal tekstinius duomenis? -## Tyrinėkite duomenų rinkinį pagal tekstinius duomenis +Histogramos gerai veikia pagal nutylėjimą su skaitiniais duomenimis. O kas, jei reikia pamatyti pasiskirstymus pagal tekstinius duomenis? +## Tyrinėjame duomenų rinkinį pagal tekstinius duomenis -Šis duomenų rinkinys taip pat apima gerą informaciją apie paukščių kategoriją, jų gentį, rūšį, šeimą ir apsaugos statusą. Panagrinėkime šią apsaugos informaciją. Koks yra paukščių pasiskirstymas pagal jų apsaugos statusą? +Šiame duomenų rinkinyje taip pat yra naudinga informacija apie paukščių kategoriją, jų gentį, rūšį, šeimą ir apsaugos statusą. Pažvelkime į šią apsaugos informaciją. Koks yra paukščių pasiskirstymas pagal jų apsaugos statusą? > ✅ Duomenų rinkinyje naudojami keli akronimai, apibūdinantys apsaugos statusą. Šie akronimai yra iš [IUCN Raudonojo sąrašo kategorijų](https://www.iucnredlist.org/), organizacijos, kataloguojančios rūšių statusą. > -> - CR: Kritiškai nykstantys -> - EN: Nykstantys -> - EX: Išnykę -> - LC: Mažiausiai susirūpinimą keliantys -> - NT: Netoli nykimo -> - VU: Pažeidžiami +> - CR: Kritiškai nykstantis +> - EN: Nykstantis +> - EX: Išnykęs +> - LC: Mažiausiai susirūpinimą keliantis +> - NT: Beveik nykstantis +> - VU: Pažeidžiamas -Tai yra tekstinės reikšmės, todėl jums reikės atlikti transformaciją, kad sukurtumėte histogramą. Naudodami filteredBirds duomenų rėmelį, parodykite jo apsaugos statusą kartu su minimaliu sparnų ilgiu. Ką pastebite? +Tai yra tekstinės reikšmės, todėl norint sukurti histogramą reikės atlikti transformaciją. Naudodami `filteredBirds` duomenų rėmelį, parodykite jo apsaugos statusą kartu su minimaliu sparnų amplitudės dydžiu. Ką pastebite? ```python x1 = filteredBirds.loc[filteredBirds.ConservationStatus=='EX', 'MinWingspan'] @@ -135,17 +135,17 @@ plt.gca().set(title='Conservation Status', ylabel='Min Wingspan') plt.legend(); ``` -![sparnų ilgis ir apsaugos statusas](../../../../3-Data-Visualization/10-visualization-distributions/images/histogram-conservation-wb.png) +![sparnų amplitudė ir apsaugos statusas](../../../../3-Data-Visualization/10-visualization-distributions/images/histogram-conservation-wb.png) -Atrodo, kad nėra gero ryšio tarp minimalaus sparnų ilgio ir apsaugos statuso. Išbandykite kitus duomenų rinkinio elementus naudodami šį metodą. Taip pat galite išbandyti skirtingus filtrus. Ar pastebite kokį nors ryšį? +Atrodo, kad nėra gero ryšio tarp minimalaus sparnų amplitudės dydžio ir apsaugos statuso. Išbandykite kitus duomenų rinkinio elementus naudodami šį metodą. Taip pat galite išbandyti skirtingus filtrus. Ar pastebite kokį nors ryšį? ## Tankio diagramos -Galbūt pastebėjote, kad histogramos, kurias iki šiol nagrinėjome, yra „žingsniuotos“ ir nesudaro sklandžios arkos. Norėdami parodyti sklandesnę tankio diagramą, galite išbandyti tankio diagramą. +Galbūt pastebėjote, kad iki šiol nagrinėtos histogramos yra „laiptinės“ ir nesudaro sklandžios kreivės. Norėdami parodyti sklandesnę tankio diagramą, galite išbandyti tankio diagramą. -Norėdami dirbti su tankio diagramomis, susipažinkite su nauja diagramos biblioteka, [Seaborn](https://seaborn.pydata.org/generated/seaborn.kdeplot.html). +Norėdami dirbti su tankio diagramomis, susipažinkite su nauja braižymo biblioteka, [Seaborn](https://seaborn.pydata.org/generated/seaborn.kdeplot.html). -Įkeldami Seaborn, išbandykite pagrindinę tankio diagramą: +Įkėlę Seaborn, išbandykite paprastą tankio diagramą: ```python import seaborn as sns @@ -155,9 +155,9 @@ plt.show() ``` ![Tankio diagrama](../../../../3-Data-Visualization/10-visualization-distributions/images/density1.png) -Galite matyti, kaip diagrama atspindi ankstesnę minimalaus sparnų ilgio diagramą; ji tiesiog šiek tiek sklandesnė. Pasak Seaborn dokumentacijos, „Lyginant su histograma, KDE gali sukurti diagramą, kuri yra mažiau perkrauta ir lengviau interpretuojama, ypač kai piešiamos kelios pasiskirstymo kreivės. Tačiau ji gali sukelti iškraipymus, jei pagrindinis pasiskirstymas yra ribotas arba nesklidus. Kaip ir histograma, vaizdavimo kokybė taip pat priklauso nuo gerų išlyginimo parametrų pasirinkimo.“ [šaltinis](https://seaborn.pydata.org/generated/seaborn.kdeplot.html) Kitaip tariant, išskirtys, kaip visada, gali neigiamai paveikti jūsų diagramas. +Galite matyti, kaip ši diagrama atspindi ankstesnę minimalaus sparnų amplitudės duomenų diagramą; ji tiesiog yra šiek tiek sklandesnė. Pasak Seaborn dokumentacijos, „Palyginti su histograma, KDE gali sukurti diagramą, kuri yra mažiau užgriozdinta ir lengviau interpretuojama, ypač kai braižomos kelios pasiskirstymo kreivės. Tačiau ji gali sukelti iškraipymus, jei pagrindinis pasiskirstymas yra ribotas arba nesudaro sklandžios kreivės. Kaip ir histograma, atvaizdavimo kokybė taip pat priklauso nuo gerų lyginimo parametrų pasirinkimo.“ [šaltinis](https://seaborn.pydata.org/generated/seaborn.kdeplot.html) Kitaip tariant, išskirtys, kaip visada, gali iškreipti jūsų diagramas. -Jei norėtumėte peržiūrėti tą dantytą MaxBodyMass liniją antroje sukurtoje diagramoje, galėtumėte ją labai gerai išlyginti, naudodami šį metodą: +Jei norėtumėte peržiūrėti tą dantytą MaxBodyMass liniją antroje sukurtoje diagramoje, galėtumėte ją labai gerai išlyginti naudodami šį metodą: ```python sns.kdeplot(filteredBirds['MaxBodyMass']) @@ -171,11 +171,11 @@ Jei norėtumėte sklandžios, bet ne per daug sklandžios linijos, redaguokite ` sns.kdeplot(filteredBirds['MaxBodyMass'], bw_adjust=.2) plt.show() ``` -![mažiau sklandi kūno masės linija](../../../../3-Data-Visualization/10-visualization-distributions/images/density3.png) +![mažiau lyginta kūno masės linija](../../../../3-Data-Visualization/10-visualization-distributions/images/density3.png) -✅ Perskaitykite apie parametrus, galimus šio tipo diagramai, ir eksperimentuokite! +✅ Perskaitykite apie šio tipo diagramos parametrus ir eksperimentuokite! -Šio tipo diagrama siūlo puikiai paaiškinančias vizualizacijas. Pavyzdžiui, su keliomis kodo eilutėmis galite parodyti maksimalios kūno masės tankį pagal paukščių būrį: +Šio tipo diagrama siūlo puikiai paaiškinančias vizualizacijas. Pavyzdžiui, keliais kodo eilutėmis galite parodyti maksimalios kūno masės tankį pagal paukščių būrį: ```python sns.kdeplot( @@ -187,25 +187,25 @@ sns.kdeplot( ![kūno masė pagal būrį](../../../../3-Data-Visualization/10-visualization-distributions/images/density4.png) -Taip pat galite žemėlapyje parodyti kelių kintamųjų tankį vienoje diagramoje. Palyginkite paukščio MaxLength ir MinLength su jų apsaugos statusu: +Taip pat galite vienoje diagramoje pavaizduoti kelių kintamųjų tankį. Palyginkite paukščio MaxLength ir MinLength su jų apsaugos statusu: ```python sns.kdeplot(data=filteredBirds, x="MinLength", y="MaxLength", hue="ConservationStatus") ``` -![kelios tankio kreivės, persidengiančios](../../../../3-Data-Visualization/10-visualization-distributions/images/multi.png) +![kelios tankio kreivės, uždengtos viena ant kitos](../../../../3-Data-Visualization/10-visualization-distributions/images/multi.png) Galbūt verta ištirti, ar „Pažeidžiamų“ paukščių grupė pagal jų ilgius yra reikšminga. ## 🚀 Iššūkis -Histogramos yra sudėtingesnis diagramų tipas nei paprastos sklaidos diagramos, stulpelinės diagramos ar linijinės diagramos. Ieškokite internete gerų histogramų naudojimo pavyzdžių. Kaip jos naudojamos, ką jos demonstruoja ir kokiose srityse ar tyrimų srityse jos dažniausiai naudojamos? +Histogramos yra sudėtingesnis diagramos tipas nei paprastos sklaidos, stulpelinės ar linijinės diagramos. Ieškokite internete gerų histogramų naudojimo pavyzdžių. Kaip jos naudojamos, ką jos demonstruoja ir kokiose srityse ar tyrimų srityse jos dažniausiai naudojamos? -## [Po paskaitos testą](https://ff-quizzes.netlify.app/en/ds/) +## [Po paskaitos vykdomas testas](https://ff-quizzes.netlify.app/en/ds/quiz/19) -## Apžvalga ir savarankiškas mokymasis +## Peržiūra ir savarankiškas mokymasis -Šioje pamokoje naudojote Matplotlib ir pradėjote dirbti su Seaborn, kad sukurtumėte sudėtingesnes diagramas. Atlikite tyrimą apie `kdeplot` Seaborn bibliotekoje, „nuolatinės tikimybės tankio kreivę vienoje ar keliose dimensijose“. Perskaitykite [dokumentaciją](https://seaborn.pydata.org/generated/seaborn.kdeplot.html), kad suprastumėte, kaip ji veikia. +Šioje pamokoje naudojote Matplotlib ir pradėjote dirbti su Seaborn, kad sukurtumėte sudėtingesnes diagramas. Atlikite tyrimą apie `kdeplot` Seaborn bibliotekoje, „nepertraukiamą tikimybių tankio kreivę vienoje ar keliose dimensijose“. Perskaitykite [dokumentaciją](https://seaborn.pydata.org/generated/seaborn.kdeplot.html), kad suprastumėte, kaip ji veikia. ## Užduotis diff --git a/translations/lt/3-Data-Visualization/11-visualization-proportions/README.md b/translations/lt/3-Data-Visualization/11-visualization-proportions/README.md index 558d0222..9c89b9e9 100644 --- a/translations/lt/3-Data-Visualization/11-visualization-proportions/README.md +++ b/translations/lt/3-Data-Visualization/11-visualization-proportions/README.md @@ -1,8 +1,8 @@ -# Vizualizuojant ryšius: Viskas apie medų 🍯 +# Vizualizuojame ryšius: Viskas apie medų 🍯 |![ Sketchnote by [(@sketchthedocs)](https://sketchthedocs.dev) ](../../sketchnotes/12-Visualizing-Relationships.png)| |:---:| @@ -19,9 +19,9 @@ Tęsdami mūsų tyrimų dėmesį į gamtą, atraskime įdomius vizualizacijos b Būtų įdomu vizualizuoti ryšį tarp tam tikros valstijos gamybos per metus ir, pavyzdžiui, medaus kainos toje valstijoje. Arba galite vizualizuoti ryšį tarp valstijų medaus derliaus vienai kolonijai. Šis laikotarpis apima niokojantį „CCD“ arba „Kolonijų žlugimo sutrikimą“, pirmą kartą pastebėtą 2006 m. (http://npic.orst.edu/envir/ccd.html), todėl tai yra prasmingas duomenų rinkinys tyrimui. 🐝 -## [Prieš paskaitą vykdomas testas](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/22) +## [Prieš paskaitą: testas](https://ff-quizzes.netlify.app/en/ds/quiz/22) -Šioje pamokoje galite naudoti Seaborn, kurį jau naudojote anksčiau, kaip puikią biblioteką vizualizuoti ryšius tarp kintamųjų. Ypač įdomi yra Seaborn funkcija `relplot`, kuri leidžia greitai kurti sklaidos diagramas ir linijines diagramas, vizualizuojant '[statistinius ryšius](https://seaborn.pydata.org/tutorial/relational.html?highlight=relationships)', leidžiančius duomenų mokslininkui geriau suprasti, kaip kintamieji tarpusavyje susiję. +Šioje pamokoje galite naudoti Seaborn, kurį jau naudojote anksčiau, kaip puikią biblioteką vizualizuoti ryšius tarp kintamųjų. Ypač įdomi yra Seaborn funkcija `relplot`, kuri leidžia greitai kurti sklaidos diagramas ir linijines diagramas, vizualizuojant '[statistinius ryšius](https://seaborn.pydata.org/tutorial/relational.html?highlight=relationships)', padedančius duomenų mokslininkui geriau suprasti, kaip kintamieji tarpusavyje susiję. ## Sklaidos diagramos @@ -38,13 +38,13 @@ honey.head() ``` Pastebėsite, kad medaus duomenyse yra keletas įdomių stulpelių, įskaitant metus ir kainą už svarą. Išnagrinėkime šiuos duomenis, suskirstytus pagal JAV valstijas: -| valstija | kolonijų skaičius | derlius vienai kolonijai | bendra gamyba | atsargos | kaina už svarą | gamybos vertė | metai | -| -------- | ----------------- | ------------------------ | ------------- | ---------- | -------------- | ------------- | ----- | -| AL | 16000 | 71 | 1136000 | 159000 | 0.72 | 818000 | 1998 | -| AZ | 55000 | 60 | 3300000 | 1485000 | 0.64 | 2112000 | 1998 | -| AR | 53000 | 65 | 3445000 | 1688000 | 0.59 | 2033000 | 1998 | -| CA | 450000 | 83 | 37350000 | 12326000 | 0.62 | 23157000 | 1998 | -| CO | 27000 | 72 | 1944000 | 1594000 | 0.7 | 1361000 | 1998 | +| valstija | kolonijų skaičius | derlius vienai kolonijai | bendra gamyba | atsargos | kaina už svarą | gamybos vertė | metai | +| -------- | ----------------- | ------------------------ | ------------- | -------- | ------------- | ------------- | ----- | +| AL | 16000 | 71 | 1136000 | 159000 | 0.72 | 818000 | 1998 | +| AZ | 55000 | 60 | 3300000 | 1485000 | 0.64 | 2112000 | 1998 | +| AR | 53000 | 65 | 3445000 | 1688000 | 0.59 | 2033000 | 1998 | +| CA | 450000 | 83 | 37350000 | 12326000 | 0.62 | 23157000 | 1998 | +| CO | 27000 | 72 | 1944000 | 1594000 | 0.7 | 1361000 | 1998 | Sukurkite paprastą sklaidos diagramą, kad parodytumėte ryšį tarp medaus kainos už svarą ir jo kilmės valstijos. Padarykite `y` ašį pakankamai aukštą, kad būtų matomos visos valstijos: @@ -53,7 +53,7 @@ sns.relplot(x="priceperlb", y="state", data=honey, height=15, aspect=.5); ``` ![sklaidos diagrama 1](../../../../3-Data-Visualization/12-visualization-relationships/images/scatter1.png) -Dabar parodykite tuos pačius duomenis su medaus spalvų schema, kad pavaizduotumėte, kaip kaina keičiasi metai iš metų. Tai galite padaryti pridėdami 'hue' parametrą, kad parodytumėte pokyčius per metus: +Dabar parodykite tuos pačius duomenis su medaus spalvų schema, kad pavaizduotumėte, kaip kaina keičiasi metai iš metų. Tai galite padaryti pridėdami 'hue' parametrą, kuris parodys pokyčius per metus: > ✅ Sužinokite daugiau apie [spalvų paletes, kurias galite naudoti Seaborn](https://seaborn.pydata.org/tutorial/color_palettes.html) - išbandykite gražią vaivorykštės spalvų schemą! @@ -62,32 +62,32 @@ sns.relplot(x="priceperlb", y="state", hue="year", palette="YlOrBr", data=honey, ``` ![sklaidos diagrama 2](../../../../3-Data-Visualization/12-visualization-relationships/images/scatter2.png) -Su šiuo spalvų schemos pakeitimu galite matyti, kad akivaizdžiai yra stipri progresija per metus, kalbant apie medaus kainą už svarą. Iš tiesų, jei peržiūrėsite duomenų pavyzdį, kad patikrintumėte (pasirinkite tam tikrą valstiją, pavyzdžiui, Arizoną), galite pastebėti kainų didėjimo modelį metai iš metų, su keliomis išimtimis: - -| valstija | kolonijų skaičius | derlius vienai kolonijai | bendra gamyba | atsargos | kaina už svarą | gamybos vertė | metai | -| -------- | ----------------- | ------------------------ | ------------- | --------- | -------------- | ------------- | ----- | -| AZ | 55000 | 60 | 3300000 | 1485000 | 0.64 | 2112000 | 1998 | -| AZ | 52000 | 62 | 3224000 | 1548000 | 0.62 | 1999000 | 1999 | -| AZ | 40000 | 59 | 2360000 | 1322000 | 0.73 | 1723000 | 2000 | -| AZ | 43000 | 59 | 2537000 | 1142000 | 0.72 | 1827000 | 2001 | -| AZ | 38000 | 63 | 2394000 | 1197000 | 1.08 | 2586000 | 2002 | -| AZ | 35000 | 72 | 2520000 | 983000 | 1.34 | 3377000 | 2003 | -| AZ | 32000 | 55 | 1760000 | 774000 | 1.11 | 1954000 | 2004 | -| AZ | 36000 | 50 | 1800000 | 720000 | 1.04 | 1872000 | 2005 | -| AZ | 30000 | 65 | 1950000 | 839000 | 0.91 | 1775000 | 2006 | -| AZ | 30000 | 64 | 1920000 | 902000 | 1.26 | 2419000 | 2007 | -| AZ | 25000 | 64 | 1600000 | 336000 | 1.26 | 2016000 | 2008 | -| AZ | 20000 | 52 | 1040000 | 562000 | 1.45 | 1508000 | 2009 | -| AZ | 24000 | 77 | 1848000 | 665000 | 1.52 | 2809000 | 2010 | -| AZ | 23000 | 53 | 1219000 | 427000 | 1.55 | 1889000 | 2011 | -| AZ | 22000 | 46 | 1012000 | 253000 | 1.79 | 1811000 | 2012 | - -Kitas būdas vizualizuoti šią progresiją yra naudoti dydį, o ne spalvą. Spalvų aklumo turintiems vartotojams tai gali būti geresnis pasirinkimas. Redaguokite savo vizualizaciją, kad parodytumėte kainos didėjimą per taško apskritimo didėjimą: +Su šiuo spalvų schemos pakeitimu galite pastebėti, kad per metus medaus kaina už svarą akivaizdžiai kyla. Iš tiesų, jei pažiūrėsite į duomenų pavyzdį, kad patikrintumėte (pasirinkite tam tikrą valstiją, pavyzdžiui, Arizoną), galite pastebėti kainų kilimo modelį metai iš metų, su keliomis išimtimis: + +| valstija | kolonijų skaičius | derlius vienai kolonijai | bendra gamyba | atsargos | kaina už svarą | gamybos vertė | metai | +| -------- | ----------------- | ------------------------ | ------------- | -------- | ------------- | ------------- | ----- | +| AZ | 55000 | 60 | 3300000 | 1485000 | 0.64 | 2112000 | 1998 | +| AZ | 52000 | 62 | 3224000 | 1548000 | 0.62 | 1999000 | 1999 | +| AZ | 40000 | 59 | 2360000 | 1322000 | 0.73 | 1723000 | 2000 | +| AZ | 43000 | 59 | 2537000 | 1142000 | 0.72 | 1827000 | 2001 | +| AZ | 38000 | 63 | 2394000 | 1197000 | 1.08 | 2586000 | 2002 | +| AZ | 35000 | 72 | 2520000 | 983000 | 1.34 | 3377000 | 2003 | +| AZ | 32000 | 55 | 1760000 | 774000 | 1.11 | 1954000 | 2004 | +| AZ | 36000 | 50 | 1800000 | 720000 | 1.04 | 1872000 | 2005 | +| AZ | 30000 | 65 | 1950000 | 839000 | 0.91 | 1775000 | 2006 | +| AZ | 30000 | 64 | 1920000 | 902000 | 1.26 | 2419000 | 2007 | +| AZ | 25000 | 64 | 1600000 | 336000 | 1.26 | 2016000 | 2008 | +| AZ | 20000 | 52 | 1040000 | 562000 | 1.45 | 1508000 | 2009 | +| AZ | 24000 | 77 | 1848000 | 665000 | 1.52 | 2809000 | 2010 | +| AZ | 23000 | 53 | 1219000 | 427000 | 1.55 | 1889000 | 2011 | +| AZ | 22000 | 46 | 1012000 | 253000 | 1.79 | 1811000 | 2012 | + +Kitas būdas vizualizuoti šį progresą yra naudoti dydį, o ne spalvą. Spalvų aklumo turintiems vartotojams tai gali būti geresnis pasirinkimas. Redaguokite savo vizualizaciją, kad parodytumėte kainos didėjimą, didinant taško apskritimo dydį: ```python sns.relplot(x="priceperlb", y="state", size="year", data=honey, height=15, aspect=.5); ``` -Galite matyti, kaip taškų dydis palaipsniui didėja. +Galite pastebėti, kad taškų dydis palaipsniui didėja. ![sklaidos diagrama 3](../../../../3-Data-Visualization/12-visualization-relationships/images/scatter3.png) @@ -108,7 +108,7 @@ Atsakymas: Taip, su kai kuriomis išimtimis apie 2003 metus: ✅ Kadangi Seaborn agreguoja duomenis aplink vieną liniją, jis rodo „kelis matavimus kiekvienoje x reikšmėje, braižydamas vidurkį ir 95% pasitikėjimo intervalą aplink vidurkį“. [Šaltinis](https://seaborn.pydata.org/tutorial/relational.html). Šį laiko reikalaujantį elgesį galima išjungti pridėjus `ci=None`. -Klausimas: Na, 2003 metais ar taip pat matome medaus tiekimo šuolį? O jei pažvelgtumėte į bendrą gamybą metai iš metų? +Klausimas: Na, o 2003 metais, ar galime pastebėti medaus pasiūlos šuolį? Ką, jei pažvelgtumėte į bendrą gamybą metai iš metų? ```python sns.relplot(x="year", y="totalprod", kind="line", data=honey); @@ -120,11 +120,11 @@ Atsakymas: Ne visai. Jei pažvelgsite į bendrą gamybą, atrodo, kad ji iš tik Klausimas: Tokiu atveju, kas galėjo sukelti medaus kainos šuolį apie 2003 metus? -Norėdami tai atrasti, galite panagrinėti facet grid. +Norėdami tai atrasti, galite naudoti facet grid. ## Facet grid -Facet grid leidžia pasirinkti vieną jūsų duomenų rinkinio aspektą (mūsų atveju galite pasirinkti „metus“, kad išvengtumėte per daug facetų). Seaborn tada gali sukurti diagramą kiekvienam iš šių aspektų, pasirinktų x ir y koordinačių, kad būtų lengviau vizualiai palyginti. Ar 2003 metai išsiskiria tokio tipo palyginime? +Facet grid leidžia pasirinkti vieną jūsų duomenų rinkinio aspektą (mūsų atveju galite pasirinkti 'metus', kad išvengtumėte per daug facetų). Tada Seaborn gali sukurti diagramą kiekvienam iš šių aspektų, pasirinktų x ir y koordinačių, kad būtų lengviau palyginti. Ar 2003 metai išsiskiria tokio tipo palyginime? Sukurkite facet grid, toliau naudodami `relplot`, kaip rekomenduoja [Seaborn dokumentacija](https://seaborn.pydata.org/generated/seaborn.FacetGrid.html?highlight=facetgrid#seaborn.FacetGrid). @@ -144,7 +144,7 @@ sns.relplot( ## Dvigubos linijos diagramos -Išbandykite daugiagubą linijinę diagramą, uždėdami dvi linijines diagramas viena ant kitos, naudodami Seaborn funkciją 'despine', kad pašalintumėte jų viršutines ir dešines linijas, ir naudodami `ax.twinx` [gautą iš Matplotlib](https://matplotlib.org/stable/api/_as_gen/matplotlib.axes.Axes.twinx.html). Twinx leidžia diagramai dalintis x ašimi ir rodyti dvi y ašis. Taigi, parodykite derlių vienai kolonijai ir kolonijų skaičių, uždėtus vienas ant kito: +Išbandykite daugiagubą linijinę diagramą, uždėdami dvi linijines diagramas viena ant kitos, naudodami Seaborn 'despine', kad pašalintumėte jų viršutines ir dešines linijas, ir naudodami `ax.twinx` [gautą iš Matplotlib](https://matplotlib.org/stable/api/_as_gen/matplotlib.axes.Axes.twinx.html). Twinx leidžia diagramai dalintis x ašimi ir rodyti dvi y ašis. Taigi, parodykite derlių vienai kolonijai ir kolonijų skaičių, uždėtus vienas ant kito: ```python fig, ax = plt.subplots(figsize=(12,6)) @@ -170,9 +170,9 @@ Pirmyn, bitės, pirmyn! 🐝❤️ ## 🚀 Iššūkis -Šioje pamokoje sužinojote šiek tiek daugiau apie kitus sklaidos diagramų ir linijinių gridų naudojimo būdus, įskaitant facet grid. Išbandykite save, sukurdami facet grid naudodami kitą duomenų rinkinį, galbūt tą, kurį naudojote prieš šias pamokas. Atkreipkite dėmesį, kiek laiko jie užtrunka ir kaip reikia būti atsargiems dėl to, kiek gridų reikia piešti naudojant šiuos metodus. +Šioje pamokoje sužinojote šiek tiek daugiau apie kitus sklaidos diagramų ir linijinių tinklų naudojimo būdus, įskaitant facet grid. Išbandykite save, sukurdami facet grid naudodami kitą duomenų rinkinį, galbūt tą, kurį naudojote prieš šias pamokas. Atkreipkite dėmesį, kiek laiko jie užtrunka ir kaip reikia būti atsargiems dėl to, kiek tinklų reikia piešti naudojant šiuos metodus. -## [Po paskaitos vykdomas testas](https://ff-quizzes.netlify.app/en/ds/) +## [Po paskaitos: testas](https://ff-quizzes.netlify.app/en/ds/quiz/23) ## Apžvalga ir savarankiškas mokymasis @@ -184,4 +184,4 @@ Linijinės diagramos gali būti paprastos arba gana sudėtingos. Šiek tiek pasi --- **Atsakomybės apribojimas**: -Šis dokumentas buvo išverstas naudojant AI vertimo paslaugą [Co-op Translator](https://github.com/Azure/co-op-translator). Nors siekiame tikslumo, prašome atkreipti dėmesį, kad automatiniai vertimai gali turėti klaidų ar netikslumų. Originalus dokumentas jo gimtąja kalba turėtų būti laikomas autoritetingu šaltiniu. Kritinei informacijai rekomenduojama profesionali žmogaus vertimo paslauga. Mes neprisiimame atsakomybės už nesusipratimus ar klaidingus interpretavimus, atsiradusius naudojant šį vertimą. \ No newline at end of file +Šis dokumentas buvo išverstas naudojant AI vertimo paslaugą [Co-op Translator](https://github.com/Azure/co-op-translator). Nors siekiame tikslumo, prašome atkreipti dėmesį, kad automatiniai vertimai gali turėti klaidų ar netikslumų. Originalus dokumentas jo gimtąja kalba turėtų būti laikomas autoritetingu šaltiniu. Kritinei informacijai rekomenduojama naudoti profesionalų žmogaus vertimą. Mes neprisiimame atsakomybės už nesusipratimus ar klaidingus interpretavimus, atsiradusius dėl šio vertimo naudojimo. \ No newline at end of file diff --git a/translations/lt/3-Data-Visualization/13-meaningful-visualizations/README.md b/translations/lt/3-Data-Visualization/13-meaningful-visualizations/README.md index 65dd79d8..afd45d61 100644 --- a/translations/lt/3-Data-Visualization/13-meaningful-visualizations/README.md +++ b/translations/lt/3-Data-Visualization/13-meaningful-visualizations/README.md @@ -1,134 +1,134 @@ -# Kurti prasmingas vizualizacijas +# Kaip Kurti Prasmingas Vizualizacijas |![ Sketchnote by [(@sketchthedocs)](https://sketchthedocs.dev) ](../../sketchnotes/13-MeaningfulViz.png)| |:---:| -| Prasmingos vizualizacijos - _Sketchnote by [@nitya](https://twitter.com/nitya)_ | +| Prasmingos Vizualizacijos - _Sketchnote by [@nitya](https://twitter.com/nitya)_ | -> „Jei pakankamai ilgai kankinsi duomenis, jie prisipažins bet ką“ -- [Ronald Coase](https://en.wikiquote.org/wiki/Ronald_Coase) +> „Jei pakankamai ilgai kankinsi duomenis, jie prisipažins bet ką“ – [Ronald Coase](https://en.wikiquote.org/wiki/Ronald_Coase) -Viena iš pagrindinių duomenų mokslininko įgūdžių yra gebėjimas sukurti prasmingą duomenų vizualizaciją, kuri padėtų atsakyti į turimus klausimus. Prieš vizualizuodami duomenis, turite įsitikinti, kad jie buvo išvalyti ir paruošti, kaip tai darėte ankstesnėse pamokose. Po to galite pradėti spręsti, kaip geriausiai pateikti duomenis. +Viena iš pagrindinių duomenų mokslininko įgūdžių yra gebėjimas sukurti prasmingą duomenų vizualizaciją, kuri padėtų atsakyti į jums rūpimus klausimus. Prieš vizualizuodami savo duomenis, turite įsitikinti, kad jie buvo išvalyti ir paruošti, kaip tai darėte ankstesnėse pamokose. Po to galite pradėti spręsti, kaip geriausiai pateikti duomenis. Šioje pamokoje peržiūrėsite: 1. Kaip pasirinkti tinkamą diagramos tipą 2. Kaip išvengti klaidinančių diagramų -3. Kaip dirbti su spalvomis +3. Kaip naudoti spalvas 4. Kaip stilizuoti diagramas, kad jos būtų lengvai suprantamos 5. Kaip kurti animuotas ar 3D diagramas -6. Kaip kurti kūrybingas vizualizacijas +6. Kaip sukurti kūrybingą vizualizaciją -## [Prieš pamokos testas](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/24) +## [Prieš paskaitą: testas](https://ff-quizzes.netlify.app/en/ds/quiz/24) ## Pasirinkite tinkamą diagramos tipą -Ankstesnėse pamokose eksperimentavote kurdami įvairias įdomias duomenų vizualizacijas naudodami Matplotlib ir Seaborn diagramoms. Paprastai galite pasirinkti [tinkamą diagramos tipą](https://chartio.com/learn/charts/how-to-select-a-data-vizualization/) pagal klausimą, kurį norite atsakyti, naudodamiesi šia lentele: +Ankstesnėse pamokose eksperimentavote kurdami įvairias įdomias duomenų vizualizacijas naudodami Matplotlib ir Seaborn. Apskritai, galite pasirinkti [tinkamą diagramos tipą](https://chartio.com/learn/charts/how-to-select-a-data-vizualization/) pagal klausimą, kurį norite atsakyti, naudodamiesi šia lentele: | Jums reikia: | Turėtumėte naudoti: | | -------------------------- | ------------------------------- | -| Rodyti duomenų tendencijas per laiką | Linijinė diagrama | -| Palyginti kategorijas | Stulpelinė, Pyrago | -| Palyginti sumas | Pyrago, Sudėtinė stulpelinė | -| Rodyti ryšius | Sklaidos, Linijinė, Facet, Dviguba linijinė | -| Rodyti pasiskirstymus | Sklaidos, Histogramos, Dėžės | -| Rodyti proporcijas | Pyrago, Žiedo, Vaflinė | +| Rodyti duomenų tendencijas laikui bėgant | Linijinę diagramą | +| Palyginti kategorijas | Stulpelinę, Skritulinę | +| Palyginti sumas | Skritulinę, Sukrautą stulpelinę | +| Rodyti ryšius | Sklaidos, Linijinę, Facet, Dvigubą linijinę | +| Rodyti pasiskirstymus | Sklaidos, Histogramą, Dėžutės | +| Rodyti proporcijas | Skritulinę, Žiedo, Vaflinę | -> ✅ Priklausomai nuo jūsų duomenų sudėties, gali tekti konvertuoti juos iš teksto į skaitinius, kad tam tikra diagrama galėtų juos palaikyti. +> ✅ Priklausomai nuo jūsų duomenų sudėties, gali tekti juos konvertuoti iš teksto į skaitinius, kad tam tikra diagrama juos palaikytų. -## Venkite klaidinimo +## Venkite klaidinančių diagramų -Net jei duomenų mokslininkas kruopščiai pasirenka tinkamą diagramą tinkamiems duomenims, yra daugybė būdų, kaip duomenys gali būti pateikti taip, kad įrodytų tam tikrą tašką, dažnai pažeidžiant pačius duomenis. Yra daugybė klaidinančių diagramų ir infografikų pavyzdžių! +Net jei duomenų mokslininkas kruopščiai pasirenka tinkamą diagramą tinkamiems duomenims, yra daugybė būdų, kaip duomenys gali būti pateikti taip, kad įrodytų tam tikrą tašką, dažnai pakenkiant pačių duomenų patikimumui. Yra daugybė klaidinančių diagramų ir infografikų pavyzdžių! -[![Kaip meluoja diagramos, Alberto Cairo](../../../../3-Data-Visualization/13-meaningful-visualizations/images/tornado.png)](https://www.youtube.com/watch?v=oX74Nge8Wkw "Kaip meluoja diagramos") +[![Kaip meluoja diagramos pagal Alberto Cairo](../../../../3-Data-Visualization/13-meaningful-visualizations/images/tornado.png)](https://www.youtube.com/watch?v=oX74Nge8Wkw "Kaip meluoja diagramos") > 🎥 Spustelėkite aukščiau esančią nuotrauką, kad pamatytumėte konferencijos pranešimą apie klaidinančias diagramas Ši diagrama apverčia X ašį, kad parodytų priešingą tiesai, remiantis datomis: -![bloga diagrama 1](../../../../3-Data-Visualization/13-meaningful-visualizations/images/bad-chart-1.png) +![blogas grafikas 1](../../../../3-Data-Visualization/13-meaningful-visualizations/images/bad-chart-1.png) -[Ši diagrama](https://media.firstcoastnews.com/assets/WTLV/images/170ae16f-4643-438f-b689-50d66ca6a8d8/170ae16f-4643-438f-b689-50d66ca6a8d8_1140x641.jpg) yra dar klaidinančesnė, nes akis nukreipiama į dešinę, kad būtų padaryta išvada, jog laikui bėgant COVID atvejų skaičius sumažėjo įvairiose apskrityse. Iš tiesų, jei atidžiai pažvelgsite į datas, pastebėsite, kad jos buvo pertvarkytos, kad būtų parodyta klaidinanti mažėjimo tendencija. +[Ši diagrama](https://media.firstcoastnews.com/assets/WTLV/images/170ae16f-4643-438f-b689-50d66ca6a8d8/170ae16f-4643-438f-b689-50d66ca6a8d8_1140x641.jpg) yra dar labiau klaidinanti, nes akis nukreipiama į dešinę, kad būtų padaryta išvada, jog laikui bėgant COVID atvejų skaičius sumažėjo įvairiose apskrityse. Tačiau, jei atidžiai pažvelgsite į datas, pastebėsite, kad jos buvo perrikiuotos, kad būtų parodyta klaidinanti mažėjimo tendencija. -![bloga diagrama 2](../../../../3-Data-Visualization/13-meaningful-visualizations/images/bad-chart-2.jpg) +![blogas grafikas 2](../../../../3-Data-Visualization/13-meaningful-visualizations/images/bad-chart-2.jpg) Šis liūdnai pagarsėjęs pavyzdys naudoja spalvas IR apverstą Y ašį, kad suklaidintų: vietoj išvados, kad ginklų mirčių skaičius išaugo po ginklams palankios teisės aktų priėmimo, akis apgaunama manyti, kad tiesa yra priešinga: -![bloga diagrama 3](../../../../3-Data-Visualization/13-meaningful-visualizations/images/bad-chart-3.jpg) +![blogas grafikas 3](../../../../3-Data-Visualization/13-meaningful-visualizations/images/bad-chart-3.jpg) -Ši keista diagrama rodo, kaip proporcijos gali būti manipuliuojamos, sukeldamos juoką: +Ši keista diagrama parodo, kaip proporcijos gali būti manipuliuojamos, sukeldamos juoką: -![bloga diagrama 4](../../../../3-Data-Visualization/13-meaningful-visualizations/images/bad-chart-4.jpg) +![blogas grafikas 4](../../../../3-Data-Visualization/13-meaningful-visualizations/images/bad-chart-4.jpg) -Palyginti nepalyginamus dalykus yra dar vienas šešėlinis triukas. Yra [puiki svetainė](https://tylervigen.com/spurious-correlations), skirta „klaidingoms koreliacijoms“, kurioje pateikiami „faktai“, koreliuojantys tokius dalykus kaip skyrybų rodiklis Meino valstijoje ir margarino vartojimas. Reddit grupė taip pat renka [blogus duomenų naudojimo pavyzdžius](https://www.reddit.com/r/dataisugly/top/?t=all). +Palyginti nepalyginamus dalykus yra dar vienas abejotinas triukas. Yra [nuostabi svetainė](https://tylervigen.com/spurious-correlations), skirta „klaidingoms koreliacijoms“, kurioje pateikiami „faktai“, siejantys, pavyzdžiui, skyrybų rodiklį Meino valstijoje ir margarino vartojimą. Reddit grupė taip pat renka [blogus duomenų naudojimo pavyzdžius](https://www.reddit.com/r/dataisugly/top/?t=all). -Svarbu suprasti, kaip lengvai akis gali būti apgauta klaidinančiomis diagramomis. Net jei duomenų mokslininko ketinimai yra geri, blogo diagramos tipo pasirinkimas, pavyzdžiui, pyrago diagrama, kurioje per daug kategorijų, gali būti klaidinantis. +Svarbu suprasti, kaip lengvai akis gali būti apgauta klaidinančių diagramų. Net jei duomenų mokslininko ketinimai yra geri, blogo diagramos tipo pasirinkimas, pavyzdžiui, skritulinė diagrama su per daug kategorijų, gali būti klaidinantis. ## Spalvos -Kaip matėte aukščiau esančioje „Floridos ginklų smurto“ diagramoje, spalva gali suteikti papildomą prasmės sluoksnį diagramoms, ypač toms, kurios nėra sukurtos naudojant tokias bibliotekas kaip Matplotlib ir Seaborn, kurios turi įvairias patikrintas spalvų bibliotekas ir paletes. Jei kuriate diagramą rankiniu būdu, šiek tiek pasidomėkite [spalvų teorija](https://colormatters.com/color-and-design/basic-color-theory). +Kaip matėte aukščiau esančioje „Floridos ginklų smurto“ diagramoje, spalvos gali suteikti papildomą reikšmės sluoksnį diagramoms, ypač toms, kurios nėra sukurtos naudojant tokias bibliotekas kaip Matplotlib ir Seaborn, kurios turi įvairias patikrintas spalvų bibliotekas ir paletes. Jei kuriate diagramą rankiniu būdu, šiek tiek pasidomėkite [spalvų teorija](https://colormatters.com/color-and-design/basic-color-theory). -> ✅ Kurdamas diagramas, atkreipkite dėmesį, kad prieinamumas yra svarbus vizualizacijos aspektas. Kai kurie jūsų vartotojai gali būti spalvų akli - ar jūsų diagrama gerai rodoma vartotojams, turintiems regos sutrikimų? +> ✅ Kurdami diagramas, atkreipkite dėmesį, kad prieinamumas yra svarbus vizualizacijos aspektas. Kai kurie jūsų naudotojai gali būti spalvų akli – ar jūsų diagrama gerai matoma naudotojams su regos sutrikimais? -Būkite atsargūs rinkdamiesi spalvas diagramai, nes spalva gali perteikti prasmę, kurios galbūt nenorėjote. „Rožinės damos“ aukščiau esančioje „ūgio“ diagramoje perteikia aiškiai „moterišką“ prasmę, kuri dar labiau sustiprina pačios diagramos keistumą. +Būkite atsargūs rinkdamiesi spalvas savo diagramai, nes spalvos gali perteikti reikšmę, kurios galbūt nenorėjote. Aukščiau esančioje „aukščio“ diagramoje „rožinės damos“ perteikia aiškiai „moterišką“ reikšmę, kuri dar labiau sustiprina pačios diagramos keistumą. -Nors [spalvų prasmė](https://colormatters.com/color-symbolism/the-meanings-of-colors) gali skirtis skirtingose pasaulio dalyse ir keistis priklausomai nuo jų atspalvio, paprastai spalvų reikšmės apima: +Nors [spalvų reikšmės](https://colormatters.com/color-symbolism/the-meanings-of-colors) gali skirtis skirtingose pasaulio dalyse ir keistis priklausomai nuo jų atspalvio, apskritai spalvų reikšmės apima: -| Spalva | Reikšmė | -| ------ | ------------------- | -| raudona | galia | +| Spalva | Reikšmė | +| ------- | ------------------- | +| raudona | galia | | mėlyna | pasitikėjimas, lojalumas | -| geltona | laimė, atsargumas | +| geltona | laimė, atsargumas | | žalia | ekologija, sėkmė, pavydas | | violetinė | laimė | | oranžinė | gyvybingumas | -Jei jums pavesta kurti diagramą su pasirinktinėmis spalvomis, įsitikinkite, kad jūsų diagramos yra prieinamos ir pasirinkta spalva atitinka prasmę, kurią norite perteikti. +Jei jums pavesta kurti diagramą su pasirinktinėmis spalvomis, įsitikinkite, kad jūsų diagramos yra tiek prieinamos, tiek spalvos atitinka reikšmę, kurią norite perteikti. -## Stilizuokite diagramas, kad jos būtų lengvai suprantamos +## Diagramų stilizavimas, kad jos būtų lengvai suprantamos -Diagramos nėra prasmingos, jei jos nėra lengvai suprantamos! Skirkite laiko apsvarstyti diagramos pločio ir aukščio stilizavimą, kad ji gerai atitiktų jūsų duomenis. Jei reikia parodyti vieną kintamąjį (pvz., visas 50 valstijų), parodykite jas vertikaliai Y ašyje, jei įmanoma, kad išvengtumėte horizontaliai slenkančios diagramos. +Diagramos nėra prasmingos, jei jos nėra lengvai suprantamos! Skirkite laiko apsvarstyti, kaip pritaikyti diagramos plotį ir aukštį, kad ji gerai atitiktų jūsų duomenis. Jei reikia parodyti vieną kintamąjį (pvz., visas 50 valstijų), parodykite jas vertikaliai Y ašyje, jei įmanoma, kad išvengtumėte horizontalaus slinkimo. -Pažymėkite ašis, pateikite legendą, jei reikia, ir pasiūlykite patarimus, kad duomenys būtų geriau suprantami. +Pažymėkite savo ašis, pateikite legendą, jei reikia, ir pasiūlykite užuominas (tooltips), kad duomenys būtų lengviau suprantami. -Jei jūsų duomenys yra tekstiniai ir išsamūs X ašyje, galite pakreipti tekstą, kad jis būtų lengviau skaitomas. [Matplotlib](https://matplotlib.org/stable/tutorials/toolkits/mplot3d.html) siūlo 3D diagramas, jei jūsų duomenys tai palaiko. Naudojant `mpl_toolkits.mplot3d` galima sukurti sudėtingas duomenų vizualizacijas. +Jei jūsų duomenys yra tekstiniai ir ilgi X ašyje, galite pakreipti tekstą, kad jis būtų lengviau skaitomas. [Matplotlib](https://matplotlib.org/stable/tutorials/toolkits/mplot3d.html) siūlo 3D braižymą, jei jūsų duomenys tai palaiko. Naudodami `mpl_toolkits.mplot3d` galite sukurti sudėtingas duomenų vizualizacijas. ![3D diagramos](../../../../3-Data-Visualization/13-meaningful-visualizations/images/3d.png) -## Animacija ir 3D diagramų rodymas +## Animacija ir 3D diagramos -Kai kurios geriausios šių dienų duomenų vizualizacijos yra animuotos. Shirley Wu turi nuostabių vizualizacijų, sukurtų su D3, tokių kaip '[filmų gėlės](http://bl.ocks.org/sxywu/raw/d612c6c653fb8b4d7ff3d422be164a5d/)', kur kiekviena gėlė yra filmo vizualizacija. Kitas pavyzdys, skirtas Guardian, yra „bussed out“, interaktyvi patirtis, derinanti vizualizacijas su Greensock ir D3 bei „scrollytelling“ straipsnio formatą, kad parodytų, kaip NYC sprendžia benamių problemą, išsiųsdama žmones iš miesto. +Kai kurios geriausios šių dienų duomenų vizualizacijos yra animuotos. Shirley Wu sukūrė nuostabias vizualizacijas su D3, tokias kaip '[filmų gėlės](http://bl.ocks.org/sxywu/raw/d612c6c653fb8b4d7ff3d422be164a5d/)', kur kiekviena gėlė yra filmo vizualizacija. Kitas pavyzdys, skirtas Guardian, yra „bussed out“, interaktyvi patirtis, derinanti vizualizacijas su Greensock ir D3 bei straipsnio formatą, kad parodytų, kaip NYC sprendžia benamių problemą, išsiųsdama žmones iš miesto. ![busing](../../../../3-Data-Visualization/13-meaningful-visualizations/images/busing.png) -> „Bussed Out: Kaip Amerika perkelia savo benamius“ iš [Guardian](https://www.theguardian.com/us-news/ng-interactive/2017/dec/20/bussed-out-america-moves-homeless-people-country-study). Vizualizacijos: Nadieh Bremer & Shirley Wu +> „Bussed Out: Kaip Amerika perkelia savo benamius“ iš [the Guardian](https://www.theguardian.com/us-news/ng-interactive/2017/dec/20/bussed-out-america-moves-homeless-people-country-study). Vizualizacijos: Nadieh Bremer & Shirley Wu -Nors ši pamoka nėra pakankama, kad išsamiai išmokytų šias galingas vizualizacijos bibliotekas, pabandykite naudoti D3 Vue.js programoje, naudodami biblioteką, kad parodytumėte knygos „Pavojingos pažintys“ animuotą socialinį tinklą. +Nors ši pamoka nėra pakankama, kad išsamiai išmokytų šių galingų vizualizacijos bibliotekų, pabandykite naudoti D3 Vue.js programoje, naudodami biblioteką, kad parodytumėte knygos „Pavojingi ryšiai“ animuotą socialinį tinklą. -> „Les Liaisons Dangereuses“ yra epistolinis romanas, arba romanas, pateiktas kaip laiškų serija. Parašytas 1782 m. Choderlos de Laclos, jis pasakoja apie žiaurius, morališkai bankrutavusius socialinius manevrus dviejų pagrindinių veikėjų iš Prancūzijos aristokratijos XVIII a. pabaigoje, vikonto de Valmont ir markizės de Merteuil. Abu galiausiai žūsta, tačiau ne be didelės socialinės žalos. Romane pateikiama laiškų serija, rašyta įvairiems žmonėms jų aplinkoje, siekiant keršto arba tiesiog sukelti problemų. Sukurkite šių laiškų vizualizaciją, kad atrastumėte pagrindinius pasakojimo veikėjus vizualiai. +> „Les Liaisons Dangereuses“ yra epistolinis romanas, arba romanas, pateiktas kaip laiškų serija. Parašytas 1782 m. Choderlos de Laclos, jis pasakoja apie žiaurius, morališkai bankrutavusius socialinius manevrus dviejų pagrindinių XVIII a. Prancūzijos aristokratijos veikėjų – vikonto de Valmont ir markizės de Merteuil. Abu galiausiai žūsta, tačiau ne be didelės socialinės žalos. Romane laiškai rašomi įvairiems žmonėms jų aplinkoje, siekiant keršto arba tiesiog sukelti problemų. Sukurkite šių laiškų vizualizaciją, kad atrastumėte pagrindinius pasakojimo veikėjus vizualiai. -Jūs užbaigsite interneto programą, kuri parodys animuotą šio socialinio tinklo vaizdą. Ji naudoja biblioteką, sukurtą sukurti [tinklo vizualizaciją](https://github.com/emiliorizzo/vue-d3-network) naudojant Vue.js ir D3. Kai programa veikia, galite perkelti mazgus ekrane, kad pertvarkytumėte duomenis. +Jūs sukursite internetinę programą, kuri parodys animuotą šio socialinio tinklo vaizdą. Ji naudoja biblioteką, sukurtą [tinklo vizualizacijai](https://github.com/emiliorizzo/vue-d3-network) su Vue.js ir D3. Kai programa veikia, galite perkelti mazgus ekrane, kad pertvarkytumėte duomenis. ![liaisons](../../../../3-Data-Visualization/13-meaningful-visualizations/images/liaisons.png) -## Projektas: Sukurkite diagramą, rodančią tinklą, naudojant D3.js +## Projektas: Sukurkite diagramą tinklui parodyti naudojant D3.js -> Šio pamokos aplanko „solution“ aplanke rasite užbaigtą projektą, skirtą jūsų nuorodai. +> Šios pamokos aplanke yra `solution` aplankas, kuriame galite rasti užbaigtą projektą kaip nuorodą. -1. Sekite instrukcijas README.md faile, esančiame pradinio aplanko šaknyje. Įsitikinkite, kad jūsų kompiuteryje veikia NPM ir Node.js prieš diegdami projekto priklausomybes. +1. Vadovaukitės README.md failo instrukcijomis pradiniame aplanke. Įsitikinkite, kad jūsų kompiuteryje veikia NPM ir Node.js prieš diegiant projekto priklausomybes. 2. Atidarykite `starter/src` aplanką. Rasite `assets` aplanką, kuriame yra .json failas su visais romano laiškais, sunumeruotais, su „to“ ir „from“ anotacijomis. -3. Užbaikite kodą `components/Nodes.vue`, kad įgalintumėte vizualizaciją. Suraskite metodą, vadinamą `createLinks()` ir pridėkite šį įdėtą ciklą. +3. Užbaikite kodą `components/Nodes.vue`, kad įgalintumėte vizualizaciją. Ieškokite metodo `createLinks()` ir pridėkite šį įdėtą ciklą. -Ciklu peržiūrėkite .json objektą, kad užfiksuotumėte „to“ ir „from“ duomenis apie laiškus ir sukurtumėte `links` objektą, kad vizualizacijos biblioteka galėtų jį naudoti: +Peržiūrėkite .json objektą, kad užfiksuotumėte „to“ ir „from“ duomenis apie laiškus ir sukurtumėte `links` objektą, kurį galėtų naudoti vizualizacijos biblioteka: ```javascript //loop through letters @@ -152,9 +152,9 @@ Paleiskite savo programą iš terminalo (npm run serve) ir mėgaukitės vizualiz ## 🚀 Iššūkis -Pasidairykite internete, kad atrastumėte klaidinančias vizualizacijas. Kaip autorius apgauna vartotoją, ir ar tai tyčia? Pabandykite pataisyti vizualizacijas, kad parodytumėte, kaip jos turėtų atrodyti. +Naršykite internete, kad atrastumėte klaidinančias vizualizacijas. Kaip autorius apgauna naudotoją, ir ar tai tyčia? Pabandykite pataisyti vizualizacijas, kad parodytumėte, kaip jos turėtų atrodyti. -## [Po pamokos testas](https://ff-quizzes.netlify.app/en/ds/) +## [Po paskaitos: testas](https://ff-quizzes.netlify.app/en/ds/quiz/25) ## Peržiūra ir savarankiškas mokymasis @@ -178,5 +178,5 @@ https://medium.com/@EvanSinar/use-animation-to-supercharge-data-visualization-cd --- -**Atsakomybės atsisakymas**: -Šis dokumentas buvo išverstas naudojant AI vertimo paslaugą [Co-op Translator](https://github.com/Azure/co-op-translator). Nors stengiamės užtikrinti tikslumą, prašome atkreipti dėmesį, kad automatiniai vertimai gali turėti klaidų ar netikslumų. Originalus dokumentas jo gimtąja kalba turėtų būti laikomas autoritetingu šaltiniu. Kritinei informacijai rekomenduojama naudoti profesionalų žmogaus vertimą. Mes neprisiimame atsakomybės už nesusipratimus ar klaidingus interpretavimus, atsiradusius dėl šio vertimo naudojimo. \ No newline at end of file +**Atsakomybės apribojimas**: +Šis dokumentas buvo išverstas naudojant AI vertimo paslaugą [Co-op Translator](https://github.com/Azure/co-op-translator). Nors siekiame tikslumo, prašome atkreipti dėmesį, kad automatiniai vertimai gali turėti klaidų ar netikslumų. Originalus dokumentas jo gimtąja kalba turėtų būti laikomas autoritetingu šaltiniu. Kritinei informacijai rekomenduojama profesionali žmogaus vertimo paslauga. Mes neprisiimame atsakomybės už nesusipratimus ar klaidingus interpretavimus, atsiradusius naudojant šį vertimą. \ No newline at end of file diff --git a/translations/lt/4-Data-Science-Lifecycle/14-Introduction/README.md b/translations/lt/4-Data-Science-Lifecycle/14-Introduction/README.md index 8e013251..60382718 100644 --- a/translations/lt/4-Data-Science-Lifecycle/14-Introduction/README.md +++ b/translations/lt/4-Data-Science-Lifecycle/14-Introduction/README.md @@ -1,8 +1,8 @@ -# Įvadas į duomenų mokslą debesyje +# Duomenų mokslas debesyje: Įvadas |![ Sketchnote by [(@sketchthedocs)](https://sketchthedocs.dev) ](../../sketchnotes/17-DataScience-Cloud.png)| |:---:| | Duomenų mokslas debesyje: Įvadas - _Sketchnote by [@nitya](https://twitter.com/nitya)_ | -Šioje pamokoje sužinosite pagrindinius debesų kompiuterijos principus, kodėl verta naudoti debesų paslaugas savo duomenų mokslo projektams vykdyti, ir peržiūrėsime keletą pavyzdžių, kaip duomenų mokslo projektai vykdomi debesyje. +Šioje pamokoje sužinosite pagrindinius debesijos principus, kodėl gali būti naudinga naudoti debesijos paslaugas savo duomenų mokslo projektams vykdyti, ir peržiūrėsime keletą pavyzdžių, kaip duomenų mokslo projektai vykdomi debesyje. -## [Prieš paskaitą: testas](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/32) +## [Prieš paskaitą: testas](https://ff-quizzes.netlify.app/en/ds/quiz/32) -## Kas yra debesis? +## Kas yra debesija? -Debesis, arba debesų kompiuterija, yra įvairių mokamų pagal poreikį kompiuterinių paslaugų teikimas, kurios yra talpinamos infrastruktūroje internete. Paslaugos apima sprendimus, tokius kaip saugyklos, duomenų bazės, tinklai, programinė įranga, analizė ir intelektualios paslaugos. +Debesija arba debesų kompiuterija – tai įvairių mokamų pagal poreikį kompiuterinių paslaugų, kurios yra talpinamos infrastruktūroje internete, teikimas. Paslaugos apima tokius sprendimus kaip saugyklos, duomenų bazės, tinklai, programinė įranga, analizė ir intelektualiosios paslaugos. -Paprastai skiriame viešąjį, privatųjį ir hibridinį debesį: +Paprastai skiriame viešąjį, privatųjį ir hibridinį debesis: -* Viešasis debesis: viešasis debesis priklauso trečiosios šalies debesų paslaugų teikėjui, kuris teikia savo kompiuterinius išteklius internetu visuomenei. -* Privatus debesis: tai kompiuteriniai ištekliai, naudojami tik vienos įmonės ar organizacijos, su paslaugomis ir infrastruktūra, palaikoma privačiame tinkle. -* Hibridinis debesis: hibridinis debesis yra sistema, kuri sujungia viešuosius ir privačiuosius debesis. Vartotojai renkasi vietinį duomenų centrą, tuo pačiu leidžiant duomenims ir programoms veikti viename ar daugiau viešųjų debesų. +* Viešasis debesis: viešasis debesis priklauso trečiosios šalies debesijos paslaugų teikėjui, kuris savo kompiuterinius išteklius teikia viešai per internetą. +* Privatus debesis: tai debesijos ištekliai, naudojami tik vienos įmonės ar organizacijos, su paslaugomis ir infrastruktūra, palaikoma privačiame tinkle. +* Hibridinis debesis: tai sistema, kuri sujungia viešuosius ir privačius debesis. Vartotojai renkasi vietinį duomenų centrą, tačiau leidžia duomenims ir programoms veikti viename ar keliuose viešuosiuose debesyse. -Dauguma debesų kompiuterijos paslaugų skirstomos į tris kategorijas: infrastruktūra kaip paslauga (IaaS), platforma kaip paslauga (PaaS) ir programinė įranga kaip paslauga (SaaS). +Dauguma debesijos paslaugų skirstomos į tris kategorijas: infrastruktūra kaip paslauga (IaaS), platforma kaip paslauga (PaaS) ir programinė įranga kaip paslauga (SaaS). * Infrastruktūra kaip paslauga (IaaS): vartotojai nuomojasi IT infrastruktūrą, tokią kaip serveriai, virtualios mašinos (VM), saugyklos, tinklai, operacinės sistemos. -* Platforma kaip paslauga (PaaS): vartotojai nuomojasi aplinką programinės įrangos kūrimui, testavimui, pristatymui ir valdymui. Vartotojams nereikia rūpintis serverių, saugyklų, tinklų ir duomenų bazių infrastruktūros nustatymu ar valdymu. -* Programinė įranga kaip paslauga (SaaS): vartotojai gauna prieigą prie programinės įrangos internetu pagal poreikį, paprastai prenumeratos pagrindu. Vartotojams nereikia rūpintis programinės įrangos talpinimu, valdymu, infrastruktūra ar priežiūra, pvz., programinės įrangos atnaujinimais ir saugumo pataisomis. +* Platforma kaip paslauga (PaaS): vartotojai nuomojasi aplinką programų kūrimui, testavimui, pristatymui ir valdymui. Vartotojams nereikia rūpintis serverių, saugyklų, tinklų ir duomenų bazių infrastruktūros nustatymu ar valdymu. +* Programinė įranga kaip paslauga (SaaS): vartotojai gauna prieigą prie programinės įrangos per internetą pagal poreikį, dažniausiai prenumeratos pagrindu. Vartotojams nereikia rūpintis programinės įrangos talpinimu, valdymu, infrastruktūra ar priežiūra, pvz., atnaujinimais ir saugumo pataisomis. -Kai kurie didžiausi debesų paslaugų teikėjai yra Amazon Web Services, Google Cloud Platform ir Microsoft Azure. +Didžiausi debesijos paslaugų teikėjai yra Amazon Web Services, Google Cloud Platform ir Microsoft Azure. -## Kodėl verta rinktis debesį duomenų mokslui? +## Kodėl rinktis debesiją duomenų mokslui? -Kūrėjai ir IT specialistai renkasi darbą su debesimi dėl daugelio priežasčių, įskaitant šias: +Kūrėjai ir IT specialistai renkasi debesiją dėl daugelio priežasčių, įskaitant šias: -* Inovacijos: galite integruoti inovatyvias paslaugas, sukurtas debesų teikėjų, tiesiai į savo programas. -* Lankstumas: mokate tik už tas paslaugas, kurių jums reikia, ir galite rinktis iš daugybės paslaugų. Paprastai mokate pagal poreikį ir pritaikote paslaugas pagal savo besikeičiančius poreikius. -* Biudžetas: nereikia investuoti į pradinį aparatūros ir programinės įrangos pirkimą, vietinių duomenų centrų nustatymą ir valdymą – mokate tik už tai, ką naudojate. -* Skalavimas: jūsų ištekliai gali būti pritaikyti pagal projekto poreikius, tai reiškia, kad jūsų programos gali naudoti daugiau ar mažiau kompiuterinės galios, saugyklos ir pralaidumo, prisitaikydamos prie išorinių veiksnių bet kuriuo metu. -* Produktyvumas: galite susitelkti į savo verslą, o ne gaišti laiką užduotims, kurias gali valdyti kiti, pvz., duomenų centrų valdymui. -* Patikimumas: debesų kompiuterija siūlo kelis būdus nuolat kurti duomenų atsargines kopijas ir galite nustatyti atkūrimo po nelaimių planus, kad jūsų verslas ir paslaugos veiktų net krizės metu. -* Saugumas: galite pasinaudoti politikomis, technologijomis ir kontrolėmis, kurios stiprina jūsų projekto saugumą. +* Inovacijos: galite integruoti debesijos teikėjų sukurtas inovatyvias paslaugas tiesiai į savo programas. +* Lankstumas: mokate tik už tas paslaugas, kurių jums reikia, ir galite rinktis iš plataus paslaugų spektro. Paprastai mokate pagal naudojimą ir pritaikote paslaugas pagal savo poreikius. +* Biudžetas: nereikia pradinių investicijų įrangai ir programinei įrangai įsigyti, vietiniams duomenų centrams įrengti ir valdyti – mokate tik už tai, ką naudojate. +* Skalavimas: jūsų ištekliai gali būti pritaikyti pagal projekto poreikius, o tai reiškia, kad jūsų programos gali naudoti daugiau ar mažiau skaičiavimo galios, saugyklos ir pralaidumo, prisitaikydamos prie išorinių veiksnių bet kuriuo metu. +* Produktyvumas: galite sutelkti dėmesį į savo verslą, o ne gaišti laiką užduotims, kurias gali atlikti kiti, pvz., duomenų centrų valdymui. +* Patikimumas: debesija siūlo įvairius būdus nuolat kurti duomenų atsargines kopijas ir galite nustatyti atkūrimo po nelaimių planus, kad jūsų verslas ir paslaugos veiktų net krizės metu. +* Saugumas: galite pasinaudoti politikomis, technologijomis ir kontrolės priemonėmis, kurios sustiprina jūsų projekto saugumą. -Tai yra keletas dažniausiai pasitaikančių priežasčių, kodėl žmonės renkasi debesų paslaugas. Dabar, kai geriau suprantame, kas yra debesis ir kokie jo pagrindiniai privalumai, pažvelkime konkrečiau į duomenų mokslininkų ir kūrėjų, dirbančių su duomenimis, darbus ir kaip debesis gali padėti jiems spręsti įvairius iššūkius: +Tai yra keletas dažniausiai minimų priežasčių, kodėl žmonės renkasi debesijos paslaugas. Dabar, kai geriau suprantame, kas yra debesija ir kokie jos pagrindiniai privalumai, pažvelkime konkrečiau į duomenų mokslininkų ir kūrėjų, dirbančių su duomenimis, darbus ir kaip debesija gali padėti spręsti įvairius iššūkius: * Didelių duomenų saugojimas: vietoj to, kad pirktumėte, valdytumėte ir apsaugotumėte didelius serverius, galite saugoti savo duomenis tiesiogiai debesyje, naudodami tokius sprendimus kaip Azure Cosmos DB, Azure SQL Database ir Azure Data Lake Storage. -* Duomenų integravimas: duomenų integravimas yra esminė duomenų mokslo dalis, leidžianti pereiti nuo duomenų rinkimo prie veiksmų atlikimo. Naudodami debesyje siūlomas duomenų integravimo paslaugas, galite rinkti, transformuoti ir integruoti duomenis iš įvairių šaltinių į vieną duomenų sandėlį, naudodami Data Factory. -* Duomenų apdorojimas: didelių duomenų apdorojimas reikalauja daug kompiuterinės galios, ir ne visi turi prieigą prie pakankamai galingų mašinų, todėl daugelis žmonių renkasi tiesiogiai naudoti debesies didžiulę kompiuterinę galią savo sprendimams vykdyti ir diegti. -* Duomenų analizės paslaugų naudojimas: debesų paslaugos, tokios kaip Azure Synapse Analytics, Azure Stream Analytics ir Azure Databricks, padeda paversti jūsų duomenis į veiksmingas įžvalgas. -* Mašininio mokymosi ir duomenų intelekto paslaugų naudojimas: vietoj to, kad pradėtumėte nuo nulio, galite naudoti debesų teikėjo siūlomus mašininio mokymosi algoritmus, su paslaugomis, tokiomis kaip AzureML. Taip pat galite naudoti kognityvines paslaugas, tokias kaip kalbos į tekstą, tekstas į kalbą, kompiuterinė vizija ir daugiau. +* Duomenų integracija: duomenų integracija yra esminė duomenų mokslo dalis, leidžianti pereiti nuo duomenų rinkimo prie veiksmų. Naudodamiesi debesijos siūlomomis duomenų integracijos paslaugomis, galite rinkti, transformuoti ir integruoti duomenis iš įvairių šaltinių į vieną duomenų saugyklą, naudodami Data Factory. +* Duomenų apdorojimas: didelių duomenų apdorojimas reikalauja daug skaičiavimo galios, o ne visi turi prieigą prie pakankamai galingų mašinų, todėl daugelis renkasi tiesiogiai naudotis debesijos didžiule skaičiavimo galia savo sprendimams vykdyti ir diegti. +* Duomenų analizės paslaugos: debesijos paslaugos, tokios kaip Azure Synapse Analytics, Azure Stream Analytics ir Azure Databricks, padeda paversti jūsų duomenis į veiksmingas įžvalgas. +* Mašininis mokymasis ir duomenų intelekto paslaugos: vietoj to, kad pradėtumėte nuo nulio, galite naudoti debesijos teikėjo siūlomus mašininio mokymosi algoritmus, pvz., AzureML. Taip pat galite naudotis kognityvinėmis paslaugomis, tokiomis kaip kalbos atpažinimas, teksto į kalbą konvertavimas, kompiuterinė rega ir kt. ## Duomenų mokslas debesyje: pavyzdžiai -Padarykime tai konkretesniu, peržiūrėdami keletą scenarijų. +Pažvelkime į keletą scenarijų, kad tai būtų aiškiau. -### Socialinių tinklų nuotaikų analizė realiu laiku +### Socialinių tinklų nuotaikų analizė realiuoju laiku -Pradėkime nuo scenarijaus, kurį dažnai nagrinėja pradedantieji mašininio mokymosi srityje: socialinių tinklų nuotaikų analizė realiu laiku. +Pradėkime nuo scenarijaus, kurį dažnai nagrinėja pradedantieji mašininio mokymosi srityje: socialinių tinklų nuotaikų analizė realiuoju laiku. -Tarkime, jūs valdote naujienų svetainę ir norite pasinaudoti tiesioginiais duomenimis, kad suprastumėte, kokiu turiniu jūsų skaitytojai galėtų būti suinteresuoti. Norėdami sužinoti daugiau apie tai, galite sukurti programą, kuri atlieka realaus laiko nuotaikų analizę iš „Twitter“ publikacijų, susijusių su jūsų skaitytojams aktualiomis temomis. +Tarkime, jūs valdote naujienų svetainę ir norite naudoti tiesioginius duomenis, kad suprastumėte, kokiu turiniu jūsų skaitytojai galėtų būti suinteresuoti. Norėdami tai sužinoti, galite sukurti programą, kuri atlieka realaus laiko nuotaikų analizę iš „Twitter“ publikacijų, susijusių su jūsų skaitytojams aktualiomis temomis. -Pagrindiniai rodikliai, kuriuos stebėsite, yra „Twitter“ žinučių apimtis tam tikromis temomis (hashtagais) ir nuotaikos, kurios nustatomos naudojant analizės įrankius, atliekančius nuotaikų analizę aplink nurodytas temas. +Pagrindiniai rodikliai, kuriuos stebėsite, yra tviterių apimtis tam tikromis temomis (žymomis) ir nuotaikos, kurios nustatomos naudojant analizės įrankius, atliekančius nuotaikų analizę pagal nurodytas temas. Šio projekto kūrimo žingsniai yra šie: -* Sukurkite įvykių centrą srauto įvestims, kuris rinks duomenis iš „Twitter“. -* Konfigūruokite ir paleiskite „Twitter“ klientų programą, kuri naudos „Twitter Streaming API“. -* Sukurkite srauto analizės užduotį. -* Nurodykite užduoties įvestį ir užklausą. -* Sukurkite išvesties saugyklą ir nurodykite užduoties išvestį. -* Paleiskite užduotį. +* Sukurti įvykių centrą duomenų srautui rinkti, kuris rinks duomenis iš „Twitter“. +* Suaktyvinti ir paleisti „Twitter“ kliento programą, kuri naudos „Twitter“ srautų API. +* Sukurti srautų analizės užduotį. +* Nustatyti užduoties įvestį ir užklausą. +* Sukurti išvesties saugyklą ir nurodyti užduoties išvestį. +* Paleisti užduotį. -Norėdami peržiūrėti visą procesą, apsilankykite [dokumentacijoje](https://docs.microsoft.com/azure/stream-analytics/stream-analytics-twitter-sentiment-analysis-trends?WT.mc_id=academic-77958-bethanycheum&ocid=AID30411099). +Visą procesą galite peržiūrėti [dokumentacijoje](https://docs.microsoft.com/azure/stream-analytics/stream-analytics-twitter-sentiment-analysis-trends?WT.mc_id=academic-77958-bethanycheum&ocid=AID30411099). ### Mokslinių straipsnių analizė -Pažvelkime į kitą projekto pavyzdį, kurį sukūrė [Dmitry Soshnikov](http://soshnikov.com), vienas iš šios mokymo programos autorių. +Pažvelkime į kitą projektą, kurį sukūrė [Dmitrijus Sošnikovas](http://soshnikov.com), vienas iš šios mokymo programos autorių. -Dmitry sukūrė įrankį, kuris analizuoja COVID straipsnius. Peržiūrėdami šį projektą, pamatysite, kaip galite sukurti įrankį, kuris išgauna žinias iš mokslinių straipsnių, gauna įžvalgas ir padeda tyrėjams efektyviai naršyti per dideles straipsnių kolekcijas. +Dmitrijus sukūrė įrankį, kuris analizuoja COVID straipsnius. Peržiūrėję šį projektą, pamatysite, kaip galite sukurti įrankį, kuris išgauna žinias iš mokslinių straipsnių, gauna įžvalgas ir padeda tyrėjams efektyviai naršyti per dideles straipsnių kolekcijas. -Pažiūrėkime, kokie žingsniai buvo naudojami: +Štai kokie žingsniai buvo naudojami: * Informacijos išgavimas ir išankstinis apdorojimas naudojant [Text Analytics for Health](https://docs.microsoft.com/azure/cognitive-services/text-analytics/how-tos/text-analytics-for-health?WT.mc_id=academic-77958-bethanycheum&ocid=AID3041109). -* Naudojant [Azure ML](https://azure.microsoft.com/services/machine-learning?WT.mc_id=academic-77958-bethanycheum&ocid=AID3041109) apdorojimo paralelizavimui. +* Naudojant [Azure ML](https://azure.microsoft.com/services/machine-learning?WT.mc_id=academic-77958-bethanycheum&ocid=AID3041109) apdorojimo procesų lygiagretinimui. * Informacijos saugojimas ir užklausų vykdymas naudojant [Cosmos DB](https://azure.microsoft.com/services/cosmos-db?WT.mc_id=academic-77958-bethanycheum&ocid=AID3041109). * Interaktyvios duomenų tyrimo ir vizualizacijos ataskaitų srities kūrimas naudojant Power BI. -Norėdami peržiūrėti visą procesą, apsilankykite [Dmitry tinklaraštyje](https://soshnikov.com/science/analyzing-medical-papers-with-azure-and-text-analytics-for-health/). +Visą procesą galite peržiūrėti [Dmitrijaus tinklaraštyje](https://soshnikov.com/science/analyzing-medical-papers-with-azure-and-text-analytics-for-health/). -Kaip matote, debesų paslaugas galima panaudoti įvairiais būdais duomenų mokslui vykdyti. +Kaip matote, debesijos paslaugos gali būti naudojamos įvairiais būdais duomenų mokslui vykdyti. ## Pastabos @@ -104,7 +104,7 @@ Kaip matote, debesų paslaugas galima panaudoti įvairiais būdais duomenų moks ## Po paskaitos: testas -## [Po paskaitos: testas](https://ff-quizzes.netlify.app/en/ds/) +## [Po paskaitos: testas](https://ff-quizzes.netlify.app/en/ds/quiz/33) ## Užduotis diff --git a/translations/lt/5-Data-Science-In-Cloud/18-Low-Code/README.md b/translations/lt/5-Data-Science-In-Cloud/18-Low-Code/README.md index dc55592e..c16800ef 100644 --- a/translations/lt/5-Data-Science-In-Cloud/18-Low-Code/README.md +++ b/translations/lt/5-Data-Science-In-Cloud/18-Low-Code/README.md @@ -1,8 +1,8 @@