From b985ee1af0dd2422422edae8aa99bc135a571015 Mon Sep 17 00:00:00 2001 From: "localizeflow[bot]" Date: Fri, 19 Dec 2025 18:36:17 +0000 Subject: [PATCH] chore(i18n): sync translations with latest source changes (chunk 9/10, 100 files) --- .../12-visualization-relationships/README.md | 181 + .../R/13-meaningful-vizualizations/README.md | 185 + .../ml/3-Data-Visualization/README.md | 45 + .../14-Introduction/README.md | 121 + .../14-Introduction/assignment.md | 38 + .../14-Introduction/notebook.ipynb | 140 + .../15-analyzing/README.md | 60 + .../15-analyzing/assignment.ipynb | 154 + .../15-analyzing/assignment.md | 38 + .../15-analyzing/notebook.ipynb | 193 + .../16-communication/README.md | 224 + .../16-communication/assignment.md | 28 + .../ml/4-Data-Science-Lifecycle/README.md | 32 + .../17-Introduction/README.md | 17 + .../17-Introduction/assignment.md | 27 + .../18-Low-Code/README.md | 355 ++ .../18-Low-Code/assignment.md | 27 + .../19-Azure/README.md | 325 ++ .../19-Azure/assignment.md | 27 + .../19-Azure/notebook.ipynb | 325 ++ .../19-Azure/solution/notebook.ipynb | 0 .../ml/5-Data-Science-In-Cloud/README.md | 36 + .../20-Real-World-Examples/README.md | 119 + .../20-Real-World-Examples/assignment.md | 52 + .../ml/6-Data-Science-In-Wild/README.md | 27 + translations/ml/AGENTS.md | 375 ++ translations/ml/CODE_OF_CONDUCT.md | 25 + translations/ml/CONTRIBUTING.md | 363 ++ translations/ml/INSTALLATION.md | 263 + translations/ml/README.md | 252 + translations/ml/SECURITY.md | 53 + translations/ml/SUPPORT.md | 26 + translations/ml/TROUBLESHOOTING.md | 629 +++ translations/ml/USAGE.md | 376 ++ translations/ml/docs/_sidebar.md | 42 + translations/ml/examples/README.md | 151 + translations/ml/for-teachers.md | 78 + translations/ml/quiz-app/README.md | 141 + translations/ml/sketchnotes/README.md | 23 + .../01-defining-data-science/README.md | 178 + .../01-defining-data-science/assignment.md | 48 + .../01-defining-data-science/notebook.ipynb | 431 ++ .../solution/assignment.md | 50 + .../solution/notebook.ipynb | 540 +++ .../te/1-Introduction/02-ethics/README.md | 275 ++ .../te/1-Introduction/02-ethics/assignment.md | 35 + .../1-Introduction/03-defining-data/README.md | 88 + .../03-defining-data/assignment.md | 81 + .../04-stats-and-probability/README.md | 278 ++ .../04-stats-and-probability/assignment.ipynb | 264 + .../04-stats-and-probability/assignment.md | 42 + .../04-stats-and-probability/notebook.ipynb | 968 ++++ .../solution/assignment.ipynb | 957 ++++ translations/te/1-Introduction/README.md | 33 + .../05-relational-databases/README.md | 199 + .../05-relational-databases/assignment.md | 76 + .../06-non-relational/README.md | 160 + .../06-non-relational/assignment.md | 35 + .../07-python/R/notebook.ipynb | 2144 +++++++++ .../2-Working-With-Data/07-python/README.md | 295 ++ .../07-python/assignment.md | 39 + .../07-python/notebook-covidspread.ipynb | 2461 ++++++++++ .../07-python/notebook-papers.ipynb | 2347 +++++++++ .../07-python/notebook.ipynb | 1510 ++++++ .../08-data-preparation/README.md | 350 ++ .../08-data-preparation/assignment.ipynb | 155 + .../08-data-preparation/assignment.md | 30 + .../08-data-preparation/notebook.ipynb | 4244 +++++++++++++++++ translations/te/2-Working-With-Data/README.md | 32 + .../09-visualization-quantities/README.md | 221 + .../09-visualization-quantities/assignment.md | 27 + .../notebook.ipynb | 48 + .../solution/notebook.ipynb | 573 +++ .../10-visualization-distributions/README.md | 219 + .../assignment.md | 27 + .../notebook.ipynb | 32 + .../solution/notebook.ipynb | 571 +++ .../11-visualization-proportions/README.md | 207 + .../assignment.md | 27 + .../notebook.ipynb | 32 + .../solution/notebook.ipynb | 1313 +++++ .../12-visualization-relationships/README.md | 190 + .../assignment.md | 27 + .../notebook.ipynb | 32 + .../solution/notebook.ipynb | 391 ++ .../13-meaningful-visualizations/README.md | 184 + .../assignment.md | 26 + .../correlation-analysis.ipynb | 100 + .../solution/README.md | 42 + .../starter/README.md | 42 + .../R/09-visualization-quantities/README.md | 233 + .../09-visualization-quantities/assignment.md | 27 + .../10-visualization-distributions/README.md | 185 + .../assignment.md | 27 + .../R/11-visualization-proportions/README.md | 204 + .../12-visualization-relationships/README.md | 179 + .../R/13-meaningful-vizualizations/README.md | 184 + .../te/3-Data-Visualization/README.md | 45 + .../14-Introduction/README.md | 122 + .../14-Introduction/assignment.md | 39 + 100 files changed, 29494 insertions(+) create mode 100644 translations/ml/3-Data-Visualization/R/12-visualization-relationships/README.md create mode 100644 translations/ml/3-Data-Visualization/R/13-meaningful-vizualizations/README.md create mode 100644 translations/ml/3-Data-Visualization/README.md create mode 100644 translations/ml/4-Data-Science-Lifecycle/14-Introduction/README.md create mode 100644 translations/ml/4-Data-Science-Lifecycle/14-Introduction/assignment.md create mode 100644 translations/ml/4-Data-Science-Lifecycle/14-Introduction/notebook.ipynb create mode 100644 translations/ml/4-Data-Science-Lifecycle/15-analyzing/README.md create mode 100644 translations/ml/4-Data-Science-Lifecycle/15-analyzing/assignment.ipynb create mode 100644 translations/ml/4-Data-Science-Lifecycle/15-analyzing/assignment.md create mode 100644 translations/ml/4-Data-Science-Lifecycle/15-analyzing/notebook.ipynb create mode 100644 translations/ml/4-Data-Science-Lifecycle/16-communication/README.md create mode 100644 translations/ml/4-Data-Science-Lifecycle/16-communication/assignment.md create mode 100644 translations/ml/4-Data-Science-Lifecycle/README.md create mode 100644 translations/ml/5-Data-Science-In-Cloud/17-Introduction/README.md create mode 100644 translations/ml/5-Data-Science-In-Cloud/17-Introduction/assignment.md create mode 100644 translations/ml/5-Data-Science-In-Cloud/18-Low-Code/README.md create mode 100644 translations/ml/5-Data-Science-In-Cloud/18-Low-Code/assignment.md create mode 100644 translations/ml/5-Data-Science-In-Cloud/19-Azure/README.md create mode 100644 translations/ml/5-Data-Science-In-Cloud/19-Azure/assignment.md create mode 100644 translations/ml/5-Data-Science-In-Cloud/19-Azure/notebook.ipynb create mode 100644 translations/ml/5-Data-Science-In-Cloud/19-Azure/solution/notebook.ipynb create mode 100644 translations/ml/5-Data-Science-In-Cloud/README.md create mode 100644 translations/ml/6-Data-Science-In-Wild/20-Real-World-Examples/README.md create mode 100644 translations/ml/6-Data-Science-In-Wild/20-Real-World-Examples/assignment.md create mode 100644 translations/ml/6-Data-Science-In-Wild/README.md create mode 100644 translations/ml/AGENTS.md create mode 100644 translations/ml/CODE_OF_CONDUCT.md create mode 100644 translations/ml/CONTRIBUTING.md create mode 100644 translations/ml/INSTALLATION.md create mode 100644 translations/ml/README.md create mode 100644 translations/ml/SECURITY.md create mode 100644 translations/ml/SUPPORT.md create mode 100644 translations/ml/TROUBLESHOOTING.md create mode 100644 translations/ml/USAGE.md create mode 100644 translations/ml/docs/_sidebar.md create mode 100644 translations/ml/examples/README.md create mode 100644 translations/ml/for-teachers.md create mode 100644 translations/ml/quiz-app/README.md create mode 100644 translations/ml/sketchnotes/README.md create mode 100644 translations/te/1-Introduction/01-defining-data-science/README.md create mode 100644 translations/te/1-Introduction/01-defining-data-science/assignment.md create mode 100644 translations/te/1-Introduction/01-defining-data-science/notebook.ipynb create mode 100644 translations/te/1-Introduction/01-defining-data-science/solution/assignment.md create mode 100644 translations/te/1-Introduction/01-defining-data-science/solution/notebook.ipynb create mode 100644 translations/te/1-Introduction/02-ethics/README.md create mode 100644 translations/te/1-Introduction/02-ethics/assignment.md create mode 100644 translations/te/1-Introduction/03-defining-data/README.md create mode 100644 translations/te/1-Introduction/03-defining-data/assignment.md create mode 100644 translations/te/1-Introduction/04-stats-and-probability/README.md create mode 100644 translations/te/1-Introduction/04-stats-and-probability/assignment.ipynb create mode 100644 translations/te/1-Introduction/04-stats-and-probability/assignment.md create mode 100644 translations/te/1-Introduction/04-stats-and-probability/notebook.ipynb create mode 100644 translations/te/1-Introduction/04-stats-and-probability/solution/assignment.ipynb create mode 100644 translations/te/1-Introduction/README.md create mode 100644 translations/te/2-Working-With-Data/05-relational-databases/README.md create mode 100644 translations/te/2-Working-With-Data/05-relational-databases/assignment.md create mode 100644 translations/te/2-Working-With-Data/06-non-relational/README.md create mode 100644 translations/te/2-Working-With-Data/06-non-relational/assignment.md create mode 100644 translations/te/2-Working-With-Data/07-python/R/notebook.ipynb create mode 100644 translations/te/2-Working-With-Data/07-python/README.md create mode 100644 translations/te/2-Working-With-Data/07-python/assignment.md create mode 100644 translations/te/2-Working-With-Data/07-python/notebook-covidspread.ipynb create mode 100644 translations/te/2-Working-With-Data/07-python/notebook-papers.ipynb create mode 100644 translations/te/2-Working-With-Data/07-python/notebook.ipynb create mode 100644 translations/te/2-Working-With-Data/08-data-preparation/README.md create mode 100644 translations/te/2-Working-With-Data/08-data-preparation/assignment.ipynb create mode 100644 translations/te/2-Working-With-Data/08-data-preparation/assignment.md create mode 100644 translations/te/2-Working-With-Data/08-data-preparation/notebook.ipynb create mode 100644 translations/te/2-Working-With-Data/README.md create mode 100644 translations/te/3-Data-Visualization/09-visualization-quantities/README.md create mode 100644 translations/te/3-Data-Visualization/09-visualization-quantities/assignment.md create mode 100644 translations/te/3-Data-Visualization/09-visualization-quantities/notebook.ipynb create mode 100644 translations/te/3-Data-Visualization/09-visualization-quantities/solution/notebook.ipynb create mode 100644 translations/te/3-Data-Visualization/10-visualization-distributions/README.md create mode 100644 translations/te/3-Data-Visualization/10-visualization-distributions/assignment.md create mode 100644 translations/te/3-Data-Visualization/10-visualization-distributions/notebook.ipynb create mode 100644 translations/te/3-Data-Visualization/10-visualization-distributions/solution/notebook.ipynb create mode 100644 translations/te/3-Data-Visualization/11-visualization-proportions/README.md create mode 100644 translations/te/3-Data-Visualization/11-visualization-proportions/assignment.md create mode 100644 translations/te/3-Data-Visualization/11-visualization-proportions/notebook.ipynb create mode 100644 translations/te/3-Data-Visualization/11-visualization-proportions/solution/notebook.ipynb create mode 100644 translations/te/3-Data-Visualization/12-visualization-relationships/README.md create mode 100644 translations/te/3-Data-Visualization/12-visualization-relationships/assignment.md create mode 100644 translations/te/3-Data-Visualization/12-visualization-relationships/notebook.ipynb create mode 100644 translations/te/3-Data-Visualization/12-visualization-relationships/solution/notebook.ipynb create mode 100644 translations/te/3-Data-Visualization/13-meaningful-visualizations/README.md create mode 100644 translations/te/3-Data-Visualization/13-meaningful-visualizations/assignment.md create mode 100644 translations/te/3-Data-Visualization/13-meaningful-visualizations/correlation-analysis.ipynb create mode 100644 translations/te/3-Data-Visualization/13-meaningful-visualizations/solution/README.md create mode 100644 translations/te/3-Data-Visualization/13-meaningful-visualizations/starter/README.md create mode 100644 translations/te/3-Data-Visualization/R/09-visualization-quantities/README.md create mode 100644 translations/te/3-Data-Visualization/R/09-visualization-quantities/assignment.md create mode 100644 translations/te/3-Data-Visualization/R/10-visualization-distributions/README.md create mode 100644 translations/te/3-Data-Visualization/R/10-visualization-distributions/assignment.md create mode 100644 translations/te/3-Data-Visualization/R/11-visualization-proportions/README.md create mode 100644 translations/te/3-Data-Visualization/R/12-visualization-relationships/README.md create mode 100644 translations/te/3-Data-Visualization/R/13-meaningful-vizualizations/README.md create mode 100644 translations/te/3-Data-Visualization/README.md create mode 100644 translations/te/4-Data-Science-Lifecycle/14-Introduction/README.md create mode 100644 translations/te/4-Data-Science-Lifecycle/14-Introduction/assignment.md diff --git a/translations/ml/3-Data-Visualization/R/12-visualization-relationships/README.md b/translations/ml/3-Data-Visualization/R/12-visualization-relationships/README.md new file mode 100644 index 00000000..f5fa8c1d --- /dev/null +++ b/translations/ml/3-Data-Visualization/R/12-visualization-relationships/README.md @@ -0,0 +1,181 @@ + +# ബന്ധങ്ങൾ ദൃശ്യവൽക്കരിക്കൽ: തേൻ 🍯 സംബന്ധിച്ച എല്ലാം + +|![ Sketchnote by [(@sketchthedocs)](https://sketchthedocs.dev) ](../../../sketchnotes/12-Visualizing-Relationships.png)| +|:---:| +|ബന്ധങ്ങൾ ദൃശ്യവൽക്കരിക്കൽ - _Sketchnote by [@nitya](https://twitter.com/nitya)_ | + +നമ്മുടെ ഗവേഷണത്തിന്റെ പ്രകൃതി കേന്ദ്രീകൃതമായ ഭാഗം തുടർന്നുകൊണ്ട്, [United States Department of Agriculture](https://www.nass.usda.gov/About_NASS/index.php) നിന്നുള്ള ഡാറ്റാസെറ്റിൽ നിന്നുള്ള വിവിധ തരത്തിലുള്ള തേനുകളുടെ ബന്ധങ്ങൾ കാണിക്കുന്ന രസകരമായ ദൃശ്യവൽക്കരണങ്ങൾ കണ്ടെത്താം. + +ഏകദേശം 600 ഇനങ്ങളുള്ള ഈ ഡാറ്റാസെറ്റ് പല യു.എസ്. സംസ്ഥാനങ്ങളിലെ തേൻ ഉത്പാദനം പ്രദർശിപ്പിക്കുന്നു. ഉദാഹരണത്തിന്, ഓരോ സംസ്ഥാനത്തെയും ഓരോ വർഷത്തെയും കോളനികളുടെ എണ്ണം, ഓരോ കോളനിക്കുള്ള ഉത്പാദനം, മൊത്തം ഉത്പാദനം, സ്റ്റോക്കുകൾ, പൗണ്ട് പ്രതി വില, ഉത്പാദന മൂല്യം എന്നിവ കാണാം. + +ഒരു സംസ്ഥാനത്തിന്റെ ഓരോ വർഷവും ഉത്പാദനവും, ഉദാഹരണത്തിന്, ആ സംസ്ഥാനത്തെ തേൻ വിലയുമായി ഉള്ള ബന്ധം ദൃശ്യവൽക്കരിക്കുന്നത് രസകരമായിരിക്കും. അല്ലെങ്കിൽ, സംസ്ഥാനങ്ങളുടെ കോളനി പ്രതി തേൻ ഉത്പാദനത്തിന്റെ ബന്ധം ദൃശ്യവൽക്കരിക്കാം. 2006-ൽ ആദ്യമായി കണ്ട 'CCD' അല്ലെങ്കിൽ 'Colony Collapse Disorder' (http://npic.orst.edu/envir/ccd.html) ഉൾപ്പെടുന്ന ഈ വർഷപരിധി പഠിക്കാൻ ഒരു പ്രാധാന്യമുള്ള ഡാറ്റാസെറ്റാണ്. 🐝 + +## [പ്രീ-ലെക്ചർ ക്വിസ്](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/22) + +ഈ പാഠത്തിൽ, നിങ്ങൾ മുമ്പ് ഉപയോഗിച്ചിട്ടുള്ള ggplot2 ഉപയോഗിച്ച് വ്യത്യസ്ത വേരിയബിളുകൾ തമ്മിലുള്ള ബന്ധങ്ങൾ ദൃശ്യവൽക്കരിക്കാൻ കഴിയും. പ്രത്യേകിച്ച്, ggplot2-യുടെ `geom_point`യും `qplot` ഫംഗ്ഷനുകളും ഉപയോഗിച്ച് സ്‌കാറ്റർ പ്ലോട്ടുകളും ലൈൻ പ്ലോട്ടുകളും എളുപ്പത്തിൽ '[സാങ്കേതിക ബന്ധങ്ങൾ](https://ggplot2.tidyverse.org/)' കാണിക്കാൻ കഴിയും, ഇത് ഡാറ്റാ സയന്റിസ്റ്റിന് വേരിയബിളുകൾ തമ്മിലുള്ള ബന്ധം മനസ്സിലാക്കാൻ സഹായിക്കുന്നു. + +## സ്‌കാറ്റർപ്ലോട്ടുകൾ + +തേൻ വില വർഷം തോറും ഓരോ സംസ്ഥാനത്തും എങ്ങനെ മാറിയെന്ന് കാണിക്കാൻ സ്‌കാറ്റർപ്ലോട്ട് ഉപയോഗിക്കുക. ggplot2, `ggplot`യും `geom_point`ഉം ഉപയോഗിച്ച് സംസ്ഥാന ഡാറ്റ ഗ്രൂപ്പുചെയ്ത് കാറ്റഗോറിയും സംഖ്യാത്മക ഡാറ്റയും കാണിക്കുന്ന ഡാറ്റ പോയിന്റുകൾ പ്രദർശിപ്പിക്കുന്നു. + +ഡാറ്റയും Seaborn-ഉം ഇറക്കുമതി ചെയ്യുന്നതിൽ നിന്ന് തുടങ്ങാം: + +```r +honey=read.csv('../../data/honey.csv') +head(honey) +``` +തേൻ ഡാറ്റയിൽ വർഷവും പൗണ്ട് പ്രതി വിലയും ഉൾപ്പെടെ പല രസകരമായ കോളങ്ങളുണ്ട്. യു.എസ്. സംസ്ഥാനങ്ങൾ അനുസരിച്ച് ഗ്രൂപ്പുചെയ്ത് ഈ ഡാറ്റ പരിശോധിക്കാം: + +| state | numcol | yieldpercol | totalprod | stocks | priceperlb | prodvalue | year | +| ----- | ------ | ----------- | --------- | -------- | ---------- | --------- | ---- | +| AL | 16000 | 71 | 1136000 | 159000 | 0.72 | 818000 | 1998 | +| AZ | 55000 | 60 | 3300000 | 1485000 | 0.64 | 2112000 | 1998 | +| AR | 53000 | 65 | 3445000 | 1688000 | 0.59 | 2033000 | 1998 | +| CA | 450000 | 83 | 37350000 | 12326000 | 0.62 | 23157000 | 1998 | +| CO | 27000 | 72 | 1944000 | 1594000 | 0.7 | 1361000 | 1998 | +| FL | 230000 | 98 |22540000 | 4508000 | 0.64 | 14426000 | 1998 | + +തേൻ പൗണ്ട് പ്രതി വിലയും അതിന്റെ യു.എസ്. സംസ്ഥാന ഉത്ഭവവും തമ്മിലുള്ള ബന്ധം കാണിക്കുന്ന ഒരു അടിസ്ഥാന സ്‌കാറ്റർപ്ലോട്ട് സൃഷ്ടിക്കുക. എല്ലാ സംസ്ഥാനങ്ങളും കാണാൻ `y` അക്ഷം ഉയരം നൽകുക: + +```r +library(ggplot2) +ggplot(honey, aes(x = priceperlb, y = state)) + + geom_point(colour = "blue") +``` +![scatterplot 1](../../../../../translated_images/scatter1.86b8900674d88b26dd3353a83fe604e9ab3722c4680cc40ee9beb452ff02cdea.ml.png) + +ഇപ്പോൾ, വർഷം തോറും വില എങ്ങനെ മാറിയെന്ന് കാണിക്കാൻ തേൻ നിറത്തിലുള്ള കളർ സ്കീം ഉപയോഗിച്ച് സമാന ഡാറ്റ കാണിക്കുക. വർഷം തോറും മാറ്റം കാണിക്കാൻ 'scale_color_gradientn' പാരാമീറ്റർ ചേർക്കാം: + +> ✅ [scale_color_gradientn](https://www.rdocumentation.org/packages/ggplot2/versions/0.9.1/topics/scale_colour_gradientn) കുറിച്ച് കൂടുതൽ പഠിക്കൂ - മനോഹരമായ റെയിൻബോ കളർ സ്കീം പരീക്ഷിക്കൂ! + +```r +ggplot(honey, aes(x = priceperlb, y = state, color=year)) + + geom_point()+scale_color_gradientn(colours = colorspace::heat_hcl(7)) +``` +![scatterplot 2](../../../../../translated_images/scatter2.4d1cbc693bad20e2b563888747eb6bdf65b73ce449d903f7cd4068a78502dcff.ml.png) + +ഈ കളർ സ്കീം മാറ്റത്തോടെ, പൗണ്ട് പ്രതി തേൻ വില വർഷം തോറും ശക്തമായി ഉയരുന്നുവെന്ന് വ്യക്തമായി കാണാം. ഡാറ്റയിൽ ഒരു സാമ്പിൾ സെറ്റ് പരിശോധിച്ചാൽ (ഉദാഹരണത്തിന്, അരിസോണ), വില വർഷം തോറും ഉയരുന്ന ഒരു പാറ്റേൺ കാണാം, കുറച്ച് ഒഴിവുകൾ കൂടെ: + +| state | numcol | yieldpercol | totalprod | stocks | priceperlb | prodvalue | year | +| ----- | ------ | ----------- | --------- | ------- | ---------- | --------- | ---- | +| AZ | 55000 | 60 | 3300000 | 1485000 | 0.64 | 2112000 | 1998 | +| AZ | 52000 | 62 | 3224000 | 1548000 | 0.62 | 1999000 | 1999 | +| AZ | 40000 | 59 | 2360000 | 1322000 | 0.73 | 1723000 | 2000 | +| AZ | 43000 | 59 | 2537000 | 1142000 | 0.72 | 1827000 | 2001 | +| AZ | 38000 | 63 | 2394000 | 1197000 | 1.08 | 2586000 | 2002 | +| AZ | 35000 | 72 | 2520000 | 983000 | 1.34 | 3377000 | 2003 | +| AZ | 32000 | 55 | 1760000 | 774000 | 1.11 | 1954000 | 2004 | +| AZ | 36000 | 50 | 1800000 | 720000 | 1.04 | 1872000 | 2005 | +| AZ | 30000 | 65 | 1950000 | 839000 | 0.91 | 1775000 | 2006 | +| AZ | 30000 | 64 | 1920000 | 902000 | 1.26 | 2419000 | 2007 | +| AZ | 25000 | 64 | 1600000 | 336000 | 1.26 | 2016000 | 2008 | +| AZ | 20000 | 52 | 1040000 | 562000 | 1.45 | 1508000 | 2009 | +| AZ | 24000 | 77 | 1848000 | 665000 | 1.52 | 2809000 | 2010 | +| AZ | 23000 | 53 | 1219000 | 427000 | 1.55 | 1889000 | 2011 | +| AZ | 22000 | 46 | 1012000 | 253000 | 1.79 | 1811000 | 2012 | + +ഈ പുരോഗതി കാണിക്കാൻ കളറിന് പകരം വലിപ്പം ഉപയോഗിക്കാം. കളർബ്ലൈൻഡ് ഉപയോക്താക്കൾക്ക് ഇത് നല്ല ഓപ്ഷൻ ആകാം. ഡോട്ട് വലിപ്പം വർദ്ധിപ്പിച്ച് വില വർദ്ധനവ് കാണിക്കുന്ന വിധം നിങ്ങളുടെ ദൃശ്യവൽക്കരണം തിരുത്തുക: + +```r +ggplot(honey, aes(x = priceperlb, y = state)) + + geom_point(aes(size = year),colour = "blue") + + scale_size_continuous(range = c(0.25, 3)) +``` +ഡോട്ടുകളുടെ വലിപ്പം ക്രമാനുസൃതമായി വർദ്ധിക്കുന്നതായി കാണാം. + +![scatterplot 3](../../../../../translated_images/scatter3.722d21e6f20b3ea2e18339bb9b10d75906126715eb7d5fdc88fe74dcb6d7066a.ml.png) + +ഇത് സപ്ലൈ-ഡിമാൻഡ് സാദ്ധ്യതയുള്ള ഒരു ലളിതമായ കേസ് ആണോ? കാലാവസ്ഥ മാറ്റം, കോളനി തകർച്ച തുടങ്ങിയ ഘടകങ്ങൾ കാരണം, വർഷം തോറും വാങ്ങാനുളള തേൻ കുറയുന്നുണ്ടോ, അതുകൊണ്ട് വില ഉയരുന്നുണ്ടോ? + +ഈ ഡാറ്റാസെറ്റിലെ ചില വേരിയബിളുകൾ തമ്മിലുള്ള സഹബന്ധം കണ്ടെത്താൻ, ചില ലൈൻ ചാർട്ടുകൾ പരിശോധിക്കാം. + +## ലൈൻ ചാർട്ടുകൾ + +ചോദ്യം: തേൻ പൗണ്ട് പ്രതി വില വർഷം തോറും വ്യക്തമായി ഉയരുന്നുണ്ടോ? ഇത് കണ്ടെത്താൻ ഏറ്റവും എളുപ്പം ഒരു സിംപിൾ ലൈൻ ചാർട്ട് സൃഷ്ടിക്കുക: + +```r +qplot(honey$year,honey$priceperlb, geom='smooth', span =0.5, xlab = "year",ylab = "priceperlb") +``` +ഉത്തരം: ചില ഒഴിവുകൾ കൂടെ, 2003-ൽ ചില വ്യത്യാസങ്ങൾ കാണാം: + +![line chart 1](../../../../../translated_images/line1.299b576fbb2a59e60a59e7130030f59836891f90302be084e4e8d14da0562e2a.ml.png) + +ചോദ്യം: 2003-ൽ തേൻ സപ്ലൈയിൽ ഒരു പീക്ക് കാണാമോ? മൊത്തം ഉത്പാദനം വർഷം തോറും നോക്കിയാൽ? + +```python +qplot(honey$year,honey$totalprod, geom='smooth', span =0.5, xlab = "year",ylab = "totalprod") +``` + +![line chart 2](../../../../../translated_images/line2.3b18fcda7176ceba5b6689eaaabb817d49c965e986f11cac1ae3f424030c34d8.ml.png) + +ഉത്തരം: അത്രയുമല്ല. മൊത്തം ഉത്പാദനം ആ വർഷം വർദ്ധിച്ചിട്ടുണ്ടെന്ന് തോന്നുന്നു, എങ്കിലും സാധാരണയായി ഈ വർഷങ്ങളിൽ തേൻ ഉത്പാദനം കുറയുകയാണ്. + +ചോദ്യം: അപ്പോൾ 2003-ൽ തേൻ വിലയിൽ ഉണ്ടായ പീക്ക് എന്തുകൊണ്ടാണ്? + +ഇത് കണ്ടെത്താൻ, ഫേസറ്റ് ഗ്രിഡ് പരിശോധിക്കാം. + +## ഫേസറ്റ് ഗ്രിഡുകൾ + +ഫേസറ്റ് ഗ്രിഡുകൾ നിങ്ങളുടെ ഡാറ്റാസെറ്റിന്റെ ഒരു ഫേസറ്റ് (ഇവിടെ 'year' തിരഞ്ഞെടുക്കാം, വളരെ ഫേസറ്റുകൾ ഉണ്ടാകാതിരിക്കാൻ) എടുത്ത്, ഓരോ ഫേസറ്റിനും x, y കോർഡിനേറ്റുകൾ ഉപയോഗിച്ച് പ്ലോട്ടുകൾ സൃഷ്ടിക്കുന്നു, എളുപ്പത്തിൽ താരതമ്യം ചെയ്യാൻ. 2003 ഈ താരതമ്യത്തിൽ വ്യത്യസ്തമാണോ? + +[ggplot2-യുടെ ഡോക്യുമെന്റേഷൻ](https://ggplot2.tidyverse.org/reference/facet_wrap.html) പ്രകാരം `facet_wrap` ഉപയോഗിച്ച് ഫേസറ്റ് ഗ്രിഡ് സൃഷ്ടിക്കുക. + +```r +ggplot(honey, aes(x=yieldpercol, y = numcol,group = 1)) + + geom_line() + facet_wrap(vars(year)) +``` +ഈ ദൃശ്യവൽക്കരണത്തിൽ, കോളനി പ്രതി ഉത്പാദനവും കോളനികളുടെ എണ്ണവും വർഷം തോറും, 3 കോളങ്ങൾ വച്ച് വച്ച് താരതമ്യം ചെയ്യാം: + +![facet grid](../../../../../translated_images/facet.491ad90d61c2a7cc69b50c929f80786c749e38217ccedbf1e22ed8909b65987c.ml.png) + +ഈ ഡാറ്റാസെറ്റിൽ, കോളനികളുടെ എണ്ണം, അവയുടെ ഉത്പാദനം വർഷം തോറും, സംസ്ഥാനങ്ങൾ അനുസരിച്ച് പ്രത്യേകമായ ഒന്നും കാണാനില്ല. ഈ രണ്ട് വേരിയബിളുകൾ തമ്മിൽ സഹബന്ധം കണ്ടെത്താൻ മറ്റൊരു മാർഗ്ഗമുണ്ടോ? + +## ഡ്യുവൽ-ലൈൻ പ്ലോട്ടുകൾ + +R-ന്റെ `par`യും `plot`ഉം ഉപയോഗിച്ച് രണ്ട് ലൈൻ പ്ലോട്ടുകൾ ഒരുമിച്ച് സൂപ്പറിംപോസ് ചെയ്ത് മൾട്ടി-ലൈൻ പ്ലോട്ട് പരീക്ഷിക്കുക. x അക്ഷത്തിൽ വർഷം, y അക്ഷത്തിൽ രണ്ട് അക്ഷങ്ങൾ പ്രദർശിപ്പിക്കുക. കോളനി പ്രതി ഉത്പാദനവും കോളനികളുടെ എണ്ണവും സൂപ്പറിംപോസ് ചെയ്ത് കാണിക്കുക: + +```r +par(mar = c(5, 4, 4, 4) + 0.3) +plot(honey$year, honey$numcol, pch = 16, col = 2,type="l") +par(new = TRUE) +plot(honey$year, honey$yieldpercol, pch = 17, col = 3, + axes = FALSE, xlab = "", ylab = "",type="l") +axis(side = 4, at = pretty(range(y2))) +mtext("colony yield", side = 4, line = 3) +``` +![superimposed plots](../../../../../translated_images/dual-line.fc4665f360a54018d7df9bc6abcc26460112e17dcbda18d3b9ae6109b32b36c3.ml.png) + +2003-ൽ പ്രത്യേകമായി ഒന്നും കാണാനില്ലെങ്കിലും, ഈ പാഠം ഒരു സന്തോഷകരമായ നോട്ടിൽ അവസാനിപ്പിക്കാൻ സഹായിക്കുന്നു: മൊത്തം കോളനികളുടെ എണ്ണം കുറയുന്നുണ്ടെങ്കിലും, അവയുടെ എണ്ണം സ്ഥിരതയുള്ളതും, കോളനി പ്രതി ഉത്പാദനം കുറയുന്നുണ്ടെങ്കിലും. + +പോകൂ, തേൻതട്ടികൾ, പോകൂ! + +🐝❤️ +## 🚀 ചലഞ്ച് + +ഈ പാഠത്തിൽ, സ്‌കാറ്റർപ്ലോട്ടുകളും ലൈൻ ഗ്രിഡുകളും, ഫേസറ്റ് ഗ്രിഡുകളും ഉൾപ്പെടെ മറ്റു ഉപയോഗങ്ങൾ കുറച്ച് പഠിച്ചു. മറ്റൊരു ഡാറ്റാസെറ്റ് ഉപയോഗിച്ച് ഫേസറ്റ് ഗ്രിഡ് സൃഷ്ടിക്കാൻ ശ്രമിക്കുക, മുൻപുള്ള പാഠങ്ങളിൽ ഉപയോഗിച്ച ഡാറ്റാസെറ്റ് ആയിരിക്കാം. എത്ര സമയം എടുക്കുന്നു, എത്ര ഗ്രിഡുകൾ വരയ്ക്കേണ്ടിവരുന്നു എന്നതിൽ ശ്രദ്ധിക്കുക. + +## [പോസ്റ്റ്-ലെക്ചർ ക്വിസ്](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/23) + +## അവലോകനം & സ്വയം പഠനം + +ലൈൻ പ്ലോട്ടുകൾ ലളിതമായതോ സങ്കീർണ്ണമായതോ ആകാം. [ggplot2 ഡോക്യുമെന്റേഷൻ](https://ggplot2.tidyverse.org/reference/geom_path.html#:~:text=geom_line()%20connects%20them%20in,which%20cases%20are%20connected%20together) വായിച്ച് വിവിധ രീതികൾ പഠിക്കൂ. ഈ പാഠത്തിൽ നിർമ്മിച്ച ലൈൻ ചാർട്ടുകൾ മറ്റ് രീതികളാൽ മെച്ചപ്പെടുത്താൻ ശ്രമിക്കൂ. + +## അസൈൻമെന്റ് + +[തേൻതട്ടിയിൽ ഡൈവ് ചെയ്യുക](assignment.md) + +--- + + +**അസൂയാ**: +ഈ രേഖ AI വിവർത്തന സേവനം [Co-op Translator](https://github.com/Azure/co-op-translator) ഉപയോഗിച്ച് വിവർത്തനം ചെയ്തതാണ്. നാം കൃത്യതയ്ക്ക് ശ്രമിച്ചിട്ടുണ്ടെങ്കിലും, സ്വയം പ്രവർത്തിക്കുന്ന വിവർത്തനങ്ങളിൽ പിശകുകൾ അല്ലെങ്കിൽ തെറ്റുകൾ ഉണ്ടാകാമെന്ന് ദയവായി ശ്രദ്ധിക്കുക. അതിന്റെ മാതൃഭാഷയിലുള്ള യഥാർത്ഥ രേഖ അധികാരപരമായ ഉറവിടമായി കണക്കാക്കപ്പെടണം. നിർണായകമായ വിവരങ്ങൾക്ക്, പ്രൊഫഷണൽ മനുഷ്യ വിവർത്തനം ശുപാർശ ചെയ്യപ്പെടുന്നു. ഈ വിവർത്തനം ഉപയോഗിക്കുന്നതിൽ നിന്നുണ്ടാകുന്ന ഏതെങ്കിലും തെറ്റിദ്ധാരണകൾക്കോ തെറ്റായ വ്യാഖ്യാനങ്ങൾക്കോ ഞങ്ങൾ ഉത്തരവാദികളല്ല. + \ No newline at end of file diff --git a/translations/ml/3-Data-Visualization/R/13-meaningful-vizualizations/README.md b/translations/ml/3-Data-Visualization/R/13-meaningful-vizualizations/README.md new file mode 100644 index 00000000..4259a8d0 --- /dev/null +++ b/translations/ml/3-Data-Visualization/R/13-meaningful-vizualizations/README.md @@ -0,0 +1,185 @@ + +# അർത്ഥവത്തായ ദൃശ്യവത്കരണങ്ങൾ നിർമ്മിക്കൽ + +|![ Sketchnote by [(@sketchthedocs)](https://sketchthedocs.dev) ](../../../sketchnotes/13-MeaningfulViz.png)| +|:---:| +| അർത്ഥവത്തായ ദൃശ്യവത്കരണങ്ങൾ - _Sketchnote by [@nitya](https://twitter.com/nitya)_ | + +> "നിങ്ങൾ ഡാറ്റയെ മതിയായ സമയം പീഡിപ്പിച്ചാൽ, അത് എന്തിനും സമ്മതിക്കും" -- [Ronald Coase](https://en.wikiquote.org/wiki/Ronald_Coase) + +ഒരു ഡാറ്റ സയന്റിസ്റ്റിന്റെ അടിസ്ഥാന കഴിവുകളിൽ ഒന്നാണ് നിങ്ങൾക്കുണ്ടാകാവുന്ന ചോദ്യങ്ങൾക്ക് ഉത്തരം നൽകാൻ സഹായിക്കുന്ന അർത്ഥവത്തായ ഡാറ്റാ ദൃശ്യവത്കരണം സൃഷ്ടിക്കാൻ കഴിയുക. നിങ്ങളുടെ ഡാറ്റ ദൃശ്യവത്കരിക്കുന്നതിന് മുമ്പ്, അത് മുൻപത്തെ പാഠങ്ങളിൽ ചെയ്തതുപോലെ ശുദ്ധീകരിക്കുകയും തയ്യാറാക്കുകയും ചെയ്തിട്ടുണ്ടെന്ന് ഉറപ്പാക്കണം. അതിനുശേഷം, ഡാറ്റ എങ്ങനെ മികച്ച രീതിയിൽ അവതരിപ്പിക്കാമെന്ന് തീരുമാനിക്കാം. + +ഈ പാഠത്തിൽ, നിങ്ങൾ അവലോകനം ചെയ്യും: + +1. ശരിയായ ചാർട്ട് തരം എങ്ങനെ തിരഞ്ഞെടുക്കാം +2. വഞ്ചനാപരമായ ചാർട്ടിംഗ് ഒഴിവാക്കാൻ എങ്ങനെ +3. നിറവുമായി എങ്ങനെ പ്രവർത്തിക്കാം +4. വായനാസൗകര്യത്തിനായി നിങ്ങളുടെ ചാർട്ടുകൾ എങ്ങനെ സ്റ്റൈൽ ചെയ്യാം +5. അനിമേറ്റഡ് അല്ലെങ്കിൽ 3D ചാർട്ടിംഗ് പരിഹാരങ്ങൾ എങ്ങനെ നിർമ്മിക്കാം +6. സൃഷ്ടിപരമായ ഒരു ദൃശ്യവത്കരണം എങ്ങനെ നിർമ്മിക്കാം + +## [പ്രീ-ലെക്ചർ ക്വിസ്](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/24) + +## ശരിയായ ചാർട്ട് തരം തിരഞ്ഞെടുക്കുക + +മുൻപത്തെ പാഠങ്ങളിൽ, Matplotlib, Seaborn എന്നിവ ഉപയോഗിച്ച് വിവിധ തരം രസകരമായ ഡാറ്റാ ദൃശ്യവത്കരണങ്ങൾ നിർമ്മിക്കാൻ നിങ്ങൾ പരീക്ഷിച്ചു. സാധാരണയായി, നിങ്ങൾ ചോദിക്കുന്ന ചോദ്യത്തിന് അനുയോജ്യമായ [ശരിയായ ചാർട്ട് തരം](https://chartio.com/learn/charts/how-to-select-a-data-vizualization/) ഈ പട്ടിക ഉപയോഗിച്ച് തിരഞ്ഞെടുക്കാം: + +| നിങ്ങൾ ചെയ്യേണ്ടത്: | നിങ്ങൾ ഉപയോഗിക്കേണ്ടത്: | +| -------------------------- | ------------------------------- | +| സമയാനുസൃത ഡാറ്റ ട്രെൻഡുകൾ കാണിക്കുക | ലൈൻ | +| വിഭാഗങ്ങൾ താരതമ്യം ചെയ്യുക | ബാർ, പൈ | +| മൊത്തം താരതമ്യം ചെയ്യുക | പൈ, സ്റ്റാക്ക് ബാർ | +| ബന്ധങ്ങൾ കാണിക്കുക | സ്കാറ്റർ, ലൈൻ, ഫേസറ്റ്, ഡ്യുവൽ ലൈൻ | +| വിതരണങ്ങൾ കാണിക്കുക | സ്കാറ്റർ, ഹിസ്റ്റോഗ്രാം, ബോക്സ് | +| അനുപാതങ്ങൾ കാണിക്കുക | പൈ, ഡോണട്ട്, വാഫിൾ | + +> ✅ നിങ്ങളുടെ ഡാറ്റയുടെ ഘടന അനുസരിച്ച്, ഒരു നൽകിയ ചാർട്ട് പിന്തുണയ്ക്കാൻ അത് ടെക്സ്റ്റിൽ നിന്ന് സംഖ്യാത്മകത്തിലേക്ക് മാറ്റേണ്ടിവരാം. + +## വഞ്ചന ഒഴിവാക്കുക + +ഒരു ഡാറ്റ സയന്റിസ്റ്റ് ശരിയായ ഡാറ്റയ്ക്ക് ശരിയായ ചാർട്ട് തിരഞ്ഞെടുക്കാൻ ശ്രദ്ധിച്ചാലും, ഡാറ്റയെ തന്നെ തകർക്കുന്ന വിധത്തിൽ ഒരു കാര്യം തെളിയിക്കാൻ ഡാറ്റ പ്രദർശിപ്പിക്കുന്ന നിരവധി മാർഗ്ഗങ്ങൾ ഉണ്ട്. വഞ്ചനാപരമായ ചാർട്ടുകളും ഇൻഫോഗ്രാഫിക്സും നിരവധി ഉദാഹരണങ്ങളുണ്ട്! + +[![How Charts Lie by Alberto Cairo](../../../../../translated_images/tornado.2880ffc7f135f82b5e5328624799010abefd1080ae4b7ecacbdc7d792f1d8849.ml.png)](https://www.youtube.com/watch?v=oX74Nge8Wkw "How charts lie") + +> 🎥 വഞ്ചനാപരമായ ചാർട്ടുകൾക്കുറിച്ചുള്ള കോൺഫറൻസ് ടോക്കിനായി മുകളിൽ ചിത്രത്തിൽ ക്ലിക്ക് ചെയ്യുക + +ഈ ചാർട്ട് X അക്ഷം മറിച്ച് സത്യം മറിച്ച് കാണിക്കുന്നു, തീയതി അടിസ്ഥാനമാക്കി: + +![bad chart 1](../../../../../translated_images/bad-chart-1.596bc93425a8ac301a28b8361f59a970276e7b961658ce849886aa1fed427341.ml.png) + +[ഈ ചാർട്ട്](https://media.firstcoastnews.com/assets/WTLV/images/170ae16f-4643-438f-b689-50d66ca6a8d8/170ae16f-4643-438f-b689-50d66ca6a8d8_1140x641.jpg) കൂടുതൽ വഞ്ചനാപരമാണ്, കാരണം കണ്ണ് വലത്തേക്ക് ആകർഷിക്കപ്പെടുന്നു, കാലക്രമത്തിൽ COVID കേസുകൾ വിവിധ കൗണ്ടികളിൽ കുറയുകയാണെന്ന് നിഗമനം ചെയ്യാൻ. എന്നാൽ, തീയതികൾ സൂക്ഷ്മമായി നോക്കിയാൽ, അവ വഞ്ചനാപരമായ താഴ്ന്ന ട്രെൻഡ് നൽകാൻ പുനഃക്രമീകരിച്ചിട്ടുള്ളതായി കാണാം. + +![bad chart 2](../../../../../translated_images/bad-chart-2.62edf4d2f30f4e519f5ef50c07ce686e27b0196a364febf9a4d98eecd21f9f60.ml.jpg) + +ഈ പ്രശസ്ത ഉദാഹരണം നിറവും മറിച്ച Y അക്ഷവും ഉപയോഗിച്ച് വഞ്ചന ചെയ്യുന്നു: തോക്കു-സഹായക നിയമം പാസായതിന് ശേഷം തോക്ക് മരണങ്ങൾ ഉയർന്നതായി നിഗമനം ചെയ്യേണ്ടതിനു പകരം, കണ്ണ് മറിച്ച് സത്യം തെറ്റായി കാണുന്നു: + +![bad chart 3](../../../../../translated_images/bad-chart-3.e201e2e915a230bc2cde289110604ec9abeb89be510bd82665bebc1228258972.ml.jpg) + +ഈ വിചിത്രമായ ചാർട്ട് അനുപാതം എങ്ങനെ മാനിപ്പുലേറ്റ് ചെയ്യാമെന്ന് ഹാസ്യകരമായി കാണിക്കുന്നു: + +![bad chart 4](../../../../../translated_images/bad-chart-4.8872b2b881ffa96c3e0db10eb6aed7793efae2cac382c53932794260f7bfff07.ml.jpg) + +തുല്യമായവയെ താരതമ്യം ചെയ്യുന്നത് മറ്റൊരു സംശയാസ്പദമായ തന്ത്രമാണ്. 'സ്പ്യൂറിയസ് കോറിലേഷൻസ്' എന്ന വിഷയത്തെക്കുറിച്ച് മുഴുവൻ വെബ്‌സൈറ്റ് [wonderful web site](https://tylervigen.com/spurious-correlations) ഉണ്ട്, മെയ്ൻയിലെ വിവാഹമോചന നിരക്കും മാർഗറിൻ ഉപഭോഗവും തമ്മിലുള്ള 'തथ്യങ്ങൾ' correlated ആയി പ്രദർശിപ്പിക്കുന്നു. Reddit ഗ്രൂപ്പ് ഡാറ്റയുടെ [അസൗന്ദര്യ ഉപയോഗങ്ങൾ](https://www.reddit.com/r/dataisugly/top/?t=all) ശേഖരിക്കുന്നു. + +വഞ്ചനാപരമായ ചാർട്ടുകൾ കണ്ണിനെ എളുപ്പത്തിൽ എങ്ങനെ വഞ്ചിക്കാമെന്ന് മനസ്സിലാക്കുന്നത് പ്രധാനമാണ്. ഡാറ്റ സയന്റിസ്റ്റിന്റെ ഉദ്ദേശ്യം നല്ലതായാലും, പൈ ചാർട്ട് പോലുള്ള തെറ്റായ തരം തിരഞ്ഞെടുക്കുന്നത്, അതിൽ വളരെ അധികം വിഭാഗങ്ങൾ കാണിക്കുന്നത്, വഞ്ചനാപരമായിരിക്കാം. + +## നിറം + +മുകളിൽ 'ഫ്ലോറിഡ ഗൺ വയലൻസ്' ചാർട്ടിൽ നിങ്ങൾ കണ്ടതുപോലെ, നിറം ചാർട്ടുകൾക്ക് അധിക അർത്ഥം നൽകാൻ സഹായിക്കുന്നു, പ്രത്യേകിച്ച് ggplot2, RColorBrewer പോലുള്ള ലൈബ്രറികൾ ഉപയോഗിക്കാതെ നിർമ്മിച്ച ചാർട്ടുകളിൽ. നിങ്ങൾ കൈകൊണ്ട് ഒരു ചാർട്ട് നിർമ്മിക്കുമ്പോൾ, [നിറ സിദ്ധാന്തം](https://colormatters.com/color-and-design/basic-color-theory) കുറച്ച് പഠിക്കുക. + +> ✅ ചാർട്ടുകൾ രൂപകൽപ്പന ചെയ്യുമ്പോൾ, ആക്സസിബിലിറ്റി ഒരു പ്രധാന ഘടകമാണെന്ന് ശ്രദ്ധിക്കുക. നിങ്ങളുടെ ചില ഉപയോക്താക്കൾക്ക് നിറം കാണാനാകാതെ പോകാം - നിങ്ങളുടെ ചാർട്ട് ദൃശ്യ വൈകല്യമുള്ള ഉപയോക്താക്കൾക്ക് നന്നായി കാണുന്നുണ്ടോ? + +നിങ്ങളുടെ ചാർട്ടിനായി നിറങ്ങൾ തിരഞ്ഞെടുക്കുമ്പോൾ ശ്രദ്ധിക്കുക, കാരണം നിറം നിങ്ങൾ ഉദ്ദേശിക്കുന്നതിൽ വ്യത്യസ്തമായ അർത്ഥം നൽകാം. മുകളിൽ 'ഉയരം' ചാർട്ടിലെ 'പിങ്ക് ലേഡീസ്' ഒരു വ്യക്തമായ 'സ്ത്രീലിംഗ' അർത്ഥം നൽകുന്നു, ഇത് ചാർട്ടിന്റെ വിചിത്രതയിൽ കൂടി കൂട്ടിച്ചേർക്കുന്നു. + +[നിറത്തിന്റെ അർത്ഥം](https://colormatters.com/color-symbolism/the-meanings-of-colors) ലോകത്തിന്റെ വിവിധ ഭാഗങ്ങളിൽ വ്യത്യസ്തമായിരിക്കാം, കൂടാതെ അവയുടെ ഷേഡിന്റെ അടിസ്ഥാനത്തിൽ അർത്ഥം മാറാം. പൊതുവെ, നിറങ്ങളുടെ അർത്ഥങ്ങൾ ഉൾപ്പെടുന്നു: + +| നിറം | അർത്ഥം | +| ------ | -------------------- | +| ചുവപ്പ് | ശക്തി | +| നീലം | വിശ്വാസം, വിശ്വസ്തത | +| മഞ്ഞ | സന്തോഷം, ജാഗ്രത | +| പച്ച | പരിസ്ഥിതി, ഭാഗ്യം, ഇർഷ്യ | +| പർപ്പിൾ | സന്തോഷം | +| ഓറഞ്ച് | ഉജ്ജ്വലത | + +നിങ്ങൾക്ക് കസ്റ്റം നിറങ്ങളുള്ള ഒരു ചാർട്ട് നിർമ്മിക്കേണ്ടതുണ്ടെങ്കിൽ, നിങ്ങളുടെ ചാർട്ടുകൾ ആക്സസിബിൾ ആണെന്ന് ഉറപ്പാക്കുക, കൂടാതെ നിങ്ങൾ തിരഞ്ഞെടുക്കുന്ന നിറം നിങ്ങൾ നൽകാൻ ശ്രമിക്കുന്ന അർത്ഥത്തോട് പൊരുത്തപ്പെടുന്നു. + +## വായനാസൗകര്യത്തിനായി നിങ്ങളുടെ ചാർട്ടുകൾ സ്റ്റൈൽ ചെയ്യുക + +ചാർട്ടുകൾ വായിക്കാൻ കഴിയാത്ത പക്ഷം അർത്ഥവത്തായിരിക്കില്ല! നിങ്ങളുടെ ഡാറ്റയ്ക്ക് അനുസരിച്ച് ചാർട്ടിന്റെ വീതി, ഉയരം എന്നിവ സ്റ്റൈൽ ചെയ്യാൻ ഒരു നിമിഷം ചെലവഴിക്കുക. ഒരു വേരിയബിൾ (ഉദാ: എല്ലാ 50 സംസ്ഥാനങ്ങളും) പ്രദർശിപ്പിക്കേണ്ടതുണ്ടെങ്കിൽ, സാധ്യമായെങ്കിൽ Y അക്ഷത്തിൽ ലംബമായി കാണിക്കുക, അതിനാൽ കൂറ്റൻ ഹോരിസോണ്ടൽ സ്ക്രോൾ ചെയ്യേണ്ടി വരാതിരിക്കും. + +നിങ്ങളുടെ അക്ഷങ്ങൾ ലേബൽ ചെയ്യുക, ആവശ്യമെങ്കിൽ ലെജൻഡ് നൽകുക, ഡാറ്റയുടെ മികച്ച മനസ്സിലാക്കലിനായി ടൂൾടിപ്പുകൾ നൽകുക. + +നിങ്ങളുടെ ഡാറ്റ ടെക്സ്റ്റ് ആണെങ്കിൽ, X അക്ഷ上的 വാചകം വായനാസൗകര്യത്തിനായി കോണിൽ കാണിക്കാം. [plot3D](https://cran.r-project.org/web/packages/plot3D/index.html) 3D പ്ലോട്ടിംഗ് നൽകുന്നു, നിങ്ങളുടെ ഡാറ്റ അത് പിന്തുണച്ചാൽ. അതുപയോഗിച്ച് സങ്കീർണ്ണമായ ഡാറ്റാ ദൃശ്യവത്കരണങ്ങൾ നിർമ്മിക്കാം. + +![3d plots](../../../../../translated_images/3d.db1734c151eee87d924989306a00e23f8cddac6a0aab122852ece220e9448def.ml.png) + +## അനിമേഷൻ, 3D ചാർട്ട് പ്രദർശനം + +ഇന്നത്തെ മികച്ച ഡാറ്റാ ദൃശ്യവത്കരണങ്ങളിൽ ചിലത് അനിമേറ്റഡ് ആണ്. Shirley Wu D3 ഉപയോഗിച്ച് '[film flowers](http://bl.ocks.org/sxywu/raw/d612c6c653fb8b4d7ff3d422be164a5d/)' പോലുള്ള അത്ഭുതകരമായവ ഉണ്ടാക്കി, ഓരോ പൂവും ഒരു സിനിമയുടെ ദൃശ്യവത്കരണമാണ്. Guardian-നായി മറ്റൊരു ഉദാഹരണം 'bussed out' ആണ്, Greensock, D3 എന്നിവയുമായി സംയോജിപ്പിച്ച ഇന്ററാക്ടീവ് അനുഭവം, സ്ക്രോൾടെല്ലിംഗ് ലേഖന ഫോർമാറ്റിൽ NYC എങ്ങനെ നഗരത്തിലെ ഹോമ്ലെസ്സ് പ്രശ്നം ബസ്സിലൂടെ പുറത്തേക്ക് കൊണ്ടുപോകുന്നു എന്ന് കാണിക്കുന്നു. + +![busing](../../../../../translated_images/busing.8157cf1bc89a3f65052d362a78c72f964982ceb9dcacbe44480e35909c3dce62.ml.png) + +> "Bussed Out: How America Moves its Homeless" from [the Guardian](https://www.theguardian.com/us-news/ng-interactive/2017/dec/20/bussed-out-america-moves-homeless-people-country-study). Visualizations by Nadieh Bremer & Shirley Wu + +ഈ പാഠം ഈ ശക്തമായ ദൃശ്യവത്കരണ ലൈബ്രറികൾ പഠിപ്പിക്കാൻ മതിയാകാത്തതിനാൽ, Vue.js ആപ്പിൽ D3 ഉപയോഗിച്ച് "Dangerous Liaisons" എന്ന പുസ്തകത്തിന്റെ അനിമേറ്റഡ് സോഷ്യൽ നെറ്റ്‌വർക്ക് ദൃശ്യവത്കരണം പ്രദർശിപ്പിക്കാൻ ശ്രമിക്കുക. + +> "Les Liaisons Dangereuses" ഒരു കത്ത് നോവലാണ്, അഥവാ കത്തുകളുടെ ഒരു പരമ്പരയായി അവതരിപ്പിച്ച നോവൽ. 1782-ൽ Choderlos de Laclos എഴുതിയ ഇത് ഫ്രഞ്ച് അരിപ്പ്രതിഷ്ഠിതരുടെ രണ്ട് മുഖ്യ കഥാപാത്രങ്ങളായ Vicomte de Valmont, Marquise de Merteuil എന്നിവരുടെ ക്രൂരവും നൈതികമായി തകർന്ന സാമൂഹിക തന്ത്രങ്ങളുടെ കഥ പറയുന്നു. ഇരുവരും അവസാനം മരണപ്പെടുന്നു, പക്ഷേ വലിയ സാമൂഹിക നാശം സൃഷ്ടിച്ചുകൊണ്ട്. നോവൽ അവരുടെ വൃത്തങ്ങളിൽ വിവിധ ആളുകൾക്ക് എഴുതിയ കത്തുകളുടെ പരമ്പരയായി തുറക്കുന്നു, പ്രതികാരം ചെയ്യാനോ പ്രശ്നങ്ങൾ സൃഷ്ടിക്കാനോ. ഈ കത്തുകളുടെ ദൃശ്യവത്കരണം സൃഷ്ടിച്ച് കഥയിലെ പ്രധാന കഥാപാത്രങ്ങളെ ദൃശ്യമായി കണ്ടെത്തുക. + +നിങ്ങൾ ഒരു വെബ് ആപ്പ് പൂർത്തിയാക്കും, ഇത് ഈ സോഷ്യൽ നെറ്റ്‌വർക്ക് അനിമേറ്റഡ് ദൃശ്യവത്കരണം പ്രദർശിപ്പിക്കും. ഇത് Vue.js, D3 ഉപയോഗിച്ച് [നെറ്റ്‌വർക്ക് ദൃശ്യവത്കരണം](https://github.com/emiliorizzo/vue-d3-network) സൃഷ്ടിക്കാൻ നിർമ്മിച്ച ഒരു ലൈബ്രറി ഉപയോഗിക്കുന്നു. ആപ്പ് പ്രവർത്തിക്കുമ്പോൾ, സ്ക്രീനിൽ നോഡുകൾ നീക്കി ഡാറ്റ മാറ്റാം. + +![liaisons](../../../../../translated_images/liaisons.90ce7360bcf8476558f700bbbaf198ad697d5b5cb2829ba141a89c0add7c6ecd.ml.png) + +## പ്രോജക്ട്: D3.js ഉപയോഗിച്ച് ഒരു നെറ്റ്‌വർക്ക് കാണിക്കുന്ന ചാർട്ട് നിർമ്മിക്കുക + +> ഈ പാഠം ഫോൾഡറിൽ `solution` ഫോൾഡർ ഉൾപ്പെടുന്നു, അവിടെ പൂർത്തിയായ പ്രോജക്ട് നിങ്ങളുടെ റഫറൻസിനായി ലഭ്യമാണ്. + +1. സ്റ്റാർട്ടർ ഫോൾഡറിന്റെ റൂട്ടിലുള്ള README.md ഫയലിലെ നിർദ്ദേശങ്ങൾ പിന്തുടരുക. നിങ്ങളുടെ മെഷീനിൽ NPM, Node.js പ്രവർത്തിക്കുന്നുണ്ടെന്ന് ഉറപ്പാക്കുക, തുടർന്ന് പ്രോജക്ടിന്റെ ഡിപ്പൻഡൻസികൾ ഇൻസ്റ്റാൾ ചെയ്യുക. + +2. `starter/src` ഫോൾഡർ തുറക്കുക. അവിടെ ഒരു `assets` ഫോൾഡർ കാണും, അതിൽ നോവലിലെ എല്ലാ കത്തുകളും നമ്പർ ചെയ്തും 'to' 'from' അനോട്ടേഷനോടും ഉള്ള .json ഫയൽ കാണാം. + +3. `components/Nodes.vue`-ൽ കോഡ് പൂർത്തിയാക്കുക, ദൃശ്യവത്കരണം സജ്ജമാക്കാൻ. `createLinks()` എന്ന മെത്തഡ് കണ്ടെത്തി താഴെ കൊടുത്ത നസ്റ്റഡ് ലൂപ്പ് ചേർക്കുക. + +.json ഒബ്ജക്റ്റിൽ 'to' 'from' ഡാറ്റ പിടിച്ച് `links` ഒബ്ജക്റ്റ് നിർമ്മിക്കുക, ദൃശ്യവത്കരണ ലൈബ്രറി അത് ഉപയോഗിക്കാനായി: + +```javascript +//അക്ഷരങ്ങളിലൂടെ ലൂപ്പ് ചെയ്യുക + let f = 0; + let t = 0; + for (var i = 0; i < letters.length; i++) { + for (var j = 0; j < characters.length; j++) { + + if (characters[j] == letters[i].from) { + f = j; + } + if (characters[j] == letters[i].to) { + t = j; + } + } + this.links.push({ sid: f, tid: t }); + } + ``` + + +ടെർമിനലിൽ നിന്ന് നിങ്ങളുടെ ആപ്പ് ഓടിക്കുക (npm run serve) ദൃശ്യവത്കരണം ആസ്വദിക്കുക! + +## 🚀 ചലഞ്ച് + +ഇന്റർനെറ്റിൽ വഞ്ചനാപരമായ ദൃശ്യവത്കരണങ്ങൾ കണ്ടെത്താൻ ഒരു യാത്ര നടത്തുക. എഴുത്തുകാരൻ ഉപയോക്താവിനെ എങ്ങനെ വഞ്ചിക്കുന്നു, അത് ഉദ്ദേശിച്ചിട്ടുള്ളതാണോ? ദൃശ്യവത്കരണങ്ങൾ ശരിയാക്കാൻ ശ്രമിക്കുക, അവ എങ്ങനെ കാണിക്കേണ്ടതാണെന്ന് കാണിക്കാൻ. + +## [പോസ്റ്റ്-ലെക്ചർ ക്വിസ്](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/25) + +## അവലോകനം & സ്വയം പഠനം + +വഞ്ചനാപരമായ ഡാറ്റാ ദൃശ്യവത്കരണത്തെക്കുറിച്ച് വായിക്കാനുള്ള ചില ലേഖനങ്ങൾ: + +https://gizmodo.com/how-to-lie-with-data-visualization-1563576606 + +http://ixd.prattsi.org/2017/12/visual-lies-usability-in-deceptive-data-visualizations/ + +ചരിത്ര ആസ്തികളും വസ്തുക്കളും സംബന്ധിച്ച രസകരമായ ദൃശ്യവത്കരണങ്ങൾ കാണുക: + +https://handbook.pubpub.org/ + +അനിമേഷൻ നിങ്ങളുടെ ദൃശ്യവത്കരണങ്ങൾ എങ്ങനെ മെച്ചപ്പെടുത്താമെന്ന് ഈ ലേഖനം കാണുക: + +https://medium.com/@EvanSinar/use-animation-to-supercharge-data-visualization-cd905a882ad4 + +## അസൈൻമെന്റ് + +[നിങ്ങളുടെ സ്വന്തം കസ്റ്റം ദൃശ്യവത്കരണം നിർമ്മിക്കുക](assignment.md) + +--- + + +**അസൂയാ**: +ഈ രേഖ AI വിവർത്തന സേവനം [Co-op Translator](https://github.com/Azure/co-op-translator) ഉപയോഗിച്ച് വിവർത്തനം ചെയ്തതാണ്. നാം കൃത്യതയ്ക്ക് ശ്രമിച്ചിട്ടുണ്ടെങ്കിലും, സ്വയം പ്രവർത്തിക്കുന്ന വിവർത്തനങ്ങളിൽ പിശകുകൾ അല്ലെങ്കിൽ തെറ്റുകൾ ഉണ്ടാകാമെന്ന് ദയവായി ശ്രദ്ധിക്കുക. അതിന്റെ മാതൃഭാഷയിലുള്ള യഥാർത്ഥ രേഖയാണ് പ്രാമാണികമായ ഉറവിടം എന്ന് പരിഗണിക്കേണ്ടതാണ്. നിർണായകമായ വിവരങ്ങൾക്ക്, പ്രൊഫഷണൽ മനുഷ്യ വിവർത്തനം ശുപാർശ ചെയ്യപ്പെടുന്നു. ഈ വിവർത്തനം ഉപയോഗിക്കുന്നതിൽ നിന്നുണ്ടാകുന്ന ഏതെങ്കിലും തെറ്റിദ്ധാരണകൾക്കോ തെറ്റായ വ്യാഖ്യാനങ്ങൾക്കോ ഞങ്ങൾ ഉത്തരവാദികളല്ല. + \ No newline at end of file diff --git a/translations/ml/3-Data-Visualization/README.md b/translations/ml/3-Data-Visualization/README.md new file mode 100644 index 00000000..88110985 --- /dev/null +++ b/translations/ml/3-Data-Visualization/README.md @@ -0,0 +1,45 @@ + +# ദൃശ്യവത്കരണങ്ങൾ + +![a bee on a lavender flower](../../../translated_images/bee.0aa1d91132b12e3a8994b9ca12816d05ce1642010d9b8be37f8d37365ba845cf.ml.jpg) +> ഫോട്ടോ ജെന്ന ലി യുടെ അൺസ്പ്ലാഷിൽ നിന്നാണ് + + +ഡാറ്റാ സയന്റിസ്റ്റിന്റെ ഏറ്റവും പ്രധാനപ്പെട്ട ജോലികളിലൊന്നാണ് ഡാറ്റ ദൃശ്യവത്കരിക്കൽ. ചിത്രങ്ങൾ 1000 വാക്കുകൾക്ക് തുല്യമാണ്, ഒരു ദൃശ്യവത്കരണം നിങ്ങളുടെ ഡാറ്റയിലെ സ്പൈക്കുകൾ, ഔട്ട്‌ലൈയേഴ്സ്, ഗ്രൂപ്പിംഗുകൾ, പ്രവണതകൾ തുടങ്ങിയ വിവിധ രസകരമായ ഭാഗങ്ങൾ തിരിച്ചറിയാൻ സഹായിക്കും, ഇത് നിങ്ങളുടെ ഡാറ്റ പറയാൻ ശ്രമിക്കുന്ന കഥ മനസ്സിലാക്കാൻ സഹായിക്കും. + +ഈ അഞ്ചു പാഠങ്ങളിൽ, നിങ്ങൾ പ്രകൃതിയിൽ നിന്നുള്ള ഡാറ്റ പരിശോധിച്ച് വിവിധ സാങ്കേതിക വിദ്യകൾ ഉപയോഗിച്ച് രസകരവും മനോഹരവുമായ ദൃശ്യവത്കരണങ്ങൾ സൃഷ്ടിക്കും. + +| വിഷയം നമ്പർ | വിഷയം | ലിങ്കുചെയ്ത പാഠം | രചയിതാവ് | +| :-----------: | :--: | :-----------: | :----: | +| 1. | അളവുകൾ ദൃശ്യവത്കരിക്കൽ | | | +| 2. | വിതരണ ദൃശ്യവത്കരിക്കൽ | | | +| 3. | അനുപാതങ്ങൾ ദൃശ്യവത്കരിക്കൽ | | | +| 4. | ബന്ധങ്ങൾ ദൃശ്യവത്കരിക്കൽ | | | +| 5. | അർത്ഥപൂർണമായ ദൃശ്യവത്കരണങ്ങൾ സൃഷ്ടിക്കൽ | | | + +### ക്രെഡിറ്റുകൾ + +ഈ ദൃശ്യവത്കരണ പാഠങ്ങൾ 🌸 [ജെൻ ലൂപ്പർ](https://twitter.com/jenlooper), [ജസ്‌ലീൻ സോന്ധി](https://github.com/jasleen101010) , [വിദുഷി ഗുപ്ത](https://github.com/Vidushi-Gupta) എന്നിവരാൽ എഴുതപ്പെട്ടതാണ്. + +🍯 US ഹണി പ്രൊഡക്ഷൻ ഡാറ്റ ജെസിക്ക ലിയുടെ [Kaggle](https://www.kaggle.com/jessicali9530/honey-production) പ്രോജക്ടിൽ നിന്നാണ് ലഭിച്ചത്. [ഡാറ്റ](https://usda.library.cornell.edu/concern/publications/rn301137d) യുണൈറ്റഡ് സ്റ്റേറ്റ്സ് ഡിപ്പാർട്ട്മെന്റ് ഓഫ് അഗ്രിക്കൾച്ചർ [United States Department of Agriculture](https://www.nass.usda.gov/About_NASS/index.php) യിൽ നിന്നാണ് ലഭിച്ചത്. + +🍄 കൂൺമഷ്‌റൂം ഡാറ്റയും [Kaggle](https://www.kaggle.com/hatterasdunton/mushroom-classification-updated-dataset) യിൽ നിന്നാണ്, ഹാറ്ററാസ് ഡൺടൺ തിരുത്തിയതാണ്. ഈ ഡാറ്റാസെറ്റിൽ അഗാരിക്കസ്, ലെപിയോട്ട കുടുംബത്തിലെ 23 സ്പീഷീസുകളിലെ ഗില്ലഡ് കൂൺമഷ്‌റൂമുകളുടെ സങ്കൽപ്പിത സാമ്പിളുകളുടെ വിവരണങ്ങൾ ഉൾപ്പെടുന്നു. കൂൺമഷ്‌റൂം ദി ഓഡുബോൺ സൊസൈറ്റി ഫീൽഡ് ഗൈഡ് ടു നോർത്ത് അമേരിക്കൻ മഷ്‌റൂമ്സ് (1981) ൽ നിന്നാണ് വരച്ചത്. ഈ ഡാറ്റാസെറ്റ് 1987-ൽ UCI ML 27-ന് ദാനം ചെയ്തതാണ്. + +🦆 മിന്നസോട്ട ബേർഡ്‌സ് ഡാറ്റ [Kaggle](https://www.kaggle.com/hannahcollins/minnesota-birds) യിൽ നിന്നാണ്, ഹന്നാ കോളിൻസ് [Wikipedia](https://en.wikipedia.org/wiki/List_of_birds_of_Minnesota) യിൽ നിന്നുള്ള ഡാറ്റ സ്ക്രാപ്പ് ചെയ്തതാണ്. + +ഈ എല്ലാ ഡാറ്റാസെറ്റുകളും [CC0: Creative Commons](https://creativecommons.org/publicdomain/zero/1.0/) ലൈസൻസിൽ ലഭ്യമാണ്. + +--- + + +**അസൂയാ**: +ഈ രേഖ AI വിവർത്തന സേവനം [Co-op Translator](https://github.com/Azure/co-op-translator) ഉപയോഗിച്ച് വിവർത്തനം ചെയ്തതാണ്. നാം കൃത്യതയ്ക്ക് ശ്രമിച്ചെങ്കിലും, സ്വയം പ്രവർത്തിക്കുന്ന വിവർത്തനങ്ങളിൽ പിശകുകൾ അല്ലെങ്കിൽ തെറ്റുകൾ ഉണ്ടാകാമെന്ന് ദയവായി ശ്രദ്ധിക്കുക. അതിന്റെ മാതൃഭാഷയിലുള്ള യഥാർത്ഥ രേഖ പ്രാമാണികമായ ഉറവിടമായി കണക്കാക്കണം. നിർണായക വിവരങ്ങൾക്ക്, പ്രൊഫഷണൽ മനുഷ്യ വിവർത്തനം ശുപാർശ ചെയ്യപ്പെടുന്നു. ഈ വിവർത്തനത്തിന്റെ ഉപയോഗത്തിൽ നിന്നുണ്ടാകുന്ന ഏതെങ്കിലും തെറ്റിദ്ധാരണകൾക്കോ തെറ്റായ വ്യാഖ്യാനങ്ങൾക്കോ ഞങ്ങൾ ഉത്തരവാദികളല്ല. + \ No newline at end of file diff --git a/translations/ml/4-Data-Science-Lifecycle/14-Introduction/README.md b/translations/ml/4-Data-Science-Lifecycle/14-Introduction/README.md new file mode 100644 index 00000000..7eed28bb --- /dev/null +++ b/translations/ml/4-Data-Science-Lifecycle/14-Introduction/README.md @@ -0,0 +1,121 @@ + +# ഡാറ്റാ സയൻസ് ലൈഫ്‌സൈക്കിൾ പരിചയം + +|![ Sketchnote by [(@sketchthedocs)](https://sketchthedocs.dev) ](../../sketchnotes/14-DataScience-Lifecycle.png)| +|:---:| +| ഡാറ്റാ സയൻസ് ലൈഫ്‌സൈക്കിൾ പരിചയം - _Sketchnote by [@nitya](https://twitter.com/nitya)_ | + +## [പ്രീ-ലെക്ചർ ക്വിസ്](https://ff-quizzes.netlify.app/en/ds/quiz/26) + +ഇപ്പോൾ നിങ്ങൾക്ക് ഡാറ്റാ സയൻസ് ഒരു പ്രക്രിയയാണ് എന്ന് മനസ്സിലായിരിക്കാം. ഈ പ്രക്രിയ 5 ഘട്ടങ്ങളായി വിഭജിക്കാം: + +- പിടിച്ചെടുക്കൽ +- പ്രോസസ്സിംഗ് +- വിശകലനം +- ആശയവിനിമയം +- പരിപാലനം + +ഈ പാഠം ലൈഫ്‌സൈക്കിളിന്റെ 3 ഭാഗങ്ങളായ പിടിച്ചെടുക്കൽ, പ്രോസസ്സിംഗ്, പരിപാലനം എന്നിവയിൽ കേന്ദ്രീകരിക്കുന്നു. + +![Diagram of the data science lifecycle](../../../../translated_images/data-science-lifecycle.a1e362637503c4fb0cd5e859d7552edcdb4aa629a279727008baa121f2d33f32.ml.jpg) +> ഫോട്ടോ: [ബർക്ക്ലി സ്കൂൾ ഓഫ് ഇൻഫർമേഷൻ](https://ischoolonline.berkeley.edu/data-science/what-is-data-science/) + +## പിടിച്ചെടുക്കൽ + +ലൈഫ്‌സൈക്കിളിന്റെ ആദ്യ ഘട്ടം വളരെ പ്രധാനമാണ്, കാരണം അടുത്ത ഘട്ടങ്ങൾ ഇതിൽ ആശ്രയിച്ചിരിക്കുന്നു. ഇത് പ്രായോഗികമായി രണ്ട് ഘട്ടങ്ങൾ ഒന്നിച്ച് ചേർന്നതാണ്: ഡാറ്റാ സമാഹരണം, ഉദ്ദേശ്യവും പരിഹരിക്കേണ്ട പ്രശ്നങ്ങളും നിർവചിക്കൽ. +പ്രോജക്ടിന്റെ ലക്ഷ്യങ്ങൾ നിർവചിക്കാൻ പ്രശ്നം അല്ലെങ്കിൽ ചോദ്യത്തെക്കുറിച്ചുള്ള കൂടുതൽ പശ്ചാത്തലം ആവശ്യമുണ്ട്. ആദ്യം, പ്രശ്നം പരിഹരിക്കേണ്ടവരെ തിരിച്ചറിയുകയും സമാഹരിക്കുകയും ചെയ്യണം. ഇവ ബിസിനസിലെ സ്റ്റേക്ക്‌ഹോൾഡർമാരോ പ്രോജക്ടിന്റെ സ്പോൺസർമാരോ ആയിരിക്കാം, അവർക്ക് ഈ പ്രോജക്ടിൽ നിന്നു ആരോ എന്തോ പ്രയോജനം ലഭിക്കുമെന്ന് തിരിച്ചറിയാൻ സഹായിക്കും, കൂടാതെ എന്ത്, എന്തുകൊണ്ട് അതു ആവശ്യമാണ് എന്നും. നന്നായി നിർവചിച്ച ലക്ഷ്യം അളക്കാവുന്നതും കണക്കാക്കാവുന്നതുമായിരിക്കണം, അംഗീകരിക്കാവുന്ന ഫലം നിർവചിക്കാൻ. + +ഡാറ്റാ സയന്റിസ്റ്റ് ചോദിക്കാവുന്ന ചോദ്യങ്ങൾ: +- ഈ പ്രശ്നം മുമ്പ് സമീപിച്ചിട്ടുണ്ടോ? എന്താണ് കണ്ടെത്തിയത്? +- പങ്കാളികളിൽ എല്ലാവർക്കും ഉദ്ദേശ്യവും ലക്ഷ്യവും മനസ്സിലായിട്ടുണ്ടോ? +- സംശയം ഉണ്ടോ, അത് കുറയ്ക്കാൻ എങ്ങനെ? +- നിയന്ത്രണങ്ങൾ എന്തെല്ലാം? +- അവസാനം ഫലം എങ്ങനെ കാണപ്പെടും? +- എത്ര വിഭവങ്ങൾ (സമയം, ആളുകൾ, കംപ്യൂട്ടേഷൻ) ലഭ്യമാണ്? + +അടുത്തത് നിർവചിച്ച ലക്ഷ്യങ്ങൾ നേടാൻ ആവശ്യമായ ഡാറ്റ തിരിച്ചറിയൽ, ശേഖരണം, പിന്നീട് പരിശോധിക്കൽ. സമാഹരണ ഘട്ടത്തിൽ, ഡാറ്റാ സയന്റിസ്റ്റുകൾ ഡാറ്റയുടെ അളവും ഗുണനിലവാരവും വിലയിരുത്തണം. ഇത് ആവശ്യമായ ഫലം നേടാൻ സഹായിക്കുന്ന ഡാറ്റ സമാഹരിച്ചതാണെന്ന് സ്ഥിരീകരിക്കാൻ ഡാറ്റാ എക്സ്പ്ലോറേഷൻ ആവശ്യമാണ്. + +ഡാറ്റയെക്കുറിച്ച് ഡാറ്റാ സയന്റിസ്റ്റ് ചോദിക്കാവുന്ന ചോദ്യങ്ങൾ: +- എനിക്ക് ഇതിനകം ലഭ്യമായ ഡാറ്റ എന്തെല്ലാം? +- ഈ ഡാറ്റയുടെ ഉടമ ആരാണ്? +- സ്വകാര്യത സംബന്ധിച്ച ആശങ്കകൾ എന്തെല്ലാം? +- ഈ പ്രശ്നം പരിഹരിക്കാൻ എനിക്ക് മതിയായ ഡാറ്റ ഉണ്ടോ? +- ഈ പ്രശ്നത്തിന് ഡാറ്റയുടെ ഗുണനിലവാരം അംഗീകരിക്കാവുന്നതാണോ? +- ഈ ഡാറ്റ വഴി അധിക വിവരങ്ങൾ കണ്ടെത്തിയാൽ, ലക്ഷ്യങ്ങൾ മാറ്റം വരുത്തണോ? + +## പ്രോസസ്സിംഗ് + +ലൈഫ്‌സൈക്കിളിന്റെ പ്രോസസ്സിംഗ് ഘട്ടം ഡാറ്റയിൽ പാറ്റേണുകൾ കണ്ടെത്തലും മോഡലിംഗ് ചെയ്യലും ആണ്. ഈ ഘട്ടത്തിൽ ചില സാങ്കേതിക വിദ്യകൾ പാറ്റേണുകൾ കണ്ടെത്താൻ സാംഖ്യിക രീതികൾ ഉപയോഗിക്കുന്നു. സാധാരണയായി വലിയ ഡാറ്റാ സെറ്റിൽ മനുഷ്യൻക്ക് ഇത് ബുദ്ധിമുട്ടുള്ള ജോലി ആയിരിക്കും, അതിനാൽ കംപ്യൂട്ടറുകൾ പ്രക്രിയ വേഗത്തിലാക്കാൻ സഹായിക്കും. ഈ ഘട്ടത്തിലാണ് ഡാറ്റാ സയൻസ്, മെഷീൻ ലേണിംഗ് തമ്മിൽ മുട്ടിച്ചേരുന്നത്. ആദ്യ പാഠത്തിൽ പഠിച്ചതുപോലെ, മെഷീൻ ലേണിംഗ് ഡാറ്റ മനസ്സിലാക്കാൻ മോഡലുകൾ നിർമ്മിക്കുന്ന പ്രക്രിയയാണ്. മോഡലുകൾ ഡാറ്റയിലെ വ്യത്യസ്ത വേരിയബിളുകൾ തമ്മിലുള്ള ബന്ധം പ്രതിനിധീകരിച്ച് ഫലങ്ങൾ പ്രവചിക്കാൻ സഹായിക്കുന്നു. + +ഈ ഘട്ടത്തിൽ ഉപയോഗിക്കുന്ന സാധാരണ സാങ്കേതിക വിദ്യകൾ ML for Beginners പാഠ്യപദ്ധതിയിൽ ഉൾപ്പെടുത്തിയിട്ടുണ്ട്. അവയെക്കുറിച്ച് കൂടുതൽ അറിയാൻ താഴെയുള്ള ലിങ്കുകൾ പിന്തുടരുക: + +- [ക്ലാസിഫിക്കേഷൻ](https://github.com/microsoft/ML-For-Beginners/tree/main/4-Classification): ഡാറ്റയെ വർഗ്ഗങ്ങളായി ക്രമീകരിച്ച് കൂടുതൽ ഫലപ്രദമായി ഉപയോഗിക്കുക. +- [ക്ലസ്റ്ററിംഗ്](https://github.com/microsoft/ML-For-Beginners/tree/main/5-Clustering): സമാനമായ ഗ്രൂപ്പുകളായി ഡാറ്റ കൂട്ടിച്ചേർക്കുക. +- [റെഗ്രഷൻ](https://github.com/microsoft/ML-For-Beginners/tree/main/2-Regression): മൂല്യങ്ങൾ പ്രവചിക്കാൻ വേരിയബിളുകൾ തമ്മിലുള്ള ബന്ധം കണ്ടെത്തുക. + +## പരിപാലനം +ലൈഫ്‌സൈക്കിൾ ഡയഗ്രാമിൽ, പരിപാലനം പിടിച്ചെടുക്കലിനും പ്രോസസ്സിംഗിനും ഇടയിൽ കാണാം. പരിപാലനം ഒരു പ്രോജക്ടിന്റെ മുഴുവൻ കാലയളവിലും ഡാറ്റ മാനേജ്മെന്റ്, സംഭരണം, സുരക്ഷ എന്നിവയുടെ തുടർച്ചയായ പ്രക്രിയയാണ്. + +### ഡാറ്റ സംഭരണം +ഡാറ്റ എങ്ങനെ എവിടെ സംഭരിക്കപ്പെടുന്നു എന്നത് സംഭരണ ചെലവും ഡാറ്റ എത്ര വേഗത്തിൽ ആക്‌സസ് ചെയ്യാമെന്നതും ബാധിക്കുന്നു. ഈ വിധത്തിലുള്ള തീരുമാനങ്ങൾ സാധാരണയായി ഡാറ്റാ സയന്റിസ്റ്റ് മാത്രം എടുക്കാറില്ല, പക്ഷേ ഡാറ്റ എങ്ങനെ സംഭരിച്ചിരിക്കുന്നു എന്നതിനെ അടിസ്ഥാനമാക്കി ഡാറ്റ കൈകാര്യം ചെയ്യുന്നതിൽ അവർ തീരുമാനങ്ങൾ എടുക്കേണ്ടി വരാം. + +ഇവിടെ ആധുനിക ഡാറ്റ സംഭരണ സംവിധാനങ്ങളുടെ ചില ഘടകങ്ങൾ ഉണ്ട്, ഇവ ഈ തീരുമാനങ്ങളെ ബാധിക്കാം: + +**ഓൺ പ്രെമൈസ് vs ഓഫ് പ്രെമൈസ് vs പബ്ലിക് അല്ലെങ്കിൽ പ്രൈവറ്റ് ക്ലൗഡ്** + +ഓൺ പ്രെമൈസ് എന്നത് നിങ്ങളുടെ സ്വന്തം ഉപകരണങ്ങളിൽ ഡാറ്റ ഹോസ്റ്റ് ചെയ്ത് മാനേജുചെയ്യുന്നതാണ്, ഉദാഹരണത്തിന് ഹാർഡ് ഡ്രൈവ് ഉള്ള സെർവർ. ഓഫ് പ്രെമൈസ് എന്നാൽ നിങ്ങൾക്ക് സ്വന്തമല്ലാത്ത ഉപകരണങ്ങളിൽ ആശ്രയിച്ചിരിക്കുന്നു, ഉദാഹരണത്തിന് ഡാറ്റ സെന്റർ. പബ്ലിക് ക്ലൗഡ് ഡാറ്റ എവിടെ എങ്ങനെ സംഭരിക്കപ്പെടുന്നു എന്നറിയാതെ ഡാറ്റ സംഭരിക്കാൻ ജനപ്രിയമായ ഒരു തിരഞ്ഞെടുപ്പാണ്, ഇവിടെ പബ്ലിക് എന്നത് ക്ലൗഡ് ഉപയോഗിക്കുന്ന എല്ലാവർക്കും പങ്കുവെക്കുന്ന ഏകീകൃത അടിസ്ഥാന ഘടനയെ സൂചിപ്പിക്കുന്നു. ചില സംഘടനകൾക്ക് കർശനമായ സുരക്ഷാ നയങ്ങൾ ഉണ്ട്, അവയ്ക്ക് ഡാറ്റ ഹോസ്റ്റ് ചെയ്യുന്ന ഉപകരണങ്ങളിൽ പൂർണ്ണ ആക്‌സസ് വേണം, അതിനാൽ അവർ സ്വന്തം ക്ലൗഡ് സേവനങ്ങൾ നൽകുന്ന പ്രൈവറ്റ് ക്ലൗഡിൽ ആശ്രയിക്കുന്നു. ക്ലൗഡിലെ ഡാറ്റയെക്കുറിച്ച് കൂടുതൽ അറിയാൻ [പിന്നീട് പാഠങ്ങൾ](https://github.com/microsoft/Data-Science-For-Beginners/tree/main/5-Data-Science-In-Cloud) കാണുക. + +**കൂൾ vs ഹോട്ട് ഡാറ്റ** + +മോഡലുകൾ പരിശീലിപ്പിക്കുമ്പോൾ കൂടുതൽ പരിശീലന ഡാറ്റ ആവശ്യമാകാം. മോഡലിൽ തൃപ്തിയുണ്ടെങ്കിൽ, കൂടുതൽ ഡാറ്റ മോഡലിന്റെ ലക്ഷ്യം നിറവേറ്റാൻ എത്തും. എങ്കിലും, ഡാറ്റ സംഭരിക്കുന്നതും ആക്‌സസ് ചെയ്യുന്നതും ചെലവ് കൂടും. അപൂർവമായി ഉപയോഗിക്കുന്ന ഡാറ്റ (കൂൾ ഡാറ്റ) സ്ഥിരമായി ആക്‌സസ് ചെയ്യുന്ന ഡാറ്റ (ഹോട്ട് ഡാറ്റ) മുതൽ വേർതിരിക്കുന്നത് ഹാർഡ്‌വെയർ അല്ലെങ്കിൽ സോഫ്റ്റ്‌വെയർ സേവനങ്ങളിലൂടെ ചെലവുകുറഞ്ഞ ഡാറ്റ സംഭരണ ഓപ്ഷൻ ആകാം. കൂൾ ഡാറ്റ ആക്‌സസ് ചെയ്യേണ്ടിവന്നാൽ, ഹോട്ട് ഡാറ്റയേക്കാൾ കുറച്ച് കൂടുതൽ സമയം എടുക്കാം. + +### ഡാറ്റ മാനേജ്മെന്റ് +ഡാറ്റ ഉപയോഗിക്കുമ്പോൾ, [ഡാറ്റാ പ്രിപറേഷൻ](https://github.com/microsoft/Data-Science-For-Beginners/tree/main/2-Working-With-Data/08-data-preparation) പാഠത്തിൽ ഉൾപ്പെടുത്തിയ ചില സാങ്കേതിക വിദ്യകൾ ഉപയോഗിച്ച് ഡാറ്റ ശുദ്ധമാക്കേണ്ടതുണ്ടെന്ന് കണ്ടെത്താം, ഇത് കൃത്യമായ മോഡലുകൾ നിർമ്മിക്കാൻ സഹായിക്കും. പുതിയ ഡാറ്റ എത്തുമ്പോൾ, ഗുണനിലവാരം നിലനിർത്താൻ സമാനമായ പ്രയോഗങ്ങൾ ആവശ്യമാകും. ചില പ്രോജക്ടുകൾ ഡാറ്റ അന്തിമ സ്ഥലത്തേക്ക് മാറ്റുന്നതിന് മുമ്പ് ശുദ്ധീകരണം, സംഗ്രഹണം, കംപ്രഷൻ എന്നിവയ്ക്ക് ഓട്ടോമേറ്റഡ് ടൂൾ ഉപയോഗിക്കും. Azure Data Factory ഇതിന്റെ ഉദാഹരണമാണ്. + +### ഡാറ്റ സുരക്ഷ +ഡാറ്റ സുരക്ഷയുടെ പ്രധാന ലക്ഷ്യങ്ങളിൽ ഒന്നാണ് ഡാറ്റ കൈകാര്യം ചെയ്യുന്നവർ എന്ത് ശേഖരിക്കുന്നു, ഏത് സാഹചര്യത്തിൽ ഉപയോഗിക്കുന്നു എന്നിവ നിയന്ത്രണത്തിൽ വയ്ക്കുക. ഡാറ്റ സുരക്ഷിതമാക്കുന്നത് ആക്‌സസ് അവശ്യമായവർക്കു മാത്രം പരിമിതപ്പെടുത്തുക, പ്രാദേശിക നിയമങ്ങളും നയങ്ങളും പാലിക്കുക, [നൈതികതാ പാഠത്തിൽ](https://github.com/microsoft/Data-Science-For-Beginners/tree/main/1-Introduction/02-ethics) ഉൾപ്പെടുത്തിയതുപോലെ നൈതിക മാനദണ്ഡങ്ങൾ പാലിക്കുക എന്നിവ ഉൾപ്പെടുന്നു. + +സുരക്ഷയെക്കുറിച്ച് ഒരു ടീം ചെയ്യാവുന്ന ചില കാര്യങ്ങൾ: +- എല്ലാ ഡാറ്റയും എൻക്രിപ്റ്റ് ചെയ്തിട്ടുണ്ടെന്ന് സ്ഥിരീകരിക്കുക +- ഉപഭോക്താക്കൾക്ക് അവരുടെ ഡാറ്റ എങ്ങനെ ഉപയോഗിക്കുന്നു എന്ന വിവരം നൽകുക +- പ്രോജക്ട് വിട്ടുപോയവരുടെ ഡാറ്റ ആക്‌സസ് നീക്കംചെയ്യുക +- ചില പ്രോജക്ട് അംഗങ്ങൾക്കു മാത്രമേ ഡാറ്റ മാറ്റാൻ അനുവാദം നൽകൂ + +## 🚀 ചലഞ്ച് + +ഡാറ്റാ സയൻസ് ലൈഫ്‌സൈക്കിളിന്റെ പല പതിപ്പുകൾ ഉണ്ട്, ഓരോ ഘട്ടത്തിനും വ്യത്യസ്ത പേരുകളും ഘട്ടങ്ങളുടെ എണ്ണം വ്യത്യസ്തമായിരിക്കാം, പക്ഷേ ഈ പാഠത്തിൽ പരാമർശിച്ച പ്രക്രിയകൾ എല്ലാം ഉൾക്കൊള്ളും. + +[ടീം ഡാറ്റാ സയൻസ് പ്രോസസ് ലൈഫ്‌സൈക്കിൾ](https://docs.microsoft.com/en-us/azure/architecture/data-science-process/lifecycle)യും [ക്രോസ്-ഇൻഡസ്ട്രി സ്റ്റാൻഡേർഡ് പ്രോസസ് ഫോർ ഡാറ്റ മൈനിംഗ്](https://www.datascience-pm.com/crisp-dm-2/)യും പരിശോധിച്ച്, അവയുടെ 3 സാമ്യമുകളും വ്യത്യാസങ്ങളും പറയുക. + +|ടീം ഡാറ്റാ സയൻസ് പ്രോസസ് (TDSP)|ക്രോസ്-ഇൻഡസ്ട്രി സ്റ്റാൻഡേർഡ് പ്രോസസ് ഫോർ ഡാറ്റ മൈനിംഗ് (CRISP-DM)| +|--|--| +|![Team Data Science Lifecycle](../../../../translated_images/tdsp-lifecycle2.e19029d598e2e73d5ef8a4b98837d688ec6044fe332c905d4dbb69eb6d5c1d96.ml.png) | ![Data Science Process Alliance Image](../../../../translated_images/CRISP-DM.8bad2b4c66e62aa75278009e38e3e99902c73b0a6f63fd605a67c687a536698c.ml.png) | +| ചിത്രം: [Microsoft](https://docs.microsoft.comazure/architecture/data-science-process/lifecycle) | ചിത്രം: [Data Science Process Alliance](https://www.datascience-pm.com/crisp-dm-2/) | + +## [പോസ്റ്റ്-ലെക്ചർ ക്വിസ്](https://ff-quizzes.netlify.app/en/ds/quiz/27) + +## അവലോകനം & സ്വയം പഠനം + +ഡാറ്റാ സയൻസ് ലൈഫ്‌സൈക്കിൾ പ്രയോഗിക്കുന്നത് പല വേഷങ്ങളും ജോലികളും ഉൾക്കൊള്ളുന്നു, ചിലർ ഓരോ ഘട്ടത്തിന്റെ പ്രത്യേക ഭാഗങ്ങളിൽ ശ്രദ്ധ കേന്ദ്രീകരിക്കും. ടീം ഡാറ്റാ സയൻസ് പ്രോസസ് പ്രോജക്ടിൽ ഒരാൾക്കുണ്ടാകാവുന്ന വേഷങ്ങളും ജോലികളും വിശദീകരിക്കുന്ന ചില വിഭവങ്ങൾ നൽകുന്നു. + +* [ടീം ഡാറ്റാ സയൻസ് പ്രോസസ് വേഷങ്ങളും ജോലികളും](https://docs.microsoft.com/en-us/azure/architecture/data-science-process/roles-tasks) +* [ഡാറ്റാ സയൻസ് ജോലികൾ നിർവഹിക്കുക: എക്സ്പ്ലോറേഷൻ, മോഡലിംഗ്, ഡിപ്ലോയ്മെന്റ്](https://docs.microsoft.com/en-us/azure/architecture/data-science-process/execute-data-science-tasks) + +## അസൈൻമെന്റ് + +[ഡാറ്റാസെറ്റ് വിലയിരുത്തൽ](assignment.md) + +--- + + +**അസൂയാപത്രം**: +ഈ രേഖ AI വിവർത്തന സേവനം [Co-op Translator](https://github.com/Azure/co-op-translator) ഉപയോഗിച്ച് വിവർത്തനം ചെയ്തതാണ്. നാം കൃത്യതയ്ക്ക് ശ്രമിച്ചിട്ടുണ്ടെങ്കിലും, സ്വയം പ്രവർത്തിക്കുന്ന വിവർത്തനങ്ങളിൽ പിശകുകൾ അല്ലെങ്കിൽ തെറ്റുകൾ ഉണ്ടാകാമെന്ന് ദയവായി ശ്രദ്ധിക്കുക. അതിന്റെ മാതൃഭാഷയിലുള്ള യഥാർത്ഥ രേഖ അധികാരപരമായ ഉറവിടമായി കണക്കാക്കപ്പെടണം. നിർണായക വിവരങ്ങൾക്ക്, പ്രൊഫഷണൽ മനുഷ്യ വിവർത്തനം ശുപാർശ ചെയ്യപ്പെടുന്നു. ഈ വിവർത്തനം ഉപയോഗിക്കുന്നതിൽ നിന്നുണ്ടാകുന്ന ഏതെങ്കിലും തെറ്റിദ്ധാരണകൾക്കോ തെറ്റായ വ്യാഖ്യാനങ്ങൾക്കോ ഞങ്ങൾ ഉത്തരവാദികളല്ല. + \ No newline at end of file diff --git a/translations/ml/4-Data-Science-Lifecycle/14-Introduction/assignment.md b/translations/ml/4-Data-Science-Lifecycle/14-Introduction/assignment.md new file mode 100644 index 00000000..b373336e --- /dev/null +++ b/translations/ml/4-Data-Science-Lifecycle/14-Introduction/assignment.md @@ -0,0 +1,38 @@ + +# ഒരു ഡാറ്റാസെറ്റ് വിലയിരുത്തൽ + +നിങ്ങളുടെ ടീമിന് ഒരു ക്ലയന്റ് ന്യൂയോർക്ക് സിറ്റിയിലെ ടാക്സി ഉപഭോക്താവിന്റെ സീസണൽ ചെലവഴിക്കൽ ശീലങ്ങൾ അന്വേഷിക്കുന്നതിന് സഹായം തേടിയിട്ടുണ്ട്. + +അവർ അറിയാൻ ആഗ്രഹിക്കുന്നത്: **ന്യൂയോർക്ക് സിറ്റിയിലെ മഞ്ഞ ടാക്സി യാത്രക്കാർ ശീതകാലത്തോ വേനൽക്കാലത്തോ ഡ്രൈവർമാർക്ക് കൂടുതൽ ടിപ്പ് നൽകുന്നുണ്ടോ?** + +ഡാറ്റാ സയൻസ് ലൈഫ്‌സൈക്കിളിന്റെ [Capturing](Readme.md#Capturing) ഘട്ടത്തിലാണ് നിങ്ങളുടെ ടീം, നിങ്ങൾ ഡാറ്റാസെറ്റ് കൈകാര്യം ചെയ്യുന്നതിന് ഉത്തരവാദിയാണ്. പരിശോധിക്കാൻ നിങ്ങൾക്ക് ഒരു നോട്ട്‌ബുക്ക് കൂടാതെ [ഡാറ്റ](../../../../data/taxi.csv) നൽകിയിട്ടുണ്ട്. + +ഈ ഡയറക്ടറിയിൽ [നോട്ട്‌ബുക്ക്](notebook.ipynb) ഉണ്ട്, ഇത് പൈത്തൺ ഉപയോഗിച്ച് [NYC Taxi & Limousine Commission](https://docs.microsoft.com/en-us/azure/open-datasets/dataset-taxi-yellow?tabs=azureml-opendatasets) നിന്നുള്ള മഞ്ഞ ടാക്സി യാത്രാ ഡാറ്റ ലോഡ് ചെയ്യുന്നു. ടാക്സി ഡാറ്റ ഫയൽ ടെക്സ്റ്റ് എഡിറ്റർ അല്ലെങ്കിൽ എക്സൽ പോലുള്ള സ്പ്രെഡ്‌ഷീറ്റ് സോഫ്റ്റ്‌വെയർ ഉപയോഗിച്ച് തുറക്കാനും കഴിയും. + +## നിർദ്ദേശങ്ങൾ + +- ഈ ഡാറ്റാസെറ്റിലുള്ള ഡാറ്റ ഈ ചോദ്യം ഉത്തരം നൽകാൻ സഹായിക്കുന്നുണ്ടോ എന്ന് വിലയിരുത്തുക. +- [NYC Open Data കാറ്റലോഗ്](https://data.cityofnewyork.us/browse?sortBy=most_accessed&utf8=%E2%9C%93) പരിശോധിക്കുക. ക്ലയന്റിന്റെ ചോദ്യം ഉത്തരം നൽകുന്നതിൽ സഹായകമായ മറ്റൊരു ഡാറ്റാസെറ്റ് കണ്ടെത്തുക. +- പ്രശ്നത്തെ കൂടുതൽ വ്യക്തമായി മനസിലാക്കാനും വിശദീകരിക്കാനും ക്ലയന്റിനോട് ചോദിക്കേണ്ട 3 ചോദ്യങ്ങൾ എഴുതുക. + +ഡാറ്റയെക്കുറിച്ചുള്ള കൂടുതൽ വിവരങ്ങൾക്ക് [ഡാറ്റാസെറ്റിന്റെ നിഘണ്ടു](https://www1.nyc.gov/assets/tlc/downloads/pdf/data_dictionary_trip_records_yellow.pdf)യും [ഉപയോക്തൃ ഗൈഡ്](https://www1.nyc.gov/assets/tlc/downloads/pdf/trip_record_user_guide.pdf)യും കാണുക. + +## റൂബ്രിക് + +Exemplary | Adequate | Needs Improvement +--- | --- | -- | + +--- + + +**അസൂയാപത്രം**: +ഈ രേഖ AI വിവർത്തന സേവനം [Co-op Translator](https://github.com/Azure/co-op-translator) ഉപയോഗിച്ച് വിവർത്തനം ചെയ്തതാണ്. നാം കൃത്യതയ്ക്ക് ശ്രമിച്ചിട്ടുണ്ടെങ്കിലും, സ്വയം പ്രവർത്തിക്കുന്ന വിവർത്തനങ്ങളിൽ പിശകുകൾ അല്ലെങ്കിൽ തെറ്റുകൾ ഉണ്ടാകാമെന്ന് ദയവായി ശ്രദ്ധിക്കുക. അതിന്റെ മാതൃഭാഷയിലുള്ള യഥാർത്ഥ രേഖ അധികാരപരമായ ഉറവിടമായി കണക്കാക്കപ്പെടണം. നിർണായക വിവരങ്ങൾക്ക്, പ്രൊഫഷണൽ മനുഷ്യ വിവർത്തനം ശുപാർശ ചെയ്യപ്പെടുന്നു. ഈ വിവർത്തനം ഉപയോഗിക്കുന്നതിൽ നിന്നുണ്ടാകുന്ന ഏതെങ്കിലും തെറ്റിദ്ധാരണകൾക്കോ തെറ്റായ വ്യാഖ്യാനങ്ങൾക്കോ ഞങ്ങൾ ഉത്തരവാദികളല്ല. + \ No newline at end of file diff --git a/translations/ml/4-Data-Science-Lifecycle/14-Introduction/notebook.ipynb b/translations/ml/4-Data-Science-Lifecycle/14-Introduction/notebook.ipynb new file mode 100644 index 00000000..db04a5cf --- /dev/null +++ b/translations/ml/4-Data-Science-Lifecycle/14-Introduction/notebook.ipynb @@ -0,0 +1,140 @@ +{ + "cells": [ + { + "cell_type": "markdown", + "source": [ + "# ശീതകാലത്തും വേനൽക്കാലത്തും NYC ടാക്സി ഡാറ്റ\r\n", + "\r\n", + "നൽകിയിരിക്കുന്ന കോളങ്ങളേക്കുറിച്ച് കൂടുതൽ അറിയാൻ [ഡാറ്റ ഡിക്ഷണറി](https://www1.nyc.gov/assets/tlc/downloads/pdf/data_dictionary_trip_records_yellow.pdf) കാണുക.\n" + ], + "metadata": {} + }, + { + "cell_type": "code", + "execution_count": null, + "source": [ + "#Install the pandas library\r\n", + "!pip install pandas" + ], + "outputs": [], + "metadata": { + "scrolled": true + } + }, + { + "cell_type": "code", + "execution_count": 7, + "source": [ + "import pandas as pd\r\n", + "\r\n", + "path = '../../data/taxi.csv'\r\n", + "\r\n", + "#Load the csv file into a dataframe\r\n", + "df = pd.read_csv(path)\r\n", + "\r\n", + "#Print the dataframe\r\n", + "print(df)\r\n" + ], + "outputs": [ + { + "output_type": "stream", + "name": "stdout", + "text": [ + " VendorID tpep_pickup_datetime tpep_dropoff_datetime passenger_count \\\n", + "0 2.0 2019-07-15 16:27:53 2019-07-15 16:44:21 3.0 \n", + "1 2.0 2019-07-17 20:26:35 2019-07-17 20:40:09 6.0 \n", + "2 2.0 2019-07-06 16:01:08 2019-07-06 16:10:25 1.0 \n", + "3 1.0 2019-07-18 22:32:23 2019-07-18 22:35:08 1.0 \n", + "4 2.0 2019-07-19 14:54:29 2019-07-19 15:19:08 1.0 \n", + ".. ... ... ... ... \n", + "195 2.0 2019-01-18 08:42:15 2019-01-18 08:56:57 1.0 \n", + "196 1.0 2019-01-19 04:34:45 2019-01-19 04:43:44 1.0 \n", + "197 2.0 2019-01-05 10:37:39 2019-01-05 10:42:03 1.0 \n", + "198 2.0 2019-01-23 10:36:29 2019-01-23 10:44:34 2.0 \n", + "199 2.0 2019-01-30 06:55:58 2019-01-30 07:07:02 5.0 \n", + "\n", + " trip_distance RatecodeID store_and_fwd_flag PULocationID DOLocationID \\\n", + "0 2.02 1.0 N 186 233 \n", + "1 1.59 1.0 N 141 161 \n", + "2 1.69 1.0 N 246 249 \n", + "3 0.90 1.0 N 229 141 \n", + "4 4.79 1.0 N 237 107 \n", + ".. ... ... ... ... ... \n", + "195 1.18 1.0 N 43 237 \n", + "196 2.30 1.0 N 148 234 \n", + "197 0.83 1.0 N 237 263 \n", + "198 1.12 1.0 N 144 113 \n", + "199 2.41 1.0 N 209 107 \n", + "\n", + " payment_type fare_amount extra mta_tax tip_amount tolls_amount \\\n", + "0 1.0 12.0 1.0 0.5 4.08 0.0 \n", + "1 2.0 10.0 0.5 0.5 0.00 0.0 \n", + "2 2.0 8.5 0.0 0.5 0.00 0.0 \n", + "3 1.0 4.5 3.0 0.5 1.65 0.0 \n", + "4 1.0 19.5 0.0 0.5 5.70 0.0 \n", + ".. ... ... ... ... ... ... \n", + "195 1.0 10.0 0.0 0.5 2.16 0.0 \n", + "196 1.0 9.5 0.5 0.5 2.15 0.0 \n", + "197 1.0 5.0 0.0 0.5 1.16 0.0 \n", + "198 2.0 7.0 0.0 0.5 0.00 0.0 \n", + "199 1.0 10.5 0.0 0.5 1.00 0.0 \n", + "\n", + " improvement_surcharge total_amount congestion_surcharge \n", + "0 0.3 20.38 2.5 \n", + "1 0.3 13.80 2.5 \n", + "2 0.3 11.80 2.5 \n", + "3 0.3 9.95 2.5 \n", + "4 0.3 28.50 2.5 \n", + ".. ... ... ... \n", + "195 0.3 12.96 0.0 \n", + "196 0.3 12.95 0.0 \n", + "197 0.3 6.96 0.0 \n", + "198 0.3 7.80 0.0 \n", + "199 0.3 12.30 0.0 \n", + "\n", + "[200 rows x 18 columns]\n" + ] + } + ], + "metadata": {} + }, + { + "cell_type": "markdown", + "metadata": {}, + "source": [ + "---\n\n\n**അസൂയാ**: \nഈ രേഖ AI വിവർത്തന സേവനം [Co-op Translator](https://github.com/Azure/co-op-translator) ഉപയോഗിച്ച് വിവർത്തനം ചെയ്തതാണ്. നാം കൃത്യതയ്ക്ക് ശ്രമിച്ചെങ്കിലും, സ്വയം പ്രവർത്തിക്കുന്ന വിവർത്തനങ്ങളിൽ പിശകുകൾ അല്ലെങ്കിൽ തെറ്റുകൾ ഉണ്ടാകാമെന്ന് ദയവായി ശ്രദ്ധിക്കുക. അതിന്റെ മാതൃഭാഷയിലുള്ള യഥാർത്ഥ രേഖയാണ് പ്രാമാണികമായ ഉറവിടം എന്ന് പരിഗണിക്കേണ്ടതാണ്. നിർണായകമായ വിവരങ്ങൾക്ക്, പ്രൊഫഷണൽ മനുഷ്യ വിവർത്തനം ശുപാർശ ചെയ്യപ്പെടുന്നു. ഈ വിവർത്തനം ഉപയോഗിക്കുന്നതിൽ നിന്നുണ്ടാകുന്ന ഏതെങ്കിലും തെറ്റിദ്ധാരണകൾക്കോ തെറ്റായ വ്യാഖ്യാനങ്ങൾക്കോ ഞങ്ങൾ ഉത്തരവാദികളല്ല.\n\n" + ] + } + ], + "metadata": { + "kernelspec": { + "name": "python3", + "display_name": "Python 3.9.7 64-bit ('venv': venv)" + }, + "language_info": { + "mimetype": "text/x-python", + "name": "python", + "pygments_lexer": "ipython3", + "codemirror_mode": { + "name": "ipython", + "version": 3 + }, + "version": "3.9.7", + "nbconvert_exporter": "python", + "file_extension": ".py" + }, + "name": "04-nyc-taxi-join-weather-in-pandas", + "notebookId": 1709144033725344, + "interpreter": { + "hash": "6b9b57232c4b57163d057191678da2030059e733b8becc68f245de5a75abe84e" + }, + "coopTranslator": { + "original_hash": "3bd4c20c4e8f3158f483f0f1cc543bb1", + "translation_date": "2025-12-19T17:11:50+00:00", + "source_file": "4-Data-Science-Lifecycle/14-Introduction/notebook.ipynb", + "language_code": "ml" + } + }, + "nbformat": 4, + "nbformat_minor": 2 +} \ No newline at end of file diff --git a/translations/ml/4-Data-Science-Lifecycle/15-analyzing/README.md b/translations/ml/4-Data-Science-Lifecycle/15-analyzing/README.md new file mode 100644 index 00000000..9842c8cf --- /dev/null +++ b/translations/ml/4-Data-Science-Lifecycle/15-analyzing/README.md @@ -0,0 +1,60 @@ + +# ഡാറ്റ സയൻസ് ലൈഫ്‌സൈക്കിൾ: വിശകലനം + +|![ Sketchnote by [(@sketchthedocs)](https://sketchthedocs.dev) ](../../sketchnotes/15-Analyzing.png)| +|:---:| +| ഡാറ്റ സയൻസ് ലൈഫ്‌സൈക്കിൾ: വിശകലനം - _Sketchnote by [@nitya](https://twitter.com/nitya)_ | + +## [പ്രീ-ലെക്ചർ ക്വിസ്](https://ff-quizzes.netlify.app/en/ds/quiz/28) + +ഡാറ്റ ലൈഫ്‌സൈക്കിളിലെ വിശകലനം, നിർദ്ദേശിച്ച ചോദ്യങ്ങൾക്ക് ഡാറ്റ ഉത്തരം നൽകാമോ എന്നതും ഒരു പ്രത്യേക പ്രശ്നം പരിഹരിക്കാമോ എന്നതും സ്ഥിരീകരിക്കുന്നു. ഈ ഘട്ടം, ഒരു മോഡൽ ഈ ചോദ്യങ്ങളും പ്രശ്നങ്ങളും ശരിയായി പരിഹരിക്കുന്നുണ്ടോ എന്ന് സ്ഥിരീകരിക്കുന്നതിലും കേന്ദ്രീകരിക്കാം. ഈ പാഠം എക്സ്പ്ലോറേറ്ററി ഡാറ്റ അനാലിസിസ് അല്ലെങ്കിൽ EDA-യെക്കുറിച്ചാണ്, ഇത് ഡാറ്റയിലെ ഫീച്ചറുകളും ബന്ധങ്ങളും നിർവചിക്കുന്ന സാങ്കേതിക വിദ്യകളാണ്, കൂടാതെ മോഡലിംഗിനായി ഡാറ്റ തയ്യാറാക്കാൻ ഉപയോഗിക്കാം. + +Python-ഉം Pandas ലൈബ്രറിയും ഉപയോഗിച്ച് ഇത് എങ്ങനെ പ്രയോഗിക്കാമെന്ന് കാണിക്കാൻ [Kaggle](https://www.kaggle.com/balaka18/email-spam-classification-dataset-csv/version/1) നിന്നുള്ള ഒരു ഉദാഹരണ ഡാറ്റാസെറ്റ് ഉപയോഗിക്കും. ഈ ഡാറ്റാസെറ്റിൽ ഇമെയിലുകളിൽ കാണപ്പെടുന്ന ചില സാധാരണ വാക്കുകളുടെ എണ്ണം ഉൾക്കൊള്ളുന്നു, ഈ ഇമെയിലുകളുടെ ഉറവിടങ്ങൾ അനാമികമാണ്. ഈ ഡയറക്ടറിയിലുള്ള [നോട്ട്ബുക്ക്](notebook.ipynb) ഉപയോഗിച്ച് പിന്തുടരുക. + +## എക്സ്പ്ലോറേറ്ററി ഡാറ്റ അനാലിസിസ് + +ലൈഫ്‌സൈക്കിളിന്റെ ക്യാപ്ചർ ഘട്ടം ഡാറ്റ സമ്പാദിക്കുകയും പ്രശ്നങ്ങളും ചോദ്യങ്ങളും കൈകാര്യം ചെയ്യുകയും ചെയ്യുന്ന ഘട്ടമാണ്, പക്ഷേ ഡാറ്റ അവസാന ഫലത്തെ പിന്തുണയ്ക്കുമെന്ന് എങ്ങനെ അറിയാം? +ഡാറ്റ സയന്റിസ്റ്റ് ഡാറ്റ സമ്പാദിക്കുമ്പോൾ താഴെപ്പറയുന്ന ചോദ്യങ്ങൾ ചോദിക്കാമെന്ന് ഓർക്കുക: +- ഈ പ്രശ്നം പരിഹരിക്കാൻ എനിക്ക് മതിയായ ഡാറ്റ ഉണ്ടോ? +- ഈ പ്രശ്നത്തിന് ഡാറ്റയുടെ ഗുണമേന്മ സ്വീകരിക്കാവുന്നതാണോ? +- ഈ ഡാറ്റ വഴി അധിക വിവരങ്ങൾ കണ്ടെത്തിയാൽ, ലക്ഷ്യങ്ങൾ മാറ്റുകയോ പുനർനിർവചിക്കുകയോ ചെയ്യണോ? +എക്സ്പ്ലോറേറ്ററി ഡാറ്റ അനാലിസിസ് ആ ഡാറ്റയെ അറിയാനുള്ള പ്രക്രിയയാണ്, ഇത് ഈ ചോദ്യങ്ങൾക്ക് ഉത്തരം നൽകാനും ഡാറ്റാസെറ്റുമായി പ്രവർത്തിക്കുമ്പോഴുള്ള വെല്ലുവിളികൾ തിരിച്ചറിയാനും സഹായിക്കുന്നു. ഇതു നേടാൻ ഉപയോഗിക്കുന്ന ചില സാങ്കേതിക വിദ്യകളിൽ ശ്രദ്ധ കേന്ദ്രീകരിക്കാം. + +## ഡാറ്റ പ്രൊഫൈലിംഗ്, വിവരണാത്മക സ്ഥിതിവിവരക്കണക്കുകൾ, Pandas +ഈ പ്രശ്നം പരിഹരിക്കാൻ എത്രമാത്രം ഡാറ്റ വേണ്ടെന്ന് എങ്ങനെ വിലയിരുത്താം? ഡാറ്റ പ്രൊഫൈലിംഗ്, വിവരണാത്മക സ്ഥിതിവിവരക്കണക്കുകളുടെ സാങ്കേതിക വിദ്യകൾ വഴി നമ്മുടെ ഡാറ്റാസെറ്റിനെക്കുറിച്ചുള്ള പൊതുവായ വിവരങ്ങൾ സംഗ്രഹിക്കുകയും ശേഖരിക്കുകയും ചെയ്യാം. ഡാറ്റ പ്രൊഫൈലിംഗ് നമ്മെ ലഭ്യമായതെന്താണെന്ന് മനസ്സിലാക്കാൻ സഹായിക്കുന്നു, വിവരണാത്മക സ്ഥിതിവിവരക്കണക്കുകൾ എത്രമാത്രം ലഭ്യമാണ് എന്ന് മനസ്സിലാക്കാൻ സഹായിക്കുന്നു. + +മുമ്പത്തെ ചില പാഠങ്ങളിൽ, Pandas ഉപയോഗിച്ച് [`describe()` ഫംഗ്ഷൻ]( https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.describe.html) ഉപയോഗിച്ച് ചില വിവരണാത്മക സ്ഥിതിവിവരക്കണക്കുകൾ നൽകിയിട്ടുണ്ട്. ഇത് എണ്ണവും പരമാവധി, കുറഞ്ഞ മൂല്യങ്ങളും, ശരാശരി, സ്റ്റാൻഡേർഡ് ഡിവിയേഷൻ, ക്വാണ്ടൈലുകൾ എന്നിവ നൽകുന്നു. `describe()` പോലുള്ള വിവരണാത്മക സ്ഥിതിവിവരക്കണക്കുകൾ ഉപയോഗിച്ച് നിങ്ങൾക്ക് എത്രമാത്രം ഡാറ്റയുണ്ട് എന്നും കൂടുതൽ ആവശ്യമുണ്ടോ എന്നും വിലയിരുത്താൻ കഴിയും. + +## സാമ്പിളിംഗ്, ക്വറി ചെയ്യൽ +വലിയ ഡാറ്റാസെറ്റിലെ എല്ലാം പരിശോധിക്കുന്നത് വളരെ സമയം കഴിക്കുന്നതും സാധാരണയായി കമ്പ്യൂട്ടറിന് വിട്ടുകൊടുക്കുന്ന ജോലിയുമാണ്. എന്നാൽ സാമ്പിളിംഗ് ഡാറ്റയെ മനസ്സിലാക്കാൻ സഹായിക്കുന്ന ഉപകരണം ആണ്, ഇത് ഡാറ്റാസെറ്റിൽ എന്തുണ്ട് എന്നും അത് എന്താണ് പ്രതിനിധാനം ചെയ്യുന്നത് എന്നും നമുക്ക് മികച്ച ബോധം നൽകുന്നു. സാമ്പിള് ഉപയോഗിച്ച്, നിങ്ങൾക്ക് പ്രൊബബിലിറ്റി, സ്ഥിതിവിവരക്കണക്കുകൾ പ്രയോഗിച്ച് ഡാറ്റയെക്കുറിച്ചുള്ള പൊതുവായ നിഗമനങ്ങൾ വരുത്താം. എത്രമാത്രം ഡാറ്റ സാമ്പിൾ ചെയ്യണം എന്നതിന് നിർദ്ദിഷ്ട നിയമമില്ലെങ്കിലും, കൂടുതൽ ഡാറ്റ സാമ്പിൾ ചെയ്താൽ, ഡാറ്റയെക്കുറിച്ചുള്ള പൊതുവായ നിഗമനങ്ങൾ കൂടുതൽ കൃത്യമായിരിക്കും. +Pandas-ൽ [`sample()` ഫംഗ്ഷൻ](https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.sample.html) ഉണ്ട്, ഇതിൽ നിങ്ങൾക്ക് എത്ര റാൻഡം സാമ്പിളുകൾ വേണമെന്നു പാരാമീറ്ററായി നൽകാം. + +ഡാറ്റയുടെ പൊതുവായ ചോദ്യങ്ങൾക്കും സിദ്ധാന്തങ്ങൾക്കും ഉത്തരം കണ്ടെത്താൻ ജനറൽ ക്വറി ചെയ്യലും സഹായിക്കുന്നു. സാമ്പിളിംഗിനോട് വ്യത്യസ്തമായി, ക്വറികൾ നിങ്ങൾക്ക് ഡാറ്റയിലെ പ്രത്യേക ഭാഗങ്ങളിൽ ശ്രദ്ധ കേന്ദ്രീകരിക്കാനും നിയന്ത്രണം നൽകുന്നു. +Pandas ലൈബ്രറിയിലെ [`query()` ഫംഗ്ഷൻ](https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.query.html) കോളങ്ങൾ തിരഞ്ഞെടുക്കാനും തിരഞ്ഞെടുത്ത വരികളിലൂടെ ഡാറ്റയെക്കുറിച്ചുള്ള ലളിതമായ ഉത്തരം ലഭിക്കാനും സഹായിക്കുന്നു. + +## ദൃശ്യവൽക്കരണങ്ങളിലൂടെ അന്വേഷിക്കൽ +ഡാറ്റ പൂർണ്ണമായി ശുദ്ധീകരിക്കപ്പെടുകയും വിശകലനം ചെയ്യപ്പെടുകയും ചെയ്യുന്നത് വരെ കാത്തിരിക്കേണ്ടതില്ല. അന്വേഷിക്കുമ്പോൾ ദൃശ്യവൽക്കരണങ്ങൾ ഉണ്ടാകുന്നത് പാറ്റേണുകൾ, ബന്ധങ്ങൾ, പ്രശ്നങ്ങൾ തിരിച്ചറിയാൻ സഹായിക്കുന്നു. കൂടാതെ, ദൃശ്യവൽക്കരണങ്ങൾ ഡാറ്റ കൈകാര്യം ചെയ്യാത്തവരുമായി ആശയവിനിമയം നടത്താനുള്ള മാർഗ്ഗവും, ക്യാപ്ചർ ഘട്ടത്തിൽ പരിഗണിക്കപ്പെടാത്ത അധിക ചോദ്യങ്ങൾ പങ്കുവെക്കാനും വ്യക്തത നൽകാനും അവസരവുമാണ്. ദൃശ്യവൽക്കരണങ്ങളെക്കുറിച്ചുള്ള കൂടുതൽ അറിയാൻ [Visualizations വിഭാഗം](../../../../../../../../../3-Data-Visualization) കാണുക. + +## അസംഘടിതത്വങ്ങൾ തിരിച്ചറിയാൻ അന്വേഷിക്കൽ +ഈ പാഠത്തിലെ എല്ലാ വിഷയങ്ങളും നഷ്ടപ്പെട്ട അല്ലെങ്കിൽ അസംഘടിത മൂല്യങ്ങൾ തിരിച്ചറിയാൻ സഹായിക്കും, Pandas ചില ഫംഗ്ഷനുകൾ ഇതിന് നൽകുന്നു. [isna() അല്ലെങ്കിൽ isnull()](https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.isna.html) നഷ്ടപ്പെട്ട മൂല്യങ്ങൾ പരിശോധിക്കാൻ ഉപയോഗിക്കാം. നിങ്ങളുടെ ഡാറ്റയിൽ ഈ മൂല്യങ്ങൾ എന്തുകൊണ്ട് അങ്ങനെ വന്നുവെന്ന് അന്വേഷിക്കുന്നത് വളരെ പ്രധാനമാണ്. ഇത് [അവ പരിഹരിക്കാൻ സ്വീകരിക്കേണ്ട നടപടികൾ](/2-Working-With-Data/08-data-preparation/notebook.ipynb) തീരുമാനിക്കാൻ സഹായിക്കും. + +## [പോസ്റ്റ്-ലെക്ചർ ക്വിസ്](https://ff-quizzes.netlify.app/en/ds/quiz/29) + +## അസൈൻമെന്റ് + +[ഉത്തരം അന്വേഷിക്കൽ](assignment.md) + +--- + + +**അസൂയാ**: +ഈ രേഖ AI വിവർത്തന സേവനം [Co-op Translator](https://github.com/Azure/co-op-translator) ഉപയോഗിച്ച് വിവർത്തനം ചെയ്തതാണ്. നാം കൃത്യതയ്ക്ക് ശ്രമിച്ചെങ്കിലും, സ്വയം പ്രവർത്തിക്കുന്ന വിവർത്തനങ്ങളിൽ പിശകുകൾ അല്ലെങ്കിൽ തെറ്റുകൾ ഉണ്ടാകാമെന്ന് ദയവായി ശ്രദ്ധിക്കുക. അതിന്റെ മാതൃഭാഷയിലുള്ള യഥാർത്ഥ രേഖ പ്രാമാണികമായ ഉറവിടമായി കണക്കാക്കണം. നിർണായക വിവരങ്ങൾക്ക്, പ്രൊഫഷണൽ മനുഷ്യ വിവർത്തനം ശുപാർശ ചെയ്യപ്പെടുന്നു. ഈ വിവർത്തനത്തിന്റെ ഉപയോഗത്തിൽ നിന്നുണ്ടാകുന്ന ഏതെങ്കിലും തെറ്റിദ്ധാരണകൾക്കോ തെറ്റായ വ്യാഖ്യാനങ്ങൾക്കോ ഞങ്ങൾ ഉത്തരവാദികളല്ല. + \ No newline at end of file diff --git a/translations/ml/4-Data-Science-Lifecycle/15-analyzing/assignment.ipynb b/translations/ml/4-Data-Science-Lifecycle/15-analyzing/assignment.ipynb new file mode 100644 index 00000000..9ed99541 --- /dev/null +++ b/translations/ml/4-Data-Science-Lifecycle/15-analyzing/assignment.ipynb @@ -0,0 +1,154 @@ +{ + "cells": [ + { + "cell_type": "markdown", + "source": [ + "# ശീതകാലത്തും വേനലിലും NYC ടാക്സി ഡാറ്റ\r\n", + "\r\n", + "നൽകിയിരിക്കുന്ന കോളങ്ങളേക്കുറിച്ച് കൂടുതൽ അറിയാൻ [ഡാറ്റാ നിഘണ്ടു](https://www1.nyc.gov/assets/tlc/downloads/pdf/data_dictionary_trip_records_yellow.pdf) കാണുക.\n" + ], + "metadata": {} + }, + { + "cell_type": "code", + "execution_count": null, + "source": [ + "#Install the pandas library\r\n", + "!pip install pandas" + ], + "outputs": [], + "metadata": { + "scrolled": true + } + }, + { + "cell_type": "code", + "execution_count": 7, + "source": [ + "import pandas as pd\r\n", + "\r\n", + "path = '../../data/taxi.csv'\r\n", + "\r\n", + "#Load the csv file into a dataframe\r\n", + "df = pd.read_csv(path)\r\n", + "\r\n", + "#Print the dataframe\r\n", + "print(df)\r\n" + ], + "outputs": [ + { + "output_type": "stream", + "name": "stdout", + "text": [ + " VendorID tpep_pickup_datetime tpep_dropoff_datetime passenger_count \\\n", + "0 2.0 2019-07-15 16:27:53 2019-07-15 16:44:21 3.0 \n", + "1 2.0 2019-07-17 20:26:35 2019-07-17 20:40:09 6.0 \n", + "2 2.0 2019-07-06 16:01:08 2019-07-06 16:10:25 1.0 \n", + "3 1.0 2019-07-18 22:32:23 2019-07-18 22:35:08 1.0 \n", + "4 2.0 2019-07-19 14:54:29 2019-07-19 15:19:08 1.0 \n", + ".. ... ... ... ... \n", + "195 2.0 2019-01-18 08:42:15 2019-01-18 08:56:57 1.0 \n", + "196 1.0 2019-01-19 04:34:45 2019-01-19 04:43:44 1.0 \n", + "197 2.0 2019-01-05 10:37:39 2019-01-05 10:42:03 1.0 \n", + "198 2.0 2019-01-23 10:36:29 2019-01-23 10:44:34 2.0 \n", + "199 2.0 2019-01-30 06:55:58 2019-01-30 07:07:02 5.0 \n", + "\n", + " trip_distance RatecodeID store_and_fwd_flag PULocationID DOLocationID \\\n", + "0 2.02 1.0 N 186 233 \n", + "1 1.59 1.0 N 141 161 \n", + "2 1.69 1.0 N 246 249 \n", + "3 0.90 1.0 N 229 141 \n", + "4 4.79 1.0 N 237 107 \n", + ".. ... ... ... ... ... \n", + "195 1.18 1.0 N 43 237 \n", + "196 2.30 1.0 N 148 234 \n", + "197 0.83 1.0 N 237 263 \n", + "198 1.12 1.0 N 144 113 \n", + "199 2.41 1.0 N 209 107 \n", + "\n", + " payment_type fare_amount extra mta_tax tip_amount tolls_amount \\\n", + "0 1.0 12.0 1.0 0.5 4.08 0.0 \n", + "1 2.0 10.0 0.5 0.5 0.00 0.0 \n", + "2 2.0 8.5 0.0 0.5 0.00 0.0 \n", + "3 1.0 4.5 3.0 0.5 1.65 0.0 \n", + "4 1.0 19.5 0.0 0.5 5.70 0.0 \n", + ".. ... ... ... ... ... ... \n", + "195 1.0 10.0 0.0 0.5 2.16 0.0 \n", + "196 1.0 9.5 0.5 0.5 2.15 0.0 \n", + "197 1.0 5.0 0.0 0.5 1.16 0.0 \n", + "198 2.0 7.0 0.0 0.5 0.00 0.0 \n", + "199 1.0 10.5 0.0 0.5 1.00 0.0 \n", + "\n", + " improvement_surcharge total_amount congestion_surcharge \n", + "0 0.3 20.38 2.5 \n", + "1 0.3 13.80 2.5 \n", + "2 0.3 11.80 2.5 \n", + "3 0.3 9.95 2.5 \n", + "4 0.3 28.50 2.5 \n", + ".. ... ... ... \n", + "195 0.3 12.96 0.0 \n", + "196 0.3 12.95 0.0 \n", + "197 0.3 6.96 0.0 \n", + "198 0.3 7.80 0.0 \n", + "199 0.3 12.30 0.0 \n", + "\n", + "[200 rows x 18 columns]\n" + ] + } + ], + "metadata": {} + }, + { + "cell_type": "markdown", + "source": [ + "# നിങ്ങളുടെ സ്വന്തം എക്സ്പ്ലോറട്ടറി ഡാറ്റാ അനാലിസിസ് ചെയ്യാൻ താഴെയുള്ള സെല്ലുകൾ ഉപയോഗിക്കുക\n" + ], + "metadata": {} + }, + { + "cell_type": "code", + "execution_count": null, + "source": [], + "outputs": [], + "metadata": {} + }, + { + "cell_type": "markdown", + "metadata": {}, + "source": [ + "---\n\n\n**അസൂയാ**: \nഈ രേഖ AI വിവർത്തന സേവനം [Co-op Translator](https://github.com/Azure/co-op-translator) ഉപയോഗിച്ച് വിവർത്തനം ചെയ്തതാണ്. നാം കൃത്യതയ്ക്ക് ശ്രമിച്ചെങ്കിലും, സ്വയം പ്രവർത്തിക്കുന്ന വിവർത്തനങ്ങളിൽ പിശകുകൾ അല്ലെങ്കിൽ തെറ്റുകൾ ഉണ്ടാകാമെന്ന് ദയവായി ശ്രദ്ധിക്കുക. അതിന്റെ മാതൃഭാഷയിലുള്ള യഥാർത്ഥ രേഖ പ്രാമാണികമായ ഉറവിടമായി കണക്കാക്കണം. നിർണായക വിവരങ്ങൾക്ക്, പ്രൊഫഷണൽ മനുഷ്യ വിവർത്തനം ശുപാർശ ചെയ്യപ്പെടുന്നു. ഈ വിവർത്തനത്തിന്റെ ഉപയോഗത്തിൽ നിന്നുണ്ടാകുന്ന ഏതെങ്കിലും തെറ്റിദ്ധാരണകൾക്കോ തെറ്റായ വ്യാഖ്യാനങ്ങൾക്കോ ഞങ്ങൾ ഉത്തരവാദികളല്ല.\n\n" + ] + } + ], + "metadata": { + "kernelspec": { + "name": "python3", + "display_name": "Python 3.9.7 64-bit ('venv': venv)" + }, + "language_info": { + "mimetype": "text/x-python", + "name": "python", + "pygments_lexer": "ipython3", + "codemirror_mode": { + "name": "ipython", + "version": 3 + }, + "version": "3.9.7", + "nbconvert_exporter": "python", + "file_extension": ".py" + }, + "name": "04-nyc-taxi-join-weather-in-pandas", + "notebookId": 1709144033725344, + "interpreter": { + "hash": "6b9b57232c4b57163d057191678da2030059e733b8becc68f245de5a75abe84e" + }, + "coopTranslator": { + "original_hash": "7bca1c1abc1e55842817b62e44e1a963", + "translation_date": "2025-12-19T17:11:31+00:00", + "source_file": "4-Data-Science-Lifecycle/15-analyzing/assignment.ipynb", + "language_code": "ml" + } + }, + "nbformat": 4, + "nbformat_minor": 2 +} \ No newline at end of file diff --git a/translations/ml/4-Data-Science-Lifecycle/15-analyzing/assignment.md b/translations/ml/4-Data-Science-Lifecycle/15-analyzing/assignment.md new file mode 100644 index 00000000..e9f9a9f8 --- /dev/null +++ b/translations/ml/4-Data-Science-Lifecycle/15-analyzing/assignment.md @@ -0,0 +1,38 @@ + +# ഉത്തരം അന്വേഷിക്കൽ + +ഇത് മുൻപത്തെ പാഠത്തിന്റെ [അസൈൻമെന്റ്](../14-Introduction/assignment.md) തുടർച്ചയാണ്, അവിടെ നാം ഡാറ്റാ സെറ്റിനെ കുറിച്ച് സംക്ഷിപ്തമായി നോക്കിയിരുന്നു. ഇപ്പോൾ നാം ഡാറ്റയെ കൂടുതൽ ആഴത്തിൽ പരിശോധിക്കാനാണ് പോകുന്നത്. + +വീണ്ടും, ക്ലയന്റ് അറിയാൻ ആഗ്രഹിക്കുന്ന ചോദ്യം: **ന്യൂയോർക്ക് സിറ്റിയിലെ മഞ്ഞ ടാക്സി യാത്രക്കാരൻമാർ ശീതകാലത്തോ വേനൽക്കാലത്തോ ഡ്രൈവർമാർക്ക് കൂടുതൽ ടിപ്പ് നൽകുന്നുണ്ടോ?** + +നിങ്ങളുടെ ടീം ഡാറ്റ സയൻസ് ലൈഫ്‌സൈക്കിളിന്റെ [വിശകലനം](README.md) ഘട്ടത്തിലാണ്, ഇവിടെ നിങ്ങൾക്ക് ഡാറ്റാസെറ്റിൽ എക്സ്പ്ലോറട്ടറി ഡാറ്റാ അനാലിസിസ് നടത്തേണ്ടതാണ്. 2019 ജനുവരി, ജൂലൈ മാസങ്ങളിൽ നിന്നുള്ള 200 ടാക്സി ഇടപാടുകൾ അടങ്ങിയ ഒരു നോട്ട്‌ബുക്ക്, ഡാറ്റാസെറ്റ് എന്നിവ നിങ്ങൾക്ക് നൽകിയിട്ടുണ്ട്. + +## നിർദ്ദേശങ്ങൾ + +ഈ ഡയറക്ടറിയിൽ [നോട്ട്‌ബുക്ക്](assignment.ipynb) ഉം [ടാക്സി & ലിമോസിൻ കമ്മീഷൻ](https://docs.microsoft.com/en-us/azure/open-datasets/dataset-taxi-yellow?tabs=azureml-opendatasets) നിന്നുള്ള ഡാറ്റയും ഉണ്ട്. ഡാറ്റയെക്കുറിച്ച് കൂടുതൽ വിവരങ്ങൾക്ക് [ഡാറ്റാസെറ്റിന്റെ നിഘണ്ടു](https://www1.nyc.gov/assets/tlc/downloads/pdf/data_dictionary_trip_records_yellow.pdf) ഉം [ഉപയോക്തൃ ഗൈഡ്](https://www1.nyc.gov/assets/tlc/downloads/pdf/trip_record_user_guide.pdf) ഉം കാണുക. + +ഈ പാഠത്തിലെ ചില സാങ്കേതിക വിദ്യകൾ ഉപയോഗിച്ച് നോട്ട്‌ബുക്കിൽ നിങ്ങളുടെ സ്വന്തം EDA നടത്തുക (ആവശ്യമായാൽ സെല്ലുകൾ ചേർക്കാം) കൂടാതെ താഴെക്കാണുന്ന ചോദ്യങ്ങൾക്ക് ഉത്തരം നൽകുക: + +- ടിപ്പ് തുകയെ ബാധിക്കാവുന്ന മറ്റ് ഡാറ്റാ സ്വാധീനങ്ങൾ എന്തെല്ലാം ഉണ്ടാകാം? +- ക്ലയന്റിന്റെ ചോദ്യങ്ങൾക്ക് ഉത്തരം നൽകാൻ ഏത് കോളങ്ങൾ ആവശ്യമില്ലാതിരിക്കാം? +- ഇതുവരെ നൽകിയ ഡാറ്റ അടിസ്ഥാനമാക്കി, സീസണൽ ടിപ്പിംഗ് പെരുമാറ്റത്തിന് ഏതെങ്കിലും തെളിവുകൾ ഡാറ്റ നൽകുന്നുണ്ടോ? + +## റൂബ്രിക് + +Exemplary | Adequate | Needs Improvement +--- | --- | -- | + +--- + + +**അസൂയാപത്രം**: +ഈ രേഖ AI വിവർത്തന സേവനം [Co-op Translator](https://github.com/Azure/co-op-translator) ഉപയോഗിച്ച് വിവർത്തനം ചെയ്തതാണ്. നാം കൃത്യതയ്ക്ക് ശ്രമിച്ചിട്ടുണ്ടെങ്കിലും, സ്വയം പ്രവർത്തിക്കുന്ന വിവർത്തനങ്ങളിൽ പിശകുകൾ അല്ലെങ്കിൽ തെറ്റുകൾ ഉണ്ടാകാമെന്ന് ദയവായി ശ്രദ്ധിക്കുക. അതിന്റെ മാതൃഭാഷയിലുള്ള യഥാർത്ഥ രേഖ പ്രാമാണികമായ ഉറവിടമായി കണക്കാക്കപ്പെടണം. നിർണായകമായ വിവരങ്ങൾക്ക്, പ്രൊഫഷണൽ മനുഷ്യ വിവർത്തനം ശുപാർശ ചെയ്യപ്പെടുന്നു. ഈ വിവർത്തനം ഉപയോഗിക്കുന്നതിൽ നിന്നുണ്ടാകുന്ന ഏതെങ്കിലും തെറ്റിദ്ധാരണകൾക്കോ തെറ്റായ വ്യാഖ്യാനങ്ങൾക്കോ ഞങ്ങൾ ഉത്തരവാദികളല്ല. + \ No newline at end of file diff --git a/translations/ml/4-Data-Science-Lifecycle/15-analyzing/notebook.ipynb b/translations/ml/4-Data-Science-Lifecycle/15-analyzing/notebook.ipynb new file mode 100644 index 00000000..b0d32101 --- /dev/null +++ b/translations/ml/4-Data-Science-Lifecycle/15-analyzing/notebook.ipynb @@ -0,0 +1,193 @@ +{ + "cells": [ + { + "cell_type": "markdown", + "source": [ + "# ഡാറ്റ വിശകലനം \n", + "[പാഠം](README.md)യിൽ പരാമർശിച്ച പാൻഡാസ് ഫംഗ്ഷനുകളുടെ ഉദാഹരണങ്ങൾ.\n" + ], + "metadata": {} + }, + { + "cell_type": "code", + "execution_count": 1, + "source": [ + "import pandas as pd\r\n", + "import glob\r\n", + "\r\n", + "#Loading the dataset\r\n", + "path = '../../data/emails.csv'\r\n", + "email_df = pd.read_csv(path)" + ], + "outputs": [], + "metadata": {} + }, + { + "cell_type": "code", + "execution_count": 2, + "source": [ + "# Using Describe on the email dataset\r\n", + "print(email_df.describe())" + ], + "outputs": [ + { + "output_type": "stream", + "name": "stdout", + "text": [ + " the to ect and for of \\\n", + "count 406.000000 406.000000 406.000000 406.000000 406.000000 406.000000 \n", + "mean 7.022167 6.519704 4.948276 3.059113 3.502463 2.662562 \n", + "std 10.945522 9.801907 9.293820 6.267806 4.901372 5.443939 \n", + "min 0.000000 0.000000 1.000000 0.000000 0.000000 0.000000 \n", + "25% 1.000000 1.000000 1.000000 0.000000 1.000000 0.000000 \n", + "50% 3.000000 3.000000 2.000000 1.000000 2.000000 1.000000 \n", + "75% 9.000000 7.750000 4.000000 3.000000 4.750000 3.000000 \n", + "max 99.000000 88.000000 79.000000 69.000000 39.000000 57.000000 \n", + "\n", + " a you in on is this \\\n", + "count 406.000000 406.000000 406.000000 406.000000 406.000000 406.000000 \n", + "mean 57.017241 2.394089 10.817734 11.591133 5.901478 1.485222 \n", + "std 78.868243 4.067015 19.050972 16.407175 8.793103 2.912473 \n", + "min 0.000000 0.000000 0.000000 0.000000 0.000000 0.000000 \n", + "25% 15.000000 0.000000 1.250000 3.000000 1.000000 0.000000 \n", + "50% 29.000000 1.000000 5.000000 6.000000 3.000000 0.000000 \n", + "75% 61.000000 3.000000 12.000000 13.000000 7.000000 2.000000 \n", + "max 843.000000 31.000000 223.000000 125.000000 61.000000 24.000000 \n", + "\n", + " i be that will \n", + "count 406.000000 406.000000 406.000000 406.000000 \n", + "mean 47.155172 2.950739 1.034483 0.955665 \n", + "std 71.043009 4.297865 1.904846 2.042271 \n", + "min 0.000000 0.000000 0.000000 0.000000 \n", + "25% 11.000000 1.000000 0.000000 0.000000 \n", + "50% 24.000000 1.000000 0.000000 0.000000 \n", + "75% 50.750000 3.000000 1.000000 1.000000 \n", + "max 754.000000 40.000000 14.000000 24.000000 \n" + ] + } + ], + "metadata": {} + }, + { + "cell_type": "code", + "execution_count": 5, + "source": [ + "# Sampling 10 emails\r\n", + "print(email_df.sample(10))" + ], + "outputs": [ + { + "output_type": "stream", + "name": "stdout", + "text": [ + " Email No. the to ect and for of a you in on is this i \\\n", + "150 Email 151 0 1 2 0 3 0 15 0 0 5 0 0 7 \n", + "380 Email 5147 0 3 2 0 0 0 7 0 1 1 0 0 3 \n", + "19 Email 20 3 4 11 0 4 2 32 1 1 3 9 5 25 \n", + "300 Email 301 2 1 1 0 1 1 15 2 2 3 2 0 8 \n", + "307 Email 308 0 0 1 0 0 0 1 0 1 0 0 0 2 \n", + "167 Email 168 2 2 2 1 5 1 24 2 5 6 4 0 30 \n", + "320 Email 321 10 12 4 6 8 6 187 5 26 28 23 2 171 \n", + "61 Email 62 0 1 1 0 4 1 15 4 4 3 3 0 19 \n", + "26 Email 27 5 4 1 1 4 4 51 0 8 6 6 2 44 \n", + "73 Email 74 0 0 1 0 0 0 7 0 4 3 0 0 6 \n", + "\n", + " be that will \n", + "150 1 0 0 \n", + "380 0 0 0 \n", + "19 3 0 1 \n", + "300 0 0 0 \n", + "307 0 0 0 \n", + "167 2 0 0 \n", + "320 5 1 1 \n", + "61 2 0 0 \n", + "26 6 0 0 \n", + "73 0 0 0 \n" + ] + } + ], + "metadata": {} + }, + { + "cell_type": "code", + "execution_count": 14, + "source": [ + "# Returns rows where there are more occurrences of \"to\" than \"the\"\r\n", + "print(email_df.query('the < to'))" + ], + "outputs": [ + { + "output_type": "stream", + "name": "stdout", + "text": [ + " Email No. the to ect and for of a you in on is this i \\\n", + "1 Email 2 8 13 24 6 6 2 102 1 18 21 13 0 61 \n", + "3 Email 4 0 5 22 0 5 1 51 2 1 5 9 2 16 \n", + "5 Email 6 4 5 1 4 2 3 45 1 16 12 8 1 52 \n", + "7 Email 8 0 2 2 3 1 2 21 6 2 6 2 0 28 \n", + "13 Email 14 4 5 7 1 5 1 37 1 8 8 6 1 43 \n", + ".. ... ... .. ... ... ... .. ... ... .. .. .. ... .. \n", + "390 Email 5157 4 13 1 0 3 1 48 2 8 26 9 1 45 \n", + "393 Email 5160 2 13 1 0 2 1 38 2 7 24 6 1 34 \n", + "396 Email 5163 2 3 1 2 1 2 32 0 7 3 2 0 26 \n", + "404 Email 5171 2 7 1 0 2 1 28 2 8 11 7 1 39 \n", + "405 Email 5172 22 24 5 1 6 5 148 8 23 13 5 4 99 \n", + "\n", + " be that will \n", + "1 4 2 0 \n", + "3 2 0 0 \n", + "5 2 0 0 \n", + "7 1 0 1 \n", + "13 1 0 1 \n", + ".. .. ... ... \n", + "390 1 0 0 \n", + "393 1 0 0 \n", + "396 3 0 0 \n", + "404 1 0 0 \n", + "405 6 4 1 \n", + "\n", + "[169 rows x 17 columns]\n" + ] + } + ], + "metadata": {} + }, + { + "cell_type": "markdown", + "metadata": {}, + "source": [ + "---\n\n\n**അസൂയാ**: \nഈ രേഖ AI വിവർത്തന സേവനം [Co-op Translator](https://github.com/Azure/co-op-translator) ഉപയോഗിച്ച് വിവർത്തനം ചെയ്തതാണ്. നാം കൃത്യതയ്ക്ക് ശ്രമിച്ചിട്ടുണ്ടെങ്കിലും, സ്വയം പ്രവർത്തിക്കുന്ന വിവർത്തനങ്ങളിൽ പിശകുകൾ അല്ലെങ്കിൽ തെറ്റുകൾ ഉണ്ടാകാമെന്ന് ദയവായി ശ്രദ്ധിക്കുക. അതിന്റെ മാതൃഭാഷയിലുള്ള യഥാർത്ഥ രേഖയാണ് പ്രാമാണികമായ ഉറവിടം എന്ന് പരിഗണിക്കേണ്ടതാണ്. നിർണായകമായ വിവരങ്ങൾക്ക്, പ്രൊഫഷണൽ മനുഷ്യ വിവർത്തനം ശുപാർശ ചെയ്യപ്പെടുന്നു. ഈ വിവർത്തനം ഉപയോഗിക്കുന്നതിൽ നിന്നുണ്ടാകുന്ന ഏതെങ്കിലും തെറ്റിദ്ധാരണകൾക്കോ തെറ്റായ വ്യാഖ്യാനങ്ങൾക്കോ ഞങ്ങൾ ഉത്തരവാദികളല്ല.\n\n" + ] + } + ], + "metadata": { + "orig_nbformat": 4, + "language_info": { + "name": "python", + "version": "3.9.7", + "mimetype": "text/x-python", + "codemirror_mode": { + "name": "ipython", + "version": 3 + }, + "pygments_lexer": "ipython3", + "nbconvert_exporter": "python", + "file_extension": ".py" + }, + "kernelspec": { + "name": "python3", + "display_name": "Python 3.9.7 64-bit ('venv': venv)" + }, + "interpreter": { + "hash": "6b9b57232c4b57163d057191678da2030059e733b8becc68f245de5a75abe84e" + }, + "coopTranslator": { + "original_hash": "9d102c8c3cdbc8ea4e92fc32593462c6", + "translation_date": "2025-12-19T17:11:08+00:00", + "source_file": "4-Data-Science-Lifecycle/15-analyzing/notebook.ipynb", + "language_code": "ml" + } + }, + "nbformat": 4, + "nbformat_minor": 2 +} \ No newline at end of file diff --git a/translations/ml/4-Data-Science-Lifecycle/16-communication/README.md b/translations/ml/4-Data-Science-Lifecycle/16-communication/README.md new file mode 100644 index 00000000..37e4295e --- /dev/null +++ b/translations/ml/4-Data-Science-Lifecycle/16-communication/README.md @@ -0,0 +1,224 @@ + +# ഡാറ്റ സയൻസ് ലൈഫ്‌സൈക്കിൾ: കമ്മ്യൂണിക്കേഷൻ + +|![ Sketchnote by [(@sketchthedocs)](https://sketchthedocs.dev)](../../sketchnotes/16-Communicating.png)| +|:---:| +| ഡാറ്റ സയൻസ് ലൈഫ്‌സൈക്കിൾ: കമ്മ്യൂണിക്കേഷൻ - _സ്കെച്ച്നോട്ട് [@nitya](https://twitter.com/nitya) എന്നവരാൽ_ | + +## [പ്രി-ലെക്ചർ ക്വിസ്](https://ff-quizzes.netlify.app/en/ds/quiz/30) + +മുകളിൽ നൽകിയ പ്രി-ലെക്ചർ ക്വിസിലൂടെ വരാനിരിക്കുന്നതിന്റെ നിങ്ങളുടെ അറിവ് പരീക്ഷിക്കൂ! + +# പരിചയം + +### കമ്മ്യൂണിക്കേഷൻ എന്താണ്? +കമ്മ്യൂണിക്കേഷൻ എന്താണെന്ന് നിർവചിക്കുന്നതിലൂടെ ഈ പാഠം ആരംഭിക്കാം. **കമ്മ്യൂണിക്കേഷൻ എന്നത് വിവരങ്ങൾ കൈമാറുകയോ കൈമാറ്റം നടത്തുകയോ ചെയ്യുന്നതാണ്.** വിവരങ്ങൾ ആശയങ്ങൾ, ചിന്തകൾ, അനുഭവങ്ങൾ, സന്ദേശങ്ങൾ, രഹസ്യ സൂചനകൾ, ഡാറ്റ എന്നിവയാകാം – ഒരു **_സെൻഡർ_** (വിവരം അയക്കുന്നവൻ) ഒരു **_റിസീവർ_** (വിവരം സ്വീകരിക്കുന്നവൻ) മനസിലാക്കാൻ ആഗ്രഹിക്കുന്ന ഏതെങ്കിലും വസ്തു. ഈ പാഠത്തിൽ, സെൻഡർമാരെ കമ്മ്യൂണിക്കേറ്റർമാരായി, റിസീവർമാരെ പ്രേക്ഷകരായി പരാമർശിക്കും. + +### ഡാറ്റ കമ്മ്യൂണിക്കേഷൻ & കഥ പറയൽ +കമ്മ്യൂണിക്കേഷൻ ചെയ്യുമ്പോൾ ലക്ഷ്യം വിവരങ്ങൾ കൈമാറുകയോ കൈമാറ്റം നടത്തുകയോ ചെയ്യുന്നതാണെന്ന് നമുക്ക് മനസ്സിലായിട്ടുണ്ട്. എന്നാൽ ഡാറ്റ കമ്മ്യൂണിക്കേഷൻ ചെയ്യുമ്പോൾ, നിങ്ങളുടെ പ്രേക്ഷകർക്കു സംഖ്യകൾ മാത്രം കൈമാറുക എന്നത് ലക്ഷ്യമാകരുത്. നിങ്ങളുടെ ഡാറ്റയിൽ നിന്നുള്ള ഒരു കഥ കമ്മ്യൂണിക്കേറ്റ് ചെയ്യുക എന്നതാണ് ലക്ഷ്യം - ഫലപ്രദമായ ഡാറ്റ കമ്മ്യൂണിക്കേഷൻയും കഥ പറയലും കൈകോർത്ത് നടക്കുന്നു. നിങ്ങൾ പറയുന്ന കഥ പ്രേക്ഷകർക്ക് ഒരു സംഖ്യ നൽകുന്നതേക്കാൾ കൂടുതൽ ഓർമ്മയിൽ നിൽക്കും. ഈ പാഠത്തിൽ പിന്നീട്, ഡാറ്റ കൂടുതൽ ഫലപ്രദമായി കമ്മ്യൂണിക്കേറ്റ് ചെയ്യാൻ കഥ പറയൽ ഉപയോഗിക്കുന്ന ചില മാർഗങ്ങൾ പരിശോധിക്കും. + +### കമ്മ്യൂണിക്കേഷന്റെ തരം +ഈ പാഠത്തിൽ രണ്ട് വ്യത്യസ്ത തരത്തിലുള്ള കമ്മ്യൂണിക്കേഷൻ ചർച്ച ചെയ്യും, ഒന്ന്-വേ കമ്മ്യൂണിക്കേഷൻ, രണ്ട്-വേ കമ്മ്യൂണിക്കേഷൻ. + +**ഒന്ന്-വേ കമ്മ്യൂണിക്കേഷൻ** സെൻഡർ ഒരു റിസീവറിലേക്ക് വിവരങ്ങൾ അയയ്ക്കുമ്പോൾ, പ്രതികരണമോ ഫീഡ്ബാക്കോ ഇല്ലാതെ നടക്കുന്നു. നാം ദിവസേന ഒന്ന്-വേ കമ്മ്യൂണിക്കേഷന്റെ ഉദാഹരണങ്ങൾ കാണുന്നു – ബൾക്ക്/മാസ് ഇമെയിലുകളിൽ, വാർത്തകൾ ഏറ്റവും പുതിയ കഥകൾ നൽകുമ്പോൾ, അല്ലെങ്കിൽ ഒരു ടെലിവിഷൻ പരസ്യം അവരുടെ ഉൽപ്പന്നം എങ്ങനെ മികച്ചതാണെന്ന് അറിയിക്കുമ്പോൾ. ഈ എല്ലാ സാഹചര്യങ്ങളിലും, സെൻഡർ വിവരങ്ങൾ കൈമാറാൻ മാത്രമാണ് ശ്രമിക്കുന്നത്. + +**രണ്ട്-വേ കമ്മ്യൂണിക്കേഷൻ** എല്ലാ പങ്കാളികളും സെൻഡറും റിസീവറും ആയി പ്രവർത്തിക്കുമ്പോൾ നടക്കുന്നു. ഒരു സെൻഡർ ഒരു റിസീവറിലേക്ക് കമ്മ്യൂണിക്കേറ്റ് ചെയ്യുന്നു, റിസീവർ ഫീഡ്ബാക്ക് അല്ലെങ്കിൽ പ്രതികരണം നൽകുന്നു. രണ്ട്-വേ കമ്മ്യൂണിക്കേഷൻ സാധാരണയായി നമ്മൾ കമ്മ്യൂണിക്കേഷൻ എന്ന് പറയുമ്പോൾ മനസ്സിലാക്കുന്നത് ആണ്. സാധാരണയായി ആളുകൾ ഒരു സംഭാഷണത്തിൽ ഏർപ്പെടുന്നുവെന്ന് കരുതുന്നു - നേരിൽ, ഫോൺ കോൾ, സോഷ്യൽ മീഡിയ, അല്ലെങ്കിൽ ടെക്സ്റ്റ് സന്ദേശം വഴി. + +ഡാറ്റ കമ്മ്യൂണിക്കേഷൻ ചെയ്യുമ്പോൾ, ചിലപ്പോൾ നിങ്ങൾ ഒന്ന്-വേ കമ്മ്യൂണിക്കേഷൻ ഉപയോഗിക്കും (ഉദാഹരണത്തിന്, ഒരു സമ്മേളനത്തിൽ പ്രദർശിപ്പിക്കുമ്പോൾ, അല്ലെങ്കിൽ വലിയ കൂട്ടത്തിൽ നേരിട്ട് ചോദ്യങ്ങൾ ചോദിക്കപ്പെടാത്തപ്പോൾ) കൂടാതെ ചിലപ്പോൾ രണ്ട്-വേ കമ്മ്യൂണിക്കേഷൻ ഉപയോഗിക്കും (ഉദാഹരണത്തിന്, ചില സ്റ്റേക്ക്‌ഹോൾഡർമാരെ ബൈ-ഇൻക്ക് പ്രേരിപ്പിക്കാൻ, അല്ലെങ്കിൽ ഒരു ടീമംഗത്തെ പുതിയ ഒന്നൊരുക്കാൻ സമയം, ശ്രമം ചെലവഴിക്കണമെന്ന് മനസ്സിലാക്കാൻ). + +# ഫലപ്രദമായ കമ്മ്യൂണിക്കേഷൻ + +### കമ്മ്യൂണിക്കേറ്ററായി നിങ്ങളുടെ ഉത്തരവാദിത്വങ്ങൾ +കമ്മ്യൂണിക്കേഷൻ ചെയ്യുമ്പോൾ, നിങ്ങളുടെ റിസീവർ(മാർ) നിങ്ങൾ ആഗ്രഹിക്കുന്ന വിവരങ്ങൾ സ്വീകരിക്കുന്നുണ്ടെന്ന് ഉറപ്പാക്കുക നിങ്ങളുടെ ജോലി ആണ്. ഡാറ്റ കമ്മ്യൂണിക്കേറ്റ് ചെയ്യുമ്പോൾ, നിങ്ങൾക്ക് റിസീവർമാരെ സംഖ്യകൾ മാത്രം സ്വീകരിക്കാൻ ആഗ്രഹമില്ല, ഡാറ്റയിൽ നിന്നുള്ള ഒരു കഥ അവർക്ക് മനസ്സിലാകണം. നല്ല ഡാറ്റ കമ്മ്യൂണിക്കേറ്റർ നല്ല കഥ പറയുന്നവനാണ്. + +ഡാറ്റയോടെ കഥ എങ്ങനെ പറയാം? അനന്തമായ മാർഗങ്ങൾ ഉണ്ട് – എന്നാൽ താഴെ 6 മാർഗങ്ങൾ ഈ പാഠത്തിൽ ചർച്ച ചെയ്യും. +1. നിങ്ങളുടെ പ്രേക്ഷകരെ, നിങ്ങളുടെ മീഡിയം, & നിങ്ങളുടെ കമ്മ്യൂണിക്കേഷൻ രീതി മനസ്സിലാക്കുക +2. അവസാനത്തെ മനസ്സിലാക്കി തുടങ്ങുക +3. ഒരു യഥാർത്ഥ കഥപോലെ സമീപിക്കുക +4. അർത്ഥമുള്ള വാക്കുകളും വാചകങ്ങളും ഉപയോഗിക്കുക +5. ഭാവന ഉപയോഗിക്കുക + +ഈ ഓരോ തന്ത്രങ്ങളും താഴെ കൂടുതൽ വിശദമായി വിശദീകരിച്ചിരിക്കുന്നു. + +### 1. നിങ്ങളുടെ പ്രേക്ഷകരെ, നിങ്ങളുടെ ചാനൽ & നിങ്ങളുടെ കമ്മ്യൂണിക്കേഷൻ രീതി മനസ്സിലാക്കുക +നിങ്ങൾ കുടുംബാംഗങ്ങളുമായി സംസാരിക്കുന്ന വിധം നിങ്ങളുടെ സുഹൃത്തുക്കളുമായി സംസാരിക്കുന്ന വിധത്തിൽ നിന്ന് വ്യത്യസ്തമായിരിക്കാം. നിങ്ങൾ സംസാരിക്കുന്ന ആളുകൾക്ക് മനസ്സിലാകാൻ സാധ്യതയുള്ള വ്യത്യസ്ത വാക്കുകളും വാചകങ്ങളും നിങ്ങൾ ഉപയോഗിക്കാം. ഡാറ്റ കമ്മ്യൂണിക്കേഷൻ ചെയ്യുമ്പോഴും അതേ സമീപനം സ്വീകരിക്കണം. നിങ്ങൾ ആരെ കമ്മ്യൂണിക്കേറ്റ് ചെയ്യുകയാണ് എന്ന് ചിന്തിക്കുക. അവരുടെ ലക്ഷ്യങ്ങളും നിങ്ങൾ വിശദീകരിക്കുന്ന സാഹചര്യവും പരിഗണിക്കുക. + +നിങ്ങളുടെ പ്രേക്ഷകരുടെ ഭൂരിഭാഗം ഒരു വിഭാഗത്തിൽ ഉൾപ്പെടുത്താൻ സാധിക്കും. _ഹാർവാർഡ് ബിസിനസ് റിവ്യൂ_ ലേഖനമായ “[How to Tell a Story with Data](http://blogs.hbr.org/2013/04/how-to-tell-a-story-with-data/)” ൽ, ഡെൽ എക്സിക്യൂട്ടീവ് സ്ട്രാറ്റജിസ്റ്റ് ജിം സ്റ്റിക്കിലീഥർ അഞ്ച് പ്രേക്ഷക വിഭാഗങ്ങൾ തിരിച്ചറിഞ്ഞിട്ടുണ്ട്. + + - **നോവിസ്**: വിഷയം ആദ്യമായി പരിചയപ്പെടുന്നു, എന്നാൽ അതി ലളിതീകരണം വേണ്ട + - **ജനറലിസ്റ്റ്**: വിഷയം അറിയുന്നു, എന്നാൽ ഒരു അവലോകനവും പ്രധാന വിഷയങ്ങളും അന്വേഷിക്കുന്നു + - **മാനേജീരിയൽ**: സങ്കീർണ്ണതകളും പരസ്പരബന്ധങ്ങളും ഉൾപ്പെടെയുള്ള ആഴത്തിലുള്ള, പ്രായോഗിക മനസ്സിലാക്കൽ, വിശദാംശങ്ങൾ ലഭ്യമാക്കുന്നു + - **എക്സ്പർട്ട്**: കൂടുതൽ അന്വേഷണവും കണ്ടെത്തലും, കുറവ് കഥ പറയലും, കൂടുതൽ വിശദാംശങ്ങളോടെ + - **എക്സിക്യൂട്ടീവ്**: ഭാരമുള്ള സാധ്യതകളുടെ പ്രാധാന്യവും നിഗമനങ്ങളും മാത്രം മനസ്സിലാക്കാൻ സമയം ഉണ്ട് + +ഈ വിഭാഗങ്ങൾ നിങ്ങളുടെ പ്രേക്ഷകർക്ക് ഡാറ്റ അവതരിപ്പിക്കുന്ന രീതിയെ സ്വാധീനിക്കും. + +നിങ്ങളുടെ പ്രേക്ഷകന്റെ വിഭാഗം ചിന്തിക്കുന്നതിനു പുറമേ, നിങ്ങൾ ഉപയോഗിക്കുന്ന ചാനലും പരിഗണിക്കണം. മെമ്മോ അല്ലെങ്കിൽ ഇമെയിൽ എഴുതുമ്പോൾ നിങ്ങളുടെ സമീപനം മീറ്റിംഗ് നടത്തുമ്പോൾ അല്ലെങ്കിൽ സമ്മേളനത്തിൽ പ്രദർശിപ്പിക്കുമ്പോൾ നിന്ന് അല്പം വ്യത്യസ്തമായിരിക്കണം. + +നിങ്ങളുടെ പ്രേക്ഷകരെ മനസ്സിലാക്കുന്നതിന് പുറമേ, നിങ്ങൾ അവരുമായി എങ്ങനെ കമ്മ്യൂണിക്കേറ്റ് ചെയ്യുമെന്ന് (ഒന്ന്-വേ അല്ലെങ്കിൽ രണ്ട്-വേ) അറിയുക അത്യന്താപേക്ഷിതമാണ്. + +നിങ്ങൾ ഭൂരിഭാഗം നോവിസ് പ്രേക്ഷകരുമായി ഒന്ന്-വേ കമ്മ്യൂണിക്കേഷൻ ഉപയോഗിച്ച് സംസാരിക്കുകയാണെങ്കിൽ, ആദ്യം പ്രേക്ഷകരെ വിദ്യാഭ്യാസം നൽകുകയും ശരിയായ പശ്ചാത്തലം നൽകുകയും വേണം. തുടർന്ന് നിങ്ങളുടെ ഡാറ്റ അവതരിപ്പിച്ച്, ഡാറ്റയുടെ അർത്ഥവും പ്രാധാന്യവും വിശദീകരിക്കണം. ഈ സാഹചര്യത്തിൽ, വ്യക്തത ഉറപ്പാക്കുന്നതിൽ നിങ്ങൾ ശ്രദ്ധ കേന്ദ്രീകരിക്കണം, കാരണം പ്രേക്ഷകർ നേരിട്ട് ചോദ്യങ്ങൾ ചോദിക്കാൻ സാധിക്കില്ല. + +നിങ്ങൾ ഭൂരിഭാഗം മാനേജീരിയൽ പ്രേക്ഷകരുമായി രണ്ട്-വേ കമ്മ്യൂണിക്കേഷൻ ഉപയോഗിച്ച് സംസാരിക്കുകയാണെങ്കിൽ, പ്രേക്ഷകരെ വിദ്യാഭ്യാസം നൽകേണ്ടതില്ല, അല്ലെങ്കിൽ കൂടുതൽ പശ്ചാത്തലം നൽകേണ്ടതില്ല. നിങ്ങൾ ശേഖരിച്ച ഡാറ്റയും അതിന്റെ പ്രാധാന്യവും നേരിട്ട് ചർച്ച ചെയ്യാൻ കഴിയും. എന്നാൽ ഈ സാഹചര്യത്തിൽ, സമയ നിയന്ത്രണവും പ്രദർശന നിയന്ത്രണവും പ്രധാനമാണ്. രണ്ട്-വേ കമ്മ്യൂണിക്കേഷൻ ഉപയോഗിക്കുമ്പോൾ (പ്രത്യേകിച്ച് മാനേജീരിയൽ പ്രേക്ഷകർക്ക്, "സങ്കീർണ്ണതകളും പരസ്പരബന്ധങ്ങളും ഉൾപ്പെടെയുള്ള പ്രായോഗിക മനസ്സിലാക്കൽ" ആവശ്യമായപ്പോൾ), ചോദ്യങ്ങൾ ഉയർന്ന് സംഭാഷണം നിങ്ങൾ പറയാൻ ശ്രമിക്കുന്ന കഥയുമായി ബന്ധപ്പെട്ടില്ലാത്ത ദിശയിലേക്ക് പോകാൻ സാധ്യതയുണ്ട്. അപ്പോൾ നിങ്ങൾ നടപടി സ്വീകരിച്ച് സംഭാഷണം നിങ്ങളുടെ കഥയിലേക്ക് തിരിച്ചു കൊണ്ടുവരാം. + +### 2. അവസാനത്തെ മനസ്സിലാക്കി തുടങ്ങുക +അവസാനത്തെ മനസ്സിലാക്കി തുടങ്ങുക എന്നത്, പ്രേക്ഷകർക്ക് നൽകേണ്ട പ്രധാന സന്ദേശങ്ങൾ നിങ്ങൾ അറിയാതെ കമ്മ്യൂണിക്കേഷൻ ആരംഭിക്കരുത് എന്നർത്ഥമാണ്. നിങ്ങൾക്ക് പ്രേക്ഷകർക്ക് നൽകേണ്ടത് എന്താണെന്ന് മുൻകൂട്ടി ചിന്തിക്കുന്നത്, നിങ്ങൾ പറയാൻ പോകുന്ന കഥയെ രൂപപ്പെടുത്താൻ സഹായിക്കും. അവസാനത്തെ മനസ്സിലാക്കി തുടങ്ങുക ഒന്ന്-വേയും രണ്ട്-വേയും കമ്മ്യൂണിക്കേഷനുകൾക്കും അനുയോജ്യമാണ്. + +എങ്ങനെ അവസാനത്തെ മനസ്സിലാക്കി തുടങ്ങാം? ഡാറ്റ കമ്മ്യൂണിക്കേറ്റ് ചെയ്യുന്നതിന് മുമ്പ്, നിങ്ങളുടെ പ്രധാന സന്ദേശങ്ങൾ എഴുതുക. തുടർന്ന്, ഡാറ്റയോടെ പറയാൻ പോകുന്ന കഥ തയ്യാറാക്കുമ്പോൾ, "ഇത് ഞാൻ പറയുന്ന കഥയുമായി എങ്ങനെ ചേർക്കുന്നു?" എന്ന് സ്വയം ചോദിക്കുക. + +ശ്രദ്ധിക്കുക – അവസാനത്തെ മനസ്സിലാക്കി തുടങ്ങുന്നത് ഉത്തമമാണ്, എന്നാൽ നിങ്ങൾക്ക് നിങ്ങളുടെ ലക്ഷ്യ സന്ദേശങ്ങളെ പിന്തുണയ്ക്കുന്ന ഡാറ്റ മാത്രം കമ്മ്യൂണിക്കേറ്റ് ചെയ്യരുത്. ഇത് ചെറി-പിക്കിംഗ് (Cherry-Picking) എന്ന് വിളിക്കുന്നു, ഒരു കമ്മ്യൂണിക്കേറ്റർ തന്റെ വാദം പിന്തുണയ്ക്കുന്ന ഡാറ്റ മാത്രം കമ്മ്യൂണിക്കേറ്റ് ചെയ്ത് മറ്റ് ഡാറ്റകൾ അവഗണിക്കുമ്പോൾ സംഭവിക്കുന്നു. + +നിങ്ങൾ ശേഖരിച്ച എല്ലാ ഡാറ്റയും നിങ്ങളുടെ ലക്ഷ്യ സന്ദേശങ്ങളെ പിന്തുണച്ചാൽ നല്ലതാണ്. എന്നാൽ നിങ്ങളുടെ ലക്ഷ്യ സന്ദേശങ്ങളെ പിന്തുണയ്ക്കാത്ത ഡാറ്റയോ, അതിന്റെ വിരുദ്ധമായ വാദം പിന്തുണയ്ക്കുന്ന ഡാറ്റയോ ഉണ്ടെങ്കിൽ, അത് കൂടി കമ്മ്യൂണിക്കേറ്റ് ചെയ്യണം. അപ്പോൾ, പ്രേക്ഷകർക്കു നേരിട്ട് പറഞ്ഞ്, എല്ലാ ഡാറ്റയും നിങ്ങളുടെ കഥയെ പിന്തുണയ്ക്കുന്നില്ലെങ്കിലും നിങ്ങൾ ആ കഥയോട് എങ്ങനെ നിഷ്‌ഠയുള്ളവനാണ് എന്ന് അറിയിക്കണം. + +### 3. യഥാർത്ഥ കഥപോലെ സമീപിക്കുക +പരമ്പരാഗത കഥ 5 ഘട്ടങ്ങളിൽ നടക്കുന്നു. ഇവയെ എക്സ്പോസിഷൻ, റൈസിംഗ് ആക്ഷൻ, ക്ലൈമാക്സ്, ഫോളിംഗ് ആക്ഷൻ, ഡിനൗൺസ്മെന്റ് എന്ന് വിളിക്കാം. അല്ലെങ്കിൽ എളുപ്പത്തിൽ ഓർക്കാൻ കോൺടെക്സ്റ്റ്, കോൺഫ്ലിക്റ്റ്, ക്ലൈമാക്സ്, ക്ലോഷർ, കോൺക്ലൂഷൻ. ഡാറ്റയും കഥയും കമ്മ്യൂണിക്കേറ്റ് ചെയ്യുമ്പോൾ സമാനമായ സമീപനം സ്വീകരിക്കാം. + +കോൺടെക്സ്റ്റിൽ തുടങ്ങാം, സീൻ സജ്ജമാക്കാം, പ്രേക്ഷകർ എല്ലാവരും ഒരേ പേജിൽ ഉണ്ടെന്ന് ഉറപ്പാക്കാം. തുടർന്ന് കോൺഫ്ലിക്റ്റ് അവതരിപ്പിക്കുക. ഈ ഡാറ്റ ശേഖരിക്കേണ്ടത് എന്തുകൊണ്ടാണ്? നിങ്ങൾ പരിഹരിക്കാനാഗ്രഹിച്ച പ്രശ്നങ്ങൾ എന്തൊക്കെയാണ്? അതിനുശേഷം ക്ലൈമാക്സ്. ഡാറ്റ എന്താണ്? ഡാറ്റയുടെ അർത്ഥം എന്ത്? ഡാറ്റ നമ്മെ ഏത് പരിഹാരങ്ങൾ ആവശ്യപ്പെടുന്നു? തുടർന്ന് ക്ലോഷർ, പ്രശ്നവും നിർദ്ദേശിച്ച പരിഹാരവും വീണ്ടും പറയാം. അവസാനം കോൺക്ലൂഷൻ, പ്രധാന സന്ദേശങ്ങളും ടീം സ്വീകരിക്കേണ്ട അടുത്ത ചുവടുകളും സംഗ്രഹിക്കാം. + +### 4. അർത്ഥമുള്ള വാക്കുകളും വാചകങ്ങളും ഉപയോഗിക്കുക +നിങ്ങളും ഞാൻ ഒരു ഉൽപ്പന്നത്തിൽ ചേർന്ന് ജോലി ചെയ്യുകയാണെങ്കിൽ, ഞാൻ നിങ്ങൾക്ക് "നമ്മുടെ ഉപയോക്താക്കൾ പ്ലാറ്റ്ഫോമിൽ ഓൺബോർഡ് ചെയ്യാൻ വളരെ സമയം എടുക്കുന്നു" എന്ന് പറഞ്ഞാൽ, "വളരെ സമയം" എത്രയെന്ന് നിങ്ങൾ എത്രമാത്രം കണക്കാക്കും? ഒരു മണിക്കൂർ? ഒരു ആഴ്ച? അറിയാൻ ബുദ്ധിമുട്ടാണ്. ഞാൻ അത് മുഴുവൻ പ്രേക്ഷകർക്കു പറഞ്ഞാൽ? പ്രേക്ഷകർക്ക് ഓരോരുത്തർക്കും വ്യത്യസ്തമായ ധാരണ ഉണ്ടാകാം. + +പകരം, ഞാൻ പറഞ്ഞാൽ "നമ്മുടെ ഉപയോക്താക്കൾ ശരാശരി 3 മിനിറ്റ് കൊണ്ട് സൈൻ അപ്പ് ചെയ്ത് ഓൺബോർഡ് ചെയ്യുന്നു." + +അത് കൂടുതൽ വ്യക്തമാണ്. ഡാറ്റ കമ്മ്യൂണിക്കേറ്റ് ചെയ്യുമ്പോൾ, എല്ലാവരും നിങ്ങളുടെ പോലെ ചിന്തിക്കുന്നുവെന്ന് കരുതുന്നത് എളുപ്പമാണ്. എന്നാൽ അത് എല്ലായ്പ്പോഴും ശരിയല്ല. നിങ്ങളുടെ ഡാറ്റയും അതിന്റെ അർത്ഥവും വ്യക്തമായി അവതരിപ്പിക്കുന്നത് നിങ്ങളുടെ ഉത്തരവാദിത്വമാണ്. ഡാറ്റയോ കഥയോ വ്യക്തമായില്ലെങ്കിൽ, പ്രേക്ഷകർക്ക് പിന്തുടരാൻ ബുദ്ധിമുട്ടും, പ്രധാന സന്ദേശങ്ങൾ മനസ്സിലാക്കാൻ കുറവാകും. + +നിങ്ങൾ അർത്ഥമുള്ള വാക്കുകളും വാചകങ്ങളും ഉപയോഗിച്ചാൽ ഡാറ്റ കൂടുതൽ വ്യക്തമായി കമ്മ്യൂണിക്കേറ്റ് ചെയ്യാം, അനിശ്ചിതമായ വാക്കുകൾക്കുപകരം. താഴെ ചില ഉദാഹരണങ്ങൾ. + + - ഞങ്ങൾക്ക് *പ്രഭാഷണീയമായ* ഒരു വർഷം ഉണ്ടായി! + - ഒരാൾക്ക് പ്രഭാഷണീയമായ വർഷം 2%-3% വരുമാന വർദ്ധനവായി തോന്നാം, മറ്റൊരാൾക്ക് 50%-60% വർദ്ധനവായി തോന്നാം. + - നമ്മുടെ ഉപയോക്താക്കളുടെ വിജയ നിരക്കുകൾ *പ്രഭാഷണീയമായി* വർദ്ധിച്ചു. + - എത്ര വലിയ വർദ്ധനവാണ് പ്രഭാഷണീയമായ വർദ്ധനവ്? + - ഈ പ്രവർത്തനം *പ്രധാനമായ* ശ്രമം ആവശ്യപ്പെടും. + - എത്ര ശ്രമമാണ് പ്രധാനമായത്? + +അനിശ്ചിതമായ വാക്കുകൾ കൂടുതൽ ഡാറ്റയിലേക്ക് പരിചയപ്പെടുത്തലായി അല്ലെങ്കിൽ നിങ്ങൾ പറഞ്ഞ കഥയുടെ സംഗ്രഹമായി ഉപയോഗിക്കാം. എന്നാൽ നിങ്ങളുടെ പ്രദർശനത്തിന്റെ എല്ലാ ഭാഗവും പ്രേക്ഷകർക്കു വ്യക്തമായിരിക്കണമെന്ന് ഉറപ്പാക്കുക. + +### 5. ഭാവന ഉപയോഗിക്കുക +ഭാവന കഥ പറയലിൽ പ്രധാനമാണ്. ഡാറ്റയോടെ കഥ പറയുമ്പോൾ ഇത് കൂടുതൽ പ്രധാനമാണ്. ഡാറ്റ കമ്മ്യൂണിക്കേറ്റ് ചെയ്യുമ്പോൾ, നിങ്ങൾ പ്രേക്ഷകർക്ക് നൽകാൻ ആഗ്രഹിക്കുന്ന സന്ദേശങ്ങളിലാണ് എല്ലാം കേന്ദ്രീകരിക്കുന്നത്. പ്രേക്ഷകർക്കു ഒരു ഭാവന ഉണർത്തുമ്പോൾ അവർക്ക് സഹാനുഭൂതി ഉണ്ടാകാൻ സഹായിക്കുന്നു, കൂടാതെ അവർക്ക് പ്രവർത്തിക്കാൻ പ്രേരണ നൽകുന്നു. ഭാവന പ്രേക്ഷകർക്ക് നിങ്ങളുടെ സന്ദേശം ഓർമ്മിക്കാൻ സാധ്യത വർദ്ധിപ്പിക്കുന്നു. + +നിങ്ങൾക്ക് ഇത് ടിവി പരസ്യങ്ങളിൽ മുമ്പ് കണ്ടിട്ടുണ്ടാകാം. ചില പരസ്യങ്ങൾ വളരെ ഗൗരവമുള്ളവയാണ്, ദു:ഖകരമായ ഭാവന ഉപയോഗിച്ച് പ്രേക്ഷകരുമായി ബന്ധപ്പെടുകയും അവർ അവതരിപ്പിക്കുന്ന ഡാറ്റയെ കൂടുതൽ ശ്രദ്ധേയമാക്കുകയും ചെയ്യുന്നു. അല്ലെങ്കിൽ ചില പരസ്യങ്ങൾ വളരെ സന്തോഷകരവും ഉല്ലാസകരവുമാണ്, അവയുടെ ഡാറ്റയെ സന്തോഷകരമായ അനുഭവവുമായി ബന്ധിപ്പിക്കാൻ പ്രേരിപ്പിക്കുന്നു. + +ഡാറ്റ കമ്മ്യൂണിക്കേറ്റ് ചെയ്യുമ്പോൾ ഭാവന എങ്ങനെ ഉപയോഗിക്കാം? താഴെ ചില മാർഗങ്ങൾ. + + - സാക്ഷ്യങ്ങളും വ്യക്തിഗത കഥകളും ഉപയോഗിക്കുക + - ഡാറ്റ ശേഖരിക്കുമ്പോൾ, ക്വാണ്ടിറ്റേറ്റീവ് (അളക്കാവുന്ന) ഡാറ്റയും ക്വാളിറ്റേറ്റീവ് (ഗുണപരമായ) ഡാറ്റയും ശേഖരിക്കാൻ ശ്രമിക്കുക, കമ്മ്യൂണിക്കേഷൻ ചെയ്യുമ്പോൾ ഇരുവരും സംയോജിപ്പിക്കുക. നിങ്ങളുടെ ഡാറ്റ പ്രധാനമായും ക്വാണ്ടിറ്റേറ്റീവ് ആണെങ്കിൽ, വ്യക്തികളുടെ അനുഭവങ്ങൾ അറിയാൻ കഥകൾ തേടുക. + - ചിത്രങ്ങൾ ഉപയോഗിക്കുക + - ചിത്രങ്ങൾ പ്രേക്ഷകർക്ക് ഒരു സാഹചര്യത്തിൽ തങ്ങളെ കാണാൻ സഹായിക്കുന്നു. ചിത്രങ്ങൾ ഉപയോഗിക്കുമ്പോൾ, നിങ്ങൾക്ക് പ്രേക്ഷകരെ നിങ്ങളുടെ ഡാറ്റയെക്കുറിച്ചുള്ള അനുഭവം ഉണ്ടാകാൻ പ്രേരിപ്പിക്കാം. + - നിറം ഉപയോഗിക്കുക + - വ്യത്യസ്ത നിറങ്ങൾ വ്യത്യസ്ത ഭാവനകൾ ഉണർത്തുന്നു. ജനപ്രിയ നിറങ്ങളും അവ ഉണർത്തുന്ന ഭാവനകളും താഴെ കൊടുത്തിരിക്കുന്നു. ശ്രദ്ധിക്കുക, നിറങ്ങൾക്ക് വ്യത്യസ്ത സംസ്കാരങ്ങളിൽ വ്യത്യസ്ത അർത്ഥങ്ങൾ ഉണ്ടാകാം. + - നീല നിറം സാധാരണയായി സമാധാനവും വിശ്വാസവും ഉണർത്തുന്നു + - പച്ച നിറം സാധാരണയായി പ്രകൃതിയുമായി ബന്ധപ്പെട്ടിരിക്കുന്നു + - ചുവപ്പ് സാധാരണയായി ആവേശവും ഉത്സാഹവും ഉണർത്തുന്നു + - മഞ്ഞ നിറം സാധാരണയായി പ്രതീക്ഷയും സന്തോഷവും ഉണർത്തുന്നു + +# കമ്മ്യൂണിക്കേഷൻ കേസ് സ്റ്റഡി +എമേഴ്സൺ ഒരു മൊബൈൽ ആപ്പിന്റെ പ്രോഡക്ട് മാനേജരാണ്. എമേഴ്സൺ ശ്രദ്ധിച്ചിട്ടുണ്ട്, വാരാന്ത്യങ്ങളിൽ ഉപഭോക്താക്കൾ 42% കൂടുതൽ പരാതികളും ബഗ് റിപ്പോർട്ടുകളും സമർപ്പിക്കുന്നു. 48 മണിക്കൂറിനുള്ളിൽ മറുപടി ലഭിക്കാത്ത പരാതികൾ സമർപ്പിക്കുന്ന ഉപഭോക്താക്കൾ ആപ്പ് സ്റ്റോറിൽ 1 അല്ലെങ്കിൽ 2 റേറ്റിംഗ് നൽകാനുള്ള സാധ്യത 32% കൂടുതലാണ്. + +ഗവേഷണം നടത്തിയ ശേഷം, എമേഴ്സണിന് പ്രശ്നം പരിഹരിക്കാൻ ചില പരിഹാരങ്ങൾ ഉണ്ട്. എമേഴ്സൺ 3 കമ്പനി ലീഡുകളുമായി 30 മിനിറ്റ് മീറ്റിംഗ് ക്രമീകരിച്ച് ഡാറ്റയും നിർദ്ദേശിച്ച പരിഹാരങ്ങളും കമ്മ്യൂണിക്കേറ്റ് ചെയ്യുന്നു. + +ഈ മീറ്റിംഗിൽ, എമേഴ്സണിന്റെ ലക്ഷ്യം കമ്പനി ലീഡുകൾക്ക് താഴെ പറയുന്ന 2 പരിഹാരങ്ങൾ ആപ്പ് റേറ്റിംഗ് മെച്ചപ്പെടുത്താൻ സഹായിക്കുമെന്ന് മനസ്സിലാക്കുക ആണ്, ഇത് ഉയർന്ന വരുമാനമായി മാറും. + +**പരിഹാരം 1.** വാരാന്ത്യങ്ങളിൽ ജോലി ചെയ്യാൻ കസ്റ്റമർ സർവീസ് പ്രതിനിധികളെ നിയമിക്കുക + +**പരിഹാരം 2.** കസ്റ്റമർ സർവീസ് ടിക്കറ്റ് സിസ്റ്റം വാങ്ങുക, ഇതിലൂടെ കസ്റ്റമർ സർവീസ് പ്രതിനിധികൾ ഏറ്റവും പഴക്കമുള്ള പരാതികൾ എളുപ്പത്തിൽ തിരിച്ചറിയാൻ കഴിയും – അതിനാൽ ഏറ്റവും ഉടൻ പരിഹരിക്കേണ്ടത് അറിയാം. + +മീറ്റിംഗിൽ, എമേഴ്സൺ 5 മിനിറ്റ് ചിലവിട്ട് ആപ്പ് സ്റ്റോറിൽ കുറഞ്ഞ റേറ്റിംഗ് ഉണ്ടാകുന്നത് എന്തുകൊണ്ട് ദോഷകരമാണെന്ന് വിശദീകരിക്കുന്നു, 10 മിനിറ്റ് ഗവേഷണ പ്രക്രിയയും ട്രെൻഡുകൾ എങ്ങനെ തിരിച്ചറിഞ്ഞുവെന്നും പറയുന്നു, 10 മിനിറ്റ് ചില പുതിയ ഉപഭോക്തൃ പരാതികൾ പരിശോധിക്കുന്നു, അവസാന 5 മിനിറ്റ് 2 പരിഹാരങ്ങൾ സംക്ഷിപ്തമായി അവതരിപ്പിക്കുന്നു. +എമേഴ്സൺ ഈ യോഗത്തിൽ ആശയവിനിമയം നടത്താൻ ഇത് ഫലപ്രദമായ മാർഗമായിരുന്നോ? + +യോഗത്തിനിടെ, ഒരു കമ്പനി ലീഡ് എമേഴ്സൺ പരിശോധിച്ച 10 മിനിറ്റ് ഉപഭോക്തൃ പരാതികളിൽ മാത്രം ശ്രദ്ധ കേന്ദ്രീകരിച്ചു. യോഗത്തിന് ശേഷം, ഈ പരാതികൾ മാത്രമാണ് ആ ടീം ലീഡ് ഓർമ്മിച്ചിരുന്നത്. മറ്റൊരു കമ്പനി ലീഡ് പ്രധാനമായും എമേഴ്സൺ ഗവേഷണ പ്രക്രിയ വിവരിക്കുന്നതിൽ ശ്രദ്ധ കേന്ദ്രീകരിച്ചു. മൂന്നാമത്തെ കമ്പനി ലീഡ് എമേഴ്സൺ നിർദ്ദേശിച്ച പരിഹാരങ്ങൾ ഓർമ്മിച്ചെങ്കിലും ആ പരിഹാരങ്ങൾ എങ്ങനെ നടപ്പിലാക്കാമെന്ന് ഉറപ്പില്ലായിരുന്നു. + +മുകളിൽ നൽകിയ സാഹചര്യത്തിൽ, എമേഴ്സൺ ടീം ലീഡുകൾക്ക് നൽകാൻ ആഗ്രഹിച്ച സന്ദേശത്തിനും അവർ യോഗത്തിൽ നിന്ന് എടുത്തു കൊണ്ടുപോയതും തമ്മിൽ വലിയ വ്യത്യാസമുണ്ടെന്ന് കാണാം. താഴെ എമേഴ്സൺ പരിഗണിക്കാവുന്ന മറ്റൊരു സമീപനം കൊടുത്തിരിക്കുന്നു. + +എമേഴ്സൺ ഈ സമീപനം എങ്ങനെ മെച്ചപ്പെടുത്താം? +Context, Conflict, Climax, Closure, Conclusion +**Context** - എമേഴ്സൺ ആദ്യ 5 മിനിറ്റ് മുഴുവൻ സാഹചര്യവും പരിചയപ്പെടുത്തുകയും, ടീം ലീഡുകൾക്ക് പ്രശ്നങ്ങൾ കമ്പനിക്ക് നിർണായകമായ മെട്രിക്‌സുകളെ (ഉദാഹരണത്തിന് വരുമാനം) എങ്ങനെ ബാധിക്കുന്നുവെന്ന് മനസ്സിലാക്കാൻ സഹായിക്കുകയും ചെയ്യാം. + +ഇത് ഇങ്ങനെ അവതരിപ്പിക്കാം: "ഇപ്പോൾ, നമ്മുടെ ആപ്പിന്റെ റേറ്റിംഗ് ആപ്പ് സ്റ്റോറിൽ 2.5 ആണ്. ആപ്പ് സ്റ്റോറിലെ റേറ്റിംഗുകൾ ആപ്പ് സ്റ്റോർ ഓപ്റ്റിമൈസേഷനിൽ നിർണായകമാണ്, ഇത് എത്ര ഉപയോക്താക്കൾക്ക് നമ്മുടെ ആപ്പ് തിരയുമ്പോൾ കാണപ്പെടുന്നു എന്നതും, ഭാവി ഉപയോക്താക്കൾക്ക് ആപ്പ് എങ്ങനെ കാണപ്പെടുന്നു എന്നതും ബാധിക്കുന്നു. കൂടാതെ, ഉപയോക്താക്കളുടെ എണ്ണം നേരിട്ട് വരുമാനത്തോട് ബന്ധപ്പെട്ടു കിടക്കുന്നു." + +**Conflict** - തുടർന്ന് എമേഴ്സൺ അടുത്ത 5 മിനിറ്റ് വരെ പ്രശ്നത്തെക്കുറിച്ച് സംസാരിക്കാം. + +ഇത് ഇങ്ങനെ പറയാം: "ഉപയോക്താക്കൾ വാരാന്ത്യങ്ങളിൽ 42% കൂടുതൽ പരാതികളും ബഗ് റിപ്പോർട്ടുകളും സമർപ്പിക്കുന്നു. 48 മണിക്കൂർ കഴിഞ്ഞ് മറുപടി ലഭിക്കാത്ത പരാതികൾ സമർപ്പിക്കുന്ന ഉപഭോക്താക്കൾ ആപ്പ് സ്റ്റോറിൽ 2-ൽ മുകളിൽ റേറ്റിംഗ് നൽകാനുള്ള സാധ്യത 32% കുറവാണ്. ആപ്പ് സ്റ്റോറിലെ റേറ്റിംഗ് 4 ആക്കുന്നത് 20-30% വരെ ദൃശ്യത വർദ്ധിപ്പിക്കും, ഇത് വരുമാനം 10% വർദ്ധിപ്പിക്കുമെന്ന് ഞാൻ പ്രവചിക്കുന്നു." ഈ സംഖ്യകൾ ന്യായീകരിക്കാൻ എമേഴ്സൺ തയ്യാറായിരിക്കണം. + +**Climax** - അടിസ്ഥാനമിടൽ കഴിഞ്ഞ്, എമേഴ്സൺ 5 മിനിറ്റ് വരെ ക്ലൈമാക്സിലേക്ക് പോകാം. + +എമേഴ്സൺ നിർദ്ദേശിച്ച പരിഹാരങ്ങൾ അവതരിപ്പിക്കുകയും, ആ പരിഹാരങ്ങൾ പ്രശ്നങ്ങൾ എങ്ങനെ പരിഹരിക്കും, നിലവിലുള്ള പ്രവൃത്തിപദ്ധതികളിൽ എങ്ങനെ നടപ്പിലാക്കാം, ചെലവ് എത്ര, ROI എന്താണെന്ന് വിശദീകരിക്കുകയും, നടപ്പിലാക്കിയാൽ എങ്ങനെ കാണപ്പെടും എന്നതിന്റെ സ്ക്രീൻഷോട്ടുകളും വയർഫ്രെയിമുകളും കാണിക്കുകയും ചെയ്യാം. 48 മണിക്കൂർ കഴിഞ്ഞ് പരാതികൾ പരിഹരിച്ച ഉപയോക്താക്കളുടെ സാക്ഷ്യപത്രങ്ങളും, നിലവിലെ ടിക്കറ്റ് സിസ്റ്റത്തെക്കുറിച്ച് അഭിപ്രായം പറയുന്ന ഒരു നിലവിലെ കസ്റ്റമർ സർവീസ് പ്രതിനിധിയുടെ സാക്ഷ്യപത്രവും പങ്കുവെക്കാം. + +**Closure** - ഇപ്പോൾ എമേഴ്സൺ 5 മിനിറ്റ് ചിലവഴിച്ച് കമ്പനി നേരിടുന്ന പ്രശ്നങ്ങൾ വീണ്ടും പറയുകയും, നിർദ്ദേശിച്ച പരിഹാരങ്ങൾ വീണ്ടും പരിശോധിക്കുകയും, ആ പരിഹാരങ്ങൾ ശരിയായതാണെന്ന് അവലോകനം ചെയ്യുകയും ചെയ്യാം. + +**Conclusion** - ഇത് കുറച്ച് പങ്കാളികളുള്ള യോഗമാണെന്നും, രണ്ട് ദിശയിലുള്ള ആശയവിനിമയം നടക്കുമെന്നും കണക്കിലെടുത്ത്, എമേഴ്സൺ 10 മിനിറ്റ് ചോദ്യങ്ങൾക്ക് മാറ്റി വയ്ക്കാൻ പദ്ധതിയിടാം, യോഗം അവസാനിക്കുന്നതിന് മുമ്പ് ടീം ലീഡുകൾക്ക് എന്തെങ്കിലും സംശയങ്ങൾ ഉണ്ടെങ്കിൽ അവ വ്യക്തമാക്കാൻ. + +എമേഴ്സൺ സമീപനം #2 സ്വീകരിച്ചാൽ, ടീം ലീഡുകൾക്ക് എമേഴ്സൺ ഉദ്ദേശിച്ച സന്ദേശം – പരാതികളും ബഗുകളും കൈകാര്യം ചെയ്യുന്നതിൽ മെച്ചപ്പെടുത്തലുകൾ ആവശ്യമാണെന്നും, ആ മെച്ചപ്പെടുത്തലുകൾക്കായി രണ്ട് പരിഹാരങ്ങൾ നടപ്പിലാക്കാവുന്നതുമാണ് – യോഗത്തിൽ നിന്ന് വ്യക്തമായി ലഭിക്കാനുള്ള സാധ്യത കൂടുതലാണ്. ഈ സമീപനം എമേഴ്സൺ അറിയിക്കാൻ ആഗ്രഹിക്കുന്ന ഡാറ്റയും കഥയും ഫലപ്രദമായി ആശയവിനിമയം നടത്താൻ സഹായിക്കും. + +# Conclusion +### പ്രധാനപ്പെട്ട കാര്യങ്ങളുടെ സംഗ്രഹം + - ആശയവിനിമയം എന്നത് വിവരങ്ങൾ കൈമാറുകയോ കൈമാറ്റം ചെയ്യുകയോ ചെയ്യുന്നതാണ്. + - ഡാറ്റ ആശയവിനിമയം ചെയ്യുമ്പോൾ, നിങ്ങളുടെ ലക്ഷ്യം വെറും സംഖ്യകൾ പ്രേക്ഷകരിലേക്ക് കൈമാറുക മാത്രമല്ല. നിങ്ങളുടെ ഡാറ്റയിൽ നിന്നുള്ള ഒരു കഥ ആശയവിനിമയം ചെയ്യുകയാണ് ലക്ഷ്യം. + - ആശയവിനിമയത്തിന് രണ്ട് തരം ഉണ്ട്: ഒറ്റദിശ ആശയവിനിമയം (പ്രതികരണമില്ലാതെ വിവരങ്ങൾ കൈമാറൽ)യും രണ്ട് ദിശ ആശയവിനിമയം (വിവരങ്ങൾ മുന്നിലും പിന്നിലും കൈമാറൽ)യും. + - ഡാറ്റയുമായി കഥ പറയാൻ ഉപയോഗിക്കാവുന്ന നിരവധി തന്ത്രങ്ങൾ ഉണ്ട്, നാം പരിശോധിച്ച 5 തന്ത്രങ്ങൾ: + - നിങ്ങളുടെ പ്രേക്ഷകരെയും, മാധ്യമത്തെയും, ആശയവിനിമയ രീതിയെയും മനസ്സിലാക്കുക + - അവസാനം മനസ്സിൽ വെച്ച് തുടങ്ങുക + - യഥാർത്ഥ കഥപോലെ സമീപിക്കുക + - അർത്ഥപൂർണമായ വാക്കുകളും വാചകങ്ങളും ഉപയോഗിക്കുക + - വികാരങ്ങൾ ഉപയോഗിക്കുക + +### സ്വയം പഠനത്തിന് ശുപാർശ ചെയ്ത വിഭവങ്ങൾ +[The Five C's of Storytelling - Articulate Persuasion](http://articulatepersuasion.com/the-five-cs-of-storytelling/) + +[1.4 Your Responsibilities as a Communicator – Business Communication for Success (umn.edu)](https://open.lib.umn.edu/businesscommunication/chapter/1-4-your-responsibilities-as-a-communicator/) + +[How to Tell a Story with Data (hbr.org)](https://hbr.org/2013/04/how-to-tell-a-story-with-data) + +[Two-Way Communication: 4 Tips for a More Engaged Workplace (yourthoughtpartner.com)](https://www.yourthoughtpartner.com/blog/bid/59576/4-steps-to-increase-employee-engagement-through-two-way-communication) + +[6 succinct steps to great data storytelling - BarnRaisers, LLC (barnraisersllc.com)](https://barnraisersllc.com/2021/05/02/6-succinct-steps-to-great-data-storytelling/) + +[How to Tell a Story With Data | Lucidchart Blog](https://www.lucidchart.com/blog/how-to-tell-a-story-with-data) + +[6 Cs of Effective Storytelling on Social Media | Cooler Insights](https://coolerinsights.com/2018/06/effective-storytelling-social-media/) + +[The Importance of Emotions In Presentations | Ethos3 - A Presentation Training and Design Agency](https://ethos3.com/2015/02/the-importance-of-emotions-in-presentations/) + +[Data storytelling: linking emotions and rational decisions (toucantoco.com)](https://www.toucantoco.com/en/blog/data-storytelling-dataviz) + +[Emotional Advertising: How Brands Use Feelings to Get People to Buy (hubspot.com)](https://blog.hubspot.com/marketing/emotions-in-advertising-examples) + +[Choosing Colors for Your Presentation Slides | Think Outside The Slide](https://www.thinkoutsidetheslide.com/choosing-colors-for-your-presentation-slides/) + +[How To Present Data [10 Expert Tips] | ObservePoint](https://resources.observepoint.com/blog/10-tips-for-presenting-data) + +[Microsoft Word - Persuasive Instructions.doc (tpsnva.org)](https://www.tpsnva.org/teach/lq/016/persinstr.pdf) + +[The Power of Story for Your Data (thinkhdi.com)](https://www.thinkhdi.com/library/supportworld/2019/power-story-your-data.aspx) + +[Common Mistakes in Data Presentation (perceptualedge.com)](https://www.perceptualedge.com/articles/ie/data_presentation.pdf) + +[Infographic: Here are 15 Common Data Fallacies to Avoid (visualcapitalist.com)](https://www.visualcapitalist.com/here-are-15-common-data-fallacies-to-avoid/) + +[Cherry Picking: When People Ignore Evidence that They Dislike – Effectiviology](https://effectiviology.com/cherry-picking/#How_to_avoid_cherry_picking) + +[Tell Stories with Data: Communication in Data Science | by Sonali Verghese | Towards Data Science](https://towardsdatascience.com/tell-stories-with-data-communication-in-data-science-5266f7671d7) + +[1. Communicating Data - Communicating Data with Tableau [Book] (oreilly.com)](https://www.oreilly.com/library/view/communicating-data-with/9781449372019/ch01.html) + +## [Post-lecture quiz](https://ff-quizzes.netlify.app/en/ds/quiz/31) + +മുകളിൽ നൽകിയ പോസ്റ്റ്-ലെക്ചർ ക്വിസ് ഉപയോഗിച്ച് നിങ്ങൾ പഠിച്ച കാര്യങ്ങൾ അവലോകനം ചെയ്യുക! + +## Assignment + +[Market Research](assignment.md) + +--- + + +**അസൂയാ**: +ഈ രേഖ AI വിവർത്തന സേവനം [Co-op Translator](https://github.com/Azure/co-op-translator) ഉപയോഗിച്ച് വിവർത്തനം ചെയ്തതാണ്. നാം കൃത്യതയ്ക്ക് ശ്രമിച്ചെങ്കിലും, സ്വയം പ്രവർത്തിക്കുന്ന വിവർത്തനങ്ങളിൽ പിശകുകൾ അല്ലെങ്കിൽ തെറ്റുകൾ ഉണ്ടാകാമെന്ന് ദയവായി ശ്രദ്ധിക്കുക. അതിന്റെ മാതൃഭാഷയിലുള്ള യഥാർത്ഥ രേഖയാണ് പ്രാമാണികമായ ഉറവിടം എന്ന് പരിഗണിക്കേണ്ടതാണ്. നിർണായകമായ വിവരങ്ങൾക്ക്, പ്രൊഫഷണൽ മനുഷ്യ വിവർത്തനം ശുപാർശ ചെയ്യപ്പെടുന്നു. ഈ വിവർത്തനം ഉപയോഗിക്കുന്നതിൽ നിന്നുണ്ടാകുന്ന ഏതെങ്കിലും തെറ്റിദ്ധാരണകൾക്കോ തെറ്റായ വ്യാഖ്യാനങ്ങൾക്കോ ഞങ്ങൾ ഉത്തരവാദികളല്ല. + \ No newline at end of file diff --git a/translations/ml/4-Data-Science-Lifecycle/16-communication/assignment.md b/translations/ml/4-Data-Science-Lifecycle/16-communication/assignment.md new file mode 100644 index 00000000..c15a34e8 --- /dev/null +++ b/translations/ml/4-Data-Science-Lifecycle/16-communication/assignment.md @@ -0,0 +1,28 @@ + +# ഒരു കഥ പറയുക + +## നിർദ്ദേശങ്ങൾ + +ഡാറ്റാ സയൻസ് മുഴുവനും കഥ പറയലിനെക്കുറിച്ചാണ്. ഏതെങ്കിലും ഒരു ഡാറ്റാസെറ്റ് തിരഞ്ഞെടുക്കുക, അതിനെക്കുറിച്ച് നിങ്ങൾ പറയാൻ കഴിയുന്ന ഒരു ചെറിയ പ്രബന്ധം എഴുതുക. നിങ്ങളുടെ ഡാറ്റാസെറ്റ് എന്ത് വെളിപ്പെടുത്തുമെന്ന് നിങ്ങൾ പ്രതീക്ഷിക്കുന്നു? അതിന്റെ വെളിപ്പെടുത്തലുകൾ പ്രശ്നകരമാകുകയാണെങ്കിൽ നിങ്ങൾ എന്ത് ചെയ്യും? നിങ്ങളുടെ ഡാറ്റ അതിന്റെ രഹസ്യങ്ങൾ എളുപ്പത്തിൽ തുറക്കാൻ കഴിയുന്നില്ലെങ്കിൽ എന്ത് ചെയ്യും? നിങ്ങളുടെ ഡാറ്റാസെറ്റ് അവതരിപ്പിക്കാവുന്ന സാഹചര്യങ്ങളെക്കുറിച്ച് ചിന്തിച്ച് അവയെ എഴുതുക. + +## റൂബ്രിക് + +ഉദാഹരണമായി | മതിയായത് | മെച്ചപ്പെടുത്തേണ്ടത് +--- | --- | -- | + +ഡാറ്റാസെറ്റ് വിശദീകരിച്ചും, രേഖപ്പെടുത്തിയും, ക്രെഡിറ്റ് നൽകിയും, അതിനെക്കുറിച്ചുള്ള സുസ്ഥിരമായ ഒരു കഥ വിശദമായ ഉദാഹരണങ്ങളോടെ .doc ഫോർമാറ്റിൽ ഒരു പേജ് പ്രബന്ധം അവതരിപ്പിക്കുന്നു.| കുറച്ച് കുറവുള്ള രൂപത്തിൽ ഒരു ചെറിയ പ്രബന്ധം അവതരിപ്പിക്കുന്നു | മുകളിൽ പറയപ്പെട്ട വിശദാംശങ്ങളിൽ ഒന്നിൽ പ്രബന്ധം കുറവാണെന്ന് കണ്ടെത്തുന്നു. + +--- + + +**അസൂയാ**: +ഈ രേഖ AI വിവർത്തന സേവനം [Co-op Translator](https://github.com/Azure/co-op-translator) ഉപയോഗിച്ച് വിവർത്തനം ചെയ്തതാണ്. നാം കൃത്യതയ്ക്ക് ശ്രമിച്ചെങ്കിലും, സ്വയം പ്രവർത്തിക്കുന്ന വിവർത്തനങ്ങളിൽ പിശകുകൾ അല്ലെങ്കിൽ തെറ്റുകൾ ഉണ്ടാകാമെന്ന് ദയവായി ശ്രദ്ധിക്കുക. അതിന്റെ മാതൃഭാഷയിലുള്ള യഥാർത്ഥ രേഖയാണ് പ്രാമാണികമായ ഉറവിടം എന്ന് പരിഗണിക്കേണ്ടതാണ്. നിർണായകമായ വിവരങ്ങൾക്ക്, പ്രൊഫഷണൽ മനുഷ്യ വിവർത്തനം ശുപാർശ ചെയ്യപ്പെടുന്നു. ഈ വിവർത്തനം ഉപയോഗിക്കുന്നതിൽ നിന്നുണ്ടാകുന്ന ഏതെങ്കിലും തെറ്റിദ്ധാരണകൾക്കോ തെറ്റായ വ്യാഖ്യാനങ്ങൾക്കോ ഞങ്ങൾ ഉത്തരവാദികളല്ല. + \ No newline at end of file diff --git a/translations/ml/4-Data-Science-Lifecycle/README.md b/translations/ml/4-Data-Science-Lifecycle/README.md new file mode 100644 index 00000000..1c2294e2 --- /dev/null +++ b/translations/ml/4-Data-Science-Lifecycle/README.md @@ -0,0 +1,32 @@ + +# ഡാറ്റ സയൻസ് ലൈഫ്‌സൈക്കിൾ + +![communication](../../../translated_images/communication.06d8e2a88d30d168d661ad9f9f0a4f947ebff3719719cfdaf9ed00a406a01ead.ml.jpg) +> ഫോട്ടോ ഹെഡ്‌വേ യുടെ അൺസ്പ്ലാഷിൽ + +ഈ പാഠങ്ങളിൽ, ഡാറ്റ സയൻസ് ലൈഫ്‌സൈക്കിളിന്റെ ചില ഭാഗങ്ങൾ, ഡാറ്റ ചുറ്റിപ്പറ്റിയുള്ള വിശകലനവും ആശയവിനിമയവും ഉൾപ്പെടെ, നിങ്ങൾ അന്വേഷിക്കും. + +### വിഷയങ്ങൾ + +1. [പരിചയം](14-Introduction/README.md) +2. [വിശകലനം](15-analyzing/README.md) +3. [ആശയവിനിമയം](16-communication/README.md) + +### ക്രെഡിറ്റുകൾ + +ഈ പാഠങ്ങൾ ❤️ കൊണ്ട് എഴുതിയത് [ജാലൻ മക്ഗീ](https://twitter.com/JalenMCG)യും [ജാസ്മിൻ ഗ്രീൻവേ](https://twitter.com/paladique)യും ആണ്. + +--- + + +**അസൂയാ**: +ഈ രേഖ AI വിവർത്തന സേവനം [Co-op Translator](https://github.com/Azure/co-op-translator) ഉപയോഗിച്ച് വിവർത്തനം ചെയ്തതാണ്. നാം കൃത്യതയ്ക്ക് ശ്രമിച്ചിട്ടുണ്ടെങ്കിലും, സ്വയം പ്രവർത്തിക്കുന്ന വിവർത്തനങ്ങളിൽ പിശകുകൾ അല്ലെങ്കിൽ തെറ്റുകൾ ഉണ്ടാകാമെന്ന് ദയവായി ശ്രദ്ധിക്കുക. അതിന്റെ മാതൃഭാഷയിലുള്ള യഥാർത്ഥ രേഖ അധികാരപരമായ ഉറവിടമായി കണക്കാക്കപ്പെടണം. നിർണായകമായ വിവരങ്ങൾക്ക്, പ്രൊഫഷണൽ മനുഷ്യ വിവർത്തനം ശുപാർശ ചെയ്യപ്പെടുന്നു. ഈ വിവർത്തനം ഉപയോഗിക്കുന്നതിൽ നിന്നുണ്ടാകുന്ന ഏതെങ്കിലും തെറ്റിദ്ധാരണകൾക്കോ തെറ്റായ വ്യാഖ്യാനങ്ങൾക്കോ ഞങ്ങൾ ഉത്തരവാദികളല്ല. + \ No newline at end of file diff --git a/translations/ml/5-Data-Science-In-Cloud/17-Introduction/README.md b/translations/ml/5-Data-Science-In-Cloud/17-Introduction/README.md new file mode 100644 index 00000000..a11f0430 --- /dev/null +++ b/translations/ml/5-Data-Science-In-Cloud/17-Introduction/README.md @@ -0,0 +1,17 @@ + +Translation for chunk 1 of 'README.md' skipped due to timeout. + +--- + + +**അസൂയാ**: +ഈ രേഖ AI വിവർത്തന സേവനം [Co-op Translator](https://github.com/Azure/co-op-translator) ഉപയോഗിച്ച് വിവർത്തനം ചെയ്തതാണ്. നാം കൃത്യതയ്ക്ക് ശ്രമിച്ചിട്ടുണ്ടെങ്കിലും, സ്വയം പ്രവർത്തിക്കുന്ന വിവർത്തനങ്ങളിൽ പിശകുകൾ അല്ലെങ്കിൽ തെറ്റുകൾ ഉണ്ടാകാമെന്ന് ദയവായി ശ്രദ്ധിക്കുക. അതിന്റെ മാതൃഭാഷയിലുള്ള യഥാർത്ഥ രേഖയാണ് പ്രാമാണികമായ ഉറവിടം എന്ന് പരിഗണിക്കേണ്ടതാണ്. നിർണായകമായ വിവരങ്ങൾക്ക്, പ്രൊഫഷണൽ മനുഷ്യ വിവർത്തനം ശുപാർശ ചെയ്യപ്പെടുന്നു. ഈ വിവർത്തനം ഉപയോഗിക്കുന്നതിൽ നിന്നുണ്ടാകുന്ന ഏതെങ്കിലും തെറ്റിദ്ധാരണകൾക്കോ തെറ്റായ വ്യാഖ്യാനങ്ങൾക്കോ ഞങ്ങൾ ഉത്തരവാദികളല്ല. + \ No newline at end of file diff --git a/translations/ml/5-Data-Science-In-Cloud/17-Introduction/assignment.md b/translations/ml/5-Data-Science-In-Cloud/17-Introduction/assignment.md new file mode 100644 index 00000000..0f54a2e4 --- /dev/null +++ b/translations/ml/5-Data-Science-In-Cloud/17-Introduction/assignment.md @@ -0,0 +1,27 @@ + +# മാർക്കറ്റ് റിസർച്ച് + +## നിർദ്ദേശങ്ങൾ + +ഈ പാഠത്തിൽ നിങ്ങൾ പഠിച്ചത് വിവിധ പ്രധാന ക്ലൗഡ് പ്രൊവൈഡർമാർ ഉണ്ടെന്ന് ആണ്. ഓരോ പ്രൊവൈഡറും ഡാറ്റാ സയന്റിസ്റ്റിന് എന്തെല്ലാം നൽകാൻ കഴിയുമെന്ന് കണ്ടെത്താൻ മാർക്കറ്റ് റിസർച്ച് നടത്തുക. അവയുടെ ഓഫറിങ്ങുകൾ താരതമ്യപ്പെടുത്താവുന്നതാണോ? ഈ ക്ലൗഡ് പ്രൊവൈഡർമാരിൽ മൂന്ന് അല്ലെങ്കിൽ അതിലധികം പ്രൊവൈഡർമാരുടെ ഓഫറിങ്ങുകൾ വിവരിക്കുന്ന ഒരു പേപ്പർ എഴുതുക. + +## റൂബ്രിക് + +Exemplary | Adequate | Needs Improvement +--- | --- | -- | +ഒരു പേജ് പേപ്പറിൽ മൂന്ന് ക്ലൗഡ് പ്രൊവൈഡർമാരുടെ ഡാറ്റാ സയൻസ് ഓഫറിങ്ങുകൾ വിവരിക്കുകയും അവ തമ്മിലുള്ള വ്യത്യാസങ്ങൾ വ്യക്തമാക്കുകയും ചെയ്യുന്നു. | ഒരു ചെറിയ പേപ്പർ സമർപ്പിച്ചിരിക്കുന്നു | വിശകലനം പൂർത്തിയാക്കാതെ ഒരു പേപ്പർ സമർപ്പിച്ചിരിക്കുന്നു + +--- + + +**അസൂയാ**: +ഈ രേഖ AI വിവർത്തന സേവനം [Co-op Translator](https://github.com/Azure/co-op-translator) ഉപയോഗിച്ച് വിവർത്തനം ചെയ്തതാണ്. നാം കൃത്യതയ്ക്ക് ശ്രമിച്ചിട്ടുണ്ടെങ്കിലും, സ്വയം പ്രവർത്തിക്കുന്ന വിവർത്തനങ്ങളിൽ പിശകുകൾ അല്ലെങ്കിൽ തെറ്റുകൾ ഉണ്ടാകാമെന്ന് ദയവായി ശ്രദ്ധിക്കുക. അതിന്റെ മാതൃഭാഷയിലുള്ള യഥാർത്ഥ രേഖയാണ് പ്രാമാണികമായ ഉറവിടം എന്ന് പരിഗണിക്കേണ്ടതാണ്. നിർണായകമായ വിവരങ്ങൾക്ക്, പ്രൊഫഷണൽ മനുഷ്യ വിവർത്തനം ശുപാർശ ചെയ്യപ്പെടുന്നു. ഈ വിവർത്തനം ഉപയോഗിക്കുന്നതിൽ നിന്നുണ്ടാകുന്ന ഏതെങ്കിലും തെറ്റിദ്ധാരണകൾക്കോ തെറ്റായ വ്യാഖ്യാനങ്ങൾക്കോ ഞങ്ങൾ ഉത്തരവാദികളല്ല. + \ No newline at end of file diff --git a/translations/ml/5-Data-Science-In-Cloud/18-Low-Code/README.md b/translations/ml/5-Data-Science-In-Cloud/18-Low-Code/README.md new file mode 100644 index 00000000..fdf6ba03 --- /dev/null +++ b/translations/ml/5-Data-Science-In-Cloud/18-Low-Code/README.md @@ -0,0 +1,355 @@ + +# ക്ലൗഡിലെ ഡാറ്റാ സയൻസ്: "ലോ കോഡ്/നോ കോഡ്" വഴി + +|![ Sketchnote by [(@sketchthedocs)](https://sketchthedocs.dev) ](../../sketchnotes/18-DataScience-Cloud.png)| +|:---:| +| ക്ലൗഡിലെ ഡാറ്റാ സയൻസ്: ലോ കോഡ് - _Sketchnote by [@nitya](https://twitter.com/nitya)_ | + +അടിസ്ഥാന പട്ടിക: + +- [ക്ലൗഡിലെ ഡാറ്റാ സയൻസ്: "ലോ കോഡ്/നോ കോഡ്" വഴി](../../../../5-Data-Science-In-Cloud/18-Low-Code) + - [പ്രി-ലെക്ചർ ക്വിസ്](../../../../5-Data-Science-In-Cloud/18-Low-Code) + - [1. പരിചയം](../../../../5-Data-Science-In-Cloud/18-Low-Code) + - [1.1 ആസ്യൂർ മെഷീൻ ലേണിംഗ് എന്താണ്?](../../../../5-Data-Science-In-Cloud/18-Low-Code) + - [1.2 ഹാർട്ട് ഫെയില്യർ പ്രവചനം പ്രോജക്ട്:](../../../../5-Data-Science-In-Cloud/18-Low-Code) + - [1.3 ഹാർട്ട് ഫെയില്യർ ഡാറ്റാസെറ്റ്:](../../../../5-Data-Science-In-Cloud/18-Low-Code) + - [2. ആസ്യൂർ ML സ്റ്റുഡിയോയിൽ മോഡൽ ലോ കോഡ്/നോ കോഡ് പരിശീലനം](../../../../5-Data-Science-In-Cloud/18-Low-Code) + - [2.1 ആസ്യൂർ ML വർക്ക്സ്പേസ് സൃഷ്ടിക്കുക](../../../../5-Data-Science-In-Cloud/18-Low-Code) + - [2.2 കംപ്യൂട്ട് റിസോഴ്‌സുകൾ](../../../../5-Data-Science-In-Cloud/18-Low-Code) + - [2.2.1 കംപ്യൂട്ട് റിസോഴ്‌സുകൾക്കായി ശരിയായ ഓപ്ഷനുകൾ തിരഞ്ഞെടുക്കൽ](../../../../5-Data-Science-In-Cloud/18-Low-Code) + - [2.2.2 കംപ്യൂട്ട് ക്ലസ്റ്റർ സൃഷ്ടിക്കൽ](../../../../5-Data-Science-In-Cloud/18-Low-Code) + - [2.3 ഡാറ്റാസെറ്റ് ലോഡ് ചെയ്യൽ](../../../../5-Data-Science-In-Cloud/18-Low-Code) + - [2.4 AutoML ഉപയോഗിച്ച് ലോ കോഡ്/നോ കോഡ് പരിശീലനം](../../../../5-Data-Science-In-Cloud/18-Low-Code) + - [3. ലോ കോഡ്/നോ കോഡ് മോഡൽ ഡിപ്ലോയ്മെന്റ് & എന്റ്പോയിന്റ് ഉപഭോഗം](../../../../5-Data-Science-In-Cloud/18-Low-Code) + - [3.1 മോഡൽ ഡിപ്ലോയ്മെന്റ്](../../../../5-Data-Science-In-Cloud/18-Low-Code) + - [3.2 എന്റ്പോയിന്റ് ഉപഭോഗം](../../../../5-Data-Science-In-Cloud/18-Low-Code) + - [🚀 ചലഞ്ച്](../../../../5-Data-Science-In-Cloud/18-Low-Code) + - [പോസ്റ്റ്-ലെക്ചർ ക്വിസ്](../../../../5-Data-Science-In-Cloud/18-Low-Code) + - [പരിശോധന & സ്വയം പഠനം](../../../../5-Data-Science-In-Cloud/18-Low-Code) + - [അസൈൻമെന്റ്](../../../../5-Data-Science-In-Cloud/18-Low-Code) + +## [പ്രി-ലെക്ചർ ക്വിസ്](https://ff-quizzes.netlify.app/en/ds/quiz/34) + +## 1. പരിചയം +### 1.1 ആസ്യൂർ മെഷീൻ ലേണിംഗ് എന്താണ്? + +ആസ്യൂർ ക്ലൗഡ് പ്ലാറ്റ്ഫോം 200-ലധികം ഉൽപ്പന്നങ്ങളും ക്ലൗഡ് സേവനങ്ങളും ഉൾക്കൊള്ളുന്ന ഒരു പ്ലാറ്റ്ഫോമാണ്, പുതിയ പരിഹാരങ്ങൾ സൃഷ്ടിക്കാൻ സഹായിക്കുന്നതിന് രൂപകൽപ്പന ചെയ്തിരിക്കുന്നു. +ഡാറ്റാ സയന്റിസ്റ്റുകൾ ഡാറ്റ പരിശോധിക്കുകയും പ്രീ-പ്രോസസ്സ് ചെയ്യുകയും, കൃത്യമായ മോഡലുകൾ സൃഷ്ടിക്കാൻ വിവിധ മോഡൽ-ട്രെയിനിംഗ് ആൽഗോരിതങ്ങൾ പരീക്ഷിക്കുകയും ചെയ്യുന്നതിൽ വലിയ പരിശ്രമം ചെലവഴിക്കാറുണ്ട്. ഈ പ്രവർത്തനങ്ങൾ സമയമെടുക്കുന്നവയാണ്, കൂടാതെ ചിലപ്പോൾ വിലയേറിയ കംപ്യൂട്ട് ഹാർഡ്‌വെയർ അനാവശ്യമായി ഉപയോഗിക്കുന്നു. + +[Azure ML](https://docs.microsoft.com/azure/machine-learning/overview-what-is-azure-machine-learning?WT.mc_id=academic-77958-bethanycheum&ocid=AID3041109) ആസ്യൂറിൽ മെഷീൻ ലേണിംഗ് പരിഹാരങ്ങൾ നിർമ്മിക്കുകയും പ്രവർത്തിപ്പിക്കുകയും ചെയ്യുന്നതിനുള്ള ക്ലൗഡ് അടിസ്ഥാനമാക്കിയ പ്ലാറ്റ്ഫോമാണ്. ഡാറ്റാ സയന്റിസ്റ്റുകൾക്ക് ഡാറ്റ തയ്യാറാക്കാനും, മോഡലുകൾ പരിശീലിപ്പിക്കാനും, പ്രവചന സേവനങ്ങൾ പ്രസിദ്ധീകരിക്കാനും, അവയുടെ ഉപയോഗം നിരീക്ഷിക്കാനും സഹായിക്കുന്ന നിരവധി ഫീച്ചറുകളും കഴിവുകളും ഇതിൽ ഉൾക്കൊള്ളുന്നു. ഏറ്റവും പ്രധാനമായി, മോഡൽ പരിശീലനവുമായി ബന്ധപ്പെട്ട സമയമെടുക്കുന്ന പല പ്രവർത്തനങ്ങളും സ്വയം പ്രവർത്തിപ്പിച്ച് അവരുടെ കാര്യക്ഷമത വർദ്ധിപ്പിക്കാൻ ഇത് സഹായിക്കുന്നു; കൂടാതെ വലിയ ഡാറ്റ വോളിയം കൈകാര്യം ചെയ്യുന്നതിനായി ഫലപ്രദമായി സ്കെയിൽ ചെയ്യുന്ന ക്ലൗഡ് അടിസ്ഥാനമാക്കിയ കംപ്യൂട്ട് റിസോഴ്‌സുകൾ ഉപയോഗിക്കാൻ ഇത് അനുവദിക്കുന്നു, ഉപയോഗിക്കുമ്പോഴേ മാത്രം ചെലവ് വരുത്തുന്നു. + +ആസ്യൂർ ML ഡെവലപ്പർമാർക്കും ഡാറ്റാ സയന്റിസ്റ്റുകൾക്കും അവരുടെ മെഷീൻ ലേണിംഗ് പ്രവൃത്തികൾക്കായി ആവശ്യമായ എല്ലാ ഉപകരണങ്ങളും നൽകുന്നു. ഇവയിൽ ഉൾപ്പെടുന്നു: + +- **Azure Machine Learning Studio**: മോഡൽ പരിശീലനം, ഡിപ്ലോയ്മെന്റ്, ഓട്ടോമേഷൻ, ട്രാക്കിംഗ്, ആസറ്റ് മാനേജ്മെന്റ് എന്നിവയ്ക്കായി ലോ-കോഡ്, നോ-കോഡ് ഓപ്ഷനുകൾ ഉള്ള ആസ്യൂർ മെഷീൻ ലേണിംഗിലെ വെബ് പോർട്ടൽ. സ്റ്റുഡിയോ ആസ്യൂർ ML SDK-യുമായി സംയോജിപ്പിച്ചിരിക്കുന്നു. +- **Jupyter Notebooks**: ML മോഡലുകൾ വേഗത്തിൽ പ്രോട്ടോടൈപ്പ് ചെയ്ത് പരീക്ഷിക്കാൻ. +- **Azure Machine Learning Designer**: മോഡ്യൂളുകൾ ഡ്രാഗ്-അൻഡ്-ഡ്രോപ്പ് ചെയ്ത് പരീക്ഷണങ്ങൾ നിർമ്മിക്കുകയും പിന്നീട് ലോ-കോഡ് പരിസ്ഥിതിയിൽ പൈപ്പ്ലൈനുകൾ ഡിപ്ലോയ് ചെയ്യുകയും ചെയ്യാൻ. +- **Automated machine learning UI (AutoML)**: മെഷീൻ ലേണിംഗ് മോഡൽ വികസനത്തിലെ ആവർത്തന പ്രവർത്തനങ്ങൾ സ്വയം പ്രവർത്തിപ്പിച്ച് ഉയർന്ന സ്കെയിൽ, കാര്യക്ഷമത, ഉൽപാദനക്ഷമത എന്നിവയോടെ ML മോഡലുകൾ നിർമ്മിക്കാൻ സഹായിക്കുന്നു, മോഡൽ ഗുണനിലവാരം നിലനിർത്തിക്കൊണ്ട്. +- **Data Labelling**: ഡാറ്റ സ്വയം ലേബൽ ചെയ്യാൻ സഹായിക്കുന്ന ML ഉപകരണം. +- **Machine learning extension for Visual Studio Code**: ML പ്രോജക്ടുകൾ നിർമ്മിക്കുകയും നിയന്ത്രിക്കുകയും ചെയ്യുന്നതിനുള്ള സമ്പൂർണ വികസന പരിസ്ഥിതി. +- **Machine learning CLI**: കമാൻഡ് ലൈൻ വഴി ആസ്യൂർ ML റിസോഴ്‌സുകൾ നിയന്ത്രിക്കാൻ കമാൻഡുകൾ. +- **PyTorch, TensorFlow, Scikit-learn തുടങ്ങിയ ഓപ്പൺ-സോഴ്‌സ് ഫ്രെയിംവർക്ക്‌സുമായി സംയോജനം**: പരിശീലനം, ഡിപ്ലോയ്മെന്റ്, എന്റ്പോയിന്റ് മാനേജ്മെന്റ് എന്നിവയ്ക്കായി. +- **MLflow**: നിങ്ങളുടെ മെഷീൻ ലേണിംഗ് പരീക്ഷണങ്ങളുടെ ലൈഫ് സൈക്കിൾ മാനേജ്മെന്റ് ചെയ്യാനുള്ള ഓപ്പൺ-സോഴ്‌സ് ലൈബ്രറി. **MLFlow Tracking** MLflow-യുടെ ഒരു ഘടകമാണ്, നിങ്ങളുടെ പരിശീലന റൺ മെട്രിക്‌സും മോഡൽ ആർട്ടിഫാക്റ്റുകളും ലോഗ് ചെയ്ത് ട്രാക്ക് ചെയ്യുന്നു, പരീക്ഷണ പരിസ്ഥിതിയുമായി ബന്ധമില്ലാതെ. + +### 1.2 ഹാർട്ട് ഫെയില്യർ പ്രവചനം പ്രോജക്ട്: + +പ്രോജക്ടുകൾ നിർമ്മിച്ച് പരീക്ഷണങ്ങൾ നടത്തുന്നത് നിങ്ങളുടെ കഴിവുകളും അറിവുകളും പരീക്ഷിക്കാൻ ഏറ്റവും നല്ല മാർഗമാണ്. ഈ പാഠത്തിൽ, ആസ്യൂർ ML സ്റ്റുഡിയോയിൽ ഹാർട്ട് ഫെയില്യർ ആക്രമണങ്ങൾ പ്രവചിക്കുന്ന ഡാറ്റാ സയൻസ് പ്രോജക്ട് നിർമ്മിക്കുന്ന രണ്ട് വ്യത്യസ്ത മാർഗങ്ങൾ പരിശോധിക്കാം: ലോ കോഡ്/നോ കോഡ് വഴി, ആസ്യൂർ ML SDK വഴി, താഴെ കാണുന്ന സ്കീമ പ്രകാരം: + +![project-schema](../../../../translated_images/project-schema.736f6e403f321eb48d10242b3f4334dc6ccf0eabef8ff87daf52b89781389fcb.ml.png) + +ഓരോ മാർഗത്തിനും സ്വന്തം ഗുണങ്ങളും ദോഷങ്ങളും ഉണ്ട്. ലോ കോഡ്/നോ കോഡ് വഴി GUI (ഗ്രാഫിക്കൽ യൂസർ ഇന്റർഫേസ്) ഉപയോഗിച്ച് ആരംഭിക്കാൻ എളുപ്പമാണ്, കോഡ് അറിവ് ആവശ്യമില്ല. ഈ രീതിയിൽ പ്രോജക്ടിന്റെ സാധുത വേഗത്തിൽ പരിശോധിക്കാനും POC (പ്രൂഫ് ഓഫ് കോൺസെപ്റ്റ്) സൃഷ്ടിക്കാനും കഴിയും. എന്നാൽ, പ്രോജക്ട് വളരുമ്പോൾ പ്രൊഡക്ഷൻ റെഡിയാക്കേണ്ടതുണ്ടെങ്കിൽ GUI വഴി റിസോഴ്‌സുകൾ സൃഷ്ടിക്കുന്നത് പ്രായോഗികമല്ല. റിസോഴ്‌സുകൾ സൃഷ്ടിക്കുന്നതിൽ നിന്നും മോഡൽ ഡിപ്ലോയ്മെന്റിലേക്കുള്ള എല്ലാ കാര്യങ്ങളും പ്രോഗ്രാമാറ്റിക്കായി ഓട്ടോമേറ്റ് ചെയ്യേണ്ടതുണ്ട്. ആസ്യൂർ ML SDK ഉപയോഗിക്കുന്നതിന്റെ പ്രാധാന്യം ഇവിടെ വരുന്നു. + +| | ലോ കോഡ്/നോ കോഡ് | ആസ്യൂർ ML SDK | +|-------------------|------------------|---------------------------| +| കോഡ് പരിജ്ഞാനം | ആവശ്യമില്ല | ആവശ്യമുണ്ട് | +| വികസന സമയം | വേഗവും എളുപ്പവും | കോഡ് പരിജ്ഞാനത്തെ ആശ്രയിച്ചിരിക്കുന്നു | +| പ്രൊഡക്ഷൻ റെഡി | ഇല്ല | ഉണ്ട് | + +### 1.3 ഹാർട്ട് ഫെയില്യർ ഡാറ്റാസെറ്റ്: + +കാർഡിയോവാസ്കുലർ രോഗങ്ങൾ (CVDs) ലോകമാകെയുള്ള മരണങ്ങളുടെ 31% നും കാരണമാകുന്ന ഏറ്റവും പ്രധാനപ്പെട്ട മരണകാരണമാണ്. പുകവലി, അസ്വസ്ഥമായ ഭക്ഷണം, അമിതവണ്ണം, ശാരീരിക പ്രവർത്തനക്കുറവ്, മദ്യപാനം എന്നിവ പോലുള്ള പരിസ്ഥിതി, പെരുമാറ്റ അപകടകാരകങ്ങൾ ഈ മോഡലുകളുടെ ഫീച്ചറുകളായി ഉപയോഗിക്കാം. CVD വികസന സാധ്യത കണക്കാക്കാൻ കഴിയുന്നത് ഉയർന്ന അപകടമുള്ള ആളുകളിൽ ആക്രമണങ്ങൾ തടയാൻ സഹായകമാണ്. + +കാഗിൾ [ഹാർട്ട് ഫെയില്യർ ഡാറ്റാസെറ്റ്](https://www.kaggle.com/andrewmvd/heart-failure-clinical-data) പൊതുവായി ലഭ്യമാക്കിയിട്ടുണ്ട്, ഇത് ഈ പ്രോജക്ടിനായി ഉപയോഗിക്കും. ഡാറ്റാസെറ്റ് ഇപ്പോൾ ഡൗൺലോഡ് ചെയ്യാം. 13 കോളങ്ങളുള്ള (12 ഫീച്ചറുകളും 1 ടാർഗറ്റ് വേരിയബിളും) 299 വരികളുള്ള ടാബുലർ ഡാറ്റാസെറ്റാണ് ഇത്. + +| | വേരിയബിൾ നാമം | തരം | വിവരണം | ഉദാഹരണം | +|----|---------------------------|-----------------|-------------------------------------------------------|-------------------| +| 1 | വയസ്സ് | സംഖ്യാത്മക | രോഗിയുടെ വയസ്സ് | 25 | +| 2 | അനീമിയ | ബൂളിയൻ | റെഡ് ബ്ലഡ് സെല്ലുകൾ അല്ലെങ്കിൽ ഹീമോഗ്ലോബിൻ കുറവ് | 0 അല്ലെങ്കിൽ 1 | +| 3 | ക്രിയാറ്റിനിൻ ഫോസ്ഫോകിനേസ് | സംഖ്യാത്മക | രക്തത്തിലെ CPK എൻസൈം ലെവൽ | 542 | +| 4 | ഡയബറ്റീസ് | ബൂളിയൻ | രോഗിക്ക് ഡയബറ്റീസ് ഉണ്ടോ | 0 അല്ലെങ്കിൽ 1 | +| 5 | ഇജക്ഷൻ ഫ്രാക്ഷൻ | സംഖ്യാത്മക | ഹൃദയം ഓരോ ചുരുളിലും പുറത്തുവിടുന്ന രക്തത്തിന്റെ ശതമാനം | 45 | +| 6 | ഉയർന്ന രക്തസമ്മർദ്ദം | ബൂളിയൻ | രോഗിക്ക് ഹൈപ്പർടെൻഷൻ ഉണ്ടോ | 0 അല്ലെങ്കിൽ 1 | +| 7 | പ്ലേറ്റ്ലെറ്റുകൾ | സംഖ്യാത്മക | രക്തത്തിലെ പ്ലേറ്റ്ലെറ്റുകൾ | 149000 | +| 8 | സീറം ക്രിയാറ്റിനിൻ | സംഖ്യാത്മക | രക്തത്തിലെ സീറം ക്രിയാറ്റിനിൻ ലെവൽ | 0.5 | +| 9 | സീറം സോഡിയം | സംഖ്യാത്മക | രക്തത്തിലെ സീറം സോഡിയം ലെവൽ | jun | +| 10 | ലിംഗം | ബൂളിയൻ | സ്ത്രീ അല്ലെങ്കിൽ പുരുഷൻ | 0 അല്ലെങ്കിൽ 1 | +| 11 | പുകവലി | ബൂളിയൻ | രോഗി പുകവലി ചെയ്യുമോ | 0 അല്ലെങ്കിൽ 1 | +| 12 | സമയം | സംഖ്യാത്മക | ഫോളോ-അപ്പ് കാലയളവ് (ദിവസങ്ങൾ) | 4 | +|----|---------------------------|-----------------|-------------------------------------------------------|-------------------| +| 21 | DEATH_EVENT [ടാർഗറ്റ്] | ബൂളിയൻ | ഫോളോ-അപ്പ് കാലയളവിൽ രോഗി മരിച്ചോ | 0 അല്ലെങ്കിൽ 1 | + +ഡാറ്റാസെറ്റ് ലഭിച്ച ശേഷം, ആസ്യൂറിൽ പ്രോജക്ട് ആരംഭിക്കാം. + +## 2. ആസ്യൂർ ML സ്റ്റുഡിയോയിൽ മോഡൽ ലോ കോഡ്/നോ കോഡ് പരിശീലനം +### 2.1 ആസ്യൂർ ML വർക്ക്സ്പേസ് സൃഷ്ടിക്കുക +ആസ്യൂർ ML-ൽ മോഡൽ പരിശീലിപ്പിക്കാൻ ആദ്യം ആസ്യൂർ ML വർക്ക്സ്പേസ് സൃഷ്ടിക്കണം. വർക്ക്സ്പേസ് ആസ്യൂർ മെഷീൻ ലേണിംഗിനുള്ള ടോപ്പ്-ലെവൽ റിസോഴ്‌സ് ആണ്, നിങ്ങൾ സൃഷ്ടിക്കുന്ന എല്ലാ ആർട്ടിഫാക്റ്റുകളുമായി പ്രവർത്തിക്കാൻ കേന്ദ്രകേന്ദ്രമായ സ്ഥലം നൽകുന്നു. വർക്ക്സ്പേസ് എല്ലാ പരിശീലന റൺസിന്റെ ചരിത്രം സൂക്ഷിക്കുന്നു, ലോഗുകൾ, മെട്രിക്‌സ്, ഔട്ട്പുട്ട്, സ്ക്രിപ്റ്റുകളുടെ സ്നാപ്ഷോട്ട് എന്നിവ ഉൾപ്പെടെ. ഏത് പരിശീലന റൺ മികച്ച മോഡൽ ഉത്പാദിപ്പിക്കുന്നുവെന്ന് നിർണയിക്കാൻ ഈ വിവരങ്ങൾ ഉപയോഗിക്കുന്നു. [കൂടുതൽ അറിയുക](https://docs.microsoft.com/azure/machine-learning/concept-workspace?WT.mc_id=academic-77958-bethanycheum&ocid=AID3041109) + +നിങ്ങളുടെ ഓപ്പറേറ്റിംഗ് സിസ്റ്റത്തിനോട് അനുയോജ്യമായ ഏറ്റവും പുതിയ ബ്രൗസർ ഉപയോഗിക്കുന്നത് ശുപാർശ ചെയ്യുന്നു. പിന്തുണയുള്ള ബ്രൗസറുകൾ: + +- Microsoft Edge (പുതിയ Microsoft Edge, ഏറ്റവും പുതിയ പതിപ്പ്. Microsoft Edge ലെഗസി അല്ല) +- Safari (ഏറ്റവും പുതിയ പതിപ്പ്, മാക് മാത്രം) +- Chrome (ഏറ്റവും പുതിയ പതിപ്പ്) +- Firefox (ഏറ്റവും പുതിയ പതിപ്പ്) + +ആസ്യൂർ മെഷീൻ ലേണിംഗ് ഉപയോഗിക്കാൻ, നിങ്ങളുടെ ആസ്യൂർ സബ്സ്ക്രിപ്ഷനിൽ വർക്ക്സ്പേസ് സൃഷ്ടിക്കുക. പിന്നീട് ഈ വർക്ക്സ്പേസ് ഉപയോഗിച്ച് ഡാറ്റ, കംപ്യൂട്ട് റിസോഴ്‌സുകൾ, കോഡ്, മോഡലുകൾ, മറ്റ് ആർട്ടിഫാക്റ്റുകൾ എന്നിവ നിയന്ത്രിക്കാം. + +> **_കുറിപ്പ്:_** ആസ്യൂർ മെഷീൻ ലേണിംഗ് വർക്ക്സ്പേസ് നിങ്ങളുടെ സബ്സ്ക്രിപ്ഷനിൽ നിലനിൽക്കുന്നവരെ ഡാറ്റാ സ്റ്റോറേജിനായി ചെറിയ തുക ചാർജ് ചെയ്യും, അതിനാൽ നിങ്ങൾ ഉപയോഗിക്കാത്തപ്പോൾ വർക്ക്സ്പേസ് ഇല്ലാതാക്കാൻ ശുപാർശ ചെയ്യുന്നു. + +1. നിങ്ങളുടെ ആസ്യൂർ സബ്സ്ക്രിപ്ഷനുമായി ബന്ധപ്പെട്ട മൈക്രോസോഫ്റ്റ് ക്രെഡൻഷ്യലുകൾ ഉപയോഗിച്ച് [ആസ്യൂർ പോർട്ടലിൽ](https://ms.portal.azure.com/) സൈൻ ഇൻ ചെയ്യുക. +2. **+Create a resource** തിരഞ്ഞെടുക്കുക + + ![workspace-1](../../../../translated_images/workspace-1.ac8694d60b073ed1ae8333d71244dc8a9b3e439d54593724f98f1beefdd27b08.ml.png) + + മെഷീൻ ലേണിംഗ് തിരയുക, മെഷീൻ ലേണിംഗ് ടൈൽ തിരഞ്ഞെടുക്കുക + + ![workspace-2](../../../../translated_images/workspace-2.ae7c486db8796147075e4a56566aa819827dd6c4c8d18d64590317c3be625f17.ml.png) + + സൃഷ്ടിക്കുക ബട്ടൺ ക്ലിക്ക് ചെയ്യുക + + ![workspace-3](../../../../translated_images/workspace-3.398ca4a5858132cce584db9df10c5a011cd9075eb182e647a77d5cac01771eea.ml.png) + + ക്രമീകരണങ്ങൾ താഴെപോലെ പൂരിപ്പിക്കുക: + - സബ്സ്ക്രിപ്ഷൻ: നിങ്ങളുടെ ആസ്യൂർ സബ്സ്ക്രിപ്ഷൻ + - റിസോഴ്‌സ് ഗ്രൂപ്പ്: ഒരു റിസോഴ്‌സ് ഗ്രൂപ്പ് സൃഷ്ടിക്കുക അല്ലെങ്കിൽ തിരഞ്ഞെടുക്കുക + - വർക്ക്സ്പേസ് നാമം: നിങ്ങളുടെ വർക്ക്സ്പേസിന് ഒരു വ്യത്യസ്തമായ പേര് നൽകുക + - പ്രദേശം: നിങ്ങളുടെ അടുത്തുള്ള ഭൂമിശാസ്ത്ര പ്രദേശം തിരഞ്ഞെടുക്കുക + - സ്റ്റോറേജ് അക്കൗണ്ട്: നിങ്ങളുടെ വർക്ക്സ്പേസിനായി സൃഷ്ടിക്കപ്പെടുന്ന ഡിഫോൾട്ട് പുതിയ സ്റ്റോറേജ് അക്കൗണ്ട് ശ്രദ്ധിക്കുക + - കീ വാൾട്ട്: നിങ്ങളുടെ വർക്ക്സ്പേസിനായി സൃഷ്ടിക്കപ്പെടുന്ന ഡിഫോൾട്ട് പുതിയ കീ വാൾട്ട് ശ്രദ്ധിക്കുക + - അപ്ലിക്കേഷൻ ഇൻസൈറ്റ്സ്: നിങ്ങളുടെ വർക്ക്സ്പേസിനായി സൃഷ്ടിക്കപ്പെടുന്ന ഡിഫോൾട്ട് പുതിയ അപ്ലിക്കേഷൻ ഇൻസൈറ്റ്സ് റിസോഴ്‌സ് ശ്രദ്ധിക്കുക + - കണ്ടെയ്‌നർ രജിസ്ട്രി: ഇല്ല (മോഡൽ ആദ്യമായി കണ്ടെയ്‌നറിൽ ഡിപ്ലോയ് ചെയ്യുമ്പോൾ സ്വയം സൃഷ്ടിക്കും) + + ![workspace-4](../../../../translated_images/workspace-4.bac87f6599c4df63e624fc2608990f965887bee551d9dedc71c687b43b986b6a.ml.png) + + - സൃഷ്ടിക്കുക + അവലോകനം ക്ലിക്ക് ചെയ്ത് പിന്നീട് സൃഷ്ടിക്കുക ബട്ടൺ ക്ലിക്ക് ചെയ്യുക +3. നിങ്ങളുടെ വർക്ക്സ്പേസ് സൃഷ്ടിക്കപ്പെടുന്നത് കാത്തിരിക്കുക (ചില മിനിറ്റുകൾ എടുക്കാം). ശേഷം പോർട്ടലിൽ അതിലേക്ക് പോകുക. ഇത് മെഷീൻ ലേണിംഗ് ആസ്യൂർ സേവനത്തിലൂടെ കണ്ടെത്താം. +4. നിങ്ങളുടെ വർക്ക്സ്പേസ് ഓവർവ്യൂ പേജിൽ, ആസ്യൂർ മെഷീൻ ലേണിംഗ് സ്റ്റുഡിയോ ആരംഭിക്കുക (അല്ലെങ്കിൽ പുതിയ ബ്രൗസർ ടാബ് തുറന്ന് https://ml.azure.com-ൽ പോകുക), നിങ്ങളുടെ മൈക്രോസോഫ്റ്റ് അക്കൗണ്ട് ഉപയോഗിച്ച് സൈൻ ഇൻ ചെയ്യുക. ആവശ്യമായാൽ, നിങ്ങളുടെ ആസ്യൂർ ഡയറക്ടറി, സബ്സ്ക്രിപ്ഷൻ, ആസ്യൂർ ML വർക്ക്സ്പേസ് തിരഞ്ഞെടുക്കുക. + +![workspace-5](../../../../translated_images/workspace-5.a6eb17e0a5e6420018b08bdaf3755ce977f96f1df3ea363d2476a9dce7e15adb.ml.png) + +5. ആസ്യൂർ ML സ്റ്റുഡിയോയിൽ, ഇടത് മുകളിൽ ☰ ഐക്കൺ ടോഗിൾ ചെയ്ത് ഇന്റർഫേസ് ഉള്ള വിവിധ പേജുകൾ കാണുക. ഈ പേജുകൾ ഉപയോഗിച്ച് നിങ്ങളുടെ വർക്ക്സ്പേസ് റിസോഴ്‌സുകൾ നിയന്ത്രിക്കാം. + +![workspace-6](../../../../translated_images/workspace-6.8dd81fe841797ee17f8f73916769576260b16c4e17e850d277a49db35fd74a15.ml.png) + +നിങ്ങൾ ആസ്യൂർ പോർട്ടൽ ഉപയോഗിച്ച് വർക്ക്സ്പേസ് നിയന്ത്രിക്കാം, എന്നാൽ ഡാറ്റാ സയന്റിസ്റ്റുകൾക്കും മെഷീൻ ലേണിംഗ് ഓപ്പറേഷൻസ് എഞ്ചിനീയർമാർക്കും, ആസ്യൂർ ML സ്റ്റുഡിയോ വർക്ക്സ്പേസ് റിസോഴ്‌സുകൾ നിയന്ത്രിക്കാൻ കൂടുതൽ കേന്ദ്രീകൃതമായ യൂസർ ഇന്റർഫേസ് നൽകുന്നു. + +### 2.2 കംപ്യൂട്ട് റിസോഴ്‌സുകൾ + +കംപ്യൂട്ട് റിസോഴ്‌സുകൾ മോഡൽ പരിശീലനവും ഡാറ്റാ എക്സ്പ്ലോറേഷനും നടത്താൻ ഉപയോഗിക്കുന്ന ക്ലൗഡ് അടിസ്ഥാനമാക്കിയ റിസോഴ്‌സുകളാണ്. നിങ്ങൾ സൃഷ്ടിക്കാവുന്ന നാല് തരത്തിലുള്ള കംപ്യൂട്ട് റിസോഴ്‌സുകൾ ഉണ്ട്: + +- **Compute Instances**: ഡാറ്റാ സയന്റിസ്റ്റുകൾക്ക് ഡാറ്റയും മോഡലുകളും കൈകാര്യം ചെയ്യാൻ ഉപയോഗിക്കുന്ന ഡെവലപ്പ്മെന്റ് വർക്ക്‌സ്റ്റേഷനുകൾ. ഇതിൽ ഒരു വെർച്വൽ മെഷീൻ (VM) സൃഷ്ടിച്ച് നോട്ട്‌ബുക്ക് ഇൻസ്റ്റൻസ് ആരംഭിക്കുന്നു. പിന്നീട് നോട്ട്‌ബുക്കിൽ നിന്ന് കംപ്യൂട്ട് ക്ലസ്റ്റർ വിളിച്ച് മോഡൽ പരിശീലിപ്പിക്കാം. +- **Compute Clusters**: പരീക്ഷണ കോഡ് ഓൺ-ഡിമാൻഡ് പ്രോസസ്സിംഗിനായി സ്കെയിലബിൾ VM ക്ലസ്റ്ററുകൾ. മോഡൽ പരിശീലനത്തിന് ഇത് ആവശ്യമാണ്. കംപ്യൂട്ട് ക്ലസ്റ്ററുകൾ പ്രത്യേക GPU അല്ലെങ്കിൽ CPU റിസോഴ്‌സുകളും ഉപയോഗിക്കാം. +- **Inference Clusters**: നിങ്ങളുടെ പരിശീലിപ്പിച്ച മോഡലുകൾ ഉപയോഗിക്കുന്ന പ്രവചന സേവനങ്ങൾക്കുള്ള വിന്യാസ ലക്ഷ്യങ്ങൾ. +- **Attached Compute**: Virtual Machines അല്ലെങ്കിൽ Azure Databricks ക്ലസ്റ്ററുകൾ പോലുള്ള നിലവിലുള്ള Azure കംപ്യൂട്ട് റിസോഴ്‌സുകളിലേക്ക് ലിങ്കുകൾ. + + +#### 2.2.1 നിങ്ങളുടെ കംപ്യൂട്ട് റിസോഴ്‌സുകൾക്കായി ശരിയായ ഓപ്ഷനുകൾ തിരഞ്ഞെടുക്കൽ + +ഒരു കംപ്യൂട്ട് റിസോഴ്‌സ് സൃഷ്ടിക്കുമ്പോൾ പരിഗണിക്കേണ്ട ചില പ്രധാന ഘടകങ്ങളുണ്ട്, ആ തിരഞ്ഞെടുപ്പുകൾ നിർണായകമായ തീരുമാനങ്ങളാകാം. + +**നിങ്ങൾക്ക് CPU അല്ലെങ്കിൽ GPU ആവശ്യമുണ്ടോ?** + +CPU (Central Processing Unit) ഒരു കമ്പ്യൂട്ടർ പ്രോഗ്രാമിന്റെ നിർദ്ദേശങ്ങൾ നിർവഹിക്കുന്ന ഇലക്ട്രോണിക് സർക്ക്യൂട്ടറിയാണ്. GPU (Graphics Processing Unit) വളരെ ഉയർന്ന നിരക്കിൽ ഗ്രാഫിക്സ്-ബന്ധപ്പെട്ട കോഡ് നിർവഹിക്കാൻ കഴിവുള്ള പ്രത്യേക ഇലക്ട്രോണിക് സർക്ക്യൂട്ടറാണ്. + +CPUയും GPUയും തമ്മിലുള്ള പ്രധാന വ്യത്യാസം CPU വേഗത്തിൽ (CPU ക്ലോക്ക് സ്പീഡ് പ്രകാരം) വ്യാപകമായ ടാസ്കുകൾ വേഗത്തിൽ കൈകാര്യം ചെയ്യാൻ രൂപകൽപ്പന ചെയ്തിട്ടുള്ളതായിരിക്കുമ്പോൾ, ഒരേസമയം പ്രവർത്തിക്കാവുന്ന ടാസ്കുകളുടെ concurrencyയിൽ പരിമിതമാണ്. GPUകൾ പാരലൽ കംപ്യൂട്ടിംഗിനായി രൂപകൽപ്പന ചെയ്തതാണ്, അതിനാൽ ഡീപ് ലേണിംഗ് ടാസ്കുകളിൽ വളരെ മികച്ചതാണ്. + +| CPU | GPU | +|-----------------------------------------|-----------------------------| +| കുറവ് ചെലവുള്ളത് | കൂടുതൽ ചെലവുള്ളത് | +| concurrency ന്റെ താഴ്ന്ന നില | concurrency ന്റെ ഉയർന്ന നില | +| ഡീപ് ലേണിംഗ് മോഡലുകൾ പരിശീലിപ്പിക്കാൻ മന്ദഗതിയുള്ളത് | ഡീപ് ലേണിംഗിന് അനുയോജ്യം | + + +**ക്ലസ്റ്റർ വലുപ്പം** + +വലുതായ ക്ലസ്റ്ററുകൾ കൂടുതൽ ചെലവേറിയതാണ്, പക്ഷേ മികച്ച പ്രതികരണക്ഷമത നൽകും. അതിനാൽ, നിങ്ങൾക്ക് സമയം ഉണ്ടെങ്കിലും പണം കുറവാണെങ്കിൽ, ചെറിയ ക്ലസ്റ്ററോടെ ആരംഭിക്കുക. മറുവശത്ത്, പണം ഉണ്ടെങ്കിലും സമയം കുറവാണെങ്കിൽ, വലിയ ക്ലസ്റ്ററോടെ ആരംഭിക്കുക. + +**VM വലുപ്പം** + +നിങ്ങളുടെ സമയം, ബജറ്റ് പരിധികൾ അനുസരിച്ച്, RAM, ഡിസ്ക്, കോറുകളുടെ എണ്ണം, ക്ലോക്ക് സ്പീഡ് എന്നിവയുടെ വലുപ്പം വ്യത്യാസപ്പെടുത്താം. ഈ എല്ലാ പാരാമീറ്ററുകളും വർദ്ധിപ്പിക്കുന്നത് ചെലവേറിയതായിരിക്കും, പക്ഷേ മികച്ച പ്രകടനം നൽകും. + +**Dedicated അല്ലെങ്കിൽ Low-Priority Instances?** + +Low-priority instance എന്നത് ഇടപെടാവുന്നതാണ്: അടിസ്ഥാനത്തിൽ, Microsoft Azure ആ റിസോഴ്‌സുകൾ എടുത്ത് മറ്റൊരു ടാസ്കിന് നൽകാം, അതിനാൽ ഒരു ജോബ് ഇടപെടപ്പെടും. Dedicated instance അല്ലെങ്കിൽ non-interruptible എന്നത്, നിങ്ങളുടെ അനുമതിയില്ലാതെ ജോബ് ഒരിക്കലും അവസാനിപ്പിക്കപ്പെടില്ല എന്നർത്ഥമാണ്. +ഇത് സമയം vs പണം എന്ന മറ്റൊരു പരിഗണനയാണ്, കാരണം ഇടപെടാവുന്ന ഇൻസ്റ്റൻസുകൾ ഡെഡിക്കേറ്റഡ് ഇൻസ്റ്റൻസുകളേക്കാൾ കുറവ് ചെലവുള്ളതാണ്. + +#### 2.2.2 കംപ്യൂട്ട് ക്ലസ്റ്റർ സൃഷ്ടിക്കൽ + +മുൻപ് സൃഷ്ടിച്ച [Azure ML workspace](https://ml.azure.com/) ൽ, compute ലേക്ക് പോകുക, നിങ്ങൾ ഇപ്പോൾ ചർച്ച ചെയ്ത വിവിധ കംപ്യൂട്ട് റിസോഴ്‌സുകൾ കാണാൻ കഴിയും (ഉദാ: compute instances, compute clusters, inference clusters, attached compute). ഈ പ്രോജക്ടിനായി, മോഡൽ പരിശീലനത്തിനായി ഒരു compute cluster ആവശ്യമുണ്ട്. സ്റ്റുഡിയോയിൽ, "Compute" മെനുവിൽ ക്ലിക്ക് ചെയ്യുക, തുടർന്ന് "Compute cluster" ടാബിൽ ക്ലിക്ക് ചെയ്ത് "+ New" ബട്ടൺ ക്ലിക്ക് ചെയ്ത് compute cluster സൃഷ്ടിക്കുക. + +![22](../../../../translated_images/cluster-1.b78cb630bb543729b11f60c34d97110a263f8c27b516ba4dc47807b3cee5579f.ml.png) + +1. നിങ്ങളുടെ ഓപ്ഷനുകൾ തിരഞ്ഞെടുക്കുക: Dedicated vs Low priority, CPU അല്ലെങ്കിൽ GPU, VM വലുപ്പം, കോർ എണ്ണം (ഈ പ്രോജക്ടിനായി ഡിഫോൾട്ട് സെറ്റിംഗുകൾ നിലനിർത്താം). +2. Next ബട്ടൺ ക്ലിക്ക് ചെയ്യുക. + +![23](../../../../translated_images/cluster-2.ea30cdbc9f926bb9e05af3fdbc1f679811c796dc2a6847f935290aec15526e88.ml.png) + +3. ക്ലസ്റ്ററിന് ഒരു കംപ്യൂട്ട് പേര് നൽകുക +4. നിങ്ങളുടെ ഓപ്ഷനുകൾ തിരഞ്ഞെടുക്കുക: കുറഞ്ഞ/പരമാവധി നോഡുകളുടെ എണ്ണം, സ്കെയിൽ ഡൗൺ ചെയ്യുന്നതിന് മുമ്പുള്ള ഐഡിൽ സെക്കൻഡുകൾ, SSH ആക്‌സസ്. കുറഞ്ഞ നോഡുകളുടെ എണ്ണം 0 ആണെങ്കിൽ, ക്ലസ്റ്റർ ഐഡിൽ ആയപ്പോൾ പണം ലാഭിക്കും. പരമാവധി നോഡുകളുടെ എണ്ണം കൂടുതലായാൽ പരിശീലനം കുറച്ച് സമയം എടുക്കും. പരമാവധി നോഡുകളുടെ ശുപാർശ 3 ആണ്. +5. "Create" ബട്ടൺ ക്ലിക്ക് ചെയ്യുക. ഈ ഘട്ടം കുറച്ച് മിനിറ്റുകൾ എടുക്കാം. + +![29](../../../../translated_images/cluster-3.8a334bc070ec173a329ce5abd2a9d727542e83eb2347676c9af20f2c8870b3e7.ml.png) + +അദ്ഭുതം! ഇപ്പോൾ ഒരു Compute cluster ഉണ്ടാകുമ്പോൾ, ഡാറ്റ Azure ML Studio-യിൽ ലോഡ് ചെയ്യേണ്ടതാണ്. + +### 2.3 ഡാറ്റാസെറ്റ് ലോഡിംഗ് + +1. മുൻപ് സൃഷ്ടിച്ച [Azure ML workspace](https://ml.azure.com/) ൽ, ഇടത് മെനുവിൽ "Datasets" ക്ലിക്ക് ചെയ്ത് "+ Create dataset" ബട്ടൺ ക്ലിക്ക് ചെയ്ത് ഒരു dataset സൃഷ്ടിക്കുക. "From local files" ഓപ്ഷൻ തിരഞ്ഞെടുക്കുക, മുൻപ് ഡൗൺലോഡ് ചെയ്ത Kaggle dataset തിരഞ്ഞെടുക്കുക. + + ![24](../../../../translated_images/dataset-1.e86ab4e10907a6e9c2a72577b51db35f13689cb33702337b8b7032f2ef76dac2.ml.png) + +2. നിങ്ങളുടെ dataset-ന് ഒരു പേര്, തരം, വിവരണം നൽകുക. Next ക്ലിക്ക് ചെയ്യുക. ഫയലുകളിൽ നിന്ന് ഡാറ്റ അപ്‌ലോഡ് ചെയ്യുക. Next ക്ലിക്ക് ചെയ്യുക. + + ![25](../../../../translated_images/dataset-2.f58de1c435d5bf9ccb16ccc5f5d4380eb2b50affca85cfbf4f97562bdab99f77.ml.png) + +3. Schema-യിൽ, താഴെപ്പറയുന്ന ഫീച്ചറുകൾക്ക് ഡാറ്റ ടൈപ്പ് Boolean ആയി മാറ്റുക: anaemia, diabetes, high blood pressure, sex, smoking, DEATH_EVENT. Next ക്ലിക്ക് ചെയ്ത് Create ക്ലിക്ക് ചെയ്യുക. + + ![26](../../../../translated_images/dataset-3.58db8c0eb783e89236a02bbce5bb4ba808d081a87d994d5284b1ae59928c95bf.ml.png) + +ശ്രേഷ്ഠം! Dataset സജ്ജമായപ്പോൾ, compute cluster സൃഷ്ടിച്ചതിനുശേഷം, മോഡൽ പരിശീലനം ആരംഭിക്കാം! + +### 2.4 AutoML ഉപയോഗിച്ച് Low code/No Code പരിശീലനം + +പരമ്പരാഗത മെഷീൻ ലേണിംഗ് മോഡൽ വികസനം വിഭവസമ്പന്നമാണ്, വലിയ ഡൊമെയ്ൻ അറിവും സമയവും ആവശ്യമാണ്, നിരവധി മോഡലുകൾ നിർമ്മിച്ച് താരതമ്യം ചെയ്യേണ്ടതുണ്ട്. +Automated machine learning (AutoML) മെഷീൻ ലേണിംഗ് മോഡൽ വികസനത്തിലെ സമയമെടുക്കുന്ന, ആവർത്തനപരമായ പ്രവർത്തനങ്ങൾ സ്വയം പ്രവർത്തിപ്പിക്കുന്ന പ്രക്രിയയാണ്. ഇത് ഡാറ്റ സയന്റിസ്റ്റുകൾ, വിശകലനക്കാർ, ഡെവലപ്പർമാർക്ക് ഉയർന്ന സ്കെയിൽ, കാര്യക്ഷമത, ഉൽപാദകത്വത്തോടെ ML മോഡലുകൾ നിർമ്മിക്കാൻ അനുവദിക്കുന്നു, മോഡൽ ഗുണനിലവാരം നിലനിർത്തിക്കൊണ്ട്. ഇത് പ്രൊഡക്ഷൻ-സജ്ജമായ ML മോഡലുകൾ ലഭിക്കാൻ വേണ്ട സമയവും ലളിതവും കാര്യക്ഷമവുമാണ് കുറയ്ക്കുന്നത്. [കൂടുതൽ പഠിക്കുക](https://docs.microsoft.com/azure/machine-learning/concept-automated-ml?WT.mc_id=academic-77958-bethanycheum&ocid=AID3041109) + +1. മുൻപ് സൃഷ്ടിച്ച [Azure ML workspace](https://ml.azure.com/) ൽ, ഇടത് മെനുവിൽ "Automated ML" ക്ലിക്ക് ചെയ്ത് നിങ്ങൾ അപ്‌ലോഡ് ചെയ്ത dataset തിരഞ്ഞെടുക്കുക. Next ക്ലിക്ക് ചെയ്യുക. + + ![27](../../../../translated_images/aml-1.67281a85d3a1e2f34eb367b2d0f74e1039d13396e510f363cd8766632106d1ec.ml.png) + +2. പുതിയ experiment പേര് നൽകുക, target column (DEATH_EVENT) തിരഞ്ഞെടുക്കുക, സൃഷ്ടിച്ച compute cluster തിരഞ്ഞെടുക്കുക. Next ക്ലിക്ക് ചെയ്യുക. + + ![28](../../../../translated_images/aml-2.c9fb9cffb39ccbbe21ab9810ae937195d41a489744e15cff2b8477ed4dcae1ec.ml.png) + +3. "Classification" തിരഞ്ഞെടുക്കുക, Finish ക്ലിക്ക് ചെയ്യുക. ഈ ഘട്ടം compute cluster വലുപ്പം അനുസരിച്ച് 30 മിനിറ്റിൽ 1 മണിക്കൂർ വരെ എടുക്കാം. + + ![30](../../../../translated_images/aml-3.a7952e4295f38cc6cdb0c7ed6dc71ea756b7fb5697ec126bc1220f87c5fa9231.ml.png) + +4. റൺ പൂർത്തിയായ ശേഷം, "Automated ML" ടാബിൽ ക്ലിക്ക് ചെയ്യുക, നിങ്ങളുടെ റൺ തിരഞ്ഞെടുക്കുക, "Best model summary" കാർഡിലെ Algorithm ക്ലിക്ക് ചെയ്യുക. + + ![31](../../../../translated_images/aml-4.7a627e09cb6f16d0aa246059d9faee3d1725cc4258d0c8df15e801f73afc7e2c.ml.png) + +ഇവിടെ AutoML സൃഷ്ടിച്ച മികച്ച മോഡലിന്റെ വിശദമായ വിവരണം കാണാം. Models ടാബിൽ മറ്റ് മോഡലുകളും പരിശോധിക്കാം. Explanations (preview ബട്ടൺ) ൽ മോഡലുകൾ പരിശോധിക്കാൻ കുറച്ച് സമയം ചെലവഴിക്കുക. നിങ്ങൾ ഉപയോഗിക്കാൻ ആഗ്രഹിക്കുന്ന മോഡൽ തിരഞ്ഞെടുക്കുമ്പോൾ (ഇവിടെ AutoML തിരഞ്ഞെടുത്ത മികച്ച മോഡൽ തിരഞ്ഞെടുക്കും), അതിനെ എങ്ങനെ വിന്യസിക്കാമെന്ന് കാണാം. + +## 3. Low code/No Code മോഡൽ വിന്യാസവും എൻഡ്‌പോയിന്റ് ഉപഭോഗവും +### 3.1 മോഡൽ വിന്യാസം + +Automated machine learning ഇന്റർഫേസ് മികച്ച മോഡൽ വെബ് സേവനമായി കുറച്ച് ഘട്ടങ്ങളിൽ വിന്യസിക്കാൻ അനുവദിക്കുന്നു. വിന്യാസം മോഡൽ ഇന്റഗ്രേഷൻ ആണ്, അതിലൂടെ പുതിയ ഡാറ്റ അടിസ്ഥാനമാക്കി പ്രവചനങ്ങൾ നടത്താനും സാധ്യതയുള്ള അവസരങ്ങൾ തിരിച്ചറിയാനും കഴിയും. ഈ പ്രോജക്ടിനായി, വെബ് സേവനമായി വിന്യസിക്കുന്നത് മെഡിക്കൽ ആപ്ലിക്കേഷനുകൾക്ക് മോഡൽ ഉപയോഗിച്ച് അവരുടെ രോഗികളുടെ ഹൃദയാഘാതം സാധ്യത ലൈവ് പ്രവചിക്കാൻ കഴിയും എന്നർത്ഥമാണ്. + +മികച്ച മോഡൽ വിവരണത്തിൽ "Deploy" ബട്ടൺ ക്ലിക്ക് ചെയ്യുക. + +![deploy-1](../../../../translated_images/deploy-1.ddad725acadc84e34553c3d09e727160faeb32527a9fb8b904c0f99235a34bb6.ml.png) + +15. ഒരു പേര്, വിവരണം, കംപ്യൂട്ട് തരം (Azure Container Instance), authentication സജ്ജമാക്കുക, Deploy ക്ലിക്ക് ചെയ്യുക. ഈ ഘട്ടം പൂർത്തിയാകാൻ ഏകദേശം 20 മിനിറ്റ് എടുക്കാം. വിന്യാസ പ്രക്രിയയിൽ മോഡൽ രജിസ്റ്റർ ചെയ്യൽ, റിസോഴ്‌സുകൾ സൃഷ്ടിക്കൽ, വെബ് സേവനത്തിനായി അവ ക്രമീകരിക്കൽ ഉൾപ്പെടുന്നു. Deploy status കീഴിൽ സ്റ്റാറ്റസ് സന്ദേശം കാണാം. സ്റ്റാറ്റസ് "Healthy" ആണെങ്കിൽ വിന്യസിച്ചും പ്രവർത്തിക്കുന്നുമാണ്. + +![deploy-2](../../../../translated_images/deploy-2.94dbb13f239086473aa4bf814342fd40483d136849b080f02bafbb995383940e.ml.png) + +16. വിന്യസിച്ച ശേഷം, Endpoint ടാബിൽ ക്ലിക്ക് ചെയ്ത് നിങ്ങൾ വിന്യസിച്ച എൻഡ്‌പോയിന്റ് തിരഞ്ഞെടുക്കുക. ഇവിടെ എൻഡ്‌പോയിന്റ് സംബന്ധിച്ച എല്ലാ വിവരങ്ങളും കാണാം. + +![deploy-3](../../../../translated_images/deploy-3.fecefef070e8ef3b28e802326d107f61ac4e672d20bf82d05f78d025f9e6c611.ml.png) + +അദ്ഭുതം! ഇപ്പോൾ ഒരു മോഡൽ വിന്യസിച്ചിരിക്കുന്നു, എൻഡ്‌പോയിന്റ് ഉപഭോഗം ആരംഭിക്കാം. + +### 3.2 എൻഡ്‌പോയിന്റ് ഉപഭോഗം + +"Consume" ടാബിൽ ക്ലിക്ക് ചെയ്യുക. ഇവിടെ REST എൻഡ്‌പോയിന്റും python സ്ക്രിപ്റ്റും ഉപഭോഗ ഓപ്ഷനിൽ കാണാം. python കോഡ് വായിക്കാൻ കുറച്ച് സമയം ചെലവഴിക്കുക. + +ഈ സ്ക്രിപ്റ്റ് നിങ്ങളുടെ ലോക്കൽ മെഷീനിൽ നിന്ന് നേരിട്ട് പ്രവർത്തിപ്പിക്കാം, നിങ്ങളുടെ എൻഡ്‌പോയിന്റ് ഉപഭോഗിക്കും. + +![35](../../../../translated_images/consumption-1.700abd196452842a020c7d745908637a6e4c5c50494ad1217be80e283e0de154.ml.png) + +ഈ 2 കോഡ് ലൈൻ പരിശോധിക്കുക: + +```python +url = 'http://98e3715f-xxxx-xxxx-xxxx-9ec22d57b796.centralus.azurecontainer.io/score' +api_key = '' # വെബ് സർവീസിനുള്ള API കീ ഇതിന് പകരം ഉപയോഗിക്കുക +``` +`url` വേരിയബിൾ consume ടാബിൽ കാണുന്ന REST എൻഡ്‌പോയിന്റാണ്, `api_key` വേരിയബിൾ consume ടാബിൽ കാണുന്ന പ്രൈമറി കീ ആണ് (authentication സജ്ജമാക്കിയിട്ടുണ്ടെങ്കിൽ മാത്രം). ഇതാണ് സ്ക്രിപ്റ്റ് എൻഡ്‌പോയിന്റ് ഉപഭോഗിക്കാൻ ഉപയോഗിക്കുന്നത്. + +18. സ്ക്രിപ്റ്റ് പ്രവർത്തിപ്പിച്ചാൽ താഴെപ്പറയുന്ന ഔട്ട്പുട്ട് കാണും: + ```python + b'"{\\"result\\": [true]}"' + ``` +ഇത് നൽകിയ ഡാറ്റയ്ക്ക് ഹൃദയ പരാജയം പ്രവചനം സത്യമാണെന്ന് സൂചിപ്പിക്കുന്നു. സ്ക്രിപ്റ്റിൽ സ്വയം സൃഷ്ടിച്ച ഡാറ്റയിൽ എല്ലാം ഡിഫോൾട്ടായി 0, false ആയതിനാൽ ഇത് യുക്തിയുള്ളതാണ്. താഴെപ്പറയുന്ന ഇൻപുട്ട് സാമ്പിൾ ഉപയോഗിച്ച് ഡാറ്റ മാറ്റാം: + +```python +data = { + "data": + [ + { + 'age': "0", + 'anaemia': "false", + 'creatinine_phosphokinase': "0", + 'diabetes': "false", + 'ejection_fraction': "0", + 'high_blood_pressure': "false", + 'platelets': "0", + 'serum_creatinine': "0", + 'serum_sodium': "0", + 'sex': "false", + 'smoking': "false", + 'time': "0", + }, + { + 'age': "60", + 'anaemia': "false", + 'creatinine_phosphokinase': "500", + 'diabetes': "false", + 'ejection_fraction': "38", + 'high_blood_pressure': "false", + 'platelets': "260000", + 'serum_creatinine': "1.40", + 'serum_sodium': "137", + 'sex': "false", + 'smoking': "false", + 'time': "130", + }, + ], +} +``` +സ്ക്രിപ്റ്റ് താഴെപ്പറയുന്ന ഫലം നൽകണം: + ```python + b'"{\\"result\\": [true, false]}"' + ``` + +അഭിനന്ദനങ്ങൾ! നിങ്ങൾ Azure ML-ൽ മോഡൽ വിന്യസിക്കുകയും പരിശീലിപ്പിക്കുകയും ചെയ്തു! + +> **_NOTE:_** പ്രോജക്ട് പൂർത്തിയായ ശേഷം എല്ലാ റിസോഴ്‌സുകളും ഇല്ലാതാക്കാൻ മറക്കരുത്. +## 🚀 ചലഞ്ച് + +AutoML ഉൽപ്പാദിപ്പിച്ച ടോപ്പ് മോഡലുകളുടെ വിശദീകരണങ്ങളും വിവരങ്ങളും ശ്രദ്ധാപൂർവ്വം പരിശോധിക്കുക. മികച്ച മോഡൽ മറ്റുള്ളവയെക്കാൾ എങ്ങനെ മെച്ചമാണ് എന്ന് മനസ്സിലാക്കാൻ ശ്രമിക്കുക. ഏത് ആൽഗോരിതങ്ങൾ താരതമ്യം ചെയ്തു? അവ തമ്മിലുള്ള വ്യത്യാസങ്ങൾ എന്തെല്ലാം? ഈ കേസിൽ മികച്ച മോഡൽ എങ്ങനെ മെച്ചപ്പെട്ട പ്രകടനം കാഴ്ചവെക്കുന്നു? + +## [പോസ്റ്റ്-ലെക്ചർ ക്വിസ്](https://ff-quizzes.netlify.app/en/ds/quiz/35) + +## അവലോകനം & സ്വയം പഠനം + +ഈ പാഠത്തിൽ, നിങ്ങൾ ക്ലൗഡിൽ Low code/No code രീതിയിൽ ഹൃദയ പരാജയ സാധ്യത പ്രവചിക്കാൻ മോഡൽ പരിശീലിപ്പിക്കുകയും വിന്യസിക്കുകയും ഉപഭോഗിക്കുകയും ചെയ്യുന്നത് പഠിച്ചു. ഇതുവരെ ചെയ്തിട്ടില്ലെങ്കിൽ, AutoML ഉൽപ്പാദിപ്പിച്ച ടോപ്പ് മോഡലുകളുടെ വിശദീകരണങ്ങളിൽ കൂടുതൽ ആഴത്തിൽ നോക്കുക, മികച്ച മോഡൽ മറ്റുള്ളവയെക്കാൾ എങ്ങനെ മെച്ചമാണ് എന്ന് മനസ്സിലാക്കാൻ ശ്രമിക്കുക. + +Low code/No code AutoML-ൽ കൂടുതൽ മുന്നോട്ട് പോകാൻ ഈ [ഡോക്യുമെന്റേഷൻ](https://docs.microsoft.com/azure/machine-learning/tutorial-first-experiment-automated-ml?WT.mc_id=academic-77958-bethanycheum&ocid=AID3041109) വായിക്കുക. + +## അസൈൻമെന്റ് + +[Low code/No code Data Science project on Azure ML](assignment.md) + +--- + + +**അസൂയാ**: +ഈ രേഖ AI വിവർത്തന സേവനം [Co-op Translator](https://github.com/Azure/co-op-translator) ഉപയോഗിച്ച് വിവർത്തനം ചെയ്തതാണ്. നാം കൃത്യതയ്ക്ക് ശ്രമിച്ചിട്ടുണ്ടെങ്കിലും, സ്വയം പ്രവർത്തിക്കുന്ന വിവർത്തനങ്ങളിൽ പിശകുകൾ അല്ലെങ്കിൽ തെറ്റുകൾ ഉണ്ടാകാമെന്ന് ദയവായി ശ്രദ്ധിക്കുക. അതിന്റെ മാതൃഭാഷയിലുള്ള യഥാർത്ഥ രേഖ അധികാരപരമായ ഉറവിടമായി കണക്കാക്കപ്പെടണം. നിർണായക വിവരങ്ങൾക്ക്, പ്രൊഫഷണൽ മനുഷ്യ വിവർത്തനം ശുപാർശ ചെയ്യപ്പെടുന്നു. ഈ വിവർത്തനം ഉപയോഗിക്കുന്നതിൽ നിന്നുണ്ടാകുന്ന ഏതെങ്കിലും തെറ്റിദ്ധാരണകൾക്കോ വ്യാഖ്യാനക്കേടുകൾക്കോ ഞങ്ങൾ ഉത്തരവാദികളല്ല. + \ No newline at end of file diff --git a/translations/ml/5-Data-Science-In-Cloud/18-Low-Code/assignment.md b/translations/ml/5-Data-Science-In-Cloud/18-Low-Code/assignment.md new file mode 100644 index 00000000..6ca270c1 --- /dev/null +++ b/translations/ml/5-Data-Science-In-Cloud/18-Low-Code/assignment.md @@ -0,0 +1,27 @@ + +# ലോ കോഡ്/നോ കോഡ് ഡാറ്റാ സയൻസ് പ്രോജക്ട് ആസ്യൂർ ML-ൽ + +## നിർദ്ദേശങ്ങൾ + +ലോ കോഡ്/നോ കോഡ് രീതിയിൽ ഒരു മോഡൽ ട്രെയിൻ ചെയ്യാനും, ഡിപ്ലോയ് ചെയ്യാനും, ഉപയോഗിക്കാനും ആസ്യൂർ ML പ്ലാറ്റ്ഫോം എങ്ങനെ ഉപയോഗിക്കാമെന്ന് നാം കണ്ടു. ഇപ്പോൾ മറ്റൊരു മോഡൽ ട്രെയിൻ ചെയ്യാനും, ഡിപ്ലോയ് ചെയ്യാനും, ഉപയോഗിക്കാനും നിങ്ങൾക്ക് ഉപയോഗിക്കാവുന്ന ഡാറ്റ ഏതെങ്കിലും കണ്ടെത്താൻ ചുറ്റിപ്പറ്റി നോക്കുക. [Kaggle](https://kaggle.com) ലും [Azure Open Datasets](https://azure.microsoft.com/services/open-datasets/catalog?WT.mc_id=academic-77958-bethanycheum&ocid=AID3041109) ലും ഡാറ്റാസെറ്റുകൾ അന്വേഷിക്കാം. + +## റൂബ്രിക് + +| ഉദാഹരണപരമായത് | മതിയായത് | മെച്ചപ്പെടുത്തേണ്ടത് | +|-----------|----------|-------------------| +|ഡാറ്റ അപ്‌ലോഡ് ചെയ്യുമ്പോൾ ഫീച്ചറിന്റെ തരം ആവശ്യമായെങ്കിൽ മാറ്റിയിട്ടുണ്ട്. ആവശ്യമായെങ്കിൽ ഡാറ്റ ശുദ്ധീകരിച്ചും. AutoML വഴി ഒരു ഡാറ്റാസെറ്റിൽ ട്രെയിനിംഗ് നടത്തി, മോഡൽ വിശദീകരണങ്ങൾ പരിശോധിച്ചു. മികച്ച മോഡൽ ഡിപ്ലോയ് ചെയ്തു, അത് ഉപയോഗിക്കാൻ കഴിഞ്ഞു. | ഡാറ്റ അപ്‌ലോഡ് ചെയ്യുമ്പോൾ ഫീച്ചറിന്റെ തരം ആവശ്യമായെങ്കിൽ മാറ്റിയിട്ടുണ്ട്. AutoML വഴി ഒരു ഡാറ്റാസെറ്റിൽ ട്രെയിനിംഗ് നടത്തി, മികച്ച മോഡൽ ഡിപ്ലോയ് ചെയ്തു, അത് ഉപയോഗിക്കാൻ കഴിഞ്ഞു. | AutoML വഴി ട്രെയിൻ ചെയ്ത മികച്ച മോഡൽ ഡിപ്ലോയ് ചെയ്തു, അത് ഉപയോഗിക്കാൻ കഴിഞ്ഞു. | + +--- + + +**അസൂയാപത്രം**: +ഈ രേഖ AI വിവർത്തന സേവനം [Co-op Translator](https://github.com/Azure/co-op-translator) ഉപയോഗിച്ച് വിവർത്തനം ചെയ്തതാണ്. നാം കൃത്യതയ്ക്ക് ശ്രമിച്ചിട്ടുണ്ടെങ്കിലും, യന്ത്രം ചെയ്ത വിവർത്തനങ്ങളിൽ പിശകുകൾ അല്ലെങ്കിൽ തെറ്റുകൾ ഉണ്ടാകാമെന്ന് ദയവായി ശ്രദ്ധിക്കുക. അതിന്റെ മാതൃഭാഷയിലുള്ള യഥാർത്ഥ രേഖ അധികാരപരമായ ഉറവിടമായി കണക്കാക്കപ്പെടണം. നിർണായക വിവരങ്ങൾക്ക്, പ്രൊഫഷണൽ മനുഷ്യ വിവർത്തനം ശുപാർശ ചെയ്യപ്പെടുന്നു. ഈ വിവർത്തനം ഉപയോഗിക്കുന്നതിൽ നിന്നുണ്ടാകുന്ന ഏതെങ്കിലും തെറ്റിദ്ധാരണകൾക്കോ തെറ്റായ വ്യാഖ്യാനങ്ങൾക്കോ ഞങ്ങൾ ഉത്തരവാദികളല്ല. + \ No newline at end of file diff --git a/translations/ml/5-Data-Science-In-Cloud/19-Azure/README.md b/translations/ml/5-Data-Science-In-Cloud/19-Azure/README.md new file mode 100644 index 00000000..db9351b7 --- /dev/null +++ b/translations/ml/5-Data-Science-In-Cloud/19-Azure/README.md @@ -0,0 +1,325 @@ + +# ക്ലൗഡിലെ ഡാറ്റാ സയൻസ്: "Azure ML SDK" വഴി + +|![ Sketchnote by [(@sketchthedocs)](https://sketchthedocs.dev) ](../../sketchnotes/19-DataScience-Cloud.png)| +|:---:| +| ക്ലൗഡിലെ ഡാറ്റാ സയൻസ്: Azure ML SDK - _Sketchnote by [@nitya](https://twitter.com/nitya)_ | + +അടിസ്ഥാന പട്ടിക: + +- [ക്ലൗഡിലെ ഡാറ്റാ സയൻസ്: "Azure ML SDK" വഴി](../../../../5-Data-Science-In-Cloud/19-Azure) + - [പ്രീ-ലെക്ചർ ക്വിസ്](../../../../5-Data-Science-In-Cloud/19-Azure) + - [1. പരിചയം](../../../../5-Data-Science-In-Cloud/19-Azure) + - [1.1 Azure ML SDK എന്താണ്?](../../../../5-Data-Science-In-Cloud/19-Azure) + - [1.2 ഹാർട്ട് ഫെയില്യർ പ്രവചനം പ്രോജക്ടും ഡാറ്റാസെറ്റും പരിചയം](../../../../5-Data-Science-In-Cloud/19-Azure) + - [2. Azure ML SDK ഉപയോഗിച്ച് മോഡൽ പരിശീലനം](../../../../5-Data-Science-In-Cloud/19-Azure) + - [2.1 Azure ML വർക്ക്‌സ്‌പേസ് സൃഷ്ടിക്കുക](../../../../5-Data-Science-In-Cloud/19-Azure) + - [2.2 കംപ്യൂട്ട് ഇൻസ്റ്റൻസ് സൃഷ്ടിക്കുക](../../../../5-Data-Science-In-Cloud/19-Azure) + - [2.3 ഡാറ്റാസെറ്റ് ലോഡ് ചെയ്യൽ](../../../../5-Data-Science-In-Cloud/19-Azure) + - [2.4 നോട്ട്‌ബുക്കുകൾ സൃഷ്ടിക്കൽ](../../../../5-Data-Science-In-Cloud/19-Azure) + - [2.5 മോഡൽ പരിശീലനം](../../../../5-Data-Science-In-Cloud/19-Azure) + - [2.5.1 വർക്ക്‌സ്‌പേസ്, പരീക്ഷണം, കംപ്യൂട്ട് ക്ലസ്റ്റർ, ഡാറ്റാസെറ്റ് സജ്ജീകരിക്കൽ](../../../../5-Data-Science-In-Cloud/19-Azure) + - [2.5.2 AutoML കോൺഫിഗറേഷൻ, പരിശീലനം](../../../../5-Data-Science-In-Cloud/19-Azure) + - [3. Azure ML SDK ഉപയോഗിച്ച് മോഡൽ വിന്യാസവും എൻഡ്‌പോയിന്റ് ഉപയോഗവും](../../../../5-Data-Science-In-Cloud/19-Azure) + - [3.1 മികച്ച മോഡൽ സേവ് ചെയ്യൽ](../../../../5-Data-Science-In-Cloud/19-Azure) + - [3.2 മോഡൽ വിന്യാസം](../../../../5-Data-Science-In-Cloud/19-Azure) + - [3.3 എൻഡ്‌പോയിന്റ് ഉപയോഗം](../../../../5-Data-Science-In-Cloud/19-Azure) + - [🚀 ചലഞ്ച്](../../../../5-Data-Science-In-Cloud/19-Azure) + - [പോസ്റ്റ്-ലെക്ചർ ക്വിസ്](../../../../5-Data-Science-In-Cloud/19-Azure) + - [പരിശോധന & സ്വയം പഠനം](../../../../5-Data-Science-In-Cloud/19-Azure) + - [അസൈൻമെന്റ്](../../../../5-Data-Science-In-Cloud/19-Azure) + +## [പ്രീ-ലെക്ചർ ക്വിസ്](https://ff-quizzes.netlify.app/en/ds/quiz/36) + +## 1. പരിചയം + +### 1.1 Azure ML SDK എന്താണ്? + +ഡാറ്റാ സയന്റിസ്റ്റുകളും AI ഡെവലപ്പർമാരും Azure Machine Learning SDK ഉപയോഗിച്ച് Azure Machine Learning സേവനത്തോടെ മെഷീൻ ലേണിംഗ് പ്രവൃത്തികൾ നിർമ്മിക്കുകയും പ്രവർത്തിപ്പിക്കുകയും ചെയ്യുന്നു. നിങ്ങൾക്ക് Jupyter നോട്ട്‌ബുക്കുകൾ, Visual Studio Code, അല്ലെങ്കിൽ നിങ്ങളുടെ ഇഷ്ട Python IDE ഉൾപ്പെടെയുള്ള ഏതെങ്കിലും Python പരിസ്ഥിതിയിൽ ഈ സേവനവുമായി ഇടപഴകാം. + +SDKയുടെ പ്രധാന മേഖലകൾ: + +- മെഷീൻ ലേണിംഗ് പരീക്ഷണങ്ങളിൽ ഉപയോഗിക്കുന്ന നിങ്ങളുടെ ഡാറ്റാസെറ്റുകളുടെ ജീവിതചക്രം പരിശോധിക്കുക, തയ്യാറാക്കുക, നിയന്ത്രിക്കുക. +- നിങ്ങളുടെ മെഷീൻ ലേണിംഗ് പരീക്ഷണങ്ങൾ നിരീക്ഷിക്കാൻ, ലോഗ് ചെയ്യാൻ, ക്രമീകരിക്കാൻ ക്ലൗഡ് വിഭവങ്ങൾ നിയന്ത്രിക്കുക. +- മോഡലുകൾ പ്രാദേശികമായി അല്ലെങ്കിൽ GPU-വേഗതയുള്ള ക്ലൗഡ് വിഭവങ്ങൾ ഉപയോഗിച്ച് പരിശീലിപ്പിക്കുക. +- ഓട്ടോമേറ്റഡ് മെഷീൻ ലേണിംഗ് ഉപയോഗിക്കുക, ഇത് കോൺഫിഗറേഷൻ പാരാമീറ്ററുകളും പരിശീലന ഡാറ്റയും സ്വീകരിച്ച്, മികച്ച മോഡൽ കണ്ടെത്താൻ ആൽഗോരിതങ്ങൾക്കും ഹൈപ്പർപാരാമീറ്റർ ക്രമീകരണങ്ങൾക്കും സ്വയം പരീക്ഷണം നടത്തുന്നു. +- പരിശീലിപ്പിച്ച മോഡലുകൾ RESTful സേവനങ്ങളായി മാറ്റാൻ വെബ് സേവനങ്ങൾ വിന്യസിക്കുക, ഇത് ഏതെങ്കിലും ആപ്ലിക്കേഷനിൽ ഉപയോഗിക്കാം. + +[Azure Machine Learning SDKയെ കുറിച്ച് കൂടുതൽ അറിയുക](https://docs.microsoft.com/python/api/overview/azure/ml?WT.mc_id=academic-77958-bethanycheum&ocid=AID3041109) + +[മുൻപത്തെ പാഠത്തിൽ](../18-Low-Code/README.md) നാം ലോ കോഡ്/നോ കോഡ് രീതിയിൽ മോഡൽ പരിശീലിപ്പിക്കുകയും വിന്യസിക്കുകയും ഉപയോഗിക്കുകയും ചെയ്തിരുന്നു. ഹാർട്ട് ഫെയില്യർ ഡാറ്റാസെറ്റ് ഉപയോഗിച്ച് ഹാർട്ട് ഫെയില്യർ പ്രവചന മോഡൽ സൃഷ്ടിച്ചു. ഈ പാഠത്തിൽ, നാം അതേ പ്രവർത്തി Azure Machine Learning SDK ഉപയോഗിച്ച് ചെയ്യാൻ പോകുന്നു. + +![project-schema](../../../../translated_images/project-schema.420e56d495624541eaecf2b737f138c86fb7d8162bb1c0bf8783c350872ffc4d.ml.png) + +### 1.2 ഹാർട്ട് ഫെയില്യർ പ്രവചനം പ്രോജക്ടും ഡാറ്റാസെറ്റും പരിചയം + +ഹാർട്ട് ഫെയില്യർ പ്രവചനം പ്രോജക്ടും ഡാറ്റാസെറ്റും പരിചയപ്പെടാൻ [ഇവിടെ](../18-Low-Code/README.md) നോക്കുക. + +## 2. Azure ML SDK ഉപയോഗിച്ച് മോഡൽ പരിശീലനം +### 2.1 Azure ML വർക്ക്‌സ്‌പേസ് സൃഷ്ടിക്കുക + +സൗകര്യത്തിനായി, നാം ഒരു Jupyter നോട്ട്‌ബുക്കിൽ പ്രവർത്തിക്കാനാണ് പോകുന്നത്. ഇതിന് നിങ്ങൾക്ക് ഇതിനകം ഒരു വർക്ക്‌സ്‌പേസ്, കംപ്യൂട്ട് ഇൻസ്റ്റൻസ് ഉണ്ടായിരിക്കണം. നിങ്ങൾക്ക് ഇതിനകം വർക്ക്‌സ്‌പേസ് ഉണ്ടെങ്കിൽ, നേരിട്ട് 2.3 നോട്ട്‌ബുക്ക് സൃഷ്ടിക്കൽ വിഭാഗത്തിലേക്ക് പോകാം. + +ഇല്ലെങ്കിൽ, [മുൻപത്തെ പാഠത്തിലെ](../18-Low-Code/README.md) **2.1 Azure ML വർക്ക്‌സ്‌പേസ് സൃഷ്ടിക്കുക** വിഭാഗത്തിലെ നിർദ്ദേശങ്ങൾ പാലിച്ച് വർക്ക്‌സ്‌പേസ് സൃഷ്ടിക്കുക. + +### 2.2 കംപ്യൂട്ട് ഇൻസ്റ്റൻസ് സൃഷ്ടിക്കുക + +മുൻപ് സൃഷ്ടിച്ച [Azure ML വർക്ക്‌സ്‌പേസിൽ](https://ml.azure.com/) കംപ്യൂട്ട് മെനുവിലേക്ക് പോകുക, അവിടെ ലഭ്യമായ വിവിധ കംപ്യൂട്ട് വിഭവങ്ങൾ കാണാം + +![compute-instance-1](../../../../translated_images/compute-instance-1.dba347cb199ca4996b3e3d649295ed95626ba481479d3986557b9b98e76d8816.ml.png) + +Jupyter നോട്ട്‌ബുക്ക് പ്രൊവിഷൻ ചെയ്യാൻ ഒരു കംപ്യൂട്ട് ഇൻസ്റ്റൻസ് സൃഷ്ടിക്കാം. +1. + New ബട്ടൺ ക്ലിക്ക് ചെയ്യുക. +2. നിങ്ങളുടെ കംപ്യൂട്ട് ഇൻസ്റ്റൻസിന് ഒരു പേര് നൽകുക. +3. CPU അല്ലെങ്കിൽ GPU, VM വലുപ്പം, കോർ എണ്ണം തിരഞ്ഞെടുക്കുക. +4. Create ബട്ടൺ ക്ലിക്ക് ചെയ്യുക. + +അഭിനന്ദനങ്ങൾ, നിങ്ങൾ ഒരു കംപ്യൂട്ട് ഇൻസ്റ്റൻസ് സൃഷ്ടിച്ചു! നാം ഈ കംപ്യൂട്ട് ഇൻസ്റ്റൻസ് ഉപയോഗിച്ച് [നോട്ട്‌ബുക്കുകൾ സൃഷ്ടിക്കൽ](../../../../5-Data-Science-In-Cloud/19-Azure) വിഭാഗത്തിൽ നോട്ട്‌ബുക്ക് സൃഷ്ടിക്കും. + +### 2.3 ഡാറ്റാസെറ്റ് ലോഡ് ചെയ്യൽ +ഡാറ്റാസെറ്റ് അപ്‌ലോഡ് ചെയ്തിട്ടില്ലെങ്കിൽ, [മുൻപത്തെ പാഠത്തിലെ](../18-Low-Code/README.md) **2.3 ഡാറ്റാസെറ്റ് ലോഡ് ചെയ്യൽ** വിഭാഗം കാണുക. + +### 2.4 നോട്ട്‌ബുക്കുകൾ സൃഷ്ടിക്കൽ + +> **_കുറിപ്പ്:_** അടുത്ത ഘട്ടത്തിന്, നിങ്ങൾക്ക് പുതിയ നോട്ട്‌ബുക്ക് സൃഷ്ടിക്കാം, അല്ലെങ്കിൽ [നാം സൃഷ്ടിച്ച നോട്ട്‌ബുക്ക്](notebook.ipynb) നിങ്ങളുടെ Azure ML സ്റ്റുഡിയോയിലേക്ക് അപ്‌ലോഡ് ചെയ്യാം. അപ്‌ലോഡ് ചെയ്യാൻ, "Notebook" മെനുവിൽ ക്ലിക്ക് ചെയ്ത് നോട്ട്‌ബുക്ക് അപ്‌ലോഡ് ചെയ്യുക. + +നോട്ട്‌ബുക്കുകൾ ഡാറ്റാ സയൻസ് പ്രക്രിയയുടെ വളരെ പ്രധാനപ്പെട്ട ഭാഗമാണ്. അവ എക്സ്പ്ലോറട്ടറി ഡാറ്റാ അനാലിസിസ് (EDA) നടത്താൻ, മോഡൽ പരിശീലനത്തിനായി കംപ്യൂട്ട് ക്ലസ്റ്ററിലേക്ക് വിളിക്കാൻ, എൻഡ്‌പോയിന്റ് വിന്യാസത്തിനായി ഇൻഫറൻസ് ക്ലസ്റ്ററിലേക്ക് വിളിക്കാൻ ഉപയോഗിക്കാം. + +നോട്ട്‌ബുക്ക് സൃഷ്ടിക്കാൻ, ജുപിറ്റർ നോട്ട്‌ബുക്ക് ഇൻസ്റ്റൻസ് സർവീസ് ചെയ്യുന്ന കംപ്യൂട്ട് നോഡ് ആവശ്യമാണ്. [Azure ML വർക്ക്‌സ്‌പേസിലേക്ക്](https://ml.azure.com/) മടങ്ങി കംപ്യൂട്ട് ഇൻസ്റ്റൻസുകൾ ക്ലിക്ക് ചെയ്യുക. കംപ്യൂട്ട് ഇൻസ്റ്റൻസുകളുടെ പട്ടികയിൽ [മുൻപ് സൃഷ്ടിച്ച കംപ്യൂട്ട് ഇൻസ്റ്റൻസ്](../../../../5-Data-Science-In-Cloud/19-Azure) കാണാം. + +1. Applications വിഭാഗത്തിൽ Jupyter ഓപ്ഷൻ ക്ലിക്ക് ചെയ്യുക. +2. "Yes, I understand" ബോക്സ് ടിക്ക് ചെയ്ത് Continue ബട്ടൺ ക്ലിക്ക് ചെയ്യുക. +![notebook-1](../../../../translated_images/notebook-1.12998af7b02c83f536c11b3aeba561be16e0f05e94146600728ec64270ce1105.ml.png) +3. ഇത് പുതിയ ബ്രൗസർ ടാബിൽ നിങ്ങളുടെ ജുപിറ്റർ നോട്ട്‌ബുക്ക് ഇൻസ്റ്റൻസ് തുറക്കും. "New" ബട്ടൺ ക്ലിക്ക് ചെയ്ത് നോട്ട്‌ബുക്ക് സൃഷ്ടിക്കുക. + +![notebook-2](../../../../translated_images/notebook-2.9a657c037e34f1cf26c0212f5ee9e2da8545b3e107c7682c55114e494167a8aa.ml.png) + +ഇപ്പോൾ നോട്ട്‌ബുക്ക് ഉണ്ടാകുമ്പോൾ, Azure ML SDK ഉപയോഗിച്ച് മോഡൽ പരിശീലനം ആരംഭിക്കാം. + +### 2.5 മോഡൽ പരിശീലനം + +ആദ്യമേ, സംശയമുണ്ടെങ്കിൽ, [Azure ML SDK ഡോക്യുമെന്റേഷൻ](https://docs.microsoft.com/python/api/overview/azure/ml?WT.mc_id=academic-77958-bethanycheum&ocid=AID3041109) കാണുക. ഈ പാഠത്തിൽ കാണുന്ന മോഡ്യൂളുകൾ മനസ്സിലാക്കാൻ ആവശ്യമായ എല്ലാ വിവരങ്ങളും അവിടെ ഉണ്ട്. + +#### 2.5.1 വർക്ക്‌സ്‌പേസ്, പരീക്ഷണം, കംപ്യൂട്ട് ക്ലസ്റ്റർ, ഡാറ്റാസെറ്റ് സജ്ജീകരിക്കൽ + +നിങ്ങൾക്ക് കോൺഫിഗറേഷൻ ഫയലിൽ നിന്ന് `workspace` ലോഡ് ചെയ്യേണ്ടതാണ് താഴെ കാണുന്ന കോഡ് ഉപയോഗിച്ച്: + +```python +from azureml.core import Workspace +ws = Workspace.from_config() +``` + +ഇത് `Workspace` തരം ഒബ്ജക്റ്റ് നൽകുന്നു, ഇത് വർക്ക്‌സ്‌പേസ് പ്രതിനിധീകരിക്കുന്നു. തുടർന്ന്, താഴെ കാണുന്ന കോഡ് ഉപയോഗിച്ച് ഒരു `experiment` സൃഷ്ടിക്കണം: + +```python +from azureml.core import Experiment +experiment_name = 'aml-experiment' +experiment = Experiment(ws, experiment_name) +``` + +വർക്ക്‌സ്‌പേസിൽ നിന്ന് പരീക്ഷണം ലഭിക്കുകയോ സൃഷ്ടിക്കുകയോ ചെയ്യാൻ, പരീക്ഷണത്തിന്റെ പേര് ഉപയോഗിച്ച് അപേക്ഷിക്കാം. പരീക്ഷണത്തിന്റെ പേര് 3-36 അക്ഷരങ്ങൾ ആയിരിക്കണം, അക്ഷരമോ സംഖ്യയോ കൊണ്ട് തുടങ്ങണം, അക്ഷരങ്ങൾ, സംഖ്യകൾ, അണ്ടർസ്കോർ, ഡാഷ് എന്നിവ മാത്രമേ ഉൾക്കൊള്ളൂ. പരീക്ഷണം വർക്ക്‌സ്‌പേസിൽ കണ്ടെത്താനാകാതെപോയാൽ പുതിയ പരീക്ഷണം സൃഷ്ടിക്കും. + +ഇപ്പോൾ പരിശീലനത്തിനായി കംപ്യൂട്ട് ക്ലസ്റ്റർ സൃഷ്ടിക്കേണ്ടതാണ്, താഴെ കാണുന്ന കോഡ് ഉപയോഗിച്ച്. ഈ ഘട്ടം കുറച്ച് മിനിറ്റുകൾ എടുക്കാം. + +```python +from azureml.core.compute import AmlCompute + +aml_name = "heart-f-cluster" +try: + aml_compute = AmlCompute(ws, aml_name) + print('Found existing AML compute context.') +except: + print('Creating new AML compute context.') + aml_config = AmlCompute.provisioning_configuration(vm_size = "Standard_D2_v2", min_nodes=1, max_nodes=3) + aml_compute = AmlCompute.create(ws, name = aml_name, provisioning_configuration = aml_config) + aml_compute.wait_for_completion(show_output = True) + +cts = ws.compute_targets +compute_target = cts[aml_name] +``` + +ഡാറ്റാസെറ്റ് വർക്ക്‌സ്‌പേസിൽ നിന്ന് ഡാറ്റാസെറ്റ് നാമം ഉപയോഗിച്ച് താഴെ കാണുന്ന രീതിയിൽ ലഭിക്കും: + +```python +dataset = ws.datasets['heart-failure-records'] +df = dataset.to_pandas_dataframe() +df.describe() +``` + + +#### 2.5.2 AutoML കോൺഫിഗറേഷൻ, പരിശീലനം + +AutoML കോൺഫിഗറേഷൻ സജ്ജമാക്കാൻ [AutoMLConfig ക്ലാസ്](https://docs.microsoft.com/python/api/azureml-train-automl-client/azureml.train.automl.automlconfig(class)?WT.mc_id=academic-77958-bethanycheum&ocid=AID3041109) ഉപയോഗിക്കുക. + +ഡോക്യുമെന്റേഷനിൽ വിശദീകരിച്ചിരിക്കുന്നതുപോലെ, നിങ്ങൾക്ക് പല പാരാമീറ്ററുകളുമായി കളിക്കാം. ഈ പ്രോജക്ടിനായി, താഴെ കാണുന്ന പാരാമീറ്ററുകൾ ഉപയോഗിക്കും: + +- `experiment_timeout_minutes`: പരീക്ഷണം ഓടാൻ അനുവദിച്ച പരമാവധി സമയം (മിനിറ്റുകളിൽ), അതിനുശേഷം സ്വയം നിർത്തുകയും ഫലങ്ങൾ ലഭ്യമാക്കുകയും ചെയ്യും +- `max_concurrent_iterations`: പരീക്ഷണത്തിന് അനുവദിച്ച പരമാവധി സമകാലിക പരിശീലന ഇറ്ററേഷനുകളുടെ എണ്ണം +- `primary_metric`: പരീക്ഷണത്തിന്റെ നില നിർണ്ണയിക്കാൻ ഉപയോഗിക്കുന്ന പ്രധാന മെട്രിക് +- `compute_target`: ഓട്ടോമേറ്റഡ് മെഷീൻ ലേണിംഗ് പരീക്ഷണം നടത്താൻ Azure Machine Learning കംപ്യൂട്ട് ടാർഗറ്റ് +- `task`: നടത്തേണ്ട ടാസ്‌കിന്റെ തരം. 'classification', 'regression', അല്ലെങ്കിൽ 'forecasting' എന്നിങ്ങനെ ഓട്ടോമേറ്റഡ് ML പ്രശ്നത്തിന്റെ തരം അനുസരിച്ച് +- `training_data`: പരീക്ഷണത്തിൽ ഉപയോഗിക്കുന്ന പരിശീലന ഡാറ്റ. പരിശീലന ഫീച്ചറുകളും ലേബൽ കോളവും (ഓപ്ഷണൽ സാംപിൾ വെയ്റ്റ് കോളവും) ഉൾക്കൊള്ളണം +- `label_column_name`: ലേബൽ കോളത്തിന്റെ പേര് +- `path`: Azure Machine Learning പ്രോജക്ട് ഫോൾഡറിന്റെ പൂർണ്ണ പാത +- `enable_early_stopping`: സ്കോർ കുറയുന്നുണ്ടെങ്കിൽ നേരത്തെ അവസാനിപ്പിക്കാൻ അനുവദിക്കണോ എന്നത് +- `featurization`: ഫീച്ചറൈസേഷൻ സ്വയം ചെയ്യണോ, അല്ലെങ്കിൽ കസ്റ്റമൈസ്ഡ് ഫീച്ചറൈസേഷൻ ഉപയോഗിക്കണോ എന്ന സൂചിക +- `debug_log`: ഡീബഗ് വിവരങ്ങൾ എഴുതാനുള്ള ലോഗ് ഫയൽ + +```python +from azureml.train.automl import AutoMLConfig + +project_folder = './aml-project' + +automl_settings = { + "experiment_timeout_minutes": 20, + "max_concurrent_iterations": 3, + "primary_metric" : 'AUC_weighted' +} + +automl_config = AutoMLConfig(compute_target=compute_target, + task = "classification", + training_data=dataset, + label_column_name="DEATH_EVENT", + path = project_folder, + enable_early_stopping= True, + featurization= 'auto', + debug_log = "automl_errors.log", + **automl_settings + ) +``` + +ഇപ്പോൾ കോൺഫിഗറേഷൻ സജ്ജമാക്കിയതിനുശേഷം, താഴെ കാണുന്ന കോഡ് ഉപയോഗിച്ച് മോഡൽ പരിശീലിപ്പിക്കാം. ക്ലസ്റ്റർ വലുപ്പം അനുസരിച്ച് ഈ ഘട്ടം ഒരു മണിക്കൂർ വരെ എടുക്കാം. + +```python +remote_run = experiment.submit(automl_config) +``` + +RunDetails വിഡ്ജറ്റ് ഉപയോഗിച്ച് വ്യത്യസ്ത പരീക്ഷണങ്ങൾ കാണാം. +```python +from azureml.widgets import RunDetails +RunDetails(remote_run).show() +``` + + +## 3. Azure ML SDK ഉപയോഗിച്ച് മോഡൽ വിന്യാസവും എൻഡ്‌പോയിന്റ് ഉപയോഗവും + +### 3.1 മികച്ച മോഡൽ സേവ് ചെയ്യൽ + +`remote_run` എന്നത് [AutoMLRun](https://docs.microsoft.com/python/api/azureml-train-automl-client/azureml.train.automl.run.automlrun?WT.mc_id=academic-77958-bethanycheum&ocid=AID3041109) തരം ഒബ്ജക്റ്റാണ്. ഈ ഒബ്ജക്റ്റിന് `get_output()` എന്ന മെത്തഡ് ഉണ്ട്, ഇത് മികച്ച റൺയും അനുബന്ധിച്ച ഫിറ്റുചെയ്ത മോഡലും നൽകുന്നു. + +```python +best_run, fitted_model = remote_run.get_output() +``` + +മികച്ച മോഡലിന് ഉപയോഗിച്ച പാരാമീറ്ററുകൾ കാണാൻ, ഫിറ്റുചെയ്ത മോഡൽ പ്രിന്റ് ചെയ്യുക. മികച്ച മോഡലിന്റെ പ്രോപ്പർട്ടികൾ കാണാൻ [get_properties()](https://docs.microsoft.com/python/api/azureml-core/azureml.core.run(class)?view=azure-ml-py#azureml_core_Run_get_properties?WT.mc_id=academic-77958-bethanycheum&ocid=AID3041109) മെത്തഡ് ഉപയോഗിക്കുക. + +```python +best_run.get_properties() +``` + +ഇപ്പോൾ മോഡൽ [register_model](https://docs.microsoft.com/python/api/azureml-train-automl-client/azureml.train.automl.run.automlrun?view=azure-ml-py#register-model-model-name-none--description-none--tags-none--iteration-none--metric-none-?WT.mc_id=academic-77958-bethanycheum&ocid=AID3041109) മെത്തഡ് ഉപയോഗിച്ച് രജിസ്റ്റർ ചെയ്യുക. +```python +model_name = best_run.properties['model_name'] +script_file_name = 'inference/score.py' +best_run.download_file('outputs/scoring_file_v_1_0_0.py', 'inference/score.py') +description = "aml heart failure project sdk" +model = best_run.register_model(model_name = model_name, + model_path = './outputs/', + description = description, + tags = None) +``` + + +### 3.2 മോഡൽ വിന്യാസം + +മികച്ച മോഡൽ സേവ് ചെയ്ത ശേഷം, [InferenceConfig](https://docs.microsoft.com/python/api/azureml-core/azureml.core.model.inferenceconfig?view=azure-ml-py?ocid=AID3041109) ക്ലാസ് ഉപയോഗിച്ച് വിന്യസിക്കാം. InferenceConfig വിന്യാസത്തിനായി ഉപയോഗിക്കുന്ന കസ്റ്റം പരിസ്ഥിതിയുടെ കോൺഫിഗറേഷൻ സജ്ജീകരണങ്ങൾ പ്രതിനിധീകരിക്കുന്നു. [AciWebservice](https://docs.microsoft.com/python/api/azureml-core/azureml.core.webservice.aciwebservice?view=azure-ml-py) ക്ലാസ് Azure Container Instances-ൽ വെബ് സേവന എൻഡ്‌പോയിന്റായി വിന്യസിച്ച മെഷീൻ ലേണിംഗ് മോഡൽ പ്രതിനിധീകരിക്കുന്നു. മോഡൽ, സ്ക്രിപ്റ്റ്, അനുബന്ധ ഫയലുകൾ എന്നിവയിൽ നിന്നാണ് വിന്യസിച്ച സേവനം സൃഷ്ടിക്കുന്നത്. ഫലമായി ലഭിക്കുന്ന വെബ് സേവനം ലോഡ് ബാലൻസ്ഡ്, HTTP എൻഡ്‌പോയിന്റ് ആണ്, REST API ഉണ്ട്. നിങ്ങൾക്ക് ഈ API-യിലേക്ക് ഡാറ്റ അയച്ച് മോഡലിന്റെ പ്രവചനങ്ങൾ സ്വീകരിക്കാം. + +മോഡൽ [deploy](https://docs.microsoft.com/python/api/azureml-core/azureml.core.model(class)?view=azure-ml-py#deploy-workspace--name--models--inference-config-none--deployment-config-none--deployment-target-none--overwrite-false--show-output-false-?WT.mc_id=academic-77958-bethanycheum&ocid=AID3041109) മെത്തഡ് ഉപയോഗിച്ച് വിന്യസിക്കുന്നു. + +```python +from azureml.core.model import InferenceConfig, Model +from azureml.core.webservice import AciWebservice + +inference_config = InferenceConfig(entry_script=script_file_name, environment=best_run.get_environment()) + +aciconfig = AciWebservice.deploy_configuration(cpu_cores = 1, + memory_gb = 1, + tags = {'type': "automl-heart-failure-prediction"}, + description = 'Sample service for AutoML Heart Failure Prediction') + +aci_service_name = 'automl-hf-sdk' +aci_service = Model.deploy(ws, aci_service_name, [model], inference_config, aciconfig) +aci_service.wait_for_deployment(True) +print(aci_service.state) +``` + +ഈ ഘട്ടം കുറച്ച് മിനിറ്റുകൾ എടുക്കും. + +### 3.3 എൻഡ്‌പോയിന്റ് ഉപയോഗം + +നിങ്ങളുടെ എൻഡ്‌പോയിന്റ് ഉപയോഗിക്കാൻ ഒരു സാമ്പിൾ ഇൻപുട്ട് സൃഷ്ടിക്കുക: +```python +data = { + "data": + [ + { + 'age': "60", + 'anaemia': "false", + 'creatinine_phosphokinase': "500", + 'diabetes': "false", + 'ejection_fraction': "38", + 'high_blood_pressure': "false", + 'platelets': "260000", + 'serum_creatinine': "1.40", + 'serum_sodium': "137", + 'sex': "false", + 'smoking': "false", + 'time': "130", + }, + ], +} + +test_sample = str.encode(json.dumps(data)) +``` +അതിനുശേഷം, പ്രവചനത്തിനായി ഈ ഇൻപുട്ട് നിങ്ങളുടെ മോഡലിലേക്ക് അയയ്ക്കാം: + +```python +response = aci_service.run(input_data=test_sample) +response +``` +ഇത് `'{"result": [false]}'` എന്ന ഔട്ട്പുട്ട് നൽകണം. ഇതിന്റെ അർത്ഥം, ഞങ്ങൾ എൻഡ്‌പോയിന്റിലേക്ക് അയച്ച രോഗിയുടെ ഇൻപുട്ട് `false` എന്ന പ്രവചനമാണ് സൃഷ്ടിച്ചത്, അതായത് ഈ വ്യക്തിക്ക് ഹൃദയാഘാതം സംഭവിക്കാനുള്ള സാധ്യത കുറവാണ്. + +അഭിനന്ദനങ്ങൾ! നിങ്ങൾ ഇപ്പോൾ Azure ML SDK ഉപയോഗിച്ച് Azure ML-ൽ ഡിപ്ലോയ് ചെയ്ത് പരിശീലിപ്പിച്ച മോഡൽ ഉപയോഗിച്ചു! + +> **_കുറിപ്പ്:_** പ്രോജക്ട് പൂർത്തിയാക്കിയ ശേഷം എല്ലാ റിസോഴ്‌സുകളും ഇല്ലാതാക്കാൻ മറക്കരുത്. + +## 🚀 ചലഞ്ച് + +SDK വഴി നിങ്ങൾ ചെയ്യാൻ കഴിയുന്ന മറ്റു പല കാര്യങ്ങളും ഉണ്ട്, പക്ഷേ ഈ പാഠത്തിൽ അവ എല്ലാം കാണാൻ സാധിക്കില്ല. എന്നാൽ നല്ല വാർത്ത, SDK ഡോക്യുമെന്റേഷൻ എങ്ങനെ സ്കിം ചെയ്യാമെന്ന് പഠിക്കുന്നത് നിങ്ങൾക്ക് സ്വയം വളരെ സഹായകമായിരിക്കും. Azure ML SDK ഡോക്യുമെന്റേഷൻ പരിശോധിച്ച് പൈപ്പ്‌ലൈൻ സൃഷ്ടിക്കാൻ അനുവദിക്കുന്ന `Pipeline` ക്ലാസ് കണ്ടെത്തുക. ഒരു Pipeline എന്നത് ഒരു വർക്ക്‌ഫ്ലോ ആയി പ്രവർത്തിപ്പിക്കാവുന്ന പല ഘട്ടങ്ങളുടെ സമാഹാരമാണ്. + +**സൂചന:** [SDK ഡോക്യുമെന്റേഷൻ](https://docs.microsoft.com/python/api/overview/azure/ml/?view=azure-ml-py?WT.mc_id=academic-77958-bethanycheum&ocid=AID3041109) സന്ദർശിച്ച് തിരയൽ ബാറിൽ "Pipeline" പോലുള്ള കീവേഡുകൾ ടൈപ്പ് ചെയ്യുക. തിരയൽ ഫലങ്ങളിൽ `azureml.pipeline.core.Pipeline` ക്ലാസ് കാണാം. + +## [പോസ്റ്റ്-ലെക്ചർ ക്വിസ്](https://ff-quizzes.netlify.app/en/ds/quiz/37) + +## അവലോകനം & സ്വയം പഠനം + +ഈ പാഠത്തിൽ, നിങ്ങൾ Azure ML SDK ഉപയോഗിച്ച് ഹൃദയ പരാജയ സാധ്യത പ്രവചിക്കാൻ മോഡൽ പരിശീലിപ്പിക്കുകയും ഡിപ്ലോയ് ചെയ്യുകയും ഉപയോഗിക്കുകയും ചെയ്യുന്നത് പഠിച്ചു. Azure ML SDK-യെക്കുറിച്ചുള്ള കൂടുതൽ വിവരങ്ങൾക്ക് ഈ [ഡോക്യുമെന്റേഷൻ](https://docs.microsoft.com/python/api/overview/azure/ml/?view=azure-ml-py?WT.mc_id=academic-77958-bethanycheum&ocid=AID3041109) പരിശോധിക്കുക. Azure ML SDK ഉപയോഗിച്ച് നിങ്ങളുടെ സ്വന്തം മോഡൽ സൃഷ്ടിക്കാൻ ശ്രമിക്കുക. + +## അസൈൻമെന്റ് + +[Azure ML SDK ഉപയോഗിച്ച് ഡാറ്റാ സയൻസ് പ്രോജക്ട്](assignment.md) + +--- + + +**അസൂയാ**: +ഈ രേഖ AI വിവർത്തന സേവനം [Co-op Translator](https://github.com/Azure/co-op-translator) ഉപയോഗിച്ച് വിവർത്തനം ചെയ്തതാണ്. നാം കൃത്യതയ്ക്ക് ശ്രമിച്ചിട്ടുണ്ടെങ്കിലും, സ്വയം പ്രവർത്തിക്കുന്ന വിവർത്തനങ്ങളിൽ പിശകുകൾ അല്ലെങ്കിൽ തെറ്റുകൾ ഉണ്ടാകാമെന്ന് ദയവായി ശ്രദ്ധിക്കുക. അതിന്റെ മാതൃഭാഷയിലുള്ള യഥാർത്ഥ രേഖയാണ് പ്രാമാണികമായ ഉറവിടം എന്ന് പരിഗണിക്കേണ്ടതാണ്. നിർണായകമായ വിവരങ്ങൾക്ക്, പ്രൊഫഷണൽ മനുഷ്യ വിവർത്തനം ശുപാർശ ചെയ്യപ്പെടുന്നു. ഈ വിവർത്തനം ഉപയോഗിക്കുന്നതിൽ നിന്നുണ്ടാകുന്ന ഏതെങ്കിലും തെറ്റിദ്ധാരണകൾക്കോ തെറ്റായ വ്യാഖ്യാനങ്ങൾക്കോ ഞങ്ങൾ ഉത്തരവാദികളല്ല. + \ No newline at end of file diff --git a/translations/ml/5-Data-Science-In-Cloud/19-Azure/assignment.md b/translations/ml/5-Data-Science-In-Cloud/19-Azure/assignment.md new file mode 100644 index 00000000..f94185fd --- /dev/null +++ b/translations/ml/5-Data-Science-In-Cloud/19-Azure/assignment.md @@ -0,0 +1,27 @@ + +# Azure ML SDK ഉപയോഗിച്ച് ഡാറ്റാ സയൻസ് പ്രോജക്ട് + +## നിർദ്ദേശങ്ങൾ + +Azure ML SDK ഉപയോഗിച്ച് ഒരു മോഡൽ ട്രെയിൻ ചെയ്യാനും, ഡിപ്ലോയ് ചെയ്യാനും, ഉപയോഗിക്കാനും Azure ML പ്ലാറ്റ്ഫോം എങ്ങനെ ഉപയോഗിക്കാമെന്ന് നാം കണ്ടു. ഇപ്പോൾ മറ്റൊരു മോഡൽ ട്രെയിൻ ചെയ്യാൻ, ഡിപ്ലോയ് ചെയ്യാൻ, ഉപയോഗിക്കാൻ നിങ്ങൾക്ക് ഉപയോഗിക്കാവുന്ന ചില ഡാറ്റ കണ്ടെത്താൻ ചുറ്റിപ്പറ്റി നോക്കുക. [Kaggle](https://kaggle.com) ലും [Azure Open Datasets](https://azure.microsoft.com/services/open-datasets/catalog?WT.mc_id=academic-77958-bethanycheum&ocid=AID3041109) ലും ഡാറ്റാസെറ്റുകൾ അന്വേഷിക്കാം. + +## റൂബ്രിക് + +| ഉദാഹരണമായ | മതിയായ | മെച്ചപ്പെടുത്തേണ്ടത് | +|-----------|----------|-------------------| +|AutoML കോൺഫിഗറേഷൻ ചെയ്യുമ്പോൾ, നിങ്ങൾ SDK ഡോക്യുമെന്റേഷൻ പരിശോധിച്ച് ഉപയോഗിക്കാവുന്ന പാരാമീറ്ററുകൾ കണ്ടു. Azure ML SDK ഉപയോഗിച്ച് AutoML വഴി ഒരു ഡാറ്റാസെറ്റിൽ ട്രെയിനിംഗ് നടത്തി, മോഡൽ വിശദീകരണങ്ങൾ പരിശോധിച്ചു. മികച്ച മോഡൽ ഡിപ്ലോയ് ചെയ്തു, Azure ML SDK വഴി അത് ഉപയോഗിക്കാൻ കഴിഞ്ഞു. | Azure ML SDK ഉപയോഗിച്ച് AutoML വഴി ഒരു ഡാറ്റാസെറ്റിൽ ട്രെയിനിംഗ് നടത്തി, മോഡൽ വിശദീകരണങ്ങൾ പരിശോധിച്ചു. മികച്ച മോഡൽ ഡിപ്ലോയ് ചെയ്തു, Azure ML SDK വഴി അത് ഉപയോഗിക്കാൻ കഴിഞ്ഞു. | Azure ML SDK ഉപയോഗിച്ച് AutoML വഴി ഒരു ഡാറ്റാസെറ്റിൽ ട്രെയിനിംഗ് നടത്തി. മികച്ച മോഡൽ ഡിപ്ലോയ് ചെയ്തു, Azure ML SDK വഴി അത് ഉപയോഗിക്കാൻ കഴിഞ്ഞു. | + +--- + + +**അസൂയാപത്രം**: +ഈ രേഖ AI വിവർത്തന സേവനം [Co-op Translator](https://github.com/Azure/co-op-translator) ഉപയോഗിച്ച് വിവർത്തനം ചെയ്തതാണ്. നാം കൃത്യതയ്ക്ക് ശ്രമിച്ചിട്ടുണ്ടെങ്കിലും, സ്വയം പ്രവർത്തിക്കുന്ന വിവർത്തനങ്ങളിൽ പിശകുകൾ അല്ലെങ്കിൽ തെറ്റുകൾ ഉണ്ടാകാമെന്ന് ദയവായി ശ്രദ്ധിക്കുക. അതിന്റെ മാതൃഭാഷയിലുള്ള യഥാർത്ഥ രേഖയാണ് പ്രാമാണികമായ ഉറവിടം എന്ന് പരിഗണിക്കേണ്ടതാണ്. നിർണായകമായ വിവരങ്ങൾക്ക്, പ്രൊഫഷണൽ മനുഷ്യ വിവർത്തനം ശുപാർശ ചെയ്യപ്പെടുന്നു. ഈ വിവർത്തനം ഉപയോഗിക്കുന്നതിൽ നിന്നുണ്ടാകുന്ന ഏതെങ്കിലും തെറ്റിദ്ധാരണകൾക്കോ തെറ്റായ വ്യാഖ്യാനങ്ങൾക്കോ ഞങ്ങൾ ഉത്തരവാദികളല്ല. + \ No newline at end of file diff --git a/translations/ml/5-Data-Science-In-Cloud/19-Azure/notebook.ipynb b/translations/ml/5-Data-Science-In-Cloud/19-Azure/notebook.ipynb new file mode 100644 index 00000000..6bd7b3b2 --- /dev/null +++ b/translations/ml/5-Data-Science-In-Cloud/19-Azure/notebook.ipynb @@ -0,0 +1,325 @@ +{ + "cells": [ + { + "cell_type": "markdown", + "source": [ + "# ക്ലൗഡിലെ ഡാറ്റാ സയൻസ്: \"Azure ML SDK\" വഴി\n", + "\n", + "## പരിചയം\n", + "\n", + "ഈ നോട്ട്‌ബുക്കിൽ, Azure ML ഉപയോഗിച്ച് ഒരു മോഡൽ ട്രെയിൻ ചെയ്യാനും, ഡിപ്ലോയ് ചെയ്യാനും, ഉപയോഗിക്കാനും Azure ML SDK എങ്ങനെ ഉപയോഗിക്കാമെന്ന് നാം പഠിക്കും.\n", + "\n", + "ആവശ്യമായ മുൻ‌പരിചയങ്ങൾ:\n", + "1. നിങ്ങൾ ഒരു Azure ML വർക്ക്‌സ്പേസ് സൃഷ്ടിച്ചിട്ടുണ്ട്.\n", + "2. നിങ്ങൾ [ഹാർട്ട് ഫെയില്യർ ഡാറ്റാസെറ്റ്](https://www.kaggle.com/andrewmvd/heart-failure-clinical-data) Azure ML-ലേക്ക് ലോഡ് ചെയ്തിട്ടുണ്ട്.\n", + "3. നിങ്ങൾ ഈ നോട്ട്‌ബുക്ക് Azure ML സ്റ്റുഡിയോയിൽ അപ്‌ലോഡ് ചെയ്തിട്ടുണ്ട്.\n", + "\n", + "അടുത്ത ഘട്ടങ്ങൾ:\n", + "\n", + "1. നിലവിലുള്ള വർക്ക്‌സ്പേസിൽ ഒരു എക്സ്പെരിമെന്റ് സൃഷ്ടിക്കുക.\n", + "2. ഒരു കംപ്യൂട്ട് ക്ലസ്റ്റർ സൃഷ്ടിക്കുക.\n", + "3. ഡാറ്റാസെറ്റ് ലോഡ് ചെയ്യുക.\n", + "4. AutoMLConfig ഉപയോഗിച്ച് AutoML കോൺഫിഗർ ചെയ്യുക.\n", + "5. AutoML എക്സ്പെരിമെന്റ് റൺ ചെയ്യുക.\n", + "6. ഫലങ്ങൾ പരിശോധിച്ച് മികച്ച മോഡൽ കണ്ടെത്തുക.\n", + "7. മികച്ച മോഡൽ രജിസ്റ്റർ ചെയ്യുക.\n", + "8. മികച്ച മോഡൽ ഡിപ്ലോയ് ചെയ്യുക.\n", + "9. എന്റ്പോയിന്റ് ഉപയോഗിക്കുക.\n", + "\n", + "## Azure മെഷീൻ ലേണിംഗ് SDK-നു പ്രത്യേകമായ ഇമ്പോർട്ടുകൾ\n" + ], + "metadata": {} + }, + { + "cell_type": "code", + "execution_count": null, + "source": [ + "from azureml.core import Workspace, Experiment\n", + "from azureml.core.compute import AmlCompute\n", + "from azureml.train.automl import AutoMLConfig\n", + "from azureml.widgets import RunDetails\n", + "from azureml.core.model import InferenceConfig, Model\n", + "from azureml.core.webservice import AciWebservice" + ], + "outputs": [], + "metadata": {} + }, + { + "cell_type": "markdown", + "source": [ + "## Initialize Workspace\n", + "സ്ഥിരീകരിച്ച കോൺഫിഗറേഷൻ നിന്ന് ഒരു വർക്ക്‌സ്പേസ് ഒബ്ജക്റ്റ് ആരംഭിക്കുക. .\\config.json എന്ന സ്ഥലത്ത് കോൺഫിഗ് ഫയൽ ഉണ്ടെന്ന് ഉറപ്പാക്കുക.\n" + ], + "metadata": {} + }, + { + "cell_type": "code", + "execution_count": null, + "source": [ + "ws = Workspace.from_config()\n", + "print(ws.name, ws.resource_group, ws.location, ws.subscription_id, sep = '\\n')" + ], + "outputs": [], + "metadata": {} + }, + { + "cell_type": "markdown", + "source": [ + "## Create an Azure ML experiment\n", + "\n", + "നാം ഇപ്പോൾ ആരംഭിച്ച വർക്ക്സ്പേസിൽ 'aml-experiment' എന്ന പേരിൽ ഒരു പരീക്ഷണം സൃഷ്ടിക്കാം.\n" + ], + "metadata": {} + }, + { + "cell_type": "code", + "execution_count": null, + "source": [ + "experiment_name = 'aml-experiment'\n", + "experiment = Experiment(ws, experiment_name)\n", + "experiment" + ], + "outputs": [], + "metadata": {} + }, + { + "cell_type": "markdown", + "source": [ + "## കംപ്യൂട്ട് ക്ലസ്റ്റർ സൃഷ്ടിക്കുക\n", + "നിങ്ങളുടെ AutoML റൺക്കായി ഒരു [compute target](https://docs.microsoft.com/azure/machine-learning/concept-azure-machine-learning-architecture#compute-target) സൃഷ്ടിക്കേണ്ടതുണ്ട്.\n" + ], + "metadata": {} + }, + { + "cell_type": "code", + "execution_count": null, + "source": [ + "aml_name = \"heart-f-cluster\"\n", + "try:\n", + " aml_compute = AmlCompute(ws, aml_name)\n", + " print('Found existing AML compute context.')\n", + "except:\n", + " print('Creating new AML compute context.')\n", + " aml_config = AmlCompute.provisioning_configuration(vm_size = \"Standard_D2_v2\", min_nodes=1, max_nodes=3)\n", + " aml_compute = AmlCompute.create(ws, name = aml_name, provisioning_configuration = aml_config)\n", + " aml_compute.wait_for_completion(show_output = True)\n", + "\n", + "cts = ws.compute_targets\n", + "compute_target = cts[aml_name]" + ], + "outputs": [], + "metadata": {} + }, + { + "cell_type": "markdown", + "source": [ + "## Data\n", + "നിങ്ങൾ ഡാറ്റാസെറ്റ് Azure ML-ലേക്ക് അപ്‌ലോഡ് ചെയ്തിട്ടുണ്ടെന്ന് ഉറപ്പാക്കുക, കൂടാതെ കീ ഡാറ്റാസെറ്റിന്റെ പേരുമായി ഒരേ പേരിലാണ്.\n" + ], + "metadata": {} + }, + { + "cell_type": "code", + "execution_count": null, + "source": [ + "key = 'heart-failure-records'\n", + "dataset = ws.datasets[key]\n", + "df = dataset.to_pandas_dataframe()\n", + "df.describe()" + ], + "outputs": [], + "metadata": {} + }, + { + "cell_type": "markdown", + "source": [ + "## ഓട്ടോഎംഎൽ കോൺഫിഗറേഷൻ\n" + ], + "metadata": {} + }, + { + "cell_type": "code", + "execution_count": null, + "source": [ + "automl_settings = {\n", + " \"experiment_timeout_minutes\": 20,\n", + " \"max_concurrent_iterations\": 3,\n", + " \"primary_metric\" : 'AUC_weighted'\n", + "}\n", + "\n", + "automl_config = AutoMLConfig(compute_target=compute_target,\n", + " task = \"classification\",\n", + " training_data=dataset,\n", + " label_column_name=\"DEATH_EVENT\",\n", + " enable_early_stopping= True,\n", + " featurization= 'auto',\n", + " debug_log = \"automl_errors.log\",\n", + " **automl_settings\n", + " )" + ], + "outputs": [], + "metadata": {} + }, + { + "cell_type": "markdown", + "source": [ + "## ഓട്ടോഎംഎൽ റൺ\n" + ], + "metadata": {} + }, + { + "cell_type": "code", + "execution_count": null, + "source": [ + "remote_run = experiment.submit(automl_config)" + ], + "outputs": [], + "metadata": {} + }, + { + "cell_type": "code", + "execution_count": null, + "source": [ + "RunDetails(remote_run).show()" + ], + "outputs": [], + "metadata": {} + }, + { + "cell_type": "markdown", + "source": [ + "## മികച്ച മോഡൽ സംരക്ഷിക്കുക\n" + ], + "metadata": {} + }, + { + "cell_type": "code", + "execution_count": null, + "source": [ + "best_run, fitted_model = remote_run.get_output()" + ], + "outputs": [], + "metadata": {} + }, + { + "cell_type": "code", + "execution_count": null, + "source": [ + "best_run.get_properties()" + ], + "outputs": [], + "metadata": {} + }, + { + "cell_type": "code", + "execution_count": null, + "source": [ + "model_name = best_run.properties['model_name']\n", + "script_file_name = 'inference/score.py'\n", + "best_run.download_file('outputs/scoring_file_v_1_0_0.py', 'inference/score.py')\n", + "description = \"aml heart failure project sdk\"\n", + "model = best_run.register_model(model_name = model_name,\n", + " description = description,\n", + " tags = None)" + ], + "outputs": [], + "metadata": {} + }, + { + "cell_type": "markdown", + "source": [ + "## മികച്ച മോഡൽ വിന്യസിക്കുക\n", + "\n", + "മികച്ച മോഡൽ വിന്യസിക്കാൻ താഴെ കൊടുത്തിരിക്കുന്ന കോഡ് പ്രവർത്തിപ്പിക്കുക. Azure ML പോർട്ടലിൽ വിന്യസനത്തിന്റെ നില നിങ്ങൾക്ക് കാണാം. ഈ ഘട്ടം കുറച്ച് മിനിറ്റുകൾ എടുക്കാം.\n" + ], + "metadata": {} + }, + { + "cell_type": "code", + "execution_count": null, + "source": [ + "inference_config = InferenceConfig(entry_script=script_file_name, environment=best_run.get_environment())\n", + "\n", + "aciconfig = AciWebservice.deploy_configuration(cpu_cores = 1,\n", + " memory_gb = 1,\n", + " tags = {'type': \"automl-heart-failure-prediction\"},\n", + " description = 'Sample service for AutoML Heart Failure Prediction')\n", + "\n", + "aci_service_name = 'automl-hf-sdk'\n", + "aci_service = Model.deploy(ws, aci_service_name, [model], inference_config, aciconfig)\n", + "aci_service.wait_for_deployment(True)\n", + "print(aci_service.state)" + ], + "outputs": [], + "metadata": {} + }, + { + "cell_type": "markdown", + "source": [ + "## എന്റ്പോയിന്റ് ഉപയോഗിക്കുക\n", + "താഴെ കൊടുത്തിരിക്കുന്ന ഇൻപുട്ട് സാമ്പിളിൽ നിങ്ങൾക്ക് ഇൻപുട്ടുകൾ ചേർക്കാം.\n" + ], + "metadata": {} + }, + { + "cell_type": "code", + "execution_count": null, + "source": [ + "data = {\n", + " \"data\":\n", + " [\n", + " {\n", + " 'age': \"60\",\n", + " 'anaemia': \"false\",\n", + " 'creatinine_phosphokinase': \"500\",\n", + " 'diabetes': \"false\",\n", + " 'ejection_fraction': \"38\",\n", + " 'high_blood_pressure': \"false\",\n", + " 'platelets': \"260000\",\n", + " 'serum_creatinine': \"1.40\",\n", + " 'serum_sodium': \"137\",\n", + " 'sex': \"false\",\n", + " 'smoking': \"false\",\n", + " 'time': \"130\",\n", + " },\n", + " ],\n", + "}\n", + "\n", + "test_sample = str.encode(json.dumps(data))" + ], + "outputs": [], + "metadata": {} + }, + { + "cell_type": "code", + "execution_count": null, + "source": [ + "response = aci_service.run(input_data=test_sample)\n", + "response" + ], + "outputs": [], + "metadata": {} + }, + { + "cell_type": "markdown", + "metadata": {}, + "source": [ + "---\n\n\n**അസൂയാ**: \nഈ രേഖ AI വിവർത്തന സേവനം [Co-op Translator](https://github.com/Azure/co-op-translator) ഉപയോഗിച്ച് വിവർത്തനം ചെയ്തതാണ്. നാം കൃത്യതയ്ക്ക് ശ്രമിച്ചെങ്കിലും, സ്വയം പ്രവർത്തിക്കുന്ന വിവർത്തനങ്ങളിൽ പിശകുകൾ അല്ലെങ്കിൽ തെറ്റുകൾ ഉണ്ടാകാമെന്ന് ദയവായി ശ്രദ്ധിക്കുക. അതിന്റെ മാതൃഭാഷയിലുള്ള യഥാർത്ഥ രേഖയാണ് പ്രാമാണികമായ ഉറവിടം എന്ന് പരിഗണിക്കേണ്ടതാണ്. നിർണായക വിവരങ്ങൾക്ക്, പ്രൊഫഷണൽ മനുഷ്യ വിവർത്തനം ശുപാർശ ചെയ്യപ്പെടുന്നു. ഈ വിവർത്തനം ഉപയോഗിക്കുന്നതിൽ നിന്നുണ്ടാകുന്ന ഏതെങ്കിലും തെറ്റിദ്ധാരണകൾക്കോ തെറ്റായ വ്യാഖ്യാനങ്ങൾക്കോ ഞങ്ങൾ ഉത്തരവാദികളല്ല.\n\n" + ] + } + ], + "metadata": { + "orig_nbformat": 4, + "language_info": { + "name": "python" + }, + "coopTranslator": { + "original_hash": "af42669556d5dc19fc4cc3866f7d2597", + "translation_date": "2025-12-19T17:10:08+00:00", + "source_file": "5-Data-Science-In-Cloud/19-Azure/notebook.ipynb", + "language_code": "ml" + } + }, + "nbformat": 4, + "nbformat_minor": 2 +} \ No newline at end of file diff --git a/translations/ml/5-Data-Science-In-Cloud/19-Azure/solution/notebook.ipynb b/translations/ml/5-Data-Science-In-Cloud/19-Azure/solution/notebook.ipynb new file mode 100644 index 00000000..e69de29b diff --git a/translations/ml/5-Data-Science-In-Cloud/README.md b/translations/ml/5-Data-Science-In-Cloud/README.md new file mode 100644 index 00000000..c8f1f51c --- /dev/null +++ b/translations/ml/5-Data-Science-In-Cloud/README.md @@ -0,0 +1,36 @@ + +# ക്ലൗഡിലെ ഡാറ്റാ സയൻസ് + +![cloud-picture](../../../translated_images/cloud-picture.f5526de3c6c6387b2d656ba94f019b3352e5e3854a78440e4fb00c93e2dea675.ml.jpg) + +> ഫോട്ടോ [Jelleke Vanooteghem](https://unsplash.com/@ilumire) യുടെ [Unsplash](https://unsplash.com/s/photos/cloud?orientation=landscape) ൽ നിന്നാണ് + +വലിയ ഡാറ്റയുമായി ഡാറ്റാ സയൻസ് ചെയ്യുമ്പോൾ, ക്ലൗഡ് ഒരു ഗെയിം ചേഞ്ചർ ആകാം. അടുത്ത മൂന്ന് പാഠങ്ങളിൽ, ക്ലൗഡ് എന്താണെന്നും അത് എങ്ങനെ സഹായകരമാകാമെന്നും നാം കാണാൻ പോകുന്നു. ഹൃദയ പരാജയ ഡാറ്റാസെറ്റ് പരിശോധിച്ച്, ആരെങ്കിലും ഹൃദയ പരാജയ സാധ്യതയുള്ളതെന്ന് വിലയിരുത്താൻ സഹായിക്കുന്ന ഒരു മോഡൽ നിർമ്മിക്കാനും നാം പോകുന്നു. മോഡൽ പരിശീലിപ്പിക്കാൻ, വിന്യസിക്കാൻ, ഉപയോഗിക്കാൻ ക്ലൗഡിന്റെ ശക്തി ഉപയോഗിക്കും. ഒരു വഴി കുറഞ്ഞ കോഡ്/കോഡ് ഇല്ലാത്ത രീതിയിൽ മാത്രം ഉപയോക്തൃ ഇന്റർഫേസ് ഉപയോഗിച്ച്, മറ്റൊരു വഴി Azure മെഷീൻ ലേണിംഗ് സോഫ്റ്റ്വെയർ ഡെവലപ്പർ കിറ്റ് (Azure ML SDK) ഉപയോഗിച്ച്. + +![project-schema](../../../translated_images/project-schema.420e56d495624541eaecf2b737f138c86fb7d8162bb1c0bf8783c350872ffc4d.ml.png) + +### വിഷയങ്ങൾ + +1. [ഡാറ്റാ സയൻസിനായി ക്ലൗഡ് ഉപയോഗിക്കേണ്ടത് എന്തുകൊണ്ട്?](17-Introduction/README.md) +2. [ക്ലൗഡിലെ ഡാറ്റാ സയൻസ്: "കുറഞ്ഞ കോഡ്/കോഡ് ഇല്ലാത്ത" വഴി](18-Low-Code/README.md) +3. [ക്ലൗഡിലെ ഡാറ്റാ സയൻസ്: "Azure ML SDK" വഴി](19-Azure/README.md) + +### ക്രെഡിറ്റുകൾ +ഈ പാഠങ്ങൾ ☁️യും 💕യും കൊണ്ട് [Maud Levy](https://twitter.com/maudstweets)യും [Tiffany Souterre](https://twitter.com/TiffanySouterre)യും ചേർന്ന് എഴുതിയതാണ് + +ഹൃദയ പരാജയ പ്രവചന പദ്ധതിക്കുള്ള ഡാറ്റ [Larxel](https://www.kaggle.com/andrewmvd) എന്നവരിൽ നിന്നുള്ളതാണ്, [Kaggle](https://www.kaggle.com/andrewmvd/heart-failure-clinical-data) ൽ നിന്നും. ഇത് [Attribution 4.0 International (CC BY 4.0)](https://creativecommons.org/licenses/by/4.0/) അനുമതിയോടെ ലൈസൻസുചെയ്യപ്പെട്ടതാണ്. + +--- + + +**അസൂയാപത്രം**: +ഈ രേഖ AI വിവർത്തന സേവനം [Co-op Translator](https://github.com/Azure/co-op-translator) ഉപയോഗിച്ച് വിവർത്തനം ചെയ്തതാണ്. നാം കൃത്യതയ്ക്ക് ശ്രമിച്ചിട്ടുണ്ടെങ്കിലും, സ്വയം പ്രവർത്തിക്കുന്ന വിവർത്തനങ്ങളിൽ പിശകുകൾ അല്ലെങ്കിൽ തെറ്റുകൾ ഉണ്ടാകാമെന്ന് ദയവായി ശ്രദ്ധിക്കുക. അതിന്റെ മാതൃഭാഷയിലുള്ള യഥാർത്ഥ രേഖ അധികാരപരമായ ഉറവിടമായി കണക്കാക്കപ്പെടണം. നിർണായക വിവരങ്ങൾക്ക്, പ്രൊഫഷണൽ മനുഷ്യ വിവർത്തനം ശുപാർശ ചെയ്യപ്പെടുന്നു. ഈ വിവർത്തനം ഉപയോഗിക്കുന്നതിൽ നിന്നുണ്ടാകുന്ന ഏതെങ്കിലും തെറ്റിദ്ധാരണകൾക്കോ തെറ്റായ വ്യാഖ്യാനങ്ങൾക്കോ ഞങ്ങൾ ഉത്തരവാദികളല്ല. + \ No newline at end of file diff --git a/translations/ml/6-Data-Science-In-Wild/20-Real-World-Examples/README.md b/translations/ml/6-Data-Science-In-Wild/20-Real-World-Examples/README.md new file mode 100644 index 00000000..e134aa31 --- /dev/null +++ b/translations/ml/6-Data-Science-In-Wild/20-Real-World-Examples/README.md @@ -0,0 +1,119 @@ + +# യഥാർത്ഥ ലോകത്തിലെ ഡാറ്റാ സയൻസ് + +| ![ Sketchnote by [(@sketchthedocs)](https://sketchthedocs.dev) ](../../sketchnotes/20-DataScience-RealWorld.png) | +| :--------------------------------------------------------------------------------------------------------------: | +| യഥാർത്ഥ ലോകത്തിലെ ഡാറ്റാ സയൻസ് - _സ്കെച്ച്നോട്ട് by [@nitya](https://twitter.com/nitya)_ | + +നാം ഈ പഠനയാത്രയുടെ അവസാനത്തോട് അടുത്തിരിക്കുന്നു! + +ഡാറ്റാ സയൻസിന്റെയും നൈതികതയുടെയും നിർവചനങ്ങളോടെ ആരംഭിച്ച്, ഡാറ്റാ വിശകലനത്തിനും ദൃശ്യവത്കരണത്തിനും വിവിധ ഉപകരണങ്ങളും സാങ്കേതിക വിദ്യകളും പരിശോധിച്ചു, ഡാറ്റാ സയൻസ് ലൈഫ്‌സൈക്കിൾ അവലോകനം ചെയ്തു, ക്ലൗഡ് കംപ്യൂട്ടിംഗ് സേവനങ്ങളിലൂടെ ഡാറ്റാ സയൻസ് പ്രവൃത്തികൾ സ്കെയിൽ ചെയ്യുകയും ഓട്ടോമേറ്റ് ചെയ്യുകയും ചെയ്യുന്നതിനെക്കുറിച്ച് നോക്കി. അതിനാൽ, നിങ്ങൾക്ക് സംശയമുണ്ടാകാം: _"ഈ പഠനങ്ങളെ യഥാർത്ഥ ലോക സാഹചര്യങ്ങളുമായി എങ്ങനെ കൃത്യമായി ബന്ധിപ്പിക്കാം?"_ + +ഈ പാഠത്തിൽ, വ്യവസായം മുഴുവൻ ഡാറ്റാ സയൻസിന്റെ യഥാർത്ഥ ലോക പ്രയോഗങ്ങൾ പരിശോധിക്കുകയും ഗവേഷണം, ഡിജിറ്റൽ ഹ്യൂമാനിറ്റീസ്, സുസ്ഥിരത എന്നീ പ്രത്യേക സാഹചര്യങ്ങളിലെ ഉദാഹരണങ്ങളിൽ ആഴത്തിൽ നോക്കുകയും ചെയ്യും. വിദ്യാർത്ഥി പ്രോജക്ട് അവസരങ്ങൾ പരിശോധിച്ച്, നിങ്ങളുടെ പഠനയാത്ര തുടരുമെന്ന് സഹായിക്കുന്ന ഉപകാരപ്രദമായ വിഭവങ്ങൾക്കൊപ്പം സമാപിപ്പിക്കും! + +## പ്രീ-ലെക്ചർ ക്വിസ് + +## [പ്രീ-ലെക്ചർ ക്വിസ്](https://ff-quizzes.netlify.app/en/ds/quiz/38) + +## ഡാറ്റാ സയൻസ് + വ്യവസായം + +AI-യുടെ ജനാധിപത്യവൽക്കരണത്തിന് നന്ദി, ഡെവലപ്പർമാർക്ക് ഇപ്പോൾ AI-നിർഭരമായ തീരുമാനമെടുക്കലും ഡാറ്റാ-നിർഭരമായ洞察ങ്ങളും ഉപയോക്തൃ അനുഭവങ്ങളിലും വികസന പ്രവൃത്തികളിലും രൂപകൽപ്പന ചെയ്യാനും സംയോജിപ്പിക്കാനും എളുപ്പമാണ്. വ്യവസായം മുഴുവൻ ഡാറ്റാ സയൻസ് യഥാർത്ഥ ലോക പ്രയോഗങ്ങളിൽ "പ്രയോഗിക്കപ്പെടുന്ന" ചില ഉദാഹരണങ്ങൾ ഇവയാണ്: + + * [Google Flu Trends](https://www.wired.com/2015/10/can-learn-epic-failure-google-flu-trends/) ഡാറ്റാ സയൻസ് ഉപയോഗിച്ച് തിരയൽ പദങ്ങൾ ഫ്ലൂ ട്രെൻഡുകളുമായി ബന്ധിപ്പിച്ചു. സമീപനം പിഴവുകൾ ഉണ്ടായിരുന്നെങ്കിലും, ഡാറ്റാ-നിർഭരമായ ആരോഗ്യപരിചരണ പ്രവചനങ്ങളുടെ സാധ്യതകളും (ചില വെല്ലുവിളികളും) ബോധവൽക്കരിച്ചു. + + * [UPS Routing Predictions](https://www.technologyreview.com/2018/11/21/139000/how-ups-uses-ai-to-outsmart-bad-weather/) - UPS എങ്ങനെ ഡാറ്റാ സയൻസ്, മെഷീൻ ലേണിംഗ് ഉപയോഗിച്ച് കാലാവസ്ഥാ സാഹചര്യങ്ങൾ, ഗതാഗത മാതൃകകൾ, ഡെലിവറി സമയപരിധികൾ എന്നിവ പരിഗണിച്ച് ഡെലിവറിയ്ക്ക് ഏറ്റവും അനുയോജ്യമായ മാർഗങ്ങൾ പ്രവചിക്കുന്നു എന്ന് വിശദീകരിക്കുന്നു. + + * [NYC Taxicab Route Visualization](http://chriswhong.github.io/nyctaxi/) - [Freedom Of Information Laws](https://chriswhong.com/open-data/foil_nyc_taxi/) ഉപയോഗിച്ച് ശേഖരിച്ച ഡാറ്റ NYC ടാക്സികളുടെ ഒരു ദിവസത്തെ ജീവിതം ദൃശ്യവത്കരിച്ചു, അവ എങ്ങനെ തിരക്കുള്ള നഗരത്തിൽ സഞ്ചരിക്കുന്നു, അവർ സമ്പാദിക്കുന്ന പണം, ഓരോ 24 മണിക്കൂറിനുള്ള യാത്രകളുടെ ദൈർഘ്യം എന്നിവ മനസ്സിലാക്കാൻ സഹായിച്ചു. + + * [Uber Data Science Workbench](https://eng.uber.com/dsw/) - Uber യാത്രകളിൽ നിന്നുള്ള (പിക്കപ്പ് & ഡ്രോപ്പ് ഓഫ് ലൊക്കേഷനുകൾ, യാത്രാ ദൈർഘ്യം, ഇഷ്ടപ്പെട്ട മാർഗങ്ങൾ തുടങ്ങിയ) ഡാറ്റ ഉപയോഗിച്ച് *ദൈനംദിനം* ഡാറ്റാ അനലിറ്റിക്സ് ഉപകരണം നിർമ്മിച്ച് വിലനിർണ്ണയം, സുരക്ഷ, തട്ടിപ്പ് കണ്ടെത്തൽ, നാവിഗേഷൻ തീരുമാനങ്ങൾ എന്നിവയ്ക്ക് സഹായിക്കുന്നു. + + * [Sports Analytics](https://towardsdatascience.com/scope-of-analytics-in-sports-world-37ed09c39860) - _പ്രവചനാത്മക വിശകലനം_ (ടീം, കളിക്കാരൻ വിശകലനം - [Moneyball](https://datasciencedegree.wisconsin.edu/blog/moneyball-proves-importance-big-data-big-ideas/) പോലെ - ഫാൻ മാനേജ്മെന്റ്)യും _ഡാറ്റാ ദൃശ്യവത്കരണം_ (ടീം & ഫാൻ ഡാഷ്ബോർഡുകൾ, ഗെയിമുകൾ തുടങ്ങിയവ)യും ടാലന്റ് സ്കൗട്ടിംഗ്, സ്പോർട്സ് ഗാംബ്ലിംഗ്, ഇൻവെന്ററി/വേദി മാനേജ്മെന്റ് പോലുള്ള പ്രയോഗങ്ങളുമായി കേന്ദ്രീകരിക്കുന്നു. + + * [Data Science in Banking](https://data-flair.training/blogs/data-science-in-banking/) - ധനകാര്യ വ്യവസായത്തിൽ ഡാറ്റാ സയൻസിന്റെ മൂല്യം ഹൈലൈറ്റ് ചെയ്യുന്നു, റിസ്‌ക് മോഡലിംഗ്, തട്ടിപ്പ് കണ്ടെത്തൽ, ഉപഭോക്തൃ വിഭാഗീകരണം, റിയൽ-ടൈം പ്രവചനവും ശുപാർശാ സംവിധാനങ്ങളും ഉൾപ്പെടെ. പ്രവചനാത്മക വിശകലനം [ക്രെഡിറ്റ് സ്കോറുകൾ](https://dzone.com/articles/using-big-data-and-predictive-analytics-for-credit) പോലുള്ള നിർണായക നടപടികൾക്ക് പ്രേരകമാണ്. + + * [Data Science in Healthcare](https://data-flair.training/blogs/data-science-in-healthcare/) - മെഡിക്കൽ ഇമേജിംഗ് (MRI, X-Ray, CT-സ്കാൻ), ജീനോമിക്സ് (DNA സീക്വൻസിംഗ്), മരുന്ന് വികസനം (റിസ്‌ക് വിലയിരുത്തൽ, വിജയ പ്രവചന), പ്രവചനാത്മക വിശകലനം (രോഗി പരിചരണം & വിതരണ ലജിസ്റ്റിക്സ്), രോഗം ട്രാക്കിംഗ് & പ്രതിരോധം തുടങ്ങിയ പ്രയോഗങ്ങൾ ഹൈലൈറ്റ് ചെയ്യുന്നു. + +![Data Science Applications in The Real World](../../../../translated_images/data-science-applications.4e5019cd8790ebac2277ff5f08af386f8727cac5d30f77727c7090677e6adb9c.ml.png) ചിത്രം ക്രെഡിറ്റ്: [Data Flair: 6 Amazing Data Science Applications ](https://data-flair.training/blogs/data-science-applications/) + +ചിത്രം ഡാറ്റാ സയൻസ് സാങ്കേതിക വിദ്യകൾ പ്രയോഗിക്കാവുന്ന മറ്റ് മേഖലകളും ഉദാഹരണങ്ങളും കാണിക്കുന്നു. മറ്റ് പ്രയോഗങ്ങൾ അന്വേഷിക്കണോ? താഴെയുള്ള [Review & Self Study](../../../../6-Data-Science-In-Wild/20-Real-World-Examples) വിഭാഗം പരിശോധിക്കുക. + +## ഡാറ്റാ സയൻസ് + ഗവേഷണം + +| ![ Sketchnote by [(@sketchthedocs)](https://sketchthedocs.dev) ](../../sketchnotes/20-DataScience-Research.png) | +| :---------------------------------------------------------------------------------------------------------------: | +| ഡാറ്റാ സയൻസ് & ഗവേഷണം - _സ്കെച്ച്നോട്ട് by [@nitya](https://twitter.com/nitya)_ | + +യഥാർത്ഥ ലോക പ്രയോഗങ്ങൾ സാധാരണയായി വ്യവസായ ഉപയോഗ കേസുകളിൽ സ്കെയിലിൽ കേന്ദ്രീകരിക്കുന്നുവെങ്കിലും, _ഗവേഷണ_ പ്രയോഗങ്ങളും പ്രോജക്ടുകളും രണ്ട് കാഴ്ചപ്പാടുകളിൽ ഉപകാരപ്രദമാണ്: + +* _നവീകരണ അവസരങ്ങൾ_ - ആധുനിക ആശയങ്ങളുടെ വേഗത്തിലുള്ള പ്രോട്ടോടൈപ്പിംഗ്, അടുത്ത തലമുറ പ്രയോഗങ്ങൾക്കുള്ള ഉപയോക്തൃ അനുഭവങ്ങളുടെ പരിശോധന. +* _പ്രയോഗ വെല്ലുവിളികൾ_ - യഥാർത്ഥ ലോക സാഹചര്യങ്ങളിൽ ഡാറ്റാ സയൻസ് സാങ്കേതിക വിദ്യകളുടെ സാധ്യതയുള്ള ഹാനികൾ അല്ലെങ്കിൽ ഉദ്ദേശിക്കാത്ത ഫലങ്ങൾ അന്വേഷിക്കുക. + +വിദ്യാർത്ഥികൾക്ക്, ഈ ഗവേഷണ പ്രോജക്ടുകൾ വിഷയത്തെക്കുറിച്ചുള്ള നിങ്ങളുടെ മനസ്സിലാക്കലും ബന്ധപ്പെട്ട ആളുകളുമായോ ടീമുകളുമായോ സഹകരിക്കുകയും വർദ്ധിപ്പിക്കുന്ന പഠനവും അവസരങ്ങൾ നൽകുന്നു. അതിനാൽ ഗവേഷണ പ്രോജക്ടുകൾ എങ്ങനെയാണ് കാണപ്പെടുന്നത്, അവ എങ്ങനെ സ്വാധീനം ചെലുത്തുന്നു? + +ഒരു ഉദാഹരണം നോക്കാം - Joy Buolamwini (MIT മീഡിയ ലാബ്സ്) യുടെ [MIT Gender Shades Study](http://gendershades.org/overview.html) ഒരു [പ്രധാന ഗവേഷണ പേപ്പർ](http://proceedings.mlr.press/v81/buolamwini18a/buolamwini18a.pdf) Timnit Gebru (അന്ന് Microsoft Research-ൽ) സഹരചയിതാവായുള്ളത്, ഇതിൽ ശ്രദ്ധ കേന്ദ്രീകരിച്ചത്: + + * **എന്ത്:** ലിംഗവും ത്വക്കിന്റെ തരം അടിസ്ഥാനമാക്കി സ്വയം പ്രവർത്തിക്കുന്ന മുഖ വിശകലന ആൽഗോരിതങ്ങളും ഡാറ്റാസെറ്റുകളും ഉള്ള പൂർവ്വാഗ്രഹം വിലയിരുത്തുക എന്നതാണ് ഗവേഷണ പ്രോജക്ടിന്റെ ലക്ഷ്യം. + * **എന്തുകൊണ്ട്:** മുഖ വിശകലനം നിയമ നടപ്പാക്കൽ, വിമാനത്താവള സുരക്ഷ, നിയമനം തുടങ്ങിയ മേഖലകളിൽ ഉപയോഗിക്കുന്നു - തെറ്റായ വർഗ്ഗീകരണങ്ങൾ (ഉദാ: പൂർവ്വാഗ്രഹം മൂലം) ബാധിച്ച വ്യക്തികൾക്ക് സാമ്പത്തികവും സാമൂഹികവും ഹാനികൾ ഉണ്ടാക്കാം. പൂർവ്വാഗ്രഹങ്ങൾ മനസ്സിലാക്കുകയും (നീക്കം ചെയ്യുകയോ കുറയ്ക്കുകയോ) നീതിക്ക് നിർണായകമാണ്. + * **എങ്ങനെ:** ഗവേഷകർ നിലവിലുള്ള ബെഞ്ച്മാർക്കുകൾ പ്രധാനമായും വെളുത്ത ത്വക്കുള്ള വിഷയങ്ങൾ ഉപയോഗിക്കുന്നതായി തിരിച്ചറിഞ്ഞു, ലിംഗവും ത്വക്കിന്റെ തരം കൂടി _സമതുല്യമായ_ പുതിയ ഡാറ്റാസെറ്റ് (1000+ ചിത്രങ്ങൾ) ഒരുക്കി. ഈ ഡാറ്റാസെറ്റ് Microsoft, IBM & Face++ എന്നിവയുടെ മൂന്ന് ലിംഗ വർഗ്ഗീകരണ ഉൽപ്പന്നങ്ങളുടെ കൃത്യത വിലയിരുത്താൻ ഉപയോഗിച്ചു. + +ഫലങ്ങൾ കാണിച്ചു, മൊത്തത്തിലുള്ള വർഗ്ഗീകരണ കൃത്യത നല്ലതായിരുന്നെങ്കിലും വിവിധ ഉപഗ്രൂപ്പുകൾക്കിടയിൽ പിഴവ് നിരക്കുകളിൽ ശ്രദ്ധേയമായ വ്യത്യാസം ഉണ്ടായിരുന്നു - **മിസ്ജെൻഡറിംഗ്** സ്ത്രീകൾക്കും ഇരുണ്ട ത്വക്കുള്ള വ്യക്തികൾക്കും കൂടുതലായിരുന്നു, ഇത് പൂർവ്വാഗ്രഹത്തിന്റെ സൂചനയാണ്. + +**പ്രധാന ഫലങ്ങൾ:** ഡാറ്റാ സയൻസിന് കൂടുതൽ _പ്രതിനിധി ഡാറ്റാസെറ്റുകൾ_ (സമതുല്യ ഉപഗ്രൂപ്പുകൾ) കൂടാതെ കൂടുതൽ _സമഗ്ര ടീമുകൾ_ (വിവിധ പശ്ചാത്തലങ്ങൾ) ആവശ്യമാണ്, AI പരിഹാരങ്ങളിൽ ഇത്തരം പൂർവ്വാഗ്രഹങ്ങൾ നേരത്തെ തിരിച്ചറിയാനും നീക്കം ചെയ്യാനും. ഈ ഗവേഷണ ശ്രമങ്ങൾ പല സംഘടനകളിലും _ഉത്തരവാദിത്വമുള്ള AI_-ക്കുള്ള സിദ്ധാന്തങ്ങളും പ്രാക്ടീസുകളും നിർവചിക്കുന്നതിൽ സഹായിക്കുന്നു, അവരുടെ AI ഉൽപ്പന്നങ്ങളിലും പ്രക്രിയകളിലും നീതി മെച്ചപ്പെടുത്താൻ. + +**Microsoft-ൽ ബന്ധപ്പെട്ട ഗവേഷണ ശ്രമങ്ങളെക്കുറിച്ച് അറിയാൻ ആഗ്രഹമുണ്ടോ?** + +* [Microsoft Research Projects](https://www.microsoft.com/research/research-area/artificial-intelligence/?facet%5Btax%5D%5Bmsr-research-area%5D%5B%5D=13556&facet%5Btax%5D%5Bmsr-content-type%5D%5B%5D=msr-project) Artificial Intelligence-ൽ പരിശോധിക്കുക. +* [Microsoft Research Data Science Summer School](https://www.microsoft.com/en-us/research/academic-program/data-science-summer-school/) ൽ നിന്നുള്ള വിദ്യാർത്ഥി പ്രോജക്ടുകൾ അന്വേഷിക്കുക. +* [Fairlearn](https://fairlearn.org/) പ്രോജക്ടും [Responsible AI](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1%3aprimaryr6) സംരംഭങ്ങളും പരിശോധിക്കുക. + +## ഡാറ്റാ സയൻസ് + ഹ്യൂമാനിറ്റീസ് + +| ![ Sketchnote by [(@sketchthedocs)](https://sketchthedocs.dev) ](../../sketchnotes/20-DataScience-Humanities.png) | +| :---------------------------------------------------------------------------------------------------------------: | +| ഡാറ്റാ സയൻസ് & ഡിജിറ്റൽ ഹ്യൂമാനിറ്റീസ് - _സ്കെച്ച്നോട്ട് by [@nitya](https://twitter.com/nitya)_ | + +ഡിജിറ്റൽ ഹ്യൂമാനിറ്റീസ് [ഇങ്ങനെ നിർവചിച്ചിട്ടുണ്ട്](https://digitalhumanities.stanford.edu/about-dh-stanford) - "കമ്പ്യൂട്ടേഷണൽ രീതികളും മാനവിക അന്വേഷണവും സംയോജിപ്പിക്കുന്ന പ്രാക്ടീസുകളും സമീപനങ്ങളും". [സ്റ്റാൻഫോർഡ് പ്രോജക്ടുകൾ](https://digitalhumanities.stanford.edu/projects) പോലുള്ള _"റീബൂട്ടിംഗ് ഹിസ്റ്ററി"_ , _"പോയറ്റിക് തിങ്കിംഗ്"_ എന്നിവ [ഡിജിറ്റൽ ഹ്യൂമാനിറ്റീസ് & ഡാറ്റാ സയൻസ്](https://digitalhumanities.stanford.edu/digital-humanities-and-data-science) തമ്മിലുള്ള ബന്ധം കാണിക്കുന്നു - നെറ്റ്‌വർക്ക് വിശകലനം, വിവര ദൃശ്യവത്കരണം, സ്ഥലം-ടെക്സ്റ്റ് വിശകലനം പോലുള്ള സാങ്കേതിക വിദ്യകൾ ചരിത്രപരവും സാഹിത്യപരവുമായ ഡാറ്റാസെറ്റുകൾ വീണ്ടും പരിശോധിച്ച് പുതിയ洞察ങ്ങളും കാഴ്ചപ്പാടുകളും കണ്ടെത്താൻ സഹായിക്കുന്നു. + +*ഈ മേഖലയിലെ ഒരു പ്രോജക്ട് അന്വേഷിച്ച് വികസിപ്പിക്കണോ?* + +["Emily Dickinson and the Meter of Mood"](https://gist.github.com/jlooper/ce4d102efd057137bc000db796bfd671) - [Jen Looper](https://twitter.com/jenlooper) യുടെ ഒരു മികച്ച ഉദാഹരണം, ഡാറ്റാ സയൻസ് ഉപയോഗിച്ച് പരിചിതമായ കവിതകൾ വീണ്ടും പരിശോധിച്ച് അതിന്റെ അർത്ഥവും രചയിതാവിന്റെ സംഭാവനകളും പുതിയ സാഹചര്യങ്ങളിൽ പുനഃമൂല്യനിർണയം ചെയ്യാൻ എങ്ങനെ കഴിയും എന്ന് ചോദിക്കുന്നു. ഉദാഹരണത്തിന്, _ഒരു കവിത എഴുതപ്പെട്ട കാലാവസ്ഥാ കാലം അതിന്റെ ടോൺ അല്ലെങ്കിൽ സന്റിമെന്റ് വിശകലനം ചെയ്ത് പ്രവചിക്കാമോ_ - ഇത് രചയിതാവിന്റെ മനോഭാവത്തെക്കുറിച്ച് എന്ത് പറയുന്നു? + +ആ ചോദ്യം ഉത്തരം നൽകാൻ, നാം ഡാറ്റാ സയൻസ് ലൈഫ്‌സൈക്കിൾ ഘട്ടങ്ങൾ പിന്തുടരുന്നു: + * [`Data Acquisition`](https://gist.github.com/jlooper/ce4d102efd057137bc000db796bfd671#acquiring-the-dataset) - വിശകലനത്തിന് അനുയോജ്യമായ ഡാറ്റാസെറ്റ് ശേഖരിക്കാൻ. API (ഉദാ: [Poetry DB API](https://poetrydb.org/index.html)) ഉപയോഗിക്കൽ അല്ലെങ്കിൽ വെബ് പേജുകൾ സ്ക്രാപ്പ് ചെയ്യൽ (ഉദാ: [Project Gutenberg](https://www.gutenberg.org/files/12242/12242-h/12242-h.htm)) [Scrapy](https://scrapy.org/) പോലുള്ള ഉപകരണങ്ങൾ ഉപയോഗിച്ച്. + * [`Data Cleaning`](https://gist.github.com/jlooper/ce4d102efd057137bc000db796bfd671#clean-the-data) - ടെക്സ്റ്റ് എങ്ങനെ ഫോർമാറ്റ് ചെയ്യാം, ശുദ്ധമാക്കാം, ലളിതമാക്കാം എന്ന് Visual Studio Code, Microsoft Excel പോലുള്ള അടിസ്ഥാന ഉപകരണങ്ങൾ ഉപയോഗിച്ച് വിശദീകരിക്കുന്നു. + * [`Data Analysis`](https://gist.github.com/jlooper/ce4d102efd057137bc000db796bfd671#working-with-the-data-in-a-notebook) - ഡാറ്റാസെറ്റ് "നോട്ട്ബുക്കുകളിൽ" ഇറക്കുമതി ചെയ്ത് Python പാക്കേജുകൾ (pandas, numpy, matplotlib) ഉപയോഗിച്ച് ഡാറ്റ ക്രമീകരിക്കുകയും ദൃശ്യവത്കരിക്കുകയും ചെയ്യുന്നത് വിശദീകരിക്കുന്നു. + * [`Sentiment Analysis`](https://gist.github.com/jlooper/ce4d102efd057137bc000db796bfd671#sentiment-analysis-using-cognitive-services) - Text Analytics പോലുള്ള ക്ലൗഡ് സേവനങ്ങൾ, [Power Automate](https://flow.microsoft.com/en-us/) പോലുള്ള ലോ-കോഡ് ഉപകരണങ്ങൾ ഉപയോഗിച്ച് ഓട്ടോമേറ്റഡ് ഡാറ്റാ പ്രോസസ്സിംഗ് പ്രവൃത്തികൾ എങ്ങനെ സംയോജിപ്പിക്കാമെന്ന് വിശദീകരിക്കുന്നു. + +ഈ പ്രവൃത്തിപദ്ധതി ഉപയോഗിച്ച് കവിതകളുടെ സീസണൽ സ്വാധീനങ്ങൾ(sentiment) പരിശോധിച്ച് രചയിതാവിനെക്കുറിച്ചുള്ള നമ്മുടെ കാഴ്ചപ്പാടുകൾ രൂപപ്പെടുത്താൻ സഹായിക്കും. നിങ്ങൾ തന്നെ പരീക്ഷിച്ച് നോക്കൂ - പിന്നെ നോട്ട്ബുക്ക് വികസിപ്പിച്ച് മറ്റ് ചോദ്യങ്ങൾ ചോദിക്കുകയോ ഡാറ്റ പുതിയ രീതിയിൽ ദൃശ്യവത്കരിക്കുകയോ ചെയ്യൂ! + +> [Digital Humanities toolkit](https://github.com/Digital-Humanities-Toolkit) ൽ ചില ഉപകരണങ്ങൾ ഈ അന്വേഷണ മാർഗങ്ങൾ പിന്തുടരാൻ ഉപയോഗിക്കാം + +## ഡാറ്റാ സയൻസ് + സുസ്ഥിരത + +| ![ Sketchnote by [(@sketchthedocs)](https://sketchthedocs.dev) ](../../sketchnotes/20-DataScience-Sustainability.png) | +| :---------------------------------------------------------------------------------------------------------------: | +| ഡാറ്റാ സയൻസ് & സുസ്ഥിരത - _സ്കെച്ച്നോട്ട് by [@nitya](https://twitter.com/nitya)_ | + +[2030 സുസ്ഥിര വികസന അജണ്ട](https://sdgs.un.org/2030agenda) - 2015-ൽ എല്ലാ ഐക്യരാഷ്ട്രസഭ അംഗങ്ങളും അംഗീകരിച്ചത് - 17 ലക്ഷ്യങ്ങൾ തിരിച്ചറിഞ്ഞു, അവയിൽ ചിലത് **ഗ്രഹത്തെ സംരക്ഷിക്കൽ** എന്നതും കാലാവസ്ഥാ മാറ്റത്തിന്റെ ബാധകൾ കുറയ്ക്കലും ഉൾക്കൊള്ളുന്നു. [Microsoft Sustainability](https://www.microsoft.com/en-us/sustainability) സംരംഭം ഈ ലക്ഷ്യങ്ങളെ പിന്തുണയ്ക്കുന്നു, 2030-ഓടെ കാർബൺ നെഗറ്റീവ്, വെള്ളം പോസിറ്റീവ്, പൂജ്യം മാലിന്യം, ബയോ-വൈവിധ്യമാർന്നതായ 4 ലക്ഷ്യങ്ങളിൽ [കേന്ദ്രീകരിച്ച്](https://dev.to/azure/a-visual-guide-to-sustainable-software-engineering-53hh) സാങ്കേതിക പരിഹാരങ്ങൾ കണ്ടെത്താനും കൂടുതൽ സുസ്ഥിര ഭാവികൾ നിർമ്മിക്കാനും. + +ഈ വെല്ലുവിളികൾ സ്കെയിലിലും സമയബന്ധിതവുമാകാൻ ക്ലൗഡ്-സ്കെയിൽ ചിന്തനവും വലിയ ഡാറ്റയും ആവശ്യമാണ്. [Planetary Computer](https://planetarycomputer.microsoft.com/) സംരംഭം ഡാറ്റാ സയന്റിസ്റ്റുകൾക്കും ഡെവലപ്പർമാർക്കും സഹായിക്കുന്ന 4 ഘടകങ്ങൾ നൽകുന്നു: + + * [Data Catalog](https://planetarycomputer.microsoft.com/catalog) - പെടാബൈറ്റുകൾ അളവിലുള്ള ഭൂമിശാസ്ത്ര ഡാറ്റ (സൗജന്യവും Azure-ൽ ഹോസ്റ്റ് ചെയ്തതും). + * [Planetary API](https://planetarycomputer.microsoft.com/docs/reference/stac/) - ഉപയോക്താക്കൾക്ക് സ്ഥലം, സമയം എന്നിവയിൽ അനുയോജ്യമായ ഡാറ്റ തിരയാൻ സഹായിക്കുന്നു. + * [Hub](https://planetarycomputer.microsoft.com/docs/overview/environment/) - ശാസ്ത്രജ്ഞർക്ക് വൻഭൂമിശാസ്ത്ര ഡാറ്റാസെറ്റുകൾ പ്രോസസ്സ് ചെയ്യാൻ മാനേജുചെയ്യുന്ന പരിസ്ഥിതി. +Translation for chunk 2 of 'README.md' skipped due to timeout. + +--- + + +**അസൂയാ**: +ഈ രേഖ AI വിവർത്തന സേവനം [Co-op Translator](https://github.com/Azure/co-op-translator) ഉപയോഗിച്ച് വിവർത്തനം ചെയ്തതാണ്. നാം കൃത്യതയ്ക്ക് ശ്രമിച്ചിട്ടുണ്ടെങ്കിലും, സ്വയം പ്രവർത്തിക്കുന്ന വിവർത്തനങ്ങളിൽ പിശകുകൾ അല്ലെങ്കിൽ തെറ്റുകൾ ഉണ്ടാകാമെന്ന് ദയവായി ശ്രദ്ധിക്കുക. അതിന്റെ മാതൃഭാഷയിലുള്ള യഥാർത്ഥ രേഖ അധികാരപരമായ ഉറവിടമായി കണക്കാക്കണം. നിർണായക വിവരങ്ങൾക്ക്, പ്രൊഫഷണൽ മനുഷ്യ വിവർത്തനം ശുപാർശ ചെയ്യപ്പെടുന്നു. ഈ വിവർത്തനത്തിന്റെ ഉപയോഗത്തിൽ നിന്നുണ്ടാകുന്ന ഏതെങ്കിലും തെറ്റിദ്ധാരണകൾക്കോ തെറ്റായ വ്യാഖ്യാനങ്ങൾക്കോ ഞങ്ങൾ ഉത്തരവാദികളല്ല. + \ No newline at end of file diff --git a/translations/ml/6-Data-Science-In-Wild/20-Real-World-Examples/assignment.md b/translations/ml/6-Data-Science-In-Wild/20-Real-World-Examples/assignment.md new file mode 100644 index 00000000..f9259fe4 --- /dev/null +++ b/translations/ml/6-Data-Science-In-Wild/20-Real-World-Examples/assignment.md @@ -0,0 +1,52 @@ + +# ഒരു പ്ലാനറ്ററി കമ്പ്യൂട്ടർ ഡാറ്റാസെറ്റ് അന്വേഷിക്കുക + +## നിർദ്ദേശങ്ങൾ + +ഈ പാഠത്തിൽ, നാം വിവിധ ഡാറ്റാ സയൻസ് അപ്ലിക്കേഷൻ ഡൊമെയ്‌നുകൾക്കുറിച്ച് സംസാരിച്ചു - ഗവേഷണം, സുസ്ഥിരത, ഡിജിറ്റൽ ഹ്യൂമാനിറ്റീസ് എന്നിവയുമായി ബന്ധപ്പെട്ട ഉദാഹരണങ്ങളിൽ ആഴത്തിലുള്ള പഠനങ്ങൾ നടത്തി. ഈ അസൈൻമെന്റിൽ, നിങ്ങൾ ഈ ഉദാഹരണങ്ങളിൽ ഒന്നിനെ കൂടുതൽ വിശദമായി അന്വേഷിച്ച്, ഡാറ്റാ വിസ്വലൈസേഷനുകളും വിശകലനവും സംബന്ധിച്ച നിങ്ങളുടെ പഠനങ്ങൾ പ്രയോഗിച്ച് സുസ്ഥിരത ഡാറ്റയെക്കുറിച്ചുള്ള洞察ങ്ങൾ കണ്ടെത്തും. + +[Planetary Computer](https://planetarycomputer.microsoft.com/) പ്രോജക്ടിന് അക്കൗണ്ട് ഉപയോഗിച്ച് ആക്സസ് ചെയ്യാവുന്ന ഡാറ്റാസെറ്റുകളും API കളും ഉണ്ട് - അസൈൻമെന്റിന്റെ ബോണസ് ഘട്ടം പരീക്ഷിക്കാൻ ആഗ്രഹിക്കുന്നുവെങ്കിൽ ആക്സസ് ആവശ്യപ്പെടുക. സൈറ്റ് അക്കൗണ്ട് സൃഷ്ടിക്കാതെ ഉപയോഗിക്കാവുന്ന [Explorer](https://planetarycomputer.microsoft.com/explore) ഫീച്ചറും നൽകുന്നു. + +`പടികൾ:` +Explorer ഇന്റർഫേസ് (താഴെ സ്ക്രീൻഷോട്ടിൽ കാണിക്കുന്നു) നിങ്ങൾക്ക് ഒരു ഡാറ്റാസെറ്റ് (നൽകിയിരിക്കുന്ന ഓപ്ഷനുകളിൽ നിന്ന്), ഒരു പ്രിസെറ്റ് ക്വറി (ഡാറ്റ ഫിൽട്ടർ ചെയ്യാൻ) ഒപ്പം ഒരു റെൻഡറിംഗ് ഓപ്ഷൻ (പ്രസക്തമായ വിസ്വലൈസേഷൻ സൃഷ്ടിക്കാൻ) തിരഞ്ഞെടുക്കാൻ അനുവദിക്കുന്നു. ഈ അസൈൻമെന്റിൽ, നിങ്ങളുടെ ജോലി: + + 1. [Explorer ഡോക്യുമെന്റേഷൻ](https://planetarycomputer.microsoft.com/docs/overview/explorer/) വായിക്കുക - ഓപ്ഷനുകൾ മനസിലാക്കുക. + 2. ഡാറ്റാസെറ്റ് [കാറ്റലോഗ്](https://planetarycomputer.microsoft.com/catalog) പരിശോധിക്കുക - ഓരോന്നിന്റെയും ഉദ്ദേശ്യം പഠിക്കുക. + 3. Explorer ഉപയോഗിക്കുക - താൽപ്പര്യമുള്ള ഒരു ഡാറ്റാസെറ്റ് തിരഞ്ഞെടുക്കുക, പ്രസക്തമായ ക്വറി & റെൻഡറിംഗ് ഓപ്ഷൻ തിരഞ്ഞെടുക്കുക. + +![The Planetary Computer Explorer](../../../../translated_images/planetary-computer-explorer.c1e95a9b053167d64e2e8e4347cfb689e47e2037c33103fc1bbea1a149d4f85b.ml.png) + +`നിങ്ങളുടെ ജോലി:` +ഇപ്പോൾ ബ്രൗസറിൽ റെൻഡർ ചെയ്ത വിസ്വലൈസേഷൻ പഠിച്ച് താഴെ പറയുന്നവയ്ക്ക് ഉത്തരം നൽകുക: + * ഡാറ്റാസെറ്റിന് എന്ത് _ഫീച്ചറുകൾ_ ഉണ്ട്? + * വിസ്വലൈസേഷൻ എന്ത് _洞察ങ്ങൾ_ അല്ലെങ്കിൽ ഫലങ്ങൾ നൽകുന്നു? + * ആ洞察ങ്ങൾ പ്രോജക്ടിന്റെ സുസ്ഥിരത ലക്ഷ്യങ്ങൾക്ക് എന്ത് _പ്രഭാവം_ ചെലുത്തുന്നു? + * വിസ്വലൈസേഷന്റെ _പരിമിതികൾ_ എന്തൊക്കെയാണ് (അഥവാ, നിങ്ങൾക്ക് ലഭിക്കാത്ത洞察ം എന്ത്?) + * നിങ്ങൾക്ക് റോ ഡാറ്റ ലഭിച്ചാൽ, നിങ്ങൾ എന്ത് _മാറ്റം വരുത്തിയ വിസ്വലൈസേഷനുകൾ_ സൃഷ്ടിക്കുമായിരുന്നു, എന്തുകൊണ്ട്? + +`ബോണസ് പോയിന്റുകൾ:` +അക്കൗണ്ടിനായി അപേക്ഷിക്കുക - അംഗീകരിച്ചാൽ ലോഗിൻ ചെയ്യുക. + * _Launch Hub_ ഓപ്ഷൻ ഉപയോഗിച്ച് റോ ഡാറ്റ ഒരു നോട്ട്‌ബുക്കിൽ തുറക്കുക. + * ഡാറ്റ ഇന്ററാക്ടീവായി പരിശോധിച്ച്, നിങ്ങൾ ചിന്തിച്ച മാറ്റം വരുത്തിയ വിസ്വലൈസേഷനുകൾ നടപ്പിലാക്കുക. + * ഇപ്പോൾ നിങ്ങളുടെ കസ്റ്റം വിസ്വലൈസേഷനുകൾ വിശകലനം ചെയ്യുക - മുമ്പ് നഷ്ടപ്പെട്ട洞察ങ്ങൾ കണ്ടെത്താൻ കഴിഞ്ഞോ? + +## റൂബ്രിക് + +Exemplary | Adequate | Needs Improvement +--- | --- | -- | +അഞ്ചു പ്രധാന ചോദ്യങ്ങൾക്കും ഉത്തരം നൽകിയിട്ടുണ്ട്. വിദ്യാർത്ഥി നിലവിലുള്ളതും മാറ്റം വരുത്തിയതുമായ വിസ്വലൈസേഷനുകൾ സുസ്ഥിരത ലക്ഷ്യങ്ങളിലേക്കോ ഫലങ്ങളിലേക്കോ洞察ങ്ങൾ നൽകുന്നതെങ്ങനെ എന്ന് വ്യക്തമായി തിരിച്ചറിഞ്ഞിട്ടുണ്ട്.| വിദ്യാർത്ഥി കുറഞ്ഞത് മുകളിൽ പറഞ്ഞ 3 ചോദ്യങ്ങൾ വിശദമായി ഉത്തരം നൽകിയിട്ടുണ്ട്, Explorer ഉപയോഗത്തിൽ പ്രായോഗിക പരിചയം തെളിയിക്കുന്നു.| വിദ്യാർത്ഥി പല ചോദ്യങ്ങൾക്കും ഉത്തരം നൽകാൻ പരാജയപ്പെട്ടു, അല്ലെങ്കിൽ അപര്യാപ്തമായ വിശദാംശങ്ങൾ നൽകി - പ്രോജക്ടിനായി യഥാർത്ഥ ശ്രമം നടത്തിയില്ല എന്ന് സൂചിപ്പിക്കുന്നു.| + +--- + + +**അസൂയാ**: +ഈ രേഖ AI വിവർത്തന സേവനം [Co-op Translator](https://github.com/Azure/co-op-translator) ഉപയോഗിച്ച് വിവർത്തനം ചെയ്തതാണ്. നാം കൃത്യതയ്ക്ക് ശ്രമിച്ചിട്ടുണ്ടെങ്കിലും, സ്വയം പ്രവർത്തിക്കുന്ന വിവർത്തനങ്ങളിൽ പിശകുകൾ അല്ലെങ്കിൽ തെറ്റുകൾ ഉണ്ടാകാമെന്ന് ദയവായി ശ്രദ്ധിക്കുക. അതിന്റെ മാതൃഭാഷയിലുള്ള യഥാർത്ഥ രേഖ പ്രാമാണികമായ ഉറവിടമായി കണക്കാക്കണം. നിർണായകമായ വിവരങ്ങൾക്ക്, പ്രൊഫഷണൽ മനുഷ്യ വിവർത്തനം ശുപാർശ ചെയ്യപ്പെടുന്നു. ഈ വിവർത്തനം ഉപയോഗിക്കുന്നതിൽ നിന്നുണ്ടാകുന്ന ഏതെങ്കിലും തെറ്റിദ്ധാരണകൾക്കോ തെറ്റായ വ്യാഖ്യാനങ്ങൾക്കോ ഞങ്ങൾ ഉത്തരവാദികളല്ല. + \ No newline at end of file diff --git a/translations/ml/6-Data-Science-In-Wild/README.md b/translations/ml/6-Data-Science-In-Wild/README.md new file mode 100644 index 00000000..eba3ea7a --- /dev/null +++ b/translations/ml/6-Data-Science-In-Wild/README.md @@ -0,0 +1,27 @@ + +# Data Science in the Wild + +വ്യവസായങ്ങളിലുടനീളം ഡാറ്റാ സയൻസിന്റെ യഥാർത്ഥ ലോക പ്രയോഗങ്ങൾ. + +### Topics + +1. [Data Science in the Real World](20-Real-World-Examples/README.md) + +### Credits + +❤️ കൊണ്ട് എഴുതിയത് [Nitya Narasimhan](https://twitter.com/nitya) + +--- + + +**അസൂയാ**: +ഈ രേഖ AI വിവർത്തന സേവനം [Co-op Translator](https://github.com/Azure/co-op-translator) ഉപയോഗിച്ച് വിവർത്തനം ചെയ്തതാണ്. നാം കൃത്യതയ്ക്ക് ശ്രമിച്ചിട്ടുണ്ടെങ്കിലും, സ്വയം പ്രവർത്തിക്കുന്ന വിവർത്തനങ്ങളിൽ പിശകുകൾ അല്ലെങ്കിൽ തെറ്റുകൾ ഉണ്ടാകാമെന്ന് ദയവായി ശ്രദ്ധിക്കുക. അതിന്റെ മാതൃഭാഷയിലുള്ള യഥാർത്ഥ രേഖയാണ് പ്രാമാണികമായ ഉറവിടം എന്ന് പരിഗണിക്കേണ്ടതാണ്. നിർണായകമായ വിവരങ്ങൾക്ക്, പ്രൊഫഷണൽ മനുഷ്യ വിവർത്തനം ശുപാർശ ചെയ്യപ്പെടുന്നു. ഈ വിവർത്തനം ഉപയോഗിക്കുന്നതിൽ നിന്നുണ്ടാകുന്ന ഏതെങ്കിലും തെറ്റിദ്ധാരണകൾക്കോ തെറ്റായ വ്യാഖ്യാനങ്ങൾക്കോ ഞങ്ങൾ ഉത്തരവാദികളല്ല. + \ No newline at end of file diff --git a/translations/ml/AGENTS.md b/translations/ml/AGENTS.md new file mode 100644 index 00000000..64abd72a --- /dev/null +++ b/translations/ml/AGENTS.md @@ -0,0 +1,375 @@ + +# AGENTS.md + +## പ്രോജക്ട് അവലോകനം + +ഡാറ്റാ സയൻസ് ഫോർ ബിഗിനേഴ്സ് മൈക്രോസോഫ്റ്റ് അസ്യൂർ ക്ലൗഡ് അഡ്വക്കേറ്റ്സ് സൃഷ്ടിച്ച ഒരു സമഗ്രമായ 10 ആഴ്ച, 20 പാഠം കോഴ്സാണ്. ഈ റിപോസിറ്ററി പ്രോജക്ട് അടിസ്ഥാനമാക്കിയ പാഠങ്ങളിലൂടെ അടിസ്ഥാന ഡാറ്റാ സയൻസ് ആശയങ്ങൾ പഠിപ്പിക്കുന്ന ഒരു പഠന വിഭവമാണ്, ഇതിൽ Jupyter നോട്ട്‌ബുക്കുകൾ, ഇന്ററാക്ടീവ് ക്വിസുകൾ, ഹാൻഡ്‌സ്-ഓൺ അസൈൻമെന്റുകൾ ഉൾപ്പെടുന്നു. + +**പ്രധാന സാങ്കേതികവിദ്യകൾ:** +- **Jupyter Notebooks**: Python 3 ഉപയോഗിച്ച് പ്രധാന പഠന മാധ്യമം +- **Python ലൈബ്രറികൾ**: pandas, numpy, matplotlib ഡാറ്റാ വിശകലനത്തിനും ദൃശ്യീകരണത്തിനും +- **Vue.js 2**: ക്വിസ് അപ്ലിക്കേഷൻ (quiz-app ഫോൾഡർ) +- **Docsify**: ഓഫ്‌ലൈൻ ആക്സസ്‌ക്കായി ഡോക്യുമെന്റേഷൻ സൈറ്റ് ജനറേറ്റർ +- **Node.js/npm**: ജാവാസ്ക്രിപ്റ്റ് ഘടകങ്ങൾക്ക് പാക്കേജ് മാനേജ്മെന്റ് +- **Markdown**: എല്ലാ പാഠം ഉള്ളടക്കവും ഡോക്യുമെന്റേഷനും + +**ആർക്കിടെക്ചർ:** +- വ്യാപകമായ ഭാഷാന്തരങ്ങളുള്ള ബഹുഭാഷാ വിദ്യാഭ്യാസ റിപോസിറ്ററി +- പാഠം മോഡ്യൂളുകളായി ഘടിപ്പിച്ചിരിക്കുന്നു (1-Introduction മുതൽ 6-Data-Science-In-Wild വരെ) +- ഓരോ പാഠത്തിലും README, നോട്ട്‌ബുക്കുകൾ, അസൈൻമെന്റുകൾ, ക്വിസുകൾ ഉൾപ്പെടുന്നു +- പാഠത്തിന് മുൻപും ശേഷവും മൂല്യനിർണയത്തിനായി സ്റ്റാൻഡ്എലോൺ Vue.js ക്വിസ് അപ്ലിക്കേഷൻ +- GitHub Codespaces, VS Code ഡെവ് കണ്ടെയ്‌നറുകൾ പിന്തുണ + +## സെറ്റപ്പ് കമാൻഡുകൾ + +### റിപോസിറ്ററി സെറ്റപ്പ് +```bash +# റിപ്പോസിറ്ററി ക്ലോൺ ചെയ്യുക (ഇതിനുമുമ്പ് ക്ലോൺ ചെയ്തിട്ടില്ലെങ്കിൽ) +git clone https://github.com/microsoft/Data-Science-For-Beginners.git +cd Data-Science-For-Beginners +``` + +### Python പരിസ്ഥിതി സെറ്റപ്പ് +```bash +# ഒരു വെർച്വൽ എൻവയോൺമെന്റ് സൃഷ്ടിക്കുക (ശുപാർശ ചെയ്യുന്നു) +python -m venv venv +source venv/bin/activate # വിൻഡോസ്-ൽ: venv\Scripts\activate + +# പൊതുവായ ഡാറ്റാ സയൻസ് ലൈബ്രറികൾ ഇൻസ്റ്റാൾ ചെയ്യുക (requirements.txt ഇല്ല) +pip install jupyter pandas numpy matplotlib seaborn scikit-learn +``` + +### ക്വിസ് അപ്ലിക്കേഷൻ സെറ്റപ്പ് +```bash +# ക്വിസ് ആപ്പിലേക്ക് നാവിഗേറ്റ് ചെയ്യുക +cd quiz-app + +# ആശ്രിതങ്ങൾ ഇൻസ്റ്റാൾ ചെയ്യുക +npm install + +# ഡെവലപ്പ്മെന്റ് സർവർ ആരംഭിക്കുക +npm run serve + +# പ്രൊഡക്ഷനായി ബിൽഡ് ചെയ്യുക +npm run build + +# ലിന്റ് ചെയ്ത് ഫയലുകൾ ശരിയാക്കുക +npm run lint +``` + +### Docsify ഡോക്യുമെന്റേഷൻ സർവർ +```bash +# ഡോക്സിഫൈ ഗ്ലോബലായി ഇൻസ്റ്റാൾ ചെയ്യുക +npm install -g docsify-cli + +# ഡോക്യുമെന്റേഷൻ ലോക്കലായി സർവ് ചെയ്യുക +docsify serve + +# ഡോക്യുമെന്റേഷൻ localhost:3000 ൽ ലഭ്യമായിരിക്കും +``` + +### ദൃശ്യീകരണ പ്രോജക്ടുകൾ സെറ്റപ്പ് +meaningful-visualizations പോലുള്ള ദൃശ്യീകരണ പ്രോജക്ടുകൾക്കായി (പാഠം 13): +```bash +# സ്റ്റാർട്ടർ അല്ലെങ്കിൽ സൊല്യൂഷൻ ഫോൾഡറിലേക്ക് നാവിഗേറ്റ് ചെയ്യുക +cd 3-Data-Visualization/13-meaningful-visualizations/starter + +# ആശ്രിതങ്ങൾ ഇൻസ്റ്റാൾ ചെയ്യുക +npm install + +# ഡെവലപ്പ്മെന്റ് സർവർ ആരംഭിക്കുക +npm run serve + +# പ്രൊഡക്ഷനായി ബിൽഡ് ചെയ്യുക +npm run build + +# ഫയലുകൾ ലിന്റ് ചെയ്യുക +npm run lint +``` + +## ഡെവലപ്പ്മെന്റ് വർക്ക്‌ഫ്ലോ + +### Jupyter നോട്ട്‌ബുക്കുകളുമായി പ്രവർത്തിക്കൽ +1. റിപോസിറ്ററി റൂട്ടിൽ Jupyter ആരംഭിക്കുക: `jupyter notebook` +2. ആവശ്യമായ പാഠ ഫോൾഡറിലേക്ക് നാവിഗേറ്റ് ചെയ്യുക +3. `.ipynb` ഫയലുകൾ തുറന്ന് അഭ്യാസങ്ങൾ ചെയ്യുക +4. നോട്ട്‌ബുക്കുകൾ സ്വയം സമ്പൂർണമാണ്, വിശദീകരണങ്ങളും കോഡ് സെല്ലുകളും ഉൾപ്പെടുന്നു +5. മിക്ക നോട്ട്‌ബുക്കുകളും pandas, numpy, matplotlib ഉപയോഗിക്കുന്നു - ഇവ ഇൻസ്റ്റാൾ ചെയ്തിട്ടുണ്ടെന്ന് ഉറപ്പാക്കുക + +### പാഠ ഘടന +ഓരോ പാഠവും സാധാരണയായി ഉൾക്കൊള്ളുന്നു: +- `README.md` - സിദ്ധാന്തവും ഉദാഹരണങ്ങളും ഉള്ള പ്രധാന പാഠം ഉള്ളടക്കം +- `notebook.ipynb` - ഹാൻഡ്‌സ്-ഓൺ Jupyter നോട്ട്‌ബുക്ക് അഭ്യാസങ്ങൾ +- `assignment.ipynb` അല്ലെങ്കിൽ `assignment.md` - പ്രാക്ടീസ് അസൈൻമെന്റുകൾ +- `solution/` ഫോൾഡർ - പരിഹാര നോട്ട്‌ബുക്കുകളും കോഡും +- `images/` ഫോൾഡർ - പിന്തുണയ്ക്കുന്ന ദൃശ്യ സാമഗ്രികൾ + +### ക്വിസ് അപ്ലിക്കേഷൻ ഡെവലപ്പ്മെന്റ് +- ഡെവലപ്പ്മെന്റിനിടെ ഹോട്ട്-റീലോഡ് ഉള്ള Vue.js 2 അപ്ലിക്കേഷൻ +- ക്വിസുകൾ `quiz-app/src/assets/translations/` ൽ സൂക്ഷിക്കുന്നു +- ഓരോ ഭാഷക്കും സ്വന്തം ഭാഷാന്തര ഫോൾഡർ ഉണ്ട് (en, fr, es, മുതലായവ) +- ക്വിസ് നമ്പറിംഗ് 0 മുതൽ 39 വരെ (മൊത്തം 40 ക്വിസുകൾ) + +### ഭാഷാന്തരങ്ങൾ ചേർക്കൽ +- ഭാഷാന്തരങ്ങൾ റിപോസിറ്ററി റൂട്ടിലുള്ള `translations/` ഫോൾഡറിൽ പോകും +- ഓരോ ഭാഷക്കും ഇംഗ്ലീഷിൽ നിന്നുള്ള പാഠ ഘടന പൂർണ്ണമായി മിറർ ചെയ്യുന്നു +- GitHub Actions വഴി സ്വയംഭാഷാന്തരം (co-op-translator.yml) + +## ടെസ്റ്റിംഗ് നിർദ്ദേശങ്ങൾ + +### ക്വിസ് അപ്ലിക്കേഷൻ ടെസ്റ്റിംഗ് +```bash +cd quiz-app + +# ലിന്റ് പരിശോധനകൾ നടത്തുക +npm run lint + +# ബിൽഡ് പ്രക്രിയ പരിശോധിക്കുക +npm run build + +# മാനുവൽ ടെസ്റ്റിംഗ്: ഡെവ് സർവർ ആരംഭിച്ച് ക്വിസ് പ്രവർത്തനം സ്ഥിരീകരിക്കുക +npm run serve +``` + +### നോട്ട്‌ബുക്ക് ടെസ്റ്റിംഗ് +- നോട്ട്‌ബുക്കുകൾക്കായി യാന്ത്രിക ടെസ്റ്റ് ഫ്രെയിംവർക്ക് ഇല്ല +- മാനുവൽ പരിശോധന: എല്ലാ സെല്ലുകളും ക്രമത്തിൽ ഓടിക്കുക, പിശകുകൾ ഇല്ലെന്ന് ഉറപ്പാക്കുക +- ഡാറ്റാ ഫയലുകൾ ലഭ്യമാണ് എന്ന് പരിശോധിക്കുക, ഔട്ട്പുട്ടുകൾ ശരിയായി ഉണ്ടാകുന്നു എന്ന് ഉറപ്പാക്കുക +- ദൃശ്യീകരണങ്ങൾ ശരിയായി പ്രദർശിപ്പിക്കുന്നുണ്ടെന്ന് പരിശോധിക്കുക + +### ഡോക്യുമെന്റേഷൻ ടെസ്റ്റിംഗ് +```bash +# ഡോക്സിഫൈ ശരിയായി റെൻഡർ ചെയ്യുന്നതായി സ്ഥിരീകരിക്കുക +docsify serve + +# ഉള്ളടക്കം വഴി നാവിഗേറ്റ് ചെയ്ത് തകരാറുള്ള ലിങ്കുകൾ മാനുവലായി പരിശോധിക്കുക +# റെൻഡർ ചെയ്ത ഡോക്യുമെന്റേഷനിൽ എല്ലാ പാഠ ലിങ്കുകളും പ്രവർത്തിക്കുന്നുണ്ടെന്ന് സ്ഥിരീകരിക്കുക +``` + +### കോഡ് ഗുണനിലവാര പരിശോധനകൾ +```bash +# Vue.js പ്രോജക്ടുകൾ (ക്വിസ്-ആപ്പ് மற்றும் ദൃശ്യീകരണ പ്രോജക്ടുകൾ) +cd quiz-app # അല്ലെങ്കിൽ ദൃശ്യീകരണ പ്രോജക്ട് ഫോൾഡർ +npm run lint + +# പൈത്തൺ നോട്ട്‌ബുക്കുകൾ - മാനുവൽ പരിശോധന ശുപാർശ ചെയ്യുന്നു +# ഇറക്കുമതികൾ പ്രവർത്തിക്കുന്നുവെന്ന് ഉറപ്പാക്കുക, സെല്ലുകൾ പിശകുകൾ കൂടാതെ പ്രവർത്തിക്കണം +``` + +## കോഡ് സ്റ്റൈൽ മാർഗ്ഗനിർദ്ദേശങ്ങൾ + +### Python (Jupyter നോട്ട്‌ബുക്കുകൾ) +- Python കോഡിനായി PEP 8 സ്റ്റൈൽ മാർഗ്ഗനിർദ്ദേശങ്ങൾ പാലിക്കുക +- ഡാറ്റ വിശകലനത്തിന് വ്യക്തമായ വേരിയബിൾ നാമങ്ങൾ ഉപയോഗിക്കുക +- കോഡ് സെല്ലുകൾക്ക് മുമ്പ് വിശദീകരണങ്ങളുള്ള മാർക്ക്ഡൗൺ സെല്ലുകൾ ഉൾപ്പെടുത്തുക +- കോഡ് സെല്ലുകൾ ഏക ആശയങ്ങളിലോ പ്രവർത്തനങ്ങളിലോ കേന്ദ്രീകരിക്കുക +- ഡാറ്റ മാനിപ്പുലേഷനായി pandas, ദൃശ്യീകരണത്തിന് matplotlib ഉപയോഗിക്കുക +- സാധാരണ ഇംപോർട്ട് പാറ്റേൺ: + ```python + import pandas as pd + import numpy as np + import matplotlib.pyplot as plt + ``` + +### ജാവാസ്ക്രിപ്റ്റ്/Vue.js +- Vue.js 2 സ്റ്റൈൽ ഗൈഡ്, മികച്ച പ്രാക്ടീസുകൾ പാലിക്കുക +- `quiz-app/package.json` ൽ ESLint കോൺഫിഗറേഷൻ +- Vue സിംഗിൾ-ഫയൽ കോംപോണന്റുകൾ (.vue ഫയലുകൾ) ഉപയോഗിക്കുക +- കോംപോണന്റ് അടിസ്ഥാന ആർക്കിടെക്ചർ നിലനിർത്തുക +- മാറ്റങ്ങൾ കമ്മിറ്റ് ചെയ്യുന്നതിന് മുമ്പ് `npm run lint` ഓടിക്കുക + +### മാർക്ക്ഡൗൺ ഡോക്യുമെന്റേഷൻ +- വ്യക്തമായ തലക്കെട്ടുകളുടെ ക്രമം (# ## ### മുതലായവ) ഉപയോഗിക്കുക +- ഭാഷാ നിർദ്ദേശകങ്ങളോടുകൂടിയ കോഡ് ബ്ലോക്കുകൾ ഉൾപ്പെടുത്തുക +- ചിത്രങ്ങൾക്ക് alt ടെക്സ്റ്റ് ചേർക്കുക +- ബന്ധപ്പെട്ട പാഠങ്ങൾക്കും വിഭവങ്ങൾക്കും ലിങ്കുകൾ നൽകുക +- വായനാസൗകര്യത്തിന് ലൈൻ നീളം യുക്തമായിരിക്കണം + +### ഫയൽ ഓർഗനൈസേഷൻ +- പാഠം ഉള്ളടക്കം നമ്പർ ചെയ്ത ഫോൾഡറുകളിൽ (01-defining-data-science മുതലായവ) +- പരിഹാരങ്ങൾ പ്രത്യേക `solution/` സബ്‌ഫോൾഡറുകളിൽ +- ഭാഷാന്തരങ്ങൾ ഇംഗ്ലീഷ് ഘടനയുടെ മിറർ `translations/` ഫോൾഡറിൽ +- ഡാറ്റാ ഫയലുകൾ `data/` അല്ലെങ്കിൽ പാഠം-നിർദ്ദിഷ്ട ഫോൾഡറുകളിൽ സൂക്ഷിക്കുക + +## ബിൽഡ് ആൻഡ് ഡിപ്ലോയ്മെന്റ് + +### ക്വിസ് അപ്ലിക്കേഷൻ ഡിപ്ലോയ്മെന്റ് +```bash +cd quiz-app + +# പ്രൊഡക്ഷൻ പതിപ്പ് നിർമ്മിക്കുക +npm run build + +# ഔട്ട്പുട്ട് dist/ ഫോൾഡറിൽ ആണ് +# dist/ ഫോൾഡർ സ്റ്റാറ്റിക് ഹോസ്റ്റിംഗിലേക്ക് ഡിപ്ലോയ് ചെയ്യുക (Azure Static Web Apps, Netlify, മുതലായവ) +``` + +### Azure Static Web Apps ഡിപ്ലോയ്മെന്റ് +quiz-app Azure Static Web Apps-ലേക്ക് ഡിപ്ലോയ് ചെയ്യാം: +1. Azure Static Web App റിസോഴ്‌സ് സൃഷ്ടിക്കുക +2. GitHub റിപോസിറ്ററിയുമായി കണക്ട് ചെയ്യുക +3. ബിൽഡ് സെറ്റിംഗുകൾ ക്രമീകരിക്കുക: + - ആപ്പ് ലൊക്കേഷൻ: `quiz-app` + - ഔട്ട്പുട്ട് ലൊക്കേഷൻ: `dist` +4. GitHub Actions workflow പുഷ് ചെയ്യുമ്പോൾ സ്വയം ഡിപ്ലോയ് ചെയ്യും + +### ഡോക്യുമെന്റേഷൻ സൈറ്റ് +```bash +# ഡോക്സിഫൈയിൽ നിന്ന് PDF നിർമ്മിക്കുക (ഐച്ഛികം) +npm run convert + +# ഡോക്സിഫൈ ഡോക്യുമെന്റേഷൻ മാർക്ക്ഡൗൺ ഫയലുകളിൽ നിന്ന് നേരിട്ട് സേവനം ചെയ്യുന്നു +# വിന്യസത്തിനായി ബിൽഡ് ഘട്ടം ആവശ്യമില്ല +# ഡോക്സിഫൈ ഉപയോഗിച്ച് സ്റ്റാറ്റിക് ഹോസ്റ്റിംഗിലേക്ക് റിപോസിറ്ററി വിന്യസിക്കുക +``` + +### GitHub Codespaces +- റിപോസിറ്ററിയിൽ ഡെവ് കണ്ടെയ്‌നർ കോൺഫിഗറേഷൻ ഉൾപ്പെടുന്നു +- Codespaces സ്വയം Python, Node.js പരിസ്ഥിതി സജ്ജമാക്കുന്നു +- GitHub UI വഴി Codespace-ൽ റിപോസിറ്ററി തുറക്കുക +- എല്ലാ ആശ്രിതങ്ങളും സ്വയം ഇൻസ്റ്റാൾ ചെയ്യും + +## പുൾ റിക്വസ്റ്റ് മാർഗ്ഗനിർദ്ദേശങ്ങൾ + +### സമർപ്പിക്കുന്നതിന് മുമ്പ് +```bash +# quiz-app ൽ Vue.js മാറ്റങ്ങൾക്കായി +cd quiz-app +npm run lint +npm run build + +# മാറ്റങ്ങൾ പ്രാദേശികമായി പരീക്ഷിക്കുക +npm run serve +``` + +### PR തലക്കെട്ട് ഫോർമാറ്റ് +- വ്യക്തവും വിവരണാത്മകവുമായ തലക്കെട്ടുകൾ ഉപയോഗിക്കുക +- ഫോർമാറ്റ്: `[Component] Breif description` +- ഉദാഹരണങ്ങൾ: + - `[Lesson 7] Python നോട്ട്‌ബുക്ക് ഇംപോർട്ട് പിശക് പരിഹരിക്കുക` + - `[Quiz App] ജർമ്മൻ ഭാഷാന്തരം ചേർക്കുക` + - `[Docs] README പുതിയ മുൻ‌അവശ്യങ്ങൾ ഉൾപ്പെടുത്തി അപ്ഡേറ്റ് ചെയ്യുക` + +### ആവശ്യമായ പരിശോധനകൾ +- എല്ലാ കോഡും പിശകുകൾ കൂടാതെ പ്രവർത്തിക്കുന്നുണ്ടെന്ന് ഉറപ്പാക്കുക +- നോട്ട്‌ബുക്കുകൾ പൂർണ്ണമായി എക്സിക്യൂട്ട് ചെയ്യുക +- Vue.js അപ്ലിക്കേഷനുകൾ വിജയകരമായി ബിൽഡ് ചെയ്യുക +- ഡോക്യുമെന്റേഷൻ ലിങ്കുകൾ പ്രവർത്തിക്കുന്നുണ്ടെന്ന് പരിശോധിക്കുക +- ക്വിസ് അപ്ലിക്കേഷൻ മാറ്റിയെങ്കിൽ ടെസ്റ്റ് ചെയ്യുക +- ഭാഷാന്തരങ്ങൾ ഘടനയിൽ സ്ഥിരത പാലിക്കുന്നുണ്ടെന്ന് ഉറപ്പാക്കുക + +### സംഭാവന മാർഗ്ഗനിർദ്ദേശങ്ങൾ +- നിലവിലുള്ള കോഡ് സ്റ്റൈൽ, പാറ്റേണുകൾ പാലിക്കുക +- സങ്കീർണ്ണമായ ലജിക് വിശദീകരിക്കുന്ന കമന്റുകൾ ചേർക്കുക +- ബന്ധപ്പെട്ട ഡോക്യുമെന്റേഷൻ അപ്ഡേറ്റ് ചെയ്യുക +- ആവശ്യമായ പക്ഷം വ്യത്യസ്ത പാഠ മോഡ്യൂളുകളിൽ മാറ്റങ്ങൾ പരീക്ഷിക്കുക +- CONTRIBUTING.md ഫയൽ പരിശോധിക്കുക + +## അധിക കുറിപ്പുകൾ + +### സാധാരണ ഉപയോഗിക്കുന്ന ലൈബ്രറികൾ +- **pandas**: ഡാറ്റ മാനിപ്പുലേഷൻ, വിശകലനം +- **numpy**: സംഖ്യാത്മക കംപ്യൂട്ടിംഗ് +- **matplotlib**: ഡാറ്റാ ദൃശ്യീകരണം, പ്ലോട്ടിംഗ് +- **seaborn**: സ്റ്റാറ്റിസ്റ്റിക്കൽ ഡാറ്റാ ദൃശ്യീകരണം (ചില പാഠങ്ങൾ) +- **scikit-learn**: മെഷീൻ ലേണിംഗ് (ഉന്നത പാഠങ്ങൾ) + +### ഡാറ്റാ ഫയലുകളുമായി പ്രവർത്തിക്കൽ +- ഡാറ്റാ ഫയലുകൾ `data/` ഫോൾഡറിലോ പാഠം-നിർദ്ദിഷ്ട ഡയറക്ടറികളിലോ +- മിക്ക നോട്ട്‌ബുക്കുകളും സാപേക്ഷ പാതകളിൽ ഡാറ്റാ ഫയലുകൾ പ്രതീക്ഷിക്കുന്നു +- CSV ഫയലുകൾ പ്രധാന ഡാറ്റാ ഫോർമാറ്റ് +- ചില പാഠങ്ങൾ JSON ഉപയോഗിക്കുന്നു നോൺ-റിലേഷണൽ ഡാറ്റാ ഉദാഹരണങ്ങൾക്ക് + +### ബഹുഭാഷാ പിന്തുണ +- 40+ ഭാഷാന്തരങ്ങൾ GitHub Actions വഴി സ്വയംഭാഷാന്തരം +- ഭാഷാന്തരം വർക്ക്‌ഫ്ലോ `.github/workflows/co-op-translator.yml` +- ഭാഷാന്തരങ്ങൾ `translations/` ഫോൾഡറിൽ ഭാഷാ കോഡുകളോടെ +- ക്വിസ് ഭാഷാന്തരങ്ങൾ `quiz-app/src/assets/translations/` ൽ + +### ഡെവലപ്പ്മെന്റ് പരിസ്ഥിതി ഓപ്ഷനുകൾ +1. **ലോകൽ ഡെവലപ്പ്മെന്റ്**: Python, Jupyter, Node.js ലോക്കലായി ഇൻസ്റ്റാൾ ചെയ്യുക +2. **GitHub Codespaces**: ക്ലൗഡ് അടിസ്ഥാന ഡെവലപ്പ്മെന്റ് പരിസ്ഥിതി +3. **VS Code ഡെവ് കണ്ടെയ്‌നറുകൾ**: ലോക്കൽ കണ്ടെയ്‌നർ അടിസ്ഥാന ഡെവലപ്പ്മെന്റ് +4. **Binder**: ക്ലൗഡിൽ നോട്ട്‌ബുക്കുകൾ ആരംഭിക്കുക (കൺഫിഗർ ചെയ്താൽ) + +### പാഠം ഉള്ളടക്കം മാർഗ്ഗനിർദ്ദേശങ്ങൾ +- ഓരോ പാഠവും സ്വതന്ത്രമാണ്, മുൻ ആശയങ്ങളിൽ അടിസ്ഥാനമാക്കിയുള്ളത് +- പാഠത്തിന് മുൻപ് ക്വിസുകൾ മുൻ അറിവ് പരിശോധിക്കുന്നു +- പാഠത്തിന് ശേഷം ക്വിസുകൾ പഠനം ശക്തിപ്പെടുത്തുന്നു +- അസൈൻമെന്റുകൾ ഹാൻഡ്‌സ്-ഓൺ അഭ്യാസം നൽകുന്നു +- സ്കെച്ച്നോട്ടുകൾ ദൃശ്യ സംഗ്രഹങ്ങൾ നൽകുന്നു + +### സാധാരണ പ്രശ്നങ്ങൾ പരിഹരിക്കൽ + +**Jupyter Kernel പ്രശ്നങ്ങൾ:** +```bash +# ശരിയായ കർണൽ ഇൻസ്റ്റാൾ ചെയ്തിട്ടുണ്ടെന്ന് ഉറപ്പാക്കുക +python -m ipykernel install --user --name=datascience +``` + +**npm ഇൻസ്റ്റാൾ പരാജയങ്ങൾ:** +```bash +# npm കാഷെ ക്ലിയർ ചെയ്ത് വീണ്ടും ശ്രമിക്കുക +npm cache clean --force +rm -rf node_modules package-lock.json +npm install +``` + +**നോട്ട്‌ബുക്കുകളിൽ ഇംപോർട്ട് പിശകുകൾ:** +- ആവശ്യമായ എല്ലാ ലൈബ്രറികളും ഇൻസ്റ്റാൾ ചെയ്തിട്ടുണ്ടെന്ന് ഉറപ്പാക്കുക +- Python പതിപ്പ് അനുയോജ്യമാണ് എന്ന് പരിശോധിക്കുക (Python 3.7+ ശുപാർശ) +- വെർച്വൽ എൻവയോൺമെന്റ് സജീവമാക്കിയിട്ടുണ്ടെന്ന് ഉറപ്പാക്കുക + +**Docsify ലോഡ് ചെയ്യാത്തത്:** +- റിപോസിറ്ററി റൂട്ടിൽ നിന്ന് സർവ് ചെയ്യുന്നതാണെന്ന് ഉറപ്പാക്കുക +- `index.html` നിലവിലുണ്ടെന്ന് പരിശോധിക്കുക +- ശരിയായ നെറ്റ്‌വർക്ക് ആക്സസ് (പോർട്ട് 3000) ഉറപ്പാക്കുക + +### പ്രകടന പരിഗണനകൾ +- വലിയ ഡാറ്റാസെറ്റുകൾ നോട്ട്‌ബുക്കുകളിൽ ലോഡ് ചെയ്യാൻ സമയം എടുക്കാം +- സങ്കീർണ്ണമായ പ്ലോട്ടുകൾക്ക് ദൃശ്യീകരണം മന്ദഗതിയിലാകാം +- Vue.js ഡെവ് സർവർ ഹോട്ട്-റീലോഡ് സജ്ജമാക്കുന്നു വേഗത്തിലുള്ള ഇറ്ററേഷനുകൾക്കായി +- പ്രൊഡക്ഷൻ ബിൽഡുകൾ ഒപ്റ്റിമൈസ്ഡ്, മിനിഫൈഡ് + +### സുരക്ഷാ കുറിപ്പുകൾ +- സენსിറ്റീവ് ഡാറ്റ അല്ലെങ്കിൽ ക്രെഡൻഷ്യലുകൾ കമ്മിറ്റ് ചെയ്യരുത് +- ക്ലൗഡ് പാഠങ്ങളിൽ API കീകൾക്ക് എൻവയോൺമെന്റ് വേരിയബിളുകൾ ഉപയോഗിക്കുക +- അസ്യൂർ-ബന്ധപ്പെട്ട പാഠങ്ങൾക്ക് അസ്യൂർ അക്കൗണ്ട് ക്രെഡൻഷ്യലുകൾ ആവശ്യമാകാം +- സുരക്ഷാ പാച്ചുകൾക്കായി ആശ്രിതങ്ങൾ അപ്ഡേറ്റ് ചെയ്യുക + +## ഭാഷാന്തരങ്ങളിൽ സംഭാവന + +- GitHub Actions വഴി സ്വയംഭാഷാന്തരം നിയന്ത്രിക്കുന്നു +- ഭാഷാന്തര കൃത്യതയ്ക്കായി മാനുവൽ തിരുത്തലുകൾ സ്വാഗതം +- നിലവിലുള്ള ഭാഷാന്തര ഫോൾഡർ ഘടന പാലിക്കുക +- ക്വിസ് ലിങ്കുകളിൽ ഭാഷാ പാരാമീറ്റർ ചേർക്കുക: `?loc=fr` +- ഭാഷാന്തര പാഠങ്ങൾ ശരിയായി പ്രദർശിപ്പിക്കുന്നുണ്ടെന്ന് ടെസ്റ്റ് ചെയ്യുക + +## ബന്ധപ്പെട്ട വിഭവങ്ങൾ +- പ്രധാന കോഴ്സ്: https://aka.ms/datascience-beginners +- Microsoft Learn: https://docs.microsoft.com/learn/ +- Student Hub: https://docs.microsoft.com/learn/student-hub +- ചർച്ച ഫോറം: https://github.com/microsoft/Data-Science-For-Beginners/discussions +- മറ്റ് Microsoft കോഴ്സുകൾ: ML for Beginners, AI for Beginners, Web Dev for Beginners + +## പ്രോജക്ട് പരിപാലനം +- ഉള്ളടക്കം പുതുക്കാൻ സ്ഥിരം അപ്ഡേറ്റുകൾ +- കമ്മ്യൂണിറ്റി സംഭാവനകൾ സ്വാഗതം +- പ്രശ്നങ്ങൾ GitHub-ൽ ട്രാക്ക് ചെയ്യുന്നു +- PR-കൾ കോഴ്സ് പരിപാലകർ പരിശോധിക്കുന്നു +- മാസാന്തം ഉള്ളടക്കം അവലോകനവും അപ്ഡേറ്റും + +--- + + +**അസൂയാ**: +ഈ രേഖ AI വിവർത്തന സേവനം [Co-op Translator](https://github.com/Azure/co-op-translator) ഉപയോഗിച്ച് വിവർത്തനം ചെയ്തതാണ്. നാം കൃത്യതയ്ക്ക് ശ്രമിച്ചെങ്കിലും, സ്വയം പ്രവർത്തിക്കുന്ന വിവർത്തനങ്ങളിൽ പിശകുകൾ അല്ലെങ്കിൽ തെറ്റുകൾ ഉണ്ടാകാമെന്ന് ദയവായി ശ്രദ്ധിക്കുക. അതിന്റെ മാതൃഭാഷയിലുള്ള യഥാർത്ഥ രേഖയാണ് പ്രാമാണികമായ ഉറവിടം എന്ന് പരിഗണിക്കേണ്ടതാണ്. നിർണായകമായ വിവരങ്ങൾക്ക്, പ്രൊഫഷണൽ മനുഷ്യ വിവർത്തനം ശുപാർശ ചെയ്യപ്പെടുന്നു. ഈ വിവർത്തനം ഉപയോഗിക്കുന്നതിൽ നിന്നുണ്ടാകുന്ന ഏതെങ്കിലും തെറ്റിദ്ധാരണകൾക്കോ തെറ്റായ വ്യാഖ്യാനങ്ങൾക്കോ ഞങ്ങൾ ഉത്തരവാദികളല്ല. + \ No newline at end of file diff --git a/translations/ml/CODE_OF_CONDUCT.md b/translations/ml/CODE_OF_CONDUCT.md new file mode 100644 index 00000000..1c7588f7 --- /dev/null +++ b/translations/ml/CODE_OF_CONDUCT.md @@ -0,0 +1,25 @@ + +# Microsoft ഓപ്പൺ സോഴ്‌സ് കോഡ് ഓഫ് കണ്ടക്റ്റ് + +ഈ പ്രോജക്ട് [Microsoft Open Source Code of Conduct](https://opensource.microsoft.com/codeofconduct/) സ്വീകരിച്ചിട്ടുണ്ട്. + +Resources: + +- [Microsoft Open Source Code of Conduct](https://opensource.microsoft.com/codeofconduct/) +- [Microsoft Code of Conduct FAQ](https://opensource.microsoft.com/codeofconduct/faq/) +- ചോദ്യങ്ങൾക്കോ ആശങ്കകൾക്കോ [opencode@microsoft.com](mailto:opencode@microsoft.com) എന്ന വിലാസത്തിൽ ബന്ധപ്പെടുക + +--- + + +**അസൂയാ**: +ഈ രേഖ AI വിവർത്തന സേവനം [Co-op Translator](https://github.com/Azure/co-op-translator) ഉപയോഗിച്ച് വിവർത്തനം ചെയ്തതാണ്. നാം കൃത്യതയ്ക്ക് ശ്രമിച്ചിട്ടുണ്ടെങ്കിലും, സ്വയം പ്രവർത്തിക്കുന്ന വിവർത്തനങ്ങളിൽ പിശകുകൾ അല്ലെങ്കിൽ തെറ്റുകൾ ഉണ്ടാകാമെന്ന് ദയവായി ശ്രദ്ധിക്കുക. അതിന്റെ മാതൃഭാഷയിലുള്ള യഥാർത്ഥ രേഖയാണ് പ്രാമാണികമായ ഉറവിടം എന്ന് പരിഗണിക്കേണ്ടതാണ്. നിർണായകമായ വിവരങ്ങൾക്ക്, പ്രൊഫഷണൽ മനുഷ്യ വിവർത്തനം ശുപാർശ ചെയ്യപ്പെടുന്നു. ഈ വിവർത്തനം ഉപയോഗിക്കുന്നതിൽ നിന്നുണ്ടാകുന്ന ഏതെങ്കിലും തെറ്റിദ്ധാരണകൾക്കോ തെറ്റായ വ്യാഖ്യാനങ്ങൾക്കോ ഞങ്ങൾ ഉത്തരവാദികളല്ല. + \ No newline at end of file diff --git a/translations/ml/CONTRIBUTING.md b/translations/ml/CONTRIBUTING.md new file mode 100644 index 00000000..b167427d --- /dev/null +++ b/translations/ml/CONTRIBUTING.md @@ -0,0 +1,363 @@ + +# Data Science for Beginners-ലേക്ക് സംഭാവന ചെയ്യുക + +Data Science for Beginners പാഠ്യപദ്ധതിയിലേക്ക് സംഭാവന ചെയ്യുന്നതിൽ താൽപര്യമുള്ളതിന് നന്ദി! സമൂഹത്തിൽ നിന്നുള്ള സംഭാവനകൾ ഞങ്ങൾ സ്വാഗതം ചെയ്യുന്നു. + +## ഉള്ളടക്ക പട്ടിക + +- [നടപടികളുടെ കോഡ്](../..) +- [ഞാൻ എങ്ങനെ സംഭാവന ചെയ്യാം?](../..) +- [ആരംഭിക്കുന്നത്](../..) +- [സംഭാവന മാർഗ്ഗനിർദ്ദേശങ്ങൾ](../..) +- [പുൾ അഭ്യർത്ഥന പ്രക്രിയ](../..) +- [ശൈലി മാർഗ്ഗനിർദ്ദേശങ്ങൾ](../..) +- [സംഭാവനാ ലൈസൻസ് കരാർ](../..) + +## നടപ്പടികളുടെ കോഡ് + +ഈ പ്രോജക്റ്റ് [Microsoft Open Source Code of Conduct](https://opensource.microsoft.com/codeofconduct/) സ്വീകരിച്ചിട്ടുണ്ട്. കൂടുതൽ വിവരങ്ങൾക്ക് [Code of Conduct FAQ](https://opensource.microsoft.com/codeofconduct/faq/) കാണുക അല്ലെങ്കിൽ [opencode@microsoft.com](mailto:opencode@microsoft.com) എന്ന വിലാസത്തിൽ അധിക ചോദ്യങ്ങൾക്കോ അഭിപ്രായങ്ങൾക്കോ ബന്ധപ്പെടുക. + +## ഞാൻ എങ്ങനെ സംഭാവന ചെയ്യാം? + +### പിശകുകൾ റിപ്പോർട്ട് ചെയ്യൽ + +പിശകുകൾ റിപ്പോർട്ട് ചെയ്യുന്നതിന് മുമ്പ്, പുനരാവൃതികൾ ഒഴിവാക്കാൻ നിലവിലുള്ള പ്രശ്നങ്ങൾ പരിശോധിക്കുക. പിശക് റിപ്പോർട്ട് ചെയ്യുമ്പോൾ, 가능한ത്ര വിശദാംശങ്ങൾ ഉൾപ്പെടുത്തുക: + +- **വ്യക്തമായ, വിവരണാത്മകമായ തലക്കെട്ട് ഉപയോഗിക്കുക** +- **പ്രശ്നം പുനരാവർത്തിപ്പെടുത്താനുള്ള കൃത്യമായ ഘട്ടങ്ങൾ വിവരിക്കുക** +- **നിർദ്ദിഷ്ട ഉദാഹരണങ്ങൾ നൽകുക** (കോഡ് സ്നിപ്പറ്റുകൾ, സ്ക്രീൻഷോട്ടുകൾ) +- **നിങ്ങൾ കണ്ട പെരുമാറ്റവും പ്രതീക്ഷിച്ചതും വിവരിക്കുക** +- **നിങ്ങളുടെ പരിസ്ഥിതി വിശദാംശങ്ങൾ ഉൾപ്പെടുത്തുക** (ഓപ്പറേറ്റിംഗ് സിസ്റ്റം, Python പതിപ്പ്, ബ്രൗസർ) + +### മെച്ചപ്പെടുത്തലുകൾ നിർദ്ദേശിക്കൽ + +മെച്ചപ്പെടുത്തലുകൾ നിർദ്ദേശിക്കുന്നത് സ്വാഗതം ചെയ്യുന്നു! നിർദ്ദേശിക്കുമ്പോൾ: + +- **വ്യക്തമായ, വിവരണാത്മകമായ തലക്കെട്ട് ഉപയോഗിക്കുക** +- **നിർദ്ദേശിച്ച മെച്ചപ്പെടുത്തലിന്റെ വിശദമായ വിവരണം നൽകുക** +- **ഈ മെച്ചപ്പെടുത്തൽ എങ്ങനെ പ്രയോജനകരമാകും എന്ന് വിശദീകരിക്കുക** +- **അന്യ പ്രോജക്റ്റുകളിൽ സമാനമായ ഫീച്ചറുകൾ ഉണ്ടെങ്കിൽ അവ പട്ടികപ്പെടുത്തുക** + +### ഡോക്യുമെന്റേഷൻ സംഭാവന + +ഡോക്യുമെന്റേഷൻ മെച്ചപ്പെടുത്തലുകൾ എപ്പോഴും അഭിനന്ദനാർഹമാണ്: + +- **വ്യാകരണ പിശകുകളും ടൈപ്പോകളും ശരിയാക്കുക** +- **വിവരണങ്ങളുടെ വ്യക്തത മെച്ചപ്പെടുത്തുക** +- **കാണാതിരുന്ന ഡോക്യുമെന്റേഷൻ ചേർക്കുക** +- **പഴയ വിവരങ്ങൾ പുതുക്കുക** +- **ഉദാഹരണങ്ങൾ അല്ലെങ്കിൽ ഉപയോഗ കേസുകൾ ചേർക്കുക** + +### കോഡ് സംഭാവന + +നാം കോഡ് സംഭാവനകൾ സ്വാഗതം ചെയ്യുന്നു, അതിൽ ഉൾപ്പെടുന്നു: + +- **പുതിയ പാഠങ്ങൾ അല്ലെങ്കിൽ അഭ്യാസങ്ങൾ** +- **പിശക് പരിഹാരങ്ങൾ** +- **നിലവിലുള്ള നോട്ട്‌ബുക്കുകളിൽ മെച്ചപ്പെടുത്തലുകൾ** +- **പുതിയ ഡാറ്റാസെറ്റുകൾ അല്ലെങ്കിൽ ഉദാഹരണങ്ങൾ** +- **ക്വിസ് ആപ്പ് മെച്ചപ്പെടുത്തലുകൾ** + +## ആരംഭിക്കുന്നത് + +### മുൻകൂട്ടി ആവശ്യങ്ങൾ + +സംഭാവന ചെയ്യുന്നതിന് മുമ്പ്, നിങ്ങൾക്കുണ്ടെന്ന് ഉറപ്പാക്കുക: + +1. GitHub അക്കൗണ്ട് +2. നിങ്ങളുടെ സിസ്റ്റത്തിൽ Git ഇൻസ്റ്റാൾ ചെയ്തിട്ടുള്ളത് +3. Python 3.7+യും Jupyter-ഉം ഇൻസ്റ്റാൾ ചെയ്തിട്ടുള്ളത് +4. Node.js, npm (ക്വിസ് ആപ്പ് സംഭാവനകൾക്കായി) +5. പാഠ്യപദ്ധതി ഘടനയെ പരിചയമുള്ളത് + +വിശദമായ സജ്ജീകരണ നിർദ്ദേശങ്ങൾക്കായി [INSTALLATION.md](INSTALLATION.md) കാണുക. + +### Fork ചെയ്യുക, Clone ചെയ്യുക + +1. GitHub-ൽ **റിപ്പോസിറ്ററി Fork ചെയ്യുക** +2. **നിങ്ങളുടെ Fork ലോക്കലായി Clone ചെയ്യുക**: + ```bash + git clone https://github.com/YOUR-USERNAME/Data-Science-For-Beginners.git + cd Data-Science-For-Beginners + ``` +3. **Upstream remote ചേർക്കുക**: + ```bash + git remote add upstream https://github.com/microsoft/Data-Science-For-Beginners.git + ``` + +### ബ്രാഞ്ച് സൃഷ്ടിക്കുക + +നിങ്ങളുടെ പ്രവർത്തനത്തിനായി പുതിയ ബ്രാഞ്ച് സൃഷ്ടിക്കുക: + +```bash +git checkout -b feature/your-feature-name +# അല്ലെങ്കിൽ +git checkout -b fix/your-bug-fix +``` + +ബ്രാഞ്ച് നാമകരണം: +- `feature/` - പുതിയ ഫീച്ചറുകൾ അല്ലെങ്കിൽ പാഠങ്ങൾ +- `fix/` - പിശക് പരിഹാരങ്ങൾ +- `docs/` - ഡോക്യുമെന്റേഷൻ മാറ്റങ്ങൾ +- `refactor/` - കോഡ് പുനഃസംഘടനം + +## സംഭാവന മാർഗ്ഗനിർദ്ദേശങ്ങൾ + +### പാഠം ഉള്ളടക്കത്തിന് + +പാഠങ്ങൾ സംഭാവന ചെയ്യുമ്പോൾ അല്ലെങ്കിൽ നിലവിലുള്ളവ മാറ്റുമ്പോൾ: + +1. **നിലവിലുള്ള ഘടന പാലിക്കുക**: + - README.md-ൽ പാഠം ഉള്ളടക്കം + - Jupyter നോട്ട്‌ബുക്കിൽ അഭ്യാസങ്ങൾ + - അസൈൻമെന്റ് (ഉണ്ടെങ്കിൽ) + - മുൻകൂട്ടി, ശേഷമുള്ള ക്വിസുകൾക്ക് ലിങ്ക് + +2. **ഈ ഘടകങ്ങൾ ഉൾപ്പെടുത്തുക**: + - വ്യക്തമായ പഠന ലക്ഷ്യങ്ങൾ + - ഘട്ടം ഘട്ടമായ വിശദീകരണങ്ങൾ + - കോഡ് ഉദാഹരണങ്ങൾ കമന്റുകളോടുകൂടി + - അഭ്യാസങ്ങൾ പ്രാക്ടീസിനായി + - അധിക സ്രോതസുകളിലേക്ക് ലിങ്കുകൾ + +3. **പ്രവേശനയോഗ്യത ഉറപ്പാക്കുക**: + - വ്യക്തവും ലളിതവുമായ ഭാഷ ഉപയോഗിക്കുക + - ചിത്രങ്ങൾക്ക് alt ടെക്സ്റ്റ് നൽകുക + - കോഡ് കമന്റുകൾ ഉൾപ്പെടുത്തുക + - വ്യത്യസ്ത പഠന ശൈലികൾ പരിഗണിക്കുക + +### Jupyter നോട്ട്‌ബുക്കുകൾക്ക് + +1. **കമ്മിറ്റ് ചെയ്യുന്നതിന് മുമ്പ് എല്ലാ ഔട്ട്പുട്ടുകളും ക്ലിയർ ചെയ്യുക**: + ```bash + jupyter nbconvert --clear-output --inplace notebook.ipynb + ``` + +2. **വിവരണങ്ങളോടെയുള്ള മാർക്ക്ഡൗൺ സെല്ലുകൾ ഉൾപ്പെടുത്തുക** + +3. **സമാനമായ ഫോർമാറ്റിംഗ് ഉപയോഗിക്കുക**: + ```python + # മുകളിൽ ലൈബ്രറികൾ ഇറക്കുമതി ചെയ്യുക + import pandas as pd + import numpy as np + import matplotlib.pyplot as plt + + # അർത്ഥമുള്ള വേരിയബിൾ നാമങ്ങൾ ഉപയോഗിക്കുക + # സങ്കീർണ്ണമായ പ്രവർത്തനങ്ങൾക്ക് കമന്റുകൾ ചേർക്കുക + # PEP 8 സ്റ്റൈൽ മാർഗ്ഗനിർദ്ദേശങ്ങൾ പാലിക്കുക + ``` + +4. **നിങ്ങളുടെ നോട്ട്‌ബുക്ക് സമ്പൂർണമായി ടെസ്റ്റ് ചെയ്യുക** + +### Python കോഡിനായി + +[PEP 8](https://www.python.org/dev/peps/pep-0008/) ശൈലി മാർഗ്ഗനിർദ്ദേശങ്ങൾ പാലിക്കുക: + +```python +# നല്ല പ്രാക്ടീസുകൾ +import pandas as pd + +def calculate_mean(data): + """Calculate the mean of a dataset. + + Args: + data (list): List of numerical values + + Returns: + float: Mean of the dataset + """ + return sum(data) / len(data) +``` + +### ക്വിസ് ആപ്പ് സംഭാവനകൾക്കായി + +ക്വിസ് ആപ്പ് മാറ്റുമ്പോൾ: + +1. **ലോക്കലായി ടെസ്റ്റ് ചെയ്യുക**: + ```bash + cd quiz-app + npm install + npm run serve + ``` + +2. **Linter ഓടിക്കുക**: + ```bash + npm run lint + ``` + +3. **സഫലമായി ബിൽഡ് ചെയ്യുക**: + ```bash + npm run build + ``` + +4. **Vue.js ശൈലി ഗൈഡ്**യും നിലവിലുള്ള മാതൃകകളും പാലിക്കുക + +### വിവർത്തനങ്ങൾക്കായി + +വിവർത്തനങ്ങൾ ചേർക്കുമ്പോൾ അല്ലെങ്കിൽ പുതുക്കുമ്പോൾ: + +1. `translations/` ഫോൾഡറിലെ ഘടന പാലിക്കുക +2. ഭാഷാ കോഡ് ഫോൾഡർ നാമമായി ഉപയോഗിക്കുക (ഉദാ: ഫ്രഞ്ച്‌ക്കായി `fr`) +3. ഇംഗ്ലീഷ് പതിപ്പിന്റെ ഫയൽ ഘടന നിലനിർത്തുക +4. ക്വിസ് ലിങ്കുകൾ ഭാഷാ പാരാമീറ്റർ ഉൾക്കൊള്ളുന്നതായി പുതുക്കുക: `?loc=fr` +5. എല്ലാ ലിങ്കുകളും ഫോർമാറ്റിംഗും ടെസ്റ്റ് ചെയ്യുക + +## പുൾ അഭ്യർത്ഥന പ്രക്രിയ + +### സമർപ്പിക്കുന്നതിന് മുമ്പ് + +1. **നിങ്ങളുടെ ബ്രാഞ്ച് ഏറ്റവും പുതിയ മാറ്റങ്ങളോടെ അപ്ഡേറ്റ് ചെയ്യുക**: + ```bash + git fetch upstream + git rebase upstream/main + ``` + +2. **നിങ്ങളുടെ മാറ്റങ്ങൾ ടെസ്റ്റ് ചെയ്യുക**: + - മാറ്റിയ എല്ലാ നോട്ട്‌ബുക്കുകളും ഓടിക്കുക + - ക്വിസ് ആപ്പ് മാറ്റിയെങ്കിൽ ടെസ്റ്റ് ചെയ്യുക + - എല്ലാ ലിങ്കുകളും പ്രവർത്തിക്കുന്നുവെന്ന് ഉറപ്പാക്കുക + - വാക്ക് പിശകുകളും വ്യാകരണ പിശകുകളും പരിശോധിക്കുക + +3. **നിങ്ങളുടെ മാറ്റങ്ങൾ കമ്മിറ്റ് ചെയ്യുക**: + ```bash + git add . + git commit -m "Brief description of changes" + ``` + + വ്യക്തമായ കമ്മിറ്റ് സന്ദേശങ്ങൾ എഴുതുക: + - ഇപ്പോഴത്തെ കാലം ഉപയോഗിക്കുക ("Add feature" "Added feature" അല്ല) + - നിർദ്ദേശാത്മക വാചകം ഉപയോഗിക്കുക ("Move cursor to..." "Moves cursor to..." അല്ല) + - ആദ്യ വരി 72 അക്ഷരങ്ങളിൽ പരിമിതപ്പെടുത്തുക + - ബന്ധപ്പെട്ട പ്രശ്നങ്ങളും പുൾ അഭ്യർത്ഥനകളും സൂചിപ്പിക്കുക + +4. **നിങ്ങളുടെ Fork-ലേക്ക് പുഷ് ചെയ്യുക**: + ```bash + git push origin feature/your-feature-name + ``` + +### പുൾ അഭ്യർത്ഥന സൃഷ്ടിക്കൽ + +1. [റിപ്പോസിറ്ററിയിലേക്ക്](https://github.com/microsoft/Data-Science-For-Beginners) പോകുക +2. "Pull requests" → "New pull request" ക്ലിക്ക് ചെയ്യുക +3. "compare across forks" ക്ലിക്ക് ചെയ്യുക +4. നിങ്ങളുടെ Forkയും ബ്രാഞ്ചും തിരഞ്ഞെടുക്കുക +5. "Create pull request" ക്ലിക്ക് ചെയ്യുക + +### PR തലക്കെട്ട് ഫോർമാറ്റ് + +വ്യക്തവും വിവരണാത്മകവുമായ തലക്കെട്ടുകൾ ഈ ഫോർമാറ്റ് പാലിച്ച് ഉപയോഗിക്കുക: + +``` +[Component] Brief description +``` + +ഉദാഹരണങ്ങൾ: +- `[Lesson 7] Python നോട്ട്‌ബുക്ക് ഇമ്പോർട്ട് പിശക് പരിഹരിക്കുക` +- `[Quiz App] ജർമ്മൻ വിവർത്തനം ചേർക്കുക` +- `[Docs] README പുതിയ മുൻകൂട്ടി ആവശ്യങ്ങളോടെ അപ്ഡേറ്റ് ചെയ്യുക` +- `[Fix] Visualization പാഠത്തിലെ ഡാറ്റ പാത ശരിയാക്കുക` + +### PR വിവരണം + +നിങ്ങളുടെ PR വിവരണത്തിൽ ഉൾപ്പെടുത്തുക: + +- **എന്ത്**: നിങ്ങൾ എന്ത് മാറ്റങ്ങൾ ചെയ്തു? +- **എന്തുകൊണ്ട്**: ഈ മാറ്റങ്ങൾ എന്തുകൊണ്ട് ആവശ്യമാണ്? +- **എങ്ങനെ**: മാറ്റങ്ങൾ എങ്ങനെ നടപ്പിലാക്കി? +- **ടെസ്റ്റിംഗ്**: മാറ്റങ്ങൾ എങ്ങനെ ടെസ്റ്റ് ചെയ്തു? +- **സ്ക്രീൻഷോട്ടുകൾ**: ദൃശ്യ മാറ്റങ്ങൾക്ക് സ്ക്രീൻഷോട്ടുകൾ ചേർക്കുക +- **ബന്ധപ്പെട്ട പ്രശ്നങ്ങൾ**: ബന്ധപ്പെട്ട പ്രശ്നങ്ങൾക്ക് ലിങ്ക് (ഉദാ: "Fixes #123") + +### അവലോകന പ്രക്രിയ + +1. **ഓട്ടോമേറ്റഡ് ചെക്കുകൾ** നിങ്ങളുടെ PR-ൽ ഓടും +2. **മെയിന്റെയ്‌നർമാർ** നിങ്ങളുടെ സംഭാവന പരിശോധിക്കും +3. **പ്രതികരണങ്ങൾ പരിഹരിക്കുക** അധിക കമ്മിറ്റുകൾ ചെയ്ത് +4. അംഗീകൃതമായാൽ, **മെയിന്റെയ്‌നർ നിങ്ങളുടെ PR മർജ് ചെയ്യും** + +### നിങ്ങളുടെ PR മർജ് ചെയ്തശേഷം + +1. നിങ്ങളുടെ ബ്രാഞ്ച് ഡിലീറ്റ് ചെയ്യുക: + ```bash + git branch -d feature/your-feature-name + git push origin --delete feature/your-feature-name + ``` + +2. നിങ്ങളുടെ Fork അപ്ഡേറ്റ് ചെയ്യുക: + ```bash + git checkout main + git pull upstream main + git push origin main + ``` + +## ശൈലി മാർഗ്ഗനിർദ്ദേശങ്ങൾ + +### മാർക്ക്ഡൗൺ + +- സ്ഥിരമായ തലക്കെട്ട് തലങ്ങൾ ഉപയോഗിക്കുക +- വിഭാഗങ്ങൾക്കിടയിൽ ശൂന്യ വരികൾ ഉൾപ്പെടുത്തുക +- ഭാഷാ നിർദ്ദേശങ്ങളോടെയുള്ള കോഡ് ബ്ലോക്കുകൾ ഉപയോഗിക്കുക: + ````markdown + ```python + import pandas as pd + ``` + ```` +- ചിത്രങ്ങൾക്ക് alt ടെക്സ്റ്റ് ചേർക്കുക: `![Alt text](../../translated_images/image.4ee84a82b5e4c9e6651b13fd27dcf615e427ec584929f2cef7167aa99151a77a.ml.png)` +- വരി നീളം യുക്തമായിരിക്കണം (ഏകദേശം 80-100 അക്ഷരങ്ങൾ) + +### Python + +- PEP 8 ശൈലി ഗൈഡ് പാലിക്കുക +- അർത്ഥമുള്ള വേരിയബിൾ നാമങ്ങൾ ഉപയോഗിക്കുക +- ഫംഗ്ഷനുകൾക്ക് ഡോക്സ്ട്രിംഗുകൾ ചേർക്കുക +- ആവശ്യമായിടത്ത് ടൈപ്പ് ഹിന്റുകൾ ഉൾപ്പെടുത്തുക: + ```python + def process_data(df: pd.DataFrame) -> pd.DataFrame: + """Process the input dataframe.""" + return df + ``` + +### JavaScript/Vue.js + +- Vue.js 2 ശൈലി ഗൈഡ് പാലിക്കുക +- നൽകിയ ESLint കോൺഫിഗറേഷൻ ഉപയോഗിക്കുക +- മോടുലാർ, പുനരുപയോഗയോഗ്യമായ ഘടകങ്ങൾ എഴുതുക +- സങ്കീർണ്ണമായ ലജിക് കമന്റുകളോടെ ചേർക്കുക + +### ഫയൽ ഓർഗനൈസേഷൻ + +- ബന്ധപ്പെട്ട ഫയലുകൾ ഒന്നിച്ച് സൂക്ഷിക്കുക +- വിവരണാത്മകമായ ഫയൽ നാമങ്ങൾ ഉപയോഗിക്കുക +- നിലവിലുള്ള ഡയറക്ടറി ഘടന പാലിക്കുക +- അനാവശ്യ ഫയലുകൾ (.DS_Store, .pyc, node_modules, തുടങ്ങിയവ) കമ്മിറ്റ് ചെയ്യരുത് + +## സംഭാവനാ ലൈസൻസ് കരാർ + +ഈ പ്രോജക്റ്റ് സംഭാവനകളും നിർദ്ദേശങ്ങളും സ്വാഗതം ചെയ്യുന്നു. ഭൂരിഭാഗം സംഭാവനകൾക്ക് Contributor License Agreement (CLA) യിൽ നിങ്ങൾക്ക് അവകാശമുണ്ടെന്ന്, ഞങ്ങൾക്ക് നിങ്ങളുടെ സംഭാവന ഉപയോഗിക്കാൻ അവകാശം നൽകുന്നതായി പ്രഖ്യാപിക്കുന്നതിന് സമ്മതിക്കേണ്ടതാണ്. വിശദാംശങ്ങൾക്ക് https://cla.microsoft.com കാണുക. + +നിങ്ങൾ പുൾ അഭ്യർത്ഥന സമർപ്പിക്കുമ്പോൾ, CLA-ബോട്ട് സ്വയം നിങ്ങൾക്ക് CLA നൽകേണ്ടതുണ്ടോ എന്ന് നിർണ്ണയിച്ച് PR-നെ അനുയോജ്യമായി അലങ്കരിക്കും (ഉദാ: ലേബൽ, കമന്റ്). ബോട്ടിന്റെ നിർദ്ദേശങ്ങൾ പാലിക്കുക. ഞങ്ങളുടെ CLA ഉപയോഗിക്കുന്ന എല്ലാ റിപ്പോസിറ്ററികളിലും ഇത് ഒരിക്കൽ മാത്രം ചെയ്യേണ്ടതുണ്ട്. + +## ചോദ്യങ്ങൾ? + +- ഞങ്ങളുടെ [Discord ചാനൽ #data-science-for-beginners](https://aka.ms/ds4beginners/discord) പരിശോധിക്കുക +- ഞങ്ങളുടെ [Discord സമൂഹത്തിൽ](https://aka.ms/ds4beginners/discord) ചേരുക +- നിലവിലുള്ള [പ്രശ്നങ്ങൾ](https://github.com/microsoft/Data-Science-For-Beginners/issues)യും [പുൾ അഭ്യർത്ഥനകളും](https://github.com/microsoft/Data-Science-For-Beginners/pulls) അവലോകനം ചെയ്യുക + +## നന്ദി! + +നിങ്ങളുടെ സംഭാവനകൾ ഈ പാഠ്യപദ്ധതിയെ എല്ലാവർക്കും മെച്ചപ്പെടുത്തുന്നു. സംഭാവന ചെയ്യാൻ സമയം കണ്ടെത്തിയതിന് നന്ദി! + +--- + + +**അസൂയാപത്രം**: +ഈ രേഖ AI വിവർത്തന സേവനം [Co-op Translator](https://github.com/Azure/co-op-translator) ഉപയോഗിച്ച് വിവർത്തനം ചെയ്തതാണ്. നാം കൃത്യതയ്ക്ക് ശ്രമിച്ചിട്ടുണ്ടെങ്കിലും, സ്വയം പ്രവർത്തിക്കുന്ന വിവർത്തനങ്ങളിൽ പിശകുകൾ അല്ലെങ്കിൽ തെറ്റുകൾ ഉണ്ടാകാമെന്ന് ദയവായി ശ്രദ്ധിക്കുക. അതിന്റെ മാതൃഭാഷയിലുള്ള യഥാർത്ഥ രേഖയാണ് പ്രാമാണികമായ ഉറവിടം എന്ന് പരിഗണിക്കേണ്ടതാണ്. നിർണായകമായ വിവരങ്ങൾക്ക്, പ്രൊഫഷണൽ മനുഷ്യ വിവർത്തനം ശുപാർശ ചെയ്യപ്പെടുന്നു. ഈ വിവർത്തനം ഉപയോഗിക്കുന്നതിൽ നിന്നുണ്ടാകുന്ന ഏതെങ്കിലും തെറ്റിദ്ധാരണകൾക്കോ തെറ്റായ വ്യാഖ്യാനങ്ങൾക്കോ ഞങ്ങൾ ഉത്തരവാദികളല്ല. + \ No newline at end of file diff --git a/translations/ml/INSTALLATION.md b/translations/ml/INSTALLATION.md new file mode 100644 index 00000000..21d3c5d6 --- /dev/null +++ b/translations/ml/INSTALLATION.md @@ -0,0 +1,263 @@ + +# ഇൻസ്റ്റലേഷൻ ഗൈഡ് + +ഈ ഗൈഡ് ഡാറ്റാ സയൻസ് ഫോർ ബിഗിനേഴ്സ് പാഠ്യപദ്ധതിയുമായി പ്രവർത്തിക്കാൻ നിങ്ങളുടെ പരിസ്ഥിതി സജ്ജമാക്കുന്നതിൽ സഹായിക്കും. + +## ഉള്ളടക്ക പട്ടിക + +- [ആവശ്യമായ മുൻകൂട്ടി അറിവുകൾ](../..) +- [വേഗത്തിലുള്ള ആരംഭ ഓപ്ഷനുകൾ](../..) +- [ലോകൽ ഇൻസ്റ്റലേഷൻ](../..) +- [നിങ്ങളുടെ ഇൻസ്റ്റലേഷൻ പരിശോധിക്കുക](../..) + +## ആവശ്യമായ മുൻകൂട്ടി അറിവുകൾ + +തുടങ്ങുന്നതിന് മുമ്പ്, നിങ്ങൾക്കുണ്ടാകേണ്ടത്: + +- കമാൻഡ് ലൈൻ/ടെർമിനലുമായി അടിസ്ഥാന പരിചയം +- ഒരു GitHub അക്കൗണ്ട് (ഉചിതം) +- പ്രാഥമിക സജ്ജീകരണത്തിനായി സ്ഥിരമായ ഇന്റർനെറ്റ് കണക്ഷൻ + +## വേഗത്തിലുള്ള ആരംഭ ഓപ്ഷനുകൾ + +### ഓപ്ഷൻ 1: GitHub Codespaces (ബിഗിനേഴ്സിന് ശുപാർശ ചെയ്യുന്നു) + +ആരാധ്യമായ രീതിയിൽ തുടങ്ങാനുള്ള ഏറ്റവും എളുപ്പവഴി GitHub Codespaces ആണ്, ഇത് നിങ്ങളുടെ ബ്രൗസറിൽ പൂർണ്ണമായ ഡെവലപ്പ്മെന്റ് പരിസ്ഥിതി നൽകുന്നു. + +1. [റിപ്പോസിറ്ററി](https://github.com/microsoft/Data-Science-For-Beginners) സന്ദർശിക്കുക +2. **Code** ഡ്രോപ്പ്ഡൗൺ മെനുവിൽ ക്ലിക്ക് ചെയ്യുക +3. **Codespaces** ടാബ് തിരഞ്ഞെടുക്കുക +4. **Create codespace on main** ക്ലിക്ക് ചെയ്യുക +5. പരിസ്ഥിതി ആരംഭിക്കാൻ കാത്തിരിക്കുക (2-3 മിനിറ്റ്) + +നിങ്ങളുടെ പരിസ്ഥിതി ഇപ്പോൾ എല്ലാ ആശ്രിതങ്ങളും മുൻകൂട്ടി ഇൻസ്റ്റാൾ ചെയ്ത നിലയിലാണ്! + +### ഓപ്ഷൻ 2: ലോകൽ ഡെവലപ്പ്മെന്റ് + +നിങ്ങളുടെ സ്വന്തം കമ്പ്യൂട്ടറിൽ പ്രവർത്തിക്കാൻ, താഴെ നൽകിയ വിശദമായ നിർദ്ദേശങ്ങൾ പിന്തുടരുക. + +## ലോകൽ ഇൻസ്റ്റലേഷൻ + +### ഘട്ടം 1: Git ഇൻസ്റ്റാൾ ചെയ്യുക + +Git റിപ്പോസിറ്ററി ക്ലോൺ ചെയ്യാനും നിങ്ങളുടെ മാറ്റങ്ങൾ ട്രാക്ക് ചെയ്യാനും ആവശ്യമാണ്. + +**Windows:** +- [git-scm.com](https://git-scm.com/download/win) ൽ നിന്ന് ഡൗൺലോഡ് ചെയ്യുക +- ഡിഫോൾട്ട് സെറ്റിംഗുകളോടെ ഇൻസ്റ്റാളർ റൺ ചെയ്യുക + +**macOS:** +- Homebrew വഴി ഇൻസ്റ്റാൾ ചെയ്യുക: `brew install git` +- അല്ലെങ്കിൽ [git-scm.com](https://git-scm.com/download/mac) ൽ നിന്ന് ഡൗൺലോഡ് ചെയ്യുക + +**Linux:** +```bash +# ഡെബിയൻ/ഉബുണ്ടു +sudo apt-get update +sudo apt-get install git + +# ഫെഡോറ +sudo dnf install git + +# ആർച്ച് +sudo pacman -S git +``` + +### ഘട്ടം 2: റിപ്പോസിറ്ററി ക്ലോൺ ചെയ്യുക + +```bash +# റിപ്പോസിറ്ററി ക്ലോൺ ചെയ്യുക +git clone https://github.com/microsoft/Data-Science-For-Beginners.git + +# ഡയറക്ടറിയിലേക്ക് നാവിഗേറ്റ് ചെയ്യുക +cd Data-Science-For-Beginners +``` + +### ഘട്ടം 3: Python, Jupyter ഇൻസ്റ്റാൾ ചെയ്യുക + +ഡാറ്റാ സയൻസ് പാഠങ്ങൾക്കായി Python 3.7 അല്ലെങ്കിൽ അതിനുമുകളിൽ വേണം. + +**Windows:** +1. [python.org](https://www.python.org/downloads/) ൽ നിന്ന് Python ഡൗൺലോഡ് ചെയ്യുക +2. ഇൻസ്റ്റലേഷനിൽ "Add Python to PATH" തിരഞ്ഞെടുക്കുക +3. ഇൻസ്റ്റലേഷൻ സ്ഥിരീകരിക്കുക: +```bash +python --version +``` + +**macOS:** +```bash +# ഹോംബ്രൂ ഉപയോഗിക്കുന്നു +brew install python3 + +# ഇൻസ്റ്റലേഷൻ സ്ഥിരീകരിക്കുക +python3 --version +``` + +**Linux:** +```bash +# മിക്ക ലിനക്സ് വിതരണങ്ങളിലും പൈതൺ മുൻകൂട്ടി ഇൻസ്റ്റാൾ ചെയ്തിരിക്കുന്നു +python3 --version + +# ഇൻസ്റ്റാൾ ചെയ്തിട്ടില്ലെങ്കിൽ: +# ഡെബിയൻ/ഉബുണ്ടു +sudo apt-get install python3 python3-pip + +# ഫെഡോറാ +sudo dnf install python3 python3-pip +``` + +### ഘട്ടം 4: Python പരിസ്ഥിതി സജ്ജമാക്കുക + +ആശ്രിതങ്ങൾ വേർതിരിച്ച് സൂക്ഷിക്കാൻ വിർച്വൽ എൻവയോൺമെന്റ് ഉപയോഗിക്കുന്നത് ശുപാർശ ചെയ്യുന്നു. + +```bash +# ഒരു വെർച്വൽ എൻവയോൺമെന്റ് സൃഷ്ടിക്കുക +python -m venv venv + +# വെർച്വൽ എൻവയോൺമെന്റ് സജീവമാക്കുക +# വിൻഡോസ്-ൽ: +venv\Scripts\activate + +# മാക്‌ഒഎസ്/ലിനക്സ്-ൽ: +source venv/bin/activate +``` + +### ഘട്ടം 5: Python പാക്കേജുകൾ ഇൻസ്റ്റാൾ ചെയ്യുക + +ആവശ്യമായ ഡാറ്റാ സയൻസ് ലൈബ്രറികൾ ഇൻസ്റ്റാൾ ചെയ്യുക: + +```bash +pip install jupyter pandas numpy matplotlib seaborn scikit-learn +``` + +### ഘട്ടം 6: Node.js, npm ഇൻസ്റ്റാൾ ചെയ്യുക (ക്വിസ് ആപ്പിനായി) + +ക്വിസ് ആപ്പിന് Node.js, npm ആവശ്യമാണ്. + +**Windows/macOS:** +- [nodejs.org](https://nodejs.org/) (LTS പതിപ്പ് ശുപാർശ ചെയ്യുന്നു) ൽ നിന്ന് ഡൗൺലോഡ് ചെയ്യുക +- ഇൻസ്റ്റാളർ റൺ ചെയ്യുക + +**Linux:** +```bash +# ഡെബിയൻ/ഉബുണ്ടു +# മുന്നറിയിപ്പ്: ഇന്റർനെറ്റിൽ നിന്നുള്ള സ്ക്രിപ്റ്റുകൾ നേരിട്ട് ബാഷിലേക്ക് പൈപ്പ് ചെയ്യുന്നത് സുരക്ഷാ അപകടം ഉണ്ടാക്കാം. +# സ്ക്രിപ്റ്റ് പ്രവർത്തിപ്പിക്കുന്നതിന് മുമ്പ് അവലോകനം ചെയ്യാൻ ശുപാർശ ചെയ്യുന്നു: +# curl -fsSL https://deb.nodesource.com/setup_lts.x -o setup_lts.x +# less setup_lts.x +# പിന്നീട് പ്രവർത്തിപ്പിക്കുക: +# sudo -E bash setup_lts.x +# +# അല്ലെങ്കിൽ, താഴെ കൊടുത്തിരിക്കുന്ന ഒറ്റ വരി കോഡ് നിങ്ങളുടെ സ്വന്തം അപകടത്തിൽ ഉപയോഗിക്കാം: +curl -fsSL https://deb.nodesource.com/setup_lts.x | sudo -E bash - +sudo apt-get install -y nodejs + +# ഫെഡോറ +sudo dnf install nodejs + +# ഇൻസ്റ്റലേഷൻ സ്ഥിരീകരിക്കുക +node --version +npm --version +``` + +### ഘട്ടം 7: ക്വിസ് ആപ്പ് ആശ്രിതങ്ങൾ ഇൻസ്റ്റാൾ ചെയ്യുക + +```bash +# ക്വിസ് ആപ്പ് ഡയറക്ടറിയിലേക്ക് നാവിഗേറ്റ് ചെയ്യുക +cd quiz-app + +# ആശ്രിതങ്ങൾ ഇൻസ്റ്റാൾ ചെയ്യുക +npm install + +# റൂട്ട് ഡയറക്ടറിയിലേക്ക് മടങ്ങുക +cd .. +``` + +### ഘട്ടം 8: Docsify ഇൻസ്റ്റാൾ ചെയ്യുക (ഐച്ഛികം) + +ഓഫ്‌ലൈൻ ഡോക്യുമെന്റേഷൻ ആക്‌സസ് ചെയ്യാൻ: + +```bash +npm install -g docsify-cli +``` + +## നിങ്ങളുടെ ഇൻസ്റ്റലേഷൻ പരിശോധിക്കുക + +### Python, Jupyter ടെസ്റ്റ് ചെയ്യുക + +```bash +# നിങ്ങളുടെ വെർച്വൽ എൻവയോൺമെന്റ് ഇതിനകം സജീവമല്ലെങ്കിൽ സജീവമാക്കുക +# വിൻഡോസ്-ൽ: +venv\Scripts\activate +# മാക്‌ഓഎസ്/ലിനക്സ്-ൽ: +source venv/bin/activate + +# ജൂപ്പിറ്റർ നോട്ട്‌ബുക്ക് ആരംഭിക്കുക +jupyter notebook +``` + +നിങ്ങളുടെ ബ്രൗസർ Jupyter ഇന്റർഫേസ് തുറക്കും. നിങ്ങൾക്ക് ഇപ്പോൾ ഏതെങ്കിലും പാഠത്തിന്റെ `.ipynb` ഫയലിലേക്ക് പോകാം. + +### ക്വിസ് ആപ്പ് ടെസ്റ്റ് ചെയ്യുക + +```bash +# ക്വിസ് ആപ്പിലേക്ക് നാവിഗേറ്റ് ചെയ്യുക +cd quiz-app + +# ഡെവലപ്പ്മെന്റ് സെർവർ ആരംഭിക്കുക +npm run serve +``` + +ക്വിസ് ആപ്പ് `http://localhost:8080` (അല്ലെങ്കിൽ 8080 തിരക്കുള്ള പക്ഷം മറ്റൊരു പോർട്ട്) ൽ ലഭ്യമായിരിക്കണം. + +### ഡോക്യുമെന്റേഷൻ സർവർ ടെസ്റ്റ് ചെയ്യുക + +```bash +# റിപ്പോസിറ്ററിയുടെ റൂട്ട് ഡയറക്ടറിയിൽ നിന്ന് +docsify serve +``` + +ഡോക്യുമെന്റേഷൻ `http://localhost:3000` ൽ ലഭ്യമായിരിക്കണം. + +## VS Code Dev Containers ഉപയോഗിക്കൽ + +Docker ഇൻസ്റ്റാൾ ചെയ്തിട്ടുണ്ടെങ്കിൽ, VS Code Dev Containers ഉപയോഗിക്കാം: + +1. [Docker Desktop](https://www.docker.com/products/docker-desktop) ഇൻസ്റ്റാൾ ചെയ്യുക +2. [Visual Studio Code](https://code.visualstudio.com/) ഇൻസ്റ്റാൾ ചെയ്യുക +3. [Remote - Containers extension](https://marketplace.visualstudio.com/items?itemName=ms-vscode-remote.remote-containers) ഇൻസ്റ്റാൾ ചെയ്യുക +4. റിപ്പോസിറ്ററി VS Code ൽ തുറക്കുക +5. `F1` അമർത്തി "Remote-Containers: Reopen in Container" തിരഞ്ഞെടുക്കുക +6. കണ്ടെയ്‌നർ നിർമ്മിക്കാൻ കാത്തിരിക്കുക (ആദ്യ തവണ മാത്രം) + +## അടുത്ത ഘട്ടങ്ങൾ + +- പാഠ്യപദ്ധതിയുടെ അവലോകനത്തിന് [README.md](README.md) പരിശോധിക്കുക +- സാധാരണ പ്രവൃത്തികൾക്കും ഉദാഹരണങ്ങൾക്കും [USAGE.md](USAGE.md) വായിക്കുക +- പ്രശ്നങ്ങൾ നേരിടുമ്പോൾ [TROUBLESHOOTING.md](TROUBLESHOOTING.md) പരിശോധിക്കുക +- സംഭാവനകൾ നൽകാൻ ആഗ്രഹിക്കുന്നുവെങ്കിൽ [CONTRIBUTING.md](CONTRIBUTING.md) വായിക്കുക + +## സഹായം നേടുക + +പ്രശ്നങ്ങൾ നേരിടുമ്പോൾ: + +1. [TROUBLESHOOTING.md](TROUBLESHOOTING.md) ഗൈഡ് പരിശോധിക്കുക +2. നിലവിലുള്ള [GitHub Issues](https://github.com/microsoft/Data-Science-For-Beginners/issues) തിരയുക +3. ഞങ്ങളുടെ [Discord community](https://aka.ms/ds4beginners/discord) ൽ ചേരുക +4. നിങ്ങളുടെ പ്രശ്നത്തെക്കുറിച്ച് വിശദമായ വിവരങ്ങളോടെ പുതിയ ഒരു ഇഷ്യൂ സൃഷ്ടിക്കുക + +--- + + +**അസൂയാ**: +ഈ രേഖ AI വിവർത്തന സേവനം [Co-op Translator](https://github.com/Azure/co-op-translator) ഉപയോഗിച്ച് വിവർത്തനം ചെയ്തതാണ്. നാം കൃത്യതയ്ക്ക് ശ്രമിച്ചിട്ടുണ്ടെങ്കിലും, സ്വയം പ്രവർത്തിക്കുന്ന വിവർത്തനങ്ങളിൽ പിശകുകൾ അല്ലെങ്കിൽ തെറ്റുകൾ ഉണ്ടാകാമെന്ന് ദയവായി ശ്രദ്ധിക്കുക. അതിന്റെ മാതൃഭാഷയിലുള്ള യഥാർത്ഥ രേഖയാണ് പ്രാമാണികമായ ഉറവിടം എന്ന് പരിഗണിക്കേണ്ടതാണ്. നിർണായകമായ വിവരങ്ങൾക്ക്, പ്രൊഫഷണൽ മനുഷ്യ വിവർത്തനം ശുപാർശ ചെയ്യപ്പെടുന്നു. ഈ വിവർത്തനം ഉപയോഗിക്കുന്നതിൽ നിന്നുണ്ടാകുന്ന ഏതെങ്കിലും തെറ്റിദ്ധാരണകൾക്കോ തെറ്റായ വ്യാഖ്യാനങ്ങൾക്കോ ഞങ്ങൾ ഉത്തരവാദികളല്ല. + \ No newline at end of file diff --git a/translations/ml/README.md b/translations/ml/README.md new file mode 100644 index 00000000..ceb826d7 --- /dev/null +++ b/translations/ml/README.md @@ -0,0 +1,252 @@ + +# ഡാറ്റാ സയൻസ് ഫോർ ബിഗിനേഴ്സ് - ഒരു പാഠ്യപദ്ധതി + +[![Open in GitHub Codespaces](https://github.com/codespaces/badge.svg)](https://github.com/codespaces/new?hide_repo_select=true&ref=main&repo=344191198) + +[![GitHub license](https://img.shields.io/github/license/microsoft/Data-Science-For-Beginners.svg)](https://github.com/microsoft/Data-Science-For-Beginners/blob/master/LICENSE) +[![GitHub contributors](https://img.shields.io/github/contributors/microsoft/Data-Science-For-Beginners.svg)](https://GitHub.com/microsoft/Data-Science-For-Beginners/graphs/contributors/) +[![GitHub issues](https://img.shields.io/github/issues/microsoft/Data-Science-For-Beginners.svg)](https://GitHub.com/microsoft/Data-Science-For-Beginners/issues/) +[![GitHub pull-requests](https://img.shields.io/github/issues-pr/microsoft/Data-Science-For-Beginners.svg)](https://GitHub.com/microsoft/Data-Science-For-Beginners/pulls/) +[![PRs Welcome](https://img.shields.io/badge/PRs-welcome-brightgreen.svg?style=flat-square)](http://makeapullrequest.com) + +[![GitHub watchers](https://img.shields.io/github/watchers/microsoft/Data-Science-For-Beginners.svg?style=social&label=Watch)](https://GitHub.com/microsoft/Data-Science-For-Beginners/watchers/) +[![GitHub forks](https://img.shields.io/github/forks/microsoft/Data-Science-For-Beginners.svg?style=social&label=Fork)](https://GitHub.com/microsoft/Data-Science-For-Beginners/network/) +[![GitHub stars](https://img.shields.io/github/stars/microsoft/Data-Science-For-Beginners.svg?style=social&label=Star)](https://GitHub.com/microsoft/Data-Science-For-Beginners/stargazers/) + + +[![Microsoft Foundry Discord](https://dcbadge.limes.pink/api/server/nTYy5BXMWG)](https://discord.gg/nTYy5BXMWG) + +[![Microsoft Foundry Developer Forum](https://img.shields.io/badge/GitHub-Microsoft_Foundry_Developer_Forum-blue?style=for-the-badge&logo=github&color=000000&logoColor=fff)](https://aka.ms/foundry/forum) + +മൈക്രോസോഫ്റ്റിലെ അസ്യൂർ ക്ലൗഡ് അഡ്വക്കേറ്റ്സ് ഡാറ്റാ സയൻസിനെക്കുറിച്ചുള്ള 10 ആഴ്ച, 20 പാഠങ്ങൾ ഉൾക്കൊള്ളുന്ന ഒരു പാഠ്യപദ്ധതി അവതരിപ്പിക്കാൻ സന്തോഷിക്കുന്നു. ഓരോ പാഠവും പ്രീ-പാഠം, പോസ്റ്റ്-പാഠം ക്വിസുകൾ, പാഠം പൂർത്തിയാക്കാനുള്ള എഴുത്ത് നിർദ്ദേശങ്ങൾ, ഒരു പരിഹാരം, ഒരു അസൈൻമെന്റ് എന്നിവ ഉൾക്കൊള്ളുന്നു. നമ്മുടെ പ്രോജക്റ്റ്-അധിഷ്ഠിത പഠനരീതി നിങ്ങൾക്ക് നിർമ്മിക്കുമ്പോൾ പഠിക്കാനും പുതിയ കഴിവുകൾ 'പിടിപ്പിക്കാൻ' സഹായിക്കുന്ന തെളിയിച്ച മാർഗമാണ്. + +**നമ്മുടെ എഴുത്തുകാരെ ഹൃദയം നിറഞ്ഞ നന്ദി:** [Jasmine Greenaway](https://www.twitter.com/paladique), [Dmitry Soshnikov](http://soshnikov.com), [Nitya Narasimhan](https://twitter.com/nitya), [Jalen McGee](https://twitter.com/JalenMcG), [Jen Looper](https://twitter.com/jenlooper), [Maud Levy](https://twitter.com/maudstweets), [Tiffany Souterre](https://twitter.com/TiffanySouterre), [Christopher Harrison](https://www.twitter.com/geektrainer). + +**🙏 പ്രത്യേക നന്ദി 🙏 നമ്മുടെ [Microsoft Student Ambassador](https://studentambassadors.microsoft.com/) എഴുത്തുകാര്ക്കും, റിവ്യൂവർക്കും, ഉള്ളടക്ക സംഭാവനക്കാർക്കും,** പ്രത്യേകിച്ച് Aaryan Arora, [Aditya Garg](https://github.com/AdityaGarg00), [Alondra Sanchez](https://www.linkedin.com/in/alondra-sanchez-molina/), [Ankita Singh](https://www.linkedin.com/in/ankitasingh007), [Anupam Mishra](https://www.linkedin.com/in/anupam--mishra/), [Arpita Das](https://www.linkedin.com/in/arpitadas01/), ChhailBihari Dubey, [Dibri Nsofor](https://www.linkedin.com/in/dibrinsofor), [Dishita Bhasin](https://www.linkedin.com/in/dishita-bhasin-7065281bb), [Majd Safi](https://www.linkedin.com/in/majd-s/), [Max Blum](https://www.linkedin.com/in/max-blum-6036a1186/), [Miguel Correa](https://www.linkedin.com/in/miguelmque/), [Mohamma Iftekher (Iftu) Ebne Jalal](https://twitter.com/iftu119), [Nawrin Tabassum](https://www.linkedin.com/in/nawrin-tabassum), [Raymond Wangsa Putra](https://www.linkedin.com/in/raymond-wp/), [Rohit Yadav](https://www.linkedin.com/in/rty2423), Samridhi Sharma, [Sanya Sinha](https://www.linkedin.com/mwlite/in/sanya-sinha-13aab1200), +[Sheena Narula](https://www.linkedin.com/in/sheena-narua-n/), [Tauqeer Ahmad](https://www.linkedin.com/in/tauqeerahmad5201/), Yogendrasingh Pawar , [Vidushi Gupta](https://www.linkedin.com/in/vidushi-gupta07/), [Jasleen Sondhi](https://www.linkedin.com/in/jasleen-sondhi/) + +|![Sketchnote by @sketchthedocs https://sketchthedocs.dev](../../translated_images/00-Title.8af36cd35da1ac555b678627fbdc6e320c75f0100876ea41d30ea205d3b08d22.ml.png)| +|:---:| +| ഡാറ്റാ സയൻസ് ഫോർ ബിഗിനേഴ്സ് - _സ്കെച്ച്നോട്ട് [@nitya](https://twitter.com/nitya) tarafından_ | + +### 🌐 ബഹുഭാഷാ പിന്തുണ + +#### GitHub ആക്ഷൻ വഴി പിന്തുണ (സ്വയം പ്രവർത്തിക്കുന്നതും എല്ലായ്പ്പോഴും പുതുക്കപ്പെടുന്നതും) + + +[Arabic](../ar/README.md) | [Bengali](../bn/README.md) | [Bulgarian](../bg/README.md) | [Burmese (Myanmar)](../my/README.md) | [Chinese (Simplified)](../zh/README.md) | [Chinese (Traditional, Hong Kong)](../hk/README.md) | [Chinese (Traditional, Macau)](../mo/README.md) | [Chinese (Traditional, Taiwan)](../tw/README.md) | [Croatian](../hr/README.md) | [Czech](../cs/README.md) | [Danish](../da/README.md) | [Dutch](../nl/README.md) | [Estonian](../et/README.md) | [Finnish](../fi/README.md) | [French](../fr/README.md) | [German](../de/README.md) | [Greek](../el/README.md) | [Hebrew](../he/README.md) | [Hindi](../hi/README.md) | [Hungarian](../hu/README.md) | [Indonesian](../id/README.md) | [Italian](../it/README.md) | [Japanese](../ja/README.md) | [Kannada](../kn/README.md) | [Korean](../ko/README.md) | [Lithuanian](../lt/README.md) | [Malay](../ms/README.md) | [Malayalam](./README.md) | [Marathi](../mr/README.md) | [Nepali](../ne/README.md) | [Nigerian Pidgin](../pcm/README.md) | [Norwegian](../no/README.md) | [Persian (Farsi)](../fa/README.md) | [Polish](../pl/README.md) | [Portuguese (Brazil)](../br/README.md) | [Portuguese (Portugal)](../pt/README.md) | [Punjabi (Gurmukhi)](../pa/README.md) | [Romanian](../ro/README.md) | [Russian](../ru/README.md) | [Serbian (Cyrillic)](../sr/README.md) | [Slovak](../sk/README.md) | [Slovenian](../sl/README.md) | [Spanish](../es/README.md) | [Swahili](../sw/README.md) | [Swedish](../sv/README.md) | [Tagalog (Filipino)](../tl/README.md) | [Tamil](../ta/README.md) | [Telugu](../te/README.md) | [Thai](../th/README.md) | [Turkish](../tr/README.md) | [Ukrainian](../uk/README.md) | [Urdu](../ur/README.md) | [Vietnamese](../vi/README.md) + + +**കൂടുതൽ ഭാഷാ പിന്തുണ ലഭിക്കാൻ ആഗ്രഹിക്കുന്നുവെങ്കിൽ, അവ ഇവിടെ പട്ടികപ്പെടുത്തിയിരിക്കുന്നു [here](https://github.com/Azure/co-op-translator/blob/main/getting_started/supported-languages.md)** + +#### നമ്മുടെ കമ്മ്യൂണിറ്റിയിൽ ചേരുക +[![Microsoft Foundry Discord](https://dcbadge.limes.pink/api/server/nTYy5BXMWG)](https://discord.gg/nTYy5BXMWG) + +നമുക്ക് ഒരു Discord ലേൺ വിത്ത് AI സീരീസ് തുടരുകയാണ്, കൂടുതൽ അറിയാനും ചേരാനും [Learn with AI Series](https://aka.ms/learnwithai/discord) സന്ദർശിക്കുക, 2025 സെപ്റ്റംബർ 18 - 30 വരെ. GitHub Copilot ഡാറ്റാ സയൻസിനായി ഉപയോഗിക്കുന്നതിനുള്ള ടിപ്സും ട്രിക്കുകളും നിങ്ങൾക്ക് ലഭിക്കും. + +![Learn with AI series](../../translated_images/1.2b28cdc6205e26fef6a21817fe5d83ae8b50fbd0a33e9fed0df05845da5b30b6.ml.jpg) + +# നിങ്ങൾ ഒരു വിദ്യാർത്ഥിയാണോ? + +തുടങ്ങാൻ താഴെപ്പറയുന്ന വിഭവങ്ങൾ ഉപയോഗിക്കുക: + +- [Student Hub page](https://docs.microsoft.com/en-gb/learn/student-hub?WT.mc_id=academic-77958-bethanycheum) ഈ പേജിൽ, നിങ്ങൾക്ക് തുടക്കക്കാർക്കുള്ള വിഭവങ്ങൾ, വിദ്യാർത്ഥി പാക്കുകൾ, സൗജന്യ സർട്ടിഫിക്കറ്റ് വൗച്ചർ നേടാനുള്ള മാർഗ്ഗങ്ങൾ എന്നിവ ലഭിക്കും. ഇത് നിങ്ങൾക്ക് ബുക്ക്മാർക്ക് ചെയ്ത് ഇടയ്ക്കിടെ പരിശോധിക്കേണ്ട ഒരു പേജ് ആണ്, കാരണം ഞങ്ങൾ ഉള്ളടക്കം കുറഞ്ഞത് മാസത്തിൽ ഒരിക്കൽ മാറ്റുന്നു. +- [Microsoft Learn Student Ambassadors](https://studentambassadors.microsoft.com?WT.mc_id=academic-77958-bethanycheum) ഒരു ആഗോള വിദ്യാർത്ഥി അംബാസഡർ കമ്മ്യൂണിറ്റിയിൽ ചേരുക, ഇത് മൈക്രോസോഫ്റ്റിലേക്ക് നിങ്ങളുടെ വഴി ആകാം. + +# ആരംഭിക്കുന്നത് + +## 📚 ഡോക്യുമെന്റേഷൻ + +- **[ഇൻസ്റ്റലേഷൻ ഗൈഡ്](INSTALLATION.md)** - തുടക്കക്കാർക്കുള്ള ഘട്ടം ഘട്ടമായുള്ള സജ്ജീകരണ നിർദ്ദേശങ്ങൾ +- **[ഉപയോഗ ഗൈഡ്](USAGE.md)** - ഉദാഹരണങ്ങളും സാധാരണ പ്രവൃത്തികളും +- **[പ്രശ്നപരിഹാരം](TROUBLESHOOTING.md)** - സാധാരണ പ്രശ്നങ്ങൾക്ക് പരിഹാരങ്ങൾ +- **[സംഭാവനാ ഗൈഡ്](CONTRIBUTING.md)** - ഈ പ്രോജക്റ്റിൽ സംഭാവന ചെയ്യാനുള്ള മാർഗ്ഗങ്ങൾ +- **[അധ്യാപകർക്ക്](for-teachers.md)** - പഠന മാർഗ്ഗനിർദ്ദേശങ്ങളും ക്ലാസ്‌റൂം വിഭവങ്ങളും + +## 👨‍🎓 വിദ്യാർത്ഥികൾക്കായി +> **പൂർണ്ണ തുടക്കക്കാർ**: ഡാറ്റാ സയൻസിൽ പുതിയവരാണോ? നമ്മുടെ [തുടക്കക്കാർക്ക് അനുയോജ്യമായ ഉദാഹരണങ്ങൾ](examples/README.md) ഉപയോഗിച്ച് തുടങ്ങുക! ഈ ലളിതവും നല്ല രീതിയിൽ കമന്റ് ചെയ്ത ഉദാഹരണങ്ങൾ പാഠ്യപദ്ധതിയിൽ മുഴുവനായി പ്രവേശിക്കുന്നതിന് മുമ്പ് അടിസ്ഥാനങ്ങൾ മനസ്സിലാക്കാൻ സഹായിക്കും. +> **[വിദ്യാർത്ഥികൾ](https://aka.ms/student-page)**: ഈ പാഠ്യപദ്ധതി സ്വയം ഉപയോഗിക്കാൻ, മുഴുവൻ റിപോ ഫോർക്ക് ചെയ്ത് പ്രീ-ലെക്ചർ ക്വിസ് മുതൽ ആരംഭിച്ച് സ്വയം അഭ്യാസങ്ങൾ പൂർത്തിയാക്കുക. തുടർന്ന് ലെക്ചർ വായിച്ച് ബാക്കി പ്രവർത്തനങ്ങളും പൂർത്തിയാക്കുക. പരിഹാര കോഡ് പകർപ്പവകാശം ചെയ്യുന്നതിന് പകരം പാഠങ്ങൾ മനസ്സിലാക്കി പ്രോജക്റ്റുകൾ സൃഷ്ടിക്കാൻ ശ്രമിക്കുക; എങ്കിലും ആ കോഡ് ഓരോ പ്രോജക്റ്റ്-കേന്ദ്രിത പാഠത്തിലും /solutions ഫോൾഡറുകളിൽ ലഭ്യമാണ്. മറ്റൊരു ആശയം സുഹൃത്തുക്കളുമായി പഠന സംഘം രൂപീകരിച്ച് ഉള്ളടക്കം ഒരുമിച്ച് പഠിക്കുക എന്നതാണ്. കൂടുതൽ പഠനത്തിനായി, [Microsoft Learn](https://docs.microsoft.com/en-us/users/jenlooper-2911/collections/qprpajyoy3x0g7?WT.mc_id=academic-77958-bethanycheum) ശുപാർശ ചെയ്യുന്നു. + +**വേഗത്തിലുള്ള ആരംഭം:** +1. നിങ്ങളുടെ പരിസ്ഥിതി സജ്ജമാക്കാൻ [ഇൻസ്റ്റലേഷൻ ഗൈഡ്](INSTALLATION.md) പരിശോധിക്കുക +2. പാഠ്യപദ്ധതിയുമായി പ്രവർത്തിക്കാൻ [ഉപയോഗ ഗൈഡ്](USAGE.md) അവലോകനം ചെയ്യുക +3. പാഠം 1 മുതൽ തുടക്കം കുറിച്ച് ക്രമമായി മുന്നോട്ട് പോവുക +4. പിന്തുണയ്ക്കായി നമ്മുടെ [Discord കമ്മ്യൂണിറ്റിയിൽ](https://aka.ms/ds4beginners/discord) ചേരുക + +## 👩‍🏫 അധ്യാപകർക്ക് + +> **അധ്യാപകർ**: ഈ പാഠ്യപദ്ധതി ഉപയോഗിക്കുന്നതിനെക്കുറിച്ച് ചില [സൂചനകൾ](for-teachers.md) ഉൾപ്പെടുത്തിയിട്ടുണ്ട്. നിങ്ങളുടെ അഭിപ്രായങ്ങൾ ഞങ്ങളുടെ [ചർച്ചാ ഫോറത്തിൽ](https://github.com/microsoft/Data-Science-For-Beginners/discussions) അറിയിക്കുക! + +## ടീമിനെ പരിചയപ്പെടുക + +[![പ്രമോ വീഡിയോ](../../ds-for-beginners.gif)](https://youtu.be/8mzavjQSMM4 "പ്രമോ വീഡിയോ") + +**ഗിഫ്** [Mohit Jaisal](https://www.linkedin.com/in/mohitjaisal) +> 🎥 പ്രോജക്ട് സൃഷ്ടിച്ച ആളുകളെക്കുറിച്ചുള്ള ഒരു വീഡിയോക്കായി മുകളിൽ കാണുന്ന ചിത്രം ക്ലിക്ക് ചെയ്യുക! + +## പാഠശാസ്ത്രം + +ഈ പാഠ്യപദ്ധതി നിർമ്മിക്കുമ്പോൾ ഞങ്ങൾ രണ്ട് പാഠശാസ്ത്ര തത്വങ്ങൾ തിരഞ്ഞെടുക്കുകയുണ്ടായി: ഇത് പ്രോജക്ട് അടിസ്ഥാനമാക്കിയുള്ളതായിരിക്കണം എന്നും അതിൽ പതിവായി ക്വിസുകൾ ഉൾപ്പെടണം എന്നും. ഈ പരമ്പരയുടെ അവസാനം, വിദ്യാർത്ഥികൾ ഡാറ്റാ സയൻസിന്റെ അടിസ്ഥാന സിദ്ധാന്തങ്ങൾ, നൈതിക ആശയങ്ങൾ, ഡാറ്റാ തയ്യാറാക്കൽ, ഡാറ്റയുമായി പ്രവർത്തിക്കുന്ന വ്യത്യസ്ത മാർഗങ്ങൾ, ഡാറ്റാ ദൃശ്യീകരണം, ഡാറ്റാ വിശകലനം, ഡാറ്റാ സയൻസിന്റെ യാഥാർത്ഥ്യ ഉപയോഗങ്ങൾ എന്നിവ പഠിച്ചിരിക്കും. + +കൂടാതെ, ക്ലാസിന് മുമ്പുള്ള കുറഞ്ഞ സമ്മർദ്ദമുള്ള ക്വിസ് ഒരു വിഷയത്തെ പഠിക്കാനുള്ള വിദ്യാർത്ഥിയുടെ ഉദ്ദേശ്യം സജ്ജമാക്കുന്നു, ക്ലാസിന് ശേഷം രണ്ടാമത്തെ ക്വിസ് കൂടുതൽ ഓർമ്മപ്പെടുത്തലിനായി സഹായിക്കുന്നു. ഈ പാഠ്യപദ്ധതി ലവച്ഛേദ്യവും രസകരവുമാണ്, മുഴുവനായോ ഭാഗികമായോ സ്വീകരിക്കാവുന്നതാണ്. പ്രോജക്ടുകൾ ചെറിയതിൽ ആരംഭിച്ച് 10 ആഴ്ചകളുടെ ചക്രത്തിന്റെ അവസാനം കൂടുതൽ സങ്കീർണ്ണമാകുന്നു. + +> ഞങ്ങളുടെ [Code of Conduct](CODE_OF_CONDUCT.md), [Contributing](CONTRIBUTING.md), [Translation](TRANSLATIONS.md) മാർഗനിർദ്ദേശങ്ങൾ കാണുക. നിങ്ങളുടെ നിർമാണാത്മക പ്രതികരണങ്ങൾ സ്വാഗതം ചെയ്യുന്നു! + +## ഓരോ പാഠവും ഉൾക്കൊള്ളുന്നത്: + +- ഐച്ഛിക സ്കെച്ച്നോട്ട് +- ഐച്ഛിക സഹായക വീഡിയോ +- പാഠത്തിന് മുമ്പുള്ള വാര്മപ്പ് ക്വിസ് +- എഴുത്തുപാഠം +- പ്രോജക്ട് അടിസ്ഥാനമാക്കിയുള്ള പാഠങ്ങൾക്ക്, പ്രോജക്ട് നിർമ്മിക്കുന്നതിനുള്ള ഘട്ടം ഘട്ടമായ മാർഗ്ഗനിർദ്ദേശങ്ങൾ +- അറിവ് പരിശോധനകൾ +- ഒരു വെല്ലുവിളി +- സഹായക വായന +- അസൈൻമെന്റ് +- [പാഠത്തിന് ശേഷം ക്വിസ്](https://ff-quizzes.netlify.app/en/) + +> **ക്വിസുകളെക്കുറിച്ചുള്ള ഒരു കുറിപ്പ്**: എല്ലാ ക്വിസുകളും Quiz-App ഫോൾഡറിൽ ഉൾക്കൊള്ളുന്നു, ഓരോന്നിലും മൂന്ന് ചോദ്യങ്ങളുള്ള 40 ക്വിസുകൾ. അവ പാഠങ്ങളിൽ നിന്നു ബന്ധിപ്പിച്ചിരിക്കുന്നു, പക്ഷേ ക്വിസ് ആപ്പ് പ്രാദേശികമായി പ്രവർത്തിപ്പിക്കാനോ Azure-ലേക്ക് വിന്യസിക്കാനോ കഴിയും; `quiz-app` ഫോൾഡറിലുള്ള നിർദ്ദേശങ്ങൾ പിന്തുടരുക. അവ ക്രമമായി പ്രാദേശികമാക്കപ്പെടുന്നു. + +## 🎓 തുടക്കക്കാർക്ക് അനുയോജ്യമായ ഉദാഹരണങ്ങൾ + +**ഡാറ്റാ സയൻസിൽ പുതിയവരാണോ?** നിങ്ങൾക്ക് ആരംഭിക്കാൻ സഹായിക്കുന്ന ലളിതവും വിശദീകരിച്ചും ഉള്ള കോഡുകളുള്ള പ്രത്യേക [examples directory](examples/README.md) ഞങ്ങൾ സൃഷ്ടിച്ചിട്ടുണ്ട്: + +- 🌟 **ഹലോ വേൾഡ്** - നിങ്ങളുടെ ആദ്യ ഡാറ്റാ സയൻസ് പ്രോഗ്രാം +- 📂 **ഡാറ്റാ ലോഡിംഗ്** - ഡാറ്റാസെറ്റുകൾ വായിക്കുകയും പരിശോധിക്കുകയും ചെയ്യുക +- 📊 **സാധാരണ വിശകലനം** - സ്ഥിതിവിവരക്കണക്കുകൾ കണക്കാക്കുകയും മാതൃകകൾ കണ്ടെത്തുകയും ചെയ്യുക +- 📈 **അടിസ്ഥാന ദൃശ്യീകരണം** - ചാർട്ടുകളും ഗ്രാഫുകളും സൃഷ്ടിക്കുക +- 🔬 **യാഥാർത്ഥ്യ പ്രോജക്ട്** - ആരംഭം മുതൽ അവസാനത്തേയ്ക്ക് പൂർണ്ണ പ്രവൃത്തി പ്രവാഹം + +ഓരോ ഉദാഹരണവും ഓരോ ഘട്ടവും വിശദമായി വിശദീകരിക്കുന്ന കമന്റുകളോടെയാണ്, അതുകൊണ്ട് തുടക്കക്കാർക്ക് ഇത് ഏറ്റവും അനുയോജ്യമാണ്! + +👉 **[ഉദാഹരണങ്ങളുമായി ആരംഭിക്കുക](examples/README.md)** 👈 + +## പാഠങ്ങൾ + + +|![ Sketchnote by @sketchthedocs https://sketchthedocs.dev](../../translated_images/00-Roadmap.4905d6567dff47532b9bfb8e0b8980fc6b0b1292eebb24181c1a9753b33bc0f5.ml.png)| +|:---:| +| ഡാറ്റാ സയൻസ് ഫോർ ബിഗിനേഴ്സ്: റോഡ്‌മാപ്പ് - _സ്കെച്ച്നോട്ട് [@nitya](https://twitter.com/nitya) tarafından_ | + + +| പാഠ നമ്പർ | വിഷയം | പാഠ ഗ്രൂപ്പിംഗ് | പഠന ലക്ഷ്യങ്ങൾ | ബന്ധിപ്പിച്ച പാഠം | രചയിതാവ് | +| :-----------: | :----------------------------------------: | :--------------------------------------------------: | :-----------------------------------------------------------------------------------------------------------------------------------------------------------------------: | :---------------------------------------------------------------------: | :----: | +| 01 | ഡാറ്റാ സയൻസ് നിർവചനം | [Introduction](1-Introduction/README.md) | ഡാറ്റാ സയൻസിന്റെ അടിസ്ഥാന ആശയങ്ങൾ പഠിക്കുക, അതിന്റെ കൃത്രിമ ബുദ്ധിമുട്ട്, മെഷീൻ ലേണിംഗ്, ബിഗ് ഡാറ്റ എന്നിവയുമായി ബന്ധം മനസിലാക്കുക. | [lesson](1-Introduction/01-defining-data-science/README.md) [video](https://youtu.be/beZ7Mb_oz9I) | [Dmitry](http://soshnikov.com) | +| 02 | ഡാറ്റാ സയൻസ് നൈതികത | [Introduction](1-Introduction/README.md) | ഡാറ്റാ നൈതികത ആശയങ്ങൾ, വെല്ലുവിളികൾ & ഫ്രെയിംവർക്കുകൾ. | [lesson](1-Introduction/02-ethics/README.md) | [Nitya](https://twitter.com/nitya) | +| 03 | ഡാറ്റ നിർവചനം | [Introduction](1-Introduction/README.md) | ഡാറ്റ എങ്ങനെ വർഗ്ഗീകരിക്കപ്പെടുന്നു, അതിന്റെ സാധാരണ ഉറവിടങ്ങൾ. | [lesson](1-Introduction/03-defining-data/README.md) | [Jasmine](https://www.twitter.com/paladique) | +| 04 | സ്ഥിതിവിവരശാസ്ത്രം & സാധ്യതകളിലേക്ക് പരിചയം | [Introduction](1-Introduction/README.md) | ഡാറ്റ മനസിലാക്കാൻ സാധ്യതയും സ്ഥിതിവിവരശാസ്ത്രവും ഉപയോഗിക്കുന്ന ഗണിത സാങ്കേതിക വിദ്യകൾ. | [lesson](1-Introduction/04-stats-and-probability/README.md) [video](https://youtu.be/Z5Zy85g4Yjw) | [Dmitry](http://soshnikov.com) | +| 05 | ബന്ധപരമായ ഡാറ്റയുമായി പ്രവർത്തിക്കൽ | [Working With Data](2-Working-With-Data/README.md) | ബന്ധപരമായ ഡാറ്റയിലേക്ക് പരിചയം, Structured Query Language (SQL) ഉപയോഗിച്ച് ബന്ധപരമായ ഡാറ്റ പരിശോധിക്കുകയും വിശകലനം ചെയ്യുകയും ചെയ്യാനുള്ള അടിസ്ഥാനങ്ങൾ. | [lesson](2-Working-With-Data/05-relational-databases/README.md) | [Christopher](https://www.twitter.com/geektrainer) | | | +| 06 | NoSQL ഡാറ്റയുമായി പ്രവർത്തിക്കൽ | [Working With Data](2-Working-With-Data/README.md) | ബന്ധമില്ലാത്ത ഡാറ്റയിലേക്ക് പരിചയം, അതിന്റെ വിവിധ തരം, ഡോക്യുമെന്റ് ഡാറ്റാബേസുകൾ പരിശോധിക്കുകയും വിശകലനം ചെയ്യുകയും ചെയ്യാനുള്ള അടിസ്ഥാനങ്ങൾ. | [lesson](2-Working-With-Data/06-non-relational/README.md) | [Jasmine](https://twitter.com/paladique)| +| 07 | Python ഉപയോഗിച്ച് പ്രവർത്തിക്കൽ | [Working With Data](2-Working-With-Data/README.md) | Pandas പോലുള്ള ലൈബ്രറികൾ ഉപയോഗിച്ച് ഡാറ്റാ പരിശോധനയ്ക്ക് Python ഉപയോഗിക്കുന്നതിന്റെ അടിസ്ഥാനങ്ങൾ. Python പ്രോഗ്രാമിംഗിന്റെ അടിസ്ഥാന അറിവ് ശുപാർശ ചെയ്യുന്നു. | [lesson](2-Working-With-Data/07-python/README.md) [video](https://youtu.be/dZjWOGbsN4Y) | [Dmitry](http://soshnikov.com) | +| 08 | ഡാറ്റാ തയ്യാറാക്കൽ | [Working With Data](2-Working-With-Data/README.md) | നഷ്ടപ്പെട്ട, തെറ്റായ, അല്ലെങ്കിൽ അപൂർണ്ണമായ ഡാറ്റ കൈകാര്യം ചെയ്യുന്നതിനുള്ള ശുചീകരണവും പരിവർത്തനവും ഉൾപ്പെടുന്ന ഡാറ്റ സാങ്കേതികവിദ്യകൾ. | [lesson](2-Working-With-Data/08-data-preparation/README.md) | [Jasmine](https://www.twitter.com/paladique) | +| 09 | അളവുകൾ ദൃശ്യീകരിക്കൽ | [Data Visualization](3-Data-Visualization/README.md) | Matplotlib ഉപയോഗിച്ച് പക്ഷി ഡാറ്റ ദൃശ്യീകരിക്കുന്നത് പഠിക്കുക 🦆 | [lesson](3-Data-Visualization/09-visualization-quantities/README.md) | [Jen](https://twitter.com/jenlooper) | +| 10 | ഡാറ്റയുടെ വിതരണങ്ങൾ ദൃശ്യീകരിക്കൽ | [Data Visualization](3-Data-Visualization/README.md) | ഒരു ഇടവേളയിൽ ഉള്ള നിരീക്ഷണങ്ങളും പ്രവണതകളും ദൃശ്യീകരിക്കൽ. | [lesson](3-Data-Visualization/10-visualization-distributions/README.md) | [Jen](https://twitter.com/jenlooper) | +| 11 | അനുപാതങ്ങൾ ദൃശ്യീകരിക്കൽ | [Data Visualization](3-Data-Visualization/README.md) | വ്യത്യസ്തവും ഗ്രൂപ്പുചെയ്ത ശതമാനങ്ങളും ദൃശ്യീകരിക്കൽ. | [lesson](3-Data-Visualization/11-visualization-proportions/README.md) | [Jen](https://twitter.com/jenlooper) | +| 12 | ബന്ധങ്ങൾ ദൃശ്യീകരിക്കൽ | [Data Visualization](3-Data-Visualization/README.md) | ഡാറ്റാ സെറ്റുകളും അവയുടെ ചാരങ്ങളും തമ്മിലുള്ള ബന്ധങ്ങളും സഹബന്ധങ്ങളും ദൃശ്യീകരിക്കൽ. | [lesson](3-Data-Visualization/12-visualization-relationships/README.md) | [Jen](https://twitter.com/jenlooper) | +| 13 | അർത്ഥവത്തായ ദൃശ്യീകരണങ്ങൾ | [Data Visualization](3-Data-Visualization/README.md) | പ്രശ്നപരിഹാരത്തിനും洞察ങ്ങൾക്കും ഫലപ്രദമായ നിങ്ങളുടെ ദൃശ്യീകരണങ്ങൾ മൂല്യവത്താക്കാനുള്ള സാങ്കേതിക വിദ്യകളും മാർഗ്ഗനിർദ്ദേശങ്ങളും. | [lesson](3-Data-Visualization/13-meaningful-visualizations/README.md) | [Jen](https://twitter.com/jenlooper) | +| 14 | ഡാറ്റാ സയൻസ് ലൈഫ് സൈക്കിൾ പരിചയം | [Lifecycle](4-Data-Science-Lifecycle/README.md) | ഡാറ്റാ സയൻസ് ലൈഫ് സൈക്കിളിന്റെ പരിചയം, ആദ്യ ഘട്ടമായ ഡാറ്റാ സമാഹരണവും എക്സ്ട്രാക്ഷനും. | [lesson](4-Data-Science-Lifecycle/14-Introduction/README.md) | [Jasmine](https://twitter.com/paladique) | +| 15 | വിശകലനം | [Lifecycle](4-Data-Science-Lifecycle/README.md) | ഡാറ്റാ സയൻസ് ലൈഫ് സൈക്കിളിന്റെ ഈ ഘട്ടം ഡാറ്റ വിശകലന സാങ്കേതിക വിദ്യകളിൽ കേന്ദ്രീകരിക്കുന്നു. | [lesson](4-Data-Science-Lifecycle/15-analyzing/README.md) | [Jasmine](https://twitter.com/paladique) | | | +| 16 | ആശയവിനിമയം | [Lifecycle](4-Data-Science-Lifecycle/README.md) | ഡാറ്റയിൽ നിന്നുള്ള洞察ങ്ങൾ തീരുമാനമെടുക്കുന്നവർക്കു മനസ്സിലാക്കാൻ എളുപ്പമാക്കുന്ന വിധത്തിൽ അവതരിപ്പിക്കുന്ന ഡാറ്റാ സയൻസ് ലൈഫ് സൈക്കിളിന്റെ ഈ ഘട്ടം. | [lesson](4-Data-Science-Lifecycle/16-communication/README.md) | [Jalen](https://twitter.com/JalenMcG) | | | +| 17 | ക്ലൗഡിൽ ഡാറ്റാ സയൻസ് | [Cloud Data](5-Data-Science-In-Cloud/README.md) | ക്ലൗഡിൽ ഡാറ്റാ സയൻസ് പരിചയപ്പെടുത്തലും അതിന്റെ ഗുണങ്ങളും. | [lesson](5-Data-Science-In-Cloud/17-Introduction/README.md) | [Tiffany](https://twitter.com/TiffanySouterre) and [Maud](https://twitter.com/maudstweets) | +| 18 | ക്ലൗഡിൽ ഡാറ്റാ സയൻസ് | [Cloud Data](5-Data-Science-In-Cloud/README.md) | ലോ കോഡ് ഉപകരണങ്ങൾ ഉപയോഗിച്ച് മോഡലുകൾ പരിശീലിപ്പിക്കൽ. |[lesson](5-Data-Science-In-Cloud/18-Low-Code/README.md) | [Tiffany](https://twitter.com/TiffanySouterre) and [Maud](https://twitter.com/maudstweets) | +| 19 | ക്ലൗഡിൽ ഡാറ്റാ സയൻസ് | [Cloud Data](5-Data-Science-In-Cloud/README.md) | Azure Machine Learning Studio ഉപയോഗിച്ച് മോഡലുകൾ വിന്യസിക്കൽ. | [lesson](5-Data-Science-In-Cloud/19-Azure/README.md)| [Tiffany](https://twitter.com/TiffanySouterre) and [Maud](https://twitter.com/maudstweets) | +| 20 | യാഥാർത്ഥ്യത്തിൽ ഡാറ്റാ സയൻസ് | [In the Wild](6-Data-Science-In-Wild/README.md) | യാഥാർത്ഥ്യ ലോകത്തിലെ ഡാറ്റാ സയൻസ് പ്രോജക്ടുകൾ. | [lesson](6-Data-Science-In-Wild/20-Real-World-Examples/README.md) | [Nitya](https://twitter.com/nitya) | + +## GitHub Codespaces + +ഈ സാമ്പിൾ ഒരു Codespace-ൽ തുറക്കാൻ ഈ ചുവടുകൾ പിന്തുടരുക: +1. Code ഡ്രോപ്പ്-ഡൗൺ മെനു ക്ലിക്ക് ചെയ്ത് Open with Codespaces ഓപ്ഷൻ തിരഞ്ഞെടുക്കുക. +2. പാനലിന്റെ അടിയിൽ + New codespace തിരഞ്ഞെടുക്കുക. +കൂടുതൽ വിവരങ്ങൾക്ക്, [GitHub ഡോക്യുമെന്റേഷൻ](https://docs.github.com/en/codespaces/developing-in-codespaces/creating-a-codespace-for-a-repository#creating-a-codespace) കാണുക. + +## VSCode Remote - Containers +നിങ്ങളുടെ ലോക്കൽ മെഷീൻ ഉപയോഗിച്ച് VSCode-ൽ ഈ റിപോസിറ്ററി ഒരു കണ്ടെയ്‌നറിൽ തുറക്കാൻ VS Code Remote - Containers എക്സ്റ്റൻഷൻ ഉപയോഗിച്ച് ഈ ചുവടുകൾ പിന്തുടരുക: + +1. നിങ്ങൾ ആദ്യമായി ഡെവലപ്പ്മെന്റ് കണ്ടെയ്‌നർ ഉപയോഗിക്കുന്നുവെങ്കിൽ, നിങ്ങളുടെ സിസ്റ്റം മുൻകൂർ ആവശ്യകതകൾ (ഉദാ: Docker ഇൻസ്റ്റാൾ ചെയ്തിട്ടുണ്ടോ) പാലിക്കുന്നുണ്ടെന്ന് ഉറപ്പാക്കുക [getting started ഡോക്യുമെന്റേഷനിൽ](https://code.visualstudio.com/docs/devcontainers/containers#_getting-started). + +ഈ റിപോസിറ്ററി ഉപയോഗിക്കാൻ, നിങ്ങൾക്ക് റിപോസിറ്ററി ഒരു ഐസൊലേറ്റഡ് Docker വോളിയത്തിൽ തുറക്കാം: + +**കുറിപ്പ്**: ഇതിന് Remote-Containers: **Clone Repository in Container Volume...** കമാൻഡ് ഉപയോഗിച്ച് സോഴ്‌സ് കോഡ് Docker വോളിയത്തിൽ ക്ലോൺ ചെയ്യുന്നു, ലോക്കൽ ഫയൽസിസ്റ്റം ഉപയോഗിക്കാതെ. [Volumes](https://docs.docker.com/storage/volumes/) കണ്ടെയ്‌നർ ഡാറ്റ നിലനിർത്തുന്നതിനുള്ള മുൻഗണനാ മാർഗമാണ്. + +അല്ലെങ്കിൽ, ലോക്കലായി ക്ലോൺ ചെയ്ത അല്ലെങ്കിൽ ഡൗൺലോഡ് ചെയ്ത റിപോസിറ്ററി തുറക്കാം: + +- ഈ റിപോസിറ്ററി നിങ്ങളുടെ ലോക്കൽ ഫയൽസിസ്റ്റത്തിലേക്ക് ക്ലോൺ ചെയ്യുക. +- F1 അമർത്തി **Remote-Containers: Open Folder in Container...** കമാൻഡ് തിരഞ്ഞെടുക്കുക. +- ഈ ഫോൾഡറിന്റെ ക്ലോൺ ചെയ്ത കോപ്പി തിരഞ്ഞെടുക്കുക, കണ്ടെയ്‌നർ ആരംഭിക്കാൻ കാത്തിരിക്കുക, തുടർന്ന് പരീക്ഷിക്കുക. + +## ഓഫ്‌ലൈൻ ആക്‌സസ് + +[Docsify](https://docsify.js.org/#/) ഉപയോഗിച്ച് ഈ ഡോക്യുമെന്റേഷൻ ഓഫ്‌ലൈൻ പ്രവർത്തിപ്പിക്കാം. ഈ റിപോസിറ്ററി ഫോർക്ക് ചെയ്ത്, നിങ്ങളുടെ ലോക്കൽ മെഷീനിൽ [Docsify ഇൻസ്റ്റാൾ](https://docsify.js.org/#/quickstart) ചെയ്യുക, തുടർന്ന് ഈ റിപോസിറ്ററിയുടെ റൂട്ട് ഫോൾഡറിൽ `docsify serve` ടൈപ്പ് ചെയ്യുക. വെബ്സൈറ്റ് നിങ്ങളുടെ ലോക്കൽഹോസ്റ്റിൽ പോർട്ട് 3000-ൽ ലഭ്യമായിരിക്കും: `localhost:3000`. + +> കുറിപ്പ്, നോട്ട്‌ബുക്കുകൾ Docsify വഴി റെൻഡർ ചെയ്യപ്പെടില്ല, അതിനാൽ നിങ്ങൾക്ക് നോട്ട്‌ബുക്ക് പ്രവർത്തിപ്പിക്കേണ്ടത് ഉണ്ടെങ്കിൽ, അത് വേർതിരിച്ച് VS Code-ൽ Python കർണൽ ഉപയോഗിച്ച് നടത്തുക. + +## മറ്റ് പാഠ്യപദ്ധതികൾ + +ഞങ്ങളുടെ ടീം മറ്റ് പാഠ്യപദ്ധതികളും നിർമ്മിക്കുന്നു! പരിശോധിക്കുക: + + +### LangChain +[![LangChain4j for Beginners](https://img.shields.io/badge/LangChain4j%20for%20Beginners-22C55E?style=for-the-badge&&labelColor=E5E7EB&color=0553D6)](https://aka.ms/langchain4j-for-beginners) +[![LangChain.js for Beginners](https://img.shields.io/badge/LangChain.js%20for%20Beginners-22C55E?style=for-the-badge&labelColor=E5E7EB&color=0553D6)](https://aka.ms/langchainjs-for-beginners?WT.mc_id=m365-94501-dwahlin) + +--- + +### Azure / Edge / MCP / Agents +[![AZD for Beginners](https://img.shields.io/badge/AZD%20for%20Beginners-0078D4?style=for-the-badge&labelColor=E5E7EB&color=0078D4)](https://github.com/microsoft/AZD-for-beginners?WT.mc_id=academic-105485-koreyst) +[![Edge AI for Beginners](https://img.shields.io/badge/Edge%20AI%20for%20Beginners-00B8E4?style=for-the-badge&labelColor=E5E7EB&color=00B8E4)](https://github.com/microsoft/edgeai-for-beginners?WT.mc_id=academic-105485-koreyst) +[![MCP for Beginners](https://img.shields.io/badge/MCP%20for%20Beginners-009688?style=for-the-badge&labelColor=E5E7EB&color=009688)](https://github.com/microsoft/mcp-for-beginners?WT.mc_id=academic-105485-koreyst) +[![AI Agents for Beginners](https://img.shields.io/badge/AI%20Agents%20for%20Beginners-00C49A?style=for-the-badge&labelColor=E5E7EB&color=00C49A)](https://github.com/microsoft/ai-agents-for-beginners?WT.mc_id=academic-105485-koreyst) + +--- + +### ജനറേറ്റീവ് AI സീരീസ് +[![Generative AI for Beginners](https://img.shields.io/badge/Generative%20AI%20for%20Beginners-8B5CF6?style=for-the-badge&labelColor=E5E7EB&color=8B5CF6)](https://github.com/microsoft/generative-ai-for-beginners?WT.mc_id=academic-105485-koreyst) +[![Generative AI (.NET)](https://img.shields.io/badge/Generative%20AI%20(.NET)-9333EA?style=for-the-badge&labelColor=E5E7EB&color=9333EA)](https://github.com/microsoft/Generative-AI-for-beginners-dotnet?WT.mc_id=academic-105485-koreyst) +[![Generative AI (Java)](https://img.shields.io/badge/Generative%20AI%20(Java)-C084FC?style=for-the-badge&labelColor=E5E7EB&color=C084FC)](https://github.com/microsoft/generative-ai-for-beginners-java?WT.mc_id=academic-105485-koreyst) +[![Generative AI (JavaScript)](https://img.shields.io/badge/Generative%20AI%20(JavaScript)-E879F9?style=for-the-badge&labelColor=E5E7EB&color=E879F9)](https://github.com/microsoft/generative-ai-with-javascript?WT.mc_id=academic-105485-koreyst) + +--- + +### കോർ ലേണിംഗ് +[![ML for Beginners](https://img.shields.io/badge/ML%20for%20Beginners-22C55E?style=for-the-badge&labelColor=E5E7EB&color=22C55E)](https://aka.ms/ml-beginners?WT.mc_id=academic-105485-koreyst) +[![Data Science for Beginners](https://img.shields.io/badge/Data%20Science%20for%20Beginners-84CC16?style=for-the-badge&labelColor=E5E7EB&color=84CC16)](https://aka.ms/datascience-beginners?WT.mc_id=academic-105485-koreyst) +[![AI for Beginners](https://img.shields.io/badge/AI%20for%20Beginners-A3E635?style=for-the-badge&labelColor=E5E7EB&color=A3E635)](https://aka.ms/ai-beginners?WT.mc_id=academic-105485-koreyst) +[![Cybersecurity for Beginners](https://img.shields.io/badge/Cybersecurity%20for%20Beginners-F97316?style=for-the-badge&labelColor=E5E7EB&color=F97316)](https://github.com/microsoft/Security-101?WT.mc_id=academic-96948-sayoung) +[![Web Dev for Beginners](https://img.shields.io/badge/Web%20Dev%20for%20Beginners-EC4899?style=for-the-badge&labelColor=E5E7EB&color=EC4899)](https://aka.ms/webdev-beginners?WT.mc_id=academic-105485-koreyst) +[![IoT for Beginners](https://img.shields.io/badge/IoT%20for%20Beginners-14B8A6?style=for-the-badge&labelColor=E5E7EB&color=14B8A6)](https://aka.ms/iot-beginners?WT.mc_id=academic-105485-koreyst) +[![XR Development for Beginners](https://img.shields.io/badge/XR%20Development%20for%20Beginners-38BDF8?style=for-the-badge&labelColor=E5E7EB&color=38BDF8)](https://github.com/microsoft/xr-development-for-beginners?WT.mc_id=academic-105485-koreyst) + +--- + +### കോപൈലറ്റ് സീരീസ് +[![Copilot for AI Paired Programming](https://img.shields.io/badge/Copilot%20for%20AI%20Paired%20Programming-FACC15?style=for-the-badge&labelColor=E5E7EB&color=FACC15)](https://aka.ms/GitHubCopilotAI?WT.mc_id=academic-105485-koreyst) +[![Copilot for C#/.NET](https://img.shields.io/badge/Copilot%20for%20C%23/.NET-FBBF24?style=for-the-badge&labelColor=E5E7EB&color=FBBF24)](https://github.com/microsoft/mastering-github-copilot-for-dotnet-csharp-developers?WT.mc_id=academic-105485-koreyst) +[![Copilot Adventure](https://img.shields.io/badge/Copilot%20Adventure-FDE68A?style=for-the-badge&labelColor=E5E7EB&color=FDE68A)](https://github.com/microsoft/CopilotAdventures?WT.mc_id=academic-105485-koreyst) + + +## സഹായം നേടുക + +**പ്രശ്നങ്ങൾ നേരിടുന്നുണ്ടോ?** സാധാരണ പ്രശ്നങ്ങൾക്ക് പരിഹാരങ്ങൾക്കായി ഞങ്ങളുടെ [ട്രബ്ല്ഷൂട്ടിംഗ് ഗൈഡ്](TROUBLESHOOTING.md) പരിശോധിക്കുക. + +AI ആപ്പുകൾ നിർമ്മിക്കുന്നതിൽ നിങ്ങൾക്ക് തടസ്സം നേരിടുകയോ എന്തെങ്കിലും ചോദ്യങ്ങളുണ്ടോ? MCP-യെക്കുറിച്ചുള്ള ചർച്ചകളിൽ സഹപാഠികളും പരിചയസമ്പന്നരായ ഡെവലപ്പർമാരും ചേർന്ന് സംവദിക്കൂ. ചോദ്യങ്ങൾക്ക് സ്വാഗതം പറയുന്ന, അറിവ് സ്വതന്ത്രമായി പങ്കിടുന്ന ഒരു പിന്തുണയുള്ള സമൂഹമാണ് ഇത്. + +[![Microsoft Foundry Discord](https://dcbadge.limes.pink/api/server/nTYy5BXMWG)](https://discord.gg/nTYy5BXMWG) + +നിങ്ങൾക്ക് ഉൽപ്പന്ന പ്രതികരണമോ നിർമ്മാണത്തിൽ പിഴവുകളോ ഉണ്ടെങ്കിൽ സന്ദർശിക്കുക: + +[![Microsoft Foundry Developer Forum](https://img.shields.io/badge/GitHub-Microsoft_Foundry_Developer_Forum-blue?style=for-the-badge&logo=github&color=000000&logoColor=fff)](https://aka.ms/foundry/forum) + +--- + + +**അസൂയാപത്രം**: +ഈ രേഖ AI വിവർത്തന സേവനം [Co-op Translator](https://github.com/Azure/co-op-translator) ഉപയോഗിച്ച് വിവർത്തനം ചെയ്തതാണ്. നാം കൃത്യതയ്ക്ക് ശ്രമിച്ചിട്ടുണ്ടെങ്കിലും, സ്വയം പ്രവർത്തിക്കുന്ന വിവർത്തനങ്ങളിൽ പിശകുകൾ അല്ലെങ്കിൽ തെറ്റുകൾ ഉണ്ടാകാമെന്ന് ദയവായി ശ്രദ്ധിക്കുക. അതിന്റെ മാതൃഭാഷയിലുള്ള യഥാർത്ഥ രേഖയാണ് പ്രാമാണികമായ ഉറവിടം എന്ന് പരിഗണിക്കേണ്ടതാണ്. നിർണായകമായ വിവരങ്ങൾക്ക്, പ്രൊഫഷണൽ മനുഷ്യ വിവർത്തനം ശുപാർശ ചെയ്യപ്പെടുന്നു. ഈ വിവർത്തനം ഉപയോഗിക്കുന്നതിൽ നിന്നുണ്ടാകുന്ന ഏതെങ്കിലും തെറ്റിദ്ധാരണകൾക്കോ തെറ്റായ വ്യാഖ്യാനങ്ങൾക്കോ ഞങ്ങൾ ഉത്തരവാദികളല്ല. + \ No newline at end of file diff --git a/translations/ml/SECURITY.md b/translations/ml/SECURITY.md new file mode 100644 index 00000000..a1fe14c4 --- /dev/null +++ b/translations/ml/SECURITY.md @@ -0,0 +1,53 @@ + +## Security + +Microsoft നമ്മുടെ സോഫ്റ്റ്വെയർ ഉൽപ്പന്നങ്ങളും സേവനങ്ങളും സുരക്ഷിതമാക്കുന്നതിൽ ഗൗരവമുണ്ട്, ഇതിൽ നമ്മുടെ GitHub സംഘടനകൾ വഴി നിയന്ത്രിക്കുന്ന എല്ലാ സോഴ്‌സ് കോഡ് റിപോസിറ്ററികളും ഉൾപ്പെടുന്നു, അവയിൽ [Microsoft](https://github.com/Microsoft), [Azure](https://github.com/Azure), [DotNet](https://github.com/dotnet), [AspNet](https://github.com/aspnet), [Xamarin](https://github.com/xamarin), കൂടാതെ [നമ്മുടെ GitHub സംഘടനകൾ](https://opensource.microsoft.com/) ഉൾപ്പെടുന്നു. + +നിങ്ങൾക്ക് Microsoft-ന്റെ ഉടമസ്ഥതയിലുള്ള ഏതെങ്കിലും റിപോസിറ്ററിയിൽ [Microsoft-ന്റെ സുരക്ഷാ ദുർബലതയുടെ നിർവചനത്തിന്](https://docs.microsoft.com/en-us/previous-versions/tn-archive/cc751383(v=technet.10)) അനുയോജ്യമായ ഒരു സുരക്ഷാ ദുർബലത കണ്ടെത്തിയതായി തോന്നുന്നുവെങ്കിൽ, താഴെ വിവരിച്ചിരിക്കുന്നതുപോലെ അത് ഞങ്ങളോട് റിപ്പോർട്ട് ചെയ്യുക. + +## Reporting Security Issues + +**സുരക്ഷാ ദുർബലതകൾ പൊതു GitHub ഇഷ്യൂസിലൂടെ റിപ്പോർട്ട് ചെയ്യരുത്.** + +പകരം, ദയവായി അവ Microsoft Security Response Center (MSRC) ൽ [https://msrc.microsoft.com/create-report](https://msrc.microsoft.com/create-report) എന്ന വിലാസത്തിൽ റിപ്പോർട്ട് ചെയ്യുക. + +ലോഗിൻ ചെയ്യാതെ സമർപ്പിക്കാൻ നിങ്ങൾക്ക് ഇഷ്ടമെങ്കിൽ, [secure@microsoft.com](mailto:secure@microsoft.com) എന്ന ഇമെയിലിലേക്ക് അയയ്ക്കുക. സാധ്യമായെങ്കിൽ, ഞങ്ങളുടെ PGP കീ ഉപയോഗിച്ച് നിങ്ങളുടെ സന്ദേശം എൻക്രിപ്റ്റ് ചെയ്യുക; അത് [Microsoft Security Response Center PGP Key പേജ്](https://www.microsoft.com/en-us/msrc/pgp-key-msrc) ൽ നിന്ന് ഡൗൺലോഡ് ചെയ്യുക. + +നിങ്ങൾക്ക് 24 മണിക്കൂറിനുള്ളിൽ ഒരു പ്രതികരണം ലഭിക്കണം. എന്തെങ്കിലും കാരണത്താൽ ലഭിക്കാത്ത പക്ഷം, ഞങ്ങൾ നിങ്ങളുടെ പ്രാഥമിക സന്ദേശം സ്വീകരിച്ചിട്ടുണ്ടെന്ന് ഉറപ്പാക്കാൻ ഇമെയിൽ വഴി ഫോളോ അപ്പ് ചെയ്യുക. കൂടുതൽ വിവരങ്ങൾ [microsoft.com/msrc](https://www.microsoft.com/msrc) ൽ ലഭ്യമാണ്. + +ദയവായി താഴെപ്പറയുന്ന ആവശ്യമായ വിവരങ്ങൾ (നിങ്ങൾക്ക് നൽകാൻ കഴിയുന്നത്ര) ഉൾപ്പെടുത്തുക, ഇത് പ്രശ്നത്തിന്റെ സ്വഭാവവും പരിധിയും നമുക്ക് മെച്ചമായി മനസ്സിലാക്കാൻ സഹായിക്കും: + + * പ്രശ്നത്തിന്റെ തരം (ഉദാ: ബഫർ ഓവർഫ്ലോ, SQL ഇൻജക്ഷൻ, ക്രോസ്-സൈറ്റ് സ്ക്രിപ്റ്റിംഗ്, തുടങ്ങിയവ) + * പ്രശ്നം പ്രകടമാകുന്ന സോഴ്‌സ് ഫയലുകളുടെ പൂർണ്ണ പാതകൾ + * ബാധിച്ച സോഴ്‌സ് കോഡിന്റെ സ്ഥാനം (ടാഗ്/ബ്രാഞ്ച്/കമ്മിറ്റ് അല്ലെങ്കിൽ നേരിട്ട് URL) + * പ്രശ്നം പുനരാവർത്തിപ്പിക്കാൻ ആവശ്യമായ പ്രത്യേക കോൺഫിഗറേഷൻ + * പ്രശ്നം പുനരാവർത്തിപ്പിക്കാൻ ഘട്ടം-ഘട്ടമായ നിർദ്ദേശങ്ങൾ + * പ്രൂഫ്-ഓഫ്-കോൺസെപ്റ്റ് അല്ലെങ്കിൽ എക്സ്പ്ലോയിറ്റ് കോഡ് (സാധ്യമായെങ്കിൽ) + * പ്രശ്നത്തിന്റെ പ്രഭാവം, അതിൽ ഒരു ആക്രമണകാരൻ എങ്ങനെ പ്രശ്നം ഉപയോഗപ്പെടുത്താമെന്ന് ഉൾപ്പെടെ + +ഈ വിവരങ്ങൾ നിങ്ങളുടെ റിപ്പോർട്ട് വേഗത്തിൽ പരിശോധിക്കാൻ സഹായിക്കും. + +നിങ്ങൾ ബഗ് ബൗണ്ടിക്ക് റിപ്പോർട്ട് ചെയ്യുകയാണെങ്കിൽ, കൂടുതൽ സമഗ്രമായ റിപ്പോർട്ടുകൾ ഉയർന്ന ബൗണ്ടി അവാർഡിന് സഹായകമാകും. ഞങ്ങളുടെ [Microsoft Bug Bounty Program](https://microsoft.com/msrc/bounty) പേജ് സന്ദർശിച്ച് സജീവ പ്രോഗ്രാമുകൾക്കുറിച്ച് കൂടുതൽ വിവരങ്ങൾ അറിയുക. + +## Preferred Languages + +എല്ലാ ആശയവിനിമയവും ഇംഗ്ലീഷിൽ ആയിരിക്കണമെന്ന് ഞങ്ങൾ അഭിലഷിക്കുന്നു. + +## Policy + +Microsoft [Coordinated Vulnerability Disclosure](https://www.microsoft.com/en-us/msrc/cvd) എന്ന സിദ്ധാന്തം പിന്തുടരുന്നു. + +--- + + +**അസൂയാ**: +ഈ രേഖ AI വിവർത്തന സേവനം [Co-op Translator](https://github.com/Azure/co-op-translator) ഉപയോഗിച്ച് വിവർത്തനം ചെയ്തതാണ്. നാം കൃത്യതയ്ക്ക് ശ്രമിച്ചെങ്കിലും, സ്വയം പ്രവർത്തിക്കുന്ന വിവർത്തനങ്ങളിൽ പിശകുകൾ അല്ലെങ്കിൽ തെറ്റുകൾ ഉണ്ടാകാമെന്ന് ദയവായി ശ്രദ്ധിക്കുക. അതിന്റെ മാതൃഭാഷയിലുള്ള യഥാർത്ഥ രേഖയാണ് പ്രാമാണികമായ ഉറവിടം എന്ന് പരിഗണിക്കേണ്ടതാണ്. നിർണായകമായ വിവരങ്ങൾക്ക്, പ്രൊഫഷണൽ മനുഷ്യ വിവർത്തനം ശുപാർശ ചെയ്യപ്പെടുന്നു. ഈ വിവർത്തനം ഉപയോഗിക്കുന്നതിൽ നിന്നുണ്ടാകുന്ന ഏതെങ്കിലും തെറ്റിദ്ധാരണകൾക്കോ തെറ്റായ വ്യാഖ്യാനങ്ങൾക്കോ ഞങ്ങൾ ഉത്തരവാദികളല്ല. + \ No newline at end of file diff --git a/translations/ml/SUPPORT.md b/translations/ml/SUPPORT.md new file mode 100644 index 00000000..a7e9d4a5 --- /dev/null +++ b/translations/ml/SUPPORT.md @@ -0,0 +1,26 @@ + +# പിന്തുണ +## പ്രശ്നങ്ങൾ ഫയൽ ചെയ്യാനും സഹായം ലഭിക്കാനും + +ഈ പ്രോജക്ട് ബഗുകളും ഫീച്ചർ അഭ്യർത്ഥനകളും ട്രാക്ക് ചെയ്യാൻ GitHub Issues ഉപയോഗിക്കുന്നു. പുനരാവൃതികൾ ഒഴിവാക്കാൻ പുതിയ പ്രശ്നങ്ങൾ ഫയൽ ചെയ്യുന്നതിന് മുമ്പ് നിലവിലുള്ള പ്രശ്നങ്ങൾ തിരയുക. പുതിയ പ്രശ്നങ്ങൾക്കായി, നിങ്ങളുടെ ബഗ് അല്ലെങ്കിൽ ഫീച്ചർ അഭ്യർത്ഥന പുതിയ ഒരു പ്രശ്നമായി ഫയൽ ചെയ്യുക. + +ഈ പ്രോജക്ട് ഉപയോഗിക്കുന്നതിനെക്കുറിച്ചുള്ള സഹായത്തിനും ചോദ്യങ്ങൾക്കും, ഒരു പ്രശ്നം ഫയൽ ചെയ്യുക. + +## Microsoft പിന്തുണ നയം + +ഈ റിപ്പോസിറ്ററിയുടെ പിന്തുണ മുകളിൽ പട്ടികപ്പെടുത്തിയ വിഭവങ്ങളിലേക്കാണ് പരിമിതമായിരിക്കുന്നത്. + +--- + + +**അസൂയാ**: +ഈ രേഖ AI വിവർത്തന സേവനം [Co-op Translator](https://github.com/Azure/co-op-translator) ഉപയോഗിച്ച് വിവർത്തനം ചെയ്തതാണ്. നാം കൃത്യതയ്ക്ക് ശ്രമിച്ചെങ്കിലും, സ്വയം പ്രവർത്തിക്കുന്ന വിവർത്തനങ്ങളിൽ പിശകുകൾ അല്ലെങ്കിൽ തെറ്റുകൾ ഉണ്ടാകാമെന്ന് ദയവായി ശ്രദ്ധിക്കുക. അതിന്റെ മാതൃഭാഷയിലുള്ള യഥാർത്ഥ രേഖയാണ് പ്രാമാണികമായ ഉറവിടം എന്ന് പരിഗണിക്കേണ്ടതാണ്. നിർണായകമായ വിവരങ്ങൾക്ക്, പ്രൊഫഷണൽ മനുഷ്യ വിവർത്തനം ശുപാർശ ചെയ്യപ്പെടുന്നു. ഈ വിവർത്തനം ഉപയോഗിക്കുന്നതിൽ നിന്നുണ്ടാകുന്ന ഏതെങ്കിലും തെറ്റിദ്ധാരണകൾക്കോ തെറ്റായ വ്യാഖ്യാനങ്ങൾക്കോ ഞങ്ങൾ ഉത്തരവാദികളല്ല. + \ No newline at end of file diff --git a/translations/ml/TROUBLESHOOTING.md b/translations/ml/TROUBLESHOOTING.md new file mode 100644 index 00000000..dc8bb101 --- /dev/null +++ b/translations/ml/TROUBLESHOOTING.md @@ -0,0 +1,629 @@ + +# പ്രശ്നപരിഹാര ഗൈഡ് + +ഡാറ്റാ സയൻസ് ഫോർ ബിഗിനേഴ്സ് പാഠ്യപദ്ധതിയുമായി പ്രവർത്തിക്കുമ്പോൾ നിങ്ങൾക്ക് നേരിടാവുന്ന സാധാരണ പ്രശ്നങ്ങൾക്ക് ഈ ഗൈഡ് പരിഹാരങ്ങൾ നൽകുന്നു. + +## ഉള്ളടക്ക പട്ടിക + +- [Python and Jupyter Issues](../..) +- [Package and Dependency Issues](../..) +- [Jupyter Notebook Issues](../..) +- [Quiz Application Issues](../..) +- [Git and GitHub Issues](../..) +- [Docsify Documentation Issues](../..) +- [Data and File Issues](../..) +- [Performance Issues](../..) +- [Getting Additional Help](../..) + +## Python and Jupyter Issues + +### Python കണ്ടെത്താനാകുന്നില്ല അല്ലെങ്കിൽ തെറ്റായ പതിപ്പ് + +**പ്രശ്നം:** `python: command not found` അല്ലെങ്കിൽ തെറ്റായ Python പതിപ്പ് + +**പരിഹാരം:** + +```bash +# പൈത്തൺ പതിപ്പ് പരിശോധിക്കുക +python --version +python3 --version + +# പൈത്തൺ 3 'python3' എന്ന പേരിൽ ഇൻസ്റ്റാൾ ചെയ്തിട്ടുണ്ടെങ്കിൽ, ഒരു അലിയാസ് സൃഷ്ടിക്കുക +# macOS/Linux-ൽ, ~/.bashrc അല്ലെങ്കിൽ ~/.zshrc-ലേക്ക് ചേർക്കുക: +alias python=python3 +alias pip=pip3 + +# അല്ലെങ്കിൽ python3 വ്യക്തമായി ഉപയോഗിക്കുക +python3 -m pip install jupyter +``` + +**Windows പരിഹാരം:** +1. [python.org](https://www.python.org/) ൽ നിന്ന് Python വീണ്ടും ഇൻസ്റ്റാൾ ചെയ്യുക +2. ഇൻസ്റ്റലേഷൻ സമയത്ത് "Add Python to PATH" തിരഞ്ഞെടുക്കുക +3. നിങ്ങളുടെ ടെർമിനൽ/കമാൻഡ് പ്രോംപ്റ്റ് റീസ്റ്റാർട്ട് ചെയ്യുക + +### Virtual Environment സജീവമാക്കൽ പ്രശ്നങ്ങൾ + +**പ്രശ്നം:** Virtual environment സജീവമാകുന്നില്ല + +**പരിഹാരം:** + +**Windows:** +```bash +# നിങ്ങൾക്ക് എക്സിക്യൂഷൻ നയം പിശക് ലഭിച്ചാൽ +Set-ExecutionPolicy -ExecutionPolicy RemoteSigned -Scope CurrentUser + +# പിന്നെ സജീവമാക്കുക +venv\Scripts\activate +``` + +**macOS/Linux:** +```bash +# സജീവമാക്കുന്ന സ്ക്രിപ്റ്റ് പ്രവർത്തനക്ഷമമാണെന്ന് ഉറപ്പാക്കുക +chmod +x venv/bin/activate + +# പിന്നീട് സജീവമാക്കുക +source venv/bin/activate +``` + +**സജീവമാക്കൽ സ്ഥിരീകരിക്കുക:** +```bash +# നിങ്ങളുടെ പ്രോംപ്റ്റ് (venv) കാണിക്കണം +# Python സ്ഥാനം പരിശോധിക്കുക +which python # venv കാണിക്കണം +``` + +### Jupyter Kernel പ്രശ്നങ്ങൾ + +**പ്രശ്നം:** "Kernel not found" അല്ലെങ്കിൽ "Kernel keeps dying" + +**പരിഹാരം:** + +```bash +# കർണൽ പുനഃസ്ഥാപിക്കുക +python -m ipykernel install --user --name=datascience --display-name="Python (Data Science)" + +# അല്ലെങ്കിൽ ഡിഫോൾട്ട് കർണൽ ഉപയോഗിക്കുക +python -m ipykernel install --user + +# ജുപിറ്റർ പുനരാരംഭിക്കുക +jupyter notebook +``` + +**പ്രശ്നം:** Jupyter-ൽ തെറ്റായ Python പതിപ്പ് + +**പരിഹാരം:** +```bash +# നിങ്ങളുടെ വെർച്വൽ എൻവയോൺമെന്റിൽ Jupyter ഇൻസ്റ്റാൾ ചെയ്യുക +source venv/bin/activate # ആദ്യം സജീവമാക്കുക +pip install jupyter ipykernel + +# കർണൽ രജിസ്റ്റർ ചെയ്യുക +python -m ipykernel install --user --name=venv --display-name="Python (venv)" + +# Jupyter-ൽ, Kernel -> Change kernel -> Python (venv) തിരഞ്ഞെടുക്കുക +``` + +## Package and Dependency Issues + +### Import Errors + +**പ്രശ്നം:** `ModuleNotFoundError: No module named 'pandas'` (അല്ലെങ്കിൽ മറ്റ് പാക്കേജുകൾ) + +**പരിഹാരം:** + +```bash +# വെർച്വൽ എൻവയോൺമെന്റ് സജീവമാക്കിയിട്ടുണ്ടെന്ന് ഉറപ്പാക്കുക +source venv/bin/activate # മാക്‌ഒഎസ്/ലിനക്സ് +venv\Scripts\activate # വിൻഡോസ് + +# നഷ്ടമായ പാക്കേജ് ഇൻസ്റ്റാൾ ചെയ്യുക +pip install pandas + +# എല്ലാ പൊതുവായ പാക്കേജുകളും ഇൻസ്റ്റാൾ ചെയ്യുക +pip install jupyter pandas numpy matplotlib seaborn scikit-learn + +# ഇൻസ്റ്റലേഷൻ സ്ഥിരീകരിക്കുക +python -c "import pandas; print(pandas.__version__)" +``` + +### Pip ഇൻസ്റ്റലേഷൻ പരാജയങ്ങൾ + +**പ്രശ്നം:** `pip install` അനുമതി പിഴവുകളോടെ പരാജയപ്പെടുന്നു + +**പരിഹാരം:** + +```bash +# --user ഫ്ലാഗ് ഉപയോഗിക്കുക +pip install --user package-name + +# അല്ലെങ്കിൽ വിർച്വൽ എൻവയോൺമെന്റ് ഉപയോഗിക്കുക (ശുപാർശ ചെയ്യുന്നു) +python -m venv venv +source venv/bin/activate +pip install package-name +``` + +**പ്രശ്നം:** `pip install` SSL സർട്ടിഫിക്കറ്റ് പിഴവുകളോടെ പരാജയപ്പെടുന്നു + +**പരിഹാരം:** + +```bash +# ആദ്യം പിപ്പ് അപ്ഡേറ്റ് ചെയ്യുക +python -m pip install --upgrade pip + +# വിശ്വസനീയമായ ഹോസ്റ്റുമായി ഇൻസ്റ്റാൾ ചെയ്യാൻ ശ്രമിക്കുക (താൽക്കാലിക പരിഹാരം) +pip install --trusted-host pypi.org --trusted-host files.pythonhosted.org package-name +``` + +### പാക്കേജ് പതിപ്പ് പൊരുത്തക്കേട് + +**പ്രശ്നം:** പൊരുത്തക്കേടുള്ള പാക്കേജ് പതിപ്പുകൾ + +**പരിഹാരം:** + +```bash +# പുതിയ വെർച്വൽ എൻവയോൺമെന്റ് സൃഷ്ടിക്കുക +python -m venv venv-new +source venv-new/bin/activate # അല്ലെങ്കിൽ Windows-ൽ venv-new\Scripts\activate + +# ആവശ്യമായെങ്കിൽ പ്രത്യേക പതിപ്പുകളുള്ള പാക്കേജുകൾ ഇൻസ്റ്റാൾ ചെയ്യുക +pip install pandas==1.3.0 +pip install numpy==1.21.0 + +# അല്ലെങ്കിൽ pip ആശ്രിതത്വങ്ങൾ പരിഹരിക്കട്ടെ +pip install jupyter pandas numpy matplotlib seaborn scikit-learn +``` + +## Jupyter Notebook Issues + +### Jupyter ആരംഭിക്കില്ല + +**പ്രശ്നം:** `jupyter notebook` കമാൻഡ് കണ്ടെത്താനാകുന്നില്ല + +**പരിഹാരം:** + +```bash +# Jupyter ഇൻസ്റ്റാൾ ചെയ്യുക +pip install jupyter + +# അല്ലെങ്കിൽ python -m ഉപയോഗിക്കുക +python -m jupyter notebook + +# ആവശ്യമെങ്കിൽ PATH-ലേക്ക് ചേർക്കുക (macOS/Linux) +export PATH="$HOME/.local/bin:$PATH" +``` + +### Notebook ലോഡ് ചെയ്യാനോ സേവ് ചെയ്യാനോ കഴിയുന്നില്ല + +**പ്രശ്നം:** "Notebook failed to load" അല്ലെങ്കിൽ സേവ് പിഴവുകൾ + +**പരിഹാരം:** + +1. ഫയൽ അനുമതികൾ പരിശോധിക്കുക +```bash +# നിങ്ങൾക്ക് എഴുതാനുള്ള അനുമതികൾ ഉണ്ടെന്ന് ഉറപ്പാക്കുക +ls -l notebook.ipynb +chmod 644 notebook.ipynb # ആവശ്യമെങ്കിൽ +``` + +2. ഫയൽ കേടുപാടുകൾ പരിശോധിക്കുക +```bash +# JSON ഘടന പരിശോധിക്കാൻ ടെക്സ്റ്റ് എഡിറ്ററിൽ തുറക്കാൻ ശ്രമിക്കുക +# കേടുപാടായാൽ ഉള്ളടക്കം പുതിയ നോട്ട്‌ബുക്കിലേക്ക് പകർത്തുക +``` + +3. Jupyter കാഷെ ക്ലിയർ ചെയ്യുക +```bash +jupyter notebook --clear-cache +``` + +### സെൽ പ്രവർത്തിക്കില്ല + +**പ്രശ്നം:** സെൽ "In [*]" എന്ന നിലയിൽ കുടുങ്ങി അല്ലെങ്കിൽ വളരെ സമയം എടുക്കുന്നു + +**പരിഹാരം:** + +1. **Kernel ഇടപെടുക**: "Interrupt" ബട്ടൺ ക്ലിക്ക് ചെയ്യുക അല്ലെങ്കിൽ `I, I` അമർത്തുക +2. **Kernel റീസ്റ്റാർട്ട് ചെയ്യുക**: Kernel മെനു → Restart +3. നിങ്ങളുടെ കോഡിൽ അനന്ത ലൂപ്പുകൾ ഉണ്ടോ എന്ന് പരിശോധിക്കുക +4. **ഔട്ട്പുട്ട് ക്ലിയർ ചെയ്യുക**: സെൽ → All Output → Clear + +### പ്ലോട്ടുകൾ കാണിക്കുന്നില്ല + +**പ്രശ്നം:** `matplotlib` പ്ലോട്ടുകൾ നോട്ട്‌ബുക്കിൽ കാണിക്കുന്നില്ല + +**പരിഹാരം:** + +```python +# നോട്ട്‌ബുക്കിന്റെ മുകളിൽ മാജിക് കമാൻഡ് ചേർക്കുക +%matplotlib inline + +import matplotlib.pyplot as plt + +# പ്ലോട്ട് സൃഷ്ടിക്കുക +plt.plot([1, 2, 3, 4]) +plt.show() # show() വിളിക്കുന്നത് ഉറപ്പാക്കുക +``` + +**ഇന്ററാക്ടീവ് പ്ലോട്ടുകൾക്കുള്ള ബദൽ:** +```python +%matplotlib notebook +# അല്ലെങ്കിൽ +%matplotlib widget +``` + +## Quiz Application Issues + +### npm install പരാജയപ്പെടുന്നു + +**പ്രശ്നം:** `npm install` സമയത്ത് പിഴവുകൾ + +**പരിഹാരം:** + +```bash +# npm കാഷെ ക്ലിയർ ചെയ്യുക +npm cache clean --force + +# node_modules ഉം package-lock.json ഉം നീക്കം ചെയ്യുക +rm -rf node_modules package-lock.json + +# പുനഃസ്ഥാപിക്കുക +npm install + +# ഇപ്പോഴും പരാജയപ്പെടുന്നുവെങ്കിൽ, legacy peer deps ഉപയോഗിച്ച് ശ്രമിക്കുക +npm install --legacy-peer-deps +``` + +### Quiz ആപ്പ് ആരംഭിക്കില്ല + +**പ്രശ്നം:** `npm run serve` പരാജയപ്പെടുന്നു + +**പരിഹാരം:** + +```bash +# Node.js പതിപ്പ് പരിശോധിക്കുക +node --version # 12.x അല്ലെങ്കിൽ അതിനുമുകളിൽ ആയിരിക്കണം + +# ആശ്രിതങ്ങൾ വീണ്ടും ഇൻസ്റ്റാൾ ചെയ്യുക +cd quiz-app +rm -rf node_modules package-lock.json +npm install + +# വ്യത്യസ്ത പോർട്ട് പരീക്ഷിക്കുക +npm run serve -- --port 8081 +``` + +### പോർട്ട് ഇതിനകം ഉപയോഗത്തിലാണ് + +**പ്രശ്നം:** "Port 8080 is already in use" + +**പരിഹാരം:** + +```bash +# 8080 പോർട്ടിൽ പ്രവർത്തിക്കുന്ന പ്രോസസ്സ് കണ്ടെത്തി നശിപ്പിക്കുക +# macOS/Linux: +lsof -ti:8080 | xargs kill -9 + +# Windows: +netstat -ano | findstr :8080 +taskkill /PID /F + +# അല്ലെങ്കിൽ വ്യത്യസ്തമായ ഒരു പോർട്ട് ഉപയോഗിക്കുക +npm run serve -- --port 8081 +``` + +### Quiz ലോഡ് ചെയ്യാനോ ശൂന്യ പേജ് കാണിക്കാനോ കഴിയുന്നില്ല + +**പ്രശ്നം:** Quiz ആപ്പ് ലോഡ് ആകുന്നു പക്ഷേ ശൂന്യ പേജ് കാണിക്കുന്നു + +**പരിഹാരം:** + +1. ബ്രൗസർ കോൺസോൾ പിഴവുകൾ പരിശോധിക്കുക (F12) +2. ബ്രൗസർ കാഷെയും കുക്കികളും ക്ലിയർ ചെയ്യുക +3. വേറെ ബ്രൗസർ പരീക്ഷിക്കുക +4. ജാവാസ്ക്രിപ്റ്റ് സജീവമാണെന്ന് ഉറപ്പാക്കുക +5. അഡ്ബ്ലോക്കറുകൾ തടസ്സം സൃഷ്ടിക്കുന്നുണ്ടോ എന്ന് പരിശോധിക്കുക + +```bash +# ആപ്പ് പുനർനിർമ്മിക്കുക +npm run build +npm run serve +``` + +## Git and GitHub Issues + +### Git തിരിച്ചറിയുന്നില്ല + +**പ്രശ്നം:** `git: command not found` + +**പരിഹാരം:** + +**Windows:** +- [git-scm.com](https://git-scm.com/) ൽ നിന്ന് Git ഇൻസ്റ്റാൾ ചെയ്യുക +- ഇൻസ്റ്റലേഷൻ കഴിഞ്ഞ് ടെർമിനൽ റീസ്റ്റാർട്ട് ചെയ്യുക + +**macOS:** + +> **കുറിപ്പ്:** നിങ്ങൾക്ക് Homebrew ഇൻസ്റ്റാൾ ചെയ്തിട്ടില്ലെങ്കിൽ, ആദ്യം [https://brew.sh/](https://brew.sh/) ൽ നൽകിയ നിർദ്ദേശങ്ങൾ പാലിച്ച് അത് ഇൻസ്റ്റാൾ ചെയ്യുക. +```bash +# ഹോംബ്രൂ വഴി ഇൻസ്റ്റാൾ ചെയ്യുക +brew install git + +# അല്ലെങ്കിൽ Xcode കമാൻഡ് ലൈൻ ടൂളുകൾ ഇൻസ്റ്റാൾ ചെയ്യുക +xcode-select --install +``` + +**Linux:** +```bash +sudo apt-get install git # ഡെബിയൻ/ഉബുണ്ടു +sudo dnf install git # ഫെഡോറാ +``` + +### Clone പരാജയപ്പെടുന്നു + +**പ്രശ്നം:** `git clone` ഓതന്റിക്കേഷൻ പിഴവുകളോടെ പരാജയപ്പെടുന്നു + +**പരിഹാരം:** + +```bash +# HTTPS URL ഉപയോഗിക്കുക +git clone https://github.com/microsoft/Data-Science-For-Beginners.git + +# GitHub-ൽ 2FA സജ്ജമാക്കിയിട്ടുണ്ടെങ്കിൽ, Personal Access Token ഉപയോഗിക്കുക +# ടോക്കൺ സൃഷ്ടിക്കുക: https://github.com/settings/tokens +# ചോദിക്കുമ്പോൾ പാസ്‌വേഡായി ടോക്കൺ ഉപയോഗിക്കുക +``` + +### Permission Denied (publickey) + +**പ്രശ്നം:** SSH കീ ഓതന്റിക്കേഷൻ പരാജയപ്പെടുന്നു + +**പരിഹാരം:** + +```bash +# SSH കീ ജനറേറ്റ് ചെയ്യുക +ssh-keygen -t ed25519 -C "your_email@example.com" + +# കീ ssh-agent-ലേക്ക് ചേർക്കുക +eval "$(ssh-agent -s)" +ssh-add ~/.ssh/id_ed25519 + +# പബ്ലിക് കീ GitHub-ലേക്ക് ചേർക്കുക +# കീ കോപ്പി ചെയ്യുക: cat ~/.ssh/id_ed25519.pub +# ഇവിടെ ചേർക്കുക: https://github.com/settings/keys +``` + +## Docsify Documentation Issues + +### Docsify കമാൻഡ് കണ്ടെത്താനാകുന്നില്ല + +**പ്രശ്നം:** `docsify: command not found` + +**പരിഹാരം:** + +```bash +# ആഗോളമായി ഇൻസ്റ്റാൾ ചെയ്യുക +npm install -g docsify-cli + +# macOS/Linux-ൽ അനുമതി പിശക് ഉണ്ടെങ്കിൽ +sudo npm install -g docsify-cli + +# ഇൻസ്റ്റലേഷൻ സ്ഥിരീകരിക്കുക +docsify --version + +# ഇപ്പോഴും കണ്ടെത്താനാകുന്നില്ലെങ്കിൽ, npm ആഗോള പാത ചേർക്കുക +# npm ആഗോള പാത കണ്ടെത്തുക +npm config get prefix + +# PATH-ലേക്ക് ചേർക്കുക (~/.bashrc അല്ലെങ്കിൽ ~/.zshrc-ലേക്ക് ചേർക്കുക) +export PATH="$PATH:/usr/local/bin" +``` + +### ഡോക്യുമെന്റേഷൻ ലോഡ് ചെയ്യാനാകുന്നില്ല + +**പ്രശ്നം:** Docsify സർവ് ചെയ്യുന്നു പക്ഷേ ഉള്ളടക്കം ലോഡ് ചെയ്യുന്നില്ല + +**പരിഹാരം:** + +```bash +# നിങ്ങൾ റിപോസിറ്ററി റൂട്ടിൽ ഉണ്ടെന്ന് ഉറപ്പാക്കുക +cd Data-Science-For-Beginners + +# index.html പരിശോധിക്കുക +ls index.html + +# പ്രത്യേക പോർട്ടിൽ സർവ് ചെയ്യുക +docsify serve --port 3000 + +# ബ്രൗസർ കോൺസോളിൽ പിശകുകൾ പരിശോധിക്കുക (F12) +``` + +### ചിത്രങ്ങൾ കാണിക്കുന്നില്ല + +**പ്രശ്നം:** ചിത്രങ്ങൾ തകരാറുള്ള ലിങ്ക് ഐക്കൺ കാണിക്കുന്നു + +**പരിഹാരം:** + +1. ചിത്രം പാതകൾ സാപേക്ഷമാണെന്ന് പരിശോധിക്കുക +2. ചിത്രം ഫയലുകൾ റിപ്പോസിറ്ററിയിൽ ഉണ്ടെന്ന് ഉറപ്പാക്കുക +3. ബ്രൗസർ കാഷെ ക്ലിയർ ചെയ്യുക +4. ഫയൽ എക്സ്റ്റൻഷനുകൾ പൊരുത്തപ്പെടുന്നുണ്ടോ എന്ന് പരിശോധിക്കുക (ചില സിസ്റ്റങ്ങളിൽ കേസ് സെൻസിറ്റീവ്) + +## Data and File Issues + +### ഫയൽ കണ്ടെത്താനാകുന്നില്ല പിഴവുകൾ + +**പ്രശ്നം:** ഡാറ്റ ലോഡ് ചെയ്യുമ്പോൾ `FileNotFoundError` + +**പരിഹാരം:** + +```python +import os + +# നിലവിലെ പ്രവർത്തന ഡയറക്ടറി പരിശോധിക്കുക +print(os.getcwd()) + +# പൂർണ്ണ പാത ഉപയോഗിക്കുക +data_path = os.path.join(os.getcwd(), 'data', 'filename.csv') +df = pd.read_csv(data_path) + +# അല്ലെങ്കിൽ നോട്ട്‌ബുക്ക് സ്ഥിതിചെയ്യുന്ന സ്ഥലത്ത് നിന്ന് സാപേക്ഷ പാത ഉപയോഗിക്കുക +df = pd.read_csv('../data/filename.csv') + +# ഫയൽ നിലവിലുണ്ടെന്ന് സ്ഥിരീകരിക്കുക +print(os.path.exists('data/filename.csv')) +``` + +### CSV വായന പിഴവുകൾ + +**പ്രശ്നം:** CSV ഫയലുകൾ വായിക്കുമ്പോൾ പിഴവുകൾ + +**പരിഹാരം:** + +```python +import pandas as pd + +# വ്യത്യസ്ത എൻകോഡിംഗുകൾ പരീക്ഷിക്കുക +df = pd.read_csv('file.csv', encoding='utf-8') +# അല്ലെങ്കിൽ +df = pd.read_csv('file.csv', encoding='latin-1') +# അല്ലെങ്കിൽ +df = pd.read_csv('file.csv', encoding='ISO-8859-1') + +# നഷ്ടപ്പെട്ട മൂല്യങ്ങൾ കൈകാര്യം ചെയ്യുക +df = pd.read_csv('file.csv', na_values=['NA', 'N/A', '']) + +# കോമ അല്ലെങ്കിൽ ഡെലിമിറ്റർ വ്യക്തമാക്കുക +df = pd.read_csv('file.csv', delimiter=';') +``` + +### വലിയ ഡാറ്റാസെറ്റുകൾ ഉപയോഗിക്കുമ്പോൾ മെമ്മറി പിഴവുകൾ + +**പ്രശ്നം:** വലിയ ഫയലുകൾ ലോഡ് ചെയ്യുമ്പോൾ `MemoryError` + +**പരിഹാരം:** + +```python +# ചങ്കുകളായി വായിക്കുക +chunk_size = 10000 +chunks = [] +for chunk in pd.read_csv('large_file.csv', chunksize=chunk_size): + # ചങ്ക് പ്രോസസ്സ് ചെയ്യുക + chunks.append(chunk) +df = pd.concat(chunks) + +# അല്ലെങ്കിൽ പ്രത്യേക കോളങ്ങൾ മാത്രം വായിക്കുക +df = pd.read_csv('file.csv', usecols=['col1', 'col2']) + +# കൂടുതൽ കാര്യക്ഷമമായ ഡാറ്റാ ടൈപ്പുകൾ ഉപയോഗിക്കുക +df = pd.read_csv('file.csv', dtype={'column_name': 'int32'}) +``` + +## Performance Issues + +### നോട്ട്‌ബുക്ക് പ്രകടനം മന്ദഗതിയിലാണ് + +**പ്രശ്നം:** നോട്ട്‌ബുക്കുകൾ വളരെ മന്ദഗതിയിലാണ് പ്രവർത്തിക്കുന്നത് + +**പരിഹാരം:** + +1. **Kernel റീസ്റ്റാർട്ട് ചെയ്ത് ഔട്ട്പുട്ട് ക്ലിയർ ചെയ്യുക** + - Kernel → Restart & Clear Output + +2. **ഉപയോഗിക്കാത്ത നോട്ട്‌ബുക്കുകൾ അടയ്ക്കുക** + +3. **കോഡ് ഒപ്റ്റിമൈസ് ചെയ്യുക:** +```python +# ലൂപ്പുകൾക്ക് പകരം വെക്ടറൈസ്ഡ് ഓപ്പറേഷനുകൾ ഉപയോഗിക്കുക +# മോശം: +result = [] +for x in data: + result.append(x * 2) + +# നല്ലത്: +result = data * 2 # NumPy/Pandas വെക്ടറൈസേഷൻ +``` + +4. **വലിയ ഡാറ്റാസെറ്റുകൾ സാമ്പിൾ ചെയ്യുക:** +```python +# വികസനത്തിനിടെ സാമ്പിളുമായി പ്രവർത്തിക്കുക +df_sample = df.sample(n=1000) # അല്ലെങ്കിൽ df.head(1000) +``` + +### ബ്രൗസർ ക്രാഷ് + +**പ്രശ്നം:** ബ്രൗസർ ക്രാഷ് ചെയ്യുന്നു അല്ലെങ്കിൽ പ്രതികരിക്കാതെ പോകുന്നു + +**പരിഹാരം:** + +1. ഉപയോഗിക്കാത്ത ടാബുകൾ അടയ്ക്കുക +2. ബ്രൗസർ കാഷെ ക്ലിയർ ചെയ്യുക +3. ബ്രൗസർ മെമ്മറി വർദ്ധിപ്പിക്കുക (Chrome: `chrome://settings/system`) +4. JupyterLab ഉപയോഗിക്കുക: +```bash +pip install jupyterlab +jupyter lab +``` + +## Getting Additional Help + +### സഹായം ചോദിക്കുന്നതിന് മുമ്പ് + +1. ഈ പ്രശ്നപരിഹാര ഗൈഡ് പരിശോധിക്കുക +2. [GitHub Issues](https://github.com/microsoft/Data-Science-For-Beginners/issues) തിരയുക +3. [INSTALLATION.md](INSTALLATION.md) ഉം [USAGE.md](USAGE.md) ഉം അവലോകനം ചെയ്യുക +4. പിഴവിന്റെ സന്ദേശം ഓൺലൈനിൽ തിരയാൻ ശ്രമിക്കുക + +### സഹായം ചോദിക്കുന്ന വിധം + +പ്രശ്നം സൃഷ്ടിക്കുമ്പോൾ അല്ലെങ്കിൽ സഹായം ചോദിക്കുമ്പോൾ ഉൾപ്പെടുത്തുക: + +1. **ഓപ്പറേറ്റിംഗ് സിസ്റ്റം**: Windows, macOS, അല്ലെങ്കിൽ Linux (ഏത് ഡിസ്‌ട്രിബ്യൂഷൻ) +2. **Python പതിപ്പ്**: `python --version` ഓടിക്കുക +3. **പിഴവ് സന്ദേശം**: പൂർണ്ണമായ പിഴവ് സന്ദേശം പകർത്തുക +4. **പുനരാവർത്തനത്തിന് വേണ്ട ഘട്ടങ്ങൾ**: പിഴവ് സംഭവിക്കുന്നതിന് മുമ്പ് നിങ്ങൾ ചെയ്തത് +5. **നിങ്ങൾ ശ്രമിച്ച കാര്യങ്ങൾ**: നിങ്ങൾ ഇതിനകം പരീക്ഷിച്ച പരിഹാരങ്ങൾ + +**ഉദാഹരണം:** +``` +**Operating System:** macOS 12.0 +**Python Version:** 3.9.7 +**Error Message:** ModuleNotFoundError: No module named 'pandas' +**Steps to Reproduce:** +1. Activated virtual environment +2. Started Jupyter notebook +3. Tried to import pandas + +**What I've Tried:** +- Ran pip install pandas +- Restarted Jupyter +``` + +### കമ്മ്യൂണിറ്റി വിഭവങ്ങൾ + +- **GitHub Issues**: [Create an issue](https://github.com/microsoft/Data-Science-For-Beginners/issues/new) +- **Discord**: [Join our community](https://aka.ms/ds4beginners/discord) +- **Discussions**: [GitHub Discussions](https://github.com/microsoft/Data-Science-For-Beginners/discussions) +- **Microsoft Learn**: [Q&A Forums](https://docs.microsoft.com/answers/) + +### ബന്ധപ്പെട്ട ഡോക്യുമെന്റേഷൻ + +- [INSTALLATION.md](INSTALLATION.md) - സെറ്റപ്പ് നിർദ്ദേശങ്ങൾ +- [USAGE.md](USAGE.md) - പാഠ്യപദ്ധതി ഉപയോഗിക്കുന്ന വിധം +- [CONTRIBUTING.md](CONTRIBUTING.md) - സംഭാവന ചെയ്യാനുള്ള മാർഗ്ഗങ്ങൾ +- [README.md](README.md) - പ്രോജക്ട് അവലോകനം + +--- + + +**അസൂയാപത്രം**: +ഈ രേഖ AI വിവർത്തന സേവനം [Co-op Translator](https://github.com/Azure/co-op-translator) ഉപയോഗിച്ച് വിവർത്തനം ചെയ്തതാണ്. നാം കൃത്യതയ്ക്ക് ശ്രമിച്ചിട്ടുണ്ടെങ്കിലും, സ്വയം പ്രവർത്തിക്കുന്ന വിവർത്തനങ്ങളിൽ പിശകുകൾ അല്ലെങ്കിൽ തെറ്റുകൾ ഉണ്ടാകാമെന്ന് ദയവായി ശ്രദ്ധിക്കുക. അതിന്റെ മാതൃഭാഷയിലുള്ള യഥാർത്ഥ രേഖയാണ് പ്രാമാണികമായ ഉറവിടം എന്ന് പരിഗണിക്കേണ്ടതാണ്. നിർണായകമായ വിവരങ്ങൾക്ക്, പ്രൊഫഷണൽ മനുഷ്യ വിവർത്തനം ശുപാർശ ചെയ്യപ്പെടുന്നു. ഈ വിവർത്തനം ഉപയോഗിക്കുന്നതിൽ നിന്നുണ്ടാകുന്ന ഏതെങ്കിലും തെറ്റിദ്ധാരണകൾക്കോ തെറ്റായ വ്യാഖ്യാനങ്ങൾക്കോ ഞങ്ങൾ ഉത്തരവാദികളല്ല. + \ No newline at end of file diff --git a/translations/ml/USAGE.md b/translations/ml/USAGE.md new file mode 100644 index 00000000..b1b1310f --- /dev/null +++ b/translations/ml/USAGE.md @@ -0,0 +1,376 @@ + +# ഉപയോഗ മാർഗ്ഗനിർദ്ദേശം + +ഡാറ്റാ സയൻസ് ഫോർ ബിഗിനേഴ്സ് പാഠ്യപദ്ധതിയുടെ ഉദാഹരണങ്ങളും സാധാരണ പ്രവൃത്തിപദ്ധതികളും ഈ മാർഗ്ഗനിർദ്ദേശം നൽകുന്നു. + +## ഉള്ളടക്ക പട്ടിക + +- [ഈ പാഠ്യപദ്ധതി എങ്ങനെ ഉപയോഗിക്കാം](../..) +- [പാഠങ്ങളുമായി പ്രവർത്തിക്കൽ](../..) +- [ജുപിറ്റർ നോട്ട്‌ബുക്കുകളുമായി പ്രവർത്തിക്കൽ](../..) +- [ക്വിസ് അപ്ലിക്കേഷൻ ഉപയോഗിക്കൽ](../..) +- [സാധാരണ പ്രവൃത്തിപദ്ധതികൾ](../..) +- [സ്വയം പഠിക്കുന്നവർക്കുള്ള ടിപ്പുകൾ](../..) +- [അധ്യാപകർക്കുള്ള ടിപ്പുകൾ](../..) + +## ഈ പാഠ്യപദ്ധതി എങ്ങനെ ഉപയോഗിക്കാം + +ഈ പാഠ്യപദ്ധതി ലവചികമായും വിവിധ രീതികളിൽ ഉപയോഗിക്കാവുന്നതുമായ രീതിയിൽ രൂപകൽപ്പന ചെയ്തിരിക്കുന്നു: + +- **സ്വയംനിർദ്ദേശ പഠനം**: നിങ്ങളുടെ സ്വന്തം വേഗതയിൽ സ്വതന്ത്രമായി പാഠങ്ങൾ പഠിക്കുക +- **ക്ലാസ്‌റൂം നിർദ്ദേശം**: മാർഗ്ഗനിർദ്ദേശത്തോടെ ഘടനാപരമായ കോഴ്സ് ആയി ഉപയോഗിക്കുക +- **അധ്യയന ഗ്രൂപ്പുകൾ**: കൂട്ടായ്മയിൽ സഹപാഠികളോടൊപ്പം പഠിക്കുക +- **വർക്ക്‌ഷോപ്പ് ഫോർമാറ്റ്**: തീവ്രമായ ചെറുകാല പഠന സെഷനുകൾ + +## പാഠങ്ങളുമായി പ്രവർത്തിക്കൽ + +ഓരോ പാഠവും പഠനം പരമാവധി ആക്കാൻ സ്ഥിരമായ ഘടന പിന്തുടരുന്നു: + +### പാഠ ഘടന + +1. **പ്രീ-പാഠ ക്വിസ്**: നിലവിലുള്ള അറിവ് പരിശോധിക്കുക +2. **സ്കെച്ച്നോട്ട്** (ഐച്ഛികം): പ്രധാന ആശയങ്ങളുടെ ദൃശ്യ സംഗ്രഹം +3. **വീഡിയോ** (ഐച്ഛികം): അനുബന്ധ വീഡിയോ ഉള്ളടക്കം +4. **ലിഖിത പാഠം**: മുഖ്യ ആശയങ്ങളും വിശദീകരണങ്ങളും +5. **ജുപിറ്റർ നോട്ട്‌ബുക്ക്**: പ്രായോഗിക കോഡിംഗ് അഭ്യാസങ്ങൾ +6. **അസൈൻമെന്റ്**: പഠിച്ചതു പ്രയോഗിക്കുക +7. **പോസ്റ്റ്-പാഠ ക്വിസ്**: നിങ്ങളുടെ മനസ്സിലാക്കൽ ശക്തിപ്പെടുത്തുക + +### ഒരു പാഠത്തിനുള്ള ഉദാഹരണ പ്രവൃത്തിപദ്ധതി + +```bash +# 1. പാഠം ഡയറക്ടറിയിലേക്ക് നാവിഗേറ്റ് ചെയ്യുക +cd 1-Introduction/01-defining-data-science + +# 2. README.md വായിക്കുക +# README.md നിങ്ങളുടെ ബ്രൗസറിലോ എഡിറ്ററിലോ തുറക്കുക + +# 3. പൂർവ്വപാഠം ക്വിസ് എടുക്കുക +# README-യിലെ ക്വിസ് ലിങ്കിൽ ക്ലിക്ക് ചെയ്യുക + +# 4. Jupyter നോട്ട്‌ബുക്ക് തുറക്കുക (ലഭ്യമായാൽ) +jupyter notebook + +# 5. നോട്ട്‌ബുക്കിലെ അഭ്യാസങ്ങൾ പൂർത്തിയാക്കുക + +# 6. അസൈൻമെന്റിൽ പ്രവർത്തിക്കുക + +# 7. പാശ്ചാത്യപാഠം ക്വിസ് എടുക്കുക +``` + +## ജുപിറ്റർ നോട്ട്‌ബുക്കുകളുമായി പ്രവർത്തിക്കൽ + +### ജുപിറ്റർ ആരംഭിക്കൽ + +```bash +# നിങ്ങളുടെ വെർച്വൽ എൻവയോൺമെന്റ് സജീവമാക്കുക +source venv/bin/activate # മാക്‌ഓഎസ്/ലിനക്സിൽ +# അല്ലെങ്കിൽ +venv\Scripts\activate # വിൻഡോസിൽ + +# റിപോസിറ്ററി റൂട്ടിൽ നിന്ന് ജുപിറ്റർ ആരംഭിക്കുക +jupyter notebook +``` + +### നോട്ട്‌ബുക്ക് സെല്ലുകൾ പ്രവർത്തിപ്പിക്കൽ + +1. **ഒരു സെൽ പ്രവർത്തിപ്പിക്കുക**: `Shift + Enter` അമർത്തുക അല്ലെങ്കിൽ "Run" ബട്ടൺ ക്ലിക്ക് ചെയ്യുക +2. **എല്ലാ സെല്ലുകളും പ്രവർത്തിപ്പിക്കുക**: മെനുവിൽ നിന്ന് "Cell" → "Run All" തിരഞ്ഞെടുക്കുക +3. **കേർണൽ പുനരാരംഭിക്കുക**: പ്രശ്നങ്ങൾ ഉണ്ടെങ്കിൽ "Kernel" → "Restart" തിരഞ്ഞെടുക്കുക + +### ഉദാഹരണം: നോട്ട്‌ബുക്കിൽ ഡാറ്റയുമായി പ്രവർത്തിക്കൽ + +```python +# ആവശ്യമായ ലൈബ്രറികൾ ഇറക്കുമതി ചെയ്യുക +import pandas as pd +import numpy as np +import matplotlib.pyplot as plt + +# ഒരു ഡാറ്റാസെറ്റ് ലോഡ് ചെയ്യുക +df = pd.read_csv('data/sample.csv') + +# ഡാറ്റ പരിശോധിക്കുക +df.head() +df.info() +df.describe() + +# ഒരു ദൃശ്യവൽക്കരണം സൃഷ്ടിക്കുക +plt.figure(figsize=(10, 6)) +plt.plot(df['column_name']) +plt.title('Sample Visualization') +plt.xlabel('X-axis Label') +plt.ylabel('Y-axis Label') +plt.show() +``` + +### നിങ്ങളുടെ ജോലി സംരക്ഷിക്കൽ + +- ജുപിറ്റർ സ്വയംക്രമമായി ഇടക്കിടെ സേവ് ചെയ്യുന്നു +- മാനുവലായി സേവ് ചെയ്യാൻ: `Ctrl + S` (മാക്ഓഎസിൽ `Cmd + S`) അമർത്തുക +- നിങ്ങളുടെ പുരോഗതി `.ipynb` ഫയലിൽ സേവ് ചെയ്യപ്പെടുന്നു + +## ക്വിസ് അപ്ലിക്കേഷൻ ഉപയോഗിക്കൽ + +### ക്വിസ് ആപ്പ് ലോക്കലായി പ്രവർത്തിപ്പിക്കൽ + +```bash +# ക്വിസ് ആപ്പ് ഡയറക്ടറിയിലേക്ക് നാവിഗേറ്റ് ചെയ്യുക +cd quiz-app + +# ഡെവലപ്പ്മെന്റ് സർവർ ആരംഭിക്കുക +npm run serve + +# http://localhost:8080 ൽ ആക്‌സസ് ചെയ്യുക +``` + +### ക്വിസുകൾ എടുക്കൽ + +1. പ്രീ-പാഠ ക്വിസുകൾ ഓരോ പാഠത്തിന്റെ മുകളിൽ ലിങ്ക് ചെയ്തിരിക്കുന്നു +2. പോസ്റ്റ്-പാഠ ക്വിസുകൾ ഓരോ പാഠത്തിന്റെ താഴെ ലിങ്ക് ചെയ്തിരിക്കുന്നു +3. ഓരോ ക്വിസിലും 3 ചോദ്യങ്ങളുണ്ട് +4. ക്വിസുകൾ പഠനം ശക്തിപ്പെടുത്താൻ രൂപകൽപ്പന ചെയ്തതാണ്, പൂർണ്ണമായ പരീക്ഷണത്തിന് അല്ല + +### ക്വിസ് നമ്പറിംഗ് + +- ക്വിസുകൾ 0-39 വരെ നമ്പർ ചെയ്തിരിക്കുന്നു (മൊത്തം 40 ക്വിസുകൾ) +- ഓരോ പാഠത്തിനും സാധാരണയായി പ്രീയും പോസ്റ്റും ക്വിസ് ഉണ്ട് +- ക്വിസ് URLs-ൽ ക്വിസ് നമ്പർ ഉൾപ്പെടുന്നു: `https://ff-quizzes.netlify.app/en/ds/quiz/0` + +## സാധാരണ പ്രവൃത്തിപദ്ധതികൾ + +### പ്രവൃത്തിപദ്ധതി 1: പൂർണ്ണ തുടക്കക്കാരൻ പാത + +```bash +# 1. നിങ്ങളുടെ പരിസ്ഥിതി സജ്ജമാക്കുക (INSTALLATION.md കാണുക) + +# 2. പാഠം 1 മുതൽ ആരംഭിക്കുക +cd 1-Introduction/01-defining-data-science + +# 3. ഓരോ പാഠത്തിനും: +# - പാഠത്തിന് മുമ്പുള്ള ക്വിസ് എടുക്കുക +# - പാഠത്തിന്റെ ഉള്ളടക്കം വായിക്കുക +# - നോട്ട്‌ബുക്ക് വഴി പ്രവർത്തിക്കുക +# - അസൈൻമെന്റ് പൂർത്തിയാക്കുക +# - പാഠത്തിന് ശേഷമുള്ള ക്വിസ് എടുക്കുക + +# 4. എല്ലാ 20 പാഠങ്ങളും ക്രമമായി മുന്നോട്ട് പോകുക +``` + +### പ്രവൃത്തിപദ്ധതി 2: വിഷയം-നിർദ്ദിഷ്ട പഠനം + +നിങ്ങൾക്ക് ഒരു പ്രത്യേക വിഷയത്തിൽ താൽപര്യമുണ്ടെങ്കിൽ: + +```bash +# ഉദാഹരണം: ഡാറ്റാ ദൃശ്യീകരണത്തിൽ ശ്രദ്ധ കേന്ദ്രീകരിക്കുക +cd 3-Data-Visualization + +# പാഠങ്ങൾ 9-13 പരിശോധിക്കുക: +# - പാഠം 9: അളവുകൾ ദൃശ്യീകരിക്കൽ +# - പാഠം 10: വിതരണങ്ങൾ ദൃശ്യീകരിക്കൽ +# - പാഠം 11: അനുപാതങ്ങൾ ദൃശ്യീകരിക്കൽ +# - പാഠം 12: ബന്ധങ്ങൾ ദൃശ്യീകരിക്കൽ +# - പാഠം 13: അർത്ഥവത്തായ ദൃശ്യീകരണങ്ങൾ +``` + +### പ്രവൃത്തിപദ്ധതി 3: പ്രോജക്ട്-അധിഷ്ഠിത പഠനം + +```bash +# 1. ഡാറ്റ സയൻസ് ലൈഫ്‌സൈക്കിൾ പാഠങ്ങൾ (14-16) അവലോകനം ചെയ്യുക +cd 4-Data-Science-Lifecycle + +# 2. യഥാർത്ഥ ലോക ഉദാഹരണം വഴി പ്രവർത്തിക്കുക (പാഠം 20) +cd ../6-Data-Science-In-Wild/20-Real-World-Examples + +# 3. നിങ്ങളുടെ സ്വന്തം പ്രോജക്ടിൽ ആശയങ്ങൾ പ്രയോഗിക്കുക +``` + +### പ്രവൃത്തിപദ്ധതി 4: ക്ലൗഡ്-അധിഷ്ഠിത ഡാറ്റാ സയൻസ് + +```bash +# ക്ലൗഡ് ഡാറ്റ സയൻസ് പഠിക്കുക (പാഠങ്ങൾ 17-19) +cd 5-Data-Science-In-Cloud + +# 17: ക്ലൗഡ് ഡാറ്റ സയൻസിലേക്ക് പരിചയം +# 18: ലോ-കോഡ് എംഎൽ ടൂളുകൾ +# 19: അസ്യൂർ മെഷീൻ ലേണിംഗ് സ്റ്റുഡിയോ +``` + +## സ്വയം പഠിക്കുന്നവർക്കുള്ള ടിപ്പുകൾ + +### ക്രമീകരിച്ചിരിക്കുക + +```bash +# ഒരു പഠന ജേർണൽ സൃഷ്ടിക്കുക +mkdir my-learning-journal + +# ഓരോ പാഠത്തിനും കുറിപ്പുകൾ സൃഷ്ടിക്കുക +echo "# Lesson 1 Notes" > my-learning-journal/lesson-01-notes.md +``` + +### പതിവായി അഭ്യാസം ചെയ്യുക + +- ഓരോ ദിവസവും അല്ലെങ്കിൽ ആഴ്ചയിൽ ഒരു നിശ്ചിത സമയം മാറ്റിവെക്കുക +- ആഴ്ചയിൽ കുറഞ്ഞത് ഒരു പാഠം പൂർത്തിയാക്കുക +- മുമ്പത്തെ പാഠങ്ങൾ ഇടക്കിടെ അവലോകനം ചെയ്യുക + +### സമൂഹവുമായി ഇടപഴകുക + +- [ഡിസ്‌കോർഡ് സമൂഹം](https://aka.ms/ds4beginners/discord)യിൽ ചേരുക +- ഡിസ്‌കോർഡിലെ #Data-Science-for-Beginners ചാനലിൽ പങ്കെടുക്കുക [Discord Discussions](https://aka.ms/ds4beginners/discord) +- നിങ്ങളുടെ പുരോഗതി പങ്കുവെക്കുകയും ചോദ്യങ്ങൾ ചോദിക്കുകയും ചെയ്യുക + +### നിങ്ങളുടെ സ്വന്തം പ്രോജക്ടുകൾ നിർമ്മിക്കുക + +പാഠങ്ങൾ പൂർത്തിയാക്കിയ ശേഷം, ആശയങ്ങൾ വ്യക്തിഗത പ്രോജക്ടുകളിൽ പ്രയോഗിക്കുക: + +```python +# ഉദാഹരണം: നിങ്ങളുടെ സ്വന്തം ഡാറ്റാസെറ്റ് വിശകലനം ചെയ്യുക +import pandas as pd + +# നിങ്ങളുടെ സ്വന്തം ഡാറ്റ ലോഡ് ചെയ്യുക +my_data = pd.read_csv('my-project/data.csv') + +# പഠിച്ച സാങ്കേതിക വിദ്യകൾ പ്രയോഗിക്കുക +# - ഡാറ്റ ശുചീകരണം (പാഠം 8) +# - അന്വേഷണാത്മക ഡാറ്റ വിശകലനം (പാഠം 7) +# - ദൃശ്യവൽക്കരണം (പാഠങ്ങൾ 9-13) +# - വിശകലനം (പാഠം 15) +``` + +## അധ്യാപകർക്കുള്ള ടിപ്പുകൾ + +### ക്ലാസ്‌റൂം ക്രമീകരണം + +1. വിശദമായ മാർഗ്ഗനിർദ്ദേശങ്ങൾക്ക് [for-teachers.md](for-teachers.md) പരിശോധിക്കുക +2. പങ്കുവെക്കുന്ന പരിസ്ഥിതി സജ്ജമാക്കുക (GitHub Classroom അല്ലെങ്കിൽ Codespaces) +3. ഒരു ആശയവിനിമയ ചാനൽ സ്ഥാപിക്കുക (Discord, Slack, അല്ലെങ്കിൽ Teams) + +### പാഠം പദ്ധതിയിടൽ + +**സൂചിപ്പിച്ച 10-ആഴ്ച ഷെഡ്യൂൾ:** + +- **ആഴ്ച 1-2**: പരിചയം (പാഠങ്ങൾ 1-4) +- **ആഴ്ച 3-4**: ഡാറ്റയുമായി പ്രവർത്തിക്കൽ (പാഠങ്ങൾ 5-8) +- **ആഴ്ച 5-6**: ഡാറ്റാ ദൃശ്യീകരണം (പാഠങ്ങൾ 9-13) +- **ആഴ്ച 7-8**: ഡാറ്റാ സയൻസ് ലൈഫ്‌സൈക്കിൾ (പാഠങ്ങൾ 14-16) +- **ആഴ്ച 9**: ക്ലൗഡ് ഡാറ്റാ സയൻസ് (പാഠങ്ങൾ 17-19) +- **ആഴ്ച 10**: യാഥാർത്ഥ്യ പ്രയോഗങ്ങളും അന്തിമ പ്രോജക്ടുകളും (പാഠം 20) + +### ഓഫ്‌ലൈൻ ആക്‌സസിനായി ഡോക്സിഫൈ പ്രവർത്തിപ്പിക്കൽ + +```bash +# ക്ലാസ് റൂം ഉപയോഗത്തിനായി ഡോക്യുമെന്റേഷൻ ലോക്കലായി സർവ് ചെയ്യുക +docsify serve + +# വിദ്യാർത്ഥികൾ localhost:3000 ൽ പ്രവേശിക്കാം +# പ്രാഥമിക ക്രമീകരണത്തിന് ശേഷം ഇന്റർനെറ്റ് ആവശ്യമില്ല +``` + +### അസൈൻമെന്റ് ഗ്രേഡിംഗ് + +- പൂർത്തിയാക്കിയ അഭ്യാസങ്ങൾക്കായി വിദ്യാർത്ഥികളുടെ നോട്ട്‌ബുക്കുകൾ പരിശോധിക്കുക +- ക്വിസ് സ്കോറുകൾ വഴി മനസ്സിലാക്കൽ പരിശോധിക്കുക +- ഡാറ്റാ സയൻസ് ലൈഫ്‌സൈക്കിൾ സിദ്ധാന്തങ്ങൾ ഉപയോഗിച്ച് അന്തിമ പ്രോജക്ടുകൾ വിലയിരുത്തുക + +### അസൈൻമെന്റുകൾ സൃഷ്ടിക്കൽ + +```python +# ഉദാഹരണ കസ്റ്റം അസൈൻമെന്റ് ടെംപ്ലേറ്റ് +""" +Assignment: [Topic] + +Objective: [Learning goal] + +Dataset: [Provide or have students find one] + +Tasks: +1. Load and explore the dataset +2. Clean and prepare the data +3. Create at least 3 visualizations +4. Perform analysis +5. Communicate findings + +Deliverables: +- Jupyter notebook with code and explanations +- Written summary of findings +""" +``` + +## ഓഫ്‌ലൈൻ പ്രവർത്തനം + +### വിഭവങ്ങൾ ഡൗൺലോഡ് ചെയ്യുക + +```bash +# മുഴുവൻ റിപ്പോസിറ്ററി ക്ലോൺ ചെയ്യുക +git clone https://github.com/microsoft/Data-Science-For-Beginners.git + +# ഡാറ്റാസെറ്റുകൾ മുൻകൂട്ടി ഡൗൺലോഡ് ചെയ്യുക +# മിക്ക ഡാറ്റാസെറ്റുകളും റിപ്പോസിറ്ററിയിൽ ഉൾപ്പെടുത്തിയിട്ടുണ്ട് +``` + +### ഡോക്യുമെന്റേഷൻ ലോക്കലായി പ്രവർത്തിപ്പിക്കുക + +```bash +# ഡോക്സിഫൈയുമായി സേവനം ചെയ്യുക +docsify serve + +# localhost:3000 ൽ പ്രവേശിക്കുക +``` + +### ക്വിസ് ആപ്പ് ലോക്കലായി പ്രവർത്തിപ്പിക്കുക + +```bash +cd quiz-app +npm run serve +``` + +## വിവർത്തന ഉള്ളടക്കം ആക്‌സസ് ചെയ്യൽ + +40-ലധികം ഭാഷകളിൽ വിവർത്തനങ്ങൾ ലഭ്യമാണ്: + +```bash +# പരിഭാഷപ്പെടുത്തിയ പാഠങ്ങൾ ആക്‌സസ് ചെയ്യുക +cd translations/fr # ഫ്രഞ്ച് +cd translations/es # സ്പാനിഷ് +cd translations/de # ജർമ്മൻ +# ... കൂടാതെ മറ്റും നിരവധി +``` + +ഓരോ വിവർത്തനവും ഇംഗ്ലീഷ് പതിപ്പിന്റെ സമാന ഘടന നിലനിർത്തുന്നു. + +## അധിക വിഭവങ്ങൾ + +### പഠനം തുടരുക + +- [Microsoft Learn](https://docs.microsoft.com/learn/) - അധിക പഠന പാതകൾ +- [Student Hub](https://docs.microsoft.com/learn/student-hub) - വിദ്യാർത്ഥികൾക്കുള്ള വിഭവങ്ങൾ +- [Azure AI Foundry](https://aka.ms/foundry/forum) - സമൂഹ ഫോറം + +### ബന്ധപ്പെട്ട പാഠ്യപദ്ധതികൾ + +- [AI for Beginners](https://aka.ms/ai-beginners) +- [ML for Beginners](https://aka.ms/ml-beginners) +- [Web Dev for Beginners](https://aka.ms/webdev-beginners) +- [Generative AI for Beginners](https://aka.ms/genai-beginners) + +## സഹായം നേടുക + +- സാധാരണ പ്രശ്നങ്ങൾക്ക് [TROUBLESHOOTING.md](TROUBLESHOOTING.md) പരിശോധിക്കുക +- [GitHub Issues](https://github.com/microsoft/Data-Science-For-Beginners/issues) തിരയുക +- ഞങ്ങളുടെ [ഡിസ്‌കോർഡ്](https://aka.ms/ds4beginners/discord) ചേരുക +- പ്രശ്നങ്ങൾ റിപ്പോർട്ട് ചെയ്യാനും സംഭാവന നൽകാനും [CONTRIBUTING.md](CONTRIBUTING.md) അവലോകനം ചെയ്യുക + +--- + + +**അസൂയാപത്രം**: +ഈ രേഖ AI വിവർത്തന സേവനം [Co-op Translator](https://github.com/Azure/co-op-translator) ഉപയോഗിച്ച് വിവർത്തനം ചെയ്തതാണ്. നാം കൃത്യതയ്ക്ക് ശ്രമിച്ചിട്ടുണ്ടെങ്കിലും, യന്ത്രം ചെയ്ത വിവർത്തനങ്ങളിൽ പിശകുകൾ അല്ലെങ്കിൽ തെറ്റുകൾ ഉണ്ടാകാമെന്ന് ദയവായി ശ്രദ്ധിക്കുക. അതിന്റെ മാതൃഭാഷയിലുള്ള യഥാർത്ഥ രേഖയാണ് പ്രാമാണികമായ ഉറവിടം എന്ന് കരുതേണ്ടതാണ്. നിർണായകമായ വിവരങ്ങൾക്ക്, പ്രൊഫഷണൽ മനുഷ്യ വിവർത്തനം ശുപാർശ ചെയ്യപ്പെടുന്നു. ഈ വിവർത്തനം ഉപയോഗിക്കുന്നതിൽ നിന്നുണ്ടാകുന്ന ഏതെങ്കിലും തെറ്റിദ്ധാരണകൾക്കോ വ്യാഖ്യാനക്കേടുകൾക്കോ ഞങ്ങൾ ഉത്തരവാദികളല്ല. + \ No newline at end of file diff --git a/translations/ml/docs/_sidebar.md b/translations/ml/docs/_sidebar.md new file mode 100644 index 00000000..d6fc7890 --- /dev/null +++ b/translations/ml/docs/_sidebar.md @@ -0,0 +1,42 @@ + +- പരിചയം + - [ഡാറ്റാ സയൻസ് നിർവചനം](../1-Introduction/01-defining-data-science/README.md) + - [ഡാറ്റാ സയൻസിന്റെ നൈതികത](../1-Introduction/02-ethics/README.md) + - [ഡാറ്റ നിർവചനം](../1-Introduction/03-defining-data/README.md) + - [സാധ്യതയും സ്ഥിതിവിവരശാസ്ത്രവും](../1-Introduction/04-stats-and-probability/README.md) +- ഡാറ്റയുമായി പ്രവർത്തിക്കൽ + - [ബന്ധപ്പെട്ട ഡാറ്റാബേസുകൾ](../2-Working-With-Data/05-relational-databases/README.md) + - [ബന്ധമില്ലാത്ത ഡാറ്റാബേസുകൾ](../2-Working-With-Data/06-non-relational/README.md) + - [പൈത്തൺ](../2-Working-With-Data/07-python/README.md) + - [ഡാറ്റ തയ്യാറാക്കൽ](../2-Working-With-Data/08-data-preparation/README.md) +- ഡാറ്റാ ദൃശ്യവൽക്കരണം + - [അളവുകൾ ദൃശ്യവൽക്കരിക്കൽ](../3-Data-Visualization/09-visualization-quantities/README.md) + - [വിതരണങ്ങൾ ദൃശ്യവൽക്കരിക്കൽ](../3-Data-Visualization/10-visualization-distributions/README.md) + - [അനുപാതങ്ങൾ ദൃശ്യവൽക്കരിക്കൽ](../3-Data-Visualization/11-visualization-proportions/README.md) + - [ബന്ധങ്ങൾ ദൃശ്യവൽക്കരിക്കൽ](../3-Data-Visualization/12-visualization-relationships/README.md) + - [അർത്ഥവത്തായ ദൃശ്യവൽക്കരണങ്ങൾ](../3-Data-Visualization/13-meaningful-visualizations/README.md) +- ഡാറ്റാ സയൻസ് ജീവിതചക്രം + - [പരിചയം](../4-Data-Science-Lifecycle/14-Introduction/README.md) + - [വിശകലനം](../4-Data-Science-Lifecycle/15-analyzing/README.md) + - [സംവാദം](../4-Data-Science-Lifecycle/16-communication/README.md) +- ക്ലൗഡിൽ ഡാറ്റാ സയൻസ് + - [പരിചയം](../5-Data-Science-In-Cloud/17-Introduction/README.md) + - [ലോ കോഡ്](../5-Data-Science-In-Cloud/18-Low-Code/README.md) + - [അസ്യൂർ](../5-Data-Science-In-Cloud/19-Azure/README.md) +- വന്യജീവിതത്തിലെ ഡാറ്റാ സയൻസ് + - [DS ഇൻ ദി വയൽഡ്](../6-Data-Science-In-Wild/README.md) + +--- + + +**അസൂയാ**: +ഈ രേഖ AI വിവർത്തന സേവനം [Co-op Translator](https://github.com/Azure/co-op-translator) ഉപയോഗിച്ച് വിവർത്തനം ചെയ്തതാണ്. നാം കൃത്യതയ്ക്ക് ശ്രമിച്ചിട്ടുണ്ടെങ്കിലും, സ്വയം പ്രവർത്തിക്കുന്ന വിവർത്തനങ്ങളിൽ പിശകുകൾ അല്ലെങ്കിൽ തെറ്റുകൾ ഉണ്ടാകാമെന്ന് ദയവായി ശ്രദ്ധിക്കുക. അതിന്റെ മാതൃഭാഷയിലുള്ള യഥാർത്ഥ രേഖയാണ് പ്രാമാണികമായ ഉറവിടം എന്ന് പരിഗണിക്കേണ്ടതാണ്. നിർണായകമായ വിവരങ്ങൾക്ക്, പ്രൊഫഷണൽ മനുഷ്യ വിവർത്തനം ശുപാർശ ചെയ്യപ്പെടുന്നു. ഈ വിവർത്തനം ഉപയോഗിക്കുന്നതിൽ നിന്നുണ്ടാകുന്ന ഏതെങ്കിലും തെറ്റിദ്ധാരണകൾക്കോ തെറ്റായ വ്യാഖ്യാനങ്ങൾക്കോ ഞങ്ങൾ ഉത്തരവാദികളല്ല. + \ No newline at end of file diff --git a/translations/ml/examples/README.md b/translations/ml/examples/README.md new file mode 100644 index 00000000..81ba9d5f --- /dev/null +++ b/translations/ml/examples/README.md @@ -0,0 +1,151 @@ + +# തുടക്കക്കാർക്ക് അനുയോജ്യമായ ഡാറ്റാ സയൻസ് ഉദാഹരണങ്ങൾ + +ഉദാഹരണങ്ങൾ ഡയറക്ടറിയിലേക്ക് സ്വാഗതം! ഈ ലളിതവും നന്നായി കമന്റ് ചെയ്ത ഉദാഹരണങ്ങളുടെ ശേഖരം, നിങ്ങൾ ഒരു പൂർണ്ണമായ തുടക്കക്കാരനാണെങ്കിലും, ഡാറ്റാ സയൻസിൽ തുടങ്ങാൻ സഹായിക്കുന്നതിനായി രൂപകൽപ്പന ചെയ്തതാണ്. + +## 📚 ഇവിടെ നിങ്ങൾ കണ്ടെത്തുന്നത് + +ഓരോ ഉദാഹരണവും സ്വയം സമ്പൂർണമാണ്, കൂടാതെ ഇതിൽ ഉൾപ്പെടുന്നു: +- **പ്രതീകാത്മകമായ കമന്റുകൾ** ഓരോ ഘട്ടവും വിശദീകരിക്കുന്നു +- **ലളിതവും വായിക്കാൻ എളുപ്പവുമായ കോഡ്** ഓരോ തത്വവും ഒരേസമയം പ്രദർശിപ്പിക്കുന്നു +- **യഥാർത്ഥ ലോക സാഹചര്യങ്ങൾ** ഈ സാങ്കേതിക വിദ്യകൾ എപ്പോൾ എങ്ങനെ ഉപയോഗിക്കാമെന്ന് മനസ്സിലാക്കാൻ സഹായിക്കുന്നു +- **പ്രതീക്ഷിച്ച ഔട്ട്പുട്ട്** നിങ്ങൾ എന്ത് നോക്കണമെന്ന് അറിയാൻ + +## 🚀 തുടങ്ങുന്നത് + +### മുൻകൂട്ടി ആവശ്യമായവ +ഈ ഉദാഹരണങ്ങൾ പ്രവർത്തിപ്പിക്കുന്നതിന് മുമ്പ്, ഉറപ്പാക്കുക: +- Python 3.7 അല്ലെങ്കിൽ അതിനുമുകളിൽ ഇൻസ്റ്റാൾ ചെയ്തിട്ടുള്ളത് +- Python സ്ക്രിപ്റ്റുകൾ എങ്ങനെ പ്രവർത്തിപ്പിക്കാമെന്ന് അടിസ്ഥാന അറിവ് + +### ആവശ്യമായ ലൈബ്രറികൾ ഇൻസ്റ്റാൾ ചെയ്യൽ +```bash +pip install pandas numpy matplotlib +``` + +## 📖 ഉദാഹരണങ്ങളുടെ അവലോകനം + +### 1. ഹലോ വേൾഡ് - ഡാറ്റാ സയൻസ് ശൈലി +**ഫയൽ:** `01_hello_world_data_science.py` + +നിങ്ങളുടെ ആദ്യ ഡാറ്റാ സയൻസ് പ്രോഗ്രാം! പഠിക്കുക: +- ലളിതമായ ഒരു ഡാറ്റാസെറ്റ് ലോഡ് ചെയ്യുന്നത് +- നിങ്ങളുടെ ഡാറ്റയെക്കുറിച്ചുള്ള അടിസ്ഥാന വിവരങ്ങൾ പ്രദർശിപ്പിക്കുന്നത് +- നിങ്ങളുടെ ആദ്യ ഡാറ്റാ സയൻസ് ഔട്ട്പുട്ട് പ്രിന്റ് ചെയ്യുന്നത് + +പൂർണ്ണമായ തുടക്കക്കാർക്ക് അവരുടെ ആദ്യ ഡാറ്റാ സയൻസ് പ്രോഗ്രാം പ്രവർത്തനത്തിൽ കാണാൻ ഇത് അനുയോജ്യമാണ്. + +--- + +### 2. ഡാറ്റ ലോഡ് ചെയ്യുകയും പരിശോധിക്കുകയും ചെയ്യൽ +**ഫയൽ:** `02_loading_data.py` + +ഡാറ്റയുമായി പ്രവർത്തിക്കുന്ന അടിസ്ഥാനങ്ങൾ പഠിക്കുക: +- CSV ഫയലുകളിൽ നിന്ന് ഡാറ്റ വായിക്കുക +- നിങ്ങളുടെ ഡാറ്റാസെറ്റിന്റെ ആദ്യ കുറച്ച് വരികൾ കാണുക +- നിങ്ങളുടെ ഡാറ്റയെക്കുറിച്ചുള്ള അടിസ്ഥാന സ്ഥിതിവിവരക്കണക്കുകൾ നേടുക +- ഡാറ്റാ തരം മനസ്സിലാക്കുക + +ഇത് സാധാരണയായി ഏതൊരു ഡാറ്റാ സയൻസ് പ്രോജക്ടിന്റെയും ആദ്യ ഘട്ടമാണ്! + +--- + +### 3. ലളിതമായ ഡാറ്റാ വിശകലനം +**ഫയൽ:** `03_simple_analysis.py` + +നിങ്ങളുടെ ആദ്യ ഡാറ്റാ വിശകലനം നടത്തുക: +- അടിസ്ഥാന സ്ഥിതിവിവരക്കണക്കുകൾ (സാധാരണ, മധ്യക, മോഡ്) കണക്കാക്കുക +- പരമാവധി, കുറഞ്ഞ മൂല്യങ്ങൾ കണ്ടെത്തുക +- മൂല്യങ്ങളുടെ സംഭവനകൾ എണ്ണുക +- നിബന്ധനകളുടെ അടിസ്ഥാനത്തിൽ ഡാറ്റ ഫിൽട്ടർ ചെയ്യുക + +നിങ്ങളുടെ ഡാറ്റയെക്കുറിച്ചുള്ള ലളിതമായ ചോദ്യങ്ങൾക്ക് എങ്ങനെ ഉത്തരം നൽകാമെന്ന് കാണുക. + +--- + +### 4. ഡാറ്റാ ദൃശ്യീകരണ അടിസ്ഥാനങ്ങൾ +**ഫയൽ:** `04_basic_visualization.py` + +നിങ്ങളുടെ ആദ്യ ദൃശ്യീകരണങ്ങൾ സൃഷ്ടിക്കുക: +- ലളിതമായ ബാർ ചാർട്ട് നിർമ്മിക്കുക +- ഒരു ലൈൻ പ്ലോട്ട് സൃഷ്ടിക്കുക +- പൈ ചാർട്ട് ജനറേറ്റ് ചെയ്യുക +- നിങ്ങളുടെ ദൃശ്യീകരണങ്ങൾ ചിത്രങ്ങളായി സേവ് ചെയ്യുക + +നിങ്ങളുടെ കണ്ടെത്തലുകൾ ദൃശ്യമായി പ്രചരിപ്പിക്കാൻ പഠിക്കുക! + +--- + +### 5. യഥാർത്ഥ ഡാറ്റയുമായി പ്രവർത്തിക്കൽ +**ഫയൽ:** `05_real_world_example.py` + +എല്ലാം ചേർത്ത് ഒരു സമ്പൂർണ ഉദാഹരണം: +- റിപോസിറ്ററിയിൽ നിന്നുള്ള യഥാർത്ഥ ഡാറ്റ ലോഡ് ചെയ്യുക +- ഡാറ്റ ശുദ്ധീകരിക്കുകയും തയ്യാറാക്കുകയും ചെയ്യുക +- വിശകലനം നടത്തുക +- അർത്ഥപൂർണമായ ദൃശ്യീകരണങ്ങൾ സൃഷ്ടിക്കുക +- നിഗമനങ്ങൾ വരുത്തുക + +ഈ ഉദാഹരണം ആരംഭം മുതൽ അവസാനം വരെ ഒരു സമ്പൂർണ പ്രവൃത്തി പ്രവാഹം കാണിക്കുന്നു. + +--- + +## 🎯 ഈ ഉദാഹരണങ്ങൾ എങ്ങനെ ഉപയോഗിക്കാം + +1. **ആരംഭത്തിൽ നിന്ന് തുടങ്ങുക**: ഉദാഹരണങ്ങൾ ബുദ്ധിമുട്ടിന്റെ ക്രമത്തിൽ നമ്പർ ചെയ്തിരിക്കുന്നു. `01_hello_world_data_science.py` മുതൽ ആരംഭിച്ച് മുന്നോട്ട് പോവുക. + +2. **കമന്റുകൾ വായിക്കുക**: ഓരോ ഫയലിലും കോഡ് എന്ത് ചെയ്യുന്നു, എന്തുകൊണ്ട് ചെയ്യുന്നു എന്നതിന്റെ വിശദമായ കമന്റുകൾ ഉണ്ട്. അവ ശ്രദ്ധാപൂർവ്വം വായിക്കുക! + +3. **പരീക്ഷണം നടത്തുക**: കോഡ് മാറ്റി നോക്കുക. ഒരു മൂല്യം മാറ്റിയാൽ എന്ത് സംഭവിക്കും? തെറ്റുകൾ ഉണ്ടാക്കുകയും അവ പരിഹരിക്കുകയും ചെയ്യുക - ഇതാണ് പഠന രീതി! + +4. **കോഡ് പ്രവർത്തിപ്പിക്കുക**: ഓരോ ഉദാഹരണവും പ്രവർത്തിപ്പിച്ച് ഔട്ട്പുട്ട് ശ്രദ്ധിക്കുക. നിങ്ങൾ പ്രതീക്ഷിച്ചതുമായി താരതമ്യം ചെയ്യുക. + +5. **അധികം വികസിപ്പിക്കുക**: ഒരു ഉദാഹരണം മനസ്സിലാക്കിയ ശേഷം, നിങ്ങളുടെ സ്വന്തം ആശയങ്ങൾ ചേർത്ത് വികസിപ്പിക്കാൻ ശ്രമിക്കുക. + +## 💡 തുടക്കക്കാർക്ക് ഉപദേശങ്ങൾ + +- **വേഗം പിടിക്കരുത്**: അടുത്ത ഉദാഹരണത്തിലേക്ക് പോകുന്നതിന് മുമ്പ് ഓരോ ഉദാഹരണവും മനസ്സിലാക്കാൻ സമയം എടുക്കുക +- **കോഡ് താങ്കൾ തന്നെ ടൈപ്പ് ചെയ്യുക**: പകർത്തി പേസ്റ്റ് ചെയ്യരുത്. ടൈപ്പിംഗ് നിങ്ങളെ പഠിപ്പിക്കുകയും ഓർക്കാനും സഹായിക്കും +- **അപരിചിതമായ ആശയങ്ങൾ അന്വേഷിക്കുക**: നിങ്ങൾക്ക് മനസ്സിലാകാത്ത എന്തെങ്കിലും കണ്ടാൽ, ഓൺലൈനിലും പ്രധാന പാഠങ്ങളിലും തിരയുക +- **ചോദ്യങ്ങൾ ചോദിക്കുക**: സഹായം ആവശ്യമെങ്കിൽ [ചർച്ചാ ഫോറം](https://github.com/microsoft/Data-Science-For-Beginners/discussions) ൽ ചേരുക +- **നിയമിതമായി അഭ്യാസം ചെയ്യുക**: ഒരാഴ്ചയിൽ ഒരു വലിയ സെഷൻ ചെയ്യുന്നതിന് പകരം, ദിവസവും കുറച്ച് കോഡ് ചെയ്യാൻ ശ്രമിക്കുക + +## 🔗 അടുത്ത ഘട്ടങ്ങൾ + +ഈ ഉദാഹരണങ്ങൾ പൂർത്തിയാക്കിയ ശേഷം, നിങ്ങൾ തയ്യാറാണ്: +- പ്രധാന പാഠ്യപദ്ധതി പാഠങ്ങൾ പഠിക്കാൻ +- ഓരോ പാഠം ഫോൾഡറിലെയും അസൈൻമെന്റുകൾ പരീക്ഷിക്കാൻ +- കൂടുതൽ ആഴത്തിലുള്ള പഠനത്തിനായി Jupyter നോട്ട്‌ബുക്കുകൾ പരിശോധിക്കാൻ +- നിങ്ങളുടെ സ്വന്തം ഡാറ്റാ സയൻസ് പ്രോജക്ടുകൾ സൃഷ്ടിക്കാൻ + +## 📚 അധിക സ്രോതസുകൾ + +- [പ്രധാന പാഠ്യപദ്ധതി](../README.md) - സമ്പൂർണ 20-പാഠ കോഴ്‌സ് +- [അധ്യാപകർക്ക്](../for-teachers.md) - ഈ പാഠ്യപദ്ധതി നിങ്ങളുടെ ക്ലാസ്സിൽ ഉപയോഗിക്കുന്നത് +- [Microsoft Learn](https://docs.microsoft.com/learn/) - സൗജന്യ ഓൺലൈൻ പഠന സ്രോതസുകൾ +- [Python ഡോക്യുമെന്റേഷൻ](https://docs.python.org/3/) - ഔദ്യോഗിക Python റഫറൻസ് + +## 🤝 സംഭാവനകൾ + +ഒരു പിശക് കണ്ടെത്തിയോ പുതിയ ഒരു ഉദാഹരണത്തിന് ആശയമുണ്ടോ? ഞങ്ങൾ സംഭാവനകൾ സ്വാഗതം ചെയ്യുന്നു! ദയവായി ഞങ്ങളുടെ [സംഭാവന മാർഗ്ഗനിർദ്ദേശം](../CONTRIBUTING.md) കാണുക. + +--- + +**സന്തോഷകരമായ പഠനം! 🎉** + +ഓരോ വിദഗ്ധനും ഒരിക്കൽ തുടക്കക്കാരനായിരുന്നു. ഓരോ ഘട്ടവും ക്രമമായി മുന്നോട്ട് പോവുക, പിഴച്ചാലും ഭയപ്പെടേണ്ട - അവ പഠനത്തിന്റെ ഭാഗമാണ്! + +--- + + +**അസൂയാ**: +ഈ രേഖ AI വിവർത്തന സേവനം [Co-op Translator](https://github.com/Azure/co-op-translator) ഉപയോഗിച്ച് വിവർത്തനം ചെയ്തതാണ്. നാം കൃത്യതയ്ക്ക് ശ്രമിച്ചെങ്കിലും, സ്വയം പ്രവർത്തിക്കുന്ന വിവർത്തനങ്ങളിൽ പിശകുകൾ അല്ലെങ്കിൽ തെറ്റുകൾ ഉണ്ടാകാമെന്ന് ദയവായി ശ്രദ്ധിക്കുക. അതിന്റെ മാതൃഭാഷയിലുള്ള യഥാർത്ഥ രേഖയാണ് പ്രാമാണികമായ ഉറവിടം എന്ന് പരിഗണിക്കേണ്ടതാണ്. നിർണായകമായ വിവരങ്ങൾക്ക്, പ്രൊഫഷണൽ മനുഷ്യ വിവർത്തനം ശുപാർശ ചെയ്യപ്പെടുന്നു. ഈ വിവർത്തനം ഉപയോഗിക്കുന്നതിൽ നിന്നുണ്ടാകുന്ന ഏതെങ്കിലും തെറ്റിദ്ധാരണകൾക്കോ തെറ്റായ വ്യാഖ്യാനങ്ങൾക്കോ ഞങ്ങൾ ഉത്തരവാദികളല്ല. + \ No newline at end of file diff --git a/translations/ml/for-teachers.md b/translations/ml/for-teachers.md new file mode 100644 index 00000000..a610462b --- /dev/null +++ b/translations/ml/for-teachers.md @@ -0,0 +1,78 @@ + +## അധ്യാപകര്‍ക്കായി + +ഈ പാഠ്യപദ്ധതി നിങ്ങളുടെ ക്ലാസ്സില്‍ ഉപയോഗിക്കണോ? ദയവായി സ്വതന്ത്രമായി ഉപയോഗിക്കൂ! + +വാസ്തവത്തില്‍, GitHub Classroom ഉപയോഗിച്ച് GitHub-ലും ഇത് ഉപയോഗിക്കാം. + +അതിനായി, ഈ റിപോ ഫോര്‍ക്ക് ചെയ്യുക. ഓരോ പാഠത്തിനും ഒരു റിപോ സൃഷ്ടിക്കേണ്ടതുണ്ട്, അതിനാല്‍ ഓരോ ഫോള്‍ഡറും വേര്‍തിരിച്ച് ഒരു റിപോ ആയി മാറ്റേണ്ടതുണ്ട്. അങ്ങനെ, [GitHub Classroom](https://classroom.github.com/classrooms) ഓരോ പാഠവും വേര്‍തിരിച്ച് സ്വീകരിക്കാം. + +ഈ [പൂര്‍ണ നിര്‍ദ്ദേശങ്ങള്‍](https://github.blog/2020-03-18-set-up-your-digital-classroom-with-github-classroom/) നിങ്ങളുടെ ക്ലാസ്സ്‌റൂം എങ്ങനെ സജ്ജമാക്കാമെന്ന് ഒരു ആശയം നല്‍കും. + +## നിലവിലുള്ള റിപോ ഉപയോഗിക്കുന്നത് + +GitHub Classroom ഉപയോഗിക്കാതെ ഈ റിപോ നിലവിലുള്ള രൂപത്തില്‍ ഉപയോഗിക്കണമെങ്കില്‍, അത് സാധ്യമാണ്. ഏത് പാഠം ഒന്നിച്ച് പഠിക്കണമെന്ന് നിങ്ങളുടെ വിദ്യാര്‍ത്ഥികളുമായി സംവദിക്കേണ്ടതുണ്ട്. + +ഓണ്‍ലൈന്‍ ഫോര്‍മാറ്റില്‍ (Zoom, Teams, അല്ലെങ്കില്‍ മറ്റേതെങ്കിലും) ക്വിസുകള്‍ക്കായി ബ്രേക്ക്ഔട്ട് റൂമുകള്‍ രൂപീകരിച്ച്, വിദ്യാര്‍ത്ഥികളെ പഠനത്തിന് തയ്യാറാക്കാന്‍ മെന്റര്‍ ചെയ്യാം. പിന്നീട് ക്വിസുകള്‍ക്കായി വിദ്യാര്‍ത്ഥികളെ ക്ഷണിച്ച്, ഒരു നിശ്ചിത സമയത്ത് അവരുടെ ഉത്തരം 'issues' ആയി സമര്‍പ്പിക്കാം. സമാനമായി അസൈന്‍മെന്റുകള്‍ കൂടി, വിദ്യാര്‍ത്ഥികള്‍ തുറന്നിടത്ത് സഹകരിച്ച് പ്രവര്‍ത്തിക്കാന്‍ ആഗ്രഹിക്കുന്നുവെങ്കില്‍ ചെയ്യാം. + +കൂടുതല്‍ സ്വകാര്യമായ ഫോര്‍മാറ്റ് ഇഷ്ടപ്പെടുന്നുവെങ്കില്‍, നിങ്ങളുടെ വിദ്യാര്‍ത്ഥികളെ പാഠം പാഠം ഫോര്‍ക്ക് ചെയ്ത് അവരുടെ സ്വന്തം GitHub റിപോകളില്‍ സ്വകാര്യ റിപോകളായി സൃഷ്ടിച്ച് നിങ്ങള്‍ക്ക് ആക്‌സസ് നല്‍കാന്‍ പറയുക. പിന്നീട് അവർ ക്വിസുകളും അസൈന്‍മെന്റുകളും സ്വകാര്യമായി പൂര്‍ത്തിയാക്കി നിങ്ങളുടെ ക്ലാസ്സ്‌റൂം റിപോയിലെ issues വഴി സമര്‍പ്പിക്കാം. + +ഓണ്‍ലൈന്‍ ക്ലാസ്സ്‌റൂം ഫോര്‍മാറ്റില്‍ ഇത് പ്രവര്‍ത്തിപ്പിക്കാന്‍ നിരവധി മാര്‍ഗ്ഗങ്ങളുണ്ട്. നിങ്ങള്‍ക്ക് ഏറ്റവും അനുയോജ്യമായത് എന്താണെന്ന് ഞങ്ങളെ അറിയിക്കുക! + +## ഈ പാഠ്യപദ്ധതിയില്‍ ഉള്‍പ്പെടുത്തിയിരിക്കുന്നത്: + +20 പാഠങ്ങള്‍, 40 ക്വിസുകള്‍, 20 അസൈന്‍മെന്റുകള്‍. ദൃശ്യ പഠനാര്‍ത്ഥികള്‍ക്കായി പാഠങ്ങളോടൊപ്പം സ്കെച്ച്നോട്ടുകള്‍ ഉണ്ട്. പല പാഠങ്ങളും Python-ലും R-ലും ലഭ്യമാണ്, VS Code-ല്‍ Jupyter നോട്ട്‌ബുക്കുകള്‍ ഉപയോഗിച്ച് പൂര്‍ത്തിയാക്കാം. ഈ ടെക് സ്റ്റാക്ക് ഉപയോഗിച്ച് ക്ലാസ്സ്‌റൂം എങ്ങനെ സജ്ജമാക്കാമെന്ന് കൂടുതല്‍ അറിയാന്‍: https://code.visualstudio.com/docs/datascience/jupyter-notebooks. + +എല്ലാ സ്കെച്ച്നോട്ടുകളും, വലിയ ഫോര്‍മാറ്റിലുള്ള പോസ്റ്ററടക്കം, [ഈ ഫോള്‍ഡറില്‍](../../sketchnotes) ഉണ്ട്. + +[Docsify](https://docsify.js.org/#/) ഉപയോഗിച്ച് ഈ പാഠ്യപദ്ധതി സ്റ്റാന്‍ഡ്എലോണ്‍, ഓഫ്‌ലൈന്‍-ഫ്രണ്ട്ലി വെബ്‌സൈറ്റ് ആയി ഓടിക്കാം. നിങ്ങളുടെ ലൊക്കല്‍ മെഷീനില്‍ [Docsify ഇന്‍സ്റ്റാള്‍](https://docsify.js.org/#/quickstart) ചെയ്ത്, ഈ റിപോയുടെ റൂട്ട് ഫോള്‍ഡറില്‍ `docsify serve` ടൈപ്പ് ചെയ്യുക. വെബ്‌സൈറ്റ് നിങ്ങളുടെ ലോക്കല്‍ഹോസ്റ്റില്‍ പോര്‍ട്ട് 3000-ല്‍ ലഭിക്കും: `localhost:3000`. + +ഓഫ്‌ലൈന്‍-ഫ്രണ്ട്ലി പാഠ്യപദ്ധതി സ്റ്റാന്‍ഡ്എലോണ്‍ വെബ് പേജായി തുറക്കും: https://localhost:3000 + +പാഠങ്ങള്‍ 6 ഭാഗങ്ങളായി ഗ്രൂപ്പ് ചെയ്തിരിക്കുന്നു: + +- 1: പരിചയം + - 1: ഡാറ്റാ സയന്‍സ് നിർവചനം + - 2: നൈതികത + - 3: ഡാറ്റ നിർവചനം + - 4: പ്രൊബബിലിറ്റി ആൻഡ് സ്റ്റാറ്റിസ്റ്റിക്സ് അവലോകനം +- 2: ഡാറ്റയുമായി ജോലി ചെയ്യല്‍ + - 5: റിലേഷണല്‍ ഡാറ്റാബേസുകള്‍ + - 6: നോണ്‍-റിലേഷണല്‍ ഡാറ്റാബേസുകള്‍ + - 7: Python + - 8: ഡാറ്റ തയ്യാറാക്കല്‍ +- 3: ഡാറ്റാ ദൃശ്യീകരണം + - 9: അളവുകളുടെ ദൃശ്യീകരണം + - 10: വിതരണങ്ങളുടെ ദൃശ്യീകരണം + - 11: അനുപാതങ്ങളുടെ ദൃശ്യീകരണം + - 12: ബന്ധങ്ങളുടെ ദൃശ്യീകരണം + - 13: അര്‍ത്ഥവത്തായ ദൃശ്യീകരണങ്ങള്‍ +- 4: ഡാറ്റാ സയന്‍സ് ലൈഫ്‌സൈക്കിൾ + - 14: പരിചയം + - 15: വിശകലനം + - 16: ആശയവിനിമയം +- 5: ക്ലൗഡിലെ ഡാറ്റാ സയന്‍സ് + - 17: പരിചയം + - 18: ലോ-കോഡ് ഓപ്ഷനുകള്‍ + - 19: Azure +- 6: വന്യപ്രകൃതിയിലെ ഡാറ്റാ സയന്‍സ് + - 20: അവലോകനം + +## ദയവായി നിങ്ങളുടെ അഭിപ്രായങ്ങള്‍ നല്‍കുക! + +ഈ പാഠ്യപദ്ധതി നിങ്ങളുടെയും നിങ്ങളുടെ വിദ്യാര്‍ത്ഥികളുടെയും ആവശ്യങ്ങള്‍ക്ക് അനുയോജ്യമായി പ്രവര്‍ത്തിക്കണമെന്ന് ഞങ്ങള്‍ ആഗ്രഹിക്കുന്നു. ചര്‍ച്ചാ ബോര്‍ഡുകളില്‍ നിങ്ങളുടെ അഭിപ്രായങ്ങള്‍ നല്‍കുക! നിങ്ങളുടെ വിദ്യാര്‍ത്ഥികള്‍ക്കായി ചര്‍ച്ചാ ബോര്‍ഡുകളില്‍ ക്ലാസ്സ്‌റൂം ഏരിയ സൃഷ്ടിക്കാന്‍ സ്വതന്ത്രമായി ശ്രമിക്കൂ. + +--- + + +**അസൂയാ**: +ഈ രേഖ AI വിവർത്തന സേവനം [Co-op Translator](https://github.com/Azure/co-op-translator) ഉപയോഗിച്ച് വിവർത്തനം ചെയ്തതാണ്. നാം കൃത്യതയ്ക്ക് ശ്രമിച്ചിട്ടുണ്ടെങ്കിലും, സ്വയം പ്രവർത്തിക്കുന്ന വിവർത്തനങ്ങളിൽ പിശകുകൾ അല്ലെങ്കിൽ തെറ്റുകൾ ഉണ്ടാകാമെന്ന് ദയവായി ശ്രദ്ധിക്കുക. അതിന്റെ മാതൃഭാഷയിലുള്ള യഥാർത്ഥ രേഖയാണ് പ്രാമാണികമായ ഉറവിടം എന്ന് പരിഗണിക്കേണ്ടതാണ്. നിർണായകമായ വിവരങ്ങൾക്ക്, പ്രൊഫഷണൽ മനുഷ്യ വിവർത്തനം ശുപാർശ ചെയ്യപ്പെടുന്നു. ഈ വിവർത്തനം ഉപയോഗിക്കുന്നതിൽ നിന്നുണ്ടാകുന്ന ഏതെങ്കിലും തെറ്റിദ്ധാരണകൾക്കോ തെറ്റായ വ്യാഖ്യാനങ്ങൾക്കോ ഞങ്ങൾ ഉത്തരവാദികളല്ല. + \ No newline at end of file diff --git a/translations/ml/quiz-app/README.md b/translations/ml/quiz-app/README.md new file mode 100644 index 00000000..a6cdb082 --- /dev/null +++ b/translations/ml/quiz-app/README.md @@ -0,0 +1,141 @@ + +# ക്വിസുകൾ + +ഈ ക്വിസുകൾ https://aka.ms/datascience-beginners എന്ന ഡാറ്റാ സയൻസ് പാഠ്യപദ്ധതിക്കുള്ള പ്രീ-ലക്ചർ, പോസ്റ്റ്-ലക്ചർ ക്വിസുകളാണ് +## വിവർത്തനം ചെയ്ത ക്വിസ് സെറ്റ് ചേർക്കൽ + +`assets/translations` ഫോൾഡറുകളിൽ പൊരുത്തപ്പെടുന്ന ക്വിസ് ഘടനകൾ സൃഷ്ടിച്ച് ക്വിസ് വിവർത്തനം ചേർക്കുക. കാനോണിക്കൽ ക്വിസുകൾ `assets/translations/en` ൽ ഉണ്ട്. ക്വിസുകൾ പല ഗ്രൂപ്പുകളായി വിഭജിച്ചിരിക്കുന്നു. ശരിയായ ക്വിസ് വിഭാഗവുമായി നമ്പറിംഗ് പൊരുത്തപ്പെടുന്നുണ്ടെന്ന് ഉറപ്പാക്കുക. ഈ പാഠ്യപദ്ധതിയിൽ മൊത്തം 40 ക്വിസുകൾ ഉണ്ട്, എണ്ണൽ 0 മുതൽ ആരംഭിക്കുന്നു. + +വിവർത്തനങ്ങൾ എഡിറ്റ് ചെയ്ത ശേഷം, `en` ൽ ഉള്ള കൺവെൻഷനുകൾ അനുസരിച്ച് എല്ലാ ഫയലുകളും ഇറക്കുമതി ചെയ്യാൻ വിവർത്തന ഫോൾഡറിലെ index.js ഫയൽ എഡിറ്റ് ചെയ്യുക. + +`assets/translations` ൽ ഉള്ള `index.js` ഫയൽ പുതിയ വിവർത്തന ഫയലുകൾ ഇറക്കുമതി ചെയ്യാൻ എഡിറ്റ് ചെയ്യുക. + +അതിനുശേഷം, ഈ ആപ്പിലെ `App.vue` ൽ ഉള്ള ഡ്രോപ്പ്ഡൗണിൽ നിങ്ങളുടെ ഭാഷ ചേർക്കുക. ലൊക്കലൈസ്ഡ് ചുരുക്കനാമം നിങ്ങളുടെ ഭാഷയുടെ ഫോൾഡർ നാമവുമായി പൊരുത്തപ്പെടണം. + +അവസാനമായി, വിവർത്തനം ചെയ്ത പാഠങ്ങളിൽ ഉള്ള എല്ലാ ക്വിസ് ലിങ്കുകളും, അവ ഉണ്ടെങ്കിൽ, ഈ ലൊക്കലൈസേഷൻ ഒരു ക്വറി പാരാമീറ്ററായി ഉൾപ്പെടുത്താൻ എഡിറ്റ് ചെയ്യുക: ഉദാഹരണത്തിന് `?loc=fr`. + + + +## പ്രോജക്ട് സജ്ജീകരണം + +``` +npm install +``` + +### വികസനത്തിനായി കോമ്പൈൽ ചെയ്ത് ഹോട്ട്-റീലോഡ് ചെയ്യുന്നു + +``` +npm run serve +``` + +### ഉത്പാദനത്തിനായി കോമ്പൈൽ ചെയ്ത് മിനിഫൈ ചെയ്യുന്നു + +``` +npm run build +``` + +### ഫയലുകൾ ലിന്റ് ചെയ്ത് ശരിയാക്കുന്നു + +``` +npm run lint +``` + +### കോൺഫിഗറേഷൻ ഇഷ്ടാനുസൃതമാക്കുക + +കാണുക [Configuration Reference](https://cli.vuejs.org/config/) . + +ക്രെഡിറ്റുകൾ: ഈ ക്വിസ് ആപ്പിന്റെ ഒറിജിനൽ വേർഷനിന് നന്ദി: https://github.com/arpan45/simple-quiz-vue + +## Azure-ലേക്ക് ഡിപ്ലോയ് ചെയ്യൽ + +തുടങ്ങാൻ സഹായിക്കുന്ന ഘട്ടം-ഘട്ടം ഗൈഡ് ഇവിടെ: + +1. GitHub റിപോസിറ്ററി ഫോർക്ക് ചെയ്യുക +നിങ്ങളുടെ സ്റ്റാറ്റിക് വെബ് ആപ്പ് കോഡ് നിങ്ങളുടെ GitHub റിപോസിറ്ററിയിൽ ഉണ്ടെന്ന് ഉറപ്പാക്കുക. ഈ റിപോസിറ്ററി ഫോർക്ക് ചെയ്യുക. + +2. Azure സ്റ്റാറ്റിക് വെബ് ആപ്പ് സൃഷ്ടിക്കുക +- [Azure അക്കൗണ്ട്](http://azure.microsoft.com) സൃഷ്ടിക്കുക +- [Azure പോർട്ടൽ](https://portal.azure.com) ൽ പോകുക +- “Create a resource” ക്ലിക്ക് ചെയ്ത് “Static Web App” തിരയുക. +- “Create” ക്ലിക്ക് ചെയ്യുക. + +3. സ്റ്റാറ്റിക് വെബ് ആപ്പ് കോൺഫിഗർ ചെയ്യുക +- അടിസ്ഥാനങ്ങൾ: സബ്സ്ക്രിപ്ഷൻ: നിങ്ങളുടെ Azure സബ്സ്ക്രിപ്ഷൻ തിരഞ്ഞെടുക്കുക. +- റിസോഴ്‌സ് ഗ്രൂപ്പ്: പുതിയ റിസോഴ്‌സ് ഗ്രൂപ്പ് സൃഷ്ടിക്കുക അല്ലെങ്കിൽ നിലവിലുള്ളത് ഉപയോഗിക്കുക. +- പേര്: നിങ്ങളുടെ സ്റ്റാറ്റിക് വെബ് ആപ്പിന് ഒരു പേര് നൽകുക. +- പ്രദേശം: നിങ്ങളുടെ ഉപയോക്താക്കൾക്ക് ഏറ്റവും അടുത്ത പ്രദേശം തിരഞ്ഞെടുക്കുക. + +- #### ഡിപ്ലോയ്മെന്റ് വിശദാംശങ്ങൾ: +- ഉറവിടം: “GitHub” തിരഞ്ഞെടുക്കുക. +- GitHub അക്കൗണ്ട്: Azure-ന് നിങ്ങളുടെ GitHub അക്കൗണ്ടിൽ പ്രവേശനം അനുവദിക്കുക. +- ഓർഗനൈസേഷൻ: നിങ്ങളുടെ GitHub ഓർഗനൈസേഷൻ തിരഞ്ഞെടുക്കുക. +- റിപോസിറ്ററി: നിങ്ങളുടെ സ്റ്റാറ്റിക് വെബ് ആപ്പ് ഉള്ള റിപോസിറ്ററി തിരഞ്ഞെടുക്കുക. +- ബ്രാഞ്ച്: ഡിപ്ലോയ് ചെയ്യാൻ ആഗ്രഹിക്കുന്ന ബ്രാഞ്ച് തിരഞ്ഞെടുക്കുക. + +- #### ബിൽഡ് വിശദാംശങ്ങൾ: +- ബിൽഡ് പ്രീസെറ്റുകൾ: നിങ്ങളുടെ ആപ്പ് നിർമ്മിച്ച ഫ്രെയിംവർക്ക് തിരഞ്ഞെടുക്കുക (ഉദാ: React, Angular, Vue, മുതലായവ). +- ആപ്പ് സ്ഥലം: നിങ്ങളുടെ ആപ്പ് കോഡ് ഉള്ള ഫോൾഡർ വ്യക്തമാക്കുക (ഉദാ: റൂട്ട് ആണെങ്കിൽ /). +- API സ്ഥലം: API ഉണ്ടെങ്കിൽ, അതിന്റെ സ്ഥലം വ്യക്തമാക്കുക (ഐച്ഛികം). +- ഔട്ട്പുട്ട് സ്ഥലം: ബിൽഡ് ഔട്ട്പുട്ട് സൃഷ്ടിക്കുന്ന ഫോൾഡർ വ്യക്തമാക്കുക (ഉദാ: build അല്ലെങ്കിൽ dist). + +4. അവലോകനം ചെയ്ത് സൃഷ്ടിക്കുക +നിങ്ങളുടെ ക്രമീകരണങ്ങൾ അവലോകനം ചെയ്ത് “Create” ക്ലിക്ക് ചെയ്യുക. Azure ആവശ്യമായ റിസോഴ്‌സുകൾ സജ്ജമാക്കി നിങ്ങളുടെ റിപോസിറ്ററിയിൽ GitHub Actions വർക്ക്‌ഫ്ലോ സൃഷ്ടിക്കും. + +5. GitHub Actions വർക്ക്‌ഫ്ലോ +Azure നിങ്ങളുടെ റിപോസിറ്ററിയിൽ (.github/workflows/azure-static-web-apps-.yml) GitHub Actions വർക്ക്‌ഫ്ലോ ഫയൽ സ്വയം സൃഷ്ടിക്കും. ഈ വർക്ക്‌ഫ്ലോ ബിൽഡ്, ഡിപ്ലോയ്മെന്റ് പ്രക്രിയ കൈകാര്യം ചെയ്യും. + +6. ഡിപ്ലോയ്മെന്റ് നിരീക്ഷിക്കുക +നിങ്ങളുടെ GitHub റിപോസിറ്ററിയിലെ “Actions” ടാബിലേക്ക് പോകുക. +ഒരു വർക്ക്‌ഫ്ലോ പ്രവർത്തിക്കുന്നതായി കാണണം. ഈ വർക്ക്‌ഫ്ലോ നിങ്ങളുടെ സ്റ്റാറ്റിക് വെബ് ആപ്പ് Azure-ലേക്ക് ബിൽഡ് ചെയ്ത് ഡിപ്ലോയ് ചെയ്യും. +വർക്ക്‌ഫ്ലോ പൂർത്തിയായാൽ, നിങ്ങളുടെ ആപ്പ് നൽകിയ Azure URL-ൽ ലൈവ് ആയിരിക്കും. + +### ഉദാഹരണ വർക്ക്‌ഫ്ലോ ഫയൽ + +GitHub Actions വർക്ക്‌ഫ്ലോ ഫയൽ എങ്ങനെ കാണാമെന്ന് ഉദാഹരണം: +name: Azure Static Web Apps CI/CD +``` +on: + push: + branches: + - main + pull_request: + types: [opened, synchronize, reopened, closed] + branches: + - main + +jobs: + build_and_deploy_job: + runs-on: ubuntu-latest + name: Build and Deploy Job + steps: + - uses: actions/checkout@v2 + - name: Build And Deploy + id: builddeploy + uses: Azure/static-web-apps-deploy@v1 + with: + azure_static_web_apps_api_token: ${{ secrets.AZURE_STATIC_WEB_APPS_API_TOKEN }} + repo_token: ${{ secrets.GITHUB_TOKEN }} + action: "upload" + app_location: "quiz-app" # App source code path + api_location: ""API source code path optional + output_location: "dist" #Built app content directory - optional +``` + +### അധിക സ്രോതസുകൾ +- [Azure Static Web Apps ഡോക്യുമെന്റേഷൻ](https://learn.microsoft.com/azure/static-web-apps/getting-started) +- [GitHub Actions ഡോക്യുമെന്റേഷൻ](https://docs.github.com/actions/use-cases-and-examples/deploying/deploying-to-azure-static-web-app) + +--- + + +**അസൂയാ**: +ഈ രേഖ AI വിവർത്തന സേവനം [Co-op Translator](https://github.com/Azure/co-op-translator) ഉപയോഗിച്ച് വിവർത്തനം ചെയ്തതാണ്. നാം കൃത്യതയ്ക്ക് ശ്രമിച്ചെങ്കിലും, സ്വയം പ്രവർത്തിക്കുന്ന വിവർത്തനങ്ങളിൽ പിശകുകൾ അല്ലെങ്കിൽ തെറ്റുകൾ ഉണ്ടാകാമെന്ന് ദയവായി ശ്രദ്ധിക്കുക. അതിന്റെ മാതൃഭാഷയിലുള്ള യഥാർത്ഥ രേഖയാണ് പ്രാമാണികമായ ഉറവിടം എന്ന് പരിഗണിക്കേണ്ടതാണ്. നിർണായക വിവരങ്ങൾക്ക്, പ്രൊഫഷണൽ മനുഷ്യ വിവർത്തനം ശുപാർശ ചെയ്യപ്പെടുന്നു. ഈ വിവർത്തനത്തിന്റെ ഉപയോഗത്തിൽ നിന്നുണ്ടാകുന്ന ഏതെങ്കിലും തെറ്റിദ്ധാരണകൾക്കോ തെറ്റായ വ്യാഖ്യാനങ്ങൾക്കോ ഞങ്ങൾ ഉത്തരവാദികളല്ല. + \ No newline at end of file diff --git a/translations/ml/sketchnotes/README.md b/translations/ml/sketchnotes/README.md new file mode 100644 index 00000000..cf8ca4d1 --- /dev/null +++ b/translations/ml/sketchnotes/README.md @@ -0,0 +1,23 @@ + +എല്ലാ സ്കെച്ച്നോട്ടുകളും ഇവിടെ കണ്ടെത്തുക! + +## ക്രെഡിറ്റുകൾ + +നിത്യ നരസിംഹൻ, കലാകാരൻ + +![roadmap sketchnote](../../../translated_images/00-Roadmap.4905d6567dff47532b9bfb8e0b8980fc6b0b1292eebb24181c1a9753b33bc0f5.ml.png) + +--- + + +**അസൂയാ**: +ഈ രേഖ AI വിവർത്തന സേവനം [Co-op Translator](https://github.com/Azure/co-op-translator) ഉപയോഗിച്ച് വിവർത്തനം ചെയ്തതാണ്. നാം കൃത്യതയ്ക്ക് ശ്രമിച്ചിട്ടുണ്ടെങ്കിലും, സ്വയം പ്രവർത്തിക്കുന്ന വിവർത്തനങ്ങളിൽ പിശകുകൾ അല്ലെങ്കിൽ തെറ്റുകൾ ഉണ്ടാകാമെന്ന് ദയവായി ശ്രദ്ധിക്കുക. അതിന്റെ മാതൃഭാഷയിലുള്ള യഥാർത്ഥ രേഖയാണ് പ്രാമാണികമായ ഉറവിടം എന്ന് പരിഗണിക്കേണ്ടതാണ്. നിർണായകമായ വിവരങ്ങൾക്ക്, പ്രൊഫഷണൽ മനുഷ്യ വിവർത്തനം ശുപാർശ ചെയ്യപ്പെടുന്നു. ഈ വിവർത്തനം ഉപയോഗിക്കുന്നതിൽ നിന്നുണ്ടാകുന്ന ഏതെങ്കിലും തെറ്റിദ്ധാരണകൾക്കോ തെറ്റായ വ്യാഖ്യാനങ്ങൾക്കോ ഞങ്ങൾ ഉത്തരവാദികളല്ല. + \ No newline at end of file diff --git a/translations/te/1-Introduction/01-defining-data-science/README.md b/translations/te/1-Introduction/01-defining-data-science/README.md new file mode 100644 index 00000000..b4278e2f --- /dev/null +++ b/translations/te/1-Introduction/01-defining-data-science/README.md @@ -0,0 +1,178 @@ + +# డేటా సైన్స్ నిర్వచనం + +| ![ Sketchnote by [(@sketchthedocs)](https://sketchthedocs.dev) ](../../sketchnotes/01-Definitions.png) | +| :----------------------------------------------------------------------------------------------------: | +| డేటా సైన్స్ నిర్వచనం - _స్కెచ్ నోట్ [@nitya](https://twitter.com/nitya) ద్వారా_ | + +--- + +[![డేటా సైన్స్ నిర్వచనం వీడియో](../../../../translated_images/video-def-ds.6623ee2392ef1abf6d7faf3fad10a4163642811749da75f44e35a5bb121de15c.te.png)](https://youtu.be/beZ7Mb_oz9I) + +## [పూర్వ-లెక్చర్ క్విజ్](https://ff-quizzes.netlify.app/en/ds/quiz/0) + +## డేటా అంటే ఏమిటి? +మన రోజువారీ జీవితంలో, మనం ఎప్పుడూ డేటాతో చుట్టబడి ఉంటాము. మీరు ఇప్పుడు చదువుతున్న వచనం డేటానే. మీ స్మార్ట్‌ఫోన్‌లో మీ స్నేహితుల ఫోన్ నంబర్ల జాబితా డేటా, అలాగే మీ గడియారంలో ప్రదర్శించబడుతున్న ప్రస్తుత సమయం కూడా డేటానే. మనుషులుగా, మనం సహజంగానే డేటాతో పనిచేస్తాము, మన దగ్గర ఉన్న డబ్బును లెక్కించడం లేదా స్నేహితులకు లేఖలు రాయడం ద్వారా. + +కానీ, కంప్యూటర్లు సృష్టించబడిన తర్వాత డేటా చాలా ముఖ్యమైంది అయింది. కంప్యూటర్ల ప్రాథమిక పాత్ర గణనలను నిర్వహించడం, కానీ అవి ఆపరేట్ చేయడానికి డేటా అవసరం. కాబట్టి, మనం కంప్యూటర్లు డేటాను ఎలా నిల్వ చేస్తాయో, ప్రాసెస్ చేస్తాయో అర్థం చేసుకోవాలి. + +ఇంటర్నెట్ ఉద్భవంతో, కంప్యూటర్ల పాత్ర డేటా నిర్వహణ పరికరాలుగా పెరిగింది. మీరు ఆలోచిస్తే, ఇప్పుడు మనం కంప్యూటర్లను గణనలకు కాకుండా డేటా ప్రాసెసింగ్ మరియు కమ్యూనికేషన్ కోసం ఎక్కువగా ఉపయోగిస్తున్నాము. మనం స్నేహితునికి ఇమెయిల్ రాస్తున్నప్పుడు లేదా ఇంటర్నెట్‌లో సమాచారాన్ని శోధిస్తున్నప్పుడు - మనం అసలు డేటాను సృష్టించడం, నిల్వ చేయడం, ప్రసారం చేయడం మరియు మార్చడం చేస్తున్నాము. +> మీరు చివరిసారిగా కంప్యూటర్లను వాస్తవంగా ఏదైనా గణన చేయడానికి ఉపయోగించినప్పుడు గుర్తు చేసుకోగలరా? + +## డేటా సైన్స్ అంటే ఏమిటి? + +[వికీపీడియా](https://en.wikipedia.org/wiki/Data_science) ప్రకారం, **డేటా సైన్స్** అనేది *సంఘటిత మరియు అసంఘటిత డేటా నుండి జ్ఞానం మరియు అవగాహనలను పొందడానికి శాస్త్రీయ పద్ధతులను ఉపయోగించే శాస్త్రీయ రంగం, మరియు విస్తృత అనువర్తన రంగాలలో డేటా నుండి జ్ఞానం మరియు అమలు చేయదగిన అవగాహనలను వర్తింపజేసే రంగం*గా నిర్వచించబడింది. + +ఈ నిర్వచనం డేటా సైన్స్ యొక్క క్రింది ముఖ్యాంశాలను హైలైట్ చేస్తుంది: + +* డేటా సైన్స్ యొక్క ప్రధాన లక్ష్యం డేటా నుండి **జ్ఞానం పొందడం**, అంటే - డేటాను **అర్థం చేసుకోవడం**, కొన్ని దాగి ఉన్న సంబంధాలను కనుగొనడం మరియు ఒక **మోడల్** నిర్మించడం. +* డేటా సైన్స్ **శాస్త్రీయ పద్ధతులను** ఉపయోగిస్తుంది, ఉదాహరణకు సంభావ్యత మరియు గణాంకాలు. వాస్తవానికి, *డేటా సైన్స్* అనే పదం మొదట ప్రవేశపెట్టినప్పుడు, కొంతమంది డేటా సైన్స్ గణాంకాలకి కొత్త ఫ్యాన్సీ పేరు మాత్రమే అని వాదించారు. ఇప్పుడు ఈ రంగం చాలా విస్తృతమైందని స్పష్టమైంది. +* పొందిన జ్ఞానం కొన్ని **అమలు చేయదగిన అవగాహనలను** ఉత్పత్తి చేయడానికి ఉపయోగించాలి, అంటే మీరు వాస్తవ వ్యాపార పరిస్థితులకు వర్తింపజేయగల ప్రాక్టికల్ అవగాహన. +* మనం **సంఘటిత** మరియు **అసంఘటిత** డేటా రెండింటిపై కూడా ఆపరేట్ చేయగలగాలి. కోర్సులో తరువాత డేటా రకాల గురించి మళ్ళీ చర్చిస్తాము. +* **అనువర్తన రంగం** ఒక ముఖ్యమైన భావన, మరియు డేటా శాస్త్రవేత్తలు తరచుగా సమస్య రంగంలో కనీసం కొంత నైపుణ్యం కలిగి ఉండాలి, ఉదాహరణకు: ఫైనాన్స్, వైద్యం, మార్కెటింగ్ మొదలైనవి. + +> డేటా సైన్స్ యొక్క మరో ముఖ్యాంశం ఏమిటంటే, ఇది డేటాను కంప్యూటర్ల ద్వారా ఎలా సేకరించవచ్చో, నిల్వ చేయవచ్చో, ఆపరేట్ చేయవచ్చో అధ్యయనం చేస్తుంది. గణాంకాలు మనకు గణిత శాస్త్రపు ఆధారాలను ఇస్తే, డేటా సైన్స్ గణిత సూత్రాలను వాస్తవంగా డేటా నుండి అవగాహనలను పొందడానికి వర్తింపజేస్తుంది. + +డేటా సైన్స్‌ను చూడటానికి ఒక మార్గం ([జిమ్ గ్రే](https://en.wikipedia.org/wiki/Jim_Gray_(computer_scientist))కి అప్పగించబడింది) ఇది శాస్త్రం యొక్క వేరే ఒక పారడైమ్‌గా పరిగణించవచ్చు: +* **ప్రయోగాత్మక** (Empirical), ఇందులో మనం ఎక్కువగా పరిశీలనలు మరియు ప్రయోగాల ఫలితాలపై ఆధారపడతాము +* **సిద్ధాంతాత్మక** (Theoretical), ఇక్కడ కొత్త భావనలు ఉన్న శాస్త్రీయ జ్ఞానంలో నుండి ఉద్భవిస్తాయి +* **గణనాత్మక** (Computational), ఇక్కడ మనం కొన్ని గణనాత్మక ప్రయోగాల ఆధారంగా కొత్త సూత్రాలను కనుగొంటాము +* **డేటా-ఆధారిత** (Data-Driven), డేటాలో సంబంధాలు మరియు నమూనాలను కనుగొనడంపై ఆధారపడి ఉంటుంది + +## ఇతర సంబంధిత రంగాలు + +డేటా విస్తృతంగా ఉండటంతో, డేటా సైన్స్ కూడా విస్తృత రంగం, అనేక ఇతర శాస్త్రాలను స్పర్శిస్తుంది. + +
+
డేటాబేసులు
+
+ముఖ్యమైన పరిగణన ఏమిటంటే డేటాను ఎలా నిల్వ చేయాలి, అంటే వేగంగా ప్రాసెస్ చేయడానికి ఎలా నిర్మించాలి. వివిధ రకాల డేటాబేసులు ఉన్నాయి, అవి సంఘటిత మరియు అసంఘటిత డేటాను నిల్వ చేస్తాయి, వాటిని మన కోర్సులో పరిశీలిస్తాము. +
+
బిగ్ డేటా
+
+చాలా పెద్ద పరిమాణంలో సాదారణ నిర్మాణంతో ఉన్న డేటాను నిల్వ చేసి ప్రాసెస్ చేయాల్సి వస్తుంది. కంప్యూటర్ క్లస్టర్‌లో పంపిణీ చేయబడిన విధంగా ఆ డేటాను నిల్వ చేయడానికి మరియు సమర్థవంతంగా ప్రాసెస్ చేయడానికి ప్రత్యేక పద్ధతులు మరియు సాధనాలు ఉన్నాయి. +
+
మిషన్ లెర్నింగ్
+
+డేటాను అర్థం చేసుకోవడానికి ఒక మార్గం అనేది కావలసిన ఫలితాన్ని అంచనా వేయగలిగే మోడల్ నిర్మించడం. డేటా నుండి మోడల్స్ అభివృద్ధి చేయడం మిషన్ లెర్నింగ్ అని పిలవబడుతుంది. దీని గురించి మరింత తెలుసుకోవడానికి మన Machine Learning for Beginners పాఠ్యాంశాన్ని చూడవచ్చు. +
+
కృత్రిమ మేధస్సు
+
+మిషన్ లెర్నింగ్ యొక్క ఒక విభాగం అయిన కృత్రిమ మేధస్సు (AI) కూడా డేటాపై ఆధారపడి ఉంటుంది, మరియు ఇది మానవ ఆలోచనా ప్రక్రియలను అనుకరించే అధిక సంక్లిష్టత మోడల్స్ నిర్మించడంలో నిమగ్నమవుతుంది. AI పద్ధతులు తరచుగా అసంఘటిత డేటాను (ఉదా: సహజ భాష) సంఘటిత అవగాహనలుగా మార్చడానికి సహాయపడతాయి. +
+
విజువలైజేషన్
+
+చాలా పెద్ద పరిమాణంలో ఉన్న డేటా మనుషులకు అర్థం కాకపోవచ్చు, కానీ ఆ డేటాను ఉపయోగించి ఉపయోగకరమైన విజువలైజేషన్లు సృష్టించినప్పుడు, మనం డేటాను బాగా అర్థం చేసుకుని కొన్ని తర్కాలను తీసుకోవచ్చు. కాబట్టి, సమాచారాన్ని విజువలైజ్ చేయడానికి అనేక మార్గాలను తెలుసుకోవడం ముఖ్యం - ఇది మన కోర్సు మూడు సెక్షన్లో కవర్ చేస్తాము. సంబంధిత రంగాలు ఇన్ఫోగ్రాఫిక్స్ మరియు సాధారణంగా హ్యూమన్-కంప్యూటర్ ఇంటరాక్షన్ కూడా ఉన్నాయి. +
+
+ +## డేటా రకాలు + +మనం ఇప్పటికే చెప్పినట్లుగా, డేటా ఎక్కడా ఉంటుంది. మనం దాన్ని సరైన విధంగా సేకరించాలి! **సంఘటిత** మరియు **అసంఘటిత** డేటాను వేరుచేయడం ఉపయోగకరం. మొదటిది సాధారణంగా బాగా నిర్మించబడిన రూపంలో ఉంటుంది, తరచుగా ఒక పట్టిక లేదా పలు పట్టికల రూపంలో, మరొకటి కేవలం ఫైళ్ల సేకరణ మాత్రమే. కొన్నిసార్లు మనం **అర్ధ-సంఘటిత** డేటా గురించి కూడా మాట్లాడవచ్చు, దీనికి కొంత నిర్మాణం ఉంటుంది కానీ అది చాలా మారవచ్చు. + +| సంఘటిత | అర్ధ-సంఘటిత | అసంఘటిత | +| ---------------------------------------------------------------------------- | ---------------------------------------------------------------------------------------------- | --------------------------------------- | +| వ్యక్తుల ఫోన్ నంబర్ల జాబితా | లింకులతో ఉన్న వికీపీడియా పేజీలు | ఎన్సైక్లోపిడియా బ్రిటానికా వచనం | +| గత 20 సంవత్సరాల పాటు ప్రతి నిమిషం భవనం లోని అన్ని గదుల ఉష్ణోగ్రత | రచయితలు, ప్రచురణ తేదీ, సారాంశంతో JSON ఫార్మాట్‌లో శాస్త్రీయ పత్రాల సేకరణ | కార్పొరేట్ డాక్యుమెంట్లతో ఫైల్ షేర్ | +| భవనంలో ప్రవేశించే అన్ని వ్యక్తుల వయస్సు మరియు లింగం డేటా | ఇంటర్నెట్ పేజీలు | పర్యవేక్షణ కెమెరా నుండి రా వీడియో ఫీడ్ | + +## డేటా ఎక్కడ నుండి పొందాలి + +డేటా పొందడానికి అనేక సాధ్యమైన మూలాలు ఉన్నాయి, వాటన్నింటినీ జాబితా చేయడం అసాధ్యం! అయినప్పటికీ, మీరు డేటా పొందగల సాధారణ ప్రదేశాలను కొన్ని చెప్పుకుందాం: + +* **సంఘటిత** + - **ఇంటర్నెట్ ఆఫ్ థింగ్స్** (IoT), ఉష్ణోగ్రత లేదా ఒత్తిడి సెన్సార్ల వంటి వివిధ సెన్సార్ల నుండి డేటా సహా, చాలా ఉపయోగకరమైన డేటాను అందిస్తుంది. ఉదాహరణకు, ఒక కార్యాలయ భవనం IoT సెన్సార్లతో సజ్జమైతే, మనం ఆటోమేటిక్‌గా వేడి మరియు లైటింగ్‌ను నియంత్రించి ఖర్చులను తగ్గించవచ్చు. + - **సర్వేలు** వినియోగదారులు కొనుగోలు తర్వాత లేదా వెబ్ సైట్ సందర్శించిన తర్వాత పూర్తి చేయమని అడిగే ప్రశ్నావళి. + - **ప్రవర్తన విశ్లేషణ** ఉదాహరణకు, వినియోగదారు ఒక సైట్ లో ఎంత లోతుగా వెళ్తున్నాడో, మరియు సైట్ నుండి బయటకు వెళ్లడానికి సాధారణ కారణం ఏమిటో అర్థం చేసుకోవడంలో సహాయపడుతుంది. +* **అసంఘటిత** + - **వచనాలు** ఒక సంపూర్ణ **భావోద్వేగ స్కోరు** లేదా కీలకపదాలు మరియు సారాంశాన్ని తీసివేయడం వంటి అవగాహనల సమృద్ధి మూలం కావచ్చు. + - **చిత్రాలు** లేదా **వీడియో**. పర్యవేక్షణ కెమెరా నుండి వీడియో రోడ్డుపై ట్రాఫిక్ అంచనా వేయడానికి మరియు ట్రాఫిక్ జామ్‌ల గురించి ప్రజలకు సమాచారం ఇవ్వడానికి ఉపయోగించవచ్చు. + - వెబ్ సర్వర్ **లాగ్స్** మన సైట్ లో ఏ పేజీలు ఎక్కువగా సందర్శించబడుతున్నాయో, మరియు ఎంతసేపు ఉంటున్నారో అర్థం చేసుకోవడానికి ఉపయోగించవచ్చు. +* అర్ధ-సంఘటిత + - **సోషల్ నెట్‌వర్క్** గ్రాఫ్లు వినియోగదారుల వ్యక్తిత్వాలు మరియు సమాచారాన్ని వ్యాప్తి చేయడంలో సామర్థ్యం గురించి మంచి డేటా మూలాలు కావచ్చు. + - పార్టీ నుండి ఫోటోలు ఉన్నప్పుడు, మనం ఒకరితో ఒకరు ఫోటోలు తీసుకునే వ్యక్తుల గ్రాఫ్ నిర్మించి **గ్రూప్ డైనమిక్స్** డేటాను తీసివేయవచ్చు. + +వివిధ డేటా మూలాలను తెలుసుకోవడం ద్వారా, మీరు వివిధ పరిస్థితుల గురించి ఆలోచించి, డేటా సైన్స్ సాంకేతికతలను వర్తింపజేసి పరిస్థితిని మెరుగుపరచడానికి ప్రయత్నించవచ్చు. + +## డేటాతో మీరు ఏమి చేయగలరు + +డేటా సైన్స్‌లో, మనం డేటా ప్రయాణం క్రింది దశలపై దృష్టి పెడతాము: + +
+
1) డేటా సేకరణ
+
+మొదటి దశ డేటాను సేకరించడం. చాలా సందర్భాల్లో ఇది సులభమైన ప్రక్రియ కావచ్చు, ఉదాహరణకు వెబ్ అప్లికేషన్ నుండి డేటా డేటాబేస్‌కు వస్తుంది, కానీ కొన్నిసార్లు ప్రత్యేక సాంకేతికతలు ఉపయోగించాల్సి ఉంటుంది. ఉదాహరణకు, IoT సెన్సార్ల నుండి డేటా అధికంగా ఉండవచ్చు, అందువల్ల IoT హబ్ వంటి బఫరింగ్ ఎండ్పాయింట్లను ఉపయోగించి అన్ని డేటాను సేకరించి తర్వాత ప్రాసెస్ చేయడం మంచి పద్ధతి. +
+
2) డేటా నిల్వ
+
+డేటాను నిల్వ చేయడం సవాలు కావచ్చు, ముఖ్యంగా బిగ్ డేటా గురించి మాట్లాడుతున్నప్పుడు. డేటాను ఎలా నిల్వ చేయాలో నిర్ణయించేటప్పుడు, భవిష్యత్తులో మీరు డేటాను ఎలా క్వెరీ చేయాలనుకుంటున్నారో ముందుగా ఊహించడం మంచిది. డేటాను నిల్వ చేసే కొన్ని మార్గాలు ఉన్నాయి: +
    +
  • ఒక రిలేషనల్ డేటాబేస్ పట్టికల సేకరణను నిల్వ చేస్తుంది, మరియు వాటిని క్వెరీ చేయడానికి SQL అనే ప్రత్యేక భాషను ఉపయోగిస్తుంది. సాధారణంగా, పట్టికలు వివిధ గ్రూపులుగా, స్కీమాలుగా పిలవబడతాయి. చాలా సందర్భాల్లో డేటాను అసలు రూపం నుండి స్కీమాకు సరిపడేలా మార్చాల్సి ఉంటుంది.
  • +
  • NoSQL డేటాబేస్, ఉదాహరణకు CosmosDB, డేటాపై స్కీమాలను అమలు చేయదు, మరియు మరింత సంక్లిష్టమైన డేటాను నిల్వ చేయడానికి అనుమతిస్తుంది, ఉదాహరణకు, హైరార్కికల్ JSON డాక్యుమెంట్లు లేదా గ్రాఫ్లు. అయితే, NoSQL డేటాబేసులకు SQL లాంటి సమృద్ధి క్వెరీ సామర్థ్యాలు లేవు, మరియు రిఫరెన్షియల్ ఇంటిగ్రిటీని అమలు చేయలేవు, అంటే పట్టికల నిర్మాణం మరియు పట్టికల మధ్య సంబంధాలను నియంత్రించే నియమాలు.
  • +
  • డేటా లేక్ నిల్వ అనేది పెద్ద పరిమాణంలో ఉన్న రా, అసంఘటిత డేటా సేకరణ కోసం ఉపయోగిస్తారు. డేటా లేక్స్ తరచుగా బిగ్ డేటాతో ఉపయోగిస్తారు, అందులో అన్ని డేటా ఒకే యంత్రంలో సరిపోదు, కాబట్టి క్లస్టర్ సర్వర్ల ద్వారా నిల్వ చేసి ప్రాసెస్ చేయాలి. పార్కెట్ అనేది బిగ్ డేటాతో తరచుగా ఉపయోగించే డేటా ఫార్మాట్.
  • +
+
+
3) డేటా ప్రాసెసింగ్
+
+ఇది డేటా ప్రయాణంలో అత్యంత ఆసక్తికరమైన భాగం, ఇది డేటాను అసలు రూపం నుండి విజువలైజేషన్/మోడల్ శిక్షణకు ఉపయోగించే రూపంలోకి మార్చడం. వచనం లేదా చిత్రాల వంటి అసంఘటిత డేటాతో వ్యవహరించేటప్పుడు, మనం కొంత AI సాంకేతికతలను ఉపయోగించి డేటా నుండి ఫీచర్లు తీసివేయవచ్చు, తద్వారా దాన్ని సంఘటిత రూపంలోకి మార్చవచ్చు. +
+
4) విజువలైజేషన్ / మానవ అవగాహన
+
+చాలాసార్లు, డేటాను అర్థం చేసుకోవడానికి, మనం దాన్ని విజువలైజ్ చేయాలి. మన టూల్‌బాక్స్‌లో అనేక విజువలైజేషన్ పద్ధతులు ఉండటం వల్ల, సరైన దృశ్యాన్ని కనుగొని అవగాహన పొందవచ్చు. తరచుగా, డేటా శాస్త్రవేత్త డేటాతో "ఆడుకుంటూ", దాన్ని ఎన్నో సార్లు విజువలైజ్ చేసి సంబంధాలను వెతుకుతాడు. అలాగే, మనం గణాంక పద్ధతులను ఉపయోగించి ఒక హైపోథసిస్‌ను పరీక్షించవచ్చు లేదా డేటా భాగాల మధ్య సంబంధాన్ని నిరూపించవచ్చు. +
+
5) అంచనా మోడల్ శిక్షణ
+
+డేటా సైన్స్ యొక్క తుది లక్ష్యం డేటా ఆధారంగా నిర్ణయాలు తీసుకోవడం కావడంతో, మనం మిషన్ లెర్నింగ్ సాంకేతికతలను ఉపయోగించి అంచనా మోడల్ నిర్మించవచ్చు. తరువాత, ఈ మోడల్‌ను ఉపయోగించి సమాన నిర్మాణాలున్న కొత్త డేటా సెట్‌లపై అంచనాలు చేయవచ్చు. +
+
+ +తప్పకుండా, వాస్తవ డేటాపై ఆధారపడి, కొన్ని దశలు లేకపోవచ్చు (ఉదా: మనకు ఇప్పటికే డేటా డేటాబేస్‌లో ఉన్నప్పుడు, లేదా మోడల్ శిక్షణ అవసరం లేకపోతే), లేదా కొన్ని దశలు పలు సార్లు పునరావృతమవ్వచ్చు (ఉదా: డేటా ప్రాసెసింగ్). + +## డిజిటలైజేషన్ మరియు డిజిటల్ ట్రాన్స్‌ఫర్మేషన్ + +గత దశాబ్దంలో, అనేక వ్యాపారాలు వ్యాపార నిర్ణయాలు తీసుకునేటప్పుడు డేటా ప్రాముఖ్యతను అర్థం చేసుకున్నాయి. వ్యాపారాన్ని నడిపించడానికి డేటా సైన్స్ సూత్రాలను వర్తింపజేయడానికి, మొదట కొంత డేటాను సేకరించాలి, అంటే వ్యాపార ప్రక్రియలను డిజిటల్ రూపంలోకి మార్చాలి. దీనిని **డిజిటలైజేషన్** అంటారు. ఈ డేటాపై డేటా సైన్స్ సాంకేతికతలను వర్తింపజేసి నిర్ణయాలను మార్గనిర్దేశం చేయడం ద్వారా ఉత్పాదకతలో గణనీయమైన పెరుగుదల (లేదా వ్యాపార మార్పు) సాధించవచ్చు, దీనిని **డిజిటల్ ట్రాన్స్‌ఫర్మేషన్** అంటారు. + +ఒక ఉదాహరణను పరిశీలిద్దాం. మనకు ఒక డేటా సైన్స్ కోర్సు (ఇలాంటి ఒకటి) ఉంది, దీన్ని మనం ఆన్‌లైన్‌లో విద్యార్థులకు అందిస్తున్నాము, మరియు దీన్ని మెరుగుపరచడానికి డేటా సైన్స్ ఉపయోగించాలనుకుంటున్నాము. మనం ఎలా చేయగలం? + +మనం మొదట అడగవచ్చు "ఏం డిజిటలైజ్ చేయవచ్చు?" సులభమైన మార్గం ప్రతి విద్యార్థి ప్రతి మాడ్యూల్ పూర్తి చేయడానికి తీసుకునే సమయాన్ని కొలవడం, మరియు ప్రతి మాడ్యూల్ చివరలో బహుళ ఎంపిక పరీక్ష ద్వారా పొందిన జ్ఞానాన్ని కొలవడం. అన్ని విద్యార్థుల సమయాన్ని సగటు తీసుకుంటే, ఏ మాడ్యూల్స్ విద్యార్థులకు ఎక్కువ కష్టాలు కలిగిస్తున్నాయో తెలుసుకుని వాటిని సులభతరం చేయడానికి పని చేయవచ్చు. +> మీరు ఈ విధానం సరైనది కాదని వాదించవచ్చు, ఎందుకంటే మాడ్యూల్స్ వివిధ పొడవులలో ఉండవచ్చు. మాడ్యూల్ పొడవు (అక్షరాల సంఖ్యలో) ద్వారా సమయాన్ని భాగించటం మరింత న్యాయమైనది, మరియు ఆ విలువలను పోల్చటం మంచిది. + +మేము బహుళ-ఎంపిక పరీక్షల ఫలితాలను విశ్లేషించడం ప్రారంభించినప్పుడు, విద్యార్థులు అర్థం చేసుకోవడంలో కష్టపడుతున్న భావనలను గుర్తించడానికి ప్రయత్నించవచ్చు, మరియు ఆ సమాచారాన్ని ఉపయోగించి కంటెంట్‌ను మెరుగుపరచవచ్చు. దానికి, ప్రతి ప్రశ్న ఒక నిర్దిష్ట భావన లేదా జ్ఞాన భాగానికి మ్యాప్ అయ్యే విధంగా పరీక్షలను రూపకల్పన చేయాలి. + +మరింత క్లిష్టంగా చేయాలనుకుంటే, మేము ప్రతి మాడ్యూల్ కోసం తీసుకున్న సమయాన్ని విద్యార్థుల వయస్సు వర్గంతో పోల్చి గ్రాఫ్ చేయవచ్చు. కొన్ని వయస్సు వర్గాల కోసం మాడ్యూల్ పూర్తి చేయడానికి అనవసరంగా ఎక్కువ సమయం పడుతుందని లేదా విద్యార్థులు పూర్తి చేయకముందే వదిలివేస్తారని కనుగొనవచ్చు. ఇది మాడ్యూల్ కోసం వయస్సు సిఫార్సులను అందించడంలో సహాయపడుతుంది, మరియు తప్పు అంచనాల వల్ల ప్రజల అసంతృప్తిని తగ్గిస్తుంది. + +## 🚀 సవాలు + +ఈ సవాలలో, మేము డేటా సైన్స్ రంగానికి సంబంధించిన భావనలను పాఠ్యాలను పరిశీలించడం ద్వారా కనుగొనడానికి ప్రయత్నిస్తాము. మేము డేటా సైన్స్ పై వికీపీడియా వ్యాసాన్ని తీసుకుని, టెక్స్ట్‌ను డౌన్లోడ్ చేసి ప్రాసెస్ చేసి, ఈ విధమైన పద మేఘాన్ని నిర్మిస్తాము: + +![Word Cloud for Data Science](../../../../translated_images/ds_wordcloud.664a7c07dca57de017c22bf0498cb40f898d48aa85b3c36a80620fea12fadd42.te.png) + +కోడ్‌ను చదవడానికి [`notebook.ipynb`](../../../../1-Introduction/01-defining-data-science/notebook.ipynb ':ignore') ను సందర్శించండి. మీరు కోడ్‌ను కూడా నడిపించి, అన్ని డేటా మార్పిడి ప్రక్రియలను ప్రత్యక్షంగా చూడవచ్చు. + +> మీరు జూపిటర్ నోట్‌బుక్‌లో కోడ్ ఎలా నడిపించాలో తెలియకపోతే, [ఈ వ్యాసం](https://soshnikov.com/education/how-to-execute-notebooks-from-github/) చూడండి. + +## [పోస్ట్-లెక్చర్ క్విజ్](https://ff-quizzes.netlify.app/en/ds/quiz/1) + +## అసైన్‌మెంట్లు + +* **టాస్క్ 1**: పై కోడ్‌ను మార్చి **బిగ్ డేటా** మరియు **మిషన్ లెర్నింగ్** రంగాలకు సంబంధించిన భావనలను కనుగొనండి +* **టాస్క్ 2**: [డేటా సైన్స్ సన్నివేశాల గురించి ఆలోచించండి](assignment.md) + +## క్రెడిట్స్ + +ఈ పాఠం ♥️ తో [Dmitry Soshnikov](http://soshnikov.com) రచించారు + +--- + + +**అస్పష్టత**: +ఈ పత్రాన్ని AI అనువాద సేవ [Co-op Translator](https://github.com/Azure/co-op-translator) ఉపయోగించి అనువదించబడింది. మేము ఖచ్చితత్వానికి ప్రయత్నించినప్పటికీ, ఆటోమేటెడ్ అనువాదాల్లో పొరపాట్లు లేదా తప్పిదాలు ఉండవచ్చు. అసలు పత్రం దాని స్వదేశీ భాషలోనే అధికారిక మూలంగా పరిగణించాలి. ముఖ్యమైన సమాచారానికి, ప్రొఫెషనల్ మానవ అనువాదం సిఫార్సు చేయబడుతుంది. ఈ అనువాదం వాడకంలో ఏర్పడిన ఏవైనా అపార్థాలు లేదా తప్పుదారుల కోసం మేము బాధ్యత వహించము. + \ No newline at end of file diff --git a/translations/te/1-Introduction/01-defining-data-science/assignment.md b/translations/te/1-Introduction/01-defining-data-science/assignment.md new file mode 100644 index 00000000..1f797fc5 --- /dev/null +++ b/translations/te/1-Introduction/01-defining-data-science/assignment.md @@ -0,0 +1,48 @@ + +# అసైన్‌మెంట్: డేటా సైన్స్ సన్నివేశాలు + +ఈ మొదటి అసైన్‌మెంట్‌లో, మీరు వివిధ సమస్యా డొమైన్‌లలోని కొన్ని వాస్తవ జీవిత ప్రక్రియ లేదా సమస్య గురించి ఆలోచించి, డేటా సైన్స్ ప్రక్రియను ఉపయోగించి దాన్ని ఎలా మెరుగుపరచవచ్చో ఆలోచించమని కోరుతున్నాము. క్రింది విషయాల గురించి ఆలోచించండి: + +1. మీరు ఏ డేటాను సేకరించగలరు? +1. దాన్ని మీరు ఎలా సేకరిస్తారు? +1. డేటాను మీరు ఎలా నిల్వ చేస్తారు? డేటా ఎంత పెద్దదిగా ఉండవచ్చు? +1. ఈ డేటా నుండి మీరు ఏ అవగాహనలను పొందగలరు? డేటా ఆధారంగా ఏ నిర్ణయాలను తీసుకోవచ్చు? + +3 విభిన్న సమస్యలు/ప్రక్రియల గురించి ఆలోచించి, ప్రతి సమస్యా డొమైన్ కోసం పై పాయింట్లను వివరించండి. + +ఇక్కడ కొన్ని సమస్యా డొమైన్‌లు మరియు సమస్యలు ఉన్నాయి, ఇవి మీ ఆలోచన ప్రారంభానికి సహాయపడతాయి: + +1. పిల్లల విద్యా ప్రక్రియను మెరుగుపరచడానికి మీరు డేటాను ఎలా ఉపయోగించగలరు? +1. మహమ్మారి సమయంలో టీకా నియంత్రణ కోసం మీరు డేటాను ఎలా ఉపయోగించగలరు? +1. మీరు పని సమయంలో ఉత్పాదకత ఉన్నారని నిర్ధారించుకోవడానికి డేటాను ఎలా ఉపయోగించగలరు? + +## సూచనలు + +క్రింది పట్టికను పూరించండి (అవసరమైతే సూచించిన సమస్యా డొమైన్‌ల స్థానంలో మీ స్వంత వాటిని ఉపయోగించండి): + +| సమస్యా డొమైన్ | సమస్య | ఏ డేటాను సేకరించాలి | డేటాను ఎలా నిల్వ చేయాలి | ఏ అవగాహనలు/నిర్ణయాలు తీసుకోవచ్చు | +|----------------|---------|-----------------------|-----------------------|--------------------------------------| +| విద్య | | | | | +| టీకా | | | | | +| ఉత్పాదకత | | | | | + +## రూబ్రిక్ + +ఉదాహరణాత్మక | సరిపడిన | మెరుగుదల అవసరం +--- | --- | -- | +అన్ని సమస్యా డొమైన్‌ల కోసం తగిన డేటా మూలాలు, డేటా నిల్వ విధానాలు మరియు సాధ్యమైన నిర్ణయాలు/అవగాహనలను గుర్తించగలిగినవారు | పరిష్కారంలోని కొన్ని అంశాలు వివరించబడలేదు, డేటా నిల్వ చర్చించబడలేదు, కనీసం 2 సమస్యా డొమైన్‌లు మాత్రమే వివరించబడ్డాయి | డేటా పరిష్కారంలోని భాగాలు మాత్రమే వివరించబడ్డాయి, ఒకే ఒక సమస్యా డొమైన్ మాత్రమే పరిగణించబడింది. + +--- + + +**అస్పష్టత**: +ఈ పత్రాన్ని AI అనువాద సేవ [Co-op Translator](https://github.com/Azure/co-op-translator) ఉపయోగించి అనువదించబడింది. మేము ఖచ్చితత్వానికి ప్రయత్నించినప్పటికీ, ఆటోమేటెడ్ అనువాదాల్లో పొరపాట్లు లేదా తప్పిదాలు ఉండవచ్చు. అసలు పత్రం దాని స్వదేశీ భాషలోనే అధికారిక మూలంగా పరిగణించాలి. ముఖ్యమైన సమాచారానికి, ప్రొఫెషనల్ మానవ అనువాదం సిఫార్సు చేయబడుతుంది. ఈ అనువాదం వాడకంలో ఏర్పడిన ఏవైనా అపార్థాలు లేదా తప్పుదారితీసే అర్థాలు కోసం మేము బాధ్యత వహించము. + \ No newline at end of file diff --git a/translations/te/1-Introduction/01-defining-data-science/notebook.ipynb b/translations/te/1-Introduction/01-defining-data-science/notebook.ipynb new file mode 100644 index 00000000..a14b6220 --- /dev/null +++ b/translations/te/1-Introduction/01-defining-data-science/notebook.ipynb @@ -0,0 +1,431 @@ +{ + "cells": [ + { + "cell_type": "markdown", + "source": [ + "# సవాలు: డేటా సైన్స్ గురించి టెక్స్ట్ విశ్లేషణ\n", + "\n", + "ఈ ఉదాహరణలో, సంప్రదాయ డేటా సైన్స్ ప్రక్రియలోని అన్ని దశలను కవర్ చేసే ఒక సులభమైన వ్యాయామం చేద్దాం. మీరు ఏ కోడ్ రాయాల్సిన అవసరం లేదు, కింద ఉన్న సెల్స్‌పై క్లిక్ చేసి వాటిని అమలు చేసి ఫలితాన్ని పరిశీలించవచ్చు. ఒక సవాలుగా, మీరు ఈ కోడ్‌ను వేరే డేటాతో ప్రయత్నించమని ప్రోత్సహించబడుతున్నారు.\n", + "\n", + "## లక్ష్యం\n", + "\n", + "ఈ పాఠంలో, మేము డేటా సైన్స్‌కు సంబంధించిన వివిధ భావనలను చర్చిస్తున్నాము. **టెక్స్ట్ మైనింగ్** చేయడం ద్వారా మరిన్ని సంబంధిత భావనలను కనుగొనడానికి ప్రయత్నిద్దాం. మేము డేటా సైన్స్ గురించి ఒక టెక్స్ట్‌తో ప్రారంభించి, దానిలోని కీలకపదాలను తీసుకుని, ఆ తర్వాత ఫలితాన్ని దృశ్యీకరించడానికి ప్రయత్నిస్తాము.\n", + "\n", + "టెక్స్ట్‌గా, నేను వికీపీడియా నుండి డేటా సైన్స్ పేజీని ఉపయోగిస్తాను:\n" + ], + "metadata": {} + }, + { + "cell_type": "markdown", + "source": [], + "metadata": {} + }, + { + "cell_type": "code", + "execution_count": 62, + "source": [ + "url = 'https://en.wikipedia.org/wiki/Data_science'" + ], + "outputs": [], + "metadata": {} + }, + { + "cell_type": "markdown", + "source": [ + "## Step 1: డేటా పొందడం\n", + "\n", + "ప్రతి డేటా సైన్స్ ప్రక్రియలో మొదటి దశ డేటాను పొందడం. దీని కోసం మనం `requests` లైబ్రరీని ఉపయోగిస్తాము:\n" + ], + "metadata": {} + }, + { + "cell_type": "code", + "execution_count": 63, + "source": [ + "import requests\r\n", + "\r\n", + "text = requests.get(url).content.decode('utf-8')\r\n", + "print(text[:1000])" + ], + "outputs": [ + { + "output_type": "stream", + "name": "stdout", + "text": [ + "\n", + "\n", + "\n", + "\n", + "Data science - Wikipedia\n", + "