chore(i18n): sync translations with latest source changes (chunk 8/10, 100 files)

pull/720/head
localizeflow[bot] 2 months ago
parent 2a56f44f51
commit c945bd6341

@ -0,0 +1,231 @@
<!--
CO_OP_TRANSLATOR_METADATA:
{
"original_hash": "22acf28f518a4769ea14fa42f4734b9f",
"translation_date": "2025-12-19T16:33:36+00:00",
"source_file": "3-Data-Visualization/R/09-visualization-quantities/README.md",
"language_code": "kn"
}
-->
# ಪ್ರಮಾಣಗಳನ್ನು ದೃಶ್ಯೀಕರಿಸುವುದು
|![ [(@sketchthedocs)](https://sketchthedocs.dev) ಅವರಿಂದ ಸ್ಕೆಚ್ ನೋಟ್ ](https://github.com/microsoft/Data-Science-For-Beginners/blob/main/sketchnotes/09-Visualizing-Quantities.png)|
|:---:|
| ಪ್ರಮಾಣಗಳನ್ನು ದೃಶ್ಯೀಕರಿಸುವುದು - _[@nitya](https://twitter.com/nitya) ಅವರಿಂದ ಸ್ಕೆಚ್ ನೋಟ್_ |
ಈ ಪಾಠದಲ್ಲಿ ನೀವು ಪ್ರಮಾಣದ ಸಂಧರ್ಭದಲ್ಲಿ ರೋಚಕ ದೃಶ್ಯೀಕರಣಗಳನ್ನು ರಚಿಸುವುದನ್ನು ಕಲಿಯಲು ಲಭ್ಯವಿರುವ ಹಲವಾರು R ಪ್ಯಾಕೇಜ್ ಗ್ರಂಥಾಲಯಗಳನ್ನು ಹೇಗೆ ಬಳಸಬೇಕೆಂದು ಅನ್ವೇಷಿಸುವಿರಿ. ಮಿನೆಸೋಟಾದ ಪಕ್ಷಿಗಳ ಬಗ್ಗೆ ಸ್ವಚ್ಛಗೊಳಿಸಿದ ಡೇಟಾಸೆಟ್ ಬಳಸಿ, ನೀವು ಸ್ಥಳೀಯ ವನ್ಯಜೀವಿಗಳ ಬಗ್ಗೆ ಹಲವಾರು ರೋಚಕ ವಾಸ್ತವಗಳನ್ನು ತಿಳಿದುಕೊಳ್ಳಬಹುದು.
## [ಪೂರ್ವ-ಪಾಠ ಪ್ರಶ್ನೋತ್ತರ](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/16)
## ggplot2 ಬಳಸಿ ರೆಕ್ಕೆ ವ್ಯಾಪ್ತಿಯನ್ನು ಗಮನಿಸಿ
ವಿವಿಧ ರೀತಿಯ ಸರಳ ಮತ್ತು ಸುಕ್ಷ್ಮ ಪ್ಲಾಟ್‌ಗಳು ಮತ್ತು ಚಾರ್ಟ್‌ಗಳನ್ನು ರಚಿಸಲು ಅತ್ಯುತ್ತಮ ಗ್ರಂಥಾಲಯವೆಂದರೆ [ggplot2](https://cran.r-project.org/web/packages/ggplot2/index.html). ಸಾಮಾನ್ಯವಾಗಿ, ಈ ಗ್ರಂಥಾಲಯಗಳನ್ನು ಬಳಸಿ ಡೇಟಾವನ್ನು ಪ್ಲಾಟ್ ಮಾಡುವ ಪ್ರಕ್ರಿಯೆಯಲ್ಲಿ ನಿಮ್ಮ ಡೇಟಾಫ್ರೇಮ್‌ನ ಯಾವ ಭಾಗಗಳನ್ನು ಗುರಿಯಾಗಿಸಬೇಕೆಂದು ಗುರುತಿಸುವುದು, ಆ ಡೇಟಾದ ಮೇಲೆ ಅಗತ್ಯವಿರುವ ಪರಿವರ್ತನೆಗಳನ್ನು ಮಾಡುವುದು, ಅದರ x ಮತ್ತು y ಅಕ್ಷ ಮೌಲ್ಯಗಳನ್ನು ನಿಗದಿಪಡಿಸುವುದು, ಯಾವ ರೀತಿಯ ಪ್ಲಾಟ್ ತೋರಿಸಬೇಕೆಂದು ನಿರ್ಧರಿಸುವುದು ಮತ್ತು ನಂತರ ಪ್ಲಾಟ್ ತೋರಿಸುವುದು ಸೇರಿದೆ.
`ggplot2` ಒಂದು ಘೋಷಣಾತ್ಮಕವಾಗಿ ಗ್ರಾಫಿಕ್ಸ್ ರಚಿಸುವ ವ್ಯವಸ್ಥೆಯಾಗಿದ್ದು, The Grammar of Graphics ಆಧಾರಿತವಾಗಿದೆ. [The Grammar of Graphics](https://en.wikipedia.org/wiki/Ggplot2) ಒಂದು ಸಾಮಾನ್ಯ ಡೇಟಾ ದೃಶ್ಯೀಕರಣ ಯೋಜನೆಯಾಗಿದ್ದು, ಗ್ರಾಫ್‌ಗಳನ್ನು ಸ್ಕೇಲ್‌ಗಳು ಮತ್ತು ಲೇಯರ್‌ಗಳಂತಹ ಅರ್ಥಪೂರ್ಣ ಘಟಕಗಳಾಗಿ ವಿಭಜಿಸುತ್ತದೆ. ಬೇರೆ ಮಾತಿನಲ್ಲಿ ಹೇಳುವುದಾದರೆ, ಕಡಿಮೆ ಕೋಡ್‌ನೊಂದಿಗೆ ಏಕವ್ಯತ್ಯಯ ಅಥವಾ ಬಹುವ್ಯತ್ಯಯ ಡೇಟಾಗಾಗಿ ಪ್ಲಾಟ್‌ಗಳು ಮತ್ತು ಗ್ರಾಫ್‌ಗಳನ್ನು ಸುಲಭವಾಗಿ ರಚಿಸುವುದರಿಂದ `ggplot2` R ನಲ್ಲಿ ದೃಶ್ಯೀಕರಣಗಳಿಗೆ ಅತ್ಯಂತ ಜನಪ್ರಿಯ ಪ್ಯಾಕೇಜಾಗಿದೆ. ಬಳಕೆದಾರರು `ggplot2` ಗೆ ಚರಗಳನ್ನು ಎಸ್ಟೆಟಿಕ್ಸ್‌ಗೆ ಹೇಗೆ ನಕ್ಷೆ ಮಾಡಬೇಕೆಂದು, ಬಳಸಬೇಕಾದ ಗ್ರಾಫಿಕಲ್ ಪ್ರಿಮಿಟಿವ್‌ಗಳನ್ನು ಹೇಳುತ್ತಾರೆ ಮತ್ತು ಉಳಿದುದನ್ನು `ggplot2` ನೋಡಿಕೊಳ್ಳುತ್ತದೆ.
> ✅ ಪ್ಲಾಟ್ = ಡೇಟಾ + ಎಸ್ಟೆಟಿಕ್ಸ್ + ಜ್ಯಾಮಿತಿ
> - ಡೇಟಾ ಎಂದರೆ ಡೇಟಾಸೆಟ್
> - ಎಸ್ಟೆಟಿಕ್ಸ್ ಎಂದರೆ ಅಧ್ಯಯನ ಮಾಡಬೇಕಾದ ಚರಗಳು (x ಮತ್ತು y ಚರಗಳು)
> - ಜ್ಯಾಮಿತಿ ಎಂದರೆ ಪ್ಲಾಟ್‌ನ ಪ್ರಕಾರ (ರೇಖಾ ಪ್ಲಾಟ್, ಬಾರ್ ಪ್ಲಾಟ್, ಇತ್ಯಾದಿ)
ನಿಮ್ಮ ಡೇಟಾ ಮತ್ತು ಪ್ಲಾಟ್ ಮೂಲಕ ಹೇಳಬೇಕಾದ ಕಥೆಯ ಪ್ರಕಾರ ಉತ್ತಮ ಜ್ಯಾಮಿತಿಯನ್ನು (ಪ್ಲಾಟ್ ಪ್ರಕಾರ) ಆಯ್ಕೆಮಾಡಿ.
> - ಪ್ರವೃತ್ತಿಗಳನ್ನು ವಿಶ್ಲೇಷಿಸಲು: ರೇಖೆ, ಕಾಲಮ್
> - ಮೌಲ್ಯಗಳನ್ನು ಹೋಲಿಸಲು: ಬಾರ್, ಕಾಲಮ್, ಪೈ, ಸ್ಕ್ಯಾಟರ್‌ಪ್ಲಾಟ್
> - ಭಾಗಗಳು ಒಟ್ಟಿಗೆ ಹೇಗೆ ಸಂಬಂಧ ಹೊಂದಿವೆ ಎಂದು ತೋರಿಸಲು: ಪೈ
> - ಡೇಟಾ ವಿತರಣೆ ತೋರಿಸಲು: ಸ್ಕ್ಯಾಟರ್‌ಪ್ಲಾಟ್, ಬಾರ್
> - ಮೌಲ್ಯಗಳ ನಡುವಿನ ಸಂಬಂಧ ತೋರಿಸಲು: ರೇಖೆ, ಸ್ಕ್ಯಾಟರ್‌ಪ್ಲಾಟ್, ಬಬಲ್
✅ ನೀವು ggplot2 ಗಾಗಿ ಈ ವಿವರಣಾತ್ಮಕ [ಚೀಟ್ಶೀಟ್](https://nyu-cdsc.github.io/learningr/assets/data-visualization-2.1.pdf) ಅನ್ನು ಸಹ ಪರಿಶೀಲಿಸಬಹುದು.
## ಪಕ್ಷಿ ರೆಕ್ಕೆ ವ್ಯಾಪ್ತಿಯ ಮೌಲ್ಯಗಳ ಬಗ್ಗೆ ರೇಖಾ ಪ್ಲಾಟ್ ರಚಿಸಿ
R ಕಾನ್ಸೋಲ್ ತೆರೆಯಿರಿ ಮತ್ತು ಡೇಟಾಸೆಟ್ ಅನ್ನು ಆಮದುಮಾಡಿ.
> ಟಿಪ್ಪಣಿ: ಡೇಟಾಸೆಟ್ ಈ ರೆಪೊನ ಮೂಲದಲ್ಲಿ `/data` ಫೋಲ್ಡರ್‌ನಲ್ಲಿ ಸಂಗ್ರಹಿಸಲಾಗಿದೆ.
ಡೇಟಾಸೆಟ್ ಅನ್ನು ಆಮದುಮಾಡಿ ಮತ್ತು ಡೇಟಾದ ತಲೆ (ಮೇಲಿನ 5 ಸಾಲುಗಳು) ಅನ್ನು ಗಮನಿಸೋಣ.
```r
birds <- read.csv("../../data/birds.csv",fileEncoding="UTF-8-BOM")
head(birds)
```
ಡೇಟಾದ ತಲೆಯು ಪಠ್ಯ ಮತ್ತು ಸಂಖ್ಯೆಗಳ ಮಿಶ್ರಣವಾಗಿದೆ:
| | ಹೆಸರು | ವೈಜ್ಞಾನಿಕ ಹೆಸರು | ವರ್ಗ | ಕ್ರಮ | ಕುಟುಂಬ | ಜೀನಸ್ | ಸಂರಕ್ಷಣಾ ಸ್ಥಿತಿ | ಕನಿಷ್ಠ ಉದ್ದ | ಗರಿಷ್ಠ ಉದ್ದ | ಕನಿಷ್ಠ ದೇಹದ ಭಾರ | ಗರಿಷ್ಠ ದೇಹದ ಭಾರ | ಕನಿಷ್ಠ ರೆಕ್ಕೆ ವ್ಯಾಪ್ತಿ | ಗರಿಷ್ಠ ರೆಕ್ಕೆ ವ್ಯಾಪ್ತಿ |
| ---: | :--------------------------- | :--------------------- | :-------------------- | :----------- | :------- | :---------- | :----------------- | --------: | --------: | ----------: | ----------: | ----------: | ----------: |
| 0 | ಬ್ಲ್ಯಾಕ್-ಬೆಲ್ಡ್ ವಿಸ್ಲಿಂಗ್-ಡಕ್ | Dendrocygna autumnalis | ಬಾತುಗಳು/ಗೀಸೆಗಳು/ನೀರಾಜೀವಿಗಳು | Anseriformes | Anatidae | Dendrocygna | LC | 47 | 56 | 652 | 1020 | 76 | 94 |
| 1 | ಫುಲ್ವಸ್ ವಿಸ್ಲಿಂಗ್-ಡಕ್ | Dendrocygna bicolor | ಬಾತುಗಳು/ಗೀಸೆಗಳು/ನೀರಾಜೀವಿಗಳು | Anseriformes | Anatidae | Dendrocygna | LC | 45 | 53 | 712 | 1050 | 85 | 93 |
| 2 | ಸ್ನೋ ಗೂಸ್ | Anser caerulescens | ಬಾತುಗಳು/ಗೀಸೆಗಳು/ನೀರಾಜೀವಿಗಳು | Anseriformes | Anatidae | Anser | LC | 64 | 79 | 2050 | 4050 | 135 | 165 |
| 3 | ರಾಸ್ ಗೂಸ್ | Anser rossii | ಬಾತುಗಳು/ಗೀಸೆಗಳು/ನೀರಾಜೀವಿಗಳು | Anseriformes | Anatidae | Anser | LC | 57.3 | 64 | 1066 | 1567 | 113 | 116 |
| 4 | ಗ್ರೇಟರ್ ವೈಟ್-ಫ್ರಂಟ್ ಗೂಸ್ | Anser albifrons | ಬಾತುಗಳು/ಗೀಸೆಗಳು/ನೀರಾಜೀವಿಗಳು | Anseriformes | Anatidae | Anser | LC | 64 | 81 | 1930 | 3310 | 130 | 165 |
ನಾವು ಕೆಲವು ಸಂಖ್ಯಾತ್ಮಕ ಡೇಟಾವನ್ನು ಮೂಲ ರೇಖಾ ಪ್ಲಾಟ್ ಬಳಸಿ ಪ್ಲಾಟ್ ಮಾಡೋಣ. ಈ ರೋಚಕ ಪಕ್ಷಿಗಳ ಗರಿಷ್ಠ ರೆಕ್ಕೆ ವ್ಯಾಪ್ತಿಯ ದೃಶ್ಯವನ್ನು ನೀವು ಬಯಸಿದರೆ.
```r
install.packages("ggplot2")
library("ggplot2")
ggplot(data=birds, aes(x=Name, y=MaxWingspan,group=1)) +
geom_line()
```
ಇಲ್ಲಿ, ನೀವು `ggplot2` ಪ್ಯಾಕೇಜ್ ಅನ್ನು ಸ್ಥಾಪಿಸಿ ನಂತರ `library("ggplot2")` ಕಮಾಂಡ್ ಬಳಸಿ ವರ್ಕ್‌ಸ್ಪೇಸ್‌ಗೆ ಆಮದುಮಾಡುತ್ತೀರಿ. ggplot ನಲ್ಲಿ ಯಾವುದೇ ಪ್ಲಾಟ್ ರಚಿಸಲು `ggplot()` ಫಂಕ್ಷನ್ ಬಳಸಲಾಗುತ್ತದೆ ಮತ್ತು ಡೇಟಾಸೆಟ್, x ಮತ್ತು y ಚರಗಳನ್ನು ಗುಣಲಕ್ಷಣಗಳಾಗಿ ಸೂಚಿಸಲಾಗುತ್ತದೆ. ಈ ಪ್ರಕರಣದಲ್ಲಿ, ನಾವು ರೇಖಾ ಪ್ಲಾಟ್ ರಚಿಸಲು `geom_line()` ಫಂಕ್ಷನ್ ಬಳಸುತ್ತೇವೆ.
![MaxWingspan-lineplot](../../../../../translated_images/MaxWingspan-lineplot.b12169f99d26fdd263f291008dfd73c18a4ba8f3d32b1fda3d74af51a0a28616.kn.png)
ನೀವು ತಕ್ಷಣವೇ ಏನು ಗಮನಿಸುತ್ತೀರಿ? ಕನಿಷ್ಠ ಒಂದು ಹೊರಗಿನ ಮೌಲ್ಯವಿದೆ - ಅದು ತುಂಬಾ ದೊಡ್ಡ ರೆಕ್ಕೆ ವ್ಯಾಪ್ತಿ! 2000+ ಸೆಂ.ಮೀ. ರೆಕ್ಕೆ ವ್ಯಾಪ್ತಿ 20 ಮೀಟರ್‌ಗಿಂತ ಹೆಚ್ಚು - ಮಿನೆಸೋಟಾದಲ್ಲಿ ಪ್ಟೆರೋಡ್ಯಾಕ್ಟೈಲ್ಸ್ ಓಡಾಡುತ್ತಿವೆಯೇ? ಪರಿಶೀಲಿಸೋಣ.
ನೀವು ಆ ಹೊರಗಿನ ಮೌಲ್ಯಗಳನ್ನು ಕಂಡುಹಿಡಿಯಲು ಎಕ್ಸೆಲ್‌ನಲ್ಲಿ ತ್ವರಿತವಾಗಿ ಸರಿಸುಮಾರು ಮಾಡಬಹುದು, ಅವು ಬಹುಶಃ ಟೈಪೋಗಳಾಗಿರಬಹುದು, ಆದರೆ ಪ್ಲಾಟ್‌ನೊಳಗಿಂದಲೇ ದೃಶ್ಯೀಕರಣ ಪ್ರಕ್ರಿಯೆಯನ್ನು ಮುಂದುವರಿಸಿ.
x-ಅಕ್ಷಕ್ಕೆ ಲೇಬಲ್ಗಳನ್ನು ಸೇರಿಸಿ ಯಾವ ರೀತಿಯ ಪಕ್ಷಿಗಳು ಪ್ರಶ್ನೆಯಲ್ಲಿವೆ ಎಂದು ತೋರಿಸಲು:
```r
ggplot(data=birds, aes(x=Name, y=MaxWingspan,group=1)) +
geom_line() +
theme(axis.text.x = element_text(angle = 45, hjust=1))+
xlab("Birds") +
ylab("Wingspan (CM)") +
ggtitle("Max Wingspan in Centimeters")
```
ನಾವು `theme` ನಲ್ಲಿ ಕೋನವನ್ನು ಸೂಚಿಸುತ್ತೇವೆ ಮತ್ತು `xlab()` ಮತ್ತು `ylab()` ನಲ್ಲಿ ಕ್ರಮವಾಗಿ x ಮತ್ತು y ಅಕ್ಷದ ಲೇಬಲ್ಗಳನ್ನು ನಿಗದಿಪಡಿಸುತ್ತೇವೆ. `ggtitle()` ಗ್ರಾಫ್/ಪ್ಲಾಟ್‌ಗೆ ಹೆಸರು ನೀಡುತ್ತದೆ.
![MaxWingspan-lineplot-improved](../../../../../translated_images/MaxWingspan-lineplot-improved.04b73b4d5a59552a6bc7590678899718e1f065abe9eada9ebb4148939b622fd4.kn.png)
ಲೇಬಲ್ಗಳ ತಿರುಗುವಿಕೆಯನ್ನು 45 ಡಿಗ್ರಿ ಗೆ ಹೊಂದಿಸಿದರೂ, ಓದಲು ತುಂಬಾ ಹೆಚ್ಚು ಇದೆ. ಬೇರೆ ತಂತ್ರವನ್ನು ಪ್ರಯತ್ನಿಸೋಣ: ಹೊರಗಿನ ಮೌಲ್ಯಗಳಿಗೆ ಮಾತ್ರ ಲೇಬಲ್ಗಳನ್ನು ನೀಡಿ ಮತ್ತು ಲೇಬಲ್ಗಳನ್ನು ಚಾರ್ಟ್ ಒಳಗೆ ಸೆಟ್ ಮಾಡಿ. ಲೇಬಲಿಂಗ್‌ಗೆ ಹೆಚ್ಚು ಜಾಗ ಮಾಡಲು ಸ್ಕ್ಯಾಟರ್ ಚಾರ್ಟ್ ಬಳಸಬಹುದು:
```r
ggplot(data=birds, aes(x=Name, y=MaxWingspan,group=1)) +
geom_point() +
geom_text(aes(label=ifelse(MaxWingspan>500,as.character(Name),'')),hjust=0,vjust=0) +
theme(axis.title.x=element_blank(), axis.text.x=element_blank(), axis.ticks.x=element_blank())
ylab("Wingspan (CM)") +
ggtitle("Max Wingspan in Centimeters") +
```
ಇಲ್ಲಿ ಏನಾಗುತ್ತಿದೆ? ನೀವು `geom_point()` ಫಂಕ್ಷನ್ ಬಳಸಿ ಸ್ಕ್ಯಾಟರ್ ಪಾಯಿಂಟ್‌ಗಳನ್ನು ಪ್ಲಾಟ್ ಮಾಡಿದ್ದೀರಿ. ಇದರಿಂದ, `MaxWingspan > 500` ಇರುವ ಪಕ್ಷಿಗಳಿಗೆ ಲೇಬಲ್ಗಳನ್ನು ಸೇರಿಸಿದ್ದೀರಿ ಮತ್ತು ಪ್ಲಾಟ್ ಅನ್ನು ಅಳವಡಿಸಲು x ಅಕ್ಷದ ಲೇಬಲ್ಗಳನ್ನು ಮರೆಮಾಚಿದ್ದೀರಿ.
ನೀವು ಏನು ಕಂಡುಹಿಡಿದಿರಿ?
![MaxWingspan-scatterplot](../../../../../translated_images/MaxWingspan-scatterplot.60dc9e0e19d32700283558f253841fdab5104abb62bc96f7d97f9c0ee857fa8b.kn.png)
## ನಿಮ್ಮ ಡೇಟಾವನ್ನು ಫಿಲ್ಟರ್ ಮಾಡಿ
ಬಾಲ್ಡ್ ಈಗಲ್ ಮತ್ತು ಪ್ರೇರೀ ಫಾಲ್ಕನ್, ಬಹುಶಃ ತುಂಬಾ ದೊಡ್ಡ ಪಕ್ಷಿಗಳು, ಗರಿಷ್ಠ ರೆಕ್ಕೆ ವ್ಯಾಪ್ತಿಗೆ ಹೆಚ್ಚುವರಿ 0 ಸೇರಿಸಿರುವುದರಿಂದ ತಪ್ಪಾಗಿ ಲೇಬಲಾದಂತೆ ಕಾಣುತ್ತವೆ. 25 ಮೀಟರ್ ರೆಕ್ಕೆ ವ್ಯಾಪ್ತಿಯ ಬಾಲ್ಡ್ ಈಗಲ್ ಅನ್ನು ನೀವು ಭೇಟಿಯಾಗುವುದಿಲ್ಲ, ಆದರೆ ಆಗಿದ್ದರೆ ದಯವಿಟ್ಟು ನಮಗೆ ತಿಳಿಸಿ! ಆ ಎರಡು ಹೊರಗಿನ ಮೌಲ್ಯಗಳನ್ನು ಹೊರತುಪಡಿಸಿ ಹೊಸ ಡೇಟಾಫ್ರೇಮ್ ರಚಿಸೋಣ:
```r
birds_filtered <- subset(birds, MaxWingspan < 500)
ggplot(data=birds_filtered, aes(x=Name, y=MaxWingspan,group=1)) +
geom_point() +
ylab("Wingspan (CM)") +
xlab("Birds") +
ggtitle("Max Wingspan in Centimeters") +
geom_text(aes(label=ifelse(MaxWingspan>500,as.character(Name),'')),hjust=0,vjust=0) +
theme(axis.text.x=element_blank(), axis.ticks.x=element_blank())
```
ನಾವು ಹೊಸ ಡೇಟಾಫ್ರೇಮ್ `birds_filtered` ರಚಿಸಿ ನಂತರ ಸ್ಕ್ಯಾಟರ್ ಪ್ಲಾಟ್ ರಚಿಸಿದ್ದೇವೆ. ಹೊರಗಿನ ಮೌಲ್ಯಗಳನ್ನು ಫಿಲ್ಟರ್ ಮಾಡಿದ ನಂತರ, ನಿಮ್ಮ ಡೇಟಾ ಈಗ ಹೆಚ್ಚು ಸಮ್ಮಿಲಿತ ಮತ್ತು ಅರ್ಥಮಾಡಿಕೊಳ್ಳಬಹುದಾಗಿದೆ.
![MaxWingspan-scatterplot-improved](../../../../../translated_images/MaxWingspan-scatterplot-improved.7d0af81658c65f3e75b8fedeb2335399e31108257e48db15d875ece608272051.kn.png)
ಈಗ ರೆಕ್ಕೆ ವ್ಯಾಪ್ತಿಯ ದೃಷ್ಟಿಯಿಂದ ಸ್ವಚ್ಛವಾದ ಡೇಟಾಸೆಟ್ ಇದ್ದು, ಈ ಪಕ್ಷಿಗಳ ಬಗ್ಗೆ ಇನ್ನಷ್ಟು ತಿಳಿದುಕೊಳ್ಳೋಣ.
ರೇಖಾ ಮತ್ತು ಸ್ಕ್ಯಾಟರ್ ಪ್ಲಾಟ್‌ಗಳು ಡೇಟಾ ಮೌಲ್ಯಗಳು ಮತ್ತು ಅವುಗಳ ವಿತರಣೆಗಳ ಬಗ್ಗೆ ಮಾಹಿತಿ ತೋರಿಸಬಹುದು, ಆದರೆ ನಾವು ಈ ಡೇಟಾಸೆಟ್‌ನಲ್ಲಿರುವ ಮೌಲ್ಯಗಳ ಬಗ್ಗೆ ಯೋಚಿಸಬೇಕು. ನೀವು ಪ್ರಮಾಣದ ಬಗ್ಗೆ ಕೆಳಗಿನ ಪ್ರಶ್ನೆಗಳಿಗೆ ಉತ್ತರ ನೀಡುವ ದೃಶ್ಯೀಕರಣಗಳನ್ನು ರಚಿಸಬಹುದು:
> ಎಷ್ಟು ವರ್ಗದ ಪಕ್ಷಿಗಳು ಇವೆ ಮತ್ತು ಅವುಗಳ ಸಂಖ್ಯೆ ಎಷ್ಟು?
> ಎಷ್ಟು ಪಕ್ಷಿಗಳು ನಾಶವಾಗಿವೆ, ಅಪಾಯದಲ್ಲಿವೆ, ಅಪರೂಪವಾಗಿವೆ ಅಥವಾ ಸಾಮಾನ್ಯವಾಗಿವೆ?
> ಲಿನಿಯಸ್ ಅವರ ಪದಬಳಕೆಯ ಪ್ರಕಾರ ವಿವಿಧ ಜೀನಸ್ ಮತ್ತು ಕ್ರಮಗಳಲ್ಲಿ ಎಷ್ಟು ಪಕ್ಷಿಗಳು ಇವೆ?
## ಬಾರ್ ಚಾರ್ಟ್‌ಗಳನ್ನು ಅನ್ವೇಷಿಸಿ
ಬಾರ್ ಚಾರ್ಟ್‌ಗಳು ಡೇಟಾ ಗುಂಪುಗಳನ್ನು ತೋರಿಸಲು ಉಪಯುಕ್ತವಾಗಿವೆ. ಈ ಡೇಟಾಸೆಟ್‌ನಲ್ಲಿ ಇರುವ ಪಕ್ಷಿಗಳ ವರ್ಗಗಳನ್ನು ಅನ್ವೇಷಿಸಿ ಯಾವುದು ಸಂಖ್ಯೆಯಲ್ಲಿ ಅತ್ಯಂತ ಸಾಮಾನ್ಯವಾಗಿದೆ ಎಂದು ನೋಡೋಣ. ಫಿಲ್ಟರ್ ಮಾಡಿದ ಡೇಟಾದ ಮೇಲೆ ಬಾರ್ ಚಾರ್ಟ್ ರಚಿಸೋಣ.
```r
install.packages("dplyr")
install.packages("tidyverse")
library(lubridate)
library(scales)
library(dplyr)
library(ggplot2)
library(tidyverse)
birds_filtered %>% group_by(Category) %>%
summarise(n=n(),
MinLength = mean(MinLength),
MaxLength = mean(MaxLength),
MinBodyMass = mean(MinBodyMass),
MaxBodyMass = mean(MaxBodyMass),
MinWingspan=mean(MinWingspan),
MaxWingspan=mean(MaxWingspan)) %>%
gather("key", "value", - c(Category, n)) %>%
ggplot(aes(x = Category, y = value, group = key, fill = key)) +
geom_bar(stat = "identity") +
scale_fill_manual(values = c("#D62728", "#FF7F0E", "#8C564B","#2CA02C", "#1F77B4", "#9467BD")) +
xlab("Category")+ggtitle("Birds of Minnesota")
```
ಕೆಳಗಿನ ಸ্নಿಪೆಟ್‌ನಲ್ಲಿ, ಡೇಟಾ ಮ್ಯಾನಿಪ್ಯುಲೇಶನ್ ಮತ್ತು ಗುಂಪು ಮಾಡಲು ಸಹಾಯ ಮಾಡುವ [dplyr](https://www.rdocumentation.org/packages/dplyr/versions/0.7.8) ಮತ್ತು [lubridate](https://www.rdocumentation.org/packages/lubridate/versions/1.8.0) ಪ್ಯಾಕೇಜ್‌ಗಳನ್ನು ಸ್ಥಾಪಿಸುತ್ತೇವೆ. ಮೊದಲು, ನೀವು ಪಕ್ಷಿಯ `Category` ಮೂಲಕ ಡೇಟಾವನ್ನು ಗುಂಪುಮಾಡಿ ನಂತರ `MinLength`, `MaxLength`, `MinBodyMass`, `MaxdyMass`, `MinWingspan`, `MaxWingspan` ಕಾಲಮ್‌ಗಳನ್ನು ಸಾರಾಂಶಗೊಳಿಸುತ್ತೀರಿ. ನಂತರ, `ggplot2` ಪ್ಯಾಕೇಜ್ ಬಳಸಿ ಬಾರ್ ಚಾರ್ಟ್ ಅನ್ನು ಪ್ಲಾಟ್ ಮಾಡಿ ವಿಭಿನ್ನ ವರ್ಗಗಳಿಗೆ ಬಣ್ಣಗಳನ್ನು ಮತ್ತು ಲೇಬಲ್ಗಳನ್ನು ಸೂಚಿಸುತ್ತೀರಿ.
![Stacked bar chart](../../../../../translated_images/stacked-bar-chart.0c92264e89da7b391a7490224d1e7059a020e8b74dcd354414aeac78871c02f1.kn.png)
ಈ ಬಾರ್ ಚಾರ್ಟ್ ಓದಲು ಅಸಾಧ್ಯವಾಗಿದೆ ಏಕೆಂದರೆ ಅತಿಯಾದ ಗುಂಪುಮಾಡದ ಡೇಟಾ ಇದೆ. ನೀವು ಪ್ಲಾಟ್ ಮಾಡಲು ಬಯಸುವ ಡೇಟಾವನ್ನು ಮಾತ್ರ ಆಯ್ಕೆಮಾಡಬೇಕು, ಆದ್ದರಿಂದ ಪಕ್ಷಿಗಳ ಉದ್ದವನ್ನು ಅವುಗಳ ವರ್ಗದ ಆಧಾರದ ಮೇಲೆ ನೋಡೋಣ.
ನಿಮ್ಮ ಡೇಟಾವನ್ನು ಪಕ್ಷಿಯ ವರ್ಗವನ್ನು ಮಾತ್ರ ಒಳಗೊಂಡಂತೆ ಫಿಲ್ಟರ್ ಮಾಡಿ.
ಬಹುಮಾನ ವರ್ಗಗಳಿದ್ದರಿಂದ, ನೀವು ಈ ಚಾರ್ಟ್ ಅನ್ನು ಲಂಬವಾಗಿ ಪ್ರದರ್ಶಿಸಿ ಎಲ್ಲಾ ಡೇಟಾವನ್ನು ಒಳಗೊಂಡಂತೆ ಅದರ ಎತ್ತರವನ್ನು ಸರಿಹೊಂದಿಸಬಹುದು:
```r
birds_count<-dplyr::count(birds_filtered, Category, sort = TRUE)
birds_count$Category <- factor(birds_count$Category, levels = birds_count$Category)
ggplot(birds_count,aes(Category,n))+geom_bar(stat="identity")+coord_flip()
```
ಮೊದಲು ನೀವು `Category` ಕಾಲಮ್‌ನ ವಿಶಿಷ್ಟ ಮೌಲ್ಯಗಳನ್ನು ಎಣಿಸಿ ನಂತರ ಅವುಗಳನ್ನು ಹೊಸ ಡೇಟಾಫ್ರೇಮ್ `birds_count` ಗೆ ಸರಿಸುಮಾರು ಮಾಡುತ್ತೀರಿ. ಈ ಸರಿಗೊಳಿಸಿದ ಡೇಟಾವನ್ನು ಅದೇ ಮಟ್ಟದಲ್ಲಿ ಫ್ಯಾಕ್ಟರ್ ಮಾಡಿ ಆದ್ದರಿಂದ ಅದು ಸರಿಗೊಳಿಸಿದ ರೀತಿಯಲ್ಲಿ ಪ್ಲಾಟ್ ಆಗುತ್ತದೆ. ನಂತರ `ggplot2` ಬಳಸಿ ಬಾರ್ ಚಾರ್ಟ್ ರಚಿಸುತ್ತೀರಿ. `coord_flip()` ಹೋರಿಜಾಂಟಲ್ ಬಾರ್‌ಗಳನ್ನು ಪ್ಲಾಟ್ ಮಾಡುತ್ತದೆ.
![category-length](../../../../../translated_images/category-length.7e34c296690e85d64f7e4d25a56077442683eca96c4f5b4eae120a64c0755636.kn.png)
ಈ ಬಾರ್ ಚಾರ್ಟ್ ಪ್ರತಿ ವರ್ಗದಲ್ಲಿನ ಪಕ್ಷಿಗಳ ಸಂಖ್ಯೆಯ ಉತ್ತಮ ದೃಶ್ಯವನ್ನು ತೋರಿಸುತ್ತದೆ. ಕ್ಷಣದಲ್ಲಿಯೇ ನೀವು ಈ ಪ್ರದೇಶದಲ್ಲಿ Ducks/Geese/Waterfowl ವರ್ಗದಲ್ಲಿರುವ ಪಕ್ಷಿಗಳ ಸಂಖ್ಯೆ ಅತ್ಯಂತ ಹೆಚ್ಚು ಎಂದು ನೋಡಬಹುದು. ಮಿನೆಸೋಟಾ '10,000 ಸರೋವರಗಳ ಭೂಮಿ' ಆಗಿರುವುದರಿಂದ ಇದು ಆಶ್ಚರ್ಯಕರವಲ್ಲ!
✅ ಈ ಡೇಟಾಸೆಟ್‌ನಲ್ಲಿ ಇನ್ನಷ್ಟು ಎಣಿಕೆಗಳನ್ನು ಪ್ರಯತ್ನಿಸಿ. ಏನಾದರೂ ನಿಮಗೆ ಆಶ್ಚರ್ಯಕರವಿದೆಯೇ?
## ಡೇಟಾ ಹೋಲಿಕೆ
ನೀವು ಗುಂಪುಮಾಡಲಾದ ಡೇಟಾದ ವಿಭಿನ್ನ ಹೋಲಿಕೆಗಳನ್ನು ಹೊಸ ಅಕ್ಷಗಳನ್ನು ರಚಿಸುವ ಮೂಲಕ ಪ್ರಯತ್ನಿಸಬಹುದು. ಪಕ್ಷಿಯ ಗರಿಷ್ಠ ಉದ್ದವನ್ನು ಅದರ ವರ್ಗದ ಆಧಾರದ ಮೇಲೆ ಹೋಲಿಸಿ:
```r
birds_grouped <- birds_filtered %>%
group_by(Category) %>%
summarise(
MaxLength = max(MaxLength, na.rm = T),
MinLength = max(MinLength, na.rm = T)
) %>%
arrange(Category)
ggplot(birds_grouped,aes(Category,MaxLength))+geom_bar(stat="identity")+coord_flip()
```
ನಾವು `birds_filtered` ಡೇಟಾವನ್ನು `Category` ಮೂಲಕ ಗುಂಪುಮಾಡಿ ನಂತರ ಬಾರ್ ಗ್ರಾಫ್ ರಚಿಸುತ್ತೇವೆ.
![comparing data](../../../../../translated_images/comparingdata.f486a450d61c7ca5416f27f3f55a6a4465d00df3be5e6d33936e9b07b95e2fdd.kn.png)
ಇಲ್ಲಿ ಏನೂ ಆಶ್ಚರ್ಯಕರವಿಲ್ಲ: ಹುಮ್ಮಿಂಗ್‌ಬರ್ಡ್‌ಗಳು ಪೆಲಿಕಾನ್ಸ್ ಅಥವಾ ಗೀಸೆಗಳಿಗಿಂತ ಕಡಿಮೆ ಗರಿಷ್ಠ ಉದ್ದ ಹೊಂದಿವೆ. ಡೇಟಾ ತಾರ್ಕಿಕವಾಗಿದ್ದರೆ ಚೆನ್ನಾಗಿದೆ!
ನೀವು ಬಾರ್ ಚಾರ್ಟ್‌ಗಳ ರೋಚಕ ದೃಶ್ಯೀಕರಣಗಳನ್ನು ಹೆಚ್ಚು ರೋಚಕವಾಗಿಸಲು ಡೇಟಾವನ್ನು ಒಟ್ಟುಗೂಡಿಸಬಹುದು. ನೀಡಲಾದ ಪಕ್ಷಿ ವರ್ಗದ ಮೇಲೆ ಕನಿಷ್ಠ ಮತ್ತು ಗರಿಷ್ಠ ಉದ್ದವನ್ನು ಒಟ್ಟುಗೂಡಿಸೋಣ:
```r
ggplot(data=birds_grouped, aes(x=Category)) +
geom_bar(aes(y=MaxLength), stat="identity", position ="identity", fill='blue') +
geom_bar(aes(y=MinLength), stat="identity", position="identity", fill='orange')+
coord_flip()
```
![super-imposed values](../../../../../translated_images/superimposed-values.5363f0705a1da4167625a373a1064331ea3cb7a06a297297d0734fcc9b3819a0.kn.png)
## 🚀 ಸವಾಲು
ಈ ಪಕ್ಷಿ ಡೇಟಾಸೆಟ್ ಒಂದು ನಿರ್ದಿಷ್ಟ ಪರಿಸರದಲ್ಲಿ ವಿವಿಧ ರೀತಿಯ ಪಕ್ಷಿಗಳ ಬಗ್ಗೆ ಸಮೃದ್ಧ ಮಾಹಿತಿಯನ್ನು ನೀಡುತ್ತದೆ. ಇಂಟರ್ನೆಟ್‌ನಲ್ಲಿ ಹುಡುಕಿ ಮತ್ತು ಇನ್ನಷ್ಟು ಪಕ್ಷಿ-ಕೇಂದ್ರಿತ ಡೇಟಾಸೆಟ್‌ಗಳನ್ನು ಕಂಡುಹಿಡಿಯಿರಿ. ಈ ಪಕ್ಷಿಗಳ ಸುತ್ತಲೂ ಚಾರ್ಟ್‌ಗಳು ಮತ್ತು ಗ್ರಾಫ್‌ಗಳನ್ನು ರಚಿಸುವ ಅಭ್ಯಾಸ ಮಾಡಿ ನೀವು ತಿಳಿಯದ ವಾಸ್ತವಗಳನ್ನು ಅನ್ವೇಷಿಸಿ.
## [ಪೋಸ್ಟ್-ಪಾಠ ಪ್ರಶ್ನೋತ್ತರ](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/17)
## ವಿಮರ್ಶೆ ಮತ್ತು ಸ್ವಯಂ ಅಧ್ಯಯನ
ಈ ಮೊದಲ ಪಾಠವು ಪ್ರಮಾಣಗಳನ್ನು ದೃಶ್ಯೀಕರಿಸಲು `ggplot2` ಅನ್ನು ಹೇಗೆ ಬಳಸಬೇಕೆಂಬ ಬಗ್ಗೆ ನಿಮಗೆ ಕೆಲವು ಮಾಹಿತಿ ನೀಡಿದೆ. ದೃಶ್ಯೀಕರಣಕ್ಕಾಗಿ ಡೇಟಾಸೆಟ್‌ಗಳೊಂದಿಗೆ ಕೆಲಸ ಮಾಡುವ ಇತರ ಮಾರ್ಗಗಳನ್ನು ಕುರಿತು ಸಂಶೋಧನೆ ಮಾಡಿ. [Lattice](https://stat.ethz.ch/R-manual/R-devel/library/lattice/html/Lattice.html) ಮತ್ತು [Plotly](https://github.com/plotly/plotly.R#readme) ಮುಂತಾದ ಇತರ ಪ್ಯಾಕೇಜ್‌ಗಳನ್ನು ಬಳಸಿ ನೀವು ದೃಶ್ಯೀಕರಿಸಬಹುದಾದ ಡೇಟಾಸೆಟ್‌ಗಳನ್ನು ಹುಡುಕಿ.
## ನಿಯೋಜನೆ
[ರೆಖೆಗಳು, ಸ್ಕ್ಯಾಟರ್‌ಗಳು ಮತ್ತು ಬಾರ್‌ಗಳು](assignment.md)
---
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
**ಅಸ್ವೀಕರಣ**:
ಈ ದಸ್ತಾವೇಜು AI ಅನುವಾದ ಸೇವೆ [Co-op Translator](https://github.com/Azure/co-op-translator) ಬಳಸಿ ಅನುವಾದಿಸಲಾಗಿದೆ. ನಾವು ನಿಖರತೆಯಿಗಾಗಿ ಪ್ರಯತ್ನಿಸುತ್ತಿದ್ದರೂ, ಸ್ವಯಂಚಾಲಿತ ಅನುವಾದಗಳಲ್ಲಿ ದೋಷಗಳು ಅಥವಾ ತಪ್ಪುಗಳು ಇರಬಹುದು ಎಂದು ದಯವಿಟ್ಟು ಗಮನಿಸಿ. ಮೂಲ ಭಾಷೆಯಲ್ಲಿರುವ ಮೂಲ ದಸ್ತಾವೇಜನ್ನು ಅಧಿಕೃತ ಮೂಲವೆಂದು ಪರಿಗಣಿಸಬೇಕು. ಮಹತ್ವದ ಮಾಹಿತಿಗಾಗಿ, ವೃತ್ತಿಪರ ಮಾನವ ಅನುವಾದವನ್ನು ಶಿಫಾರಸು ಮಾಡಲಾಗುತ್ತದೆ. ಈ ಅನುವಾದ ಬಳಕೆಯಿಂದ ಉಂಟಾಗುವ ಯಾವುದೇ ತಪ್ಪು ಅರ್ಥಮಾಡಿಕೊಳ್ಳುವಿಕೆ ಅಥವಾ ತಪ್ಪು ವಿವರಣೆಗಳಿಗೆ ನಾವು ಹೊಣೆಗಾರರಾಗುವುದಿಲ್ಲ.
<!-- CO-OP TRANSLATOR DISCLAIMER END -->

@ -0,0 +1,27 @@
<!--
CO_OP_TRANSLATOR_METADATA:
{
"original_hash": "0ea21b6513df5ade7419c6b7d65f10b1",
"translation_date": "2025-12-19T16:35:04+00:00",
"source_file": "3-Data-Visualization/R/09-visualization-quantities/assignment.md",
"language_code": "kn"
}
-->
# ರೇಖೆಗಳು, ಚಿತ್ತಾರಗಳು ಮತ್ತು ಬಾರ್‌ಗಳು
## ಸೂಚನೆಗಳು
ಈ ಪಾಠದಲ್ಲಿ, ನೀವು ರೇಖಾ ಚಾರ್ಟ್‌ಗಳು, ಚಿತ್ತಾರ ಪ್ಲಾಟ್‌ಗಳು ಮತ್ತು ಬಾರ್ ಚಾರ್ಟ್‌ಗಳೊಂದಿಗೆ ಈ ಡೇಟಾಸೆಟ್ ಬಗ್ಗೆ ಆಸಕ್ತಿದಾಯಕ ವಾಸ್ತವಗಳನ್ನು ತೋರಿಸಲು ಕೆಲಸ ಮಾಡಿದ್ದೀರಿ. ಈ ನಿಯೋಜನೆಯಲ್ಲಿ, ನೀಡಲಾದ ಪಕ್ಷಿಯ ಪ್ರಕಾರದ ಬಗ್ಗೆ ಒಂದು ವಾಸ್ತವವನ್ನು ಕಂಡುಹಿಡಿಯಲು ಡೇಟಾಸೆಟ್ ಅನ್ನು ಇನ್ನಷ್ಟು ಆಳವಾಗಿ ಪರಿಶೀಲಿಸಿ. ಉದಾಹರಣೆಗೆ, ಸ್ನೋ ಗೀಸ್ ಬಗ್ಗೆ ನೀವು ಕಂಡುಹಿಡಿಯಬಹುದಾದ ಎಲ್ಲಾ ಆಸಕ್ತಿದಾಯಕ ಡೇಟಾವನ್ನು ದೃಶ್ಯೀಕರಿಸುವ ಸ್ಕ್ರಿಪ್ಟ್ ರಚಿಸಿ. ಮೇಲ್ಕಂಡ ಮೂರು ಪ್ಲಾಟ್‌ಗಳನ್ನು ಬಳಸಿಕೊಂಡು ನಿಮ್ಮ ನೋಟ್ಬುಕ್‌ನಲ್ಲಿ ಒಂದು ಕಥೆಯನ್ನು ಹೇಳಿ.
## ಮೌಲ್ಯಮಾಪನ
ಉದಾಹರಣೆಯಾದ | ತೃಪ್ತಿಕರ | ಸುಧಾರಣೆಯ ಅಗತ್ಯವಿದೆ
--- | --- | -- |
ಒಳ್ಳೆಯ ಟಿಪ್ಪಣಿಗಳು, ದೃಢ ಕಥನಶೈಲಿ ಮತ್ತು ಆಕರ್ಷಕ ಗ್ರಾಫ್‌ಗಳೊಂದಿಗೆ ಸ್ಕ್ರಿಪ್ಟ್ ಪ್ರಸ್ತುತಪಡಿಸಲಾಗಿದೆ | ಈ ಅಂಶಗಳಲ್ಲಿ ಒಂದನ್ನು ಸ್ಕ್ರಿಪ್ಟ್ ತಪ್ಪಿಸಿದೆ | ಈ ಅಂಶಗಳಲ್ಲಿ ಎರಡು ತಪ್ಪಿವೆ
---
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
**ಅಸ್ವೀಕಾರ**:
ಈ ದಸ್ತಾವೇಜು AI ಅನುವಾದ ಸೇವೆ [Co-op Translator](https://github.com/Azure/co-op-translator) ಬಳಸಿ ಅನುವಾದಿಸಲಾಗಿದೆ. ನಾವು ನಿಖರತೆಯಿಗಾಗಿ ಪ್ರಯತ್ನಿಸುತ್ತಿದ್ದರೂ, ಸ್ವಯಂಚಾಲಿತ ಅನುವಾದಗಳಲ್ಲಿ ತಪ್ಪುಗಳು ಅಥವಾ ಅಸತ್ಯತೆಗಳು ಇರಬಹುದು ಎಂದು ದಯವಿಟ್ಟು ಗಮನಿಸಿ. ಮೂಲ ಭಾಷೆಯಲ್ಲಿರುವ ಮೂಲ ದಸ್ತಾವೇಜನ್ನು ಅಧಿಕೃತ ಮೂಲವೆಂದು ಪರಿಗಣಿಸಬೇಕು. ಪ್ರಮುಖ ಮಾಹಿತಿಗಾಗಿ, ವೃತ್ತಿಪರ ಮಾನವ ಅನುವಾದವನ್ನು ಶಿಫಾರಸು ಮಾಡಲಾಗುತ್ತದೆ. ಈ ಅನುವಾದ ಬಳಕೆಯಿಂದ ಉಂಟಾಗುವ ಯಾವುದೇ ತಪ್ಪು ಅರ್ಥಮಾಡಿಕೊಳ್ಳುವಿಕೆ ಅಥವಾ ತಪ್ಪು ವಿವರಣೆಗಳಿಗೆ ನಾವು ಹೊಣೆಗಾರರಾಗುವುದಿಲ್ಲ.
<!-- CO-OP TRANSLATOR DISCLAIMER END -->

@ -0,0 +1,185 @@
<!--
CO_OP_TRANSLATOR_METADATA:
{
"original_hash": "ea67c0c40808fd723594de6896c37ccf",
"translation_date": "2025-12-19T16:22:32+00:00",
"source_file": "3-Data-Visualization/R/10-visualization-distributions/README.md",
"language_code": "kn"
}
-->
# ವಿತರಣೆಯ ದೃಶ್ಯೀಕರಣ
|![ [(@sketchthedocs)](https://sketchthedocs.dev) ಅವರ ಸ್ಕೆಚ್ ನೋಟ್ ](https://github.com/microsoft/Data-Science-For-Beginners/blob/main/sketchnotes/10-Visualizing-Distributions.png)|
|:---:|
| ವಿತರಣೆಯ ದೃಶ್ಯೀಕರಣ - _[@nitya](https://twitter.com/nitya) ಅವರ ಸ್ಕೆಚ್ ನೋಟ್_ |
ಹಿಂದಿನ ಪಾಠದಲ್ಲಿ, ನೀವು ಮಿನೆಸೋಟಾದ ಪಕ್ಷಿಗಳ ಬಗ್ಗೆ ಇರುವ ಡೇಟಾಸೆಟ್ ಬಗ್ಗೆ ಕೆಲವು ಆಸಕ್ತಿದಾಯಕ ವಾಸ್ತವಗಳನ್ನು ಕಲಿತಿರಿ. ನೀವು ಔಟ್‌ಲೈಯರ್‌ಗಳನ್ನು ದೃಶ್ಯೀಕರಿಸುವ ಮೂಲಕ ಕೆಲವು ತಪ್ಪು ಡೇಟಾವನ್ನು ಕಂಡುಹಿಡಿದಿರಿ ಮತ್ತು ಪಕ್ಷಿಗಳ ವರ್ಗಗಳ ಗರಿಷ್ಠ ಉದ್ದದ ನಡುವಿನ ವ್ಯತ್ಯಾಸಗಳನ್ನು ನೋಡಿದಿರಿ.
## [ಪೂರ್ವ-ಪಾಠ ಪ್ರಶ್ನೋತ್ತರ](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/18)
## ಪಕ್ಷಿಗಳ ಡೇಟಾಸೆಟ್ ಅನ್ನು ಅನ್ವೇಷಿಸಿ
ಡೇಟಾವನ್ನು ವಿಶ್ಲೇಷಿಸುವ ಮತ್ತೊಂದು ವಿಧಾನವೆಂದರೆ ಅದರ ವಿತರಣೆಯನ್ನು ನೋಡುವುದು, ಅಥವಾ ಡೇಟಾ ಒಂದು ಅಕ್ಷದ ಮೇಲೆ ಹೇಗೆ ಸಂಘಟಿತವಾಗಿದೆ ಎಂಬುದನ್ನು ತಿಳಿದುಕೊಳ್ಳುವುದು. ಉದಾಹರಣೆಗೆ, ನೀವು ಈ ಡೇಟಾಸೆಟ್‌ನಲ್ಲಿ ಮಿನೆಸೋಟಾದ ಪಕ್ಷಿಗಳ ಗರಿಷ್ಠ ರೆಕ್ಕೆ ವಿಸ್ತಾರ ಅಥವಾ ಗರಿಷ್ಠ ದೇಹ ಭಾರದ ಸಾಮಾನ್ಯ ವಿತರಣೆಯನ್ನು ತಿಳಿದುಕೊಳ್ಳಲು ಇಚ್ಛಿಸಬಹುದು.
ಈ ಡೇಟಾಸೆಟ್‌ನ ಡೇಟಾ ವಿತರಣೆಯ ಬಗ್ಗೆ ಕೆಲವು ವಾಸ್ತವಗಳನ್ನು ಕಂಡುಹಿಡಿಯೋಣ. ನಿಮ್ಮ R ಕಾನ್ಸೋಲ್‌ನಲ್ಲಿ `ggplot2` ಮತ್ತು ಡೇಟಾಬೇಸ್ ಅನ್ನು ಆಮದುಮಾಡಿ. ಹಿಂದಿನ ವಿಷಯದಲ್ಲಿ ಮಾಡಿದಂತೆ ಔಟ್‌ಲೈಯರ್‌ಗಳನ್ನು ಡೇಟಾಬೇಸ್‌ನಿಂದ ತೆಗೆದುಹಾಕಿ.
```r
library(ggplot2)
birds <- read.csv("../../data/birds.csv",fileEncoding="UTF-8-BOM")
birds_filtered <- subset(birds, MaxWingspan < 500)
head(birds_filtered)
```
| | ಹೆಸರು | ವೈಜ್ಞಾನಿಕ ಹೆಸರು | ವರ್ಗ | ಕ್ರಮ | ಕುಟುಂಬ | ಜೀನಸ್ | ಸಂರಕ್ಷಣಾ ಸ್ಥಿತಿ | ಕನಿಷ್ಠ ಉದ್ದ | ಗರಿಷ್ಠ ಉದ್ದ | ಕನಿಷ್ಠ ದೇಹ ಭಾರ | ಗರಿಷ್ಠ ದೇಹ ಭಾರ | ಕನಿಷ್ಠ ರೆಕ್ಕೆ ವಿಸ್ತಾರ | ಗರಿಷ್ಠ ರೆಕ್ಕೆ ವಿಸ್ತಾರ |
| ---: | :--------------------------- | :--------------------- | :-------------------- | :----------- | :------- | :---------- | :----------------- | --------: | --------: | ----------: | ----------: | ----------: | ----------: |
| 0 | ಬ್ಲ್ಯಾಕ್-ಬೆಲ್ಡ್ ವಿಸ್ಲಿಂಗ್-ಡಕ್ | Dendrocygna autumnalis | ಬಾತುಗಳು/ಗೀಸೆ/ನೀರಿನ ಪಕ್ಷಿಗಳು | Anseriformes | Anatidae | Dendrocygna | LC | 47 | 56 | 652 | 1020 | 76 | 94 |
| 1 | ಫುಲ್ವಸ್ ವಿಸ್ಲಿಂಗ್-ಡಕ್ | Dendrocygna bicolor | ಬಾತುಗಳು/ಗೀಸೆ/ನೀರಿನ ಪಕ್ಷಿಗಳು | Anseriformes | Anatidae | Dendrocygna | LC | 45 | 53 | 712 | 1050 | 85 | 93 |
| 2 | ಸ್ನೋ ಗೂಸ್ | Anser caerulescens | ಬಾತುಗಳು/ಗೀಸೆ/ನೀರಿನ ಪಕ್ಷಿಗಳು | Anseriformes | Anatidae | Anser | LC | 64 | 79 | 2050 | 4050 | 135 | 165 |
| 3 | ರಾಸ್ ಗೂಸ್ | Anser rossii | ಬಾತುಗಳು/ಗೀಸೆ/ನೀರಿನ ಪಕ್ಷಿಗಳು | Anseriformes | Anatidae | Anser | LC | 57.3 | 64 | 1066 | 1567 | 113 | 116 |
| 4 | ಗ್ರೇಟರ್ ವೈಟ್-ಫ್ರಂಟ್ ಗೂಸ್ | Anser albifrons | ಬಾತುಗಳು/ಗೀಸೆ/ನೀರಿನ ಪಕ್ಷಿಗಳು | Anseriformes | Anatidae | Anser | LC | 64 | 81 | 1930 | 3310 | 130 | 165 |
ಸಾಮಾನ್ಯವಾಗಿ, ನೀವು ಹಿಂದಿನ ಪಾಠದಲ್ಲಿ ಮಾಡಿದಂತೆ ಸ್ಕ್ಯಾಟರ್ ಪ್ಲಾಟ್ ಬಳಸಿ ಡೇಟಾ ಹೇಗೆ ವಿತರಿಸಲಾಗಿದೆ ಎಂಬುದನ್ನು ತ್ವರಿತವಾಗಿ ನೋಡಬಹುದು:
```r
ggplot(data=birds_filtered, aes(x=Order, y=MaxLength,group=1)) +
geom_point() +
ggtitle("Max Length per order") + coord_flip()
```
![max length per order](../../../../../translated_images/max-length-per-order.e5b283d952c78c12b091307c5d3cf67132dad6fefe80a073353b9dc5c2bd3eb8.kn.png)
ಇದು ಪಕ್ಷಿ ಕ್ರಮದ ಪ್ರತಿ ದೇಹ ಉದ್ದದ ಸಾಮಾನ್ಯ ವಿತರಣೆಯ ಅವಲೋಕನವನ್ನು ನೀಡುತ್ತದೆ, ಆದರೆ ಇದು ನಿಜವಾದ ವಿತರಣೆಯನ್ನು ಪ್ರದರ್ಶಿಸಲು ಅತ್ಯುತ್ತಮ ವಿಧಾನವಲ್ಲ. ಆ ಕಾರ್ಯವನ್ನು ಸಾಮಾನ್ಯವಾಗಿ ಹಿಸ್ಟೋಗ್ರಾಮ್ ರಚಿಸುವ ಮೂಲಕ ನಿರ್ವಹಿಸಲಾಗುತ್ತದೆ.
## ಹಿಸ್ಟೋಗ್ರಾಮ್‌ಗಳೊಂದಿಗೆ ಕೆಲಸ
`ggplot2` ಡೇಟಾ ವಿತರಣೆಯನ್ನು ಹಿಸ್ಟೋಗ್ರಾಮ್‌ಗಳ ಮೂಲಕ ದೃಶ್ಯೀಕರಿಸಲು ಅತ್ಯುತ್ತಮ ವಿಧಾನಗಳನ್ನು ಒದಗಿಸುತ್ತದೆ. ಈ ರೀತಿಯ ಚಾರ್ಟ್ ಒಂದು ಬಾರ್ ಚಾರ್ಟ್ ಹೋಲುತ್ತದೆ, ಇಲ್ಲಿ ಬಾರ್‌ಗಳ ಏರಿಕೆ ಮತ್ತು ಇಳಿಕೆಯಿಂದ ವಿತರಣೆಯನ್ನು ನೋಡಬಹುದು. ಹಿಸ್ಟೋಗ್ರಾಮ್ ರಚಿಸಲು, ನಿಮಗೆ ಸಂಖ್ಯಾತ್ಮಕ ಡೇಟಾ ಬೇಕಾಗುತ್ತದೆ. ಹಿಸ್ಟೋಗ್ರಾಮ್ ರಚಿಸಲು, ನೀವು ಚಾರ್ಟ್ ಅನ್ನು 'hist' ಪ್ರಕಾರವಾಗಿ ನಿರ್ಧರಿಸಿ ಪ್ಲಾಟ್ ಮಾಡಬಹುದು. ಈ ಚಾರ್ಟ್ ಸಂಪೂರ್ಣ ಡೇಟಾಸೆಟ್‌ನ ಸಂಖ್ಯಾತ್ಮಕ ಡೇಟಾದ ವ್ಯಾಪ್ತಿಯ ಗರಿಷ್ಠ ದೇಹ ಭಾರದ ವಿತರಣೆಯನ್ನು ತೋರಿಸುತ್ತದೆ. ಡೇಟಾ ಸರಣಿಯನ್ನು ಸಣ್ಣ ಬಿನ್‌ಗಳಾಗಿ ವಿಭಜಿಸುವ ಮೂಲಕ, ಅದು ಡೇಟಾ ಮೌಲ್ಯಗಳ ವಿತರಣೆಯನ್ನು ಪ್ರದರ್ಶಿಸಬಹುದು:
```r
ggplot(data = birds_filtered, aes(x = MaxBodyMass)) +
geom_histogram(bins=10)+ylab('Frequency')
```
![distribution over entire dataset](../../../../../translated_images/distribution-over-the-entire-dataset.d22afd3fa96be854e4c82213fedec9e3703cba753d07fad4606aadf58cf7e78e.kn.png)
ನೀವು ನೋಡಬಹುದು, ಈ ಡೇಟಾಸೆಟ್‌ನ 400+ ಪಕ್ಷಿಗಳ ಬಹುತೇಕವು ಗರಿಷ್ಠ ದೇಹ ಭಾರದ 2000 ಕ್ಕಿಂತ ಕಡಿಮೆ ವ್ಯಾಪ್ತಿಯಲ್ಲಿ ಬರುತ್ತವೆ. `bins` ಪರಿಮಾಣವನ್ನು 30 ರಂತಹ ಹೆಚ್ಚಿನ ಸಂಖ್ಯೆಗೆ ಬದಲಾಯಿಸುವ ಮೂಲಕ ಡೇಟಾದ ಬಗ್ಗೆ ಹೆಚ್ಚಿನ ಒಳನೋಟವನ್ನು ಪಡೆಯಿರಿ:
```r
ggplot(data = birds_filtered, aes(x = MaxBodyMass)) + geom_histogram(bins=30)+ylab('Frequency')
```
![distribution-30bins](../../../../../translated_images/distribution-30bins.6a3921ea7a421bf71f06bf5231009e43d1146f1b8da8dc254e99b5779a4983e5.kn.png)
ಈ ಚಾರ್ಟ್ ಸ್ವಲ್ಪ ಹೆಚ್ಚು ಸೂಕ್ಷ್ಮ ರೀತಿಯಲ್ಲಿ ವಿತರಣೆಯನ್ನು ತೋರಿಸುತ್ತದೆ. ಎಡಕ್ಕೆ ಕಡಿಮೆ ತಿರುವು ಹೊಂದಿರುವ ಚಾರ್ಟ್ ಅನ್ನು ನೀವು ನಿರ್ದಿಷ್ಟ ವ್ಯಾಪ್ತಿಯೊಳಗಿನ ಡೇಟಾವನ್ನು ಮಾತ್ರ ಆಯ್ಕೆಮಾಡುವ ಮೂಲಕ ರಚಿಸಬಹುದು:
ನಿಮ್ಮ ಡೇಟಾವನ್ನು ಫಿಲ್ಟರ್ ಮಾಡಿ, ದೇಹ ಭಾರವು 60 ಕ್ಕಿಂತ ಕಡಿಮೆ ಇರುವ ಪಕ್ಷಿಗಳನ್ನು ಮಾತ್ರ ತೆಗೆದುಕೊಳ್ಳಿ ಮತ್ತು 30 `bins` ತೋರಿಸಿ:
```r
birds_filtered_1 <- subset(birds_filtered, MaxBodyMass > 1 & MaxBodyMass < 60)
ggplot(data = birds_filtered_1, aes(x = MaxBodyMass)) +
geom_histogram(bins=30)+ylab('Frequency')
```
![filtered histogram](../../../../../translated_images/filtered-histogram.6bf5d2bfd82533220e1bd4bc4f7d14308f43746ed66721d9ec8f460732be6674.kn.png)
✅ ಇನ್ನಷ್ಟು ಫಿಲ್ಟರ್‌ಗಳು ಮತ್ತು ಡೇಟಾ ಪಾಯಿಂಟ್‌ಗಳನ್ನು ಪ್ರಯತ್ನಿಸಿ. ಡೇಟಾದ ಸಂಪೂರ್ಣ ವಿತರಣೆಯನ್ನು ನೋಡಲು, ಲೇಬಲ್ ಮಾಡಲಾದ ವಿತರಣೆಯನ್ನು ತೋರಿಸಲು `['MaxBodyMass']` ಫಿಲ್ಟರ್ ಅನ್ನು ತೆಗೆದುಹಾಕಿ.
ಹಿಸ್ಟೋಗ್ರಾಮ್ ಕೆಲವು ಸುಂದರ ಬಣ್ಣ ಮತ್ತು ಲೇಬಲಿಂಗ್ ಸುಧಾರಣೆಗಳನ್ನು ಸಹ ಒದಗಿಸುತ್ತದೆ:
ಎರಡು ವಿತರಣೆಗಳ ನಡುವಿನ ಸಂಬಂಧವನ್ನು ಹೋಲಿಸಲು 2D ಹಿಸ್ಟೋಗ್ರಾಮ್ ರಚಿಸಿ. `MaxBodyMass` ಮತ್ತು `MaxLength` ಅನ್ನು ಹೋಲಿಸಿ. `ggplot2` ಪ್ರಕಾಶಮಾನ ಬಣ್ಣಗಳನ್ನು ಬಳಸಿ ಸಂಯೋಜನೆಯನ್ನು ತೋರಿಸುವ ಒಳಗೊಂಡ ವಿಧಾನವನ್ನು ಒದಗಿಸುತ್ತದೆ:
```r
ggplot(data=birds_filtered_1, aes(x=MaxBodyMass, y=MaxLength) ) +
geom_bin2d() +scale_fill_continuous(type = "viridis")
```
ಈ ಎರಡು ಅಂಶಗಳ ನಡುವೆ ನಿರೀಕ್ಷಿತ ಅಕ್ಷದ ಮೇಲೆ ನಿರೀಕ್ಷಿತ ಸಂಬಂಧವಿದೆ, ಒಂದು ವಿಶೇಷವಾಗಿ ಬಲವಾದ ಸಂಯೋಜನೆಯ ಬಿಂದುವಿನೊಂದಿಗೆ:
![2d plot](../../../../../translated_images/2d-plot.c504786f439bd7ebceebf2465c70ca3b124103e06c7ff7214bf24e26f7aec21e.kn.png)
ಹಿಸ್ಟೋಗ್ರಾಮ್‌ಗಳು ಸಂಖ್ಯಾತ್ಮಕ ಡೇಟಾಗಾಗಿ ಡೀಫಾಲ್ಟ್‌ನಲ್ಲಿ ಚೆನ್ನಾಗಿ ಕೆಲಸ ಮಾಡುತ್ತವೆ. ಪಠ್ಯ ಡೇಟಾ ಪ್ರಕಾರ ವಿತರಣೆಯನ್ನು ನೋಡಬೇಕಾದರೆ ಏನು ಮಾಡಬೇಕು?
## ಪಠ್ಯ ಡೇಟಾ ಬಳಸಿ ವಿತರಣೆಯನ್ನು ಅನ್ವೇಷಿಸಿ
ಈ ಡೇಟಾಸೆಟ್ ಪಕ್ಷಿ ವರ್ಗ ಮತ್ತು ಅದರ ಜೀನಸ್, ಪ್ರಭೇದ ಮತ್ತು ಕುಟುಂಬದ ಜೊತೆಗೆ ಅದರ ಸಂರಕ್ಷಣಾ ಸ್ಥಿತಿಯ ಬಗ್ಗೆ ಉತ್ತಮ ಮಾಹಿತಿಯನ್ನು ಒಳಗೊಂಡಿದೆ. ಈ ಸಂರಕ್ಷಣಾ ಮಾಹಿತಿಯನ್ನು ಅನ್ವೇಷಿಸೋಣ. ಪಕ್ಷಿಗಳ ಸಂರಕ್ಷಣಾ ಸ್ಥಿತಿಯ ಪ್ರಕಾರ ವಿತರಣೆಯೇನು?
> ✅ ಡೇಟಾಸೆಟ್‌ನಲ್ಲಿ, ಸಂರಕ್ಷಣಾ ಸ್ಥಿತಿಯನ್ನು ವಿವರಿಸಲು ಹಲವಾರು ಸಂಕ್ಷಿಪ್ತ ಪದಗಳನ್ನು ಬಳಸಲಾಗಿದೆ. ಈ ಸಂಕ್ಷಿಪ್ತ ಪದಗಳು [IUCN ರೆಡ್ ಲಿಸ್ಟ್ ವರ್ಗಗಳು](https://www.iucnredlist.org/) ನಿಂದ ಬಂದಿವೆ, ಇದು ಪ್ರಭೇದಗಳ ಸ್ಥಿತಿಯನ್ನು ದಾಖಲಿಸುವ ಸಂಸ್ಥೆ.
>
> - CR: ಗಂಭೀರವಾಗಿ ಅಪಾಯದಲ್ಲಿರುವುದು
> - EN: ಅಪಾಯದಲ್ಲಿರುವುದು
> - EX: ನಾಶವಾದುದು
> - LC: ಕನಿಷ್ಠ ಚಿಂತನೆ
> - NT: ಸಮೀಪದ ಅಪಾಯ
> - VU: ಅಸುರಕ್ಷಿತ
ಇವು ಪಠ್ಯ ಆಧಾರಿತ ಮೌಲ್ಯಗಳು ಆದ್ದರಿಂದ ನೀವು ಹಿಸ್ಟೋಗ್ರಾಮ್ ರಚಿಸಲು ಪರಿವರ್ತನೆ ಮಾಡಬೇಕಾಗುತ್ತದೆ. filteredBirds ಡೇಟಾಫ್ರೇಮ್ ಬಳಸಿ, ಅದರ ಸಂರಕ್ಷಣಾ ಸ್ಥಿತಿಯನ್ನು ಕನಿಷ್ಠ ರೆಕ್ಕೆ ವಿಸ್ತಾರದೊಂದಿಗೆ ಪ್ರದರ್ಶಿಸಿ. ನೀವು ಏನು ನೋಡುತ್ತೀರಿ?
```r
birds_filtered_1$ConservationStatus[birds_filtered_1$ConservationStatus == 'EX'] <- 'x1'
birds_filtered_1$ConservationStatus[birds_filtered_1$ConservationStatus == 'CR'] <- 'x2'
birds_filtered_1$ConservationStatus[birds_filtered_1$ConservationStatus == 'EN'] <- 'x3'
birds_filtered_1$ConservationStatus[birds_filtered_1$ConservationStatus == 'NT'] <- 'x4'
birds_filtered_1$ConservationStatus[birds_filtered_1$ConservationStatus == 'VU'] <- 'x5'
birds_filtered_1$ConservationStatus[birds_filtered_1$ConservationStatus == 'LC'] <- 'x6'
ggplot(data=birds_filtered_1, aes(x = MinWingspan, fill = ConservationStatus)) +
geom_histogram(position = "identity", alpha = 0.4, bins = 20) +
scale_fill_manual(name="Conservation Status",values=c("red","green","blue","pink"),labels=c("Endangered","Near Threathened","Vulnerable","Least Concern"))
```
![wingspan and conservation collation](../../../../../translated_images/wingspan-conservation-collation.4024e9aa6910866aa82f0c6cb6a6b4b925bd10079e6b0ef8f92eefa5a6792f76.kn.png)
ಕನಿಷ್ಠ ರೆಕ್ಕೆ ವಿಸ್ತಾರ ಮತ್ತು ಸಂರಕ್ಷಣಾ ಸ್ಥಿತಿಯ ನಡುವೆ ಉತ್ತಮ ಸಂಬಂಧವಿಲ್ಲದಂತೆ ತೋರುತ್ತದೆ. ಈ ವಿಧಾನವನ್ನು ಬಳಸಿ ಡೇಟಾಸೆಟ್‌ನ ಇತರ ಅಂಶಗಳನ್ನು ಪರೀಕ್ಷಿಸಿ. ನೀವು ಯಾವುದೇ ಸಂಬಂಧವನ್ನು ಕಂಡುಕೊಳ್ಳುತ್ತೀರಾ?
## ಡೆನ್ಸಿಟಿ ಪ್ಲಾಟ್‌ಗಳು
ನೀವು ಗಮನಿಸಿದ್ದೀರಾ, ನಾವು ಈಗಾಗಲೇ ನೋಡಿದ ಹಿಸ್ಟೋಗ್ರಾಮ್‌ಗಳು 'ಹಂತದ' ಆಗಿದ್ದು, ಸ್ಮೂತ್ ಆಗಿ ವಕ್ರವಾಗಿ ಹರಿಯುವುದಿಲ್ಲ. ಸ್ಮೂತ್ ಡೆನ್ಸಿಟಿ ಚಾರ್ಟ್ ತೋರಿಸಲು, ನೀವು ಡೆನ್ಸಿಟಿ ಪ್ಲಾಟ್ ಪ್ರಯತ್ನಿಸಬಹುದು.
ಇದೀಗ ಡೆನ್ಸಿಟಿ ಪ್ಲಾಟ್‌ಗಳೊಂದಿಗೆ ಕೆಲಸ ಮಾಡೋಣ!
```r
ggplot(data = birds_filtered_1, aes(x = MinWingspan)) +
geom_density()
```
![density plot](../../../../../translated_images/density-plot.675ccf865b76c690487fb7f69420a8444a3515f03bad5482886232d4330f5c85.kn.png)
ನೀವು ನೋಡಬಹುದು, ಈ ಪ್ಲಾಟ್ ಕನಿಷ್ಠ ರೆಕ್ಕೆ ವಿಸ್ತಾರದ ಡೇಟಾಗಾಗಿ ಹಿಂದಿನದನ್ನು ಪ್ರತಿಧ್ವನಿಸುತ್ತದೆ; ಅದು ಸ್ವಲ್ಪ ಸ್ಮೂತ್ ಆಗಿದೆ. ನೀವು ಎರಡನೇ ಚಾರ್ಟ್‌ನಲ್ಲಿ ರಚಿಸಿದ ಜಾಗೃತ MaxBodyMass ರೇಖೆಯನ್ನು ಮರುಸೃಷ್ಟಿಸುವ ಮೂಲಕ ಅದನ್ನು ಚೆನ್ನಾಗಿ ಸ್ಮೂತ್ ಮಾಡಬಹುದು:
```r
ggplot(data = birds_filtered_1, aes(x = MaxBodyMass)) +
geom_density()
```
![bodymass density](../../../../../translated_images/bodymass-smooth.d31ce526d82b0a1f19a073815dea28ecfbe58145ec5337e4ef7e8cdac81120b3.kn.png)
ನೀವು ಸ್ಮೂತ್ ಆದರೆ ತುಂಬಾ ಸ್ಮೂತ್ ಅಲ್ಲದ ರೇಖೆಯನ್ನು ಬಯಸಿದರೆ, `adjust` ಪರಿಮಾಣವನ್ನು ಸಂಪಾದಿಸಿ:
```r
ggplot(data = birds_filtered_1, aes(x = MaxBodyMass)) +
geom_density(adjust = 1/5)
```
![less smooth bodymass](../../../../../translated_images/less-smooth-bodymass.10f4db8b683cc17d17b2d33f22405413142004467a1493d416608dafecfdee23.kn.png)
✅ ಈ ರೀತಿಯ ಪ್ಲಾಟ್‌ಗೆ ಲಭ್ಯವಿರುವ ಪರಿಮಾಣಗಳ ಬಗ್ಗೆ ಓದಿ ಮತ್ತು ಪ್ರಯೋಗ ಮಾಡಿ!
ಈ ರೀತಿಯ ಚಾರ್ಟ್ ಸುಂದರವಾಗಿ ವಿವರಣಾತ್ಮಕ ದೃಶ್ಯೀಕರಣಗಳನ್ನು ಒದಗಿಸುತ್ತದೆ. ಕೆಲವು ಸಾಲುಗಳ ಕೋಡ್‌ನೊಂದಿಗೆ, ಉದಾಹರಣೆಗೆ, ನೀವು ಪಕ್ಷಿ ಕ್ರಮದ ಪ್ರತಿ ಗರಿಷ್ಠ ದೇಹ ಭಾರದ ಡೆನ್ಸಿಟಿಯನ್ನು ತೋರಿಸಬಹುದು:
```r
ggplot(data=birds_filtered_1,aes(x = MaxBodyMass, fill = Order)) +
geom_density(alpha=0.5)
```
![bodymass per order](../../../../../translated_images/bodymass-per-order.9d2b065dd931b928c839d8cdbee63067ab1ae52218a1b90717f4bc744354f485.kn.png)
## 🚀 ಸವಾಲು
ಹಿಸ್ಟೋಗ್ರಾಮ್‌ಗಳು ಮೂಲ ಸ್ಕ್ಯಾಟರ್ ಪ್ಲಾಟ್‌ಗಳು, ಬಾರ್ ಚಾರ್ಟ್‌ಗಳು ಅಥವಾ ಲೈನ್ ಚಾರ್ಟ್‌ಗಳಿಗಿಂತ ಹೆಚ್ಚು ಸುಧಾರಿತ ಚಾರ್ಟ್ ಪ್ರಕಾರ. ಇಂಟರ್ನೆಟ್‌ನಲ್ಲಿ ಹಿಸ್ಟೋಗ್ರಾಮ್‌ಗಳ ಬಳಕೆಯ ಉತ್ತಮ ಉದಾಹರಣೆಗಳನ್ನು ಹುಡುಕಿ. ಅವು ಹೇಗೆ ಬಳಸಲಾಗುತ್ತವೆ, ಏನು ಪ್ರದರ್ಶಿಸುತ್ತವೆ ಮತ್ತು ಯಾವ ಕ್ಷೇತ್ರಗಳು ಅಥವಾ ವಿಚಾರಣಾ ಕ್ಷೇತ್ರಗಳಲ್ಲಿ ಅವು ಸಾಮಾನ್ಯವಾಗಿ ಬಳಸಲಾಗುತ್ತವೆ?
## [ಪೋಸ್ಟ್-ಪಾಠ ಪ್ರಶ್ನೋತ್ತರ](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/19)
## ವಿಮರ್ಶೆ ಮತ್ತು ಸ್ವಯಂ ಅಧ್ಯಯನ
ಈ ಪಾಠದಲ್ಲಿ, ನೀವು `ggplot2` ಬಳಸಿ ಹೆಚ್ಚು ಸುಧಾರಿತ ಚಾರ್ಟ್‌ಗಳನ್ನು ತೋರಿಸಲು ಕೆಲಸ ಪ್ರಾರಂಭಿಸಿದ್ದೀರಿ. `geom_density_2d()` ಎಂಬ "ಒಂದು ಅಥವಾ ಹೆಚ್ಚು ಆಯಾಮಗಳಲ್ಲಿ ನಿರಂತರ ಸಾಧ್ಯತೆ ಡೆನ್ಸಿಟಿ ವಕ್ರ" ಬಗ್ಗೆ ಸಂಶೋಧನೆ ಮಾಡಿ. ಅದು ಹೇಗೆ ಕೆಲಸ ಮಾಡುತ್ತದೆ ಎಂಬುದನ್ನು ಅರ್ಥಮಾಡಿಕೊಳ್ಳಲು [ಡಾಕ್ಯುಮೆಂಟೇಶನ್](https://ggplot2.tidyverse.org/reference/geom_density_2d.html) ಓದಿ.
## ನಿಯೋಜನೆ
[ನಿಮ್ಮ ಕೌಶಲ್ಯಗಳನ್ನು ಅನ್ವಯಿಸಿ](assignment.md)
---
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
**ಅಸ್ವೀಕರಣ**:
ಈ ದಸ್ತಾವೇಜು [Co-op Translator](https://github.com/Azure/co-op-translator) ಎಂಬ AI ಅನುವಾದ ಸೇವೆಯನ್ನು ಬಳಸಿ ಅನುವಾದಿಸಲಾಗಿದೆ. ನಾವು ಶುದ್ಧತೆಯತ್ತ ಪ್ರಯತ್ನಿಸುತ್ತಿದ್ದರೂ, ಸ್ವಯಂಚಾಲಿತ ಅನುವಾದಗಳಲ್ಲಿ ತಪ್ಪುಗಳು ಅಥವಾ ಅಸತ್ಯತೆಗಳು ಇರಬಹುದು ಎಂಬುದನ್ನು ದಯವಿಟ್ಟು ಗಮನಿಸಿ. ಮೂಲ ಭಾಷೆಯಲ್ಲಿರುವ ಮೂಲ ದಸ್ತಾವೇಜನ್ನು ಅಧಿಕೃತ ಮೂಲವೆಂದು ಪರಿಗಣಿಸಬೇಕು. ಮಹತ್ವದ ಮಾಹಿತಿಗಾಗಿ, ವೃತ್ತಿಪರ ಮಾನವ ಅನುವಾದವನ್ನು ಶಿಫಾರಸು ಮಾಡಲಾಗುತ್ತದೆ. ಈ ಅನುವಾದ ಬಳಕೆಯಿಂದ ಉಂಟಾಗುವ ಯಾವುದೇ ತಪ್ಪು ಅರ್ಥಮಾಡಿಕೊಳ್ಳುವಿಕೆ ಅಥವಾ ತಪ್ಪು ವಿವರಣೆಗಳಿಗೆ ನಾವು ಹೊಣೆಗಾರರಾಗುವುದಿಲ್ಲ.
<!-- CO-OP TRANSLATOR DISCLAIMER END -->

@ -0,0 +1,27 @@
<!--
CO_OP_TRANSLATOR_METADATA:
{
"original_hash": "a233d542512136c4dd29aad38ca0175f",
"translation_date": "2025-12-19T16:23:54+00:00",
"source_file": "3-Data-Visualization/R/10-visualization-distributions/assignment.md",
"language_code": "kn"
}
-->
# ನಿಮ್ಮ ಕೌಶಲ್ಯಗಳನ್ನು ಅನ್ವಯಿಸಿ
## ಸೂಚನೆಗಳು
ಇದುವರೆಗೆ, ನೀವು ಮಿನೆಸೋಟಾ ಪಕ್ಷಿಗಳ ಡೇಟಾಸೆಟ್‌ನೊಂದಿಗೆ ಪಕ್ಷಿಗಳ ಪ್ರಮಾಣ ಮತ್ತು ಜನಸಂಖ್ಯಾ ಸಾಂದ್ರತೆ ಬಗ್ಗೆ ಮಾಹಿತಿ ಕಂಡುಹಿಡಿಯಲು ಕೆಲಸ ಮಾಡಿದ್ದೀರಿ. ಈ ತಂತ್ರಗಳನ್ನು ಅನ್ವಯಿಸುವ ಅಭ್ಯಾಸವನ್ನು ಬೇರೆ ಡೇಟಾಸೆಟ್‌ನೊಂದಿಗೆ ಪ್ರಯತ್ನಿಸಿ, ಬಹುಶಃ [Kaggle](https://www.kaggle.com/) ನಿಂದ ಪಡೆದಿರಬಹುದು. ಈ ಡೇಟಾಸೆಟ್ ಬಗ್ಗೆ ಕಥೆಯನ್ನು ಹೇಳಲು R ಸ್ಕ್ರಿಪ್ಟ್ ರಚಿಸಿ, ಮತ್ತು ಅದನ್ನು ಚರ್ಚಿಸುವಾಗ ಹಿಸ್ಟೋಗ್ರಾಮ್‌ಗಳನ್ನು ಬಳಸುವುದನ್ನು ಖಚಿತಪಡಿಸಿಕೊಳ್ಳಿ.
## ಮೌಲ್ಯಮಾಪನ
ಉದಾಹರಣೆಯಾಗಿ | ತೃಪ್ತಿಕರ | ಸುಧಾರಣೆಯ ಅಗತ್ಯವಿದೆ
--- | --- | -- |
ಈ ಡೇಟಾಸೆಟ್‌ನ ಮೂಲವನ್ನು ಒಳಗೊಂಡಂತೆ ಟಿಪ್ಪಣಿಗಳೊಂದಿಗೆ ಸ್ಕ್ರಿಪ್ಟ್ ಅನ್ನು ಪ್ರಸ್ತುತಪಡಿಸಲಾಗಿದೆ ಮತ್ತು ಡೇಟಾದ ಬಗ್ಗೆ ತಥ್ಯಗಳನ್ನು ಕಂಡುಹಿಡಿಯಲು ಕನಿಷ್ಠ 5 ಹಿಸ್ಟೋಗ್ರಾಮ್‌ಗಳನ್ನು ಬಳಸಲಾಗಿದೆ. | ಅಪೂರ್ಣ ಟಿಪ್ಪಣಿಗಳು ಅಥವಾ ದೋಷಗಳೊಂದಿಗೆ ಸ್ಕ್ರಿಪ್ಟ್ ಅನ್ನು ಪ್ರಸ್ತುತಪಡಿಸಲಾಗಿದೆ. | ಟಿಪ್ಪಣಿಗಳಿಲ್ಲದೆ ಮತ್ತು ದೋಷಗಳೊಂದಿಗೆ ಸ್ಕ್ರಿಪ್ಟ್ ಅನ್ನು ಪ್ರಸ್ತುತಪಡಿಸಲಾಗಿದೆ.
---
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
**ಅಸ್ವೀಕರಣ**:
ಈ ದಸ್ತಾವೇಜು [Co-op Translator](https://github.com/Azure/co-op-translator) ಎಂಬ AI ಅನುವಾದ ಸೇವೆಯನ್ನು ಬಳಸಿ ಅನುವಾದಿಸಲಾಗಿದೆ. ನಾವು ಶುದ್ಧತೆಯತ್ತ ಪ್ರಯತ್ನಿಸುತ್ತಿದ್ದರೂ, ಸ್ವಯಂಚಾಲಿತ ಅನುವಾದಗಳಲ್ಲಿ ತಪ್ಪುಗಳು ಅಥವಾ ಅಸತ್ಯತೆಗಳು ಇರಬಹುದು ಎಂದು ದಯವಿಟ್ಟು ಗಮನಿಸಿ. ಮೂಲ ಭಾಷೆಯಲ್ಲಿರುವ ಮೂಲ ದಸ್ತಾವೇಜನ್ನು ಅಧಿಕೃತ ಮೂಲವೆಂದು ಪರಿಗಣಿಸಬೇಕು. ಮಹತ್ವದ ಮಾಹಿತಿಗಾಗಿ, ವೃತ್ತಿಪರ ಮಾನವ ಅನುವಾದವನ್ನು ಶಿಫಾರಸು ಮಾಡಲಾಗುತ್ತದೆ. ಈ ಅನುವಾದ ಬಳಕೆಯಿಂದ ಉಂಟಾಗುವ ಯಾವುದೇ ತಪ್ಪು ಅರ್ಥಮಾಡಿಕೊಳ್ಳುವಿಕೆ ಅಥವಾ ತಪ್ಪು ವಿವರಣೆಗಳಿಗೆ ನಾವು ಹೊಣೆಗಾರರಾಗುವುದಿಲ್ಲ.
<!-- CO-OP TRANSLATOR DISCLAIMER END -->

@ -0,0 +1,206 @@
<!--
CO_OP_TRANSLATOR_METADATA:
{
"original_hash": "47028abaaafa2bcb1079702d20569066",
"translation_date": "2025-12-19T16:29:36+00:00",
"source_file": "3-Data-Visualization/R/11-visualization-proportions/README.md",
"language_code": "kn"
}
-->
# ಪ್ರಮಾಣಗಳನ್ನು ದೃಶ್ಯೀಕರಿಸುವುದು
|![ [(@sketchthedocs)](https://sketchthedocs.dev) ಅವರ ಸ್ಕೆಚ್ ನೋಟ್ ](../../../sketchnotes/11-Visualizing-Proportions.png)|
|:---:|
|ಪ್ರಮಾಣಗಳನ್ನು ದೃಶ್ಯೀಕರಿಸುವುದು - _[@nitya](https://twitter.com/nitya) ಅವರ ಸ್ಕೆಚ್ ನೋಟ್_ |
ಈ ಪಾಠದಲ್ಲಿ, ನೀವು ಪ್ರಾಕೃತಿಕ-ಕೇಂದ್ರೀಕೃತ ಬೇರೆ ಡೇಟಾಸೆಟ್ ಅನ್ನು ಬಳಸಿಕೊಂಡು ಪ್ರಮಾಣಗಳನ್ನು ದೃಶ್ಯೀಕರಿಸುವಿರಿ, ಉದಾಹರಣೆಗೆ, ಒಂದು ಡೇಟಾಸೆಟ್‌ನಲ್ಲಿ ಎಷ್ಟು ವಿಭಿನ್ನ ಪ್ರಕಾರದ ಫಂಗಿ ಇದ್ದಾರೆ ಎಂಬುದನ್ನು. ನಾವು ಈ ಆಕರ್ಷಕ ಫಂಗಿಗಳನ್ನು Audubon ನಿಂದ ಪಡೆದ 23 ಪ್ರಭೇದಗಳ ಗಿಲ್ಲ್ಡ್ ಮಶ್ರೂಮ್‌ಗಳ ವಿವರಗಳನ್ನು ಹೊಂದಿರುವ ಡೇಟಾಸೆಟ್ ಬಳಸಿ ಅನ್ವೇಷಿಸೋಣ. ನೀವು ರುಚಿಕರವಾದ ದೃಶ್ಯೀಕರಣಗಳನ್ನು ಪ್ರಯೋಗಿಸುವಿರಿ, ಉದಾಹರಣೆಗೆ:
- ಪೈ ಚಾರ್ಟ್‌ಗಳು 🥧
- ಡೋನಟ್ ಚಾರ್ಟ್‌ಗಳು 🍩
- ವಾಫಲ್ ಚಾರ್ಟ್‌ಗಳು 🧇
> 💡 ಮೈಕ್ರೋಸಾಫ್ಟ್ ರಿಸರ್ಚ್‌ನಿಂದ [Charticulator](https://charticulator.com) ಎಂಬ ಬಹಳ ಆಸಕ್ತಿದಾಯಕ ಯೋಜನೆ ಉಚಿತ ಡ್ರ್ಯಾಗ್ ಮತ್ತು ಡ್ರಾಪ್ ಇಂಟರ್ಫೇಸ್ ಅನ್ನು ಡೇಟಾ ದೃಶ್ಯೀಕರಣಗಳಿಗೆ ನೀಡುತ್ತದೆ. ಅವರ ಟ್ಯುಟೋರಿಯಲ್‌ಗಳಲ್ಲಿ ಒಂದರಲ್ಲಿ ಅವರು ಈ ಮಶ್ರೂಮ್ ಡೇಟಾಸೆಟ್ ಅನ್ನು ಕೂಡ ಬಳಸುತ್ತಾರೆ! ಆದ್ದರಿಂದ ನೀವು ಡೇಟಾವನ್ನು ಅನ್ವೇಷಿಸಿ ಲೈಬ್ರರಿಯನ್ನು ಒಂದೇ ಸಮಯದಲ್ಲಿ ಕಲಿಯಬಹುದು: [Charticulator ಟ್ಯುಟೋರಿಯಲ್](https://charticulator.com/tutorials/tutorial4.html).
## [ಪೂರ್ವ-ಪಾಠ ಪ್ರಶ್ನೋತ್ತರ](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/20)
## ನಿಮ್ಮ ಮಶ್ರೂಮ್‌ಗಳನ್ನು ಪರಿಚಯಿಸಿಕೊಳ್ಳಿ 🍄
ಮಶ್ರೂಮ್‌ಗಳು ಬಹಳ ಆಸಕ್ತಿದಾಯಕವಾಗಿವೆ. ಅವುಗಳನ್ನು ಅಧ್ಯಯನ ಮಾಡಲು ಡೇಟಾಸೆಟ್ ಅನ್ನು ಆಮದು ಮಾಡೋಣ:
```r
mushrooms = read.csv('../../data/mushrooms.csv')
head(mushrooms)
```
ಒಂದು ಟೇಬಲ್ ವಿಶ್ಲೇಷಣೆಗೆ ಉತ್ತಮ ಡೇಟಾ ಜೊತೆಗೆ ಮುದ್ರಿತವಾಗಿದೆ:
| ವರ್ಗ | ಕ್ಯಾಪ್-ಆಕಾರ | ಕ್ಯಾಪ್-ಮೇಲ್ಮೈ | ಕ್ಯಾಪ್-ಬಣ್ಣ | ಗಾಯಗಳು | ವಾಸನೆ | ಗಿಲ್-ಸಂಯೋಜನೆ | ಗಿಲ್-ಅಂತರ | ಗಿಲ್-ಗಾತ್ರ | ಗಿಲ್-ಬಣ್ಣ | ಸ್ಟಾಕ್-ಆಕಾರ | ಸ್ಟಾಕ್-ಮೂಲ | ಸ್ಟಾಕ್-ಮೇಲ್ಮೈ-ರಿಂಗ್‌ಮೇಲೆ | ಸ್ಟಾಕ್-ಮೇಲ್ಮೈ-ರಿಂಗ್‌ಕೆಳಗೆ | ಸ್ಟಾಕ್-ಬಣ್ಣ-ರಿಂಗ್‌ಮೇಲೆ | ಸ್ಟಾಕ್-ಬಣ್ಣ-ರಿಂಗ್‌ಕೆಳಗೆ | ವೀಲ್-ಪ್ರಕಾರ | ವೀಲ್-ಬಣ್ಣ | ರಿಂಗ್-ಸಂಖ್ಯೆ | ರಿಂಗ್-ಪ್ರಕಾರ | ಸ್ಪೋರ್-ಪ್ರಿಂಟ್-ಬಣ್ಣ | ಜನಸಂಖ್ಯೆ | ವಾಸಸ್ಥಳ |
| --------- | --------- | ----------- | --------- | ------- | ------- | --------------- | ------------ | --------- | ---------- | ----------- | ---------- | ------------------------ | ------------------------ | ---------------------- | ---------------------- | --------- | ---------- | ----------- | --------- | ----------------- | ---------- | ------- |
| ವಿಷಕಾರಿ | ಉಬ್ಬು | ಮೃದುವು | ಕಂದು | ಗಾಯಗಳು | ತೀವ್ರ | ಮುಕ್ತ | ಹತ್ತಿರ | ಸಣ್ಣ | ಕಪ್ಪು | ವಿಸ್ತಾರಗೊಳ್ಳುವ | ಸಮಾನ | ಮೃದುವು | ಮೃದುವು | ಬಿಳಿ | ಬಿಳಿ | ಭಾಗಶಃ | ಬಿಳಿ | ಒಂದು | ಲटकಿಸುವ | ಕಪ್ಪು | ಹರಡಿದ | ನಗರ |
| ತಿನ್ನಬಹುದಾದ | ಉಬ್ಬು | ಮೃದುವು | ಹಳದಿ | ಗಾಯಗಳು | ಬಾದಾಮಿ | ಮುಕ್ತ | ಹತ್ತಿರ | ಅಗಲ | ಕಪ್ಪು | ವಿಸ್ತಾರಗೊಳ್ಳುವ | ಕ್ಲಬ್ | ಮೃದುವು | ಮೃದುವು | ಬಿಳಿ | ಬಿಳಿ | ಭಾಗಶಃ | ಬಿಳಿ | ಒಂದು | ಲटकಿಸುವ | ಕಂದು | ಬಹಳ | ಹುಲ್ಲುಗಳು |
| ತಿನ್ನಬಹುದಾದ | ಘಂಟೆ | ಮೃದುವು | ಬಿಳಿ | ಗಾಯಗಳು | ಅನೀಸ್ | ಮುಕ್ತ | ಹತ್ತಿರ | ಅಗಲ | ಕಂದು | ವಿಸ್ತಾರಗೊಳ್ಳುವ | ಕ್ಲಬ್ | ಮೃದುವು | ಮೃದುವು | ಬಿಳಿ | ಬಿಳಿ | ಭಾಗಶಃ | ಬಿಳಿ | ಒಂದು | ಲटकಿಸುವ | ಕಂದು | ಬಹಳ | ಮೇದಾನಗಳು |
| ವಿಷಕಾರಿ | ಉಬ್ಬು | ತೊಗರಿ | ಬಿಳಿ | ಗಾಯಗಳು | ತೀವ್ರ | ಮುಕ್ತ | ಹತ್ತಿರ | ಸಣ್ಣ | ಕಂದು | ವಿಸ್ತಾರಗೊಳ್ಳುವ | ಸಮಾನ | ಮೃದುವು | ಮೃದುವು | ಬಿಳಿ | ಬಿಳಿ | ಭಾಗಶಃ | ಬಿಳಿ | ಒಂದು | ಲटकಿಸುವ | ಕಪ್ಪು | ಹರಡಿದ | ನಗರ
| ತಿನ್ನಬಹುದಾದ | ಉಬ್ಬು | ಮೃದುವು | ಹಸಿರು | ಗಾಯಗಳಿಲ್ಲ| ಇಲ್ಲ | ಮುಕ್ತ | ತುಂಬಿದ | ಅಗಲ | ಕಪ್ಪು | ಸಣ್ಣಗೊಳ್ಳುವ | ಸಮಾನ | ಮೃದುವು | ಮೃದುವು | ಬಿಳಿ | ಬಿಳಿ | ಭಾಗಶಃ | ಬಿಳಿ | ಒಂದು | ಅಸ್ತಮಿಸುವ | ಕಂದು | ಬಹಳ | ಹುಲ್ಲುಗಳು
| ತಿನ್ನಬಹುದಾದ | ಉಬ್ಬು | ತೊಗರಿ | ಹಳದಿ | ಗಾಯಗಳು | ಬಾದಾಮಿ | ಮುಕ್ತ | ಹತ್ತಿರ | ಅಗಲ | ಕಂದು | ವಿಸ್ತಾರಗೊಳ್ಳುವ | ಕ್ಲಬ್ | ಮೃದುವು | ಮೃದುವು | ಬಿಳಿ | ಬಿಳಿ | ಭಾಗಶಃ | ಬಿಳಿ | ಒಂದು | ಲटकಿಸುವ | ಕಪ್ಪು | ಬಹಳ | ಹುಲ್ಲುಗಳು
ತಕ್ಷಣವೇ, ನೀವು ಗಮನಿಸುತ್ತೀರಿ ಎಲ್ಲಾ ಡೇಟಾ ಪಠ್ಯರೂಪದಲ್ಲಿದೆ. ನೀವು ಈ ಡೇಟಾವನ್ನು ಚಾರ್ಟ್‌ನಲ್ಲಿ ಬಳಸಲು ಪರಿವರ್ತಿಸಬೇಕಾಗುತ್ತದೆ. ಬಹುತೇಕ ಡೇಟಾ ವಾಸ್ತವವಾಗಿ ಒಂದು ವಸ್ತುವಾಗಿ ಪ್ರತಿನಿಧಿಸಲಾಗಿದೆ:
```r
names(mushrooms)
```
ಫಲಿತಾಂಶ:
```output
[1] "class" "cap.shape"
[3] "cap.surface" "cap.color"
[5] "bruises" "odor"
[7] "gill.attachment" "gill.spacing"
[9] "gill.size" "gill.color"
[11] "stalk.shape" "stalk.root"
[13] "stalk.surface.above.ring" "stalk.surface.below.ring"
[15] "stalk.color.above.ring" "stalk.color.below.ring"
[17] "veil.type" "veil.color"
[19] "ring.number" "ring.type"
[21] "spore.print.color" "population"
[23] "habitat"
```
ಈ ಡೇಟಾವನ್ನು ತೆಗೆದುಕೊಂಡು 'class' ಕಾಲಮ್ ಅನ್ನು ವರ್ಗವಾಗಿ ಪರಿವರ್ತಿಸಿ:
```r
library(dplyr)
grouped=mushrooms %>%
group_by(class) %>%
summarise(count=n())
```
ಈಗ, ನೀವು ಮಶ್ರೂಮ್ ಡೇಟಾವನ್ನು ಮುದ್ರಿಸಿದರೆ, ಅದು ವಿಷಕಾರಿ/ತಿನ್ನಬಹುದಾದ ವರ್ಗಗಳ ಪ್ರಕಾರ ವರ್ಗೀಕೃತವಾಗಿದೆ ಎಂದು ಕಾಣಬಹುದು:
```r
View(grouped)
```
| ವರ್ಗ | ಎಣಿಕೆ |
| --------- | --------- |
| ತಿನ್ನಬಹುದಾದ | 4208 |
| ವಿಷಕಾರಿ | 3916 |
ನೀವು ಈ ಟೇಬಲ್‌ನಲ್ಲಿ ನೀಡಲಾದ ಕ್ರಮವನ್ನು ಅನುಸರಿಸಿ ನಿಮ್ಮ ವರ್ಗದ ಲೇಬಲ್ಗಳನ್ನು ರಚಿಸಿದರೆ, ನೀವು ಪೈ ಚಾರ್ಟ್ ರಚಿಸಬಹುದು.
## ಪೈ!
```r
pie(grouped$count,grouped$class, main="Edible?")
```
ಇದು, ಈ ಡೇಟಾದ ಪ್ರಮಾಣಗಳನ್ನು ಈ ಎರಡು ಮಶ್ರೂಮ್ ವರ್ಗಗಳ ಪ್ರಕಾರ ತೋರಿಸುವ ಪೈ ಚಾರ್ಟ್. ಲೇಬಲ್‌ಗಳ ಕ್ರಮವನ್ನು ಸರಿಯಾಗಿ ಪಡೆಯುವುದು ಬಹಳ ಮುಖ್ಯ, ವಿಶೇಷವಾಗಿ ಇಲ್ಲಿ, ಆದ್ದರಿಂದ ಲೇಬಲ್ ಅರೆ ಅನ್ನು ರಚಿಸುವ ಕ್ರಮವನ್ನು ಖಚಿತಪಡಿಸಿಕೊಳ್ಳಿ!
![pie chart](../../../../../translated_images/pie1-wb.685df063673751f4b0b82127f7a52c7f9a920192f22ae61ad28412ba9ace97bf.kn.png)
## ಡೋನಟ್ಸ್!
ಒಂದು ಸ್ವಲ್ಪ ಹೆಚ್ಚು ದೃಶ್ಯಾತ್ಮಕವಾಗಿ ಆಸಕ್ತಿದಾಯಕ ಪೈ ಚಾರ್ಟ್ ಡೋನಟ್ ಚಾರ್ಟ್ ಆಗಿದೆ, ಇದು ಮಧ್ಯದಲ್ಲಿ ರಂಧ್ರವಿರುವ ಪೈ ಚಾರ್ಟ್. ಈ ವಿಧಾನವನ್ನು ಬಳಸಿ ನಮ್ಮ ಡೇಟಾವನ್ನು ನೋಡೋಣ.
ಮಶ್ರೂಮ್ ಬೆಳೆಯುವ ವಿವಿಧ ವಾಸಸ್ಥಳಗಳನ್ನು ನೋಡಿ:
```r
library(dplyr)
habitat=mushrooms %>%
group_by(habitat) %>%
summarise(count=n())
View(habitat)
```
ಫಲಿತಾಂಶ:
| ವಾಸಸ್ಥಳ | ಎಣಿಕೆ |
| --------- | --------- |
| ಹುಲ್ಲುಗಳು | 2148 |
| ಎಲೆಗಳು | 832 |
| ಮೇದಾನಗಳು | 292 |
| ದಾರಿಗಳು | 1144 |
| ನಗರ | 368 |
| ತ್ಯಾಜ್ಯ | 192 |
| ಮರ | 3148 |
ಇಲ್ಲಿ, ನೀವು ನಿಮ್ಮ ಡೇಟಾವನ್ನು ವಾಸಸ್ಥಳದ ಪ್ರಕಾರ ಗುಂಪುಮಾಡುತ್ತಿದ್ದೀರಿ. 7 ವಾಸಸ್ಥಳಗಳಿವೆ, ಅವುಗಳನ್ನು ನಿಮ್ಮ ಡೋನಟ್ ಚಾರ್ಟ್ ಲೇಬಲ್ಗಾಗಿ ಬಳಸಿ:
```r
library(ggplot2)
library(webr)
PieDonut(habitat, aes(habitat, count=count))
```
![donut chart](../../../../../translated_images/donut-wb.34e6fb275da9d834c2205145e39a3de9b6878191dcdba6f7a9e85f4b520449bc.kn.png)
ಈ ಕೋಡ್ ಎರಡು ಲೈಬ್ರರಿಗಳನ್ನು ಬಳಸುತ್ತದೆ - ggplot2 ಮತ್ತು webr. webr ಲೈಬ್ರರಿಯ PieDonut ಫಂಕ್ಷನ್ ಬಳಸಿ, ನಾವು ಸುಲಭವಾಗಿ ಡೋನಟ್ ಚಾರ್ಟ್ ರಚಿಸಬಹುದು!
R ನಲ್ಲಿ ಡೋನಟ್ ಚಾರ್ಟ್‌ಗಳನ್ನು ಕೇವಲ ggplot2 ಲೈಬ್ರರಿಯೊಂದಿಗೆ ಕೂಡ ಮಾಡಬಹುದು. ನೀವು ಅದನ್ನು [ಇಲ್ಲಿ](https://www.r-graph-gallery.com/128-ring-or-donut-plot.html) ಹೆಚ್ಚು ತಿಳಿದುಕೊಳ್ಳಬಹುದು ಮತ್ತು ಸ್ವತಃ ಪ್ರಯತ್ನಿಸಬಹುದು.
ನೀವು ಈಗ ನಿಮ್ಮ ಡೇಟಾವನ್ನು ಗುಂಪುಮಾಡುವುದು ಮತ್ತು ಅದನ್ನು ಪೈ ಅಥವಾ ಡೋನಟ್ ಆಗಿ ಪ್ರದರ್ಶಿಸುವುದನ್ನು ತಿಳಿದಿದ್ದೀರಿ, ನೀವು ಇತರ ಚಾರ್ಟ್ ಪ್ರಕಾರಗಳನ್ನು ಅನ್ವೇಷಿಸಬಹುದು. ವಾಫಲ್ ಚಾರ್ಟ್ ಅನ್ನು ಪ್ರಯತ್ನಿಸಿ, ಇದು ಪ್ರಮಾಣವನ್ನು ಅನ್ವೇಷಿಸುವ ಬೇರೆ ವಿಧಾನ.
## ವಾಫಲ್ಸ್!
'ವಾಫಲ್' ಪ್ರಕಾರದ ಚಾರ್ಟ್ ಒಂದು 2D ಚದರಗಳ ಸರಣಿಯಾಗಿ ಪ್ರಮಾಣಗಳನ್ನು ದೃಶ್ಯೀಕರಿಸುವ ಬೇರೆ ವಿಧಾನ. ಈ ಡೇಟಾಸೆಟ್‌ನ ಮಶ್ರೂಮ್ ಕ್ಯಾಪ್ ಬಣ್ಣಗಳ ವಿಭಿನ್ನ ಪ್ರಮಾಣಗಳನ್ನು ದೃಶ್ಯೀಕರಿಸಲು ಪ್ರಯತ್ನಿಸಿ. ಇದಕ್ಕಾಗಿ, ನೀವು [waffle](https://cran.r-project.org/web/packages/waffle/waffle.pdf) ಎಂಬ ಸಹಾಯಕ ಲೈಬ್ರರಿಯನ್ನು ಸ್ಥಾಪಿಸಿ ಅದನ್ನು ಬಳಸಿ ನಿಮ್ಮ ದೃಶ್ಯೀಕರಣವನ್ನು ರಚಿಸಬೇಕು:
```r
install.packages("waffle", repos = "https://cinc.rud.is")
```
ನಿಮ್ಮ ಡೇಟಾದ ಒಂದು ವಿಭಾಗವನ್ನು ಗುಂಪುಮಾಡಿ:
```r
library(dplyr)
cap_color=mushrooms %>%
group_by(cap.color) %>%
summarise(count=n())
View(cap_color)
```
ಲೇಬಲ್ಗಳನ್ನು ರಚಿಸಿ ನಂತರ ನಿಮ್ಮ ಡೇಟಾವನ್ನು ಗುಂಪುಮಾಡಿ ವಾಫಲ್ ಚಾರ್ಟ್ ರಚಿಸಿ:
```r
library(waffle)
names(cap_color$count) = paste0(cap_color$cap.color)
waffle((cap_color$count/10), rows = 7, title = "Waffle Chart")+scale_fill_manual(values=c("brown", "#F0DC82", "#D2691E", "green",
"pink", "purple", "red", "grey",
"yellow","white"))
```
ವಾಫಲ್ ಚಾರ್ಟ್ ಬಳಸಿ, ನೀವು ಈ ಮಶ್ರೂಮ್ ಡೇಟಾಸೆಟ್‌ನ ಕ್ಯಾಪ್ ಬಣ್ಣಗಳ ಪ್ರಮಾಣಗಳನ್ನು ಸ್ಪಷ್ಟವಾಗಿ ನೋಡಬಹುದು. ಆಸಕ್ತಿದಾಯಕವಾಗಿ, ಹಸಿರು ಕ್ಯಾಪ್ ಇರುವ ಮಶ್ರೂಮ್‌ಗಳು ಬಹಳಿವೆ!
![waffle chart](../../../../../translated_images/waffle.aaa75c5337735a6ef32ace0ffb6506ef49e5aefe870ffd72b1bb080f4843c217.kn.png)
ಈ ಪಾಠದಲ್ಲಿ, ನೀವು ಪ್ರಮಾಣಗಳನ್ನು ದೃಶ್ಯೀಕರಿಸುವ ಮೂರು ವಿಧಾನಗಳನ್ನು ಕಲಿತಿರಿ. ಮೊದಲು, ನಿಮ್ಮ ಡೇಟಾವನ್ನು ವರ್ಗಗಳಾಗಿ ಗುಂಪುಮಾಡಬೇಕು ಮತ್ತು ನಂತರ ಡೇಟಾವನ್ನು ಪ್ರದರ್ಶಿಸುವ ಅತ್ಯುತ್ತಮ ವಿಧಾನವನ್ನು ನಿರ್ಧರಿಸಬೇಕು - ಪೈ, ಡೋನಟ್ ಅಥವಾ ವಾಫಲ್. ಎಲ್ಲವೂ ರುಚಿಕರವಾಗಿವೆ ಮತ್ತು ಬಳಕೆದಾರರಿಗೆ ಡೇಟಾಸೆಟ್‌ನ ತಕ್ಷಣದ ದೃಶ್ಯವನ್ನು ನೀಡುತ್ತವೆ.
## 🚀 ಸವಾಲು
ಈ ರುಚಿಕರ ಚಾರ್ಟ್‌ಗಳನ್ನು [Charticulator](https://charticulator.com) ನಲ್ಲಿ ಪುನರಾವರ್ತಿಸಿ.
## [ಪೋಸ್ಟ್-ಪಾಠ ಪ್ರಶ್ನೋತ್ತರ](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/21)
## ವಿಮರ್ಶೆ ಮತ್ತು ಸ್ವಯಂ ಅಧ್ಯಯನ
ಯಾವಾಗ ಪೈ, ಡೋನಟ್ ಅಥವಾ ವಾಫಲ್ ಚಾರ್ಟ್ ಬಳಸಬೇಕೆಂದು ಸ್ಪಷ್ಟವಾಗದಿದ್ದಾಗ ಕೆಲವೊಂದು ಲೇಖನಗಳನ್ನು ಓದಿ:
https://www.beautiful.ai/blog/battle-of-the-charts-pie-chart-vs-donut-chart
https://medium.com/@hypsypops/pie-chart-vs-donut-chart-showdown-in-the-ring-5d24fd86a9ce
https://www.mit.edu/~mbarker/formula1/f1help/11-ch-c6.htm
https://medium.datadriveninvestor.com/data-visualization-done-the-right-way-with-tableau-waffle-chart-fdf2a19be402
ಈ ಸಂಕೀರ್ಣ ನಿರ್ಧಾರ ಕುರಿತು ಹೆಚ್ಚಿನ ಮಾಹಿತಿಗಾಗಿ ಸಂಶೋಧನೆ ಮಾಡಿ.
## ನಿಯೋಜನೆ
[Excel ನಲ್ಲಿ ಪ್ರಯತ್ನಿಸಿ](assignment.md)
---
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
**ಅಸ್ವೀಕರಣ**:
ಈ ದಸ್ತಾವೇಜು AI ಅನುವಾದ ಸೇವೆ [Co-op Translator](https://github.com/Azure/co-op-translator) ಬಳಸಿ ಅನುವಾದಿಸಲಾಗಿದೆ. ನಾವು ನಿಖರತೆಯಿಗಾಗಿ ಪ್ರಯತ್ನಿಸುತ್ತಿದ್ದರೂ, ಸ್ವಯಂಚಾಲಿತ ಅನುವಾದಗಳಲ್ಲಿ ದೋಷಗಳು ಅಥವಾ ತಪ್ಪುಗಳು ಇರಬಹುದು ಎಂಬುದನ್ನು ದಯವಿಟ್ಟು ಗಮನಿಸಿ. ಮೂಲ ಭಾಷೆಯಲ್ಲಿರುವ ಮೂಲ ದಸ್ತಾವೇಜನ್ನು ಅಧಿಕೃತ ಮೂಲವೆಂದು ಪರಿಗಣಿಸಬೇಕು. ಮಹತ್ವದ ಮಾಹಿತಿಗಾಗಿ ವೃತ್ತಿಪರ ಮಾನವ ಅನುವಾದವನ್ನು ಶಿಫಾರಸು ಮಾಡಲಾಗುತ್ತದೆ. ಈ ಅನುವಾದ ಬಳಕೆಯಿಂದ ಉಂಟಾಗುವ ಯಾವುದೇ ತಪ್ಪು ಅರ್ಥಮಾಡಿಕೊಳ್ಳುವಿಕೆ ಅಥವಾ ತಪ್ಪು ವಿವರಣೆಗಳಿಗೆ ನಾವು ಹೊಣೆಗಾರರಾಗುವುದಿಲ್ಲ.
<!-- CO-OP TRANSLATOR DISCLAIMER END -->

@ -0,0 +1,179 @@
<!--
CO_OP_TRANSLATOR_METADATA:
{
"original_hash": "a33c5d4b4156a2b41788d8720b6f724c",
"translation_date": "2025-12-19T16:25:43+00:00",
"source_file": "3-Data-Visualization/R/12-visualization-relationships/README.md",
"language_code": "kn"
}
-->
# ಸಂಬಂಧಗಳನ್ನು ದೃಶ್ಯೀಕರಿಸುವುದು: ಜೇನುತುಪ್ಪ ಬಗ್ಗೆ ಎಲ್ಲವೂ 🍯
|![ [(@sketchthedocs)](https://sketchthedocs.dev) ಅವರ ಸ್ಕೆಚ್ ನೋಟ್ ](../../../sketchnotes/12-Visualizing-Relationships.png)|
|:---:|
|ಸಂಬಂಧಗಳನ್ನು ದೃಶ್ಯೀಕರಿಸುವುದು - _[@nitya](https://twitter.com/nitya) ಅವರ ಸ್ಕೆಚ್ ನೋಟ್_ |
ನಮ್ಮ ಸಂಶೋಧನೆಯ ಪ್ರಕೃತಿ ಕೇಂದ್ರೀಕೃತ ವಿಷಯವನ್ನು ಮುಂದುವರೆಸುತ್ತಾ, [ಯುನೈಟೆಡ್ ಸ್ಟೇಟ್ಸ್ ಡಿಪಾರ್ಟ್‌ಮೆಂಟ್ ಆಫ್ ಅಗ್ರಿಕಲ್ಚರ್](https://www.nass.usda.gov/About_NASS/index.php) ನಿಂದ ಪಡೆದ ಡೇಟಾಸೆಟ್ ಪ್ರಕಾರ ವಿವಿಧ ರೀತಿಯ ಜೇನುತುಪ್ಪಗಳ ನಡುವಿನ ಸಂಬಂಧಗಳನ್ನು ತೋರಿಸಲು ಆಸಕ್ತಿದಾಯಕ ದೃಶ್ಯೀಕರಣಗಳನ್ನು ಕಂಡುಹಿಡಿಯೋಣ.
ಈ ಸುಮಾರು 600 ಐಟಂಗಳ ಡೇಟಾಸೆಟ್ ಅಮೆರಿಕದ ಹಲವಾರು ರಾಜ್ಯಗಳಲ್ಲಿ ಜೇನುತುಪ್ಪ ಉತ್ಪಾದನೆಯನ್ನು ಪ್ರದರ್ಶಿಸುತ್ತದೆ. ಉದಾಹರಣೆಗೆ, ನೀವು ಪ್ರತಿ ರಾಜ್ಯದಲ್ಲಿ 1998-2012 ರವರೆಗೆ ಪ್ರತಿ ವರ್ಷಕ್ಕೆ ಒಂದು ಸಾಲಿನಲ್ಲಿ ಕಾಲೋನಿಗಳ ಸಂಖ್ಯೆ, ಪ್ರತಿ ಕಾಲೋನಿಗೆ ಉತ್ಪಾದನೆ, ಒಟ್ಟು ಉತ್ಪಾದನೆ, ಸ್ಟಾಕ್‌ಗಳು, ಪೌಂಡ್ ಪ್ರತಿ ಬೆಲೆ ಮತ್ತು ಉತ್ಪಾದನೆಯ ಮೌಲ್ಯವನ್ನು ನೋಡಬಹುದು.
ನೀವು ಒಂದು ರಾಜ್ಯದ ಪ್ರತಿ ವರ್ಷದ ಉತ್ಪಾದನೆ ಮತ್ತು ಉದಾಹರಣೆಗೆ ಆ ರಾಜ್ಯದಲ್ಲಿ ಜೇನುತುಪ್ಪದ ಬೆಲೆಯ ನಡುವಿನ ಸಂಬಂಧವನ್ನು ದೃಶ್ಯೀಕರಿಸುವುದು ಆಸಕ್ತಿದಾಯಕವಾಗಿರುತ್ತದೆ. ಬದಲಾಗಿ, ರಾಜ್ಯಗಳ ಜೇನುತುಪ್ಪದ ಪ್ರತಿ ಕಾಲೋನಿಗೆ ಉತ್ಪಾದನೆಯ ನಡುವಿನ ಸಂಬಂಧವನ್ನು ದೃಶ್ಯೀಕರಿಸಬಹುದು. ಈ ವರ್ಷಾವಧಿ 2006 ರಲ್ಲಿ ಮೊದಲ ಬಾರಿಗೆ ಕಂಡುಬಂದ 'CCD' ಅಥವಾ 'ಕಾಲೋನಿ ಕಾಲಾಪ್ಸ್ ಡಿಸಾರ್ಡರ್' (http://npic.orst.edu/envir/ccd.html) ನಾಶಕಾರಿ ಪರಿಣಾಮಗಳನ್ನು ಒಳಗೊಂಡಿದೆ, ಆದ್ದರಿಂದ ಇದು ಅಧ್ಯಯನಕ್ಕೆ ಸೂಕ್ತವಾದ ಡೇಟಾಸೆಟ್ ಆಗಿದೆ. 🐝
## [ಪೂರ್ವ-ಪಾಠ ಪ್ರಶ್ನೋತ್ತರ](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/22)
ಈ ಪಾಠದಲ್ಲಿ, ನೀವು ಹಿಂದಿನಂತೆ ಬಳಸಿದ ggplot2 ಅನ್ನು ವ್ಯತ್ಯಾಸಗಳ ನಡುವಿನ ಸಂಬಂಧಗಳನ್ನು ದೃಶ್ಯೀಕರಿಸಲು ಉತ್ತಮ ಗ್ರಂಥಾಲಯವಾಗಿ ಬಳಸಬಹುದು. ವಿಶೇಷವಾಗಿ ggplot2 ನ `geom_point` ಮತ್ತು `qplot` ಫಂಕ್ಷನ್‌ಗಳ ಬಳಕೆ ಆಸಕ್ತಿದಾಯಕವಾಗಿದೆ, ಇದು ಸ್ಕ್ಯಾಟರ್ ಪ್ಲಾಟ್‌ಗಳು ಮತ್ತು ಲೈನ್ ಪ್ಲಾಟ್‌ಗಳನ್ನು ತ್ವರಿತವಾಗಿ ದೃಶ್ಯೀಕರಿಸಲು ಅನುಮತಿಸುತ್ತದೆ, ಇದು ಡೇಟಾ ವಿಜ್ಞಾನಿಗೆ ವ್ಯತ್ಯಾಸಗಳು ಪರಸ್ಪರ ಹೇಗೆ ಸಂಬಂಧ ಹೊಂದಿವೆ ಎಂಬುದನ್ನು ಉತ್ತಮವಾಗಿ ಅರ್ಥಮಾಡಿಕೊಳ್ಳಲು ಸಹಾಯ ಮಾಡುತ್ತದೆ.
## ಸ್ಕ್ಯಾಟರ್ ಪ್ಲಾಟ್‌ಗಳು
ಪ್ರತಿ ರಾಜ್ಯದ ಪ್ರತಿ ವರ್ಷದ ಜೇನುತುಪ್ಪದ ಬೆಲೆ ಹೇಗೆ ಬದಲಾಗಿದೆ ಎಂಬುದನ್ನು ತೋರಿಸಲು ಸ್ಕ್ಯಾಟರ್ ಪ್ಲಾಟ್ ಬಳಸಿ. ggplot2, `ggplot` ಮತ್ತು `geom_point` ಬಳಸಿ, ರಾಜ್ಯದ ಡೇಟಾವನ್ನು ಗುಂಪುಮಾಡಿ ವರ್ಗೀಕೃತ ಮತ್ತು ಸಂಖ್ಯಾತ್ಮಕ ಡೇಟಾ ಎರಡಕ್ಕೂ ಡೇಟಾ ಪಾಯಿಂಟ್‌ಗಳನ್ನು ಪ್ರದರ್ಶಿಸುತ್ತದೆ.
ಡೇಟಾ ಮತ್ತು Seaborn ಅನ್ನು ಆಮದುಮಾಡುವುದರಿಂದ ಪ್ರಾರಂಭಿಸೋಣ:
```r
honey=read.csv('../../data/honey.csv')
head(honey)
```
ನೀವು ಗಮನಿಸುವಿರಿ ಜೇನುತುಪ್ಪ ಡೇಟಾದಲ್ಲಿ ವರ್ಷ ಮತ್ತು ಪೌಂಡ್ ಪ್ರತಿ ಬೆಲೆ ಸೇರಿದಂತೆ ಹಲವಾರು ಆಸಕ್ತಿದಾಯಕ ಕಾಲಮ್‌ಗಳಿವೆ. ಅಮೆರಿಕದ ರಾಜ್ಯಗಳ ಪ್ರಕಾರ ಈ ಡೇಟಾವನ್ನು ಗುಂಪುಮಾಡಿ ಅನ್ವೇಷಿಸೋಣ:
| state | numcol | yieldpercol | totalprod | stocks | priceperlb | prodvalue | year |
| ----- | ------ | ----------- | --------- | -------- | ---------- | --------- | ---- |
| AL | 16000 | 71 | 1136000 | 159000 | 0.72 | 818000 | 1998 |
| AZ | 55000 | 60 | 3300000 | 1485000 | 0.64 | 2112000 | 1998 |
| AR | 53000 | 65 | 3445000 | 1688000 | 0.59 | 2033000 | 1998 |
| CA | 450000 | 83 | 37350000 | 12326000 | 0.62 | 23157000 | 1998 |
| CO | 27000 | 72 | 1944000 | 1594000 | 0.7 | 1361000 | 1998 |
| FL | 230000 | 98 |22540000 | 4508000 | 0.64 | 14426000 | 1998 |
ಜೇನುತುಪ್ಪದ ಪೌಂಡ್ ಪ್ರತಿ ಬೆಲೆ ಮತ್ತು ಅದರ ಅಮೆರಿಕದ ರಾಜ್ಯದ ಮೂಲದ ನಡುವಿನ ಸಂಬಂಧವನ್ನು ತೋರಿಸಲು ಮೂಲಭೂತ ಸ್ಕ್ಯಾಟರ್ ಪ್ಲಾಟ್ ರಚಿಸಿ. ಎಲ್ಲಾ ರಾಜ್ಯಗಳನ್ನು ಪ್ರದರ್ಶಿಸಲು `y` ಅಕ್ಷವನ್ನು ಎತ್ತರವಾಗಿ ಮಾಡಿ:
```r
library(ggplot2)
ggplot(honey, aes(x = priceperlb, y = state)) +
geom_point(colour = "blue")
```
![scatterplot 1](../../../../../translated_images/scatter1.86b8900674d88b26dd3353a83fe604e9ab3722c4680cc40ee9beb452ff02cdea.kn.png)
ಈಗ, ವರ್ಷಗಳ ಪ್ರಗತಿಯನ್ನು ತೋರಿಸಲು ಜೇನುತುಪ್ಪ ಬಣ್ಣದ ಸ್ಕೀಮ್ ಬಳಸಿ ಅದೇ ಡೇಟಾವನ್ನು ತೋರಿಸಿ. ವರ್ಷದಿಂದ ವರ್ಷಕ್ಕೆ ಬದಲಾವಣೆಯನ್ನು ತೋರಿಸಲು 'scale_color_gradientn' ಪರಿಮಾಣವನ್ನು ಸೇರಿಸಬಹುದು:
> ✅ [scale_color_gradientn](https://www.rdocumentation.org/packages/ggplot2/versions/0.9.1/topics/scale_colour_gradientn) ಬಗ್ಗೆ ಇನ್ನಷ್ಟು ತಿಳಿದುಕೊಳ್ಳಿ - ಸುಂದರವಾದ ರೇನ್ಬೋ ಬಣ್ಣದ ಸ್ಕೀಮ್ ಪ್ರಯತ್ನಿಸಿ!
```r
ggplot(honey, aes(x = priceperlb, y = state, color=year)) +
geom_point()+scale_color_gradientn(colours = colorspace::heat_hcl(7))
```
![scatterplot 2](../../../../../translated_images/scatter2.4d1cbc693bad20e2b563888747eb6bdf65b73ce449d903f7cd4068a78502dcff.kn.png)
ಈ ಬಣ್ಣದ ಸ್ಕೀಮ್ ಬದಲಾವಣೆಯಿಂದ, ಜೇನುತುಪ್ಪದ ಪೌಂಡ್ ಪ್ರತಿ ಬೆಲೆಯು ವರ್ಷದಿಂದ ವರ್ಷಕ್ಕೆ ಸ್ಪಷ್ಟವಾಗಿ ಹೆಚ್ಚುತ್ತಿರುವುದು ಕಾಣುತ್ತದೆ. ನಿಜವಾಗಿಯೂ, ಡೇಟಾದ ಒಂದು ಮಾದರಿ ಸೆಟ್ (ಉದಾಹರಣೆಗೆ ಅರೆಜೋನಾದ ಒಂದು ರಾಜ್ಯ) ನೋಡಿದರೆ, ವರ್ಷದಿಂದ ವರ್ಷಕ್ಕೆ ಬೆಲೆ ಏರಿಕೆಯ ಮಾದರಿಯನ್ನು ಕಾಣಬಹುದು, ಕೆಲವೊಂದು ಹೊರತುಪಡಿಸಿ:
| state | numcol | yieldpercol | totalprod | stocks | priceperlb | prodvalue | year |
| ----- | ------ | ----------- | --------- | ------- | ---------- | --------- | ---- |
| AZ | 55000 | 60 | 3300000 | 1485000 | 0.64 | 2112000 | 1998 |
| AZ | 52000 | 62 | 3224000 | 1548000 | 0.62 | 1999000 | 1999 |
| AZ | 40000 | 59 | 2360000 | 1322000 | 0.73 | 1723000 | 2000 |
| AZ | 43000 | 59 | 2537000 | 1142000 | 0.72 | 1827000 | 2001 |
| AZ | 38000 | 63 | 2394000 | 1197000 | 1.08 | 2586000 | 2002 |
| AZ | 35000 | 72 | 2520000 | 983000 | 1.34 | 3377000 | 2003 |
| AZ | 32000 | 55 | 1760000 | 774000 | 1.11 | 1954000 | 2004 |
| AZ | 36000 | 50 | 1800000 | 720000 | 1.04 | 1872000 | 2005 |
| AZ | 30000 | 65 | 1950000 | 839000 | 0.91 | 1775000 | 2006 |
| AZ | 30000 | 64 | 1920000 | 902000 | 1.26 | 2419000 | 2007 |
| AZ | 25000 | 64 | 1600000 | 336000 | 1.26 | 2016000 | 2008 |
| AZ | 20000 | 52 | 1040000 | 562000 | 1.45 | 1508000 | 2009 |
| AZ | 24000 | 77 | 1848000 | 665000 | 1.52 | 2809000 | 2010 |
| AZ | 23000 | 53 | 1219000 | 427000 | 1.55 | 1889000 | 2011 |
| AZ | 22000 | 46 | 1012000 | 253000 | 1.79 | 1811000 | 2012 |
ಬಣ್ಣದ ಬದಲು ಗಾತ್ರವನ್ನು ಬಳಸಿ ಈ ಪ್ರಗತಿಯನ್ನು ದೃಶ್ಯೀಕರಿಸುವ ಮತ್ತೊಂದು ವಿಧಾನ ಇದೆ. ಬಣ್ಣದ ದೃಷ್ಟಿ ಸಮಸ್ಯೆ ಇರುವ ಬಳಕೆದಾರರಿಗೆ ಇದು ಉತ್ತಮ ಆಯ್ಕೆಯಾಗಬಹುದು. ಬೆಲೆಯ ಏರಿಕೆಯನ್ನು ಬಿಂದುಗಳ ವೃತ್ತಾಕಾರದ ವಿಸ್ತಾರದಲ್ಲಿ ತೋರಿಸಲು ನಿಮ್ಮ ದೃಶ್ಯೀಕರಣವನ್ನು ಸಂಪಾದಿಸಿ:
```r
ggplot(honey, aes(x = priceperlb, y = state)) +
geom_point(aes(size = year),colour = "blue") +
scale_size_continuous(range = c(0.25, 3))
```
ನೀವು ಬಿಂದುಗಳ ಗಾತ್ರ ಕ್ರಮೇಣ ಹೆಚ್ಚುತ್ತಿರುವುದನ್ನು ಕಾಣಬಹುದು.
![scatterplot 3](../../../../../translated_images/scatter3.722d21e6f20b3ea2e18339bb9b10d75906126715eb7d5fdc88fe74dcb6d7066a.kn.png)
ಇದು ಸರಳ ಸರಬರಾಜು ಮತ್ತು ಬೇಡಿಕೆ ಪ್ರಕರಣವೇ? ಹವಾಮಾನ ಬದಲಾವಣೆ ಮತ್ತು ಕಾಲೋನಿ ಕಾಲಾಪ್ಸ್ ಮುಂತಾದ ಕಾರಣಗಳಿಂದ, ವರ್ಷದಿಂದ ವರ್ಷಕ್ಕೆ ಖರೀದಿಗೆ ಲಭ್ಯವಿರುವ ಜೇನುತುಪ್ಪ ಕಡಿಮೆಯಾಗುತ್ತಿದೆಯೇ, ಆದ್ದರಿಂದ ಬೆಲೆ ಏರುತ್ತಿದೆಯೇ?
ಈ ಡೇಟಾಸೆಟ್‌ನ ಕೆಲವು ವ್ಯತ್ಯಾಸಗಳ ನಡುವಿನ ಸಂಬಂಧವನ್ನು ಕಂಡುಹಿಡಿಯಲು, ಕೆಲವು ಲೈನ್ ಚಾರ್ಟ್‌ಗಳನ್ನು ಅನ್ವೇಷಿಸೋಣ.
## ಲೈನ್ ಚಾರ್ಟ್‌ಗಳು
ಪ್ರಶ್ನೆ: ಜೇನುತುಪ್ಪದ ಪೌಂಡ್ ಪ್ರತಿ ಬೆಲೆಯು ವರ್ಷದಿಂದ ವರ್ಷಕ್ಕೆ ಸ್ಪಷ್ಟವಾಗಿ ಏರಿದೆಯೇ? ನೀವು ಇದನ್ನು ಸುಲಭವಾಗಿ ಕಂಡುಹಿಡಿಯಬಹುದು ಒಂದು ಲೈನ್ ಚಾರ್ಟ್ ರಚಿಸುವ ಮೂಲಕ:
```r
qplot(honey$year,honey$priceperlb, geom='smooth', span =0.5, xlab = "year",ylab = "priceperlb")
```
ಉತ್ತರ: ಹೌದು, 2003 ರ ಸುತ್ತಲೂ ಕೆಲವು ಹೊರತುಪಡಿಸಿ:
![line chart 1](../../../../../translated_images/line1.299b576fbb2a59e60a59e7130030f59836891f90302be084e4e8d14da0562e2a.kn.png)
ಪ್ರಶ್ನೆ: 2003 ರಲ್ಲಿ ಜೇನುತುಪ್ಪದ ಸರಬರಾಜಿನಲ್ಲಿ ಏರಿಕೆಯನ್ನು ನೋಡಬಹುದೇ? ಒಟ್ಟು ಉತ್ಪಾದನೆಯನ್ನು ವರ್ಷದಿಂದ ವರ್ಷಕ್ಕೆ ನೋಡಿದರೆ?
```python
qplot(honey$year,honey$totalprod, geom='smooth', span =0.5, xlab = "year",ylab = "totalprod")
```
![line chart 2](../../../../../translated_images/line2.3b18fcda7176ceba5b6689eaaabb817d49c965e986f11cac1ae3f424030c34d8.kn.png)
ಉತ್ತರ: ಅಷ್ಟು ಅಲ್ಲ. ಒಟ್ಟು ಉತ್ಪಾದನೆಯನ್ನು ನೋಡಿದರೆ, ಆ ವಿಶೇಷ ವರ್ಷದಲ್ಲಿ ಅದು ಹೆಚ್ಚಿದಂತೆ ತೋರುತ್ತದೆ, ಆದರೂ ಸಾಮಾನ್ಯವಾಗಿ ಈ ವರ್ಷಗಳಲ್ಲಿ ಜೇನುತುಪ್ಪದ ಉತ್ಪಾದನೆ ಕಡಿಮೆಯಾಗುತ್ತಿದೆ.
ಪ್ರಶ್ನೆ: ಆ ಸಂದರ್ಭದಲ್ಲಿ, 2003 ರ ಸುತ್ತಲೂ ಜೇನುತುಪ್ಪದ ಬೆಲೆಯ ಏರಿಕೆಗೆ ಕಾರಣವೇನು?
ಇದನ್ನು ಕಂಡುಹಿಡಿಯಲು, ನೀವು ಫೇಸಟ್ ಗ್ರಿಡ್ ಅನ್ನು ಅನ್ವೇಷಿಸಬಹುದು.
## ಫೇಸಟ್ ಗ್ರಿಡ್‌ಗಳು
ಫೇಸಟ್ ಗ್ರಿಡ್ ನಿಮ್ಮ ಡೇಟಾಸೆಟ್‌ನ ಒಂದು ಭಾಗವನ್ನು ತೆಗೆದುಕೊಳ್ಳುತ್ತದೆ (ನಮ್ಮ ಪ್ರಕರಣದಲ್ಲಿ, ನೀವು 'ವರ್ಷ' ಆಯ್ಕೆಮಾಡಬಹುದು ಹೆಚ್ಚು ಫೇಸಟ್‌ಗಳು ಉತ್ಪಾದನೆಯಾಗದಂತೆ). Seaborn ನಂತರ ಆಯ್ಕೆಮಾಡಿದ x ಮತ್ತು y ಸಂಯೋಜನೆಗಳ ಪ್ರತಿಯೊಂದು ಫೇಸಟ್‌ಗೆ ಪ್ಲಾಟ್ ರಚಿಸುತ್ತದೆ, ಇದರಿಂದ ಸುಲಭ ದೃಶ್ಯಾತ್ಮಕ ಹೋಲಿಕೆ ಸಾಧ್ಯವಾಗುತ್ತದೆ. 2003 ಈ ರೀತಿಯ ಹೋಲಿಕೆಯಲ್ಲಿ ಹೊರಹೊಮ್ಮುತ್ತದೆಯೇ?
[ggplot2 ನ ಡಾಕ್ಯುಮೆಂಟೇಶನ್](https://ggplot2.tidyverse.org/reference/facet_wrap.html) ಪ್ರಕಾರ `facet_wrap` ಬಳಸಿ ಫೇಸಟ್ ಗ್ರಿಡ್ ರಚಿಸಿ.
```r
ggplot(honey, aes(x=yieldpercol, y = numcol,group = 1)) +
geom_line() + facet_wrap(vars(year))
```
ಈ ದೃಶ್ಯೀಕರಣದಲ್ಲಿ, ನೀವು ವರ್ಷದಿಂದ ವರ್ಷಕ್ಕೆ ಮತ್ತು ರಾಜ್ಯದಿಂದ ರಾಜ್ಯಕ್ಕೆ yield per colony ಮತ್ತು ಕಾಲೋನಿಗಳ ಸಂಖ್ಯೆಯನ್ನು ಪಕ್ಕಪಕ್ಕವಾಗಿ 3 ಕಾಲಮ್‌ಗಳೊಂದಿಗೆ ಹೋಲಿಸಬಹುದು:
![facet grid](../../../../../translated_images/facet.491ad90d61c2a7cc69b50c929f80786c749e38217ccedbf1e22ed8909b65987c.kn.png)
ಈ ಡೇಟಾಸೆಟ್‌ಗೆ, ಕಾಲೋನಿಗಳ ಸಂಖ್ಯೆ ಮತ್ತು ಅವರ ಉತ್ಪಾದನೆಯ ಕುರಿತು ವರ್ಷದಿಂದ ವರ್ಷಕ್ಕೆ ಮತ್ತು ರಾಜ್ಯದಿಂದ ರಾಜ್ಯಕ್ಕೆ ವಿಶೇಷವಾಗಿ ಏನೂ ಹೊರಹೊಮ್ಮುವುದಿಲ್ಲ. ಈ ಎರಡು ವ್ಯತ್ಯಾಸಗಳ ನಡುವಿನ ಸಂಬಂಧವನ್ನು ಕಂಡುಹಿಡಿಯಲು ಬೇರೆ ವಿಧಾನವಿದೆಯೇ?
## ಡ್ಯುಯಲ್-ಲೈನ್ ಪ್ಲಾಟ್‌ಗಳು
R ನ `par` ಮತ್ತು `plot` ಫಂಕ್ಷನ್ ಬಳಸಿ ಎರಡು ಲೈನ್ ಪ್ಲಾಟ್‌ಗಳನ್ನು ಒಟ್ಟಿಗೆ ಮ-superimpose ಮಾಡಿ ಬಹು-ಲೈನ್ ಪ್ಲಾಟ್ ಪ್ರಯತ್ನಿಸಿ. ನಾವು x ಅಕ್ಷದಲ್ಲಿ ವರ್ಷವನ್ನು ಮತ್ತು ಎರಡು y ಅಕ್ಷಗಳನ್ನು ಪ್ರದರ್ಶಿಸುವೆವು. ಆದ್ದರಿಂದ, yield per colony ಮತ್ತು ಕಾಲೋನಿಗಳ ಸಂಖ್ಯೆಯನ್ನು ಒಟ್ಟಿಗೆ ಪ್ರದರ್ಶಿಸಿ:
```r
par(mar = c(5, 4, 4, 4) + 0.3)
plot(honey$year, honey$numcol, pch = 16, col = 2,type="l")
par(new = TRUE)
plot(honey$year, honey$yieldpercol, pch = 17, col = 3,
axes = FALSE, xlab = "", ylab = "",type="l")
axis(side = 4, at = pretty(range(y2)))
mtext("colony yield", side = 4, line = 3)
```
![superimposed plots](../../../../../translated_images/dual-line.fc4665f360a54018d7df9bc6abcc26460112e17dcbda18d3b9ae6109b32b36c3.kn.png)
2003 ರ ಸುತ್ತಲೂ ಏನೂ ವಿಶೇಷವಾಗಿ ಗಮನ ಸೆಳೆಯದಿದ್ದರೂ, ಈ ಪಾಠವನ್ನು ಸ್ವಲ್ಪ ಸಂತೋಷಕರವಾಗಿ ಮುಗಿಸಲು ಇದು ಸಹಾಯ ಮಾಡುತ್ತದೆ: ಒಟ್ಟಾರೆ ಕಾಲೋನಿಗಳ ಸಂಖ್ಯೆ ಕಡಿಮೆಯಾಗುತ್ತಿದೆಯಾದರೂ, ಕಾಲೋನಿಗಳ ಸಂಖ್ಯೆ ಸ್ಥಿರವಾಗುತ್ತಿದೆ ಮತ್ತು ಅವರ yield per colony ಕಡಿಮೆಯಾಗುತ್ತಿದೆ.
ಹೋಗಿ, ಜೇನುಗಳು, ಹೋಗಿ!
🐝❤️
## 🚀 ಸವಾಲು
ಈ ಪಾಠದಲ್ಲಿ, ನೀವು ಸ್ಕ್ಯಾಟರ್ ಪ್ಲಾಟ್‌ಗಳು ಮತ್ತು ಲೈನ್ ಗ್ರಿಡ್‌ಗಳ ಇತರ ಬಳಕೆಗಳ ಬಗ್ಗೆ ಸ್ವಲ್ಪ ತಿಳಿದುಕೊಂಡಿದ್ದೀರಿ, ಫೇಸಟ್ ಗ್ರಿಡ್‌ಗಳ ಸಹಿತ. ಬೇರೆ ಡೇಟಾಸೆಟ್ ಬಳಸಿ ಫೇಸಟ್ ಗ್ರಿಡ್ ರಚಿಸುವ ಸವಾಲು ಸ್ವೀಕರಿಸಿ, ಬಹುಶಃ ನೀವು ಈ ಪಾಠಗಳ ಮೊದಲು ಬಳಸಿದ ಡೇಟಾಸೆಟ್. ಅವು ರಚಿಸಲು ಎಷ್ಟು ಸಮಯ ಬೇಕಾಗುತ್ತದೆ ಮತ್ತು ಈ ತಂತ್ರಗಳನ್ನು ಬಳಸಿ ಎಷ್ಟು ಗ್ರಿಡ್‌ಗಳನ್ನು ರಚಿಸಬೇಕೆಂದು ಎಚ್ಚರಿಕೆಯಿಂದ ಇರಬೇಕಾಗುತ್ತದೆ ಎಂಬುದನ್ನು ಗಮನಿಸಿ.
## [ಪೋಸ್ಟ್-ಪಾಠ ಪ್ರಶ್ನೋತ್ತರ](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/23)
## ವಿಮರ್ಶೆ ಮತ್ತು ಸ್ವಯಂ ಅಧ್ಯಯನ
ಲೈನ್ ಪ್ಲಾಟ್‌ಗಳು ಸರಳವಾಗಿರಬಹುದು ಅಥವಾ ಬಹಳ ಸಂಕೀರ್ಣವಾಗಿರಬಹುದು. ನೀವು ಅವುಗಳನ್ನು ಹೇಗೆ ರಚಿಸಬಹುದು ಎಂಬುದರ ಬಗ್ಗೆ [ggplot2 ಡಾಕ್ಯುಮೆಂಟೇಶನ್](https://ggplot2.tidyverse.org/reference/geom_path.html#:~:text=geom_line()%20connects%20them%20in,which%20cases%20are%20connected%20together) ನಲ್ಲಿ ಸ್ವಲ್ಪ ಓದಿಕೊಳ್ಳಿ. ಈ ಪಾಠದಲ್ಲಿ ನೀವು ರಚಿಸಿದ ಲೈನ್ ಚಾರ್ಟ್‌ಗಳನ್ನು ಡಾಕ್ಸ್‌ನಲ್ಲಿ ನೀಡಲಾದ ಇತರ ವಿಧಾನಗಳೊಂದಿಗೆ ಸುಧಾರಿಸಲು ಪ್ರಯತ್ನಿಸಿ.
## ನಿಯೋಜನೆ
[ಜೇನುಮಡಿಗೆ ಒಳಗೆ ನುಗ್ಗಿ](assignment.md)
---
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
**ಅಸ್ವೀಕರಣ**:
ಈ ದಸ್ತಾವೇಜು AI ಅನುವಾದ ಸೇವೆ [Co-op Translator](https://github.com/Azure/co-op-translator) ಬಳಸಿ ಅನುವಾದಿಸಲಾಗಿದೆ. ನಾವು ನಿಖರತೆಯಿಗಾಗಿ ಪ್ರಯತ್ನಿಸುತ್ತಿದ್ದರೂ, ಸ್ವಯಂಚಾಲಿತ ಅನುವಾದಗಳಲ್ಲಿ ತಪ್ಪುಗಳು ಅಥವಾ ಅಸತ್ಯತೆಗಳು ಇರಬಹುದು ಎಂದು ದಯವಿಟ್ಟು ಗಮನಿಸಿ. ಮೂಲ ಭಾಷೆಯಲ್ಲಿರುವ ಮೂಲ ದಸ್ತಾವೇಜನ್ನು ಅಧಿಕೃತ ಮೂಲವೆಂದು ಪರಿಗಣಿಸಬೇಕು. ಮಹತ್ವದ ಮಾಹಿತಿಗಾಗಿ ವೃತ್ತಿಪರ ಮಾನವ ಅನುವಾದವನ್ನು ಶಿಫಾರಸು ಮಾಡಲಾಗುತ್ತದೆ. ಈ ಅನುವಾದ ಬಳಕೆಯಿಂದ ಉಂಟಾಗುವ ಯಾವುದೇ ತಪ್ಪು ಅರ್ಥಮಾಡಿಕೊಳ್ಳುವಿಕೆ ಅಥವಾ ತಪ್ಪು ವಿವರಣೆಗಳಿಗೆ ನಾವು ಹೊಣೆಗಾರರಾಗುವುದಿಲ್ಲ.
<!-- CO-OP TRANSLATOR DISCLAIMER END -->

@ -0,0 +1,184 @@
<!--
CO_OP_TRANSLATOR_METADATA:
{
"original_hash": "b4039f1c76548d144a0aee0bf28304ec",
"translation_date": "2025-12-19T16:39:52+00:00",
"source_file": "3-Data-Visualization/R/13-meaningful-vizualizations/README.md",
"language_code": "kn"
}
-->
# ಅರ್ಥಪೂರ್ಣ ದೃಶ್ಯೀಕರಣಗಳನ್ನು ಮಾಡುವುದು
|![ [(@sketchthedocs)](https://sketchthedocs.dev) ಅವರಿಂದ ಸ್ಕೆಚ್ ನೋಟ್ ](../../../sketchnotes/13-MeaningfulViz.png)|
|:---:|
| ಅರ್ಥಪೂರ್ಣ ದೃಶ್ಯೀಕರಣಗಳು - _[@nitya](https://twitter.com/nitya) ಅವರಿಂದ ಸ್ಕೆಚ್ ನೋಟ್_ |
> "ನೀವು ಡೇಟಾವನ್ನು ಸಾಕಷ್ಟು ಕಾಲ ಹಿಂಸಿಸಿದರೆ, ಅದು ಯಾವುದಕ್ಕೂ ಒಪ್ಪಿಕೊಳ್ಳುತ್ತದೆ" -- [ರೋನಾಲ್ಡ್ ಕೋಸ್](https://en.wikiquote.org/wiki/Ronald_Coase)
ಡೇಟಾ ವಿಜ್ಞಾನಿಯ ಮೂಲ ಕೌಶಲ್ಯಗಳಲ್ಲಿ ಒಂದಾಗಿದೆ ಅರ್ಥಪೂರ್ಣ ಡೇಟಾ ದೃಶ್ಯೀಕರಣವನ್ನು ಸೃಷ್ಟಿಸುವ ಸಾಮರ್ಥ್ಯ, ಇದು ನೀವು ಹೊಂದಿರುವ ಪ್ರಶ್ನೆಗಳಿಗೆ ಉತ್ತರ ನೀಡಲು ಸಹಾಯ ಮಾಡುತ್ತದೆ. ನಿಮ್ಮ ಡೇಟಾವನ್ನು ದೃಶ್ಯೀಕರಿಸುವ ಮೊದಲು, ನೀವು ಅದನ್ನು ಸ್ವಚ್ಛಗೊಳಿಸಿ ಸಿದ್ಧಪಡಿಸಿರುವುದನ್ನು ಖಚಿತಪಡಿಸಿಕೊಳ್ಳಬೇಕು, ನೀವು ಹಿಂದಿನ ಪಾಠಗಳಲ್ಲಿ ಮಾಡಿದಂತೆ. ಅದಾದ ನಂತರ, ನೀವು ಡೇಟಾವನ್ನು ಹೇಗೆ ಉತ್ತಮವಾಗಿ ಪ್ರದರ್ಶಿಸಬಹುದು ಎಂದು ನಿರ್ಧರಿಸಬಹುದು.
ಈ ಪಾಠದಲ್ಲಿ, ನೀವು ಪರಿಶೀಲಿಸುವಿರಿ:
1. ಸರಿಯಾದ ಚಾರ್ಟ್ ಪ್ರಕಾರವನ್ನು ಹೇಗೆ ಆಯ್ಕೆಮಾಡುವುದು
2. ಮೋಸಮಯ ಚಾರ್ಟಿಂಗ್ ಅನ್ನು ಹೇಗೆ ತಪ್ಪಿಸುವುದು
3. ಬಣ್ಣದೊಂದಿಗೆ ಹೇಗೆ ಕೆಲಸ ಮಾಡುವುದು
4. ಓದಲು ಸುಲಭವಾಗುವಂತೆ ನಿಮ್ಮ ಚಾರ್ಟ್‌ಗಳನ್ನು ಹೇಗೆ ಶೈಲಿಮಾಡುವುದು
5. ಅನಿಮೇಟೆಡ್ ಅಥವಾ 3D ಚಾರ್ಟಿಂಗ್ ಪರಿಹಾರಗಳನ್ನು ಹೇಗೆ ನಿರ್ಮಿಸುವುದು
6. ಸೃಜನಾತ್ಮಕ ದೃಶ್ಯೀಕರಣವನ್ನು ಹೇಗೆ ನಿರ್ಮಿಸುವುದು
## [ಪೂರ್ವ-ಪಾಠ ಕ್ವಿಜ್](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/24)
## ಸರಿಯಾದ ಚಾರ್ಟ್ ಪ್ರಕಾರವನ್ನು ಆಯ್ಕೆಮಾಡಿ
ಹಿಂದಿನ ಪಾಠಗಳಲ್ಲಿ, ನೀವು Matplotlib ಮತ್ತು Seaborn ಬಳಸಿ ವಿವಿಧ ರಕಮದ ಆಸಕ್ತಿದಾಯಕ ಡೇಟಾ ದೃಶ್ಯೀಕರಣಗಳನ್ನು ನಿರ್ಮಿಸುವ ಪ್ರಯೋಗ ಮಾಡಿದ್ದೀರಿ. ಸಾಮಾನ್ಯವಾಗಿ, ನೀವು ಕೇಳುತ್ತಿರುವ ಪ್ರಶ್ನೆಗೆ ಸರಿಯಾದ ಚಾರ್ಟ್ ಪ್ರಕಾರವನ್ನು ಈ ಟೇಬಲ್ ಬಳಸಿ ಆಯ್ಕೆಮಾಡಬಹುದು:
| ನೀವು ಬೇಕಾದದ್ದು: | ನೀವು ಬಳಸಬೇಕು: |
| -------------------------- | ----------------------------- |
| ಸಮಯದೊಂದಿಗೆ ಡೇಟಾ ಪ್ರವೃತ್ತಿಗಳನ್ನು ತೋರಿಸಿ | ಲೈನ್ |
| ವರ್ಗಗಳನ್ನು ಹೋಲಿಸಿ | ಬಾರ್, ಪೈ |
| ಒಟ್ಟುಗಳನ್ನು ಹೋಲಿಸಿ | ಪೈ, ಸ್ಟ್ಯಾಕ್ಡ್ ಬಾರ್ |
| ಸಂಬಂಧಗಳನ್ನು ತೋರಿಸಿ | ಸ್ಕ್ಯಾಟರ್, ಲೈನ್, ಫೇಸಟ್, ಡ್ಯುಯಲ್ ಲೈನ್ |
| ವಿತರಣೆಗಳನ್ನು ತೋರಿಸಿ | ಸ್ಕ್ಯಾಟರ್, ಹಿಸ್ಟೋಗ್ರಾಮ್, ಬಾಕ್ಸ್ |
| ಅನುಪಾತಗಳನ್ನು ತೋರಿಸಿ | ಪೈ, ಡೋನಟ್, ವಾಫಲ್ |
> ✅ ನಿಮ್ಮ ಡೇಟಾದ ರಚನೆಯ ಮೇಲೆ ಅವಲಂಬಿಸಿ, ನೀವು ಡೇಟಾವನ್ನು ಪಠ್ಯದಿಂದ ಸಂಖ್ಯಾತ್ಮಕಕ್ಕೆ ಪರಿವರ್ತಿಸಲು ಅಗತ್ಯವಿರಬಹುದು, ನಿರ್ದಿಷ್ಟ ಚಾರ್ಟ್ ಅದನ್ನು ಬೆಂಬಲಿಸಲು.
## ಮೋಸ ತಪ್ಪಿಸಿ
ಒಂದು ಡೇಟಾ ವಿಜ್ಞಾನಿ ಸರಿಯಾದ ಡೇಟಾ ಗೆ ಸರಿಯಾದ ಚಾರ್ಟ್ ಆಯ್ಕೆಮಾಡಿದರೂ ಸಹ, ಡೇಟಾವನ್ನು ತೋರಿಸುವ ಹಲವು ಮಾರ್ಗಗಳಿವೆ, ಅವು ಡೇಟಾವನ್ನು ಹಾಳುಮಾಡುವ ಬೆಲೆಗಾಗಿ ಒಂದು ವಿಷಯವನ್ನು ಸಾಬೀತುಪಡಿಸಲು. ಮೋಸಮಯ ಚಾರ್ಟ್‌ಗಳು ಮತ್ತು ಇನ್ಫೋಗ್ರಾಫಿಕ್ಸ್‌ಗಳ ಅನೇಕ ಉದಾಹರಣೆಗಳಿವೆ!
[![ಅಲ್ಬೆರ್ಟೋ ಕೈರೋ ಅವರ "ಹೌ ಚಾರ್ಟ್ಸ್ ಲೈ"](../../../../../translated_images/tornado.2880ffc7f135f82b5e5328624799010abefd1080ae4b7ecacbdc7d792f1d8849.kn.png)](https://www.youtube.com/watch?v=oX74Nge8Wkw "ಹೌ ಚಾರ್ಟ್ಸ್ ಲೈ")
> 🎥 ಮೇಲಿನ ಚಿತ್ರವನ್ನು ಕ್ಲಿಕ್ ಮಾಡಿ ಮೋಸಮಯ ಚಾರ್ಟ್‌ಗಳ ಬಗ್ಗೆ ಸಮ್ಮೇಳನ ಮಾತುಕತೆ ನೋಡಿರಿ
ಈ ಚಾರ್ಟ್ X ಅಕ್ಷವನ್ನು ತಿರುಗಿಸಿ ಸತ್ಯದ ವಿರುದ್ಧ ತೋರಿಸುತ್ತದೆ, ದಿನಾಂಕ ಆಧಾರಿತ:
![ಕೆಟ್ಟ ಚಾರ್ಟ್ 1](../../../../../translated_images/bad-chart-1.596bc93425a8ac301a28b8361f59a970276e7b961658ce849886aa1fed427341.kn.png)
[ಈ ಚಾರ್ಟ್](https://media.firstcoastnews.com/assets/WTLV/images/170ae16f-4643-438f-b689-50d66ca6a8d8/170ae16f-4643-438f-b689-50d66ca6a8d8_1140x641.jpg) ಇನ್ನೂ ಹೆಚ್ಚು ಮೋಸಮಯವಾಗಿದೆ, ಕಣ್ಣು ಬಲಕ್ಕೆ ಸೆಳೆಯುತ್ತದೆ ಮತ್ತು ಸಮಯದೊಂದಿಗೆ COVID ಪ್ರಕರಣಗಳು ವಿವಿಧ ಜಿಲ್ಲೆಗಳಲ್ಲಿ ಕಡಿಮೆಯಾದಂತೆ ತೋರುತ್ತದೆ. ನಿಜವಾಗಿ, ದಿನಾಂಕಗಳನ್ನು ಗಮನದಿಂದ ನೋಡಿದರೆ, ಅವು ಮೋಸಮಯ ಇಳಿಜಾರಿನ ಪ್ರವೃತ್ತಿಯನ್ನು ನೀಡಲು ಮರುಕ್ರಮಿಸಲಾಗಿದೆ.
![ಕೆಟ್ಟ ಚಾರ್ಟ್ 2](../../../../../translated_images/bad-chart-2.62edf4d2f30f4e519f5ef50c07ce686e27b0196a364febf9a4d98eecd21f9f60.kn.jpg)
ಈ ಪ್ರಸಿದ್ಧ ಉದಾಹರಣೆ ಬಣ್ಣ ಮತ್ತು ತಿರುಗಿದ Y ಅಕ್ಷವನ್ನು ಬಳಸಿಕೊಂಡು ಮೋಸ ಮಾಡುತ್ತದೆ: ಗನ್-ಸ್ನೇಹಿ ಕಾನೂನುಗಳ ಅಂಗೀಕಾರದ ನಂತರ ಗನ್ ಸಾವುಗಳು ಏರಿಕೆಯಾಗಿವೆ ಎಂದು ನಿರ್ಣಯಿಸುವ ಬದಲು, ಕಣ್ಣು ವಿರುದ್ಧವನ್ನು ನಂಬುವಂತೆ ಮಾಡುತ್ತದೆ:
![ಕೆಟ್ಟ ಚಾರ್ಟ್ 3](../../../../../translated_images/bad-chart-3.e201e2e915a230bc2cde289110604ec9abeb89be510bd82665bebc1228258972.kn.jpg)
ಈ ವಿಚಿತ್ರ ಚಾರ್ಟ್ ಅನುಪಾತವನ್ನು ಹೇಗೆ ಮ್ಯಾನಿಪ್ಯುಲೇಟ್ ಮಾಡಬಹುದು ಎಂಬುದನ್ನು ಹಾಸ್ಯಾಸ್ಪದ ಪರಿಣಾಮದೊಂದಿಗೆ ತೋರಿಸುತ್ತದೆ:
![ಕೆಟ್ಟ ಚಾರ್ಟ್ 4](../../../../../translated_images/bad-chart-4.8872b2b881ffa96c3e0db10eb6aed7793efae2cac382c53932794260f7bfff07.kn.jpg)
ತೂಕಮಾಡಲಾಗದ ವಸ್ತುಗಳನ್ನು ಹೋಲಿಸುವುದು ಇನ್ನೊಂದು ಅನುಮಾನಾಸ್ಪದ ತಂತ್ರ. 'ಸ್ಪ್ಯೂರಿಯಸ್ ಕೊರಿಲೇಶನ್ಸ್' ಬಗ್ಗೆ ಒಂದು [ಅದ್ಭುತ ವೆಬ್ ಸೈಟ್](https://tylervigen.com/spurious-correlations) ಇದೆ, ಇದು ಮೇನ್‌ನ ವಿಚ್ಛೇದನ ದರ ಮತ್ತು ಮಾರ್ಜರಿನ್ ಬಳಕೆಯಂತಹ ವಿಷಯಗಳನ್ನು ಹೊಂದಿರುವ 'ವಾಸ್ತವಗಳನ್ನು' ತೋರಿಸುತ್ತದೆ. ರೆಡ್ಡಿಟ್ ಗುಂಪು ಕೂಡ ಡೇಟಾ ಬಳಕೆಯ [ಕಿರುಕುಳಗಳನ್ನು](https://www.reddit.com/r/dataisugly/top/?t=all) ಸಂಗ್ರಹಿಸುತ್ತದೆ.
ಮೋಸಮಯ ಚಾರ್ಟ್‌ಗಳಿಂದ ಕಣ್ಣು ಎಷ್ಟು ಸುಲಭವಾಗಿ ಮೋಸಗೊಳ್ಳಬಹುದು ಎಂಬುದನ್ನು ಅರ್ಥಮಾಡಿಕೊಳ್ಳುವುದು ಮುಖ್ಯ. ಡೇಟಾ ವಿಜ್ಞಾನಿಯ ಉದ್ದೇಶ ಉತ್ತಮವಾದರೂ ಸಹ, ಪೈ ಚಾರ್ಟ್‌ನಲ್ಲಿ ಬಹಳಷ್ಟು ವರ್ಗಗಳನ್ನು ತೋರಿಸುವಂತಹ ಕೆಟ್ಟ ಚಾರ್ಟ್ ಆಯ್ಕೆ ಮೋಸಮಯವಾಗಬಹುದು.
## ಬಣ್ಣ
ಮೇಲಿನ 'ಫ್ಲೋರಿಡಾ ಗನ್ ಹಿಂಸಾಚಾರ' ಚಾರ್ಟ್‌ನಲ್ಲಿ ನೀವು ನೋಡಿದಂತೆ, ಬಣ್ಣವು ಚಾರ್ಟ್‌ಗಳಿಗೆ ಹೆಚ್ಚುವರಿ ಅರ್ಥದ ಪದರವನ್ನು ನೀಡಬಹುದು, ವಿಶೇಷವಾಗಿ ggplot2 ಮತ್ತು RColorBrewer ಮುಂತಾದ ಗ್ರಂಥಾಲಯಗಳನ್ನು ಬಳಸದೆ ಕೈಯಿಂದ ಚಾರ್ಟ್ ಮಾಡುತ್ತಿದ್ದರೆ. ನೀವು ಕೈಯಿಂದ ಚಾರ್ಟ್ ಮಾಡುತ್ತಿದ್ದರೆ, [ಬಣ್ಣ ಸಿದ್ಧಾಂತ](https://colormatters.com/color-and-design/basic-color-theory) ಬಗ್ಗೆ ಸ್ವಲ್ಪ ಅಧ್ಯಯನ ಮಾಡಿ.
> ✅ ಚಾರ್ಟ್ ವಿನ್ಯಾಸ ಮಾಡುವಾಗ, ಪ್ರವೇಶಾರ್ಹತೆ ದೃಶ್ಯೀಕರಣದ ಪ್ರಮುಖ ಅಂಶವಾಗಿದೆ ಎಂದು ಗಮನಿಸಿ. ನಿಮ್ಮ ಬಳಕೆದಾರರಲ್ಲಿ ಕೆಲವರು ಬಣ್ಣ ಅಂಧರಾಗಿರಬಹುದು - ನಿಮ್ಮ ಚಾರ್ಟ್ ದೃಷ್ಟಿ ಅಶಕ್ತರ ಬಳಕೆದಾರರಿಗೆ ಚೆನ್ನಾಗಿ ತೋರಿಸುತ್ತದೆಯೇ?
ನಿಮ್ಮ ಚಾರ್ಟ್‌ಗೆ ಬಣ್ಣಗಳನ್ನು ಆಯ್ಕೆಮಾಡುವಾಗ ಜಾಗರೂಕವಾಗಿರಿ, ಏಕೆಂದರೆ ಬಣ್ಣವು ನೀವು ಉದ್ದೇಶಿಸದ ಅರ್ಥವನ್ನು ನೀಡಬಹುದು. ಮೇಲಿನ 'ಎತ್ತರ' ಚಾರ್ಟ್‌ನ 'ಪಿಂಕ್ ಲೇಡೀಸ್' ಸ್ಪಷ್ಟವಾಗಿ 'ಸ್ತ್ರೀಯ' ಅರ್ಥವನ್ನು ನೀಡುತ್ತವೆ, ಇದು ಚಾರ್ಟ್‌ನ ವಿಚಿತ್ರತೆಯನ್ನು ಹೆಚ್ಚಿಸುತ್ತದೆ.
ವಿಶ್ವದ ವಿಭಿನ್ನ ಭಾಗಗಳಲ್ಲಿ [ಬಣ್ಣದ ಅರ್ಥ](https://colormatters.com/color-symbolism/the-meanings-of-colors) ವಿಭಿನ್ನವಾಗಿರಬಹುದು ಮತ್ತು ಅವುಗಳ ಛಾಯೆಯ ಪ್ರಕಾರ ಅರ್ಥ ಬದಲಾಗಬಹುದು. ಸಾಮಾನ್ಯವಾಗಿ, ಬಣ್ಣದ ಅರ್ಥಗಳು ಇವು:
| ಬಣ್ಣ | ಅರ್ಥ |
| ------- | -------------------- |
| ಕೆಂಪು | ಶಕ್ತಿ |
| ನೀಲಿ | ನಂಬಿಕೆ, ನಿಷ್ಠೆ |
| ಹಳದಿ | ಸಂತೋಷ, ಎಚ್ಚರಿಕೆ |
| ಹಸಿರು | ಪರಿಸರ, ಭಾಗ್ಯ, ಹಿಂಸೆ |
| ನೇರಳೆ | ಸಂತೋಷ |
| ಕಿತ್ತಳೆ | ಚೈತನ್ಯ |
ನೀವು ಕಸ್ಟಮ್ ಬಣ್ಣಗಳೊಂದಿಗೆ ಚಾರ್ಟ್ ನಿರ್ಮಿಸುವ ಜವಾಬ್ದಾರಿಯನ್ನು ಹೊಂದಿದ್ದರೆ, ನಿಮ್ಮ ಚಾರ್ಟ್‌ಗಳು ಪ್ರವೇಶಾರ್ಹವಾಗಿರಬೇಕು ಮತ್ತು ನೀವು ನೀಡಲು ಯತ್ನಿಸುವ ಅರ್ಥಕ್ಕೆ ಬಣ್ಣ ಹೊಂದಿರಬೇಕು ಎಂದು ಖಚಿತಪಡಿಸಿಕೊಳ್ಳಿ.
## ಓದಲು ಸುಲಭವಾಗುವಂತೆ ನಿಮ್ಮ ಚಾರ್ಟ್‌ಗಳನ್ನು ಶೈಲಿಮಾಡುವುದು
ಚಾರ್ಟ್‌ಗಳು ಓದಲು ಸಾಧ್ಯವಾಗದಿದ್ದರೆ ಅರ್ಥಪೂರ್ಣವಾಗುವುದಿಲ್ಲ! ನಿಮ್ಮ ಡೇಟಾ ಅನುಗುಣವಾಗಿ ಚಾರ್ಟ್‌ನ ಅಗಲ ಮತ್ತು ಎತ್ತರವನ್ನು ಶೈಲಿಮಾಡಲು ಸ್ವಲ್ಪ ಸಮಯ ತೆಗೆದುಕೊಳ್ಳಿ. ಒಂದು ವ್ಯತ್ಯಯ (ಉದಾಹರಣೆಗೆ ಎಲ್ಲಾ 50 ರಾಜ್ಯಗಳು) ತೋರಿಸಬೇಕಾದರೆ, ಸಾಧ್ಯವಾದರೆ ಅವುಗಳನ್ನು Y ಅಕ್ಷದಲ್ಲಿ ಲಂಬವಾಗಿ ತೋರಿಸಿ, ಹೋರಿಜಾಂಟಲ್ ಸ್ಕ್ರೋಲಿಂಗ್ ಚಾರ್ಟ್ ತಪ್ಪಿಸಲು.
ನಿಮ್ಮ ಅಕ್ಷಗಳನ್ನು ಲೇಬಲ್ ಮಾಡಿ, ಅಗತ್ಯವಿದ್ದರೆ ಲೆಜೆಂಡ್ ನೀಡಿ, ಮತ್ತು ಡೇಟಾ ಉತ್ತಮವಾಗಿ ಅರ್ಥಮಾಡಿಕೊಳ್ಳಲು ಟೂಲ್‌ಟಿಪ್‌ಗಳನ್ನು ಒದಗಿಸಿ.
ನಿಮ್ಮ ಡೇಟಾ ಪಠ್ಯಾತ್ಮಕ ಮತ್ತು X ಅಕ್ಷದಲ್ಲಿ ವಿಸ್ತಾರವಾಗಿದ್ದರೆ, ಓದಲು ಸುಲಭವಾಗಲು ಪಠ್ಯವನ್ನು ತಿರುಗಿಸಬಹುದು. [plot3D](https://cran.r-project.org/web/packages/plot3D/index.html) 3D ಪ್ಲಾಟಿಂಗ್ ಅನ್ನು ಒದಗಿಸುತ್ತದೆ, ನಿಮ್ಮ ಡೇಟಾ ಅದನ್ನು ಬೆಂಬಲಿಸಿದರೆ. ಅದನ್ನು ಬಳಸಿ ಸುಧಾರಿತ ಡೇಟಾ ದೃಶ್ಯೀಕರಣಗಳನ್ನು ಸೃಷ್ಟಿಸಬಹುದು.
![3D ಪ್ಲಾಟ್‌ಗಳು](../../../../../translated_images/3d.db1734c151eee87d924989306a00e23f8cddac6a0aab122852ece220e9448def.kn.png)
## ಅನಿಮೇಷನ್ ಮತ್ತು 3D ಚಾರ್ಟ್ ಪ್ರದರ್ಶನ
ಇಂದಿನ ಅತ್ಯುತ್ತಮ ಡೇಟಾ ದೃಶ್ಯೀಕರಣಗಳಲ್ಲಿ ಕೆಲವು ಅನಿಮೇಟೆಡ್ ಆಗಿವೆ. ಶಿರ್ಲಿ ವು D3 ಬಳಸಿ ಅದ್ಭುತ ಅನಿಮೇಟೆಡ್ ದೃಶ್ಯೀಕರಣಗಳನ್ನು ಮಾಡಿದ್ದಾಳೆ, ಉದಾಹರಣೆಗೆ '[ಫಿಲ್ಮ್ ಫ್ಲವರ್ಸ್](http://bl.ocks.org/sxywu/raw/d612c6c653fb8b4d7ff3d422be164a5d/)', ಇಲ್ಲಿ ಪ್ರತಿ ಹೂವು ಒಂದು ಚಲನಚಿತ್ರದ ದೃಶ್ಯೀಕರಣವಾಗಿದೆ. ಇನ್ನೊಂದು ಉದಾಹರಣೆ ಗಾರ್ಡಿಯನ್‌ನ 'ಬಸ್ಸ್ಡ್ ಔಟ್', ಇದು ಗ್ರೀನ್ಸಾಕ್ ಮತ್ತು D3 ಜೊತೆಗೆ ಇಂಟರಾಕ್ಟಿವ್ ಅನುಭವ ಮತ್ತು ಸ್ಕ್ರೋಲಿಟೆಲ್ಲಿಂಗ್ ಲೇಖನ ರೂಪದಲ್ಲಿ NYC ತನ್ನ ಗೃಹವಿಹೀನ ಸಮಸ್ಯೆಯನ್ನು ಬಸ್ಸಿಂಗ್ ಮೂಲಕ ಹೇಗೆ ನಿರ್ವಹಿಸುತ್ತದೆ ಎಂಬುದನ್ನು ತೋರಿಸುತ್ತದೆ.
![ಬಸ್ಸಿಂಗ್](../../../../../translated_images/busing.8157cf1bc89a3f65052d362a78c72f964982ceb9dcacbe44480e35909c3dce62.kn.png)
> "ಬಸ್ಸ್ಡ್ ಔಟ್: ಅಮೆರಿಕ ಗೃಹವಿಹೀನರನ್ನು ಹೇಗೆ ಸಾಗಿಸುತ್ತದೆ" [ಗಾರ್ಡಿಯನ್](https://www.theguardian.com/us-news/ng-interactive/2017/dec/20/bussed-out-america-moves-homeless-people-country-study) ನಿಂದ. ದೃಶ್ಯೀಕರಣಗಳು ನಾಡಿಯೆ ಬ್ರೆಮರ್ ಮತ್ತು ಶಿರ್ಲಿ ವು ಅವರಿಂದ
ಈ ಪಾಠವು ಈ ಶಕ್ತಿಶಾಲಿ ದೃಶ್ಯೀಕರಣ ಗ್ರಂಥಾಲಯಗಳನ್ನು ಆಳವಾಗಿ ಕಲಿಸಲು ಸಾಕಾಗದಿದ್ದರೂ, Vue.js ಅಪ್ಲಿಕೇಶನ್‌ನಲ್ಲಿ D3 ಬಳಸಿ "Dangerous Liaisons" ಪುಸ್ತಕದ ಅನಿಮೇಟೆಡ್ ಸಾಮಾಜಿಕ ಜಾಲದೃಶ್ಯೀಕರಣವನ್ನು ಪ್ರದರ್ಶಿಸಲು ಪ್ರಯತ್ನಿಸಿ.
> "Les Liaisons Dangereuses" ಒಂದು ಪತ್ರಿಕಾದ ಕಾದಂಬರಿ, ಅಥವಾ ಸರಣಿಯ ಪತ್ರಗಳಾಗಿ ಪ್ರಸ್ತುತಪಡಿಸಲಾದ ಕಾದಂಬರಿ. 1782 ರಲ್ಲಿ ಚೋಡರ್ಲೋಸ್ ಡೆ ಲಾಕ್ಲೋಸ್ ಬರೆದಿದ್ದು, 18ನೇ ಶತಮಾನದ ಕೊನೆಯಲ್ಲಿ ಫ್ರೆಂಚ್ ಅರಿಸ್ಟೊಕ್ರಸಿ ಎರಡು ಪ್ರತಿಸ್ಪರ್ಧಿ ನಾಯಕರು ವಿಕಾಂಟ್ ಡೆ ವಾಲ್ಮೋಂಟ್ ಮತ್ತು ಮಾರ್ಕ್ವಿಸ್ ಡೆ ಮೆರ್ಟೆಯುಲ್ ಅವರ ದುಷ್ಟ, ನೈತಿಕವಾಗಿ ಕುಸಿದ ಸಾಮಾಜಿಕ ಯುಕ್ತಿಗಳ ಕಥೆಯನ್ನು ಹೇಳುತ್ತದೆ. ಇಬ್ಬರೂ ಕೊನೆಯಲ್ಲಿ ತಮ್ಮ ಅಂತ್ಯವನ್ನು ಎದುರಿಸುತ್ತಾರೆ ಆದರೆ ಬಹಳಷ್ಟು ಸಾಮಾಜಿಕ ಹಾನಿಯನ್ನುಂಟುಮಾಡಿ. ಕಾದಂಬರಿ ಅವರ ವಲಯದ ವಿವಿಧ ಜನರಿಗೆ ಬರೆದ ಪತ್ರಗಳ ಸರಣಿಯಾಗಿ ಬೆಳೆಯುತ್ತದೆ, ಪ್ರತೀಕಾರಕ್ಕಾಗಿ ಅಥವಾ ಕೇವಲ ಸಮಸ್ಯೆ ಸೃಷ್ಟಿಸಲು ಯೋಜನೆ ಮಾಡುತ್ತಾ. ಈ ಪತ್ರಗಳ ದೃಶ್ಯೀಕರಣವನ್ನು ಸೃಷ್ಟಿಸಿ ಕಥೆಯ ಪ್ರಮುಖ ನಾಯಕರು ಯಾರು ಎಂದು ದೃಶ್ಯವಾಗಿ ಕಂಡುಹಿಡಿಯಿರಿ.
ನೀವು ಈ ಸಾಮಾಜಿಕ ಜಾಲದೃಶ್ಯೀಕರಣದ ಅನಿಮೇಟೆಡ್ ವೀಕ್ಷಣೆಯನ್ನು ಪ್ರದರ್ಶಿಸುವ ವೆಬ್ ಅಪ್ಲಿಕೇಶನ್ ಅನ್ನು ಪೂರ್ಣಗೊಳಿಸುವಿರಿ. ಇದು Vue.js ಮತ್ತು D3 ಬಳಸಿ [ಜಾಲದೃಶ್ಯ](https://github.com/emiliorizzo/vue-d3-network) ಸೃಷ್ಟಿಸಲು ನಿರ್ಮಿಸಲಾದ ಗ್ರಂಥಾಲಯವನ್ನು ಬಳಸುತ್ತದೆ. ಅಪ್ಲಿಕೇಶನ್ ಚಾಲನೆಯಲ್ಲಿದ್ದಾಗ, ನೀವು ನೊಡ್‌ಗಳನ್ನು ಪರದೆ ಮೇಲೆ ಎಳೆಯಬಹುದು ಮತ್ತು ಡೇಟಾವನ್ನು ಮರುಸಂರಚಿಸಬಹುದು.
![ಲಿಯಾಜನ್ಸ್](../../../../../translated_images/liaisons.90ce7360bcf8476558f700bbbaf198ad697d5b5cb2829ba141a89c0add7c6ecd.kn.png)
## ಪ್ರಾಜೆಕ್ಟ್: D3.js ಬಳಸಿ ಜಾಲವನ್ನು ತೋರಿಸಲು ಚಾರ್ಟ್ ನಿರ್ಮಿಸಿ
> ಈ ಪಾಠ ಫೋಲ್ಡರ್‌ನಲ್ಲಿ `solution` ಫೋಲ್ಡರ್ ಇದೆ, ಅಲ್ಲಿ ಪೂರ್ಣಗೊಂಡ ಪ್ರಾಜೆಕ್ಟ್ ನಿಮ್ಮ ಉಲ್ಲೇಖಕ್ಕಾಗಿ ಇದೆ.
1. ಸ್ಟಾರ್ಟರ್ ಫೋಲ್ಡರ್‌ನ ರೂಟ್‌ನಲ್ಲಿ README.md ಫೈಲ್‌ನ ಸೂಚನೆಗಳನ್ನು ಅನುಸರಿಸಿ. ನಿಮ್ಮ ಯಂತ್ರದಲ್ಲಿ NPM ಮತ್ತು Node.js ಚಾಲನೆಯಲ್ಲಿರುವುದನ್ನು ಖಚಿತಪಡಿಸಿ, ನಂತರ ನಿಮ್ಮ ಪ್ರಾಜೆಕ್ಟ್ ಅವಲಂಬನೆಗಳನ್ನು ಸ್ಥಾಪಿಸಿ.
2. `starter/src` ಫೋಲ್ಡರ್ ತೆರೆಯಿರಿ. ಅಲ್ಲಿ ನೀವು `assets` ಫೋಲ್ಡರ್ ಕಂಡುಹಿಡಿಯುತ್ತೀರಿ, ಅದರಲ್ಲಿ ಕಾದಂಬರಿಯಿಂದ ಎಲ್ಲಾ ಪತ್ರಗಳ .json ಫೈಲ್ ಇದೆ, ಸಂಖ್ಯೆಬದ್ಧವಾಗಿ, 'to' ಮತ್ತು 'from' ಟ್ಯಾಗ್‌ಗಳೊಂದಿಗೆ.
3. `components/Nodes.vue` ನಲ್ಲಿ ಕೋಡ್ ಪೂರ್ಣಗೊಳಿಸಿ ದೃಶ್ಯೀಕರಣಕ್ಕೆ ಅನುಕೂಲವಾಗುವಂತೆ. `createLinks()` ಎಂಬ ವಿಧಾನವನ್ನು ಹುಡುಕಿ ಮತ್ತು ಕೆಳಗಿನ ನೆಸ್ಟೆಡ್ ಲೂಪ್ ಅನ್ನು ಸೇರಿಸಿ.
.json ವಸ್ತುವಿನ ಮೂಲಕ ಲೂಪ್ ಮಾಡಿ ಪತ್ರಗಳ 'to' ಮತ್ತು 'from' ಡೇಟಾವನ್ನು ಹಿಡಿದು `links` ವಸ್ತುವನ್ನು ನಿರ್ಮಿಸಿ, ಇದರಿಂದ ದೃಶ್ಯೀಕರಣ ಗ್ರಂಥಾಲಯ ಅದನ್ನು ಬಳಸಬಹುದು:
```javascript
//ಅಕ್ಷರಗಳ ಮೂಲಕ ಲೂಪ್ ಮಾಡಿ
let f = 0;
let t = 0;
for (var i = 0; i < letters.length; i++) {
for (var j = 0; j < characters.length; j++) {
if (characters[j] == letters[i].from) {
f = j;
}
if (characters[j] == letters[i].to) {
t = j;
}
}
this.links.push({ sid: f, tid: t });
}
```
ಟರ್ಮಿನಲ್‌ನಿಂದ ನಿಮ್ಮ ಅಪ್ಲಿಕೇಶನ್ ಅನ್ನು ಚಾಲನೆ ಮಾಡಿ (npm run serve) ಮತ್ತು ದೃಶ್ಯೀಕರಣವನ್ನು ಆನಂದಿಸಿ!
## 🚀 ಸವಾಲು
ಮೋಸಮಯ ದೃಶ್ಯೀಕರಣಗಳನ್ನು ಕಂಡುಹಿಡಿಯಲು ಇಂಟರ್ನೆಟ್‌ನಲ್ಲಿ ಸುತ್ತಾಡಿ. ಲೇಖಕ ಬಳಕೆದಾರರನ್ನು ಹೇಗೆ ಮೋಸಗೊಳಿಸುತ್ತಾನೆ, ಮತ್ತು ಅದು ಉದ್ದೇಶಿತವೇ? ದೃಶ್ಯೀಕರಣಗಳನ್ನು ಸರಿಪಡಿಸಲು ಪ್ರಯತ್ನಿಸಿ ಅವು ಹೇಗೆ ಕಾಣಬೇಕು ಎಂದು ತೋರಿಸಲು.
## [ಪೋಸ್ಟ್-ಪಾಠ ಕ್ವಿಜ್](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/25)
## ವಿಮರ್ಶೆ ಮತ್ತು ಸ್ವಯಂ ಅಧ್ಯಯನ
ಮೋಸಮಯ ಡೇಟಾ ದೃಶ್ಯೀಕರಣಗಳ ಬಗ್ಗೆ ಓದಲು ಕೆಲವು ಲೇಖನಗಳು ಇಲ್ಲಿವೆ:
https://gizmodo.com/how-to-lie-with-data-visualization-1563576606
http://ixd.prattsi.org/2017/12/visual-lies-usability-in-deceptive-data-visualizations/
ಇತಿಹಾಸಿಕ ಆಸ್ತಿ ಮತ್ತು ವಸ್ತುಗಳ ಆಸಕ್ತಿದಾಯಕ ದೃಶ್ಯೀಕರಣಗಳನ್ನು ನೋಡಿ:
https://handbook.pubpub.org/
ಅನಿಮೇಷನ್ ನಿಮ್ಮ ದೃಶ್ಯೀಕರಣಗಳನ್ನು ಹೇಗೆ ಸುಧಾರಿಸಬಹುದು ಎಂಬ ಲೇಖನವನ್ನು ನೋಡಿ:
https://medium.com/@EvanSinar/use-animation-to-supercharge-data-visualization-cd905a882ad4
## ಹುದ್ದೆ
[ನಿಮ್ಮ ಸ್ವಂತ ಕಸ್ಟಮ್ ದೃಶ್ಯೀಕರಣವನ್ನು ನಿರ್ಮಿಸಿ](assignment.md)
---
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
**ಅಸ್ವೀಕರಣ**:
ಈ ದಸ್ತಾವೇಜು [Co-op Translator](https://github.com/Azure/co-op-translator) ಎಂಬ AI ಅನುವಾದ ಸೇವೆಯನ್ನು ಬಳಸಿ ಅನುವಾದಿಸಲಾಗಿದೆ. ನಾವು ಶುದ್ಧತೆಯತ್ತ ಪ್ರಯತ್ನಿಸುತ್ತಿದ್ದರೂ, ಸ್ವಯಂಚಾಲಿತ ಅನುವಾದಗಳಲ್ಲಿ ತಪ್ಪುಗಳು ಅಥವಾ ಅಸತ್ಯತೆಗಳು ಇರಬಹುದು ಎಂದು ದಯವಿಟ್ಟು ಗಮನಿಸಿ. ಮೂಲ ಭಾಷೆಯಲ್ಲಿರುವ ಮೂಲ ದಸ್ತಾವೇಜನ್ನು ಅಧಿಕೃತ ಮೂಲವೆಂದು ಪರಿಗಣಿಸಬೇಕು. ಮಹತ್ವದ ಮಾಹಿತಿಗಾಗಿ, ವೃತ್ತಿಪರ ಮಾನವ ಅನುವಾದವನ್ನು ಶಿಫಾರಸು ಮಾಡಲಾಗುತ್ತದೆ. ಈ ಅನುವಾದ ಬಳಕೆಯಿಂದ ಉಂಟಾಗುವ ಯಾವುದೇ ತಪ್ಪು ಅರ್ಥಮಾಡಿಕೊಳ್ಳುವಿಕೆ ಅಥವಾ ತಪ್ಪು ವಿವರಣೆಗಳಿಗೆ ನಾವು ಹೊಣೆಗಾರರಾಗುವುದಿಲ್ಲ.
<!-- CO-OP TRANSLATOR DISCLAIMER END -->

@ -0,0 +1,45 @@
<!--
CO_OP_TRANSLATOR_METADATA:
{
"original_hash": "1441550a0d789796b2821e04f7f4cc94",
"translation_date": "2025-12-19T13:36:00+00:00",
"source_file": "3-Data-Visualization/README.md",
"language_code": "kn"
}
-->
# ದೃಶ್ಯೀಕರಣಗಳು
![ಲ್ಯಾವೆಂಡರ್ ಹೂವಿನ ಮೇಲೆ ಒಂದು ಜೇನುತುಪ್ಪ](../../../translated_images/bee.0aa1d91132b12e3a8994b9ca12816d05ce1642010d9b8be37f8d37365ba845cf.kn.jpg)
> ಫೋಟೋ <a href="https://unsplash.com/@jenna2980?utm_source=unsplash&utm_medium=referral&utm_content=creditCopyText">ಜೆನ್ನಾ ಲೀ</a> ಅವರಿಂದ <a href="https://unsplash.com/s/photos/bees-in-a-meadow?utm_source=unsplash&utm_medium=referral&utm_content=creditCopyText">ಅನ್ಸ್ಪ್ಲ್ಯಾಶ್</a> ನಲ್ಲಿ
ಡೇಟಾ ವಿಜ್ಞಾನಿಯೊಬ್ಬರ ಪ್ರಮುಖ ಕಾರ್ಯಗಳಲ್ಲಿ ಒಂದಾಗಿದೆ ಡೇಟಾವನ್ನು ದೃಶ್ಯೀಕರಿಸುವುದು. ಚಿತ್ರಗಳು 1000 ಪದಗಳ ಮೌಲ್ಯವನ್ನು ಹೊಂದಿವೆ, ಮತ್ತು ಒಂದು ದೃಶ್ಯೀಕರಣವು ನಿಮ್ಮ ಡೇಟಾದ ಎಲ್ಲಾ ರೀತಿಯ ಆಸಕ್ತಿದಾಯಕ ಭಾಗಗಳನ್ನು ಗುರುತಿಸಲು ಸಹಾಯ ಮಾಡಬಹುದು, ಉದಾಹರಣೆಗೆ ಶಿಖರಗಳು, ಹೊರಗಿನ ಅಂಶಗಳು, ಗುಂಪುಗಳು, ಪ್ರವೃತ್ತಿಗಳು ಮತ್ತು ಇನ್ನಷ್ಟು, ಇದು ನಿಮ್ಮ ಡೇಟಾ ಹೇಳಲು ಯತ್ನಿಸುತ್ತಿರುವ ಕಥೆಯನ್ನು ಅರ್ಥಮಾಡಿಕೊಳ್ಳಲು ಸಹಾಯ ಮಾಡುತ್ತದೆ.
ಈ ಐದು ಪಾಠಗಳಲ್ಲಿ, ನೀವು ಪ್ರಕೃತಿಯಿಂದ ಪಡೆದ ಡೇಟಾವನ್ನು ಅನ್ವೇಷಿಸಿ ವಿವಿಧ ತಂತ್ರಗಳನ್ನು ಬಳಸಿ ಆಸಕ್ತಿದಾಯಕ ಮತ್ತು ಸುಂದರ ದೃಶ್ಯೀಕರಣಗಳನ್ನು ರಚಿಸುವಿರಿ.
| ವಿಷಯ ಸಂಖ್ಯೆ | ವಿಷಯ | ಲಿಂಕ್ ಮಾಡಿದ ಪಾಠ | ಲೇಖಕರು |
| :-----------: | :--: | :-----------: | :----: |
| 1. | ಪ್ರಮಾಣಗಳನ್ನು ದೃಶ್ಯೀಕರಿಸುವುದು | <ul> <li> [Python](09-visualization-quantities/README.md)</li> <li>[R](../../../3-Data-Visualization/R/09-visualization-quantities) </li> </ul>|<ul> <li> [ಜೆನ್ ಲೂಪರ್](https://twitter.com/jenlooper)</li><li> [ವಿದುಷಿ ಗುಪ್ತ](https://github.com/Vidushi-Gupta)</li> <li>[ಜಸ್ಲೀನ್ ಸೊಂಡಿ](https://github.com/jasleen101010)</li></ul> |
| 2. | ವಿತರಣೆಗಳನ್ನು ದೃಶ್ಯೀಕರಿಸುವುದು | <ul> <li> [Python](10-visualization-distributions/README.md)</li> <li>[R](../../../3-Data-Visualization/R/10-visualization-distributions) </li> </ul>|<ul> <li> [ಜೆನ್ ಲೂಪರ್](https://twitter.com/jenlooper)</li><li> [ವಿದುಷಿ ಗುಪ್ತ](https://github.com/Vidushi-Gupta)</li> <li>[ಜಸ್ಲೀನ್ ಸೊಂಡಿ](https://github.com/jasleen101010)</li></ul> |
| 3. | ಅನುಪಾತಗಳನ್ನು ದೃಶ್ಯೀಕರಿಸುವುದು | <ul> <li> [Python](11-visualization-proportions/README.md)</li> <li>[R](../../../3-Data-Visualization) </li> </ul>|<ul> <li> [ಜೆನ್ ಲೂಪರ್](https://twitter.com/jenlooper)</li><li> [ವಿದುಷಿ ಗುಪ್ತ](https://github.com/Vidushi-Gupta)</li> <li>[ಜಸ್ಲೀನ್ ಸೊಂಡಿ](https://github.com/jasleen101010)</li></ul> |
| 4. | ಸಂಬಂಧಗಳನ್ನು ದೃಶ್ಯೀಕರಿಸುವುದು | <ul> <li> [Python](12-visualization-relationships/README.md)</li> <li>[R](../../../3-Data-Visualization) </li> </ul>|<ul> <li> [ಜೆನ್ ಲೂಪರ್](https://twitter.com/jenlooper)</li><li> [ವಿದುಷಿ ಗುಪ್ತ](https://github.com/Vidushi-Gupta)</li> <li>[ಜಸ್ಲೀನ್ ಸೊಂಡಿ](https://github.com/jasleen101010)</li></ul> |
| 5. | ಅರ್ಥಪೂರ್ಣ ದೃಶ್ಯೀಕರಣಗಳನ್ನು ಮಾಡುವುದು | <ul> <li> [Python](13-meaningful-visualizations/README.md)</li> <li>[R](../../../3-Data-Visualization) </li> </ul>|<ul> <li> [ಜೆನ್ ಲೂಪರ್](https://twitter.com/jenlooper)</li><li> [ವಿದುಷಿ ಗುಪ್ತ](https://github.com/Vidushi-Gupta)</li> <li>[ಜಸ್ಲೀನ್ ಸೊಂಡಿ](https://github.com/jasleen101010)</li></ul> |
### ಕ್ರೆಡಿಟ್ಸ್
ಈ ದೃಶ್ಯೀಕರಣ ಪಾಠಗಳನ್ನು 🌸 [ಜೆನ್ ಲೂಪರ್](https://twitter.com/jenlooper), [ಜಸ್ಲೀನ್ ಸೊಂಡಿ](https://github.com/jasleen101010) ಮತ್ತು [ವಿದುಷಿ ಗುಪ್ತ](https://github.com/Vidushi-Gupta) ರವರು ಬರೆಯಲಾಗಿದೆ.
🍯 US ಹನಿ ಉತ್ಪಾದನೆಗೆ ಸಂಬಂಧಿಸಿದ ಡೇಟಾ ಜೆಸಿಕಾ ಲಿ ಅವರ ಪ್ರಾಜೆಕ್ಟ್‌ನಿಂದ [Kaggle](https://www.kaggle.com/jessicali9530/honey-production) ನಲ್ಲಿ ಪಡೆದಿದೆ. [ಡೇಟಾ](https://usda.library.cornell.edu/concern/publications/rn301137d) ಯು [ಯುನೈಟೆಡ್ ಸ್ಟೇಟ್ಸ್ ಡಿಪಾರ್ಟ್‌ಮೆಂಟ್ ಆಫ್ ಅಗ್ರಿಕಲ್ಚರ್](https://www.nass.usda.gov/About_NASS/index.php) ನಿಂದ ಪಡೆದಿದೆ.
🍄 ಕಾಳುಮರಿಗಳು ಸಂಬಂಧಿಸಿದ ಡೇಟಾ ಕೂಡ [Kaggle](https://www.kaggle.com/hatterasdunton/mushroom-classification-updated-dataset) ನಿಂದ ಹ್ಯಾಟೆರಾಸ್ ಡಂಟನ್ ಅವರಿಂದ ಪರಿಷ್ಕೃತವಾಗಿದೆ. ಈ ಡೇಟಾಸೆಟ್ 23 ಪ್ರಭೇದಗಳ ಗಿಲ್ಲುಳ್ಳ ಕಾಳುಮರಿಗಳ ಹೈಪೋಥೆಟಿಕಲ್ ಮಾದರಿಗಳ ವಿವರಣೆಗಳನ್ನು ಒಳಗೊಂಡಿದೆ, ಆಗರಿಕಸ್ ಮತ್ತು ಲೆಪಿಯೋಟಾ ಕುಟುಂಬಗಳಿಗೆ ಸಂಬಂಧಿಸಿದವು. ಕಾಳುಮರಿಗಳನ್ನು ನಾರ್ತ್ ಅಮೆರಿಕನ್ ಮಶ್ರೂಮ್‌ಗಳ ಆಡಿಯುಬನ್ ಸೊಸೈಟಿ ಫೀಲ್ಡ್ ಗೈಡ್ (1981) ನಿಂದ ಚಿತ್ರಿಸಲಾಗಿದೆ. ಈ ಡೇಟಾಸೆಟ್ 1987 ರಲ್ಲಿ UCI ML 27 ಗೆ ದಾನ ಮಾಡಲಾಯಿತು.
🦆 ಮಿನೆಸೋಟಾ ಪಕ್ಷಿಗಳ ಡೇಟಾ [Kaggle](https://www.kaggle.com/hannahcollins/minnesota-birds) ನಿಂದ [ವಿಕಿಪೀಡಿಯಾ](https://en.wikipedia.org/wiki/List_of_birds_of_Minnesota) ಯಿಂದ ಹನ್ನಾ ಕೊಲಿನ್ಸ್ ಅವರಿಂದ ಸ್ಕ್ರೇಪ್ ಮಾಡಲಾಗಿದೆ.
ಈ ಎಲ್ಲಾ ಡೇಟಾಸೆಟ್‌ಗಳು [CC0: ಕ್ರಿಯೇಟಿವ್ ಕಾಮನ್ಸ್](https://creativecommons.org/publicdomain/zero/1.0/) ಅಡಿಯಲ್ಲಿ ಪರವಾನಗಿ ಪಡೆದಿವೆ.
---
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
**ಅಸ್ವೀಕರಣ**:
ಈ ದಸ್ತಾವೇಜು [Co-op Translator](https://github.com/Azure/co-op-translator) ಎಂಬ AI ಅನುವಾದ ಸೇವೆಯನ್ನು ಬಳಸಿ ಅನುವಾದಿಸಲಾಗಿದೆ. ನಾವು ಶುದ್ಧತೆಯತ್ತ ಪ್ರಯತ್ನಿಸುತ್ತಿದ್ದರೂ, ಸ್ವಯಂಚಾಲಿತ ಅನುವಾದಗಳಲ್ಲಿ ತಪ್ಪುಗಳು ಅಥವಾ ಅಸತ್ಯತೆಗಳು ಇರಬಹುದು ಎಂದು ದಯವಿಟ್ಟು ಗಮನಿಸಿ. ಮೂಲ ಭಾಷೆಯಲ್ಲಿರುವ ಮೂಲ ದಸ್ತಾವೇಜನ್ನು ಅಧಿಕೃತ ಮೂಲವೆಂದು ಪರಿಗಣಿಸಬೇಕು. ಮಹತ್ವದ ಮಾಹಿತಿಗಾಗಿ, ವೃತ್ತಿಪರ ಮಾನವ ಅನುವಾದವನ್ನು ಶಿಫಾರಸು ಮಾಡಲಾಗುತ್ತದೆ. ಈ ಅನುವಾದ ಬಳಕೆಯಿಂದ ಉಂಟಾಗುವ ಯಾವುದೇ ತಪ್ಪು ಅರ್ಥಮಾಡಿಕೊಳ್ಳುವಿಕೆ ಅಥವಾ ತಪ್ಪು ವಿವರಣೆಗಳಿಗೆ ನಾವು ಹೊಣೆಗಾರರಾಗುವುದಿಲ್ಲ.
<!-- CO-OP TRANSLATOR DISCLAIMER END -->

@ -0,0 +1,121 @@
<!--
CO_OP_TRANSLATOR_METADATA:
{
"original_hash": "07e12a25d20b8f191e3cb651c27fdb2b",
"translation_date": "2025-12-19T15:27:40+00:00",
"source_file": "4-Data-Science-Lifecycle/14-Introduction/README.md",
"language_code": "kn"
}
-->
# ಡೇಟಾ ಸೈನ್ಸ್ ಜೀವನಚಕ್ರಕ್ಕೆ ಪರಿಚಯ
|![ [(@sketchthedocs)](https://sketchthedocs.dev) ಅವರಿಂದ ಸ್ಕೆಚ್ ನೋಟ್ ](../../sketchnotes/14-DataScience-Lifecycle.png)|
|:---:|
| ಡೇಟಾ ಸೈನ್ಸ್ ಜೀವನಚಕ್ರಕ್ಕೆ ಪರಿಚಯ - _[@nitya](https://twitter.com/nitya) ಅವರಿಂದ ಸ್ಕೆಚ್ ನೋಟ್_ |
## [ಪೂರ್ವ-ಲೇಕ್ಚರ್ ಕ್ವಿಜ್](https://ff-quizzes.netlify.app/en/ds/quiz/26)
ಈ ಸಮಯದಲ್ಲಿ ನೀವು ಬಹುಶಃ ತಿಳಿದುಕೊಂಡಿರಬಹುದು ಡೇಟಾ ಸೈನ್ಸ್ ಒಂದು ಪ್ರಕ್ರಿಯೆ ಎಂದು. ಈ ಪ್ರಕ್ರಿಯೆಯನ್ನು 5 ಹಂತಗಳಾಗಿ ವಿಭಜಿಸಬಹುದು:
- ಸೆರೆಹಿಡಿಯುವುದು
- ಪ್ರಕ್ರಿಯೆಗೊಳಿಸುವುದು
- ವಿಶ್ಲೇಷಣೆ
- ಸಂವಹನ
- ನಿರ್ವಹಣೆ
ಈ ಪಾಠವು ಜೀವನಚಕ್ರದ 3 ಭಾಗಗಳ ಮೇಲೆ ಕೇಂದ್ರೀಕರಿಸುತ್ತದೆ: ಸೆರೆಹಿಡಿಯುವುದು, ಪ್ರಕ್ರಿಯೆಗೊಳಿಸುವುದು ಮತ್ತು ನಿರ್ವಹಣೆ.
![ಡೇಟಾ ಸೈನ್ಸ್ ಜೀವನಚಕ್ರದ ಚಿತ್ರಣ](../../../../translated_images/data-science-lifecycle.a1e362637503c4fb0cd5e859d7552edcdb4aa629a279727008baa121f2d33f32.kn.jpg)
> ಚಿತ್ರ: [ಬರ್ಕ್ಲಿ ಮಾಹಿತಿ ಶಾಲೆ](https://ischoolonline.berkeley.edu/data-science/what-is-data-science/)
## ಸೆರೆಹಿಡಿಯುವುದು
ಜೀವನಚಕ್ರದ ಮೊದಲ ಹಂತ ಬಹಳ ಮುಖ್ಯ, ಏಕೆಂದರೆ ಮುಂದಿನ ಹಂತಗಳು ಇದಕ್ಕೆ ಅವಲಂಬಿತವಾಗಿವೆ. ಇದು ಪ್ರಾಯೋಗಿಕವಾಗಿ ಎರಡು ಹಂತಗಳನ್ನು ಒಟ್ಟುಗೂಡಿಸಿದೆ: ಡೇಟಾವನ್ನು ಪಡೆಯುವುದು ಮತ್ತು ಪರಿಹರಿಸಬೇಕಾದ ಉದ್ದೇಶ ಮತ್ತು ಸಮಸ್ಯೆಗಳನ್ನು ನಿರ್ಧರಿಸುವುದು.
ಪ್ರಾಜೆಕ್ಟಿನ ಗುರಿಗಳನ್ನು ನಿರ್ಧರಿಸುವುದು ಸಮಸ್ಯೆ ಅಥವಾ ಪ್ರಶ್ನೆಯ ಆಳವಾದ ಸನ್ನಿವೇಶವನ್ನು ಅಗತ್ಯವಿರುತ್ತದೆ. ಮೊದಲು, ನಾವು ಪರಿಹಾರ ಬೇಕಾದವರನ್ನು ಗುರುತಿಸಿ ಪಡೆಯಬೇಕು. ಇವರು ವ್ಯವಹಾರದ ಹಿತಾಸಕ್ತಿದಾರರು ಅಥವಾ ಪ್ರಾಜೆಕ್ಟಿನ ಪ್ರಾಯೋಜಕರು ಆಗಿರಬಹುದು, ಅವರು ಯಾರು ಅಥವಾ ಏನು ಈ ಪ್ರಾಜೆಕ್ಟಿನಿಂದ ಲಾಭ ಪಡೆಯುತ್ತಾರೋ ಮತ್ತು ಏಕೆ ಅವಶ್ಯಕತೆ ಇದೆ ಎಂದು ಗುರುತಿಸಲು ಸಹಾಯ ಮಾಡುತ್ತಾರೆ. ಚೆನ್ನಾಗಿ ನಿರ್ಧರಿಸಿದ ಗುರಿ ಅಳತೆ ಮಾಡಬಹುದಾದ ಮತ್ತು ಪ್ರಮಾಣೀಕರಿಸಬಹುದಾದ ಫಲಿತಾಂಶವನ್ನು ನಿರ್ಧರಿಸಬೇಕು.
ಡೇಟಾ ವಿಜ್ಞಾನಿ ಕೇಳಬಹುದಾದ ಪ್ರಶ್ನೆಗಳು:
- ಈ ಸಮಸ್ಯೆಯನ್ನು ಮೊದಲು ಎದುರಿಸಲಾಗಿದೆ? ಏನು ಕಂಡುಬಂದಿತು?
- ಉದ್ದೇಶ ಮತ್ತು ಗುರಿ ಎಲ್ಲರಿಗೂ ಅರ್ಥವಾಗಿದೆಯೇ?
- ಅಸ್ಪಷ್ಟತೆ ಇದೆಯೇ ಮತ್ತು ಅದನ್ನು ಹೇಗೆ ಕಡಿಮೆ ಮಾಡುವುದು?
- ನಿರ್ಬಂಧಗಳು ಯಾವುವು?
- ಅಂತಿಮ ಫಲಿತಾಂಶ ಹೇಗಿರಬಹುದು?
- ಎಷ್ಟು ಸಂಪನ್ಮೂಲಗಳು (ಸಮಯ, ಜನರು, ಗಣನೀಯ) ಲಭ್ಯವಿವೆ?
ಮುಂದೆ, ಈ ನಿರ್ಧರಿಸಿದ ಗುರಿಗಳನ್ನು ಸಾಧಿಸಲು ಅಗತ್ಯವಿರುವ ಡೇಟಾವನ್ನು ಗುರುತಿಸಿ, ಸಂಗ್ರಹಿಸಿ, ನಂತರ ಅನ್ವೇಷಿಸುವುದು. ಈ ಪಡೆಯುವ ಹಂತದಲ್ಲಿ, ಡೇಟಾ ವಿಜ್ಞಾನಿಗಳು ಡೇಟಾದ ಪ್ರಮಾಣ ಮತ್ತು ಗುಣಮಟ್ಟವನ್ನು ಮೌಲ್ಯಮಾಪನ ಮಾಡಬೇಕು. ಇದಕ್ಕಾಗಿ ಡೇಟಾ ಅನ್ವೇಷಣೆ ಅಗತ್ಯವಿದೆ, ಏಕೆಂದರೆ ಪಡೆದಿರುವುದು ಬಯಸಿದ ಫಲಿತಾಂಶವನ್ನು ಬೆಂಬಲಿಸುವುದೇ ಎಂದು ದೃಢೀಕರಿಸಲು.
ಡೇಟಾ ಬಗ್ಗೆ ಡೇಟಾ ವಿಜ್ಞಾನಿ ಕೇಳಬಹುದಾದ ಪ್ರಶ್ನೆಗಳು:
- ನನಗೆ ಈಗಾಗಲೇ ಯಾವ ಡೇಟಾ ಲಭ್ಯವಿದೆ?
- ಈ ಡೇಟಾ ಯಾರು ಹೊಂದಿದ್ದಾರೆ?
- ಗೌಪ್ಯತೆ ಸಂಬಂಧಿ ಚಿಂತೆಗಳೇನು?
- ಈ ಸಮಸ್ಯೆಯನ್ನು ಪರಿಹರಿಸಲು ನನಗೆ ಸಾಕಷ್ಟು ಡೇಟಾ ಇದೆಯೇ?
- ಈ ಸಮಸ್ಯೆಗೆ ಡೇಟಾದ ಗುಣಮಟ್ಟ ತಕ್ಕಮಟ್ಟದಲ್ಲಿದೆಯೇ?
- ಈ ಡೇಟಾದ ಮೂಲಕ ಹೆಚ್ಚುವರಿ ಮಾಹಿತಿ ಕಂಡುಬಂದರೆ, ಗುರಿಗಳನ್ನು ಬದಲಾಯಿಸುವ ಅಥವಾ ಮರುನಿರ್ಧರಿಸುವ ಬಗ್ಗೆ ಪರಿಗಣಿಸಬೇಕೇ?
## ಪ್ರಕ್ರಿಯೆಗೊಳಿಸುವುದು
ಜೀವನಚಕ್ರದ ಪ್ರಕ್ರಿಯೆ ಹಂತವು ಡೇಟಾದಲ್ಲಿನ ಮಾದರಿಗಳನ್ನು ಕಂಡುಹಿಡಿಯುವುದರ ಜೊತೆಗೆ ಮಾದರಿಗಳನ್ನು ನಿರ್ಮಿಸುವುದರ ಮೇಲೆ ಕೇಂದ್ರೀಕರಿಸುತ್ತದೆ. ಪ್ರಕ್ರಿಯೆ ಹಂತದಲ್ಲಿ ಬಳಸುವ ಕೆಲವು ತಂತ್ರಗಳು ಮಾದರಿಗಳನ್ನು ಅನಾವರಣಗೊಳಿಸಲು ಸಂಖ್ಯಾಶಾಸ್ತ್ರೀಯ ವಿಧಾನಗಳನ್ನು ಅಗತ್ಯವಿರುತ್ತದೆ. ಸಾಮಾನ್ಯವಾಗಿ, ದೊಡ್ಡ ಡೇಟಾ ಸೆಟ್‌ನೊಂದಿಗೆ ಮಾನವನಿಗೆ ಇದು ಕಷ್ಟಕರ ಕೆಲಸವಾಗಿದ್ದು, ಪ್ರಕ್ರಿಯೆಯನ್ನು ವೇಗಗೊಳಿಸಲು ಕಂಪ್ಯೂಟರ್‌ಗಳ ಮೇಲೆ ಅವಲಂಬಿತವಾಗಿರುತ್ತದೆ. ಈ ಹಂತದಲ್ಲಿ ಡೇಟಾ ಸೈನ್ಸ್ ಮತ್ತು ಯಂತ್ರ ಅಧ್ಯಯನ (machine learning) ಸಂಧಿಸುತ್ತವೆ. ಮೊದಲ ಪಾಠದಲ್ಲಿ ನೀವು ಕಲಿತಂತೆ, ಯಂತ್ರ ಅಧ್ಯಯನವು ಡೇಟಾವನ್ನು ಅರ್ಥಮಾಡಿಕೊಳ್ಳಲು ಮಾದರಿಗಳನ್ನು ನಿರ್ಮಿಸುವ ಪ್ರಕ್ರಿಯೆ. ಮಾದರಿಗಳು ಡೇಟಾದಲ್ಲಿನ ಚರಗಳ ನಡುವಿನ ಸಂಬಂಧವನ್ನು ಪ್ರತಿನಿಧಿಸುತ್ತವೆ ಮತ್ತು ಫಲಿತಾಂಶಗಳನ್ನು ಭವಿಷ್ಯವಾಣಿ ಮಾಡಲು ಸಹಾಯ ಮಾಡುತ್ತವೆ.
ಈ ಹಂತದಲ್ಲಿ ಸಾಮಾನ್ಯವಾಗಿ ಬಳಸುವ ತಂತ್ರಗಳು ML for Beginners ಪಠ್ಯಕ್ರಮದಲ್ಲಿ ಒಳಗೊಂಡಿವೆ. ಅವುಗಳ ಬಗ್ಗೆ ತಿಳಿಯಲು ಕೆಳಗಿನ ಲಿಂಕ್‌ಗಳನ್ನು ಅನುಸರಿಸಿ:
- [ವರ್ಗೀಕರಣ](https://github.com/microsoft/ML-For-Beginners/tree/main/4-Classification): ಡೇಟಾವನ್ನು ವರ್ಗಗಳಾಗಿ ಸಂಘಟಿಸುವುದು, ಹೆಚ್ಚು ಪರಿಣಾಮಕಾರಿಯಾಗಿ ಬಳಸಲು.
- [ಗುಚ್ಛೀಕರಣ](https://github.com/microsoft/ML-For-Beginners/tree/main/5-Clustering): ಸಮಾನ ಗುಚ್ಛಗಳಾಗಿ ಡೇಟಾವನ್ನು ಗುಚ್ಛೀಕರಿಸುವುದು.
- [ಪ್ರತಿಗಮನ](https://github.com/microsoft/ML-For-Beginners/tree/main/2-Regression): ಮೌಲ್ಯಗಳನ್ನು ಭವಿಷ್ಯವಾಣಿ ಮಾಡಲು ಚರಗಳ ನಡುವಿನ ಸಂಬಂಧಗಳನ್ನು ನಿರ್ಧರಿಸುವುದು.
## ನಿರ್ವಹಣೆ
ಜೀವನಚಕ್ರದ ಚಿತ್ರಣದಲ್ಲಿ, ನೀವು ಗಮನಿಸಿದ್ದೀರಾ ನಿರ್ವಹಣೆ ಸೆರೆಹಿಡಿಯುವುದು ಮತ್ತು ಪ್ರಕ್ರಿಯೆಗೊಳಿಸುವುದರ ನಡುವೆ ಇದೆ. ನಿರ್ವಹಣೆ ಒಂದು ನಿರಂತರ ಪ್ರಕ್ರಿಯೆಯಾಗಿದೆ, ಪ್ರಾಜೆಕ್ಟಿನ ಪ್ರಕ್ರಿಯೆಗೊಳಿಸುವುದರಲ್ಲಿಯೂ ಡೇಟಾವನ್ನು ನಿರ್ವಹಿಸುವುದು, ಸಂಗ್ರಹಿಸುವುದು ಮತ್ತು ಸುರಕ್ಷಿತವಾಗಿಡುವುದು ಮತ್ತು ಪ್ರಾಜೆಕ್ಟಿನ ಸಂಪೂರ್ಣ ಅವಧಿಯಲ್ಲಿ ಪರಿಗಣಿಸಬೇಕಾಗಿದೆ.
### ಡೇಟಾ ಸಂಗ್ರಹಣೆ
ಡೇಟಾವನ್ನು ಹೇಗೆ ಮತ್ತು ಎಲ್ಲಿಗೆ ಸಂಗ್ರಹಿಸುವುದು ಎಂಬ ವಿಚಾರಗಳು ಅದರ ಸಂಗ್ರಹಣೆಯ ವೆಚ್ಚ ಮತ್ತು ಡೇಟಾ ತ್ವರಿತವಾಗಿ ಪ್ರವೇಶಿಸುವ ಕಾರ್ಯಕ್ಷಮತೆಯನ್ನು ಪ್ರಭಾವಿಸುತ್ತವೆ. ಇಂತಹ ನಿರ್ಧಾರಗಳನ್ನು ಡೇಟಾ ವಿಜ್ಞಾನಿ ಒಬ್ಬನೇ ಮಾಡುವುದು ಸಾಧ್ಯವಿಲ್ಲ, ಆದರೆ ಡೇಟಾ ಸಂಗ್ರಹಣೆಯ ಆಧಾರದ ಮೇಲೆ ಡೇಟಾ ಜೊತೆ ಹೇಗೆ ಕೆಲಸ ಮಾಡಬೇಕೆಂದು ಆಯ್ಕೆಮಾಡಬಹುದು.
ಇವು ಕೆಲವು ಆಧುನಿಕ ಡೇಟಾ ಸಂಗ್ರಹಣಾ ವ್ಯವಸ್ಥೆಗಳ ಅಂಶಗಳು, ಅವು ಈ ಆಯ್ಕೆಗಳನ್ನು ಪ್ರಭಾವಿಸುತ್ತವೆ:
**ಆನ್ ಪ್ರೆಮೈಸ್ vs ಆಫ್ ಪ್ರೆಮೈಸ್ vs ಸಾರ್ವಜನಿಕ ಅಥವಾ ಖಾಸಗಿ ಕ್ಲೌಡ್**
ಆನ್ ಪ್ರೆಮೈಸ್ ಎಂದರೆ ನಿಮ್ಮ ಸ್ವಂತ ಉಪಕರಣಗಳಲ್ಲಿ ಡೇಟಾವನ್ನು ನಿರ್ವಹಿಸುವುದು, ಉದಾಹರಣೆಗೆ ಡೇಟಾವನ್ನು ಸಂಗ್ರಹಿಸುವ ಹಾರ್ಡ್ ಡ್ರೈವ್‌ಗಳಿರುವ ಸರ್ವರ್ ಹೊಂದಿರುವುದು, ಆದರೆ ಆಫ್ ಪ್ರೆಮೈಸ್ ಎಂದರೆ ನೀವು ಹೊಂದಿಲ್ಲದ ಉಪಕರಣಗಳ ಮೇಲೆ ಅವಲಂಬಿತವಾಗಿರುವುದು, ಉದಾಹರಣೆಗೆ ಡೇಟಾ ಸೆಂಟರ್. ಸಾರ್ವಜನಿಕ ಕ್ಲೌಡ್ ಒಂದು ಜನಪ್ರಿಯ ಆಯ್ಕೆ, ಇದರಲ್ಲಿ ಡೇಟಾ ಹೇಗೆ ಮತ್ತು ಎಲ್ಲಿಗೆ ಸಂಗ್ರಹಿಸಲಾಗಿದೆ ಎಂಬುದರ ಬಗ್ಗೆ ತಿಳಿವಳಿಕೆ ಅಗತ್ಯವಿಲ್ಲ, ಸಾರ್ವಜನಿಕ ಎಂದರೆ ಕ್ಲೌಡ್ ಬಳಸುವ ಎಲ್ಲರಿಗೂ ಹಂಚಿಕೊಳ್ಳುವ ಒಕ್ಕೂಟದ ಮೂಲಭೂತ ಮೂಲಸೌಕರ್ಯ. ಕೆಲವು ಸಂಸ್ಥೆಗಳು ಕಟ್ಟುನಿಟ್ಟಾದ ಭದ್ರತಾ ನೀತಿಗಳನ್ನು ಹೊಂದಿದ್ದು, ಡೇಟಾ ಹೋಸ್ಟ್ ಆಗಿರುವ ಉಪಕರಣಗಳಿಗೆ ಸಂಪೂರ್ಣ ಪ್ರವೇಶ ಹೊಂದಬೇಕೆಂದು ಬಯಸುತ್ತವೆ ಮತ್ತು ತಮ್ಮದೇ ಖಾಸಗಿ ಕ್ಲೌಡ್ ಸೇವೆಗಳನ್ನು ಬಳಸುತ್ತವೆ. ನೀವು [ನಂತರದ ಪಾಠಗಳಲ್ಲಿ](https://github.com/microsoft/Data-Science-For-Beginners/tree/main/5-Data-Science-In-Cloud) ಕ್ಲೌಡ್‌ನಲ್ಲಿನ ಡೇಟಾ ಬಗ್ಗೆ ಹೆಚ್ಚು ತಿಳಿಯುತ್ತೀರಿ.
**ತಣಿತ ಡೇಟಾ vs ಬಿಸಿ ಡೇಟಾ**
ನಿಮ್ಮ ಮಾದರಿಗಳನ್ನು ತರಬೇತುಗೊಳಿಸುವಾಗ, ನೀವು ಹೆಚ್ಚು ತರಬೇತಿ ಡೇಟಾ ಬೇಕಾಗಬಹುದು. ನಿಮ್ಮ ಮಾದರಿಯಿಂದ ತೃಪ್ತರಾಗಿದ್ದರೆ, ಇನ್ನಷ್ಟು ಡೇಟಾ ಬರುತ್ತದೆ, ಮಾದರಿ ತನ್ನ ಉದ್ದೇಶವನ್ನು ಸೇವೆ ಮಾಡುತ್ತದೆ. ಯಾವುದೇ ಸಂದರ್ಭದಲ್ಲಿಯೂ, ಡೇಟಾ ಸಂಗ್ರಹಣೆ ಮತ್ತು ಪ್ರವೇಶಿಸುವ ವೆಚ್ಚವು ಹೆಚ್ಚಾಗುತ್ತದೆ. ಕಡಿಮೆ ಬಳಕೆಯ ಡೇಟಾವನ್ನು (ತಣಿತ ಡೇಟಾ) ಮತ್ತು ಹೆಚ್ಚು ಪ್ರವೇಶಿಸುವ ಡೇಟಾವನ್ನು (ಬಿಸಿ ಡೇಟಾ) ವಿಭಜಿಸುವುದು, ಹಾರ್ಡ್‌ವೇರ್ ಅಥವಾ ಸಾಫ್ಟ್‌ವೇರ್ ಸೇವೆಗಳ ಮೂಲಕ ಕಡಿಮೆ ವೆಚ್ಚದ ಡೇಟಾ ಸಂಗ್ರಹಣೆಯ ಆಯ್ಕೆಯಾಗಬಹುದು. ತಣಿತ ಡೇಟಾವನ್ನು ಪ್ರವೇಶಿಸುವಾಗ, ಬಿಸಿ ಡೇಟಾ ಹೋಲಿಸಿದರೆ ಸ್ವಲ್ಪ ಹೆಚ್ಚು ಸಮಯ ತೆಗೆದುಕೊಳ್ಳಬಹುದು.
### ಡೇಟಾ ನಿರ್ವಹಣೆ
ನೀವು ಡೇಟಾ ಜೊತೆ ಕೆಲಸ ಮಾಡುವಾಗ, ಕೆಲವು ಡೇಟಾವನ್ನು ಸ್ವಚ್ಛಗೊಳಿಸುವ ಅಗತ್ಯವಿರಬಹುದು, ಇದು [ಡೇಟಾ ತಯಾರಿಕೆ](https://github.com/microsoft/Data-Science-For-Beginners/tree/main/2-Working-With-Data/08-data-preparation) ಪಾಠದಲ್ಲಿ ಒಳಗೊಂಡ ತಂತ್ರಗಳನ್ನು ಬಳಸಬಹುದು, ಸರಿಯಾದ ಮಾದರಿಗಳನ್ನು ನಿರ್ಮಿಸಲು. ಹೊಸ ಡೇಟಾ ಬಂದಾಗ, ಗುಣಮಟ್ಟದಲ್ಲಿ ಸತತತೆ ಕಾಯ್ದುಕೊಳ್ಳಲು ಅದೇ ಅನ್ವಯಿಕೆಗಳು ಬೇಕಾಗಬಹುದು. ಕೆಲವು ಪ್ರಾಜೆಕ್ಟುಗಳು ಸ್ವಯಂಚಾಲಿತ ಸಾಧನಗಳನ್ನು ಬಳಸುತ್ತವೆ, ಸ್ವಚ್ಛಗೊಳಿಸುವಿಕೆ, ಸಂಗ್ರಹಣೆ ಮತ್ತು ಸಂಕುಚಿತಗೊಳಿಸುವಿಕೆಗಾಗಿ, ನಂತರ ಡೇಟಾವನ್ನು ಅಂತಿಮ ಸ್ಥಳಕ್ಕೆ ಕಳುಹಿಸುವ ಮೊದಲು. Azure Data Factory ಇವುಗಳಲ್ಲಿ ಒಂದು ಉದಾಹರಣೆ.
### ಡೇಟಾ ಸುರಕ್ಷತೆ
ಡೇಟಾ ಸುರಕ್ಷತೆಯ ಪ್ರಮುಖ ಗುರಿಗಳಲ್ಲಿ ಒಂದಾಗಿದೆ, ಡೇಟಾ ಕೆಲಸ ಮಾಡುವವರು ಏನು ಸಂಗ್ರಹಿಸುತ್ತಿದ್ದಾರೆ ಮತ್ತು ಯಾವ ಸನ್ನಿವೇಶದಲ್ಲಿ ಬಳಸಲಾಗುತ್ತಿದೆ ಎಂಬುದರ ನಿಯಂತ್ರಣದಲ್ಲಿರುವುದು. ಡೇಟಾವನ್ನು ಸುರಕ್ಷಿತವಾಗಿಡುವುದು, ಅದಕ್ಕೆ ಪ್ರವೇಶ ಹೊಂದಬೇಕಾದವರಿಗೆ ಮಾತ್ರ ಪ್ರವೇಶವನ್ನು ಮಿತಿಗೊಳಿಸುವುದು, ಸ್ಥಳೀಯ ಕಾನೂನುಗಳು ಮತ್ತು ನಿಯಮಗಳನ್ನು ಪಾಲಿಸುವುದು, ಮತ್ತು ನೈತಿಕ ಮಾನದಂಡಗಳನ್ನು ಕಾಯ್ದುಕೊಳ್ಳುವುದು, [ನೈತಿಕತೆ ಪಾಠದಲ್ಲಿ](https://github.com/microsoft/Data-Science-For-Beginners/tree/main/1-Introduction/02-ethics) ವಿವರಿಸಲಾಗಿದೆ.
ಸುರಕ್ಷತೆಗಾಗಿ ತಂಡ ಮಾಡಬಹುದಾದ ಕೆಲವು ಕಾರ್ಯಗಳು:
- ಎಲ್ಲಾ ಡೇಟಾ ಎನ್‌ಕ್ರಿಪ್ಟ್ ಆಗಿರುವುದನ್ನು ದೃಢೀಕರಿಸುವುದು
- ಗ್ರಾಹಕರಿಗೆ ಅವರ ಡೇಟಾ ಹೇಗೆ ಬಳಸಲಾಗುತ್ತಿದೆ ಎಂಬ ಮಾಹಿತಿ ನೀಡುವುದು
- ಪ್ರಾಜೆಕ್ಟ್ ಬಿಟ್ಟುಹೋಗಿದವರಿಂದ ಡೇಟಾ ಪ್ರವೇಶವನ್ನು ತೆಗೆದುಹಾಕುವುದು
- ಕೆಲವು ಪ್ರಾಜೆಕ್ಟ್ ಸದಸ್ಯರಿಗೆ ಮಾತ್ರ ಡೇಟಾ ಬದಲಾಯಿಸಲು ಅವಕಾಶ ನೀಡುವುದು
## 🚀 ಸವಾಲು
ಡೇಟಾ ಸೈನ್ಸ್ ಜೀವನಚಕ್ರದ ಅನೇಕ ಆವೃತ್ತಿಗಳು ಇವೆ, ಪ್ರತಿಯೊಂದು ಹಂತವು ವಿಭಿನ್ನ ಹೆಸರುಗಳು ಮತ್ತು ಹಂತಗಳ ಸಂಖ್ಯೆಯನ್ನು ಹೊಂದಿರಬಹುದು ಆದರೆ ಈ ಪಾಠದಲ್ಲಿ ಉಲ್ಲೇಖಿಸಿದ ಪ್ರಕ್ರಿಯೆಗಳೇ ಇರುತ್ತವೆ.
[ಟೀಮ್ ಡೇಟಾ ಸೈನ್ಸ್ ಪ್ರಕ್ರಿಯೆ ಜೀವನಚಕ್ರ](https://docs.microsoft.com/en-us/azure/architecture/data-science-process/lifecycle) ಮತ್ತು [ಕ್ರಾಸ್-ಇಂಡಸ್ಟ್ರಿ ಸ್ಟ್ಯಾಂಡರ್ಡ್ ಪ್ರಕ್ರಿಯೆ ಫಾರ್ ಡೇಟಾ ಮೈನಿಂಗ್](https://www.datascience-pm.com/crisp-dm-2/) ಅನ್ನು ಅನ್ವೇಷಿಸಿ. ಎರಡರ ನಡುವೆ 3 ಸಾಮ್ಯತೆಗಳು ಮತ್ತು ಭೇದಗಳನ್ನು ಹೆಸರಿಸಿ.
|ಟೀಮ್ ಡೇಟಾ ಸೈನ್ಸ್ ಪ್ರಕ್ರಿಯೆ (TDSP)|ಕ್ರಾಸ್-ಇಂಡಸ್ಟ್ರಿ ಸ್ಟ್ಯಾಂಡರ್ಡ್ ಪ್ರಕ್ರಿಯೆ ಫಾರ್ ಡೇಟಾ ಮೈನಿಂಗ್ (CRISP-DM)|
|--|--|
|![ಟೀಮ್ ಡೇಟಾ ಸೈನ್ಸ್ ಜೀವನಚಕ್ರ](../../../../translated_images/tdsp-lifecycle2.e19029d598e2e73d5ef8a4b98837d688ec6044fe332c905d4dbb69eb6d5c1d96.kn.png) | ![ಡೇಟಾ ಸೈನ್ಸ್ ಪ್ರಕ್ರಿಯೆ ಅಲಯನ್ಸ್ ಚಿತ್ರ](../../../../translated_images/CRISP-DM.8bad2b4c66e62aa75278009e38e3e99902c73b0a6f63fd605a67c687a536698c.kn.png) |
| ಚಿತ್ರ: [Microsoft](https://docs.microsoft.comazure/architecture/data-science-process/lifecycle) | ಚಿತ್ರ: [ಡೇಟಾ ಸೈನ್ಸ್ ಪ್ರಕ್ರಿಯೆ ಅಲಯನ್ಸ್](https://www.datascience-pm.com/crisp-dm-2/) |
## [ಪೋಸ್ಟ್-ಲೇಕ್ಚರ್ ಕ್ವಿಜ್](https://ff-quizzes.netlify.app/en/ds/quiz/27)
## ವಿಮರ್ಶೆ ಮತ್ತು ಸ್ವಯಂ ಅಧ್ಯಯನ
ಡೇಟಾ ಸೈನ್ಸ್ ಜೀವನಚಕ್ರವನ್ನು ಅನ್ವಯಿಸುವುದು ಹಲವಾರು ಪಾತ್ರಗಳು ಮತ್ತು ಕಾರ್ಯಗಳನ್ನು ಒಳಗೊಂಡಿದೆ, ಕೆಲವು ವ್ಯಕ್ತಿಗಳು ಪ್ರತಿ ಹಂತದ ನಿರ್ದಿಷ್ಟ ಭಾಗಗಳ ಮೇಲೆ ಕೇಂದ್ರೀಕರಿಸುತ್ತಾರೆ. ಟೀಮ್ ಡೇಟಾ ಸೈನ್ಸ್ ಪ್ರಕ್ರಿಯೆ ಕೆಲವು ಸಂಪನ್ಮೂಲಗಳನ್ನು ಒದಗಿಸುತ್ತದೆ, ಅವು ಪ್ರಾಜೆಕ್ಟಿನಲ್ಲಿ ಯಾರಿಗೆ ಯಾವ ರೀತಿಯ ಪಾತ್ರಗಳು ಮತ್ತು ಕಾರ್ಯಗಳಿರಬಹುದು ಎಂಬುದನ್ನು ವಿವರಿಸುತ್ತವೆ.
* [ಟೀಮ್ ಡೇಟಾ ಸೈನ್ಸ್ ಪ್ರಕ್ರಿಯೆ ಪಾತ್ರಗಳು ಮತ್ತು ಕಾರ್ಯಗಳು](https://docs.microsoft.com/en-us/azure/architecture/data-science-process/roles-tasks)
* [ಡೇಟಾ ಸೈನ್ಸ್ ಕಾರ್ಯಗಳನ್ನು ನಿರ್ವಹಿಸುವುದು: ಅನ್ವೇಷಣೆ, ಮಾದರೀಕರಣ ಮತ್ತು ನಿಯೋಜನೆ](https://docs.microsoft.com/en-us/azure/architecture/data-science-process/execute-data-science-tasks)
## ನಿಯೋಜನೆ
[ಡೇಟಾಸೆಟ್ ಮೌಲ್ಯಮಾಪನ](assignment.md)
---
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
**ಅಸ್ವೀಕಾರ**:
ಈ ದಸ್ತಾವೇಜು AI ಅನುವಾದ ಸೇವೆ [Co-op Translator](https://github.com/Azure/co-op-translator) ಬಳಸಿ ಅನುವಾದಿಸಲಾಗಿದೆ. ನಾವು ನಿಖರತೆಯಿಗಾಗಿ ಪ್ರಯತ್ನಿಸುತ್ತಿದ್ದರೂ, ಸ್ವಯಂಚಾಲಿತ ಅನುವಾದಗಳಲ್ಲಿ ತಪ್ಪುಗಳು ಅಥವಾ ಅಸತ್ಯತೆಗಳು ಇರಬಹುದು ಎಂದು ದಯವಿಟ್ಟು ಗಮನಿಸಿ. ಮೂಲ ಭಾಷೆಯಲ್ಲಿರುವ ಮೂಲ ದಸ್ತಾವೇಜನ್ನು ಅಧಿಕೃತ ಮೂಲವೆಂದು ಪರಿಗಣಿಸಬೇಕು. ಮಹತ್ವದ ಮಾಹಿತಿಗಾಗಿ ವೃತ್ತಿಪರ ಮಾನವ ಅನುವಾದವನ್ನು ಶಿಫಾರಸು ಮಾಡಲಾಗುತ್ತದೆ. ಈ ಅನುವಾದ ಬಳಕೆಯಿಂದ ಉಂಟಾಗುವ ಯಾವುದೇ ತಪ್ಪು ಅರ್ಥಮಾಡಿಕೊಳ್ಳುವಿಕೆ ಅಥವಾ ತಪ್ಪು ವಿವರಣೆಗಳಿಗೆ ನಾವು ಹೊಣೆಗಾರರಾಗುವುದಿಲ್ಲ.
<!-- CO-OP TRANSLATOR DISCLAIMER END -->

@ -0,0 +1,39 @@
<!--
CO_OP_TRANSLATOR_METADATA:
{
"original_hash": "564445c39ad29a491abcb9356fc4d47d",
"translation_date": "2025-12-19T15:29:05+00:00",
"source_file": "4-Data-Science-Lifecycle/14-Introduction/assignment.md",
"language_code": "kn"
}
-->
# ಡೇಟಾಸೆಟ್ ಅನ್ನು ಅಂದಾಜಿಸುವುದು
ನಿಮ್ಮ ತಂಡಕ್ಕೆ ನ್ಯೂಯಾರ್ಕ್ ನಗರದಲ್ಲಿ ಟ್ಯಾಕ್ಸಿ ಗ್ರಾಹಕರ ಋತುಮಾನ ಖರ್ಚು عادತಗಳನ್ನು ಪರಿಶೀಲಿಸಲು ಸಹಾಯ ಮಾಡಲು ಒಂದು ಗ್ರಾಹಕ ಸಂಪರ್ಕಿಸಿದ್ದಾರೆ.
ಅವರು ತಿಳಿಯಲು ಬಯಸುತ್ತಾರೆ: **ನ್ಯೂಯಾರ್ಕ್ ನಗರದಲ್ಲಿ ಹಳದಿ ಟ್ಯಾಕ್ಸಿ ಪ್ರಯಾಣಿಕರು ಚಳಿಗಾಲದಲ್ಲಿ ಅಥವಾ ಬೇಸಿಗೆಯಲ್ಲಿ ಚಾಲಕರಿಗೆ ಹೆಚ್ಚು ಟಿಪ್ ನೀಡುತ್ತಾರಾ?**
ನಿಮ್ಮ ತಂಡ ಡೇಟಾ ಸೈನ್ಸ್ ಜೀವನಚಕ್ರದ [ಕ್ಯಾಪ್ಚರಿಂಗ್](Readme.md#Capturing) ಹಂತದಲ್ಲಿದ್ದು, ನೀವು ಡೇಟಾಸೆಟ್ ನಿರ್ವಹಣೆಗೆ ಜವಾಬ್ದಾರರಾಗಿದ್ದೀರಿ. ನೀವು ಪರಿಶೀಲಿಸಲು ಒಂದು ನೋಟ್ಬುಕ್ ಮತ್ತು [ಡೇಟಾ](../../../../data/taxi.csv) ಅನ್ನು ಒದಗಿಸಲಾಗಿದೆ.
ಈ ಡೈರೆಕ್ಟರಿಯಲ್ಲಿ [ನೋಟ್ಬುಕ್](notebook.ipynb) ಇದೆ, ಇದು ಪೈಥಾನ್ ಬಳಸಿ [NYC ಟ್ಯಾಕ್ಸಿ & ಲಿಮೋಸಿನ್ ಕಮಿಷನ್](https://docs.microsoft.com/en-us/azure/open-datasets/dataset-taxi-yellow?tabs=azureml-opendatasets) ನಿಂದ ಹಳದಿ ಟ್ಯಾಕ್ಸಿ ಪ್ರಯಾಣದ ಡೇಟಾವನ್ನು ಲೋಡ್ ಮಾಡುತ್ತದೆ.
ನೀವು ಟ್ಯಾಕ್ಸಿ ಡೇಟಾ ಫೈಲ್ ಅನ್ನು ಪಠ್ಯ ಸಂಪಾದಕ ಅಥವಾ ಎಕ್ಸೆಲ್ ಮುಂತಾದ ಸ್ಪ್ರೆಡ್ಶೀಟ್ ಸಾಫ್ಟ್‌ವೇರ್‌ನಲ್ಲಿ ಕೂಡ ತೆರೆಯಬಹುದು.
## ಸೂಚನೆಗಳು
- ಈ ಡೇಟಾಸೆಟ್‌ನಲ್ಲಿರುವ ಡೇಟಾ ಪ್ರಶ್ನೆಗೆ ಉತ್ತರಿಸಲು ಸಹಾಯ ಮಾಡಬಹುದೇ ಎಂದು ಅಂದಾಜಿಸಿ.
- [NYC ಓಪನ್ ಡೇಟಾ ಕ್ಯಾಟಲಾಗ್](https://data.cityofnewyork.us/browse?sortBy=most_accessed&utf8=%E2%9C%93) ಅನ್ನು ಅನ್ವೇಷಿಸಿ. ಗ್ರಾಹಕರ ಪ್ರಶ್ನೆಗೆ ಉತ್ತರಿಸಲು ಸಹಾಯವಾಗಬಹುದಾದ ಮತ್ತೊಂದು ಡೇಟಾಸೆಟ್ ಅನ್ನು ಗುರುತಿಸಿ.
- ಸಮಸ್ಯೆಯ ಬಗ್ಗೆ ಹೆಚ್ಚಿನ ಸ್ಪಷ್ಟತೆ ಮತ್ತು ಉತ್ತಮ ಅರ್ಥಮಾಡಿಕೊಳ್ಳಲು ನೀವು ಗ್ರಾಹಕರಿಗೆ ಕೇಳಬಹುದಾದ 3 ಪ್ರಶ್ನೆಗಳನ್ನು ಬರೆಯಿರಿ.
ಡೇಟಾ ಬಗ್ಗೆ ಹೆಚ್ಚಿನ ಮಾಹಿತಿಗಾಗಿ [ಡೇಟಾಸೆಟ್‌ನ ಡಿಕ್ಷನರಿ](https://www1.nyc.gov/assets/tlc/downloads/pdf/data_dictionary_trip_records_yellow.pdf) ಮತ್ತು [ಬಳಕೆದಾರ ಮಾರ್ಗದರ್ಶಿ](https://www1.nyc.gov/assets/tlc/downloads/pdf/trip_record_user_guide.pdf) ಅನ್ನು ನೋಡಿ.
## ರೂಬ್ರಿಕ್
ಉತ್ತಮ | ತೃಪ್ತಿಕರ | ಸುಧಾರಣೆ ಅಗತ್ಯ
--- | --- | --
---
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
**ಅಸ್ವೀಕರಣ**:
ಈ ದಸ್ತಾವೇಜು [Co-op Translator](https://github.com/Azure/co-op-translator) ಎಂಬ AI ಅನುವಾದ ಸೇವೆಯನ್ನು ಬಳಸಿ ಅನುವಾದಿಸಲಾಗಿದೆ. ನಾವು ಶುದ್ಧತೆಯತ್ತ ಪ್ರಯತ್ನಿಸುತ್ತಿದ್ದರೂ, ಸ್ವಯಂಚಾಲಿತ ಅನುವಾದಗಳಲ್ಲಿ ತಪ್ಪುಗಳು ಅಥವಾ ಅಸತ್ಯತೆಗಳು ಇರಬಹುದು ಎಂದು ದಯವಿಟ್ಟು ಗಮನಿಸಿ. ಮೂಲ ಭಾಷೆಯಲ್ಲಿರುವ ಮೂಲ ದಸ್ತಾವೇಜನ್ನು ಅಧಿಕೃತ ಮೂಲವೆಂದು ಪರಿಗಣಿಸಬೇಕು. ಮಹತ್ವದ ಮಾಹಿತಿಗಾಗಿ, ವೃತ್ತಿಪರ ಮಾನವ ಅನುವಾದವನ್ನು ಶಿಫಾರಸು ಮಾಡಲಾಗುತ್ತದೆ. ಈ ಅನುವಾದ ಬಳಕೆಯಿಂದ ಉಂಟಾಗುವ ಯಾವುದೇ ತಪ್ಪು ಅರ್ಥಮಾಡಿಕೊಳ್ಳುವಿಕೆ ಅಥವಾ ತಪ್ಪು ವಿವರಣೆಗಳಿಗೆ ನಾವು ಹೊಣೆಗಾರರಾಗುವುದಿಲ್ಲ.
<!-- CO-OP TRANSLATOR DISCLAIMER END -->

@ -0,0 +1,140 @@
{
"cells": [
{
"cell_type": "markdown",
"source": [
"# ಶೀತಕಾಲ ಮತ್ತು ಬೇಸಿಗೆಗಳಲ್ಲಿ NYC ಟ್ಯಾಕ್ಸಿ ಡೇಟಾ\n",
"\n",
"ಕೊಟ್ಟಿರುವ ಕಾಲಮ್‌ಗಳ ಬಗ್ಗೆ ಹೆಚ್ಚಿನ ಮಾಹಿತಿಗಾಗಿ [ಡೇಟಾ ನಿಘಂಟು](https://www1.nyc.gov/assets/tlc/downloads/pdf/data_dictionary_trip_records_yellow.pdf) ಅನ್ನು ನೋಡಿ.\n"
],
"metadata": {}
},
{
"cell_type": "code",
"execution_count": null,
"source": [
"#Install the pandas library\r\n",
"!pip install pandas"
],
"outputs": [],
"metadata": {
"scrolled": true
}
},
{
"cell_type": "code",
"execution_count": 7,
"source": [
"import pandas as pd\r\n",
"\r\n",
"path = '../../data/taxi.csv'\r\n",
"\r\n",
"#Load the csv file into a dataframe\r\n",
"df = pd.read_csv(path)\r\n",
"\r\n",
"#Print the dataframe\r\n",
"print(df)\r\n"
],
"outputs": [
{
"output_type": "stream",
"name": "stdout",
"text": [
" VendorID tpep_pickup_datetime tpep_dropoff_datetime passenger_count \\\n",
"0 2.0 2019-07-15 16:27:53 2019-07-15 16:44:21 3.0 \n",
"1 2.0 2019-07-17 20:26:35 2019-07-17 20:40:09 6.0 \n",
"2 2.0 2019-07-06 16:01:08 2019-07-06 16:10:25 1.0 \n",
"3 1.0 2019-07-18 22:32:23 2019-07-18 22:35:08 1.0 \n",
"4 2.0 2019-07-19 14:54:29 2019-07-19 15:19:08 1.0 \n",
".. ... ... ... ... \n",
"195 2.0 2019-01-18 08:42:15 2019-01-18 08:56:57 1.0 \n",
"196 1.0 2019-01-19 04:34:45 2019-01-19 04:43:44 1.0 \n",
"197 2.0 2019-01-05 10:37:39 2019-01-05 10:42:03 1.0 \n",
"198 2.0 2019-01-23 10:36:29 2019-01-23 10:44:34 2.0 \n",
"199 2.0 2019-01-30 06:55:58 2019-01-30 07:07:02 5.0 \n",
"\n",
" trip_distance RatecodeID store_and_fwd_flag PULocationID DOLocationID \\\n",
"0 2.02 1.0 N 186 233 \n",
"1 1.59 1.0 N 141 161 \n",
"2 1.69 1.0 N 246 249 \n",
"3 0.90 1.0 N 229 141 \n",
"4 4.79 1.0 N 237 107 \n",
".. ... ... ... ... ... \n",
"195 1.18 1.0 N 43 237 \n",
"196 2.30 1.0 N 148 234 \n",
"197 0.83 1.0 N 237 263 \n",
"198 1.12 1.0 N 144 113 \n",
"199 2.41 1.0 N 209 107 \n",
"\n",
" payment_type fare_amount extra mta_tax tip_amount tolls_amount \\\n",
"0 1.0 12.0 1.0 0.5 4.08 0.0 \n",
"1 2.0 10.0 0.5 0.5 0.00 0.0 \n",
"2 2.0 8.5 0.0 0.5 0.00 0.0 \n",
"3 1.0 4.5 3.0 0.5 1.65 0.0 \n",
"4 1.0 19.5 0.0 0.5 5.70 0.0 \n",
".. ... ... ... ... ... ... \n",
"195 1.0 10.0 0.0 0.5 2.16 0.0 \n",
"196 1.0 9.5 0.5 0.5 2.15 0.0 \n",
"197 1.0 5.0 0.0 0.5 1.16 0.0 \n",
"198 2.0 7.0 0.0 0.5 0.00 0.0 \n",
"199 1.0 10.5 0.0 0.5 1.00 0.0 \n",
"\n",
" improvement_surcharge total_amount congestion_surcharge \n",
"0 0.3 20.38 2.5 \n",
"1 0.3 13.80 2.5 \n",
"2 0.3 11.80 2.5 \n",
"3 0.3 9.95 2.5 \n",
"4 0.3 28.50 2.5 \n",
".. ... ... ... \n",
"195 0.3 12.96 0.0 \n",
"196 0.3 12.95 0.0 \n",
"197 0.3 6.96 0.0 \n",
"198 0.3 7.80 0.0 \n",
"199 0.3 12.30 0.0 \n",
"\n",
"[200 rows x 18 columns]\n"
]
}
],
"metadata": {}
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"---\n\n<!-- CO-OP TRANSLATOR DISCLAIMER START -->\n**ಅಸ್ವೀಕರಣ**: \nಈ ದಸ್ತಾವೇಜು AI ಅನುವಾದ ಸೇವೆ [Co-op Translator](https://github.com/Azure/co-op-translator) ಬಳಸಿ ಅನುವಾದಿಸಲಾಗಿದೆ. ನಾವು ನಿಖರತೆಯಿಗಾಗಿ ಪ್ರಯತ್ನಿಸುತ್ತಿದ್ದರೂ, ಸ್ವಯಂಚಾಲಿತ ಅನುವಾದಗಳಲ್ಲಿ ದೋಷಗಳು ಅಥವಾ ಅಸತ್ಯತೆಗಳು ಇರಬಹುದು ಎಂದು ದಯವಿಟ್ಟು ಗಮನಿಸಿ. ಮೂಲ ಭಾಷೆಯಲ್ಲಿರುವ ಮೂಲ ದಸ್ತಾವೇಜನ್ನು ಅಧಿಕೃತ ಮೂಲವಾಗಿ ಪರಿಗಣಿಸಬೇಕು. ಮಹತ್ವದ ಮಾಹಿತಿಗಾಗಿ, ವೃತ್ತಿಪರ ಮಾನವ ಅನುವಾದವನ್ನು ಶಿಫಾರಸು ಮಾಡಲಾಗುತ್ತದೆ. ಈ ಅನುವಾದ ಬಳಕೆಯಿಂದ ಉಂಟಾಗುವ ಯಾವುದೇ ತಪ್ಪು ಅರ್ಥಮಾಡಿಕೊಳ್ಳುವಿಕೆ ಅಥವಾ ತಪ್ಪು ವಿವರಣೆಗಳಿಗೆ ನಾವು ಹೊಣೆಗಾರರಾಗುವುದಿಲ್ಲ.\n<!-- CO-OP TRANSLATOR DISCLAIMER END -->\n"
]
}
],
"metadata": {
"kernelspec": {
"name": "python3",
"display_name": "Python 3.9.7 64-bit ('venv': venv)"
},
"language_info": {
"mimetype": "text/x-python",
"name": "python",
"pygments_lexer": "ipython3",
"codemirror_mode": {
"name": "ipython",
"version": 3
},
"version": "3.9.7",
"nbconvert_exporter": "python",
"file_extension": ".py"
},
"name": "04-nyc-taxi-join-weather-in-pandas",
"notebookId": 1709144033725344,
"interpreter": {
"hash": "6b9b57232c4b57163d057191678da2030059e733b8becc68f245de5a75abe84e"
},
"coopTranslator": {
"original_hash": "3bd4c20c4e8f3158f483f0f1cc543bb1",
"translation_date": "2025-12-19T17:11:57+00:00",
"source_file": "4-Data-Science-Lifecycle/14-Introduction/notebook.ipynb",
"language_code": "kn"
}
},
"nbformat": 4,
"nbformat_minor": 2
}

@ -0,0 +1,60 @@
<!--
CO_OP_TRANSLATOR_METADATA:
{
"original_hash": "661dad02c3ac239644d34c1eb51e76f8",
"translation_date": "2025-12-19T15:25:24+00:00",
"source_file": "4-Data-Science-Lifecycle/15-analyzing/README.md",
"language_code": "kn"
}
-->
# ಡೇಟಾ ಸೈನ್ಸ್ ಜೀವನಚಕ್ರ: ವಿಶ್ಲೇಷಣೆ
|![ [(@sketchthedocs)](https://sketchthedocs.dev) ಅವರ ಸ್ಕೆಚ್ ನೋಟ್ ](../../sketchnotes/15-Analyzing.png)|
|:---:|
| ಡೇಟಾ ಸೈನ್ಸ್ ಜೀವನಚಕ್ರ: ವಿಶ್ಲೇಷಣೆ - _[@nitya](https://twitter.com/nitya) ಅವರ ಸ್ಕೆಚ್ ನೋಟ್_ |
## [ಪೂರ್ವ-ಲೇಕ್ಚರ್ ಕ್ವಿಜ್](https://ff-quizzes.netlify.app/en/ds/quiz/28)
ಡೇಟಾ ಜೀವನಚಕ್ರದಲ್ಲಿ ವಿಶ್ಲೇಷಣೆ ಎಂದರೆ, ಡೇಟಾ ಪ್ರಸ್ತಾಪಿಸಿದ ಪ್ರಶ್ನೆಗಳಿಗೆ ಉತ್ತರ ನೀಡಬಹುದೇ ಅಥವಾ ನಿರ್ದಿಷ್ಟ ಸಮಸ್ಯೆಯನ್ನು ಪರಿಹರಿಸಬಹುದೇ ಎಂದು ದೃಢೀಕರಿಸುವುದು. ಈ ಹಂತವು ಮಾದರಿಯು ಈ ಪ್ರಶ್ನೆಗಳು ಮತ್ತು ಸಮಸ್ಯೆಗಳನ್ನು ಸರಿಯಾಗಿ ಪರಿಹರಿಸುತ್ತಿದೆಯೇ ಎಂದು ದೃಢೀಕರಿಸುವುದರ ಮೇಲೂ ಕೇಂದ್ರೀಕರಿಸಬಹುದು. ಈ ಪಾಠವು ಅನ್ವೇಷಣಾತ್ಮಕ ಡೇಟಾ ವಿಶ್ಲೇಷಣೆ ಅಥವಾ EDA ಮೇಲೆ ಕೇಂದ್ರೀಕರಿಸಿದೆ, ಇದು ಡೇಟಾದೊಳಗಿನ ಲಕ್ಷಣಗಳು ಮತ್ತು ಸಂಬಂಧಗಳನ್ನು ನಿರ್ಧರಿಸುವ ತಂತ್ರಗಳು ಮತ್ತು ಮಾದರಿಗಾಗಿ ಡೇಟಾವನ್ನು ಸಿದ್ಧಪಡಿಸಲು ಬಳಸಬಹುದು.
ನಾವು [Kaggle](https://www.kaggle.com/balaka18/email-spam-classification-dataset-csv/version/1) ನಿಂದ ಉದಾಹರಣಾ ಡೇಟಾಸೆಟ್ ಅನ್ನು ಬಳಸುತ್ತೇವೆ, ಇದನ್ನು Python ಮತ್ತು Pandas ಗ್ರಂಥಾಲಯದೊಂದಿಗೆ ಹೇಗೆ ಅನ್ವಯಿಸಬಹುದು ಎಂದು ತೋರಿಸಲು. ಈ ಡೇಟಾಸೆಟ್ ಇಮೇಲ್‌ಗಳಲ್ಲಿ ಕಂಡುಬರುವ ಕೆಲವು ಸಾಮಾನ್ಯ ಪದಗಳ ಎಣಿಕೆಯನ್ನು ಹೊಂದಿದೆ, ಈ ಇಮೇಲ್‌ಗಳ ಮೂಲಗಳು ಅನಾಮಧೇಯವಾಗಿವೆ. ಈ ಡೈರೆಕ್ಟರಿಯಲ್ಲಿರುವ [ನೋಟ್ಬುಕ್](notebook.ipynb) ಅನ್ನು ಅನುಸರಿಸಿ.
## ಅನ್ವೇಷಣಾತ್ಮಕ ಡೇಟಾ ವಿಶ್ಲೇಷಣೆ
ಜೀವನಚಕ್ರದ ಕ್ಯಾಪ್ಚರ್ ಹಂತದಲ್ಲಿ ಡೇಟಾ ಮತ್ತು ಸಮಸ್ಯೆಗಳು ಮತ್ತು ಪ್ರಶ್ನೆಗಳು ಪಡೆಯಲ್ಪಡುತ್ತವೆ, ಆದರೆ ಡೇಟಾ ಅಂತಿಮ ಫಲಿತಾಂಶವನ್ನು ಬೆಂಬಲಿಸಬಹುದೆಂದು ನಾವು ಹೇಗೆ ತಿಳಿದುಕೊಳ್ಳಬಹುದು?
ಡೇಟಾ ವಿಜ್ಞಾನಿ ಡೇಟಾ ಪಡೆಯುವಾಗ ಕೆಳಗಿನ ಪ್ರಶ್ನೆಗಳನ್ನು ಕೇಳಬಹುದು ಎಂದು ನೆನಪಿಸಿಕೊಳ್ಳಿ:
- ಈ ಸಮಸ್ಯೆಯನ್ನು ಪರಿಹರಿಸಲು ನನಗೆ ಸಾಕಷ್ಟು ಡೇಟಾ ಇದೆಯೇ?
- ಈ ಸಮಸ್ಯೆಗೆ ಡೇಟಾ ಸ್ವೀಕಾರ್ಯ ಗುಣಮಟ್ಟದಿದೆಯೇ?
- ಈ ಡೇಟಾದ ಮೂಲಕ ಹೆಚ್ಚುವರಿ ಮಾಹಿತಿಯನ್ನು ಕಂಡುಹಿಡಿದರೆ, ಗುರಿಗಳನ್ನು ಬದಲಾಯಿಸುವ ಅಥವಾ ಮರುನಿರ್ಧರಿಸುವ ಬಗ್ಗೆ ಪರಿಗಣಿಸಬೇಕೇ?
ಅನ್ವೇಷಣಾತ್ಮಕ ಡೇಟಾ ವಿಶ್ಲೇಷಣೆ ಎಂದರೆ ಆ ಡೇಟಾವನ್ನು ತಿಳಿದುಕೊಳ್ಳುವ ಪ್ರಕ್ರಿಯೆ ಮತ್ತು ಈ ಪ್ರಶ್ನೆಗಳಿಗೆ ಉತ್ತರ ನೀಡಲು, ಜೊತೆಗೆ ಡೇಟಾಸೆಟ್‌ನೊಂದಿಗೆ ಕೆಲಸ ಮಾಡುವ ಸವಾಲುಗಳನ್ನು ಗುರುತಿಸಲು ಬಳಸಬಹುದು. ಇದನ್ನು ಸಾಧಿಸಲು ಬಳಸುವ ಕೆಲವು ತಂತ್ರಗಳ ಮೇಲೆ ಗಮನಹರಿಸೋಣ.
## ಡೇಟಾ ಪ್ರೊಫೈಲಿಂಗ್, ವರ್ಣನಾತ್ಮಕ ಅಂಕಿಅಂಶಗಳು ಮತ್ತು Pandas
ನಾವು ಈ ಸಮಸ್ಯೆಯನ್ನು ಪರಿಹರಿಸಲು ಸಾಕಷ್ಟು ಡೇಟಾ ಹೊಂದಿದ್ದೇವೆ ಎಂದು ಹೇಗೆ ಮೌಲ್ಯಮಾಪನ ಮಾಡಬಹುದು? ಡೇಟಾ ಪ್ರೊಫೈಲಿಂಗ್ ನಮ್ಮ ಡೇಟಾಸೆಟ್ ಬಗ್ಗೆ ಕೆಲವು ಸಾಮಾನ್ಯ ಮಾಹಿತಿಯನ್ನು ಸಂಗ್ರಹಿಸಿ ಸಾರಾಂಶ ನೀಡಬಹುದು, ಇದು ವರ್ಣನಾತ್ಮಕ ಅಂಕಿಅಂಶಗಳ ತಂತ್ರಗಳ ಮೂಲಕ ಸಾಧ್ಯ. ಡೇಟಾ ಪ್ರೊಫೈಲಿಂಗ್ ನಮಗೆ ಲಭ್ಯವಿರುವುದನ್ನು ಅರ್ಥಮಾಡಿಕೊಳ್ಳಲು ಸಹಾಯ ಮಾಡುತ್ತದೆ, ಮತ್ತು ವರ್ಣನಾತ್ಮಕ ಅಂಕಿಅಂಶಗಳು ನಮಗೆ ಎಷ್ಟು ವಸ್ತುಗಳು ಲಭ್ಯವಿವೆ ಎಂದು ತಿಳಿಯಲು ಸಹಾಯ ಮಾಡುತ್ತವೆ.
ಹಿಂದಿನ ಕೆಲವು ಪಾಠಗಳಲ್ಲಿ, ನಾವು Pandas ನ [`describe()` ಫಂಕ್ಷನ್](https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.describe.html) ಅನ್ನು ಬಳಸಿದ್ದೇವೆ. ಇದು ಸಂಖ್ಯಾತ್ಮಕ ಡೇಟಾದ ಮೇಲೆ ಎಣಿಕೆ, ಗರಿಷ್ಠ ಮತ್ತು ಕನಿಷ್ಠ ಮೌಲ್ಯಗಳು, ಸರಾಸರಿ, ಮಾನಕ ವ್ಯತ್ಯಾಸ ಮತ್ತು ಕ್ವಾಂಟೈಲ್‌ಗಳನ್ನು ಒದಗಿಸುತ್ತದೆ. `describe()` ಫಂಕ್ಷನ್ ಹೋಲುವ ವರ್ಣನಾತ್ಮಕ ಅಂಕಿಅಂಶಗಳನ್ನು ಬಳಸಿಕೊಂಡು ನೀವು ಎಷ್ಟು ಡೇಟಾ ಹೊಂದಿದ್ದೀರಿ ಮತ್ತು ಇನ್ನಷ್ಟು ಬೇಕೇ ಎಂದು ಅಂದಾಜು ಮಾಡಬಹುದು.
## ಸ್ಯಾಂಪ್ಲಿಂಗ್ ಮತ್ತು ಕ್ವೆರಿಂಗ್
ದೊಡ್ಡ ಡೇಟಾಸೆಟ್‌ನಲ್ಲಿನ ಎಲ್ಲವನ್ನೂ ಅನ್ವೇಷಿಸುವುದು ಬಹಳ ಸಮಯ ತೆಗೆದುಕೊಳ್ಳಬಹುದು ಮತ್ತು ಸಾಮಾನ್ಯವಾಗಿ ಕಂಪ್ಯೂಟರ್‌ಗೆ ಬಿಟ್ಟುಕೊಡಲಾಗುವ ಕೆಲಸ. ಆದಾಗ್ಯೂ, ಸ್ಯಾಂಪ್ಲಿಂಗ್ ಡೇಟಾವನ್ನು ಅರ್ಥಮಾಡಿಕೊಳ್ಳಲು ಸಹಾಯಕ ಸಾಧನವಾಗಿದೆ ಮತ್ತು ಡೇಟಾಸೆಟ್‌ನಲ್ಲಿ ಏನಿದೆ ಮತ್ತು ಅದು ಏನನ್ನು ಪ್ರತಿನಿಧಿಸುತ್ತದೆ ಎಂಬುದರ ಉತ್ತಮ ಅರ್ಥವನ್ನು ನೀಡುತ್ತದೆ. ಸ್ಯಾಂಪಲ್ ಮೂಲಕ, ನೀವು ಪ್ರಾಬಬಿಲಿಟಿ ಮತ್ತು ಅಂಕಿಅಂಶಗಳನ್ನು ಅನ್ವಯಿಸಿ ನಿಮ್ಮ ಡೇಟಾ ಬಗ್ಗೆ ಸಾಮಾನ್ಯ ನಿರ್ಣಯಗಳಿಗೆ ಬರಬಹುದು. ನೀವು ಎಷ್ಟು ಡೇಟಾ ಸ್ಯಾಂಪಲ್ ಮಾಡಬೇಕು ಎಂಬುದಕ್ಕೆ ನಿರ್ದಿಷ್ಟ ನಿಯಮವಿಲ್ಲ, ಆದರೆ ಹೆಚ್ಚು ಡೇಟಾ ಸ್ಯಾಂಪಲ್ ಮಾಡಿದರೆ, ಡೇಟಾ ಬಗ್ಗೆ ನೀವು ಮಾಡಬಹುದಾದ ಸಾಮಾನ್ಯೀಕರಣ ಹೆಚ್ಚು ನಿಖರವಾಗಿರುತ್ತದೆ.
Pandas ನಲ್ಲಿ [`sample()` ಫಂಕ್ಷನ್](https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.sample.html) ಇದೆ, ಇದರಲ್ಲಿ ನೀವು ಎಷ್ಟು ಯಾದೃಚ್ಛಿಕ ಸ್ಯಾಂಪಲ್‌ಗಳನ್ನು ಪಡೆಯಲು ಇಚ್ಛಿಸುತ್ತೀರಿ ಎಂಬ ಆರ್ಗ್ಯುಮೆಂಟ್ ಅನ್ನು ಪಾಸ್ ಮಾಡಬಹುದು.
ಡೇಟಾದ ಸಾಮಾನ್ಯ ಕ್ವೆರಿಗಳು ನಿಮಗೆ ಕೆಲವು ಸಾಮಾನ್ಯ ಪ್ರಶ್ನೆಗಳು ಮತ್ತು ಸಿದ್ಧಾಂತಗಳಿಗೆ ಉತ್ತರ ನೀಡಲು ಸಹಾಯ ಮಾಡಬಹುದು. ಸ್ಯಾಂಪ್ಲಿಂಗ್‌ಗೆ ವಿರುದ್ಧವಾಗಿ, ಕ್ವೆರಿಗಳು ನಿಮಗೆ ನಿಯಂತ್ರಣ ಮತ್ತು ನಿಮ್ಮ ಪ್ರಶ್ನೆಗಳಿರುವ ಡೇಟಾದ ನಿರ್ದಿಷ್ಟ ಭಾಗಗಳ ಮೇಲೆ ಕೇಂದ್ರೀಕರಿಸಲು ಅವಕಾಶ ನೀಡುತ್ತವೆ.
Pandas ಗ್ರಂಥಾಲಯದ [`query()` ಫಂಕ್ಷನ್](https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.query.html) ನಿಮಗೆ ಕಾಲಮ್‌ಗಳನ್ನು ಆಯ್ಕೆಮಾಡಲು ಮತ್ತು ಪಡೆಯಲಾದ ಸಾಲುಗಳ ಮೂಲಕ ಡೇಟಾ ಬಗ್ಗೆ ಸರಳ ಉತ್ತರಗಳನ್ನು ಪಡೆಯಲು ಅನುಮತಿಸುತ್ತದೆ.
## ದೃಶ್ಯೀಕರಣಗಳೊಂದಿಗೆ ಅನ್ವೇಷಣೆ
ಡೇಟಾ ಸಂಪೂರ್ಣವಾಗಿ ಶುದ್ಧೀಕರಿಸಿ ವಿಶ್ಲೇಷಿಸುವವರೆಗೆ ಕಾಯಬೇಕಾಗಿಲ್ಲ, ದೃಶ್ಯೀಕರಣಗಳನ್ನು ಸೃಷ್ಟಿಸುವುದನ್ನು ಪ್ರಾರಂಭಿಸಲು. ವಾಸ್ತವದಲ್ಲಿ, ಅನ್ವೇಷಿಸುವಾಗ ದೃಶ್ಯಾತ್ಮಕ ಪ್ರತಿನಿಧಾನವು ಮಾದರಿಗಳು, ಸಂಬಂಧಗಳು ಮತ್ತು ಸಮಸ್ಯೆಗಳನ್ನು ಗುರುತಿಸಲು ಸಹಾಯ ಮಾಡುತ್ತದೆ. ಜೊತೆಗೆ, ದೃಶ್ಯೀಕರಣಗಳು ಡೇಟಾ ನಿರ್ವಹಣೆಯಲ್ಲಿ ಭಾಗವಹಿಸದವರೊಂದಿಗೆ ಸಂವಹನದ ಮಾರ್ಗವನ್ನು ಒದಗಿಸುತ್ತವೆ ಮತ್ತು ಕ್ಯಾಪ್ಚರ್ ಹಂತದಲ್ಲಿ ಸ್ಪರ್ಶಿಸಲ್ಪಟ್ಟಿಲ್ಲದ ಹೆಚ್ಚುವರಿ ಪ್ರಶ್ನೆಗಳನ್ನು ಹಂಚಿಕೊಳ್ಳಲು ಮತ್ತು ಸ್ಪಷ್ಟಪಡಿಸಲು ಅವಕಾಶ ನೀಡಬಹುದು. ದೃಶ್ಯೀಕರಣಗಳ ಬಗ್ಗೆ ಹೆಚ್ಚು ತಿಳಿಯಲು [ದೃಶ್ಯೀಕರಣಗಳ ವಿಭಾಗ](../../../../../../../../../3-Data-Visualization) ಅನ್ನು ನೋಡಿ.
## ಅಸಂಗತಿಗಳನ್ನು ಗುರುತಿಸಲು ಅನ್ವೇಷಣೆ
ಈ ಪಾಠದ ಎಲ್ಲಾ ವಿಷಯಗಳು ಕಳೆದುಹೋಗಿದ ಅಥವಾ ಅಸಂಗತ ಮೌಲ್ಯಗಳನ್ನು ಗುರುತಿಸಲು ಸಹಾಯ ಮಾಡಬಹುದು, ಆದರೆ Pandas ಕೆಲವು ಫಂಕ್ಷನ್‌ಗಳನ್ನು ಒದಗಿಸುತ್ತದೆ. [isna() ಅಥವಾ isnull()](https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.isna.html) ಕಳೆದುಹೋಗಿದ ಮೌಲ್ಯಗಳನ್ನು ಪರಿಶೀಲಿಸಬಹುದು. ನಿಮ್ಮ ಡೇಟಾದೊಳಗಿನ ಈ ಮೌಲ್ಯಗಳನ್ನು ಅನ್ವೇಷಿಸುವ ಪ್ರಮುಖ ಭಾಗವೆಂದರೆ ಅವು ಮೊದಲಿಗೆ ಏಕೆ ಹಾಗಾಗಿವೆ ಎಂದು ಅನ್ವೇಷಿಸುವುದು. ಇದು ಅವುಗಳನ್ನು ಪರಿಹರಿಸಲು ತೆಗೆದುಕೊಳ್ಳಬೇಕಾದ [ಕ್ರಿಯೆಗಳ ಬಗ್ಗೆ ನಿರ್ಧಾರ ಮಾಡಲು](/2-Working-With-Data/08-data-preparation/notebook.ipynb) ಸಹಾಯ ಮಾಡುತ್ತದೆ.
## [ಪೋಸ್ಟ್-ಲೇಕ್ಚರ್ ಕ್ವಿಜ್](https://ff-quizzes.netlify.app/en/ds/quiz/29)
## ಅಸೈನ್‌ಮೆಂಟ್
[ಉತ್ತರಗಳನ್ನು ಅನ್ವೇಷಿಸುವುದು](assignment.md)
---
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
**ಅಸ್ವೀಕರಣ**:
ಈ ದಸ್ತಾವೇಜು [Co-op Translator](https://github.com/Azure/co-op-translator) ಎಂಬ AI ಅನುವಾದ ಸೇವೆಯನ್ನು ಬಳಸಿ ಅನುವಾದಿಸಲಾಗಿದೆ. ನಾವು ಶುದ್ಧತೆಯತ್ತ ಪ್ರಯತ್ನಿಸುತ್ತಿದ್ದರೂ, ಸ್ವಯಂಚಾಲಿತ ಅನುವಾದಗಳಲ್ಲಿ ತಪ್ಪುಗಳು ಅಥವಾ ಅಸತ್ಯತೆಗಳು ಇರಬಹುದು ಎಂಬುದನ್ನು ದಯವಿಟ್ಟು ಗಮನಿಸಿ. ಮೂಲ ಭಾಷೆಯಲ್ಲಿರುವ ಮೂಲ ದಸ್ತಾವೇಜನ್ನು ಅಧಿಕೃತ ಮೂಲವೆಂದು ಪರಿಗಣಿಸಬೇಕು. ಮಹತ್ವದ ಮಾಹಿತಿಗಾಗಿ, ವೃತ್ತಿಪರ ಮಾನವ ಅನುವಾದವನ್ನು ಶಿಫಾರಸು ಮಾಡಲಾಗುತ್ತದೆ. ಈ ಅನುವಾದ ಬಳಕೆಯಿಂದ ಉಂಟಾಗುವ ಯಾವುದೇ ತಪ್ಪು ಅರ್ಥಮಾಡಿಕೊಳ್ಳುವಿಕೆ ಅಥವಾ ತಪ್ಪು ವಿವರಣೆಗಳಿಗೆ ನಾವು ಹೊಣೆಗಾರರಾಗುವುದಿಲ್ಲ.
<!-- CO-OP TRANSLATOR DISCLAIMER END -->

@ -0,0 +1,154 @@
{
"cells": [
{
"cell_type": "markdown",
"source": [
"# ಶೀತಕಾಲ ಮತ್ತು ಬೇಸಿಗೆಗಳಲ್ಲಿ NYC ಟ್ಯಾಕ್ಸಿ ಡೇಟಾ\n",
"\n",
"ಕೊಟ್ಟಿರುವ ಕಾಲಮ್‌ಗಳ ಬಗ್ಗೆ ಹೆಚ್ಚಿನ ಮಾಹಿತಿಗಾಗಿ [ಡೇಟಾ ನಿಘಂಟು](https://www1.nyc.gov/assets/tlc/downloads/pdf/data_dictionary_trip_records_yellow.pdf) ಅನ್ನು ನೋಡಿ.\n"
],
"metadata": {}
},
{
"cell_type": "code",
"execution_count": null,
"source": [
"#Install the pandas library\r\n",
"!pip install pandas"
],
"outputs": [],
"metadata": {
"scrolled": true
}
},
{
"cell_type": "code",
"execution_count": 7,
"source": [
"import pandas as pd\r\n",
"\r\n",
"path = '../../data/taxi.csv'\r\n",
"\r\n",
"#Load the csv file into a dataframe\r\n",
"df = pd.read_csv(path)\r\n",
"\r\n",
"#Print the dataframe\r\n",
"print(df)\r\n"
],
"outputs": [
{
"output_type": "stream",
"name": "stdout",
"text": [
" VendorID tpep_pickup_datetime tpep_dropoff_datetime passenger_count \\\n",
"0 2.0 2019-07-15 16:27:53 2019-07-15 16:44:21 3.0 \n",
"1 2.0 2019-07-17 20:26:35 2019-07-17 20:40:09 6.0 \n",
"2 2.0 2019-07-06 16:01:08 2019-07-06 16:10:25 1.0 \n",
"3 1.0 2019-07-18 22:32:23 2019-07-18 22:35:08 1.0 \n",
"4 2.0 2019-07-19 14:54:29 2019-07-19 15:19:08 1.0 \n",
".. ... ... ... ... \n",
"195 2.0 2019-01-18 08:42:15 2019-01-18 08:56:57 1.0 \n",
"196 1.0 2019-01-19 04:34:45 2019-01-19 04:43:44 1.0 \n",
"197 2.0 2019-01-05 10:37:39 2019-01-05 10:42:03 1.0 \n",
"198 2.0 2019-01-23 10:36:29 2019-01-23 10:44:34 2.0 \n",
"199 2.0 2019-01-30 06:55:58 2019-01-30 07:07:02 5.0 \n",
"\n",
" trip_distance RatecodeID store_and_fwd_flag PULocationID DOLocationID \\\n",
"0 2.02 1.0 N 186 233 \n",
"1 1.59 1.0 N 141 161 \n",
"2 1.69 1.0 N 246 249 \n",
"3 0.90 1.0 N 229 141 \n",
"4 4.79 1.0 N 237 107 \n",
".. ... ... ... ... ... \n",
"195 1.18 1.0 N 43 237 \n",
"196 2.30 1.0 N 148 234 \n",
"197 0.83 1.0 N 237 263 \n",
"198 1.12 1.0 N 144 113 \n",
"199 2.41 1.0 N 209 107 \n",
"\n",
" payment_type fare_amount extra mta_tax tip_amount tolls_amount \\\n",
"0 1.0 12.0 1.0 0.5 4.08 0.0 \n",
"1 2.0 10.0 0.5 0.5 0.00 0.0 \n",
"2 2.0 8.5 0.0 0.5 0.00 0.0 \n",
"3 1.0 4.5 3.0 0.5 1.65 0.0 \n",
"4 1.0 19.5 0.0 0.5 5.70 0.0 \n",
".. ... ... ... ... ... ... \n",
"195 1.0 10.0 0.0 0.5 2.16 0.0 \n",
"196 1.0 9.5 0.5 0.5 2.15 0.0 \n",
"197 1.0 5.0 0.0 0.5 1.16 0.0 \n",
"198 2.0 7.0 0.0 0.5 0.00 0.0 \n",
"199 1.0 10.5 0.0 0.5 1.00 0.0 \n",
"\n",
" improvement_surcharge total_amount congestion_surcharge \n",
"0 0.3 20.38 2.5 \n",
"1 0.3 13.80 2.5 \n",
"2 0.3 11.80 2.5 \n",
"3 0.3 9.95 2.5 \n",
"4 0.3 28.50 2.5 \n",
".. ... ... ... \n",
"195 0.3 12.96 0.0 \n",
"196 0.3 12.95 0.0 \n",
"197 0.3 6.96 0.0 \n",
"198 0.3 7.80 0.0 \n",
"199 0.3 12.30 0.0 \n",
"\n",
"[200 rows x 18 columns]\n"
]
}
],
"metadata": {}
},
{
"cell_type": "markdown",
"source": [
"# ನಿಮ್ಮ ಸ್ವಂತ ಅನ್ವೇಷಣಾತ್ಮಕ ಡೇಟಾ ವಿಶ್ಲೇಷಣೆಯನ್ನು ಮಾಡಲು ಕೆಳಗಿನ ಸೆಲ್‌ಗಳನ್ನು ಬಳಸಿ\n"
],
"metadata": {}
},
{
"cell_type": "code",
"execution_count": null,
"source": [],
"outputs": [],
"metadata": {}
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"---\n\n<!-- CO-OP TRANSLATOR DISCLAIMER START -->\n**ಅಸ್ವೀಕರಣ**: \nಈ ದಸ್ತಾವೇಜು [Co-op Translator](https://github.com/Azure/co-op-translator) ಎಂಬ AI ಅನುವಾದ ಸೇವೆಯನ್ನು ಬಳಸಿ ಅನುವಾದಿಸಲಾಗಿದೆ. ನಾವು ಶುದ್ಧತೆಯತ್ತ ಪ್ರಯತ್ನಿಸುತ್ತಿದ್ದರೂ, ಸ್ವಯಂಚಾಲಿತ ಅನುವಾದಗಳಲ್ಲಿ ತಪ್ಪುಗಳು ಅಥವಾ ಅಸತ್ಯತೆಗಳು ಇರಬಹುದು ಎಂದು ದಯವಿಟ್ಟು ಗಮನಿಸಿ. ಮೂಲ ಭಾಷೆಯಲ್ಲಿರುವ ಮೂಲ ದಸ್ತಾವೇಜನ್ನು ಅಧಿಕೃತ ಮೂಲವೆಂದು ಪರಿಗಣಿಸಬೇಕು. ಮಹತ್ವದ ಮಾಹಿತಿಗಾಗಿ, ವೃತ್ತಿಪರ ಮಾನವ ಅನುವಾದವನ್ನು ಶಿಫಾರಸು ಮಾಡಲಾಗುತ್ತದೆ. ಈ ಅನುವಾದ ಬಳಕೆಯಿಂದ ಉಂಟಾಗುವ ಯಾವುದೇ ತಪ್ಪು ಅರ್ಥಮಾಡಿಕೊಳ್ಳುವಿಕೆ ಅಥವಾ ತಪ್ಪು ವಿವರಣೆಗಳಿಗೆ ನಾವು ಹೊಣೆಗಾರರಾಗುವುದಿಲ್ಲ.\n<!-- CO-OP TRANSLATOR DISCLAIMER END -->\n"
]
}
],
"metadata": {
"kernelspec": {
"name": "python3",
"display_name": "Python 3.9.7 64-bit ('venv': venv)"
},
"language_info": {
"mimetype": "text/x-python",
"name": "python",
"pygments_lexer": "ipython3",
"codemirror_mode": {
"name": "ipython",
"version": 3
},
"version": "3.9.7",
"nbconvert_exporter": "python",
"file_extension": ".py"
},
"name": "04-nyc-taxi-join-weather-in-pandas",
"notebookId": 1709144033725344,
"interpreter": {
"hash": "6b9b57232c4b57163d057191678da2030059e733b8becc68f245de5a75abe84e"
},
"coopTranslator": {
"original_hash": "7bca1c1abc1e55842817b62e44e1a963",
"translation_date": "2025-12-19T17:11:38+00:00",
"source_file": "4-Data-Science-Lifecycle/15-analyzing/assignment.ipynb",
"language_code": "kn"
}
},
"nbformat": 4,
"nbformat_minor": 2
}

@ -0,0 +1,38 @@
<!--
CO_OP_TRANSLATOR_METADATA:
{
"original_hash": "fcc7547171f4530f159676dd73ed772e",
"translation_date": "2025-12-19T15:26:15+00:00",
"source_file": "4-Data-Science-Lifecycle/15-analyzing/assignment.md",
"language_code": "kn"
}
-->
# ಉತ್ತರಗಳನ್ನು ಅನ್ವೇಷಿಸುವುದು
ಇದು ಹಿಂದಿನ ಪಾಠದ [ಕಾರ್ಯ](../14-Introduction/assignment.md)ನ ಮುಂದುವರಿದ ಭಾಗವಾಗಿದ್ದು, ಅಲ್ಲಿ ನಾವು ಡೇಟಾ ಸೆಟ್ ಅನ್ನು ಸಂಕ್ಷಿಪ್ತವಾಗಿ ನೋಡಿದ್ದೇವೆ. ಈಗ ನಾವು ಡೇಟಾವನ್ನು ಹೆಚ್ಚು ಆಳವಾಗಿ ಪರಿಶೀಲಿಸುವೆವು.
ಮತ್ತೆ, ಗ್ರಾಹಕರು ತಿಳಿದುಕೊಳ್ಳಲು ಬಯಸುವ ಪ್ರಶ್ನೆ: **ನ್ಯೂಯಾರ್ಕ್ ಸಿಟಿಯ ಹಳದಿ ಟ್ಯಾಕ್ಸಿ ಪ್ರಯಾಣಿಕರು ಚಳಿಗಾಲದಲ್ಲಿ ಅಥವಾ ಬೇಸಿಗೆಯಲ್ಲಿ ಚಾಲಕರಿಗೆ ಹೆಚ್ಚು ಟಿಪ್ ನೀಡುತ್ತಾರಾ?**
ನಿಮ್ಮ ತಂಡ ಡೇಟಾ ಸೈನ್ಸ್ ಜೀವನಚಕ್ರದ [ವಿಶ್ಲೇಷಣೆ](README.md) ಹಂತದಲ್ಲಿದ್ದು, ಡೇಟಾ ಸೆಟ್ ಮೇಲೆ ಅನ್ವೇಷಣಾತ್ಮಕ ಡೇಟಾ ವಿಶ್ಲೇಷಣೆ ಮಾಡಲು ಜವಾಬ್ದಾರಿಯಲ್ಲಿದೆ. ನಿಮಗೆ ಜನವರಿ ಮತ್ತು ಜುಲೈ 2019 ರ 200 ಟ್ಯಾಕ್ಸಿ ವ್ಯವಹಾರಗಳನ್ನು ಒಳಗೊಂಡ ನೋಟ್ಬುಕ್ ಮತ್ತು ಡೇಟಾ ಸೆಟ್ ಒದಗಿಸಲಾಗಿದೆ.
## ಸೂಚನೆಗಳು
ಈ ಡೈರೆಕ್ಟರಿಯಲ್ಲಿ [ನೋಟ್ಬುಕ್](assignment.ipynb) ಮತ್ತು [ಟ್ಯಾಕ್ಸಿ & ಲಿಮೋಸಿನ್ ಕಮಿಷನ್](https://docs.microsoft.com/en-us/azure/open-datasets/dataset-taxi-yellow?tabs=azureml-opendatasets)ನ ಡೇಟಾ ಇದೆ. ಡೇಟಾ ಬಗ್ಗೆ ಹೆಚ್ಚಿನ ಮಾಹಿತಿಗಾಗಿ [ಡೇಟಾ ಸೆಟ್ ನ ಡಿಕ್ಷನರಿ](https://www1.nyc.gov/assets/tlc/downloads/pdf/data_dictionary_trip_records_yellow.pdf) ಮತ್ತು [ಬಳಕೆದಾರ ಮಾರ್ಗದರ್ಶಿ](https://www1.nyc.gov/assets/tlc/downloads/pdf/trip_record_user_guide.pdf) ಅನ್ನು ನೋಡಿ.
ಈ ಪಾಠದಲ್ಲಿ ಕೆಲವು ತಂತ್ರಗಳನ್ನು ಬಳಸಿ ನಿಮ್ಮ ಸ್ವಂತ EDA ನೋಟ್ಬುಕ್‌ನಲ್ಲಿ ಮಾಡಿ (ನೀವು ಇಚ್ಛಿಸಿದರೆ ಸೆಲ್‌ಗಳನ್ನು ಸೇರಿಸಬಹುದು) ಮತ್ತು ಕೆಳಗಿನ ಪ್ರಶ್ನೆಗಳಿಗೆ ಉತ್ತರ ನೀಡಿ:
- ಟಿಪ್ ಮೊತ್ತವನ್ನು ಪ್ರಭಾವಿಸುವ ಇನ್ನಾವುದೇ ಡೇಟಾ ಪ್ರಭಾವಗಳು ಏನು ಇರಬಹುದು?
- ಗ್ರಾಹಕರ ಪ್ರಶ್ನೆಗಳಿಗೆ ಉತ್ತರಿಸಲು ಯಾವ ಕಾಲಮ್‌ಗಳು ಬಹುಶಃ ಅಗತ್ಯವಿಲ್ಲ?
- ಇದುವರೆಗೆ ಒದಗಿಸಲಾದ ಮಾಹಿತಿಯ ಆಧಾರದ ಮೇಲೆ, ಡೇಟಾ ಋತುಚಕ್ರದ ಟಿಪ್ ನೀಡುವ ವರ್ತನೆಗೆ ಯಾವುದೇ ಸಾಕ್ಷ್ಯವನ್ನು ನೀಡುತ್ತದೆಯೇ?
## ಮೌಲ್ಯಮಾಪನ
ಉತ್ತಮ | ತೃಪ್ತಿಕರ | ಸುಧಾರಣೆಯ ಅಗತ್ಯ
--- | --- | --
---
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
**ಅಸ್ವೀಕರಣ**:
ಈ ದಸ್ತಾವೇಜು AI ಅನುವಾದ ಸೇವೆ [Co-op Translator](https://github.com/Azure/co-op-translator) ಬಳಸಿ ಅನುವಾದಿಸಲಾಗಿದೆ. ನಾವು ನಿಖರತೆಯಿಗಾಗಿ ಪ್ರಯತ್ನಿಸುತ್ತಿದ್ದರೂ, ಸ್ವಯಂಚಾಲಿತ ಅನುವಾದಗಳಲ್ಲಿ ದೋಷಗಳು ಅಥವಾ ಅಸತ್ಯತೆಗಳು ಇರಬಹುದು ಎಂದು ದಯವಿಟ್ಟು ಗಮನಿಸಿ. ಮೂಲ ಭಾಷೆಯಲ್ಲಿರುವ ಮೂಲ ದಸ್ತಾವೇಜನ್ನು ಅಧಿಕೃತ ಮೂಲವಾಗಿ ಪರಿಗಣಿಸಬೇಕು. ಮಹತ್ವದ ಮಾಹಿತಿಗಾಗಿ, ವೃತ್ತಿಪರ ಮಾನವ ಅನುವಾದವನ್ನು ಶಿಫಾರಸು ಮಾಡಲಾಗುತ್ತದೆ. ಈ ಅನುವಾದ ಬಳಕೆಯಿಂದ ಉಂಟಾಗುವ ಯಾವುದೇ ತಪ್ಪು ಅರ್ಥಮಾಡಿಕೊಳ್ಳುವಿಕೆ ಅಥವಾ ತಪ್ಪು ವಿವರಣೆಗಳಿಗೆ ನಾವು ಹೊಣೆಗಾರರಾಗುವುದಿಲ್ಲ.
<!-- CO-OP TRANSLATOR DISCLAIMER END -->

@ -0,0 +1,193 @@
{
"cells": [
{
"cell_type": "markdown",
"source": [
"# ಡೇಟಾ ವಿಶ್ಲೇಷಣೆ\r\n",
"[ಪಾಠ](README.md)ದಲ್ಲಿ ಉಲ್ಲೇಖಿಸಲಾದ Pandas ಫಂಕ್ಷನ್‌ಗಳ ಉದಾಹರಣೆಗಳು.\n"
],
"metadata": {}
},
{
"cell_type": "code",
"execution_count": 1,
"source": [
"import pandas as pd\r\n",
"import glob\r\n",
"\r\n",
"#Loading the dataset\r\n",
"path = '../../data/emails.csv'\r\n",
"email_df = pd.read_csv(path)"
],
"outputs": [],
"metadata": {}
},
{
"cell_type": "code",
"execution_count": 2,
"source": [
"# Using Describe on the email dataset\r\n",
"print(email_df.describe())"
],
"outputs": [
{
"output_type": "stream",
"name": "stdout",
"text": [
" the to ect and for of \\\n",
"count 406.000000 406.000000 406.000000 406.000000 406.000000 406.000000 \n",
"mean 7.022167 6.519704 4.948276 3.059113 3.502463 2.662562 \n",
"std 10.945522 9.801907 9.293820 6.267806 4.901372 5.443939 \n",
"min 0.000000 0.000000 1.000000 0.000000 0.000000 0.000000 \n",
"25% 1.000000 1.000000 1.000000 0.000000 1.000000 0.000000 \n",
"50% 3.000000 3.000000 2.000000 1.000000 2.000000 1.000000 \n",
"75% 9.000000 7.750000 4.000000 3.000000 4.750000 3.000000 \n",
"max 99.000000 88.000000 79.000000 69.000000 39.000000 57.000000 \n",
"\n",
" a you in on is this \\\n",
"count 406.000000 406.000000 406.000000 406.000000 406.000000 406.000000 \n",
"mean 57.017241 2.394089 10.817734 11.591133 5.901478 1.485222 \n",
"std 78.868243 4.067015 19.050972 16.407175 8.793103 2.912473 \n",
"min 0.000000 0.000000 0.000000 0.000000 0.000000 0.000000 \n",
"25% 15.000000 0.000000 1.250000 3.000000 1.000000 0.000000 \n",
"50% 29.000000 1.000000 5.000000 6.000000 3.000000 0.000000 \n",
"75% 61.000000 3.000000 12.000000 13.000000 7.000000 2.000000 \n",
"max 843.000000 31.000000 223.000000 125.000000 61.000000 24.000000 \n",
"\n",
" i be that will \n",
"count 406.000000 406.000000 406.000000 406.000000 \n",
"mean 47.155172 2.950739 1.034483 0.955665 \n",
"std 71.043009 4.297865 1.904846 2.042271 \n",
"min 0.000000 0.000000 0.000000 0.000000 \n",
"25% 11.000000 1.000000 0.000000 0.000000 \n",
"50% 24.000000 1.000000 0.000000 0.000000 \n",
"75% 50.750000 3.000000 1.000000 1.000000 \n",
"max 754.000000 40.000000 14.000000 24.000000 \n"
]
}
],
"metadata": {}
},
{
"cell_type": "code",
"execution_count": 5,
"source": [
"# Sampling 10 emails\r\n",
"print(email_df.sample(10))"
],
"outputs": [
{
"output_type": "stream",
"name": "stdout",
"text": [
" Email No. the to ect and for of a you in on is this i \\\n",
"150 Email 151 0 1 2 0 3 0 15 0 0 5 0 0 7 \n",
"380 Email 5147 0 3 2 0 0 0 7 0 1 1 0 0 3 \n",
"19 Email 20 3 4 11 0 4 2 32 1 1 3 9 5 25 \n",
"300 Email 301 2 1 1 0 1 1 15 2 2 3 2 0 8 \n",
"307 Email 308 0 0 1 0 0 0 1 0 1 0 0 0 2 \n",
"167 Email 168 2 2 2 1 5 1 24 2 5 6 4 0 30 \n",
"320 Email 321 10 12 4 6 8 6 187 5 26 28 23 2 171 \n",
"61 Email 62 0 1 1 0 4 1 15 4 4 3 3 0 19 \n",
"26 Email 27 5 4 1 1 4 4 51 0 8 6 6 2 44 \n",
"73 Email 74 0 0 1 0 0 0 7 0 4 3 0 0 6 \n",
"\n",
" be that will \n",
"150 1 0 0 \n",
"380 0 0 0 \n",
"19 3 0 1 \n",
"300 0 0 0 \n",
"307 0 0 0 \n",
"167 2 0 0 \n",
"320 5 1 1 \n",
"61 2 0 0 \n",
"26 6 0 0 \n",
"73 0 0 0 \n"
]
}
],
"metadata": {}
},
{
"cell_type": "code",
"execution_count": 14,
"source": [
"# Returns rows where there are more occurrences of \"to\" than \"the\"\r\n",
"print(email_df.query('the < to'))"
],
"outputs": [
{
"output_type": "stream",
"name": "stdout",
"text": [
" Email No. the to ect and for of a you in on is this i \\\n",
"1 Email 2 8 13 24 6 6 2 102 1 18 21 13 0 61 \n",
"3 Email 4 0 5 22 0 5 1 51 2 1 5 9 2 16 \n",
"5 Email 6 4 5 1 4 2 3 45 1 16 12 8 1 52 \n",
"7 Email 8 0 2 2 3 1 2 21 6 2 6 2 0 28 \n",
"13 Email 14 4 5 7 1 5 1 37 1 8 8 6 1 43 \n",
".. ... ... .. ... ... ... .. ... ... .. .. .. ... .. \n",
"390 Email 5157 4 13 1 0 3 1 48 2 8 26 9 1 45 \n",
"393 Email 5160 2 13 1 0 2 1 38 2 7 24 6 1 34 \n",
"396 Email 5163 2 3 1 2 1 2 32 0 7 3 2 0 26 \n",
"404 Email 5171 2 7 1 0 2 1 28 2 8 11 7 1 39 \n",
"405 Email 5172 22 24 5 1 6 5 148 8 23 13 5 4 99 \n",
"\n",
" be that will \n",
"1 4 2 0 \n",
"3 2 0 0 \n",
"5 2 0 0 \n",
"7 1 0 1 \n",
"13 1 0 1 \n",
".. .. ... ... \n",
"390 1 0 0 \n",
"393 1 0 0 \n",
"396 3 0 0 \n",
"404 1 0 0 \n",
"405 6 4 1 \n",
"\n",
"[169 rows x 17 columns]\n"
]
}
],
"metadata": {}
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"---\n\n<!-- CO-OP TRANSLATOR DISCLAIMER START -->\n**ಅಸ್ವೀಕಾರ**: \nಈ ದಸ್ತಾವೇಜು AI ಅನುವಾದ ಸೇವೆ [Co-op Translator](https://github.com/Azure/co-op-translator) ಬಳಸಿ ಅನುವಾದಿಸಲಾಗಿದೆ. ನಾವು ನಿಖರತೆಯಿಗಾಗಿ ಪ್ರಯತ್ನಿಸುತ್ತಿದ್ದರೂ, ಸ್ವಯಂಚಾಲಿತ ಅನುವಾದಗಳಲ್ಲಿ ತಪ್ಪುಗಳು ಅಥವಾ ಅಸತ್ಯತೆಗಳು ಇರಬಹುದು ಎಂದು ದಯವಿಟ್ಟು ಗಮನಿಸಿ. ಮೂಲ ಭಾಷೆಯಲ್ಲಿರುವ ಮೂಲ ದಸ್ತಾವೇಜನ್ನು ಅಧಿಕೃತ ಮೂಲವೆಂದು ಪರಿಗಣಿಸಬೇಕು. ಮಹತ್ವದ ಮಾಹಿತಿಗಾಗಿ, ವೃತ್ತಿಪರ ಮಾನವ ಅನುವಾದವನ್ನು ಶಿಫಾರಸು ಮಾಡಲಾಗುತ್ತದೆ. ಈ ಅನುವಾದ ಬಳಕೆಯಿಂದ ಉಂಟಾಗುವ ಯಾವುದೇ ತಪ್ಪು ಅರ್ಥಮಾಡಿಕೊಳ್ಳುವಿಕೆ ಅಥವಾ ತಪ್ಪು ವಿವರಣೆಗಳಿಗೆ ನಾವು ಹೊಣೆಗಾರರಾಗುವುದಿಲ್ಲ.\n<!-- CO-OP TRANSLATOR DISCLAIMER END -->\n"
]
}
],
"metadata": {
"orig_nbformat": 4,
"language_info": {
"name": "python",
"version": "3.9.7",
"mimetype": "text/x-python",
"codemirror_mode": {
"name": "ipython",
"version": 3
},
"pygments_lexer": "ipython3",
"nbconvert_exporter": "python",
"file_extension": ".py"
},
"kernelspec": {
"name": "python3",
"display_name": "Python 3.9.7 64-bit ('venv': venv)"
},
"interpreter": {
"hash": "6b9b57232c4b57163d057191678da2030059e733b8becc68f245de5a75abe84e"
},
"coopTranslator": {
"original_hash": "9d102c8c3cdbc8ea4e92fc32593462c6",
"translation_date": "2025-12-19T17:11:15+00:00",
"source_file": "4-Data-Science-Lifecycle/15-analyzing/notebook.ipynb",
"language_code": "kn"
}
},
"nbformat": 4,
"nbformat_minor": 2
}

@ -0,0 +1,224 @@
<!--
CO_OP_TRANSLATOR_METADATA:
{
"original_hash": "215a3254ba5a222a57c5bb0192cea8e3",
"translation_date": "2025-12-19T15:21:08+00:00",
"source_file": "4-Data-Science-Lifecycle/16-communication/README.md",
"language_code": "kn"
}
-->
# ಡೇಟಾ ಸೈನ್ಸ್ ಜೀವನಚಕ್ರ: ಸಂವಹನ
|![ ಸ್ಕೆಚ್‌ನೋಟ್ [(@sketchthedocs)](https://sketchthedocs.dev) ಅವರಿಂದ ](../../sketchnotes/16-Communicating.png)|
|:---:|
| ಡೇಟಾ ಸೈನ್ಸ್ ಜೀವನಚಕ್ರ: ಸಂವಹನ - _ಸ್ಕೆಚ್ನೋಟ್ [@nitya](https://twitter.com/nitya) ಅವರಿದ_ |
## [ಪೂರ್ವ-ವಕ್ತೃತ್ವ ಕ್ವಿಜ್](https://ff-quizzes.netlify.app/en/ds/quiz/30)
ಮೇಲಿನ ಪೂರ್ವ-ವಕ್ತೃತ್ವ ಕ್ವಿಜ್ ಮೂಲಕ ಮುಂದಿನ ವಿಷಯದ ಬಗ್ಗೆ ನಿಮ್ಮ ಜ್ಞಾನವನ್ನು ಪರೀಕ್ಷಿಸಿ!
# ಪರಿಚಯ
### ಸಂವಹನ ಎಂದರೆ ಏನು?
ನಾವು ಈ ಪಾಠವನ್ನು ಸಂವಹನ ಎಂದರೇನು ಎಂದು ವ್ಯಾಖ್ಯಾನಿಸುವುದರಿಂದ ಪ್ರಾರಂಭಿಸೋಣ. **ಸಂವಹನ ಎಂದರೆ ಮಾಹಿತಿ ಹಂಚಿಕೊಳ್ಳುವುದು ಅಥವಾ ವಿನಿಮಯ ಮಾಡಿಕೊಳ್ಳುವುದು.** ಮಾಹಿತಿ ಎಂದರೆ ಆಲೋಚನೆಗಳು, ಭಾವನೆಗಳು, ಸಂದೇಶಗಳು, ಗುಪ್ತ ಸಂಕೇತಗಳು, ಡೇಟಾ ಯಾವುದೇ ವಿಷಯವನ್ನು **_ಪ್ರೇಕ್ಷಕ_** (ಮಾಹಿತಿ ಕಳುಹಿಸುವವರು) **_ಗ್ರಾಹಕ_** (ಮಾಹಿತಿ ಸ್ವೀಕರಿಸುವವರು) ಅರ್ಥಮಾಡಿಕೊಳ್ಳಬೇಕಾಗುತ್ತದೆ. ಈ ಪಾಠದಲ್ಲಿ, ನಾವು ಪ್ರೇಕ್ಷಕರನ್ನು ಸಂವಹನಕಾರರು ಎಂದು ಮತ್ತು ಗ್ರಾಹಕರನ್ನು ಪ್ರೇಕ್ಷಕರಾಗಿ ಪರಿಗಣಿಸುವೆವು.
### ಡೇಟಾ ಸಂವಹನ ಮತ್ತು ಕಥನಕಲೆ
ನಾವು ತಿಳಿದುಕೊಂಡಿದ್ದೇವೆ ಸಂವಹನದ ಉದ್ದೇಶ ಮಾಹಿತಿ ಹಂಚಿಕೊಳ್ಳುವುದು ಅಥವಾ ವಿನಿಮಯ ಮಾಡಿಕೊಳ್ಳುವುದು. ಆದರೆ ಡೇಟಾ ಸಂವಹನದಲ್ಲಿ, ನಿಮ್ಮ ಉದ್ದೇಶವು ಕೇವಲ ಸಂಖ್ಯೆಗಳನ್ನೇ ಪ್ರೇಕ್ಷಕರಿಗೆ ನೀಡುವುದು ಆಗಿರಬಾರದು. ನಿಮ್ಮ ಉದ್ದೇಶವು ನಿಮ್ಮ ಡೇಟಾದಿಂದ ಪ್ರೇರಿತವಾದ ಕಥೆಯನ್ನು ಸಂವಹನ ಮಾಡುವುದು ಆಗಿರಬೇಕು - ಪರಿಣಾಮಕಾರಿ ಡೇಟಾ ಸಂವಹನ ಮತ್ತು ಕಥನಕಲೆ ಪರಸ್ಪರ ಸಂಬಂಧ ಹೊಂದಿವೆ. ನಿಮ್ಮ ಪ್ರೇಕ್ಷಕರು ನೀವು ಹೇಳುವ ಕಥೆಯನ್ನು ಸಂಖ್ಯೆಯಿಗಿಂತ ಹೆಚ್ಚು ನೆನಪಿಡುತ್ತಾರೆ. ಈ ಪಾಠದ ನಂತರ, ನೀವು ಡೇಟಾ ಹೆಚ್ಚು ಪರಿಣಾಮಕಾರಿಯಾಗಿ ಸಂವಹನ ಮಾಡಲು ಕಥನಕಲೆಯನ್ನು ಬಳಸಬಹುದಾದ ಕೆಲವು ವಿಧಾನಗಳನ್ನು ನಾವು ನೋಡೋಣ.
### ಸಂವಹನದ ಪ್ರಕಾರಗಳು
ಈ ಪಾಠದಲ್ಲಿ ಎರಡು ವಿಭಿನ್ನ ಸಂವಹನ ಪ್ರಕಾರಗಳನ್ನು ಚರ್ಚಿಸಲಾಗುವುದು, ಒನ್-ವೇ ಸಂವಹನ ಮತ್ತು ಟೂ-ವೇ ಸಂವಹನ.
**ಒನ್-ವೇ ಸಂವಹನ** ಆಗಾಗ ಪ್ರೇಕ್ಷಕನಿಗೆ ಯಾವುದೇ ಪ್ರತಿಕ್ರಿಯೆ ಇಲ್ಲದೆ ಮಾಹಿತಿ ಕಳುಹಿಸುವಾಗ ಸಂಭವಿಸುತ್ತದೆ. ನಾವು ಪ್ರತಿದಿನವೂ ಒನ್-ವೇ ಸಂವಹನದ ಉದಾಹರಣೆಗಳನ್ನು ನೋಡುತ್ತೇವೆ ಬಲ್ಕ್/ಮಾಸ್ ಇಮೇಲ್‌ಗಳಲ್ಲಿ, ಸುದ್ದಿಗಳು ಇತ್ತೀಚಿನ ಕಥೆಗಳನ್ನು ನೀಡುವಾಗ, ಅಥವಾ ಟಿವಿ ಜಾಹೀರಾತುಗಳು ತಮ್ಮ ಉತ್ಪನ್ನದ ಮಹತ್ವವನ್ನು ತಿಳಿಸುವಾಗ. ಈ ಎಲ್ಲಾ ಸಂದರ್ಭಗಳಲ್ಲಿ, ಪ್ರೇಕ್ಷಕರು ಮಾಹಿತಿ ವಿನಿಮಯವನ್ನು ಬಯಸುವುದಿಲ್ಲ. ಅವರು ಕೇವಲ ಮಾಹಿತಿ ನೀಡಲು ಬಯಸುತ್ತಾರೆ.
**ಟೂ-ವೇ ಸಂವಹನ** ಆಗಾಗ ಎಲ್ಲಾ ಭಾಗವಹಿಸುವವರು ಪ್ರೇಕ್ಷಕರಾಗಿಯೂ ಮತ್ತು ಗ್ರಾಹಕರಾಗಿಯೂ ಕಾರ್ಯನಿರ್ವಹಿಸುತ್ತಾರೆ. ಪ್ರೇಕ್ಷಕ ಪ್ರಾರಂಭದಲ್ಲಿ ಮಾಹಿತಿ ಕಳುಹಿಸುತ್ತಾನೆ ಮತ್ತು ಗ್ರಾಹಕ ಪ್ರತಿಕ್ರಿಯೆ ನೀಡುತ್ತಾನೆ. ಟೂ-ವೇ ಸಂವಹನವನ್ನು ನಾವು ಸಾಮಾನ್ಯವಾಗಿ ಸಂವಹನವೆಂದು ಪರಿಗಣಿಸುತ್ತೇವೆ. ನಾವು ಸಾಮಾನ್ಯವಾಗಿ ವ್ಯಕ್ತಿಗಳು ಸಂಭಾಷಣೆಯಲ್ಲಿ ತೊಡಗಿಸಿಕೊಂಡಿರುವಂತೆ ಭಾವಿಸುತ್ತೇವೆ - ವ್ಯಕ್ತಿಗತವಾಗಿ, ಫೋನ್ ಕರೆ, ಸಾಮಾಜಿಕ ಮಾಧ್ಯಮ ಅಥವಾ ಟೆಕ್ಸ್ಟ್ ಸಂದೇಶಗಳ ಮೂಲಕ.
ಡೇಟಾ ಸಂವಹನದಲ್ಲಿ, ನೀವು ಕೆಲವು ಸಂದರ್ಭಗಳಲ್ಲಿ ಒನ್-ವೇ ಸಂವಹನವನ್ನು ಬಳಸಬಹುದು (ಉದಾಹರಣೆಗೆ, ಸಮ್ಮೇಳನದಲ್ಲಿ ಪ್ರಸ್ತುತಪಡಿಸುವಾಗ ಅಥವಾ ದೊಡ್ಡ ಗುಂಪಿಗೆ ಪ್ರಸ್ತುತಪಡಿಸುವಾಗ, ಪ್ರಶ್ನೆಗಳು ನೇರವಾಗಿ ಕೇಳಲಾಗದಾಗ) ಮತ್ತು ಕೆಲವು ಸಂದರ್ಭಗಳಲ್ಲಿ ಟೂ-ವೇ ಸಂವಹನವನ್ನು ಬಳಸಬಹುದು (ಉದಾಹರಣೆಗೆ, ಕೆಲವು ಹಿತಾಸಕ್ತಿಗಳನ್ನು ಖರೀದಿಸಲು ಡೇಟಾ ಬಳಸಿ ಮನವಿಪಡಿಸುವಾಗ ಅಥವಾ ತಂಡದ ಸದಸ್ಯನಿಗೆ ಹೊಸದಾಗಿ ಏನಾದರೂ ನಿರ್ಮಿಸಲು ಸಮಯ ಮತ್ತು ಪ್ರಯತ್ನವನ್ನು ಖರ್ಚು ಮಾಡಬೇಕೆಂದು ಮನವಿಪಡಿಸುವಾಗ).
# ಪರಿಣಾಮಕಾರಿ ಸಂವಹನ
### ಸಂವಹನಕಾರರಾಗಿ ನಿಮ್ಮ ಜವಾಬ್ದಾರಿಗಳು
ಸಂವಹನ ಮಾಡುವಾಗ, ನಿಮ್ಮ ಗ್ರಾಹಕರು ನೀವು ನೀಡಲು ಬಯಸುವ ಮಾಹಿತಿಯನ್ನು ತೆಗೆದುಕೊಂಡು ಹೋಗುತ್ತಿರುವುದನ್ನು ಖಚಿತಪಡಿಸುವುದು ನಿಮ್ಮ ಕೆಲಸ. ಡೇಟಾ ಸಂವಹನದಲ್ಲಿ, ನೀವು ಕೇವಲ ಸಂಖ್ಯೆಗಳನ್ನೇ ಗ್ರಾಹಕರಿಗೆ ನೀಡಬಾರದು, ನೀವು ಡೇಟಾದಿಂದ ಪ್ರೇರಿತವಾದ ಕಥೆಯನ್ನು ನೀಡಬೇಕು. ಒಳ್ಳೆಯ ಡೇಟಾ ಸಂವಹನಕಾರ ಒಳ್ಳೆಯ ಕಥಾನಾಯಕ.
ಡೇಟಾ ಮೂಲಕ ಕಥೆ ಹೇಗೆ ಹೇಳುವುದು? ಅನಂತ ವಿಧಾನಗಳಿವೆ ಆದರೆ ಈ ಪಾಠದಲ್ಲಿ ನಾವು 6 ವಿಧಾನಗಳನ್ನು ಚರ್ಚಿಸುವೆವು.
1. ನಿಮ್ಮ ಪ್ರೇಕ್ಷಕರು, ನಿಮ್ಮ ಮಾಧ್ಯಮ ಮತ್ತು ನಿಮ್ಮ ಸಂವಹನ ವಿಧಾನವನ್ನು ಅರ್ಥಮಾಡಿಕೊಳ್ಳಿ
2. ಕೊನೆಯನ್ನು ಮನಸ್ಸಿನಲ್ಲಿ ಇಟ್ಟು ಪ್ರಾರಂಭಿಸಿ
3. ನಿಜವಾದ ಕಥೆಯಂತೆ ಹತ್ತಿರವಾಗಿರಿ
4. ಅರ್ಥಪೂರ್ಣ ಪದಗಳು ಮತ್ತು ವಾಕ್ಯಗಳನ್ನು ಬಳಸಿ
5. ಭಾವನೆಗಳನ್ನು ಬಳಸಿ
ಈ ಪ್ರತಿಯೊಂದು ತಂತ್ರಗಳನ್ನು ಕೆಳಗೆ ವಿವರಿಸಲಾಗಿದೆ.
### 1. ನಿಮ್ಮ ಪ್ರೇಕ್ಷಕರು, ನಿಮ್ಮ ಚಾನೆಲ್ ಮತ್ತು ನಿಮ್ಮ ಸಂವಹನ ವಿಧಾನವನ್ನು ಅರ್ಥಮಾಡಿಕೊಳ್ಳಿ
ನೀವು ಕುಟುಂಬ ಸದಸ್ಯರೊಂದಿಗೆ ಸಂವಹನ ಮಾಡುವ ವಿಧಾನವು ನಿಮ್ಮ ಸ್ನೇಹಿತರೊಂದಿಗೆ ಸಂವಹನ ಮಾಡುವ ವಿಧಾನದಿಂದ ಭಿನ್ನವಾಗಿರಬಹುದು. ನೀವು ಮಾತನಾಡುತ್ತಿರುವವರಿಗೆ ಅರ್ಥವಾಗುವ ವಿಭಿನ್ನ ಪದಗಳು ಮತ್ತು ವಾಕ್ಯಗಳನ್ನು ನೀವು ಬಳಸಬಹುದು. ಡೇಟಾ ಸಂವಹನದಲ್ಲಿಯೂ ಇದೇ ವಿಧಾನವನ್ನು ಅನುಸರಿಸಬೇಕು. ನೀವು ಯಾರಿಗೆ ಸಂವಹನ ಮಾಡುತ್ತಿದ್ದೀರಿ ಎಂದು ಯೋಚಿಸಿ. ಅವರ ಗುರಿಗಳು ಮತ್ತು ನೀವು ವಿವರಿಸುತ್ತಿರುವ ಪರಿಸ್ಥಿತಿಯ ಸುತ್ತಲೂ ಅವರ ಸನ್ನಿವೇಶವನ್ನು ಪರಿಗಣಿಸಿ.
ನೀವು ಬಹುಶಃ ನಿಮ್ಮ ಪ್ರೇಕ್ಷಕರನ್ನು ಒಂದು ವರ್ಗದಲ್ಲಿ ಗುಂಪು ಮಾಡಬಹುದು. _ಹಾರ್ವರ್ಡ್ ಬಿಸಿನೆಸ್ ರಿವ್ಯೂ_ ಲೇಖನ "[ಡೇಟಾ ಮೂಲಕ ಕಥೆ ಹೇಗೆ ಹೇಳುವುದು](http://blogs.hbr.org/2013/04/how-to-tell-a-story-with-data/)" ನಲ್ಲಿ, ಡೆಲ್ ಎಕ್ಸಿಕ್ಯೂಟಿವ್ ಸ್ಟ್ರಾಟಜಿಸ್ಟ್ ಜಿಮ್ ಸ್ಟಿಕಿಲಿಥರ್ ಐದು ಪ್ರೇಕ್ಷಕರ ವರ್ಗಗಳನ್ನು ಗುರುತಿಸಿದ್ದಾರೆ.
- **ನವಶಿಕ್ಷಿತ**: ವಿಷಯದ ಮೊದಲ ಪರಿಚಯ, ಆದರೆ ಅತಿಸರಳೀಕರಣವನ್ನು ಬಯಸುವುದಿಲ್ಲ
- **ಸಾಮಾನ್ಯ**: ವಿಷಯದ ಅರಿವು ಇದೆ, ಆದರೆ ಸಮಗ್ರ ಅವಲೋಕನ ಮತ್ತು ಪ್ರಮುಖ ವಿಷಯಗಳನ್ನು ಹುಡುಕುತ್ತಾನೆ
- **ನಿರ್ವಹಣಾ**: ಸೂಕ್ಷ್ಮ, ಕಾರ್ಯನಿರ್ವಹಣೀಯ ಅರ್ಥಮಾಡಿಕೊಳ್ಳುವಿಕೆ ಮತ್ತು ವಿವರಗಳಿಗೆ ಪ್ರವೇಶ
- **ತಜ್ಞ**: ಹೆಚ್ಚಿನ ಅನ್ವೇಷಣೆ ಮತ್ತು ಕಂಡುಹಿಡಿಯುವಿಕೆ, ಕಡಿಮೆ ಕಥನಕಲೆ, ಹೆಚ್ಚಿನ ವಿವರ
- **ನಿರ್ವಾಹಕ**: ತೂಕದ ಸಾಧ್ಯತೆಗಳ ಮಹತ್ವ ಮತ್ತು ನಿರ್ಣಯಗಳನ್ನು ಮಾತ್ರ ತಿಳಿದುಕೊಳ್ಳಲು ಸಮಯವಿದೆ
ಈ ವರ್ಗಗಳು ನಿಮ್ಮ ಪ್ರೇಕ್ಷಕರಿಗೆ ಡೇಟಾ ಪ್ರಸ್ತುತಪಡಿಸುವ ವಿಧಾನವನ್ನು ಸೂಚಿಸಬಹುದು.
ನಿಮ್ಮ ಪ್ರೇಕ್ಷಕರ ವರ್ಗವನ್ನು ಪರಿಗಣಿಸುವ ಜೊತೆಗೆ, ನೀವು ಯಾವ ಚಾನೆಲ್ ಮೂಲಕ ಸಂವಹನ ಮಾಡುತ್ತಿದ್ದೀರಿ ಎಂಬುದನ್ನು ಕೂಡ ಪರಿಗಣಿಸಬೇಕು. ನೀವು ಮೆಮೊ ಅಥವಾ ಇಮೇಲ್ ಬರೆಯುತ್ತಿರುವಾಗ ಮತ್ತು ಸಭೆ ನಡೆಸುತ್ತಿರುವಾಗ ಅಥವಾ ಸಮ್ಮೇಳನದಲ್ಲಿ ಪ್ರಸ್ತುತಪಡಿಸುವಾಗ ನಿಮ್ಮ ವಿಧಾನ ಸ್ವಲ್ಪ ಬದಲಾಗಬಹುದು.
ನಿಮ್ಮ ಪ್ರೇಕ್ಷಕರನ್ನು ಅರ್ಥಮಾಡಿಕೊಳ್ಳುವುದರ ಜೊತೆಗೆ, ನೀವು ಒನ್-ವೇ ಸಂವಹನ ಅಥವಾ ಟೂ-ವೇ ಸಂವಹನವನ್ನು ಬಳಸುತ್ತಿರುವುದನ್ನು ತಿಳಿದುಕೊಳ್ಳುವುದು ಕೂಡ ಅತ್ಯಂತ ಮುಖ್ಯ.
ನೀವು ಬಹುಮತ ನವಶಿಕ್ಷಿತ ಪ್ರೇಕ್ಷಕರೊಂದಿಗೆ ಒನ್-ವೇ ಸಂವಹನವನ್ನು ಬಳಸುತ್ತಿದ್ದರೆ, ಮೊದಲು ಪ್ರೇಕ್ಷಕರಿಗೆ ಶಿಕ್ಷಣ ನೀಡಬೇಕು ಮತ್ತು ಸರಿಯಾದ ಸನ್ನಿವೇಶವನ್ನು ಒದಗಿಸಬೇಕು. ನಂತರ ನಿಮ್ಮ ಡೇಟಾವನ್ನು ಅವರಿಗೆ ಪ್ರಸ್ತುತಪಡಿಸಿ, ನಿಮ್ಮ ಡೇಟಾ ಏನು ಅರ್ಥ ಮತ್ತು ಏಕೆ ಮಹತ್ವವಾಗಿದೆ ಎಂದು ಹೇಳಬೇಕು. ಈ ಸಂದರ್ಭದಲ್ಲಿ, ಸ್ಪಷ್ಟತೆಯನ್ನು ಹೆಚ್ಚಿಸುವುದರಲ್ಲಿ ನೀವು ಗಮನಹರಿಸಬೇಕು, ಏಕೆಂದರೆ ನಿಮ್ಮ ಪ್ರೇಕ್ಷಕರು ನೇರವಾಗಿ ಪ್ರಶ್ನೆಗಳನ್ನು ಕೇಳಲು ಸಾಧ್ಯವಿಲ್ಲ.
ನೀವು ಬಹುಮತ ನಿರ್ವಹಣಾ ಪ್ರೇಕ್ಷಕರೊಂದಿಗೆ ಟೂ-ವೇ ಸಂವಹನವನ್ನು ಬಳಸುತ್ತಿದ್ದರೆ, ನೀವು ಪ್ರೇಕ್ಷಕರಿಗೆ ಶಿಕ್ಷಣ ನೀಡಬೇಕಾಗಿಲ್ಲ ಅಥವಾ ಹೆಚ್ಚಿನ ಸನ್ನಿವೇಶ ನೀಡಬೇಕಾಗಿಲ್ಲ. ನೀವು ನೇರವಾಗಿ ಸಂಗ್ರಹಿಸಿದ ಡೇಟಾ ಮತ್ತು ಅದರ ಮಹತ್ವವನ್ನು ಚರ್ಚಿಸಲು ಸಾಧ್ಯ. ಆದರೆ ಈ ಸಂದರ್ಭದಲ್ಲಿ, ನೀವು ಸಮಯ ನಿಯಂತ್ರಣ ಮತ್ತು ಪ್ರಸ್ತುತಪಡಿಸುವಿಕೆಯಲ್ಲಿ ಗಮನಹರಿಸಬೇಕು. ಟೂ-ವೇ ಸಂವಹನದಲ್ಲಿ (ವಿಶೇಷವಾಗಿ ನಿರ್ವಹಣಾ ಪ್ರೇಕ್ಷಕರೊಂದಿಗೆ, ಅವರು "ಸೂಕ್ಷ್ಮತೆಗಳ ಮತ್ತು ಪರಸ್ಪರ ಸಂಬಂಧಗಳ ಕಾರ್ಯನಿರ್ವಹಣೀಯ ಅರ್ಥಮಾಡಿಕೊಳ್ಳುವಿಕೆಯನ್ನು" ಹುಡುಕುತ್ತಿರುವಾಗ) ಪ್ರಶ್ನೆಗಳು ಉದಯಿಸಬಹುದು, ಮತ್ತು ಚರ್ಚೆಯನ್ನು ನೀವು ಹೇಳಲು ಬಯಸುವ ಕಥೆಯಿಂದ ದೂರಕ್ಕೆ ತಳ್ಳಬಹುದು. ಈ ಸಂದರ್ಭದಲ್ಲಿ, ನೀವು ಚರ್ಚೆಯನ್ನು ನಿಮ್ಮ ಕಥೆಗೆ ಹಿಂತಿರುಗಿಸಲು ಕ್ರಮ ಕೈಗೊಳ್ಳಬಹುದು.
### 2. ಕೊನೆಯನ್ನು ಮನಸ್ಸಿನಲ್ಲಿ ಇಟ್ಟು ಪ್ರಾರಂಭಿಸಿ
ಕೊನೆಯನ್ನು ಮನಸ್ಸಿನಲ್ಲಿ ಇಟ್ಟು ಪ್ರಾರಂಭಿಸುವುದು ಎಂದರೆ, ನೀವು ಪ್ರೇಕ್ಷಕರಿಗೆ ನೀಡಬೇಕಾದ ಮುಖ್ಯ ಅಂಶಗಳನ್ನು ಸಂವಹನ ಆರಂಭಿಸುವ ಮೊದಲು ಅರ್ಥಮಾಡಿಕೊಳ್ಳುವುದು. ನೀವು ನಿಮ್ಮ ಪ್ರೇಕ್ಷಕರು ಏನು ತೆಗೆದುಕೊಂಡು ಹೋಗಬೇಕೆಂದು ಬಯಸುತ್ತೀರಿ ಎಂದು ಮುಂಚಿತವಾಗಿ ಯೋಚಿಸುವುದು, ನೀವು ಹೇಳಲು ಬಯಸುವ ಕಥೆಯನ್ನು ರೂಪಿಸಲು ಸಹಾಯ ಮಾಡುತ್ತದೆ. ಕೊನೆಯನ್ನು ಮನಸ್ಸಿನಲ್ಲಿ ಇಟ್ಟು ಪ್ರಾರಂಭಿಸುವುದು ಒನ್-ವೇ ಮತ್ತು ಟೂ-ವೇ ಎರಡೂ ಸಂವಹನಗಳಿಗೆ ಸೂಕ್ತ.
ನೀವು ಕೊನೆಯನ್ನು ಮನಸ್ಸಿನಲ್ಲಿ ಇಟ್ಟು ಪ್ರಾರಂಭಿಸುವುದು ಹೇಗೆ? ನಿಮ್ಮ ಡೇಟಾ ಸಂವಹನ ಮಾಡುವ ಮೊದಲು, ನಿಮ್ಮ ಪ್ರಮುಖ ಅಂಶಗಳನ್ನು ಬರೆಯಿರಿ. ನಂತರ, ನೀವು ಡೇಟಾ ಮೂಲಕ ಹೇಳಲು ಬಯಸುವ ಕಥೆಯನ್ನು ತಯಾರಿಸುವ ಪ್ರತಿ ಹಂತದಲ್ಲಿ, "ಇದು ನಾನು ಹೇಳುತ್ತಿರುವ ಕಥೆಗೆ ಹೇಗೆ ಸೇರಿಕೊಳ್ಳುತ್ತದೆ?" ಎಂದು ಕೇಳಿಕೊಳ್ಳಿ.
ಜಾಗರೂಕವಾಗಿರಿ ಕೊನೆಯನ್ನು ಮನಸ್ಸಿನಲ್ಲಿ ಇಟ್ಟು ಪ್ರಾರಂಭಿಸುವುದು ಆದರ್ಶವಾಗಿದೆ, ಆದರೆ ನೀವು ನಿಮ್ಮ ಉದ್ದೇಶಿತ ಅಂಶಗಳನ್ನು ಬೆಂಬಲಿಸುವ ಡೇಟಾವನ್ನು ಮಾತ್ರ ಸಂವಹನ ಮಾಡಬಾರದು. ಇದನ್ನು ಚೆರ್ರಿ-ಪಿಕಿಂಗ್ ಎಂದು ಕರೆಯುತ್ತಾರೆ, ಅಂದರೆ ಸಂವಹನಕಾರರು ತಮ್ಮ ಹೇಳಲು ಬಯಸುವ ಅಂಶವನ್ನು ಬೆಂಬಲಿಸುವ ಡೇಟಾವನ್ನು ಮಾತ್ರ ಸಂವಹನ ಮಾಡುತ್ತಾರೆ ಮತ್ತು ಇತರ ಡೇಟಾವನ್ನು ನಿರ್ಲಕ್ಷಿಸುತ್ತಾರೆ.
ನೀವು ಸಂಗ್ರಹಿಸಿದ ಎಲ್ಲಾ ಡೇಟಾ ನಿಮ್ಮ ಉದ್ದೇಶಿತ ಅಂಶಗಳನ್ನು ಸ್ಪಷ್ಟವಾಗಿ ಬೆಂಬಲಿಸಿದರೆ, ಅದ್ಭುತ. ಆದರೆ ನೀವು ಸಂಗ್ರಹಿಸಿದ ಕೆಲವು ಡೇಟಾ ನಿಮ್ಮ ಅಂಶಗಳನ್ನು ಬೆಂಬಲಿಸದಿದ್ದರೆ ಅಥವಾ ನಿಮ್ಮ ಪ್ರಮುಖ ಅಂಶಗಳಿಗೆ ವಿರುದ್ಧವಾದ ವಾದವನ್ನು ಬೆಂಬಲಿಸಿದರೆ, ಆ ಡೇಟಾವನ್ನು ಕೂಡ ಸಂವಹನ ಮಾಡಬೇಕು. ಈ ಸಂದರ್ಭದಲ್ಲಿ, ನಿಮ್ಮ ಪ್ರೇಕ್ಷಕರಿಗೆ ಮುಂಚಿತವಾಗಿ ತಿಳಿಸಿ, ಎಲ್ಲಾ ಡೇಟಾ ನಿಮ್ಮ ಕಥೆಯನ್ನು ಬೆಂಬಲಿಸದಿದ್ದರೂ ನೀವು ಕಥೆಯನ್ನು ಮುಂದುವರಿಸುವುದಕ್ಕೆ ಕಾರಣವೇನು ಎಂದು ತಿಳಿಸಿ.
### 3. ನಿಜವಾದ ಕಥೆಯಂತೆ ಹತ್ತಿರವಾಗಿರಿ
ಸಾಂಪ್ರದಾಯಿಕ ಕಥೆ 5 ಹಂತಗಳಲ್ಲಿ ನಡೆಯುತ್ತದೆ. ನೀವು ಈ ಹಂತಗಳನ್ನು ಪ್ರದರ್ಶನ, ಏರಿಕೆ, ಶಿಖರ, ಇಳಿಕೆ, ಮತ್ತು ನಿರ್ಣಯ ಎಂದು ಕೇಳಿರಬಹುದು. ಅಥವಾ ಸುಲಭವಾಗಿ ನೆನಪಿಡಲು ಸನ್ನಿವೇಶ, ಸಂಘರ್ಷ, ಶಿಖರ, ಮುಕ್ತಾಯ, ಸಮಾರೋಪ. ನಿಮ್ಮ ಡೇಟಾ ಮತ್ತು ಕಥೆಯನ್ನು ಸಂವಹನ ಮಾಡುವಾಗ, ನೀವು ಇದೇ ರೀತಿಯ ವಿಧಾನವನ್ನು ಅನುಸರಿಸಬಹುದು.
ನೀವು ಸನ್ನಿವೇಶದಿಂದ ಪ್ರಾರಂಭಿಸಿ, ವೇದಿಕೆಯನ್ನು ಸಿದ್ಧಪಡಿಸಿ ಮತ್ತು ನಿಮ್ಮ ಪ್ರೇಕ್ಷಕರು ಎಲ್ಲರೂ ಒಂದೇ ಪುಟದಲ್ಲಿದ್ದಾರೆ ಎಂದು ಖಚಿತಪಡಿಸಿಕೊಳ್ಳಿ. ನಂತರ ಸಂಘರ್ಷವನ್ನು ಪರಿಚಯಿಸಿ. ನೀವು ಈ ಡೇಟಾವನ್ನು ಸಂಗ್ರಹಿಸಲು ಏಕೆ ಬೇಕಾಯಿತು? ನೀವು ಯಾವ ಸಮಸ್ಯೆಗಳನ್ನು ಪರಿಹರಿಸಲು ಯತ್ನಿಸುತ್ತಿದ್ದೀರಿ? ನಂತರ ಶಿಖರ. ಡೇಟಾ ಏನು? ಡೇಟಾ ಅರ್ಥವೇನು? ಡೇಟಾ ನಮಗೆ ಯಾವ ಪರಿಹಾರಗಳನ್ನು ಸೂಚಿಸುತ್ತದೆ? ನಂತರ ಮುಕ್ತಾಯ, ಇಲ್ಲಿ ನೀವು ಸಮಸ್ಯೆಯನ್ನು ಮತ್ತು ಪ್ರಸ್ತಾವಿತ ಪರಿಹಾರ(ಗಳನ್ನು) ಪುನರಾವರ್ತಿಸಬಹುದು. ಕೊನೆಗೆ, ಸಮಾರೋಪ, ಇಲ್ಲಿ ನೀವು ನಿಮ್ಮ ಪ್ರಮುಖ ಅಂಶಗಳನ್ನು ಮತ್ತು ತಂಡ ತೆಗೆದುಕೊಳ್ಳಬೇಕಾದ ಮುಂದಿನ ಹಂತಗಳನ್ನು ಸಾರಾಂಶ ಮಾಡಬಹುದು.
### 4. ಅರ್ಥಪೂರ್ಣ ಪದಗಳು ಮತ್ತು ವಾಕ್ಯಗಳನ್ನು ಬಳಸಿ
ನೀವು ಮತ್ತು ನಾನು ಒಟ್ಟಿಗೆ ಉತ್ಪನ್ನದ ಮೇಲೆ ಕೆಲಸ ಮಾಡುತ್ತಿದ್ದೇವೆ ಎಂದು ಊಹಿಸಿ, ನಾನು ನಿಮಗೆ "ನಮ್ಮ ಬಳಕೆದಾರರು ನಮ್ಮ ವೇದಿಕೆಗೆ ಸೇರಲು ಹೆಚ್ಚು ಸಮಯ ತೆಗೆದುಕೊಳ್ಳುತ್ತಾರೆ" ಎಂದು ಹೇಳಿದರೆ, "ಹೆಚ್ಚು ಸಮಯ" ಎಷ್ಟು ಎಂದು ನೀವು ಅಂದಾಜಿಸುತ್ತೀರಿ? ಒಂದು ಗಂಟೆ? ಒಂದು ವಾರ? ತಿಳಿಯಲು ಕಷ್ಟ. ನಾನು ಅದನ್ನು ಸಂಪೂರ್ಣ ಪ್ರೇಕ್ಷಕರಿಗೆ ಹೇಳಿದರೆ? ಪ್ರತಿ ಪ್ರೇಕ್ಷಕನಿಗೆ ಬೇರೆ ಬೇರೆ ಕಲ್ಪನೆಗಳು ಇರಬಹುದು.
ಬದಲಿಗೆ, ನಾನು ಹೇಳಿದರೆ "ನಮ್ಮ ಬಳಕೆದಾರರು ಸರಾಸರಿ 3 ನಿಮಿಷಗಳಲ್ಲಿ ಸೈನ್ ಅಪ್ ಮಾಡಿ ನಮ್ಮ ವೇದಿಕೆಗೆ ಸೇರುತ್ತಾರೆ."
ಅಂತಹ ಸಂದೇಶ ಸ್ಪಷ್ಟವಾಗಿದೆ. ಡೇಟಾ ಸಂವಹನದಲ್ಲಿ, ನಿಮ್ಮ ಪ್ರೇಕ್ಷಕರು ನಿಮ್ಮಂತೆ ಯೋಚಿಸುತ್ತಿದ್ದಾರೆ ಎಂದು ಭಾವಿಸುವುದು ಸುಲಭ. ಆದರೆ ಅದು ಸದಾ ಸತ್ಯವಲ್ಲ. ನಿಮ್ಮ ಡೇಟಾ ಮತ್ತು ಅದರ ಅರ್ಥವನ್ನು ಸ್ಪಷ್ಟವಾಗಿ ತಿಳಿಸುವುದು ನಿಮ್ಮ ಜವಾಬ್ದಾರಿಯಾಗಿದೆ. ಡೇಟಾ ಅಥವಾ ನಿಮ್ಮ ಕಥೆ ಸ್ಪಷ್ಟವಾಗದಿದ್ದರೆ, ನಿಮ್ಮ ಪ್ರೇಕ್ಷಕರು ಅನುಸರಿಸಲು ಕಷ್ಟಪಡುತ್ತಾರೆ ಮತ್ತು ನಿಮ್ಮ ಪ್ರಮುಖ ಅಂಶಗಳನ್ನು ಅರ್ಥಮಾಡಿಕೊಳ್ಳುವ ಸಾಧ್ಯತೆ ಕಡಿಮೆಯಾಗುತ್ತದೆ.
ನೀವು ಅರ್ಥಪೂರ್ಣ ಪದಗಳು ಮತ್ತು ವಾಕ್ಯಗಳನ್ನು ಬಳಸಿದಾಗ ಡೇಟಾವನ್ನು ಹೆಚ್ಚು ಸ್ಪಷ್ಟವಾಗಿ ಸಂವಹನ ಮಾಡಬಹುದು, ಅಸ್ಪಷ್ಟ ಪದಗಳ ಬದಲು. ಕೆಳಗೆ ಕೆಲವು ಉದಾಹರಣೆಗಳಿವೆ.
- ನಾವು *ಅದ್ಭುತ* ವರ್ಷವನ್ನು ಹೊಂದಿದ್ದೇವೆ!
- ಒಬ್ಬರು ಅದ್ಭುತ ವರ್ಷ ಎಂದರೆ 2% - 3% ಆದಾಯ ಏರಿಕೆಯನ್ನು ಅರ್ಥಮಾಡಿಕೊಳ್ಳಬಹುದು, ಮತ್ತೊಬ್ಬರು 50% - 60% ಏರಿಕೆಯನ್ನು ಅರ್ಥಮಾಡಿಕೊಳ್ಳಬಹುದು.
- ನಮ್ಮ ಬಳಕೆದಾರರ ಯಶಸ್ಸಿನ ದರಗಳು *ನಾಟಕೀಯವಾಗಿ* ಹೆಚ್ಚಿದವು.
- ನಾಟಕೀಯ ಏರಿಕೆ ಎಂದರೆ ಎಷ್ಟು ದೊಡ್ಡ ಏರಿಕೆ?
- ಈ ಕಾರ್ಯವು *ಗಂಭೀರ* ಪ್ರಯತ್ನವನ್ನು ಅಗತ್ಯವಿದೆ.
- ಗಂಭೀರ ಪ್ರಯತ್ನ ಎಂದರೆ ಎಷ್ಟು?
ಅಸ್ಪಷ್ಟ ಪದಗಳನ್ನು ಮುಂದಿನ ಡೇಟಾ ಪರಿಚಯಿಸಲು ಅಥವಾ ನೀವು ಹೇಳಿದ ಕಥೆಯ ಸಾರಾಂಶವಾಗಿ ಬಳಸಬಹುದು. ಆದರೆ ನಿಮ್ಮ ಪ್ರಸ್ತುತಪಡಿಸುವಿಕೆಯ ಪ್ರತಿಯೊಂದು ಭಾಗವೂ ಸ್ಪಷ್ಟವಾಗಿರಬೇಕು ಎಂದು ಖಚಿತಪಡಿಸಿಕೊಳ್ಳಿ.
### 5. ಭಾವನೆಗಳನ್ನು ಬಳಸಿ
ಭಾವನೆ ಕಥನಕಲೆಯ ಪ್ರಮುಖ ಅಂಶ. ಡೇಟಾ ಮೂಲಕ ಕಥೆ ಹೇಳುವಾಗ ಇದು ಇನ್ನೂ ಮುಖ್ಯ. ನೀವು ಡೇಟಾ ಸಂವಹನ ಮಾಡುವಾಗ, ಎಲ್ಲವೂ ನಿಮ್ಮ ಪ್ರೇಕ್ಷಕರು ತೆಗೆದುಕೊಳ್ಳಬೇಕಾದ ಅಂಶಗಳ ಮೇಲೆ ಕೇಂದ್ರೀಕರಿಸುತ್ತದೆ. ನೀವು ಪ್ರೇಕ್ಷಕರಲ್ಲಿ ಭಾವನೆಗಳನ್ನು ಹುಟ್ಟಿಸಿದಾಗ, ಅವರು ಸಹಾನುಭೂತಿ ಹೊಂದುತ್ತಾರೆ ಮತ್ತು ಕ್ರಮ ಕೈಗೊಳ್ಳುವ ಸಾಧ್ಯತೆ ಹೆಚ್ಚಾಗುತ್ತದೆ. ಭಾವನೆ ಪ್ರೇಕ್ಷಕರು ನಿಮ್ಮ ಸಂದೇಶವನ್ನು ನೆನಪಿಡುವ ಸಾಧ್ಯತೆಯನ್ನು ಹೆಚ್ಚಿಸುತ್ತದೆ.
ನೀವು ಇದನ್ನು ಟಿವಿ ಜಾಹೀರಾತುಗಳಲ್ಲಿ ನೋಡಿರಬಹುದು. ಕೆಲವು ಜಾಹೀರಾತುಗಳು ತುಂಬಾ ಗಂಭೀರವಾಗಿರುತ್ತವೆ ಮತ್ತು ದುಃಖಭಾವವನ್ನು ಬಳಸಿ ಪ್ರೇಕ್ಷಕರೊಂದಿಗೆ ಸಂಪರ್ಕ ಸಾಧಿಸುತ್ತವೆ ಮತ್ತು ಅವರು ನೀಡುತ್ತಿರುವ ಡೇಟಾವನ್ನು ಹೆಚ್ಚು ಗಮನ ಸೆಳೆಯುವಂತೆ ಮಾಡುತ್ತವೆ. ಅಥವಾ ಕೆಲವು ಜಾಹೀರಾತುಗಳು ತುಂಬಾ ಹರ್ಷಭರಿತವಾಗಿರುತ್ತವೆ ಮತ್ತು ನಿಮ್ಮನ್ನು ಅವರ ಡೇಟಾವನ್ನು ಸಂತೋಷಭಾವದೊಂದಿಗೆ ಸಂಪರ್ಕಿಸುವಂತೆ ಮಾಡಬಹುದು.
ಡೇಟಾ ಸಂವಹನದಲ್ಲಿ ಭಾವನೆಗಳನ್ನು ಹೇಗೆ ಬಳಸುವುದು? ಕೆಳಗೆ ಕೆಲವು ವಿಧಾನಗಳಿವೆ.
- ಸಾಕ್ಷ್ಯಗಳು ಮತ್ತು ವೈಯಕ್ತಿಕ ಕಥೆಗಳನ್ನು ಬಳಸಿ
- ಡೇಟಾ ಸಂಗ್ರಹಿಸುವಾಗ, ಪ್ರಮಾಣಾತ್ಮಕ ಮತ್ತು ಗುಣಾತ್ಮಕ ಡೇಟಾವನ್ನು ಎರಡನ್ನೂ ಸಂಗ್ರಹಿಸಲು ಪ್ರಯತ್ನಿಸಿ, ಮತ್ತು ಸಂವಹನ ಮಾಡುವಾಗ ಎರಡನ್ನೂ ಸೇರಿಸಿ. ನಿಮ್ಮ ಡೇಟಾ ಮುಖ್ಯವಾಗಿ ಪ್ರಮಾಣಾತ್ಮಕವಾಗಿದ್ದರೆ, ವ್ಯಕ್ತಿಗಳಿಂದ ಕಥೆಗಳನ್ನು ಹುಡುಕಿ ಅವರ ಅನುಭವವನ್ನು ತಿಳಿದುಕೊಳ್ಳಿ.
- ಚಿತ್ರಗಳನ್ನು ಬಳಸಿ
- ಚಿತ್ರಗಳು ಪ್ರೇಕ್ಷಕರಿಗೆ ತಾವು ಆ ಪರಿಸ್ಥಿತಿಯಲ್ಲಿ ಇದ್ದಂತೆ ಕಾಣಲು ಸಹಾಯ ಮಾಡುತ್ತವೆ. ಚಿತ್ರಗಳನ್ನು ಬಳಸಿದಾಗ, ನೀವು ಪ್ರೇಕ್ಷಕರನ್ನು ನಿಮ್ಮ ಡೇಟಾ ಬಗ್ಗೆ ಹೊಂದಬೇಕಾದ ಭಾವನೆಗೆ ಒತ್ತಾಯಿಸಬಹುದು.
- ಬಣ್ಣಗಳನ್ನು ಬಳಸಿ
- ವಿಭಿನ್ನ ಬಣ್ಣಗಳು ವಿಭಿನ್ನ ಭಾವನೆಗಳನ್ನು ಹುಟ್ಟಿಸುತ್ತವೆ. ಜನಪ್ರಿಯ ಬಣ್ಣಗಳು ಮತ್ತು ಅವು ಹುಟ್ಟಿಸುವ ಭಾವನೆಗಳು ಕೆಳಗಿನಂತಿವೆ. ಗಮನಿಸಿ, ಬಣ್ಣಗಳು ವಿಭಿನ್ನ ಸಂಸ್ಕೃತಿಗಳಲ್ಲಿ ವಿಭಿನ್ನ ಅರ್ಥಗಳನ್ನು ಹೊಂದಿರಬಹುದು.
- ನೀಲಿ ಸಾಮಾನ್ಯವಾಗಿ ಶಾಂತಿ ಮತ್ತು ನಂಬಿಕೆಯನ್ನು ಹುಟ್ಟಿಸುತ್ತದೆ
- ಹಸಿರು ಸಾಮಾನ್ಯವಾಗಿ ಪ್ರಕೃತಿ ಮತ್ತು ಪರಿಸರಕ್ಕೆ ಸಂಬಂಧಿಸಿದೆ
- ಕೆಂಪು ಸಾಮಾನ್ಯವಾಗಿ ಉತ್ಸಾಹ ಮತ್ತು ಉತ್ಸಾಹವನ್ನು ಸೂಚಿಸುತ್ತದೆ
- ಹಳದಿ ಸಾಮಾನ್ಯವಾಗಿ ಆಶಾವಾದ ಮತ್ತು ಸಂತೋಷವನ್ನು ಸೂಚಿಸುತ್ತದೆ
# ಸಂವಹನ ಪ್ರಕರಣ ಅಧ್ಯಯನ
ಎಮರ್ಸನ್ ಒಂದು ಮೊಬೈಲ್ ಅಪ್ಲಿಕೇಶನ್‌ನ ಉತ್ಪನ್ನ ನಿರ್ವಾಹಕ. ಎಮರ್ಸನ್ ಗಮನಿಸಿದಂತೆ, ಗ್ರಾಹಕರು ವಾರಾಂತ್ಯಗಳಲ್ಲಿ 42% ಹೆಚ್ಚು ದೂರುಗಳು ಮತ್ತು ದೋಷ ವರದಿಗಳನ್ನು ಸಲ್ಲಿಸುತ್ತಾರೆ. 48 ಗಂಟೆಗಳ ನಂತರ ಉತ್ತರಿಸದ ದೂರು ಸಲ್ಲಿಸುವ ಗ್ರಾಹಕರು ಅಪ್ಲಿಕೇಶನ್ ಸ್ಟೋರ್‌ನಲ್ಲಿ 1 ಅಥವಾ 2 ರೇಟಿಂಗ್ ನೀಡುವ ಸಾಧ್ಯತೆ 32% ಹೆಚ್ಚು ಇದೆ ಎಂದು ಎಮರ್ಸನ್ ಗಮನಿಸಿದ್ದಾರೆ.
ಶೋಧನೆ ಮಾಡಿದ ನಂತರ, ಎಮರ್ಸನ್ ಸಮಸ್ಯೆಯನ್ನು ಪರಿಹರಿಸುವ ಕೆಲವು ಪರಿಹಾರಗಳನ್ನು ಹೊಂದಿದ್ದಾರೆ. ಎಮರ್ಸನ್ 3 ಕಂಪನಿ ಮುಖ್ಯಸ್ಥರೊಂದಿಗೆ 30 ನಿಮಿಷಗಳ ಸಭೆಯನ್ನು ಏರ್ಪಡಿಸಿ ಡೇಟಾ ಮತ್ತು ಪ್ರಸ್ತಾವಿತ ಪರಿಹಾರಗಳನ್ನು ಸಂವಹನ ಮಾಡುತ್ತಾರೆ.
ಈ ಸಭೆಯಲ್ಲಿ, ಎಮರ್ಸನ್ ಗುರಿ ಕಂಪನಿ ಮುಖ್ಯಸ್ಥರಿಗೆ ಕೆಳಗಿನ 2 ಪರಿಹಾರಗಳು ಅಪ್ಲಿಕೇಶನ್ ರೇಟಿಂಗ್ ಅನ್ನು ಸುಧಾರಿಸಬಹುದು ಮತ್ತು ಅದು ಹೆಚ್ಚಿನ ಆದಾಯಕ್ಕೆ ಅನುವಾದವಾಗಬಹುದು ಎಂದು ಅರ್ಥಮಾಡಿಕೊಳ್ಳಿಸುವುದು.
**ಪರಿಹಾರ 1.** ವಾರಾಂತ್ಯಗಳಲ್ಲಿ ಕೆಲಸ ಮಾಡಲು ಗ್ರಾಹಕ ಸೇವಾ ಪ್ರತಿನಿಧಿಗಳನ್ನು ನೇಮಿಸಿ
**ಪರಿಹಾರ 2.** ಹೊಸ ಗ್ರಾಹಕ ಸೇವಾ ಟಿಕೆಟ್ ವ್ಯವಸ್ಥೆಯನ್ನು ಖರೀದಿಸಿ, ಇಲ್ಲಿ ಗ್ರಾಹಕ ಸೇವಾ ಪ್ರತಿನಿಧಿಗಳು ಯಾವ ದೂರುಗಳು ಹೆಚ್ಚು ಕಾಲ ಕ್ಯೂಯಲ್ಲಿ ಇದ್ದವು ಎಂದು ಸುಲಭವಾಗಿ ಗುರುತಿಸಬಹುದು ಆದ್ದರಿಂದ ತಕ್ಷಣವೇ ಯಾವ ದೂರುಗಳನ್ನು ಪರಿಹರಿಸಬೇಕೆಂದು ತಿಳಿಸಬಹುದು.
ಸಭೆಯಲ್ಲಿ, ಎಮರ್ಸನ್ 5 ನಿಮಿಷಗಳು ಅಪ್ಲಿಕೇಶನ್ ಸ್ಟೋರ್‌ನಲ್ಲಿ ಕಡಿಮೆ ರೇಟಿಂಗ್ ಇರುವುದರಿಂದ ಏಕೆ ಕೆಟ್ಟದು ಎಂದು ವಿವರಿಸುತ್ತಾರೆ, 10 ನಿಮಿಷಗಳು ಶೋಧನಾ ಪ್ರಕ್ರಿಯೆ ಮತ್ತು ಟ್ರೆಂಡ್ಗಳನ್ನು ಗುರುತಿಸುವ ವಿಧಾನವನ್ನು ವಿವರಿಸುತ್ತಾರೆ, 10 ನಿಮಿಷಗಳು ಇತ್ತೀಚಿನ ಗ್ರಾಹಕ ದೂರುಗಳನ್ನು ಪರಿಶೀಲಿಸುತ್ತಾರೆ, ಮತ್ತು ಕೊನೆಗೆ 5 ನಿಮಿಷಗಳಲ್ಲಿ 2 ಸಾಧ್ಯ ಪರಿಹಾರಗಳನ್ನು ಸಂಕ್ಷಿಪ್ತವಾಗಿ ವಿವರಿಸುತ್ತಾರೆ.
ಇದು Emerson ಈ ಸಭೆಯ ಸಮಯದಲ್ಲಿ ಸಂವಹನ ಮಾಡಲು ಪರಿಣಾಮಕಾರಿಯಾದ ವಿಧಾನವಾಗಿದೆಯೇ?
ಸಭೆಯ ಸಮಯದಲ್ಲಿ, ಒಂದು ಕಂಪನಿಯ ನಾಯಕ Emerson ಮೂಲಕ ನಡೆದ 10 ನಿಮಿಷಗಳ ಗ್ರಾಹಕ ದೂರುಗಳ ಮೇಲೆ ಕೇಂದ್ರೀಕರಿಸಿದರು. ಸಭೆಯ ನಂತರ, ಈ ದೂರುಗಳು ಮಾತ್ರ ಈ ತಂಡದ ನಾಯಕರಿಗೆ ನೆನಪಿನಲ್ಲಿ ಉಳಿದವು. ಮತ್ತೊಂದು ಕಂಪನಿಯ ನಾಯಕ Emerson ಸಂಶೋಧನಾ ಪ್ರಕ್ರಿಯೆಯನ್ನು ವಿವರಿಸುವುದರಲ್ಲಿ ಮುಖ್ಯವಾಗಿ ಗಮನಹರಿಸಿದರು. ಮೂರನೇ ಕಂಪನಿಯ ನಾಯಕ Emerson ಪ್ರಸ್ತಾಪಿಸಿದ ಪರಿಹಾರಗಳನ್ನು ನೆನಪಿಟ್ಟುಕೊಂಡರು ಆದರೆ ಆ ಪರಿಹಾರಗಳನ್ನು ಹೇಗೆ ಜಾರಿಗೆ ತರಬಹುದು ಎಂಬುದರಲ್ಲಿ ಖಚಿತವಾಗಿರಲಿಲ್ಲ.
ಮೇಲಿನ ಪರಿಸ್ಥಿತಿಯಲ್ಲಿ, Emerson ತಂಡದ ನಾಯಕರಿಗೆ ನೀಡಲು ಬಯಸಿದ ಸಂದೇಶ ಮತ್ತು ಅವರು ಸಭೆಯಿಂದ ತೆಗೆದುಕೊಂಡ ಸಂದೇಶಗಳ ನಡುವೆ ಮಹತ್ವದ ವ್ಯತ್ಯಾಸವಿತ್ತು. ಕೆಳಗಿನದು Emerson ಪರಿಗಣಿಸಬಹುದಾದ ಮತ್ತೊಂದು ವಿಧಾನವಾಗಿದೆ.
Emerson ಈ ವಿಧಾನವನ್ನು ಹೇಗೆ ಸುಧಾರಿಸಬಹುದು?
ಸಂದರ್ಭ, ಸಂಘರ್ಷ, ಶಿಖರ, ಸಮಾಪ್ತಿ, ನಿರ್ಣಯ
**ಸಂದರ್ಭ** - Emerson ಮೊದಲ 5 ನಿಮಿಷಗಳನ್ನು ಸಂಪೂರ್ಣ ಪರಿಸ್ಥಿತಿಯನ್ನು ಪರಿಚಯಿಸಲು ಮತ್ತು ತಂಡದ ನಾಯಕರು ಸಮಸ್ಯೆಗಳು ಕಂಪನಿಗೆ ಮಹತ್ವದ ಮೆಟ್ರಿಕ್ಸ್‌ಗಳ ಮೇಲೆ ಹೇಗೆ ಪ್ರಭಾವ ಬೀರುತ್ತವೆ ಎಂಬುದನ್ನು ಅರ್ಥಮಾಡಿಕೊಳ್ಳುವಂತೆ ಮಾಡಲು ಬಳಸಬಹುದು, ಉದಾಹರಣೆಗೆ ಆದಾಯ.
ಇದನ್ನು ಹೀಗೆ ವಿವರಿಸಬಹುದು: "ಪ್ರಸ್ತುತ, ನಮ್ಮ ಆಪ್ ಸ್ಟೋರ್‌ನಲ್ಲಿ ನಮ್ಮ ಆಪ್ ರೇಟಿಂಗ್ 2.5 ಆಗಿದೆ. ಆಪ್ ಸ್ಟೋರ್‌ನಲ್ಲಿ ರೇಟಿಂಗ್‌ಗಳು ಆಪ್ ಸ್ಟೋರ್ ಆಪ್ಟಿಮೈಜೆಶನ್‌ಗೆ ಮಹತ್ವದವು, ಇದು ಎಷ್ಟು ಬಳಕೆದಾರರು ನಮ್ಮ ಆಪ್ ಅನ್ನು ಹುಡುಕಾಟದಲ್ಲಿ ನೋಡುತ್ತಾರೆ ಮತ್ತು ಭವಿಷ್ಯದ ಬಳಕೆದಾರರಿಗೆ ನಮ್ಮ ಆಪ್ ಹೇಗೆ ಕಾಣುತ್ತದೆ ಎಂಬುದನ್ನು ಪ್ರಭಾವಿಸುತ್ತದೆ. ಮತ್ತು ನಿಶ್ಚಿತವಾಗಿ, ನಮ್ಮ ಬಳಕೆದಾರರ ಸಂಖ್ಯೆ ನೇರವಾಗಿ ಆದಾಯಕ್ಕೆ ಸಂಬಂಧಿಸಿದೆ."
**ಸಂಘರ್ಷ** Emerson ನಂತರ ಮುಂದಿನ 5 ನಿಮಿಷಗಳ ಕಾಲ ಸಂಘರ್ಷದ ಬಗ್ಗೆ ಮಾತನಾಡಬಹುದು.
ಇದನ್ನು ಹೀಗೆ ಹೇಳಬಹುದು: "ಬಳಕೆದಾರರು ವಾರಾಂತ್ಯಗಳಲ್ಲಿ 42% ಹೆಚ್ಚು ದೂರುಗಳು ಮತ್ತು ಬಗ್ ವರದಿಗಳನ್ನು ಸಲ್ಲಿಸುತ್ತಾರೆ. 48 ಗಂಟೆಗಳ ನಂತರ ಉತ್ತರಿಸದ ದೂರು ಸಲ್ಲಿಸುವ ಗ್ರಾಹಕರು ಆಪ್ ಸ್ಟೋರ್‌ನಲ್ಲಿ 2 ರೇಟಿಂಗ್‌ಕ್ಕಿಂತ ಹೆಚ್ಚು ನೀಡುವ ಸಾಧ್ಯತೆ 32% ಕಡಿಮೆಯಾಗಿದೆ. ನಮ್ಮ ಆಪ್ ರೇಟಿಂಗ್ ಅನ್ನು 4ಕ್ಕೆ ಸುಧಾರಿಸುವುದು ನಮ್ಮ ದೃಶ್ಯತೆಯನ್ನು 20-30% ಹೆಚ್ಚಿಸುತ್ತದೆ, ಇದರಿಂದ ನಾನು 10% ಆದಾಯ ವೃದ್ಧಿ ನಿರೀಕ್ಷಿಸುತ್ತೇನೆ." ನಿಶ್ಚಿತವಾಗಿ, Emerson ಈ ಸಂಖ್ಯೆಗಳ ನ್ಯಾಯಸಮ್ಮತತೆಯನ್ನು ಸಿದ್ಧಪಡಿಸಬೇಕು.
**ಶಿಖರ** ನೆಲೆಯನ್ನಿಟ್ಟ ನಂತರ, Emerson 5 ನಿಮಿಷಗಳ ಕಾಲ ಶಿಖರಕ್ಕೆ ಹೋಗಬಹುದು.
Emerson ಪ್ರಸ್ತಾಪಿಸಿದ ಪರಿಹಾರಗಳನ್ನು ಪರಿಚಯಿಸಬಹುದು, ಆ ಪರಿಹಾರಗಳು ವಿವರಿಸಿದ ಸಮಸ್ಯೆಗಳನ್ನು ಹೇಗೆ ಪರಿಹರಿಸುತ್ತವೆ, ಆ ಪರಿಹಾರಗಳನ್ನು ಇತ್ತೀಚಿನ ಕಾರ್ಯಪ್ರವಾಹಗಳಲ್ಲಿ ಹೇಗೆ ಜಾರಿಗೆ ತರಬಹುದು, ಪರಿಹಾರಗಳ ವೆಚ್ಚ ಎಷ್ಟು, ROI ಏನು, ಮತ್ತು ಜಾರಿಗೆ ಬಂದರೆ ಪರಿಹಾರಗಳು ಹೇಗೆ ಕಾಣುತ್ತವೆ ಎಂಬ ಸ್ಕ್ರೀನ್‌ಶಾಟ್‌ಗಳು ಅಥವಾ ವೈರ್‌ಫ್ರೇಮ್‌ಗಳನ್ನು ತೋರಿಸಬಹುದು. Emerson 48 ಗಂಟೆಗಳ ನಂತರ ದೂರುಗೆ ಉತ್ತರ ಪಡೆದ ಬಳಕೆದಾರರ ಪ್ರತಿಕ್ರಿಯೆಗಳನ್ನು ಮತ್ತು ಕಂಪನಿಯ ಪ್ರಸ್ತುತ ಗ್ರಾಹಕ ಸೇವಾ ಪ್ರತಿನಿಧಿಯ ಟಿಕೆಟ್ ವ್ಯವಸ್ಥೆಯ ಬಗ್ಗೆ ಕಾಮೆಂಟ್‌ಗಳನ್ನು ಹಂಚಿಕೊಳ್ಳಬಹುದು.
**ಸಮಾಪ್ತಿ** ಈಗ Emerson 5 ನಿಮಿಷಗಳನ್ನು ಕಂಪನಿಯ ಎದುರಿಸುತ್ತಿರುವ ಸಮಸ್ಯೆಗಳನ್ನು ಪುನಃ ಹೇಳಲು, ಪ್ರಸ್ತಾಪಿಸಿದ ಪರಿಹಾರಗಳನ್ನು ಮರುಪರಿಶೀಲಿಸಲು ಮತ್ತು ಆ ಪರಿಹಾರಗಳು ಯಾಕೆ ಸರಿಯಾದವು ಎಂಬುದನ್ನು ಪರಿಶೀಲಿಸಲು ಬಳಸಬಹುದು.
**ನಿರ್ಣಯ** ಇದು ಕೆಲವು ಹಿತಾಸಕ್ತರು ಇರುವ ಸಭೆಯಾಗಿದ್ದು, ಎರಡು ದಿಕ್ಕಿನ ಸಂವಹನ ನಡೆಯುವ ಕಾರಣ, Emerson 10 ನಿಮಿಷಗಳನ್ನು ಪ್ರಶ್ನೆಗಳಿಗೆ ಮೀಸಲಿಡಬಹುದು, ಇದರಿಂದ ತಂಡದ ನಾಯಕರಿಗೆ ಗೊಂದಲವಾಗಿದ್ದ ಯಾವುದೇ ವಿಷಯಗಳನ್ನು ಸಭೆ ಮುಗಿಯುವ ಮೊದಲು ಸ್ಪಷ್ಟಪಡಿಸಬಹುದು.
Emerson ವಿಧಾನ #2 ತೆಗೆದುಕೊಂಡರೆ, ತಂಡದ ನಾಯಕರು Emerson ಬಯಸಿದಂತೆ ಸಭೆಯಿಂದ ತೆಗೆದುಕೊಳ್ಳುವ ಸಾಧ್ಯತೆ ಹೆಚ್ಚು ದೂರುಗಳು ಮತ್ತು ಬಗ್‌ಗಳನ್ನು ಹೇಗೆ ನಿರ್ವಹಿಸಬಹುದು ಎಂಬುದನ್ನು ಸುಧಾರಿಸಬಹುದು ಮತ್ತು ಆ ಸುಧಾರಣೆಗೆ 2 ಪರಿಹಾರಗಳನ್ನು ಜಾರಿಗೆ ತರಬಹುದು. ಈ ವಿಧಾನವು Emerson ಸಂವಹನ ಮಾಡಲು ಬಯಸುವ ಡೇಟಾ ಮತ್ತು ಕಥೆಯನ್ನು ಪರಿಣಾಮಕಾರಿಯಾಗಿ ಸಂವಹನ ಮಾಡುವ ಉತ್ತಮ ವಿಧಾನವಾಗಿರುತ್ತದೆ.
# ನಿರ್ಣಯ
### ಮುಖ್ಯ ಅಂಶಗಳ ಸಾರಾಂಶ
- ಸಂವಹನ ಎಂದರೆ ಮಾಹಿತಿ ಹಂಚಿಕೊಳ್ಳುವುದು ಅಥವಾ ವಿನಿಮಯ ಮಾಡಿಕೊಳ್ಳುವುದು.
- ಡೇಟಾ ಸಂವಹನ ಮಾಡುವಾಗ, ನಿಮ್ಮ ಗುರಿ ಸಂಖ್ಯೆಗಳನ್ನಷ್ಟೇ ಪ್ರೇಕ್ಷಕರಿಗೆ ನೀಡುವುದು ಅಲ್ಲ. ನಿಮ್ಮ ಗುರಿ ನಿಮ್ಮ ಡೇಟಾದಿಂದ ಪ್ರೇರಿತವಾದ ಕಥೆಯನ್ನು ಸಂವಹನ ಮಾಡುವುದು.
- ಎರಡು ವಿಧದ ಸಂವಹನಗಳಿವೆ, ಒನ್-ವೇ ಸಂವಹನ (ಮಾಹಿತಿ ಪ್ರತಿಕ್ರಿಯೆಯ ಉದ್ದೇಶವಿಲ್ಲದೆ ಸಂವಹನವಾಗುತ್ತದೆ) ಮತ್ತು ಟೂ-ವೇ ಸಂವಹನ (ಮಾಹಿತಿ ಹಿಂದಿರುಗಿ ವಿನಿಮಯವಾಗುತ್ತದೆ).
- ಡೇಟಾ ಕಥನಕ್ಕೆ ನೀವು ಬಳಸಬಹುದಾದ ಹಲವಾರು ತಂತ್ರಗಳಿವೆ, ನಾವು ನೋಡಿದ 5 ತಂತ್ರಗಳು:
- ನಿಮ್ಮ ಪ್ರೇಕ್ಷಕರನ್ನು, ನಿಮ್ಮ ಮಾಧ್ಯಮವನ್ನು ಮತ್ತು ನಿಮ್ಮ ಸಂವಹನ ವಿಧಾನವನ್ನು ಅರ್ಥಮಾಡಿಕೊಳ್ಳಿ
- ಅಂತ್ಯವನ್ನು ಮನಸ್ಸಿನಲ್ಲಿ ಇಟ್ಟುಕೊಂಡು ಪ್ರಾರಂಭಿಸಿ
- ನಿಜವಾದ ಕಥೆಯಂತೆ ಹತ್ತಿರವಿರಿ
- ಅರ್ಥಪೂರ್ಣ ಪದಗಳು ಮತ್ತು ವಾಕ್ಯಗಳನ್ನು ಬಳಸಿ
- ಭಾವನೆಯನ್ನು ಬಳಸಿ
### ಸ್ವಯಂ ಅಧ್ಯಯನಕ್ಕೆ ಶಿಫಾರಸು ಮಾಡಿದ ಸಂಪನ್ಮೂಲಗಳು
[The Five C's of Storytelling - Articulate Persuasion](http://articulatepersuasion.com/the-five-cs-of-storytelling/)
[1.4 Your Responsibilities as a Communicator Business Communication for Success (umn.edu)](https://open.lib.umn.edu/businesscommunication/chapter/1-4-your-responsibilities-as-a-communicator/)
[How to Tell a Story with Data (hbr.org)](https://hbr.org/2013/04/how-to-tell-a-story-with-data)
[Two-Way Communication: 4 Tips for a More Engaged Workplace (yourthoughtpartner.com)](https://www.yourthoughtpartner.com/blog/bid/59576/4-steps-to-increase-employee-engagement-through-two-way-communication)
[6 succinct steps to great data storytelling - BarnRaisers, LLC (barnraisersllc.com)](https://barnraisersllc.com/2021/05/02/6-succinct-steps-to-great-data-storytelling/)
[How to Tell a Story With Data | Lucidchart Blog](https://www.lucidchart.com/blog/how-to-tell-a-story-with-data)
[6 Cs of Effective Storytelling on Social Media | Cooler Insights](https://coolerinsights.com/2018/06/effective-storytelling-social-media/)
[The Importance of Emotions In Presentations | Ethos3 - A Presentation Training and Design Agency](https://ethos3.com/2015/02/the-importance-of-emotions-in-presentations/)
[Data storytelling: linking emotions and rational decisions (toucantoco.com)](https://www.toucantoco.com/en/blog/data-storytelling-dataviz)
[Emotional Advertising: How Brands Use Feelings to Get People to Buy (hubspot.com)](https://blog.hubspot.com/marketing/emotions-in-advertising-examples)
[Choosing Colors for Your Presentation Slides | Think Outside The Slide](https://www.thinkoutsidetheslide.com/choosing-colors-for-your-presentation-slides/)
[How To Present Data [10 Expert Tips] | ObservePoint](https://resources.observepoint.com/blog/10-tips-for-presenting-data)
[Microsoft Word - Persuasive Instructions.doc (tpsnva.org)](https://www.tpsnva.org/teach/lq/016/persinstr.pdf)
[The Power of Story for Your Data (thinkhdi.com)](https://www.thinkhdi.com/library/supportworld/2019/power-story-your-data.aspx)
[Common Mistakes in Data Presentation (perceptualedge.com)](https://www.perceptualedge.com/articles/ie/data_presentation.pdf)
[Infographic: Here are 15 Common Data Fallacies to Avoid (visualcapitalist.com)](https://www.visualcapitalist.com/here-are-15-common-data-fallacies-to-avoid/)
[Cherry Picking: When People Ignore Evidence that They Dislike Effectiviology](https://effectiviology.com/cherry-picking/#How_to_avoid_cherry_picking)
[Tell Stories with Data: Communication in Data Science | by Sonali Verghese | Towards Data Science](https://towardsdatascience.com/tell-stories-with-data-communication-in-data-science-5266f7671d7)
[1. Communicating Data - Communicating Data with Tableau [Book] (oreilly.com)](https://www.oreilly.com/library/view/communicating-data-with/9781449372019/ch01.html)
## [ಪೋಸ್ಟ್-ಲೆಕ್ಚರ್ ಕ್ವಿಜ್](https://ff-quizzes.netlify.app/en/ds/quiz/31)
ಮೇಲಿನ ಪೋಸ್ಟ್-ಲೆಕ್ಚರ್ ಕ್ವಿಜ್ ಮೂಲಕ ನೀವು ಇತ್ತೀಚೆಗೆ ಕಲಿತ ವಿಷಯವನ್ನು ಪರಿಶೀಲಿಸಿ!
## ಅಸೈನ್‌ಮೆಂಟ್
[ಮಾರ್ಕೆಟ್ ರಿಸರ್ಚ್](assignment.md)
---
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
**ಅಸ್ವೀಕಾರ**:
ಈ ದಸ್ತಾವೇಜು [Co-op Translator](https://github.com/Azure/co-op-translator) ಎಂಬ AI ಅನುವಾದ ಸೇವೆಯನ್ನು ಬಳಸಿ ಅನುವಾದಿಸಲಾಗಿದೆ. ನಾವು ಶುದ್ಧತೆಯತ್ತ ಪ್ರಯತ್ನಿಸುತ್ತಿದ್ದರೂ, ಸ್ವಯಂಚಾಲಿತ ಅನುವಾದಗಳಲ್ಲಿ ತಪ್ಪುಗಳು ಅಥವಾ ಅಸತ್ಯತೆಗಳು ಇರಬಹುದು ಎಂಬುದನ್ನು ದಯವಿಟ್ಟು ಗಮನಿಸಿ. ಮೂಲ ಭಾಷೆಯಲ್ಲಿರುವ ಮೂಲ ದಸ್ತಾವೇಜನ್ನು ಅಧಿಕೃತ ಮೂಲವೆಂದು ಪರಿಗಣಿಸಬೇಕು. ಪ್ರಮುಖ ಮಾಹಿತಿಗಾಗಿ, ವೃತ್ತಿಪರ ಮಾನವ ಅನುವಾದವನ್ನು ಶಿಫಾರಸು ಮಾಡಲಾಗುತ್ತದೆ. ಈ ಅನುವಾದ ಬಳಕೆಯಿಂದ ಉಂಟಾಗುವ ಯಾವುದೇ ತಪ್ಪು ಅರ್ಥಮಾಡಿಕೊಳ್ಳುವಿಕೆ ಅಥವಾ ತಪ್ಪು ವಿವರಣೆಗಳಿಗೆ ನಾವು ಹೊಣೆಗಾರರಾಗುವುದಿಲ್ಲ.
<!-- CO-OP TRANSLATOR DISCLAIMER END -->

@ -0,0 +1,28 @@
<!--
CO_OP_TRANSLATOR_METADATA:
{
"original_hash": "8980d7efd101c82d6d6ffc3458214120",
"translation_date": "2025-12-19T15:23:15+00:00",
"source_file": "4-Data-Science-Lifecycle/16-communication/assignment.md",
"language_code": "kn"
}
-->
# ಕಥೆಯನ್ನು ಹೇಳಿ
## ಸೂಚನೆಗಳು
ಡೇಟಾ ಸೈನ್ಸ್ ಎಂದರೆ ಕಥೆ ಹೇಳುವ ಕಲೆಯೇ. ಯಾವುದೇ ಡೇಟಾಸೆಟ್ ಅನ್ನು ಆಯ್ಕೆಮಾಡಿ ಅದರ ಬಗ್ಗೆ ನೀವು ಹೇಳಬಹುದಾದ ಕಥೆಯ ಕುರಿತು ಒಂದು ಚಿಕ್ಕ ಪ್ರಬಂಧವನ್ನು ಬರೆಯಿರಿ. ನಿಮ್ಮ ಡೇಟಾಸೆಟ್ ಏನು ಬಹಿರಂಗಪಡಿಸಬಹುದು ಎಂದು ನೀವು ನಿರೀಕ್ಷಿಸುತ್ತೀರಿ? ಅದರ ಬಹಿರಂಗಪಡಿಸುವಿಕೆಗಳು ಸಮಸ್ಯೆಕಾರಿಯಾಗಿದ್ದರೆ ನೀವು ಏನು ಮಾಡುತ್ತೀರಿ? ನಿಮ್ಮ ಡೇಟಾ ಸುಲಭವಾಗಿ ಅದರ ರಹಸ್ಯಗಳನ್ನು ಅನಾವರಣ ಮಾಡದಿದ್ದರೆ ಏನು? ನಿಮ್ಮ ಡೇಟಾಸೆಟ್ ನೀಡಬಹುದಾದ ಸಂದರ್ಭಗಳನ್ನು ಯೋಚಿಸಿ ಅವುಗಳನ್ನು ಬರೆಯಿರಿ.
## ಮೌಲ್ಯಮಾಪನ
ಉದಾಹರಣೆಯಾದ | ತೃಪ್ತಿಕರ | ಸುಧಾರಣೆಯ ಅಗತ್ಯವಿದೆ
--- | --- | -- |
ಡೇಟಾಸೆಟ್ ವಿವರಿಸಲ್ಪಟ್ಟಿದ್ದು, ದಾಖಲೆ ಮಾಡಲ್ಪಟ್ಟಿದ್ದು, ಕ್ರೆಡಿಟ್ ನೀಡಲ್ಪಟ್ಟಿದ್ದು, ಅದರ ಬಗ್ಗೆ ಸಮಗ್ರ ಕಥೆಯನ್ನು ವಿವರಿಸಿದ ಒಂದು ಪುಟದ ಪ್ರಬಂಧ .doc ಫಾರ್ಮ್ಯಾಟ್‌ನಲ್ಲಿ ನೀಡಲಾಗಿದೆ, ಡೇಟಾದಿಂದ ವಿವರವಾದ ಉದಾಹರಣೆಗಳೊಂದಿಗೆ. | ಕಡಿಮೆ ವಿವರಗಳೊಂದಿಗೆ ಚಿಕ್ಕ ಪ್ರಬಂಧ ನೀಡಲಾಗಿದೆ | ಮೇಲ್ಕಂಡ ವಿವರಗಳಲ್ಲಿ ಒಂದರಲ್ಲಿ ಕೊರತೆ ಕಂಡುಬರುತ್ತದೆ.
---
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
**ಅಸ್ವೀಕರಣ**:
ಈ ದಸ್ತಾವೇಜು [Co-op Translator](https://github.com/Azure/co-op-translator) ಎಂಬ AI ಅನುವಾದ ಸೇವೆಯನ್ನು ಬಳಸಿ ಅನುವಾದಿಸಲಾಗಿದೆ. ನಾವು ಶುದ್ಧತೆಯತ್ತ ಪ್ರಯತ್ನಿಸುತ್ತಿದ್ದರೂ, ಸ್ವಯಂಚಾಲಿತ ಅನುವಾದಗಳಲ್ಲಿ ತಪ್ಪುಗಳು ಅಥವಾ ಅಸತ್ಯತೆಗಳು ಇರಬಹುದು ಎಂದು ದಯವಿಟ್ಟು ಗಮನಿಸಿ. ಮೂಲ ಭಾಷೆಯಲ್ಲಿರುವ ಮೂಲ ದಸ್ತಾವೇಜನ್ನು ಅಧಿಕೃತ ಮೂಲವೆಂದು ಪರಿಗಣಿಸಬೇಕು. ಮಹತ್ವದ ಮಾಹಿತಿಗಾಗಿ, ವೃತ್ತಿಪರ ಮಾನವ ಅನುವಾದವನ್ನು ಶಿಫಾರಸು ಮಾಡಲಾಗುತ್ತದೆ. ಈ ಅನುವಾದ ಬಳಕೆಯಿಂದ ಉಂಟಾಗುವ ಯಾವುದೇ ತಪ್ಪು ಅರ್ಥಮಾಡಿಕೊಳ್ಳುವಿಕೆ ಅಥವಾ ತಪ್ಪು ವಿವರಣೆಗಳಿಗೆ ನಾವು ಹೊಣೆಗಾರರಾಗುವುದಿಲ್ಲ.
<!-- CO-OP TRANSLATOR DISCLAIMER END -->

@ -0,0 +1,32 @@
<!--
CO_OP_TRANSLATOR_METADATA:
{
"original_hash": "dd173fd30fc039a7a299898920680723",
"translation_date": "2025-12-19T13:24:49+00:00",
"source_file": "4-Data-Science-Lifecycle/README.md",
"language_code": "kn"
}
-->
# ಡೇಟಾ ಸೈನ್ಸ್ ಜೀವನಚಕ್ರ
![communication](../../../translated_images/communication.06d8e2a88d30d168d661ad9f9f0a4f947ebff3719719cfdaf9ed00a406a01ead.kn.jpg)
> ಫೋಟೋ <a href="https://unsplash.com/@headwayio?utm_source=unsplash&utm_medium=referral&utm_content=creditCopyText">ಹೆಡ್‌ವೇ</a> ಅವರಿಂದ <a href="https://unsplash.com/s/photos/communication?utm_source=unsplash&utm_medium=referral&utm_content=creditCopyText">ಅನ್ಸ್ಪ್ಲ್ಯಾಶ್</a> ನಲ್ಲಿ
ಈ ಪಾಠಗಳಲ್ಲಿ, ನೀವು ಡೇಟಾ ಸೈನ್ಸ್ ಜೀವನಚಕ್ರದ ಕೆಲವು ಅಂಶಗಳನ್ನು, ಡೇಟಾ ಸುತ್ತಲೂ ವಿಶ್ಲೇಷಣೆ ಮತ್ತು ಸಂವಹನವನ್ನು ಅನ್ವೇಷಿಸುವಿರಿ.
### ವಿಷಯಗಳು
1. [ಪರಿಚಯ](14-Introduction/README.md)
2. [ವಿಶ್ಲೇಷಣೆ](15-analyzing/README.md)
3. [ಸಂವಹನ](16-communication/README.md)
### ಕ್ರೆಡಿಟ್ಸ್
ಈ ಪಾಠಗಳನ್ನು ❤️ ಸಹಿತ [ಜೆಲೆನ್ ಮ್ಯಾಕ್‌ಗೀ](https://twitter.com/JalenMCG) ಮತ್ತು [ಜಾಸ್ಮಿನ್ ಗ್ರೀನವೇ](https://twitter.com/paladique) ರವರು ಬರೆಯಲಾಗಿದೆ
---
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
**ಅಸ್ವೀಕಾರ**:
ಈ ದಸ್ತಾವೇಜು [Co-op Translator](https://github.com/Azure/co-op-translator) ಎಂಬ AI ಅನುವಾದ ಸೇವೆಯನ್ನು ಬಳಸಿ ಅನುವಾದಿಸಲಾಗಿದೆ. ನಾವು ಶುದ್ಧತೆಯತ್ತ ಪ್ರಯತ್ನಿಸುತ್ತಿದ್ದರೂ, ಸ್ವಯಂಚಾಲಿತ ಅನುವಾದಗಳಲ್ಲಿ ತಪ್ಪುಗಳು ಅಥವಾ ಅಸತ್ಯತೆಗಳು ಇರಬಹುದು ಎಂದು ದಯವಿಟ್ಟು ಗಮನಿಸಿ. ಮೂಲ ಭಾಷೆಯಲ್ಲಿರುವ ಮೂಲ ದಸ್ತಾವೇಜನ್ನು ಅಧಿಕೃತ ಮೂಲವೆಂದು ಪರಿಗಣಿಸಬೇಕು. ಮಹತ್ವದ ಮಾಹಿತಿಗಾಗಿ, ವೃತ್ತಿಪರ ಮಾನವ ಅನುವಾದವನ್ನು ಶಿಫಾರಸು ಮಾಡಲಾಗುತ್ತದೆ. ಈ ಅನುವಾದ ಬಳಕೆಯಿಂದ ಉಂಟಾಗುವ ಯಾವುದೇ ತಪ್ಪು ಅರ್ಥಮಾಡಿಕೊಳ್ಳುವಿಕೆ ಅಥವಾ ತಪ್ಪು ವಿವರಣೆಗಳಿಗೆ ನಾವು ಹೊಣೆಗಾರರಾಗುವುದಿಲ್ಲ.
<!-- CO-OP TRANSLATOR DISCLAIMER END -->

@ -0,0 +1,116 @@
<!--
CO_OP_TRANSLATOR_METADATA:
{
"original_hash": "5f8e7cdefa096664ae86f795be571580",
"translation_date": "2025-12-19T15:16:46+00:00",
"source_file": "5-Data-Science-In-Cloud/17-Introduction/README.md",
"language_code": "kn"
}
-->
# ಕ್ಲೌಡ್‌ನಲ್ಲಿ ಡೇಟಾ ಸೈನ್ಸ್‌ಗೆ ಪರಿಚಯ
|![ [(@sketchthedocs)](https://sketchthedocs.dev) ಅವರಿಂದ ಸ್ಕೆಚ್ ನೋಟ್ ](../../sketchnotes/17-DataScience-Cloud.png)|
|:---:|
| ಕ್ಲೌಡ್‌ನಲ್ಲಿ ಡೇಟಾ ಸೈನ್ಸ್: ಪರಿಚಯ - _[@nitya](https://twitter.com/nitya) ಅವರಿಂದ ಸ್ಕೆಚ್ ನೋಟ್_ |
ಈ ಪಾಠದಲ್ಲಿ, ನೀವು ಕ್ಲೌಡ್‌ನ ಮೂಲಭೂತ ತತ್ವಗಳನ್ನು ಕಲಿಯುತ್ತೀರಿ, ನಂತರ ನಿಮ್ಮ ಡೇಟಾ ಸೈನ್ಸ್ ಯೋಜನೆಗಳನ್ನು ನಡೆಸಲು ಕ್ಲೌಡ್ ಸೇವೆಗಳನ್ನು ಬಳಸುವುದು ನಿಮಗೆ ಏಕೆ ಆಸಕ್ತಿದಾಯಕವಾಗಬಹುದು ಎಂದು ನೋಡುತ್ತೀರಿ ಮತ್ತು ಕ್ಲೌಡ್‌ನಲ್ಲಿ ನಡೆಸಲ್ಪಡುವ ಕೆಲವು ಡೇಟಾ ಸೈನ್ಸ್ ಯೋಜನೆಗಳ ಉದಾಹರಣೆಗಳನ್ನು ನೋಡುತ್ತೇವೆ.
## [ಪೂರ್ವ-ಪಾಠ ಪ್ರಶ್ನೋತ್ತರ](https://ff-quizzes.netlify.app/en/ds/quiz/32)
## ಕ್ಲೌಡ್ ಎಂದರೆ ಏನು?
ಕ್ಲೌಡ್ ಅಥವಾ ಕ್ಲೌಡ್ ಕಂಪ್ಯೂಟಿಂಗ್ ಎಂದರೆ ಇಂಟರ್ನೆಟ್ ಮೂಲಕ ಹೋಸ್ಟ್ ಮಾಡಲಾದ ಮೂಲಸೌಕರ್ಯದಲ್ಲಿ ಪಾವತಿಸು-ಬಳಸುವ ಆಧಾರದ ಮೇಲೆ ವಿವಿಧ ಕಂಪ್ಯೂಟಿಂಗ್ ಸೇವೆಗಳ ವಿತರಣೆ. ಸೇವೆಗಳಲ್ಲಿ ಸಂಗ್ರಹಣೆ, ಡೇಟಾಬೇಸ್‌ಗಳು, ನೆಟ್ವರ್ಕಿಂಗ್, ಸಾಫ್ಟ್‌ವೇರ್, ವಿಶ್ಲೇಷಣೆ ಮತ್ತು ಬುದ್ಧಿವಂತ ಸೇವೆಗಳು ಸೇರಿವೆ.
ನಾವು ಸಾಮಾನ್ಯವಾಗಿ ಸಾರ್ವಜನಿಕ, ಖಾಸಗಿ ಮತ್ತು ಸಂಯುಕ್ತ ಕ್ಲೌಡ್‌ಗಳನ್ನು ಹೀಗಾಗಿ ವಿಭಜಿಸುತ್ತೇವೆ:
* ಸಾರ್ವಜನಿಕ ಕ್ಲೌಡ್: ಸಾರ್ವಜನಿಕ ಕ್ಲೌಡ್ ಅನ್ನು ಮೂರನೇ ಪಕ್ಷದ ಕ್ಲೌಡ್ ಸೇವಾ ಪೂರೈಕೆದಾರರು ಹೊಂದಿದ್ದು, ಇಂಟರ್ನೆಟ್ ಮೂಲಕ ಸಾರ್ವಜನಿಕರಿಗೆ ಕಂಪ್ಯೂಟಿಂಗ್ ಸಂಪನ್ಮೂಲಗಳನ್ನು ವಿತರಿಸುತ್ತಾರೆ.
* ಖಾಸಗಿ ಕ್ಲೌಡ್: ಖಾಸಗಿ ಕ್ಲೌಡ್ ಎಂದರೆ ಒಂದು ವ್ಯವಹಾರ ಅಥವಾ ಸಂಸ್ಥೆ ಮಾತ್ರ ಬಳಸುವ ಕ್ಲೌಡ್ ಕಂಪ್ಯೂಟಿಂಗ್ ಸಂಪನ್ಮೂಲಗಳು, ಸೇವೆಗಳು ಮತ್ತು ಮೂಲಸೌಕರ್ಯ ಖಾಸಗಿ ನೆಟ್ವರ್ಕ್‌ನಲ್ಲಿ ನಿರ್ವಹಿಸಲಾಗುತ್ತದೆ.
* ಸಂಯುಕ್ತ ಕ್ಲೌಡ್: ಸಂಯುಕ್ತ ಕ್ಲೌಡ್ ಎಂದರೆ ಸಾರ್ವಜನಿಕ ಮತ್ತು ಖಾಸಗಿ ಕ್ಲೌಡ್‌ಗಳನ್ನು ಸಂಯೋಜಿಸುವ ವ್ಯವಸ್ಥೆ. ಬಳಕೆದಾರರು ಆನ್-ಪ್ರೆಮೈಸಸ್ ಡೇಟಾಸೆಂಟರ್ ಆಯ್ಕೆಮಾಡುತ್ತಾರೆ, ಆದರೆ ಡೇಟಾ ಮತ್ತು ಅಪ್ಲಿಕೇಶನ್‌ಗಳನ್ನು ಒಂದು ಅಥವಾ ಹೆಚ್ಚು ಸಾರ್ವಜನಿಕ ಕ್ಲೌಡ್‌ಗಳಲ್ಲಿ ನಡೆಸಲು ಅನುಮತಿಸುತ್ತಾರೆ.
ಬಹುತೇಕ ಕ್ಲೌಡ್ ಕಂಪ್ಯೂಟಿಂಗ್ ಸೇವೆಗಳು ಮೂರು ವರ್ಗಗಳಲ್ಲಿ ಬರುತ್ತವೆ: ಮೂಲಸೌಕರ್ಯ ಸೇವೆಯಾಗಿ (IaaS), ವೇದಿಕೆ ಸೇವೆಯಾಗಿ (PaaS) ಮತ್ತು ಸಾಫ್ಟ್‌ವೇರ್ ಸೇವೆಯಾಗಿ (SaaS).
* ಮೂಲಸೌಕರ್ಯ ಸೇವೆಯಾಗಿ (IaaS): ಬಳಕೆದಾರರು ಸರ್ವರ್‌ಗಳು ಮತ್ತು ವರ್ಚುವಲ್ ಮಷೀನ್ಗಳು (VMs), ಸಂಗ್ರಹಣೆ, ನೆಟ್ವರ್ಕ್‌ಗಳು, ಆಪರೇಟಿಂಗ್ ಸಿಸ್ಟಮ್‌ಗಳಂತಹ ಐಟಿ ಮೂಲಸೌಕರ್ಯವನ್ನು ಬಾಡಿಗೆಗೆ ಪಡೆಯುತ್ತಾರೆ
* ವೇದಿಕೆ ಸೇವೆಯಾಗಿ (PaaS): ಬಳಕೆದಾರರು ಸಾಫ್ಟ್‌ವೇರ್ ಅಪ್ಲಿಕೇಶನ್‌ಗಳನ್ನು ಅಭಿವೃದ್ಧಿಪಡಿಸುವ, ಪರೀಕ್ಷಿಸುವ, ವಿತರಿಸುವ ಮತ್ತು ನಿರ್ವಹಿಸುವ ಪರಿಸರವನ್ನು ಬಾಡಿಗೆಗೆ ಪಡೆಯುತ್ತಾರೆ. ಅಭಿವೃದ್ಧಿಗೆ ಅಗತ್ಯವಿರುವ ಸರ್ವರ್‌ಗಳು, ಸಂಗ್ರಹಣೆ, ನೆಟ್ವರ್ಕ್ ಮತ್ತು ಡೇಟಾಬೇಸ್‌ಗಳ ಮೂಲಸೌಕರ್ಯವನ್ನು ಹೊಂದಿಸುವ ಅಥವಾ ನಿರ್ವಹಿಸುವ ಬಗ್ಗೆ ಬಳಕೆದಾರರು ಚಿಂತಿಸಬೇಕಾಗಿಲ್ಲ.
* ಸಾಫ್ಟ್‌ವೇರ್ ಸೇವೆಯಾಗಿ (SaaS): ಬಳಕೆದಾರರು ಇಂಟರ್ನೆಟ್ ಮೂಲಕ, ಬೇಡಿಕೆಯಂತೆ ಮತ್ತು ಸಾಮಾನ್ಯವಾಗಿ ಚಂದಾದಾರಿಕೆಯ ಆಧಾರದ ಮೇಲೆ ಸಾಫ್ಟ್‌ವೇರ್ ಅಪ್ಲಿಕೇಶನ್‌ಗಳಿಗೆ ಪ್ರವೇಶ ಪಡೆಯುತ್ತಾರೆ. ಸಾಫ್ಟ್‌ವೇರ್ ಅಪ್ಲಿಕೇಶನ್, ಮೂಲಸೌಕರ್ಯ ಅಥವಾ ನಿರ್ವಹಣೆ, ಉದಾಹರಣೆಗೆ ಸಾಫ್ಟ್‌ವೇರ್ ಅಪ್‌ಗ್ರೇಡ್‌ಗಳು ಮತ್ತು ಭದ್ರತಾ ಪ್ಯಾಚ್‌ಗಳನ್ನು ನಿರ್ವಹಿಸುವ ಬಗ್ಗೆ ಬಳಕೆದಾರರು ಚಿಂತಿಸಬೇಕಾಗಿಲ್ಲ.
ಅಮೆಜಾನ್ ವೆಬ್ ಸರ್ವಿಸಸ್, ಗೂಗಲ್ ಕ್ಲೌಡ್ ಪ್ಲಾಟ್‌ಫಾರ್ಮ್ ಮತ್ತು ಮೈಕ್ರೋಸಾಫ್ಟ್ ಅಜೂರ್ ಕೆಲವು ದೊಡ್ಡ ಕ್ಲೌಡ್ ಪೂರೈಕೆದಾರರು.
## ಡೇಟಾ ಸೈನ್ಸ್‌ಗೆ ಕ್ಲೌಡ್ ಆಯ್ಕೆಮಾಡಬೇಕಾದ ಕಾರಣ?
ವಿಕಸಕರೂ ಮತ್ತು ಐಟಿ ವೃತ್ತಿಪರರೂ ಹಲವಾರು ಕಾರಣಗಳಿಂದ ಕ್ಲೌಡ್‌ನಲ್ಲಿ ಕೆಲಸ ಮಾಡಲು ಆಯ್ಕೆಮಾಡುತ್ತಾರೆ, ಅವುಗಳಲ್ಲಿ ಕೆಲವು ಈ ಕೆಳಗಿನಂತಿವೆ:
* ನವೀನತೆ: ನೀವು ನಿಮ್ಮ ಅಪ್ಲಿಕೇಶನ್‌ಗಳನ್ನು ನೇರವಾಗಿ ಕ್ಲೌಡ್ ಪೂರೈಕೆದಾರರಿಂದ ರಚಿಸಲಾದ ನವೀನ ಸೇವೆಗಳನ್ನು ಸಂಯೋಜಿಸುವ ಮೂಲಕ ಶಕ್ತಿಶಾಲಿ ಮಾಡಬಹುದು.
* ಲವಚಿಕತೆ: ನೀವು ಬೇಕಾದ ಸೇವೆಗಳಿಗೆ ಮಾತ್ರ ಪಾವತಿಸುತ್ತೀರಿ ಮತ್ತು ವಿವಿಧ ಸೇವೆಗಳಲ್ಲಿಂದ ಆಯ್ಕೆಮಾಡಬಹುದು. ಸಾಮಾನ್ಯವಾಗಿ ನೀವು ಬಳಕೆಮಾಡಿದಷ್ಟು ಪಾವತಿಸುತ್ತೀರಿ ಮತ್ತು ನಿಮ್ಮ ಬದಲಾಗುತ್ತಿರುವ ಅಗತ್ಯಗಳಿಗೆ ಅನುಗುಣವಾಗಿ ಸೇವೆಗಳನ್ನು ಹೊಂದಿಕೊಳ್ಳಬಹುದು.
* ಬಜೆಟ್: ನೀವು ಹಾರ್ಡ್‌ವೇರ್ ಮತ್ತು ಸಾಫ್ಟ್‌ವೇರ್ ಖರೀದಿಸಲು ಪ್ರಾಥಮಿಕ ಹೂಡಿಕೆ ಮಾಡಬೇಕಾಗಿಲ್ಲ, ಆನ್-ಸೈಟ್ ಡೇಟಾಸೆಂಟರ್‌ಗಳನ್ನು ಸ್ಥಾಪಿಸಿ ನಡೆಸಬೇಕಾಗಿಲ್ಲ ಮತ್ತು ನೀವು ಬಳಸಿದಷ್ಟು ಮಾತ್ರ ಪಾವತಿಸಬಹುದು.
* ವಿಸ್ತರಣೆ ಸಾಮರ್ಥ್ಯ: ನಿಮ್ಮ ಸಂಪನ್ಮೂಲಗಳು ನಿಮ್ಮ ಯೋಜನೆಯ ಅಗತ್ಯಗಳಿಗೆ ಅನುಗುಣವಾಗಿ ವಿಸ್ತರಿಸಬಹುದು, ಅಂದರೆ ನಿಮ್ಮ ಅಪ್ಲಿಕೇಶನ್‌ಗಳು ಹೆಚ್ಚು ಅಥವಾ ಕಡಿಮೆ ಕಂಪ್ಯೂಟಿಂಗ್ ಶಕ್ತಿ, ಸಂಗ್ರಹಣೆ ಮತ್ತು ಬ್ಯಾಂಡ್‌ವಿಡ್ತ್ ಬಳಸಬಹುದು, ಯಾವುದೇ ಸಮಯದಲ್ಲಿ ಬಾಹ್ಯ ಕಾರಣಗಳಿಗೆ ಹೊಂದಿಕೊಳ್ಳುತ್ತವೆ.
* ಉತ್ಪಾದಕತೆ: ಡೇಟಾಸೆಂಟರ್‌ಗಳನ್ನು ನಿರ್ವಹಿಸುವಂತಹ ಕೆಲಸಗಳಿಗೆ ಸಮಯ ವ್ಯಯಿಸುವ ಬದಲು ನಿಮ್ಮ ವ್ಯವಹಾರಕ್ಕೆ ಗಮನಹರಿಸಬಹುದು.
* ನಂಬಿಕೆ: ಕ್ಲೌಡ್ ಕಂಪ್ಯೂಟಿಂಗ್ ನಿಮ್ಮ ಡೇಟಾವನ್ನು ನಿರಂತರವಾಗಿ ಬ್ಯಾಕಪ್ ಮಾಡಲು ಹಲವಾರು ಮಾರ್ಗಗಳನ್ನು ಒದಗಿಸುತ್ತದೆ ಮತ್ತು ಸಂಕಷ್ಟದ ಸಮಯದಲ್ಲೂ ನಿಮ್ಮ ವ್ಯವಹಾರ ಮತ್ತು ಸೇವೆಗಳನ್ನು ಮುಂದುವರಿಸಲು ವಿಪತ್ತು ಪುನರುತ್ಥಾನ ಯೋಜನೆಗಳನ್ನು ಸ್ಥಾಪಿಸಬಹುದು.
* ಭದ್ರತೆ: ನಿಮ್ಮ ಯೋಜನೆಯ ಭದ್ರತೆಯನ್ನು ಬಲಪಡಿಸುವ ನೀತಿಗಳು, ತಂತ್ರಜ್ಞಾನಗಳು ಮತ್ತು ನಿಯಂತ್ರಣಗಳಿಂದ ನೀವು ಲಾಭ ಪಡೆಯಬಹುದು.
ಇವು ಕೆಲವೇ ಸಾಮಾನ್ಯ ಕಾರಣಗಳು, ಜನರು ಕ್ಲೌಡ್ ಸೇವೆಗಳನ್ನು ಬಳಸಲು ಆಯ್ಕೆಮಾಡುವ. ಈಗ ನಾವು ಕ್ಲೌಡ್ ಎಂದರೇನು ಮತ್ತು ಅದರ ಪ್ರಮುಖ ಲಾಭಗಳು ಏನೆಂದು ಉತ್ತಮವಾಗಿ ಅರ್ಥಮಾಡಿಕೊಂಡಿದ್ದೇವೆ, ಡೇಟಾ ವಿಜ್ಞಾನಿಗಳು ಮತ್ತು ಡೇಟಾ ಜೊತೆ ಕೆಲಸ ಮಾಡುವ ವಿಕಸಕರ ಕೆಲಸಗಳನ್ನು ಮತ್ತು ಅವರು ಎದುರಿಸಬಹುದಾದ ಹಲವು ಸವಾಲುಗಳಲ್ಲಿ ಕ್ಲೌಡ್ ಹೇಗೆ ಸಹಾಯ ಮಾಡಬಹುದು ಎಂಬುದನ್ನು ವಿಶೇಷವಾಗಿ ನೋಡೋಣ:
* ದೊಡ್ಡ ಪ್ರಮಾಣದ ಡೇಟಾವನ್ನು ಸಂಗ್ರಹಿಸುವುದು: ದೊಡ್ಡ ಸರ್ವರ್‌ಗಳನ್ನು ಖರೀದಿಸುವ, ನಿರ್ವಹಿಸುವ ಮತ್ತು ರಕ್ಷಿಸುವ ಬದಲು, ನೀವು ನಿಮ್ಮ ಡೇಟಾವನ್ನು ನೇರವಾಗಿ ಕ್ಲೌಡ್‌ನಲ್ಲಿ ಸಂಗ್ರಹಿಸಬಹುದು, ಉದಾಹರಣೆಗೆ Azure Cosmos DB, Azure SQL Database ಮತ್ತು Azure Data Lake Storage.
* ಡೇಟಾ ಏಕೀಕರಣವನ್ನು ನಿರ್ವಹಿಸುವುದು: ಡೇಟಾ ಏಕೀಕರಣವು ಡೇಟಾ ಸಂಗ್ರಹಣೆಯಿಂದ ಕ್ರಮ ಕೈಗೊಳ್ಳುವಿಕೆಗೆ ಪರಿವರ್ತನೆ ಮಾಡಲು ಅಗತ್ಯವಿರುವ ಡೇಟಾ ಸೈನ್ಸ್‌ನ ಅವಿಭಾಜ್ಯ ಭಾಗ. ಕ್ಲೌಡ್‌ನಲ್ಲಿ ನೀಡಲಾದ ಡೇಟಾ ಏಕೀಕರಣ ಸೇವೆಗಳೊಂದಿಗೆ, ನೀವು ವಿವಿಧ ಮೂಲಗಳಿಂದ ಡೇಟಾವನ್ನು ಸಂಗ್ರಹಿಸಿ, ಪರಿವರ್ತಿಸಿ ಮತ್ತು Data Factory ಮೂಲಕ ಒಟ್ಟಾರೆ ಡೇಟಾ ವೇರ್‌ಹೌಸ್‌ಗೆ ಏಕೀಕರಿಸಬಹುದು.
* ಡೇಟಾ ಪ್ರಕ್ರಿಯೆಗೊಳಿಸುವುದು: ದೊಡ್ಡ ಪ್ರಮಾಣದ ಡೇಟಾವನ್ನು ಪ್ರಕ್ರಿಯೆಗೊಳಿಸಲು ಹೆಚ್ಚಿನ ಕಂಪ್ಯೂಟಿಂಗ್ ಶಕ್ತಿ ಬೇಕಾಗುತ್ತದೆ, ಮತ್ತು ಎಲ್ಲರಿಗೂ ಅದಕ್ಕೆ ತಕ್ಕಷ್ಟು ಶಕ್ತಿಶಾಲಿ ಯಂತ್ರಗಳ ಪ್ರವೇಶವಿಲ್ಲ, ಆದ್ದರಿಂದ ಅನೇಕರು ತಮ್ಮ ಪರಿಹಾರಗಳನ್ನು ನಡೆಸಲು ಮತ್ತು ನಿಯೋಜಿಸಲು ನೇರವಾಗಿ ಕ್ಲೌಡ್‌ನ ಭಾರೀ ಕಂಪ್ಯೂಟಿಂಗ್ ಶಕ್ತಿಯನ್ನು ಬಳಸಲು ಆಯ್ಕೆಮಾಡುತ್ತಾರೆ.
* ಡೇಟಾ ವಿಶ್ಲೇಷಣೆ ಸೇವೆಗಳನ್ನು ಬಳಸುವುದು: Azure Synapse Analytics, Azure Stream Analytics ಮತ್ತು Azure Databricks ಮುಂತಾದ ಕ್ಲೌಡ್ ಸೇವೆಗಳು ನಿಮ್ಮ ಡೇಟಾವನ್ನು ಕಾರ್ಯನಿರ್ವಹಣೀಯ ಒಳನೋಟಗಳಾಗಿ ಪರಿವರ್ತಿಸಲು ಸಹಾಯ ಮಾಡುತ್ತವೆ.
* ಯಂತ್ರ ಅಧ್ಯಯನ ಮತ್ತು ಡೇಟಾ ಬುದ್ಧಿವಂತಿಕೆ ಸೇವೆಗಳನ್ನು ಬಳಸುವುದು: ಆರಂಭದಿಂದಲೇ ಪ್ರಾರಂಭಿಸುವ ಬದಲು, ನೀವು ಕ್ಲೌಡ್ ಪೂರೈಕೆದಾರರಿಂದ ನೀಡಲಾದ ಯಂತ್ರ ಅಧ್ಯಯನ ಆಲ್ಗಾರಿದಮ್‌ಗಳನ್ನು, ಉದಾಹರಣೆಗೆ AzureML ಸೇವೆಗಳನ್ನು ಬಳಸಬಹುದು. ನೀವು ಮಾತು-ದಿಂದ-ಪಠ್ಯ, ಪಠ್ಯ-ದಿಂದ-ಮಾತು, ಕಂಪ್ಯೂಟರ್ ದೃಷ್ಟಿ ಮತ್ತು ಇನ್ನಷ್ಟು ಜ್ಞಾನ ಸೇವೆಗಳನ್ನು ಕೂಡ ಬಳಸಬಹುದು.
## ಕ್ಲೌಡ್‌ನಲ್ಲಿ ಡೇಟಾ ಸೈನ್ಸ್ ಉದಾಹರಣೆಗಳು
ಇದನ್ನು ಇನ್ನಷ್ಟು ಸ್ಪಷ್ಟಗೊಳಿಸಲು ಕೆಲವು ದೃಶ್ಯಗಳನ್ನು ನೋಡೋಣ.
### ನೈಜ-ಸಮಯ ಸಾಮಾಜಿಕ ಮಾಧ್ಯಮ ಭಾವನೆ ವಿಶ್ಲೇಷಣೆ
ನಾವು ಯಂತ್ರ ಅಧ್ಯಯನದಿಂದ ಪ್ರಾರಂಭಿಸುವ ಜನರು ಸಾಮಾನ್ಯವಾಗಿ ಅಧ್ಯಯನ ಮಾಡುವ ದೃಶ್ಯದಿಂದ ಪ್ರಾರಂಭಿಸೋಣ: ನೈಜ-ಸಮಯ ಸಾಮಾಜಿಕ ಮಾಧ್ಯಮ ಭಾವನೆ ವಿಶ್ಲೇಷಣೆ.
ನೀವು ಸುದ್ದಿಮಾಧ್ಯಮ ವೆಬ್‌ಸೈಟ್ ಅನ್ನು ನಡೆಸುತ್ತಿರುವಿರಿ ಎಂದು ಹೇಳೋಣ ಮತ್ತು ನಿಮ್ಮ ಓದುಗರಿಗೆ ಯಾವ ವಿಷಯ ಆಸಕ್ತಿದಾಯಕವಾಗಬಹುದು ಎಂದು ತಿಳಿಯಲು ನೈಜ-ಸಮಯ ಡೇಟಾವನ್ನು ಬಳಸಲು ಬಯಸುತ್ತೀರಿ. ಅದನ್ನು ತಿಳಿಯಲು, ನೀವು ಟ್ವಿಟ್ಟರ್ ಪ್ರಕಟಣೆಗಳಿಂದ ನೈಜ-ಸಮಯ ಭಾವನೆ ವಿಶ್ಲೇಷಣೆ ಮಾಡುವ ಕಾರ್ಯಕ್ರಮವನ್ನು ನಿರ್ಮಿಸಬಹುದು, ನಿಮ್ಮ ಓದುಗರಿಗೆ ಸಂಬಂಧಿಸಿದ ವಿಷಯಗಳ ಮೇಲೆ.
ನೀವು ನೋಡಬೇಕಾದ ಪ್ರಮುಖ ಸೂಚಕಗಳು ನಿರ್ದಿಷ್ಟ ವಿಷಯಗಳ (ಹ್ಯಾಷ್‌ಟ್ಯಾಗ್‌ಗಳು) ಮೇಲೆ ಟ್ವೀಟ್‌ಗಳ ಪ್ರಮಾಣ ಮತ್ತು ಭಾವನೆ, ಇದು analytics ಉಪಕರಣಗಳನ್ನು ಬಳಸಿ ಆ ವಿಷಯಗಳ ಸುತ್ತಲೂ ಭಾವನೆ ವಿಶ್ಲೇಷಣೆ ಮಾಡುವ ಮೂಲಕ ಸ್ಥಾಪಿಸಲಾಗುತ್ತದೆ.
ಈ ಯೋಜನೆಯನ್ನು ರಚಿಸಲು ಅಗತ್ಯವಿರುವ ಹಂತಗಳು ಇವು:
* ಟ್ವಿಟ್ಟರ್‌ನಿಂದ ಡೇಟಾ ಸಂಗ್ರಹಿಸಲು ಸ್ಟ್ರೀಮಿಂಗ್ ಇನ್‌ಪುಟ್‌ಗಾಗಿ ಇವೆಂಟ್ ಹಬ್ ರಚಿಸಿ
* ಟ್ವಿಟ್ಟರ್ ಸ್ಟ್ರೀಮಿಂಗ್ APIಗಳನ್ನು ಕರೆಮಾಡುವ ಟ್ವಿಟ್ಟರ್ ಕ್ಲೈಂಟ್ ಅಪ್ಲಿಕೇಶನ್ ಅನ್ನು ಸಂರಚಿಸಿ ಮತ್ತು ಪ್ರಾರಂಭಿಸಿ
* ಸ್ಟ್ರೀಮ್ ಅನಾಲಿಟಿಕ್ಸ್ ಕೆಲಸವನ್ನು ರಚಿಸಿ
* ಕೆಲಸದ ಇನ್‌ಪುಟ್ ಮತ್ತು ಕ್ವೆರಿಯನ್ನು ನಿರ್ದಿಷ್ಟಪಡಿಸಿ
* ಔಟ್‌ಪುಟ್ ಸಿಂಕ್ ರಚಿಸಿ ಮತ್ತು ಕೆಲಸದ ಔಟ್‌ಪುಟ್ ಅನ್ನು ನಿರ್ದಿಷ್ಟಪಡಿಸಿ
* ಕೆಲಸವನ್ನು ಪ್ರಾರಂಭಿಸಿ
ಪೂರ್ಣ ಪ್ರಕ್ರಿಯೆಯನ್ನು ನೋಡಲು, [ದಾಖಲೆಗಳನ್ನು](https://docs.microsoft.com/azure/stream-analytics/stream-analytics-twitter-sentiment-analysis-trends?WT.mc_id=academic-77958-bethanycheum&ocid=AID30411099) ಪರಿಶೀಲಿಸಿ.
### ವೈಜ್ಞಾನಿಕ ಪೇಪರ್‌ಗಳ ವಿಶ್ಲೇಷಣೆ
ಇನ್ನೊಂದು ಉದಾಹರಣೆಯಾಗಿ, ಈ ಪಠ್ಯಕ್ರಮದ ಲೇಖಕರಲ್ಲಿ ಒಬ್ಬರಾದ [Dmitry Soshnikov](http://soshnikov.com) ರಚಿಸಿದ ಯೋಜನೆಯನ್ನು ನೋಡೋಣ.
Dmitry COVID ಪೇಪರ್‌ಗಳನ್ನು ವಿಶ್ಲೇಷಿಸುವ ಉಪಕರಣವನ್ನು ರಚಿಸಿದ್ದಾರೆ. ಈ ಯೋಜನೆಯನ್ನು ಪರಿಶೀಲಿಸುವ ಮೂಲಕ, ನೀವು ವೈಜ್ಞಾನಿಕ ಪೇಪರ್‌ಗಳಿಂದ ಜ್ಞಾನವನ್ನು ಹೊರತೆಗೆಯುವ, ಒಳನೋಟಗಳನ್ನು ಪಡೆಯುವ ಮತ್ತು ಸಂಶೋಧಕರಿಗೆ ದೊಡ್ಡ ಪೇಪರ್ ಸಂಗ್ರಹಗಳನ್ನು ಪರಿಣಾಮಕಾರಿಯಾಗಿ ನಾವಿಗೇಟ್ ಮಾಡಲು ಸಹಾಯ ಮಾಡುವ ಉಪಕರಣವನ್ನು ಹೇಗೆ ರಚಿಸಬಹುದು ಎಂದು ನೋಡಬಹುದು.
ಇದಕ್ಕೆ ಬಳಸಲಾದ ವಿವಿಧ ಹಂತಗಳು:
* [Text Analytics for Health](https://docs.microsoft.com/azure/cognitive-services/text-analytics/how-tos/text-analytics-for-health?WT.mc_id=academic-77958-bethanycheum&ocid=AID3041109) ಬಳಸಿ ಮಾಹಿತಿ ಹೊರತೆಗೆಯುವುದು ಮತ್ತು ಪೂರ್ವ-ಪ್ರಕ್ರಿಯೆಗೊಳಿಸುವುದು
* ಪ್ರಕ್ರಿಯೆಯನ್ನು ಸಮಾಂತರಗೊಳಿಸಲು [Azure ML](https://azure.microsoft.com/services/machine-learning?WT.mc_id=academic-77958-bethanycheum&ocid=AID3041109) ಬಳಸುವುದು
* [Cosmos DB](https://azure.microsoft.com/services/cosmos-db?WT.mc_id=academic-77958-bethanycheum&ocid=AID3041109) ಬಳಸಿ ಮಾಹಿತಿ ಸಂಗ್ರಹಿಸುವುದು ಮತ್ತು ಕ್ವೇರಿ ಮಾಡುವುದು
* Power BI ಬಳಸಿ ಡೇಟಾ ಅನ್ವೇಷಣೆ ಮತ್ತು ದೃಶ್ಯೀಕರಣಕ್ಕಾಗಿ ಸಂವಹನಾತ್ಮಕ ಡ್ಯಾಶ್‌ಬೋರ್ಡ್ ರಚಿಸುವುದು
ಪೂರ್ಣ ಪ್ರಕ್ರಿಯೆಯನ್ನು ನೋಡಲು [Dmitry ಅವರ ಬ್ಲಾಗ್](https://soshnikov.com/science/analyzing-medical-papers-with-azure-and-text-analytics-for-health/) ಗೆ ಭೇಟಿ ನೀಡಿ.
ನೀವು ನೋಡಿದಂತೆ, ನಾವು ಡೇಟಾ ಸೈನ್ಸ್ ನಡೆಸಲು ಹಲವಾರು ರೀತಿಯಲ್ಲಿ ಕ್ಲೌಡ್ ಸೇವೆಗಳನ್ನು ಬಳಸಬಹುದು.
## ಪಾದಟಿಪ್ಪಣಿ
ಮೂಲಗಳು:
* https://azure.microsoft.com/overview/what-is-cloud-computing?ocid=AID3041109
* https://docs.microsoft.com/azure/stream-analytics/stream-analytics-twitter-sentiment-analysis-trends?ocid=AID3041109
* https://soshnikov.com/science/analyzing-medical-papers-with-azure-and-text-analytics-for-health/
## ಪಾಠೋತ್ತರ ಪ್ರಶ್ನೋತ್ತರ
## [ಪಾಠೋತ್ತರ ಪ್ರಶ್ನೋತ್ತರ](https://ff-quizzes.netlify.app/en/ds/quiz/33)
## ಹುದ್ದೆ
[ಮಾರುಕಟ್ಟೆ ಸಂಶೋಧನೆ](assignment.md)
---
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
**ಅಸ್ವೀಕರಣ**:
ಈ ದಸ್ತಾವೇಜು [Co-op Translator](https://github.com/Azure/co-op-translator) ಎಂಬ AI ಅನುವಾದ ಸೇವೆಯನ್ನು ಬಳಸಿ ಅನುವಾದಿಸಲಾಗಿದೆ. ನಾವು ನಿಖರತೆಯಿಗಾಗಿ ಪ್ರಯತ್ನಿಸುತ್ತಿದ್ದರೂ, ಸ್ವಯಂಚಾಲಿತ ಅನುವಾದಗಳಲ್ಲಿ ತಪ್ಪುಗಳು ಅಥವಾ ಅಸತ್ಯತೆಗಳು ಇರಬಹುದು ಎಂಬುದನ್ನು ದಯವಿಟ್ಟು ಗಮನಿಸಿ. ಮೂಲ ಭಾಷೆಯಲ್ಲಿರುವ ಮೂಲ ದಸ್ತಾವೇಜನ್ನು ಅಧಿಕೃತ ಮೂಲವೆಂದು ಪರಿಗಣಿಸಬೇಕು. ಪ್ರಮುಖ ಮಾಹಿತಿಗಾಗಿ, ವೃತ್ತಿಪರ ಮಾನವ ಅನುವಾದವನ್ನು ಶಿಫಾರಸು ಮಾಡಲಾಗುತ್ತದೆ. ಈ ಅನುವಾದ ಬಳಕೆಯಿಂದ ಉಂಟಾಗುವ ಯಾವುದೇ ತಪ್ಪು ಅರ್ಥಮಾಡಿಕೊಳ್ಳುವಿಕೆ ಅಥವಾ ತಪ್ಪು ವಿವರಣೆಗಳಿಗೆ ನಾವು ಹೊಣೆಗಾರರಾಗುವುದಿಲ್ಲ.
<!-- CO-OP TRANSLATOR DISCLAIMER END -->

@ -0,0 +1,27 @@
<!--
CO_OP_TRANSLATOR_METADATA:
{
"original_hash": "96f3696153d9ed54b19a1bb65438c104",
"translation_date": "2025-12-19T15:18:09+00:00",
"source_file": "5-Data-Science-In-Cloud/17-Introduction/assignment.md",
"language_code": "kn"
}
-->
# ಮಾರುಕಟ್ಟೆ ಸಂಶೋಧನೆ
## ಸೂಚನೆಗಳು
ಈ ಪಾಠದಲ್ಲಿ ನೀವು ಹಲವು ಪ್ರಮುಖ ಕ್ಲೌಡ್ ಪೂರೈಕೆದಾರರು ಇದ್ದಾರೆ ಎಂದು ಕಲಿತಿರಿ. ಪ್ರತಿ ಒಬ್ಬರೂ ಡೇಟಾ ಸೈನ್ಟಿಸ್ಟ್‌ಗೆ ಏನು ನೀಡಬಹುದು ಎಂದು ಕಂಡುಹಿಡಿಯಲು ಕೆಲವು ಮಾರುಕಟ್ಟೆ ಸಂಶೋಧನೆ ಮಾಡಿ. ಆ ಕೊಡುಗೆಗಳು ಹೋಲಿಕೆ ಮಾಡಬಹುದುವೇ? ಈ ಕ್ಲೌಡ್ ಪೂರೈಕೆದಾರರ ಮೂವರು ಅಥವಾ ಹೆಚ್ಚು ಅವರ ಕೊಡುಗೆಗಳನ್ನು ವರ್ಣಿಸುವ ಒಂದು ಪ್ರಬಂಧವನ್ನು ಬರೆಯಿರಿ.
## ಮೌಲ್ಯಮಾಪನ
ಉದಾಹರಣೆಯಾಗಿ | ತೃಪ್ತಿಕರ | ಸುಧಾರಣೆಯ ಅಗತ್ಯವಿದೆ
--- | --- | ---
ಒಂದು ಪುಟದ ಪ್ರಬಂಧವು ಮೂರು ಕ್ಲೌಡ್ ಪೂರೈಕೆದಾರರ ಡೇಟಾ ಸೈನ್ಸ್ ಕೊಡುಗೆಗಳನ್ನು ವರ್ಣಿಸಿ ಅವುಗಳ ನಡುವಿನ ವ್ಯತ್ಯಾಸವನ್ನು ವಿವರಿಸುತ್ತದೆ. | ಒಂದು ಚಿಕ್ಕ ಪ್ರಬಂಧವನ್ನು ಪ್ರಸ್ತುತಪಡಿಸಲಾಗಿದೆ | ವಿಶ್ಲೇಷಣೆಯನ್ನು ಪೂರ್ಣಗೊಳಿಸದೆ ಪ್ರಬಂಧವನ್ನು ಪ್ರಸ್ತುತಪಡಿಸಲಾಗಿದೆ
---
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
**ಅಸ್ವೀಕರಣ**:
ಈ ದಸ್ತಾವೇಜು [Co-op Translator](https://github.com/Azure/co-op-translator) ಎಂಬ AI ಅನುವಾದ ಸೇವೆಯನ್ನು ಬಳಸಿ ಅನುವಾದಿಸಲಾಗಿದೆ. ನಾವು ಶುದ್ಧತೆಯತ್ತ ಪ್ರಯತ್ನಿಸುತ್ತಿದ್ದರೂ, ಸ್ವಯಂಚಾಲಿತ ಅನುವಾದಗಳಲ್ಲಿ ತಪ್ಪುಗಳು ಅಥವಾ ಅಸತ್ಯತೆಗಳು ಇರಬಹುದು ಎಂಬುದನ್ನು ದಯವಿಟ್ಟು ಗಮನಿಸಿ. ಮೂಲ ಭಾಷೆಯಲ್ಲಿರುವ ಮೂಲ ದಸ್ತಾವೇಜನ್ನು ಅಧಿಕೃತ ಮೂಲವೆಂದು ಪರಿಗಣಿಸಬೇಕು. ಪ್ರಮುಖ ಮಾಹಿತಿಗಾಗಿ, ವೃತ್ತಿಪರ ಮಾನವ ಅನುವಾದವನ್ನು ಶಿಫಾರಸು ಮಾಡಲಾಗುತ್ತದೆ. ಈ ಅನುವಾದ ಬಳಕೆಯಿಂದ ಉಂಟಾಗುವ ಯಾವುದೇ ತಪ್ಪು ಅರ್ಥಮಾಡಿಕೊಳ್ಳುವಿಕೆ ಅಥವಾ ತಪ್ಪು ವಿವರಣೆಗಳಿಗೆ ನಾವು ಹೊಣೆಗಾರರಾಗುವುದಿಲ್ಲ.
<!-- CO-OP TRANSLATOR DISCLAIMER END -->

@ -0,0 +1,355 @@
<!--
CO_OP_TRANSLATOR_METADATA:
{
"original_hash": "bd4da10766c64fce4294a98f6479dfb0",
"translation_date": "2025-12-19T15:01:15+00:00",
"source_file": "5-Data-Science-In-Cloud/18-Low-Code/README.md",
"language_code": "kn"
}
-->
# ಕ್ಲೌಡ್‌ನಲ್ಲಿ ಡೇಟಾ ಸೈನ್ಸ್: "ಲೋ ಕೋಡ್/ನೋ ಕೋಡ್" ವಿಧಾನ
|![ [(@sketchthedocs)](https://sketchthedocs.dev) ಅವರ ಸ್ಕೆಚ್ ನೋಟ್ ](../../sketchnotes/18-DataScience-Cloud.png)|
|:---:|
| ಕ್ಲೌಡ್‌ನಲ್ಲಿ ಡೇಟಾ ಸೈನ್ಸ್: ಲೋ ಕೋಡ್ - _[@nitya](https://twitter.com/nitya) ಅವರ ಸ್ಕೆಚ್ ನೋಟ್_ |
ವಿಷಯಗಳ ಪಟ್ಟಿಃ
- [ಕ್ಲೌಡ್‌ನಲ್ಲಿ ಡೇಟಾ ಸೈನ್ಸ್: "ಲೋ ಕೋಡ್/ನೋ ಕೋಡ್" ವಿಧಾನ](../../../../5-Data-Science-In-Cloud/18-Low-Code)
- [ಪೂರ್ವ-ಲೇಕ್ಚರ್ ಕ್ವಿಜ್](../../../../5-Data-Science-In-Cloud/18-Low-Code)
- [1. ಪರಿಚಯ](../../../../5-Data-Science-In-Cloud/18-Low-Code)
- [1.1 ಅಜೂರ್ ಮೆಷಿನ್ ಲರ್ನಿಂಗ್ ಎಂದರೆ ಏನು?](../../../../5-Data-Science-In-Cloud/18-Low-Code)
- [1.2 ಹೃದಯ ವೈಫಲ್ಯ ಭವಿಷ್ಯವಾಣಿ ಯೋಜನೆ:](../../../../5-Data-Science-In-Cloud/18-Low-Code)
- [1.3 ಹೃದಯ ವೈಫಲ್ಯ ಡೇಟಾಸೆಟ್:](../../../../5-Data-Science-In-Cloud/18-Low-Code)
- [2. ಅಜೂರ್ ಎಂಎಲ್ ಸ್ಟುಡಿಯೋದಲ್ಲಿ ಲೋ ಕೋಡ್/ನೋ ಕೋಡ್ ಮಾದರಿ ತರಬೇತಿ](../../../../5-Data-Science-In-Cloud/18-Low-Code)
- [2.1 ಅಜೂರ್ ಎಂಎಲ್ ವರ್ಕ್‌ಸ್ಪೇಸ್ ರಚನೆ](../../../../5-Data-Science-In-Cloud/18-Low-Code)
- [2.2 ಗಣನೆ ಸಂಪನ್ಮೂಲಗಳು](../../../../5-Data-Science-In-Cloud/18-Low-Code)
- [2.2.1 ನಿಮ್ಮ ಗಣನೆ ಸಂಪನ್ಮೂಲಗಳಿಗೆ ಸರಿಯಾದ ಆಯ್ಕೆಗಳು](../../../../5-Data-Science-In-Cloud/18-Low-Code)
- [2.2.2 ಗಣನೆ ಕ್ಲಸ್ಟರ್ ರಚನೆ](../../../../5-Data-Science-In-Cloud/18-Low-Code)
- [2.3 ಡೇಟಾಸೆಟ್ ಲೋಡ್ ಮಾಡುವುದು](../../../../5-Data-Science-In-Cloud/18-Low-Code)
- [2.4 AutoML ಮೂಲಕ ಲೋ ಕೋಡ್/ನೋ ಕೋಡ್ ತರಬೇತಿ](../../../../5-Data-Science-In-Cloud/18-Low-Code)
- [3. ಲೋ ಕೋಡ್/ನೋ ಕೋಡ್ ಮಾದರಿ ನಿಯೋಜನೆ ಮತ್ತು ಎಂಡ್‌ಪಾಯಿಂಟ್ ಬಳಕೆ](../../../../5-Data-Science-In-Cloud/18-Low-Code)
- [3.1 ಮಾದರಿ ನಿಯೋಜನೆ](../../../../5-Data-Science-In-Cloud/18-Low-Code)
- [3.2 ಎಂಡ್‌ಪಾಯಿಂಟ್ ಬಳಕೆ](../../../../5-Data-Science-In-Cloud/18-Low-Code)
- [🚀 ಸವಾಲು](../../../../5-Data-Science-In-Cloud/18-Low-Code)
- [ಪೋಸ್ಟ್-ಲೇಕ್ಚರ್ ಕ್ವಿಜ್](../../../../5-Data-Science-In-Cloud/18-Low-Code)
- [ಪುನರ್ ವಿಮರ್ಶೆ ಮತ್ತು ಸ್ವಯಂ ಅಧ್ಯಯನ](../../../../5-Data-Science-In-Cloud/18-Low-Code)
- [ಕಾರ್ಯನಿರ್ವಹಣೆ](../../../../5-Data-Science-In-Cloud/18-Low-Code)
## [ಪೂರ್ವ-ಲೇಕ್ಚರ್ ಕ್ವಿಜ್](https://ff-quizzes.netlify.app/en/ds/quiz/34)
## 1. ಪರಿಚಯ
### 1.1 ಅಜೂರ್ ಮೆಷಿನ್ ಲರ್ನಿಂಗ್ ಎಂದರೆ ಏನು?
ಅಜೂರ್ ಕ್ಲೌಡ್ ವೇದಿಕೆ 200 ಕ್ಕೂ ಹೆಚ್ಚು ಉತ್ಪನ್ನಗಳು ಮತ್ತು ಕ್ಲೌಡ್ ಸೇವೆಗಳನ್ನು ಒಳಗೊಂಡಿದ್ದು, ಹೊಸ ಪರಿಹಾರಗಳನ್ನು ಜೀವಂತಗೊಳಿಸಲು ಸಹಾಯ ಮಾಡುತ್ತದೆ.
ಡೇಟಾ ವಿಜ್ಞಾನಿಗಳು ಡೇಟಾವನ್ನು ಅನ್ವೇಷಿಸುವುದು ಮತ್ತು ಪೂರ್ವ-ಪ್ರಕ್ರಿಯೆ ಮಾಡುವುದರಲ್ಲಿ ಬಹಳ ಶ್ರಮವನ್ನು ಖರ್ಚುಮಾಡುತ್ತಾರೆ, ಮತ್ತು ನಿಖರ ಮಾದರಿಗಳನ್ನು ಉತ್ಪಾದಿಸಲು ವಿವಿಧ ಮಾದರಿ ತರಬೇತಿ ಆಲ್ಗಾರಿದಮ್ಗಳನ್ನು ಪ್ರಯತ್ನಿಸುತ್ತಾರೆ. ಈ ಕಾರ್ಯಗಳು ಸಮಯ ತೆಗೆದುಕೊಳ್ಳುತ್ತವೆ ಮತ್ತು ದುಬಾರಿ ಗಣನೆ ಹಾರ್ಡ್‌ವೇರ್ ಅನ್ನು ಅಸಮರ್ಥವಾಗಿ ಬಳಸುತ್ತವೆ.
[ಅಜೂರ್ ಎಂಎಲ್](https://docs.microsoft.com/azure/machine-learning/overview-what-is-azure-machine-learning?WT.mc_id=academic-77958-bethanycheum&ocid=AID3041109) ಅಜೂರ್‌ನಲ್ಲಿ ಮೆಷಿನ್ ಲರ್ನಿಂಗ್ ಪರಿಹಾರಗಳನ್ನು ನಿರ್ಮಿಸಲು ಮತ್ತು ಕಾರ್ಯಗತಗೊಳಿಸಲು ಕ್ಲೌಡ್ ಆಧಾರಿತ ವೇದಿಕೆ. ಇದು ಡೇಟಾ ವಿಜ್ಞಾನಿಗಳಿಗೆ ಡೇಟಾ ಸಿದ್ಧತೆ, ಮಾದರಿ ತರಬೇತಿ, ಭವಿಷ್ಯವಾಣಿ ಸೇವೆಗಳ ಪ್ರಕಟಣೆ ಮತ್ತು ಬಳಕೆಯ ಮೇಲ್ವಿಚಾರಣೆಗೆ ಸಹಾಯ ಮಾಡುವ ವೈಶಿಷ್ಟ್ಯಗಳು ಮತ್ತು ಸಾಮರ್ಥ್ಯಗಳನ್ನು ಒಳಗೊಂಡಿದೆ. ಮುಖ್ಯವಾಗಿ, ಇದು ಮಾದರಿ ತರಬೇತಿಗೆ ಸಂಬಂಧಿಸಿದ ಸಮಯ-ತೊಡಗಿಸುವ ಕಾರ್ಯಗಳನ್ನು ಸ್ವಯಂಚಾಲಿತಗೊಳಿಸುವ ಮೂಲಕ ಅವರ ಕಾರ್ಯಕ್ಷಮತೆಯನ್ನು ಹೆಚ್ಚಿಸುತ್ತದೆ; ಮತ್ತು ದೊಡ್ಡ ಪ್ರಮಾಣದ ಡೇಟಾವನ್ನು ಪರಿಣಾಮಕಾರಿಯಾಗಿ ನಿರ್ವಹಿಸಲು ಕ್ಲೌಡ್ ಆಧಾರಿತ ಗಣನೆ ಸಂಪನ್ಮೂಲಗಳನ್ನು ಬಳಸಲು ಸಹಾಯ ಮಾಡುತ್ತದೆ, ಮತ್ತು ಬಳಕೆಯ ಸಮಯದಲ್ಲಿ ಮಾತ್ರ ವೆಚ್ಚವನ್ನು ಹೊರುತ್ತದೆ.
ಅಜೂರ್ ಎಂಎಲ್ ಅಭಿವೃದ್ಧಿಪಡಕರಿಗೆ ಮತ್ತು ಡೇಟಾ ವಿಜ್ಞಾನಿಗಳಿಗೆ ಅವರ ಮೆಷಿನ್ ಲರ್ನಿಂಗ್ ಕಾರ್ಯಪ್ರವಾಹಗಳಿಗೆ ಅಗತ್ಯವಿರುವ ಎಲ್ಲಾ ಸಾಧನಗಳನ್ನು ಒದಗಿಸುತ್ತದೆ. ಅವುಗಳೆಂದರೆ:
- **ಅಜೂರ್ ಮೆಷಿನ್ ಲರ್ನಿಂಗ್ ಸ್ಟುಡಿಯೋ**: ಇದು ಅಜೂರ್ ಮೆಷಿನ್ ಲರ್ನಿಂಗ್‌ನಲ್ಲಿ ಲೋ-ಕೋಡ್ ಮತ್ತು ನೋ-ಕೋಡ್ ಆಯ್ಕೆಗಳೊಂದಿಗೆ ಮಾದರಿ ತರಬೇತಿ, ನಿಯೋಜನೆ, ಸ್ವಯಂಚಾಲನೆ, ಟ್ರ್ಯಾಕಿಂಗ್ ಮತ್ತು ಆಸ್ತಿ ನಿರ್ವಹಣೆಗೆ ವೆಬ್ ಪೋರ್ಟಲ್. ಸ್ಟುಡಿಯೋ ಅಜೂರ್ ಮೆಷಿನ್ ಲರ್ನಿಂಗ್ SDK ಜೊತೆಗೆ ಸಮ್ಮಿಲನ ಹೊಂದಿದೆ.
- **ಜುಪೈಟರ್ ನೋಟ್ಬುಕ್‌ಗಳು**: ML ಮಾದರಿಗಳನ್ನು ತ್ವರಿತವಾಗಿ ಪ್ರೋಟೋಟೈಪ್ ಮತ್ತು ಪರೀಕ್ಷೆ ಮಾಡಬಹುದು.
- **ಅಜೂರ್ ಮೆಷಿನ್ ಲರ್ನಿಂಗ್ ಡಿಸೈನರ್**: ಪ್ರಯೋಗಗಳನ್ನು ನಿರ್ಮಿಸಲು ಮತ್ತು ನಂತರ ಪೈಪ್ಲೈನ್ಗಳನ್ನು ನಿಯೋಜಿಸಲು ಡ್ರ್ಯಾಗ್-ಅಂಡ್-ಡ್ರಾಪ್ ಮಾಡಬಹುದಾದ ಲೋ-ಕೋಡ್ ಪರಿಸರ.
- **ಸ್ವಯಂಚಾಲಿತ ಮೆಷಿನ್ ಲರ್ನಿಂಗ್ UI (AutoML)**: ಮೆಷಿನ್ ಲರ್ನಿಂಗ್ ಮಾದರಿ ಅಭಿವೃದ್ಧಿಯ ಪುನರಾವರ್ತಿತ ಕಾರ್ಯಗಳನ್ನು ಸ್ವಯಂಚಾಲಿತಗೊಳಿಸುತ್ತದೆ, ಹೆಚ್ಚಿನ ಪ್ರಮಾಣ, ಕಾರ್ಯಕ್ಷಮತೆ ಮತ್ತು ಉತ್ಪಾದಕತೆ ಹೊಂದಿರುವ ML ಮಾದರಿಗಳನ್ನು ನಿರ್ಮಿಸಲು ಸಹಾಯ ಮಾಡುತ್ತದೆ, ಮತ್ತು ಮಾದರಿ ಗುಣಮಟ್ಟವನ್ನು ಕಾಪಾಡುತ್ತದೆ.
- **ಡೇಟಾ ಲೇಬಲಿಂಗ್**: ಡೇಟಾವನ್ನು ಸ್ವಯಂಚಾಲಿತವಾಗಿ ಲೇಬಲ್ ಮಾಡಲು ಸಹಾಯ ಮಾಡುವ ML ಸಾಧನ.
- **ವಿಜುವಲ್ ಸ್ಟುಡಿಯೋ ಕೋಡ್‌ಗೆ ಮೆಷಿನ್ ಲರ್ನಿಂಗ್ ವಿಸ್ತರಣೆ**: ML ಯೋಜನೆಗಳನ್ನು ನಿರ್ಮಿಸಲು ಮತ್ತು ನಿರ್ವಹಿಸಲು ಸಂಪೂರ್ಣ ವೈಶಿಷ್ಟ್ಯಗಳ ಅಭಿವೃದ್ಧಿ ಪರಿಸರ.
- **ಮೆಷಿನ್ ಲರ್ನಿಂಗ್ CLI**: ಕಮಾಂಡ್ ಲೈನ್‌ನಿಂದ ಅಜೂರ್ ಎಂಎಲ್ ಸಂಪನ್ಮೂಲಗಳನ್ನು ನಿರ್ವಹಿಸಲು ಕಮಾಂಡ್‌ಗಳು.
- **ಪೈಟಾರ್ಚ್, ಟೆನ್ಸರ್‌ಫ್ಲೋ, ಸ್ಕಿಕಿಟ್-ಲರ್ನ್ ಮತ್ತು ಇನ್ನಿತರ ಮುಕ್ತ ಮೂಲ ಫ್ರೇಮ್ವರ್ಕ್‌ಗಳೊಂದಿಗೆ ಏಕೀಕರಣ**: ತರಬೇತಿ, ನಿಯೋಜನೆ ಮತ್ತು ಸಂಪೂರ್ಣ ಮೆಷಿನ್ ಲರ್ನಿಂಗ್ ಪ್ರಕ್ರಿಯೆಯನ್ನು ನಿರ್ವಹಿಸಲು.
- **MLflow**: ನಿಮ್ಮ ಮೆಷಿನ್ ಲರ್ನಿಂಗ್ ಪ್ರಯೋಗಗಳ ಜೀವನಚಕ್ರವನ್ನು ನಿರ್ವಹಿಸಲು ಮುಕ್ತ ಮೂಲ ಗ್ರಂಥಾಲಯ. **MLFlow ಟ್ರ್ಯಾಕಿಂಗ್** ನಿಮ್ಮ ತರಬೇತಿ ರನ್ ಮೆಟ್ರಿಕ್ಸ್ ಮತ್ತು ಮಾದರಿ ವಸ್ತುಗಳನ್ನು ಲಾಗ್ ಮತ್ತು ಟ್ರ್ಯಾಕ್ ಮಾಡುವ MLflow ಘಟಕ, ನಿಮ್ಮ ಪ್ರಯೋಗದ ಪರಿಸರದಿಂದ ಸ್ವತಂತ್ರವಾಗಿ.
### 1.2 ಹೃದಯ ವೈಫಲ್ಯ ಭವಿಷ್ಯವಾಣಿ ಯೋಜನೆ:
ಯೋಜನೆಗಳನ್ನು ರಚಿಸುವುದು ಮತ್ತು ನಿರ್ಮಿಸುವುದು ನಿಮ್ಮ ಕೌಶಲ್ಯ ಮತ್ತು ಜ್ಞಾನವನ್ನು ಪರೀಕ್ಷಿಸಲು ಅತ್ಯುತ್ತಮ ಮಾರ್ಗವೆಂದು ಯಾವುದೇ ಸಂಶಯವಿಲ್ಲ. ಈ ಪಾಠದಲ್ಲಿ, ನಾವು ಅಜೂರ್ ಎಂಎಲ್ ಸ್ಟುಡಿಯೋದಲ್ಲಿ ಹೃದಯ ವೈಫಲ್ಯ ದಾಳಿಗಳ ಭವಿಷ್ಯವಾಣಿಗಾಗಿ ಡೇಟಾ ಸೈನ್ಸ್ ಯೋಜನೆಯನ್ನು ಎರಡು ವಿಭಿನ್ನ ವಿಧಾನಗಳಲ್ಲಿ ಅನ್ವೇಷಿಸುವೆವು: ಲೋ ಕೋಡ್/ನೋ ಕೋಡ್ ಮತ್ತು ಅಜೂರ್ ಎಂಎಲ್ SDK ಮೂಲಕ, ಕೆಳಗಿನ ಚಿತ್ರಣದಂತೆ:
![project-schema](../../../../translated_images/project-schema.736f6e403f321eb48d10242b3f4334dc6ccf0eabef8ff87daf52b89781389fcb.kn.png)
ಪ್ರತಿ ವಿಧಾನಕ್ಕೂ ತನ್ನದೇ ಆದ ಲಾಭ ಮತ್ತು ನಷ್ಟಗಳಿವೆ. ಲೋ ಕೋಡ್/ನೋ ಕೋಡ್ ವಿಧಾನವು GUI (ಗ್ರಾಫಿಕಲ್ ಯೂಸರ್ ಇಂಟರ್ಫೇಸ್) ಜೊತೆಗೆ ಸಂವಹನ ಮಾಡುವುದರಿಂದ ಪ್ರಾರಂಭಿಸಲು ಸುಲಭವಾಗಿದೆ, ಕೋಡ್ ಬಗ್ಗೆ ಪೂರ್ವಜ್ಞಾನ ಅಗತ್ಯವಿಲ್ಲ. ಈ ವಿಧಾನವು ಯೋಜನೆಯ ಸಾಧ್ಯತೆಯನ್ನು ತ್ವರಿತವಾಗಿ ಪರೀಕ್ಷಿಸಲು ಮತ್ತು POC (ಪ್ರೂಫ್ ಆಫ್ ಕಾಂಸೆಪ್ಟ್) ರಚಿಸಲು ಸಹಾಯ ಮಾಡುತ್ತದೆ. ಆದರೆ, ಯೋಜನೆ ವಿಸ್ತಾರವಾಗುತ್ತಾ ಮತ್ತು ಉತ್ಪಾದನೆಗೆ ಸಿದ್ಧವಾಗಬೇಕಾದಾಗ, GUI ಮೂಲಕ ಸಂಪನ್ಮೂಲಗಳನ್ನು ರಚಿಸುವುದು ಸಾಧ್ಯವಿಲ್ಲ. ಸಂಪನ್ಮೂಲಗಳ ರಚನೆ, ಮಾದರಿ ನಿಯೋಜನೆ ಸೇರಿದಂತೆ ಎಲ್ಲವನ್ನೂ ಪ್ರೋಗ್ರಾಮ್ಯಾಟಿಕಾಗಿ ಸ್ವಯಂಚಾಲಿತಗೊಳಿಸಬೇಕಾಗುತ್ತದೆ. ಈ ಸಂದರ್ಭದಲ್ಲಿ ಅಜೂರ್ ಎಂಎಲ್ SDK ಬಳಕೆ ತಿಳಿದುಕೊಳ್ಳುವುದು ಅತ್ಯಂತ ಮುಖ್ಯ.
| | ಲೋ ಕೋಡ್/ನೋ ಕೋಡ್ | ಅಜೂರ್ ಎಂಎಲ್ SDK |
|-------------------|------------------|---------------------------|
| ಕೋಡ್ ಪರಿಣತಿ | ಅಗತ್ಯವಿಲ್ಲ | ಅಗತ್ಯವಿದೆ |
| ಅಭಿವೃದ್ಧಿ ಸಮಯ | ವೇಗವಾಗಿ ಮತ್ತು ಸುಲಭವಾಗಿ | ಕೋಡ್ ಪರಿಣತಿಗೆ ಅವಲಂಬಿತವಾಗಿದೆ |
| ಉತ್ಪಾದನೆಗೆ ಸಿದ್ಧ | ಇಲ್ಲ | ಹೌದು |
### 1.3 ಹೃದಯ ವೈಫಲ್ಯ ಡೇಟಾಸೆಟ್:
ಹೃದಯರೋಗಗಳು (CVDs) ಜಾಗತಿಕವಾಗಿ ಮರಣದ ಪ್ರಮುಖ ಕಾರಣವಾಗಿದ್ದು, ಎಲ್ಲಾ ಮರಣಗಳ 31% ಅನ್ನು占ಿಸುತ್ತವೆ. ತಂಬಾಕು ಬಳಕೆ, ಅಸ್ವಸ್ಥ ಆಹಾರ ಮತ್ತು ಸ್ಥೂಲತೆ, ದೈಹಿಕ ಚಟುವಟಿಕೆ ಕೊರತೆ ಮತ್ತು ಮದ್ಯಪಾನದ ಹಾನಿಕಾರಕ ಬಳಕೆ ಮುಂತಾದ ಪರಿಸರ ಮತ್ತು ವರ್ತನೆ ಸಂಬಂಧಿತ ಅಪಾಯಕಾರಕ ಅಂಶಗಳನ್ನು ಅಂದಾಜು ಮಾದರಿಗಳ ವೈಶಿಷ್ಟ್ಯಗಳಾಗಿ ಬಳಸಬಹುದು. CVD ಅಭಿವೃದ್ಧಿಯ ಸಾಧ್ಯತೆಯನ್ನು ಅಂದಾಜಿಸಲು ಸಾಧ್ಯವಾಗುವುದರಿಂದ, ಅಪಾಯದೊಳಗಿನ ಜನರಲ್ಲಿ ದಾಳಿಗಳನ್ನು ತಡೆಯಲು ಬಹುಮೌಲ್ಯವಾಗಬಹುದು.
ಕಾಗಲ್ [ಹೃದಯ ವೈಫಲ್ಯ ಡೇಟಾಸೆಟ್](https://www.kaggle.com/andrewmvd/heart-failure-clinical-data) ಅನ್ನು ಸಾರ್ವಜನಿಕವಾಗಿ ಲಭ್ಯವಿದೆ, ಇದನ್ನು ನಾವು ಈ ಯೋಜನೆಗೆ ಬಳಸಲಿದ್ದೇವೆ. ನೀವು ಈಗಲೇ ಡೇಟಾಸೆಟ್ ಡೌನ್‌ಲೋಡ್ ಮಾಡಬಹುದು. ಇದು 13 ಕಾಲಮ್‌ಗಳ (12 ವೈಶಿಷ್ಟ್ಯಗಳು ಮತ್ತು 1 ಗುರಿ ಚರ) ಮತ್ತು 299 ಸಾಲುಗಳ ಟೇಬ್ಯುಲರ್ ಡೇಟಾಸೆಟ್.
| | ಚರದ ಹೆಸರು | ಪ್ರಕಾರ | ವಿವರಣೆ | ಉದಾಹರಣೆ |
|----|-------------------------|-----------------|-------------------------------------------------------|-------------------|
| 1 | ವಯಸ್ಸು | ಸಂಖ್ಯಾತ್ಮಕ | ರೋಗಿಯ ವಯಸ್ಸು | 25 |
| 2 | ಅನೀಮಿಯಾ | ಬೂಲಿಯನ್ | ರಕ್ತಕಣಗಳು ಅಥವಾ ಹೀಮೋಗ್ಲೋಬಿನ್ ಕಡಿಮೆಯಾಗುವುದು | 0 ಅಥವಾ 1 |
| 3 | ಕ್ರಿಯಾಟಿನಿನ್ ಫಾಸ್ಫೋಕಿನೇಸ್ | ಸಂಖ್ಯಾತ್ಮಕ | ರಕ್ತದಲ್ಲಿ CPK ಎನ್ಜೈಮ್ ಮಟ್ಟ | 542 |
| 4 | ಮಧುಮೇಹ | ಬೂಲಿಯನ್ | ರೋಗಿಗೆ ಮಧುಮೇಹವಿದೆಯೇ | 0 ಅಥವಾ 1 |
| 5 | ಇಜೆಕ್ಷನ್ ಫ್ರಾಕ್ಷನ್ | ಸಂಖ್ಯಾತ್ಮಕ | ಪ್ರತಿ ಸಂಕುಚನೆಯಲ್ಲಿ ಹೃದಯದಿಂದ ರಕ್ತದ ಶೇಕಡಾವಾರು | 45 |
| 6 | ಉನ್ನತ ರಕ್ತದೊತ್ತಡ | ಬೂಲಿಯನ್ | ರೋಗಿಗೆ ಹೈಪರ್‌ಟೆನ್ಷನ್ ಇದೆಯೇ | 0 ಅಥವಾ 1 |
| 7 | ಪ್ಲೇಟ್ಲೆಟ್ಸ್ | ಸಂಖ್ಯಾತ್ಮಕ | ರಕ್ತದಲ್ಲಿನ ಪ್ಲೇಟ್ಲೆಟ್ಸ್ | 149000 |
| 8 | ಸೀರಮ್ ಕ್ರಿಯಾಟಿನಿನ್ | ಸಂಖ್ಯಾತ್ಮಕ | ರಕ್ತದಲ್ಲಿನ ಸೀರಮ್ ಕ್ರಿಯಾಟಿನಿನ್ ಮಟ್ಟ | 0.5 |
| 9 | ಸೀರಮ್ ಸೋಡಿಯಂ | ಸಂಖ್ಯಾತ್ಮಕ | ರಕ್ತದಲ್ಲಿನ ಸೀರಮ್ ಸೋಡಿಯಂ ಮಟ್ಟ | ಜೂನ್ |
| 10 | ಲಿಂಗ | ಬೂಲಿಯನ್ | ಮಹಿಳೆ ಅಥವಾ ಪುರುಷ | 0 ಅಥವಾ 1 |
| 11 | ಧೂಮಪಾನ | ಬೂಲಿಯನ್ | ರೋಗಿ ಧೂಮಪಾನ ಮಾಡುತ್ತಾನೆಯೇ | 0 ಅಥವಾ 1 |
| 12 | ಸಮಯ | ಸಂಖ್ಯಾತ್ಮಕ | ಅನುಸರಣೆ ಅವಧಿ (ದಿನಗಳು) | 4 |
|----|-------------------------|-----------------|-------------------------------------------------------|-------------------|
| 21 | DEATH_EVENT [ಗುರಿ] | ಬೂಲಿಯನ್ | ಅನುಸರಣೆ ಅವಧಿಯಲ್ಲಿ ರೋಗಿ ಸಾವು ಸಂಭವಿಸಿದೆಯೇ | 0 ಅಥವಾ 1 |
ನೀವು ಡೇಟಾಸೆಟ್ ಪಡೆದ ನಂತರ, ನಾವು ಅಜೂರ್‌ನಲ್ಲಿ ಯೋಜನೆಯನ್ನು ಪ್ರಾರಂಭಿಸಬಹುದು.
## 2. ಅಜೂರ್ ಎಂಎಲ್ ಸ್ಟುಡಿಯೋದಲ್ಲಿ ಲೋ ಕೋಡ್/ನೋ ಕೋಡ್ ಮಾದರಿ ತರಬೇತಿ
### 2.1 ಅಜೂರ್ ಎಂಎಲ್ ವರ್ಕ್‌ಸ್ಪೇಸ್ ರಚನೆ
ಅಜೂರ್ ಎಂಎಲ್‌ನಲ್ಲಿ ಮಾದರಿಯನ್ನು ತರಬೇತಿಗೆ ಮೊದಲು ಅಜೂರ್ ಎಂಎಲ್ ವರ್ಕ್‌ಸ್ಪೇಸ್ ರಚಿಸಬೇಕು. ವರ್ಕ್‌ಸ್ಪೇಸ್ ಅಜೂರ್ ಮೆಷಿನ್ ಲರ್ನಿಂಗ್‌ನ ಟಾಪ್-ಲೆವೆಲ್ ಸಂಪನ್ಮೂಲವಾಗಿದೆ, ನೀವು ಅಜೂರ್ ಮೆಷಿನ್ ಲರ್ನಿಂಗ್ ಬಳಸುವಾಗ ರಚಿಸುವ ಎಲ್ಲಾ ವಸ್ತುಗಳನ್ನು ಕೇಂದ್ರಿತವಾಗಿ ನಿರ್ವಹಿಸಲು ಸ್ಥಳ ಒದಗಿಸುತ್ತದೆ. ವರ್ಕ್‌ಸ್ಪೇಸ್ ಎಲ್ಲಾ ತರಬೇತಿ ರನ್‌ಗಳ ಇತಿಹಾಸವನ್ನು, ಲಾಗ್‌ಗಳು, ಮೆಟ್ರಿಕ್ಸ್, ಔಟ್‌ಪುಟ್ ಮತ್ತು ನಿಮ್ಮ ಸ್ಕ್ರಿಪ್ಟ್‌ಗಳ ಸ্ন್ಯಾಪ್‌ಶಾಟ್ ಅನ್ನು ಸಂಗ್ರಹಿಸುತ್ತದೆ. ನೀವು ಈ ಮಾಹಿತಿಯನ್ನು ಬಳಸಿಕೊಂಡು ಯಾವ ತರಬೇತಿ ರನ್ ಉತ್ತಮ ಮಾದರಿಯನ್ನು ಉತ್ಪಾದಿಸುತ್ತದೆ ಎಂದು ನಿರ್ಧರಿಸಬಹುದು. [ಹೆಚ್ಚು ತಿಳಿಯಿರಿ](https://docs.microsoft.com/azure/machine-learning/concept-workspace?WT.mc_id=academic-77958-bethanycheum&ocid=AID3041109)
ನಿಮ್ಮ ಆಪರೇಟಿಂಗ್ ಸಿಸ್ಟಮ್‌ಗೆ ಹೊಂದಿಕೊಳ್ಳುವ ಅತ್ಯಂತ ನವೀಕೃತ ಬ್ರೌಸರ್ ಬಳಸಲು ಶಿಫಾರಸು ಮಾಡಲಾಗಿದೆ. ಕೆಳಗಿನ ಬ್ರೌಸರ್‌ಗಳು ಬೆಂಬಲಿತವಾಗಿವೆ:
- ಮೈಕ್ರೋಸಾಫ್ಟ್ ಎಡ್ಜ್ (ಹೊಸ ಮೈಕ್ರೋಸಾಫ್ಟ್ ಎಡ್ಜ್, ಇತ್ತೀಚಿನ ಆವೃತ್ತಿ. ಮೈಕ್ರೋಸಾಫ್ಟ್ ಎಡ್ಜ್ ಲೆಗಸಿ ಅಲ್ಲ)
- ಸಫಾರಿ (ಇತ್ತೀಚಿನ ಆವೃತ್ತಿ, ಮ್ಯಾಕ್ ಮಾತ್ರ)
- ಕ್ರೋಮ್ (ಇತ್ತೀಚಿನ ಆವೃತ್ತಿ)
- ಫೈರ್‌ಫಾಕ್ಸ್ (ಇತ್ತೀಚಿನ ಆವೃತ್ತಿ)
ಅಜೂರ್ ಮೆಷಿನ್ ಲರ್ನಿಂಗ್ ಬಳಸಲು, ನಿಮ್ಮ ಅಜೂರ್ ಸಬ್ಸ್ಕ್ರಿಪ್ಷನ್‌ನಲ್ಲಿ ವರ್ಕ್‌ಸ್ಪೇಸ್ ರಚಿಸಿ. ನಂತರ ನೀವು ಈ ವರ್ಕ್‌ಸ್ಪೇಸ್ ಅನ್ನು ಡೇಟಾ, ಗಣನೆ ಸಂಪನ್ಮೂಲಗಳು, ಕೋಡ್, ಮಾದರಿಗಳು ಮತ್ತು ನಿಮ್ಮ ಮೆಷಿನ್ ಲರ್ನಿಂಗ್ ಕಾರ್ಯಭಾರಗಳಿಗೆ ಸಂಬಂಧಿಸಿದ ಇತರ ವಸ್ತುಗಳನ್ನು ನಿರ್ವಹಿಸಲು ಬಳಸಬಹುದು.
> **_ಗಮನಿಸಿ:_** ಅಜೂರ್ ಮೆಷಿನ್ ಲರ್ನಿಂಗ್ ವರ್ಕ್‌ಸ್ಪೇಸ್ ನಿಮ್ಮ ಸಬ್ಸ್ಕ್ರಿಪ್ಷನ್‌ನಲ್ಲಿ ಇರುವವರೆಗೆ ಡೇಟಾ ಸಂಗ್ರಹಣೆಗೆ ಸಣ್ಣ ಶುಲ್ಕ ವಿಧಿಸಲಾಗುತ್ತದೆ, ಆದ್ದರಿಂದ ನೀವು ಬಳಸದಾಗ ಅಜೂರ್ ಮೆಷಿನ್ ಲರ್ನಿಂಗ್ ವರ್ಕ್‌ಸ್ಪೇಸ್ ಅನ್ನು ಅಳಿಸುವುದನ್ನು ಶಿಫಾರಸು ಮಾಡುತ್ತೇವೆ.
1. ನಿಮ್ಮ ಅಜೂರ್ ಸಬ್ಸ್ಕ್ರಿಪ್ಷನ್‌ಗೆ ಸಂಬಂಧಿಸಿದ ಮೈಕ್ರೋಸಾಫ್ಟ್ ಕ್ರೆಡೆನ್ಷಿಯಲ್ಸ್ ಬಳಸಿ [ಅಜೂರ್ ಪೋರ್ಟಲ್](https://ms.portal.azure.com/) ಗೆ ಸೈನ್ ಇನ್ ಆಗಿ.
2. **+ಸಂಪನ್ಮೂಲ ರಚಿಸಿ** ಆಯ್ಕೆಮಾಡಿ
![workspace-1](../../../../translated_images/workspace-1.ac8694d60b073ed1ae8333d71244dc8a9b3e439d54593724f98f1beefdd27b08.kn.png)
ಮೆಷಿನ್ ಲರ್ನಿಂಗ್ ಅನ್ನು ಹುಡುಕಿ ಮತ್ತು ಮೆಷಿನ್ ಲರ್ನಿಂಗ್ ಟೈಲ್ ಆಯ್ಕೆಮಾಡಿ
![workspace-2](../../../../translated_images/workspace-2.ae7c486db8796147075e4a56566aa819827dd6c4c8d18d64590317c3be625f17.kn.png)
ರಚನೆ ಬಟನ್ ಕ್ಲಿಕ್ ಮಾಡಿ
![workspace-3](../../../../translated_images/workspace-3.398ca4a5858132cce584db9df10c5a011cd9075eb182e647a77d5cac01771eea.kn.png)
ಕೆಳಗಿನಂತೆ ಸೆಟ್ಟಿಂಗ್‌ಗಳನ್ನು ಭರ್ತಿ ಮಾಡಿ:
- ಸಬ್ಸ್ಕ್ರಿಪ್ಷನ್: ನಿಮ್ಮ ಅಜೂರ್ ಸಬ್ಸ್ಕ್ರಿಪ್ಷನ್
- ಸಂಪನ್ಮೂಲ ಗುಂಪು: ಸಂಪನ್ಮೂಲ ಗುಂಪನ್ನು ರಚಿಸಿ ಅಥವಾ ಆಯ್ಕೆಮಾಡಿ
- ವರ್ಕ್‌ಸ್ಪೇಸ್ ಹೆಸರು: ನಿಮ್ಮ ವರ್ಕ್‌ಸ್ಪೇಸ್‌ಗೆ ವಿಶಿಷ್ಟ ಹೆಸರು ನಮೂದಿಸಿ
- ಪ್ರದೇಶ: ನಿಮ್ಮ ಹತ್ತಿರದ ಭೌಗೋಳಿಕ ಪ್ರದೇಶ ಆಯ್ಕೆಮಾಡಿ
- ಸಂಗ್ರಹಣಾ ಖಾತೆ: ನಿಮ್ಮ ವರ್ಕ್‌ಸ್ಪೇಸ್‌ಗೆ ಹೊಸ ಡೀಫಾಲ್ಟ್ ಸಂಗ್ರಹಣಾ ಖಾತೆ ಸೃಷ್ಟಿಸಲಾಗುತ್ತದೆ
- ಕೀ ವಾಲ್ಟ್: ನಿಮ್ಮ ವರ್ಕ್‌ಸ್ಪೇಸ್‌ಗೆ ಹೊಸ ಡೀಫಾಲ್ಟ್ ಕೀ ವಾಲ್ಟ್ ಸೃಷ್ಟಿಸಲಾಗುತ್ತದೆ
- ಅಪ್ಲಿಕೇಶನ್ ಇನ್ಸೈಟ್ಸ್: ನಿಮ್ಮ ವರ್ಕ್‌ಸ್ಪೇಸ್‌ಗೆ ಹೊಸ ಡೀಫಾಲ್ಟ್ ಅಪ್ಲಿಕೇಶನ್ ಇನ್ಸೈಟ್ಸ್ ಸಂಪನ್ಮೂಲ ಸೃಷ್ಟಿಸಲಾಗುತ್ತದೆ
- ಕಂಟೈನರ್ ರಿಜಿಸ್ಟ್ರಿ: ಇಲ್ಲ (ನೀವು ಮೊದಲ ಬಾರಿಗೆ ಮಾದರಿಯನ್ನು ಕಂಟೈನರ್‌ಗೆ ನಿಯೋಜಿಸುವಾಗ ಸ್ವಯಂಚಾಲಿತವಾಗಿ ಸೃಷ್ಟಿಸಲಾಗುತ್ತದೆ)
![workspace-4](../../../../translated_images/workspace-4.bac87f6599c4df63e624fc2608990f965887bee551d9dedc71c687b43b986b6a.kn.png)
- ರಚಿಸಿ + ಪರಿಶೀಲಿಸಿ ಕ್ಲಿಕ್ ಮಾಡಿ ಮತ್ತು ನಂತರ ರಚನೆ ಬಟನ್ ಕ್ಲಿಕ್ ಮಾಡಿ
3. ನಿಮ್ಮ ವರ್ಕ್‌ಸ್ಪೇಸ್ ರಚನೆಗೆ ಕೆಲವು ನಿಮಿಷಗಳು ಬೇಕಾಗಬಹುದು. ನಂತರ ಪೋರ್ಟಲ್‌ನಲ್ಲಿ ಅದಕ್ಕೆ ಹೋಗಿ. ನೀವು ಅದನ್ನು ಮೆಷಿನ್ ಲರ್ನಿಂಗ್ ಅಜೂರ್ ಸೇವೆಯ ಮೂಲಕ ಹುಡುಕಬಹುದು.
4. ನಿಮ್ಮ ವರ್ಕ್‌ಸ್ಪೇಸ್‌ನ ಅವಲೋಕನ ಪುಟದಲ್ಲಿ, ಅಜೂರ್ ಮೆಷಿನ್ ಲರ್ನಿಂಗ್ ಸ್ಟುಡಿಯೋವನ್ನು ಪ್ರಾರಂಭಿಸಿ (ಅಥವಾ ಹೊಸ ಬ್ರೌಸರ್ ಟ್ಯಾಬ್ ತೆರೆಯಿರಿ ಮತ್ತು https://ml.azure.com ಗೆ ಹೋಗಿ), ಮತ್ತು ನಿಮ್ಮ ಮೈಕ್ರೋಸಾಫ್ಟ್ ಖಾತೆ ಬಳಸಿ ಅಜೂರ್ ಮೆಷಿನ್ ಲರ್ನಿಂಗ್ ಸ್ಟುಡಿಯೋದಲ್ಲಿ ಸೈನ್ ಇನ್ ಆಗಿ. ಕೇಳಿದರೆ, ನಿಮ್ಮ ಅಜೂರ್ ಡೈರೆಕ್ಟರಿ ಮತ್ತು ಸಬ್ಸ್ಕ್ರಿಪ್ಷನ್ ಮತ್ತು ಅಜೂರ್ ಮೆಷಿನ್ ಲರ್ನಿಂಗ್ ವರ್ಕ್‌ಸ್ಪೇಸ್ ಆಯ್ಕೆಮಾಡಿ.
![workspace-5](../../../../translated_images/workspace-5.a6eb17e0a5e6420018b08bdaf3755ce977f96f1df3ea363d2476a9dce7e15adb.kn.png)
5. ಅಜೂರ್ ಮೆಷಿನ್ ಲರ್ನಿಂಗ್ ಸ್ಟುಡಿಯೋದಲ್ಲಿ, ಎಡಮೇಲೆ ಇರುವ ☰ ಐಕಾನ್ ಅನ್ನು ಟಾಗಲ್ ಮಾಡಿ ಇಂಟರ್ಫೇಸ್‌ನ ವಿವಿಧ ಪುಟಗಳನ್ನು ವೀಕ್ಷಿಸಿ. ನೀವು ಈ ಪುಟಗಳನ್ನು ನಿಮ್ಮ ವರ್ಕ್‌ಸ್ಪೇಸ್‌ನ ಸಂಪನ್ಮೂಲಗಳನ್ನು ನಿರ್ವಹಿಸಲು ಬಳಸಬಹುದು.
![workspace-6](../../../../translated_images/workspace-6.8dd81fe841797ee17f8f73916769576260b16c4e17e850d277a49db35fd74a15.kn.png)
ನೀವು ಅಜೂರ್ ಪೋರ್ಟಲ್ ಬಳಸಿ ನಿಮ್ಮ ವರ್ಕ್‌ಸ್ಪೇಸ್ ಅನ್ನು ನಿರ್ವಹಿಸಬಹುದು, ಆದರೆ ಡೇಟಾ ವಿಜ್ಞಾನಿಗಳು ಮತ್ತು ಮೆಷಿನ್ ಲರ್ನಿಂಗ್ ಕಾರ್ಯಾಚರಣೆ ಇಂಜಿನಿಯರ್‌ಗಳಿಗೆ, ಅಜೂರ್ ಮೆಷಿನ್ ಲರ್ನಿಂಗ್ ಸ್ಟುಡಿಯೋ ವರ್ಕ್‌ಸ್ಪೇಸ್ ಸಂಪನ್ಮೂಲಗಳನ್ನು ನಿರ್ವಹಿಸಲು ಹೆಚ್ಚು ಕೇಂದ್ರೀಕೃತ ಬಳಕೆದಾರ ಇಂಟರ್ಫೇಸ್ ಒದಗಿಸುತ್ತದೆ.
### 2.2 ಗಣನೆ ಸಂಪನ್ಮೂಲಗಳು
ಗಣನೆ ಸಂಪನ್ಮೂಲಗಳು ಕ್ಲೌಡ್ ಆಧಾರಿತ ಸಂಪನ್ಮೂಲಗಳು, ಅವುಗಳಲ್ಲಿ ನೀವು ಮಾದರಿ ತರಬೇತಿ ಮತ್ತು ಡೇಟಾ ಅನ್ವೇಷಣೆ ಪ್ರಕ್ರಿಯೆಗಳನ್ನು ನಡೆಸಬಹುದು. ನೀವು ರಚಿಸಬಹುದಾದ ನಾಲ್ಕು ವಿಧದ ಗಣನೆ ಸಂಪನ್ಮೂಲಗಳಿವೆ:
- **ಗಣನೆ ಇನ್ಸ್ಟಾನ್ಸ್‌ಗಳು**: ಡೇಟಾ ವಿಜ್ಞಾನಿಗಳು ಡೇಟಾ ಮತ್ತು ಮಾದರಿಗಳೊಂದಿಗೆ ಕೆಲಸ ಮಾಡಲು ಬಳಸಬಹುದಾದ ಅಭಿವೃದ್ಧಿ ವರ್ಕ್‌ಸ್ಟೇಷನ್‌ಗಳು. ಇದರಲ್ಲಿ ವರ್ಚುವಲ್ ಮಷೀನ್ (VM) ರಚನೆ ಮತ್ತು ನೋಟ್ಬುಕ್ ಇನ್ಸ್ಟಾನ್ಸ್ ಪ್ರಾರಂಭಿಸುವುದು ಸೇರಿದೆ. ನಂತರ ನೀವು ನೋಟ್ಬುಕ್‌ನಿಂದ ಗಣನೆ ಕ್ಲಸ್ಟರ್ ಅನ್ನು ಕರೆದು ಮಾದರಿಯನ್ನು ತರಬೇತಿಗೆ ತೆಗೆದುಕೊಳ್ಳಬಹುದು.
- **ಗಣನೆ ಕ್ಲಸ್ಟರ್‌ಗಳು**: ಪ್ರಯೋಗ ಕೋಡ್‌ನ ಆನ್-ಡಿಮ್ಯಾಂಡ್ ಪ್ರಕ್ರಿಯೆಗೆ VM ಗಳ ಸ್ಕೇಲಬಲ್ ಕ್ಲಸ್ಟರ್‌ಗಳು. ನೀವು ಮಾದರಿ ತರಬೇತಿಗೆ ಇದನ್ನು ಬಳಸುತ್ತೀರಿ. ಗಣನೆ ಕ್ಲಸ್ಟರ್‌ಗಳು ವಿಶೇಷ GPU ಅಥವಾ CPU ಸಂಪನ್ಮೂಲಗಳನ್ನು ಸಹ ಬಳಸಬಹುದು.
- **ಅನುವಾದ ಕ್ಲಸ್ಟರ್‌ಗಳು**: ನಿಮ್ಮ ತರಬೇತುದಾರ ಮಾದರಿಗಳನ್ನು ಬಳಸುವ ಭವಿಷ್ಯವಾಣಿ ಸೇವೆಗಳ ನಿಯೋಜನೆ ಗುರಿಗಳು.
- **ಸಂಯೋಜಿತ ಗಣನೆ**: ವಾಸ್ತವಿಕ ಯಂತ್ರಗಳು ಅಥವಾ ಅಜೂರ್ ಡೇಟಾಬ್ರಿಕ್ಸ್ ಕ್ಲಸ್ಟರ್‌ಗಳಂತಹ ಅಸ್ತಿತ್ವದಲ್ಲಿರುವ ಅಜೂರ್ ಗಣನೆ ಸಂಪನ್ಮೂಲಗಳಿಗೆ ಲಿಂಕ್‌ಗಳು.
#### 2.2.1 ನಿಮ್ಮ ಗಣನೆ ಸಂಪನ್ಮೂಲಗಳಿಗೆ ಸರಿಯಾದ ಆಯ್ಕೆಗಳನ್ನು ಮಾಡುವುದು
ಗಣನೆ ಸಂಪನ್ಮೂಲವನ್ನು ರಚಿಸುವಾಗ ಪರಿಗಣಿಸಬೇಕಾದ ಕೆಲವು ಪ್ರಮುಖ ಅಂಶಗಳಿವೆ ಮತ್ತು ಆ ಆಯ್ಕೆಗಳು ಮಹತ್ವದ ನಿರ್ಧಾರಗಳಾಗಬಹುದು.
**ನೀವು CPU ಅಥವಾ GPU ಬೇಕೇ?**
CPU (ಸೆಂಟ್ರಲ್ ಪ್ರೊಸೆಸಿಂಗ್ ಯೂನಿಟ್) ಎಂದರೆ ಕಂಪ್ಯೂಟರ್ ಪ್ರೋಗ್ರಾಂ ಒಳಗೊಂಡ ಸೂಚನೆಗಳನ್ನು ನಿರ್ವಹಿಸುವ ಎಲೆಕ್ಟ್ರಾನಿಕ್ ಸರ್ಕ್ಯೂಟ್. GPU (ಗ್ರಾಫಿಕ್ಸ್ ಪ್ರೊಸೆಸಿಂಗ್ ಯೂನಿಟ್) ಎಂದರೆ ಅತ್ಯಂತ ವೇಗವಾಗಿ ಗ್ರಾಫಿಕ್ಸ್ ಸಂಬಂಧಿತ ಕೋಡ್ ಅನ್ನು ನಿರ್ವಹಿಸಲು ವಿಶೇಷವಾಗಿ ವಿನ್ಯಾಸಗೊಳಿಸಿದ ಎಲೆಕ್ಟ್ರಾನಿಕ್ ಸರ್ಕ್ಯೂಟ್.
CPU ಮತ್ತು GPU ವಾಸ್ತುಶಿಲ್ಪದ ಮುಖ್ಯ ವ್ಯತ್ಯಾಸವೆಂದರೆ CPU ವೇಗವಾಗಿ ವಿವಿಧ ಕಾರ್ಯಗಳನ್ನು ನಿರ್ವಹಿಸಲು ವಿನ್ಯಾಸಗೊಳಿಸಲಾಗಿದೆ (CPU ಕ್ಲಾಕ್ ವೇಗದಿಂದ ಅಳೆಯಲ್ಪಡುವುದು), ಆದರೆ ಕಾರ್ಯಗಳ ಸಮಕಾಲೀನತೆಯಲ್ಲಿ ಮಿತಿಯಿದೆ. GPU ಗಳು ಸಮಾಂತರ ಗಣನೆಗಾಗಿ ವಿನ್ಯಾಸಗೊಳಿಸಲ್ಪಟ್ಟಿದ್ದು, ಆದುದರಿಂದ ಆಳವಾದ ಕಲಿಕೆ ಕಾರ್ಯಗಳಲ್ಲಿ ಉತ್ತಮವಾಗಿವೆ.
| CPU | GPU |
|-----------------------------------------|-----------------------------|
| ಕಡಿಮೆ ವೆಚ್ಚದ | ಹೆಚ್ಚು ವೆಚ್ಚದ |
| ಕಡಿಮೆ ಮಟ್ಟದ ಸಮಕಾಲೀನತೆ | ಹೆಚ್ಚು ಮಟ್ಟದ ಸಮಕಾಲೀನತೆ |
| ಆಳವಾದ ಕಲಿಕೆ ಮಾದರಿಗಳನ್ನು ತರಬೇತಿಯಲ್ಲಿ ನಿಧಾನ | ಆಳವಾದ ಕಲಿಕೆಗೆ ಸೂಕ್ತ |
**ಕ್ಲಸ್ಟರ್ ಗಾತ್ರ**
ದೊಡ್ಡ ಕ್ಲಸ್ಟರ್‌ಗಳು ಹೆಚ್ಚು ವೆಚ್ಚದಾಗಿವೆ ಆದರೆ ಉತ್ತಮ ಪ್ರತಿಕ್ರಿಯಾಶೀಲತೆಯನ್ನು ನೀಡುತ್ತವೆ. ಆದ್ದರಿಂದ, ನಿಮಗೆ ಸಮಯವಿದ್ದರೂ ಹಣ ಕಡಿಮೆ ಇದ್ದರೆ, ನೀವು ಸಣ್ಣ ಕ್ಲಸ್ಟರ್‌ನಿಂದ ಪ್ರಾರಂಭಿಸಬೇಕು. ವಿರುದ್ಧವಾಗಿ, ನಿಮಗೆ ಹಣ ಇದ್ದರೂ ಸಮಯ ಕಡಿಮೆ ಇದ್ದರೆ, ನೀವು ದೊಡ್ಡ ಕ್ಲಸ್ಟರ್‌ನಿಂದ ಪ್ರಾರಂಭಿಸಬೇಕು.
**VM ಗಾತ್ರ**
ನಿಮ್ಮ ಸಮಯ ಮತ್ತು ಬಜೆಟ್ ನಿರ್ಬಂಧಗಳ ಆಧಾರದ ಮೇಲೆ, ನೀವು ನಿಮ್ಮ RAM, ಡಿಸ್ಕ್, ಕೋರ್‌ಗಳ ಸಂಖ್ಯೆ ಮತ್ತು ಕ್ಲಾಕ್ ವೇಗವನ್ನು ಬದಲಾಯಿಸಬಹುದು. ಈ ಎಲ್ಲಾ ಪರಿಮಾಣಗಳನ್ನು ಹೆಚ್ಚಿಸುವುದು ಹೆಚ್ಚು ವೆಚ್ಚದಾಗುತ್ತದೆ, ಆದರೆ ಉತ್ತಮ ಕಾರ್ಯಕ್ಷಮತೆಯನ್ನು ನೀಡುತ್ತದೆ.
**ನಿರ್ದಿಷ್ಟ ಅಥವಾ ಕಡಿಮೆ ಪ್ರಾಥಮಿಕತೆ ಇರುವ ಉದಾಹರಣೆಗಳು?**
ಕಡಿಮೆ ಪ್ರಾಥಮಿಕತೆ ಇರುವ ಉದಾಹರಣೆ ಎಂದರೆ ಅದು ಮಧ್ಯಂತರವಾಗಬಹುದು: ಅರ್ಥಾತ್, ಮೈಕ್ರೋಸಾಫ್ಟ್ ಅಜೂರ್ ಆ ಸಂಪನ್ಮೂಲಗಳನ್ನು ತೆಗೆದುಕೊಂಡು ಬೇರೆ ಕಾರ್ಯಕ್ಕೆ ನಿಯೋಜಿಸಬಹುದು, ಹೀಗಾಗಿ ಕೆಲಸವನ್ನು ಮಧ್ಯಂತರಗೊಳಿಸುತ್ತದೆ. ನಿರ್ದಿಷ್ಟ ಉದಾಹರಣೆ ಅಥವಾ ಮಧ್ಯಂತರವಲ್ಲದ ಉದಾಹರಣೆ ಎಂದರೆ ನಿಮ್ಮ ಅನುಮತಿಯಿಲ್ಲದೆ ಕೆಲಸವನ್ನು ಎಂದಿಗೂ ನಿಲ್ಲಿಸಲಾಗುವುದಿಲ್ಲ.
ಇದು ಸಮಯ ಮತ್ತು ಹಣದ ಮತ್ತೊಂದು ಪರಿಗಣನೆ, ಏಕೆಂದರೆ ಮಧ್ಯಂತರ ಉದಾಹರಣೆಗಳು ನಿರ್ದಿಷ್ಟ ಉದಾಹರಣೆಗಳಿಗಿಂತ ಕಡಿಮೆ ವೆಚ್ಚದವಾಗಿವೆ.
#### 2.2.2 ಗಣನೆ ಕ್ಲಸ್ಟರ್ ರಚನೆ
ನಾವು ಮೊದಲು ರಚಿಸಿದ [ಅಜೂರ್ ML ವರ್ಕ್‌ಸ್ಪೇಸ್](https://ml.azure.com/) ನಲ್ಲಿ, ಗಣನೆಗೆ ಹೋಗಿ ನಾವು ಈಗಾಗಲೇ ಚರ್ಚಿಸಿದ ವಿವಿಧ ಗಣನೆ ಸಂಪನ್ಮೂಲಗಳನ್ನು ನೋಡಬಹುದು (ಅಂದರೆ ಗಣನೆ ಉದಾಹರಣೆಗಳು, ಗಣನೆ ಕ್ಲಸ್ಟರ್‌ಗಳು, ಅನುವಾದ ಕ್ಲಸ್ಟರ್‌ಗಳು ಮತ್ತು ಸಂಯೋಜಿತ ಗಣನೆ). ಈ ಯೋಜನೆಗಾಗಿ, ನಮಗೆ ಮಾದರಿ ತರಬೇತಿಗೆ ಗಣನೆ ಕ್ಲಸ್ಟರ್ ಬೇಕಾಗುತ್ತದೆ. ಸ್ಟುಡಿಯೋದಲ್ಲಿ, "Compute" ಮೆನು ಕ್ಲಿಕ್ ಮಾಡಿ, ನಂತರ "Compute cluster" ಟ್ಯಾಬ್ ಕ್ಲಿಕ್ ಮಾಡಿ ಮತ್ತು "+ New" ಬಟನ್ ಕ್ಲಿಕ್ ಮಾಡಿ ಗಣನೆ ಕ್ಲಸ್ಟರ್ ರಚಿಸಲು.
![22](../../../../translated_images/cluster-1.b78cb630bb543729b11f60c34d97110a263f8c27b516ba4dc47807b3cee5579f.kn.png)
1. ನಿಮ್ಮ ಆಯ್ಕೆಗಳನ್ನು ಆರಿಸಿ: ನಿರ್ದಿಷ್ಟ ವಿರುದ್ಧ ಕಡಿಮೆ ಪ್ರಾಥಮಿಕತೆ, CPU ಅಥವಾ GPU, VM ಗಾತ್ರ ಮತ್ತು ಕೋರ್ ಸಂಖ್ಯೆ (ಈ ಯೋಜನೆಗಾಗಿ ಡೀಫಾಲ್ಟ್ ಸೆಟ್ಟಿಂಗ್‌ಗಳನ್ನು ಇಡಬಹುದು).
2. ಮುಂದಿನ ಬಟನ್ ಕ್ಲಿಕ್ ಮಾಡಿ.
![23](../../../../translated_images/cluster-2.ea30cdbc9f926bb9e05af3fdbc1f679811c796dc2a6847f935290aec15526e88.kn.png)
3. ಕ್ಲಸ್ಟರ್‌ಗೆ ಗಣನೆ ಹೆಸರು ನೀಡಿ
4. ನಿಮ್ಮ ಆಯ್ಕೆಗಳನ್ನು ಆರಿಸಿ: ಕನಿಷ್ಠ/ಗರಿಷ್ಠ ನೋಡ್‌ಗಳ ಸಂಖ್ಯೆ, ಸ್ಕೇಲ್ ಡೌನ್ ಮಾಡುವ ಮೊದಲು ನಿರ್ಜೀವ ಸೆಕೆಂಡುಗಳು, SSH ಪ್ರವೇಶ. ಕನಿಷ್ಠ ನೋಡ್‌ಗಳ ಸಂಖ್ಯೆ 0 ಇದ್ದರೆ, ಕ್ಲಸ್ಟರ್ ನಿರ್ಜೀವವಾಗಿರುವಾಗ ನೀವು ಹಣ ಉಳಿಸಬಹುದು. ಗರಿಷ್ಠ ನೋಡ್‌ಗಳ ಸಂಖ್ಯೆ ಹೆಚ್ಚಾದರೆ ತರಬೇತಿ ಕಡಿಮೆ ಸಮಯ ತೆಗೆದುಕೊಳ್ಳುತ್ತದೆ. ಶಿಫಾರಸು ಮಾಡಲಾದ ಗರಿಷ್ಠ ನೋಡ್‌ಗಳ ಸಂಖ್ಯೆ 3.
5. "Create" ಬಟನ್ ಕ್ಲಿಕ್ ಮಾಡಿ. ಈ ಹಂತಕ್ಕೆ ಕೆಲವು ನಿಮಿಷಗಳು ಬೇಕಾಗಬಹುದು.
![29](../../../../translated_images/cluster-3.8a334bc070ec173a329ce5abd2a9d727542e83eb2347676c9af20f2c8870b3e7.kn.png)
ಅದ್ಭುತ! ಈಗ ನಮಗೆ ಗಣನೆ ಕ್ಲಸ್ಟರ್ ಇದೆ, ನಾವು ಡೇಟಾವನ್ನು ಅಜೂರ್ ML ಸ್ಟುಡಿಯೋಗೆ ಲೋಡ್ ಮಾಡಬೇಕಾಗಿದೆ.
### 2.3 ಡೇಟಾಸೆಟ್ ಲೋಡ್ ಮಾಡುವುದು
1. ನಾವು ಮೊದಲು ರಚಿಸಿದ [ಅಜೂರ್ ML ವರ್ಕ್‌ಸ್ಪೇಸ್](https://ml.azure.com/) ನಲ್ಲಿ, ಎಡ ಮೆನುದಲ್ಲಿ "Datasets" ಕ್ಲಿಕ್ ಮಾಡಿ ಮತ್ತು "+ Create dataset" ಬಟನ್ ಕ್ಲಿಕ್ ಮಾಡಿ ಡೇಟಾಸೆಟ್ ರಚಿಸಲು. "From local files" ಆಯ್ಕೆ ಮಾಡಿ ಮತ್ತು ನಾವು ಮೊದಲು ಡೌನ್‌ಲೋಡ್ ಮಾಡಿದ ಕಾಗಲ್ ಡೇಟಾಸೆಟ್ ಆಯ್ಕೆಮಾಡಿ.
![24](../../../../translated_images/dataset-1.e86ab4e10907a6e9c2a72577b51db35f13689cb33702337b8b7032f2ef76dac2.kn.png)
2. ನಿಮ್ಮ ಡೇಟಾಸೆಟ್‌ಗೆ ಹೆಸರು, ಪ್ರಕಾರ ಮತ್ತು ವಿವರಣೆ ನೀಡಿ. ಮುಂದಿನ ಬಟನ್ ಕ್ಲಿಕ್ ಮಾಡಿ. ಫೈಲ್‌ಗಳಿಂದ ಡೇಟಾ ಅಪ್‌ಲೋಡ್ ಮಾಡಿ. ಮುಂದಿನ ಬಟನ್ ಕ್ಲಿಕ್ ಮಾಡಿ.
![25](../../../../translated_images/dataset-2.f58de1c435d5bf9ccb16ccc5f5d4380eb2b50affca85cfbf4f97562bdab99f77.kn.png)
3. ಸ್ಕೀಮಾ‌ನಲ್ಲಿ, ಕೆಳಗಿನ ವೈಶಿಷ್ಟ್ಯಗಳಿಗಾಗಿ ಡೇಟಾ ಪ್ರಕಾರವನ್ನು ಬೂಲಿಯನ್‌ಗೆ ಬದಲಾಯಿಸಿ: ಅನೀಮಿಯಾ, ಡಯಾಬಿಟಿಸ್, ಹೈ ಬ್ಲಡ್ ಪ್ರೆಶರ್, ಲಿಂಗ, ಧೂಮಪಾನ, ಮತ್ತು DEATH_EVENT. ಮುಂದಿನ ಬಟನ್ ಕ್ಲಿಕ್ ಮಾಡಿ ಮತ್ತು ರಚಿಸಿ ಕ್ಲಿಕ್ ಮಾಡಿ.
![26](../../../../translated_images/dataset-3.58db8c0eb783e89236a02bbce5bb4ba808d081a87d994d5284b1ae59928c95bf.kn.png)
ಚೆನ್ನಾಗಿದೆ! ಈಗ ಡೇಟಾಸೆಟ್ ಸಿದ್ಧವಾಗಿದೆ ಮತ್ತು ಗಣನೆ ಕ್ಲಸ್ಟರ್ ರಚಿಸಲಾಗಿದೆ, ನಾವು ಮಾದರಿ ತರಬೇತಿಯನ್ನು ಪ್ರಾರಂಭಿಸಬಹುದು!
### 2.4 ಕಡಿಮೆ ಕೋಡ್/ಕೋಡ್ ಇಲ್ಲದ ತರಬೇತಿ AutoML ಮೂಲಕ
ಪಾರಂಪರಿಕ ಯಂತ್ರ ಕಲಿಕೆ ಮಾದರಿ ಅಭಿವೃದ್ಧಿ ಸಂಪನ್ಮೂಲ-ತೀವ್ರ, ಮಹತ್ವದ ಕ್ಷೇತ್ರ ಜ್ಞಾನ ಮತ್ತು ಸಮಯವನ್ನು ಅಗತ್ಯವಿದೆ ಮತ್ತು ಅನೇಕ ಮಾದರಿಗಳನ್ನು ಉತ್ಪಾದಿಸಿ ಹೋಲಿಸಲು ಬೇಕಾಗುತ್ತದೆ.
ಸ್ವಯಂಚಾಲಿತ ಯಂತ್ರ ಕಲಿಕೆ (AutoML) ಎಂದರೆ ಯಂತ್ರ ಕಲಿಕೆ ಮಾದರಿ ಅಭಿವೃದ್ಧಿಯ ಸಮಯ-ತೀವ್ರ, ಪುನರಾವರ್ತಿತ ಕಾರ್ಯಗಳನ್ನು ಸ್ವಯಂಚಾಲಿತಗೊಳಿಸುವ ಪ್ರಕ್ರಿಯೆ. ಇದು ಡೇಟಾ ವಿಜ್ಞಾನಿಗಳು, ವಿಶ್ಲೇಷಕರು ಮತ್ತು ಅಭಿವೃದ್ಧಿಪಡಿಸುವವರಿಗೆ ಹೆಚ್ಚಿನ ಪ್ರಮಾಣ, ಕಾರ್ಯಕ್ಷಮತೆ ಮತ್ತು ಉತ್ಪಾದಕತೆ ಜೊತೆಗೆ ML ಮಾದರಿಗಳನ್ನು ನಿರ್ಮಿಸಲು ಅನುಮತಿಸುತ್ತದೆ, ಮತ್ತು ಮಾದರಿ ಗುಣಮಟ್ಟವನ್ನು ಕಾಪಾಡುತ್ತದೆ. ಇದು ಉತ್ಪಾದನೆಗೆ ಸಿದ್ಧ ML ಮಾದರಿಗಳನ್ನು ಪಡೆಯಲು ಬೇಕಾದ ಸಮಯವನ್ನು ಕಡಿಮೆ ಮಾಡುತ್ತದೆ, ಸುಲಭ ಮತ್ತು ಪರಿಣಾಮಕಾರಿಯಾಗಿ. [ಹೆಚ್ಚು ತಿಳಿಯಿರಿ](https://docs.microsoft.com/azure/machine-learning/concept-automated-ml?WT.mc_id=academic-77958-bethanycheum&ocid=AID3041109)
1. ನಾವು ಮೊದಲು ರಚಿಸಿದ [ಅಜೂರ್ ML ವರ್ಕ್‌ಸ್ಪೇಸ್](https://ml.azure.com/) ನಲ್ಲಿ ಎಡ ಮೆನುದಲ್ಲಿ "Automated ML" ಕ್ಲಿಕ್ ಮಾಡಿ ಮತ್ತು ನೀವು appena ಅಪ್‌ಲೋಡ್ ಮಾಡಿದ ಡೇಟಾಸೆಟ್ ಆಯ್ಕೆಮಾಡಿ. ಮುಂದಿನ ಬಟನ್ ಕ್ಲಿಕ್ ಮಾಡಿ.
![27](../../../../translated_images/aml-1.67281a85d3a1e2f34eb367b2d0f74e1039d13396e510f363cd8766632106d1ec.kn.png)
2. ಹೊಸ ಪ್ರಯೋಗದ ಹೆಸರು, ಗುರಿ ಕಾಲಮ್ (DEATH_EVENT) ಮತ್ತು ನಾವು ರಚಿಸಿದ ಗಣನೆ ಕ್ಲಸ್ಟರ್ ನಮೂದಿಸಿ. ಮುಂದಿನ ಬಟನ್ ಕ್ಲಿಕ್ ಮಾಡಿ.
![28](../../../../translated_images/aml-2.c9fb9cffb39ccbbe21ab9810ae937195d41a489744e15cff2b8477ed4dcae1ec.kn.png)
3. "Classification" ಆಯ್ಕೆ ಮಾಡಿ ಮತ್ತು Finish ಕ್ಲಿಕ್ ಮಾಡಿ. ಈ ಹಂತವು ನಿಮ್ಮ ಗಣನೆ ಕ್ಲಸ್ಟರ್ ಗಾತ್ರದ ಮೇಲೆ ಅವಲಂಬಿತವಾಗಿ 30 ನಿಮಿಷದಿಂದ 1 ಗಂಟೆ ತೆಗೆದುಕೊಳ್ಳಬಹುದು.
![30](../../../../translated_images/aml-3.a7952e4295f38cc6cdb0c7ed6dc71ea756b7fb5697ec126bc1220f87c5fa9231.kn.png)
4. ರನ್ ಪೂರ್ಣಗೊಂಡ ನಂತರ, "Automated ML" ಟ್ಯಾಬ್ ಕ್ಲಿಕ್ ಮಾಡಿ, ನಿಮ್ಮ ರನ್ ಕ್ಲಿಕ್ ಮಾಡಿ, ಮತ್ತು "Best model summary" ಕಾರ್ಡ್‌ನಲ್ಲಿನ ಆಲ್ಗೋರಿದಮ್ ಕ್ಲಿಕ್ ಮಾಡಿ.
![31](../../../../translated_images/aml-4.7a627e09cb6f16d0aa246059d9faee3d1725cc4258d0c8df15e801f73afc7e2c.kn.png)
ಇಲ್ಲಿ ನೀವು AutoML ರಚಿಸಿದ ಅತ್ಯುತ್ತಮ ಮಾದರಿಯ ವಿವರವಾದ ವಿವರಣೆಯನ್ನು ನೋಡಬಹುದು. ನೀವು ಮಾದರಿಗಳ ಟ್ಯಾಬ್‌ನಲ್ಲಿ ಇತರ ಮಾದರಿಗಳನ್ನು ಸಹ ಅನ್ವೇಷಿಸಬಹುದು. ವಿವರಣೆಗಳಲ್ಲಿ (ಪೂರ್ವವೀಕ್ಷಣಾ ಬಟನ್) ಕೆಲವು ನಿಮಿಷಗಳನ್ನು ತೆಗೆದು ಮಾದರಿಗಳನ್ನು ಪರಿಶೀಲಿಸಿ. ನೀವು ಬಳಸಲು ಬಯಸುವ ಮಾದರಿಯನ್ನು ಆಯ್ಕೆಮಾಡಿದ ನಂತರ (ಇಲ್ಲಿ ನಾವು AutoML ಆಯ್ಕೆಮಾಡಿದ ಅತ್ಯುತ್ತಮ ಮಾದರಿಯನ್ನು ಆಯ್ಕೆಮಾಡುತ್ತೇವೆ), ನಾವು ಅದನ್ನು ಹೇಗೆ ನಿಯೋಜಿಸಬಹುದು ಎಂದು ನೋಡೋಣ.
## 3. ಕಡಿಮೆ ಕೋಡ್/ಕೋಡ್ ಇಲ್ಲದ ಮಾದರಿ ನಿಯೋಜನೆ ಮತ್ತು ಎಂಡ್ಪಾಯಿಂಟ್ ಬಳಕೆ
### 3.1 ಮಾದರಿ ನಿಯೋಜನೆ
ಸ್ವಯಂಚಾಲಿತ ಯಂತ್ರ ಕಲಿಕೆ ಇಂಟರ್ಫೇಸ್ ನಿಮಗೆ ಅತ್ಯುತ್ತಮ ಮಾದರಿಯನ್ನು ವೆಬ್ ಸೇವೆಯಾಗಿ ಕೆಲವು ಹಂತಗಳಲ್ಲಿ ನಿಯೋಜಿಸಲು ಅನುಮತಿಸುತ್ತದೆ. ನಿಯೋಜನೆ ಎಂದರೆ ಮಾದರಿಯನ್ನು ಸಂಯೋಜಿಸುವುದು, ಅದು ಹೊಸ ಡೇಟಾದ ಆಧಾರದ ಮೇಲೆ ಭವಿಷ್ಯವಾಣಿಗಳನ್ನು ಮಾಡಬಹುದು ಮತ್ತು ಸಾಧ್ಯತೆಗಳ ಪ್ರದೇಶಗಳನ್ನು ಗುರುತಿಸಬಹುದು. ಈ ಯೋಜನೆಗಾಗಿ, ವೆಬ್ ಸೇವೆಗೆ ನಿಯೋಜನೆ ಎಂದರೆ ವೈದ್ಯಕೀಯ ಅಪ್ಲಿಕೇಶನ್‌ಗಳು ಮಾದರಿಯನ್ನು ಬಳಸಿ ತಮ್ಮ ರೋಗಿಗಳ ಹೃದಯಾಘಾತದ ಅಪಾಯವನ್ನು ನೇರವಾಗಿ ಭವಿಷ್ಯವಾಣಿ ಮಾಡಲು ಸಾಧ್ಯವಾಗುತ್ತದೆ.
ಅತ್ಯುತ್ತಮ ಮಾದರಿ ವಿವರಣೆಯಲ್ಲಿ, "Deploy" ಬಟನ್ ಕ್ಲಿಕ್ ಮಾಡಿ.
![deploy-1](../../../../translated_images/deploy-1.ddad725acadc84e34553c3d09e727160faeb32527a9fb8b904c0f99235a34bb6.kn.png)
15. ಅದಕ್ಕೆ ಹೆಸರು, ವಿವರಣೆ, ಗಣನೆ ಪ್ರಕಾರ (Azure Container Instance), ಪ್ರಮಾಣೀಕರಣ ಸಕ್ರಿಯಗೊಳಿಸಿ ಮತ್ತು Deploy ಕ್ಲಿಕ್ ಮಾಡಿ. ಈ ಹಂತವು ಪೂರ್ಣಗೊಳ್ಳಲು ಸುಮಾರು 20 ನಿಮಿಷ ತೆಗೆದುಕೊಳ್ಳಬಹುದು. ನಿಯೋಜನೆ ಪ್ರಕ್ರಿಯೆಯಲ್ಲಿ ಮಾದರಿಯನ್ನು ನೋಂದಾಯಿಸುವುದು, ಸಂಪನ್ಮೂಲಗಳನ್ನು ರಚಿಸುವುದು ಮತ್ತು ಅವುಗಳನ್ನು ವೆಬ್ ಸೇವೆಗೆ ಸಂರಚಿಸುವುದು ಸೇರಿವೆ. Deploy ಸ್ಥಿತಿಯಡಿ ಸ್ಥಿತಿ ಸಂದೇಶ ಕಾಣಿಸುತ್ತದೆ. ನಿಯೋಜನೆ ಸ್ಥಿತಿಯನ್ನು ಪರಿಶೀಲಿಸಲು Refresh periodically ಆಯ್ಕೆಮಾಡಿ. ಸ್ಥಿತಿ "Healthy" ಆಗಿದ್ದಾಗ ಅದು ನಿಯೋಜಿತ ಮತ್ತು ಚಾಲನೆಯಲ್ಲಿ ಇದೆ.
![deploy-2](../../../../translated_images/deploy-2.94dbb13f239086473aa4bf814342fd40483d136849b080f02bafbb995383940e.kn.png)
16. ನಿಯೋಜನೆಯಾದ ನಂತರ, Endpoint ಟ್ಯಾಬ್ ಕ್ಲಿಕ್ ಮಾಡಿ ಮತ್ತು ನೀವು appena ನಿಯೋಜಿಸಿದ ಎಂಡ್ಪಾಯಿಂಟ್ ಕ್ಲಿಕ್ ಮಾಡಿ. ಇಲ್ಲಿ ನೀವು ಎಂಡ್ಪಾಯಿಂಟ್ ಬಗ್ಗೆ ಬೇಕಾದ ಎಲ್ಲಾ ವಿವರಗಳನ್ನು ಕಾಣಬಹುದು.
![deploy-3](../../../../translated_images/deploy-3.fecefef070e8ef3b28e802326d107f61ac4e672d20bf82d05f78d025f9e6c611.kn.png)
ಅದ್ಭುತ! ಈಗ ನಮಗೆ ಮಾದರಿ ನಿಯೋಜಿಸಲಾಗಿದೆ, ನಾವು ಎಂಡ್ಪಾಯಿಂಟ್ ಬಳಕೆಯನ್ನು ಪ್ರಾರಂಭಿಸಬಹುದು.
### 3.2 ಎಂಡ್ಪಾಯಿಂಟ್ ಬಳಕೆ
"Consume" ಟ್ಯಾಬ್ ಕ್ಲಿಕ್ ಮಾಡಿ. ಇಲ್ಲಿ ನೀವು REST ಎಂಡ್ಪಾಯಿಂಟ್ ಮತ್ತು ಪೈಥಾನ್ ಸ್ಕ್ರಿಪ್ಟ್ ಅನ್ನು ಬಳಕೆ ಆಯ್ಕೆಯಲ್ಲಿ ಕಾಣಬಹುದು. ಪೈಥಾನ್ ಕೋಡ್ ಓದಲು ಸ್ವಲ್ಪ ಸಮಯ ತೆಗೆದುಕೊಳ್ಳಿ.
ಈ ಸ್ಕ್ರಿಪ್ಟ್ ನೇರವಾಗಿ ನಿಮ್ಮ ಸ್ಥಳೀಯ ಯಂತ್ರದಿಂದ ಚಾಲನೆ ಮಾಡಬಹುದು ಮತ್ತು ನಿಮ್ಮ ಎಂಡ್ಪಾಯಿಂಟ್ ಅನ್ನು ಬಳಕೆ ಮಾಡುತ್ತದೆ.
![35](../../../../translated_images/consumption-1.700abd196452842a020c7d745908637a6e4c5c50494ad1217be80e283e0de154.kn.png)
ಆ ಎರಡು ಸಾಲುಗಳ ಕೋಡ್ ಪರಿಶೀಲಿಸಲು ಒಂದು ಕ್ಷಣ ತೆಗೆದುಕೊಳ್ಳಿ:
```python
url = 'http://98e3715f-xxxx-xxxx-xxxx-9ec22d57b796.centralus.azurecontainer.io/score'
api_key = '' # ವೆಬ್ ಸೇವೆಯ API ಕೀಲಿಯನ್ನು ಇದರಿಂದ ಬದಲಾಯಿಸಿ
```
`url` ಚರವು REST ಎಂಡ್ಪಾಯಿಂಟ್ ಆಗಿದ್ದು consume ಟ್ಯಾಬ್‌ನಲ್ಲಿ ಕಂಡುಬರುತ್ತದೆ ಮತ್ತು `api_key` ಚರವು ಪ್ರಾಥಮಿಕ ಕೀ ಆಗಿದ್ದು consume ಟ್ಯಾಬ್‌ನಲ್ಲಿ (ನೀವು ಪ್ರಮಾಣೀಕರಣ ಸಕ್ರಿಯಗೊಳಿಸಿದ್ದರೆ ಮಾತ್ರ) ಕಂಡುಬರುತ್ತದೆ. ಈ ರೀತಿಯಾಗಿ ಸ್ಕ್ರಿಪ್ಟ್ ಎಂಡ್ಪಾಯಿಂಟ್ ಅನ್ನು ಬಳಕೆ ಮಾಡಬಹುದು.
18. ಸ್ಕ್ರಿಪ್ಟ್ ಚಾಲನೆ ಮಾಡಿದಾಗ, ನೀವು ಕೆಳಗಿನ ಔಟ್‌ಪುಟ್ ನೋಡಬಹುದು:
```python
b'"{\\"result\\": [true]}"'
```
ಇದು ನೀಡಲಾದ ಡೇಟಾದ ಹೃದಯ ವೈಫಲ್ಯದ ಭವಿಷ್ಯವಾಣಿ ಸತ್ಯವಾಗಿದೆ ಎಂದು ಅರ್ಥ. ಇದು ಅರ್ಥಪೂರ್ಣ, ಏಕೆಂದರೆ ನೀವು ಸ್ಕ್ರಿಪ್ಟ್‌ನಲ್ಲಿ ಸ್ವಯಂಚಾಲಿತವಾಗಿ ರಚಿಸಲಾದ ಡೇಟಾವನ್ನು ಹೆಚ್ಚು ಗಮನಿಸಿದರೆ, ಎಲ್ಲವೂ ಡೀಫಾಲ್ಟ್ ಆಗಿ 0 ಮತ್ತು ತಪ್ಪು ಆಗಿವೆ. ನೀವು ಕೆಳಗಿನ ಇನ್‌ಪುಟ್ ಮಾದರಿಯನ್ನು ಬಳಸಿ ಡೇಟಾವನ್ನು ಬದಲಾಯಿಸಬಹುದು:
```python
data = {
"data":
[
{
'age': "0",
'anaemia': "false",
'creatinine_phosphokinase': "0",
'diabetes': "false",
'ejection_fraction': "0",
'high_blood_pressure': "false",
'platelets': "0",
'serum_creatinine': "0",
'serum_sodium': "0",
'sex': "false",
'smoking': "false",
'time': "0",
},
{
'age': "60",
'anaemia': "false",
'creatinine_phosphokinase': "500",
'diabetes': "false",
'ejection_fraction': "38",
'high_blood_pressure': "false",
'platelets': "260000",
'serum_creatinine': "1.40",
'serum_sodium': "137",
'sex': "false",
'smoking': "false",
'time': "130",
},
],
}
```
ಸ್ಕ್ರಿಪ್ಟ್ ಹೀಗೆ ಪ್ರತಿಕ್ರಿಯಿಸಬೇಕು:
```python
b'"{\\"result\\": [true, false]}"'
```
ಅಭಿನಂದನೆಗಳು! ನೀವು appena ನಿಯೋಜಿಸಿದ ಮತ್ತು ಅಜೂರ್ ML ನಲ್ಲಿ ತರಬೇತುದಾರ ಮಾದರಿಯನ್ನು ಬಳಕೆ ಮಾಡಿದ್ದೀರಿ!
> **_ಗಮನಿಸಿ:_** ಯೋಜನೆ ಮುಗಿದ ನಂತರ, ಎಲ್ಲಾ ಸಂಪನ್ಮೂಲಗಳನ್ನು ಅಳಿಸುವುದನ್ನು ಮರೆತಬೇಡಿ.
## 🚀 ಸವಾಲು
AutoML ರಚಿಸಿದ ಶ್ರೇಷ್ಠ ಮಾದರಿಗಳ ವಿವರಣೆಗಳು ಮತ್ತು ವಿವರಗಳನ್ನು ಗಮನದಿಂದ ನೋಡಿ. ಶ್ರೇಷ್ಠ ಮಾದರಿ ಇತರ ಮಾದರಿಗಳಿಗಿಂತ ಉತ್ತಮವಾಗಿರುವ ಕಾರಣವನ್ನು ಅರ್ಥಮಾಡಿಕೊಳ್ಳಲು ಪ್ರಯತ್ನಿಸಿ. ಯಾವ ಆಲ್ಗೋರಿದಮ್‌ಗಳನ್ನು ಹೋಲಿಸಲಾಗಿದೆ? ಅವುಗಳ ನಡುವಿನ ವ್ಯತ್ಯಾಸಗಳು ಏನು? ಈ ಪ್ರಕರಣದಲ್ಲಿ ಶ್ರೇಷ್ಠ ಮಾದರಿ ಉತ್ತಮವಾಗಿ ಕಾರ್ಯನಿರ್ವಹಿಸುವ ಕಾರಣವೇನು?
## [ಪೋಸ್ಟ್-ಲೆಕ್ಚರ್ ಕ್ವಿಜ್](https://ff-quizzes.netlify.app/en/ds/quiz/35)
## ವಿಮರ್ಶೆ ಮತ್ತು ಸ್ವಯಂ ಅಧ್ಯಯನ
ಈ ಪಾಠದಲ್ಲಿ, ನೀವು ಕಡಿಮೆ ಕೋಡ್/ಕೋಡ್ ಇಲ್ಲದ ರೀತಿಯಲ್ಲಿ ಹೃದಯ ವೈಫಲ್ಯದ ಅಪಾಯವನ್ನು ಭವಿಷ್ಯವಾಣಿ ಮಾಡಲು ಮಾದರಿಯನ್ನು ತರಬೇತು, ನಿಯೋಜಿಸಿ ಮತ್ತು ಬಳಕೆ ಮಾಡುವುದು ಹೇಗೆ ಎಂಬುದನ್ನು ಕಲಿತಿರಿ. ನೀವು ಇನ್ನೂ ಮಾಡದಿದ್ದರೆ, AutoML ರಚಿಸಿದ ಶ್ರೇಷ್ಠ ಮಾದರಿಗಳ ವಿವರಣೆಗಳನ್ನು ಆಳವಾಗಿ ಅಧ್ಯಯನ ಮಾಡಿ ಮತ್ತು ಶ್ರೇಷ್ಠ ಮಾದರಿ ಇತರ ಮಾದರಿಗಳಿಗಿಂತ ಉತ್ತಮವಾಗಿರುವ ಕಾರಣವನ್ನು ಅರ್ಥಮಾಡಿಕೊಳ್ಳಿ.
ನೀವು ಈ [ಡಾಕ್ಯುಮೆಂಟೇಶನ್](https://docs.microsoft.com/azure/machine-learning/tutorial-first-experiment-automated-ml?WT.mc_id=academic-77958-bethanycheum&ocid=AID3041109) ಓದಿ ಕಡಿಮೆ ಕೋಡ್/ಕೋಡ್ ಇಲ್ಲದ AutoML ಬಗ್ಗೆ ಇನ್ನಷ್ಟು ತಿಳಿದುಕೊಳ್ಳಬಹುದು.
## ಹುದ್ದೆ
[ಅಜೂರ್ ML ನಲ್ಲಿ ಕಡಿಮೆ ಕೋಡ್/ಕೋಡ್ ಇಲ್ಲದ ಡೇಟಾ ಸೈನ್ಸ್ ಯೋಜನೆ](assignment.md)
---
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
**ಅಸ್ವೀಕರಣ**:
ಈ ದಸ್ತಾವೇಜು AI ಅನುವಾದ ಸೇವೆ [Co-op Translator](https://github.com/Azure/co-op-translator) ಬಳಸಿ ಅನುವಾದಿಸಲಾಗಿದೆ. ನಾವು ನಿಖರತೆಯಿಗಾಗಿ ಪ್ರಯತ್ನಿಸುತ್ತಿದ್ದರೂ, ಸ್ವಯಂಚಾಲಿತ ಅನುವಾದಗಳಲ್ಲಿ ದೋಷಗಳು ಅಥವಾ ಅಸತ್ಯತೆಗಳು ಇರಬಹುದು ಎಂದು ದಯವಿಟ್ಟು ಗಮನಿಸಿ. ಮೂಲ ಭಾಷೆಯಲ್ಲಿರುವ ಮೂಲ ದಸ್ತಾವೇಜನ್ನು ಅಧಿಕೃತ ಮೂಲವೆಂದು ಪರಿಗಣಿಸಬೇಕು. ಮಹತ್ವದ ಮಾಹಿತಿಗಾಗಿ, ವೃತ್ತಿಪರ ಮಾನವ ಅನುವಾದವನ್ನು ಶಿಫಾರಸು ಮಾಡಲಾಗುತ್ತದೆ. ಈ ಅನುವಾದ ಬಳಕೆಯಿಂದ ಉಂಟಾಗುವ ಯಾವುದೇ ತಪ್ಪು ಅರ್ಥಮಾಡಿಕೊಳ್ಳುವಿಕೆ ಅಥವಾ ತಪ್ಪು ವಿವರಣೆಗಳಿಗೆ ನಾವು ಹೊಣೆಗಾರರಾಗುವುದಿಲ್ಲ.
<!-- CO-OP TRANSLATOR DISCLAIMER END -->

@ -0,0 +1,27 @@
<!--
CO_OP_TRANSLATOR_METADATA:
{
"original_hash": "8fdc4a5fd9bc27a8d2ebef995dfbf73f",
"translation_date": "2025-12-19T15:04:10+00:00",
"source_file": "5-Data-Science-In-Cloud/18-Low-Code/assignment.md",
"language_code": "kn"
}
-->
# ಕಡಿಮೆ ಕೋಡ್/ಕೋಡ್ ಇಲ್ಲದ ಡೇಟಾ ಸೈನ್ಸ್ ಪ್ರಾಜೆಕ್ಟ್ ಆನ್ ಅಜೂರ್ ಎಂಎಲ್
## ಸೂಚನೆಗಳು
ನಾವು ಅಜೂರ್ ಎಂಎಲ್ ವೇದಿಕೆಯನ್ನು ಕಡಿಮೆ ಕೋಡ್/ಕೋಡ್ ಇಲ್ಲದ ರೀತಿಯಲ್ಲಿ ಮಾದರಿಯನ್ನು ತರಬೇತಿ, ನಿಯೋಜನೆ ಮತ್ತು ಬಳಕೆ ಮಾಡುವುದನ್ನು ಹೇಗೆ ಮಾಡುವುದು ಎಂದು ನೋಡಿದೆವು. ಈಗ ನೀವು ಇನ್ನೊಂದು ಮಾದರಿಯನ್ನು ತರಬೇತಿ ಮಾಡಲು, ನಿಯೋಜಿಸಲು ಮತ್ತು ಬಳಸಲು ಬಳಸಬಹುದಾದ ಕೆಲವು ಡೇಟಾವನ್ನು ಹುಡುಕಿ. ನೀವು [Kaggle](https://kaggle.com) ಮತ್ತು [Azure Open Datasets](https://azure.microsoft.com/services/open-datasets/catalog?WT.mc_id=academic-77958-bethanycheum&ocid=AID3041109) ನಲ್ಲಿ ಡೇಟಾಸೆಟ್‌ಗಳನ್ನು ಹುಡುಕಬಹುದು.
## ರೂಬ್ರಿಕ್
| ಉದಾಹರಣೀಯ | ಯೋಗ್ಯ | ಸುಧಾರಣೆಯ ಅಗತ್ಯವಿದೆ |
|-----------|----------|-------------------|
|ಡೇಟಾವನ್ನು ಅಪ್ಲೋಡ್ ಮಾಡುವಾಗ ಅಗತ್ಯವಿದ್ದರೆ ವೈಶಿಷ್ಟ್ಯದ ಪ್ರಕಾರವನ್ನು ಬದಲಾಯಿಸುವುದನ್ನು ನೀವು ಗಮನಿಸಿದ್ದೀರಿ. ಅಗತ್ಯವಿದ್ದರೆ ಡೇಟಾವನ್ನು ನೀವು ಶುದ್ಧೀಕರಿಸಿದ್ದೀರಿ. ನೀವು AutoML ಮೂಲಕ ಡೇಟಾಸೆಟ್‌ನಲ್ಲಿ ತರಬೇತಿ ನಡೆಸಿದ್ದೀರಿ ಮತ್ತು ಮಾದರಿ ವಿವರಣೆಗಳನ್ನು ಪರಿಶೀಲಿಸಿದ್ದೀರಿ. ನೀವು ಅತ್ಯುತ್ತಮ ಮಾದರಿಯನ್ನು ನಿಯೋಜಿಸಿದ್ದೀರಿ ಮತ್ತು ಅದನ್ನು ಬಳಸಲು ಸಾಧ್ಯವಾಯಿತು. |ಡೇಟಾವನ್ನು ಅಪ್ಲೋಡ್ ಮಾಡುವಾಗ ಅಗತ್ಯವಿದ್ದರೆ ವೈಶಿಷ್ಟ್ಯದ ಪ್ರಕಾರವನ್ನು ಬದಲಾಯಿಸುವುದನ್ನು ನೀವು ಗಮನಿಸಿದ್ದೀರಿ. ನೀವು AutoML ಮೂಲಕ ಡೇಟಾಸೆಟ್‌ನಲ್ಲಿ ತರಬೇತಿ ನಡೆಸಿದ್ದೀರಿ, ಅತ್ಯುತ್ತಮ ಮಾದರಿಯನ್ನು ನಿಯೋಜಿಸಿದ್ದೀರಿ ಮತ್ತು ಅದನ್ನು ಬಳಸಲು ಸಾಧ್ಯವಾಯಿತು. |ನೀವು AutoML ಮೂಲಕ ತರಬೇತಿಗೊಂಡ ಅತ್ಯುತ್ತಮ ಮಾದರಿಯನ್ನು ನಿಯೋಜಿಸಿದ್ದೀರಿ ಮತ್ತು ಅದನ್ನು ಬಳಸಲು ಸಾಧ್ಯವಾಯಿತು. |
---
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
**ಅಸ್ವೀಕಾರ**:
ಈ ದಸ್ತಾವೇಜು AI ಅನುವಾದ ಸೇವೆ [Co-op Translator](https://github.com/Azure/co-op-translator) ಬಳಸಿ ಅನುವಾದಿಸಲಾಗಿದೆ. ನಾವು ನಿಖರತೆಯಿಗಾಗಿ ಪ್ರಯತ್ನಿಸುತ್ತಿದ್ದರೂ, ಸ್ವಯಂಚಾಲಿತ ಅನುವಾದಗಳಲ್ಲಿ ತಪ್ಪುಗಳು ಅಥವಾ ಅಸತ್ಯತೆಗಳು ಇರಬಹುದು ಎಂದು ದಯವಿಟ್ಟು ಗಮನಿಸಿ. ಮೂಲ ಭಾಷೆಯಲ್ಲಿರುವ ಮೂಲ ದಸ್ತಾವೇಜನ್ನು ಅಧಿಕೃತ ಮೂಲವೆಂದು ಪರಿಗಣಿಸಬೇಕು. ಪ್ರಮುಖ ಮಾಹಿತಿಗಾಗಿ, ವೃತ್ತಿಪರ ಮಾನವ ಅನುವಾದವನ್ನು ಶಿಫಾರಸು ಮಾಡಲಾಗುತ್ತದೆ. ಈ ಅನುವಾದ ಬಳಕೆಯಿಂದ ಉಂಟಾಗುವ ಯಾವುದೇ ತಪ್ಪು ಅರ್ಥಮಾಡಿಕೊಳ್ಳುವಿಕೆ ಅಥವಾ ತಪ್ಪು ವಿವರಣೆಗಳಿಗೆ ನಾವು ಹೊಣೆಗಾರರಾಗುವುದಿಲ್ಲ.
<!-- CO-OP TRANSLATOR DISCLAIMER END -->

@ -0,0 +1,325 @@
<!--
CO_OP_TRANSLATOR_METADATA:
{
"original_hash": "472d3fab1c5be50f387336e7a686dbe1",
"translation_date": "2025-12-19T14:45:41+00:00",
"source_file": "5-Data-Science-In-Cloud/19-Azure/README.md",
"language_code": "kn"
}
-->
# ಕ್ಲೌಡ್‌ನಲ್ಲಿ ಡೇಟಾ ಸೈನ್ಸ್: "ಅಜೂರ್ ಎಂಎಲ್ ಎಸ್‌ಡಿಕೆ" ವಿಧಾನ
|![ [(@sketchthedocs)](https://sketchthedocs.dev) ಅವರಿಂದ ಸ್ಕೆಚ್‌ನೋಟ್ ](../../sketchnotes/19-DataScience-Cloud.png)|
|:---:|
| ಕ್ಲೌಡ್‌ನಲ್ಲಿ ಡೇಟಾ ಸೈನ್ಸ್: ಅಜೂರ್ ಎಂಎಲ್ ಎಸ್‌ಡಿಕೆ - _[@nitya](https://twitter.com/nitya) ಅವರಿಂದ ಸ್ಕೆಚ್ನೋಟ್_ |
ವಿಷಯಗಳ ಪಟ್ಟಿಃ
- [ಕ್ಲೌಡ್‌ನಲ್ಲಿ ಡೇಟಾ ಸೈನ್ಸ್: "ಅಜೂರ್ ಎಂಎಲ್ ಎಸ್‌ಡಿಕೆ" ವಿಧಾನ](../../../../5-Data-Science-In-Cloud/19-Azure)
- [ಪೂರ್ವ-ಲೇಕ್ಚರ್ ಕ್ವಿಜ್](../../../../5-Data-Science-In-Cloud/19-Azure)
- [1. ಪರಿಚಯ](../../../../5-Data-Science-In-Cloud/19-Azure)
- [1.1 ಅಜೂರ್ ಎಂಎಲ್ ಎಸ್‌ಡಿಕೆ ಎಂದರೆ ಏನು?](../../../../5-Data-Science-In-Cloud/19-Azure)
- [1.2 ಹೃದಯ ವೈಫಲ್ಯ ಭವಿಷ್ಯವಾಣಿ ಯೋಜನೆ ಮತ್ತು ಡೇಟಾಸೆಟ್ ಪರಿಚಯ](../../../../5-Data-Science-In-Cloud/19-Azure)
- [2. ಅಜೂರ್ ಎಂಎಲ್ ಎಸ್‌ಡಿಕೆ ಬಳಸಿ ಮಾದರಿಯನ್ನು ತರಬೇತಿ ಮಾಡುವುದು](../../../../5-Data-Science-In-Cloud/19-Azure)
- [2.1 ಅಜೂರ್ ಎಂಎಲ್ ವರ್ಕ್‌ಸ್ಪೇಸ್ ರಚನೆ](../../../../5-Data-Science-In-Cloud/19-Azure)
- [2.2 ಕಂಪ್ಯೂಟ್ ಇನ್ಸ್ಟಾನ್ಸ್ ರಚನೆ](../../../../5-Data-Science-In-Cloud/19-Azure)
- [2.3 ಡೇಟಾಸೆಟ್ ಲೋಡ್ ಮಾಡುವುದು](../../../../5-Data-Science-In-Cloud/19-Azure)
- [2.4 ನೋಟ್ಬುಕ್‌ಗಳು ರಚಿಸುವುದು](../../../../5-Data-Science-In-Cloud/19-Azure)
- [2.5 ಮಾದರಿಯನ್ನು ತರಬೇತಿ ಮಾಡುವುದು](../../../../5-Data-Science-In-Cloud/19-Azure)
- [2.5.1 ವರ್ಕ್‌ಸ್ಪೇಸ್, ಪ್ರಯೋಗ, ಕಂಪ್ಯೂಟ್ ಕ್ಲಸ್ಟರ್ ಮತ್ತು ಡೇಟಾಸೆಟ್ ಸೆಟ್‌ಅಪ್](../../../../5-Data-Science-In-Cloud/19-Azure)
- [2.5.2 ಆಟೋಎಂಎಲ್ ಸಂರಚನೆ ಮತ್ತು ತರಬೇತಿ](../../../../5-Data-Science-In-Cloud/19-Azure)
- [3. ಅಜೂರ್ ಎಂಎಲ್ ಎಸ್‌ಡಿಕೆ ಬಳಸಿ ಮಾದರಿ ನಿಯೋಜನೆ ಮತ್ತು ಎಂಡ್‌ಪಾಯಿಂಟ್ ಬಳಕೆ](../../../../5-Data-Science-In-Cloud/19-Azure)
- [3.1 ಉತ್ತಮ ಮಾದರಿಯನ್ನು ಉಳಿಸುವುದು](../../../../5-Data-Science-In-Cloud/19-Azure)
- [3.2 ಮಾದರಿ ನಿಯೋಜನೆ](../../../../5-Data-Science-In-Cloud/19-Azure)
- [3.3 ಎಂಡ್‌ಪಾಯಿಂಟ್ ಬಳಕೆ](../../../../5-Data-Science-In-Cloud/19-Azure)
- [🚀 ಸವಾಲು](../../../../5-Data-Science-In-Cloud/19-Azure)
- [ಪೋಸ್ಟ್-ಲೇಕ್ಚರ್ ಕ್ವಿಜ್](../../../../5-Data-Science-In-Cloud/19-Azure)
- [ಪುನರ್ ವಿಮರ್ಶೆ ಮತ್ತು ಸ್ವಯಂ ಅಧ್ಯಯನ](../../../../5-Data-Science-In-Cloud/19-Azure)
- [ಕಾರ್ಯನಿರ್ವಹಣೆ](../../../../5-Data-Science-In-Cloud/19-Azure)
## [ಪೂರ್ವ-ಲೇಕ್ಚರ್ ಕ್ವಿಜ್](https://ff-quizzes.netlify.app/en/ds/quiz/36)
## 1. ಪರಿಚಯ
### 1.1 ಅಜೂರ್ ಎಂಎಲ್ ಎಸ್‌ಡಿಕೆ ಎಂದರೆ ಏನು?
ಡೇಟಾ ವಿಜ್ಞಾನಿಗಳು ಮತ್ತು AI ಅಭಿವೃದ್ಧಿಪಡಿಸುವವರು ಅಜೂರ್ ಮೆಷಿನ್ ಲರ್ನಿಂಗ್ ಎಸ್‌ಡಿಕೆ ಬಳಸಿ ಅಜೂರ್ ಮೆಷಿನ್ ಲರ್ನಿಂಗ್ ಸೇವೆಯೊಂದಿಗೆ ಮೆಷಿನ್ ಲರ್ನಿಂಗ್ ವರ್ಕ್‌ಫ್ಲೋಗಳನ್ನು ನಿರ್ಮಿಸಿ ಮತ್ತು ಚಾಲನೆ ಮಾಡುತ್ತಾರೆ. ನೀವು ಯಾವುದೇ ಪೈಥಾನ್ ಪರಿಸರದಲ್ಲಿ, ಜುಪೈಟರ್ ನೋಟ್ಬುಕ್‌ಗಳು, ವಿಸುಯಲ್ ಸ್ಟುಡಿಯೋ ಕೋಡ್ ಅಥವಾ ನಿಮ್ಮ ಇಷ್ಟದ ಪೈಥಾನ್ ಐಡಿಇ ಸೇರಿದಂತೆ, ಸೇವೆಯೊಂದಿಗೆ ಸಂವಹನ ಮಾಡಬಹುದು.
ಎಸ್‌ಡಿಕೆ ಪ್ರಮುಖ ಕ್ಷೇತ್ರಗಳು:
- ಮೆಷಿನ್ ಲರ್ನಿಂಗ್ ಪ್ರಯೋಗಗಳಲ್ಲಿ ಬಳಸುವ ನಿಮ್ಮ ಡೇಟಾಸೆಟ್‌ಗಳ ಜೀವನಚಕ್ರವನ್ನು ಅನ್ವೇಷಿಸಿ, ಸಿದ್ಧಪಡಿಸಿ ಮತ್ತು ನಿರ್ವಹಿಸಿ.
- ನಿಮ್ಮ ಮೆಷಿನ್ ಲರ್ನಿಂಗ್ ಪ್ರಯೋಗಗಳನ್ನು ಮೇಲ್ವಿಚಾರಣೆ, ಲಾಗಿಂಗ್ ಮತ್ತು ಸಂಘಟಿಸಲು ಕ್ಲೌಡ್ ಸಂಪನ್ಮೂಲಗಳನ್ನು ನಿರ್ವಹಿಸಿ.
- ಸ್ಥಳೀಯವಾಗಿ ಅಥವಾ GPU-ವೇಗವರ್ಧಿತ ಮಾದರಿ ತರಬೇತಿಯನ್ನು ಒಳಗೊಂಡಂತೆ ಕ್ಲೌಡ್ ಸಂಪನ್ಮೂಲಗಳನ್ನು ಬಳಸಿ ಮಾದರಿಗಳನ್ನು ತರಬೇತಿ ಮಾಡಿ.
- ಸ್ವಯಂಚಾಲಿತ ಮೆಷಿನ್ ಲರ್ನಿಂಗ್ ಬಳಸಿ, ಇದು ಸಂರಚನಾ ಪರಿಮಾಣಗಳು ಮತ್ತು ತರಬೇತಿ ಡೇಟಾವನ್ನು ಸ್ವೀಕರಿಸುತ್ತದೆ. ಇದು ಸ್ವಯಂಚಾಲಿತವಾಗಿ ಅಲ್ಗಾರಿಥಮ್‌ಗಳು ಮತ್ತು ಹೈಪರ್‌ಪ್ಯಾರಾಮೀಟರ್ ಸೆಟ್ಟಿಂಗ್‌ಗಳ ಮೂಲಕ ಸುತ್ತುತ್ತದೆ ಮತ್ತು ಭವಿಷ್ಯವಾಣಿಗೆ ಉತ್ತಮ ಮಾದರಿಯನ್ನು ಕಂಡುಹಿಡಿಯುತ್ತದೆ.
- ನಿಮ್ಮ ತರಬೇತಿಗೊಂಡ ಮಾದರಿಗಳನ್ನು RESTful ಸೇವೆಗಳಾಗಿ ಪರಿವರ್ತಿಸಿ, ಯಾವುದೇ ಅಪ್ಲಿಕೇಶನ್‌ನಲ್ಲಿ ಸೇವೆಗಳನ್ನು ಉಪಯೋಗಿಸಲು ವೆಬ್ ಸೇವೆಗಳನ್ನು ನಿಯೋಜಿಸಿ.
[ಅಜೂರ್ ಮೆಷಿನ್ ಲರ್ನಿಂಗ್ ಎಸ್‌ಡಿಕೆ ಬಗ್ಗೆ ಇನ್ನಷ್ಟು ತಿಳಿಯಿರಿ](https://docs.microsoft.com/python/api/overview/azure/ml?WT.mc_id=academic-77958-bethanycheum&ocid=AID3041109)
[ಹಿಂದಿನ ಪಾಠದಲ್ಲಿ](../18-Low-Code/README.md), ನಾವು ಕಡಿಮೆ ಕೋಡ್/ಕೋಡ್ ಇಲ್ಲದ ರೀತಿಯಲ್ಲಿ ಮಾದರಿಯನ್ನು ತರಬೇತಿ, ನಿಯೋಜನೆ ಮತ್ತು ಬಳಕೆ ಮಾಡುವುದು ಹೇಗೆ ಎಂದು ನೋಡಿದ್ದೇವೆ. ನಾವು ಹೃದಯ ವೈಫಲ್ಯ ಡೇಟಾಸೆಟ್ ಬಳಸಿ ಹೃದಯ ವೈಫಲ್ಯ ಭವಿಷ್ಯವಾಣಿ ಮಾದರಿಯನ್ನು ರಚಿಸಿದ್ದೇವೆ. ಈ ಪಾಠದಲ್ಲಿ, ನಾವು ಅದೇ ಕಾರ್ಯವನ್ನು ಅಜೂರ್ ಮೆಷಿನ್ ಲರ್ನಿಂಗ್ ಎಸ್‌ಡಿಕೆ ಬಳಸಿ ಮಾಡಲಿದ್ದೇವೆ.
![project-schema](../../../../translated_images/project-schema.420e56d495624541eaecf2b737f138c86fb7d8162bb1c0bf8783c350872ffc4d.kn.png)
### 1.2 ಹೃದಯ ವೈಫಲ್ಯ ಭವಿಷ್ಯವಾಣಿ ಯೋಜನೆ ಮತ್ತು ಡೇಟಾಸೆಟ್ ಪರಿಚಯ
ಹೃದಯ ವೈಫಲ್ಯ ಭವಿಷ್ಯವಾಣಿ ಯೋಜನೆ ಮತ್ತು ಡೇಟಾಸೆಟ್ ಪರಿಚಯವನ್ನು [ಇಲ್ಲಿ](../18-Low-Code/README.md) ಪರಿಶೀಲಿಸಿ.
## 2. ಅಜೂರ್ ಎಂಎಲ್ ಎಸ್‌ಡಿಕೆ ಬಳಸಿ ಮಾದರಿಯನ್ನು ತರಬೇತಿ ಮಾಡುವುದು
### 2.1 ಅಜೂರ್ ಎಂಎಲ್ ವರ್ಕ್‌ಸ್ಪೇಸ್ ರಚನೆ
ಸರಳತೆಗೆ, ನಾವು ಜುಪೈಟರ್ ನೋಟ್ಬುಕ್‌ನಲ್ಲಿ ಕೆಲಸ ಮಾಡಲಿದ್ದೇವೆ. ಇದರಿಂದ ನೀವು ಈಗಾಗಲೇ ವರ್ಕ್‌ಸ್ಪೇಸ್ ಮತ್ತು ಕಂಪ್ಯೂಟ್ ಇನ್ಸ್ಟಾನ್ಸ್ ಹೊಂದಿರಬೇಕು. ನೀವು ಈಗಾಗಲೇ ವರ್ಕ್‌ಸ್ಪೇಸ್ ಹೊಂದಿದ್ದರೆ, ನೇರವಾಗಿ 2.3 ನೋಟ್ಬುಕ್ ರಚನೆ ವಿಭಾಗಕ್ಕೆ ಹೋಗಬಹುದು.
ಇಲ್ಲದಿದ್ದರೆ, ದಯವಿಟ್ಟು [ಹಿಂದಿನ ಪಾಠದಲ್ಲಿ](../18-Low-Code/README.md) **2.1 ಅಜೂರ್ ಎಂಎಲ್ ವರ್ಕ್‌ಸ್ಪೇಸ್ ರಚನೆ** ವಿಭಾಗದಲ್ಲಿನ ಸೂಚನೆಗಳನ್ನು ಅನುಸರಿಸಿ ವರ್ಕ್‌ಸ್ಪೇಸ್ ರಚಿಸಿ.
### 2.2 ಕಂಪ್ಯೂಟ್ ಇನ್ಸ್ಟಾನ್ಸ್ ರಚನೆ
ನಾವು ಮೊದಲು ರಚಿಸಿದ [ಅಜೂರ್ ಎಂಎಲ್ ವರ್ಕ್‌ಸ್ಪೇಸ್](https://ml.azure.com/) ನಲ್ಲಿ, ಕಂಪ್ಯೂಟ್ ಮೆನುಗೆ ಹೋಗಿ ಲಭ್ಯವಿರುವ ವಿವಿಧ ಕಂಪ್ಯೂಟ್ ಸಂಪನ್ಮೂಲಗಳನ್ನು ನೋಡಬಹುದು
![compute-instance-1](../../../../translated_images/compute-instance-1.dba347cb199ca4996b3e3d649295ed95626ba481479d3986557b9b98e76d8816.kn.png)
ಜುಪೈಟರ್ ನೋಟ್ಬುಕ್ ಪ್ರೊವಿಷನ್ ಮಾಡಲು ಕಂಪ್ಯೂಟ್ ಇನ್ಸ್ಟಾನ್ಸ್ ರಚಿಸೋಣ.
1. + New ಬಟನ್ ಕ್ಲಿಕ್ ಮಾಡಿ.
2. ನಿಮ್ಮ ಕಂಪ್ಯೂಟ್ ಇನ್ಸ್ಟಾನ್ಸ್‌ಗೆ ಹೆಸರು ನೀಡಿ.
3. ನಿಮ್ಮ ಆಯ್ಕೆಗಳು: CPU ಅಥವಾ GPU, VM ಗಾತ್ರ ಮತ್ತು ಕೋರ್ ಸಂಖ್ಯೆ ಆಯ್ಕೆಮಾಡಿ.
4. Create ಬಟನ್ ಕ್ಲಿಕ್ ಮಾಡಿ.
ಅಭಿನಂದನೆಗಳು, ನೀವು ಕಂಪ್ಯೂಟ್ ಇನ್ಸ್ಟಾನ್ಸ್ ರಚಿಸಿದ್ದೀರಿ! ನಾವು ಈ ಕಂಪ್ಯೂಟ್ ಇನ್ಸ್ಟಾನ್ಸ್ ಅನ್ನು [ನೋಟ್ಬುಕ್ ರಚನೆ ವಿಭಾಗದಲ್ಲಿ](../../../../5-Data-Science-In-Cloud/19-Azure) ನೋಟ್ಬುಕ್ ರಚಿಸಲು ಬಳಸಲಿದ್ದೇವೆ.
### 2.3 ಡೇಟಾಸೆಟ್ ಲೋಡ್ ಮಾಡುವುದು
ನೀವು ಡೇಟಾಸೆಟ್ ಅನ್ನು ಇನ್ನೂ ಅಪ್‌ಲೋಡ್ ಮಾಡದಿದ್ದರೆ, ದಯವಿಟ್ಟು [ಹಿಂದಿನ ಪಾಠದಲ್ಲಿ](../18-Low-Code/README.md) **2.3 ಡೇಟಾಸೆಟ್ ಲೋಡ್ ಮಾಡುವುದು** ವಿಭಾಗವನ್ನು ನೋಡಿ.
### 2.4 ನೋಟ್ಬುಕ್‌ಗಳು ರಚಿಸುವುದು
> **_ಗಮನಿಸಿ:_** ಮುಂದಿನ ಹಂತಕ್ಕೆ ನೀವು ಹೊಸ ನೋಟ್ಬುಕ್ ಅನ್ನು ಶೂನ್ಯದಿಂದ ರಚಿಸಬಹುದು ಅಥವಾ ನೀವು ರಚಿಸಿದ [ನೋಟ್ಬುಕ್](notebook.ipynb) ಅನ್ನು ನಿಮ್ಮ ಅಜೂರ್ ಎಂಎಲ್ ಸ್ಟುಡಿಯೋಗೆ ಅಪ್‌ಲೋಡ್ ಮಾಡಬಹುದು. ಅದಕ್ಕಾಗಿ "Notebook" ಮೆನು ಕ್ಲಿಕ್ ಮಾಡಿ ನೋಟ್ಬುಕ್ ಅಪ್‌ಲೋಡ್ ಮಾಡಿ.
ನೋಟ್ಬುಕ್‌ಗಳು ಡೇಟಾ ಸೈನ್ಸ್ ಪ್ರಕ್ರಿಯೆಯ ಅತ್ಯಂತ ಪ್ರಮುಖ ಭಾಗ. ಅವುಗಳನ್ನು ಅನ್ವೇಷಣಾತ್ಮಕ ಡೇಟಾ ವಿಶ್ಲೇಷಣೆ (EDA) ನಡೆಸಲು, ಕಂಪ್ಯೂಟ್ ಕ್ಲಸ್ಟರ್‌ಗೆ ಕರೆ ಮಾಡಿ ಮಾದರಿಯನ್ನು ತರಬೇತಿ ಮಾಡಲು, ಇನ್ಫರೆನ್ಸ್ ಕ್ಲಸ್ಟರ್‌ಗೆ ಕರೆ ಮಾಡಿ ಎಂಡ್‌ಪಾಯಿಂಟ್ ನಿಯೋಜಿಸಲು ಬಳಸಬಹುದು.
ನೋಟ್ಬುಕ್ ರಚಿಸಲು, ಜುಪೈಟರ್ ನೋಟ್ಬುಕ್ ಇನ್ಸ್ಟಾನ್ಸ್ ಅನ್ನು ಸರ್ವ್ ಮಾಡುವ ಕಂಪ್ಯೂಟ್ ನೋಡ್ ಬೇಕು. [ಅಜೂರ್ ಎಂಎಲ್ ವರ್ಕ್‌ಸ್ಪೇಸ್](https://ml.azure.com/) ಗೆ ಹಿಂತಿರುಗಿ ಮತ್ತು Compute instances ಕ್ಲಿಕ್ ಮಾಡಿ. ಕಂಪ್ಯೂಟ್ ಇನ್ಸ್ಟಾನ್ಸ್ ಪಟ್ಟಿಯಲ್ಲಿ ನೀವು [ನಾವು ಮೊದಲು ರಚಿಸಿದ ಕಂಪ್ಯೂಟ್ ಇನ್ಸ್ಟಾನ್ಸ್](../../../../5-Data-Science-In-Cloud/19-Azure) ನೋಡಬಹುದು.
1. Applications ವಿಭಾಗದಲ್ಲಿ, Jupyter ಆಯ್ಕೆಯನ್ನು ಕ್ಲಿಕ್ ಮಾಡಿ.
2. "Yes, I understand" ಬಾಕ್ಸ್ ಟಿಕ್ ಮಾಡಿ ಮತ್ತು Continue ಬಟನ್ ಕ್ಲಿಕ್ ಮಾಡಿ.
![notebook-1](../../../../translated_images/notebook-1.12998af7b02c83f536c11b3aeba561be16e0f05e94146600728ec64270ce1105.kn.png)
3. ಇದು ನಿಮ್ಮ ಜುಪೈಟರ್ ನೋಟ್ಬುಕ್ ಇನ್ಸ್ಟಾನ್ಸ್‌ನೊಂದಿಗೆ ಹೊಸ ಬ್ರೌಸರ್ ಟ್ಯಾಬ್ ತೆರೆಯುತ್ತದೆ. ನೋಟ್ಬುಕ್ ರಚಿಸಲು "New" ಬಟನ್ ಕ್ಲಿಕ್ ಮಾಡಿ.
![notebook-2](../../../../translated_images/notebook-2.9a657c037e34f1cf26c0212f5ee9e2da8545b3e107c7682c55114e494167a8aa.kn.png)
ನಾವು ಈಗ ನೋಟ್ಬುಕ್ ಹೊಂದಿದ್ದೇವೆ, ಅಜೂರ್ ಎಂಎಲ್ ಎಸ್‌ಡಿಕೆ ಬಳಸಿ ಮಾದರಿಯನ್ನು ತರಬೇತಿ ಮಾಡಬಹುದು.
### 2.5 ಮಾದರಿಯನ್ನು ತರಬೇತಿ ಮಾಡುವುದು
ಮೊದಲು, ನೀವು ಯಾವಾಗಲಾದರೂ ಸಂಶಯ ಹೊಂದಿದರೆ, [ಅಜೂರ್ ಎಂಎಲ್ ಎಸ್‌ಡಿಕೆ ಡಾಕ್ಯುಮೆಂಟೇಶನ್](https://docs.microsoft.com/python/api/overview/azure/ml?WT.mc_id=academic-77958-bethanycheum&ocid=AID3041109) ನೋಡಿ. ಈ ಪಾಠದಲ್ಲಿ ನಾವು ನೋಡಲಿರುವ ಮೋಡ್ಯೂಲ್‌ಗಳನ್ನು ಅರ್ಥಮಾಡಿಕೊಳ್ಳಲು ಅಗತ್ಯವಿರುವ ಎಲ್ಲಾ ಮಾಹಿತಿಯನ್ನು ಇದು ಹೊಂದಿದೆ.
#### 2.5.1 ವರ್ಕ್‌ಸ್ಪೇಸ್, ಪ್ರಯೋಗ, ಕಂಪ್ಯೂಟ್ ಕ್ಲಸ್ಟರ್ ಮತ್ತು ಡೇಟಾಸೆಟ್ ಸೆಟ್‌ಅಪ್
ನೀವು ಕೆಳಗಿನ ಕೋಡ್ ಬಳಸಿ ಸಂರಚನಾ ಫೈಲ್‌ನಿಂದ `workspace` ಅನ್ನು ಲೋಡ್ ಮಾಡಬೇಕು:
```python
from azureml.core import Workspace
ws = Workspace.from_config()
```
ಇದು ವರ್ಕ್‌ಸ್ಪೇಸ್ ಅನ್ನು ಪ್ರತಿನಿಧಿಸುವ `Workspace` ಪ್ರಕಾರದ ವಸ್ತುವನ್ನು ಹಿಂತಿರುಗಿಸುತ್ತದೆ. ನಂತರ ನೀವು ಕೆಳಗಿನ ಕೋಡ್ ಬಳಸಿ `experiment` ರಚಿಸಬೇಕು:
```python
from azureml.core import Experiment
experiment_name = 'aml-experiment'
experiment = Experiment(ws, experiment_name)
```
ವರ್ಕ್‌ಸ್ಪೇಸ್‌ನಿಂದ ಪ್ರಯೋಗವನ್ನು ಪಡೆಯಲು ಅಥವಾ ರಚಿಸಲು, ನೀವು ಪ್ರಯೋಗದ ಹೆಸರನ್ನು ಬಳಸಿ ಅದನ್ನು ಕೇಳುತ್ತೀರಿ. ಪ್ರಯೋಗದ ಹೆಸರು 3-36 ಅಕ್ಷರಗಳಿರಬೇಕು, ಅಕ್ಷರ ಅಥವಾ ಸಂಖ್ಯೆಯಿಂದ ಪ್ರಾರಂಭವಾಗಬೇಕು ಮತ್ತು ಅಕ್ಷರಗಳು, ಸಂಖ್ಯೆಗಳು, ಅಂಡರ್ಸ್ಕೋರ್ ಮತ್ತು ಡ್ಯಾಶ್‌ಗಳನ್ನು ಮಾತ್ರ ಹೊಂದಿರಬಹುದು. ಪ್ರಯೋಗವು ವರ್ಕ್‌ಸ್ಪೇಸ್‌ನಲ್ಲಿ ಕಂಡುಬರದಿದ್ದರೆ, ಹೊಸ ಪ್ರಯೋಗ ರಚಿಸಲಾಗುತ್ತದೆ.
ಈಗ ನೀವು ತರಬೇತಿಗಾಗಿ ಕಂಪ್ಯೂಟ್ ಕ್ಲಸ್ಟರ್ ರಚಿಸಬೇಕು, ಕೆಳಗಿನ ಕೋಡ್ ಬಳಸಿ. ಈ ಹಂತಕ್ಕೆ ಕೆಲವು ನಿಮಿಷಗಳು ಬೇಕಾಗಬಹುದು.
```python
from azureml.core.compute import AmlCompute
aml_name = "heart-f-cluster"
try:
aml_compute = AmlCompute(ws, aml_name)
print('Found existing AML compute context.')
except:
print('Creating new AML compute context.')
aml_config = AmlCompute.provisioning_configuration(vm_size = "Standard_D2_v2", min_nodes=1, max_nodes=3)
aml_compute = AmlCompute.create(ws, name = aml_name, provisioning_configuration = aml_config)
aml_compute.wait_for_completion(show_output = True)
cts = ws.compute_targets
compute_target = cts[aml_name]
```
ನೀವು ಡೇಟಾಸೆಟ್ ಅನ್ನು ವರ್ಕ್‌ಸ್ಪೇಸ್‌ನಿಂದ ಡೇಟಾಸೆಟ್ ಹೆಸರನ್ನು ಬಳಸಿ ಕೆಳಗಿನ ರೀತಿಯಲ್ಲಿ ಪಡೆಯಬಹುದು:
```python
dataset = ws.datasets['heart-failure-records']
df = dataset.to_pandas_dataframe()
df.describe()
```
#### 2.5.2 ಆಟೋಎಂಎಲ್ ಸಂರಚನೆ ಮತ್ತು ತರಬೇತಿ
ಆಟೋಎಂಎಲ್ ಸಂರಚನೆಯನ್ನು ಸೆಟ್ ಮಾಡಲು, [AutoMLConfig ವರ್ಗ](https://docs.microsoft.com/python/api/azureml-train-automl-client/azureml.train.automl.automlconfig(class)?WT.mc_id=academic-77958-bethanycheum&ocid=AID3041109) ಬಳಸಿ.
ಡಾಕ್ಯುಮೆಂಟ್‌ನಲ್ಲಿ ವಿವರಿಸಿದಂತೆ, ನೀವು ಆಡಲು ಬಹಳಷ್ಟು ಪರಿಮಾಣಗಳಿವೆ. ಈ ಯೋಜನೆಗಾಗಿ, ನಾವು ಕೆಳಗಿನ ಪರಿಮಾಣಗಳನ್ನು ಬಳಸಲಿದ್ದೇವೆ:
- `experiment_timeout_minutes`: ಪ್ರಯೋಗವನ್ನು ಸ್ವಯಂಚಾಲಿತವಾಗಿ ನಿಲ್ಲಿಸುವ ಮೊದಲು ಅನುಮತಿಸಲಾದ ಗರಿಷ್ಠ ಸಮಯ (ನಿಮಿಷಗಳಲ್ಲಿ) ಮತ್ತು ಫಲಿತಾಂಶಗಳನ್ನು ಸ್ವಯಂಚಾಲಿತವಾಗಿ ಲಭ್ಯವಿರಿಸುವಂತೆ ಮಾಡುವುದು
- `max_concurrent_iterations`: ಪ್ರಯೋಗಕ್ಕೆ ಅನುಮತಿಸಲಾದ ಗರಿಷ್ಠ ಸಮಕಾಲೀನ ತರಬೇತಿ ಪುನರಾವೃತ್ತಿಗಳ ಸಂಖ್ಯೆ
- `primary_metric`: ಪ್ರಯೋಗದ ಸ್ಥಿತಿಯನ್ನು ನಿರ್ಧರಿಸಲು ಬಳಸುವ ಪ್ರಾಥಮಿಕ ಮಿತಿ
- `compute_target`: ಆಟೋಮೇಟೆಡ್ ಮೆಷಿನ್ ಲರ್ನಿಂಗ್ ಪ್ರಯೋಗವನ್ನು ನಡೆಸಲು ಅಜೂರ್ ಮೆಷಿನ್ ಲರ್ನಿಂಗ್ ಕಂಪ್ಯೂಟ್ ಗುರಿ
- `task`: ನಡೆಸಬೇಕಾದ ಕಾರ್ಯದ ಪ್ರಕಾರ. ಮೌಲ್ಯಗಳು 'classification', 'regression', ಅಥವಾ 'forecasting' ಆಗಿರಬಹುದು, ಆಟೋಎಂಎಲ್ ಸಮಸ್ಯೆಯ ಪ್ರಕಾರ
- `training_data`: ಪ್ರಯೋಗದಲ್ಲಿ ಬಳಸುವ ತರಬೇತಿ ಡೇಟಾ. ಇದರಲ್ಲಿ ತರಬೇತಿ ವೈಶಿಷ್ಟ್ಯಗಳು ಮತ್ತು ಲೇಬಲ್ ಕಾಲಮ್ (ಐಚ್ಛಿಕವಾಗಿ ಸ್ಯಾಂಪಲ್ ತೂಕಗಳ ಕಾಲಮ್) ಇರಬೇಕು
- `label_column_name`: ಲೇಬಲ್ ಕಾಲಮ್ ಹೆಸರು
- `path`: ಅಜೂರ್ ಮೆಷಿನ್ ಲರ್ನಿಂಗ್ ಯೋಜನೆ ಫೋಲ್ಡರ್‌ಗೆ ಪೂರ್ಣ ಮಾರ್ಗ
- `enable_early_stopping`: ಸ್ಕೋರ್ ಕಡಿಮೆ ಆಗುತ್ತಿರುವಾಗ ಮುಂಚಿತವಾಗಿ ನಿಲ್ಲಿಸುವುದನ್ನು ಸಕ್ರಿಯಗೊಳಿಸುವುದು
- `featurization`: ಫೀಚರೈಜೆಷನ್ ಹಂತವನ್ನು ಸ್ವಯಂಚಾಲಿತವಾಗಿ ಮಾಡಬೇಕೇ ಅಥವಾ ಕಸ್ಟಮೈಸ್ ಮಾಡಬೇಕೇ ಎಂಬ ಸೂಚಕ
- `debug_log`: ಡಿಬಗ್ ಮಾಹಿತಿಯನ್ನು ಬರೆಯಲು ಲಾಗ್ ಫೈಲ್
```python
from azureml.train.automl import AutoMLConfig
project_folder = './aml-project'
automl_settings = {
"experiment_timeout_minutes": 20,
"max_concurrent_iterations": 3,
"primary_metric" : 'AUC_weighted'
}
automl_config = AutoMLConfig(compute_target=compute_target,
task = "classification",
training_data=dataset,
label_column_name="DEATH_EVENT",
path = project_folder,
enable_early_stopping= True,
featurization= 'auto',
debug_log = "automl_errors.log",
**automl_settings
)
```
ನೀವು ನಿಮ್ಮ ಸಂರಚನೆಯನ್ನು ಸೆಟ್ ಮಾಡಿದ ನಂತರ, ಕೆಳಗಿನ ಕೋಡ್ ಬಳಸಿ ಮಾದರಿಯನ್ನು ತರಬೇತಿ ಮಾಡಬಹುದು. ನಿಮ್ಮ ಕ್ಲಸ್ಟರ್ ಗಾತ್ರದ ಮೇಲೆ ಅವಲಂಬಿಸಿ ಈ ಹಂತಕ್ಕೆ ಒಂದು ಗಂಟೆವರೆಗೂ ಸಮಯ ಬೇಕಾಗಬಹುದು.
```python
remote_run = experiment.submit(automl_config)
```
ನೀವು RunDetails ವಿಗೆಟ್ ಅನ್ನು ಚಾಲನೆ ಮಾಡಿ ವಿವಿಧ ಪ್ರಯೋಗಗಳನ್ನು ತೋರಿಸಬಹುದು.
```python
from azureml.widgets import RunDetails
RunDetails(remote_run).show()
```
## 3. ಅಜೂರ್ ಎಂಎಲ್ ಎಸ್‌ಡಿಕೆ ಬಳಸಿ ಮಾದರಿ ನಿಯೋಜನೆ ಮತ್ತು ಎಂಡ್‌ಪಾಯಿಂಟ್ ಬಳಕೆ
### 3.1 ಉತ್ತಮ ಮಾದರಿಯನ್ನು ಉಳಿಸುವುದು
`remote_run` ಒಂದು [AutoMLRun](https://docs.microsoft.com/python/api/azureml-train-automl-client/azureml.train.automl.run.automlrun?WT.mc_id=academic-77958-bethanycheum&ocid=AID3041109) ಪ್ರಕಾರದ ವಸ್ತು. ಈ ವಸ್ತುವಿನಲ್ಲಿ `get_output()` ವಿಧಾನವಿದೆ, ಇದು ಉತ್ತಮ ರನ್ ಮತ್ತು ಸಂಬಂಧಿತ ಫಿಟ್ ಮಾಡಲಾದ ಮಾದರಿಯನ್ನು ಹಿಂತಿರುಗಿಸುತ್ತದೆ.
```python
best_run, fitted_model = remote_run.get_output()
```
ನೀವು ಉತ್ತಮ ಮಾದರಿಗಾಗಿ ಬಳಸಲಾದ ಪರಿಮಾಣಗಳನ್ನು `fitted_model` ಅನ್ನು ಮುದ್ರಿಸಿ ನೋಡಬಹುದು ಮತ್ತು ಉತ್ತಮ ಮಾದರಿಯ ಗುಣಲಕ್ಷಣಗಳನ್ನು [get_properties()](https://docs.microsoft.com/python/api/azureml-core/azureml.core.run(class)?view=azure-ml-py#azureml_core_Run_get_properties?WT.mc_id=academic-77958-bethanycheum&ocid=AID3041109) ವಿಧಾನ ಬಳಸಿ ನೋಡಬಹುದು.
```python
best_run.get_properties()
```
ಈಗ [register_model](https://docs.microsoft.com/python/api/azureml-train-automl-client/azureml.train.automl.run.automlrun?view=azure-ml-py#register-model-model-name-none--description-none--tags-none--iteration-none--metric-none-?WT.mc_id=academic-77958-bethanycheum&ocid=AID3041109) ವಿಧಾನ ಬಳಸಿ ಮಾದರಿಯನ್ನು ನೋಂದಣಿ ಮಾಡಿರಿ.
```python
model_name = best_run.properties['model_name']
script_file_name = 'inference/score.py'
best_run.download_file('outputs/scoring_file_v_1_0_0.py', 'inference/score.py')
description = "aml heart failure project sdk"
model = best_run.register_model(model_name = model_name,
model_path = './outputs/',
description = description,
tags = None)
```
### 3.2 ಮಾದರಿ ನಿಯೋಜನೆ
ಒಮ್ಮೆ ಉತ್ತಮ ಮಾದರಿ ಉಳಿಸಿದ ನಂತರ, ಅದನ್ನು [InferenceConfig](https://docs.microsoft.com/python/api/azureml-core/azureml.core.model.inferenceconfig?view=azure-ml-py?ocid=AID3041109) ವರ್ಗ ಬಳಸಿ ನಿಯೋಜಿಸಬಹುದು. InferenceConfig ನಿಯೋಜನೆಗೆ ಬಳಸುವ ಕಸ್ಟಮ್ ಪರಿಸರದ ಸಂರಚನಾ ಸೆಟ್ಟಿಂಗ್‌ಗಳನ್ನು ಪ್ರತಿನಿಧಿಸುತ್ತದೆ. [AciWebservice](https://docs.microsoft.com/python/api/azureml-core/azureml.core.webservice.aciwebservice?view=azure-ml-py) ವರ್ಗವು ಅಜೂರ್ ಕಂಟೈನರ್ ಇನ್ಸ್ಟಾನ್ಸ್‌ಗಳ ಮೇಲೆ ವೆಬ್ ಸೇವೆ ಎಂಡ್‌ಪಾಯಿಂಟ್ ಆಗಿ ನಿಯೋಜಿಸಲಾದ ಮೆಷಿನ್ ಲರ್ನಿಂಗ್ ಮಾದರಿಯನ್ನು ಪ್ರತಿನಿಧಿಸುತ್ತದೆ. ನಿಯೋಜಿಸಲಾದ ಸೇವೆ ಮಾದರಿ, ಸ್ಕ್ರಿಪ್ಟ್ ಮತ್ತು ಸಂಬಂಧಿತ ಫೈಲ್‌ಗಳಿಂದ ರಚಿಸಲಾಗುತ್ತದೆ. ಫಲಿತಾಂಶ ವೆಬ್ ಸೇವೆ ಲೋಡ್-ಬ್ಯಾಲೆನ್ಸ್ ಮಾಡಲಾದ, HTTP ಎಂಡ್‌ಪಾಯಿಂಟ್ ಮತ್ತು REST API ಆಗಿದೆ. ನೀವು ಈ API ಗೆ ಡೇಟಾ ಕಳುಹಿಸಿ, ಮಾದರಿಯಿಂದ ಭವಿಷ್ಯವಾಣಿ ಪಡೆಯಬಹುದು.
ಮಾದರಿಯನ್ನು [deploy](https://docs.microsoft.com/python/api/azureml-core/azureml.core.model(class)?view=azure-ml-py#deploy-workspace--name--models--inference-config-none--deployment-config-none--deployment-target-none--overwrite-false--show-output-false-?WT.mc_id=academic-77958-bethanycheum&ocid=AID3041109) ವಿಧಾನ ಬಳಸಿ ನಿಯೋಜಿಸಲಾಗುತ್ತದೆ.
```python
from azureml.core.model import InferenceConfig, Model
from azureml.core.webservice import AciWebservice
inference_config = InferenceConfig(entry_script=script_file_name, environment=best_run.get_environment())
aciconfig = AciWebservice.deploy_configuration(cpu_cores = 1,
memory_gb = 1,
tags = {'type': "automl-heart-failure-prediction"},
description = 'Sample service for AutoML Heart Failure Prediction')
aci_service_name = 'automl-hf-sdk'
aci_service = Model.deploy(ws, aci_service_name, [model], inference_config, aciconfig)
aci_service.wait_for_deployment(True)
print(aci_service.state)
```
ಈ ಹಂತಕ್ಕೆ ಕೆಲವು ನಿಮಿಷಗಳು ಬೇಕಾಗಬಹುದು.
### 3.3 ಎಂಡ್‌ಪಾಯಿಂಟ್ ಬಳಕೆ
ನೀವು ನಿಮ್ಮ ಎಂಡ್‌ಪಾಯಿಂಟ್ ಅನ್ನು ಉದಾಹರಣಾ ಇನ್‌ಪುಟ್ ರಚಿಸುವ ಮೂಲಕ ಬಳಕೆ ಮಾಡಬಹುದು:
```python
data = {
"data":
[
{
'age': "60",
'anaemia': "false",
'creatinine_phosphokinase': "500",
'diabetes': "false",
'ejection_fraction': "38",
'high_blood_pressure': "false",
'platelets': "260000",
'serum_creatinine': "1.40",
'serum_sodium': "137",
'sex': "false",
'smoking': "false",
'time': "130",
},
],
}
test_sample = str.encode(json.dumps(data))
```
ನಂತರ ನೀವು ಈ ಇನ್‌ಪುಟ್ ಅನ್ನು ನಿಮ್ಮ ಮಾದರಿಗೆ ಭವಿಷ್ಯವಾಣಿ ಮಾಡಲು ಕಳುಹಿಸಬಹುದು :
```python
response = aci_service.run(input_data=test_sample)
response
```
ಇದು `'{"result": [false]}'` ಅನ್ನು ಔಟ್‌ಪುಟ್ ಮಾಡಬೇಕು. ಇದರ ಅರ್ಥ ನಾವು ಎಂಡ್‌ಪಾಯಿಂಟ್‌ಗೆ ಕಳುಹಿಸಿದ ರೋಗಿಯ ಇನ್‌ಪುಟ್ ಭವಿಷ್ಯವಾಣಿ `false` ಅನ್ನು ರಚಿಸಿದೆ, ಅಂದರೆ ಈ ವ್ಯಕ್ತಿಗೆ ಹೃದಯಾಘಾತ ಸಂಭವಿಸುವ ಸಾಧ್ಯತೆ ಕಡಿಮೆ.
ಅಭಿನಂದನೆಗಳು! ನೀವು ಈಗಾಗಲೇ Azure ML SDK ಬಳಸಿ Azure ML ನಲ್ಲಿ ನಿಯೋಜಿಸಲ್ಪಟ್ಟ ಮತ್ತು ತರಬೇತುಗೊಂಡ ಮಾದರಿಯನ್ನು ಉಪಯೋಗಿಸಿದ್ದೀರಿ!
> **_ಗಮನಿಸಿ:_** ಪ್ರಾಜೆಕ್ಟ್ ಮುಗಿಸಿದ ನಂತರ, ಎಲ್ಲಾ ಸಂಪನ್ಮೂಲಗಳನ್ನು ಅಳಿಸುವುದನ್ನು ಮರೆತಬೇಡಿ.
## 🚀 ಸವಾಲು
SDK ಮೂಲಕ ನೀವು ಇನ್ನೂ ಅನೇಕ ಕಾರ್ಯಗಳನ್ನು ಮಾಡಬಹುದು, ಆದರೆ ಈ ಪಾಠದಲ್ಲಿ ಅವುಗಳೆಲ್ಲವನ್ನು ನೋಡಲು ಸಾಧ್ಯವಿಲ್ಲ. ಆದರೆ ಒಳ್ಳೆಯ ಸುದ್ದಿ ಏನೆಂದರೆ, SDK ಡಾಕ್ಯುಮೆಂಟೇಶನ್ ಅನ್ನು ಹೇಗೆ ತ್ವರಿತವಾಗಿ ಓದಿಕೊಳ್ಳುವುದು ಎಂಬುದನ್ನು ಕಲಿತರೆ, ನೀವು ಸ್ವತಃ ಬಹಳ ದೂರ ಹೋಗಬಹುದು. Azure ML SDK ಡಾಕ್ಯುಮೆಂಟೇಶನ್ ಅನ್ನು ನೋಡಿ, ಪೈಪ್‌ಲೈನ್ ರಚಿಸಲು ಅನುಮತಿಸುವ `Pipeline` ಕ್ಲಾಸ್ ಅನ್ನು ಹುಡುಕಿ. ಪೈಪ್‌ಲೈನ್ ಎಂದರೆ ಕಾರ್ಯಪ್ರವಾಹವಾಗಿ ಕಾರ್ಯಗತಗೊಳಿಸಬಹುದಾದ ಹಂತಗಳ ಸಂಗ್ರಹ.
**ಸೂಚನೆ:** [SDK ಡಾಕ್ಯುಮೆಂಟೇಶನ್](https://docs.microsoft.com/python/api/overview/azure/ml/?view=azure-ml-py?WT.mc_id=academic-77958-bethanycheum&ocid=AID3041109) ಗೆ ಹೋಗಿ, ಹುಡುಕಾಟ ಬಾರಿನಲ್ಲಿ "Pipeline" ಎಂಬ ಕೀವರ್ಡ್‌ಗಳನ್ನು ಟೈಪ್ ಮಾಡಿ. ಹುಡುಕಾಟ ಫಲಿತಾಂಶಗಳಲ್ಲಿ `azureml.pipeline.core.Pipeline` ಕ್ಲಾಸ್ ಕಾಣಿಸಿಕೊಳ್ಳಬೇಕು.
## [ಪಾಠದ ನಂತರದ ಕ್ವಿಜ್](https://ff-quizzes.netlify.app/en/ds/quiz/37)
## ವಿಮರ್ಶೆ ಮತ್ತು ಸ್ವಯಂ ಅಧ್ಯಯನ
ಈ ಪಾಠದಲ್ಲಿ, ನೀವು Azure ML SDK ಬಳಸಿ ಹೃದಯ ವೈಫಲ್ಯ ಅಪಾಯವನ್ನು ಭವಿಷ್ಯವಾಣಿ ಮಾಡಲು ಮಾದರಿಯನ್ನು ತರಬೇತುಗೊಳಿಸುವುದು, ನಿಯೋಜಿಸುವುದು ಮತ್ತು ಉಪಯೋಗಿಸುವುದನ್ನು ಕಲಿತಿರಿ. Azure ML SDK ಬಗ್ಗೆ ಹೆಚ್ಚಿನ ಮಾಹಿತಿಗಾಗಿ ಈ [ಡಾಕ್ಯುಮೆಂಟೇಶನ್](https://docs.microsoft.com/python/api/overview/azure/ml/?view=azure-ml-py?WT.mc_id=academic-77958-bethanycheum&ocid=AID3041109) ಅನ್ನು ಪರಿಶೀಲಿಸಿ. Azure ML SDK ಬಳಸಿ ನಿಮ್ಮದೇ ಮಾದರಿಯನ್ನು ರಚಿಸಲು ಪ್ರಯತ್ನಿಸಿ.
## ನಿಯೋಜನೆ
[Azure ML SDK ಬಳಸಿ ಡೇಟಾ ಸೈನ್ಸ್ ಪ್ರಾಜೆಕ್ಟ್](assignment.md)
---
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
**ಅಸ್ವೀಕರಣ**:
ಈ ದಸ್ತಾವೇಜು AI ಅನುವಾದ ಸೇವೆ [Co-op Translator](https://github.com/Azure/co-op-translator) ಬಳಸಿ ಅನುವಾದಿಸಲಾಗಿದೆ. ನಾವು ನಿಖರತೆಯಿಗಾಗಿ ಪ್ರಯತ್ನಿಸುತ್ತಿದ್ದರೂ, ಸ್ವಯಂಚಾಲಿತ ಅನುವಾದಗಳಲ್ಲಿ ದೋಷಗಳು ಅಥವಾ ಅಸತ್ಯತೆಗಳು ಇರಬಹುದು ಎಂದು ದಯವಿಟ್ಟು ಗಮನಿಸಿ. ಮೂಲ ಭಾಷೆಯಲ್ಲಿರುವ ಮೂಲ ದಸ್ತಾವೇಜನ್ನು ಅಧಿಕೃತ ಮೂಲವಾಗಿ ಪರಿಗಣಿಸಬೇಕು. ಮಹತ್ವದ ಮಾಹಿತಿಗಾಗಿ, ವೃತ್ತಿಪರ ಮಾನವ ಅನುವಾದವನ್ನು ಶಿಫಾರಸು ಮಾಡಲಾಗುತ್ತದೆ. ಈ ಅನುವಾದ ಬಳಕೆಯಿಂದ ಉಂಟಾಗುವ ಯಾವುದೇ ತಪ್ಪು ಅರ್ಥಮಾಡಿಕೊಳ್ಳುವಿಕೆ ಅಥವಾ ತಪ್ಪು ವಿವರಣೆಗಳಿಗೆ ನಾವು ಹೊಣೆಗಾರರಾಗುವುದಿಲ್ಲ.
<!-- CO-OP TRANSLATOR DISCLAIMER END -->

@ -0,0 +1,27 @@
<!--
CO_OP_TRANSLATOR_METADATA:
{
"original_hash": "386efdbc19786951341f6956247ee990",
"translation_date": "2025-12-19T14:47:52+00:00",
"source_file": "5-Data-Science-In-Cloud/19-Azure/assignment.md",
"language_code": "kn"
}
-->
# ಅಜೂರ್ ಎಂಎಲ್ ಎಸ್‌ಡಿಕೆ ಬಳಸಿ ಡೇಟಾ ಸೈನ್ಸ್ ಪ್ರಾಜೆಕ್ಟ್
## ಸೂಚನೆಗಳು
ನಾವು ಅಜೂರ್ ಎಂಎಲ್ ಪ್ಲಾಟ್‌ಫಾರ್ಮ್ ಅನ್ನು ಬಳಸಿಕೊಂಡು ಅಜೂರ್ ಎಂಎಲ್ ಎಸ್‌ಡಿಕೆ ಮೂಲಕ ಮಾದರಿಯನ್ನು ತರಬೇತಿ, ನಿಯೋಜನೆ ಮತ್ತು ಉಪಯೋಗಿಸುವ ವಿಧಾನವನ್ನು ನೋಡಿದ್ದೇವೆ. ಈಗ ನೀವು ಇನ್ನೊಂದು ಮಾದರಿಯನ್ನು ತರಬೇತಿ ಮಾಡಲು, ನಿಯೋಜಿಸಲು ಮತ್ತು ಉಪಯೋಗಿಸಲು ಬಳಸಬಹುದಾದ ಕೆಲವು ಡೇಟಾವನ್ನು ಹುಡುಕಿ. ನೀವು [Kaggle](https://kaggle.com) ಮತ್ತು [Azure Open Datasets](https://azure.microsoft.com/services/open-datasets/catalog?WT.mc_id=academic-77958-bethanycheum&ocid=AID3041109) ನಲ್ಲಿ ಡೇಟಾಸೆಟ್‌ಗಳನ್ನು ಹುಡುಕಬಹುದು.
## ರೂಬ್ರಿಕ್
| ಉದಾಹರಣೀಯ | ಸಮರ್ಪಕ | ಸುಧಾರಣೆಯ ಅಗತ್ಯವಿದೆ |
|-----------|----------|-------------------|
|AutoML ಸಂರಚನೆಯನ್ನು ಮಾಡುವಾಗ, ನೀವು SDK ಡಾಕ್ಯುಮೆಂಟೇಶನ್ ಮೂಲಕ ಯಾವ ಪ್ಯಾರಾಮೀಟರ್‌ಗಳನ್ನು ಬಳಸಬಹುದು ಎಂದು ನೋಡಿದ್ದೀರಿ. ನೀವು ಅಜೂರ್ ಎಂಎಲ್ SDK ಬಳಸಿ AutoML ಮೂಲಕ ಡೇಟಾಸೆಟ್‌ನಲ್ಲಿ ತರಬೇತಿ ನಡೆಸಿದ್ದೀರಿ ಮತ್ತು ಮಾದರಿ ವಿವರಣೆಗಳನ್ನು ಪರಿಶೀಲಿಸಿದ್ದೀರಿ. ನೀವು ಅತ್ಯುತ್ತಮ ಮಾದರಿಯನ್ನು ನಿಯೋಜಿಸಿದ್ದೀರಿ ಮತ್ತು ಅದನ್ನು ಅಜೂರ್ ಎಂಎಲ್ SDK ಮೂಲಕ ಉಪಯೋಗಿಸಲು ಸಾಧ್ಯವಾಯಿತು. | ನೀವು ಅಜೂರ್ ಎಂಎಲ್ SDK ಬಳಸಿ AutoML ಮೂಲಕ ಡೇಟಾಸೆಟ್‌ನಲ್ಲಿ ತರಬೇತಿ ನಡೆಸಿದ್ದೀರಿ ಮತ್ತು ಮಾದರಿ ವಿವರಣೆಗಳನ್ನು ಪರಿಶೀಲಿಸಿದ್ದೀರಿ. ನೀವು ಅತ್ಯುತ್ತಮ ಮಾದರಿಯನ್ನು ನಿಯೋಜಿಸಿದ್ದೀರಿ ಮತ್ತು ಅದನ್ನು ಅಜೂರ್ ಎಂಎಲ್ SDK ಮೂಲಕ ಉಪಯೋಗಿಸಲು ಸಾಧ್ಯವಾಯಿತು. | ನೀವು ಅಜೂರ್ ಎಂಎಲ್ SDK ಬಳಸಿ AutoML ಮೂಲಕ ಡೇಟಾಸೆಟ್‌ನಲ್ಲಿ ತರಬೇತಿ ನಡೆಸಿದ್ದೀರಿ. ನೀವು ಅತ್ಯುತ್ತಮ ಮಾದರಿಯನ್ನು ನಿಯೋಜಿಸಿದ್ದೀರಿ ಮತ್ತು ಅದನ್ನು ಅಜೂರ್ ಎಂಎಲ್ SDK ಮೂಲಕ ಉಪಯೋಗಿಸಲು ಸಾಧ್ಯವಾಯಿತು. |
---
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
**ಅಸ್ವೀಕರಣ**:
ಈ ದಸ್ತಾವೇಜು [Co-op Translator](https://github.com/Azure/co-op-translator) ಎಂಬ AI ಅನುವಾದ ಸೇವೆಯನ್ನು ಬಳಸಿ ಅನುವಾದಿಸಲಾಗಿದೆ. ನಾವು ಶುದ್ಧತೆಯತ್ತ ಪ್ರಯತ್ನಿಸುತ್ತಿದ್ದರೂ, ಸ್ವಯಂಚಾಲಿತ ಅನುವಾದಗಳಲ್ಲಿ ತಪ್ಪುಗಳು ಅಥವಾ ಅಸತ್ಯತೆಗಳು ಇರಬಹುದು ಎಂದು ದಯವಿಟ್ಟು ಗಮನಿಸಿ. ಮೂಲ ಭಾಷೆಯಲ್ಲಿರುವ ಮೂಲ ದಸ್ತಾವೇಜನ್ನು ಅಧಿಕೃತ ಮೂಲವೆಂದು ಪರಿಗಣಿಸಬೇಕು. ಪ್ರಮುಖ ಮಾಹಿತಿಗಾಗಿ, ವೃತ್ತಿಪರ ಮಾನವ ಅನುವಾದವನ್ನು ಶಿಫಾರಸು ಮಾಡಲಾಗುತ್ತದೆ. ಈ ಅನುವಾದ ಬಳಕೆಯಿಂದ ಉಂಟಾಗುವ ಯಾವುದೇ ತಪ್ಪು ಅರ್ಥಮಾಡಿಕೊಳ್ಳುವಿಕೆ ಅಥವಾ ತಪ್ಪು ವಿವರಣೆಗಳಿಗೆ ನಾವು ಹೊಣೆಗಾರರಾಗುವುದಿಲ್ಲ.
<!-- CO-OP TRANSLATOR DISCLAIMER END -->

@ -0,0 +1,325 @@
{
"cells": [
{
"cell_type": "markdown",
"source": [
"# ಕ್ಲೌಡ್‌ನಲ್ಲಿ ಡೇಟಾ ಸೈನ್ಸ್: \"ಅಜೂರ್ ಎಂಎಲ್ ಎಸ್‌ಡಿಕೆ\" ವಿಧಾನ\n",
"\n",
"## ಪರಿಚಯ\n",
"\n",
"ಈ ನೋಟ್ಬುಕ್‌ನಲ್ಲಿ, ನಾವು ಅಜೂರ್ ಎಂಎಲ್ ಮೂಲಕ ಮಾದರಿಯನ್ನು ತರಬೇತಿ, ನಿಯೋಜನೆ ಮತ್ತು ಬಳಕೆ ಮಾಡಲು ಅಜೂರ್ ಎಂಎಲ್ ಎಸ್‌ಡಿಕೆ ಅನ್ನು ಹೇಗೆ ಬಳಸುವುದು ಎಂದು ಕಲಿಯುತ್ತೇವೆ.\n",
"\n",
"ಪೂರ್ವಾಪೇಕ್ಷಿತಗಳು:\n",
"1. ನೀವು ಅಜೂರ್ ಎಂಎಲ್ ವರ್ಕ್‌ಸ್ಪೇಸ್ ಅನ್ನು ರಚಿಸಿದ್ದೀರಿ.\n",
"2. ನೀವು [ಹಾರ್ಟ್ ಫೇಲ್ಯೂರ್ ಡೇಟಾಸೆಟ್](https://www.kaggle.com/andrewmvd/heart-failure-clinical-data) ಅನ್ನು ಅಜೂರ್ ಎಂಎಲ್‌ಗೆ ಲೋಡ್ ಮಾಡಿದ್ದೀರಿ.\n",
"3. ನೀವು ಈ ನೋಟ್ಬುಕ್ ಅನ್ನು ಅಜೂರ್ ಎಂಎಲ್ ಸ್ಟುಡಿಯೋಗೆ ಅಪ್‌ಲೋಡ್ ಮಾಡಿದ್ದೀರಿ.\n",
"\n",
"ಮುಂದಿನ ಹಂತಗಳು:\n",
"\n",
"1. ಇರುವ ವರ್ಕ್‌ಸ್ಪೇಸ್‌ನಲ್ಲಿ ಒಂದು ಪ್ರಯೋಗವನ್ನು ರಚಿಸಿ.\n",
"2. ಒಂದು ಕಂಪ್ಯೂಟ್ ಕ್ಲಸ್ಟರ್ ರಚಿಸಿ.\n",
"3. ಡೇಟಾಸೆಟ್ ಅನ್ನು ಲೋಡ್ ಮಾಡಿ.\n",
"4. AutoMLConfig ಬಳಸಿ AutoML ಅನ್ನು ಸಂರಚಿಸಿ.\n",
"5. AutoML ಪ್ರಯೋಗವನ್ನು ಚಾಲನೆ ಮಾಡಿ.\n",
"6. ಫಲಿತಾಂಶಗಳನ್ನು ಅನ್ವೇಷಿಸಿ ಮತ್ತು ಉತ್ತಮ ಮಾದರಿಯನ್ನು ಪಡೆಯಿರಿ.\n",
"7. ಉತ್ತಮ ಮಾದರಿಯನ್ನು ನೋಂದಣಿ ಮಾಡಿ.\n",
"8. ಉತ್ತಮ ಮಾದರಿಯನ್ನು ನಿಯೋಜಿಸಿ.\n",
"9. ಎಂಡ್‌ಪಾಯಿಂಟ್ ಅನ್ನು ಬಳಸಿ.\n",
"\n",
"## ಅಜೂರ್ ಮೆಷಿನ್ ಲರ್ನಿಂಗ್ SDK-ನಿರ್ದಿಷ್ಟ ಆಮದುಗಳು\n"
],
"metadata": {}
},
{
"cell_type": "code",
"execution_count": null,
"source": [
"from azureml.core import Workspace, Experiment\n",
"from azureml.core.compute import AmlCompute\n",
"from azureml.train.automl import AutoMLConfig\n",
"from azureml.widgets import RunDetails\n",
"from azureml.core.model import InferenceConfig, Model\n",
"from azureml.core.webservice import AciWebservice"
],
"outputs": [],
"metadata": {}
},
{
"cell_type": "markdown",
"source": [
"## ಕಾರ್ಯಸ್ಥಳವನ್ನು ಪ್ರಾರಂಭಿಸಿ\n",
"ಸ್ಥಿರಗೊಂಡ ಸಂರಚನೆಯಿಂದ ಕಾರ್ಯಸ್ಥಳ ವಸ್ತುವನ್ನು ಪ್ರಾರಂಭಿಸಿ. .\\config.json ನಲ್ಲಿ ಸಂರಚನಾ ಕಡತವು ಇರುವುದನ್ನು ಖಚಿತಪಡಿಸಿಕೊಳ್ಳಿ.\n"
],
"metadata": {}
},
{
"cell_type": "code",
"execution_count": null,
"source": [
"ws = Workspace.from_config()\n",
"print(ws.name, ws.resource_group, ws.location, ws.subscription_id, sep = '\\n')"
],
"outputs": [],
"metadata": {}
},
{
"cell_type": "markdown",
"source": [
"## Azure ML ಪ್ರಯೋಗವನ್ನು ರಚಿಸಿ\n",
"\n",
"ನಾವು ಇತ್ತೀಚೆಗೆ ಪ್ರಾರಂಭಿಸಿದ ವರ್ಕ್‌ಸ್ಪೇಸ್‌ನಲ್ಲಿ 'aml-experiment' ಎಂಬ ಪ್ರಯೋಗವನ್ನು ರಚಿಸೋಣ.\n"
],
"metadata": {}
},
{
"cell_type": "code",
"execution_count": null,
"source": [
"experiment_name = 'aml-experiment'\n",
"experiment = Experiment(ws, experiment_name)\n",
"experiment"
],
"outputs": [],
"metadata": {}
},
{
"cell_type": "markdown",
"source": [
"## ಕಂಪ್ಯೂಟ್ ಕ್ಲಸ್ಟರ್ ರಚಿಸಿ\n",
"ನೀವು ನಿಮ್ಮ AutoML ರನ್‌ಗಾಗಿ [ಕಂಪ್ಯೂಟ್ ಗುರಿ](https://docs.microsoft.com/azure/machine-learning/concept-azure-machine-learning-architecture#compute-target) ರಚಿಸಬೇಕಾಗುತ್ತದೆ.\n"
],
"metadata": {}
},
{
"cell_type": "code",
"execution_count": null,
"source": [
"aml_name = \"heart-f-cluster\"\n",
"try:\n",
" aml_compute = AmlCompute(ws, aml_name)\n",
" print('Found existing AML compute context.')\n",
"except:\n",
" print('Creating new AML compute context.')\n",
" aml_config = AmlCompute.provisioning_configuration(vm_size = \"Standard_D2_v2\", min_nodes=1, max_nodes=3)\n",
" aml_compute = AmlCompute.create(ws, name = aml_name, provisioning_configuration = aml_config)\n",
" aml_compute.wait_for_completion(show_output = True)\n",
"\n",
"cts = ws.compute_targets\n",
"compute_target = cts[aml_name]"
],
"outputs": [],
"metadata": {}
},
{
"cell_type": "markdown",
"source": [
"## ಡೇಟಾ\n",
"ನೀವು ಡೇಟಾಸೆಟ್ ಅನ್ನು Azure ML ಗೆ ಅಪ್‌ಲೋಡ್ ಮಾಡಿರುವುದನ್ನು ಖಚಿತಪಡಿಸಿಕೊಳ್ಳಿ ಮತ್ತು ಕೀ ಡೇಟಾಸೆಟ್‌ನ ಅದೇ ಹೆಸರಾಗಿರಬೇಕು.\n"
],
"metadata": {}
},
{
"cell_type": "code",
"execution_count": null,
"source": [
"key = 'heart-failure-records'\n",
"dataset = ws.datasets[key]\n",
"df = dataset.to_pandas_dataframe()\n",
"df.describe()"
],
"outputs": [],
"metadata": {}
},
{
"cell_type": "markdown",
"source": [
"## AutoML ಸಂರಚನೆ\n"
],
"metadata": {}
},
{
"cell_type": "code",
"execution_count": null,
"source": [
"automl_settings = {\n",
" \"experiment_timeout_minutes\": 20,\n",
" \"max_concurrent_iterations\": 3,\n",
" \"primary_metric\" : 'AUC_weighted'\n",
"}\n",
"\n",
"automl_config = AutoMLConfig(compute_target=compute_target,\n",
" task = \"classification\",\n",
" training_data=dataset,\n",
" label_column_name=\"DEATH_EVENT\",\n",
" enable_early_stopping= True,\n",
" featurization= 'auto',\n",
" debug_log = \"automl_errors.log\",\n",
" **automl_settings\n",
" )"
],
"outputs": [],
"metadata": {}
},
{
"cell_type": "markdown",
"source": [
"## AutoML ರನ್\n"
],
"metadata": {}
},
{
"cell_type": "code",
"execution_count": null,
"source": [
"remote_run = experiment.submit(automl_config)"
],
"outputs": [],
"metadata": {}
},
{
"cell_type": "code",
"execution_count": null,
"source": [
"RunDetails(remote_run).show()"
],
"outputs": [],
"metadata": {}
},
{
"cell_type": "markdown",
"source": [
"## ಅತ್ಯುತ್ತಮ ಮಾದರಿಯನ್ನು ಉಳಿಸಿ\n"
],
"metadata": {}
},
{
"cell_type": "code",
"execution_count": null,
"source": [
"best_run, fitted_model = remote_run.get_output()"
],
"outputs": [],
"metadata": {}
},
{
"cell_type": "code",
"execution_count": null,
"source": [
"best_run.get_properties()"
],
"outputs": [],
"metadata": {}
},
{
"cell_type": "code",
"execution_count": null,
"source": [
"model_name = best_run.properties['model_name']\n",
"script_file_name = 'inference/score.py'\n",
"best_run.download_file('outputs/scoring_file_v_1_0_0.py', 'inference/score.py')\n",
"description = \"aml heart failure project sdk\"\n",
"model = best_run.register_model(model_name = model_name,\n",
" description = description,\n",
" tags = None)"
],
"outputs": [],
"metadata": {}
},
{
"cell_type": "markdown",
"source": [
"## ಅತ್ಯುತ್ತಮ ಮಾದರಿಯನ್ನು ನಿಯೋಜಿಸಿ\n",
"\n",
"ಅತ್ಯುತ್ತಮ ಮಾದರಿಯನ್ನು ನಿಯೋಜಿಸಲು ಕೆಳಗಿನ ಕೋಡ್ ಅನ್ನು ಚಾಲನೆ ಮಾಡಿ. ನಿಯೋಜನೆಯ ಸ್ಥಿತಿಯನ್ನು ನೀವು Azure ML ಪೋರ್ಟಲ್‌ನಲ್ಲಿ ನೋಡಬಹುದು. ಈ ಹಂತಕ್ಕೆ ಕೆಲವು ನಿಮಿಷಗಳು ಬೇಕಾಗಬಹುದು.\n"
],
"metadata": {}
},
{
"cell_type": "code",
"execution_count": null,
"source": [
"inference_config = InferenceConfig(entry_script=script_file_name, environment=best_run.get_environment())\n",
"\n",
"aciconfig = AciWebservice.deploy_configuration(cpu_cores = 1,\n",
" memory_gb = 1,\n",
" tags = {'type': \"automl-heart-failure-prediction\"},\n",
" description = 'Sample service for AutoML Heart Failure Prediction')\n",
"\n",
"aci_service_name = 'automl-hf-sdk'\n",
"aci_service = Model.deploy(ws, aci_service_name, [model], inference_config, aciconfig)\n",
"aci_service.wait_for_deployment(True)\n",
"print(aci_service.state)"
],
"outputs": [],
"metadata": {}
},
{
"cell_type": "markdown",
"source": [
"## ಎಂಡ್ಪಾಯಿಂಟ್ ಅನ್ನು ಬಳಸಿ\n",
"ನೀವು ಕೆಳಗಿನ ಇನ್‌ಪುಟ್ ಮಾದರಿಗೆ ಇನ್‌ಪುಟ್‌ಗಳನ್ನು ಸೇರಿಸಬಹುದು.\n"
],
"metadata": {}
},
{
"cell_type": "code",
"execution_count": null,
"source": [
"data = {\n",
" \"data\":\n",
" [\n",
" {\n",
" 'age': \"60\",\n",
" 'anaemia': \"false\",\n",
" 'creatinine_phosphokinase': \"500\",\n",
" 'diabetes': \"false\",\n",
" 'ejection_fraction': \"38\",\n",
" 'high_blood_pressure': \"false\",\n",
" 'platelets': \"260000\",\n",
" 'serum_creatinine': \"1.40\",\n",
" 'serum_sodium': \"137\",\n",
" 'sex': \"false\",\n",
" 'smoking': \"false\",\n",
" 'time': \"130\",\n",
" },\n",
" ],\n",
"}\n",
"\n",
"test_sample = str.encode(json.dumps(data))"
],
"outputs": [],
"metadata": {}
},
{
"cell_type": "code",
"execution_count": null,
"source": [
"response = aci_service.run(input_data=test_sample)\n",
"response"
],
"outputs": [],
"metadata": {}
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"---\n\n<!-- CO-OP TRANSLATOR DISCLAIMER START -->\n**ಅಸ್ವೀಕಾರ**: \nಈ ದಸ್ತಾವೇಜು AI ಅನುವಾದ ಸೇವೆ [Co-op Translator](https://github.com/Azure/co-op-translator) ಬಳಸಿ ಅನುವಾದಿಸಲಾಗಿದೆ. ನಾವು ನಿಖರತೆಯಿಗಾಗಿ ಪ್ರಯತ್ನಿಸುತ್ತಿದ್ದರೂ, ಸ್ವಯಂಚಾಲಿತ ಅನುವಾದಗಳಲ್ಲಿ ದೋಷಗಳು ಅಥವಾ ಅಸತ್ಯತೆಗಳು ಇರಬಹುದು ಎಂದು ದಯವಿಟ್ಟು ಗಮನಿಸಿ. ಮೂಲ ಭಾಷೆಯಲ್ಲಿರುವ ಮೂಲ ದಸ್ತಾವೇಜನ್ನು ಅಧಿಕೃತ ಮೂಲವೆಂದು ಪರಿಗಣಿಸಬೇಕು. ಮಹತ್ವದ ಮಾಹಿತಿಗಾಗಿ ವೃತ್ತಿಪರ ಮಾನವ ಅನುವಾದವನ್ನು ಶಿಫಾರಸು ಮಾಡಲಾಗುತ್ತದೆ. ಈ ಅನುವಾದ ಬಳಕೆಯಿಂದ ಉಂಟಾಗುವ ಯಾವುದೇ ತಪ್ಪು ಅರ್ಥಮಾಡಿಕೊಳ್ಳುವಿಕೆ ಅಥವಾ ತಪ್ಪು ವಿವರಣೆಗಳಿಗೆ ನಾವು ಹೊಣೆಗಾರರಾಗುವುದಿಲ್ಲ.\n<!-- CO-OP TRANSLATOR DISCLAIMER END -->\n"
]
}
],
"metadata": {
"orig_nbformat": 4,
"language_info": {
"name": "python"
},
"coopTranslator": {
"original_hash": "af42669556d5dc19fc4cc3866f7d2597",
"translation_date": "2025-12-19T17:10:35+00:00",
"source_file": "5-Data-Science-In-Cloud/19-Azure/notebook.ipynb",
"language_code": "kn"
}
},
"nbformat": 4,
"nbformat_minor": 2
}

@ -0,0 +1,36 @@
<!--
CO_OP_TRANSLATOR_METADATA:
{
"original_hash": "8dfe141a0f46f7d253e07f74913c7f44",
"translation_date": "2025-12-19T13:23:55+00:00",
"source_file": "5-Data-Science-In-Cloud/README.md",
"language_code": "kn"
}
-->
# ಕ್ಲೌಡ್‌ನಲ್ಲಿ ಡೇಟಾ ಸೈನ್ಸ್
![cloud-picture](../../../translated_images/cloud-picture.f5526de3c6c6387b2d656ba94f019b3352e5e3854a78440e4fb00c93e2dea675.kn.jpg)
> ಫೋಟೋ [Jelleke Vanooteghem](https://unsplash.com/@ilumire) ಅವರಿಂದ [Unsplash](https://unsplash.com/s/photos/cloud?orientation=landscape)
ಬೃಹತ್ ಡೇಟಾ ಜೊತೆಗೆ ಡೇಟಾ ಸೈನ್ಸ್ ಮಾಡುವಾಗ, ಕ್ಲೌಡ್ ಒಂದು ಆಟ ಬದಲಿಸುವುದಾಗಿ ಇರಬಹುದು. ಮುಂದಿನ ಮೂರು ಪಾಠಗಳಲ್ಲಿ, ನಾವು ಕ್ಲೌಡ್ ಎಂದರೇನು ಮತ್ತು ಅದು ಏಕೆ ಬಹಳ ಸಹಾಯಕವಾಗಬಹುದು ಎಂಬುದನ್ನು ನೋಡಲಿದ್ದೇವೆ. ನಾವು ಹೃದಯ ವೈಫಲ್ಯ ಡೇಟಾಸೆಟ್ ಅನ್ನು ಅನ್ವೇಷಿಸಿ, ಯಾರಿಗಾದರೂ ಹೃದಯ ವೈಫಲ್ಯ ಇರುವ ಸಾಧ್ಯತೆಯನ್ನು ಅಂದಾಜಿಸಲು ಸಹಾಯ ಮಾಡುವ ಮಾದರಿಯನ್ನು ನಿರ್ಮಿಸಲಿದ್ದೇವೆ. ನಾವು ಮಾದರಿಯನ್ನು ತರಬೇತಿ, ನಿಯೋಜನೆ ಮತ್ತು ಬಳಕೆ ಮಾಡಲು ಕ್ಲೌಡ್ ಶಕ್ತಿಯನ್ನು ಎರಡು ವಿಭಿನ್ನ ರೀತಿಗಳಲ್ಲಿ ಬಳಸಲಿದ್ದೇವೆ. ಒಂದು ಮಾರ್ಗವು ಕೇವಲ ಬಳಕೆದಾರ ಇಂಟರ್ಫೇಸ್ ಅನ್ನು ಬಳಸಿಕೊಂಡು ಲೋ ಕೋಡ್/ನೋ ಕೋಡ್ ಶೈಲಿಯಲ್ಲಿ, ಮತ್ತೊಂದು ಮಾರ್ಗವು ಅಜೂರ್ ಮೆಷಿನ್ ಲರ್ನಿಂಗ್ ಸಾಫ್ಟ್‌ವೇರ್ ಡೆವಲಪರ್ ಕಿಟ್ (Azure ML SDK) ಬಳಸಿ.
![project-schema](../../../translated_images/project-schema.420e56d495624541eaecf2b737f138c86fb7d8162bb1c0bf8783c350872ffc4d.kn.png)
### ವಿಷಯಗಳು
1. [ಡೇಟಾ ಸೈನ್ಸ್‌ಗೆ ಕ್ಲೌಡ್ ಅನ್ನು ಏಕೆ ಬಳಸಬೇಕು?](17-Introduction/README.md)
2. [ಕ್ಲೌಡ್‌ನಲ್ಲಿ ಡೇಟಾ ಸೈನ್ಸ್: "ಲೋ ಕೋಡ್/ನೋ ಕೋಡ್" ಮಾರ್ಗ](18-Low-Code/README.md)
3. [ಕ್ಲೌಡ್‌ನಲ್ಲಿ ಡೇಟಾ ಸೈನ್ಸ್: "ಅಜೂರ್ ML SDK" ಮಾರ್ಗ](19-Azure/README.md)
### ಕ್ರೆಡಿಟ್ಸ್
ಈ ಪಾಠಗಳನ್ನು ☁️ ಮತ್ತು 💕 ಸಹಿತ [Maud Levy](https://twitter.com/maudstweets) ಮತ್ತು [Tiffany Souterre](https://twitter.com/TiffanySouterre) ರವರು ಬರೆಯಲಾಗಿದೆ
ಹೃದಯ ವೈಫಲ್ಯ ಭವಿಷ್ಯವಾಣಿ ಯೋಜನೆಗೆ ಡೇಟಾ [Larxel](https://www.kaggle.com/andrewmvd) ಅವರಿಂದ [Kaggle](https://www.kaggle.com/andrewmvd/heart-failure-clinical-data) ನಲ್ಲಿ ದೊರಕಿದೆ. ಇದು [Attribution 4.0 International (CC BY 4.0)](https://creativecommons.org/licenses/by/4.0/) ಅಡಿಯಲ್ಲಿ ಪರವಾನಗಿಯಾಗಿದೆ.
---
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
**ಅಸ್ವೀಕರಣ**:
ಈ ದಸ್ತಾವೇಜು [Co-op Translator](https://github.com/Azure/co-op-translator) ಎಂಬ AI ಅನುವಾದ ಸೇವೆಯನ್ನು ಬಳಸಿ ಅನುವಾದಿಸಲಾಗಿದೆ. ನಾವು ಶುದ್ಧತೆಯತ್ತ ಪ್ರಯತ್ನಿಸುತ್ತಿದ್ದರೂ, ಸ್ವಯಂಚಾಲಿತ ಅನುವಾದಗಳಲ್ಲಿ ತಪ್ಪುಗಳು ಅಥವಾ ಅಸತ್ಯತೆಗಳು ಇರಬಹುದು ಎಂದು ದಯವಿಟ್ಟು ಗಮನಿಸಿ. ಮೂಲ ಭಾಷೆಯಲ್ಲಿರುವ ಮೂಲ ದಸ್ತಾವೇಜನ್ನು ಅಧಿಕೃತ ಮೂಲವೆಂದು ಪರಿಗಣಿಸಬೇಕು. ಮಹತ್ವದ ಮಾಹಿತಿಗಾಗಿ, ವೃತ್ತಿಪರ ಮಾನವ ಅನುವಾದವನ್ನು ಶಿಫಾರಸು ಮಾಡಲಾಗುತ್ತದೆ. ಈ ಅನುವಾದ ಬಳಕೆಯಿಂದ ಉಂಟಾಗುವ ಯಾವುದೇ ತಪ್ಪು ಅರ್ಥಮಾಡಿಕೊಳ್ಳುವಿಕೆ ಅಥವಾ ತಪ್ಪು ವಿವರಣೆಗಳಿಗೆ ನಾವು ಹೊಣೆಗಾರರಾಗುವುದಿಲ್ಲ.
<!-- CO-OP TRANSLATOR DISCLAIMER END -->

@ -0,0 +1,159 @@
<!--
CO_OP_TRANSLATOR_METADATA:
{
"original_hash": "0f67a4139454816631526779a456b734",
"translation_date": "2025-12-19T16:57:54+00:00",
"source_file": "6-Data-Science-In-Wild/20-Real-World-Examples/README.md",
"language_code": "kn"
}
-->
# ನಿಜಜೀವನದಲ್ಲಿ ಡೇಟಾ ಸೈನ್ಸ್
| ![ [(@sketchthedocs)](https://sketchthedocs.dev) ಅವರ ಸ್ಕೆಚ್ ನೋಟ್ ](../../sketchnotes/20-DataScience-RealWorld.png) |
| :--------------------------------------------------------------------------------------------------------------: |
| ನಿಜಜೀವನದಲ್ಲಿ ಡೇಟಾ ಸೈನ್ಸ್ - _[@nitya](https://twitter.com/nitya) ಅವರ ಸ್ಕೆಚ್ ನೋಟ್_ |
ನಾವು ಈ ಅಧ್ಯಯನ ಪ್ರಯಾಣದ ಕೊನೆಯಲ್ಲಿ ಬಹುಶಃ ಬಂದಿದ್ದೇವೆ!
ನಾವು ಡೇಟಾ ಸೈನ್ಸ್ ಮತ್ತು ನೈತಿಕತೆಗಳ ವ್ಯಾಖ್ಯಾನಗಳಿಂದ ಪ್ರಾರಂಭಿಸಿ, ಡೇಟಾ ವಿಶ್ಲೇಷಣೆ ಮತ್ತು ದೃಶ್ಯೀಕರಣಕ್ಕಾಗಿ ವಿವಿಧ ಸಾಧನಗಳು ಮತ್ತು ತಂತ್ರಗಳನ್ನು ಅನ್ವೇಷಿಸಿ, ಡೇಟಾ ಸೈನ್ಸ್ ಜೀವನಚಕ್ರವನ್ನು ಪರಿಶೀಲಿಸಿ, ಮತ್ತು ಕ್ಲೌಡ್ ಕಂಪ್ಯೂಟಿಂಗ್ ಸೇವೆಗಳೊಂದಿಗೆ ಡೇಟಾ ಸೈನ್ಸ್ ಕಾರ್ಯಪ್ರವಾಹಗಳನ್ನು ವಿಸ್ತರಿಸುವುದು ಮತ್ತು ಸ್ವಯಂಚಾಲಿತಗೊಳಿಸುವುದನ್ನು ನೋಡಿದ್ದೇವೆ. ಆದ್ದರಿಂದ, ನೀವು ಬಹುಶಃ ಆಶ್ಚರ್ಯಪಡುತ್ತಿದ್ದೀರಿ: _"ನಾನು ಈ ಎಲ್ಲಾ ಕಲಿಕೆಗಳನ್ನು ನಿಜಜೀವನದ ಸಂದರ್ಭಗಳಿಗೆ ಹೇಗೆ ನಿಖರವಾಗಿ ನಕ್ಷೆ ಮಾಡಬಹುದು?"_
ಈ ಪಾಠದಲ್ಲಿ, ನಾವು ಕೈಗಾರಿಕೆಯಲ್ಲಿ ಡೇಟಾ ಸೈನ್ಸ್ ನ ನಿಜಜೀವನ ಅನ್ವಯಗಳನ್ನು ಅನ್ವೇಷಿಸುವೆವು ಮತ್ತು ಸಂಶೋಧನೆ, ಡಿಜಿಟಲ್ ಮಾನವಶಾಸ್ತ್ರ ಮತ್ತು ಸ್ಥಿರತೆಯ ಸಂದರ್ಭಗಳಲ್ಲಿ ವಿಶೇಷ ಉದಾಹರಣೆಗಳನ್ನು ನೋಡೋಣ. ನಾವು ವಿದ್ಯಾರ್ಥಿ ಯೋಜನೆಗಳ ಅವಕಾಶಗಳನ್ನು ನೋಡೋಣ ಮತ್ತು ನಿಮ್ಮ ಅಧ್ಯಯನ ಪ್ರಯಾಣವನ್ನು ಮುಂದುವರಿಸಲು ಸಹಾಯಕವಾದ ಸಂಪನ್ಮೂಲಗಳೊಂದಿಗೆ ಸಮಾಪ್ತಿಮಾಡೋಣ!
## ಪಾಠದ ಮುಂಚಿನ ಪ್ರಶ್ನೋತ್ತರ
## [ಪಾಠದ ಮುಂಚಿನ ಪ್ರಶ್ನೋತ್ತರ](https://ff-quizzes.netlify.app/en/ds/quiz/38)
## ಡೇಟಾ ಸೈನ್ಸ್ + ಕೈಗಾರಿಕೆ
ಕೃತಕ ಬುದ್ಧಿಮತ್ತೆಯ ಪ್ರಜಾಪ್ರಭುತ್ವಕ್ಕೆ ಧನ್ಯವಾದಗಳು, ಅಭಿವೃದ್ಧಿಪಡಿಸುವವರು ಈಗ AI ಚಾಲಿತ ನಿರ್ಧಾರಮೇಕಿಂಗ್ ಮತ್ತು ಡೇಟಾ ಚಾಲಿತ ಒಳನೋಟಗಳನ್ನು ಬಳಕೆದಾರ ಅನುಭವಗಳು ಮತ್ತು ಅಭಿವೃದ್ಧಿ ಕಾರ್ಯಪ್ರವಾಹಗಳಲ್ಲಿ ವಿನ್ಯಾಸಗೊಳಿಸಲು ಮತ್ತು ಸಂಯೋಜಿಸಲು ಸುಲಭವಾಗುತ್ತಿದೆ. ಕೈಗಾರಿಕೆಯಲ್ಲಿ ಡೇಟಾ ಸೈನ್ಸ್ ಅನ್ನು ನಿಜಜೀವನ ಅನ್ವಯಗಳಿಗೆ "ಅನ್ವಯಿಸುವ" ಕೆಲವು ಉದಾಹರಣೆಗಳು ಇಲ್ಲಿವೆ:
* [Google Flu Trends](https://www.wired.com/2015/10/can-learn-epic-failure-google-flu-trends/) ಡೇಟಾ ಸೈನ್ಸ್ ಬಳಸಿ ಹುಡುಕಾಟ ಪದಗಳನ್ನು ಫ್ಲೂ ಪ್ರವೃತ್ತಿಗಳೊಂದಿಗೆ ಹೊಂದಾಣಿಕೆ ಮಾಡಿತು. ಈ ವಿಧಾನದಲ್ಲಿ ದೋಷಗಳಿದ್ದರೂ, ಡೇಟಾ ಚಾಲಿತ ಆರೋಗ್ಯ ನಿರೀಕ್ಷಣೆಯ ಸಾಧ್ಯತೆಗಳು (ಮತ್ತು ಸವಾಲುಗಳು) ಬಗ್ಗೆ ಜಾಗೃತಿ ಮೂಡಿಸಿತು.
* [UPS Routing Predictions](https://www.technologyreview.com/2018/11/21/139000/how-ups-uses-ai-to-outsmart-bad-weather/) - UPS ಹೇಗೆ ಡೇಟಾ ಸೈನ್ಸ್ ಮತ್ತು ಯಂತ್ರ ಅಧ್ಯಯನವನ್ನು ಬಳಸಿ ವಿತರಣೆಗೆ ಅತ್ಯುತ್ತಮ ಮಾರ್ಗಗಳನ್ನು ಹವಾಮಾನ ಪರಿಸ್ಥಿತಿಗಳು, ಟ್ರಾಫಿಕ್ ಮಾದರಿಗಳು, ವಿತರಣಾ ಗಡಿಬಿಡಿಗಳು ಮತ್ತು ಇನ್ನಿತರವನ್ನು ಪರಿಗಣಿಸಿ ಭವಿಷ್ಯವಾಣಿ ಮಾಡುತ್ತದೆ ಎಂಬುದನ್ನು ವಿವರಿಸುತ್ತದೆ.
* [NYC Taxicab Route Visualization](http://chriswhong.github.io/nyctaxi/) - [ಮಾಹಿತಿ ಮುಕ್ತತಾ ಕಾನೂನುಗಳು](https://chriswhong.com/open-data/foil_nyc_taxi/) ಬಳಸಿ ಸಂಗ್ರಹಿಸಿದ ಡೇಟಾ NYC ಟ್ಯಾಕ್ಸಿಗಳ ದಿನಚರಿಯನ್ನು ದೃಶ್ಯೀಕರಿಸಲು ಸಹಾಯ ಮಾಡಿತು, ಅವು ಹೇಗೆ ಬ್ಯುಸಿ ನಗರವನ್ನು ಸಂಚರಿಸುತ್ತವೆ, ಅವರು ಗಳಿಸುವ ಹಣ ಮತ್ತು ಪ್ರತಿ 24 ಗಂಟೆಗಳ ಅವಧಿಯಲ್ಲಿ ಪ್ರಯಾಣಗಳ ಅವಧಿಯನ್ನು ನಾವು ಅರ್ಥಮಾಡಿಕೊಳ್ಳಲು ಸಹಾಯ ಮಾಡಿತು.
* [Uber Data Science Workbench](https://eng.uber.com/dsw/) - ಪ್ರತಿದಿನವೂ ಲಕ್ಷಾಂತರ ಉಬರ್ ಪ್ರಯಾಣಗಳಿಂದ ಸಂಗ್ರಹಿಸಿದ ಡೇಟಾ (ಪಿಕಪ್ ಮತ್ತು ಡ್ರಾಪ್ಓಫ್ ಸ್ಥಳಗಳು, ಪ್ರಯಾಣ ಅವಧಿ, ಇಚ್ಛಿತ ಮಾರ್ಗಗಳು ಇತ್ಯಾದಿ) ಬಳಸಿ ಬೆಲೆ ನಿಗದಿ, ಸುರಕ್ಷತೆ, ಮೋಸ ಪತ್ತೆ ಮತ್ತು ನ್ಯಾವಿಗೇಶನ್ ನಿರ್ಧಾರಗಳಿಗೆ ಸಹಾಯ ಮಾಡುವ ಡೇಟಾ ವಿಶ್ಲೇಷಣಾ ಸಾಧನವನ್ನು ನಿರ್ಮಿಸುತ್ತದೆ.
* [Sports Analytics](https://towardsdatascience.com/scope-of-analytics-in-sports-world-37ed09c39860) - _ಭವಿಷ್ಯವಾಣಿ ವಿಶ್ಲೇಷಣೆ_ (ಟೀಮ್ ಮತ್ತು ಆಟಗಾರ ವಿಶ್ಲೇಷಣೆ - [Moneyball](https://datasciencedegree.wisconsin.edu/blog/moneyball-proves-importance-big-data-big-ideas/) ನೆನಪಿಸಿಕೊಳ್ಳಿ - ಮತ್ತು ಅಭಿಮಾನಿ ನಿರ್ವಹಣೆ) ಮತ್ತು _ಡೇಟಾ ದೃಶ್ಯೀಕರಣ_ (ಟೀಮ್ ಮತ್ತು ಅಭಿಮಾನಿ ಡ್ಯಾಶ್‌ಬೋರ್ಡ್‌ಗಳು, ಆಟಗಳು ಇತ್ಯಾದಿ) ಮೇಲೆ ಕೇಂದ್ರೀಕರಿಸುತ್ತದೆ, ಪ್ರತಿಭಾ ಹುಡುಕಾಟ, ಕ್ರೀಡಾ ಜೂಜಾಟ ಮತ್ತು ಇನ್ವೆಂಟರಿ/ಸ್ಥಳ ನಿರ್ವಹಣೆ ಸೇರಿದಂತೆ ಅನ್ವಯಿಕೆಗಳೊಂದಿಗೆ.
* [ಬ್ಯಾಂಕಿಂಗ್‌ನಲ್ಲಿ ಡೇಟಾ ಸೈನ್ಸ್](https://data-flair.training/blogs/data-science-in-banking/) - ಹಣಕಾಸು ಕ್ಷೇತ್ರದಲ್ಲಿ ಡೇಟಾ ಸೈನ್ಸ್ ಮೌಲ್ಯವನ್ನು ಹೈಲೈಟ್ ಮಾಡುತ್ತದೆ, ಅಪಾಯ ಮಾದರೀಕರಣ ಮತ್ತು ಮೋಸ ಪತ್ತೆ, ಗ್ರಾಹಕ ವಿಭಾಗೀಕರಣ, ರಿಯಲ್-ಟೈಮ್ ಭವಿಷ್ಯವಾಣಿ ಮತ್ತು ಶಿಫಾರಸು ವ್ಯವಸ್ಥೆಗಳ ಅನ್ವಯಿಕೆಗಳೊಂದಿಗೆ. ಭವಿಷ್ಯವಾಣಿ ವಿಶ್ಲೇಷಣೆಗಳು [ಕ್ರೆಡಿಟ್ ಸ್ಕೋರ್‌ಗಳು](https://dzone.com/articles/using-big-data-and-predictive-analytics-for-credit) ಮುಂತಾದ ಪ್ರಮುಖ ಕ್ರಮಗಳನ್ನು ಚಾಲನೆ ಮಾಡುತ್ತವೆ.
* [ಆರೋಗ್ಯ ಸೇವೆಯಲ್ಲಿ ಡೇಟಾ ಸೈನ್ಸ್](https://data-flair.training/blogs/data-science-in-healthcare/) - ವೈದ್ಯಕೀಯ ಚಿತ್ರಣ (ಉದಾ: MRI, X-ರೇ, CT-ಸ್ಕ್ಯಾನ್), ಜಿನೋಮಿಕ್ಸ್ (DNA ಕ್ರಮಬದ್ಧತೆ), ಔಷಧಿ ಅಭಿವೃದ್ಧಿ (ಅಪಾಯ ಮೌಲ್ಯಮಾಪನ, ಯಶಸ್ಸಿನ ಭವಿಷ್ಯವಾಣಿ), ಭವಿಷ್ಯವಾಣಿ ವಿಶ್ಲೇಷಣೆ (ರೋಗಿ ಆರೈಕೆ ಮತ್ತು ಸರಬರಾಜು ಲಾಜಿಸ್ಟಿಕ್ಸ್), ರೋಗ ಟ್ರ್ಯಾಕಿಂಗ್ ಮತ್ತು ತಡೆ ಮುಂತಾದ ಅನ್ವಯಿಕೆಗಳನ್ನು ಹೈಲೈಟ್ ಮಾಡುತ್ತದೆ.
![ನಿಜಜೀವನದಲ್ಲಿ ಡೇಟಾ ಸೈನ್ಸ್ ಅನ್ವಯಿಕೆಗಳು](../../../../translated_images/data-science-applications.4e5019cd8790ebac2277ff5f08af386f8727cac5d30f77727c7090677e6adb9c.kn.png) ಚಿತ್ರ ಕ್ರೆಡಿಟ್: [ಡೇಟಾ ಫ್ಲೇರ್: 6 ಅದ್ಭುತ ಡೇಟಾ ಸೈನ್ಸ್ ಅನ್ವಯಿಕೆಗಳು](https://data-flair.training/blogs/data-science-applications/)
ಚಿತ್ರವು ಡೇಟಾ ಸೈನ್ಸ್ ತಂತ್ರಗಳನ್ನು ಅನ್ವಯಿಸುವ ಇತರ ಕ್ಷೇತ್ರಗಳು ಮತ್ತು ಉದಾಹರಣೆಗಳನ್ನು ತೋರಿಸುತ್ತದೆ. ಇತರ ಅನ್ವಯಿಕೆಗಳನ್ನು ಅನ್ವೇಷಿಸಲು ಬಯಸುತ್ತೀರಾ? ಕೆಳಗಿನ [ಪರಿಶೀಲನೆ ಮತ್ತು ಸ್ವಯಂ ಅಧ್ಯಯನ](../../../../6-Data-Science-In-Wild/20-Real-World-Examples) ವಿಭಾಗವನ್ನು ಪರಿಶೀಲಿಸಿ.
## ಡೇಟಾ ಸೈನ್ಸ್ + ಸಂಶೋಧನೆ
| ![ [(@sketchthedocs)](https://sketchthedocs.dev) ಅವರ ಸ್ಕೆಚ್ ನೋಟ್ ](../../sketchnotes/20-DataScience-Research.png) |
| :---------------------------------------------------------------------------------------------------------------: |
| ಡೇಟಾ ಸೈನ್ಸ್ ಮತ್ತು ಸಂಶೋಧನೆ - _[@nitya](https://twitter.com/nitya) ಅವರ ಸ್ಕೆಚ್ ನೋಟ್_ |
ನಿಜಜೀವನ ಅನ್ವಯಿಕೆಗಳು ಸಾಮಾನ್ಯವಾಗಿ ಕೈಗಾರಿಕಾ ಬಳಕೆ ಪ್ರಕರಣಗಳ ಮೇಲೆ ಕೇಂದ್ರೀಕರಿಸಿದರೂ, _ಸಶೋಧನೆ_ ಅನ್ವಯಿಕೆಗಳು ಮತ್ತು ಯೋಜನೆಗಳು ಎರಡು ದೃಷ್ಟಿಕೋನಗಳಿಂದ ಉಪಯುಕ್ತವಾಗಬಹುದು:
* _ನವೀನತೆ ಅವಕಾಶಗಳು_ - ಮುಂದಿನ ತಲೆಮಾರಿನ ಅನ್ವಯಿಕೆಗಳಿಗಾಗಿ ಉನ್ನತ ತತ್ವಗಳ ವೇಗದ ಪ್ರೋಟೋಟೈಪಿಂಗ್ ಮತ್ತು ಬಳಕೆದಾರ ಅನುಭವಗಳ ಪರೀಕ್ಷೆಯನ್ನು ಅನ್ವೇಷಿಸಿ.
* _ನಿರ್ವಹಣಾ ಸವಾಲುಗಳು_ - ನಿಜಜೀವನ ಸಂದರ್ಭಗಳಲ್ಲಿ ಡೇಟಾ ಸೈನ್ಸ್ ತಂತ್ರಜ್ಞಾನಗಳ ಸಾಧ್ಯ ಹಾನಿಗಳು ಅಥವಾ ಅನಿರೀಕ್ಷಿತ ಪರಿಣಾಮಗಳನ್ನು ಪರಿಶೀಲಿಸಿ.
ವಿದ್ಯಾರ್ಥಿಗಳಿಗೆ, ಈ ಸಂಶೋಧನಾ ಯೋಜನೆಗಳು ವಿಷಯದ ನಿಮ್ಮ ಅರ್ಥವನ್ನು ಸುಧಾರಿಸಲು ಮತ್ತು ಸಂಬಂಧಿತ ಜನರು ಅಥವಾ ತಂಡಗಳೊಂದಿಗೆ ನಿಮ್ಮ ಜಾಗೃತಿ ಮತ್ತು ತೊಡಕನ್ನು ವಿಸ್ತರಿಸಲು ಕಲಿಕೆ ಮತ್ತು ಸಹಕಾರದ ಅವಕಾಶಗಳನ್ನು ಒದಗಿಸಬಹುದು. ಆದ್ದರಿಂದ ಸಂಶೋಧನಾ ಯೋಜನೆಗಳು ಹೇಗಿರುತ್ತವೆ ಮತ್ತು ಅವು ಹೇಗೆ ಪ್ರಭಾವ ಬೀರುತ್ತವೆ?
ಒಂದು ಉದಾಹರಣೆಯನ್ನು ನೋಡೋಣ - Joy Buolamwini (MIT ಮೀಡಿಯಾ ಲ್ಯಾಬ್ಸ್) ಅವರ [MIT Gender Shades Study](http://gendershades.org/overview.html) ಮತ್ತು Timnit Gebru (ಆ ಸಮಯದಲ್ಲಿ Microsoft Research ನಲ್ಲಿ) ಸಹಲೇಖಕರಾದ [ಅಂಗೀಕೃತ ಸಂಶೋಧನಾ ಪತ್ರ](http://proceedings.mlr.press/v81/buolamwini18a/buolamwini18a.pdf) ಇದು ಕೆಳಗಿನ ವಿಷಯದ ಮೇಲೆ ಕೇಂದ್ರೀಕರಿಸಿದೆ:
* **ಏನು:** ಸಂಶೋಧನಾ ಯೋಜನೆಯ ಉದ್ದೇಶವು _ಲಿಗ ಮತ್ತು ಚರ್ಮದ ಬಣ್ಣ ಆಧಾರಿತ ಸ್ವಯಂಚಾಲಿತ ಮುಖ ವಿಶ್ಲೇಷಣಾ ಅಲ್ಗಾರಿದಮ್‌ಗಳು ಮತ್ತು ಡೇಟಾ ಸೆಟ್‌ಗಳಲ್ಲಿ ಇರುವ ಪಕ್ಷಪಾತವನ್ನು ಮೌಲ್ಯಮಾಪನ ಮಾಡುವುದು_.
* **ಏಕೆ:** ಮುಖ ವಿಶ್ಲೇಷಣೆ ಕಾನೂನು ಅನುಷ್ಠಾನ, ವಿಮಾನ ನಿಲ್ದಾಣ ಭದ್ರತೆ, ನೇಮಕಾತಿ ವ್ಯವಸ್ಥೆಗಳು ಮುಂತಾದ ಕ್ಷೇತ್ರಗಳಲ್ಲಿ ಬಳಸಲಾಗುತ್ತದೆ - ಅಲ್ಲಿ ತಪ್ಪು ವರ್ಗೀಕರಣಗಳು (ಉದಾ: ಪಕ್ಷಪಾತದಿಂದ) ಪ್ರಭಾವಿತ ವ್ಯಕ್ತಿಗಳು ಅಥವಾ ಗುಂಪುಗಳಿಗೆ ಆರ್ಥಿಕ ಮತ್ತು ಸಾಮಾಜಿಕ ಹಾನಿಗಳನ್ನುಂಟುಮಾಡಬಹುದು. ಪಕ್ಷಪಾತಗಳನ್ನು ಅರ್ಥಮಾಡಿಕೊಳ್ಳುವುದು (ಮತ್ತು ಅಳಿಸುವುದು ಅಥವಾ ಕಡಿಮೆ ಮಾಡುವುದು) ಬಳಕೆಯ ನ್ಯಾಯತೆಯ ಪ್ರಮುಖ ಅಂಶವಾಗಿದೆ.
* **ಹೇಗೆ:** ಸಂಶೋಧಕರು ಅರ್ಥಮಾಡಿಕೊಂಡರು ಇತ್ತೀಚಿನ ಮಾನದಂಡಗಳು ಬಹುಮಟ್ಟಿಗೆ ಬೆಳಗಿನ ಚರ್ಮದ ವಿಷಯಗಳನ್ನು ಬಳಸುತ್ತಿವೆ ಮತ್ತು ಲಿಂಗ ಮತ್ತು ಚರ್ಮದ ಬಣ್ಣದ ಮೂಲಕ _ಮೇಲ್ಮಟ್ಟದ ಸಮತೋಲನ_ ಹೊಂದಿರುವ ಹೊಸ ಡೇಟಾ ಸೆಟ್ (1000+ ಚಿತ್ರಗಳು) ಅನ್ನು ಸಂಗ್ರಹಿಸಿದರು. ಈ ಡೇಟಾ ಸೆಟ್ ಅನ್ನು ಮೂರು ಲಿಂಗ ವರ್ಗೀಕರಣ ಉತ್ಪನ್ನಗಳ (Microsoft, IBM & Face++) ನ ನಿಖರತೆಯನ್ನು ಮೌಲ್ಯಮಾಪನ ಮಾಡಲು ಬಳಸಿದರು.
ಫಲಿತಾಂಶಗಳು ಒಟ್ಟಾರೆ ವರ್ಗೀಕರಣ ನಿಖರತೆ ಉತ್ತಮವಾಗಿದ್ದರೂ, ವಿವಿಧ ಉಪಗುಂಪುಗಳ ನಡುವೆ ದೋಷ ದರಗಳಲ್ಲಿ ಗಮನಾರ್ಹ ವ್ಯತ್ಯಾಸವಿತ್ತು - **ತಪ್ಪು ಲಿಂಗ ನಿರ್ಧಾರ** ಮಹಿಳೆಯರು ಅಥವಾ ಗಾಢ ಚರ್ಮದ ವ್ಯಕ್ತಿಗಳಲ್ಲಿ ಹೆಚ್ಚು ಕಂಡುಬಂದಿತು, ಇದು ಪಕ್ಷಪಾತದ ಸೂಚಕವಾಗಿದೆ.
**ಪ್ರಮುಖ ಫಲಿತಾಂಶಗಳು:** ಡೇಟಾ ಸೈನ್ಸ್‌ಗೆ ಹೆಚ್ಚು _ಪ್ರತಿನಿಧಿ ಡೇಟಾ ಸೆಟ್ಗಳು_ (ಸಮತೋಲನ ಉಪಗುಂಪುಗಳು) ಮತ್ತು ಹೆಚ್ಚು _ಸಮಾವೇಶಿ ತಡಗಳು_ (ವಿವಿಧ ಹಿನ್ನೆಲೆಗಳು) ಅಗತ್ಯವಿದೆ ಎಂದು ಜಾಗೃತಿ ಮೂಡಿಸಿತು, ಇಂತಹ ಪಕ್ಷಪಾತಗಳನ್ನು AI ಪರಿಹಾರಗಳಲ್ಲಿ ಮೊದಲೇ ಗುರುತಿಸಿ ಅಳಿಸಲು ಅಥವಾ ಕಡಿಮೆ ಮಾಡಲು. ಈ ರೀತಿಯ ಸಂಶೋಧನಾ ಪ್ರಯತ್ನಗಳು ಹಲವಾರು ಸಂಸ್ಥೆಗಳಲ್ಲಿ _ಜವಾಬ್ದಾರಿಯುತ AI_ ಸಿದ್ಧಾಂತಗಳು ಮತ್ತು ಅಭ್ಯಾಸಗಳನ್ನು ನಿರ್ಧರಿಸಲು ಸಹಾಯಕವಾಗಿವೆ, AI ಉತ್ಪನ್ನಗಳು ಮತ್ತು ಪ್ರಕ್ರಿಯೆಗಳ ನ್ಯಾಯತೆಯನ್ನು ಸುಧಾರಿಸಲು.
**Microsoft ನಲ್ಲಿ ಸಂಬಂಧಿತ ಸಂಶೋಧನಾ ಪ್ರಯತ್ನಗಳನ್ನು ತಿಳಿಯಲು ಬಯಸುವಿರಾ?**
* ಕೃತಕ ಬುದ್ಧಿಮತ್ತೆಯ ಮೇಲೆ [Microsoft Research Projects](https://www.microsoft.com/research/research-area/artificial-intelligence/?facet%5Btax%5D%5Bmsr-research-area%5D%5B%5D=13556&facet%5Btax%5D%5Bmsr-content-type%5D%5B%5D=msr-project) ಅನ್ನು ಪರಿಶೀಲಿಸಿ.
* [Microsoft Research Data Science Summer School](https://www.microsoft.com/en-us/research/academic-program/data-science-summer-school/) ನಿಂದ ವಿದ್ಯಾರ್ಥಿ ಯೋಜನೆಗಳನ್ನು ಅನ್ವೇಷಿಸಿ.
* [Fairlearn](https://fairlearn.org/) ಯೋಜನೆ ಮತ್ತು [Responsible AI](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1%3aprimaryr6) ಉಪಕ್ರಮಗಳನ್ನು ಪರಿಶೀಲಿಸಿ.
## ಡೇಟಾ ಸೈನ್ಸ್ + ಮಾನವಶಾಸ್ತ್ರ
| ![ [(@sketchthedocs)](https://sketchthedocs.dev) ಅವರ ಸ್ಕೆಚ್ ನೋಟ್ ](../../sketchnotes/20-DataScience-Humanities.png) |
| :---------------------------------------------------------------------------------------------------------------: |
| ಡೇಟಾ ಸೈನ್ಸ್ ಮತ್ತು ಡಿಜಿಟಲ್ ಮಾನವಶಾಸ್ತ್ರ - _[@nitya](https://twitter.com/nitya) ಅವರ ಸ್ಕೆಚ್ ನೋಟ್_ |
ಡಿಜಿಟಲ್ ಮಾನವಶಾಸ್ತ್ರವನ್ನು [ಇದಾಗಿಯೇ ವ್ಯಾಖ್ಯಾನಿಸಲಾಗಿದೆ](https://digitalhumanities.stanford.edu/about-dh-stanford) "ಗಣಕಯಂತ್ರ ವಿಧಾನಗಳನ್ನು ಮಾನವಶಾಸ್ತ್ರೀಯ ವಿಚಾರಣೆಯೊಂದಿಗೆ ಸಂಯೋಜಿಸುವ ಅಭ್ಯಾಸಗಳು ಮತ್ತು ವಿಧಾನಗಳ ಸಂಗ್ರಹ" ಎಂದು. [ಸ್ಟ್ಯಾನ್‌ಫರ್ಡ್ ಯೋಜನೆಗಳು](https://digitalhumanities.stanford.edu/projects) _"ಇತಿಹಾಸವನ್ನು ಮರುಪ್ರಾರಂಭಿಸುವುದು"_ ಮತ್ತು _"ಕಾವ್ಯಾತ್ಮಕ ಚಿಂತನೆ"_ ಮುಂತಾದವುಗಳು [ಡಿಜಿಟಲ್ ಮಾನವಶಾಸ್ತ್ರ ಮತ್ತು ಡೇಟಾ ಸೈನ್ಸ್](https://digitalhumanities.stanford.edu/digital-humanities-and-data-science) ನಡುವಿನ ಸಂಪರ್ಕವನ್ನು ತೋರಿಸುತ್ತವೆ - ಜಾಲ ವಿಶ್ಲೇಷಣೆ, ಮಾಹಿತಿ ದೃಶ್ಯೀಕರಣ, ಸ್ಥಳೀಯ ಮತ್ತು ಪಠ್ಯ ವಿಶ್ಲೇಷಣೆಗಳಂತಹ ತಂತ್ರಗಳನ್ನು ಒತ್ತಿ ಹೇಳುತ್ತವೆ, ಇದು ನಮಗೆ ಐತಿಹಾಸಿಕ ಮತ್ತು ಸಾಹಿತ್ಯ ಡೇಟಾ ಸೆಟ್‌ಗಳನ್ನು ಮರುಪರಿಶೀಲಿಸಲು ಮತ್ತು ಹೊಸ ಒಳನೋಟ ಮತ್ತು ದೃಷ್ಟಿಕೋನಗಳನ್ನು ಪಡೆಯಲು ಸಹಾಯ ಮಾಡುತ್ತದೆ.
*ಈ ಕ್ಷೇತ್ರದಲ್ಲಿ ಯೋಜನೆಯನ್ನು ಅನ್ವೇಷಿಸಲು ಮತ್ತು ವಿಸ್ತರಿಸಲು ಬಯಸುತ್ತೀರಾ?*
["ಎಮಿಲಿ ಡಿಕಿನ್ಸನ್ ಮತ್ತು ಮನೋಭಾವದ ಮೀಟರ್"](https://gist.github.com/jlooper/ce4d102efd057137bc000db796bfd671) ಅನ್ನು ಪರಿಶೀಲಿಸಿ - ಇದು [ಜೆನ್ ಲೂಪರ್](https://twitter.com/jenlooper) ಅವರ ಒಳ್ಳೆಯ ಉದಾಹರಣೆ, ಇದು ಡೇಟಾ ಸೈನ್ಸ್ ಬಳಸಿ ಪರಿಚಿತ ಕಾವ್ಯವನ್ನು ಮರುಪರಿಶೀಲಿಸಿ ಅದರ ಅರ್ಥ ಮತ್ತು ಲೇಖಕರ ಕೊಡುಗೆಗಳನ್ನು ಹೊಸ ಸಂದರ್ಭಗಳಲ್ಲಿ ಮೌಲ್ಯಮಾಪನ ಮಾಡುವುದನ್ನು ಕೇಳುತ್ತದೆ. ಉದಾಹರಣೆಗೆ, _ನಾವು ಕಾವ್ಯವನ್ನು ರಚಿಸಿದ ಋತುವನ್ನು ಅದರ ಧ್ವನಿ ಅಥವಾ ಭಾವನೆಯನ್ನು ವಿಶ್ಲೇಷಿಸುವ ಮೂಲಕ ಭವಿಷ್ಯವಾಣಿ ಮಾಡಬಹುದೇ_ - ಮತ್ತು ಇದು ಲೇಖಕರ ಮನೋಸ್ಥಿತಿಯನ್ನು ಆ ಅವಧಿಯಲ್ಲಿ ಏನು ಹೇಳುತ್ತದೆ?
ಆ ಪ್ರಶ್ನೆಗೆ ಉತ್ತರಿಸಲು, ನಾವು ನಮ್ಮ ಡೇಟಾ ಸೈನ್ಸ್ ಜೀವನಚಕ್ರದ ಹಂತಗಳನ್ನು ಅನುಸರಿಸುತ್ತೇವೆ:
* [`ಡೇಟಾ ಸಂಗ್ರಹಣೆ`](https://gist.github.com/jlooper/ce4d102efd057137bc000db796bfd671#acquiring-the-dataset) - ವಿಶ್ಲೇಷಣೆಗೆ ಸಂಬಂಧಿಸಿದ ಡೇಟಾ ಸೆಟ್ ಸಂಗ್ರಹಿಸಲು. ಆಯ್ಕೆಗಳು API ಬಳಕೆ (ಉದಾ: [Poetry DB API](https://poetrydb.org/index.html)) ಅಥವಾ ವೆಬ್ ಪುಟಗಳನ್ನು ಸ್ಕ್ರ್ಯಾಪ್ ಮಾಡುವುದು (ಉದಾ: [Project Gutenberg](https://www.gutenberg.org/files/12242/12242-h/12242-h.htm)) [Scrapy](https://scrapy.org/) ಮುಂತಾದ ಸಾಧನಗಳೊಂದಿಗೆ.
* [`ಡೇಟಾ ಶುದ್ಧೀಕರಣ`](https://gist.github.com/jlooper/ce4d102efd057137bc000db796bfd671#clean-the-data) - ಪಠ್ಯವನ್ನು ಹೇಗೆ ಸ್ವರೂಪಗೊಳಿಸಬಹುದು, ಶುದ್ಧೀಕರಿಸಬಹುದು ಮತ್ತು ಸರಳೀಕರಿಸಬಹುದು ಎಂಬುದನ್ನು Visual Studio Code ಮತ್ತು Microsoft Excel ಮುಂತಾದ ಮೂಲಭೂತ ಸಾಧನಗಳೊಂದಿಗೆ ವಿವರಿಸುತ್ತದೆ.
* [`ಡೇಟಾ ವಿಶ್ಲೇಷಣೆ`](https://gist.github.com/jlooper/ce4d102efd057137bc000db796bfd671#working-with-the-data-in-a-notebook) - ಈಗ ನಾವು ಡೇಟಾ ಸೆಟ್ ಅನ್ನು Python ಪ್ಯಾಕೇಜ್‌ಗಳು (pandas, numpy ಮತ್ತು matplotlib) ಬಳಸಿ "ನೋಟ್ಬುಕ್‌ಗಳಲ್ಲಿ" ಆಮದುಮಾಡಿ ವಿಶ್ಲೇಷಣೆ ಮಾಡಲು ಹೇಗೆ ಮಾಡಬಹುದು ಎಂಬುದನ್ನು ವಿವರಿಸುತ್ತದೆ.
* [`ಭಾವ ವಿಶ್ಲೇಷಣೆ`](https://gist.github.com/jlooper/ce4d102efd057137bc000db796bfd671#sentiment-analysis-using-cognitive-services) - Text Analytics ಮುಂತಾದ ಕ್ಲೌಡ್ ಸೇವೆಗಳನ್ನು, [Power Automate](https://flow.microsoft.com/en-us/) ಮುಂತಾದ ಕಡಿಮೆ ಕೋಡ್ ಸಾಧನಗಳನ್ನು ಬಳಸಿ ಸ್ವಯಂಚಾಲಿತ ಡೇಟಾ ಪ್ರಕ್ರಿಯೆ ಕಾರ್ಯಪ್ರವಾಹಗಳಿಗೆ ಹೇಗೆ ಸಂಯೋಜಿಸಬಹುದು ಎಂಬುದನ್ನು ವಿವರಿಸುತ್ತದೆ.
ಈ ಕಾರ್ಯಪ್ರವಾಹವನ್ನು ಬಳಸಿ, ನಾವು ಕಾವ್ಯಗಳ ಭಾವನೆಯಲ್ಲಿ ಋತುವಿನ ಪ್ರಭಾವಗಳನ್ನು ಅನ್ವೇಷಿಸಬಹುದು ಮತ್ತು ಲೇಖಕರ ಬಗ್ಗೆ ನಮ್ಮದೇ ದೃಷ್ಟಿಕೋನಗಳನ್ನು ರೂಪಿಸಬಹುದು. ನೀವು ಸ್ವತಃ ಪ್ರಯತ್ನಿಸಿ - ನಂತರ ನೋಟ್ಬುಕ್ ಅನ್ನು ವಿಸ್ತರಿಸಿ ಇತರ ಪ್ರಶ್ನೆಗಳನ್ನು ಕೇಳಿ ಅಥವಾ ಡೇಟಾವನ್ನು ಹೊಸ ರೀತಿಯಲ್ಲಿ ದೃಶ್ಯೀಕರಿಸಿ!
> ನೀವು [ಡಿಜಿಟಲ್ ಮಾನವಶಾಸ್ತ್ರ ಉಪಕರಣಸಂಪುಟ](https://github.com/Digital-Humanities-Toolkit) ನ ಕೆಲವು ಸಾಧನಗಳನ್ನು ಈ ವಿಚಾರಣಾ ಮಾರ್ಗಗಳನ್ನು ಅನುಸರಿಸಲು ಬಳಸಬಹುದು
## ಡೇಟಾ ಸೈನ್ಸ್ + ಸ್ಥಿರತೆ
| ![ [(@sketchthedocs)](https://sketchthedocs.dev) ಅವರ ಸ್ಕೆಚ್ ನೋಟ್ ](../../sketchnotes/20-DataScience-Sustainability.png) |
| :---------------------------------------------------------------------------------------------------------------: |
| ಡೇಟಾ ಸೈನ್ಸ್ ಮತ್ತು ಸ್ಥಿರತೆ - _[@nitya](https://twitter.com/nitya) ಅವರ ಸ್ಕೆಚ್ ನೋಟ್_ |
[2030 ಸ್ಥಿರ ಅಭಿವೃದ್ಧಿ ಕಾರ್ಯಯೋಜನೆ](https://sdgs.un.org/2030agenda) - 2015 ರಲ್ಲಿ ಎಲ್ಲಾ ಯುನೈಟೆಡ್ ನೇಷನ್ಸ್ ಸದಸ್ಯರಿಂದ ಅಂಗೀಕರಿಸಲ್ಪಟ್ಟ - 17 ಗುರಿಗಳನ್ನು ಗುರುತಿಸುತ್ತದೆ, ಅವುಗಳಲ್ಲಿ ಕೆಲವು **ಗ್ರಹವನ್ನು ರಕ್ಷಿಸುವುದು** ಮತ್ತು ಹವಾಮಾನ ಬದಲಾವಣೆಯ ಪರಿಣಾಮಗಳನ್ನು ತಡೆಯುವದಕ್ಕೆ ಕೇಂದ್ರೀಕರಿಸುತ್ತವೆ. [Microsoft Sustainability](https://www.microsoft.com/en-us/sustainability) ಉಪಕ್ರಮವು ಈ ಗುರಿಗಳನ್ನು ಬೆಂಬಲಿಸುತ್ತದೆ, ತಂತ್ರಜ್ಞಾನ ಪರಿಹಾರಗಳು 2030 ರೊಳಗೆ ಕಾರ್ಬನ್ ನೆಗೆಟಿವ್, ನೀರು ಧನಾತ್ಮಕ, ಶೂನ್ಯ ತ್ಯಾಜ್ಯ ಮತ್ತು ಜೈವ ವೈವಿಧ್ಯತೆಯ ಮೇಲೆ ಕೇಂದ್ರೀಕರಿಸಿ ಹೆಚ್ಚು ಸ್ಥಿರ ಭವಿಷ್ಯಗಳನ್ನು ನಿರ್ಮಿಸಲು ಸಹಾಯ ಮಾಡುವ ಮಾರ್ಗಗಳನ್ನು ಅನ್ವೇಷಿಸುತ್ತದೆ.
ಈ ಸವಾಲುಗಳನ್ನು ವ್ಯಾಪಕ ಮತ್ತು ಸಮಯೋಚಿತವಾಗಿ ಎದುರಿಸಲು ಕ್ಲೌಡ್-ಮಟ್ಟದ ಚಿಂತನೆ ಮತ್ತು ದೊಡ್ಡ ಪ್ರಮಾಣದ ಡೇಟಾ ಅಗತ್ಯವಿದೆ. [Planetary Computer](https://planetarycomputer.microsoft.com/) ಉಪಕ್ರಮವು ಈ ಪ್ರಯತ್ನದಲ್ಲಿ ಡೇಟಾ ವಿಜ್ಞಾನಿಗಳು ಮತ್ತು ಅಭಿವೃದ್ಧಿಪಡಿಸುವವರಿಗೆ ಸಹಾಯ ಮಾಡಲು 4 ಘಟಕಗಳನ್ನು ಒದಗಿಸುತ್ತದೆ:
* [ಡೇಟಾ ಕ್ಯಾಟಲಾಗ್](https://planetarycomputer.microsoft.com/catalog) - ಭೂಮಿಯ ವ್ಯವಸ್ಥೆಗಳ ಪೆಟಾಬೈಟ್‌ಗಳ ಡೇಟಾ (ಉಚಿತ ಮತ್ತು ಅಜೂರ್-ಹೋಸ್ಟ್ ಮಾಡಲಾಗಿದೆ).
* [ಪ್ಲಾನೆಟರಿ API](https://planetarycomputer.microsoft.com/docs/reference/stac/) - ಬಳಕೆದಾರರಿಗೆ ಸ್ಥಳ ಮತ್ತು ಕಾಲದಾದ್ಯಾಂತ ಸಂಬಂಧಿತ ಡೇಟಾವನ್ನು ಹುಡುಕಲು ಸಹಾಯ ಮಾಡುತ್ತದೆ.
* [ಹಬ್](https://planetarycomputer.microsoft.com/docs/overview/environment/) - ವಿಜ್ಞಾನಿಗಳಿಗೆ ಭಾರೀ ಭೂಸ್ಥಳೀಯ ಡೇಟಾಸೆಟ್‌ಗಳನ್ನು ಪ್ರಕ್ರಿಯೆಗೊಳಿಸಲು ನಿರ್ವಹಿತ ಪರಿಸರ.
* [ಅಪ್ಲಿಕೇಶನ್ಗಳು](https://planetarycomputer.microsoft.com/applications) - ಸ್ಥಿರತೆಯ洞察ಗಳಿಗಾಗಿ ಬಳಕೆ ಪ್ರಕರಣಗಳು ಮತ್ತು ಉಪಕರಣಗಳನ್ನು ಪ್ರದರ್ಶಿಸಿ.
**ಪ್ಲಾನೆಟರಿ ಕಂಪ್ಯೂಟರ್ ಪ್ರಾಜೆಕ್ಟ್ ಪ್ರಸ್ತುತ ಪೂರ್ವವೀಕ್ಷಣೆಯಲ್ಲಿ ಇದೆ (ಸೆಪ್ಟೆಂಬರ್ 2021 ರಂತೆ)** - ಡೇಟಾ ಸೈನ್ಸ್ ಬಳಸಿ ಸ್ಥಿರತೆ ಪರಿಹಾರಗಳಿಗೆ ನೀವು ಹೇಗೆ ಕೊಡುಗೆ ನೀಡಬಹುದು ಎಂಬುದನ್ನು ಇಲ್ಲಿ ತಿಳಿಸಲಾಗಿದೆ.
* ಅನ್ವೇಷಣೆಯನ್ನು ಪ್ರಾರಂಭಿಸಲು ಮತ್ತು ಸಹೋದ್ಯೋಗಿಗಳೊಂದಿಗೆ ಸಂಪರ್ಕಿಸಲು [ಪ್ರವೇಶವನ್ನು ವಿನಂತಿಸಿ](https://planetarycomputer.microsoft.com/account/request).
* ಬೆಂಬಲಿತ ಡೇಟಾಸೆಟ್‌ಗಳು ಮತ್ತು APIಗಳನ್ನು ಅರ್ಥಮಾಡಿಕೊಳ್ಳಲು [ದಾಖಲೆಗಳನ್ನು ಅನ್ವೇಷಿಸಿ](https://planetarycomputer.microsoft.com/docs/overview/about).
* ಅಪ್ಲಿಕೇಶನ್ ಆಲೋಚನೆಗಳಿಗೆ ಪ್ರೇರಣೆಯಾಗಿ [ಪರಿಸರ ವ್ಯವಸ್ಥೆ ಮೇಲ್ವಿಚಾರಣೆ](https://analytics-lab.org/ecosystemmonitoring/) ಮುಂತಾದ ಅಪ್ಲಿಕೇಶನ್ಗಳನ್ನು ಅನ್ವೇಷಿಸಿ.
ಹವಾಮಾನ ಬದಲಾವಣೆ ಮತ್ತು ಅರಣ್ಯ ನಾಶದಂತಹ ಕ್ಷೇತ್ರಗಳಲ್ಲಿ ಸಂಬಂಧಿತ洞察ಗಳನ್ನು ಬಹಿರಂಗಪಡಿಸಲು ಅಥವಾ ವೃದ್ಧಿಸಲು ನೀವು ಡೇಟಾ ದೃಶ್ಯೀಕರಣವನ್ನು ಹೇಗೆ ಬಳಸಬಹುದು ಎಂದು ಯೋಚಿಸಿ. ಅಥವಾ洞察ಗಳನ್ನು ಬಳಸಿಕೊಂಡು ಹೆಚ್ಚು ಸ್ಥಿರ ಜೀವನಕ್ಕಾಗಿ ವರ್ತನೆ ಬದಲಾವಣೆಗಳನ್ನು ಪ್ರೇರೇಪಿಸುವ ಹೊಸ ಬಳಕೆದಾರ ಅನುಭವಗಳನ್ನು ಸೃಷ್ಟಿಸುವ ಬಗ್ಗೆ ಯೋಚಿಸಿ.
## ಡೇಟಾ ಸೈನ್ಸ್ + ವಿದ್ಯಾರ್ಥಿಗಳು
ನಾವು ಕೈಗಾರಿಕೆ ಮತ್ತು ಸಂಶೋಧನೆಯಲ್ಲಿ ನೈಜ ಜಗತ್ತಿನ ಅಪ್ಲಿಕೇಶನ್‌ಗಳ ಬಗ್ಗೆ ಮಾತನಾಡಿದ್ದೇವೆ ಮತ್ತು ಡಿಜಿಟಲ್ ಮಾನವಶಾಸ್ತ್ರ ಮತ್ತು ಸ್ಥಿರತೆಯಲ್ಲಿ ಡೇಟಾ ಸೈನ್ಸ್ ಅಪ್ಲಿಕೇಶನ್ ಉದಾಹರಣೆಗಳನ್ನು ಅನ್ವೇಷಿಸಿದ್ದೇವೆ. ಆದ್ದರಿಂದ ನೀವು ಡೇಟಾ ಸೈನ್ಸ್ ಆರಂಭಿಕರಾಗಿ ನಿಮ್ಮ ಕೌಶಲ್ಯಗಳನ್ನು ಹೇಗೆ ನಿರ್ಮಿಸಬಹುದು ಮತ್ತು ನಿಮ್ಮ ಪರಿಣತಿಯನ್ನು ಹಂಚಿಕೊಳ್ಳಬಹುದು?
ನಿಮಗೆ ಪ್ರೇರಣೆ ನೀಡಲು ಕೆಲವು ಡೇಟಾ ಸೈನ್ಸ್ ವಿದ್ಯಾರ್ಥಿ ಪ್ರಾಜೆಕ್ಟ್ ಉದಾಹರಣೆಗಳು ಇಲ್ಲಿವೆ.
* [MSR ಡೇಟಾ ಸೈನ್ಸ್ ಸಮರ್ ಶಾಲೆ](https://www.microsoft.com/en-us/research/academic-program/data-science-summer-school/#!projects) GitHub [ಪ್ರಾಜೆಕ್ಟ್‌ಗಳು](https://github.com/msr-ds3) ಜೊತೆಗೆ ಈ ವಿಷಯಗಳನ್ನು ಅನ್ವೇಷಿಸುತ್ತಿದೆ:
- [ಪೊಲೀಸ್ ಬಲ ಬಳಕೆಯಲ್ಲಿ ಜಾತಿ ಭೇದ](https://www.microsoft.com/en-us/research/video/data-science-summer-school-2019-replicating-an-empirical-analysis-of-racial-differences-in-police-use-of-force/) | [Github](https://github.com/msr-ds3/stop-question-frisk)
- [ಎನ್‌ವೈಸಿ ಸಬ್ವೇ ವ್ಯವಸ್ಥೆಯ ವಿಶ್ವಾಸಾರ್ಹತೆ](https://www.microsoft.com/en-us/research/video/data-science-summer-school-2018-exploring-the-reliability-of-the-nyc-subway-system/) | [Github](https://github.com/msr-ds3/nyctransit)
* [ವಸ್ತು ಸಂಸ್ಕೃತಿಯನ್ನು ಡಿಜಿಟೈಸ್ ಮಾಡುವುದು: ಸಿರಕಪ್‌ನಲ್ಲಿ ಸಾಮಾಜಿಕ-ಆರ್ಥಿಕ ವಿತರಣೆಗಳನ್ನು ಅನ್ವೇಷಿಸುವುದು](https://claremont.maps.arcgis.com/apps/Cascade/index.html?appid=bdf2aef0f45a4674ba41cd373fa23afc) - [Ornella Altunyan](https://twitter.com/ornelladotcom) ಮತ್ತು ಕ್ಲೇರ್‌ಮಾಂಟ್ ತಂಡದಿಂದ, [ArcGIS StoryMaps](https://storymaps.arcgis.com/) ಬಳಸಿ.
## 🚀 ಸವಾಲು
ಡೇಟಾ ಸೈನ್ಸ್ ಪ್ರಾಜೆಕ್ಟ್‌ಗಳನ್ನು ಶಿಫಾರಸು ಮಾಡುವ ಲೇಖನಗಳನ್ನು ಹುಡುಕಿ, ಅವು ಆರಂಭಿಕರಿಗೆ ಅನುಕೂಲಕರವಾಗಿರಲಿ - ಉದಾಹರಣೆಗೆ [ಈ 50 ವಿಷಯ ಪ್ರದೇಶಗಳು](https://www.upgrad.com/blog/data-science-project-ideas-topics-beginners/) ಅಥವಾ [ಈ 21 ಪ್ರಾಜೆಕ್ಟ್ ಆಲೋಚನೆಗಳು](https://www.intellspot.com/data-science-project-ideas) ಅಥವಾ [ಈ 16 ಮೂಲ ಕೋಡ್ ಹೊಂದಿರುವ ಪ್ರಾಜೆಕ್ಟ್‌ಗಳು](https://data-flair.training/blogs/data-science-project-ideas/) ನೀವು ವಿಶ್ಲೇಷಿಸಿ ಮರುಸಂಯೋಜಿಸಬಹುದು. ಮತ್ತು ನಿಮ್ಮ ಕಲಿಕೆಯ ಪ್ರಯಾಣಗಳನ್ನು ಬ್ಲಾಗ್ ಮಾಡುವುದು ಮತ್ತು ನಿಮ್ಮ洞察ಗಳನ್ನು ನಮ್ಮೆಲ್ಲರೊಂದಿಗೆ ಹಂಚಿಕೊಳ್ಳುವುದನ್ನು ಮರೆಯಬೇಡಿ.
## ಉಪನ್ಯಾಸೋತ್ತರ ಕ್ವಿಜ್
## [ಉಪನ್ಯಾಸೋತ್ತರ ಕ್ವಿಜ್](https://ff-quizzes.netlify.app/en/ds/quiz/39)
## ವಿಮರ್ಶೆ ಮತ್ತು ಸ್ವಯಂ ಅಧ್ಯಯನ
ಹೆಚ್ಚು ಬಳಕೆ ಪ್ರಕರಣಗಳನ್ನು ಅನ್ವೇಷಿಸಲು ಬಯಸುವಿರಾ? ಇಲ್ಲಿ ಕೆಲವು ಸಂಬಂಧಿತ ಲೇಖನಗಳಿವೆ:
* [17 ಡೇಟಾ ಸೈನ್ಸ್ ಅಪ್ಲಿಕೇಶನ್ಗಳು ಮತ್ತು ಉದಾಹರಣೆಗಳು](https://builtin.com/data-science/data-science-applications-examples) - ಜುಲೈ 2021
* [11 ನೈಜ ಜಗತ್ತಿನ ಅದ್ಭುತ ಡೇಟಾ ಸೈನ್ಸ್ ಅಪ್ಲಿಕೇಶನ್ಗಳು](https://myblindbird.com/data-science-applications-real-world/) - ಮೇ 2021
* [ನೈಜ ಜಗತ್ತಿನಲ್ಲಿ ಡೇಟಾ ಸೈನ್ಸ್](https://towardsdatascience.com/data-science-in-the-real-world/home) - ಲೇಖನ ಸಂಗ್ರಹ
* [12 ನೈಜ ಜಗತ್ತಿನ ಡೇಟಾ ಸೈನ್ಸ್ ಅಪ್ಲಿಕೇಶನ್ಗಳು ಉದಾಹರಣೆಗಳೊಂದಿಗೆ](https://www.scaler.com/blog/data-science-applications/) - ಮೇ 2024
* ಡೇಟಾ ಸೈನ್ಸ್: [ಶಿಕ್ಷಣ](https://data-flair.training/blogs/data-science-in-education/), [ಕೃಷಿ](https://data-flair.training/blogs/data-science-in-agriculture/), [ಹಣಕಾಸು](https://data-flair.training/blogs/data-science-in-finance/), [ಚಿತ್ರರಂಗ](https://data-flair.training/blogs/data-science-at-movies/), [ಆರೋಗ್ಯ ಸೇವೆ](https://onlinedegrees.sandiego.edu/data-science-health-care/) ಮತ್ತು ಇನ್ನಷ್ಟು.
## ನಿಯೋಜನೆ
[ಪ್ಲಾನೆಟರಿ ಕಂಪ್ಯೂಟರ್ ಡೇಟಾಸೆಟ್ ಅನ್ನು ಅನ್ವೇಷಿಸಿ](assignment.md)
---
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
**ಅಸ್ವೀಕಾರ**:
ಈ ದಸ್ತಾವೇಜು AI ಅನುವಾದ ಸೇವೆ [Co-op Translator](https://github.com/Azure/co-op-translator) ಬಳಸಿ ಅನುವಾದಿಸಲಾಗಿದೆ. ನಾವು ನಿಖರತೆಯಿಗಾಗಿ ಪ್ರಯತ್ನಿಸುತ್ತಿದ್ದರೂ, ಸ್ವಯಂಚಾಲಿತ ಅನುವಾದಗಳಲ್ಲಿ ತಪ್ಪುಗಳು ಅಥವಾ ಅಸತ್ಯತೆಗಳು ಇರಬಹುದು ಎಂದು ದಯವಿಟ್ಟು ಗಮನಿಸಿ. ಮೂಲ ಭಾಷೆಯಲ್ಲಿರುವ ಮೂಲ ದಸ್ತಾವೇಜನ್ನು ಅಧಿಕೃತ ಮೂಲವೆಂದು ಪರಿಗಣಿಸಬೇಕು. ಮಹತ್ವದ ಮಾಹಿತಿಗಾಗಿ, ವೃತ್ತಿಪರ ಮಾನವ ಅನುವಾದವನ್ನು ಶಿಫಾರಸು ಮಾಡಲಾಗುತ್ತದೆ. ಈ ಅನುವಾದ ಬಳಕೆಯಿಂದ ಉಂಟಾಗುವ ಯಾವುದೇ ತಪ್ಪು ಅರ್ಥಮಾಡಿಕೊಳ್ಳುವಿಕೆ ಅಥವಾ ತಪ್ಪು ವಿವರಣೆಗಳಿಗೆ ನಾವು ಹೊಣೆಗಾರರಾಗುವುದಿಲ್ಲ.
<!-- CO-OP TRANSLATOR DISCLAIMER END -->

@ -0,0 +1,52 @@
<!--
CO_OP_TRANSLATOR_METADATA:
{
"original_hash": "d1e05715f9d97de6c4f1fb0c5a4702c0",
"translation_date": "2025-12-19T16:59:35+00:00",
"source_file": "6-Data-Science-In-Wild/20-Real-World-Examples/assignment.md",
"language_code": "kn"
}
-->
# ಗ್ರಹಣ ಕಂಪ್ಯೂಟರ್ ಡೇಟಾಸೆಟ್ ಅನ್ನು ಅನ್ವೇಷಿಸಿ
## ಸೂಚನೆಗಳು
ಈ ಪಾಠದಲ್ಲಿ, ನಾವು ವಿವಿಧ ಡೇಟಾ ವಿಜ್ಞಾನ ಅನ್ವಯ ಕ್ಷೇತ್ರಗಳ ಬಗ್ಗೆ ಚರ್ಚೆ ಮಾಡಿದ್ದೇವೆ - ಸಂಶೋಧನೆ, ಸ್ಥಿರತೆ ಮತ್ತು ಡಿಜಿಟಲ್ ಮಾನವಶಾಸ್ತ್ರಕ್ಕೆ ಸಂಬಂಧಿಸಿದ ಉದಾಹರಣೆಗಳೊಂದಿಗೆ ಆಳವಾದ ಅಧ್ಯಯನಗಳೊಂದಿಗೆ. ಈ ನಿಯೋಜನೆಯಲ್ಲಿ, ನೀವು ಈ ಉದಾಹರಣೆಗಳಲ್ಲಿ ಒಂದನ್ನು ಹೆಚ್ಚಿನ ವಿವರದಲ್ಲಿ ಅನ್ವೇಷಿಸಿ, ಮತ್ತು ಸ್ಥಿರತೆ ಡೇಟಾ ಬಗ್ಗೆ ಒಳನೋಟಗಳನ್ನು ಪಡೆಯಲು ಡೇಟಾ ದೃಶ್ಯೀಕರಣ ಮತ್ತು ವಿಶ್ಲೇಷಣೆಯ ಬಗ್ಗೆ ನಿಮ್ಮ ಕೆಲವು ಕಲಿಕೆಗಳನ್ನು ಅನ್ವಯಿಸುವಿರಿ.
[ಗ್ರಹಣ ಕಂಪ್ಯೂಟರ್](https://planetarycomputer.microsoft.com/) ಯೋಜನೆಯಲ್ಲಿ ಖಾತೆ ಹೊಂದಿದರೆ ಪ್ರವೇಶಿಸಬಹುದಾದ ಡೇಟಾಸೆಟ್‌ಗಳು ಮತ್ತು API ಗಳು ಇವೆ - ನೀವು ನಿಯೋಜನೆಯ ಬೋನಸ್ ಹಂತವನ್ನು ಪ್ರಯತ್ನಿಸಲು ಪ್ರವೇಶಕ್ಕಾಗಿ ಒಂದು ಖಾತೆಯನ್ನು ವಿನಂತಿಸಬಹುದು. ಈ ತಾಣವು ಖಾತೆ ರಚಿಸದೆ ಬಳಸಬಹುದಾದ [ಎಕ್ಸ್‌ಪ್ಲೋರರ್](https://planetarycomputer.microsoft.com/explore) ವೈಶಿಷ್ಟ್ಯವನ್ನು ಸಹ ಒದಗಿಸುತ್ತದೆ.
`ಹಂತಗಳು:`
ಎಕ್ಸ್‌ಪ್ಲೋರರ್ ಇಂಟರ್ಫೇಸ್ (ಕೆಳಗಿನ ಸ್ಕ್ರೀನ್‌ಶಾಟ್‌ನಲ್ಲಿ ತೋರಿಸಲಾಗಿದೆ) ನಿಮಗೆ ಡೇಟಾಸೆಟ್ (ಕೊಟ್ಟಿರುವ ಆಯ್ಕೆಗಳಿಂದ), ಪೂರ್ವನಿರ್ಧರಿತ ಪ್ರಶ್ನೆ (ಡೇಟಾವನ್ನು ಫಿಲ್ಟರ್ ಮಾಡಲು) ಮತ್ತು ರೆಂಡರಿಂಗ್ ಆಯ್ಕೆಯನ್ನು (ಸಂಬಂಧಿತ ದೃಶ್ಯೀಕರಣವನ್ನು ಸೃಷ್ಟಿಸಲು) ಆಯ್ಕೆಮಾಡಲು ಅವಕಾಶ ನೀಡುತ್ತದೆ. ಈ ನಿಯೋಜನೆಯಲ್ಲಿ, ನಿಮ್ಮ ಕಾರ್ಯ:
1. [ಎಕ್ಸ್‌ಪ್ಲೋರರ್ ಡಾಕ್ಯುಮೆಂಟೇಶನ್](https://planetarycomputer.microsoft.com/docs/overview/explorer/) ಓದಿ - ಆಯ್ಕೆಗಳನ್ನು ಅರ್ಥಮಾಡಿಕೊಳ್ಳಿ.
2. ಡೇಟಾಸೆಟ್ [ಕ್ಯಾಟಲಾಗ್](https://planetarycomputer.microsoft.com/catalog) ಅನ್ನು ಅನ್ವೇಷಿಸಿ - ಪ್ರತಿ ಡೇಟಾಸೆಟ್ ಉದ್ದೇಶವನ್ನು ತಿಳಿದುಕೊಳ್ಳಿ.
3. ಎಕ್ಸ್‌ಪ್ಲೋರರ್ ಬಳಸಿ - ಆಸಕ್ತಿಯ ಡೇಟಾಸೆಟ್ ಆಯ್ಕೆಮಾಡಿ, ಸಂಬಂಧಿತ ಪ್ರಶ್ನೆ ಮತ್ತು ರೆಂಡರಿಂಗ್ ಆಯ್ಕೆಯನ್ನು ಆರಿಸಿ.
![ಗ್ರಹಣ ಕಂಪ್ಯೂಟರ್ ಎಕ್ಸ್‌ಪ್ಲೋರರ್](../../../../translated_images/planetary-computer-explorer.c1e95a9b053167d64e2e8e4347cfb689e47e2037c33103fc1bbea1a149d4f85b.kn.png)
`ನಿಮ್ಮ ಕಾರ್ಯ:`
ಈಗ ಬ್ರೌಸರ್‌ನಲ್ಲಿ ರೆಂಡರ್ ಆಗಿರುವ ದೃಶ್ಯೀಕರಣವನ್ನು ಅಧ್ಯಯನ ಮಾಡಿ ಮತ್ತು ಕೆಳಗಿನ ಪ್ರಶ್ನೆಗಳಿಗೆ ಉತ್ತರ ನೀಡಿ:
* ಡೇಟಾಸೆಟ್‌ನಲ್ಲಿ ಯಾವ _ವೈಶಿಷ್ಟ್ಯಗಳು_ ಇವೆ?
* ದೃಶ್ಯೀಕರಣವು ಯಾವ _ಒಳನೋಟಗಳು_ ಅಥವಾ ಫಲಿತಾಂಶಗಳನ್ನು ಒದಗಿಸುತ್ತದೆ?
* ಆ ಒಳನೋಟಗಳ _ಪ್ರಭಾವಗಳು_ ಯೋಜನೆಯ ಸ್ಥಿರತೆ ಗುರಿಗಳ ಮೇಲೆ ಏನು?
* ದೃಶ್ಯೀಕರಣದ _ಮಿತಿಗಳು_ ಯಾವುವು (ಅಂದರೆ, ನೀವು ಯಾವ ಒಳನೋಟವನ್ನು ಪಡೆಯಲಿಲ್ಲ?)
* ನೀವು ಕಚ್ಚಾ ಡೇಟಾವನ್ನು ಪಡೆದಿದ್ದರೆ, ಯಾವ _ವೈಕಲ್ಪಿಕ ದೃಶ್ಯೀಕರಣಗಳನ್ನು_ ನೀವು ಸೃಷ್ಟಿಸುತ್ತೀರಿ ಮತ್ತು ಏಕೆ?
`ಬೋನಸ್ ಪಾಯಿಂಟ್‌ಗಳು:`
ಖಾತೆಗೆ ಅರ್ಜಿ ಸಲ್ಲಿಸಿ - ಒಪ್ಪಿಗೆಯಾದಾಗ ಲಾಗಿನ್ ಆಗಿ.
* _ಲಾಚ್ ಹಬ್_ ಆಯ್ಕೆಯನ್ನು ಬಳಸಿ ಕಚ್ಚಾ ಡೇಟಾವನ್ನು ನೋಟ್ಬುಕ್‌ನಲ್ಲಿ ತೆರೆಯಿರಿ.
* ಡೇಟಾವನ್ನು ಸಂವಹನಾತ್ಮಕವಾಗಿ ಅನ್ವೇಷಿಸಿ, ನೀವು ಯೋಚಿಸಿದ ವೈಕಲ್ಪಿಕ ದೃಶ್ಯೀಕರಣಗಳನ್ನು ಅನುಷ್ಠಾನಗೊಳಿಸಿ.
* ಈಗ ನಿಮ್ಮ ಕಸ್ಟಮ್ ದೃಶ್ಯೀಕರಣಗಳನ್ನು ವಿಶ್ಲೇಷಿಸಿ - ನೀವು ಮೊದಲು ತಪ್ಪಿದ ಒಳನೋಟಗಳನ್ನು ಪಡೆಯಲು ಸಾಧ್ಯವಾಯಿತೇ?
## ಮೌಲ್ಯಮಾಪನ
ಉದಾಹರಣೀಯ | ತೃಪ್ತಿಕರ | ಸುಧಾರಣೆಯ ಅಗತ್ಯ
--- | --- | -- |
ಎಲ್ಲಾ ಐದು ಮೂಲ ಪ್ರಶ್ನೆಗಳಿಗೆ ಉತ್ತರ ನೀಡಲಾಗಿದೆ. ವಿದ್ಯಾರ್ಥಿ ಪ್ರಸ್ತುತ ಮತ್ತು ವೈಕಲ್ಪಿಕ ದೃಶ್ಯೀಕರಣಗಳು ಸ್ಥಿರತೆ ಗುರಿಗಳು ಅಥವಾ ಫಲಿತಾಂಶಗಳ ಬಗ್ಗೆ ಒಳನೋಟಗಳನ್ನು ಹೇಗೆ ಒದಗಿಸಬಹುದು ಎಂಬುದನ್ನು ಸ್ಪಷ್ಟವಾಗಿ ಗುರುತಿಸಿದ್ದಾರೆ.| ವಿದ್ಯಾರ್ಥಿ ಕನಿಷ್ಠ ಮೇಲಿನ 3 ಪ್ರಶ್ನೆಗಳಿಗೆ ವಿವರವಾಗಿ ಉತ್ತರಿಸಿದ್ದಾರೆ, ಎಕ್ಸ್‌ಪ್ಲೋರರ್‌ನಲ್ಲಿ ಪ್ರಾಯೋಗಿಕ ಅನುಭವವಿದೆ ಎಂದು ತೋರಿಸುತ್ತಾರೆ. | ವಿದ್ಯಾರ್ಥಿ ಹಲವಾರು ಪ್ರಶ್ನೆಗಳಿಗೆ ಉತ್ತರಿಸದಿದ್ದರೆ ಅಥವಾ ಅಲ್ಪ ವಿವರ ನೀಡಿದರೆ - ಯೋಜನೆಗಾಗಿ ಅರ್ಥಪೂರ್ಣ ಪ್ರಯತ್ನ ಮಾಡಲಿಲ್ಲ ಎಂದು ಸೂಚಿಸುತ್ತದೆ |
---
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
**ಅಸ್ವೀಕರಣ**:
ಈ ದಸ್ತಾವೇಜು AI ಅನುವಾದ ಸೇವೆ [Co-op Translator](https://github.com/Azure/co-op-translator) ಬಳಸಿ ಅನುವಾದಿಸಲಾಗಿದೆ. ನಾವು ನಿಖರತೆಯಿಗಾಗಿ ಪ್ರಯತ್ನಿಸುತ್ತಿದ್ದರೂ, ಸ್ವಯಂಚಾಲಿತ ಅನುವಾದಗಳಲ್ಲಿ ದೋಷಗಳು ಅಥವಾ ಅಸತ್ಯತೆಗಳು ಇರಬಹುದು ಎಂದು ದಯವಿಟ್ಟು ಗಮನಿಸಿ. ಮೂಲ ಭಾಷೆಯಲ್ಲಿರುವ ಮೂಲ ದಸ್ತಾವೇಜನ್ನು ಅಧಿಕೃತ ಮೂಲವೆಂದು ಪರಿಗಣಿಸಬೇಕು. ಮಹತ್ವದ ಮಾಹಿತಿಗಾಗಿ, ವೃತ್ತಿಪರ ಮಾನವ ಅನುವಾದವನ್ನು ಶಿಫಾರಸು ಮಾಡಲಾಗುತ್ತದೆ. ಈ ಅನುವಾದ ಬಳಕೆಯಿಂದ ಉಂಟಾಗುವ ಯಾವುದೇ ತಪ್ಪು ಅರ್ಥಮಾಡಿಕೊಳ್ಳುವಿಕೆ ಅಥವಾ ತಪ್ಪು ವಿವರಣೆಗಳಿಗೆ ನಾವು ಹೊಣೆಗಾರರಾಗುವುದಿಲ್ಲ.
<!-- CO-OP TRANSLATOR DISCLAIMER END -->

@ -0,0 +1,27 @@
<!--
CO_OP_TRANSLATOR_METADATA:
{
"original_hash": "07faf02ff163e609edf0b0308dc5d4e6",
"translation_date": "2025-12-19T13:36:52+00:00",
"source_file": "6-Data-Science-In-Wild/README.md",
"language_code": "kn"
}
-->
# ಕಾಡಿನಲ್ಲಿ ಡೇಟಾ ಸೈನ್ಸ್
ವ್ಯವಸ್ಥೆಗಳಾದ್ಯಂತ ಡೇಟಾ ಸೈನ್ಸ್‌ನ ನೈಜ ಜಗತ್ತಿನ ಅನ್ವಯಿಕೆಗಳು.
### ವಿಷಯಗಳು
1. [ನೈಜ ಜಗತ್ತಿನಲ್ಲಿ ಡೇಟಾ ಸೈನ್ಸ್](20-Real-World-Examples/README.md)
### ಕ್ರೆಡಿಟ್ಸ್
❤️ ಸಹಿತ ಬರೆಯಲಾಗಿದೆ [ನಿತ್ಯ ನಾರಸಿಂಹನ್](https://twitter.com/nitya)
---
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
**ಅಸ್ವೀಕರಣ**:
ಈ ದಸ್ತಾವೇಜು [Co-op Translator](https://github.com/Azure/co-op-translator) ಎಂಬ AI ಅನುವಾದ ಸೇವೆಯನ್ನು ಬಳಸಿ ಅನುವಾದಿಸಲಾಗಿದೆ. ನಾವು ಶುದ್ಧತೆಯತ್ತ ಪ್ರಯತ್ನಿಸುತ್ತಿದ್ದರೂ, ಸ್ವಯಂಚಾಲಿತ ಅನುವಾದಗಳಲ್ಲಿ ತಪ್ಪುಗಳು ಅಥವಾ ಅಸತ್ಯತೆಗಳು ಇರಬಹುದು ಎಂಬುದನ್ನು ದಯವಿಟ್ಟು ಗಮನಿಸಿ. ಮೂಲ ಭಾಷೆಯಲ್ಲಿರುವ ಮೂಲ ದಸ್ತಾವೇಜನ್ನು ಅಧಿಕೃತ ಮೂಲವೆಂದು ಪರಿಗಣಿಸಬೇಕು. ಪ್ರಮುಖ ಮಾಹಿತಿಗಾಗಿ, ವೃತ್ತಿಪರ ಮಾನವ ಅನುವಾದವನ್ನು ಶಿಫಾರಸು ಮಾಡಲಾಗುತ್ತದೆ. ಈ ಅನುವಾದ ಬಳಕೆಯಿಂದ ಉಂಟಾಗುವ ಯಾವುದೇ ತಪ್ಪು ಅರ್ಥಮಾಡಿಕೊಳ್ಳುವಿಕೆ ಅಥವಾ ತಪ್ಪು ವಿವರಣೆಗಳಿಗೆ ನಾವು ಹೊಣೆಗಾರರಾಗುವುದಿಲ್ಲ.
<!-- CO-OP TRANSLATOR DISCLAIMER END -->

@ -0,0 +1,374 @@
<!--
CO_OP_TRANSLATOR_METADATA:
{
"original_hash": "cc2e18ab65df63e75d3619c4752e9b22",
"translation_date": "2025-12-19T13:07:24+00:00",
"source_file": "AGENTS.md",
"language_code": "kn"
}
-->
# AGENTS.md
## ಪ್ರಾಜೆಕ್ಟ್ ಅವಲೋಕನ
ಡೇಟಾ ಸೈನ್ಸ್ ಫಾರ್ ಬಿಗಿನರ್ಸ್ ಎಂಬುದು ಮೈಕ್ರೋಸಾಫ್ಟ್ ಅಜೂರ್ ಕ್ಲೌಡ್ ಅಡ್ವೊಕೇಟ್ಸ್ ರಚಿಸಿದ ಸಮಗ್ರ 10-ವಾರ, 20-ಪಾಠಗಳ ಪಠ್ಯಕ್ರಮವಾಗಿದೆ. ಈ ರೆಪೊಸಿಟರಿ ಪ್ರಾಜೆಕ್ಟ್ ಆಧಾರಿತ ಪಾಠಗಳ ಮೂಲಕ ಮೂಲಭೂತ ಡೇಟಾ ಸೈನ್ಸ್ ತತ್ವಗಳನ್ನು ಕಲಿಸುವ ಕಲಿಕಾ ಸಂಪನ್ಮೂಲವಾಗಿದೆ, ಇದರಲ್ಲಿ ಜುಪೈಟರ್ ನೋಟ್ಬುಕ್‌ಗಳು, ಇಂಟರಾಕ್ಟಿವ್ ಕ್ವಿಜ್‌ಗಳು ಮತ್ತು ಹ್ಯಾಂಡ್ಸ್-ಆನ್ ಅಸೈನ್‌ಮೆಂಟ್‌ಗಳು ಸೇರಿವೆ.
**ಪ್ರಮುಖ ತಂತ್ರಜ್ಞಾನಗಳು:**
- **ಜುಪೈಟರ್ ನೋಟ್ಬುಕ್‌ಗಳು**: ಪೈಥಾನ್ 3 ಬಳಸಿ ಪ್ರಾಥಮಿಕ ಕಲಿಕಾ ಮಾಧ್ಯಮ
- **ಪೈಥಾನ್ ಲೈಬ್ರರಿಗಳು**: pandas, numpy, matplotlib ಡೇಟಾ ವಿಶ್ಲೇಷಣೆ ಮತ್ತು ದೃಶ್ಯೀಕರಣಕ್ಕಾಗಿ
- **Vue.js 2**: ಕ್ವಿಜ್ ಅಪ್ಲಿಕೇಶನ್ (quiz-app ಫೋಲ್ಡರ್)
- **Docsify**: ಆಫ್‌ಲೈನ್ ಪ್ರವೇಶಕ್ಕಾಗಿ ಡಾಕ್ಯುಮೆಂಟೇಶನ್ ಸೈಟ್ ಜನರೇಟರ್
- **Node.js/npm**: ಜಾವಾಸ್ಕ್ರಿಪ್ಟ್ ಘಟಕಗಳ ಪ್ಯಾಕೇಜ್ ನಿರ್ವಹಣೆ
- **Markdown**: ಎಲ್ಲಾ ಪಾಠ ವಿಷಯ ಮತ್ತು ಡಾಕ್ಯುಮೆಂಟೇಶನ್
**ವಾಸ್ತುಶಿಲ್ಪ:**
- ವ್ಯಾಪಕ ಅನುವಾದಗಳೊಂದಿಗೆ ಬಹುಭಾಷಾ ಶೈಕ್ಷಣಿಕ ರೆಪೊಸಿಟರಿ
- ಪಾಠ ಮಾಯಾಜಾಲಗಳಾಗಿ ರಚಿಸಲಾಗಿದೆ (1-ಪರಿಚಯದಿಂದ 6-ಡೇಟಾ-ಸೈನ್ಸ್-ಇನ್-ವೈಲ್ಡ್)
- ಪ್ರತಿ ಪಾಠದಲ್ಲಿ README, ನೋಟ್ಬುಕ್‌ಗಳು, ಅಸೈನ್‌ಮೆಂಟ್‌ಗಳು ಮತ್ತು ಕ್ವಿಜ್‌ಗಳು ಸೇರಿವೆ
- ಪೂರ್ವ/ಪೋಸ್ಟ್ ಪಾಠ ಮೌಲ್ಯಮಾಪನಕ್ಕಾಗಿ ಸ್ವತಂತ್ರ Vue.js ಕ್ವಿಜ್ ಅಪ್ಲಿಕೇಶನ್
- GitHub Codespaces ಮತ್ತು VS Code ಡೆವ್ ಕಂಟೈನರ್‌ಗಳಿಗೆ ಬೆಂಬಲ
## ಸೆಟಪ್ ಕಮಾಂಡ್‌ಗಳು
### ರೆಪೊಸಿಟರಿ ಸೆಟಪ್
```bash
# ರೆಪೊಸಿಟರಿಯನ್ನು ಕ್ಲೋನ್ ಮಾಡಿ (ಇನ್ನೂ ಕ್ಲೋನ್ ಮಾಡದಿದ್ದರೆ)
git clone https://github.com/microsoft/Data-Science-For-Beginners.git
cd Data-Science-For-Beginners
```
### ಪೈಥಾನ್ ಪರಿಸರ ಸೆಟಪ್
```bash
# ವರ್ಚುವಲ್ ಪರಿಸರವನ್ನು ರಚಿಸಿ (ಶಿಫಾರಸು ಮಾಡಲಾಗಿದೆ)
python -m venv venv
source venv/bin/activate # ವಿಂಡೋಸ್‌ನಲ್ಲಿ: venv\Scripts\activate
# ಸಾಮಾನ್ಯ ಡೇಟಾ ಸೈನ್ಸ್ ಲೈಬ್ರರಿಗಳನ್ನು ಸ್ಥಾಪಿಸಿ (requirements.txt ಇಲ್ಲ)
pip install jupyter pandas numpy matplotlib seaborn scikit-learn
```
### ಕ್ವಿಜ್ ಅಪ್ಲಿಕೇಶನ್ ಸೆಟಪ್
```bash
# ಕ್ವಿಜ್ ಅಪ್ಲಿಕೇಶನ್‌ಗೆ ನಾವಿಗೇಟ್ ಮಾಡಿ
cd quiz-app
# ಅವಲಂಬನೆಗಳನ್ನು ಸ್ಥಾಪಿಸಿ
npm install
# ಅಭಿವೃದ್ಧಿ ಸರ್ವರ್ ಪ್ರಾರಂಭಿಸಿ
npm run serve
# ಉತ್ಪಾದನೆಗಾಗಿ ನಿರ್ಮಿಸಿ
npm run build
# ಲಿಂಟ್ ಮಾಡಿ ಮತ್ತು ಫೈಲ್‌ಗಳನ್ನು ಸರಿಪಡಿಸಿ
npm run lint
```
### Docsify ಡಾಕ್ಯುಮೆಂಟೇಶನ್ ಸರ್ವರ್
```bash
# ಡಾಕ್ಸಿಫೈ ಅನ್ನು ಜಾಗತಿಕವಾಗಿ ಸ್ಥಾಪಿಸಿ
npm install -g docsify-cli
# ಡಾಕ್ಯುಮೆಂಟೇಶನ್ ಅನ್ನು ಸ್ಥಳೀಯವಾಗಿ ಸೇವೆ ಮಾಡಿ
docsify serve
# ಡಾಕ್ಯುಮೆಂಟೇಶನ್ localhost:3000 ನಲ್ಲಿ ಲಭ್ಯವಿರುತ್ತದೆ
```
### ದೃಶ್ಯೀಕರಣ ಪ್ರಾಜೆಕ್ಟ್‌ಗಳ ಸೆಟಪ್
meaningful-visualizations (ಪಾಠ 13) ಮುಂತಾದ ದೃಶ್ಯೀಕರಣ ಪ್ರಾಜೆಕ್ಟ್‌ಗಳಿಗೆ:
```bash
# ಸ್ಟಾರ್ಟರ್ ಅಥವಾ ಸೊಲ್ಯೂಶನ್ ಫೋಲ್ಡರ್‌ಗೆ ನ್ಯಾವಿಗೇಟ್ ಮಾಡಿ
cd 3-Data-Visualization/13-meaningful-visualizations/starter
# ಅವಲಂಬನೆಗಳನ್ನು ಸ್ಥಾಪಿಸಿ
npm install
# ಡೆವಲಪ್‌ಮೆಂಟ್ ಸರ್ವರ್ ಪ್ರಾರಂಭಿಸಿ
npm run serve
# ಉತ್ಪಾದನೆಗಾಗಿ ನಿರ್ಮಿಸಿ
npm run build
# ಫೈಲ್‌ಗಳನ್ನು ಲಿಂಟ್ ಮಾಡಿ
npm run lint
```
## ಅಭಿವೃದ್ಧಿ ಕಾರ್ಯಪ್ರವಾಹ
### ಜುಪೈಟರ್ ನೋಟ್ಬುಕ್‌ಗಳೊಂದಿಗೆ ಕೆಲಸ
1. ರೆಪೊಸಿಟರಿ ರೂಟ್‌ನಲ್ಲಿ ಜುಪೈಟರ್ ಪ್ರಾರಂಭಿಸಿ: `jupyter notebook`
2. ಬೇಕಾದ ಪಾಠ ಫೋಲ್ಡರ್‌ಗೆ ನ್ಯಾವಿಗೇಟ್ ಮಾಡಿ
3. ವ್ಯಾಯಾಮಗಳನ್ನು ಮಾಡಲು `.ipynb` ಫೈಲ್‌ಗಳನ್ನು ತೆರೆಯಿರಿ
4. ನೋಟ್ಬುಕ್‌ಗಳು ಸ್ವಯಂ-ಸಂಯೋಜಿತವಾಗಿದ್ದು ವಿವರಣೆಗಳು ಮತ್ತು ಕೋಡ್ ಸೆಲ್‌ಗಳನ್ನು ಒಳಗೊಂಡಿವೆ
5. ಹೆಚ್ಚಿನ ನೋಟ್ಬುಕ್‌ಗಳು pandas, numpy ಮತ್ತು matplotlib ಬಳಸುತ್ತವೆ - ಇವುಗಳನ್ನು ಸ್ಥಾಪಿಸಿಕೊಳ್ಳಿ
### ಪಾಠ ರಚನೆ
ಪ್ರತಿ ಪಾಠ ಸಾಮಾನ್ಯವಾಗಿ ಹೊಂದಿರುವುದು:
- `README.md` - ಸಿದ್ಧಾಂತ ಮತ್ತು ಉದಾಹರಣೆಗಳೊಂದಿಗೆ ಮುಖ್ಯ ಪಾಠ ವಿಷಯ
- `notebook.ipynb` - ಹ್ಯಾಂಡ್ಸ್-ಆನ್ ಜುಪೈಟರ್ ನೋಟ್ಬುಕ್ ವ್ಯಾಯಾಮಗಳು
- `assignment.ipynb` ಅಥವಾ `assignment.md` - ಅಭ್ಯಾಸ ಅಸೈನ್‌ಮೆಂಟ್‌ಗಳು
- `solution/` ಫೋಲ್ಡರ್ - ಪರಿಹಾರ ನೋಟ್ಬುಕ್‌ಗಳು ಮತ್ತು ಕೋಡ್
- `images/` ಫೋಲ್ಡರ್ - ಬೆಂಬಲ ದೃಶ್ಯ ಸಾಮಗ್ರಿಗಳು
### ಕ್ವಿಜ್ ಅಪ್ಲಿಕೇಶನ್ ಅಭಿವೃದ್ಧಿ
- ಅಭಿವೃದ್ಧಿ ಸಮಯದಲ್ಲಿ ಹಾಟ್-ರಿಲೋಡ್ ಹೊಂದಿರುವ Vue.js 2 ಅಪ್ಲಿಕೇಶನ್
- ಕ್ವಿಜ್‌ಗಳು `quiz-app/src/assets/translations/` ನಲ್ಲಿ ಸಂಗ್ರಹಿಸಲಾಗಿದೆ
- ಪ್ರತಿ ಭಾಷೆಗೆ ತನ್ನದೇ ಆದ ಅನುವಾದ ಫೋಲ್ಡರ್ ಇದೆ (en, fr, es, ಇತ್ಯಾದಿ)
- ಕ್ವಿಜ್ ಸಂಖ್ಯೆ 0 ರಿಂದ ಪ್ರಾರಂಭವಾಗಿ 39 ರವರೆಗೆ (ಒಟ್ಟು 40 ಕ್ವಿಜ್‌ಗಳು)
### ಅನುವಾದಗಳನ್ನು ಸೇರಿಸುವುದು
- ಅನುವಾದಗಳು ರೆಪೊಸಿಟರಿ ರೂಟ್‌ನ `translations/` ಫೋಲ್ಡರ್‌ನಲ್ಲಿ ಇರುತ್ತವೆ
- ಪ್ರತಿ ಭಾಷೆಗೆ ಇಂಗ್ಲಿಷ್‌ನಿಂದ ಪೂರ್ಣ ಪಾಠ ರಚನೆ ಪ್ರತಿಬಿಂಬಿತವಾಗಿದೆ
- GitHub Actions ಮೂಲಕ ಸ್ವಯಂಚಾಲಿತ ಅನುವಾದ (co-op-translator.yml)
## ಪರೀಕ್ಷಾ ಸೂಚನೆಗಳು
### ಕ್ವಿಜ್ ಅಪ್ಲಿಕೇಶನ್ ಪರೀಕ್ಷೆ
```bash
cd quiz-app
# ಲಿಂಟ್ ಪರಿಶೀಲನೆಗಳನ್ನು ನಡೆಸಿ
npm run lint
# ನಿರ್ಮಾಣ ಪ್ರಕ್ರಿಯೆಯನ್ನು ಪರೀಕ್ಷಿಸಿ
npm run build
# ಕೈಯಿಂದ ಪರೀಕ್ಷೆ: ಡೆವ್ ಸರ್ವರ್ ಪ್ರಾರಂಭಿಸಿ ಮತ್ತು ಕ್ವಿಜ್ ಕಾರ್ಯಕ್ಷಮತೆಯನ್ನು ಪರಿಶೀಲಿಸಿ
npm run serve
```
### ನೋಟ್ಬುಕ್ ಪರೀಕ್ಷೆ
- ನೋಟ್ಬುಕ್‌ಗಳಿಗೆ ಸ್ವಯಂಚಾಲಿತ ಪರೀಕ್ಷಾ ಫ್ರೇಮ್ವರ್ಕ್ ಇಲ್ಲ
- ಕೈಯಿಂದ ಪರಿಶೀಲನೆ: ಎಲ್ಲಾ ಸೆಲ್‌ಗಳನ್ನು ಕ್ರಮವಾಗಿ ಓಡಿಸಿ ದೋಷಗಳಿಲ್ಲದಿರುವುದನ್ನು ಖಚಿತಪಡಿಸಿಕೊಳ್ಳಿ
- ಡೇಟಾ ಫೈಲ್‌ಗಳು ಲಭ್ಯವಿರುವುದನ್ನು ಮತ್ತು ಔಟ್‌ಪುಟ್‌ಗಳು ಸರಿಯಾಗಿ ಉತ್ಪಾದಿತವಾಗಿರುವುದನ್ನು ಪರಿಶೀಲಿಸಿ
- ದೃಶ್ಯೀಕರಣಗಳು ಸರಿಯಾಗಿ ರೆಂಡರ್ ಆಗುತ್ತಿವೆಯೇ ಎಂದು ಪರಿಶೀಲಿಸಿ
### ಡಾಕ್ಯುಮೆಂಟೇಶನ್ ಪರೀಕ್ಷೆ
```bash
# ಡಾಕ್ಸಿಫೈ ಸರಿಯಾಗಿ ರೆಂಡರ್ ಆಗುತ್ತದೆಯೇ ಎಂದು ಪರಿಶೀಲಿಸಿ
docsify serve
# ವಿಷಯವನ್ನು ನಾವಿಗೇಟ್ ಮಾಡಿ ಮುರಿದ ಲಿಂಕ್‌ಗಳನ್ನು ಕೈಯಿಂದ ಪರಿಶೀಲಿಸಿ
# ರೆಂಡರ್ ಮಾಡಿದ ಡಾಕ್ಯುಮೆಂಟೇಶನ್‌ನಲ್ಲಿ ಎಲ್ಲಾ ಪಾಠ ಲಿಂಕ್‌ಗಳು ಕಾರ್ಯನಿರ್ವಹಿಸುತ್ತವೆಯೇ ಎಂದು ಪರಿಶೀಲಿಸಿ
```
### ಕೋಡ್ ಗುಣಮಟ್ಟ ಪರಿಶೀಲನೆ
```bash
# Vue.js ಪ್ರಾಜೆಕ್ಟ್‌ಗಳು (quiz-app ಮತ್ತು ದೃಶ್ಯೀಕರಣ ಪ್ರಾಜೆಕ್ಟ್‌ಗಳು)
cd quiz-app # ಅಥವಾ ದೃಶ್ಯೀಕರಣ ಪ್ರಾಜೆಕ್ಟ್ ಫೋಲ್ಡರ್
npm run lint
# ಪೈಥಾನ್ ನೋಟ್ಬುಕ್‌ಗಳು - ಕೈಯಿಂದ ಪರಿಶೀಲನೆ ಶಿಫಾರಸು ಮಾಡಲಾಗಿದೆ
# ಆಮದುಗಳು ಸರಿಯಾಗಿ ಕಾರ್ಯನಿರ್ವಹಿಸುತ್ತವೆ ಮತ್ತು ಸೆಲ್‌ಗಳು ದೋಷರಹಿತವಾಗಿ ಕಾರ್ಯನಿರ್ವಹಿಸುತ್ತವೆ ಎಂದು ಖಚಿತಪಡಿಸಿಕೊಳ್ಳಿ
```
## ಕೋಡ್ ಶೈಲಿ ಮಾರ್ಗಸೂಚಿಗಳು
### ಪೈಥಾನ್ (ಜುಪೈಟರ್ ನೋಟ್ಬುಕ್‌ಗಳು)
- ಪೈಥಾನ್ ಕೋಡ್‌ಗೆ PEP 8 ಶೈಲಿ ಮಾರ್ಗಸೂಚಿಗಳನ್ನು ಅನುಸರಿಸಿ
- ವಿಶ್ಲೇಷಿಸುತ್ತಿರುವ ಡೇಟಾವನ್ನು ವಿವರಿಸುವ ಸ್ಪಷ್ಟ ವ್ಯತ್ಯಯ ಹೆಸರುಗಳನ್ನು ಬಳಸಿ
- ಕೋಡ್ ಸೆಲ್‌ಗಳ ಮುಂಚೆ ವಿವರಣೆಗಳೊಂದಿಗೆ ಮಾರ್ಕ್‌ಡೌನ್ ಸೆಲ್‌ಗಳನ್ನು ಸೇರಿಸಿ
- ಕೋಡ್ ಸೆಲ್‌ಗಳನ್ನು ಏಕಾಂಗಿ ತತ್ವಗಳು ಅಥವಾ ಕಾರ್ಯಾಚರಣೆಗಳ ಮೇಲೆ ಕೇಂದ್ರೀಕರಿಸಿ
- ಡೇಟಾ ಸಂಚಲನಕ್ಕೆ pandas, ದೃಶ್ಯೀಕರಣಕ್ಕೆ matplotlib ಬಳಸಿ
- ಸಾಮಾನ್ಯ ಆಮದು ಮಾದರಿ:
```python
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
```
### ಜಾವಾಸ್ಕ್ರಿಪ್ಟ್/Vue.js
- Vue.js 2 ಶೈಲಿ ಮಾರ್ಗಸೂಚಿ ಮತ್ತು ಉತ್ತಮ ಅಭ್ಯಾಸಗಳನ್ನು ಅನುಸರಿಸಿ
- ESLint ಸಂರಚನೆ `quiz-app/package.json` ನಲ್ಲಿ ಇದೆ
- Vue ಸಿಂಗಲ್-ಫೈಲ್ ಕಾಂಪೋನಂಟ್‌ಗಳು (.vue ಫೈಲ್‌ಗಳು) ಬಳಸಿ
- ಕಾಂಪೋನಂಟ್ ಆಧಾರಿತ ವಾಸ್ತುಶಿಲ್ಪವನ್ನು ಕಾಪಾಡಿ
- ಬದಲಾವಣೆಗಳನ್ನು ಕಮಿಟ್ ಮಾಡುವ ಮೊದಲು `npm run lint` ಓಡಿಸಿ
### ಮಾರ್ಕ್‌ಡೌನ್ ಡಾಕ್ಯುಮೆಂಟೇಶನ್
- ಸ್ಪಷ್ಟ ಶೀರ್ಷಿಕೆ ಹೈರಾರ್ಕಿಯನ್ನು ಬಳಸಿ (# ## ### ಇತ್ಯಾದಿ)
- ಭಾಷಾ ಸೂಚಕಗಳೊಂದಿಗೆ ಕೋಡ್ ಬ್ಲಾಕ್‌ಗಳನ್ನು ಸೇರಿಸಿ
- ಚಿತ್ರಗಳಿಗೆ alt ಪಠ್ಯವನ್ನು ಸೇರಿಸಿ
- ಸಂಬಂಧಿತ ಪಾಠಗಳು ಮತ್ತು ಸಂಪನ್ಮೂಲಗಳಿಗೆ ಲಿಂಕ್ ಮಾಡಿ
- ಓದಲು ಸುಲಭವಾಗುವಂತೆ ಸಾಲಿನ ಉದ್ದವನ್ನು ಯುಕ್ತವಾಗಿ ಇಡಿ
### ಫೈಲ್ ಸಂಘಟನೆ
- ಪಾಠ ವಿಷಯ ಸಂಖ್ಯಿತ ಫೋಲ್ಡರ್‌ಗಳಲ್ಲಿ (01-defining-data-science ಮುಂತಾದವು)
- ಪರಿಹಾರಗಳು ಸಮರ್ಪಿತ `solution/` ಉಪಫೋಲ್ಡರ್‌ಗಳಲ್ಲಿ
- ಅನುವಾದಗಳು ಇಂಗ್ಲಿಷ್ ರಚನೆಯನ್ನು ಪ್ರತಿಬಿಂಬಿಸುವ `translations/` ಫೋಲ್ಡರ್‌ನಲ್ಲಿ
- ಡೇಟಾ ಫೈಲ್‌ಗಳನ್ನು `data/` ಅಥವಾ ಪಾಠ-ನಿರ್ದಿಷ್ಟ ಫೋಲ್ಡರ್‌ಗಳಲ್ಲಿ ಇಡಿ
## ನಿರ್ಮಾಣ ಮತ್ತು ನಿಯೋಜನೆ
### ಕ್ವಿಜ್ ಅಪ್ಲಿಕೇಶನ್ ನಿಯೋಜನೆ
```bash
cd quiz-app
# ಉತ್ಪಾದನಾ ಆವೃತ್ತಿಯನ್ನು ನಿರ್ಮಿಸಿ
npm run build
# ಔಟ್‌ಪುಟ್ dist/ ಫೋಲ್ಡರ್‌ನಲ್ಲಿ ಇದೆ
# dist/ ಫೋಲ್ಡರ್ ಅನ್ನು ಸ್ಥಿರ ಹೋಸ್ಟಿಂಗ್‌ಗೆ ನಿಯೋಜಿಸಿ (Azure Static Web Apps, Netlify, ಇತ್ಯಾದಿ)
```
### ಅಜೂರ್ ಸ್ಟ್ಯಾಟಿಕ್ ವೆಬ್ ಅಪ್ಲಿಕೇಶನ್ ನಿಯೋಜನೆ
quiz-app ಅನ್ನು ಅಜೂರ್ ಸ್ಟ್ಯಾಟಿಕ್ ವೆಬ್ ಅಪ್ಲಿಕೇಶನ್‌ಗಳಿಗೆ ನಿಯೋಜಿಸಬಹುದು:
1. ಅಜೂರ್ ಸ್ಟ್ಯಾಟಿಕ್ ವೆಬ್ ಅಪ್ಲಿಕೇಶನ್ ಸಂಪನ್ಮೂಲವನ್ನು ರಚಿಸಿ
2. GitHub ರೆಪೊಸಿಟರಿಯನ್ನು ಸಂಪರ್ಕಿಸಿ
3. ನಿರ್ಮಾಣ ಸೆಟ್ಟಿಂಗ್‌ಗಳನ್ನು ಸಂರಚಿಸಿ:
- ಅಪ್ಲಿಕೇಶನ್ ಸ್ಥಳ: `quiz-app`
- ಔಟ್‌ಪುಟ್ ಸ್ಥಳ: `dist`
4. GitHub Actions ಕಾರ್ಯಪ್ರವಾಹವು ಪುಷ್ ಮಾಡಿದಾಗ ಸ್ವಯಂಚಾಲಿತವಾಗಿ ನಿಯೋಜಿಸುತ್ತದೆ
### ಡಾಕ್ಯುಮೆಂಟೇಶನ್ ಸೈಟ್
```bash
# ಡಾಕ್ಸಿಫಿಯಿಂದ PDF ನಿರ್ಮಿಸಿ (ಐಚ್ಛಿಕ)
npm run convert
# ಡಾಕ್ಸಿಫಿ ಡಾಕ್ಯುಮೆಂಟೇಶನ್ ನೇರವಾಗಿ ಮಾರ್ಕ್‌ಡೌನ್ ಫೈಲ್‌ಗಳಿಂದ ಸೇವೆ ಮಾಡಲಾಗುತ್ತದೆ
# ನಿಯೋಜನೆಗಾಗಿ ಯಾವುದೇ ನಿರ್ಮಾಣ ಹಂತ ಅಗತ್ಯವಿಲ್ಲ
# ಡಾಕ್ಸಿಫಿ ಬಳಸಿ ರೆಪೊಸಿಟರಿಯನ್ನು ಸ್ಥಿರ ಹೋಸ್ಟಿಂಗ್‌ಗೆ ನಿಯೋಜಿಸಿ
```
### GitHub Codespaces
- ರೆಪೊಸಿಟರಿಯಲ್ಲಿ ಡೆವ್ ಕಂಟೈನರ್ ಸಂರಚನೆ ಸೇರಿದೆ
- Codespaces ಸ್ವಯಂಚಾಲಿತವಾಗಿ ಪೈಥಾನ್ ಮತ್ತು Node.js ಪರಿಸರವನ್ನು ಸೆಟ್ ಮಾಡುತ್ತದೆ
- GitHub UI ಮೂಲಕ Codespace ನಲ್ಲಿ ರೆಪೊಸಿಟರಿ ತೆರೆಯಿರಿ
- ಎಲ್ಲಾ ಅವಲಂಬನೆಗಳು ಸ್ವಯಂಚಾಲಿತವಾಗಿ ಸ್ಥಾಪಿತವಾಗುತ್ತವೆ
## ಪುಲ್ ರಿಕ್ವೆಸ್ಟ್ ಮಾರ್ಗಸೂಚಿಗಳು
### ಸಲ್ಲಿಸುವ ಮೊದಲು
```bash
# quiz-app ನಲ್ಲಿ Vue.js ಬದಲಾವಣೆಗಳಿಗೆ
cd quiz-app
npm run lint
npm run build
# ಬದಲಾವಣೆಗಳನ್ನು ಸ್ಥಳೀಯವಾಗಿ ಪರೀಕ್ಷಿಸಿ
npm run serve
```
### PR ಶೀರ್ಷಿಕೆ ಸ್ವರೂಪ
- ಸ್ಪಷ್ಟ, ವಿವರಣಾತ್ಮಕ ಶೀರ್ಷಿಕೆಗಳನ್ನು ಬಳಸಿ
- ಸ್ವರೂಪ: `[Component] ಸಂಕ್ಷಿಪ್ತ ವಿವರಣೆ`
- ಉದಾಹರಣೆಗಳು:
- `[Lesson 7] ಪೈಥಾನ್ ನೋಟ್ಬುಕ್ ಆಮದು ದೋಷವನ್ನು ಸರಿಪಡಿಸಿ`
- `[Quiz App] ಜರ್ಮನ್ ಅನುವಾದವನ್ನು ಸೇರಿಸಿ`
- `[Docs] README ನ್ನು ಹೊಸ ಪೂರ್ವಾಪೇಕ್ಷೆಗಳೊಂದಿಗೆ ನವೀಕರಿಸಿ`
### ಅಗತ್ಯ ಪರಿಶೀಲನೆಗಳು
- ಎಲ್ಲಾ ಕೋಡ್ ದೋಷರಹಿತವಾಗಿ ಓಡುತ್ತದೆಯೇ ಎಂದು ಖಚಿತಪಡಿಸಿಕೊಳ್ಳಿ
- ನೋಟ್ಬುಕ್‌ಗಳು ಸಂಪೂರ್ಣವಾಗಿ ಕಾರ್ಯನಿರ್ವಹಿಸುತ್ತವೆಯೇ ಎಂದು ಪರಿಶೀಲಿಸಿ
- Vue.js ಅಪ್ಲಿಕೇಶನ್‌ಗಳು ಯಶಸ್ವಿಯಾಗಿ ನಿರ್ಮಿತವಾಗುತ್ತವೆಯೇ ಎಂದು ದೃಢೀಕರಿಸಿ
- ಡಾಕ್ಯುಮೆಂಟೇಶನ್ ಲಿಂಕ್‌ಗಳು ಕಾರ್ಯನಿರ್ವಹಿಸುತ್ತವೆಯೇ ಎಂದು ಪರಿಶೀಲಿಸಿ
- ಬದಲಾವಣೆ ಮಾಡಿದರೆ ಕ್ವಿಜ್ ಅಪ್ಲಿಕೇಶನ್ ಪರೀಕ್ಷಿಸಿ
- ಅನುವಾದಗಳು ಸुसಂಗತ ರಚನೆಯನ್ನು ಕಾಪಾಡುತ್ತವೆಯೇ ಎಂದು ಖಚಿತಪಡಿಸಿಕೊಳ್ಳಿ
### ಕೊಡುಗೆ ಮಾರ್ಗಸೂಚಿಗಳು
- ಇತ್ತೀಚಿನ ಕೋಡ್ ಶೈಲಿ ಮತ್ತು ಮಾದರಿಗಳನ್ನು ಅನುಸರಿಸಿ
- ಸಂಕೀರ್ಣ ತರ್ಕಕ್ಕೆ ವಿವರಣಾತ್ಮಕ ಕಾಮೆಂಟ್‌ಗಳನ್ನು ಸೇರಿಸಿ
- ಸಂಬಂಧಿತ ಡಾಕ್ಯುಮೆಂಟೇಶನ್ ನವೀಕರಿಸಿ
- ಅನ್ವಯಿಸಿದರೆ ವಿಭಿನ್ನ ಪಾಠ ಮಾಯಾಜಾಲಗಳಲ್ಲಿ ಬದಲಾವಣೆಗಳನ್ನು ಪರೀಕ್ಷಿಸಿ
- CONTRIBUTING.md ಫೈಲ್ ಪರಿಶೀಲಿಸಿ
## ಹೆಚ್ಚುವರಿ ಟಿಪ್ಪಣಿಗಳು
### ಸಾಮಾನ್ಯವಾಗಿ ಬಳಸುವ ಲೈಬ್ರರಿಗಳು
- **pandas**: ಡೇಟಾ ಸಂಚಲನ ಮತ್ತು ವಿಶ್ಲೇಷಣೆ
- **numpy**: ಸಂಖ್ಯಾತ್ಮಕ ಗಣನೆ
- **matplotlib**: ಡೇಟಾ ದೃಶ್ಯೀಕರಣ ಮತ್ತು ಪ್ಲಾಟಿಂಗ್
- **seaborn**: ಸಾಂಖ್ಯಿಕ ಡೇಟಾ ದೃಶ್ಯೀಕರಣ (ಕೆಲವು ಪಾಠಗಳು)
- **scikit-learn**: ಯಂತ್ರ ಅಧ್ಯಯನ (ಅಧಿಕೃತ ಪಾಠಗಳು)
### ಡೇಟಾ ಫೈಲ್‌ಗಳೊಂದಿಗೆ ಕೆಲಸ
- ಡೇಟಾ ಫೈಲ್‌ಗಳು `data/` ಫೋಲ್ಡರ್ ಅಥವಾ ಪಾಠ-ನಿರ್ದಿಷ್ಟ ಡೈರೆಕ್ಟರಿಗಳಲ್ಲಿ ಇರುತ್ತವೆ
- ಹೆಚ್ಚಿನ ನೋಟ್ಬುಕ್‌ಗಳು ಸಂಬಂಧಿತ ಮಾರ್ಗಗಳಲ್ಲಿ ಡೇಟಾ ಫೈಲ್‌ಗಳನ್ನು ನಿರೀಕ್ಷಿಸುತ್ತವೆ
- CSV ಫೈಲ್‌ಗಳು ಪ್ರಾಥಮಿಕ ಡೇಟಾ ಸ್ವರೂಪ
- ಕೆಲವು ಪಾಠಗಳು JSON ಅನ್ನು ಅಸಂಬಂಧಿತ ಡೇಟಾ ಉದಾಹರಣೆಗಳಿಗೆ ಬಳಸುತ್ತವೆ
### ಬಹುಭಾಷಾ ಬೆಂಬಲ
- 40+ ಭಾಷಾ ಅನುವಾದಗಳು ಸ್ವಯಂಚಾಲಿತ GitHub Actions ಮೂಲಕ
- ಅನುವಾದ ಕಾರ್ಯಪ್ರವಾಹ `.github/workflows/co-op-translator.yml` ನಲ್ಲಿ
- ಅನುವಾದಗಳು `translations/` ಫೋಲ್ಡರ್‌ನಲ್ಲಿ ಭಾಷಾ ಕೋಡ್‌ಗಳೊಂದಿಗೆ
- ಕ್ವಿಜ್ ಅನುವಾದಗಳು `quiz-app/src/assets/translations/` ನಲ್ಲಿ
### ಅಭಿವೃದ್ಧಿ ಪರಿಸರ ಆಯ್ಕೆಗಳು
1. **ಸ್ಥಳೀಯ ಅಭಿವೃದ್ಧಿ**: ಪೈಥಾನ್, ಜುಪೈಟರ್, Node.js ಸ್ಥಳೀಯವಾಗಿ ಸ್ಥಾಪಿಸಿ
2. **GitHub Codespaces**: ಕ್ಲೌಡ್ ಆಧಾರಿತ ತಕ್ಷಣದ ಅಭಿವೃದ್ಧಿ ಪರಿಸರ
3. **VS Code ಡೆವ್ ಕಂಟೈನರ್‌ಗಳು**: ಸ್ಥಳೀಯ ಕಂಟೈನರ್ ಆಧಾರಿತ ಅಭಿವೃದ್ಧಿ
4. **ಬಿಂಡರ್**: ಕ್ಲೌಡ್‌ನಲ್ಲಿ ನೋಟ್ಬುಕ್‌ಗಳನ್ನು ಪ್ರಾರಂಭಿಸಿ (ಸೆಟ್ ಮಾಡಿದರೆ)
### ಪಾಠ ವಿಷಯ ಮಾರ್ಗಸೂಚಿಗಳು
- ಪ್ರತಿ ಪಾಠ ಸ್ವತಂತ್ರವಾಗಿದ್ದು ಹಿಂದಿನ ತತ್ವಗಳ ಮೇಲೆ ನಿರ್ಮಿತವಾಗಿದೆ
- ಪೂರ್ವ ಪಾಠ ಕ್ವಿಜ್‌ಗಳು ಹಿಂದಿನ ಜ್ಞಾನವನ್ನು ಪರೀಕ್ಷಿಸುತ್ತವೆ
- ಪೋಸ್ಟ್ ಪಾಠ ಕ್ವಿಜ್‌ಗಳು ಕಲಿಕೆಯನ್ನು ಬಲಪಡಿಸುತ್ತವೆ
- ಅಸೈನ್‌ಮೆಂಟ್‌ಗಳು ಹ್ಯಾಂಡ್ಸ್-ಆನ್ ಅಭ್ಯಾಸವನ್ನು ಒದಗಿಸುತ್ತವೆ
- ಸ್ಕೆಚ್‌ನೋಟ್‌ಗಳು ದೃಶ್ಯ ಸಾರಾಂಶಗಳನ್ನು ಒದಗಿಸುತ್ತವೆ
### ಸಾಮಾನ್ಯ ಸಮಸ್ಯೆಗಳ ಪರಿಹಾರ
**ಜುಪೈಟರ್ ಕರ್ಣಲ್ ಸಮಸ್ಯೆಗಳು:**
```bash
# ಸರಿಯಾದ ಕರ್ಣಲ್ ಸ್ಥಾಪಿತವಾಗಿದೆ ಎಂದು ಖಚಿತಪಡಿಸಿಕೊಳ್ಳಿ
python -m ipykernel install --user --name=datascience
```
**npm ಸ್ಥಾಪನೆ ವಿಫಲತೆಗಳು:**
```bash
# npm ಕ್ಯಾಶೆ ತೆರವುಗೊಳಿಸಿ ಮತ್ತು ಮರುಪ್ರಯತ್ನಿಸಿ
npm cache clean --force
rm -rf node_modules package-lock.json
npm install
```
**ನೋಟ್ಬುಕ್‌ಗಳಲ್ಲಿ ಆಮದು ದೋಷಗಳು:**
- ಅಗತ್ಯವಿರುವ ಎಲ್ಲಾ ಲೈಬ್ರರಿಗಳು ಸ್ಥಾಪಿತವಾಗಿವೆ ಎಂದು ಖಚಿತಪಡಿಸಿಕೊಳ್ಳಿ
- ಪೈಥಾನ್ ಆವೃತ್ತಿ ಹೊಂದಾಣಿಕೆ ಪರಿಶೀಲಿಸಿ (ಪೈಥಾನ್ 3.7+ ಶಿಫಾರಸು)
- ವರ್ಚುವಲ್ ಪರಿಸರ ಸಕ್ರಿಯವಾಗಿದೆ ಎಂದು ಖಚಿತಪಡಿಸಿಕೊಳ್ಳಿ
**Docsify ಲೋಡ್ ಆಗುತ್ತಿಲ್ಲ:**
- ನೀವು ರೆಪೊಸಿಟರಿ ರೂಟ್‌ನಿಂದ ಸರ್ವ್ ಮಾಡುತ್ತಿದ್ದೀರಾ ಎಂದು ಪರಿಶೀಲಿಸಿ
- `index.html` ಇದೆ ಎಂದು ಖಚಿತಪಡಿಸಿಕೊಳ್ಳಿ
- ಸರಿಯಾದ ನೆಟ್‌ವರ್ಕ್ ಪ್ರವೇಶ (ಪೋರ್ಟ್ 3000) ಇದೆ ಎಂದು ಖಚಿತಪಡಿಸಿಕೊಳ್ಳಿ
### ಕಾರ್ಯಕ್ಷಮತೆ ಪರಿಗಣನೆಗಳು
- ದೊಡ್ಡ ಡೇಟಾಸೆಟ್‌ಗಳು ನೋಟ್ಬುಕ್‌ಗಳಲ್ಲಿ ಲೋಡ್ ಆಗಲು ಸಮಯ ತೆಗೆದುಕೊಳ್ಳಬಹುದು
- ಸಂಕೀರ್ಣ ಪ್ಲಾಟ್‌ಗಳ ದೃಶ್ಯೀಕರಣ ನಿಧಾನವಾಗಬಹುದು
- Vue.js ಡೆವ್ ಸರ್ವರ್ ತ್ವರಿತ ಪುನರಾವೃತ್ತಿಗಾಗಿ ಹಾಟ್-ರಿಲೋಡ್ ಸೌಲಭ್ಯ ನೀಡುತ್ತದೆ
- ಉತ್ಪಾದನಾ ನಿರ್ಮಾಣಗಳು ಆಪ್ಟಿಮೈಸ್ ಮತ್ತು ಮಿನಿಫೈ ಮಾಡಲ್ಪಟ್ಟಿವೆ
### ಭದ್ರತಾ ಟಿಪ್ಪಣಿಗಳು
- ಯಾವುದೇ ಸಂವೇದನಾಶೀಲ ಡೇಟಾ ಅಥವಾ ಪ್ರಮಾಣಪತ್ರಗಳನ್ನು ಕಮಿಟ್ ಮಾಡಬಾರದು
- ಕ್ಲೌಡ್ ಪಾಠಗಳಲ್ಲಿ ಯಾವುದೇ API ಕೀಗಳಿಗೆ ಪರಿಸರ ಚರಗಳನ್ನು ಬಳಸಿ
- ಅಜೂರ್ ಸಂಬಂಧಿತ ಪಾಠಗಳಿಗೆ ಅಜೂರ್ ಖಾತೆ ಪ್ರಮಾಣಪತ್ರಗಳು ಅಗತ್ಯವಿರಬಹುದು
- ಭದ್ರತಾ ಪ್ಯಾಚ್‌ಗಳಿಗೆ ಅವಲಂಬನೆಗಳನ್ನು ನವೀಕರಿಸಿ
## ಅನುವಾದಗಳಿಗೆ ಕೊಡುಗೆ ನೀಡುವುದು
- ಸ್ವಯಂಚಾಲಿತ ಅನುವಾದಗಳನ್ನು GitHub Actions ಮೂಲಕ ನಿರ್ವಹಿಸಲಾಗುತ್ತದೆ
- ಅನುವಾದದ ನಿಖರತೆಗಾಗಿ ಕೈಯಿಂದ ತಿದ್ದುಪಡಿ ಸ್ವಾಗತ
- ಇತ್ತೀಚಿನ ಅನುವಾದ ಫೋಲ್ಡರ್ ರಚನೆಯನ್ನು ಅನುಸರಿಸಿ
- ಕ್ವಿಜ್ ಲಿಂಕ್‌ಗಳನ್ನು ಭಾಷಾ ಪರಿಮಾಣದೊಂದಿಗೆ ನವೀಕರಿಸಿ: `?loc=fr`
- ಸರಿಯಾಗಿ ರೆಂಡರ್ ಆಗುವಂತೆ ಅನುವಾದಿತ ಪಾಠಗಳನ್ನು ಪರೀಕ್ಷಿಸಿ
## ಸಂಬಂಧಿತ ಸಂಪನ್ಮೂಲಗಳು
- ಮುಖ್ಯ ಪಠ್ಯಕ್ರಮ: https://aka.ms/datascience-beginners
- ಮೈಕ್ರೋಸಾಫ್ಟ್ ಲರ್ನ್: https://docs.microsoft.com/learn/
- ವಿದ್ಯಾರ್ಥಿ ಹಬ್: https://docs.microsoft.com/learn/student-hub
- ಚರ್ಚಾ ವೇದಿಕೆ: https://github.com/microsoft/Data-Science-For-Beginners/discussions
- ಇತರ ಮೈಕ್ರೋಸಾಫ್ಟ್ ಪಠ್ಯಕ್ರಮಗಳು: ML for Beginners, AI for Beginners, Web Dev for Beginners
## ಪ್ರಾಜೆಕ್ಟ್ ನಿರ್ವಹಣೆ
- ವಿಷಯವನ್ನು ನವೀನಗೊಳಿಸಲು ನಿಯಮಿತ ನವೀಕರಣಗಳು
- ಸಮುದಾಯ ಕೊಡುಗೆಗಳಿಗೆ ಸ್ವಾಗತ
- ಸಮಸ್ಯೆಗಳು GitHub ನಲ್ಲಿ ಟ್ರ್ಯಾಕ್ ಮಾಡಲಾಗುತ್ತವೆ
- ಪಿಆರ್‌ಗಳನ್ನು ಪಠ್ಯಕ್ರಮ ನಿರ್ವಹಕರು ಪರಿಶೀಲಿಸುತ್ತಾರೆ
- ಮಾಸಿಕ ವಿಷಯ ವಿಮರ್ಶೆಗಳು ಮತ್ತು ನವೀಕರಣಗಳು
---
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
**ಅಸ್ವೀಕರಣ**:
ಈ ದಸ್ತಾವೇಜು AI ಅನುವಾದ ಸೇವೆ [Co-op Translator](https://github.com/Azure/co-op-translator) ಬಳಸಿ ಅನುವಾದಿಸಲಾಗಿದೆ. ನಾವು ನಿಖರತೆಯಿಗಾಗಿ ಪ್ರಯತ್ನಿಸುತ್ತಿದ್ದರೂ, ಸ್ವಯಂಚಾಲಿತ ಅನುವಾದಗಳಲ್ಲಿ ದೋಷಗಳು ಅಥವಾ ಅಸತ್ಯತೆಗಳು ಇರಬಹುದು ಎಂದು ದಯವಿಟ್ಟು ಗಮನಿಸಿ. ಮೂಲ ಭಾಷೆಯಲ್ಲಿರುವ ಮೂಲ ದಸ್ತಾವೇಜನ್ನು ಅಧಿಕೃತ ಮೂಲವಾಗಿ ಪರಿಗಣಿಸಬೇಕು. ಮಹತ್ವದ ಮಾಹಿತಿಗಾಗಿ, ವೃತ್ತಿಪರ ಮಾನವ ಅನುವಾದವನ್ನು ಶಿಫಾರಸು ಮಾಡಲಾಗುತ್ತದೆ. ಈ ಅನುವಾದ ಬಳಕೆಯಿಂದ ಉಂಟಾಗುವ ಯಾವುದೇ ತಪ್ಪು ಅರ್ಥಮಾಡಿಕೊಳ್ಳುವಿಕೆ ಅಥವಾ ತಪ್ಪು ವಿವರಣೆಗಳಿಗೆ ನಾವು ಹೊಣೆಗಾರರಾಗುವುದಿಲ್ಲ.
<!-- CO-OP TRANSLATOR DISCLAIMER END -->

@ -0,0 +1,25 @@
<!--
CO_OP_TRANSLATOR_METADATA:
{
"original_hash": "c06b12caf3c901eb3156e3dd5b0aea56",
"translation_date": "2025-12-19T13:09:19+00:00",
"source_file": "CODE_OF_CONDUCT.md",
"language_code": "kn"
}
-->
# ಮೈಕ್ರೋಸಾಫ್ಟ್ ಓಪನ್ ಸೋರ್ಸ್ ಕೋಡ್ ಆಫ್ ಕಂಡಕ್ಟ್
ಈ ಯೋಜನೆ [ಮೈಕ್ರೋಸಾಫ್ಟ್ ಓಪನ್ ಸೋರ್ಸ್ ಕೋಡ್ ಆಫ್ ಕಂಡಕ್ಟ್](https://opensource.microsoft.com/codeofconduct/) ಅನ್ನು ಅಂಗೀಕರಿಸಿದೆ.
ಸಂಪನ್ಮೂಲಗಳು:
- [ಮೈಕ್ರೋಸಾಫ್ಟ್ ಓಪನ್ ಸೋರ್ಸ್ ಕೋಡ್ ಆಫ್ ಕಂಡಕ್ಟ್](https://opensource.microsoft.com/codeofconduct/)
- [ಮೈಕ್ರೋಸಾಫ್ಟ್ ಕೋಡ್ ಆಫ್ ಕಂಡಕ್ಟ್ FAQ](https://opensource.microsoft.com/codeofconduct/faq/)
- ಪ್ರಶ್ನೆಗಳು ಅಥವಾ ಚಿಂತೆಗಳಿಗಾಗಿ [opencode@microsoft.com](mailto:opencode@microsoft.com) ಸಂಪರ್ಕಿಸಿ
---
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
**ಅಸ್ವೀಕರಣ**:
ಈ ದಸ್ತಾವೇಜು [Co-op Translator](https://github.com/Azure/co-op-translator) ಎಂಬ AI ಅನುವಾದ ಸೇವೆಯನ್ನು ಬಳಸಿ ಅನುವಾದಿಸಲಾಗಿದೆ. ನಾವು ಶುದ್ಧತೆಯತ್ತ ಪ್ರಯತ್ನಿಸುತ್ತಿದ್ದರೂ, ಸ್ವಯಂಚಾಲಿತ ಅನುವಾದಗಳಲ್ಲಿ ತಪ್ಪುಗಳು ಅಥವಾ ಅಸತ್ಯತೆಗಳು ಇರಬಹುದು ಎಂದು ದಯವಿಟ್ಟು ಗಮನಿಸಿ. ಮೂಲ ಭಾಷೆಯಲ್ಲಿರುವ ಮೂಲ ದಸ್ತಾವೇಜನ್ನು ಅಧಿಕೃತ ಮೂಲವೆಂದು ಪರಿಗಣಿಸಬೇಕು. ಮಹತ್ವದ ಮಾಹಿತಿಗಾಗಿ, ವೃತ್ತಿಪರ ಮಾನವ ಅನುವಾದವನ್ನು ಶಿಫಾರಸು ಮಾಡಲಾಗುತ್ತದೆ. ಈ ಅನುವಾದ ಬಳಕೆಯಿಂದ ಉಂಟಾಗುವ ಯಾವುದೇ ತಪ್ಪು ಅರ್ಥಮಾಡಿಕೊಳ್ಳುವಿಕೆ ಅಥವಾ ತಪ್ಪು ವಿವರಣೆಗಳಿಗೆ ನಾವು ಹೊಣೆಗಾರರಾಗುವುದಿಲ್ಲ.
<!-- CO-OP TRANSLATOR DISCLAIMER END -->

@ -0,0 +1,368 @@
<!--
CO_OP_TRANSLATOR_METADATA:
{
"original_hash": "10f86fb29b5407088445ac803b3d0ed1",
"translation_date": "2025-12-19T12:50:17+00:00",
"source_file": "CONTRIBUTING.md",
"language_code": "kn"
}
-->
# ಆರಂಭಿಕರಿಗಾಗಿ ಡೇಟಾ ಸೈನ್ಸ್‌ಗೆ ಕೊಡುಗೆ ನೀಡುವುದು
ಡೇಟಾ ಸೈನ್ಸ್ ಫಾರ್ ಬಿಗಿನರ್ಸ್ ಪಠ್ಯಕ್ರಮಕ್ಕೆ ಕೊಡುಗೆ ನೀಡಲು ನಿಮ್ಮ ಆಸಕ್ತಿಗೆ ಧನ್ಯವಾದಗಳು! ನಾವು ಸಮುದಾಯದಿಂದ ಕೊಡುಗೆಗಳನ್ನು ಸ್ವಾಗತಿಸುತ್ತೇವೆ.
## ವಿಷಯಗಳ ಪಟ್ಟಿಕೆ
- [ನಡವಳಿಕೆ ಸಂಹಿತೆ](../..)
- [ನಾನು ಹೇಗೆ ಕೊಡುಗೆ ನೀಡಬಹುದು?](../..)
- [ಪ್ರಾರಂಭಿಸುವುದು](../..)
- [ಕೊಡುಗೆ ಮಾರ್ಗಸೂಚಿಗಳು](../..)
- [ಪುಲ್ ರಿಕ್ವೆಸ್ಟ್ ಪ್ರಕ್ರಿಯೆ](../..)
- [ಶೈಲಿ ಮಾರ್ಗಸೂಚಿಗಳು](../..)
- [ಕೊಡುಗೆದಾರ ಪರವಾನಗಿ ಒಪ್ಪಂದ](../..)
## ನಡವಳಿಕೆ ಸಂಹಿತೆ
ಈ ಯೋಜನೆ [Microsoft Open Source Code of Conduct](https://opensource.microsoft.com/codeofconduct/) ಅನ್ನು ಅಳವಡಿಸಿಕೊಂಡಿದೆ.
ಹೆಚ್ಚಿನ ಮಾಹಿತಿಗಾಗಿ [ನಡವಳಿಕೆ ಸಂಹಿತೆ FAQ](https://opensource.microsoft.com/codeofconduct/faq/) ನೋಡಿ
ಅಥವಾ ಯಾವುದೇ ಹೆಚ್ಚುವರಿ ಪ್ರಶ್ನೆಗಳು ಅಥವಾ ಟಿಪ್ಪಣಿಗಳಿಗಾಗಿ [opencode@microsoft.com](mailto:opencode@microsoft.com) ಸಂಪರ್ಕಿಸಿ.
## ನಾನು ಹೇಗೆ ಕೊಡುಗೆ ನೀಡಬಹುದು?
### ದೋಷಗಳನ್ನು ವರದಿ ಮಾಡುವುದು
ದೋಷ ವರದಿಗಳನ್ನು ರಚಿಸುವ ಮೊದಲು, ನಕಲಿ ವರದಿಗಳನ್ನು ತಪ್ಪಿಸಲು ಇತ್ತೀಚಿನ ಸಮಸ್ಯೆಗಳನ್ನು ಪರಿಶೀಲಿಸಿ. ನೀವು ದೋಷ ವರದಿ ರಚಿಸುವಾಗ, ಸಾಧ್ಯವಾದಷ್ಟು ವಿವರಗಳನ್ನು ಸೇರಿಸಿ:
- **ಸ್ಪಷ್ಟ ಮತ್ತು ವಿವರಣಾತ್ಮಕ ಶೀರ್ಷಿಕೆ ಬಳಸಿ**
- **ಸಮಸ್ಯೆಯನ್ನು ಪುನರಾವರ್ತಿಸಲು ನಿಖರವಾದ ಹಂತಗಳನ್ನು ವಿವರಿಸಿ**
- **ನಿರ್ದಿಷ್ಟ ಉದಾಹರಣೆಗಳನ್ನು ಒದಗಿಸಿ** (ಕೋಡ್ ತುಣುಕುಗಳು, ಸ್ಕ್ರೀನ್‌ಶಾಟ್‌ಗಳು)
- **ನೀವು ಕಂಡ ವರ್ತನೆ ಮತ್ತು ನಿರೀಕ್ಷಿತ ವರ್ತನೆಯನ್ನು ವಿವರಿಸಿ**
- **ನಿಮ್ಮ ಪರಿಸರ ವಿವರಗಳನ್ನು ಸೇರಿಸಿ** (OS, Python ಆವೃತ್ತಿ, ಬ್ರೌಸರ್)
### ಸುಧಾರಣೆಗಳನ್ನು ಸೂಚಿಸುವುದು
ಸುಧಾರಣೆ ಸಲಹೆಗಳು ಸ್ವಾಗತಾರ್ಹ! ಸುಧಾರಣೆಗಳನ್ನು ಸೂಚಿಸುವಾಗ:
- **ಸ್ಪಷ್ಟ ಮತ್ತು ವಿವರಣಾತ್ಮಕ ಶೀರ್ಷಿಕೆ ಬಳಸಿ**
- **ಸುಧಾರಣೆಯ ವಿವರವಾದ ವಿವರಣೆಯನ್ನು ಒದಗಿಸಿ**
- **ಈ ಸುಧಾರಣೆ ಯಾಕೆ ಉಪಯುಕ್ತವಾಗುತ್ತದೆ ಎಂದು ವಿವರಿಸಿ**
- **ಇತರ ಯೋಜನೆಗಳಲ್ಲಿ ಇರುವ ಸಮಾನ ವೈಶಿಷ್ಟ್ಯಗಳನ್ನು ಪಟ್ಟಿ ಮಾಡಿ, ಅನ್ವಯಿಸಿದರೆ**
### ಡಾಕ್ಯುಮೆಂಟೇಶನ್‌ಗೆ ಕೊಡುಗೆ ನೀಡುವುದು
ಡಾಕ್ಯುಮೆಂಟೇಶನ್ ಸುಧಾರಣೆಗಳನ್ನು ಯಾವಾಗಲೂ ಮೆಚ್ಚಲಾಗುತ್ತದೆ:
- **ಟೈಪೋಗಳು ಮತ್ತು ವ್ಯಾಕರಣ ದೋಷಗಳನ್ನು ಸರಿಪಡಿಸಿ**
- **ವಿವರಣೆಗಳ ಸ್ಪಷ್ಟತೆಯನ್ನು ಸುಧಾರಿಸಿ**
- **ಕಾಣದಿರುವ ಡಾಕ್ಯುಮೆಂಟೇಶನ್ ಸೇರಿಸಿ**
- **ಹಳೆಯ ಮಾಹಿತಿಯನ್ನು ನವೀಕರಿಸಿ**
- **ಉದಾಹರಣೆಗಳು ಅಥವಾ ಬಳಕೆ ಪ್ರಕರಣಗಳನ್ನು ಸೇರಿಸಿ**
### ಕೋಡ್‌ಗೆ ಕೊಡುಗೆ ನೀಡುವುದು
ನಾವು ಕೆಳಗಿನ ಕೋಡ್ ಕೊಡುಗೆಗಳನ್ನು ಸ್ವಾಗತಿಸುತ್ತೇವೆ:
- **ಹೊಸ ಪಾಠಗಳು ಅಥವಾ ವ್ಯಾಯಾಮಗಳು**
- **ದೋಷ ಸರಿಪಡಿಸುವಿಕೆಗಳು**
- **ಇದೀಗಿರುವ ನೋಟ್ಬುಕ್‌ಗಳ ಸುಧಾರಣೆಗಳು**
- **ಹೊಸ ಡೇಟಾಸೆಟ್‌ಗಳು ಅಥವಾ ಉದಾಹರಣೆಗಳು**
- **ಕ್ವಿಜ್ ಅಪ್ಲಿಕೇಶನ್ ಸುಧಾರಣೆಗಳು**
## ಪ್ರಾರಂಭಿಸುವುದು
### ಪೂರ್ವಾಪೇಕ್ಷಿತಗಳು
ಕೊಡುಗೆ ನೀಡುವ ಮೊದಲು, ನೀವು ಹೊಂದಿರಬೇಕು:
1. GitHub ಖಾತೆ
2. ನಿಮ್ಮ ವ್ಯವಸ್ಥೆಯಲ್ಲಿ Git ಸ್ಥಾಪನೆ
3. Python 3.7+ ಮತ್ತು Jupyter ಸ್ಥಾಪನೆ
4. Node.js ಮತ್ತು npm (ಕ್ವಿಜ್ ಅಪ್ಲಿಕೇಶನ್ ಕೊಡುಗೆಗಳಿಗೆ)
5. ಪಠ್ಯಕ್ರಮ ರಚನೆಗೆ ಪರಿಚಯ
ವಿಸ್ತೃತ ಸ್ಥಾಪನೆ ಸೂಚನೆಗಳಿಗಾಗಿ [INSTALLATION.md](INSTALLATION.md) ನೋಡಿ.
### ಫೋರ್ಕ್ ಮತ್ತು ಕ್ಲೋನ್
1. GitHub ನಲ್ಲಿ **ರಿಪೊಸಿಟರಿಯನ್ನು ಫೋರ್ಕ್ ಮಾಡಿ**
2. **ನಿಮ್ಮ ಫೋರ್ಕ್ ಅನ್ನು ಸ್ಥಳೀಯವಾಗಿ ಕ್ಲೋನ್ ಮಾಡಿ**:
```bash
git clone https://github.com/YOUR-USERNAME/Data-Science-For-Beginners.git
cd Data-Science-For-Beginners
```
3. **ಅಪ್ಸ್ಟ್ರೀಮ್ ರಿಮೋಟ್ ಸೇರಿಸಿ**:
```bash
git remote add upstream https://github.com/microsoft/Data-Science-For-Beginners.git
```
### ಶಾಖೆಯನ್ನು ರಚಿಸಿ
ನಿಮ್ಮ ಕೆಲಸಕ್ಕೆ ಹೊಸ ಶಾಖೆಯನ್ನು ರಚಿಸಿ:
```bash
git checkout -b feature/your-feature-name
# ಅಥವಾ
git checkout -b fix/your-bug-fix
```
ಶಾಖೆ ಹೆಸರು ನಿಯಮಗಳು:
- `feature/` - ಹೊಸ ವೈಶಿಷ್ಟ್ಯಗಳು ಅಥವಾ ಪಾಠಗಳು
- `fix/` - ದೋಷ ಸರಿಪಡಿಸುವಿಕೆಗಳು
- `docs/` - ಡಾಕ್ಯುಮೆಂಟೇಶನ್ ಬದಲಾವಣೆಗಳು
- `refactor/` - ಕೋಡ್ ಪುನರ್‌ರಚನೆ
## ಕೊಡುಗೆ ಮಾರ್ಗಸೂಚಿಗಳು
### ಪಾಠ ವಿಷಯಕ್ಕಾಗಿ
ಪಾಠಗಳನ್ನು ಕೊಡುಗೆ ನೀಡುವಾಗ ಅಥವಾ ಇತ್ತೀಚಿನ ಪಾಠಗಳನ್ನು ಬದಲಾಯಿಸುವಾಗ:
1. **ಇದೀಗಿರುವ ರಚನೆಯನ್ನು ಅನುಸರಿಸಿ**:
- README.md ನಲ್ಲಿ ಪಾಠ ವಿಷಯ
- ವ್ಯಾಯಾಮಗಳೊಂದಿಗೆ Jupyter ನೋಟ್ಬುಕ್
- ನಿಯೋಜನೆ (ಅನ್ವಯಿಸಿದರೆ)
- ಪೂರ್ವ ಮತ್ತು ನಂತರದ ಕ್ವಿಜ್‌ಗಳಿಗೆ ಲಿಂಕ್
2. **ಈ ಅಂಶಗಳನ್ನು ಸೇರಿಸಿ**:
- ಸ್ಪಷ್ಟ ಕಲಿಕೆ ಗುರಿಗಳು
- ಹಂತ ಹಂತವಾಗಿ ವಿವರಣೆಗಳು
- ಕಾಮೆಂಟ್‌ಗಳೊಂದಿಗೆ ಕೋಡ್ ಉದಾಹರಣೆಗಳು
- ಅಭ್ಯಾಸಕ್ಕಾಗಿ ವ್ಯಾಯಾಮಗಳು
- ಹೆಚ್ಚುವರಿ ಸಂಪನ್ಮೂಲಗಳಿಗೆ ಲಿಂಕ್‌ಗಳು
3. **ಪ್ರವೇಶಾರ್ಹತೆಯನ್ನು ಖಚಿತಪಡಿಸಿ**:
- ಸ್ಪಷ್ಟ, ಸರಳ ಭಾಷೆ ಬಳಸಿ
- ಚಿತ್ರಗಳಿಗೆ alt ಪಠ್ಯ ಒದಗಿಸಿ
- ಕೋಡ್ ಕಾಮೆಂಟ್‌ಗಳನ್ನು ಸೇರಿಸಿ
- ವಿಭಿನ್ನ ಕಲಿಕೆ ಶೈಲಿಗಳನ್ನು ಪರಿಗಣಿಸಿ
### Jupyter ನೋಟ್ಬುಕ್‌ಗಳಿಗೆ
1. **ಕಮಿಟ್ ಮಾಡುವ ಮೊದಲು ಎಲ್ಲಾ ಔಟ್‌ಪುಟ್‌ಗಳನ್ನು ತೆರವುಗೊಳಿಸಿ**:
```bash
jupyter nbconvert --clear-output --inplace notebook.ipynb
```
2. **ವಿವರಣೆಗಳೊಂದಿಗೆ ಮಾರ್ಕ್‌ಡೌನ್ ಸೆಲ್‌ಗಳನ್ನು ಸೇರಿಸಿ**
3. **ಸಮರಸಿತ ಫಾರ್ಮ್ಯಾಟಿಂಗ್ ಬಳಸಿ**:
```python
# ಮೇಲ್ಭಾಗದಲ್ಲಿ ಗ್ರಂಥಾಲಯಗಳನ್ನು ಆಮದುಮಾಡಿ
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
# ಅರ್ಥಪೂರ್ಣ ಚರ ನಾಮಗಳನ್ನು ಬಳಸಿ
# ಸಂಕೀರ್ಣ ಕಾರ್ಯಾಚರಣೆಗಳಿಗೆ ಟಿಪ್ಪಣಿಗಳನ್ನು ಸೇರಿಸಿ
# PEP 8 ಶೈಲಿ ಮಾರ್ಗಸೂಚಿಗಳನ್ನು ಅನುಸರಿಸಿ
```
4. **ನಿಮ್ಮ ನೋಟ್ಬುಕ್ ಅನ್ನು ಸಂಪೂರ್ಣವಾಗಿ ಪರೀಕ್ಷಿಸಿ** ಸಲ್ಲಿಸುವ ಮೊದಲು
### Python ಕೋಡ್‌ಗೆ
[PEP 8](https://www.python.org/dev/peps/pep-0008/) ಶೈಲಿ ಮಾರ್ಗಸೂಚಿಗಳನ್ನು ಅನುಸರಿಸಿ:
```python
# ಉತ್ತಮ ಅಭ್ಯಾಸಗಳು
import pandas as pd
def calculate_mean(data):
"""Calculate the mean of a dataset.
Args:
data (list): List of numerical values
Returns:
float: Mean of the dataset
"""
return sum(data) / len(data)
```
### ಕ್ವಿಜ್ ಅಪ್ಲಿಕೇಶನ್ ಕೊಡುಗೆಗಳಿಗೆ
ಕ್ವಿಜ್ ಅಪ್ಲಿಕೇಶನ್ ಬದಲಾಯಿಸುವಾಗ:
1. **ಸ್ಥಳೀಯವಾಗಿ ಪರೀಕ್ಷಿಸಿ**:
```bash
cd quiz-app
npm install
npm run serve
```
2. **ಲಿಂಟರ್ ಅನ್ನು ಓಡಿಸಿ**:
```bash
npm run lint
```
3. **ಯಶಸ್ವಿಯಾಗಿ ನಿರ್ಮಿಸಿ**:
```bash
npm run build
```
4. **Vue.js ಶೈಲಿ ಮಾರ್ಗಸೂಚಿ ಮತ್ತು ಇತ್ತೀಚಿನ ಮಾದರಿಗಳನ್ನು ಅನುಸರಿಸಿ**
### ಅನುವಾದಗಳಿಗೆ
ಅನುವಾದಗಳನ್ನು ಸೇರಿಸುವಾಗ ಅಥವಾ ನವೀಕರಿಸುವಾಗ:
1. `translations/` ಫೋಲ್ಡರ್ ರಚನೆಯನ್ನು ಅನುಸರಿಸಿ
2. ಭಾಷಾ ಕೋಡ್ ಅನ್ನು ಫೋಲ್ಡರ್ ಹೆಸರಾಗಿ ಬಳಸಿ (ಉದಾ: ಫ್ರೆಂಚ್‌ಗೆ `fr`)
3. ಇಂಗ್ಲಿಷ್ ಆವೃತ್ತಿಯಂತೆ ಫೈಲ್ ರಚನೆಯನ್ನು ಕಾಯ್ದುಕೊಳ್ಳಿ
4. ಕ್ವಿಜ್ ಲಿಂಕ್‌ಗಳನ್ನು ಭಾಷಾ ಪರಿಮಾಣದೊಂದಿಗೆ ನವೀಕರಿಸಿ: `?loc=fr`
5. ಎಲ್ಲಾ ಲಿಂಕ್‌ಗಳು ಮತ್ತು ಫಾರ್ಮ್ಯಾಟಿಂಗ್ ಅನ್ನು ಪರೀಕ್ಷಿಸಿ
## ಪುಲ್ ರಿಕ್ವೆಸ್ಟ್ ಪ್ರಕ್ರಿಯೆ
### ಸಲ್ಲಿಸುವ ಮೊದಲು
1. **ನಿಮ್ಮ ಶಾಖೆಯನ್ನು ಇತ್ತೀಚಿನ ಬದಲಾವಣೆಗಳೊಂದಿಗೆ ನವೀಕರಿಸಿ**:
```bash
git fetch upstream
git rebase upstream/main
```
2. **ನಿಮ್ಮ ಬದಲಾವಣೆಗಳನ್ನು ಪರೀಕ್ಷಿಸಿ**:
- ಎಲ್ಲಾ ಬದಲಾಯಿಸಿದ ನೋಟ್ಬುಕ್‌ಗಳನ್ನು ಓಡಿಸಿ
- ಬದಲಾಯಿಸಿದರೆ ಕ್ವಿಜ್ ಅಪ್ಲಿಕೇಶನ್ ಪರೀಕ್ಷಿಸಿ
- ಎಲ್ಲಾ ಲಿಂಕ್‌ಗಳು ಕಾರ್ಯನಿರ್ವಹಿಸುತ್ತವೆ ಎಂದು ಖಚಿತಪಡಿಸಿ
- ವ್ಯಾಕರಣ ಮತ್ತು ಶಬ್ದದೋಷಗಳಿಗಾಗಿ ಪರಿಶೀಲಿಸಿ
3. **ನಿಮ್ಮ ಬದಲಾವಣೆಗಳನ್ನು ಕಮಿಟ್ ಮಾಡಿ**:
```bash
git add .
git commit -m "Brief description of changes"
```
ಸ್ಪಷ್ಟ ಕಮಿಟ್ ಸಂದೇಶಗಳನ್ನು ಬರೆಯಿರಿ:
- ವರ್ತಮಾನ ಕಾಲ ಬಳಸಿ ("Add feature" "Added feature" ಅಲ್ಲ)
- ಆಜ್ಞಾಪದ ಭಾವ ಬಳಸಿ ("Move cursor to..." "Moves cursor to..." ಅಲ್ಲ)
- ಮೊದಲ ಸಾಲು 72 ಅಕ್ಷರಗಳಿಗೆ ಮಿತಿಮಾಡಿ
- ಸಂಬಂಧಿತ ಸಮಸ್ಯೆಗಳು ಮತ್ತು ಪುಲ್ ರಿಕ್ವೆಸ್ಟ್‌ಗಳನ್ನು ಉಲ್ಲೇಖಿಸಿ
4. **ನಿಮ್ಮ ಫೋರ್ಕ್‌ಗೆ ಪುಷ್ ಮಾಡಿ**:
```bash
git push origin feature/your-feature-name
```
### ಪುಲ್ ರಿಕ್ವೆಸ್ಟ್ ರಚನೆ
1. [ರಿಪೊಸಿಟರಿಯ](https://github.com/microsoft/Data-Science-For-Beginners) ಗೆ ಹೋಗಿ
2. "Pull requests" → "New pull request" ಕ್ಲಿಕ್ ಮಾಡಿ
3. "compare across forks" ಕ್ಲಿಕ್ ಮಾಡಿ
4. ನಿಮ್ಮ ಫೋರ್ಕ್ ಮತ್ತು ಶಾಖೆಯನ್ನು ಆಯ್ಕೆಮಾಡಿ
5. "Create pull request" ಕ್ಲಿಕ್ ಮಾಡಿ
### PR ಶೀರ್ಷಿಕೆ ಸ್ವರೂಪ
ಈ ಸ್ವರೂಪವನ್ನು ಅನುಸರಿಸಿ ಸ್ಪಷ್ಟ, ವಿವರಣಾತ್ಮಕ ಶೀರ್ಷಿಕೆಗಳನ್ನು ಬಳಸಿ:
```
[Component] Brief description
```
ಉದಾಹರಣೆಗಳು:
- `[Lesson 7] Python ನೋಟ್ಬುಕ್ ಆಮದು ದೋಷವನ್ನು ಸರಿಪಡಿಸಿ`
- `[Quiz App] ಜರ್ಮನ್ ಅನುವಾದವನ್ನು ಸೇರಿಸಿ`
- `[Docs] README ನವೀಕರಣ ಹೊಸ ಪೂರ್ವಾಪೇಕ್ಷಿತಗಳೊಂದಿಗೆ`
- `[Fix] ದೃಶ್ಯೀಕರಣ ಪಾಠದಲ್ಲಿ ಡೇಟಾ ಮಾರ್ಗವನ್ನು ಸರಿಪಡಿಸಿ`
### PR ವಿವರಣೆ
ನಿಮ್ಮ PR ವಿವರಣೆಯಲ್ಲಿ ಸೇರಿಸಿ:
- **ಏನು**: ನೀವು ಯಾವ ಬದಲಾವಣೆಗಳನ್ನು ಮಾಡಿದ್ದೀರಿ?
- **ಯಾಕೆ**: ಈ ಬದಲಾವಣೆಗಳು ಯಾಕೆ ಅಗತ್ಯ?
- **ಹೇಗೆ**: ನೀವು ಬದಲಾವಣೆಗಳನ್ನು ಹೇಗೆ ಜಾರಿಗೆ ತಂದಿರಿ?
- **ಪರೀಕ್ಷೆ**: ನೀವು ಬದಲಾವಣೆಗಳನ್ನು ಹೇಗೆ ಪರೀಕ್ಷಿಸಿದ್ದೀರಿ?
- **ಸ್ಕ್ರೀನ್‌ಶಾಟ್‌ಗಳು**: ದೃಶ್ಯ ಬದಲಾವಣೆಗಳಿಗೆ ಸ್ಕ್ರೀನ್‌ಶಾಟ್‌ಗಳನ್ನು ಸೇರಿಸಿ
- **ಸಂಬಂಧಿತ ಸಮಸ್ಯೆಗಳು**: ಸಂಬಂಧಿತ ಸಮಸ್ಯೆಗಳಿಗೆ ಲಿಂಕ್ (ಉದಾ: "Fixes #123")
### ವಿಮರ್ಶಾ ಪ್ರಕ್ರಿಯೆ
1. **ಸ್ವಯಂಚಾಲಿತ ಪರಿಶೀಲನೆಗಳು** ನಿಮ್ಮ PR ಮೇಲೆ ನಡೆಯುತ್ತವೆ
2. **ನಿರ್ವಹಕರು ನಿಮ್ಮ ಕೊಡುಗೆ ಪರಿಶೀಲಿಸುತ್ತಾರೆ**
3. **ಪ್ರತಿಕ್ರಿಯೆಗಳನ್ನು ಗಮನಿಸಿ ಹೆಚ್ಚುವರಿ ಕಮಿಟ್‌ಗಳನ್ನು ಮಾಡಿ**
4. ಒಪ್ಪಿಗೆಯಾದ ನಂತರ, **ನಿರ್ವಹಕರು ನಿಮ್ಮ PR ಅನ್ನು ಮರ್ಜ್ ಮಾಡುತ್ತಾರೆ**
### ನಿಮ್ಮ PR ಮರ್ಜ್ ಆದ ನಂತರ
1. ನಿಮ್ಮ ಶಾಖೆಯನ್ನು ಅಳಿಸಿ:
```bash
git branch -d feature/your-feature-name
git push origin --delete feature/your-feature-name
```
2. ನಿಮ್ಮ ಫೋರ್ಕ್ ಅನ್ನು ನವೀಕರಿಸಿ:
```bash
git checkout main
git pull upstream main
git push origin main
```
## ಶೈಲಿ ಮಾರ್ಗಸೂಚಿಗಳು
### ಮಾರ್ಕ್‌ಡೌನ್
- ಸತತ ಶೀರ್ಷಿಕೆ ಮಟ್ಟಗಳನ್ನು ಬಳಸಿ
- ವಿಭಾಗಗಳ ನಡುವೆ ಖಾಲಿ ಸಾಲುಗಳನ್ನು ಸೇರಿಸಿ
- ಭಾಷಾ ಸೂಚಕಗಳೊಂದಿಗೆ ಕೋಡ್ ಬ್ಲಾಕ್‌ಗಳನ್ನು ಬಳಸಿ:
````markdown
```python
import pandas as pd
```
````
- ಚಿತ್ರಗಳಿಗೆ alt ಪಠ್ಯ ಸೇರಿಸಿ: `![Alt text](../../translated_images/image.4ee84a82b5e4c9e6651b13fd27dcf615e427ec584929f2cef7167aa99151a77a.kn.png)`
- ಸಾಲಿನ ಉದ್ದವನ್ನು ಯುಕ್ತಮಟ್ಟದಲ್ಲಿ ಇಡಿ (ಸುಮಾರು 80-100 ಅಕ್ಷರಗಳು)
### Python
- PEP 8 ಶೈಲಿ ಮಾರ್ಗಸೂಚಿಯನ್ನು ಅನುಸರಿಸಿ
- ಅರ್ಥಪೂರ್ಣ ಚರಗಳ ಹೆಸರುಗಳನ್ನು ಬಳಸಿ
- ಫಂಕ್ಷನ್‌ಗಳಿಗೆ ಡಾಕ್ಸ್ಟ್ರಿಂಗ್‌ಗಳನ್ನು ಸೇರಿಸಿ
- ಅಗತ್ಯವಿದ್ದಲ್ಲಿ ಟೈಪ್ ಸೂಚನೆಗಳನ್ನು ಸೇರಿಸಿ:
```python
def process_data(df: pd.DataFrame) -> pd.DataFrame:
"""Process the input dataframe."""
return df
```
### JavaScript/Vue.js
- Vue.js 2 ಶೈಲಿ ಮಾರ್ಗಸೂಚಿಯನ್ನು ಅನುಸರಿಸಿ
- ESLint ಸಂರಚನೆಯನ್ನು ಬಳಸಿ
- ಮಡ್ಯೂಲರ್, ಮರುಬಳಕೆ ಮಾಡಬಹುದಾದ ಘಟಕಗಳನ್ನು ಬರೆಯಿರಿ
- ಸಂಕೀರ್ಣ ತರ್ಕಕ್ಕೆ ಕಾಮೆಂಟ್‌ಗಳನ್ನು ಸೇರಿಸಿ
### ಫೈಲ್ ಸಂಘಟನೆ
- ಸಂಬಂಧಿತ ಫೈಲ್‌ಗಳನ್ನು ಒಟ್ಟಿಗೆ ಇಡಿ
- ವಿವರಣಾತ್ಮಕ ಫೈಲ್ ಹೆಸರುಗಳನ್ನು ಬಳಸಿ
- ಇತ್ತೀಚಿನ ಡೈರೆಕ್ಟರಿ ರಚನೆಯನ್ನು ಅನುಸರಿಸಿ
- ಅನಗತ್ಯ ಫೈಲ್‌ಗಳನ್ನು ಕಮಿಟ್ ಮಾಡಬೇಡಿ (.DS_Store, .pyc, node_modules, ಇತ್ಯಾದಿ)
## ಕೊಡುಗೆದಾರ ಪರವಾನಗಿ ಒಪ್ಪಂದ
ಈ ಯೋಜನೆ ಕೊಡುಗೆಗಳು ಮತ್ತು ಸಲಹೆಗಳನ್ನು ಸ್ವಾಗತಿಸುತ್ತದೆ. ಬಹುತೇಕ ಕೊಡುಗೆಗಳಿಗೆ ನೀವು
ಕೊಡುಗೆದಾರ ಪರವಾನಗಿ ಒಪ್ಪಂದ (CLA) ಗೆ ಒಪ್ಪಿಗೆ ನೀಡಬೇಕಾಗುತ್ತದೆ, ಇದು ನೀವು ನಿಮ್ಮ ಕೊಡುಗೆ ಬಳಸಲು
ನಮ್ಮಿಗೆ ಹಕ್ಕುಗಳನ್ನು ನೀಡಲು ಹಕ್ಕು ಹೊಂದಿದ್ದೀರಿ ಮತ್ತು ನಿಜವಾಗಿಯೂ ನೀಡುತ್ತೀರಿ ಎಂದು ಘೋಷಿಸುತ್ತದೆ. ವಿವರಗಳಿಗೆ,
https://cla.microsoft.com ನೋಡಿ.
ನೀವು ಪುಲ್ ರಿಕ್ವೆಸ್ಟ್ ಸಲ್ಲಿಸುವಾಗ, CLA-ಬಾಟ್ ಸ್ವಯಂಚಾಲಿತವಾಗಿ ನೀವು CLA ಒದಗಿಸಬೇಕೇ ಎಂದು ನಿರ್ಧರಿಸಿ PR ಅನ್ನು ಸೂಕ್ತವಾಗಿ ಅಲಂಕರಿಸುತ್ತದೆ (ಉದಾ: ಲೇಬಲ್, ಕಾಮೆಂಟ್). ಬಾಟ್ ನೀಡುವ ಸೂಚನೆಗಳನ್ನು ಅನುಸರಿಸಿ. ನಮ್ಮ CLA ಬಳಸಿ ಎಲ್ಲಾ ರಿಪೊಸಿಟರಿಗಳಲ್ಲಿ ನೀವು ಇದನ್ನು ಒಂದೇ ಬಾರಿ ಮಾಡಬೇಕಾಗುತ್ತದೆ.
## ಪ್ರಶ್ನೆಗಳು?
- ನಮ್ಮ [Discord ಚಾನೆಲ್ #data-science-for-beginners](https://aka.ms/ds4beginners/discord) ಪರಿಶೀಲಿಸಿ
- ನಮ್ಮ [Discord ಸಮುದಾಯ](https://aka.ms/ds4beginners/discord) ಸೇರಿ
- ಇತ್ತೀಚಿನ [ಸಮಸ್ಯೆಗಳು](https://github.com/microsoft/Data-Science-For-Beginners/issues) ಮತ್ತು [ಪುಲ್ ರಿಕ್ವೆಸ್ಟ್‌ಗಳು](https://github.com/microsoft/Data-Science-For-Beginners/pulls) ಪರಿಶೀಲಿಸಿ
## ಧನ್ಯವಾದಗಳು!
ನಿಮ್ಮ ಕೊಡುಗೆಗಳು ಈ ಪಠ್ಯಕ್ರಮವನ್ನು ಎಲ್ಲರಿಗೂ ಉತ್ತಮವಾಗಿಸುತ್ತವೆ. ಕೊಡುಗೆ ನೀಡಲು ಸಮಯ ತೆಗೆದುಕೊಂಡಿದ್ದಕ್ಕೆ ಧನ್ಯವಾದಗಳು!
---
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
**ಅಸ್ವೀಕರಣ**:
ಈ ದಸ್ತಾವೇಜು AI ಅನುವಾದ ಸೇವೆ [Co-op Translator](https://github.com/Azure/co-op-translator) ಬಳಸಿ ಅನುವಾದಿಸಲಾಗಿದೆ. ನಾವು ನಿಖರತೆಯಿಗಾಗಿ ಪ್ರಯತ್ನಿಸುತ್ತಿದ್ದರೂ, ಸ್ವಯಂಚಾಲಿತ ಅನುವಾದಗಳಲ್ಲಿ ತಪ್ಪುಗಳು ಅಥವಾ ಅಸತ್ಯತೆಗಳು ಇರಬಹುದು ಎಂದು ದಯವಿಟ್ಟು ಗಮನಿಸಿ. ಮೂಲ ಭಾಷೆಯಲ್ಲಿರುವ ಮೂಲ ದಸ್ತಾವೇಜನ್ನು ಅಧಿಕೃತ ಮೂಲವಾಗಿ ಪರಿಗಣಿಸಬೇಕು. ಮಹತ್ವದ ಮಾಹಿತಿಗಾಗಿ, ವೃತ್ತಿಪರ ಮಾನವ ಅನುವಾದವನ್ನು ಶಿಫಾರಸು ಮಾಡಲಾಗುತ್ತದೆ. ಈ ಅನುವಾದ ಬಳಕೆಯಿಂದ ಉಂಟಾಗುವ ಯಾವುದೇ ತಪ್ಪು ಅರ್ಥಮಾಡಿಕೊಳ್ಳುವಿಕೆ ಅಥವಾ ತಪ್ಪು ವಿವರಣೆಗಳಿಗೆ ನಾವು ಹೊಣೆಗಾರರಾಗುವುದಿಲ್ಲ.
<!-- CO-OP TRANSLATOR DISCLAIMER END -->

@ -0,0 +1,263 @@
<!--
CO_OP_TRANSLATOR_METADATA:
{
"original_hash": "a64d8afa22ffcc2016bb239188d6acb1",
"translation_date": "2025-12-19T13:13:01+00:00",
"source_file": "INSTALLATION.md",
"language_code": "kn"
}
-->
# ಸ್ಥಾಪನೆ ಮಾರ್ಗದರ್ಶಿ
ಈ ಮಾರ್ಗದರ್ಶಿ ನಿಮಗೆ Data Science for Beginners ಪಠ್ಯಕ್ರಮದೊಂದಿಗೆ ಕೆಲಸ ಮಾಡಲು ನಿಮ್ಮ ಪರಿಸರವನ್ನು ಸೆಟ್ ಅಪ್ ಮಾಡಲು ಸಹಾಯ ಮಾಡುತ್ತದೆ.
## ವಿಷಯಗಳ ಪಟ್ಟಿಯು
- [ಪೂರ್ವಾಪೇಕ್ಷೆಗಳು](../..)
- [ತ್ವರಿತ ಪ್ರಾರಂಭ ಆಯ್ಕೆಗಳು](../..)
- [ಸ್ಥಳೀಯ ಸ್ಥಾಪನೆ](../..)
- [ನಿಮ್ಮ ಸ್ಥಾಪನೆಯನ್ನು ಪರಿಶೀಲಿಸಿ](../..)
## ಪೂರ್ವಾಪೇಕ್ಷೆಗಳು
ನೀವು ಪ್ರಾರಂಭಿಸುವ ಮೊದಲು, ನಿಮಗೆ ಇರಬೇಕು:
- ಕಮಾಂಡ್ ಲೈನ್/ಟರ್ಮಿನಲ್ ಬಗ್ಗೆ ಮೂಲ ಪರಿಚಯ
- GitHub ಖಾತೆ (ಉಚಿತ)
- ಪ್ರಾಥಮಿಕ ಸೆಟ್ ಅಪ್‌ಗಾಗಿ ಸ್ಥಿರ ಇಂಟರ್ನೆಟ್ ಸಂಪರ್ಕ
## ತ್ವರಿತ ಪ್ರಾರಂಭ ಆಯ್ಕೆಗಳು
### ಆಯ್ಕೆ 1: GitHub Codespaces (ಆರಂಭಿಕರಿಗೆ ಶಿಫಾರಸು)
ತ್ವರಿತವಾಗಿ ಪ್ರಾರಂಭಿಸುವ ಸುಲಭ ಮಾರ್ಗ GitHub Codespaces, ಇದು ನಿಮ್ಮ ಬ್ರೌಸರ್‌ನಲ್ಲಿ ಸಂಪೂರ್ಣ ಅಭಿವೃದ್ಧಿ ಪರಿಸರವನ್ನು ಒದಗಿಸುತ್ತದೆ.
1. [repository](https://github.com/microsoft/Data-Science-For-Beginners) ಗೆ ಹೋಗಿ
2. **Code** ಡ್ರಾಪ್‌ಡೌನ್ ಮೆನು ಕ್ಲಿಕ್ ಮಾಡಿ
3. **Codespaces** ಟ್ಯಾಬ್ ಆಯ್ಕೆಮಾಡಿ
4. **Create codespace on main** ಕ್ಲಿಕ್ ಮಾಡಿ
5. ಪರಿಸರ ಆರಂಭವಾಗಲು ಕಾಯಿರಿ (2-3 ನಿಮಿಷಗಳು)
ನಿಮ್ಮ ಪರಿಸರ ಈಗ ಎಲ್ಲಾ ಅವಲಂಬನೆಗಳೊಂದಿಗೆ ಸಿದ್ಧವಾಗಿದೆ!
### ಆಯ್ಕೆ 2: ಸ್ಥಳೀಯ ಅಭಿವೃದ್ಧಿ
ನಿಮ್ಮ ಸ್ವಂತ ಕಂಪ್ಯೂಟರ್‌ನಲ್ಲಿ ಕೆಲಸ ಮಾಡಲು, ಕೆಳಗಿನ ವಿವರವಾದ ಸೂಚನೆಗಳನ್ನು ಅನುಸರಿಸಿ.
## ಸ್ಥಳೀಯ ಸ್ಥಾಪನೆ
### ಹಂತ 1: Git ಅನ್ನು ಸ್ಥಾಪಿಸಿ
Git ಅನ್ನು ರೆಪೊಸಿಟರಿಯನ್ನು ಕ್ಲೋನ್ ಮಾಡಲು ಮತ್ತು ನಿಮ್ಮ ಬದಲಾವಣೆಗಳನ್ನು ಟ್ರ್ಯಾಕ್ ಮಾಡಲು ಅಗತ್ಯವಿದೆ.
**Windows:**
- [git-scm.com](https://git-scm.com/download/win) ನಿಂದ ಡೌನ್‌ಲೋಡ್ ಮಾಡಿ
- ಡೀಫಾಲ್ಟ್ ಸೆಟ್ಟಿಂಗ್‌ಗಳೊಂದಿಗೆ ಇನ್‌ಸ್ಟಾಲರ್ ಅನ್ನು ರನ್ ಮಾಡಿ
**macOS:**
- Homebrew ಮೂಲಕ ಇನ್‌ಸ್ಟಾಲ್ ಮಾಡಿ: `brew install git`
- ಅಥವಾ [git-scm.com](https://git-scm.com/download/mac) ನಿಂದ ಡೌನ್‌ಲೋಡ್ ಮಾಡಿ
**Linux:**
```bash
# ಡೆಬಿಯನ್/ಉಬುಂಟು
sudo apt-get update
sudo apt-get install git
# ಫೆಡೋರಾ
sudo dnf install git
# ಆರ್ಚ್
sudo pacman -S git
```
### ಹಂತ 2: ರೆಪೊಸಿಟರಿಯನ್ನು ಕ್ಲೋನ್ ಮಾಡಿ
```bash
# ರೆಪೊಸಿಟರಿಯನ್ನು ಕ್ಲೋನ್ ಮಾಡಿ
git clone https://github.com/microsoft/Data-Science-For-Beginners.git
# ಡೈರೆಕ್ಟರಿಯ ಕಡೆಗೆ ನವಿಗೇಟ್ ಮಾಡಿ
cd Data-Science-For-Beginners
```
### ಹಂತ 3: Python ಮತ್ತು Jupyter ಅನ್ನು ಸ್ಥಾಪಿಸಿ
Python 3.7 ಅಥವಾ ಹೆಚ್ಚಿನ ಆವೃತ್ತಿ ಡೇಟಾ ಸೈನ್ಸ್ ಪಾಠಗಳಿಗೆ ಅಗತ್ಯವಿದೆ.
**Windows:**
1. [python.org](https://www.python.org/downloads/) ನಿಂದ Python ಡೌನ್‌ಲೋಡ್ ಮಾಡಿ
2. ಸ್ಥಾಪನೆಯ ಸಮಯದಲ್ಲಿ "Add Python to PATH" ಅನ್ನು ಪರಿಶೀಲಿಸಿ
3. ಸ್ಥಾಪನೆಯನ್ನು ಪರಿಶೀಲಿಸಿ:
```bash
python --version
```
**macOS:**
```bash
# ಹೋಮ್‌ಬ್ರೂ ಬಳಸಿ
brew install python3
# ಸ್ಥಾಪನೆಯನ್ನು ಪರಿಶೀಲಿಸಿ
python3 --version
```
**Linux:**
```bash
# ಬಹುತೇಕ ಲಿನಕ್ಸ್ನ ವಿತರಣೆಗಳು ಪೈಥಾನ್ ಅನ್ನು ಪೂರ್ವಸ್ಥಾಪಿತವಾಗಿ ಹೊಂದಿವೆ
python3 --version
# ಸ್ಥಾಪಿಸಲಾಗದಿದ್ದರೆ:
# ಡೆಬಿಯನ್/ಉಬುಂಟು
sudo apt-get install python3 python3-pip
# ಫೆಡೋರಾ
sudo dnf install python3 python3-pip
```
### ಹಂತ 4: Python ಪರಿಸರವನ್ನು ಸೆಟ್ ಅಪ್ ಮಾಡಿ
ಅವಲಂಬನೆಗಳನ್ನು ಪ್ರತ್ಯೇಕವಾಗಿ ಇಡಲು ವರ್ಚುವಲ್ ಪರಿಸರವನ್ನು ಬಳಸಲು ಶಿಫಾರಸು ಮಾಡಲಾಗಿದೆ.
```bash
# ವರ್ಚುವಲ್ ಪರಿಸರವನ್ನು ರಚಿಸಿ
python -m venv venv
# ವರ್ಚುವಲ್ ಪರಿಸರವನ್ನು ಸಕ್ರಿಯಗೊಳಿಸಿ
# ವಿಂಡೋಸ್‌ನಲ್ಲಿ:
venv\Scripts\activate
# ಮ್ಯಾಕ್‌ಒಎಸ್/ಲಿನಕ್ಸ್ನಲ್ಲಿ:
source venv/bin/activate
```
### ಹಂತ 5: Python ಪ್ಯಾಕೇಜುಗಳನ್ನು ಸ್ಥಾಪಿಸಿ
ಅಗತ್ಯವಿರುವ ಡೇಟಾ ಸೈನ್ಸ್ ಲೈಬ್ರರಿಗಳನ್ನು ಸ್ಥಾಪಿಸಿ:
```bash
pip install jupyter pandas numpy matplotlib seaborn scikit-learn
```
### ಹಂತ 6: Node.js ಮತ್ತು npm ಅನ್ನು ಸ್ಥಾಪಿಸಿ (Quiz ಅಪ್ಲಿಕೇಶನ್‌ಗಾಗಿ)
ಕ್ವಿಜ್ ಅಪ್ಲಿಕೇಶನ್‌ಗೆ Node.js ಮತ್ತು npm ಅಗತ್ಯವಿದೆ.
**Windows/macOS:**
- [nodejs.org](https://nodejs.org/) ನಿಂದ ಡೌನ್‌ಲೋಡ್ ಮಾಡಿ (LTS ಆವೃತ್ತಿ ಶಿಫಾರಸು)
- ಇನ್‌ಸ್ಟಾಲರ್ ಅನ್ನು ರನ್ ಮಾಡಿ
**Linux:**
```bash
# ಡೆಬಿಯನ್/ಉಬುಂಟು
# ಎಚ್ಚರಿಕೆ: ಇಂಟರ್ನೆಟ್‌ನಿಂದ ಸ್ಕ್ರಿಪ್ಟ್‌ಗಳನ್ನು ನೇರವಾಗಿ ಬಾಷ್‌ಗೆ ಪೈಪ್ ಮಾಡುವುದು ಭದ್ರತಾ ಅಪಾಯವಾಗಬಹುದು.
# ಸ್ಕ್ರಿಪ್ಟ್ ಅನ್ನು ಚಾಲನೆ ಮಾಡುವ ಮೊದಲು ಪರಿಶೀಲಿಸುವುದು ಶಿಫಾರಸು ಮಾಡಲಾಗಿದೆ:
# curl -fsSL https://deb.nodesource.com/setup_lts.x -o setup_lts.x
# less setup_lts.x
# ನಂತರ ಚಾಲನೆ ಮಾಡಿ:
# sudo -E bash setup_lts.x
#
# ಬದಲಾಗಿ, ಕೆಳಗಿನ ಒನ್-ಲೈನರ್ ಅನ್ನು ನಿಮ್ಮ ಸ್ವಂತ ಅಪಾಯದಲ್ಲಿ ಬಳಸಬಹುದು:
curl -fsSL https://deb.nodesource.com/setup_lts.x | sudo -E bash -
sudo apt-get install -y nodejs
# ಫೆಡೋರಾ
sudo dnf install nodejs
# ಸ್ಥಾಪನೆಯನ್ನು ಪರಿಶೀಲಿಸಿ
node --version
npm --version
```
### ಹಂತ 7: Quiz ಅಪ್ಲಿಕೇಶನ್ ಅವಲಂಬನೆಗಳನ್ನು ಸ್ಥಾಪಿಸಿ
```bash
# ಕ್ವಿಜ್ ಅಪ್ಲಿಕೇಶನ್ ಡೈರೆಕ್ಟರಿಗೆ ನ್ಯಾವಿಗೇಟ್ ಮಾಡಿ
cd quiz-app
# ಅವಲಂಬನೆಗಳನ್ನು ಸ್ಥಾಪಿಸಿ
npm install
# ರೂಟ್ ಡೈರೆಕ್ಟರಿಗೆ ಮರಳಿ ಹೋಗಿ
cd ..
```
### ಹಂತ 8: Docsify ಅನ್ನು ಸ್ಥಾಪಿಸಿ (ಐಚ್ಛಿಕ)
ಡಾಕ್ಯುಮೆಂಟೇಶನ್‌ಗೆ ಆಫ್‌ಲೈನ್ ಪ್ರವೇಶಕ್ಕಾಗಿ:
```bash
npm install -g docsify-cli
```
## ನಿಮ್ಮ ಸ್ಥಾಪನೆಯನ್ನು ಪರಿಶೀಲಿಸಿ
### Python ಮತ್ತು Jupyter ಅನ್ನು ಪರೀಕ್ಷಿಸಿ
```bash
# ನಿಮ್ಮ ವರ್ಚುವಲ್ ಪರಿಸರವನ್ನು ಈಗಾಗಲೇ ಸಕ್ರಿಯಗೊಳಿಸದಿದ್ದರೆ ಸಕ್ರಿಯಗೊಳಿಸಿ
# ವಿಂಡೋಸ್‌ನಲ್ಲಿ:
venv\Scripts\activate
# ಮ್ಯಾಕ್‌ಒಎಸ್/ಲಿನಕ್ಸ್ನಲ್ಲಿ:
source venv/bin/activate
# ಜುಪೈಟರ್ ನೋಟ್ಬುಕ್ ಪ್ರಾರಂಭಿಸಿ
jupyter notebook
```
ನಿಮ್ಮ ಬ್ರೌಸರ್ Jupyter ಇಂಟರ್ಫೇಸ್ ಅನ್ನು ತೆರೆಯಬೇಕು. ನೀವು ಈಗ ಯಾವುದೇ ಪಾಠದ `.ipynb` ಫೈಲ್‌ಗೆ ಹೋಗಬಹುದು.
### Quiz ಅಪ್ಲಿಕೇಶನ್ ಅನ್ನು ಪರೀಕ್ಷಿಸಿ
```bash
# ಕ್ವಿಜ್ ಅಪ್ಲಿಕೇಶನ್‌ಗೆ ನ್ಯಾವಿಗೇಟ್ ಮಾಡಿ
cd quiz-app
# ಅಭಿವೃದ್ಧಿ ಸರ್ವರ್ ಪ್ರಾರಂಭಿಸಿ
npm run serve
```
ಕ್ವಿಜ್ ಅಪ್ಲಿಕೇಶನ್ `http://localhost:8080` (ಅಥವಾ 8080 ಬ್ಯುಸಿ ಇದ್ದರೆ ಬೇರೆ ಪೋರ್ಟ್) ನಲ್ಲಿ ಲಭ್ಯವಿರಬೇಕು.
### ಡಾಕ್ಯುಮೆಂಟೇಶನ್ ಸರ್ವರ್ ಅನ್ನು ಪರೀಕ್ಷಿಸಿ
```bash
# ಸಂಗ್ರಹಣೆಯ ಮೂಲ ಡೈರೆಕ್ಟರಿಯಿಂದ
docsify serve
```
ಡಾಕ್ಯುಮೆಂಟೇಶನ್ `http://localhost:3000` ನಲ್ಲಿ ಲಭ್ಯವಿರಬೇಕು.
## VS Code Dev Containers ಬಳಕೆ
ನೀವು Docker ಅನ್ನು ಸ್ಥಾಪಿಸಿಕೊಂಡಿದ್ದರೆ, ನೀವು VS Code Dev Containers ಅನ್ನು ಬಳಸಬಹುದು:
1. [Docker Desktop](https://www.docker.com/products/docker-desktop) ಅನ್ನು ಸ್ಥಾಪಿಸಿ
2. [Visual Studio Code](https://code.visualstudio.com/) ಅನ್ನು ಸ್ಥಾಪಿಸಿ
3. [Remote - Containers extension](https://marketplace.visualstudio.com/items?itemName=ms-vscode-remote.remote-containers) ಅನ್ನು ಸ್ಥಾಪಿಸಿ
4. ರೆಪೊಸಿಟರಿಯನ್ನು VS Code ನಲ್ಲಿ ತೆರೆಯಿರಿ
5. `F1` ಒತ್ತಿ ಮತ್ತು "Remote-Containers: Reopen in Container" ಆಯ್ಕೆಮಾಡಿ
6. ಕಂಟೈನರ್ ನಿರ್ಮಾಣವಾಗಲು ಕಾಯಿರಿ (ಮೊದಲ ಬಾರಿ ಮಾತ್ರ)
## ಮುಂದಿನ ಹಂತಗಳು
- ಪಠ್ಯಕ್ರಮದ ಅವಲೋಕನಕ್ಕಾಗಿ [README.md](README.md) ಅನ್ನು ಅನ್ವೇಷಿಸಿ
- ಸಾಮಾನ್ಯ ಕಾರ್ಯಪ್ರವಾಹಗಳು ಮತ್ತು ಉದಾಹರಣೆಗಳಿಗಾಗಿ [USAGE.md](USAGE.md) ಓದಿ
- ಸಮಸ್ಯೆಗಳು ಎದುರಾದರೆ [TROUBLESHOOTING.md](TROUBLESHOOTING.md) ಪರಿಶೀಲಿಸಿ
- ಕೊಡುಗೆ ನೀಡಲು ಬಯಸಿದರೆ [CONTRIBUTING.md](CONTRIBUTING.md) ಪರಿಶೀಲಿಸಿ
## ಸಹಾಯ ಪಡೆಯುವುದು
ನೀವು ಸಮಸ್ಯೆಗಳನ್ನು ಎದುರಿಸಿದರೆ:
1. [TROUBLESHOOTING.md](TROUBLESHOOTING.md) ಮಾರ್ಗದರ್ಶಿಯನ್ನು ಪರಿಶೀಲಿಸಿ
2. ಇತ್ತೀಚಿನ [GitHub Issues](https://github.com/microsoft/Data-Science-For-Beginners/issues) ಹುಡುಕಿ
3. ನಮ್ಮ [Discord ಸಮುದಾಯ](https://aka.ms/ds4beginners/discord) ಸೇರಿ
4. ನಿಮ್ಮ ಸಮಸ್ಯೆಯ ವಿವರಗಳೊಂದಿಗೆ ಹೊಸ issue ರಚಿಸಿ
---
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
**ಅಸ್ವೀಕರಣ**:
ಈ ದಸ್ತಾವೇಜು [Co-op Translator](https://github.com/Azure/co-op-translator) ಎಂಬ AI ಅನುವಾದ ಸೇವೆಯನ್ನು ಬಳಸಿ ಅನುವಾದಿಸಲಾಗಿದೆ. ನಾವು ಶುದ್ಧತೆಯತ್ತ ಪ್ರಯತ್ನಿಸುತ್ತಿದ್ದರೂ, ಸ್ವಯಂಚಾಲಿತ ಅನುವಾದಗಳಲ್ಲಿ ತಪ್ಪುಗಳು ಅಥವಾ ಅಸತ್ಯತೆಗಳು ಇರಬಹುದು ಎಂಬುದನ್ನು ದಯವಿಟ್ಟು ಗಮನಿಸಿ. ಮೂಲ ಭಾಷೆಯಲ್ಲಿರುವ ಮೂಲ ದಸ್ತಾವೇಜನ್ನು ಅಧಿಕೃತ ಮೂಲವೆಂದು ಪರಿಗಣಿಸಬೇಕು. ಮಹತ್ವದ ಮಾಹಿತಿಗಾಗಿ, ವೃತ್ತಿಪರ ಮಾನವ ಅನುವಾದವನ್ನು ಶಿಫಾರಸು ಮಾಡಲಾಗುತ್ತದೆ. ಈ ಅನುವಾದ ಬಳಕೆಯಿಂದ ಉಂಟಾಗುವ ಯಾವುದೇ ತಪ್ಪು ಅರ್ಥಮಾಡಿಕೊಳ್ಳುವಿಕೆ ಅಥವಾ ತಪ್ಪು ವಿವರಣೆಗಳಿಗೆ ನಾವು ಹೊಣೆಗಾರರಾಗುವುದಿಲ್ಲ.
<!-- CO-OP TRANSLATOR DISCLAIMER END -->

@ -0,0 +1,252 @@
<!--
CO_OP_TRANSLATOR_METADATA:
{
"original_hash": "210052dafe5b5d956c427824e2c96686",
"translation_date": "2025-12-19T13:18:13+00:00",
"source_file": "README.md",
"language_code": "kn"
}
-->
# ಪ್ರಾರಂಭಿಕರಿಗಾಗಿ ಡೇಟಾ ಸೈನ್ಸ್ - ಒಂದು ಪಠ್ಯಕ್ರಮ
[![GitHub Codespaces ನಲ್ಲಿ ತೆರೆಯಿರಿ](https://github.com/codespaces/badge.svg)](https://github.com/codespaces/new?hide_repo_select=true&ref=main&repo=344191198)
[![GitHub ಪರವಾನಗಿ](https://img.shields.io/github/license/microsoft/Data-Science-For-Beginners.svg)](https://github.com/microsoft/Data-Science-For-Beginners/blob/master/LICENSE)
[![GitHub ಸಹಯೋಗಿಗಳು](https://img.shields.io/github/contributors/microsoft/Data-Science-For-Beginners.svg)](https://GitHub.com/microsoft/Data-Science-For-Beginners/graphs/contributors/)
[![GitHub ಸಮಸ್ಯೆಗಳು](https://img.shields.io/github/issues/microsoft/Data-Science-For-Beginners.svg)](https://GitHub.com/microsoft/Data-Science-For-Beginners/issues/)
[![GitHub ಪುಲ್-ರಿಕ್ವೆಸ್ಟ್‌ಗಳು](https://img.shields.io/github/issues-pr/microsoft/Data-Science-For-Beginners.svg)](https://GitHub.com/microsoft/Data-Science-For-Beginners/pulls/)
[![ಪಿಆರ್‌ಗಳಿಗೆ ಸ್ವಾಗತ](https://img.shields.io/badge/PRs-welcome-brightgreen.svg?style=flat-square)](http://makeapullrequest.com)
[![GitHub ವಾಚರ್ಸ್](https://img.shields.io/github/watchers/microsoft/Data-Science-For-Beginners.svg?style=social&label=Watch)](https://GitHub.com/microsoft/Data-Science-For-Beginners/watchers/)
[![GitHub ಫೋರ್ಕ್ಸ್](https://img.shields.io/github/forks/microsoft/Data-Science-For-Beginners.svg?style=social&label=Fork)](https://GitHub.com/microsoft/Data-Science-For-Beginners/network/)
[![GitHub ಸ್ಟಾರ್ಸ್](https://img.shields.io/github/stars/microsoft/Data-Science-For-Beginners.svg?style=social&label=Star)](https://GitHub.com/microsoft/Data-Science-For-Beginners/stargazers/)
[![Microsoft Foundry Discord](https://dcbadge.limes.pink/api/server/nTYy5BXMWG)](https://discord.gg/nTYy5BXMWG)
[![Microsoft Foundry Developer Forum](https://img.shields.io/badge/GitHub-Microsoft_Foundry_Developer_Forum-blue?style=for-the-badge&logo=github&color=000000&logoColor=fff)](https://aka.ms/foundry/forum)
ಮೈಕ್ರೋಸಾಫ್ಟ್‌ನ ಅಜೂರ್ ಕ್ಲೌಡ್ ಅಡ್ವೊಕೇಟ್ಸ್ ಡೇಟಾ ಸೈನ್ಸ್ ಬಗ್ಗೆ 10 ವಾರಗಳ, 20 ಪಾಠಗಳ ಪಠ್ಯಕ್ರಮವನ್ನು ನೀಡಲು ಸಂತೋಷಪಡುತ್ತಾರೆ. ಪ್ರತಿ ಪಾಠದಲ್ಲಿ ಪಾಠದ ಮುಂಚಿನ ಮತ್ತು ನಂತರದ ಕ್ವಿಜ್‌ಗಳು, ಪಾಠವನ್ನು ಪೂರ್ಣಗೊಳಿಸಲು ಬರೆಯಲಾದ ಸೂಚನೆಗಳು, ಪರಿಹಾರ ಮತ್ತು ನಿಯೋಜನೆ ಸೇರಿವೆ. ನಮ್ಮ ಪ್ರಾಜೆಕ್ಟ್ ಆಧಾರಿತ ಪಠ್ಯಕ್ರಮವು ನೀವು ನಿರ್ಮಿಸುವಾಗ ಕಲಿಯಲು ಅವಕಾಶ ನೀಡುತ್ತದೆ, ಇದು ಹೊಸ ಕೌಶಲ್ಯಗಳನ್ನು 'ಸ್ಥಿರವಾಗಿಸಲು' ಸಾಬೀತಾದ ವಿಧಾನವಾಗಿದೆ.
**ನಮ್ಮ ಲೇಖಕರಿಗೆ ಹೃತ್ಪೂರ್ವಕ ಧನ್ಯವಾದಗಳು:** [Jasmine Greenaway](https://www.twitter.com/paladique), [Dmitry Soshnikov](http://soshnikov.com), [Nitya Narasimhan](https://twitter.com/nitya), [Jalen McGee](https://twitter.com/JalenMcG), [Jen Looper](https://twitter.com/jenlooper), [Maud Levy](https://twitter.com/maudstweets), [Tiffany Souterre](https://twitter.com/TiffanySouterre), [Christopher Harrison](https://www.twitter.com/geektrainer).
**🙏 ವಿಶೇಷ ಧನ್ಯವಾದಗಳು 🙏 ನಮ್ಮ [Microsoft Student Ambassador](https://studentambassadors.microsoft.com/) ಲೇಖಕರು, ವಿಮರ್ಶಕರು ಮತ್ತು ವಿಷಯದ ಸಹಯೋಗಿಗಳಿಗೆ,** ವಿಶೇಷವಾಗಿ ಆರ್ಯನ್ ಅರುರಾ, [ಅದಿತ್ಯ ಗರ್ಗ್](https://github.com/AdityaGarg00), [ಅಲೋಂದ್ರಾ ಸಾಂಚೆಜ್](https://www.linkedin.com/in/alondra-sanchez-molina/), [ಅಂಕಿತಾ ಸಿಂಗ್](https://www.linkedin.com/in/ankitasingh007), [ಅನೂಪಮ್ ಮಿಶ್ರಾ](https://www.linkedin.com/in/anupam--mishra/), [ಅರ್ಪಿತಾ ದಾಸ್](https://www.linkedin.com/in/arpitadas01/), ಛೈಲ್‌ಬಿಹಾರಿ ದುಬೆ, [ಡಿಬ್ರಿ ನ್ಸೋಫರ್](https://www.linkedin.com/in/dibrinsofor), [ದಿಶಿತಾ ಭಾಸಿನ್](https://www.linkedin.com/in/dishita-bhasin-7065281bb), [ಮಜ್ದ್ ಸಾಫಿ](https://www.linkedin.com/in/majd-s/), [ಮ್ಯಾಕ್ಸ್ ಬ್ಲಮ್](https://www.linkedin.com/in/max-blum-6036a1186/), [ಮಿಗುಯೆಲ್ ಕೊರಿಯಾ](https://www.linkedin.com/in/miguelmque/), [ಮೊಹಮ್ಮ ಇಫ್ತೇಖರ್ (ಇಫ್ತು) ಎಬ್ನೆ ಜಲಾಲ್](https://twitter.com/iftu119), [ನಾವ್ರಿನ್ ತಬಸ್ಸುಮ್](https://www.linkedin.com/in/nawrin-tabassum), [ರೇಮಂಡ್ ವಾಂಸಾ ಪುತ್ರ](https://www.linkedin.com/in/raymond-wp/), [ರೋಹಿತ್ ಯಾದವ್](https://www.linkedin.com/in/rty2423), ಸಮೃಧಿ ಶರ್ಮಾ, [ಸನ್ಯಾ ಸಿಂಹ](https://www.linkedin.com/mwlite/in/sanya-sinha-13aab1200),
[ಶೀನಾ ನರುಳ](https://www.linkedin.com/in/sheena-narua-n/), [ತೌಕೀರ್ ಅಹ್ಮದ್](https://www.linkedin.com/in/tauqeerahmad5201/), ಯೋಗೇಂದ್ರಸಿಂಗ್ ಪವಾರ್ , [ವಿದುಷಿ ಗುಪ್ತ](https://www.linkedin.com/in/vidushi-gupta07/), [ಜಸ್ಲೀನ್ ಸೊಂಧಿ](https://www.linkedin.com/in/jasleen-sondhi/)
|![@sketchthedocs ಅವರ ಸ್ಕೆಚ್ ನೋಟ್ https://sketchthedocs.dev](../../translated_images/00-Title.8af36cd35da1ac555b678627fbdc6e320c75f0100876ea41d30ea205d3b08d22.kn.png)|
|:---:|
| ಪ್ರಾರಂಭಿಕರಿಗಾಗಿ ಡೇಟಾ ಸೈನ್ಸ್ - _ಸ್ಕೆಚ್ ನೋಟ್ [@nitya](https://twitter.com/nitya) ಅವರಿದ_ |
### 🌐 ಬಹುಭಾಷಾ ಬೆಂಬಲ
#### GitHub ಕ್ರಿಯೆಯಿಂದ ಬೆಂಬಲಿತ (ಸ್ವಯಂಚಾಲಿತ ಮತ್ತು ಸದಾ ನವೀಕರಿಸಲಾಗುತ್ತದೆ)
<!-- CO-OP TRANSLATOR LANGUAGES TABLE START -->
[Arabic](../ar/README.md) | [Bengali](../bn/README.md) | [Bulgarian](../bg/README.md) | [Burmese (Myanmar)](../my/README.md) | [Chinese (Simplified)](../zh/README.md) | [Chinese (Traditional, Hong Kong)](../hk/README.md) | [Chinese (Traditional, Macau)](../mo/README.md) | [Chinese (Traditional, Taiwan)](../tw/README.md) | [Croatian](../hr/README.md) | [Czech](../cs/README.md) | [Danish](../da/README.md) | [Dutch](../nl/README.md) | [Estonian](../et/README.md) | [Finnish](../fi/README.md) | [French](../fr/README.md) | [German](../de/README.md) | [Greek](../el/README.md) | [Hebrew](../he/README.md) | [Hindi](../hi/README.md) | [Hungarian](../hu/README.md) | [Indonesian](../id/README.md) | [Italian](../it/README.md) | [Japanese](../ja/README.md) | [Kannada](./README.md) | [Korean](../ko/README.md) | [Lithuanian](../lt/README.md) | [Malay](../ms/README.md) | [Malayalam](../ml/README.md) | [Marathi](../mr/README.md) | [Nepali](../ne/README.md) | [Nigerian Pidgin](../pcm/README.md) | [Norwegian](../no/README.md) | [Persian (Farsi)](../fa/README.md) | [Polish](../pl/README.md) | [Portuguese (Brazil)](../br/README.md) | [Portuguese (Portugal)](../pt/README.md) | [Punjabi (Gurmukhi)](../pa/README.md) | [Romanian](../ro/README.md) | [Russian](../ru/README.md) | [Serbian (Cyrillic)](../sr/README.md) | [Slovak](../sk/README.md) | [Slovenian](../sl/README.md) | [Spanish](../es/README.md) | [Swahili](../sw/README.md) | [Swedish](../sv/README.md) | [Tagalog (Filipino)](../tl/README.md) | [Tamil](../ta/README.md) | [Telugu](../te/README.md) | [Thai](../th/README.md) | [Turkish](../tr/README.md) | [Ukrainian](../uk/README.md) | [Urdu](../ur/README.md) | [Vietnamese](../vi/README.md)
<!-- CO-OP TRANSLATOR LANGUAGES TABLE END -->
**ನೀವು ಹೆಚ್ಚುವರಿ ಭಾಷಾ ಅನುವಾದಗಳನ್ನು ಬೆಂಬಲಿಸಲು ಬಯಸಿದರೆ, ಅವುಗಳನ್ನು [ಇಲ್ಲಿ](https://github.com/Azure/co-op-translator/blob/main/getting_started/supported-languages.md) ಪಟ್ಟಿ ಮಾಡಲಾಗಿದೆ**
#### ನಮ್ಮ ಸಮುದಾಯದಲ್ಲಿ ಸೇರಿ
[![Microsoft Foundry Discord](https://dcbadge.limes.pink/api/server/nTYy5BXMWG)](https://discord.gg/nTYy5BXMWG)
ನಾವು ಡಿಸ್ಕಾರ್ಡ್‌ನಲ್ಲಿ AI ಸರಣಿಯನ್ನು ನಡೆಸುತ್ತಿದ್ದೇವೆ, ಹೆಚ್ಚಿನ ಮಾಹಿತಿಗಾಗಿ ಮತ್ತು ಸೇರಲು [Learn with AI Series](https://aka.ms/learnwithai/discord) ಗೆ 18 - 30 ಸೆಪ್ಟೆಂಬರ್, 2025 ರಂದು ಭೇಟಿ ನೀಡಿ. ನೀವು GitHub Copilot ಅನ್ನು ಡೇಟಾ ಸೈನ್ಸ್‌ಗೆ ಬಳಸುವ ಸಲಹೆಗಳು ಮತ್ತು ತಂತ್ರಗಳನ್ನು ಪಡೆಯುತ್ತೀರಿ.
![Learn with AI series](../../translated_images/1.2b28cdc6205e26fef6a21817fe5d83ae8b50fbd0a33e9fed0df05845da5b30b6.kn.jpg)
# ನೀವು ವಿದ್ಯಾರ್ಥಿಯಾಗಿದ್ದೀರಾ?
ಕೆಳಗಿನ ಸಂಪನ್ಮೂಲಗಳಿಂದ ಪ್ರಾರಂಭಿಸಿ:
- [ವಿದ್ಯಾರ್ಥಿ ಹಬ್ ಪುಟ](https://docs.microsoft.com/en-gb/learn/student-hub?WT.mc_id=academic-77958-bethanycheum) ಈ ಪುಟದಲ್ಲಿ, ನೀವು ಪ್ರಾರಂಭಿಕರಿಗಾಗಿ ಸಂಪನ್ಮೂಲಗಳು, ವಿದ್ಯಾರ್ಥಿ ಪ್ಯಾಕ್ಗಳು ಮತ್ತು ಉಚಿತ ಪ್ರಮಾಣಪತ್ರ ವೋಚರ್ ಪಡೆಯುವ ಮಾರ್ಗಗಳನ್ನು ಕಾಣಬಹುದು. ಇದು ನೀವು ಬುಕ್‌ಮಾರ್ಕ್ ಮಾಡಿ ಸಮಯಕಾಲಕ್ಕೆ ಪರಿಶೀಲಿಸಬೇಕಾದ ಪುಟವಾಗಿದೆ ಏಕೆಂದರೆ ನಾವು ವಿಷಯವನ್ನು ಕನಿಷ್ಠ ತಿಂಗಳಿಗೆ ಬದಲಾಯಿಸುತ್ತೇವೆ.
- [Microsoft Learn Student Ambassadors](https://studentambassadors.microsoft.com?WT.mc_id=academic-77958-bethanycheum) ಜಾಗತಿಕ ವಿದ್ಯಾರ್ಥಿ ಅಂಬಾಸಿಡರ್ ಸಮುದಾಯದಲ್ಲಿ ಸೇರಿ, ಇದು ನಿಮ್ಮ ಮೈಕ್ರೋಸಾಫ್ಟ್ ಪ್ರವೇಶವಾಗಬಹುದು.
# ಪ್ರಾರಂಭಿಸುವುದು
## 📚 ಡಾಕ್ಯುಮೆಂಟೇಶನ್
- **[ಸ್ಥಾಪನೆ ಮಾರ್ಗದರ್ಶಿ](INSTALLATION.md)** - ಪ್ರಾರಂಭಿಕರಿಗಾಗಿ ಹಂತ ಹಂತವಾಗಿ ಸೆಟ್‌ಅಪ್ ಸೂಚನೆಗಳು
- **[ಬಳಕೆ ಮಾರ್ಗದರ್ಶಿ](USAGE.md)** - ಉದಾಹರಣೆಗಳು ಮತ್ತು ಸಾಮಾನ್ಯ ಕಾರ್ಯಪ್ರವಾಹಗಳು
- **[ಸಮಸ್ಯೆ ಪರಿಹಾರ](TROUBLESHOOTING.md)** - ಸಾಮಾನ್ಯ ಸಮಸ್ಯೆಗಳಿಗೆ ಪರಿಹಾರಗಳು
- **[ಸಹಾಯ ಮಾರ್ಗದರ್ಶಿ](CONTRIBUTING.md)** - ಈ ಪ್ರಾಜೆಕ್ಟ್‌ಗೆ ಹೇಗೆ ಸಹಾಯ ಮಾಡುವುದು
- **[ಶಿಕ್ಷಕರಿಗಾಗಿ](for-teachers.md)** - ಬೋಧನಾ ಮಾರ್ಗದರ್ಶನ ಮತ್ತು ತರಗತಿ ಸಂಪನ್ಮೂಲಗಳು
## 👨‍🎓 ವಿದ್ಯಾರ್ಥಿಗಳಿಗಾಗಿ
> **ಪೂರ್ಣ ಪ್ರಾರಂಭಿಕರು**: ಡೇಟಾ ಸೈನ್ಸ್‌ಗೆ ಹೊಸದಾಗಿ ಬಂದಿದ್ದೀರಾ? ನಮ್ಮ [ಪ್ರಾರಂಭಿಕರ ಸ್ನೇಹಿ ಉದಾಹರಣೆಗಳು](examples/README.md) ನಿಂದ ಪ್ರಾರಂಭಿಸಿ! ಈ ಸರಳ, ಚೆನ್ನಾಗಿ ಕಾಮೆಂಟ್ ಮಾಡಲಾದ ಉದಾಹರಣೆಗಳು ನೀವು ಮೂಲಭೂತಗಳನ್ನು ಅರ್ಥಮಾಡಿಕೊಳ್ಳಲು ಸಹಾಯ ಮಾಡುತ್ತವೆ ಪೂರ್ಣ ಪಠ್ಯಕ್ರಮಕ್ಕೆ ಮುನ್ನ.
> **[ವಿದ್ಯಾರ್ಥಿಗಳು](https://aka.ms/student-page)**: ಈ ಪಠ್ಯಕ್ರಮವನ್ನು ಸ್ವತಃ ಬಳಸಲು, ಸಂಪೂರ್ಣ ರೆಪೊವನ್ನು ಫೋರ್ಕ್ ಮಾಡಿ ಮತ್ತು ಸ್ವತಃ ವ್ಯಾಯಾಮಗಳನ್ನು ಪೂರ್ಣಗೊಳಿಸಿ, ಪ್ರಾಥಮಿಕ ಉಪನ್ಯಾಸ ಕ್ವಿಜ್‌ನಿಂದ ಪ್ರಾರಂಭಿಸಿ. ನಂತರ ಉಪನ್ಯಾಸವನ್ನು ಓದಿ ಉಳಿದ ಚಟುವಟಿಕೆಗಳನ್ನು ಪೂರ್ಣಗೊಳಿಸಿ. ಪರಿಹಾರ ಕೋಡ್ ನಕಲಿಸುವ ಬದಲು ಪಾಠಗಳನ್ನು ಅರ್ಥಮಾಡಿಕೊಂಡು ಪ್ರಾಜೆಕ್ಟ್‌ಗಳನ್ನು ರಚಿಸಲು ಪ್ರಯತ್ನಿಸಿ; ಆದಾಗ್ಯೂ, ಆ ಕೋಡ್ ಪ್ರತಿ ಪ್ರಾಜೆಕ್ಟ್-ಕೇಂದ್ರೀಕೃತ ಪಾಠದ /solutions ಫೋಲ್ಡರ್‌ಗಳಲ್ಲಿ ಲಭ್ಯವಿದೆ. ಮತ್ತೊಂದು ಐಡಿಯಾ ಎಂದರೆ ಸ್ನೇಹಿತರೊಂದಿಗೆ ಅಧ್ಯಯನ ಗುಂಪು ರಚಿಸಿ ಮತ್ತು ವಿಷಯವನ್ನು ಒಟ್ಟಿಗೆ ಪರಿಶೀಲಿಸುವುದು. ಹೆಚ್ಚಿನ ಅಧ್ಯಯನಕ್ಕಾಗಿ, ನಾವು [Microsoft Learn](https://docs.microsoft.com/en-us/users/jenlooper-2911/collections/qprpajyoy3x0g7?WT.mc_id=academic-77958-bethanycheum) ಅನ್ನು ಶಿಫಾರಸು ಮಾಡುತ್ತೇವೆ.
**ತ್ವರಿತ ಪ್ರಾರಂಭ:**
1. ನಿಮ್ಮ ಪರಿಸರವನ್ನು ಸೆಟ್‌ಅಪ್ ಮಾಡಲು [ಸ್ಥಾಪನೆ ಮಾರ್ಗದರ್ಶಿ](INSTALLATION.md) ಪರಿಶೀಲಿಸಿ
2. ಪಠ್ಯಕ್ರಮದೊಂದಿಗೆ ಕೆಲಸ ಮಾಡಲು [ಬಳಕೆ ಮಾರ್ಗದರ್ಶಿ](USAGE.md) ಪರಿಶೀಲಿಸಿ
3. ಪಾಠ 1 ರಿಂದ ಪ್ರಾರಂಭಿಸಿ ಕ್ರಮವಾಗಿ ಕೆಲಸ ಮಾಡಿ
4. ಬೆಂಬಲಕ್ಕಾಗಿ ನಮ್ಮ [ಡಿಸ್ಕಾರ್ಡ್ ಸಮುದಾಯ](https://aka.ms/ds4beginners/discord) ಸೇರಿ
## 👩‍🏫 ಶಿಕ್ಷಕರಿಗಾಗಿ
> **ಶಿಕ್ಷಕರು**: ಈ ಪಠ್ಯಕ್ರಮವನ್ನು ಹೇಗೆ ಬಳಸುವುದು ಎಂಬುದರ ಬಗ್ಗೆ ನಾವು [ಕೆಲವು ಸಲಹೆಗಳನ್ನು ಸೇರಿಸಿದ್ದೇವೆ](for-teachers.md). ನಿಮ್ಮ ಪ್ರತಿಕ್ರಿಯೆಯನ್ನು ನಾವು [ನಮ್ಮ ಚರ್ಚಾ ವೇದಿಕೆಯಲ್ಲಿ](https://github.com/microsoft/Data-Science-For-Beginners/discussions) ಸ್ವಾಗತಿಸುತ್ತೇವೆ!
## ತಂಡವನ್ನು ಪರಿಚಯಿಸಿ
[![ಪ್ರಚಾರ ವೀಡಿಯೊ](../../ds-for-beginners.gif)](https://youtu.be/8mzavjQSMM4 "ಪ್ರಚಾರ ವೀಡಿಯೊ")
**ಗಿಫ್** [ಮೊಹಿತ್ ಜೈಸಲ್](https://www.linkedin.com/in/mohitjaisal) ಅವರಿಂದ
> 🎥 ಮೇಲಿನ ಚಿತ್ರವನ್ನು ಕ್ಲಿಕ್ ಮಾಡಿ ಈ ಯೋಜನೆಯ ಬಗ್ಗೆ ಮತ್ತು ಅದನ್ನು ರಚಿಸಿದ ಜನರ ಬಗ್ಗೆ ವಿಡಿಯೋ ನೋಡಿ!
## ಪಠ್ಯಶಾಸ್ತ್ರ
ನಾವು ಈ ಪಠ್ಯಕ್ರಮವನ್ನು ರಚಿಸುವಾಗ ಎರಡು ಪಠ್ಯಶಾಸ್ತ್ರದ ತತ್ವಗಳನ್ನು ಆಯ್ಕೆಮಾಡಿದ್ದೇವೆ: ಇದು ಯೋಜನೆ ಆಧಾರಿತವಾಗಿರಬೇಕು ಮತ್ತು ಇದರಲ್ಲಿ ನಿಯಮಿತವಾಗಿ ಪ್ರಶ್ನೋತ್ತರಗಳು ಇರಬೇಕು ಎಂಬುದು. ಈ ಸರಣಿಯ ಕೊನೆಯಲ್ಲಿ, ವಿದ್ಯಾರ್ಥಿಗಳು ಡೇಟಾ ವಿಜ್ಞಾನದ ಮೂಲಭೂತ ತತ್ವಗಳನ್ನು ಕಲಿತಿರುತ್ತಾರೆ, ಇದರಲ್ಲಿ ನೈತಿಕ ತತ್ವಗಳು, ಡೇಟಾ ತಯಾರಿ, ಡೇಟಾ ಜೊತೆ ಕೆಲಸ ಮಾಡುವ ವಿಭಿನ್ನ ವಿಧಾನಗಳು, ಡೇಟಾ ದೃಶ್ಯೀಕರಣ, ಡೇಟಾ ವಿಶ್ಲೇಷಣೆ, ಡೇಟಾ ವಿಜ್ಞಾನದ ನೈಜ ಜಗತ್ತಿನ ಬಳಕೆ ಪ್ರಕರಣಗಳು ಮತ್ತು ಇನ್ನಷ್ಟು ಸೇರಿವೆ.
ಇದರ ಜೊತೆಗೆ, ತರಗತಿಯ ಮುಂಚೆ ಕಡಿಮೆ ಒತ್ತಡದ ಪ್ರಶ್ನೋತ್ತರವು ವಿದ್ಯಾರ್ಥಿಯು ವಿಷಯವನ್ನು ಕಲಿಯಲು ಉದ್ದೇಶವನ್ನು ಹೊಂದಲು ಸಹಾಯ ಮಾಡುತ್ತದೆ, ಮತ್ತು ತರಗತಿಯ ನಂತರದ ಎರಡನೇ ಪ್ರಶ್ನೋತ್ತರವು ಹೆಚ್ಚಿನ ನೆನಪನ್ನು ಖಚಿತಪಡಿಸುತ್ತದೆ. ಈ ಪಠ್ಯಕ್ರಮವನ್ನು ಲವಚಿಕ ಮತ್ತು ಮನರಂಜನಾತ್ಮಕವಾಗಿರಲು ವಿನ್ಯಾಸಗೊಳಿಸಲಾಗಿದೆ ಮತ್ತು ಸಂಪೂರ್ಣವಾಗಿ ಅಥವಾ ಭಾಗವಾಗಿ ತೆಗೆದುಕೊಳ್ಳಬಹುದು. ಯೋಜನೆಗಳು ಸಣ್ಣದಾಗಿ ಪ್ರಾರಂಭವಾಗಿ 10 ವಾರಗಳ ಚಕ್ರದ ಕೊನೆಯಲ್ಲಿ ಹೆಚ್ಚು ಸಂಕೀರ್ಣವಾಗುತ್ತವೆ.
> ನಮ್ಮ [ನಡವಳಿಕೆ ಸಂಹಿತೆ](CODE_OF_CONDUCT.md), [ಹೊಂದಾಣಿಕೆ](CONTRIBUTING.md), [ಭಾಷಾಂತರ](TRANSLATIONS.md) ಮಾರ್ಗಸೂಚಿಗಳನ್ನು ನೋಡಿ. ನಿಮ್ಮ ರಚನಾತ್ಮಕ ಪ್ರತಿಕ್ರಿಯೆಯನ್ನು ನಾವು ಸ್ವಾಗತಿಸುತ್ತೇವೆ!
## ಪ್ರತಿ ಪಾಠದಲ್ಲಿ ಸೇರಿವೆ:
- ಐಚ್ಛಿಕ ಸ್ಕೆಚ್ ನೋಟ್
- ಐಚ್ಛಿಕ ಪೂರಕ ವೀಡಿಯೊ
- ಪಾಠದ ಮುಂಚಿನ ತಯಾರಿ ಪ್ರಶ್ನೋತ್ತರ
- ಬರಹದ ಪಾಠ
- ಯೋಜನೆ ಆಧಾರಿತ ಪಾಠಗಳಿಗೆ, ಯೋಜನೆಯನ್ನು ನಿರ್ಮಿಸುವ ಹಂತ ಹಂತದ ಮಾರ್ಗದರ್ಶಿಗಳು
- ಜ್ಞಾನ ಪರಿಶೀಲನೆಗಳು
- ಒಂದು ಸವಾಲು
- ಪೂರಕ ಓದು
- ನಿಯೋಜನೆ
- [ಪಾಠದ ನಂತರದ ಪ್ರಶ್ನೋತ್ತರ](https://ff-quizzes.netlify.app/en/)
> **ಪ್ರಶ್ನೋತ್ತರಗಳ ಬಗ್ಗೆ ಒಂದು ಟಿಪ್ಪಣಿ**: ಎಲ್ಲಾ ಪ್ರಶ್ನೋತ್ತರಗಳು Quiz-App ಫೋಲ್ಡರ್‌ನಲ್ಲಿ ಇವೆ, ಒಟ್ಟು 40 ಪ್ರಶ್ನೋತ್ತರಗಳು, ಪ್ರತಿ ಒಂದು ಮೂರು ಪ್ರಶ್ನೆಗಳಿವೆ. ಅವು ಪಾಠಗಳಲ್ಲಿ ಲಿಂಕ್ ಮಾಡಲ್ಪಟ್ಟಿವೆ, ಆದರೆ ಪ್ರಶ್ನೋತ್ತರ ಅಪ್ಲಿಕೇಶನ್ ಅನ್ನು ಸ್ಥಳೀಯವಾಗಿ ಚಾಲನೆ ಮಾಡಬಹುದು ಅಥವಾ ಅಜೂರ್‌ಗೆ ನಿಯೋಜಿಸಬಹುದು; `quiz-app` ಫೋಲ್ಡರ್‌ನ ಸೂಚನೆಗಳನ್ನು ಅನುಸರಿಸಿ. ಅವು ಕ್ರಮೇಣ ಸ್ಥಳೀಯಗೊಳ್ಳುತ್ತಿವೆ.
## 🎓 ಪ್ರಾರಂಭಿಕರಿಗಾಗಿ ಸ್ನೇಹಪೂರ್ಣ ಉದಾಹರಣೆಗಳು
**ಡೇಟಾ ವಿಜ್ಞಾನದಲ್ಲಿ ಹೊಸದಾಗಿ ಬಂದಿದ್ದೀರಾ?** ನಾವು ಸರಳ, ಚೆನ್ನಾಗಿ ಕಾಮೆಂಟ್ ಮಾಡಲಾದ ಕೋಡ್ ಹೊಂದಿರುವ ವಿಶೇಷ [ಉದಾಹರಣೆಗಳ ಡೈರೆಕ್ಟರಿ](examples/README.md) ರಚಿಸಿದ್ದೇವೆ, ಇದು ನಿಮಗೆ ಪ್ರಾರಂಭಿಸಲು ಸಹಾಯ ಮಾಡುತ್ತದೆ:
- 🌟 **ಹೆಲೋ ವರ್ಲ್ಡ್** - ನಿಮ್ಮ ಮೊದಲ ಡೇಟಾ ವಿಜ್ಞಾನ ಕಾರ್ಯಕ್ರಮ
- 📂 **ಡೇಟಾ ಲೋಡ್ ಮಾಡುವುದು** - ಡೇಟಾಸೆಟ್‌ಗಳನ್ನು ಓದಿ ಅನ್ವೇಷಿಸುವುದನ್ನು ಕಲಿಯಿರಿ
- 📊 **ಸರಳ ವಿಶ್ಲೇಷಣೆ** - ಅಂಕಿಅಂಶಗಳನ್ನು ಲೆಕ್ಕಿಸಿ ಮತ್ತು ಮಾದರಿಗಳನ್ನು ಕಂಡುಹಿಡಿಯಿರಿ
- 📈 **ಮೂಲಭೂತ ದೃಶ್ಯೀಕರಣ** - ಚಾರ್ಟ್‌ಗಳು ಮತ್ತು ಗ್ರಾಫ್‌ಗಳನ್ನು ರಚಿಸಿ
- 🔬 **ನೈಜ ಜಗತ್ತಿನ ಯೋಜನೆ** - ಪ್ರಾರಂಭದಿಂದ ಕೊನೆವರೆಗೆ ಸಂಪೂರ್ಣ ಕಾರ್ಯಪ್ರವಾಹ
ಪ್ರತಿ ಉದಾಹರಣೆಯು ಪ್ರತಿಯೊಂದು ಹಂತವನ್ನು ವಿವರಿಸುವ ಕಾಮೆಂಟ್‌ಗಳನ್ನು ಒಳಗೊಂಡಿದೆ, ಇದು ಸಂಪೂರ್ಣ ಪ್ರಾರಂಭಿಕರಿಗಾಗಿ ಪರಿಪೂರ್ಣವಾಗಿದೆ!
👉 **[ಉದಾಹರಣೆಗಳಿಂದ ಪ್ರಾರಂಭಿಸಿ](examples/README.md)** 👈
## ಪಾಠಗಳು
|![ @sketchthedocs ರವರ ಸ್ಕೆಚ್ ನೋಟ್ https://sketchthedocs.dev](../../translated_images/00-Roadmap.4905d6567dff47532b9bfb8e0b8980fc6b0b1292eebb24181c1a9753b33bc0f5.kn.png)|
|:---:|
| ಪ್ರಾರಂಭಿಕರಿಗಾಗಿ ಡೇಟಾ ವಿಜ್ಞಾನ: ರಸ್ತೆ ನಕ್ಷೆ - _ಸ್ಕೆಚ್ ನೋಟ್ [@nitya](https://twitter.com/nitya) ರವರಿದ_ |
| ಪಾಠ ಸಂಖ್ಯೆ | ವಿಷಯ | ಪಾಠ ಗುಂಪು | ಕಲಿಕೆಯ ಉದ್ದೇಶಗಳು | ಲಿಂಕ್ ಮಾಡಿದ ಪಾಠ | ಲೇಖಕ |
| :-----------: | :----------------------------------------: | :--------------------------------------------------: | :-----------------------------------------------------------------------------------------------------------------------------------------------------------------------: | :---------------------------------------------------------------------: | :----: |
| 01 | ಡೇಟಾ ವಿಜ್ಞಾನವನ್ನು ವ್ಯಾಖ್ಯಾನಿಸುವುದು | [ಪರಿಚಯ](1-Introduction/README.md) | ಡೇಟಾ ವಿಜ್ಞಾನದ ಮೂಲಭೂತ ತತ್ವಗಳನ್ನು ಮತ್ತು ಅದು ಕೃತಕ ಬುದ್ಧಿಮತ್ತೆ, ಯಂತ್ರ ಅಧ್ಯಯನ ಮತ್ತು ದೊಡ್ಡ ಡೇಟಾ ಜೊತೆ ಹೇಗೆ ಸಂಬಂಧಿಸಿದೆ ಎಂಬುದನ್ನು ಕಲಿಯಿರಿ. | [ಪಾಠ](1-Introduction/01-defining-data-science/README.md) [ವೀಡಿಯೊ](https://youtu.be/beZ7Mb_oz9I) | [ಡ್ಮಿತ್ರಿ](http://soshnikov.com) |
| 02 | ಡೇಟಾ ವಿಜ್ಞಾನ ನೈತಿಕತೆ | [ಪರಿಚಯ](1-Introduction/README.md) | ಡೇಟಾ ನೈತಿಕತೆ ತತ್ವಗಳು, ಸವಾಲುಗಳು ಮತ್ತು ಚಟುವಟಿಕೆಗಳು. | [ಪಾಠ](1-Introduction/02-ethics/README.md) | [ನಿತ್ಯ](https://twitter.com/nitya) |
| 03 | ಡೇಟಾ ವ್ಯಾಖ್ಯಾನ | [ಪರಿಚಯ](1-Introduction/README.md) | ಡೇಟಾ ಹೇಗೆ ವರ್ಗೀಕರಿಸಲಾಗಿದೆ ಮತ್ತು ಅದರ ಸಾಮಾನ್ಯ ಮೂಲಗಳು. | [ಪಾಠ](1-Introduction/03-defining-data/README.md) | [ಜಾಸ್ಮಿನ್](https://www.twitter.com/paladique) |
| 04 | ಸಂಖ್ಯಾಶಾಸ್ತ್ರ ಮತ್ತು ಸಾಧ್ಯತೆಗಳಿಗೆ ಪರಿಚಯ | [ಪರಿಚಯ](1-Introduction/README.md) | ಡೇಟಾವನ್ನು ಅರ್ಥಮಾಡಿಕೊಳ್ಳಲು ಸಾಧ್ಯತೆ ಮತ್ತು ಸಂಖ್ಯಾಶಾಸ್ತ್ರದ ಗಣಿತೀಯ ತಂತ್ರಗಳು. | [ಪಾಠ](1-Introduction/04-stats-and-probability/README.md) [ವೀಡಿಯೊ](https://youtu.be/Z5Zy85g4Yjw) | [ಡ್ಮಿತ್ರಿ](http://soshnikov.com) |
| 05 | ಸಂಬಂಧಿತ ಡೇಟಾ ಜೊತೆ ಕೆಲಸ ಮಾಡುವುದು | [ಡೇಟಾ ಜೊತೆ ಕೆಲಸ](2-Working-With-Data/README.md) | ಸಂಬಂಧಿತ ಡೇಟಾಗೆ ಪರಿಚಯ ಮತ್ತು ರಚನಾತ್ಮಕ ಪ್ರಶ್ನೆ ಭಾಷೆ (SQL) ಬಳಸಿ ಸಂಬಂಧಿತ ಡೇಟಾವನ್ನು ಅನ್ವೇಷಿಸುವ ಮತ್ತು ವಿಶ್ಲೇಷಿಸುವ ಮೂಲಭೂತಗಳು. | [ಪಾಠ](2-Working-With-Data/05-relational-databases/README.md) | [ಕ್ರಿಸ್ಟೋಫರ್](https://www.twitter.com/geektrainer) | | |
| 06 | ನೋನ್ಎಸ್ಎಕ್ವೆಲ್ ಡೇಟಾ ಜೊತೆ ಕೆಲಸ | [ಡೇಟಾ ಜೊತೆ ಕೆಲಸ](2-Working-With-Data/README.md) | ಅಸಂಬಂಧಿತ ಡೇಟಾಗೆ ಪರಿಚಯ, ಅದರ ವಿವಿಧ ಪ್ರಕಾರಗಳು ಮತ್ತು ಡಾಕ್ಯುಮೆಂಟ್ ಡೇಟಾಬೇಸ್‌ಗಳನ್ನು ಅನ್ವೇಷಿಸುವ ಮತ್ತು ವಿಶ್ಲೇಷಿಸುವ ಮೂಲಭೂತಗಳು. | [ಪಾಠ](2-Working-With-Data/06-non-relational/README.md) | [ಜಾಸ್ಮಿನ್](https://twitter.com/paladique)|
| 07 | ಪೈಥಾನ್ ಜೊತೆ ಕೆಲಸ | [ಡೇಟಾ ಜೊತೆ ಕೆಲಸ](2-Working-With-Data/README.md) | ಪಾಂಡಾಸ್ ಮುಂತಾದ ಗ್ರಂಥಾಲಯಗಳನ್ನು ಬಳಸಿ ಡೇಟಾ ಅನ್ವೇಷಣೆಗೆ ಪೈಥಾನ್ ಬಳಕೆಯ ಮೂಲಭೂತಗಳು. ಪೈಥಾನ್ ಪ್ರೋಗ್ರಾಮಿಂಗ್‌ನ ಮೂಲಭೂತ ತಿಳಿವಳಿಕೆ ಶಿಫಾರಸು ಮಾಡಲಾಗಿದೆ. | [ಪಾಠ](2-Working-With-Data/07-python/README.md) [ವೀಡಿಯೊ](https://youtu.be/dZjWOGbsN4Y) | [ಡ್ಮಿತ್ರಿ](http://soshnikov.com) |
| 08 | ಡೇಟಾ ತಯಾರಿ | [ಡೇಟಾ ಜೊತೆ ಕೆಲಸ](2-Working-With-Data/README.md) | ಕಳೆದುಹೋಗಿದ, ತಪ್ಪು ಅಥವಾ ಅಪೂರ್ಣ ಡೇಟಾ ಸಮಸ್ಯೆಗಳನ್ನು ನಿಭಾಯಿಸಲು ಡೇಟಾ ಶುದ್ಧೀಕರಣ ಮತ್ತು ಪರಿವರ್ತನೆ ತಂತ್ರಗಳು. | [ಪಾಠ](2-Working-With-Data/08-data-preparation/README.md) | [ಜಾಸ್ಮಿನ್](https://www.twitter.com/paladique) |
| 09 | ಪ್ರಮಾಣಗಳನ್ನು ದೃಶ್ಯೀಕರಿಸುವುದು | [ಡೇಟಾ ದೃಶ್ಯೀಕರಣ](3-Data-Visualization/README.md) | ಮ್ಯಾಟ್‌ಪ್ಲಾಟ್‌ಲಿಬ್ ಬಳಸಿ ಹಕ್ಕಿಗಳ ಡೇಟಾವನ್ನು ದೃಶ್ಯೀಕರಿಸುವುದು 🦆 | [ಪಾಠ](3-Data-Visualization/09-visualization-quantities/README.md) | [ಜೆನ್](https://twitter.com/jenlooper) |
| 10 | ಡೇಟಾ ವಿತರಣೆಗಳನ್ನು ದೃಶ್ಯೀಕರಿಸುವುದು | [ಡೇಟಾ ದೃಶ್ಯೀಕರಣ](3-Data-Visualization/README.md) | ಒಂದು ಅಂತರದಲ್ಲಿ ವೀಕ್ಷಣೆಗಳು ಮತ್ತು ಪ್ರವೃತ್ತಿಗಳನ್ನು ದೃಶ್ಯೀಕರಿಸುವುದು. | [ಪಾಠ](3-Data-Visualization/10-visualization-distributions/README.md) | [ಜೆನ್](https://twitter.com/jenlooper) |
| 11 | ಪ್ರಮಾಣಗಳನ್ನು ದೃಶ್ಯೀಕರಿಸುವುದು | [ಡೇಟಾ ದೃಶ್ಯೀಕರಣ](3-Data-Visualization/README.md) | ವಿಭಜಿತ ಮತ್ತು ಗುಂಪು ಶೇಕಡಾವಾರುಗಳನ್ನು ದೃಶ್ಯೀಕರಿಸುವುದು. | [ಪಾಠ](3-Data-Visualization/11-visualization-proportions/README.md) | [ಜೆನ್](https://twitter.com/jenlooper) |
| 12 | ಸಂಬಂಧಗಳನ್ನು ದೃಶ್ಯೀಕರಿಸುವುದು | [ಡೇಟಾ ದೃಶ್ಯೀಕರಣ](3-Data-Visualization/README.md) | ಡೇಟಾ ಮತ್ತು ಅದರ ಚರಗಳ ನಡುವಿನ ಸಂಪರ್ಕಗಳು ಮತ್ತು ಸಹಸಂಬಂಧಗಳನ್ನು ದೃಶ್ಯೀಕರಿಸುವುದು. | [ಪಾಠ](3-Data-Visualization/12-visualization-relationships/README.md) | [ಜೆನ್](https://twitter.com/jenlooper) |
| 13 | ಅರ್ಥಪೂರ್ಣ ದೃಶ್ಯೀಕರಣಗಳು | [ಡೇಟಾ ದೃಶ್ಯೀಕರಣ](3-Data-Visualization/README.md) | ಪರಿಣಾಮಕಾರಿ ಸಮಸ್ಯೆ ಪರಿಹಾರ ಮತ್ತು ಒಳನೋಟಗಳಿಗಾಗಿ ನಿಮ್ಮ ದೃಶ್ಯೀಕರಣಗಳನ್ನು ಮೌಲ್ಯಯುತವಾಗಿಸಲು ತಂತ್ರಗಳು ಮತ್ತು ಮಾರ್ಗದರ್ಶನ. | [ಪಾಠ](3-Data-Visualization/13-meaningful-visualizations/README.md) | [ಜೆನ್](https://twitter.com/jenlooper) |
| 14 | ಡೇಟಾ ವಿಜ್ಞಾನ ಜೀವನಚಕ್ರಕ್ಕೆ ಪರಿಚಯ | [ಜೀವನಚಕ್ರ](4-Data-Science-Lifecycle/README.md) | ಡೇಟಾ ವಿಜ್ಞಾನ ಜೀವನಚಕ್ರಕ್ಕೆ ಪರಿಚಯ ಮತ್ತು ಡೇಟಾ ಸಂಗ್ರಹಣೆ ಮತ್ತು ಹೊರತೆಗೆಯುವ ಮೊದಲ ಹಂತ. | [ಪಾಠ](4-Data-Science-Lifecycle/14-Introduction/README.md) | [ಜಾಸ್ಮಿನ್](https://twitter.com/paladique) |
| 15 | ವಿಶ್ಲೇಷಣೆ | [ಜೀವನಚಕ್ರ](4-Data-Science-Lifecycle/README.md) | ಡೇಟಾ ವಿಜ್ಞಾನ ಜೀವನಚಕ್ರದ ಈ ಹಂತವು ಡೇಟಾವನ್ನು ವಿಶ್ಲೇಷಿಸುವ ತಂತ್ರಗಳ ಮೇಲೆ ಕೇಂದ್ರೀಕರಿಸುತ್ತದೆ. | [ಪಾಠ](4-Data-Science-Lifecycle/15-analyzing/README.md) | [ಜಾಸ್ಮಿನ್](https://twitter.com/paladique) | | |
| 16 | ಸಂವಹನ | [ಜೀವನಚಕ್ರ](4-Data-Science-Lifecycle/README.md) | ಡೇಟಾ ವಿಜ್ಞಾನ ಜೀವನಚಕ್ರದ ಈ ಹಂತವು ನಿರ್ಧಾರ ಕೈಗೊಳ್ಳುವವರಿಗೆ ಅರ್ಥಮಾಡಿಕೊಳ್ಳಲು ಸುಲಭವಾಗುವ ರೀತಿಯಲ್ಲಿ ಡೇಟಾದಿಂದ ಒಳನೋಟಗಳನ್ನು ಪ್ರಸ್ತುತಪಡಿಸುವುದರ ಮೇಲೆ ಕೇಂದ್ರೀಕರಿಸುತ್ತದೆ. | [ಪಾಠ](4-Data-Science-Lifecycle/16-communication/README.md) | [ಜೆಲೆನ್](https://twitter.com/JalenMcG) | | |
| 17 | ಕ್ಲೌಡ್‌ನಲ್ಲಿ ಡೇಟಾ ವಿಜ್ಞಾನ | [ಕ್ಲೌಡ್ ಡೇಟಾ](5-Data-Science-In-Cloud/README.md) | ಈ ಪಾಠ ಸರಣಿಯು ಕ್ಲೌಡ್‌ನಲ್ಲಿ ಡೇಟಾ ವಿಜ್ಞಾನ ಮತ್ತು ಅದರ ಲಾಭಗಳನ್ನು ಪರಿಚಯಿಸುತ್ತದೆ. | [ಪಾಠ](5-Data-Science-In-Cloud/17-Introduction/README.md) | [ಟಿಫನಿ](https://twitter.com/TiffanySouterre) ಮತ್ತು [ಮಾಡ್](https://twitter.com/maudstweets) |
| 18 | ಕ್ಲೌಡ್‌ನಲ್ಲಿ ಡೇಟಾ ವಿಜ್ಞಾನ | [ಕ್ಲೌಡ್ ಡೇಟಾ](5-Data-Science-In-Cloud/README.md) | ಲೋ ಕೋಡ್ ಉಪಕರಣಗಳನ್ನು ಬಳಸಿ ಮಾದರಿಗಳನ್ನು ತರಬೇತುಗೊಳಿಸುವುದು. |[ಪಾಠ](5-Data-Science-In-Cloud/18-Low-Code/README.md) | [ಟಿಫನಿ](https://twitter.com/TiffanySouterre) ಮತ್ತು [ಮಾಡ್](https://twitter.com/maudstweets) |
| 19 | ಕ್ಲೌಡ್‌ನಲ್ಲಿ ಡೇಟಾ ವಿಜ್ಞಾನ | [ಕ್ಲೌಡ್ ಡೇಟಾ](5-Data-Science-In-Cloud/README.md) | ಅಜೂರ್ ಮೆಷಿನ್ ಲರ್ನಿಂಗ್ ಸ್ಟುಡಿಯೋ ಬಳಸಿ ಮಾದರಿಗಳನ್ನು ನಿಯೋಜಿಸುವುದು. | [ಪಾಠ](5-Data-Science-In-Cloud/19-Azure/README.md)| [ಟಿಫನಿ](https://twitter.com/TiffanySouterre) ಮತ್ತು [ಮಾಡ್](https://twitter.com/maudstweets) |
| 20 | ನೈಸರ್ಗಿಕ ಪರಿಸರದಲ್ಲಿ ಡೇಟಾ ವಿಜ್ಞಾನ | [ನೈಸರ್ಗಿಕ ಪರಿಸರದಲ್ಲಿ](6-Data-Science-In-Wild/README.md) | ನೈಜ ಜಗತ್ತಿನಲ್ಲಿ ಡೇಟಾ ವಿಜ್ಞಾನ ಚಾಲಿತ ಯೋಜನೆಗಳು. | [ಪಾಠ](6-Data-Science-In-Wild/20-Real-World-Examples/README.md) | [ನಿತ್ಯ](https://twitter.com/nitya) |
## GitHub ಕೋಡ್ಸ್ಪೇಸಸ್
ಈ ಮಾದರಿಯನ್ನು ಕೋಡ್ಸ್ಪೇಸ್‌ನಲ್ಲಿ ತೆರೆಯಲು ಈ ಹಂತಗಳನ್ನು ಅನುಸರಿಸಿ:
1. ಕೋಡ್ ಡ್ರಾಪ್-ಡೌನ್ ಮೆನು ಕ್ಲಿಕ್ ಮಾಡಿ ಮತ್ತು Open with Codespaces ಆಯ್ಕೆಯನ್ನು ಆರಿಸಿ.
2. ಪ್ಯಾನೆಲಿನ ಕೆಳಭಾಗದಲ್ಲಿ + New codespace ಆಯ್ಕೆಮಾಡಿ.
ಹೆಚ್ಚಿನ ಮಾಹಿತಿಗಾಗಿ, [GitHub ಡಾಕ್ಯುಮೆಂಟೇಶನ್](https://docs.github.com/en/codespaces/developing-in-codespaces/creating-a-codespace-for-a-repository#creating-a-codespace) ನೋಡಿ.
## VSCode ರಿಮೋಟ್ - ಕಂಟೈನರ್‌ಗಳು
ನಿಮ್ಮ ಸ್ಥಳೀಯ ಯಂತ್ರ ಮತ್ತು VSCode ಬಳಸಿ ಈ ರೆಪೊವನ್ನು ಕಂಟೈನರ್‌ನಲ್ಲಿ ತೆರೆಯಲು VS Code Remote - Containers ವಿಸ್ತರಣೆ ಬಳಸಿ ಈ ಹಂತಗಳನ್ನು ಅನುಸರಿಸಿ:
1. ನೀವು ಮೊದಲ ಬಾರಿಗೆ ಡೆವಲಪ್‌ಮೆಂಟ್ ಕಂಟೈನರ್ ಬಳಸುತ್ತಿದ್ದರೆ, ದಯವಿಟ್ಟು ನಿಮ್ಮ ವ್ಯವಸ್ಥೆ ಪೂರ್ವಾಪೇಕ್ಷಿತಗಳನ್ನು ಪೂರೈಸಿದೆಯೇ ಎಂದು ಖಚಿತಪಡಿಸಿಕೊಳ್ಳಿ (ಅಂದರೆ ಡೋಕರ್ ಇನ್‌ಸ್ಟಾಲ್ ಮಾಡಿರಬೇಕು) [ಆರಂಭಿಸುವ ಡಾಕ್ಯುಮೆಂಟೇಶನ್](https://code.visualstudio.com/docs/devcontainers/containers#_getting-started) ನಲ್ಲಿ.
ಈ ರೆಪೊವನ್ನು ಬಳಸಲು, ನೀವು ರೆಪೊವನ್ನು ಪ್ರತ್ಯೇಕ ಡೋಕರ್ ವಾಲ್ಯೂಮ್‌ನಲ್ಲಿ ತೆರೆಯಬಹುದು:
**ಗಮನಿಸಿ**: ಒಳಗೆ, ಇದು Remote-Containers: **Clone Repository in Container Volume...** ಕಮಾಂಡ್ ಬಳಸಿ ಮೂಲ ಕೋಡ್ ಅನ್ನು ಸ್ಥಳೀಯ ಫೈಲ್ ಸಿಸ್ಟಮ್ ಬದಲು ಡೋಕರ್ ವಾಲ್ಯೂಮ್‌ನಲ್ಲಿ ಕ್ಲೋನ್ ಮಾಡುತ್ತದೆ. [ವಾಲ್ಯೂಮ್‌ಗಳು](https://docs.docker.com/storage/volumes/) ಕಂಟೈನರ್ ಡೇಟಾವನ್ನು ಉಳಿಸುವ ಪ್ರಾಧಾನ್ಯ ವಿಧಾನ.
ಅಥವಾ ಸ್ಥಳೀಯವಾಗಿ ಕ್ಲೋನ್ ಮಾಡಲಾದ ಅಥವಾ ಡೌನ್‌ಲೋಡ್ ಮಾಡಲಾದ ರೆಪೊವನ್ನು ತೆರೆಯಿರಿ:
- ಈ ರೆಪೊವನ್ನು ನಿಮ್ಮ ಸ್ಥಳೀಯ ಫೈಲ್ ಸಿಸ್ಟಮ್‌ಗೆ ಕ್ಲೋನ್ ಮಾಡಿ.
- F1 ಒತ್ತಿ ಮತ್ತು **Remote-Containers: Open Folder in Container...** ಕಮಾಂಡ್ ಆಯ್ಕೆಮಾಡಿ.
- ಈ ಫೋಲ್ಡರ್‌ನ ಕ್ಲೋನ್ ಮಾಡಿದ ನಕಲನ್ನು ಆರಿಸಿ, ಕಂಟೈನರ್ ಪ್ರಾರಂಭವಾಗುವವರೆಗೆ ಕಾಯಿರಿ ಮತ್ತು ಪ್ರಯತ್ನಿಸಿ.
## ಆಫ್‌ಲೈನ್ ಪ್ರವೇಶ
ನೀವು [Docsify](https://docsify.js.org/#/) ಬಳಸಿ ಈ ಡಾಕ್ಯುಮೆಂಟೇಶನ್ ಅನ್ನು ಆಫ್‌ಲೈನ್‌ನಲ್ಲಿ ಓಡಿಸಬಹುದು. ಈ ರೆಪೊವನ್ನು ಫೋರ್ಕ್ ಮಾಡಿ, ನಿಮ್ಮ ಸ್ಥಳೀಯ ಯಂತ್ರದಲ್ಲಿ [Docsify ಅನ್ನು ಇನ್‌ಸ್ಟಾಲ್ ಮಾಡಿ](https://docsify.js.org/#/quickstart), ನಂತರ ಈ ರೆಪೊ ಮೂಲ ಫೋಲ್ಡರ್‌ನಲ್ಲಿ `docsify serve` ಟೈಪ್ ಮಾಡಿ. ವೆಬ್‌ಸೈಟ್ ನಿಮ್ಮ ಸ್ಥಳೀಯಹೋಸ್ಟ್‌ನಲ್ಲಿ 3000 ಪೋರ್ಟ್‌ನಲ್ಲಿ ಸರ್ವ್ ಆಗುತ್ತದೆ: `localhost:3000`.
> ಗಮನಿಸಿ, ನೋಟ್ಬುಕ್‌ಗಳು Docsify ಮೂಲಕ ರೆಂಡರ್ ಆಗುವುದಿಲ್ಲ, ಆದ್ದರಿಂದ ನೀವು ನೋಟ್ಬುಕ್ ಅನ್ನು ಓಡಿಸಲು ಬೇಕಾದಾಗ, ಅದನ್ನು ಪ್ರತ್ಯೇಕವಾಗಿ VS Code ನಲ್ಲಿ ಪೈಥಾನ್ ಕರ್ಣಲ್ ಚಾಲನೆ ಮಾಡಿ.
## ಇತರ ಪಠ್ಯಕ್ರಮಗಳು
ನಮ್ಮ ತಂಡ ಇತರ ಪಠ್ಯಕ್ರಮಗಳನ್ನು ಉತ್ಪಾದಿಸುತ್ತದೆ! ನೋಡಿ:
<!-- CO-OP TRANSLATOR OTHER COURSES START -->
### LangChain
[![LangChain4j for Beginners](https://img.shields.io/badge/LangChain4j%20for%20Beginners-22C55E?style=for-the-badge&&labelColor=E5E7EB&color=0553D6)](https://aka.ms/langchain4j-for-beginners)
[![LangChain.js for Beginners](https://img.shields.io/badge/LangChain.js%20for%20Beginners-22C55E?style=for-the-badge&labelColor=E5E7EB&color=0553D6)](https://aka.ms/langchainjs-for-beginners?WT.mc_id=m365-94501-dwahlin)
---
### Azure / Edge / MCP / Agents
[![ಆಜಡ್ ಫಾರ್ ಬೆಗಿನ್ನರ್ಸ್](https://img.shields.io/badge/AZD%20for%20Beginners-0078D4?style=for-the-badge&labelColor=E5E7EB&color=0078D4)](https://github.com/microsoft/AZD-for-beginners?WT.mc_id=academic-105485-koreyst)
[![ಎಡ್ಜ್ ಎಐ ಫಾರ್ ಬೆಗಿನ್ನರ್ಸ್](https://img.shields.io/badge/Edge%20AI%20for%20Beginners-00B8E4?style=for-the-badge&labelColor=E5E7EB&color=00B8E4)](https://github.com/microsoft/edgeai-for-beginners?WT.mc_id=academic-105485-koreyst)
[![ಎಂಸಿಪಿ ಫಾರ್ ಬೆಗಿನ್ನರ್ಸ್](https://img.shields.io/badge/MCP%20for%20Beginners-009688?style=for-the-badge&labelColor=E5E7EB&color=009688)](https://github.com/microsoft/mcp-for-beginners?WT.mc_id=academic-105485-koreyst)
[![ಎಐ ಏಜೆಂಟ್ಸ್ ಫಾರ್ ಬೆಗಿನ್ನರ್ಸ್](https://img.shields.io/badge/AI%20Agents%20for%20Beginners-00C49A?style=for-the-badge&labelColor=E5E7EB&color=00C49A)](https://github.com/microsoft/ai-agents-for-beginners?WT.mc_id=academic-105485-koreyst)
---
### ಜನರೇಟಿವ್ ಎಐ ಸರಣಿ
[![ಜನರೇಟಿವ್ ಎಐ ಫಾರ್ ಬೆಗಿನ್ನರ್ಸ್](https://img.shields.io/badge/Generative%20AI%20for%20Beginners-8B5CF6?style=for-the-badge&labelColor=E5E7EB&color=8B5CF6)](https://github.com/microsoft/generative-ai-for-beginners?WT.mc_id=academic-105485-koreyst)
[![ಜನರೇಟಿವ್ ಎಐ (.NET)](https://img.shields.io/badge/Generative%20AI%20(.NET)-9333EA?style=for-the-badge&labelColor=E5E7EB&color=9333EA)](https://github.com/microsoft/Generative-AI-for-beginners-dotnet?WT.mc_id=academic-105485-koreyst)
[![ಜನರೇಟಿವ್ ಎಐ (ಜಾವಾ)](https://img.shields.io/badge/Generative%20AI%20(Java)-C084FC?style=for-the-badge&labelColor=E5E7EB&color=C084FC)](https://github.com/microsoft/generative-ai-for-beginners-java?WT.mc_id=academic-105485-koreyst)
[![ಜನರೇಟಿವ್ ಎಐ (ಜಾವಾಸ್ಕ್ರಿಪ್ಟ್)](https://img.shields.io/badge/Generative%20AI%20(JavaScript)-E879F9?style=for-the-badge&labelColor=E5E7EB&color=E879F9)](https://github.com/microsoft/generative-ai-with-javascript?WT.mc_id=academic-105485-koreyst)
---
### ಕೋರ್ ಲರ್ನಿಂಗ್
[![ಎಂಎಲ್ ಫಾರ್ ಬೆಗಿನ್ನರ್ಸ್](https://img.shields.io/badge/ML%20for%20Beginners-22C55E?style=for-the-badge&labelColor=E5E7EB&color=22C55E)](https://aka.ms/ml-beginners?WT.mc_id=academic-105485-koreyst)
[![ಡೇಟಾ ಸೈನ್ಸ್ ಫಾರ್ ಬೆಗಿನ್ನರ್ಸ್](https://img.shields.io/badge/Data%20Science%20for%20Beginners-84CC16?style=for-the-badge&labelColor=E5E7EB&color=84CC16)](https://aka.ms/datascience-beginners?WT.mc_id=academic-105485-koreyst)
[![ಎಐ ಫಾರ್ ಬೆಗಿನ್ನರ್ಸ್](https://img.shields.io/badge/AI%20for%20Beginners-A3E635?style=for-the-badge&labelColor=E5E7EB&color=A3E635)](https://aka.ms/ai-beginners?WT.mc_id=academic-105485-koreyst)
[![ಸೈಬರ್‌ಸಿಕ್ಯುರಿಟಿ ಫಾರ್ ಬೆಗಿನ್ನರ್ಸ್](https://img.shields.io/badge/Cybersecurity%20for%20Beginners-F97316?style=for-the-badge&labelColor=E5E7EB&color=F97316)](https://github.com/microsoft/Security-101?WT.mc_id=academic-96948-sayoung)
[![ವೆಬ್ ಡೆವ್ ಫಾರ್ ಬೆಗಿನ್ನರ್ಸ್](https://img.shields.io/badge/Web%20Dev%20for%20Beginners-EC4899?style=for-the-badge&labelColor=E5E7EB&color=EC4899)](https://aka.ms/webdev-beginners?WT.mc_id=academic-105485-koreyst)
[![ಐಒಟಿ ಫಾರ್ ಬೆಗಿನ್ನರ್ಸ್](https://img.shields.io/badge/IoT%20for%20Beginners-14B8A6?style=for-the-badge&labelColor=E5E7EB&color=14B8A6)](https://aka.ms/iot-beginners?WT.mc_id=academic-105485-koreyst)
[![ಎಕ್ಸ್ಆರ್ ಡೆವಲಪ್‌ಮೆಂಟ್ ಫಾರ್ ಬೆಗಿನ್ನರ್ಸ್](https://img.shields.io/badge/XR%20Development%20for%20Beginners-38BDF8?style=for-the-badge&labelColor=E5E7EB&color=38BDF8)](https://github.com/microsoft/xr-development-for-beginners?WT.mc_id=academic-105485-koreyst)
---
### ಕೋಪೈಲಟ್ ಸರಣಿ
[![ಎಐ ಜೋಡಣೆಯ ಪ್ರೋಗ್ರಾಮಿಂಗ್‌ಗೆ ಕೋಪೈಲಟ್](https://img.shields.io/badge/Copilot%20for%20AI%20Paired%20Programming-FACC15?style=for-the-badge&labelColor=E5E7EB&color=FACC15)](https://aka.ms/GitHubCopilotAI?WT.mc_id=academic-105485-koreyst)
[![ಸಿ#/.ನೆಟ್‌ಗಾಗಿ ಕೋಪೈಲಟ್](https://img.shields.io/badge/Copilot%20for%20C%23/.NET-FBBF24?style=for-the-badge&labelColor=E5E7EB&color=FBBF24)](https://github.com/microsoft/mastering-github-copilot-for-dotnet-csharp-developers?WT.mc_id=academic-105485-koreyst)
[![ಕೋಪೈಲಟ್ ಸಾಹಸ](https://img.shields.io/badge/Copilot%20Adventure-FDE68A?style=for-the-badge&labelColor=E5E7EB&color=FDE68A)](https://github.com/microsoft/CopilotAdventures?WT.mc_id=academic-105485-koreyst)
<!-- CO-OP TRANSLATOR OTHER COURSES END -->
## ಸಹಾಯ ಪಡೆಯುವುದು
**ಸಮಸ್ಯೆ ಎದುರಿಸುತ್ತಿದ್ದೀರಾ?** ಸಾಮಾನ್ಯ ಸಮಸ್ಯೆಗಳ ಪರಿಹಾರಕ್ಕಾಗಿ ನಮ್ಮ [ಟ್ರಬಲ್‌ಶೂಟಿಂಗ್ ಗೈಡ್](TROUBLESHOOTING.md) ಅನ್ನು ಪರಿಶೀಲಿಸಿ.
ನೀವು ಅಡಚಣೆಗೆ ಸಿಲುಕಿದರೆ ಅಥವಾ ಎಐ ಅಪ್ಲಿಕೇಶನ್‌ಗಳನ್ನು ನಿರ್ಮಿಸುವ ಬಗ್ಗೆ ಯಾವುದೇ ಪ್ರಶ್ನೆಗಳಿದ್ದರೆ, MCP ಬಗ್ಗೆ ಚರ್ಚೆಗಳಲ್ಲಿ ಭಾಗವಹಿಸಲು ಸಹಪಾಠಿಗಳು ಮತ್ತು ಅನುಭವಜ್ಞ ಡೆವಲಪರ್‌ಗಳೊಂದಿಗೆ ಸೇರಿ. ಇದು ಪ್ರಶ್ನೆಗಳಿಗೆ ಸ್ವಾಗತ ನೀಡುವ ಮತ್ತು ಜ್ಞಾನವನ್ನು ಮುಕ್ತವಾಗಿ ಹಂಚಿಕೊಳ್ಳುವ ಬೆಂಬಲದ ಸಮುದಾಯವಾಗಿದೆ.
[![Microsoft Foundry Discord](https://dcbadge.limes.pink/api/server/nTYy5BXMWG)](https://discord.gg/nTYy5BXMWG)
ನೀವು ಉತ್ಪನ್ನ ಪ್ರತಿಕ್ರಿಯೆ ಅಥವಾ ನಿರ್ಮಾಣದ ವೇಳೆ ದೋಷಗಳನ್ನು ಹೊಂದಿದ್ದರೆ ಭೇಟಿ ನೀಡಿ:
[![Microsoft Foundry Developer Forum](https://img.shields.io/badge/GitHub-Microsoft_Foundry_Developer_Forum-blue?style=for-the-badge&logo=github&color=000000&logoColor=fff)](https://aka.ms/foundry/forum)
---
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
**ಅಸ್ವೀಕಾರ**:
ಈ ದಸ್ತಾವೇಜು [Co-op Translator](https://github.com/Azure/co-op-translator) ಎಂಬ AI ಅನುವಾದ ಸೇವೆಯನ್ನು ಬಳಸಿ ಅನುವಾದಿಸಲಾಗಿದೆ. ನಾವು ಶುದ್ಧತೆಯತ್ತ ಪ್ರಯತ್ನಿಸುತ್ತಿದ್ದರೂ, ಸ್ವಯಂಚಾಲಿತ ಅನುವಾದಗಳಲ್ಲಿ ತಪ್ಪುಗಳು ಅಥವಾ ಅಸತ್ಯತೆಗಳು ಇರಬಹುದು ಎಂದು ದಯವಿಟ್ಟು ಗಮನಿಸಿ. ಮೂಲ ಭಾಷೆಯಲ್ಲಿರುವ ಮೂಲ ದಸ್ತಾವೇಜನ್ನು ಅಧಿಕೃತ ಮೂಲವೆಂದು ಪರಿಗಣಿಸಬೇಕು. ಮಹತ್ವದ ಮಾಹಿತಿಗಾಗಿ, ವೃತ್ತಿಪರ ಮಾನವ ಅನುವಾದವನ್ನು ಶಿಫಾರಸು ಮಾಡಲಾಗುತ್ತದೆ. ಈ ಅನುವಾದ ಬಳಕೆಯಿಂದ ಉಂಟಾಗುವ ಯಾವುದೇ ತಪ್ಪು ಅರ್ಥಮಾಡಿಕೊಳ್ಳುವಿಕೆ ಅಥವಾ ತಪ್ಪು ವಿವರಣೆಗಳಿಗೆ ನಾವು ಹೊಣೆಗಾರರಾಗುವುದಿಲ್ಲ.
<!-- CO-OP TRANSLATOR DISCLAIMER END -->

@ -0,0 +1,53 @@
<!--
CO_OP_TRANSLATOR_METADATA:
{
"original_hash": "0d575483100c332b2dbaefef915bb3c4",
"translation_date": "2025-12-19T13:14:12+00:00",
"source_file": "SECURITY.md",
"language_code": "kn"
}
-->
## ಭದ್ರತೆ
Microsoft ನಮ್ಮ ಸಾಫ್ಟ್‌ವೇರ್ ಉತ್ಪನ್ನಗಳು ಮತ್ತು ಸೇವೆಗಳ ಭದ್ರತೆಯನ್ನು ಗಂಭೀರವಾಗಿ ತೆಗೆದುಕೊಳ್ಳುತ್ತದೆ, ಇದರಲ್ಲಿ ನಮ್ಮ GitHub ಸಂಸ್ಥೆಗಳ ಮೂಲಕ ನಿರ್ವಹಿಸಲಾದ ಎಲ್ಲಾ ಮೂಲ ಕೋಡ್ ರೆಪೊಸಿಟರಿಗಳು ಸೇರಿವೆ, ಅವುಗಳಲ್ಲಿ [Microsoft](https://github.com/Microsoft), [Azure](https://github.com/Azure), [DotNet](https://github.com/dotnet), [AspNet](https://github.com/aspnet), [Xamarin](https://github.com/xamarin), ಮತ್ತು [ನಮ್ಮ GitHub ಸಂಸ್ಥೆಗಳು](https://opensource.microsoft.com/) ಸೇರಿವೆ.
ನೀವು ಯಾವುದೇ Microsoft-ಸ್ವಂತ ರೆಪೊಸಿಟರಿಯಲ್ಲಿ [Microsoft ಭದ್ರತಾ ದುರ್ಬಲತೆಯ ವ್ಯಾಖ್ಯಾನ](https://docs.microsoft.com/en-us/previous-versions/tn-archive/cc751383(v=technet.10))ಗೆ ಹೊಂದಿಕೆಯಾಗುವ ಭದ್ರತಾ ದುರ್ಬಲತೆಯನ್ನು ಕಂಡುಹಿಡಿದಿದ್ದೀರಿ ಎಂದು ನಂಬಿದರೆ, ದಯವಿಟ್ಟು ಕೆಳಗಿನಂತೆ ನಮಗೆ ವರದಿ ಮಾಡಿ.
## ಭದ್ರತಾ ಸಮಸ್ಯೆಗಳ ವರದಿ
**ದಯವಿಟ್ಟು ಸಾರ್ವಜನಿಕ GitHub ಸಮಸ್ಯೆಗಳ ಮೂಲಕ ಭದ್ರತಾ ದುರ್ಬಲತೆಗಳನ್ನು ವರದಿ ಮಾಡಬೇಡಿ.**
ಬದಲಾಗಿ, ದಯವಿಟ್ಟು Microsoft Security Response Center (MSRC) ಗೆ [https://msrc.microsoft.com/create-report](https://msrc.microsoft.com/create-report) ನಲ್ಲಿ ವರದಿ ಮಾಡಿ.
ನೀವು ಲಾಗಿನ್ ಮಾಡದೆ ಸಲ್ಲಿಸಲು ಇಚ್ಛಿಸಿದರೆ, [secure@microsoft.com](mailto:secure@microsoft.com) ಗೆ ಇಮೇಲ್ ಕಳುಹಿಸಿ. ಸಾಧ್ಯವಾದರೆ, ನಮ್ಮ PGP ಕೀ ಬಳಸಿ ನಿಮ್ಮ ಸಂದೇಶವನ್ನು ಎನ್‌ಕ್ರಿಪ್ಟ್ ಮಾಡಿ; ದಯವಿಟ್ಟು ಅದನ್ನು [Microsoft Security Response Center PGP Key ಪುಟದಿಂದ](https://www.microsoft.com/en-us/msrc/pgp-key-msrc) ಡೌನ್‌ಲೋಡ್ ಮಾಡಿ.
ನೀವು 24 ಗಂಟೆಗಳ ಒಳಗೆ ಪ್ರತಿಕ್ರಿಯೆ ಪಡೆಯಬೇಕು. ಯಾವುದೋ ಕಾರಣಕ್ಕಾಗಿ ನೀವು ಪಡೆಯದಿದ್ದರೆ, ದಯವಿಟ್ಟು ನಮ್ಮ ಮೂಲ ಸಂದೇಶವನ್ನು ಸ್ವೀಕರಿಸಿದ್ದೇವೆ ಎಂದು ಖಚಿತಪಡಿಸಲು ಇಮೇಲ್ ಮೂಲಕ ಅನುಸರಿಸಿ. ಹೆಚ್ಚಿನ ಮಾಹಿತಿಯನ್ನು [microsoft.com/msrc](https://www.microsoft.com/msrc) ನಲ್ಲಿ ಕಾಣಬಹುದು.
ದಯವಿಟ್ಟು ಕೆಳಗಿನ ವಿನಂತಿಸಿದ ಮಾಹಿತಿಯನ್ನು (ನೀವು ನೀಡಬಹುದಾದಷ್ಟು) ಸೇರಿಸಿ, ಇದರಿಂದ ನಾವು ಸಾಧ್ಯವಿರುವ ಸಮಸ್ಯೆಯ ಸ್ವಭಾವ ಮತ್ತು ವ್ಯಾಪ್ತಿಯನ್ನು ಉತ್ತಮವಾಗಿ ಅರ್ಥಮಾಡಿಕೊಳ್ಳಲು ಸಹಾಯವಾಗುತ್ತದೆ:
* ಸಮಸ್ಯೆಯ ಪ್ರಕಾರ (ಉದಾ: ಬಫರ್ ಓವರ್‌ಫ್ಲೋ, SQL ಇಂಜೆಕ್ಷನ್, ಕ್ರಾಸ್-ಸೈಟ್ ಸ್ಕ್ರಿಪ್ಟಿಂಗ್, ಇತ್ಯಾದಿ)
* ಸಮಸ್ಯೆಯ ಪ್ರತ್ಯಕ್ಷತೆಯೊಂದಿಗೆ ಸಂಬಂಧಿಸಿದ ಮೂಲ ಫೈಲ್‌ಗಳ ಸಂಪೂರ್ಣ ಮಾರ್ಗಗಳು
* ಪ್ರಭಾವಿತ ಮೂಲ ಕೋಡ್‌ನ ಸ್ಥಳ (ಟ್ಯಾಗ್/ಬ್ರಾಂಚ್/ಕಮಿಟ್ ಅಥವಾ ನೇರ URL)
* ಸಮಸ್ಯೆಯನ್ನು ಪುನರಾವರ್ತಿಸಲು ಅಗತ್ಯವಿರುವ ಯಾವುದೇ ವಿಶೇಷ ಸಂರಚನೆ
* ಸಮಸ್ಯೆಯನ್ನು ಪುನರಾವರ್ತಿಸಲು ಹಂತ-ಹಂತದ ಸೂಚನೆಗಳು
* ಸಾಬೀತು-ಆಫ್-ಕಾನ್ಸೆಪ್ಟ್ ಅಥವಾ ಎಕ್ಸ್‌ಪ್ಲಾಯಿಟ್ ಕೋಡ್ (ಸಾಧ್ಯವಾದರೆ)
* ಸಮಸ್ಯೆಯ ಪ್ರಭಾವ, ಮತ್ತು ಹೇಗೆ ಹ್ಯಾಕರ್ ಅದನ್ನು ದುರುಪಯೋಗ ಮಾಡಬಹುದು ಎಂಬುದು
ಈ ಮಾಹಿತಿ ನಿಮ್ಮ ವರದಿಯನ್ನು ವೇಗವಾಗಿ ತಪಾಸಣೆಗೆ ಸಹಾಯ ಮಾಡುತ್ತದೆ.
ನೀವು ಬಗ್ ಬೌಂಟಿಗಾಗಿ ವರದಿ ಮಾಡುತ್ತಿದ್ದರೆ, ಹೆಚ್ಚು ಸಂಪೂರ್ಣ ವರದಿಗಳು ಹೆಚ್ಚಿನ ಬೌಂಟಿ ಬಹುಮಾನಕ್ಕೆ ಸಹಾಯ ಮಾಡಬಹುದು. ದಯವಿಟ್ಟು ನಮ್ಮ [Microsoft Bug Bounty Program](https://microsoft.com/msrc/bounty) ಪುಟವನ್ನು ನಮ್ಮ ಸಕ್ರಿಯ ಕಾರ್ಯಕ್ರಮಗಳ ಬಗ್ಗೆ ಹೆಚ್ಚಿನ ವಿವರಗಳಿಗೆ ಭೇಟಿ ನೀಡಿ.
## ಇಚ್ಛಿತ ಭಾಷೆಗಳು
ನಾವು ಎಲ್ಲಾ ಸಂವಹನಗಳು ಇಂಗ್ಲಿಷ್‌ನಲ್ಲಿ ಇರಬೇಕೆಂದು ಇಚ್ಛಿಸುತ್ತೇವೆ.
## ನೀತಿ
Microsoft [ಸಂಯೋಜಿತ ದುರ್ಬಲತೆ ಬಹಿರಂಗಪಡಿಸುವಿಕೆ](https://www.microsoft.com/en-us/msrc/cvd) ತತ್ವವನ್ನು ಅನುಸರಿಸುತ್ತದೆ.
---
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
**ಅಸ್ವೀಕಾರ**:
ಈ ದಸ್ತಾವೇಜು AI ಅನುವಾದ ಸೇವೆ [Co-op Translator](https://github.com/Azure/co-op-translator) ಬಳಸಿ ಅನುವಾದಿಸಲಾಗಿದೆ. ನಾವು ನಿಖರತೆಯಿಗಾಗಿ ಪ್ರಯತ್ನಿಸುತ್ತಿದ್ದರೂ, ಸ್ವಯಂಚಾಲಿತ ಅನುವಾದಗಳಲ್ಲಿ ದೋಷಗಳು ಅಥವಾ ಅಸತ್ಯತೆಗಳು ಇರಬಹುದು ಎಂದು ದಯವಿಟ್ಟು ಗಮನಿಸಿ. ಮೂಲ ಭಾಷೆಯಲ್ಲಿರುವ ಮೂಲ ದಸ್ತಾವೇಜನ್ನು ಅಧಿಕೃತ ಮೂಲವಾಗಿ ಪರಿಗಣಿಸಬೇಕು. ಮಹತ್ವದ ಮಾಹಿತಿಗಾಗಿ, ವೃತ್ತಿಪರ ಮಾನವ ಅನುವಾದವನ್ನು ಶಿಫಾರಸು ಮಾಡಲಾಗುತ್ತದೆ. ಈ ಅನುವಾದ ಬಳಕೆಯಿಂದ ಉಂಟಾಗುವ ಯಾವುದೇ ತಪ್ಪು ಅರ್ಥಮಾಡಿಕೊಳ್ಳುವಿಕೆ ಅಥವಾ ತಪ್ಪು ವಿವರಣೆಗಳಿಗೆ ನಾವು ಹೊಣೆಗಾರರಾಗುವುದಿಲ್ಲ.
<!-- CO-OP TRANSLATOR DISCLAIMER END -->

@ -0,0 +1,26 @@
<!--
CO_OP_TRANSLATOR_METADATA:
{
"original_hash": "872be8bc1b93ef1dd9ac3d6e8f99f6ab",
"translation_date": "2025-12-19T12:48:40+00:00",
"source_file": "SUPPORT.md",
"language_code": "kn"
}
-->
# ಬೆಂಬಲ
## ಸಮಸ್ಯೆಗಳನ್ನು ದಾಖಲಿಸುವುದು ಮತ್ತು ಸಹಾಯ ಪಡೆಯುವುದು ಹೇಗೆ
ಈ ಯೋಜನೆ ದೋಷಗಳು ಮತ್ತು ವೈಶಿಷ್ಟ್ಯ ವಿನಂತಿಗಳನ್ನು ಟ್ರ್ಯಾಕ್ ಮಾಡಲು GitHub Issues ಅನ್ನು ಬಳಸುತ್ತದೆ. ನಕಲುಗಳನ್ನು ತಪ್ಪಿಸಲು ಹೊಸ ಸಮಸ್ಯೆಗಳನ್ನು ದಾಖಲಿಸುವ ಮೊದಲು ದಯವಿಟ್ಟು ಇತ್ತೀಚಿನ ಸಮಸ್ಯೆಗಳನ್ನು ಹುಡುಕಿ. ಹೊಸ ಸಮಸ್ಯೆಗಳಿಗೆ, ನಿಮ್ಮ ದೋಷ ಅಥವಾ ವೈಶಿಷ್ಟ್ಯ ವಿನಂತಿಯನ್ನು ಹೊಸ ಸಮಸ್ಯೆಯಾಗಿ ದಾಖಲಿಸಿ.
ಈ ಯೋಜನೆಯನ್ನು ಬಳಸುವ ಬಗ್ಗೆ ಸಹಾಯ ಮತ್ತು ಪ್ರಶ್ನೆಗಳಿಗಾಗಿ, ಸಮಸ್ಯೆಯನ್ನು ದಾಖಲಿಸಿ.
## ಮೈಕ್ರೋಸಾಫ್ಟ್ ಬೆಂಬಲ ನೀತಿ
ಈ ಸಂಗ್ರಹಣೆಗೆ ಬೆಂಬಲವು ಮೇಲ್ಕಂಡ ಸಂಪನ್ಮೂಲಗಳಿಗೆ ಮಾತ್ರ ಸೀಮಿತವಾಗಿದೆ.
---
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
**ಅಸ್ವೀಕಾರ**:
ಈ ದಸ್ತಾವೇಜು AI ಅನುವಾದ ಸೇವೆ [Co-op Translator](https://github.com/Azure/co-op-translator) ಬಳಸಿ ಅನುವಾದಿಸಲಾಗಿದೆ. ನಾವು ನಿಖರತೆಯಿಗಾಗಿ ಪ್ರಯತ್ನಿಸುತ್ತಿದ್ದರೂ, ಸ್ವಯಂಚಾಲಿತ ಅನುವಾದಗಳಲ್ಲಿ ದೋಷಗಳು ಅಥವಾ ಅಸತ್ಯತೆಗಳು ಇರಬಹುದು ಎಂದು ದಯವಿಟ್ಟು ಗಮನಿಸಿ. ಮೂಲ ಭಾಷೆಯಲ್ಲಿರುವ ಮೂಲ ದಸ್ತಾವೇಜನ್ನು ಅಧಿಕೃತ ಮೂಲವೆಂದು ಪರಿಗಣಿಸಬೇಕು. ಮಹತ್ವದ ಮಾಹಿತಿಗಾಗಿ ವೃತ್ತಿಪರ ಮಾನವ ಅನುವಾದವನ್ನು ಶಿಫಾರಸು ಮಾಡಲಾಗುತ್ತದೆ. ಈ ಅನುವಾದ ಬಳಕೆಯಿಂದ ಉಂಟಾಗುವ ಯಾವುದೇ ತಪ್ಪು ಅರ್ಥಮಾಡಿಕೊಳ್ಳುವಿಕೆ ಅಥವಾ ತಪ್ಪು ವಿವರಣೆಗಳಿಗೆ ನಾವು ಹೊಣೆಗಾರರಾಗುವುದಿಲ್ಲ.
<!-- CO-OP TRANSLATOR DISCLAIMER END -->

@ -0,0 +1,629 @@
<!--
CO_OP_TRANSLATOR_METADATA:
{
"original_hash": "93a6a8a8a209128cbfedcbc076ee21b0",
"translation_date": "2025-12-19T12:59:04+00:00",
"source_file": "TROUBLESHOOTING.md",
"language_code": "kn"
}
-->
# ಸಮಸ್ಯೆ ಪರಿಹಾರ ಮಾರ್ಗದರ್ಶಿ
ಈ ಮಾರ್ಗದರ್ಶಿ ಡೇಟಾ ಸೈನ್ಸ್ ಫಾರ್ ಬಿಗಿನರ್ಸ್ ಪಠ್ಯಕ್ರಮದೊಂದಿಗೆ ಕೆಲಸ ಮಾಡುವಾಗ ನೀವು ಎದುರಿಸಬಹುದಾದ ಸಾಮಾನ್ಯ ಸಮಸ್ಯೆಗಳಿಗೆ ಪರಿಹಾರಗಳನ್ನು ಒದಗಿಸುತ್ತದೆ.
## ವಿಷಯಗಳ ಪಟ್ಟಿಯು
- [ಪೈಥಾನ್ ಮತ್ತು ಜುಪಿಟರ್ ಸಮಸ್ಯೆಗಳು](../..)
- [ಪ್ಯಾಕೇಜ್ ಮತ್ತು ಅವಲಂಬನೆ ಸಮಸ್ಯೆಗಳು](../..)
- [ಜುಪಿಟರ್ ನೋಟ್ಬುಕ್ ಸಮಸ್ಯೆಗಳು](../..)
- [ಕ್ವಿಜ್ ಅಪ್ಲಿಕೇಶನ್ ಸಮಸ್ಯೆಗಳು](../..)
- [ಗಿಟ್ ಮತ್ತು ಗಿಟ್‌ಹಬ್ ಸಮಸ್ಯೆಗಳು](../..)
- [ಡಾಕ್ಸಿಫೈ ಡಾಕ್ಯುಮೆಂಟೇಶನ್ ಸಮಸ್ಯೆಗಳು](../..)
- [ಡೇಟಾ ಮತ್ತು ಫೈಲ್ ಸಮಸ್ಯೆಗಳು](../..)
- [ಕಾರ್ಯಕ್ಷಮತೆ ಸಮಸ್ಯೆಗಳು](../..)
- [ಹೆಚ್ಚಿನ ಸಹಾಯ ಪಡೆಯುವುದು](../..)
## ಪೈಥಾನ್ ಮತ್ತು ಜುಪಿಟರ್ ಸಮಸ್ಯೆಗಳು
### ಪೈಥಾನ್ ಕಂಡುಬರಲಿಲ್ಲ ಅಥವಾ ತಪ್ಪು ಆವೃತ್ತಿ
**ಸಮಸ್ಯೆ:** `python: command not found` ಅಥವಾ ತಪ್ಪು ಪೈಥಾನ್ ಆವೃತ್ತಿ
**ಪರಿಹಾರ:**
```bash
# ಪೈಥಾನ್ ಆವೃತ್ತಿಯನ್ನು ಪರಿಶೀಲಿಸಿ
python --version
python3 --version
# ಪೈಥಾನ್ 3 'python3' ಎಂದು ಸ್ಥಾಪಿತವಾಗಿದ್ದರೆ, ಒಂದು ಅಲಿಯಾಸ್ ರಚಿಸಿ
# macOS/Linux ನಲ್ಲಿ, ~/.bashrc ಅಥವಾ ~/.zshrc ಗೆ ಸೇರಿಸಿ:
alias python=python3
alias pip=pip3
# ಅಥವಾ python3 ಅನ್ನು ಸ್ಪಷ್ಟವಾಗಿ ಬಳಸಿ
python3 -m pip install jupyter
```
**ವಿಂಡೋಸ್ ಪರಿಹಾರ:**
1. [python.org](https://www.python.org/) ನಿಂದ ಪೈಥಾನ್ ಮರುಸ್ಥಾಪಿಸಿ
2. ಸ್ಥಾಪನೆಯಾಗುತ್ತಿರುವಾಗ, "Add Python to PATH" ಅನ್ನು ಪರಿಶೀಲಿಸಿ
3. ನಿಮ್ಮ ಟರ್ಮಿನಲ್/ಕಮಾಂಡ್ ಪ್ರಾಂಪ್ಟ್ ಅನ್ನು ಮರುಪ್ರಾರಂಭಿಸಿ
### ವರ್ಚುವಲ್ ಎನ್ವಿರಾನ್‌ಮೆಂಟ್ ಸಕ್ರಿಯಗೊಳಿಸುವ ಸಮಸ್ಯೆಗಳು
**ಸಮಸ್ಯೆ:** ವರ್ಚುವಲ್ ಎನ್ವಿರಾನ್‌ಮೆಂಟ್ ಸಕ್ರಿಯಗೊಳ್ಳುತ್ತಿಲ್ಲ
**ಪರಿಹಾರ:**
**ವಿಂಡೋಸ್:**
```bash
# ನೀವು ಕಾರ್ಯಗತಗೊಳಿಸುವ ನೀತಿ ದೋಷವನ್ನು ಪಡೆದರೆ
Set-ExecutionPolicy -ExecutionPolicy RemoteSigned -Scope CurrentUser
# ನಂತರ ಸಕ್ರಿಯಗೊಳಿಸಿ
venv\Scripts\activate
```
**ಮ್ಯಾಕ್‌ಒಎಸ್/ಲಿನಕ್ಸ್ನಲ್ಲಿ:**
```bash
# ಸಕ್ರಿಯಗೊಳಿಸುವ ಸ್ಕ್ರಿಪ್ಟ್ ಕಾರ್ಯನಿರ್ವಹಣೀಯವಾಗಿರುವುದನ್ನು ಖಚಿತಪಡಿಸಿಕೊಳ್ಳಿ
chmod +x venv/bin/activate
# ನಂತರ ಸಕ್ರಿಯಗೊಳಿಸಿ
source venv/bin/activate
```
**ಸಕ್ರಿಯಗೊಳಿಸುವಿಕೆ ಪರಿಶೀಲಿಸಿ:**
```bash
# ನಿಮ್ಮ ಪ್ರಾಂಪ್ಟ್ (venv) ಅನ್ನು ತೋರಿಸಬೇಕು
# ಪೈಥಾನ್ ಸ್ಥಳವನ್ನು ಪರಿಶೀಲಿಸಿ
which python # venv ಗೆ ಸೂಚಿಸಬೇಕು
```
### ಜುಪಿಟರ್ ಕರ್ಣಲ್ ಸಮಸ್ಯೆಗಳು
**ಸಮಸ್ಯೆ:** "Kernel not found" ಅಥವಾ "Kernel keeps dying"
**ಪರಿಹಾರ:**
```bash
# ಕರ್ಣಲ್ ಅನ್ನು ಮರುಸ್ಥಾಪಿಸಿ
python -m ipykernel install --user --name=datascience --display-name="Python (Data Science)"
# ಅಥವಾ ಡೀಫಾಲ್ಟ್ ಕರ್ಣಲ್ ಅನ್ನು ಬಳಸಿ
python -m ipykernel install --user
# ಜುಪೈಟರ್ ಅನ್ನು ಮರುಪ್ರಾರಂಭಿಸಿ
jupyter notebook
```
**ಸಮಸ್ಯೆ:** ಜುಪಿಟರ್‌ನಲ್ಲಿ ತಪ್ಪು ಪೈಥಾನ್ ಆವೃತ್ತಿ
**ಪರಿಹಾರ:**
```bash
# ನಿಮ್ಮ ವರ್ಚುವಲ್ ಪರಿಸರದಲ್ಲಿ ಜುಪೈಟರ್ ಅನ್ನು ಸ್ಥಾಪಿಸಿ
source venv/bin/activate # ಮೊದಲು ಸಕ್ರಿಯಗೊಳಿಸಿ
pip install jupyter ipykernel
# ಕರ್ಣಲ್ ಅನ್ನು ನೋಂದಣಿ ಮಾಡಿ
python -m ipykernel install --user --name=venv --display-name="Python (venv)"
# ಜುಪೈಟರ್‌ನಲ್ಲಿ, Kernel -> Change kernel -> Python (venv) ಆಯ್ಕೆಮಾಡಿ
```
## ಪ್ಯಾಕೇಜ್ ಮತ್ತು ಅವಲಂಬನೆ ಸಮಸ್ಯೆಗಳು
### ಆಮದು ದೋಷಗಳು
**ಸಮಸ್ಯೆ:** `ModuleNotFoundError: No module named 'pandas'` (ಅಥವಾ ಇತರ ಪ್ಯಾಕೇಜ್‌ಗಳು)
**ಪರಿಹಾರ:**
```bash
# ವರ್ಚುವಲ್ ಪರಿಸರ ಸಕ್ರಿಯವಾಗಿದೆ ಎಂದು ಖಚಿತಪಡಿಸಿಕೊಳ್ಳಿ
source venv/bin/activate # macOS/Linux
venv\Scripts\activate # ವಿಂಡೋಸ್
# ಕಾಣೆಯಾದ ಪ್ಯಾಕೇಜ್ ಅನ್ನು ಸ್ಥಾಪಿಸಿ
pip install pandas
# ಎಲ್ಲಾ ಸಾಮಾನ್ಯ ಪ್ಯಾಕೇಜ್‌ಗಳನ್ನು ಸ್ಥಾಪಿಸಿ
pip install jupyter pandas numpy matplotlib seaborn scikit-learn
# ಸ್ಥಾಪನೆ ಪರಿಶೀಲಿಸಿ
python -c "import pandas; print(pandas.__version__)"
```
### ಪಿಪ್ ಸ್ಥಾಪನೆ ವಿಫಲತೆಗಳು
**ಸಮಸ್ಯೆ:** ಅನುಮತಿ ದೋಷಗಳೊಂದಿಗೆ `pip install` ವಿಫಲವಾಗಿದೆ
**ಪರಿಹಾರ:**
```bash
# --user ಧ್ವಜವನ್ನು ಬಳಸಿ
pip install --user package-name
# ಅಥವಾ ವರ್ಚುವಲ್ ಪರಿಸರವನ್ನು ಬಳಸಿ (ಶಿಫಾರಸು ಮಾಡಲಾಗಿದೆ)
python -m venv venv
source venv/bin/activate
pip install package-name
```
**ಸಮಸ್ಯೆ:** SSL ಪ್ರಮಾಣಪತ್ರ ದೋಷಗಳೊಂದಿಗೆ `pip install` ವಿಫಲವಾಗಿದೆ
**ಪರಿಹಾರ:**
```bash
# ಮೊದಲು ಪಿಪ್ ಅನ್ನು ನವೀಕರಿಸಿ
python -m pip install --upgrade pip
# ನಂಬಿಗಸ್ತ ಹೋಸ್ಟ್‌ನೊಂದಿಗೆ ಸ್ಥಾಪಿಸಲು ಪ್ರಯತ್ನಿಸಿ (ತಾತ್ಕಾಲಿಕ ಪರಿಹಾರ)
pip install --trusted-host pypi.org --trusted-host files.pythonhosted.org package-name
```
### ಪ್ಯಾಕೇಜ್ ಆವೃತ್ತಿ ಸಂಘರ್ಷಗಳು
**ಸಮಸ್ಯೆ:** ಅಸಂಗತ ಪ್ಯಾಕೇಜ್ ಆವೃತ್ತಿಗಳು
**ಪರಿಹಾರ:**
```bash
# ಹೊಸ ವರ್ಚುವಲ್ ಪರಿಸರವನ್ನು ರಚಿಸಿ
python -m venv venv-new
source venv-new/bin/activate # ಅಥವಾ ವಿಂಡೋಸ್‌ನಲ್ಲಿ venv-new\Scripts\activate
# ಅಗತ್ಯವಿದ್ದರೆ ನಿರ್ದಿಷ್ಟ ಆವೃತ್ತಿಗಳೊಂದಿಗೆ ಪ್ಯಾಕೇಜುಗಳನ್ನು ಸ್ಥಾಪಿಸಿ
pip install pandas==1.3.0
pip install numpy==1.21.0
# ಅಥವಾ pip ಗೆ ಅವಲಂಬನೆಗಳನ್ನು ಪರಿಹರಿಸಲು ಬಿಡಿ
pip install jupyter pandas numpy matplotlib seaborn scikit-learn
```
## ಜುಪಿಟರ್ ನೋಟ್ಬುಕ್ ಸಮಸ್ಯೆಗಳು
### ಜುಪಿಟರ್ ಪ್ರಾರಂಭವಾಗುತ್ತಿಲ್ಲ
**ಸಮಸ್ಯೆ:** `jupyter notebook` ಕಮಾಂಡ್ ಕಂಡುಬರಲಿಲ್ಲ
**ಪರಿಹಾರ:**
```bash
# ಜುಪೈಟರ್ ಅನ್ನು ಸ್ಥಾಪಿಸಿ
pip install jupyter
# ಅಥವಾ python -m ಬಳಸಿ
python -m jupyter notebook
# ಅಗತ್ಯವಿದ್ದರೆ PATH ಗೆ ಸೇರಿಸಿ (macOS/Linux)
export PATH="$HOME/.local/bin:$PATH"
```
### ನೋಟ್ಬುಕ್ ಲೋಡ್ ಅಥವಾ ಉಳಿಸುವುದಿಲ್ಲ
**ಸಮಸ್ಯೆ:** "Notebook failed to load" ಅಥವಾ ಉಳಿಸುವ ದೋಷಗಳು
**ಪರಿಹಾರ:**
1. ಫೈಲ್ ಅನುಮತಿಗಳನ್ನು ಪರಿಶೀಲಿಸಿ
```bash
# ನೀವು ಬರೆಯಲು ಅನುಮತಿಗಳನ್ನು ಹೊಂದಿರುವುದನ್ನು ಖಚಿತಪಡಿಸಿಕೊಳ್ಳಿ
ls -l notebook.ipynb
chmod 644 notebook.ipynb # ಅಗತ್ಯವಿದ್ದರೆ
```
2. ಫೈಲ್ ಹಾಳಾಗಿರುವುದಿಲ್ಲ ಎಂದು ಪರಿಶೀಲಿಸಿ
```bash
# JSON ರಚನೆಯನ್ನು ಪರಿಶೀಲಿಸಲು ಪಠ್ಯ ಸಂಪಾದಕದಲ್ಲಿ ತೆರೆಯಲು ಪ್ರಯತ್ನಿಸಿ
# ಹಾಳಾಗಿದ್ದರೆ ವಿಷಯವನ್ನು ಹೊಸ ನೋಟ್ಬುಕ್‌ಗೆ ನಕಲಿಸಿ
```
3. ಜುಪಿಟರ್ ಕ್ಯಾಶೆ ತೆರವುಗೊಳಿಸಿ
```bash
jupyter notebook --clear-cache
```
### ಸೆಲ್ ಕಾರ್ಯಗತಗೊಳ್ಳುತ್ತಿಲ್ಲ
**ಸಮಸ್ಯೆ:** ಸೆಲ್ "In [*]" ನಲ್ಲಿ ಅಂಟಿಕೊಂಡಿದೆ ಅಥವಾ ಬಹಳ ಸಮಯ ತೆಗೆದುಕೊಳ್ಳುತ್ತಿದೆ
**ಪರಿಹಾರ:**
1. **ಕರ್ಣಲ್ ಅನ್ನು ಮಧ್ಯಂತರಗೊಳಿಸಿ**: "Interrupt" ಬಟನ್ ಕ್ಲಿಕ್ ಮಾಡಿ ಅಥವಾ `I, I` ಒತ್ತಿ
2. **ಕರ್ಣಲ್ ಮರುಪ್ರಾರಂಭಿಸಿ**: Kernel ಮೆನು → Restart
3. ನಿಮ್ಮ ಕೋಡ್‌ನಲ್ಲಿ **ಅನಂತ ಲೂಪ್ಗಳಿಗಾಗಿ ಪರಿಶೀಲಿಸಿ**
4. **ಔಟ್‌ಪುಟ್ ತೆರವುಗೊಳಿಸಿ**: ಸೆಲ್ → All Output → Clear
### ಪ್ಲಾಟ್‌ಗಳು ಪ್ರದರ್ಶಿಸಲಾಗುತ್ತಿಲ್ಲ
**ಸಮಸ್ಯೆ:** `matplotlib` ಪ್ಲಾಟ್‌ಗಳು ನೋಟ್ಬುಕ್‌ನಲ್ಲಿ ತೋರಿಸುತ್ತಿಲ್ಲ
**ಪರಿಹಾರ:**
```python
# ನೋಟ್ಬುಕ್‌ನ ಮೇಲ್ಭಾಗದಲ್ಲಿ ಮಾಯಾಜಾಲ ಆಜ್ಞೆಯನ್ನು ಸೇರಿಸಿ
%matplotlib inline
import matplotlib.pyplot as plt
# ಚಿತ್ರ ರಚಿಸಿ
plt.plot([1, 2, 3, 4])
plt.show() # show() ಅನ್ನು ಕರೆಮಾಡುವುದು ಖಚಿತಪಡಿಸಿಕೊಳ್ಳಿ
```
**ಇಂಟರಾಕ್ಟಿವ್ ಪ್ಲಾಟ್‌ಗಳಿಗೆ ಪರ್ಯಾಯ:**
```python
%matplotlib notebook
# ಅಥವಾ
%matplotlib widget
```
## ಕ್ವಿಜ್ ಅಪ್ಲಿಕೇಶನ್ ಸಮಸ್ಯೆಗಳು
### npm install ವಿಫಲವಾಗಿದೆ
**ಸಮಸ್ಯೆ:** `npm install` ಸಮಯದಲ್ಲಿ ದೋಷಗಳು
**ಪರಿಹಾರ:**
```bash
# npm ಕ್ಯಾಶೆ ತೆರವುಗೊಳಿಸಿ
npm cache clean --force
# node_modules ಮತ್ತು package-lock.json ಅನ್ನು ತೆಗೆದುಹಾಕಿ
rm -rf node_modules package-lock.json
# ಮರುಸ್ಥಾಪಿಸಿ
npm install
# ಇನ್ನೂ ವಿಫಲವಾಗಿದ್ದರೆ, ಹಳೆಯ ಪಿಯರ್ ಡಿಪ್ಸ್ ಜೊತೆಗೆ ಪ್ರಯತ್ನಿಸಿ
npm install --legacy-peer-deps
```
### ಕ್ವಿಜ್ ಅಪ್ಲಿಕೇಶನ್ ಪ್ರಾರಂಭವಾಗುತ್ತಿಲ್ಲ
**ಸಮಸ್ಯೆ:** `npm run serve` ವಿಫಲವಾಗಿದೆ
**ಪರಿಹಾರ:**
```bash
# Node.js ಆವೃತ್ತಿಯನ್ನು ಪರಿಶೀಲಿಸಿ
node --version # 12.x ಅಥವಾ ಅದಕ್ಕಿಂತ ಹೆಚ್ಚಿನದಾಗಿರಬೇಕು
# ಅವಲಂಬನೆಗಳನ್ನು ಮರುಸ್ಥಾಪಿಸಿ
cd quiz-app
rm -rf node_modules package-lock.json
npm install
# ವಿಭಿನ್ನ ಪೋರ್ಟ್ ಪ್ರಯತ್ನಿಸಿ
npm run serve -- --port 8081
```
### ಪೋರ್ಟ್ ಈಗಾಗಲೇ ಬಳಕೆಯಲ್ಲಿದೆ
**ಸಮಸ್ಯೆ:** "Port 8080 is already in use"
**ಪರಿಹಾರ:**
```bash
# 8080 ಪೋರ್ಟ್‌ನಲ್ಲಿ ಪ್ರಕ್ರಿಯೆಯನ್ನು ಹುಡುಕಿ ಮತ್ತು ಕೊಲ್ಲಿರಿ
# macOS/Linux:
lsof -ti:8080 | xargs kill -9
# Windows:
netstat -ano | findstr :8080
taskkill /PID <PID> /F
# ಅಥವಾ ಬೇರೆ ಪೋರ್ಟ್ ಬಳಸಿ
npm run serve -- --port 8081
```
### ಕ್ವಿಜ್ ಲೋಡ್ ಆಗುತ್ತಿಲ್ಲ ಅಥವಾ ಖಾಲಿ ಪುಟ
**ಸಮಸ್ಯೆ:** ಕ್ವಿಜ್ ಅಪ್ಲಿಕೇಶನ್ ಲೋಡ್ ಆಗುತ್ತದೆ ಆದರೆ ಖಾಲಿ ಪುಟ ತೋರಿಸುತ್ತದೆ
**ಪರಿಹಾರ:**
1. ಬ್ರೌಸರ್ ಕಾನ್ಸೋಲ್‌ನಲ್ಲಿ ದೋಷಗಳನ್ನು ಪರಿಶೀಲಿಸಿ (F12)
2. ಬ್ರೌಸರ್ ಕ್ಯಾಶೆ ಮತ್ತು ಕುಕೀಸ್ ತೆರವುಗೊಳಿಸಿ
3. ಬೇರೆ ಬ್ರೌಸರ್ ಪ್ರಯತ್ನಿಸಿ
4. ಜಾವಾಸ್ಕ್ರಿಪ್ಟ್ ಸಕ್ರಿಯವಾಗಿದೆ ಎಂದು ಖಚಿತಪಡಿಸಿಕೊಳ್ಳಿ
5. ಜಾಹೀರಾತು ತಡೆಗಟ್ಟುವವರನ್ನು ಪರಿಶೀಲಿಸಿ
```bash
# ಆಪ್ ಅನ್ನು ಮರುನಿರ್ಮಿಸಿ
npm run build
npm run serve
```
## ಗಿಟ್ ಮತ್ತು ಗಿಟ್‌ಹಬ್ ಸಮಸ್ಯೆಗಳು
### ಗಿಟ್ ಗುರುತಿಸಲಾಗುತ್ತಿಲ್ಲ
**ಸಮಸ್ಯೆ:** `git: command not found`
**ಪರಿಹಾರ:**
**ವಿಂಡೋಸ್:**
- [git-scm.com](https://git-scm.com/) ನಿಂದ ಗಿಟ್ ಅನ್ನು ಸ್ಥಾಪಿಸಿ
- ಸ್ಥಾಪನೆಯ ನಂತರ ಟರ್ಮಿನಲ್ ಮರುಪ್ರಾರಂಭಿಸಿ
**ಮ್ಯಾಕ್‌ಒಎಸ್:**
> **ಗಮನಿಸಿ:** ನೀವು ಹೋಮ್‌ಬ್ರೂ ಸ್ಥಾಪಿಸದಿದ್ದರೆ, ಮೊದಲು ಅದನ್ನು ಸ್ಥಾಪಿಸಲು [https://brew.sh/](https://brew.sh/) ನಲ್ಲಿ ಸೂಚನೆಗಳನ್ನು ಅನುಸರಿಸಿ.
```bash
# ಹೋಮ್‌ಬ್ರೂ ಮೂಲಕ ಸ್ಥಾಪಿಸಿ
brew install git
# ಅಥವಾ Xcode ಕಮಾಂಡ್ ಲೈನ್ ಟೂಲ್ಸ್ ಅನ್ನು ಸ್ಥಾಪಿಸಿ
xcode-select --install
```
**ಲಿನಕ್ಸ್ನಲ್ಲಿ:**
```bash
sudo apt-get install git # ಡೆಬಿಯನ್/ಉಬುಂಟು
sudo dnf install git # ಫೆಡೋರಾ
```
### ಕ್ಲೋನ್ ವಿಫಲವಾಗಿದೆ
**ಸಮಸ್ಯೆ:** `git clone` ಪ್ರಮಾಣೀಕರಣ ದೋಷಗಳೊಂದಿಗೆ ವಿಫಲವಾಗಿದೆ
**ಪರಿಹಾರ:**
```bash
# HTTPS URL ಅನ್ನು ಬಳಸಿ
git clone https://github.com/microsoft/Data-Science-For-Beginners.git
# ನೀವು GitHub ನಲ್ಲಿ 2FA ಸಕ್ರಿಯಗೊಳಿಸಿದ್ದರೆ, ವೈಯಕ್ತಿಕ ಪ್ರವೇಶ ಟೋಕನ್ ಅನ್ನು ಬಳಸಿ
# ಟೋಕನ್ ಅನ್ನು ರಚಿಸಿ: https://github.com/settings/tokens
# ಕೇಳಿದಾಗ ಪಾಸ್ವರ್ಡ್ ಆಗಿ ಟೋಕನ್ ಅನ್ನು ಬಳಸಿ
```
### ಅನುಮತಿ ನಿರಾಕರಿಸಲಾಗಿದೆ (publickey)
**ಸಮಸ್ಯೆ:** SSH ಕೀ ಪ್ರಮಾಣೀಕರಣ ವಿಫಲವಾಗಿದೆ
**ಪರಿಹಾರ:**
```bash
# SSH ಕೀ ರಚಿಸಿ
ssh-keygen -t ed25519 -C "your_email@example.com"
# ಕೀ ಅನ್ನು ssh-agent ಗೆ ಸೇರಿಸಿ
eval "$(ssh-agent -s)"
ssh-add ~/.ssh/id_ed25519
# ಸಾರ್ವಜನಿಕ ಕೀ GitHub ಗೆ ಸೇರಿಸಿ
# ಕೀ ನಕಲಿಸಿ: cat ~/.ssh/id_ed25519.pub
# ಇಲ್ಲಿ ಸೇರಿಸಿ: https://github.com/settings/keys
```
## ಡಾಕ್ಸಿಫೈ ಡಾಕ್ಯುಮೆಂಟೇಶನ್ ಸಮಸ್ಯೆಗಳು
### ಡಾಕ್ಸಿಫೈ ಕಮಾಂಡ್ ಕಂಡುಬರಲಿಲ್ಲ
**ಸಮಸ್ಯೆ:** `docsify: command not found`
**ಪರಿಹಾರ:**
```bash
# ಜಾಗತಿಕವಾಗಿ ಸ್ಥಾಪಿಸಿ
npm install -g docsify-cli
# macOS/Linux ನಲ್ಲಿ ಅನುಮತಿ ದೋಷ ಇದ್ದರೆ
sudo npm install -g docsify-cli
# ಸ್ಥಾಪನೆಯನ್ನು ಪರಿಶೀಲಿಸಿ
docsify --version
# ಇನ್ನೂ ಕಂಡುಬಂದಿಲ್ಲದಿದ್ದರೆ, npm ಜಾಗತಿಕ ಮಾರ್ಗವನ್ನು ಸೇರಿಸಿ
# npm ಜಾಗತಿಕ ಮಾರ್ಗವನ್ನು ಹುಡುಕಿ
npm config get prefix
# PATH ಗೆ ಸೇರಿಸಿ (~/.bashrc ಅಥವಾ ~/.zshrc ಗೆ ಸೇರಿಸಿ)
export PATH="$PATH:/usr/local/bin"
```
### ಡಾಕ್ಯುಮೆಂಟೇಶನ್ ಲೋಡ್ ಆಗುತ್ತಿಲ್ಲ
**ಸಮಸ್ಯೆ:** ಡಾಕ್ಸಿಫೈ ಸೇವ್ ಮಾಡುತ್ತದೆ ಆದರೆ ವಿಷಯ ಲೋಡ್ ಆಗುವುದಿಲ್ಲ
**ಪರಿಹಾರ:**
```bash
# ನೀವು ರೆಪೊಸಿಟರಿ ರೂಟ್‌ನಲ್ಲಿ ಇದ್ದೀರಾ ಎಂದು ಖಚಿತಪಡಿಸಿಕೊಳ್ಳಿ
cd Data-Science-For-Beginners
# index.html ಅನ್ನು ಪರಿಶೀಲಿಸಿ
ls index.html
# ನಿರ್ದಿಷ್ಟ ಪೋರ್ಟ್‌ನೊಂದಿಗೆ ಸೇವೆ ನೀಡಿ
docsify serve --port 3000
# ದೋಷಗಳಿಗಾಗಿ ಬ್ರೌಸರ್ ಕಾನ್ಸೋಲ್ ಪರಿಶೀಲಿಸಿ (F12)
```
### ಚಿತ್ರಗಳು ಪ್ರದರ್ಶಿಸಲಾಗುತ್ತಿಲ್ಲ
**ಸಮಸ್ಯೆ:** ಚಿತ್ರಗಳು ಮುರಿದ ಲಿಂಕ್ ಐಕಾನ್ ತೋರಿಸುತ್ತಿವೆ
**ಪರಿಹಾರ:**
1. ಚಿತ್ರ ಮಾರ್ಗಗಳು ಸಂಬಂಧಿತವಾಗಿವೆ ಎಂದು ಪರಿಶೀಲಿಸಿ
2. ಚಿತ್ರ ಫೈಲ್‌ಗಳು ರೆಪೊಸಿಟರಿಯಲ್ಲಿ ಇವೆ ಎಂದು ಖಚಿತಪಡಿಸಿಕೊಳ್ಳಿ
3. ಬ್ರೌಸರ್ ಕ್ಯಾಶೆ ತೆರವುಗೊಳಿಸಿ
4. ಫೈಲ್ ವಿಸ್ತರಣೆಗಳು ಹೊಂದಿಕೆಯಾಗಿವೆ ಎಂದು ಪರಿಶೀಲಿಸಿ (ಕೆಲವು ವ್ಯವಸ್ಥೆಗಳಲ್ಲಿ ಕೇಸ್-ಸೆನ್ಸಿಟಿವ್)
## ಡೇಟಾ ಮತ್ತು ಫೈಲ್ ಸಮಸ್ಯೆಗಳು
### ಫೈಲ್ ಕಂಡುಬರದ ದೋಷಗಳು
**ಸಮಸ್ಯೆ:** ಡೇಟಾ ಲೋಡ್ ಮಾಡುವಾಗ `FileNotFoundError`
**ಪರಿಹಾರ:**
```python
import os
# ಪ್ರಸ್ತುತ ಕಾರ್ಯನಿರ್ವಹಣಾ ಡೈರೆಕ್ಟರಿಯನ್ನು ಪರಿಶೀಲಿಸಿ
print(os.getcwd())
# ಪೂರ್ಣ ಪಥವನ್ನು ಬಳಸಿ
data_path = os.path.join(os.getcwd(), 'data', 'filename.csv')
df = pd.read_csv(data_path)
# ಅಥವಾ ನೋಟ್ಬುಕ್ ಸ್ಥಳದಿಂದ ಸಂಬಂಧಿತ ಪಥವನ್ನು ಬಳಸಿ
df = pd.read_csv('../data/filename.csv')
# ಫೈಲ್ ಅಸ್ತಿತ್ವದಲ್ಲಿದೆಯೇ ಎಂದು ಪರಿಶೀಲಿಸಿ
print(os.path.exists('data/filename.csv'))
```
### CSV ಓದುವ ದೋಷಗಳು
**ಸಮಸ್ಯೆ:** CSV ಫೈಲ್‌ಗಳನ್ನು ಓದುವಾಗ ದೋಷಗಳು
**ಪರಿಹಾರ:**
```python
import pandas as pd
# ವಿಭಿನ್ನ ಎನ್‌ಕೋಡಿಂಗ್‌ಗಳನ್ನು ಪ್ರಯತ್ನಿಸಿ
df = pd.read_csv('file.csv', encoding='utf-8')
# ಅಥವಾ
df = pd.read_csv('file.csv', encoding='latin-1')
# ಅಥವಾ
df = pd.read_csv('file.csv', encoding='ISO-8859-1')
# ಕಾಣೆಯಾದ ಮೌಲ್ಯಗಳನ್ನು ನಿರ್ವಹಿಸಿ
df = pd.read_csv('file.csv', na_values=['NA', 'N/A', ''])
# ಕಾಮಾ ಅಲ್ಲದಿದ್ದರೆ ಡೆಲಿಮಿಟರ್ ಅನ್ನು ಸೂಚಿಸಿ
df = pd.read_csv('file.csv', delimiter=';')
```
### ದೊಡ್ಡ ಡೇಟಾಸೆಟ್‌ಗಳೊಂದಿಗೆ ಮೆಮೊರಿ ದೋಷಗಳು
**ಸಮಸ್ಯೆ:** ದೊಡ್ಡ ಫೈಲ್‌ಗಳನ್ನು ಲೋಡ್ ಮಾಡುವಾಗ `MemoryError`
**ಪರಿಹಾರ:**
```python
# ತುಂಡುಗಳಾಗಿ ಓದಿ
chunk_size = 10000
chunks = []
for chunk in pd.read_csv('large_file.csv', chunksize=chunk_size):
# ತುಂಡನ್ನು ಪ್ರಕ್ರಿಯೆಗೊಳಿಸಿ
chunks.append(chunk)
df = pd.concat(chunks)
# ಅಥವಾ ನಿರ್ದಿಷ್ಟ ಕಾಲಮ್‌ಗಳನ್ನು ಮಾತ್ರ ಓದಿ
df = pd.read_csv('file.csv', usecols=['col1', 'col2'])
# ಹೆಚ್ಚು ಪರಿಣಾಮಕಾರಿಯಾದ ಡೇಟಾ ಪ್ರಕಾರಗಳನ್ನು ಬಳಸಿ
df = pd.read_csv('file.csv', dtype={'column_name': 'int32'})
```
## ಕಾರ್ಯಕ್ಷಮತೆ ಸಮಸ್ಯೆಗಳು
### ನೋಟ್ಬುಕ್ ನಿಧಾನ ಕಾರ್ಯಕ್ಷಮತೆ
**ಸಮಸ್ಯೆ:** ನೋಟ್ಬುಕ್‌ಗಳು ಬಹಳ ನಿಧಾನವಾಗಿ ಕಾರ್ಯನಿರ್ವಹಿಸುತ್ತಿವೆ
**ಪರಿಹಾರ:**
1. **ಕರ್ಣಲ್ ಮರುಪ್ರಾರಂಭಿಸಿ ಮತ್ತು ಔಟ್‌ಪುಟ್ ತೆರವುಗೊಳಿಸಿ**
- Kernel → Restart & Clear Output
2. **ಬಳಸದ ನೋಟ್ಬುಕ್‌ಗಳನ್ನು ಮುಚ್ಚಿ**
3. **ಕೋಡ್ ಅನ್ನು ಆಪ್ಟಿಮೈಸ್ ಮಾಡಿ:**
```python
# ಲೂಪ್ಗಳ ಬದಲು ವೆಕ್ಟರೈಜ್ಡ್ ಕಾರ್ಯಾಚರಣೆಗಳನ್ನು ಬಳಸಿ
# ಕೆಟ್ಟದು:
result = []
for x in data:
result.append(x * 2)
# ಉತ್ತಮ:
result = data * 2 # ನಮ್‌ಪೈ/ಪಾಂಡಾಸ್ ವೆಕ್ಟರೈಜೆಷನ್
```
4. **ದೊಡ್ಡ ಡೇಟಾಸೆಟ್‌ಗಳ ಮಾದರಿಯನ್ನು ತೆಗೆದುಕೊಳ್ಳಿ:**
```python
# ಅಭಿವೃದ್ಧಿಯ ಸಮಯದಲ್ಲಿ ಮಾದರಿಯೊಂದಿಗೆ ಕೆಲಸ ಮಾಡಿ
df_sample = df.sample(n=1000) # ಅಥವಾ df.head(1000)
```
### ಬ್ರೌಸರ್ ಕ್ರ್ಯಾಶ್ ಆಗುವುದು
**ಸಮಸ್ಯೆ:** ಬ್ರೌಸರ್ ಕ್ರ್ಯಾಶ್ ಆಗುತ್ತದೆ ಅಥವಾ ಪ್ರತಿಕ್ರಿಯೆ ನೀಡುವುದಿಲ್ಲ
**ಪರಿಹಾರ:**
1. ಬಳಸದ ಟ್ಯಾಬ್‌ಗಳನ್ನು ಮುಚ್ಚಿ
2. ಬ್ರೌಸರ್ ಕ್ಯಾಶೆ ತೆರವುಗೊಳಿಸಿ
3. ಬ್ರೌಸರ್ ಮೆಮೊರಿ ಹೆಚ್ಚಿಸಿ (ಕ್ರೋಮ್: `chrome://settings/system`)
4. ಜುಪಿಟರ್‌ಲ್ಯಾಬ್ ಬಳಸಿ:
```bash
pip install jupyterlab
jupyter lab
```
## ಹೆಚ್ಚುವರಿ ಸಹಾಯ ಪಡೆಯುವುದು
### ಸಹಾಯ ಕೇಳುವ ಮೊದಲು
1. ಈ ಸಮಸ್ಯೆ ಪರಿಹಾರ ಮಾರ್ಗದರ್ಶಿಯನ್ನು ಪರಿಶೀಲಿಸಿ
2. [GitHub Issues](https://github.com/microsoft/Data-Science-For-Beginners/issues) ನಲ್ಲಿ ಹುಡುಕಿ
3. [INSTALLATION.md](INSTALLATION.md) ಮತ್ತು [USAGE.md](USAGE.md) ಪರಿಶೀಲಿಸಿ
4. ದೋಷ ಸಂದೇಶವನ್ನು ಆನ್‌ಲೈನ್‌ನಲ್ಲಿ ಹುಡುಕಿ
### ಸಹಾಯ ಕೇಳುವುದು ಹೇಗೆ
ಸಮಸ್ಯೆ ಸೃಷ್ಟಿಸುವಾಗ ಅಥವಾ ಸಹಾಯ ಕೇಳುವಾಗ, ಈ ಮಾಹಿತಿಯನ್ನು ಸೇರಿಸಿ:
1. **ಆಪರೇಟಿಂಗ್ ಸಿಸ್ಟಮ್**: ವಿಂಡೋಸ್, ಮ್ಯಾಕ್‌ಒಎಸ್ ಅಥವಾ ಲಿನಕ್ಸ್ (ಯಾವ ಡಿಸ್ಟ್ರಿಬ್ಯೂಷನ್)
2. **ಪೈಥಾನ್ ಆವೃತ್ತಿ**: `python --version` ಅನ್ನು ರನ್ ಮಾಡಿ
3. **ದೋಷ ಸಂದೇಶ**: ಸಂಪೂರ್ಣ ದೋಷ ಸಂದೇಶವನ್ನು ನಕಲಿಸಿ
4. **ಪುನರಾವರ್ತಿಸುವ ಹಂತಗಳು**: ದೋಷ ಸಂಭವಿಸುವ ಮೊದಲು ನೀವು ಏನು ಮಾಡಿದ್ದೀರಿ
5. **ನೀವು ಪ್ರಯತ್ನಿಸಿದವು**: ನೀವು ಈಗಾಗಲೇ ಪ್ರಯತ್ನಿಸಿದ ಪರಿಹಾರಗಳು
**ಉದಾಹರಣೆ:**
```
**Operating System:** macOS 12.0
**Python Version:** 3.9.7
**Error Message:** ModuleNotFoundError: No module named 'pandas'
**Steps to Reproduce:**
1. Activated virtual environment
2. Started Jupyter notebook
3. Tried to import pandas
**What I've Tried:**
- Ran pip install pandas
- Restarted Jupyter
```
### ಸಮುದಾಯ ಸಂಪನ್ಮೂಲಗಳು
- **GitHub Issues**: [ಸಮಸ್ಯೆ ಸೃಷ್ಟಿಸಿ](https://github.com/microsoft/Data-Science-For-Beginners/issues/new)
- **Discord**: [ನಮ್ಮ ಸಮುದಾಯದಲ್ಲಿ ಸೇರಿ](https://aka.ms/ds4beginners/discord)
- **ಚರ್ಚೆಗಳು**: [GitHub Discussions](https://github.com/microsoft/Data-Science-For-Beginners/discussions)
- **Microsoft Learn**: [ಪ್ರಶ್ನೋತ್ತರ ವೇದಿಕೆಗಳು](https://docs.microsoft.com/answers/)
### ಸಂಬಂಧಿತ ಡಾಕ್ಯುಮೆಂಟೇಶನ್
- [INSTALLATION.md](INSTALLATION.md) - ಸ್ಥಾಪನೆ ಸೂಚನೆಗಳು
- [USAGE.md](USAGE.md) - ಪಠ್ಯಕ್ರಮವನ್ನು ಹೇಗೆ ಬಳಸುವುದು
- [CONTRIBUTING.md](CONTRIBUTING.md) - ಹೇಗೆ ಕೊಡುಗೆ ನೀಡುವುದು
- [README.md](README.md) - ಯೋಜನೆಯ ಅವಲೋಕನ
---
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
**ಅಸ್ವೀಕರಣ**:
ಈ ದಸ್ತಾವೇಜು AI ಅನುವಾದ ಸೇವೆ [Co-op Translator](https://github.com/Azure/co-op-translator) ಬಳಸಿ ಅನುವಾದಿಸಲಾಗಿದೆ. ನಾವು ನಿಖರತೆಯಿಗಾಗಿ ಪ್ರಯತ್ನಿಸುತ್ತಿದ್ದರೂ, ಸ್ವಯಂಚಾಲಿತ ಅನುವಾದಗಳಲ್ಲಿ ದೋಷಗಳು ಅಥವಾ ಅಸತ್ಯತೆಗಳು ಇರಬಹುದು ಎಂದು ದಯವಿಟ್ಟು ಗಮನಿಸಿ. ಮೂಲ ಭಾಷೆಯಲ್ಲಿರುವ ಮೂಲ ದಸ್ತಾವೇಜನ್ನು ಅಧಿಕೃತ ಮೂಲವೆಂದು ಪರಿಗಣಿಸಬೇಕು. ಮಹತ್ವದ ಮಾಹಿತಿಗಾಗಿ, ವೃತ್ತಿಪರ ಮಾನವ ಅನುವಾದವನ್ನು ಶಿಫಾರಸು ಮಾಡಲಾಗುತ್ತದೆ. ಈ ಅನುವಾದ ಬಳಕೆಯಿಂದ ಉಂಟಾಗುವ ಯಾವುದೇ ತಪ್ಪು ಅರ್ಥಮಾಡಿಕೊಳ್ಳುವಿಕೆ ಅಥವಾ ತಪ್ಪು ವಿವರಣೆಗಳಿಗೆ ನಾವು ಹೊಣೆಗಾರರಾಗುವುದಿಲ್ಲ.
<!-- CO-OP TRANSLATOR DISCLAIMER END -->

@ -0,0 +1,376 @@
<!--
CO_OP_TRANSLATOR_METADATA:
{
"original_hash": "f546349678757508d69ce9e1d2688446",
"translation_date": "2025-12-19T12:47:17+00:00",
"source_file": "USAGE.md",
"language_code": "kn"
}
-->
# ಬಳಕೆ ಮಾರ್ಗದರ್ಶಿ
ಈ ಮಾರ್ಗದರ್ಶಿ ಡೇಟಾ ಸೈನ್ಸ್ ಫಾರ್ ಬಿಗಿನರ್ಸ್ ಪಠ್ಯಕ್ರಮವನ್ನು ಬಳಸಲು ಉದಾಹರಣೆಗಳು ಮತ್ತು ಸಾಮಾನ್ಯ ಕಾರ್ಯಪ್ರವಾಹಗಳನ್ನು ಒದಗಿಸುತ್ತದೆ.
## ವಿಷಯಗಳ ಪಟ್ಟಿಕೆ
- [ಈ ಪಠ್ಯಕ್ರಮವನ್ನು ಹೇಗೆ ಬಳಸುವುದು](../..)
- [ಪಾಠಗಳೊಂದಿಗೆ ಕೆಲಸ ಮಾಡುವುದು](../..)
- [ಜುಪೈಟರ್ ನೋಟ್ಬುಕ್‌ಗಳೊಂದಿಗೆ ಕೆಲಸ ಮಾಡುವುದು](../..)
- [ಕ್ವಿಜ್ ಅಪ್ಲಿಕೇಶನ್ ಬಳಕೆ](../..)
- [ಸಾಮಾನ್ಯ ಕಾರ್ಯಪ್ರವಾಹಗಳು](../..)
- [ಸ್ವಯಂ ಅಧ್ಯಯನಕ್ಕಾಗಿ ಸಲಹೆಗಳು](../..)
- [ಶಿಕ್ಷಕರಿಗಾಗಿ ಸಲಹೆಗಳು](../..)
## ಈ ಪಠ್ಯಕ್ರಮವನ್ನು ಹೇಗೆ ಬಳಸುವುದು
ಈ ಪಠ್ಯಕ್ರಮವು ಲವಚಿಕವಾಗಿದ್ದು, ವಿವಿಧ ರೀತಿಯಲ್ಲಿ ಬಳಸಬಹುದು:
- **ಸ್ವಯಂ-ಗತಿಯ ಅಧ್ಯಯನ**: ನಿಮ್ಮ ಸ್ವಂತ ವೇಗದಲ್ಲಿ ಪಾಠಗಳನ್ನು ಸ್ವತಂತ್ರವಾಗಿ ಮಾಡಿ
- **ತರಗತಿ ಬೋಧನೆ**: ಮಾರ್ಗದರ್ಶಿತ ಬೋಧನೆಯೊಂದಿಗೆ ರಚಿಸಲಾದ ಕೋರ್ಸ್ ಆಗಿ ಬಳಸಿ
- **ಅಧ್ಯಯನ ಗುಂಪುಗಳು**: ಸಹಪಾಠಿಗಳೊಂದಿಗೆ ಸಹಕಾರದಿಂದ ಕಲಿಯಿರಿ
- **ಕಾರ್ಖಾನೆ ರೂಪ**: ತೀವ್ರ ಸ್ವಲ್ಪಕಾಲಿಕ ಅಧ್ಯಯನ ಸೆಷನ್‌ಗಳು
## ಪಾಠಗಳೊಂದಿಗೆ ಕೆಲಸ ಮಾಡುವುದು
ಪ್ರತಿ ಪಾಠವು ಕಲಿಕೆಯನ್ನು ಗರಿಷ್ಠಗೊಳಿಸಲು ಸತತ ರಚನೆಯನ್ನು ಅನುಸರಿಸುತ್ತದೆ:
### ಪಾಠ ರಚನೆ
1. **ಪೂರ್ವ ಪಾಠ ಕ್ವಿಜ್**: ನಿಮ್ಮ ಇತ್ತೀಚಿನ ಜ್ಞಾನವನ್ನು ಪರೀಕ್ಷಿಸಿ
2. **ಸ್ಕೆಚ್‌ನೋಟ್** (ಐಚ್ಛಿಕ): ಪ್ರಮುಖ ತತ್ವಗಳ ದೃಶ್ಯ ಸಾರಾಂಶ
3. **ವೀಡಿಯೊ** (ಐಚ್ಛಿಕ): ಪೂರಕ ವೀಡಿಯೊ ವಿಷಯ
4. **ಲೇಖಿತ ಪಾಠ**: ಮೂಲ ತತ್ವಗಳು ಮತ್ತು ವಿವರಣೆಗಳು
5. **ಜುಪೈಟರ್ ನೋಟ್ಬುಕ್**: ಕೈಯಿಂದ ಕೋಡಿಂಗ್ ಅಭ್ಯಾಸಗಳು
6. **ಕಾರ್ಯನಿರ್ವಹಣೆ**: ನೀವು ಕಲಿತದ್ದನ್ನು ಅಭ್ಯಾಸ ಮಾಡಿ
7. **ಪೋಸ್ಟ್-ಪಾಠ ಕ್ವಿಜ್**: ನಿಮ್ಮ ಅರ್ಥವನ್ನು ಬಲಪಡಿಸಿ
### ಪಾಠದ ಉದಾಹರಣಾ ಕಾರ್ಯಪ್ರವಾಹ
```bash
# 1. ಪಾಠ ಡೈರೆಕ್ಟರಿಗೆ ನಾವಿಗೇಟ್ ಮಾಡಿ
cd 1-Introduction/01-defining-data-science
# 2. README.md ಓದಿ
# README.md ಅನ್ನು ನಿಮ್ಮ ಬ್ರೌಸರ್ ಅಥವಾ ಸಂಪಾದಕದಲ್ಲಿ ತೆರೆಯಿರಿ
# 3. ಪೂರ್ವ-ಪಾಠ ಕ್ವಿಜ್ ತೆಗೆದುಕೊಳ್ಳಿ
# README ನಲ್ಲಿ ಕ್ವಿಜ್ ಲಿಂಕ್ ಕ್ಲಿಕ್ ಮಾಡಿ
# 4. ಜುಪೈಟರ್ ನೋಟ್ಬುಕ್ ತೆರೆಯಿರಿ (ಲಭ್ಯವಿದ್ದರೆ)
jupyter notebook
# 5. ನೋಟ್ಬುಕ್‌ನ ವ್ಯಾಯಾಮಗಳನ್ನು ಪೂರ್ಣಗೊಳಿಸಿ
# 6. ನಿಯೋಜನೆ ಮೇಲೆ ಕೆಲಸ ಮಾಡಿ
# 7. ಪಾಠದ ನಂತರದ ಕ್ವಿಜ್ ತೆಗೆದುಕೊಳ್ಳಿ
```
## ಜುಪೈಟರ್ ನೋಟ್ಬುಕ್‌ಗಳೊಂದಿಗೆ ಕೆಲಸ ಮಾಡುವುದು
### ಜುಪೈಟರ್ ಪ್ರಾರಂಭಿಸುವುದು
```bash
# ನಿಮ್ಮ ವರ್ಚುವಲ್ ಪರಿಸರವನ್ನು ಸಕ್ರಿಯಗೊಳಿಸಿ
source venv/bin/activate # macOS/Linux ನಲ್ಲಿ
# ಅಥವಾ
venv\Scripts\activate # Windows ನಲ್ಲಿ
# ರೆಪೊಸಿಟರಿ ರೂಟ್‌ನಿಂದ Jupyter ಪ್ರಾರಂಭಿಸಿ
jupyter notebook
```
### ನೋಟ್ಬುಕ್ ಸೆಲ್‌ಗಳನ್ನು ಚಾಲನೆ ಮಾಡುವುದು
1. **ಸೆಲ್ ಅನ್ನು ಕಾರ್ಯಗತಗೊಳಿಸಿ**: `Shift + Enter` ಒತ್ತಿ ಅಥವಾ "Run" ಬಟನ್ ಕ್ಲಿಕ್ ಮಾಡಿ
2. **ಎಲ್ಲಾ ಸೆಲ್‌ಗಳನ್ನು ಕಾರ್ಯಗತಗೊಳಿಸಿ**: ಮೆನುದಿಂದ "Cell" → "Run All" ಆಯ್ಕೆಮಾಡಿ
3. **ಕರ್ಣಲ್ ಮರುಪ್ರಾರಂಭಿಸಿ**: ಸಮಸ್ಯೆ ಎದುರಾದರೆ "Kernel" → "Restart" ಆಯ್ಕೆಮಾಡಿ
### ಉದಾಹರಣೆ: ನೋಟ್ಬುಕ್‌ನಲ್ಲಿ ಡೇಟಾ ಜೊತೆ ಕೆಲಸ ಮಾಡುವುದು
```python
# ಅಗತ್ಯ ಲೈಬ್ರರಿಗಳನ್ನು ಆಮದುಮಾಡಿ
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
# ಡೇಟಾಸೆಟ್ ಅನ್ನು ಲೋಡ್ ಮಾಡಿ
df = pd.read_csv('data/sample.csv')
# ಡೇಟಾವನ್ನು ಅನ್ವೇಷಿಸಿ
df.head()
df.info()
df.describe()
# ದೃಶ್ಯೀಕರಣವನ್ನು ರಚಿಸಿ
plt.figure(figsize=(10, 6))
plt.plot(df['column_name'])
plt.title('Sample Visualization')
plt.xlabel('X-axis Label')
plt.ylabel('Y-axis Label')
plt.show()
```
### ನಿಮ್ಮ ಕೆಲಸವನ್ನು ಉಳಿಸುವುದು
- ಜುಪೈಟರ್ ಸ್ವಯಂಚಾಲಿತವಾಗಿ ಅವಧಿ ಅವಧಿಗೆ ಉಳಿಸುತ್ತದೆ
- ಕೈಯಿಂದ ಉಳಿಸುವುದು: `Ctrl + S` (ಅಥವಾ macOS ನಲ್ಲಿ `Cmd + S`) ಒತ್ತಿ
- ನಿಮ್ಮ ಪ್ರಗತಿ `.ipynb` ಫೈಲ್‌ನಲ್ಲಿ ಉಳಿಯುತ್ತದೆ
## ಕ್ವಿಜ್ ಅಪ್ಲಿಕೇಶನ್ ಬಳಕೆ
### ಕ್ವಿಜ್ ಅಪ್ಲಿಕೇಶನ್ ಅನ್ನು ಸ್ಥಳೀಯವಾಗಿ ಚಾಲನೆ ಮಾಡುವುದು
```bash
# ಕ್ವಿಜ್ ಅಪ್ಲಿಕೇಶನ್ ಡೈರೆಕ್ಟರಿಗೆ ನಾವಿಗೇಟ್ ಮಾಡಿ
cd quiz-app
# ಡೆವಲಪ್‌ಮೆಂಟ್ ಸರ್ವರ್ ಪ್ರಾರಂಭಿಸಿ
npm run serve
# http://localhost:8080 ನಲ್ಲಿ ಪ್ರವೇಶಿಸಿ
```
### ಕ್ವಿಜ್‌ಗಳನ್ನು ತೆಗೆದುಕೊಳ್ಳುವುದು
1. ಪೂರ್ವ ಪಾಠ ಕ್ವಿಜ್‌ಗಳು ಪ್ರತಿ ಪಾಠದ ಮೇಲ್ಭಾಗದಲ್ಲಿ ಲಿಂಕ್ ಮಾಡಲ್ಪಟ್ಟಿವೆ
2. ಪೋಸ್ಟ್-ಪಾಠ ಕ್ವಿಜ್‌ಗಳು ಪ್ರತಿ ಪಾಠದ ಕೆಳಭಾಗದಲ್ಲಿ ಲಿಂಕ್ ಮಾಡಲ್ಪಟ್ಟಿವೆ
3. ಪ್ರತಿ ಕ್ವಿಜ್‌ಗೆ 3 ಪ್ರಶ್ನೆಗಳಿವೆ
4. ಕ್ವಿಜ್‌ಗಳು ಕಲಿಕೆಯನ್ನು ಬಲಪಡಿಸಲು ವಿನ್ಯಾಸಗೊಳಿಸಲಾಗಿದೆ, ಸಂಪೂರ್ಣ ಪರೀಕ್ಷೆಗಾಗಿ ಅಲ್ಲ
### ಕ್ವಿಜ್ ಸಂಖ್ಯೆಕರಣ
- ಕ್ವಿಜ್‌ಗಳು 0-39 (ಒಟ್ಟು 40 ಕ್ವಿಜ್‌ಗಳು) ಸಂಖ್ಯೆಯಾಗಿದೆ
- ಪ್ರತಿ ಪಾಠದಲ್ಲಿ ಸಾಮಾನ್ಯವಾಗಿ ಪೂರ್ವ ಮತ್ತು ಪೋಸ್ಟ್ ಕ್ವಿಜ್ ಇರುತ್ತದೆ
- ಕ್ವಿಜ್ URL ಗಳು ಕ್ವಿಜ್ ಸಂಖ್ಯೆಯನ್ನು ಒಳಗೊಂಡಿವೆ: `https://ff-quizzes.netlify.app/en/ds/quiz/0`
## ಸಾಮಾನ್ಯ ಕಾರ್ಯಪ್ರವಾಹಗಳು
### ಕಾರ್ಯಪ್ರವಾಹ 1: ಸಂಪೂರ್ಣ ಪ್ರಾರಂಭಿಕ ಮಾರ್ಗ
```bash
# 1. ನಿಮ್ಮ ಪರಿಸರವನ್ನು ಸೆಟ್ ಅಪ್ ಮಾಡಿ (INSTALLATION.md ನೋಡಿ)
# 2. ಪಾಠ 1 ರಿಂದ ಪ್ರಾರಂಭಿಸಿ
cd 1-Introduction/01-defining-data-science
# 3. ಪ್ರತಿ ಪಾಠಕ್ಕೆ:
# - ಪಾಠದ ಮುಂಚಿನ ಕ್ವಿಜ್ ತೆಗೆದುಕೊಳ್ಳಿ
# - ಪಾಠದ ವಿಷಯವನ್ನು ಓದಿ
# - ನೋಟ್ಬುಕ್ ಮೂಲಕ ಕೆಲಸ ಮಾಡಿ
# - ನಿಯೋಜನೆಯನ್ನು ಪೂರ್ಣಗೊಳಿಸಿ
# - ಪಾಠದ ನಂತರದ ಕ್ವಿಜ್ ತೆಗೆದುಕೊಳ್ಳಿ
# 4. ಎಲ್ಲಾ 20 ಪಾಠಗಳನ್ನು ಕ್ರಮವಾಗಿ ಮುಂದುವರಿಸಿ
```
### ಕಾರ್ಯಪ್ರವಾಹ 2: ವಿಷಯ-ನಿರ್ದಿಷ್ಟ ಅಧ್ಯಯನ
ನೀವು ನಿರ್ದಿಷ್ಟ ವಿಷಯದಲ್ಲಿ ಆಸಕ್ತಿ ಹೊಂದಿದ್ದರೆ:
```bash
# ಉದಾಹರಣೆ: ಡೇಟಾ ದೃಶ್ಯೀಕರಣದ ಮೇಲೆ ಗಮನಹರಿಸಿ
cd 3-Data-Visualization
# ಪಾಠಗಳು 9-13 ಅನ್ನು ಅನ್ವೇಷಿಸಿ:
# - ಪಾಠ 9: ಪ್ರಮಾಣಗಳನ್ನು ದೃಶ್ಯೀಕರಿಸುವುದು
# - ಪಾಠ 10: ವಿತರಣೆಗಳನ್ನು ದೃಶ್ಯೀಕರಿಸುವುದು
# - ಪಾಠ 11: ಅನುಪಾತಗಳನ್ನು ದೃಶ್ಯೀಕರಿಸುವುದು
# - ಪಾಠ 12: ಸಂಬಂಧಗಳನ್ನು ದೃಶ್ಯೀಕರಿಸುವುದು
# - ಪಾಠ 13: ಅರ್ಥಪೂರ್ಣ ದೃಶ್ಯೀಕರಣಗಳು
```
### ಕಾರ್ಯಪ್ರವಾಹ 3: ಯೋಜನೆ ಆಧಾರಿತ ಅಧ್ಯಯನ
```bash
# 1. ಡೇಟಾ ಸೈನ್ಸ್ ಲೈಫ್ಸೈಕಲ್ ಪಾಠಗಳನ್ನು ಪರಿಶೀಲಿಸಿ (14-16)
cd 4-Data-Science-Lifecycle
# 2. ನೈಜ ಜಗತ್ತಿನ ಉದಾಹರಣೆಯನ್ನು ಕಾರ್ಯಗತಗೊಳಿಸಿ (ಪಾಠ 20)
cd ../6-Data-Science-In-Wild/20-Real-World-Examples
# 3. ನಿಮ್ಮ ಸ್ವಂತ ಯೋಜನೆಗೆ ತತ್ವಗಳನ್ನು ಅನ್ವಯಿಸಿ
```
### ಕಾರ್ಯಪ್ರವಾಹ 4: ಕ್ಲೌಡ್ ಆಧಾರಿತ ಡೇಟಾ ಸೈನ್ಸ್
```bash
# ಕ್ಲೌಡ್ ಡೇಟಾ ಸೈನ್ಸ್ ಬಗ್ಗೆ ತಿಳಿದುಕೊಳ್ಳಿ (ಪಾಠಗಳು 17-19)
cd 5-Data-Science-In-Cloud
# 17: ಕ್ಲೌಡ್ ಡೇಟಾ ಸೈನ್ಸ್ ಪರಿಚಯ
# 18: ಕಡಿಮೆ-ಕೋಡ್ ಎಂಎಲ್ ಉಪಕರಣಗಳು
# 19: ಅಜೂರ್ ಮೆಷಿನ್ ಲರ್ನಿಂಗ್ ಸ್ಟುಡಿಯೋ
```
## ಸ್ವಯಂ ಅಧ್ಯಯನಕ್ಕಾಗಿ ಸಲಹೆಗಳು
### ಸಂಘಟಿತವಾಗಿರಿ
```bash
# ಕಲಿಕೆಯ ದಿನಚರಿಯನ್ನು ರಚಿಸಿ
mkdir my-learning-journal
# ಪ್ರತಿ ಪಾಠಕ್ಕೆ, ಟಿಪ್ಪಣಿಗಳನ್ನು ರಚಿಸಿ
echo "# Lesson 1 Notes" > my-learning-journal/lesson-01-notes.md
```
### ನಿಯಮಿತ ಅಭ್ಯಾಸ ಮಾಡಿ
- ಪ್ರತಿದಿನ ಅಥವಾ ವಾರಕ್ಕೆ ನಿಗದಿತ ಸಮಯ ಮೀಸಲಿಡಿ
- ವಾರಕ್ಕೆ ಕನಿಷ್ಠ ಒಂದು ಪಾಠವನ್ನು ಪೂರ್ಣಗೊಳಿಸಿ
- ಹಿಂದಿನ ಪಾಠಗಳನ್ನು ನಿಯಮಿತವಾಗಿ ಪರಿಶೀಲಿಸಿ
### ಸಮುದಾಯದೊಂದಿಗೆ ಸಂವಹನ ಮಾಡಿ
- [Discord ಸಮುದಾಯ](https://aka.ms/ds4beginners/discord) ಸೇರಿ
- Discord ನಲ್ಲಿ #Data-Science-for-Beginners ಚಾನೆಲ್‌ನಲ್ಲಿ ಭಾಗವಹಿಸಿ [Discord ಚರ್ಚೆಗಳು](https://aka.ms/ds4beginners/discord)
- ನಿಮ್ಮ ಪ್ರಗತಿಯನ್ನು ಹಂಚಿಕೊಳ್ಳಿ ಮತ್ತು ಪ್ರಶ್ನೆಗಳನ್ನು ಕೇಳಿ
### ನಿಮ್ಮ ಸ್ವಂತ ಯೋಜನೆಗಳನ್ನು ನಿರ್ಮಿಸಿ
ಪಾಠಗಳನ್ನು ಪೂರ್ಣಗೊಳಿಸಿದ ನಂತರ, ತತ್ವಗಳನ್ನು ವೈಯಕ್ತಿಕ ಯೋಜನೆಗಳಿಗೆ ಅನ್ವಯಿಸಿ:
```python
# ಉದಾಹರಣೆ: ನಿಮ್ಮ ಸ್ವಂತ ಡೇಟಾಸೆಟ್ ಅನ್ನು ವಿಶ್ಲೇಷಿಸಿ
import pandas as pd
# ನಿಮ್ಮ ಸ್ವಂತ ಡೇಟಾವನ್ನು ಲೋಡ್ ಮಾಡಿ
my_data = pd.read_csv('my-project/data.csv')
# ಕಲಿತ ತಂತ್ರಗಳನ್ನು ಅನ್ವಯಿಸಿ
# - ಡೇಟಾ ಶುದ್ಧೀಕರಣ (ಪಾಠ 8)
# - ಅನ್ವೇಷಣಾತ್ಮಕ ಡೇಟಾ ವಿಶ್ಲೇಷಣೆ (ಪಾಠ 7)
# - ದೃಶ್ಯೀಕರಣ (ಪಾಠಗಳು 9-13)
# - ವಿಶ್ಲೇಷಣೆ (ಪಾಠ 15)
```
## ಶಿಕ್ಷಕರಿಗಾಗಿ ಸಲಹೆಗಳು
### ತರಗತಿ ವ್ಯವಸ್ಥೆ
1. ವಿವರವಾದ ಮಾರ್ಗದರ್ಶನಕ್ಕಾಗಿ [for-teachers.md](for-teachers.md) ಪರಿಶೀಲಿಸಿ
2. ಹಂಚಿಕೊಂಡ ಪರಿಸರವನ್ನು ಸ್ಥಾಪಿಸಿ (GitHub Classroom ಅಥವಾ Codespaces)
3. ಸಂವಹನ ಚಾನೆಲ್ ಸ್ಥಾಪಿಸಿ (Discord, Slack, ಅಥವಾ Teams)
### ಪಾಠ ಯೋಜನೆ
**ಸೂಚಿತ 10-ವಾರಗಳ ವೇಳಾಪಟ್ಟಿ:**
- **ವಾರ 1-2**: ಪರಿಚಯ (ಪಾಠಗಳು 1-4)
- **ವಾರ 3-4**: ಡೇಟಾ ಜೊತೆ ಕೆಲಸ (ಪಾಠಗಳು 5-8)
- **ವಾರ 5-6**: ಡೇಟಾ ದೃಶ್ಯೀಕರಣ (ಪಾಠಗಳು 9-13)
- **ವಾರ 7-8**: ಡೇಟಾ ಸೈನ್ಸ್ ಜೀವನಚಕ್ರ (ಪಾಠಗಳು 14-16)
- **ವಾರ 9**: ಕ್ಲೌಡ್ ಡೇಟಾ ಸೈನ್ಸ್ (ಪಾಠಗಳು 17-19)
- **ವಾರ 10**: ವಾಸ್ತವಿಕ ಅನ್ವಯಿಕೆಗಳು ಮತ್ತು ಅಂತಿಮ ಯೋಜನೆಗಳು (ಪಾಠ 20)
### ಆಫ್‌ಲೈನ್ ಪ್ರವೇಶಕ್ಕಾಗಿ Docsify ಚಾಲನೆ
```bash
# ತರಗತಿ ಬಳಕೆಗೆ ಸ್ಥಳೀಯವಾಗಿ ಡಾಕ್ಯುಮೆಂಟೇಶನ್ ಸೇವೆ ನೀಡುವುದು
docsify serve
# ವಿದ್ಯಾರ್ಥಿಗಳು localhost:3000 ನಲ್ಲಿ ಪ್ರವೇಶಿಸಬಹುದು
# ಪ್ರಾಥಮಿಕ ಸೆಟಪ್ ನಂತರ ಇಂಟರ್ನೆಟ್ ಅಗತ್ಯವಿಲ್ಲ
```
### ಕಾರ್ಯನಿರ್ವಹಣೆ ಮೌಲ್ಯಮಾಪನ
- ಪೂರ್ಣಗೊಂಡ ಅಭ್ಯಾಸಗಳಿಗಾಗಿ ವಿದ್ಯಾರ್ಥಿಗಳ ನೋಟ್ಬುಕ್‌ಗಳನ್ನು ಪರಿಶೀಲಿಸಿ
- ಕ್ವಿಜ್ ಅಂಕಗಳ ಮೂಲಕ ಅರ್ಥಮಾಡಿಕೊಳ್ಳುವಿಕೆಯನ್ನು ಪರಿಶೀಲಿಸಿ
- ಡೇಟಾ ಸೈನ್ಸ್ ಜೀವನಚಕ್ರ ತತ್ವಗಳನ್ನು ಬಳಸಿ ಅಂತಿಮ ಯೋಜನೆಗಳನ್ನು ಮೌಲ್ಯಮಾಪನ ಮಾಡಿ
### ಕಾರ್ಯನಿರ್ವಹಣೆ ರಚನೆ
```python
# ಉದಾಹರಣೆಯ ಕಸ್ಟಮ್ ನಿಯೋಜನೆ ಟೆಂಪ್ಲೇಟು
"""
Assignment: [Topic]
Objective: [Learning goal]
Dataset: [Provide or have students find one]
Tasks:
1. Load and explore the dataset
2. Clean and prepare the data
3. Create at least 3 visualizations
4. Perform analysis
5. Communicate findings
Deliverables:
- Jupyter notebook with code and explanations
- Written summary of findings
"""
```
## ಆಫ್‌ಲೈನ್‌ನಲ್ಲಿ ಕೆಲಸ ಮಾಡುವುದು
### ಸಂಪನ್ಮೂಲಗಳನ್ನು ಡೌನ್‌ಲೋಡ್ ಮಾಡಿ
```bash
# ಸಂಪೂರ್ಣ ರೆಪೊಸಿಟರಿಯನ್ನು ಕ್ಲೋನ್ ಮಾಡಿ
git clone https://github.com/microsoft/Data-Science-For-Beginners.git
# ಡೇಟಾಸೆಟ್‌ಗಳನ್ನು ಮುಂಚಿತವಾಗಿ ಡೌನ್‌ಲೋಡ್ ಮಾಡಿ
# ಹೆಚ್ಚಿನ ಡೇಟಾಸೆಟ್‌ಗಳು ರೆಪೊಸಿಟರಿಯಲ್ಲಿ ಸೇರಿಸಲಾಗಿದೆ
```
### ಡಾಕ್ಯುಮೆಂಟೇಶನ್ ಅನ್ನು ಸ್ಥಳೀಯವಾಗಿ ಚಾಲನೆ ಮಾಡಿ
```bash
# ಡಾಕ್ಸಿಫಿಯೊಂದಿಗೆ ಸೇವೆ ನೀಡಿ
docsify serve
# localhost:3000 ನಲ್ಲಿ ಪ್ರವೇಶಿಸಿ
```
### ಕ್ವಿಜ್ ಅಪ್ಲಿಕೇಶನ್ ಅನ್ನು ಸ್ಥಳೀಯವಾಗಿ ಚಾಲನೆ ಮಾಡಿ
```bash
cd quiz-app
npm run serve
```
## ಅನುವಾದಿತ ವಿಷಯಗಳಿಗೆ ಪ್ರವೇಶ
40+ ಭಾಷೆಗಳಲ್ಲಿ ಅನುವಾದಗಳು ಲಭ್ಯವಿವೆ:
```bash
# ಅನುವಾದಿತ ಪಾಠಗಳನ್ನು ಪ್ರವೇಶಿಸಿ
cd translations/fr # ಫ್ರೆಂಚ್
cd translations/es # ಸ್ಪ್ಯಾನಿಷ್
cd translations/de # ಜರ್ಮನ್
# ... ಮತ್ತು ಇನ್ನೂ ಅನೇಕ
```
ಪ್ರತಿ ಅನುವಾದವು ಇಂಗ್ಲಿಷ್ ಆವೃತ್ತಿಯಂತೆ ಅದೇ ರಚನೆಯನ್ನು ಕಾಯ್ದುಕೊಳ್ಳುತ್ತದೆ.
## ಹೆಚ್ಚುವರಿ ಸಂಪನ್ಮೂಲಗಳು
### ಅಧ್ಯಯನ ಮುಂದುವರಿಸಿ
- [Microsoft Learn](https://docs.microsoft.com/learn/) - ಹೆಚ್ಚುವರಿ ಅಧ್ಯಯನ ಮಾರ್ಗಗಳು
- [ವಿದ್ಯಾರ್ಥಿ ಹಬ್](https://docs.microsoft.com/learn/student-hub) - ವಿದ್ಯಾರ್ಥಿಗಳಿಗಾಗಿ ಸಂಪನ್ಮೂಲಗಳು
- [Azure AI Foundry](https://aka.ms/foundry/forum) - ಸಮುದಾಯ ವೇದಿಕೆ
### ಸಂಬಂಧಿತ ಪಠ್ಯಕ್ರಮಗಳು
- [ಬಿಗಿನರ್ಸ್‌ಗಾಗಿ AI](https://aka.ms/ai-beginners)
- [ಬಿಗಿನರ್ಸ್‌ಗಾಗಿ ML](https://aka.ms/ml-beginners)
- [ಬಿಗಿನರ್ಸ್‌ಗಾಗಿ ವೆಬ್ ಡೆವ್](https://aka.ms/webdev-beginners)
- [ಬಿಗಿನರ್ಸ್‌ಗಾಗಿ ಜನರೇಟಿವ್ AI](https://aka.ms/genai-beginners)
## ಸಹಾಯ ಪಡೆಯುವುದು
- ಸಾಮಾನ್ಯ ಸಮಸ್ಯೆಗಳಿಗಾಗಿ [TROUBLESHOOTING.md](TROUBLESHOOTING.md) ಪರಿಶೀಲಿಸಿ
- [GitHub Issues](https://github.com/microsoft/Data-Science-For-Beginners/issues) ನಲ್ಲಿ ಹುಡುಕಿ
- ನಮ್ಮ [Discord](https://aka.ms/ds4beginners/discord) ಸೇರಿ
- ಸಮಸ್ಯೆಗಳನ್ನು ವರದಿ ಮಾಡಲು ಅಥವಾ ಕೊಡುಗೆ ನೀಡಲು [CONTRIBUTING.md](CONTRIBUTING.md) ಪರಿಶೀಲಿಸಿ
---
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
**ಅಸ್ವೀಕರಣ**:
ಈ ದಸ್ತಾವೇಜು AI ಅನುವಾದ ಸೇವೆ [Co-op Translator](https://github.com/Azure/co-op-translator) ಬಳಸಿ ಅನುವಾದಿಸಲಾಗಿದೆ. ನಾವು ನಿಖರತೆಯಿಗಾಗಿ ಪ್ರಯತ್ನಿಸುತ್ತಿದ್ದರೂ, ಸ್ವಯಂಚಾಲಿತ ಅನುವಾದಗಳಲ್ಲಿ ದೋಷಗಳು ಅಥವಾ ತಪ್ಪುಗಳು ಇರಬಹುದು ಎಂದು ದಯವಿಟ್ಟು ಗಮನಿಸಿ. ಮೂಲ ಭಾಷೆಯಲ್ಲಿರುವ ಮೂಲ ದಸ್ತಾವೇಜನ್ನು ಅಧಿಕೃತ ಮೂಲವೆಂದು ಪರಿಗಣಿಸಬೇಕು. ಮಹತ್ವದ ಮಾಹಿತಿಗಾಗಿ, ವೃತ್ತಿಪರ ಮಾನವ ಅನುವಾದವನ್ನು ಶಿಫಾರಸು ಮಾಡಲಾಗುತ್ತದೆ. ಈ ಅನುವಾದ ಬಳಕೆಯಿಂದ ಉಂಟಾಗುವ ಯಾವುದೇ ತಪ್ಪು ಅರ್ಥಮಾಡಿಕೊಳ್ಳುವಿಕೆ ಅಥವಾ ತಪ್ಪು ವಿವರಣೆಗಳಿಗೆ ನಾವು ಹೊಣೆಗಾರರಾಗುವುದಿಲ್ಲ.
<!-- CO-OP TRANSLATOR DISCLAIMER END -->

@ -0,0 +1,42 @@
<!--
CO_OP_TRANSLATOR_METADATA:
{
"original_hash": "3767555b3cc28a2865c79202f4374204",
"translation_date": "2025-12-19T13:31:12+00:00",
"source_file": "docs/_sidebar.md",
"language_code": "kn"
}
-->
- ಪರಿಚಯ
- [ಡೇಟಾ ಸೈನ್ಸ್ ಅನ್ನು ವ್ಯಾಖ್ಯಾನಿಸುವುದು](../1-Introduction/01-defining-data-science/README.md)
- [ಡೇಟಾ ಸೈನ್ಸ್ ನ ನೈತಿಕತೆ](../1-Introduction/02-ethics/README.md)
- [ಡೇಟಾ ಅನ್ನು ವ್ಯಾಖ್ಯಾನಿಸುವುದು](../1-Introduction/03-defining-data/README.md)
- [ಸಂಭಾವ್ಯತೆ ಮತ್ತು ಅಂಕಿಅಂಶಗಳು](../1-Introduction/04-stats-and-probability/README.md)
- ಡೇಟಾ ಜೊತೆಗೆ ಕೆಲಸ ಮಾಡುವುದು
- [ಸಂಬಂಧಿತ ಡೇಟಾಬೇಸ್‌ಗಳು](../2-Working-With-Data/05-relational-databases/README.md)
- [ಅಸಂಬಂಧಿತ ಡೇಟಾಬೇಸ್‌ಗಳು](../2-Working-With-Data/06-non-relational/README.md)
- [ಪೈಥಾನ್](../2-Working-With-Data/07-python/README.md)
- [ಡೇಟಾ ತಯಾರಿ](../2-Working-With-Data/08-data-preparation/README.md)
- ಡೇಟಾ ದೃಶ್ಯೀಕರಣ
- [ಪ್ರಮಾಣಗಳನ್ನು ದೃಶ್ಯೀಕರಿಸುವುದು](../3-Data-Visualization/09-visualization-quantities/README.md)
- [ವಿತರಣೆಯನ್ನು ದೃಶ್ಯೀಕರಿಸುವುದು](../3-Data-Visualization/10-visualization-distributions/README.md)
- [ಪ್ರಮಾಣಾಂಶಗಳನ್ನು ದೃಶ್ಯೀಕರಿಸುವುದು](../3-Data-Visualization/11-visualization-proportions/README.md)
- [ಸಂಬಂಧಗಳನ್ನು ದೃಶ್ಯೀಕರಿಸುವುದು](../3-Data-Visualization/12-visualization-relationships/README.md)
- [ಅರ್ಥಪೂರ್ಣ ದೃಶ್ಯೀಕರಣಗಳು](../3-Data-Visualization/13-meaningful-visualizations/README.md)
- ಡೇಟಾ ಸೈನ್ಸ್ ಜೀವನಚಕ್ರ
- [ಪರಿಚಯ](../4-Data-Science-Lifecycle/14-Introduction/README.md)
- [ವಿಶ್ಲೇಷಣೆ](../4-Data-Science-Lifecycle/15-analyzing/README.md)
- [ಸಂವಹನ](../4-Data-Science-Lifecycle/16-communication/README.md)
- ಕ್ಲೌಡ್‌ನಲ್ಲಿ ಡೇಟಾ ಸೈನ್ಸ್
- [ಪರಿಚಯ](../5-Data-Science-In-Cloud/17-Introduction/README.md)
- [ಕಡಿಮೆ ಕೋಡ್](../5-Data-Science-In-Cloud/18-Low-Code/README.md)
- [ಅಜೂರ್](../5-Data-Science-In-Cloud/19-Azure/README.md)
- ಕಾಡಿನಲ್ಲಿ ಡೇಟಾ ಸೈನ್ಸ್
- [ಕಾಡಿನಲ್ಲಿ ಡಿಎಸ್](../6-Data-Science-In-Wild/README.md)
---
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
**ಅಸ್ವೀಕರಣ**:
ಈ ದಸ್ತಾವೇಜು [Co-op Translator](https://github.com/Azure/co-op-translator) ಎಂಬ AI ಅನುವಾದ ಸೇವೆಯನ್ನು ಬಳಸಿ ಅನುವಾದಿಸಲಾಗಿದೆ. ನಾವು ಶುದ್ಧತೆಯತ್ತ ಪ್ರಯತ್ನಿಸುತ್ತಿದ್ದರೂ, ಸ್ವಯಂಚಾಲಿತ ಅನುವಾದಗಳಲ್ಲಿ ತಪ್ಪುಗಳು ಅಥವಾ ಅಸತ್ಯತೆಗಳು ಇರಬಹುದು ಎಂದು ದಯವಿಟ್ಟು ಗಮನಿಸಿ. ಮೂಲ ಭಾಷೆಯಲ್ಲಿರುವ ಮೂಲ ದಸ್ತಾವೇಜನ್ನು ಅಧಿಕೃತ ಮೂಲವೆಂದು ಪರಿಗಣಿಸಬೇಕು. ಮಹತ್ವದ ಮಾಹಿತಿಗಾಗಿ, ವೃತ್ತಿಪರ ಮಾನವ ಅನುವಾದವನ್ನು ಶಿಫಾರಸು ಮಾಡಲಾಗುತ್ತದೆ. ಈ ಅನುವಾದ ಬಳಕೆಯಿಂದ ಉಂಟಾಗುವ ಯಾವುದೇ ತಪ್ಪು ಅರ್ಥಮಾಡಿಕೊಳ್ಳುವಿಕೆ ಅಥವಾ ತಪ್ಪು ವಿವರಣೆಗಳಿಗೆ ನಾವು ಹೊಣೆಗಾರರಾಗುವುದಿಲ್ಲ.
<!-- CO-OP TRANSLATOR DISCLAIMER END -->

@ -0,0 +1,151 @@
<!--
CO_OP_TRANSLATOR_METADATA:
{
"original_hash": "9bef7fd96c8f262339933117d9b3e342",
"translation_date": "2025-12-19T13:28:44+00:00",
"source_file": "examples/README.md",
"language_code": "kn"
}
-->
# ಆರಂಭಿಕರಿಗಾಗಿ ಸ್ನೇಹಪರ ಡೇಟಾ ಸೈನ್ಸ್ ಉದಾಹರಣೆಗಳು
ಉದಾಹರಣೆಗಳ ಡೈರೆಕ್ಟರಿಗೆ ಸ್ವಾಗತ! ಈ ಸರಳ, ಚೆನ್ನಾಗಿ ಕಾಮೆಂಟ್ ಮಾಡಲಾದ ಉದಾಹರಣೆಗಳ ಸಂಗ್ರಹವು ನೀವು ಸಂಪೂರ್ಣ ಆರಂಭಿಕರಾಗಿದ್ದರೂ ಸಹ ಡೇಟಾ ಸೈನ್ಸ್ ಪ್ರಾರಂಭಿಸಲು ಸಹಾಯ ಮಾಡಲು ವಿನ್ಯಾಸಗೊಳಿಸಲಾಗಿದೆ.
## 📚 ನೀವು ಇಲ್ಲಿ ಏನು ಕಾಣುತ್ತೀರಿ
ಪ್ರತಿ ಉದಾಹರಣೆ ಸ್ವತಂತ್ರವಾಗಿದ್ದು ಮತ್ತು ಒಳಗೊಂಡಿದೆ:
- **ಪ್ರತಿ ಹಂತವನ್ನು ವಿವರಿಸುವ ಸ್ಪಷ್ಟ ಕಾಮೆಂಟ್‌ಗಳು**
- **ಒಂದು ಸಮಯದಲ್ಲಿ ಒಂದು ತತ್ವವನ್ನು ತೋರಿಸುವ ಸರಳ, ಓದಲು ಸುಲಭವಾದ ಕೋಡ್**
- **ಈ ತಂತ್ರಗಳನ್ನು ಯಾವಾಗ ಮತ್ತು ಏಕೆ ಬಳಸಬೇಕು ಎಂಬುದನ್ನು ಅರ್ಥಮಾಡಿಕೊಳ್ಳಲು ನೈಜ-ಜಗತ್ತಿನ ಸನ್ನಿವೇಶ**
- **ನಿರೀಕ್ಷಿತ ಔಟ್‌ಪುಟ್** ನೀವು ಏನು ನೋಡಬೇಕೆಂದು ತಿಳಿಯಲು
## 🚀 ಪ್ರಾರಂಭಿಸುವುದು
### ಪೂರ್ವಾಪೇಕ್ಷಿತಗಳು
ಈ ಉದಾಹರಣೆಗಳನ್ನು ಚಾಲನೆ ಮಾಡುವ ಮೊದಲು, ಖಚಿತಪಡಿಸಿಕೊಳ್ಳಿ ನೀವು ಹೊಂದಿರುವುದು:
- Python 3.7 ಅಥವಾ ಅದಕ್ಕಿಂತ ಮೇಲಿನ ಆವೃತ್ತಿ ಸ್ಥಾಪಿಸಲಾಗಿದೆ
- Python ಸ್ಕ್ರಿಪ್ಟ್‌ಗಳನ್ನು ಹೇಗೆ ಚಾಲನೆ ಮಾಡುವುದು ಎಂಬ ಮೂಲಭೂತ ಅರ್ಥ
### ಅಗತ್ಯ ಗ್ರಂಥಾಲಯಗಳನ್ನು ಸ್ಥಾಪಿಸುವುದು
```bash
pip install pandas numpy matplotlib
```
## 📖 ಉದಾಹರಣೆಗಳ ಅವಲೋಕನ
### 1. ಹಲೋ ವರ್ಲ್ಡ್ - ಡೇಟಾ ಸೈನ್ಸ್ ಶೈಲಿ
**ಫೈಲ್:** `01_hello_world_data_science.py`
ನಿಮ್ಮ ಮೊದಲ ಡೇಟಾ ಸೈನ್ಸ್ ಪ್ರೋಗ್ರಾಂ! ಕಲಿಯಿರಿ ಹೇಗೆ:
- ಸರಳ ಡೇಟಾಸೆಟ್ ಅನ್ನು ಲೋಡ್ ಮಾಡುವುದು
- ನಿಮ್ಮ ಡೇಟಾ ಬಗ್ಗೆ ಮೂಲಭೂತ ಮಾಹಿತಿಯನ್ನು ಪ್ರದರ್ಶಿಸುವುದು
- ನಿಮ್ಮ ಮೊದಲ ಡೇಟಾ ಸೈನ್ಸ್ ಔಟ್‌ಪುಟ್ ಅನ್ನು ಮುದ್ರಿಸುವುದು
ನಿಜವಾಗಿಯೂ ಆರಂಭಿಕರಿಗೆ ಇದು ಅವರ ಮೊದಲ ಡೇಟಾ ಸೈನ್ಸ್ ಪ್ರೋಗ್ರಾಂ ಅನ್ನು ಕಾರ್ಯನಿರ್ವಹಿಸುವುದನ್ನು ನೋಡಲು ಪರಿಪೂರ್ಣ.
---
### 2. ಡೇಟಾ ಲೋಡ್ ಮಾಡುವುದು ಮತ್ತು ಅನ್ವೇಷಿಸುವುದು
**ಫೈಲ್:** `02_loading_data.py`
ಡೇಟಾ ಜೊತೆ ಕೆಲಸ ಮಾಡುವ ಮೂಲಭೂತಗಳನ್ನು ಕಲಿಯಿರಿ:
- CSV ಫೈಲ್‌ಗಳಿಂದ ಡೇಟಾ ಓದುವುದು
- ನಿಮ್ಮ ಡೇಟಾಸೆಟ್‌ನ ಮೊದಲ ಕೆಲವು ಸಾಲುಗಳನ್ನು ವೀಕ್ಷಿಸುವುದು
- ನಿಮ್ಮ ಡೇಟಾ ಬಗ್ಗೆ ಮೂಲಭೂತ ಅಂಕಿಅಂಶಗಳನ್ನು ಪಡೆಯುವುದು
- ಡೇಟಾ ಪ್ರಕಾರಗಳನ್ನು ಅರ್ಥಮಾಡಿಕೊಳ್ಳುವುದು
ಇದು ಯಾವುದೇ ಡೇಟಾ ಸೈನ್ಸ್ ಯೋಜನೆಯ ಮೊದಲ ಹಂತವಾಗಿರುತ್ತದೆ!
---
### 3. ಸರಳ ಡೇಟಾ ವಿಶ್ಲೇಷಣೆ
**ಫೈಲ್:** `03_simple_analysis.py`
ನಿಮ್ಮ ಮೊದಲ ಡೇಟಾ ವಿಶ್ಲೇಷಣೆಯನ್ನು ನಿರ್ವಹಿಸಿ:
- ಮೂಲಭೂತ ಅಂಕಿಅಂಶಗಳನ್ನು ಲೆಕ್ಕಹಾಕಿ (ಸರಾಸರಿ, ಮಧ್ಯಮ, ಮೋಡ್)
- ಗರಿಷ್ಠ ಮತ್ತು ಕನಿಷ್ಠ ಮೌಲ್ಯಗಳನ್ನು ಕಂಡುಹಿಡಿಯಿರಿ
- ಮೌಲ್ಯಗಳ ಸಂಭವನೆಯನ್ನು ಎಣಿಸಿ
- ಶರತ್ತುಗಳ ಆಧಾರದ ಮೇಲೆ ಡೇಟಾವನ್ನು ಫಿಲ್ಟರ್ ಮಾಡಿ
ನಿಮ್ಮ ಡೇಟಾ ಬಗ್ಗೆ ಸರಳ ಪ್ರಶ್ನೆಗಳಿಗೆ ಉತ್ತರಿಸುವುದನ್ನು ನೋಡಿ.
---
### 4. ಡೇಟಾ ದೃಶ್ಯೀಕರಣ ಮೂಲಭೂತಗಳು
**ಫೈಲ್:** `04_basic_visualization.py`
ನಿಮ್ಮ ಮೊದಲ ದೃಶ್ಯೀಕರಣಗಳನ್ನು ರಚಿಸಿ:
- ಸರಳ ಬಾರ್ ಚಾರ್ಟ್ ಮಾಡಿ
- ಲೈನ್ ಪ್ಲಾಟ್ ರಚಿಸಿ
- ಪೈ ಚಾರ್ಟ್ ತಯಾರಿಸಿ
- ನಿಮ್ಮ ದೃಶ್ಯೀಕರಣಗಳನ್ನು ಚಿತ್ರಗಳಾಗಿ ಉಳಿಸಿ
ನಿಮ್ಮ ಕಂಡುಹಿಡಿತಗಳನ್ನು ದೃಶ್ಯವಾಗಿ ಸಂವಹನ ಮಾಡಲು ಕಲಿಯಿರಿ!
---
### 5. ನೈಜ ಡೇಟಾ ಜೊತೆ ಕೆಲಸ ಮಾಡುವುದು
**ಫೈಲ್:** `05_real_world_example.py`
ಎಲ್ಲವನ್ನು ಒಟ್ಟುಗೂಡಿಸಿ ಸಂಪೂರ್ಣ ಉದಾಹರಣೆಯನ್ನು ಮಾಡಿ:
- ರೆಪೊಸಿಟರಿಯಿಂದ ನೈಜ ಡೇಟಾ ಲೋಡ್ ಮಾಡುವುದು
- ಡೇಟಾವನ್ನು ಸ್ವಚ್ಛಗೊಳಿಸಿ ಮತ್ತು ಸಿದ್ಧಪಡಿಸಿ
- ವಿಶ್ಲೇಷಣೆ ನಡೆಸಿ
- ಅರ್ಥಪೂರ್ಣ ದೃಶ್ಯೀಕರಣಗಳನ್ನು ರಚಿಸಿ
- ನಿರ್ಣಯಗಳನ್ನು ತೆಗೆದುಕೊಳ್ಳಿ
ಈ ಉದಾಹರಣೆ ಆರಂಭದಿಂದ ಕೊನೆವರೆಗೆ ಸಂಪೂರ್ಣ ಕಾರ್ಯಪ್ರವಾಹವನ್ನು ತೋರಿಸುತ್ತದೆ.
---
## 🎯 ಈ ಉದಾಹರಣೆಗಳನ್ನು ಹೇಗೆ ಬಳಸುವುದು
1. **ಆರಂಭದಿಂದ ಪ್ರಾರಂಭಿಸಿ**: ಉದಾಹರಣೆಗಳು ಕಷ್ಟದ ಕ್ರಮದಲ್ಲಿ ಸಂಖ್ಯೆಬದ್ಧವಾಗಿವೆ. `01_hello_world_data_science.py` ನಿಂದ ಪ್ರಾರಂಭಿಸಿ ಮತ್ತು ಕ್ರಮವಾಗಿ ಮುಂದುವರಿಯಿರಿ.
2. **ಕಾಮೆಂಟ್‌ಗಳನ್ನು ಓದಿ**: ಪ್ರತಿ ಫೈಲ್‌ನಲ್ಲಿ ಕೋಡ್ ಏನು ಮಾಡುತ್ತದೆ ಮತ್ತು ಏಕೆ ಎಂದು ವಿವರಿಸುವ ವಿವರವಾದ ಕಾಮೆಂಟ್‌ಗಳಿವೆ. ಅವುಗಳನ್ನು ಗಮನದಿಂದ ಓದಿ!
3. **ಪ್ರಯೋಗ ಮಾಡಿ**: ಕೋಡ್ ಅನ್ನು ಬದಲಾಯಿಸಲು ಪ್ರಯತ್ನಿಸಿ. ಮೌಲ್ಯವನ್ನು ಬದಲಾಯಿಸಿದರೆ ಏನಾಗುತ್ತದೆ? ತಪ್ಪುಗಳನ್ನು ಮಾಡಿ ಮತ್ತು ಸರಿಪಡಿಸಿ - ಹೀಗೆ ನೀವು ಕಲಿಯುತ್ತೀರಿ!
4. **ಕೋಡ್ ಅನ್ನು ಚಾಲನೆ ಮಾಡಿ**: ಪ್ರತಿ ಉದಾಹರಣೆಯನ್ನು ಕಾರ್ಯಗತಗೊಳಿಸಿ ಮತ್ತು ಔಟ್‌ಪುಟ್ ಅನ್ನು ಗಮನಿಸಿ. ನೀವು ನಿರೀಕ್ಷಿಸಿದದನ್ನು ಹೋಲಿಸಿ.
5. **ಅದರ ಮೇಲೆ ನಿರ್ಮಿಸಿ**: ಒಂದು ಉದಾಹರಣೆಯನ್ನು ಅರ್ಥಮಾಡಿಕೊಂಡ ನಂತರ, ನಿಮ್ಮ ಸ್ವಂತ ಆಲೋಚನೆಗಳೊಂದಿಗೆ ಅದನ್ನು ವಿಸ್ತರಿಸಲು ಪ್ರಯತ್ನಿಸಿ.
## 💡 ಆರಂಭಿಕರಿಗಾಗಿ ಸಲಹೆಗಳು
- **ತ್ವರೆಯಲ್ಲದೆ**: ಮುಂದಿನ ಉದಾಹರಣೆಗೆ ಹೋಗುವ ಮೊದಲು ಪ್ರತಿ ಉದಾಹರಣೆಯನ್ನು ಅರ್ಥಮಾಡಿಕೊಳ್ಳಲು ಸಮಯ ತೆಗೆದುಕೊಳ್ಳಿ
- **ಕೋಡ್ ಅನ್ನು ಸ್ವತಃ ಟೈಪ್ ಮಾಡಿ**: ಕಾಪಿ-ಪೇಸ್ಟ್ ಮಾಡಬೇಡಿ. ಟೈಪಿಂಗ್ ನಿಮಗೆ ಕಲಿಯಲು ಮತ್ತು ನೆನಪಿಡಲು ಸಹಾಯ ಮಾಡುತ್ತದೆ
- **ಅಪರಿಚಿತ ತತ್ವಗಳನ್ನು ಹುಡುಕಿ**: ನೀವು ಅರ್ಥಮಾಡಿಕೊಳ್ಳದ ಯಾವುದಾದರೂ ಕಂಡರೆ, ಅದನ್ನು ಆನ್‌ಲೈನ್ ಅಥವಾ ಮುಖ್ಯ ಪಾಠಗಳಲ್ಲಿ ಹುಡುಕಿ
- **ಪ್ರಶ್ನೆಗಳನ್ನು ಕೇಳಿ**: ಸಹಾಯ ಬೇಕಾದರೆ [ಚರ್ಚಾ ವೇದಿಕೆ](https://github.com/microsoft/Data-Science-For-Beginners/discussions) ಸೇರಿ
- **ನಿಯಮಿತವಾಗಿ ಅಭ್ಯಾಸ ಮಾಡಿ**: ವಾರಕ್ಕೆ ಒಂದು ಬಾರಿ ದೀರ್ಘ ಅವಧಿ ಬದಲು ಪ್ರತಿದಿನ ಸ್ವಲ್ಪ ಕೋಡ್ ಮಾಡಲು ಪ್ರಯತ್ನಿಸಿ
## 🔗 ಮುಂದಿನ ಹಂತಗಳು
ಈ ಉದಾಹರಣೆಗಳನ್ನು ಪೂರ್ಣಗೊಳಿಸಿದ ನಂತರ, ನೀವು ಸಿದ್ಧರಾಗಿದ್ದೀರಿ:
- ಮುಖ್ಯ ಪಠ್ಯಕ್ರಮ ಪಾಠಗಳನ್ನು ಅನುಸರಿಸಲು
- ಪ್ರತಿ ಪಾಠ ಫೋಲ್ಡರ್‌ನಲ್ಲಿನ ನಿಯೋಜನೆಗಳನ್ನು ಪ್ರಯತ್ನಿಸಲು
- ಹೆಚ್ಚಿನ ಆಳವಾದ ಕಲಿಕೆಗೆ ಜುಪಿಟರ್ ನೋಟ್ಬುಕ್‌ಗಳನ್ನು ಅನ್ವೇಷಿಸಲು
- ನಿಮ್ಮ ಸ್ವಂತ ಡೇಟಾ ಸೈನ್ಸ್ ಯೋಜನೆಗಳನ್ನು ರಚಿಸಲು
## 📚 ಹೆಚ್ಚುವರಿ ಸಂಪನ್ಮೂಲಗಳು
- [ಮುಖ್ಯ ಪಠ್ಯಕ್ರಮ](../README.md) - ಸಂಪೂರ್ಣ 20-ಪಾಠ ಕೋರ್ಸ್
- [ಶಿಕ್ಷಕರಿಗಾಗಿ](../for-teachers.md) - ನಿಮ್ಮ ತರಗತಿಯಲ್ಲಿ ಈ ಪಠ್ಯಕ್ರಮವನ್ನು ಬಳಸುವುದು
- [Microsoft Learn](https://docs.microsoft.com/learn/) - ಉಚಿತ ಆನ್‌ಲೈನ್ ಕಲಿಕೆ ಸಂಪನ್ಮೂಲಗಳು
- [Python ಡಾಕ್ಯುಮೆಂಟೇಶನ್](https://docs.python.org/3/) - ಅಧಿಕೃತ Python ರೆಫರೆನ್ಸ್
## 🤝 ಕೊಡುಗೆ ನೀಡುವುದು
ದೋಷ ಕಂಡುಹಿಡಿದಿದ್ದೀರಾ ಅಥವಾ ಹೊಸ ಉದಾಹರಣೆಗೆ ಐಡಿಯಾ ಇದೆಯಾ? ನಾವು ಕೊಡುಗೆಗಳನ್ನು ಸ್ವಾಗತಿಸುತ್ತೇವೆ! ದಯವಿಟ್ಟು ನಮ್ಮ [ಕೊಡುಗೆ ಮಾರ್ಗದರ್ಶಿ](../CONTRIBUTING.md) ನೋಡಿ.
---
**ಸಂತೋಷಕರ ಕಲಿಕೆ! 🎉**
ಮರೆಮಾಡಬೇಡಿ: ಪ್ರತಿಯೊಬ್ಬ ಪರಿಣಿತರೂ ಒಮ್ಮೆ ಆರಂಭಿಕರಾಗಿದ್ದರು. ಒಂದು ಹಂತವನ್ನು ಒಂದು ಸಮಯದಲ್ಲಿ ತೆಗೆದುಕೊಳ್ಳಿ, ಮತ್ತು ತಪ್ಪುಗಳನ್ನು ಮಾಡಲು ಭಯಪಡಬೇಡಿ - ಅವು ಕಲಿಕೆಯ ಭಾಗವಾಗಿವೆ!
---
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
**ಅಸ್ವೀಕಾರ**:
ಈ ದಸ್ತಾವೇಜು AI ಅನುವಾದ ಸೇವೆ [Co-op Translator](https://github.com/Azure/co-op-translator) ಬಳಸಿ ಅನುವಾದಿಸಲಾಗಿದೆ. ನಾವು ನಿಖರತೆಯಿಗಾಗಿ ಪ್ರಯತ್ನಿಸುತ್ತಿದ್ದರೂ, ಸ್ವಯಂಚಾಲಿತ ಅನುವಾದಗಳಲ್ಲಿ ದೋಷಗಳು ಅಥವಾ ಅಸತ್ಯತೆಗಳು ಇರಬಹುದು ಎಂದು ದಯವಿಟ್ಟು ಗಮನಿಸಿ. ಮೂಲ ಭಾಷೆಯಲ್ಲಿರುವ ಮೂಲ ದಸ್ತಾವೇಜನ್ನು ಅಧಿಕೃತ ಮೂಲವೆಂದು ಪರಿಗಣಿಸಬೇಕು. ಮಹತ್ವದ ಮಾಹಿತಿಗಾಗಿ, ವೃತ್ತಿಪರ ಮಾನವ ಅನುವಾದವನ್ನು ಶಿಫಾರಸು ಮಾಡಲಾಗುತ್ತದೆ. ಈ ಅನುವಾದ ಬಳಕೆಯಿಂದ ಉಂಟಾಗುವ ಯಾವುದೇ ತಪ್ಪು ಅರ್ಥಮಾಡಿಕೊಳ್ಳುವಿಕೆ ಅಥವಾ ತಪ್ಪು ವಿವರಣೆಗಳಿಗೆ ನಾವು ಹೊಣೆಗಾರರಾಗುವುದಿಲ್ಲ.
<!-- CO-OP TRANSLATOR DISCLAIMER END -->

@ -0,0 +1,78 @@
<!--
CO_OP_TRANSLATOR_METADATA:
{
"original_hash": "f7440be10c17a8a9262713af3d2818a9",
"translation_date": "2025-12-19T12:41:35+00:00",
"source_file": "for-teachers.md",
"language_code": "kn"
}
-->
## ಶಿಕ್ಷಕರಿಗಾಗಿ
ನೀವು ಈ ಪಠ್ಯಕ್ರಮವನ್ನು ನಿಮ್ಮ ತರಗತಿಯಲ್ಲಿ ಬಳಸಲು ಇಚ್ಛಿಸುತ್ತೀರಾ? ದಯವಿಟ್ಟು ಮುಕ್ತವಾಗಿ ಬಳಸಿಕೊಳ್ಳಿ!
ವಾಸ್ತವದಲ್ಲಿ, ನೀವು GitHub Classroom ಬಳಸಿ GitHub ನೊಳಗೆ ಇದನ್ನು ಬಳಸಬಹುದು.
ಅದಕ್ಕಾಗಿ, ಈ ರೆಪೊವನ್ನು ಫೋರ್ಕ್ ಮಾಡಿ. ಪ್ರತಿಯೊಂದು ಪಾಠಕ್ಕಾಗಿ ನೀವು ಒಂದು ರೆಪೊ ಸೃಷ್ಟಿಸಬೇಕಾಗುತ್ತದೆ, ಆದ್ದರಿಂದ ಪ್ರತಿಯೊಂದು ಫೋಲ್ಡರ್ ಅನ್ನು ಪ್ರತ್ಯೇಕ ರೆಪೊಗೆ ಹೊರತೆಗೆಯಬೇಕಾಗುತ್ತದೆ. ಆ ರೀತಿಯಲ್ಲಿ, [GitHub Classroom](https://classroom.github.com/classrooms) ಪ್ರತಿ ಪಾಠವನ್ನು ಪ್ರತ್ಯೇಕವಾಗಿ ಹಿಡಿಯಬಹುದು.
ಈ [ಪೂರ್ಣ ಸೂಚನೆಗಳು](https://github.blog/2020-03-18-set-up-your-digital-classroom-with-github-classroom/) ನಿಮ್ಮ ತರಗತಿಯನ್ನು ಹೇಗೆ ಸೆಟ್ ಅಪ್ ಮಾಡುವುದು ಎಂಬುದರ ಬಗ್ಗೆ ನಿಮಗೆ ಒಂದು ಕಲ್ಪನೆ ನೀಡುತ್ತವೆ.
## ರೆಪೊವನ್ನು ಹಾಗೆ ಬಳಸುವುದು
ನೀವು GitHub Classroom ಬಳಸದೆ ಈ ರೆಪೊವನ್ನು ಪ್ರಸ್ತುತ ಸ್ಥಿತಿಯಲ್ಲಿ ಬಳಸಲು ಇಚ್ಛಿಸಿದರೆ, ಅದು ಸಹ ಸಾಧ್ಯ. ನೀವು ನಿಮ್ಮ ವಿದ್ಯಾರ್ಥಿಗಳೊಂದಿಗೆ ಯಾವ ಪಾಠವನ್ನು ಒಟ್ಟಿಗೆ ಕೆಲಸ ಮಾಡಬೇಕೆಂದು ಸಂವಹನ ಮಾಡಬೇಕಾಗುತ್ತದೆ.
ಆನ್ಲೈನ್ ಫಾರ್ಮ್ಯಾಟ್ (Zoom, Teams, ಅಥವಾ ಇತರೆ) ನಲ್ಲಿ ನೀವು ಕ್ವಿಜ್‌ಗಳಿಗಾಗಿ ಬ್ರೇಕ್‌ಔಟ್ ರೂಮ್‌ಗಳನ್ನು ರಚಿಸಬಹುದು ಮತ್ತು ವಿದ್ಯಾರ್ಥಿಗಳನ್ನು ಕಲಿಯಲು ಸಿದ್ಧರಾಗಲು ಮಾರ್ಗದರ್ಶನ ಮಾಡಬಹುದು. ನಂತರ ವಿದ್ಯಾರ್ಥಿಗಳನ್ನು ಕ್ವಿಜ್‌ಗಳಿಗೆ ಆಹ್ವಾನಿಸಿ, ನಿರ್ದಿಷ್ಟ ಸಮಯದಲ್ಲಿ 'issues' ಆಗಿ ಉತ್ತರಗಳನ್ನು ಸಲ್ಲಿಸಲು ಹೇಳಬಹುದು. ನೀವು ಬಯಸಿದರೆ, ವಿದ್ಯಾರ್ಥಿಗಳು ಸಹಕಾರದಿಂದ ಹೊರಗೆ ಕೆಲಸ ಮಾಡಲು, ಅಸೈನ್ಮೆಂಟ್‌ಗಳಿಗೂ ಇದೇ ರೀತಿಯ ವ್ಯವಸ್ಥೆ ಮಾಡಬಹುದು.
ನೀವು ಹೆಚ್ಚು ಖಾಸಗಿ ಫಾರ್ಮ್ಯಾಟ್ ಇಚ್ಛಿಸಿದರೆ, ನಿಮ್ಮ ವಿದ್ಯಾರ್ಥಿಗಳಿಗೆ ಪಠ್ಯಕ್ರಮವನ್ನು ಪಾಠದ ಮೂಲಕ ಫೋರ್ಕ್ ಮಾಡಿ, ತಮ್ಮ ಸ್ವಂತ GitHub ರೆಪೊಗಳಲ್ಲಿ ಖಾಸಗಿ ರೆಪೊಗಳಾಗಿ ಇಟ್ಟುಕೊಳ್ಳಲು ಹೇಳಿ, ಮತ್ತು ನಿಮಗೆ ಪ್ರವೇಶವನ್ನು ನೀಡಿ. ನಂತರ ಅವರು ಖಾಸಗಿ ರೀತಿಯಲ್ಲಿ ಕ್ವಿಜ್‌ಗಳು ಮತ್ತು ಅಸೈನ್ಮೆಂಟ್‌ಗಳನ್ನು ಪೂರ್ಣಗೊಳಿಸಿ, ನಿಮ್ಮ ತರಗತಿ ರೆಪೊದಲ್ಲಿ issues ಮೂಲಕ ನಿಮಗೆ ಸಲ್ಲಿಸಬಹುದು.
ಆನ್ಲೈನ್ ತರಗತಿ ಫಾರ್ಮ್ಯಾಟ್‌ನಲ್ಲಿ ಇದನ್ನು ಕಾರ್ಯಗತಗೊಳಿಸುವ ಅನೇಕ ಮಾರ್ಗಗಳಿವೆ. ದಯವಿಟ್ಟು ನಿಮಗೆ ಯಾವುದು ಉತ್ತಮವಾಗಿ ಕೆಲಸ ಮಾಡುತ್ತದೆ ಎಂದು ನಮಗೆ ತಿಳಿಸಿ!
## ಈ ಪಠ್ಯಕ್ರಮದಲ್ಲಿ ಸೇರಿಸಲಾಗಿದೆ:
20 ಪಾಠಗಳು, 40 ಕ್ವಿಜ್‌ಗಳು, ಮತ್ತು 20 ಅಸೈನ್ಮೆಂಟ್‌ಗಳು. ದೃಶ್ಯ ಕಲಿಕಾರ್ಥಿಗಳಿಗೆ ಪಾಠಗಳಿಗೆ ಸ್ಕೆಚ್‌ನೋಟ್ಸ್ ಸಹ ಸೇರಿವೆ. ಅನೇಕ ಪಾಠಗಳು Python ಮತ್ತು R ಎರಡೂ ಭಾಷೆಗಳಲ್ಲಿ ಲಭ್ಯವಿದ್ದು, VS Code ನಲ್ಲಿ Jupyter ನೋಟ್ಬುಕ್‌ಗಳನ್ನು ಬಳಸಿಕೊಂಡು ಪೂರ್ಣಗೊಳಿಸಬಹುದು. ಈ ತಂತ್ರಜ್ಞಾನ ಸ್ಟ್ಯಾಕ್ ಅನ್ನು ಬಳಸಲು ನಿಮ್ಮ ತರಗತಿಯನ್ನು ಹೇಗೆ ಸೆಟ್ ಅಪ್ ಮಾಡುವುದು ಎಂಬುದರ ಬಗ್ಗೆ ಹೆಚ್ಚಿನ ಮಾಹಿತಿಗಾಗಿ: https://code.visualstudio.com/docs/datascience/jupyter-notebooks.
ಎಲ್ಲಾ ಸ್ಕೆಚ್‌ನೋಟ್ಸ್, ದೊಡ್ಡ ಫಾರ್ಮ್ಯಾಟ್ ಪೋಸ್ಟರ್ ಸೇರಿದಂತೆ, [ಈ ಫೋಲ್ಡರ್](../../sketchnotes) ನಲ್ಲಿ ಇವೆ.
ನೀವು ಈ ಪಠ್ಯಕ್ರಮವನ್ನು ಸ್ವತಂತ್ರ, ಆಫ್‌ಲೈನ್-ಸ್ನೇಹಿ ವೆಬ್‌ಸೈಟ್ ಆಗಿ [Docsify](https://docsify.js.org/#/) ಬಳಸಿ ನಡೆಸಬಹುದು. ನಿಮ್ಮ ಸ್ಥಳೀಯ ಯಂತ್ರದಲ್ಲಿ [Docsify ಅನ್ನು ಇನ್‌ಸ್ಟಾಲ್ ಮಾಡಿ](https://docsify.js.org/#/quickstart), ನಂತರ ಈ ರೆಪೊನ ಸ್ಥಳೀಯ ಪ್ರತಿಯುತದ ರೂಟ್ ಫೋಲ್ಡರ್‌ನಲ್ಲಿ `docsify serve` ಟೈಪ್ ಮಾಡಿ. ವೆಬ್‌ಸೈಟ್ ನಿಮ್ಮ ಲೋಕಲ್‌ಹೋಸ್ಟ್‌ನಲ್ಲಿ 3000 ಪೋರ್ಟ್‌ನಲ್ಲಿ ಸರ್ವ್ ಆಗುತ್ತದೆ: `localhost:3000`.
ಪಠ್ಯಕ್ರಮದ ಆಫ್‌ಲೈನ್-ಸ್ನೇಹಿ ಆವೃತ್ತಿ ಸ್ವತಂತ್ರ ವೆಬ್ ಪುಟವಾಗಿ ತೆರೆಯುತ್ತದೆ: https://localhost:3000
ಪಾಠಗಳು 6 ಭಾಗಗಳಾಗಿ ಗುಂಪುಮಾಡಲಾಗಿದೆ:
- 1: ಪರಿಚಯ
- 1: ಡೇಟಾ ಸೈನ್ಸ್ ವ್ಯಾಖ್ಯಾನ
- 2: ನೈತಿಕತೆ
- 3: ಡೇಟಾ ವ್ಯಾಖ್ಯಾನ
- 4: ಪ್ರಾಬಬಿಲಿಟಿ ಮತ್ತು ಸ್ಟಾಟಿಸ್ಟಿಕ್ಸ್ ಅವಲೋಕನ
- 2: ಡೇಟಾ ಜೊತೆಗೆ ಕೆಲಸ
- 5: ಸಂಬಂಧಿತ ಡೇಟಾಬೇಸ್‌ಗಳು
- 6: ಅಸಂಬಂಧಿತ ಡೇಟಾಬೇಸ್‌ಗಳು
- 7: ಪೈಥಾನ್
- 8: ಡೇಟಾ ತಯಾರಿ
- 3: ಡೇಟಾ ದೃಶ್ಯೀಕರಣ
- 9: ಪ್ರಮಾಣಗಳ ದೃಶ್ಯೀಕರಣ
- 10: ವಿತರಣೆಯ ದೃಶ್ಯೀಕರಣ
- 11: ಅನುಪಾತಗಳ ದೃಶ್ಯೀಕರಣ
- 12: ಸಂಬಂಧಗಳ ದೃಶ್ಯೀಕರಣ
- 13: ಅರ್ಥಪೂರ್ಣ ದೃಶ್ಯೀಕರಣಗಳು
- 4: ಡೇಟಾ ಸೈನ್ಸ್ ಜೀವನಚಕ್ರ
- 14: ಪರಿಚಯ
- 15: ವಿಶ್ಲೇಷಣೆ
- 16: ಸಂವಹನ
- 5: ಕ್ಲೌಡ್‌ನಲ್ಲಿ ಡೇಟಾ ಸೈನ್ಸ್
- 17: ಪರಿಚಯ
- 18: ಲೋ-ಕೋಡ್ ಆಯ್ಕೆಗಳು
- 19: ಅಜೂರ್
- 6: ವನ್ಯಜೀವನದಲ್ಲಿ ಡೇಟಾ ಸೈನ್ಸ್
- 20: ಅವಲೋಕನ
## ದಯವಿಟ್ಟು ನಿಮ್ಮ ಅಭಿಪ್ರಾಯಗಳನ್ನು ನಮಗೆ ನೀಡಿ!
ನಾವು ಈ ಪಠ್ಯಕ್ರಮವನ್ನು ನಿಮಗೂ ನಿಮ್ಮ ವಿದ್ಯಾರ್ಥಿಗಳಿಗೂ ಅನುಕೂಲವಾಗುವಂತೆ ಮಾಡಲು ಬಯಸುತ್ತೇವೆ. ದಯವಿಟ್ಟು ಚರ್ಚಾ ಫಲಕಗಳಲ್ಲಿ ಪ್ರತಿಕ್ರಿಯೆ ನೀಡಿ! ನಿಮ್ಮ ವಿದ್ಯಾರ್ಥಿಗಳಿಗಾಗಿ ಚರ್ಚಾ ಫಲಕಗಳಲ್ಲಿ ತರಗತಿ ಪ್ರದೇಶವನ್ನು ಸೃಷ್ಟಿಸಲು ಮುಕ್ತವಾಗಿರಿ.
---
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
**ಅಸ್ವೀಕರಣ**:
ಈ ದಸ್ತಾವೇಜು [Co-op Translator](https://github.com/Azure/co-op-translator) ಎಂಬ AI ಅನುವಾದ ಸೇವೆಯನ್ನು ಬಳಸಿ ಅನುವಾದಿಸಲಾಗಿದೆ. ನಾವು ಶುದ್ಧತೆಯತ್ತ ಪ್ರಯತ್ನಿಸುತ್ತಿದ್ದರೂ, ಸ್ವಯಂಚಾಲಿತ ಅನುವಾದಗಳಲ್ಲಿ ತಪ್ಪುಗಳು ಅಥವಾ ಅಸತ್ಯತೆಗಳು ಇರಬಹುದು ಎಂದು ದಯವಿಟ್ಟು ಗಮನಿಸಿ. ಮೂಲ ಭಾಷೆಯಲ್ಲಿರುವ ಮೂಲ ದಸ್ತಾವೇಜನ್ನು ಅಧಿಕೃತ ಮೂಲವೆಂದು ಪರಿಗಣಿಸಬೇಕು. ಮಹತ್ವದ ಮಾಹಿತಿಗಾಗಿ, ವೃತ್ತಿಪರ ಮಾನವ ಅನುವಾದವನ್ನು ಶಿಫಾರಸು ಮಾಡಲಾಗುತ್ತದೆ. ಈ ಅನುವಾದ ಬಳಕೆಯಿಂದ ಉಂಟಾಗುವ ಯಾವುದೇ ತಪ್ಪು ಅರ್ಥಮಾಡಿಕೊಳ್ಳುವಿಕೆ ಅಥವಾ ತಪ್ಪು ವಿವರಣೆಗಳಿಗೆ ನಾವು ಹೊಣೆಗಾರರಾಗುವುದಿಲ್ಲ.
<!-- CO-OP TRANSLATOR DISCLAIMER END -->

@ -0,0 +1,141 @@
<!--
CO_OP_TRANSLATOR_METADATA:
{
"original_hash": "e92c33ea498915a13c9aec162616db18",
"translation_date": "2025-12-19T13:26:21+00:00",
"source_file": "quiz-app/README.md",
"language_code": "kn"
}
-->
# ಪ್ರಶ್ನೋತ್ತರಗಳು
ಈ ಪ್ರಶ್ನೋತ್ತರಗಳು https://aka.ms/datascience-beginners ನಲ್ಲಿ ಡೇಟಾ ಸೈನ್ಸ್ ಪಠ್ಯಕ್ರಮದ ಪೂರ್ವ ಮತ್ತು ನಂತರದ ಉಪನ್ಯಾಸ ಪ್ರಶ್ನೋತ್ತರಗಳಾಗಿವೆ
## ಅನುವಾದಿತ ಪ್ರಶ್ನೋತ್ತರ ಸೆಟ್ ಸೇರಿಸುವುದು
`assets/translations` ಫೋಲ್ಡರ್‌ಗಳಲ್ಲಿ ಹೊಂದಾಣಿಕೆಯ ಪ್ರಶ್ನೋತ್ತರ ರಚನೆಗಳನ್ನು ಸೃಷ್ಟಿಸುವ ಮೂಲಕ ಪ್ರಶ್ನೋತ್ತರ ಅನುವಾದವನ್ನು ಸೇರಿಸಿ. ಮೂಲ ಪ್ರಶ್ನೋತ್ತರಗಳು `assets/translations/en` ನಲ್ಲಿ ಇವೆ. ಪ್ರಶ್ನೋತ್ತರಗಳನ್ನು ಹಲವಾರು ಗುಂಪುಗಳಾಗಿ ವಿಭಜಿಸಲಾಗಿದೆ. ಸರಿಯಾದ ಪ್ರಶ್ನೋತ್ತರ ವಿಭಾಗದ ಸಂಖ್ಯೆಯನ್ನು ಹೊಂದಾಣಿಕೆ ಮಾಡಿಕೊಳ್ಳಿ. ಈ ಪಠ್ಯಕ್ರಮದಲ್ಲಿ ಒಟ್ಟು 40 ಪ್ರಶ್ನೋತ್ತರಗಳಿವೆ, ಎಣಿಕೆ 0 ರಿಂದ ಪ್ರಾರಂಭವಾಗುತ್ತದೆ.
ಅನುವಾದಗಳನ್ನು ಸಂಪಾದಿಸಿದ ನಂತರ, `en` ನಲ್ಲಿ ಇರುವ ನಿಯಮಗಳನ್ನು ಅನುಸರಿಸಿ ಅನುವಾದ ಫೋಲ್ಡರ್‌ನ `index.js` ಫೈಲ್ ಅನ್ನು ಸಂಪಾದಿಸಿ ಎಲ್ಲಾ ಫೈಲ್‌ಗಳನ್ನು ಆಮದುಮಾಡಿ.
`assets/translations` ನಲ್ಲಿ ಇರುವ `index.js` ಫೈಲ್ ಅನ್ನು ಸಂಪಾದಿಸಿ ಹೊಸ ಅನುವಾದಿತ ಫೈಲ್‌ಗಳನ್ನು ಆಮದುಮಾಡಿ.
ನಂತರ, ಈ ಅಪ್ಲಿಕೇಶನ್‌ನ `App.vue` ನಲ್ಲಿ ಇರುವ ಡ್ರಾಪ್‌ಡೌನ್ ಅನ್ನು ಸಂಪಾದಿಸಿ ನಿಮ್ಮ ಭಾಷೆಯನ್ನು ಸೇರಿಸಿ. ಸ್ಥಳೀಯೀಕೃತ ಸಂಕ್ಷಿಪ್ತ ರೂಪವನ್ನು ನಿಮ್ಮ ಭಾಷೆಯ ಫೋಲ್ಡರ್ ಹೆಸರಿಗೆ ಹೊಂದಾಣಿಕೆ ಮಾಡಿ.
ಕೊನೆಗೆ, ಅನುವಾದಿತ ಪಾಠಗಳಲ್ಲಿ ಇದ್ದರೆ ಎಲ್ಲಾ ಪ್ರಶ್ನೋತ್ತರ ಲಿಂಕ್‌ಗಳನ್ನು ಸಂಪಾದಿಸಿ ಈ ಸ್ಥಳೀಯೀಕರಣವನ್ನು ಪ್ರಶ್ನಾ ಪರಿಮಾಣವಾಗಿ ಸೇರಿಸಿ: ಉದಾಹರಣೆಗೆ `?loc=fr`.
## ಪ್ರಾಜೆಕ್ಟ್ ಸೆಟಪ್
```
npm install
```
### ಅಭಿವೃದ್ಧಿಗಾಗಿ ಸಂಯೋಜನೆ ಮತ್ತು ಹಾಟ್-ರಿಲೋಡ್
```
npm run serve
```
### ಉತ್ಪಾದನೆಗಾಗಿ ಸಂಯೋಜನೆ ಮತ್ತು ಸಂಕ್ಷಿಪ್ತಗೊಳಿಸುವಿಕೆ
```
npm run build
```
### ಫೈಲ್‌ಗಳನ್ನು ಲಿಂಟ್ ಮಾಡಿ ಸರಿಪಡಿಸುವಿಕೆ
```
npm run lint
```
### ಸಂರಚನೆಯನ್ನು ಕಸ್ಟಮೈಸ್ ಮಾಡುವುದು
[Configuration Reference](https://cli.vuejs.org/config/) ನೋಡಿ.
ಕ್ರೆಡಿಟ್ಸ್: ಈ ಪ್ರಶ್ನೋತ್ತರ ಅಪ್ಲಿಕೇಶನ್‌ನ ಮೂಲ ಆವೃತ್ತಿಗೆ ಧನ್ಯವಾದಗಳು: https://github.com/arpan45/simple-quiz-vue
## ಅಜೂರ್‌ಗೆ ನಿಯೋಜಿಸುವುದು
ನಿಮಗೆ ಪ್ರಾರಂಭಿಸಲು ಸಹಾಯ ಮಾಡುವ ಹಂತ ಹಂತದ ಮಾರ್ಗದರ್ಶಿ ಇಲ್ಲಿದೆ:
1. ಗಿಥಬ್ ರೆಪೊಸಿಟರಿಯನ್ನು ಫೋರ್ಕ್ ಮಾಡಿ
ನಿಮ್ಮ ಸ್ಥಿರ ವೆಬ್ ಅಪ್ಲಿಕೇಶನ್ ಕೋಡ್ ನಿಮ್ಮ ಗಿಥಬ್ ರೆಪೊಸಿಟರಿಯಲ್ಲಿ ಇರಬೇಕು. ಈ ರೆಪೊಸಿಟರಿಯನ್ನು ಫೋರ್ಕ್ ಮಾಡಿ.
2. ಅಜೂರ್ ಸ್ಥಿರ ವೆಬ್ ಅಪ್ಲಿಕೇಶನ್ ಸೃಷ್ಟಿಸಿ
- [ಅಜೂರ್ ಖಾತೆ](http://azure.microsoft.com) ಸೃಷ್ಟಿಸಿ
- [ಅಜೂರ್ ಪೋರ್ಟಲ್](https://portal.azure.com) ಗೆ ಹೋಗಿ
- “Create a resource” ಕ್ಲಿಕ್ ಮಾಡಿ ಮತ್ತು “Static Web App” ಅನ್ನು ಹುಡುಕಿ.
- “Create” ಕ್ಲಿಕ್ ಮಾಡಿ.
3. ಸ್ಥಿರ ವೆಬ್ ಅಪ್ಲಿಕೇಶನ್ ಅನ್ನು ಸಂರಚಿಸಿ
- ಮೂಲಭೂತಗಳು: ಸಬ್ಸ್ಕ್ರಿಪ್ಷನ್: ನಿಮ್ಮ ಅಜೂರ್ ಸಬ್ಸ್ಕ್ರಿಪ್ಷನ್ ಆಯ್ಕೆಮಾಡಿ.
- ರಿಸೋರ್ಸ್ ಗ್ರೂಪ್: ಹೊಸ ರಿಸೋರ್ಸ್ ಗ್ರೂಪ್ ಸೃಷ್ಟಿಸಿ ಅಥವಾ ಇತ್ತೀಚಿನದನ್ನು ಬಳಸಿ.
- ಹೆಸರು: ನಿಮ್ಮ ಸ್ಥಿರ ವೆಬ್ ಅಪ್ಲಿಕೇಶನ್‌ಗೆ ಹೆಸರು ನೀಡಿ.
- ಪ್ರದೇಶ: ನಿಮ್ಮ ಬಳಕೆದಾರರಿಗೆ ಸಮೀಪದ ಪ್ರದೇಶವನ್ನು ಆಯ್ಕೆಮಾಡಿ.
- #### ನಿಯೋಜನೆ ವಿವರಗಳು:
- ಮೂಲ: “GitHub” ಆಯ್ಕೆಮಾಡಿ.
- GitHub ಖಾತೆ: ಅಜೂರ್‌ಗೆ ನಿಮ್ಮ GitHub ಖಾತೆಯನ್ನು ಪ್ರವೇಶಿಸಲು ಅನುಮತಿಸಿ.
- ಸಂಸ್ಥೆ: ನಿಮ್ಮ GitHub ಸಂಸ್ಥೆಯನ್ನು ಆಯ್ಕೆಮಾಡಿ.
- ರೆಪೊಸಿಟರಿ: ನಿಮ್ಮ ಸ್ಥಿರ ವೆಬ್ ಅಪ್ಲಿಕೇಶನ್ ಹೊಂದಿರುವ ರೆಪೊಸಿಟರಿಯನ್ನು ಆಯ್ಕೆಮಾಡಿ.
- ಶಾಖೆ: ನೀವು ನಿಯೋಜಿಸಲು ಬಯಸುವ ಶಾಖೆಯನ್ನು ಆಯ್ಕೆಮಾಡಿ.
- #### ನಿರ್ಮಾಣ ವಿವರಗಳು:
- ನಿರ್ಮಾಣ ಪೂರ್ವನಿಯೋಜನೆಗಳು: ನಿಮ್ಮ ಅಪ್ಲಿಕೇಶನ್ ನಿರ್ಮಿತವಾಗಿರುವ ಫ್ರೇಮ್ವರ್ಕ್ ಆಯ್ಕೆಮಾಡಿ (ಉದಾ: React, Angular, Vue, ಇತ್ಯಾದಿ).
- ಅಪ್ಲಿಕೇಶನ್ ಸ್ಥಳ: ನಿಮ್ಮ ಅಪ್ಲಿಕೇಶನ್ ಕೋಡ್ ಇರುವ ಫೋಲ್ಡರ್ ಸೂಚಿಸಿ (ಉದಾ: / ಮೂಲದಲ್ಲಿ ಇದ್ದರೆ).
- API ಸ್ಥಳ: ನೀವು API ಹೊಂದಿದ್ದರೆ, ಅದರ ಸ್ಥಳವನ್ನು ಸೂಚಿಸಿ (ಐಚ್ಛಿಕ).
- ಔಟ್‌ಪುಟ್ ಸ್ಥಳ: ನಿರ್ಮಾಣ ಔಟ್‌ಪುಟ್ ಉತ್ಪಾದನೆಯಾಗುವ ಫೋಲ್ಡರ್ ಸೂಚಿಸಿ (ಉದಾ: build ಅಥವಾ dist).
4. ಪರಿಶೀಲಿಸಿ ಮತ್ತು ಸೃಷ್ಟಿಸಿ
ನಿಮ್ಮ ಸೆಟ್ಟಿಂಗ್‌ಗಳನ್ನು ಪರಿಶೀಲಿಸಿ ಮತ್ತು “Create” ಕ್ಲಿಕ್ ಮಾಡಿ. ಅಜೂರ್ ಅಗತ್ಯವಿರುವ ಸಂಪನ್ಮೂಲಗಳನ್ನು ಸಿದ್ಧಪಡಿಸಿ ನಿಮ್ಮ ರೆಪೊಸಿಟರಿಯಲ್ಲಿ GitHub Actions ವರ್ಕ್‌ಫ್ಲೋವನ್ನು ಸೃಷ್ಟಿಸುತ್ತದೆ.
5. GitHub Actions ವರ್ಕ್‌ಫ್ಲೋ
ಅಜೂರ್ ಸ್ವಯಂಚಾಲಿತವಾಗಿ ನಿಮ್ಮ ರೆಪೊಸಿಟರಿಯಲ್ಲಿ GitHub Actions ವರ್ಕ್‌ಫ್ಲೋ ಫೈಲ್ (.github/workflows/azure-static-web-apps-<name>.yml) ಅನ್ನು ಸೃಷ್ಟಿಸುತ್ತದೆ. ಈ ವರ್ಕ್‌ಫ್ಲೋ ನಿರ್ಮಾಣ ಮತ್ತು ನಿಯೋಜನೆ ಪ್ರಕ್ರಿಯೆಯನ್ನು ನಿರ್ವಹಿಸುತ್ತದೆ.
6. ನಿಯೋಜನೆಯನ್ನು ಮೇಲ್ವಿಚಾರಣೆ ಮಾಡಿ
ನಿಮ್ಮ GitHub ರೆಪೊಸಿಟರಿಯಲ್ಲಿ “Actions” ಟ್ಯಾಬ್‌ಗೆ ಹೋಗಿ.
ನೀವು ಒಂದು ವರ್ಕ್‌ಫ್ಲೋ ಚಲಿಸುತ್ತಿರುವುದನ್ನು ನೋಡಬಹುದು. ಈ ವರ್ಕ್‌ಫ್ಲೋ ನಿಮ್ಮ ಸ್ಥಿರ ವೆಬ್ ಅಪ್ಲಿಕೇಶನ್ ಅನ್ನು ಅಜೂರ್‌ಗೆ ನಿರ್ಮಿಸಿ ನಿಯೋಜಿಸುತ್ತದೆ.
ವರ್ಕ್‌ಫ್ಲೋ ಪೂರ್ಣಗೊಂಡ ನಂತರ, ನಿಮ್ಮ ಅಪ್ಲಿಕೇಶನ್ ನೀಡಲಾದ ಅಜೂರ್ URL ನಲ್ಲಿ ಲೈವ್ ಆಗಿರುತ್ತದೆ.
### ಉದಾಹರಣೆಯ ವರ್ಕ್‌ಫ್ಲೋ ಫೈಲ್
GitHub Actions ವರ್ಕ್‌ಫ್ಲೋ ಫೈಲ್ ಹೇಗಿರಬಹುದು ಎಂಬ ಉದಾಹರಣೆ ಇಲ್ಲಿದೆ:
name: Azure Static Web Apps CI/CD
```
on:
push:
branches:
- main
pull_request:
types: [opened, synchronize, reopened, closed]
branches:
- main
jobs:
build_and_deploy_job:
runs-on: ubuntu-latest
name: Build and Deploy Job
steps:
- uses: actions/checkout@v2
- name: Build And Deploy
id: builddeploy
uses: Azure/static-web-apps-deploy@v1
with:
azure_static_web_apps_api_token: ${{ secrets.AZURE_STATIC_WEB_APPS_API_TOKEN }}
repo_token: ${{ secrets.GITHUB_TOKEN }}
action: "upload"
app_location: "quiz-app" # App source code path
api_location: ""API source code path optional
output_location: "dist" #Built app content directory - optional
```
### ಹೆಚ್ಚುವರಿ ಸಂಪನ್ಮೂಲಗಳು
- [Azure Static Web Apps Documentation](https://learn.microsoft.com/azure/static-web-apps/getting-started)
- [GitHub Actions Documentation](https://docs.github.com/actions/use-cases-and-examples/deploying/deploying-to-azure-static-web-app)
---
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
**ಅಸ್ವೀಕಾರ**:
ಈ ದಸ್ತಾವೇಜು [Co-op Translator](https://github.com/Azure/co-op-translator) ಎಂಬ AI ಅನುವಾದ ಸೇವೆಯನ್ನು ಬಳಸಿ ಅನುವಾದಿಸಲಾಗಿದೆ. ನಾವು ನಿಖರತೆಯಿಗಾಗಿ ಪ್ರಯತ್ನಿಸುತ್ತಿದ್ದರೂ, ಸ್ವಯಂಚಾಲಿತ ಅನುವಾದಗಳಲ್ಲಿ ತಪ್ಪುಗಳು ಅಥವಾ ಅಸತ್ಯತೆಗಳು ಇರಬಹುದು ಎಂದು ದಯವಿಟ್ಟು ಗಮನಿಸಿ. ಮೂಲ ಭಾಷೆಯಲ್ಲಿರುವ ಮೂಲ ದಸ್ತಾವೇಜನ್ನು ಅಧಿಕೃತ ಮೂಲವಾಗಿ ಪರಿಗಣಿಸಬೇಕು. ಮಹತ್ವದ ಮಾಹಿತಿಗಾಗಿ, ವೃತ್ತಿಪರ ಮಾನವ ಅನುವಾದವನ್ನು ಶಿಫಾರಸು ಮಾಡಲಾಗುತ್ತದೆ. ಈ ಅನುವಾದ ಬಳಕೆಯಿಂದ ಉಂಟಾಗುವ ಯಾವುದೇ ತಪ್ಪು ಅರ್ಥಮಾಡಿಕೊಳ್ಳುವಿಕೆ ಅಥವಾ ತಪ್ಪು ವಿವರಣೆಗಳಿಗೆ ನಾವು ಹೊಣೆಗಾರರಾಗುವುದಿಲ್ಲ.
<!-- CO-OP TRANSLATOR DISCLAIMER END -->

@ -0,0 +1,23 @@
<!--
CO_OP_TRANSLATOR_METADATA:
{
"original_hash": "3a848466cb63aff1a93411affb152c2a",
"translation_date": "2025-12-19T13:32:13+00:00",
"source_file": "sketchnotes/README.md",
"language_code": "kn"
}
-->
ಎಲ್ಲಾ ಸ್ಕೆಚ್‌ನೋಟ್ಗಳನ್ನು ಇಲ್ಲಿ ಕಂಡುಹಿಡಿಯಿರಿ!
## ಕ್ರೆಡಿಟ್ಸ್
ನಿತ್ಯ ನಾರಸಿಂಹನ್, ಕಲಾವಿದ
![roadmap sketchnote](../../../translated_images/00-Roadmap.4905d6567dff47532b9bfb8e0b8980fc6b0b1292eebb24181c1a9753b33bc0f5.kn.png)
---
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
**ಅಸ್ವೀಕಾರ**:
ಈ ದಸ್ತಾವೇಜು [Co-op Translator](https://github.com/Azure/co-op-translator) ಎಂಬ AI ಅನುವಾದ ಸೇವೆಯನ್ನು ಬಳಸಿ ಅನುವಾದಿಸಲಾಗಿದೆ. ನಾವು ಶುದ್ಧತೆಯತ್ತ ಪ್ರಯತ್ನಿಸುತ್ತಿದ್ದರೂ, ಸ್ವಯಂಚಾಲಿತ ಅನುವಾದಗಳಲ್ಲಿ ತಪ್ಪುಗಳು ಅಥವಾ ಅಸತ್ಯತೆಗಳು ಇರಬಹುದು ಎಂದು ದಯವಿಟ್ಟು ಗಮನಿಸಿ. ಮೂಲ ಭಾಷೆಯಲ್ಲಿರುವ ಮೂಲ ದಸ್ತಾವೇಜನ್ನು ಅಧಿಕೃತ ಮೂಲವೆಂದು ಪರಿಗಣಿಸಬೇಕು. ಮಹತ್ವದ ಮಾಹಿತಿಗಾಗಿ, ವೃತ್ತಿಪರ ಮಾನವ ಅನುವಾದವನ್ನು ಶಿಫಾರಸು ಮಾಡಲಾಗುತ್ತದೆ. ಈ ಅನುವಾದ ಬಳಕೆಯಿಂದ ಉಂಟಾಗುವ ಯಾವುದೇ ತಪ್ಪು ಅರ್ಥಮಾಡಿಕೊಳ್ಳುವಿಕೆ ಅಥವಾ ತಪ್ಪು ವಿವರಣೆಗಳಿಗೆ ನಾವು ಹೊಣೆಗಾರರಾಗುವುದಿಲ್ಲ.
<!-- CO-OP TRANSLATOR DISCLAIMER END -->

@ -0,0 +1,178 @@
<!--
CO_OP_TRANSLATOR_METADATA:
{
"original_hash": "43212cc1ac137b7bb1dcfb37ca06b0f4",
"translation_date": "2025-12-19T13:37:59+00:00",
"source_file": "1-Introduction/01-defining-data-science/README.md",
"language_code": "ml"
}
-->
# ഡാറ്റാ സയൻസ് നിർവചിക്കൽ
| ![ Sketchnote by [(@sketchthedocs)](https://sketchthedocs.dev) ](../../sketchnotes/01-Definitions.png) |
| :----------------------------------------------------------------------------------------------------: |
| ഡാറ്റാ സയൻസ് നിർവചിക്കൽ - _Sketchnote by [@nitya](https://twitter.com/nitya)_ |
---
[![Defining Data Science Video](../../../../translated_images/video-def-ds.6623ee2392ef1abf6d7faf3fad10a4163642811749da75f44e35a5bb121de15c.ml.png)](https://youtu.be/beZ7Mb_oz9I)
## [പ്രീ-ലെക്ചർ ക്വിസ്](https://ff-quizzes.netlify.app/en/ds/quiz/0)
## ഡാറ്റ എന്താണ്?
നമ്മുടെ ദൈനംദിന ജീവിതത്തിൽ, നാം നിരന്തരം ഡാറ്റയാൽ ചുറ്റപ്പെട്ടിരിക്കുന്നു. നിങ്ങൾ ഇപ്പോൾ വായിക്കുന്ന എഴുത്ത് ഡാറ്റയാണ്. നിങ്ങളുടെ സ്മാർട്ട്ഫോണിലുള്ള സുഹൃത്തുക്കളുടെ ഫോൺ നമ്പറുകളുടെ പട്ടിക ഡാറ്റയാണ്, കൂടാതെ നിങ്ങളുടെ വാച്ചിൽ കാണിക്കുന്ന നിലവിലെ സമയവും ഡാറ്റയാണ്. മനുഷ്യരായി, നാം സ്വാഭാവികമായി ഡാറ്റ ഉപയോഗിച്ച് പ്രവർത്തിക്കുന്നു, ഉദാഹരണത്തിന് നമുക്ക് ഉള്ള പണം എണ്ണുകയോ സുഹൃത്തുക്കൾക്ക് കത്ത് എഴുതുകയോ ചെയ്യുന്നു.
എങ്കിലും, കമ്പ്യൂട്ടറുകളുടെ സൃഷ്ടിയോടെ ഡാറ്റ വളരെ പ്രധാനപ്പെട്ടതായി മാറി. കമ്പ്യൂട്ടറുകളുടെ പ്രധാന പങ്ക് കണക്കുകൂട്ടലുകൾ നടത്തുകയാണ്, പക്ഷേ അവ പ്രവർത്തിക്കാൻ ഡാറ്റ ആവശ്യമാണ്. അതിനാൽ, കമ്പ്യൂട്ടറുകൾ ഡാറ്റ എങ്ങനെ സംഭരിക്കുകയും പ്രോസസ്സ് ചെയ്യുകയും ചെയ്യുന്നതെന്ന് നമുക്ക് മനസ്സിലാക്കേണ്ടതുണ്ട്.
ഇന്റർനെറ്റിന്റെ ഉദയം കൊണ്ട്, കമ്പ്യൂട്ടറുകളുടെ ഡാറ്റ കൈകാര്യം ചെയ്യുന്ന ഉപകരണങ്ങളായ പങ്ക് വർദ്ധിച്ചു. നിങ്ങൾ ചിന്തിച്ചാൽ, നാം ഇപ്പോൾ കമ്പ്യൂട്ടറുകൾ കണക്കുകൂട്ടലുകൾക്കേക്കാൾ ഡാറ്റ പ്രോസസ്സിംഗിനും ആശയവിനിമയത്തിനും കൂടുതൽ ഉപയോഗിക്കുന്നു. നാം സുഹൃത്തുക്കൾക്ക് ഇമെയിൽ എഴുതുമ്പോഴും ഇന്റർനെറ്റിൽ വിവരങ്ങൾ തിരയുമ്പോഴും - നാം അടിസ്ഥാനപരമായി ഡാറ്റ സൃഷ്ടിക്കുകയും, സംഭരിക്കുകയും, പ്രേഷിപ്പിക്കുകയും, കൈകാര്യം ചെയ്യുകയും ചെയ്യുന്നു.
> നിങ്ങൾക്ക് ഓർമ്മയുണ്ടോ, അവസാനമായി കമ്പ്യൂട്ടർ ഉപയോഗിച്ച് യഥാർത്ഥത്തിൽ എന്തെങ്കിലും കണക്കുകൂട്ടിയത്?
## ഡാറ്റാ സയൻസ് എന്താണ്?
[വിക്കിപീഡിയയിൽ](https://en.wikipedia.org/wiki/Data_science), **ഡാറ്റാ സയൻസ്** എന്നത് *സംഘടിതവും അസംഘടിതവുമായ ഡാറ്റയിൽ നിന്നുള്ള അറിവും洞察ങ്ങളും ശാസ്ത്രീയ രീതികൾ ഉപയോഗിച്ച് എടുക്കുകയും, ഡാറ്റയിൽ നിന്നുള്ള അറിവും പ്രായോഗിക洞察ങ്ങളും വ്യാപകമായ പ്രയോഗ മേഖലകളിൽ പ്രയോഗിക്കുകയും ചെയ്യുന്ന ശാസ്ത്രീയ മേഖലയായി* നിർവചിച്ചിരിക്കുന്നു.
ഈ നിർവചനത്തിൽ ഡാറ്റാ സയൻസിന്റെ താഴെപ്പറയുന്ന പ്രധാന അംശങ്ങൾ ഉണ്ട്:
* ഡാറ്റാ സയൻസിന്റെ പ്രധാന ലക്ഷ്യം ഡാറ്റയിൽ നിന്നുള്ള **അറിവ്** എടുക്കുക, മറ്റൊരു വാക്കിൽ - ഡാറ്റ **അറിയുക**, ചില മറഞ്ഞിരിക്കുന്ന ബന്ധങ്ങൾ കണ്ടെത്തുക, ഒരു **മോഡൽ** നിർമ്മിക്കുക.
* ഡാറ്റാ സയൻസ് **ശാസ്ത്രീയ രീതികൾ** ഉപയോഗിക്കുന്നു, ഉദാഹരണത്തിന് സാധ്യതാ സിദ്ധാന്തവും സ്ഥിതിവിവരശാസ്ത്രവും. യഥാർത്ഥത്തിൽ, *ഡാറ്റാ സയൻസ്* എന്ന പദം ആദ്യമായി പരിചയപ്പെടുത്തിയപ്പോൾ, ചിലർ ഡാറ്റാ സയൻസ് സ്ഥിതിവിവരശാസ്ത്രത്തിന് പുതിയ ഒരു ആകർഷകമായ പേര് മാത്രമാണെന്ന് വാദിച്ചിരുന്നു. ഇപ്പോൾ ഈ മേഖല വളരെ വ്യാപകമാണെന്ന് വ്യക്തമാണ്.
* ലഭിച്ച അറിവ് ചില **പ്രായോഗിക洞察ങ്ങൾ** ഉൽപ്പാദിപ്പിക്കാൻ ഉപയോഗിക്കണം, അതായത് യഥാർത്ഥ ബിസിനസ് സാഹചര്യങ്ങളിൽ പ്രയോഗിക്കാവുന്ന洞察ങ്ങൾ.
* നാം **സംഘടിത**യും **അസംഘടിത**വുമായ ഡാറ്റയിൽ പ്രവർത്തിക്കാൻ കഴിയണം. കോഴ്സിന്റെ പിന്നീട് ഭാഗങ്ങളിൽ നാം ഡാറ്റയുടെ വ്യത്യസ്ത തരം വിശദീകരിക്കും.
* **പ്രയോഗ മേഖല** ഒരു പ്രധാന ആശയമാണ്, ഡാറ്റാ സയന്റിസ്റ്റുകൾക്ക് സാധാരണയായി പ്രശ്ന മേഖലയിൽ കുറച്ച് പരിചയം വേണം, ഉദാഹരണത്തിന്: ധനകാര്യ, മെഡിസിൻ, മാർക്കറ്റിംഗ് തുടങ്ങിയവ.
> ഡാറ്റാ സയൻസിന്റെ മറ്റൊരു പ്രധാന അംശം ഡാറ്റ എങ്ങനെ ശേഖരിക്കാമെന്ന്, സംഭരിക്കാമെന്ന്, കമ്പ്യൂട്ടറുകൾ ഉപയോഗിച്ച് എങ്ങനെ പ്രവർത്തിക്കാമെന്ന് പഠിക്കുന്നതാണ്. സ്ഥിതിവിവരശാസ്ത്രം ഗണിത അടിസ്ഥാനങ്ങൾ നൽകുമ്പോൾ, ഡാറ്റാ സയൻസ് ഗണിത ആശയങ്ങൾ പ്രയോഗിച്ച് ഡാറ്റയിൽ നിന്നുള്ള洞察ങ്ങൾ എടുക്കുന്നു.
ഡാറ്റാ സയൻസ് കാണാനുള്ള ഒരു മാർഗം ([ജിം ഗ്രേ](https://en.wikipedia.org/wiki/Jim_Gray_(computer_scientist)) എന്നവനോട് ബന്ധപ്പെട്ടത്) ഡാറ്റാ സയൻസ് ഒരു വ്യത്യസ്ത ശാസ്ത്രപരമായ പാരഡൈം ആയി കാണുക എന്നതാണ്:
* **പരീക്ഷണാത്മക** - പ്രധാനമായും നിരീക്ഷണങ്ങളും പരീക്ഷണ ഫലങ്ങളും ആശ്രയിക്കുന്നു
* **സിദ്ധാന്തപരമായ** - നിലവിലുള്ള ശാസ്ത്രീയ അറിവിൽ നിന്നുള്ള പുതിയ ആശയങ്ങൾ ഉദയം ചെയ്യുന്നു
* **കമ്പ്യൂട്ടേഷണൽ** - ചില കമ്പ്യൂട്ടേഷൻ പരീക്ഷണങ്ങളുടെ അടിസ്ഥാനത്തിൽ പുതിയ സിദ്ധാന്തങ്ങൾ കണ്ടെത്തുന്നു
* **ഡാറ്റാ-ഡ്രിവൻ** - ഡാറ്റയിൽ ബന്ധങ്ങളും മാതൃകകളും കണ്ടെത്തുന്നതിൽ അടിസ്ഥാനമാക്കിയുള്ളത്
## മറ്റ് ബന്ധപ്പെട്ട മേഖലകൾ
ഡാറ്റ വ്യാപകമായതിനാൽ, ഡാറ്റാ സയൻസ് തന്നെ ഒരു വ്യാപകമായ മേഖലയാണ്, പല ശാസ്ത്രശാഖകളെയും സ്പർശിക്കുന്നു.
<dl>
<dt>ഡാറ്റാബേസുകൾ</dt>
<dd>
ഒരു പ്രധാന പരിഗണനയാണ് ഡാറ്റ എങ്ങനെ <b>സംഭരിക്കണം</b>, അതായത് അതിനെ എങ്ങനെ ഘടിപ്പിക്കണം എന്നത്, അതിലൂടെ വേഗത്തിൽ പ്രോസസ്സ് ചെയ്യാൻ കഴിയും. വിവിധ തരത്തിലുള്ള ഡാറ്റാബേസുകൾ ഉണ്ട്, അവ ഘടിതവും അസംഘടിതവുമായ ഡാറ്റ സംഭരിക്കുന്നു, അവയെക്കുറിച്ച് <a href="../../2-Working-With-Data/README.md">നമ്മുടെ കോഴ്സിൽ പരിഗണിക്കും</a>.
</dd>
<dt>ബിഗ് ഡാറ്റ</dt>
<dd>
പലപ്പോഴും വളരെ വലിയ അളവിലുള്ള ഡാറ്റ സംഭരിക്കുകയും പ്രോസസ്സ് ചെയ്യുകയും ചെയ്യേണ്ടതുണ്ട്, സാധാരണയായി ലളിതമായ ഘടനയുള്ളത്. ഈ ഡാറ്റ കമ്പ്യൂട്ടർ ക്ലസ്റ്ററിൽ വിതരണം ചെയ്ത് സംഭരിക്കുകയും കാര്യക്ഷമമായി പ്രോസസ്സ് ചെയ്യുന്നതിനുള്ള പ്രത്യേക സമീപനങ്ങളും ഉപകരണങ്ങളും ഉണ്ട്.
</dd>
<dt>മെഷീൻ ലേണിംഗ്</dt>
<dd>
ഡാറ്റ മനസ്സിലാക്കാനുള്ള ഒരു മാർഗം ഒരു മോഡൽ <b>നിർമിക്കുക</b> എന്നതാണ്, അത് ആഗ്രഹിക്കുന്ന ഫലം പ്രവചിക്കാൻ കഴിയും. ഡാറ്റയിൽ നിന്നുള്ള മോഡലുകൾ വികസിപ്പിക്കുന്നത് <b>മെഷീൻ ലേണിംഗ്</b> എന്നാണ് വിളിക്കുന്നത്. ഇതിനെക്കുറിച്ച് കൂടുതൽ അറിയാൻ ഞങ്ങളുടെ <a href="https://aka.ms/ml-beginners">Machine Learning for Beginners</a> പാഠ്യപദ്ധതി കാണാം.
</dd>
<dt>കൃത്രിമ ബുദ്ധിമുട്ട്</dt>
<dd>
മെഷീൻ ലേണിംഗിന്റെ ഒരു മേഖലയായ കൃത്രിമ ബുദ്ധിമുട്ട് (AI) ഡാറ്റയിൽ ആശ്രയിച്ചിരിക്കുന്നു, കൂടാതെ മനുഷ്യ ചിന്താ പ്രക്രിയകൾ അനുകരിക്കുന്ന ഉയർന്ന സങ്കീർണ്ണതയുള്ള മോഡലുകൾ നിർമ്മിക്കുന്നതും ഉൾപ്പെടുന്നു. AI രീതികൾ അസംഘടിത ഡാറ്റ (ഉദാഹരണത്തിന് സ്വാഭാവിക ഭാഷ) ഘടിത洞察ങ്ങളായി മാറ്റാൻ സാധിക്കുന്നു.
</dd>
<dt>ദൃശ്യവൽക്കരണം</dt>
<dd>
വലിയ അളവിലുള്ള ഡാറ്റ മനുഷ്യനായി മനസ്സിലാക്കാൻ ബുദ്ധിമുട്ടാണ്, പക്ഷേ ആ ഡാറ്റ ഉപയോഗിച്ച് ഉപകാരപ്രദമായ ദൃശ്യവൽക്കരണങ്ങൾ സൃഷ്ടിച്ചാൽ, നാം ഡാറ്റയെ കൂടുതൽ മനസ്സിലാക്കുകയും ചില നിഗമനങ്ങൾ വരുത്തുകയും ചെയ്യാം. അതിനാൽ, വിവരങ്ങൾ ദൃശ്യവൽക്കരിക്കുന്ന നിരവധി മാർഗങ്ങൾ അറിയുന്നത് പ്രധാനമാണ് - ഇത് ഞങ്ങളുടെ കോഴ്സിന്റെ <a href="../../3-Data-Visualization/README.md">മൂന്നാം ഭാഗം</a>യിൽ ഉൾപ്പെടും. ബന്ധപ്പെട്ട മേഖലകൾക്ക് <b>ഇൻഫോഗ്രാഫിക്സ്</b>യും, പൊതുവായി <b>മനുഷ്യ-കമ്പ്യൂട്ടർ ഇടപെടൽ</b>യും ഉൾപ്പെടുന്നു.
</dd>
</dl>
## ഡാറ്റയുടെ തരം
നാം ഇതിനകം പറഞ്ഞതുപോലെ, ഡാറ്റ എല്ലായിടത്തും ഉണ്ട്. നമുക്ക് അത് ശരിയായ രീതിയിൽ പിടിച്ചെടുക്കേണ്ടതാണ്! **സംഘടിത**വും **അസംഘടിത**വുമായ ഡാറ്റ തമ്മിൽ വ്യത്യാസം കാണുന്നത് ഉപകാരപ്രദമാണ്. മുൻപുള്ളത് സാധാരണയായി ഒരു നന്നായി ഘടിപ്പിച്ച രൂപത്തിലാണ് പ്രതിനിധാനം ചെയ്യപ്പെടുന്നത്, സാധാരണയായി ഒരു പട്ടിക അല്ലെങ്കിൽ പല പട്ടികകളായി, പിന്നെ അസംഘടിത ഡാറ്റ ഫയലുകളുടെ ശേഖരമാണ്. ചിലപ്പോൾ നാം **അർദ്ധഘടിത** ഡാറ്റയെക്കുറിച്ച് സംസാരിക്കാം, അതിന് ചില ഘടനയുണ്ടെങ്കിലും അത് വളരെ വ്യത്യസ്തമായിരിക്കും.
| ഘടിതം | അർദ്ധഘടിതം | അസംഘടിതം |
| ---------------------------------------------------------------------------- | ---------------------------------------------------------------------------------------------- | --------------------------------------- |
| ആളുകളുടെ ഫോൺ നമ്പറുകളുള്ള പട്ടിക | ലിങ്കുകളുള്ള വിക്കിപീഡിയ പേജുകൾ | എൻസൈക്ലോപീഡിയ ബ്രിട്ടാനിക്കയുടെ എഴുത്ത് |
| കഴിഞ്ഞ 20 വർഷം ഓരോ മിനിറ്റിലും ഒരു കെട്ടിടത്തിലെ എല്ലാ മുറികളിലെ താപനില | ലേഖകരും പ്രസിദ്ധീകരണ തീയതിയും സാരാംശവും ഉള്ള JSON ഫോർമാറ്റിലുള്ള ശാസ്ത്രീയ ലേഖനങ്ങളുടെ ശേഖരം | കോർപ്പറേറ്റ് ഡോക്യുമെന്റുകളുള്ള ഫയൽ ഷെയർ |
| കെട്ടിടത്തിലേക്ക് പ്രവേശിക്കുന്ന എല്ലാ ആളുകളുടെ പ്രായവും ലിംഗവും സംബന്ധിച്ച ഡാറ്റ | ഇന്റർനെറ്റ് പേജുകൾ | നിരീക്ഷണ ക്യാമറയിൽ നിന്നുള്ള കച്ചവട വീഡിയോ ഫീഡ് |
## ഡാറ്റ എവിടെ നിന്ന് ലഭിക്കും
ഡാറ്റ ലഭിക്കുന്ന നിരവധി സ്രോതസ്സുകൾ ഉണ്ട്, അവയെല്ലാം പട്ടികപ്പെടുത്തുന്നത് അസാധ്യമാണ്! എങ്കിലും, നിങ്ങൾക്ക് ഡാറ്റ ലഭിക്കാവുന്ന ചില സാധാരണ സ്ഥലങ്ങൾ പറയാം:
* **സംഘടിത**
- **ഇന്റർനെറ്റ് ഓഫ് തിങ്സ്** (IoT), താപനില അല്ലെങ്കിൽ മർദ്ദം സെൻസറുകൾ പോലുള്ള വിവിധ സെൻസറുകളിൽ നിന്നുള്ള ഡാറ്റ ഉൾപ്പെടെ, വളരെ ഉപകാരപ്രദമായ ഡാറ്റ നൽകുന്നു. ഉദാഹരണത്തിന്, ഒരു ഓഫീസ് കെട്ടിടം IoT സെൻസറുകളാൽ സജ്ജമാക്കിയാൽ, ചെലവുകൾ കുറയ്ക്കാൻ താപനിലയും ലൈറ്റിംഗും സ്വയം നിയന്ത്രിക്കാം.
- **സർവേകൾ** ഉപഭോക്താക്കൾക്ക് വാങ്ങിയതിന് ശേഷം അല്ലെങ്കിൽ വെബ്‌സൈറ്റ് സന്ദർശിച്ചതിന് ശേഷം പൂരിപ്പിക്കാൻ പറയുന്നവ.
- **പ്രവർത്തന വിശകലനം** ഉദാഹരണത്തിന്, ഒരു ഉപയോക്താവ് ഒരു സൈറ്റിൽ എത്ര ആഴത്തിൽ പോകുന്നു, സൈറ്റ് വിടാനുള്ള സാധാരണ കാരണം എന്താണെന്ന് മനസ്സിലാക്കാൻ സഹായിക്കും.
* **അസംഘടിത**
- **എഴുത്തുകൾ**洞察ങ്ങളുടെ സമൃദ്ധമായ സ്രോതസ്സാകാം, ഉദാഹരണത്തിന് ഒരു മൊത്തം **ഭാവനാ സ്കോർ**, അല്ലെങ്കിൽ പ്രധാനവാക്കുകളും സാംവേദനാത്മക അർത്ഥവും എടുക്കൽ.
- **ചിത്രങ്ങൾ** അല്ലെങ്കിൽ **വീഡിയോ**. നിരീക്ഷണ ക്യാമറയിൽ നിന്നുള്ള ഒരു വീഡിയോ റോഡിലെ ഗതാഗതം അളക്കാനും ഗതാഗത തടസ്സങ്ങളെക്കുറിച്ച് ആളുകളെ അറിയിക്കാനും ഉപയോഗിക്കാം.
- വെബ് സെർവർ **ലോഗുകൾ** നമ്മുടെ സൈറ്റിലെ ഏത് പേജുകൾ ഏറ്റവും അധികം സന്ദർശിക്കപ്പെടുന്നു, എത്ര സമയം ചെലവഴിക്കുന്നു എന്നിവ മനസ്സിലാക്കാൻ ഉപയോഗിക്കാം.
* അർദ്ധഘടിത
- **സോഷ്യൽ നെറ്റ്‌വർക്ക്** ഗ്രാഫുകൾ ഉപയോക്തൃ വ്യക്തിത്വങ്ങളും വിവരങ്ങൾ പ്രചരിപ്പിക്കുന്നതിലെ സാധ്യതകളും സംബന്ധിച്ച മികച്ച ഡാറ്റ സ്രോതസ്സുകളാകാം.
- ഒരു പാർട്ടിയിൽ നിന്നുള്ള നിരവധി ഫോട്ടോകൾ ഉണ്ടെങ്കിൽ, ഒരുമിച്ച് ഫോട്ടോ എടുക്കുന്ന ആളുകളുടെ ഗ്രാഫ് നിർമ്മിച്ച് **ഗ്രൂപ്പ് ഡൈനാമിക്സ്** ഡാറ്റ എടുക്കാൻ ശ്രമിക്കാം.
വിവിധ ഡാറ്റ സ്രോതസ്സുകൾ അറിയുന്നതിലൂടെ, ഡാറ്റാ സയൻസ് സാങ്കേതികവിദ്യകൾ പ്രയോഗിച്ച് സ്ഥിതിഗതികൾ കൂടുതൽ മനസ്സിലാക്കാനും ബിസിനസ് പ്രക്രിയകൾ മെച്ചപ്പെടുത്താനും നിങ്ങൾക്ക് വ്യത്യസ്ത സാഹചര്യങ്ങൾ ചിന്തിക്കാം.
## ഡാറ്റയുമായി നിങ്ങൾ ചെയ്യാൻ കഴിയുന്നത്
ഡാറ്റാ സയൻസിൽ, നാം ഡാറ്റയുടെ യാത്രയുടെ താഴെപ്പറയുന്ന ഘട്ടങ്ങളിൽ ശ്രദ്ധ കേന്ദ്രീകരിക്കുന്നു:
<dl>
<dt>1) ഡാറ്റ ശേഖരണം</dt>
<dd>
ആദ്യ ഘട്ടം ഡാറ്റ ശേഖരിക്കുകയാണ്. പലപ്പോഴും ഇത് നേരിട്ടുള്ള പ്രക്രിയയായിരിക്കാം, ഉദാഹരണത്തിന് ഒരു വെബ് ആപ്ലിക്കേഷനിൽ നിന്നുള്ള ഡാറ്റ ഒരു ഡാറ്റാബേസിലേക്ക് വരുന്നത് പോലുള്ളത്, ചിലപ്പോൾ പ്രത്യേക സാങ്കേതിക വിദ്യകൾ ഉപയോഗിക്കേണ്ടി വരും. ഉദാഹരണത്തിന്, IoT സെൻസറുകളിൽ നിന്നുള്ള ഡാറ്റ വളരെ വലുതായിരിക്കാം, അതിനാൽ എല്ലാ ഡാറ്റയും കൂടുതൽ പ്രോസസ്സിംഗിന് മുമ്പ് ശേഖരിക്കാൻ IoT ഹബ് പോലുള്ള ബഫറിംഗ് എന്റ്പോയിന്റുകൾ ഉപയോഗിക്കുന്നത് നല്ല പ്രക്രിയയാണ്.
</dd>
<dt>2) ഡാറ്റ സംഭരണം</dt>
<dd>
ഡാറ്റ സംഭരിക്കുന്നത് വെല്ലുവിളിയാകാം, പ്രത്യേകിച്ച് ബിഗ് ഡാറ്റയെക്കുറിച്ചാണ് സംസാരിക്കുന്നത്. ഡാറ്റ എങ്ങനെ സംഭരിക്കണമെന്ന് തീരുമാനിക്കുമ്പോൾ, ഭാവിയിൽ നിങ്ങൾ ഡാറ്റയെ എങ്ങനെ ക്വറി ചെയ്യണമെന്ന് മുൻകൂട്ടി കരുതുന്നത് ബുദ്ധിമുട്ടില്ല. ഡാറ്റ സംഭരിക്കുന്ന ചില മാർഗങ്ങൾ:
<ul>
<li>ഒരു റിലേഷണൽ ഡാറ്റാബേസ് പട്ടികകളുടെ ശേഖരം സംഭരിക്കുന്നു, അവയെ ക്വറി ചെയ്യാൻ SQL എന്ന പ്രത്യേക ഭാഷ ഉപയോഗിക്കുന്നു. സാധാരണയായി, പട്ടികകൾ സ്കീമകൾ എന്ന വ്യത്യസ്ത ഗ്രൂപ്പുകളായി ക്രമീകരിച്ചിരിക്കുന്നു. പലപ്പോഴും ഡാറ്റയുടെ യഥാർത്ഥ രൂപം സ്കീമയ്ക്ക് അനുയോജ്യമായി മാറ്റേണ്ടി വരും.</li>
<li><a href="https://en.wikipedia.org/wiki/NoSQL">NoSQL</a> ഡാറ്റാബേസ്, ഉദാഹരണത്തിന് <a href="https://azure.microsoft.com/services/cosmos-db/?WT.mc_id=academic-77958-bethanycheum">CosmosDB</a>, ഡാറ്റയിൽ സ്കീമകൾ നിർബന്ധമാക്കുന്നില്ല, കൂടുതൽ സങ്കീർണ്ണമായ ഡാറ്റ സംഭരിക്കാൻ അനുവദിക്കുന്നു, ഉദാഹരണത്തിന്, ഹയർആർക്കിക്കൽ JSON ഡോക്യുമെന്റുകൾ അല്ലെങ്കിൽ ഗ്രാഫുകൾ. എന്നാൽ NoSQL ഡാറ്റാബേസുകൾക്ക് SQL പോലുള്ള സമ്പന്നമായ ക്വറി കഴിവുകൾ ഇല്ല, കൂടാതെ റഫറൻഷ്യൽ ഇന്റഗ്രിറ്റി നിർബന്ധമാക്കാൻ കഴിയില്ല, അതായത് പട്ടികകളിലെ ഡാറ്റ എങ്ങനെ ഘടിപ്പിക്കപ്പെട്ടിരിക്കുന്നു എന്നതും പട്ടികകളിലെ ബന്ധങ്ങൾ നിയന്ത്രിക്കുന്ന നിയമങ്ങളും.</li>
<li><a href="https://en.wikipedia.org/wiki/Data_lake">ഡാറ്റാ ലേക്ക്</a> സംഭരണം കച്ചവട, അസംഘടിത രൂപത്തിലുള്ള വലിയ ഡാറ്റ ശേഖരങ്ങൾക്ക് ഉപയോഗിക്കുന്നു. ഡാറ്റാ ലേക്ക് സാധാരണയായി ബിഗ് ഡാറ്റയുമായി ഉപയോഗിക്കുന്നു, എല്ലാ ഡാറ്റയും ഒരു യന്ത്രത്തിൽ ഫിറ്റ് ചെയ്യാനാകാത്തപ്പോൾ, ക്ലസ്റ്റർ സർവറുകളുടെ കൂട്ടത്തിൽ സംഭരിക്കുകയും പ്രോസസ്സ് ചെയ്യുകയും ചെയ്യേണ്ടതുണ്ട്. <a href="https://en.wikipedia.org/wiki/Apache_Parquet">Parquet</a> ബിഗ് ഡാറ്റയുമായി ചേർന്ന് ഉപയോഗിക്കുന്ന ഡാറ്റ ഫോർമാറ്റാണ്.</li>
</ul>
</dd>
<dt>3) ഡാറ്റ പ്രോസസ്സിംഗ്</dt>
<dd>
ഡാറ്റയുടെ യാത്രയിലെ ഏറ്റവും രസകരമായ ഭാഗമാണ് ഇത്, യഥാർത്ഥ രൂപത്തിൽ നിന്നുള്ള ഡാറ്റ ദൃശ്യവൽക്കരണത്തിനും മോഡൽ പരിശീലനത്തിനും ഉപയോഗിക്കാവുന്ന രൂപത്തിലേക്ക് മാറ്റുന്നതാണ്. എഴുത്ത് അല്ലെങ്കിൽ ചിത്രങ്ങൾ പോലുള്ള അസംഘടിത ഡാറ്റ കൈകാര്യം ചെയ്യുമ്പോൾ, ഡാറ്റയിൽ നിന്നുള്ള <b>ഫീച്ചറുകൾ</b> എടുക്കാൻ ചില AI സാങ്കേതിക വിദ്യകൾ ഉപയോഗിക്കേണ്ടി വരാം, അതിലൂടെ അത് ഘടിത രൂപത്തിലേക്ക് മാറ്റുന്നു.
</dd>
<dt>4) ദൃശ്യവൽക്കരണം / മനുഷ്യ洞察ങ്ങൾ</dt>
<dd>
ഡാറ്റ മനസ്സിലാക്കാൻ പലപ്പോഴും അതിനെ ദൃശ്യവൽക്കരിക്കേണ്ടതുണ്ട്. വിവിധ ദൃശ്യവൽക്കരണ സാങ്കേതിക വിദ്യകൾ നമ്മുടെ ഉപകരണസഞ്ചയത്തിൽ ഉണ്ടെങ്കിൽ,洞察ം കണ്ടെത്താൻ ശരിയായ കാഴ്ച കണ്ടെത്താം. പലപ്പോഴും, ഒരു ഡാറ്റാ സയന്റിസ്റ്റ് ഡാറ്റയുമായി "കളിയാക്കണം", പല തവണ ദൃശ്യവൽക്കരിച്ച് ചില ബന്ധങ്ങൾ അന്വേഷിക്കണം. കൂടാതെ, നാം സ്ഥിതിവിവരശാസ്ത്ര സാങ്കേതിക വിദ്യകൾ ഉപയോഗിച്ച് ഒരു ഹിപോത്തസിസ് പരിശോധിക്കുകയോ ഡാറ്റയിലെ വിവിധ ഭാഗങ്ങൾ തമ്മിലുള്ള ബന്ധം തെളിയിക്കുകയോ ചെയ്യാം.
</dd>
<dt>5) പ്രവചന മോഡൽ പരിശീലനം</dt>
<dd>
ഡാറ്റാ സയൻസിന്റെ അന്തിമ ലക്ഷ്യം ഡാറ്റയുടെ അടിസ്ഥാനത്തിൽ തീരുമാനങ്ങൾ എടുക്കാനാകുക എന്നതാണ്, അതിനാൽ <a href="http://github.com/microsoft/ml-for-beginners">മെഷീൻ ലേണിംഗ്</a> സാങ്കേതിക വിദ്യകൾ ഉപയോഗിച്ച് പ്രവചന മോഡൽ നിർമ്മിക്കാൻ ആഗ്രഹിക്കാം. പിന്നീട് സമാന ഘടനകളുള്ള പുതിയ ഡാറ്റാ സെറ്റുകൾ ഉപയോഗിച്ച് പ്രവചനങ്ങൾ നടത്താൻ ഇത് ഉപയോഗിക്കാം.
</dd>
</dl>
തികച്ചും, യഥാർത്ഥ ഡാറ്റയെ ആശ്രയിച്ച് ചില ഘട്ടങ്ങൾ ഇല്ലാതിരിക്കാം (ഉദാഹരണത്തിന്, ഡാറ്റാബേസിൽ ഡാറ്റ ഇതിനകം ഉണ്ടെങ്കിൽ, അല്ലെങ്കിൽ മോഡൽ പരിശീലനം ആവശ്യമില്ലെങ്കിൽ), അല്ലെങ്കിൽ ചില ഘട്ടങ്ങൾ പല തവണ ആവർത്തിക്കപ്പെടാം (ഉദാഹരണത്തിന്, ഡാറ്റ പ്രോസസ്സിംഗ്).
## ഡിജിറ്റലൈസേഷൻയും ഡിജിറ്റൽ ട്രാൻസ്ഫർമേഷനും
കഴിഞ്ഞ ദശകത്തിൽ, പല ബിസിനസുകളും ബിസിനസ് തീരുമാനങ്ങൾ എടുക്കുമ്പോൾ ഡാറ്റയുടെ പ്രാധാന്യം മനസ്സിലാക്കാൻ തുടങ്ങി. ബിസിനസ് പ്രക്രിയകൾ ഡിജിറ്റൽ രൂപത്തിലേക്ക് മാറ്റി ഡാറ്റ ശേഖരിക്കുകയാണ് ആദ്യഘട്ടം, ഇതാണ് **ഡിജിറ്റലൈസേഷൻ** എന്ന് അറിയപ്പെടുന്നത്. ഈ ഡാറ്റയിൽ ഡാറ്റാ സയൻസ് സാങ്കേതിക വിദ്യകൾ പ്രയോഗിച്ച് തീരുമാനങ്ങൾ നയിക്കുന്നത് **ഡിജിറ്റൽ ട്രാൻസ്ഫർമേഷൻ** എന്ന് വിളിക്കുന്നു, ഇത് ഉൽപാദനക്ഷമതയിൽ വലിയ വർദ്ധനവുകൾ (അല്ലെങ്കിൽ ബിസിനസ് പിവോട്ട്) ഉണ്ടാക്കാം.
ഒരു ഉദാഹരണം പരിഗണിക്കാം. നമുക്ക് ഒരു ഡാറ്റാ സയൻസ് കോഴ്സ് (ഇതുപോലുള്ളത്) ഓൺലൈനായി വിദ്യാർത്ഥികൾക്ക് നൽകുന്നു, അതിൽ ഡാറ്റാ സയൻസ് ഉപയോഗിച്ച് മെച്ചപ്പെടുത്താൻ ആഗ്രഹിക്കുന്നു. എങ്ങനെ ചെയ്യാം?
"എന്ത് ഡിജിറ്റലൈസ് ചെയ്യാം?" എന്ന് ചോദിച്ച് തുടങ്ങാം. ഏറ്റവും ലളിതമായ മാർഗം ഓരോ വിദ്യാർത്ഥിയും ഓരോ മോഡ്യൂളും പൂർത്തിയാക്കാൻ എത്ര സമയം എടുക്കുന്നു എന്ന് അളക്കുകയും, ഓരോ മോഡ്യൂളിന്റെ അവസാനം മൾട്ടി-ചോയ്സ് ടെസ്റ്റ് നൽകി ലഭിച്ച അറിവ് അളക്കുകയും ചെയ്യുക ആണ്. എല്ലാ വിദ്യാർത്ഥികളുടെയും പൂർത്തിയാക്കാനുള്ള സമയം ശരാശരി എടുത്ത്, ഏത് മോഡ്യൂളുകൾ വിദ്യാർത്ഥികൾക്ക് ഏറ്റവും ബുദ്ധിമുട്ടുള്ളതാണെന്ന് കണ്ടെത്തി അവ ലളിതമാക്കാൻ പ്രവർത്തിക്കാം.
> നിങ്ങൾ ഈ സമീപനം അനുയോജ്യമല്ലെന്ന് വാദിക്കാം, കാരണം മോഡ്യൂളുകൾ വ്യത്യസ്ത നീളമുള്ളവയായിരിക്കാം. മോഡ്യൂളിന്റെ നീളം (അക്ഷരങ്ങളുടെ എണ്ണം) അനുസരിച്ച് സമയം വിഭജിച്ച് ആ മൂല്യങ്ങൾ താരതമ്യം ചെയ്യുന്നത് കൂടുതൽ നീതിപൂർണമായിരിക്കാം.
നാം ബഹുവികല്പ പരീക്ഷകളുടെ ഫലങ്ങൾ വിശകലനം തുടങ്ങുമ്പോൾ, വിദ്യാർത്ഥികൾക്ക് ബുദ്ധിമുട്ട് ഉണ്ടാകുന്ന ആശയങ്ങൾ കണ്ടെത്താൻ ശ്രമിക്കാം, ആ വിവരങ്ങൾ ഉള്ളടക്കം മെച്ചപ്പെടുത്താൻ ഉപയോഗിക്കാം. അതിനായി, ഓരോ ചോദ്യവും ഒരു പ്രത്യേക ആശയത്തോടോ അറിവിന്റെ ഒരു ഭാഗത്തോടോ ബന്ധിപ്പിക്കുന്ന വിധത്തിൽ പരീക്ഷകൾ രൂപകൽപ്പന ചെയ്യേണ്ടതുണ്ട്.
കൂടുതൽ സങ്കീർണ്ണമാക്കാൻ ആഗ്രഹിക്കുന്നുവെങ്കിൽ, ഓരോ മോഡ്യൂളിനും വേണ്ടി എടുത്ത സമയം വിദ്യാർത്ഥികളുടെ പ്രായ വിഭാഗത്തോടൊപ്പം പ്ലോട്ട് ചെയ്യാം. ചില പ്രായ വിഭാഗങ്ങൾക്ക് മോഡ്യൂൾ പൂർത്തിയാക്കാൻ അനാവശ്യമായി കൂടുതൽ സമയം എടുക്കുന്നുണ്ടോ, അല്ലെങ്കിൽ വിദ്യാർത്ഥികൾ പൂർത്തിയാക്കുന്നതിന് മുമ്പ് വിട്ടുപോകുന്നുണ്ടോ എന്ന് കണ്ടെത്താം. ഇത് മോഡ്യൂളിനായി പ്രായ ശുപാർശകൾ നൽകാനും തെറ്റായ പ്രതീക്ഷകളാൽ ആളുകളുടെ അസന്തോഷം കുറയ്ക്കാനും സഹായിക്കും.
## 🚀 വെല്ലുവിളി
ഈ വെല്ലുവിളിയിൽ, ഡാറ്റാ സയൻസ് മേഖലയുമായി ബന്ധപ്പെട്ട ആശയങ്ങൾ വാചകങ്ങൾ പരിശോധിച്ച് കണ്ടെത്താൻ ശ്രമിക്കും. ഡാറ്റാ സയൻസിനെക്കുറിച്ചുള്ള ഒരു വിക്കിപീഡിയ ലേഖനം എടുത്ത്, ടെക്സ്റ്റ് ഡൗൺലോഡ് ചെയ്ത് പ്രോസസ് ചെയ്ത്, താഴെ കാണുന്ന പോലെ ഒരു വാക്ക് ക്ലൗഡ് നിർമ്മിക്കും:
![Word Cloud for Data Science](../../../../translated_images/ds_wordcloud.664a7c07dca57de017c22bf0498cb40f898d48aa85b3c36a80620fea12fadd42.ml.png)
കോഡ് വായിക്കാൻ [`notebook.ipynb`](../../../../1-Introduction/01-defining-data-science/notebook.ipynb ':ignore') സന്ദർശിക്കുക. നിങ്ങൾക്ക് കോഡ് പ്രവർത്തിപ്പിച്ച് എല്ലാ ഡാറ്റാ പരിവർത്തനങ്ങളും യഥാർത്ഥ സമയത്ത് എങ്ങനെ നടക്കുന്നതെന്ന് കാണാം.
> Jupyter Notebook-ൽ കോഡ് എങ്ങനെ പ്രവർത്തിപ്പിക്കാമെന്ന് അറിയില്ലെങ്കിൽ, [ഈ ലേഖനം](https://soshnikov.com/education/how-to-execute-notebooks-from-github/) കാണുക.
## [പോസ്റ്റ്-ലെക്ചർ ക്വിസ്](https://ff-quizzes.netlify.app/en/ds/quiz/1)
## അസൈൻമെന്റുകൾ
* **ടാസ്‌ക് 1**: മുകളിൽ നൽകിയ കോഡ് മാറ്റി **Big Data** ഉം **Machine Learning** ഉം മേഖലകളുമായി ബന്ധപ്പെട്ട ആശയങ്ങൾ കണ്ടെത്തുക
* **ടാസ്‌ക് 2**: [ഡാറ്റാ സയൻസ് സീനാരിയോകൾ ചിന്തിക്കുക](assignment.md)
## ക്രെഡിറ്റുകൾ
ഈ പാഠം ♥️ കൊണ്ട് രചിച്ചത് [Dmitry Soshnikov](http://soshnikov.com) ആണ്.
---
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
**അസൂയാ**:
ഈ രേഖ AI വിവർത്തന സേവനം [Co-op Translator](https://github.com/Azure/co-op-translator) ഉപയോഗിച്ച് വിവർത്തനം ചെയ്തതാണ്. നാം കൃത്യതയ്ക്ക് ശ്രമിച്ചിട്ടുണ്ടെങ്കിലും, സ്വയം പ്രവർത്തിക്കുന്ന വിവർത്തനങ്ങളിൽ പിശകുകൾ അല്ലെങ്കിൽ തെറ്റുകൾ ഉണ്ടാകാമെന്ന് ദയവായി ശ്രദ്ധിക്കുക. അതിന്റെ മാതൃഭാഷയിലുള്ള യഥാർത്ഥ രേഖ പ്രാമാണികമായ ഉറവിടമായി കണക്കാക്കണം. നിർണായക വിവരങ്ങൾക്ക്, പ്രൊഫഷണൽ മനുഷ്യ വിവർത്തനം ശുപാർശ ചെയ്യപ്പെടുന്നു. ഈ വിവർത്തനത്തിന്റെ ഉപയോഗത്തിൽ നിന്നുണ്ടാകുന്ന ഏതെങ്കിലും തെറ്റിദ്ധാരണകൾക്കോ തെറ്റായ വ്യാഖ്യാനങ്ങൾക്കോ ഞങ്ങൾ ഉത്തരവാദികളല്ല.
<!-- CO-OP TRANSLATOR DISCLAIMER END -->

@ -0,0 +1,17 @@
<!--
CO_OP_TRANSLATOR_METADATA:
{
"original_hash": "4e0f1773b9bee1be3b28f9fe2c71b3de",
"translation_date": "2025-12-19T13:41:01+00:00",
"source_file": "1-Introduction/01-defining-data-science/assignment.md",
"language_code": "ml"
}
-->
Translation for chunk 1 of 'assignment.md' skipped due to timeout.
---
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
**അസൂയാ**:
ഈ രേഖ AI വിവർത്തന സേവനം [Co-op Translator](https://github.com/Azure/co-op-translator) ഉപയോഗിച്ച് വിവർത്തനം ചെയ്തതാണ്. നാം കൃത്യതയ്ക്ക് ശ്രമിച്ചിട്ടുണ്ടെങ്കിലും, സ്വയം പ്രവർത്തിക്കുന്ന വിവർത്തനങ്ങളിൽ പിശകുകൾ അല്ലെങ്കിൽ തെറ്റുകൾ ഉണ്ടാകാമെന്ന് ദയവായി ശ്രദ്ധിക്കുക. അതിന്റെ മാതൃഭാഷയിലുള്ള യഥാർത്ഥ രേഖയാണ് പ്രാമാണികമായ ഉറവിടം എന്ന് പരിഗണിക്കേണ്ടതാണ്. നിർണായകമായ വിവരങ്ങൾക്ക്, പ്രൊഫഷണൽ മനുഷ്യ വിവർത്തനം ശുപാർശ ചെയ്യപ്പെടുന്നു. ഈ വിവർത്തനം ഉപയോഗിക്കുന്നതിൽ നിന്നുണ്ടാകുന്ന ഏതെങ്കിലും തെറ്റിദ്ധാരണകൾക്കോ തെറ്റായ വ്യാഖ്യാനങ്ങൾക്കോ ഞങ്ങൾ ഉത്തരവാദികളല്ല.
<!-- CO-OP TRANSLATOR DISCLAIMER END -->

File diff suppressed because one or more lines are too long

@ -0,0 +1,17 @@
<!--
CO_OP_TRANSLATOR_METADATA:
{
"original_hash": "a8f79b9c0484c35b4f26e8aec7fc4d56",
"translation_date": "2025-12-19T14:34:45+00:00",
"source_file": "1-Introduction/01-defining-data-science/solution/assignment.md",
"language_code": "ml"
}
-->
Translation for chunk 1 of 'assignment.md' skipped due to timeout.
---
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
**അസൂയാപത്രം**:
ഈ രേഖ AI വിവർത്തന സേവനം [Co-op Translator](https://github.com/Azure/co-op-translator) ഉപയോഗിച്ച് വിവർത്തനം ചെയ്തതാണ്. നാം കൃത്യതയ്ക്ക് ശ്രമിച്ചിട്ടുണ്ടെങ്കിലും, യന്ത്രം ചെയ്ത വിവർത്തനങ്ങളിൽ പിശകുകൾ അല്ലെങ്കിൽ തെറ്റുകൾ ഉണ്ടാകാമെന്ന് ദയവായി ശ്രദ്ധിക്കുക. അതിന്റെ മാതൃഭാഷയിലുള്ള യഥാർത്ഥ രേഖ അധികാരപരമായ ഉറവിടമായി കണക്കാക്കണം. നിർണായക വിവരങ്ങൾക്ക്, പ്രൊഫഷണൽ മനുഷ്യ വിവർത്തനം ശുപാർശ ചെയ്യപ്പെടുന്നു. ഈ വിവർത്തനം ഉപയോഗിക്കുന്നതിൽ നിന്നുണ്ടാകുന്ന ഏതെങ്കിലും തെറ്റിദ്ധാരണകൾക്കോ തെറ്റായ വ്യാഖ്യാനങ്ങൾക്കോ ഞങ്ങൾ ഉത്തരവാദികളല്ല.
<!-- CO-OP TRANSLATOR DISCLAIMER END -->

File diff suppressed because one or more lines are too long

@ -0,0 +1,136 @@
<!--
CO_OP_TRANSLATOR_METADATA:
{
"original_hash": "58860ce9a4b8a564003d2752f7c72851",
"translation_date": "2025-12-19T14:10:15+00:00",
"source_file": "1-Introduction/02-ethics/README.md",
"language_code": "ml"
}
-->
Translation for chunk 1 of 'README.md' skipped due to timeout.
* വിവരങ്ങൾ യാഥാർത്ഥ്യത്തെ പ്രതിഫലിപ്പിക്കുന്നതിൽ _സത്യസന്ധമായി_ പിടിച്ചെടുത്തിട്ടുണ്ടോ?
#### 2.8 ആൽഗോരിതം നീതിമാന്മാർഗ്ഗം
[ആൽഗോരിതം നീതിമാന്മാർഗ്ഗം](https://towardsdatascience.com/what-is-algorithm-fairness-3182e161cf9f) പരിശോധിക്കുന്നത് ആൽഗോരിതം രൂപകൽപ്പന പ്രത്യേക ഡാറ്റാ സബ്ഗ്രൂപ്പുകളെ വ്യത്യസ്തമായി വേർതിരിക്കുന്നുണ്ടോ എന്ന് കാണാനാണ്, ഇത് _വിഭജന_ (ആ ഗ്രൂപ്പിൽ നിന്നുള്ള വിഭവങ്ങൾ നിഷേധിക്കപ്പെടുകയോ തടയപ്പെടുകയോ ചെയ്യുന്നത്) കൂടാതെ _സേവന ഗുണമേന്മ_ (കുറഞ്ഞ ചില സബ്ഗ്രൂപ്പുകൾക്ക് AI മറ്റുള്ളവരെക്കാൾ കൃത്യമായില്ല) എന്നിവയിൽ [സാധ്യമായ ഹാനികൾ](https://docs.microsoft.com/en-us/azure/machine-learning/concept-fairness-ml) ഉണ്ടാക്കുന്നു.
ഇവിടെ പരിശോധിക്കേണ്ട ചോദ്യങ്ങൾ:
* വ്യത്യസ്ത സബ്ഗ്രൂപ്പുകൾക്കും സാഹചര്യങ്ങൾക്കും മോഡൽ കൃത്യത ഞങ്ങൾ വിലയിരുത്തിയോ?
* സിസ്റ്റത്തിൽ സാധ്യതയുള്ള ഹാനികൾ (ഉദാ: സ്റ്റീരിയോടൈപ്പിംഗ്) പരിശോധിച്ചോ?
* തിരിച്ചറിയപ്പെട്ട ഹാനികൾ കുറയ്ക്കാൻ ഡാറ്റ തിരുത്തുകയോ മോഡലുകൾ പുനരുപയോഗം ചെയ്യുകയോ ചെയ്യാമോ?
കൂടുതൽ അറിയാൻ [AI നീതിമാന്മാർഗ്ഗ ചെക്ക്ലിസ്റ്റുകൾ](https://query.prod.cms.rt.microsoft.com/cms/api/am/binary/RE4t6dA) പോലുള്ള വിഭവങ്ങൾ പരിശോധിക്കുക.
#### 2.9 തെറ്റായ പ്രതിനിധാനം
[ഡാറ്റ തെറ്റായ പ്രതിനിധാനം](https://www.sciencedirect.com/topics/computer-science/misrepresentation) എന്നത് നമുക്ക് സത്യസന്ധമായി റിപ്പോർട്ട് ചെയ്ത ഡാറ്റയിൽ നിന്നുള്ള洞察ങ്ങൾ വഞ്ചനാപരമായി പ്രദർശിപ്പിച്ച് ഒരു ആഗ്രഹിച്ച നാരേറ്റീവ് പിന്തുണയ്ക്കുന്നുണ്ടോ എന്ന് ചോദിക്കുന്നതാണ്.
ഇവിടെ പരിശോധിക്കേണ്ട ചോദ്യങ്ങൾ:
* നാം അപൂർണ്ണമോ തെറ്റായോ ഡാറ്റ റിപ്പോർട്ട് ചെയ്യുകയാണോ?
* തെറ്റിദ്ധരിപ്പിക്കുന്ന നിഗമനങ്ങൾ സൃഷ്ടിക്കുന്ന രീതിയിൽ ഡാറ്റ ദൃശ്യവൽക്കരിക്കുകയാണോ?
* ഫലങ്ങൾ നിയന്ത്രിക്കാൻ തിരഞ്ഞെടുക്കപ്പെട്ട സാംഖ്യിക സാങ്കേതിക വിദ്യകൾ ഉപയോഗിക്കുകയാണോ?
* വ്യത്യസ്ത നിഗമനങ്ങൾ നൽകുന്ന മറ്റ് വ്യാഖ്യാനങ്ങൾ ഉണ്ടോ?
#### 2.10 സ്വതന്ത്ര തിരഞ്ഞെടുപ്പ്
[സ്വതന്ത്ര തിരഞ്ഞെടുപ്പിന്റെ മായാജാലം](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice) സംഭവിക്കുന്നത് സിസ്റ്റം "തിരഞ്ഞെടുപ്പ് ഘടനകൾ" തീരുമാനമെടുക്കൽ ആൽഗോരിതങ്ങൾ ഉപയോഗിച്ച് ആളുകളെ ഒരു ഇഷ്ടപ്പെട്ട ഫലത്തിലേക്ക് നയിക്കുമ്പോൾ അവർക്ക് ഓപ്ഷനുകളും നിയന്ത്രണവും നൽകുന്ന പോലെ തോന്നിക്കുന്നതാണ്. ഈ [ഡാർക്ക് പാറ്റേണുകൾ](https://www.darkpatterns.org/) ഉപയോക്താക്കൾക്ക് സാമൂഹിക-ആര്ത്ഥിക ഹാനി ഉണ്ടാക്കാം. ഉപയോക്തൃ തീരുമാനങ്ങൾ പെരുമാറ്റ പ്രൊഫൈലുകളെ ബാധിക്കുന്നതിനാൽ, ഈ പ്രവർത്തനങ്ങൾ ഭാവിയിലെ തിരഞ്ഞെടുപ്പുകൾക്ക് പ്രേരകമാകുകയും ഹാനികൾ വർദ്ധിപ്പിക്കുകയും ചെയ്യാം.
ഇവിടെ പരിശോധിക്കേണ്ട ചോദ്യങ്ങൾ:
* ആ തിരഞ്ഞെടുപ്പ് ചെയ്യുന്നതിന്റെ ഫലങ്ങൾ ഉപയോക്താവ് മനസ്സിലാക്കിയിരുന്നോ?
* ഉപയോക്താവ് (മറ്റു) തിരഞ്ഞെടുപ്പുകളും അവയുടെ ഗുണദോഷങ്ങളും അറിയാമോ?
* ഉപയോക്താവ് പിന്നീട് സ്വയംമാറ്റം ചെയ്യാനോ സ്വയം നിയന്ത്രിക്കാനോ കഴിയുമോ?
### 3. കേസ്സ് സ്റ്റഡികൾ
ഈ നൈതിക വെല്ലുവിളികൾ യാഥാർത്ഥ്യ സാഹചര്യങ്ങളിൽ എങ്ങനെ പ്രതിഫലിക്കുന്നു എന്ന് കാണാൻ, വ്യക്തികൾക്കും സമൂഹത്തിനും സംഭവിക്കുന്ന ഹാനികളും ഫലങ്ങളും വ്യക്തമാക്കുന്ന കേസ്സ് സ്റ്റഡികൾ സഹായിക്കുന്നു.
ചില ഉദാഹരണങ്ങൾ:
| നൈതിക വെല്ലുവിളി | കേസ്സ് സ്റ്റഡി |
|--- |--- |
| **അറിയിപ്പോടെ സമ്മതം** | 1972 - [Tuskegee Syphilis Study](https://en.wikipedia.org/wiki/Tuskegee_Syphilis_Study) - പഠനത്തിൽ പങ്കെടുത്ത ആഫ്രിക്കൻ അമേരിക്കൻ പുരുഷന്മാർക്ക് സൗജന്യ മെഡിക്കൽ പരിചരണം വാഗ്ദാനം ചെയ്തിരുന്നെങ്കിലും, രോഗനിർണയം അല്ലെങ്കിൽ ചികിത്സ ലഭ്യതയെക്കുറിച്ച് അറിയിക്കാതെ ഗവേഷകർ വഞ്ചിച്ചു. പലർ മരിച്ചു, പങ്കാളികൾക്കും കുട്ടികൾക്കും ബാധിച്ചു; പഠനം 40 വർഷം നീണ്ടു. |
| **ഡാറ്റാ സ്വകാര്യത** | 2007 - [Netflix data prize](https://www.wired.com/2007/12/why-anonymous-data-sometimes-isnt/) 50,000 ഉപഭോക്താക്കളിൽ നിന്നുള്ള _10M അനോണിമൈസ്ഡ് മൂവി റാങ്കിഗുകൾ_ ഗവേഷകർക്ക് നൽകി ശുപാർശ ആൽഗോരിതങ്ങൾ മെച്ചപ്പെടുത്താൻ സഹായിച്ചു. എന്നാൽ, ഗവേഷകർ അനോണിമൈസ്ഡ് ഡാറ്റയെ വ്യക്തിഗതമായി തിരിച്ചറിയാവുന്ന ഡാറ്റയുമായി (ഉദാ: IMDb കമന്റുകൾ) ബന്ധിപ്പിച്ച് ചില Netflix ഉപഭോക്താക്കളെ "ഡീ-അനോണിമൈസ്" ചെയ്തു.|
| **സംഗ്രഹണ പാകം** | 2013 - ബോസ്റ്റൺ നഗരം [Street Bump](https://www.boston.gov/transportation/street-bump) എന്ന ആപ്പ് വികസിപ്പിച്ചു, പാതയിലെ പാളങ്ങൾ റിപ്പോർട്ട് ചെയ്യാൻ പൗരന്മാർക്ക് അനുവദിച്ചു, നഗരത്തിന് റോഡുകളുടെ മെച്ചപ്പെടുത്തലിന് മികച്ച ഡാറ്റ ലഭിച്ചു. എന്നാൽ, [കുറഞ്ഞ വരുമാനമുള്ളവർക്ക് കാറുകളും ഫോണുകളും കുറവായിരുന്നു](https://hbr.org/2013/04/the-hidden-biases-in-big-data), അവരുടെ റോഡ് പ്രശ്നങ്ങൾ ആ ആപ്പിൽ കാണാനാകാതെ പോയി. വികസിപ്പിച്ചവർ അക്കാദമികരുമായി ചേർന്ന് _സമതുല്യ ആക്സസ്_ പ്രശ്നങ്ങളും ഡിജിറ്റൽ വിഭജനം പരിഹരിക്കാൻ പ്രവർത്തിച്ചു. |
| **ആൽഗോരിതം നീതിമാന്മാർഗ്ഗം** | 2018 - MIT [Gender Shades Study](http://gendershades.org/overview.html) ലിംഗ തിരിച്ചറിയൽ AI ഉൽപ്പന്നങ്ങളുടെ കൃത്യത വിലയിരുത്തി, സ്ത്രീകൾക്കും വർണ്ണജാതി വ്യക്തികൾക്കും കൃത്യതയിൽ വ്യത്യാസങ്ങൾ കണ്ടെത്തി. 2019-ലെ [Apple Card](https://www.wired.com/story/the-apple-card-didnt-see-genderand-thats-the-problem/) സ്ത്രീകൾക്ക് പുരുഷന്മാരേക്കാൾ കുറവ് ക്രെഡിറ്റ് നൽകുന്നതായി തോന്നി. ഇരുവരും ആൽഗോരിതം പാകം മൂലം സാമൂഹ്യ-ആര്ത്ഥിക ഹാനികൾ ഉണ്ടാകുന്നതിന്റെ ഉദാഹരണങ്ങൾ.|
| **ഡാറ്റ തെറ്റായ പ്രതിനിധാനം** | 2020 - [ജോർജിയ പബ്ലിക് ഹെൽത്ത് വകുപ്പ് COVID-19 ചാർട്ടുകൾ](https://www.vox.com/covid-19-coronavirus-us-response-trump/2020/5/18/21262265/georgia-covid-19-cases-declining-reopening) പുറത്തിറക്കി, സ്ഥിരീകരിച്ച കേസുകളുടെ പ്രവണതയെക്കുറിച്ച് പൗരന്മാരെ തെറ്റിദ്ധരിപ്പിക്കുന്നതായി തോന്നി, x-അക്ഷത്തിൽ ക്രമരഹിതമായ ഓർഡറിംഗ് ഉപയോഗിച്ചു. ഇത് ദൃശ്യവൽക്കരണ തന്ത്രങ്ങളിലൂടെ തെറ്റായ പ്രതിനിധാനത്തിന്റെ ഉദാഹരണമാണ്. |
| **സ്വതന്ത്ര തിരഞ്ഞെടുപ്പിന്റെ മായാജാലം** | 2020 - പഠന ആപ്പ് [ABCmouse FTC പരാതിയിൽ $10M തീർപ്പു](https://www.washingtonpost.com/business/2020/09/04/abcmouse-10-million-ftc-settlement/) നൽകി, രക്ഷിതാക്കൾക്ക് റദ്ദാക്കാനാകാത്ത സബ്സ്ക്രിപ്ഷനുകൾക്ക് പണം നൽകേണ്ടി വന്നു. ഇത് തിരഞ്ഞെടുപ്പ് ഘടനകളിലെ ഡാർക്ക് പാറ്റേണുകളുടെ ഉദാഹരണമാണ്, ഉപയോക്താക്കളെ ഹാനികരമായ തിരഞ്ഞെടുപ്പുകളിലേക്ക് നയിക്കുന്നു. |
| **ഡാറ്റാ സ്വകാര്യത & ഉപയോക്തൃ അവകാശങ്ങൾ** | 2021 - Facebook [ഡാറ്റാ ലംഘനം](https://www.npr.org/2021/04/09/986005820/after-data-breach-exposes-530-million-facebook-says-it-will-not-notify-users) 530M ഉപയോക്താക്കളുടെ ഡാറ്റ പുറത്തുവിട്ടു, FTC-യുമായി $5B തീർപ്പ് ഉണ്ടായി. എന്നാൽ, ലംഘനത്തെക്കുറിച്ച് ഉപയോക്താക്കളെ അറിയിക്കാൻ Facebook തള്ളിപ്പറഞ്ഞു, ഡാറ്റാ പരദർശിത്വവും ആക്‌സസും സംബന്ധിച്ച ഉപയോക്തൃ അവകാശങ്ങൾ ലംഘിച്ചു. |
കൂടുതൽ കേസ്സ് സ്റ്റഡികൾ അന്വേഷിക്കണോ? ഈ വിഭവങ്ങൾ പരിശോധിക്കുക:
* [Ethics Unwrapped](https://ethicsunwrapped.utexas.edu/case-studies) - വ്യത്യസ്ത വ്യവസായങ്ങളിലെ നൈതിക പ്രശ്നങ്ങൾ.
* [Data Science Ethics course](https://www.coursera.org/learn/data-science-ethics#syllabus) - പ്രധാനപ്പെട്ട കേസ്സ് സ്റ്റഡികൾ.
* [Where things have gone wrong](https://deon.drivendata.org/examples/) - deon ചെക്ക്ലിസ്റ്റ് ഉദാഹരണങ്ങളോടെ.
> 🚨 നിങ്ങൾ കണ്ട കേസ്സ് സ്റ്റഡികൾക്കുറിച്ച് ചിന്തിക്കുക - നിങ്ങൾ ജീവിതത്തിൽ സമാനമായ നൈതിക വെല്ലുവിളി അനുഭവിച്ചിട്ടുണ്ടോ? ഈ വിഭാഗത്തിൽ ചർച്ച ചെയ്ത നൈതിക വെല്ലുവിളികളിൽ ഒന്നിനെ പ്രതിപാദിക്കുന്ന മറ്റൊരു കേസ്സ് സ്റ്റഡി നിങ്ങൾക്ക് ഓർക്കാമോ?
## പ്രയോഗാത്മക നൈതികത
നാം നൈതിക ആശയങ്ങൾ, വെല്ലുവിളികൾ, യാഥാർത്ഥ്യ സാഹചര്യങ്ങളിലെ കേസ്സ് സ്റ്റഡികൾ ചർച്ച ചെയ്തു. എന്നാൽ നമുക്ക് എങ്ങനെ നൈതിക സിദ്ധാന്തങ്ങളും പ്രയോഗങ്ങളും നമ്മുടെ പ്രോജക്ടുകളിൽ _പ്രയോഗിക്കാ_? മികച്ച ഭരണത്തിനായി ഈ പ്രയോഗങ്ങൾ എങ്ങനെ _പ്രവർത്തനക്ഷമമാക്കാ_? യാഥാർത്ഥ്യ പരിഹാരങ്ങൾ പരിശോധിക്കാം:
### 1. പ്രൊഫഷണൽ കോഡുകൾ
പ്രൊഫഷണൽ കോഡുകൾ സംഘടനകൾക്ക് അംഗങ്ങളെ അവരുടെ നൈതിക സിദ്ധാന്തങ്ങളും ദൗത്യം പ്രസ്താവനയും പിന്തുണയ്ക്കാൻ "പ്രേരിപ്പിക്കാൻ" ഒരു മാർഗമാണ്. കോഡുകൾ പ്രൊഫഷണൽ പെരുമാറ്റത്തിനുള്ള _നൈതിക മാർഗ്ഗനിർദ്ദേശങ്ങളാണ്_, ജീവനക്കാർക്ക് അല്ലെങ്കിൽ അംഗങ്ങൾക്ക് അവരുടെ സംഘടനയുടെ സിദ്ധാന്തങ്ങളുമായി പൊരുത്തപ്പെടുന്ന തീരുമാനങ്ങൾ എടുക്കാൻ സഹായിക്കുന്നു. അംഗങ്ങളുടെ സ്വമേധയാ അനുസരണമാണ് ഇവയുടെ ഗുണമേന്മ; എന്നാൽ, പല സംഘടനകളും അംഗങ്ങളെ പ്രേരിപ്പിക്കാൻ അധിക ബഹുമതികളും ശിക്ഷകളും നൽകുന്നു.
ഉദാഹരണങ്ങൾ:
* [Oxford Munich](http://www.code-of-ethics.org/code-of-conduct/) നൈതിക കോഡ്
* [Data Science Association](http://datascienceassn.org/code-of-conduct.html) പെരുമാറ്റ കോഡ് (2013-ൽ സൃഷ്ടിച്ചത്)
* [ACM Code of Ethics and Professional Conduct](https://www.acm.org/code-of-ethics) (1993 മുതൽ)
> 🚨 നിങ്ങൾ പ്രൊഫഷണൽ എഞ്ചിനീയറിംഗ് അല്ലെങ്കിൽ ഡാറ്റാ സയൻസ് സംഘടനയുടെ അംഗമാണോ? അവരുടെ സൈറ്റ് പരിശോധിച്ച് അവർ പ്രൊഫഷണൽ നൈതിക കോഡ് നിർവചിച്ചിട്ടുണ്ടോ എന്ന് നോക്കൂ. അവരുടെ നൈതിക സിദ്ധാന്തങ്ങളെക്കുറിച്ച് ഇത് എന്ത് പറയുന്നു? അംഗങ്ങളെ കോഡ് പാലിക്കാൻ അവർ എങ്ങനെ "പ്രേരിപ്പിക്കുന്നു"?
### 2. നൈതിക ചെക്ക്ലിസ്റ്റുകൾ
പ്രൊഫഷണൽ കോഡുകൾ പ്രയോഗകരിൽ നിന്നുള്ള ആവശ്യമായ _നൈതിക പെരുമാറ്റ_ നിർവചിക്കുന്നുവെങ്കിലും, വലിയ പ്രോജക്ടുകളിൽ [അവയ്ക്ക് പരിധികൾ അറിയപ്പെടുന്നു](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md). പകരം, പല ഡാറ്റാ സയൻസ് വിദഗ്ധരും [ചെക്ക്ലിസ്റ്റുകൾ](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md) പ്രോത്സാഹിപ്പിക്കുന്നു, അവ **സിദ്ധാന്തങ്ങളെ പ്രയോഗങ്ങളുമായി ബന്ധിപ്പിക്കുന്നു** കൂടുതൽ നിർണായകവും പ്രായോഗികവുമായ രീതിയിൽ.
ചെക്ക്ലിസ്റ്റുകൾ ചോദ്യങ്ങളെ "അതെ/ഇല്ല" പ്രവർത്തനങ്ങളായി മാറ്റുന്നു, ഇത് സാധാരണ ഉൽപ്പന്ന റിലീസ് പ്രവൃത്തികളിൽ ട്രാക്ക് ചെയ്യാൻ കഴിയും.
ഉദാഹരണങ്ങൾ:
* [Deon](https://deon.drivendata.org/) - വ്യവസായ ശുപാർശകളിൽ നിന്നുള്ള [സാമാന്യ ഡാറ്റാ നൈതിക ചെക്ക്ലിസ്റ്റ്](https://deon.drivendata.org/#checklist-citations) സൃഷ്ടിച്ച കമാൻഡ്-ലൈൻ ടൂൾ.
* [Privacy Audit Checklist](https://cyber.harvard.edu/ecommerce/privacyaudit.html) - നിയമപരവും സാമൂഹ്യപരവുമായ വിവര കൈകാര്യം മാർഗ്ഗനിർദ്ദേശങ്ങൾ.
* [AI Fairness Checklist](https://www.microsoft.com/en-us/research/project/ai-fairness-checklist/) - AI വികസന ചക്രങ്ങളിൽ നീതിമാന്മാർഗ്ഗ പരിശോധനകൾ ഉൾപ്പെടുത്താൻ AI പ്രയോഗകർ സൃഷ്ടിച്ചത്.
* [22 questions for ethics in data and AI](https://medium.com/the-organization/22-questions-for-ethics-in-data-and-ai-efb68fd19429) - കൂടുതൽ തുറന്ന ഘടന, രൂപകൽപ്പന, നടപ്പാക്കൽ, സംഘടനാ സാഹചര്യങ്ങളിൽ നൈതിക പ്രശ്നങ്ങൾ ആദ്യമായി പരിശോധിക്കാൻ.
### 3. നൈതിക നിയമങ്ങൾ
നൈതികത എന്നത് പങ്കുവെക്കുന്ന മൂല്യങ്ങൾ നിർവചിച്ച് ശരിയായത് സ്വമേധയാ ചെയ്യുന്നതാണ്. **അനുസരണം** എന്നാൽ നിയമം പാലിക്കുന്നതും അതിന്റെ പരിധിയിൽ പ്രവർത്തിക്കുന്നതുമാണ്. **ഭരണസംവിധാനം** സംഘടനകൾ നൈതിക സിദ്ധാന്തങ്ങൾ നടപ്പിലാക്കാനും നിയമങ്ങൾ പാലിക്കാനും ഉപയോഗിക്കുന്ന എല്ലാ മാർഗ്ഗങ്ങളും ഉൾക്കൊള്ളുന്നു.
ഇന്ന്, ഭരണസംവിധാനം രണ്ട് രൂപത്തിലാണ്. ഒന്നാമത്, സംഘടനയിലെ എല്ലാ AI-സംബന്ധപ്പെട്ട പ്രോജക്ടുകളിലും **നൈതിക AI** സിദ്ധാന്തങ്ങൾ നിർവചിച്ച് അവ സ്വീകരിക്കാൻ പ്രയോഗങ്ങൾ സ്ഥാപിക്കുന്നതും. രണ്ടാമത്, പ്രവർത്തിക്കുന്ന പ്രദേശങ്ങളിലെ എല്ലാ സർക്കാർ നിർദ്ദേശിച്ച **ഡാറ്റാ സംരക്ഷണ നിയമങ്ങൾ** പാലിക്കുന്നതും.
ഡാറ്റാ സംരക്ഷണവും സ്വകാര്യതയും സംബന്ധിച്ച നിയമങ്ങളുടെ ഉദാഹരണങ്ങൾ:
* `1974`, [US Privacy Act](https://www.justice.gov/opcl/privacy-act-1974) - ഫെഡറൽ സർക്കാർ വ്യക്തിഗത വിവരങ്ങൾ ശേഖരിക്കൽ, ഉപയോഗം, വെളിപ്പെടുത്തൽ നിയന്ത്രിക്കുന്നു.
* `1996`, [US Health Insurance Portability & Accountability Act (HIPAA)](https://www.cdc.gov/phlp/publications/topic/hipaa.html) - വ്യക്തിഗത ആരോഗ്യ ഡാറ്റ സംരക്ഷിക്കുന്നു.
* `1998`, [US Children's Online Privacy Protection Act (COPPA)](https://www.ftc.gov/enforcement/rules/rulemaking-regulatory-reform-proceedings/childrens-online-privacy-protection-rule) - 13 വയസ്സിന് താഴെയുള്ള കുട്ടികളുടെ ഡാറ്റാ സ്വകാര്യത സംരക്ഷിക്കുന്നു.
* `2018`, [General Data Protection Regulation (GDPR)](https://gdpr-info.eu/) - ഉപയോക്തൃ അവകാശങ്ങൾ, ഡാറ്റ സംരക്ഷണം, സ്വകാര്യത നൽകുന്നു.
* `2018`, [California Consumer Privacy Act (CCPA)](https://www.oag.ca.gov/privacy/ccpa) ഉപഭോക്താക്കൾക്ക് അവരുടെ (വ്യക്തിഗത) ഡാറ്റയിൽ കൂടുതൽ _അവകാശങ്ങൾ_ നൽകുന്നു.
* `2021`, ചൈനയുടെ [Personal Information Protection Law](https://www.reuters.com/world/china/china-passes-new-personal-data-privacy-law-take-effect-nov-1-2021-08-20/) ഏറ്റവും ശക്തമായ ഓൺലൈൻ ഡാറ്റാ സ്വകാര്യത നിയമങ്ങളിൽ ഒന്നായി.
> 🚨 യൂറോപ്യൻ യൂണിയൻ നിർവചിച്ച GDPR (General Data Protection Regulation) ഇന്നും ഏറ്റവും സ്വാധീനമുള്ള ഡാറ്റാ സ്വകാര്യത നിയമങ്ങളിലൊന്നാണ്. ഇത് [8 ഉപയോക്തൃ അവകാശങ്ങളും](https://www.freeprivacypolicy.com/blog/8-user-rights-gdpr) നിർവചിക്കുന്നു എന്ന് നിങ്ങൾ അറിയാമോ? ഇവ എന്തൊക്കെയാണ്, എന്തുകൊണ്ട് അവ പ്രധാനമാണെന്ന് പഠിക്കൂ.
### 4. നൈതിക സംസ്കാരം
_അനുസരണ_ (നിയമത്തിന്റെ "അക്ഷരം" പാലിക്കുന്നത്) 与 [സിസ്റ്റമാറ്റിക് പ്രശ്നങ്ങൾ](https://www.coursera.org/learn/data-science-ethics/home/week/4) (ഉദാ: ഒസ്സിഫിക്കേഷൻ, വിവര അസമത്വം, വിതരണ നീതിമാന്മാർഗ്ഗം) ഇടയിൽ അദൃശ്യമായ ഒരു ഇടവേള ഇപ്പോഴും നിലനിൽക്കുന്നു, ഇത് AI ആയുധമാക്കൽ വേഗത്തിലാക്കാം.
അവസാനത്തെ പരിഹരിക്കാൻ [നൈതിക സംസ്കാരങ്ങൾ നിർവചിക്കുന്ന സഹകരണ സമീപനങ്ങൾ](https://towardsdatascience.com/why-ai-ethics-requires-a-culture-driven-approach-26f451afa29f) ആവശ്യമാണ്, ഇത് വ്യവസായത്തിലെ _സഘടനകളിലുടനീള_ മാനസിക ബന്ധങ്ങളും സ്ഥിരതയുള്ള പങ്കുവെച്ച മൂല്യങ്ങളും സൃഷ്ടിക്കുന്നു. ഇത് സംഘടനകളിൽ കൂടുതൽ [ഫോർമലൈസ്ഡ് ഡാറ്റാ നൈതിക സംസ്കാരങ്ങൾ](https://www.codeforamerica.org/news/formalizing-an-ethical-data-culture/) ആവശ്യപ്പെടുന്നു - _ഏതെങ്കിലു_ ആളുകൾക്ക് [അണ്ടോൺ കോർഡ് പുള്‍ ചെയ്യാൻ](https://en.wikipedia.org/wiki/Andon_(manufacturing)) (പ്രക്രിയയിൽ നൈതിക പ്രശ്നങ്ങൾ നേരത്തെ ഉയർത്താൻ) അനുവദിക്കുകയും, AI പ്രോജക്ടുകളിൽ _നൈതിക വിലയിരുത്തലുകൾ_ (ഉദാ: നിയമനം) ഒരു പ്രധാന മാനദണ്ഡമാക്കുകയും ചെയ്യുന്നു.
---
## [പോസ്റ്റ്-ലെക്ചർ ക്വിസ്](https://ff-quizzes.netlify.app/en/ds/quiz/3) 🎯
## അവലോകനം & സ്വയം പഠനം
കോഴ്സുകളും പുസ്തകങ്ങളും അടിസ്ഥാന നൈതിക ആശയങ്ങളും വെല്ലുവിളികളും മനസ്സിലാക്കാൻ സഹായിക്കുന്നു, കേസ്സ് സ്റ്റഡികളും ഉപകരണങ്ങളും യാഥാർത്ഥ്യ സാഹചര്യങ്ങളിലെ പ്രയോഗാത്മക നൈതികതയിൽ സഹായിക്കുന്നു. തുടങ്ങാൻ ചില വിഭവങ്ങൾ ഇവിടെ.
* [ആരംഭക്കാർക്കുള്ള മെഷീൻ ലേണിംഗ്](https://github.com/microsoft/ML-For-Beginners/blob/main/1-Introduction/3-fairness/README.md) - മൈക്രോസോഫ്റ്റിൽ നിന്നുള്ള ഫെയർനെസ്സ് പാഠം.
* [ഉത്തരവാദിത്വമുള്ള AI ന്റെ സിദ്ധാന്തങ്ങൾ](https://docs.microsoft.com/en-us/learn/modules/responsible-ai-principles/) - മൈക്രോസോഫ്റ്റ് ലേണിൽ നിന്നുള്ള സൗജന്യ പഠന പാത.
* [നൈതികതയും ഡാറ്റാ സയൻസും](https://resources.oreilly.com/examples/0636920203964) - O'Reilly ഇബുക്ക് (എം. ലൂക്കിഡസ്, എച്ച്. മേസൺ എന്നിവരാൽ)
* [ഡാറ്റാ സയൻസ് നൈതികത](https://www.coursera.org/learn/data-science-ethics#syllabus) - മിഷിഗൺ സർവകലാശാലയിൽ നിന്നുള്ള ഓൺലൈൻ കോഴ്സ്.
* [എതിക്സ് അൺവ്രാപ്പഡ്](https://ethicsunwrapped.utexas.edu/case-studies) - ടെക്സാസ് സർവകലാശാലയിൽ നിന്നുള്ള കേസ് സ്റ്റഡികൾ.
# അസൈൻമെന്റ്
[ഡാറ്റാ എതിക്സ് കേസ് സ്റ്റഡി എഴുതുക](assignment.md)
---
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
**അസൂയാ**:
ഈ രേഖ AI വിവർത്തന സേവനം [Co-op Translator](https://github.com/Azure/co-op-translator) ഉപയോഗിച്ച് വിവർത്തനം ചെയ്തതാണ്. നാം കൃത്യതയ്ക്ക് ശ്രമിച്ചെങ്കിലും, സ്വയം പ്രവർത്തിക്കുന്ന വിവർത്തനങ്ങളിൽ പിശകുകൾ അല്ലെങ്കിൽ തെറ്റുകൾ ഉണ്ടാകാമെന്ന് ദയവായി ശ്രദ്ധിക്കുക. അതിന്റെ മാതൃഭാഷയിലുള്ള യഥാർത്ഥ രേഖയാണ് പ്രാമാണികമായ ഉറവിടം എന്ന് പരിഗണിക്കേണ്ടതാണ്. നിർണായകമായ വിവരങ്ങൾക്ക്, പ്രൊഫഷണൽ മനുഷ്യ വിവർത്തനം ശുപാർശ ചെയ്യപ്പെടുന്നു. ഈ വിവർത്തനം ഉപയോഗിക്കുന്നതിൽ നിന്നുണ്ടാകുന്ന ഏതെങ്കിലും തെറ്റിദ്ധാരണകൾക്കോ തെറ്റായ വ്യാഖ്യാനങ്ങൾക്കോ ഞങ്ങൾ ഉത്തരവാദികളല്ല.
<!-- CO-OP TRANSLATOR DISCLAIMER END -->

@ -0,0 +1,35 @@
<!--
CO_OP_TRANSLATOR_METADATA:
{
"original_hash": "b588c0fc73014f52520c666efc3e0cc3",
"translation_date": "2025-12-19T14:28:24+00:00",
"source_file": "1-Introduction/02-ethics/assignment.md",
"language_code": "ml"
}
-->
## ഡാറ്റ എതിക്സ് കേസ് സ്റ്റഡി എഴുതുക
## നിർദ്ദേശങ്ങൾ
നിങ്ങൾ വിവിധ [ഡാറ്റ എതിക്സ് ചലഞ്ചുകൾ](README.md#2-ethics-challenges) പഠിച്ചിട്ടുണ്ട്, കൂടാതെ യാഥാർത്ഥ്യ സാഹചര്യങ്ങളിൽ ഡാറ്റ എതിക്സ് ചലഞ്ചുകൾ പ്രതിഫലിപ്പിക്കുന്ന ചില [കേസ് സ്റ്റഡികൾ](README.md#3-case-studies) കണ്ടിട്ടുണ്ട്.
ഈ അസൈൻമെന്റിൽ, നിങ്ങളുടെ സ്വന്തം അനുഭവത്തിൽ നിന്നോ നിങ്ങൾ പരിചയമുള്ള യഥാർത്ഥ ലോക സാഹചര്യത്തിൽ നിന്നോ ഒരു ഡാറ്റ എതിക്സ് ചലഞ്ച് പ്രതിഫലിപ്പിക്കുന്ന നിങ്ങളുടെ സ്വന്തം കേസ് സ്റ്റഡി എഴുതും. ഈ ഘട്ടങ്ങൾ പിന്തുടരുക:
1. `ഒരു ഡാറ്റ എതിക്സ് ചലഞ്ച് തിരഞ്ഞെടുക്കുക`. [പാഠം ഉദാഹരണങ്ങൾ](README.md#2-ethics-challenges) നോക്കുക അല്ലെങ്കിൽ പ്രചോദനത്തിനായി ഓൺലൈൻ ഉദാഹരണങ്ങൾ പോലുള്ള [Deon ചെക്ക്ലിസ്റ്റ്](https://deon.drivendata.org/examples/) പരിശോധിക്കുക.
2. `ഒരു യഥാർത്ഥ ലോക ഉദാഹരണം വിവരിക്കുക`. നിങ്ങൾ കേട്ടിട്ടുള്ള (ഹെഡ്‌ലൈനുകൾ, ഗവേഷണ പഠനം മുതലായവ) അല്ലെങ്കിൽ അനുഭവിച്ച (പ്രാദേശിക സമൂഹം) ഒരു സാഹചര്യത്തെക്കുറിച്ച് ചിന്തിക്കുക, ഈ പ്രത്യേക ചലഞ്ച് സംഭവിച്ച സ്ഥലം. ഈ ചലഞ്ചുമായി ബന്ധപ്പെട്ട ഡാറ്റ എതിക്സ് ചോദ്യങ്ങളെക്കുറിച്ച് ചിന്തിക്കുക - ഈ പ്രശ്നം മൂലം ഉണ്ടാകുന്ന സാധ്യതയുള്ള ഹാനികൾ അല്ലെങ്കിൽ അനിഷ്ടഫലങ്ങൾ ചർച്ച ചെയ്യുക. ബോണസ് പോയിന്റുകൾ: ഈ ചലഞ്ചിന്റെ ദോഷപ്രഭാവം ഒഴിവാക്കാൻ അല്ലെങ്കിൽ കുറയ്ക്കാൻ സഹായിക്കുന്ന സാധ്യതയുള്ള പരിഹാരങ്ങൾ അല്ലെങ്കിൽ പ്രക്രിയകൾ ചിന്തിക്കുക.
3. `ബന്ധപ്പെട്ട റിസോഴ്‌സുകളുടെ പട്ടിക നൽകുക`. ഇത് യഥാർത്ഥ ലോക സംഭവമായിരുന്നുവെന്ന് തെളിയിക്കാൻ ഒരു അല്ലെങ്കിൽ കൂടുതൽ റിസോഴ്‌സുകൾ (ആർട്ടിക്കിള്‍ ലിങ്കുകൾ, വ്യക്തിഗത ബ്ലോഗ് പോസ്റ്റ് അല്ലെങ്കിൽ ചിത്രം, ഓൺലൈൻ ഗവേഷണ പേപ്പർ മുതലായവ) പങ്കുവെക്കുക. ബോണസ് പോയിന്റുകൾ: സംഭവത്തിൽ നിന്നുള്ള സാധ്യതയുള്ള ഹാനികളും ഫലങ്ങളും കാണിക്കുന്ന, അല്ലെങ്കിൽ അതിന്റെ ആവർത്തനം തടയാൻ എടുത്ത പോസിറ്റീവ് നടപടികൾ ഹൈലൈറ്റ് ചെയ്യുന്ന റിസോഴ്‌സുകൾ പങ്കുവെക്കുക.
## റൂബ്രിക്
Exemplary | Adequate | Needs Improvement
--- | --- | -- |
ഒരു അല്ലെങ്കിൽ കൂടുതൽ ഡാറ്റ എതിക്സ് ചലഞ്ചുകൾ തിരിച്ചറിയപ്പെട്ടിട്ടുണ്ട്. <br/> <br/> കേസ് സ്റ്റഡി ആ ചലഞ്ച് പ്രതിഫലിപ്പിക്കുന്ന യഥാർത്ഥ ലോക സംഭവത്തെ വ്യക്തമായി വിവരിക്കുന്നു, അതും അതിന്റെ അനിഷ്ടഫലങ്ങൾ അല്ലെങ്കിൽ ഹാനികൾ ഹൈലൈറ്റ് ചെയ്യുന്നു. <br/><br/> ഇത് സംഭവിച്ചതായി തെളിയിക്കാൻ കുറഞ്ഞത് ഒരു ലിങ്കുചെയ്ത റിസോഴ്‌സ് ഉണ്ട്. | ഒരു ഡാറ്റ എതിക്സ് ചലഞ്ച് തിരിച്ചറിയപ്പെട്ടിട്ടുണ്ട്. <br/><br/> കുറഞ്ഞത് ഒരു ബന്ധപ്പെട്ട ഹാനി അല്ലെങ്കിൽ ഫലം സംക്ഷിപ്തമായി ചർച്ച ചെയ്യപ്പെട്ടിട്ടുണ്ട്. <br/><br/> എന്നാൽ ചർച്ച പരിമിതമാണ് അല്ലെങ്കിൽ യഥാർത്ഥ ലോക സംഭവമെന്ന തെളിവ് കുറവാണ്. | ഒരു ഡാറ്റ ചലഞ്ച് തിരിച്ചറിയപ്പെട്ടിട്ടുണ്ട്. <br/><br/> എന്നാൽ വിവരണം അല്ലെങ്കിൽ റിസോഴ്‌സുകൾ ചലഞ്ച് ശരിയായി പ്രതിഫലിപ്പിക്കുന്നില്ല അല്ലെങ്കിൽ യഥാർത്ഥ ലോക സംഭവമെന്നു തെളിയിക്കുന്നില്ല. |
---
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
**അസൂയാ**:
ഈ രേഖ AI വിവർത്തന സേവനം [Co-op Translator](https://github.com/Azure/co-op-translator) ഉപയോഗിച്ച് വിവർത്തനം ചെയ്തതാണ്. നാം കൃത്യതയ്ക്ക് ശ്രമിച്ചെങ്കിലും, സ്വയം പ്രവർത്തിക്കുന്ന വിവർത്തനങ്ങളിൽ പിശകുകൾ അല്ലെങ്കിൽ തെറ്റുകൾ ഉണ്ടാകാമെന്ന് ദയവായി ശ്രദ്ധിക്കുക. അതിന്റെ മാതൃഭാഷയിലുള്ള യഥാർത്ഥ രേഖ പ്രാമാണികമായ ഉറവിടമായി കണക്കാക്കണം. നിർണായക വിവരങ്ങൾക്ക്, പ്രൊഫഷണൽ മനുഷ്യ വിവർത്തനം ശുപാർശ ചെയ്യപ്പെടുന്നു. ഈ വിവർത്തനത്തിന്റെ ഉപയോഗത്തിൽ നിന്നുണ്ടാകുന്ന ഏതെങ്കിലും തെറ്റിദ്ധാരണകൾക്കോ തെറ്റായ വ്യാഖ്യാനങ്ങൾക്കോ ഞങ്ങൾ ഉത്തരവാദികളല്ല.
<!-- CO-OP TRANSLATOR DISCLAIMER END -->

@ -0,0 +1,88 @@
<!--
CO_OP_TRANSLATOR_METADATA:
{
"original_hash": "12339119c0165da569a93ddba05f9339",
"translation_date": "2025-12-19T13:59:33+00:00",
"source_file": "1-Introduction/03-defining-data/README.md",
"language_code": "ml"
}
-->
# ഡാറ്റ നിർവചിക്കൽ
|![ Sketchnote by [(@sketchthedocs)](https://sketchthedocs.dev) ](../../sketchnotes/03-DefiningData.png)|
|:---:|
|ഡാറ്റ നിർവചിക്കൽ - _Sketchnote by [@nitya](https://twitter.com/nitya)_ |
ഡാറ്റ എന്നത് കണ്ടെത്തലുകൾ നടത്താനും വിവരസമ്പന്നമായ തീരുമാനങ്ങൾ പിന്തുണയ്ക്കാനും ഉപയോഗിക്കുന്ന വാസ്തവങ്ങൾ, വിവരങ്ങൾ, നിരീക്ഷണങ്ങൾ, അളവുകൾ എന്നിവയാണ്. ഒരു ഡാറ്റ പോയിന്റ് എന്നത് ഒരു ഡാറ്റാസെറ്റിനുള്ളിൽ ഉള്ള ഒരു ഏകക ഡാറ്റയാണ്, ഡാറ്റ പോയിന്റുകളുടെ സമാഹാരമാണ് ഡാറ്റാസെറ്റ്. ഡാറ്റാസെറ്റുകൾ വ്യത്യസ്ത ഫോർമാറ്റുകളിലും ഘടനകളിലും വരാം, സാധാരണയായി അതിന്റെ ഉറവിടം അല്ലെങ്കിൽ ഡാറ്റ എവിടെ നിന്നാണ് വന്നത് എന്നതിന്റെ അടിസ്ഥാനത്തിലാണ്. ഉദാഹരണത്തിന്, ഒരു കമ്പനിയുടെ മാസവരുമാനം ഒരു സ്പ്രെഡ്‌ഷീറ്റിൽ ഉണ്ടാകാം, എന്നാൽ ഒരു സ്മാർട്ട്‌വാച്ചിൽ നിന്നുള്ള മണിക്കൂറിൽ ഹൃദയമിടിപ്പ് ഡാറ്റ [JSON](https://stackoverflow.com/a/383699) ഫോർമാറ്റിൽ ഉണ്ടാകാം. ഒരു ഡാറ്റാസെറ്റിനുള്ളിൽ ഡാറ്റ സയന്റിസ്റ്റുകൾ വ്യത്യസ്ത തരത്തിലുള്ള ഡാറ്റകളുമായി പ്രവർത്തിക്കുന്നത് സാധാരണമാണ്.
ഈ പാഠം ഡാറ്റയുടെ സവിശേഷതകളും ഉറവിടങ്ങളും അടിസ്ഥാനമാക്കി ഡാറ്റ തിരിച്ചറിയാനും വർഗ്ഗീകരിക്കാനും ശ്രദ്ധ കേന്ദ്രീകരിക്കുന്നു.
## [പ്രീ-ലെക്ചർ ക്വിസ്](https://ff-quizzes.netlify.app/en/ds/quiz/4)
## ഡാറ്റ എങ്ങനെ വിവരണമാണ്
### റോ ഡാറ്റ
റോ ഡാറ്റ എന്നത് അതിന്റെ ഉറവിടത്തിൽ നിന്നുള്ള പ്രാഥമിക അവസ്ഥയിലുള്ള ഡാറ്റയാണ്, ഇത് വിശകലനം ചെയ്യപ്പെടുകയോ ക്രമീകരിക്കപ്പെടുകയോ ചെയ്തിട്ടില്ല. ഒരു ഡാറ്റാസെറ്റിൽ എന്ത് സംഭവിക്കുന്നു എന്ന് മനസ്സിലാക്കാൻ, അത് മനുഷ്യരും അവയെ കൂടുതൽ വിശകലനം ചെയ്യാൻ ഉപയോഗിക്കുന്ന സാങ്കേതികവിദ്യയും മനസ്സിലാക്കാൻ കഴിയുന്ന ഫോർമാറ്റിലേക്ക് ക്രമീകരിക്കേണ്ടതുണ്ട്. ഒരു ഡാറ്റാസെറ്റിന്റെ ഘടന അതെങ്ങനെ ക്രമീകരിച്ചിരിക്കുന്നു എന്ന് വിവരിക്കുന്നു, ഇത് ഘടനയുള്ള, ഘടനയില്ലാത്ത, അർദ്ധഘടനയുള്ള എന്നിങ്ങനെ വർഗ്ഗീകരിക്കാം. ഈ ഘടനാ തരം ഉറവിടത്തിന്റെ അടിസ്ഥാനത്തിൽ വ്യത്യാസപ്പെടും, പക്ഷേ ഒടുവിൽ ഈ മൂന്ന് വിഭാഗങ്ങളിൽ പെടും.
### അളവുകൂട്ടിയ ഡാറ്റ
അളവുകൂട്ടിയ ഡാറ്റ എന്നത് ഒരു ഡാറ്റാസെറ്റിനുള്ളിലെ സംഖ്യാത്മക നിരീക്ഷണങ്ങളാണ്, സാധാരണയായി ഇത് വിശകലനം ചെയ്യാനും അളക്കാനും ഗണിതപരമായി ഉപയോഗിക്കാനും കഴിയും. അളവുകൂട്ടിയ ഡാറ്റയുടെ ചില ഉദാഹരണങ്ങൾ: ഒരു രാജ്യത്തിന്റെ ജനസംഖ്യ, ഒരു വ്യക്തിയുടെ ഉയരം, ഒരു കമ്പനിയുടെ ത്രൈമാസ വരുമാനം. കൂടുതൽ വിശകലനത്തോടെ, അളവുകൂട്ടിയ ഡാറ്റ ഉപയോഗിച്ച് എയർ ക്വാളിറ്റി ഇൻഡക്സ് (AQI) ന്റെ സീസണൽ ട്രെൻഡുകൾ കണ്ടെത്താനോ സാധാരണ ജോലി ദിവസത്തിലെ തിരക്കുള്ള സമയത്തിന്റെ സാധ്യത കണക്കാക്കാനോ കഴിയും.
### ഗുണപരമായ ഡാറ്റ
ഗുണപരമായ ഡാറ്റ, അല്ലെങ്കിൽ വർഗ്ഗീയ ഡാറ്റ എന്നറിയപ്പെടുന്നത്, അളവുകൂട്ടിയ ഡാറ്റ പോലെയുള്ള വസ്തുനിഷ്ഠമായി അളക്കാനാകാത്ത ഡാറ്റയാണ്. സാധാരണയായി ഇത് ഉൽപ്പന്നം അല്ലെങ്കിൽ പ്രക്രിയ പോലുള്ള ഒന്നിന്റെ ഗുണനിലവാരം പിടിച്ചെടുക്കുന്ന വിവിധ സ്വഭാവത്തിലുള്ള വിഷയപരമായ ഡാറ്റയാണ്. ചിലപ്പോൾ, ഗുണപരമായ ഡാറ്റ സംഖ്യാത്മകമായിരിക്കാം, എന്നാൽ സാധാരണ ഗണിതപരമായി ഉപയോഗിക്കാറില്ല, ഉദാഹരണത്തിന് ഫോൺ നമ്പറുകൾ അല്ലെങ്കിൽ ടൈംസ്റ്റാമ്പുകൾ. ഗുണപരമായ ഡാറ്റയുടെ ചില ഉദാഹരണങ്ങൾ: വീഡിയോ കമന്റുകൾ, ഒരു കാറിന്റെ നിർമ്മാതാവ് മോഡൽ, നിങ്ങളുടെ അടുത്ത സുഹൃത്തുക്കളുടെ പ്രിയപ്പെട്ട നിറം. ഗുണപരമായ ഡാറ്റ ഉപഭോക്താക്കൾക്ക് ഏറ്റവും ഇഷ്ടപ്പെട്ട ഉൽപ്പന്നങ്ങൾ മനസ്സിലാക്കാനോ ജോലി അപേക്ഷാ റിസ്യൂമുകളിൽ ജനപ്രിയമായ കീവേഡുകൾ തിരിച്ചറിയാനോ ഉപയോഗിക്കാം.
### ഘടനയുള്ള ഡാറ്റ
ഘടനയുള്ള ഡാറ്റ എന്നത് വരികളും കോളങ്ങളുമായി ക്രമീകരിച്ചിരിക്കുന്ന ഡാറ്റയാണ്, ഓരോ വരിയിലും ഒരേ സെറ്റ് കോളങ്ങൾ ഉണ്ടാകും. കോളങ്ങൾ ഒരു പ്രത്യേക തരം മൂല്യത്തെ പ്രതിനിധീകരിക്കുന്നു, ആ മൂല്യം എന്താണെന്ന് വിവരിക്കുന്ന പേരോടെ തിരിച്ചറിയപ്പെടും, വരികൾ യഥാർത്ഥ മൂല്യങ്ങൾ അടങ്ങിയിരിക്കും. കോളങ്ങളിൽ സാധാരണയായി മൂല്യങ്ങൾക്ക് പ്രത്യേക നിയമങ്ങളോ നിയന്ത്രണങ്ങളോ ഉണ്ടാകും, മൂല്യങ്ങൾ കോളത്തെ ശരിയായി പ്രതിനിധീകരിക്കുന്നുവെന്ന് ഉറപ്പാക്കാൻ. ഉദാഹരണത്തിന്, ഓരോ വരിയിലും ഫോൺ നമ്പർ ഉണ്ടായിരിക്കേണ്ട ഒരു ഉപഭോക്തൃ സ്പ്രെഡ്‌ഷീറ്റിനെ കണക്കാക്കുക, ഫോൺ നമ്പറുകളിൽ അക്ഷരങ്ങൾ ഉണ്ടായിരിക്കരുത്. ഫോൺ നമ്പർ കോളത്തിൽ ശൂന്യമാകരുത്, നമ്പറുകൾ മാത്രമേ അടങ്ങിയിരിക്കൂ എന്നിങ്ങനെ നിയമങ്ങൾ പ്രയോഗിക്കാം.
ഘടനയുള്ള ഡാറ്റയുടെ ഒരു ഗുണം, അത് മറ്റൊരു ഘടനയുള്ള ഡാറ്റയുമായി ബന്ധിപ്പിക്കാവുന്നതാണ്. എന്നാൽ, ഡാറ്റ ഒരു പ്രത്യേക രീതിയിൽ ക്രമീകരിക്കാൻ രൂപകൽപ്പന ചെയ്തതിനാൽ, അതിന്റെ മൊത്തം ഘടനയിൽ മാറ്റം വരുത്താൻ വലിയ ശ്രമം വേണം. ഉദാഹരണത്തിന്, ഉപഭോക്തൃ സ്പ്രെഡ്‌ഷീറ്റിൽ ശൂന്യമാകരുതാത്ത ഒരു ഇമെയിൽ കോളം ചേർക്കുന്നത്, നിലവിലുള്ള വരികളിൽ ഈ മൂല്യങ്ങൾ എങ്ങനെ ചേർക്കാമെന്ന് കണ്ടെത്തേണ്ടതായിരിക്കും.
ഘടനയുള്ള ഡാറ്റയുടെ ഉദാഹരണങ്ങൾ: സ്പ്രെഡ്‌ഷീറ്റുകൾ, റിലേഷണൽ ഡാറ്റാബേസുകൾ, ഫോൺ നമ്പറുകൾ, ബാങ്ക് സ്റ്റേറ്റ്മെന്റുകൾ
### ഘടനയില്ലാത്ത ഡാറ്റ
ഘടനയില്ലാത്ത ഡാറ്റ സാധാരണയായി വരികളിലോ കോളങ്ങളിലോ വർഗ്ഗീകരിക്കാനാകാത്തതും ഒരു ഫോർമാറ്റോ നിയമങ്ങളോ ഇല്ലാത്തതുമാണ്. ഘടനയില്ലാത്ത ഡാറ്റയുടെ ഘടനയിൽ കുറവ് നിയന്ത്രണങ്ങൾ ഉള്ളതിനാൽ, പുതിയ വിവരങ്ങൾ ചേർക്കുന്നത് ഘടനയുള്ള ഡാറ്റാസെറ്റിനേക്കാൾ എളുപ്പമാണ്. ഒരു സെൻസർ 2 മിനിറ്റിൽ ഒരു തവണ ബാരോമെട്രിക് പ്രഷർ ഡാറ്റ ശേഖരിക്കുന്നുണ്ടെങ്കിൽ, ഇപ്പോൾ താപനില അളക്കാനും രേഖപ്പെടുത്താനും കഴിയുന്ന അപ്ഡേറ്റ് ലഭിച്ചാൽ, അത് ഘടനയില്ലാത്ത ഡാറ്റ ആണെങ്കിൽ നിലവിലുള്ള ഡാറ്റ മാറ്റേണ്ടതില്ല. എന്നാൽ, ഈ തരത്തിലുള്ള ഡാറ്റ വിശകലനം ചെയ്യുന്നതിന് കൂടുതൽ സമയം എടുക്കാം. ഉദാഹരണത്തിന്, ഒരു ശാസ്ത്രജ്ഞൻ സെൻസർ ഡാറ്റയിൽ നിന്നുള്ള കഴിഞ്ഞ മാസത്തെ ശരാശരി താപനില കണ്ടെത്താൻ ശ്രമിക്കുമ്പോൾ, ചില രേഖപ്പെടുത്തിയ ഡാറ്റയിൽ "e" എന്നത് സെൻസർ തകരാറിലായിരുന്നുവെന്ന് സൂചിപ്പിക്കാൻ ഉപയോഗിച്ചതായി കണ്ടെത്തുന്നു, അതായത് ഡാറ്റ അപൂർണ്ണമാണ്.
ഘടനയില്ലാത്ത ഡാറ്റയുടെ ഉദാഹരണങ്ങൾ: ടെക്സ്റ്റ് ഫയലുകൾ, ടെക്സ്റ്റ് സന്ദേശങ്ങൾ, വീഡിയോ ഫയലുകൾ
### അർദ്ധഘടനയുള്ള ഡാറ്റ
അർദ്ധഘടനയുള്ള ഡാറ്റ ഘടനയുള്ളതും ഘടനയില്ലാത്തതുമായ ഡാറ്റയുടെ സംയോജനം പോലെയാണ്. സാധാരണയായി വരികളും കോളങ്ങളുമായുള്ള ഫോർമാറ്റിൽ ഒത്തുപോകുന്നില്ല, പക്ഷേ ഘടനയുള്ളതായും സ്ഥിരമായ ഫോർമാറ്റോ നിയമങ്ങളോ പാലിക്കുന്നതുമായ രീതിയിൽ ക്രമീകരിച്ചിരിക്കുന്നു. ഘടന ഉറവിടങ്ങൾക്കിടയിൽ വ്യത്യാസപ്പെടും, ഉദാഹരണത്തിന് നന്നായി നിർവചിച്ച ഹയർആർക്കി മുതൽ പുതിയ വിവരങ്ങൾ എളുപ്പത്തിൽ സംയോജിപ്പിക്കാൻ അനുവദിക്കുന്ന കൂടുതൽ സൗകര്യമുള്ള ഘടന വരെ. മെറ്റാഡേറ്റ എന്നത് ഡാറ്റ എങ്ങനെ ക്രമീകരിച്ചിരിക്കുന്നു എന്ന് തീരുമാനിക്കാൻ സഹായിക്കുന്ന സൂചകങ്ങളാണ്, ഡാറ്റയുടെ തരം അനുസരിച്ച് വിവിധ പേരുകൾ ഉണ്ടാകും. മെറ്റാഡേറ്റയ്ക്ക് സാധാരണ പേരുകൾ: ടാഗുകൾ, ഘടകങ്ങൾ, ഘടനകൾ, ഗുണങ്ങൾ. ഉദാഹരണത്തിന്, ഒരു സാധാരണ ഇമെയിൽ സന്ദേശത്തിന് വിഷയം, ശരീരം, സ്വീകരിക്കുന്നവരുടെ ഒരു സെറ്റ് ഉണ്ടാകും, അയച്ചത് ആരാണെന്നും എപ്പോൾ ആണെന്നും ക്രമീകരിക്കാവുന്നതാണ്.
അർദ്ധഘടനയുള്ള ഡാറ്റയുടെ ഉദാഹരണങ്ങൾ: HTML, CSV ഫയലുകൾ, ജാവാസ്ക്രിപ്റ്റ് ഒബ്ജക്റ്റ് നോട്ടേഷൻ (JSON)
## ഡാറ്റയുടെ ഉറവിടങ്ങൾ
ഡാറ്റ ഉറവിടം എന്നത് ഡാറ്റ എവിടെ സൃഷ്ടിക്കപ്പെട്ടുവോ "വസിക്കുന്നിടമോ" ആ പ്രാഥമിക സ്ഥലം ആണ്, ഇത് എങ്ങനെ എപ്പോൾ ശേഖരിച്ചതിന്റെ അടിസ്ഥാനത്തിൽ വ്യത്യാസപ്പെടും. ഉപയോക്താക്കൾ സൃഷ്ടിച്ച ഡാറ്റ പ്രാഥമിക ഡാറ്റയായി അറിയപ്പെടുന്നു, പൊതുവായ ഉപയോഗത്തിനായി ശേഖരിച്ച ഡാറ്റ രണ്ടാമത്തെ ഡാറ്റയാണ്. ഉദാഹരണത്തിന്, ഒരു ഗ്രൂപ്പ് ശാസ്ത്രജ്ഞർ ഒരു മഴക്കാടിൽ നിരീക്ഷണങ്ങൾ ശേഖരിക്കുന്നത് പ്രാഥമികമായി കണക്കാക്കപ്പെടും, അവർ അത് മറ്റ് ശാസ്ത്രജ്ഞരുമായി പങ്കുവെക്കാൻ തീരുമാനിച്ചാൽ അത് ഉപയോഗിക്കുന്നവർക്കു രണ്ടാമത്തെ ഡാറ്റയായി കണക്കാക്കപ്പെടും.
ഡാറ്റാബേസുകൾ സാധാരണ ഉറവിടമാണ്, ഡാറ്റാബേസ് മാനേജ്മെന്റ് സിസ്റ്റം ഡാറ്റ ഹോസ്റ്റ് ചെയ്യാനും പരിപാലിക്കാനും ഉപയോഗിക്കുന്നു, ഉപയോക്താക്കൾ ക്വെറിയുകൾ എന്ന കമാൻഡുകൾ ഉപയോഗിച്ച് ഡാറ്റ പരിശോധിക്കുന്നു. ഫയലുകൾ ഡാറ്റ ഉറവിടങ്ങളായി ഓഡിയോ, ഇമേജ്, വീഡിയോ ഫയലുകൾ കൂടാതെ എക്സൽ പോലുള്ള സ്പ്രെഡ്‌ഷീറ്റുകളും ആകാം. ഇന്റർനെറ്റ് ഉറവിടങ്ങൾ ഡാറ്റ ഹോസ്റ്റ് ചെയ്യാനുള്ള സാധാരണ സ്ഥലമാണ്, ഡാറ്റാബേസുകളും ഫയലുകളും അവിടെ കാണാം. ആപ്ലിക്കേഷൻ പ്രോഗ്രാമിംഗ് ഇന്റർഫേസുകൾ (APIs) പ്രോഗ്രാമർമാർക്ക് ഡാറ്റ ഇന്റർനെറ്റിലൂടെ ബാഹ്യ ഉപയോക്താക്കളുമായി പങ്കുവെക്കാനുള്ള മാർഗങ്ങൾ സൃഷ്ടിക്കാൻ അനുവദിക്കുന്നു, വെബ് സ്ക്രാപ്പിംഗ് എന്ന പ്രക്രിയ വെബ് പേജിൽ നിന്നുള്ള ഡാറ്റ എടുക്കുന്നു. [ഡാറ്റയുമായി പ്രവർത്തിക്കൽ](../../../../../../../../../2-Working-With-Data) പാഠങ്ങൾ വിവിധ ഡാറ്റ ഉറവിടങ്ങൾ എങ്ങനെ ഉപയോഗിക്കാമെന്ന് ശ്രദ്ധിക്കുന്നു.
## സമാപനം
ഈ പാഠത്തിൽ നാം പഠിച്ചത്:
- ഡാറ്റ എന്താണെന്ന്
- ഡാറ്റ എങ്ങനെ വിവരണമാണ്
- ഡാറ്റ എങ്ങനെ വർഗ്ഗീകരിക്കപ്പെടുന്നു
- ഡാറ്റ എവിടെ കണ്ടെത്താം
## 🚀 ചലഞ്ച്
കാഗിൾ തുറന്ന ഡാറ്റാസെറ്റുകളുടെ മികച്ച ഉറവിടമാണ്. [ഡാറ്റാസെറ്റ് തിരയൽ ഉപകരണം](https://www.kaggle.com/datasets) ഉപയോഗിച്ച് ചില രസകരമായ ഡാറ്റാസെറ്റുകൾ കണ്ടെത്തി ഈ മാനദണ്ഡങ്ങൾ ഉപയോഗിച്ച് 3-5 ഡാറ്റാസെറ്റുകൾ വർഗ്ഗീകരിക്കുക:
- ഡാറ്റ അളവുകൂട്ടിയതാണോ ഗുണപരമായതാണോ?
- ഡാറ്റ ഘടനയുള്ളതാണോ, ഘടനയില്ലാത്തതാണോ, അർദ്ധഘടനയുള്ളതാണോ?
## [പോസ്റ്റ്-ലെക്ചർ ക്വിസ്](https://ff-quizzes.netlify.app/en/ds/quiz/5)
## അവലോകനം & സ്വയം പഠനം
- [Classify your Data](https://docs.microsoft.com/en-us/learn/modules/choose-storage-approach-in-azure/2-classify-data) എന്ന മൈക്രോസോഫ്റ്റ് ലേൺ യൂണിറ്റ് ഘടനയുള്ള, അർദ്ധഘടനയുള്ള, ഘടനയില്ലാത്ത ഡാറ്റയുടെ വിശദമായ വിഭജനം നൽകുന്നു.
## അസൈൻമെന്റ്
[Classifying Datasets](assignment.md)
---
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
**അസൂയാ**:
ഈ രേഖ AI വിവർത്തന സേവനം [Co-op Translator](https://github.com/Azure/co-op-translator) ഉപയോഗിച്ച് വിവർത്തനം ചെയ്തതാണ്. നാം കൃത്യതയ്ക്ക് ശ്രമിച്ചിട്ടുണ്ടെങ്കിലും, സ്വയം പ്രവർത്തിക്കുന്ന വിവർത്തനങ്ങളിൽ പിശകുകൾ അല്ലെങ്കിൽ തെറ്റുകൾ ഉണ്ടാകാമെന്ന് ദയവായി ശ്രദ്ധിക്കുക. അതിന്റെ മാതൃഭാഷയിലുള്ള യഥാർത്ഥ രേഖയാണ് പ്രാമാണികമായ ഉറവിടം എന്ന് പരിഗണിക്കേണ്ടതാണ്. നിർണായകമായ വിവരങ്ങൾക്ക്, പ്രൊഫഷണൽ മനുഷ്യ വിവർത്തനം ശുപാർശ ചെയ്യപ്പെടുന്നു. ഈ വിവർത്തനം ഉപയോഗിക്കുന്നതിൽ നിന്നുണ്ടാകുന്ന ഏതെങ്കിലും തെറ്റിദ്ധാരണകൾക്കോ തെറ്റായ വ്യാഖ്യാനങ്ങൾക്കോ ഞങ്ങൾ ഉത്തരവാദികളല്ല.
<!-- CO-OP TRANSLATOR DISCLAIMER END -->

@ -0,0 +1,81 @@
<!--
CO_OP_TRANSLATOR_METADATA:
{
"original_hash": "2e5cacb967c1e9dfd07809bfc441a0b4",
"translation_date": "2025-12-19T14:01:37+00:00",
"source_file": "1-Introduction/03-defining-data/assignment.md",
"language_code": "ml"
}
-->
# ഡാറ്റാസെറ്റുകൾ വർഗ്ഗീകരിക്കൽ
## നിർദ്ദേശങ്ങൾ
ഈ അസൈൻമെന്റിലെ പ്രോംപ്റ്റുകൾ പിന്തുടർന്ന് താഴെ കൊടുത്തിരിക്കുന്ന ഓരോ ഡാറ്റാ തരം ഓരോന്നായി തിരിച്ചറിയുകയും വർഗ്ഗീകരിക്കുകയും ചെയ്യുക:
**സ്ട്രക്ചർ തരം**: സ്ട്രക്ചർഡ്, സെമി-സ്ട്രക്ചർഡ്, അല്ലെങ്കിൽ അൺസ്ട്രക്ചർഡ്
**വാല്യു തരം**: ഗുണപരമായ (Qualitative) അല്ലെങ്കിൽ അളവുപരമായ (Quantitative)
**സോഴ്‌സ് തരം**: പ്രൈമറി അല്ലെങ്കിൽ സെക്കൻഡറി
1. ഒരു കമ്പനി ഏറ്റെടുത്ത് ഇപ്പോൾ ഒരു പാരന്റ് കമ്പനി ഉണ്ട്. ഡാറ്റാ സയന്റിസ്റ്റുകൾക്ക് പാരന്റ് കമ്പനിയിൽ നിന്നുള്ള കസ്റ്റമർ ഫോൺ നമ്പറുകളുടെ സ്പ്രെഡ്‌ഷീറ്റ് ലഭിച്ചു.
Structure Type:
Value Type:
Source Type:
---
2. ഒരു സ്മാർട്ട് വാച്ച് ധാരകൻ്റെ ഹൃദയമിടിപ്പ് ഡാറ്റ ശേഖരിച്ച് വരികയാണ്, ആ റോ ഡാറ്റ JSON ഫോർമാറ്റിലാണ്.
Structure Type:
Value Type:
Source Type:
---
3. ഒരു CSV ഫയലിൽ സൂക്ഷിച്ചിരിക്കുന്ന ജീവനക്കാരുടെ മനോഭാവം സംബന്ധിച്ച ജോലി സ്ഥല സർവേ.
Structure Type:
Value Type:
Source Type:
---
4. ആസ്ട്രോഫിസിസ്റുകൾ ഒരു സ്പേസ് പ്രോബിൽ ശേഖരിച്ച ഗാലക്സികളുടെ ഡാറ്റാബേസ് ആക്‌സസ് ചെയ്യുന്നു. ഡാറ്റയിൽ ഓരോ ഗാലക്സിയിലുമുള്ള ഗ്രഹങ്ങളുടെ എണ്ണം ഉൾപ്പെടുന്നു.
Structure Type:
Value Type:
Source Type:
---
5. ഒരു വ്യക്തിഗത ധനകാര്യ ആപ്പ് ഉപയോക്താവിന്റെ ധനകാര്യ അക്കൗണ്ടുകളുമായി APIകൾ വഴി ബന്ധപ്പെടുന്നു, അവരുടെ നെറ്റ് വർത്ത് കണക്കാക്കാൻ. അവർക്ക് എല്ലാ ഇടപാടുകളും വരികളും കോളങ്ങളുമായി ഉള്ള സ്പ്രെഡ്‌ഷീറ്റിനോട് സമാനമായ ഫോർമാറ്റിൽ കാണാം.
Structure Type:
Value Type:
Source Type:
## റൂബ്രിക്
Exemplary | Adequate | Needs Improvement
--- | --- | -- |
സ്ട്രക്ചർ, വാല്യു, സോഴ്‌സ് തരം എല്ലാം ശരിയായി തിരിച്ചറിയുന്നു |സ്ട്രക്ചർ, വാല്യു, സോഴ്‌സ് തരം 3 ശരിയായി തിരിച്ചറിയുന്നു|സ്ട്രക്ചർ, വാല്യു, സോഴ്‌സ് തരം 2 അല്ലെങ്കിൽ കുറവ് ശരിയായി തിരിച്ചറിയുന്നു|
---
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
**അസൂയാ**:
ഈ രേഖ AI വിവർത്തന സേവനം [Co-op Translator](https://github.com/Azure/co-op-translator) ഉപയോഗിച്ച് വിവർത്തനം ചെയ്തതാണ്. നാം കൃത്യതയ്ക്ക് ശ്രമിച്ചെങ്കിലും, സ്വയം പ്രവർത്തിക്കുന്ന വിവർത്തനങ്ങളിൽ പിശകുകൾ അല്ലെങ്കിൽ തെറ്റുകൾ ഉണ്ടാകാമെന്ന് ദയവായി ശ്രദ്ധിക്കുക. അതിന്റെ മാതൃഭാഷയിലുള്ള യഥാർത്ഥ രേഖ അധികാരപരമായ ഉറവിടമായി കണക്കാക്കപ്പെടണം. നിർണായക വിവരങ്ങൾക്ക്, പ്രൊഫഷണൽ മനുഷ്യ വിവർത്തനം ശുപാർശ ചെയ്യപ്പെടുന്നു. ഈ വിവർത്തനത്തിന്റെ ഉപയോഗത്തിൽ നിന്നുണ്ടാകുന്ന ഏതെങ്കിലും തെറ്റിദ്ധാരണകൾക്കോ തെറ്റായ വ്യാഖ്യാനങ്ങൾക്കോ ഞങ്ങൾ ഉത്തരവാദികളല്ല.
<!-- CO-OP TRANSLATOR DISCLAIMER END -->

@ -0,0 +1,280 @@
<!--
CO_OP_TRANSLATOR_METADATA:
{
"original_hash": "ce95884566a74db72572cd51f0cb25ad",
"translation_date": "2025-12-19T13:51:35+00:00",
"source_file": "1-Introduction/04-stats-and-probability/README.md",
"language_code": "ml"
}
-->
# സാംഖ്യശാസ്ത്രത്തെയും സാദ്ധ്യതയെയും കുറിച്ചുള്ള ഒരു സംക്ഷിപ്ത പരിചയം
|![ Sketchnote by [(@sketchthedocs)](https://sketchthedocs.dev) ](../../sketchnotes/04-Statistics-Probability.png)|
|:---:|
| സാംഖ്യശാസ്ത്രവും സാദ്ധ്യതയും - _Sketchnote by [@nitya](https://twitter.com/nitya)_ |
സാംഖ്യശാസ്ത്രവും സാദ്ധ്യത സിദ്ധാന്തവും ഗണിതശാസ്ത്രത്തിന്റെ രണ്ട് വളരെ ബന്ധപ്പെട്ട മേഖലകളാണ്, ഇവ ഡാറ്റാ സയൻസിനോട് വളരെ ബന്ധപ്പെട്ടവയാണ്. ഗണിതശാസ്ത്രത്തിന്റെ ആഴത്തിലുള്ള അറിവില്ലാതെ ഡാറ്റയുമായി പ്രവർത്തിക്കുന്നത് സാധ്യമാണ്, പക്ഷേ കുറഞ്ഞത് ചില അടിസ്ഥാന ആശയങ്ങൾ അറിയുന്നത് മെച്ചമാണ്. ഇവിടെ നിങ്ങൾക്ക് ആരംഭിക്കാൻ സഹായിക്കുന്ന ഒരു ചെറിയ പരിചയം നൽകുന്നു.
[![Intro Video](../../../../translated_images/video-prob-and-stats.e4282e5efa2f2543400843ed98b1057065c9600cebfc8a728e8931b5702b2ae4.ml.png)](https://youtu.be/Z5Zy85g4Yjw)
## [പ്രീ-ലെക്ചർ ക്വിസ്](https://ff-quizzes.netlify.app/en/ds/quiz/6)
## സാദ്ധ്യതയും യാദൃച്ഛിക ചാരത്രങ്ങളും
**സാദ്ധ്യത** എന്നത് 0നു 1നു ഇടയിൽ ഉള്ള ഒരു സംഖ്യയാണ്, അത് ഒരു **സംഭവം** എത്രത്തോളം സംഭവിക്കാനിടയുള്ളതാണെന്ന് പ്രകടിപ്പിക്കുന്നു. എല്ലാ ഫലങ്ങളും സമാനമായ സാദ്ധ്യതയുള്ളതായി കരുതുമ്പോൾ, ഒരു സംഭവത്തിലേക്ക് നയിക്കുന്ന പോസിറ്റീവ് ഫലങ്ങളുടെ എണ്ണം മൊത്തം ഫലങ്ങളുടെ എണ്ണത്തിൽ വിഭജിച്ച സംഖ്യയായി ഇത് നിർവചിക്കപ്പെടുന്നു. ഉദാഹരണത്തിന്, ഒരു ഡൈസ് എറിയുമ്പോൾ, സമസംഖ്യ ലഭിക്കാനുള്ള സാദ്ധ്യത 3/6 = 0.5 ആണ്.
സംഭവങ്ങളെ കുറിച്ച് സംസാരിക്കുമ്പോൾ, **യാദൃച്ഛിക ചാരത്രങ്ങൾ** ഉപയോഗിക്കുന്നു. ഉദാഹരണത്തിന്, ഒരു ഡൈസ് എറിയുമ്പോൾ ലഭിക്കുന്ന സംഖ്യയെ പ്രതിനിധീകരിക്കുന്ന യാദൃച്ഛിക ചാരത്രം 1 മുതൽ 6 വരെ മൂല്യങ്ങൾ സ്വീകരിക്കും. 1 മുതൽ 6 വരെ സംഖ്യകളുടെ സമുച്ചയം **സാമ്പിൾ സ്പേസ്** എന്ന് വിളിക്കുന്നു. ഒരു യാദൃച്ഛിക ചാരത്രം ഒരു പ്രത്യേക മൂല്യം സ്വീകരിക്കുന്ന സാദ്ധ്യതയെക്കുറിച്ച് സംസാരിക്കാം, ഉദാഹരണത്തിന് P(X=3)=1/6.
മുൻ ഉദാഹരണത്തിലെ യാദൃച്ഛിക ചാരത്രം **ഡിസ്ക്രീറ്റ്** ആണ്, കാരണം അതിന് എണ്ണാവുന്ന സാമ്പിൾ സ്പേസ് ഉണ്ട്, അഥവാ വേർതിരിച്ചുള്ള മൂല്യങ്ങൾ എണ്ണാം. ചിലപ്പോൾ സാമ്പിൾ സ്പേസ് യഥാർത്ഥ സംഖ്യകളുടെ ഒരു പരിധിയാകാം, അല്ലെങ്കിൽ മുഴുവൻ യഥാർത്ഥ സംഖ്യകളുടെ സമുച്ചയമായിരിക്കാം. ഇത്തരം ചാരത്രങ്ങളെ **കണ്ടിന്യൂവസ്** എന്ന് വിളിക്കുന്നു. ഒരു നല്ല ഉദാഹരണം ബസ്സ് എത്തുന്ന സമയം ആണ്.
## സാദ്ധ്യത വിതരണങ്ങൾ
ഡിസ്ക്രീറ്റ് യാദൃച്ഛിക ചാരത്രങ്ങളുടെ കാര്യത്തിൽ, ഓരോ സംഭവത്തിന്റെയും സാദ്ധ്യത ഒരു ഫംഗ്ഷൻ P(X) ആയി എളുപ്പത്തിൽ വിവരിക്കാം. സാമ്പിൾ സ്പേസ് *S* യിൽ നിന്നുള്ള ഓരോ മൂല്യത്തിനും *s* 0 മുതൽ 1 വരെ ഒരു സംഖ്യ നൽകും, എല്ലാ സംഭവങ്ങൾക്കും P(X=s) മൂല്യങ്ങളുടെ മൊത്തം 1 ആകും.
ഏറ്റവും പ്രശസ്തമായ ഡിസ്ക്രീറ്റ് വിതരണമാണ് **യൂണിഫോം വിതരണം**, ഇതിൽ N ഘടകങ്ങളുള്ള സാമ്പിൾ സ്പേസ് ഉണ്ട്, ഓരോ ഘടകത്തിനും 1/N എന്ന സമാന സാദ്ധ്യതയുണ്ട്.
കണ്ടിന്യൂവസ് ചാരത്രത്തിന്റെ സാദ്ധ്യത വിതരണം വിവരിക്കുന്നത് കൂടുതൽ ബുദ്ധിമുട്ടാണ്, മൂല്യങ്ങൾ [a,b] എന്ന ഒരു ഇടവേളയിൽ നിന്നോ, മുഴുവൻ യഥാർത്ഥ സംഖ്യകളിൽ നിന്നോ വരാം. ബസ്സ് എത്തുന്ന സമയത്തിന്റെ ഉദാഹരണം പരിഗണിക്കൂ. യഥാർത്ഥത്തിൽ, ഓരോ കൃത്യമായ എത്തുന്ന സമയത്തിനും *t*, ബസ്സ് ആ സമയത്ത് എത്താനുള്ള സാദ്ധ്യത 0 ആണ്!
> ഇപ്പോൾ നിങ്ങൾക്ക് അറിയാം, 0 സാദ്ധ്യതയുള്ള സംഭവങ്ങൾ സംഭവിക്കുന്നു, അതും വളരെ പലപ്പോഴും! കുറഞ്ഞത് ബസ്സ് എത്തുന്ന ഓരോ തവണയും!
ഒരു ചാരത്രം ഒരു നൽകിയ മൂല്യ പരിധിയിൽപ്പെടുന്ന സാദ്ധ്യതയെക്കുറിച്ച് മാത്രമേ സംസാരിക്കാനാകൂ, ഉദാഹരണത്തിന് P(t<sub>1</sub>&le;X&lt;t<sub>2</sub>). ഈ സാഹചര്യത്തിൽ, സാദ്ധ്യത വിതരണം **സാദ്ധ്യത സാന്ദ്രത ഫംഗ്ഷൻ** p(x) ഉപയോഗിച്ച് വിവരിക്കപ്പെടുന്നു, അതായത്
![P(t_1\le X<t_2)=\int_{t_1}^{t_2}p(x)dx](../../../../translated_images/probability-density.a8aad29f17a14afb519b407c7b6edeb9f3f9aa5f69c9e6d9445f604e5f8a2bf7.ml.png)
യൂണിഫോം വിതരണത്തിന്റെ കണ്ടിന്യൂവസ് അനലോഗ് **കണ്ടിന്യൂവസ് യൂണിഫോം** എന്നാണ് വിളിക്കുന്നത്, ഇത് ഒരു പരിധിയിലായി നിർവചിക്കപ്പെടുന്നു. മൂല്യം X ഒരു l നീളമുള്ള ഇടവേളയിൽപ്പെടാനുള്ള സാദ്ധ്യത l-നോട് അനുപാതികമാണ്, കൂടാതെ 1 വരെ ഉയരും.
മറ്റൊരു പ്രധാന വിതരണമാണ് **നോർമൽ വിതരണം**, അതിനെ കുറിച്ച് താഴെ കൂടുതൽ വിശദമായി സംസാരിക്കും.
## ശരാശരി, വ്യതിയാനം, സ്റ്റാൻഡേർഡ് ഡിവിയേഷൻ
ഒരു യാദൃച്ഛിക ചാരത്രം X ന്റെ n സാമ്പിളുകളുടെ ഒരു ശ്രേണി വരച്ചെടുക്കുക: x<sub>1</sub>, x<sub>2</sub>, ..., x<sub>n</sub>. പരമ്പരയുടെ **ശരാശരി** (അഥവാ **അരിത്മെറ്റിക് ശരാശരി**) മൂല്യം പരമ്പരയുടെ മൂല്യങ്ങളുടെ കൂട്ടം n-ൽ വിഭജിച്ചാണ് നിർവചിക്കുന്നത് (x<sub>1</sub>+x<sub>2</sub>+...+x<sub>n</sub>)/n. സാമ്പിൾ വലുപ്പം (n&rarr;&infin;) വർദ്ധിപ്പിക്കുമ്പോൾ, വിതരണത്തിന്റെ ശരാശരി (അഥവാ **പ്രതീക്ഷ**), ലഭിക്കും. പ്രതീക്ഷ **E**(x) ആയി സൂചിപ്പിക്കും.
> ഏതെങ്കിലും ഡിസ്ക്രീറ്റ് വിതരണത്തിനായി മൂല്യങ്ങൾ {x<sub>1</sub>, x<sub>2</sub>, ..., x<sub>N</sub>} ഉം അനുബന്ധ സാദ്ധ്യതകൾ p<sub>1</sub>, p<sub>2</sub>, ..., p<sub>N</sub> ഉം ഉള്ളപ്പോൾ, പ്രതീക്ഷ E(X)=x<sub>1</sub>p<sub>1</sub>+x<sub>2</sub>p<sub>2</sub>+...+x<sub>N</sub>p<sub>N</sub> ആകുമെന്ന് കാണിക്കാം.
മൂല്യങ്ങൾ എത്രത്തോളം വ്യാപിച്ചിരിക്കുന്നു എന്ന് തിരിച്ചറിയാൻ, വ്യതിയാനം &sigma;<sup>2</sup> = &sum;(x<sub>i</sub> - &mu;)<sup>2</sup>/n കണക്കാക്കാം, ഇവിടെ &mu; പരമ്പരയുടെ ശരാശരിയാണ്. &sigma; എന്നത് **സ്റ്റാൻഡേർഡ് ഡിവിയേഷൻ** എന്നും &sigma;<sup>2</sup> **വ്യതിയാനം** എന്നും വിളിക്കുന്നു.
## മോഡ്, മീഡിയൻ, ക്വാർട്ടൈൽസ്
എപ്പോൾ ചിലപ്പോൾ ശരാശരി ഡാറ്റയുടെ "സാധാരണ" മൂല്യം ശരിയായി പ്രതിനിധീകരിക്കാറില്ല. ഉദാഹരണത്തിന്, ചില അത്യന്തം വ്യത്യസ്ത മൂല്യങ്ങൾ ശരാശരിയെ ബാധിക്കാം. മറ്റൊരു നല്ല സൂചനയാണ് **മീഡിയൻ**, അതായത് ഡാറ്റയിലെ പകുതി പോയിന്റുകൾ അതിനേക്കാൾ താഴെയായിരിക്കും, മറ്റെ പകുതി അതിനേക്കാൾ ഉയർന്നിരിക്കും.
ഡാറ്റയുടെ വിതരണത്തെ മനസ്സിലാക്കാൻ സഹായിക്കുന്നതിന് **ക്വാർട്ടൈൽസ്** ഉപയോഗിക്കുന്നു:
* ആദ്യ ക്വാർട്ടൈൽ, അല്ലെങ്കിൽ Q1, 25% ഡാറ്റ അതിനേക്കാൾ താഴെയായിരിക്കും
* മൂന്നാം ക്വാർട്ടൈൽ, അല്ലെങ്കിൽ Q3, 75% ഡാറ്റ അതിനേക്കാൾ താഴെയായിരിക്കും
ഗ്രാഫിക് ആയി, മീഡിയനും ക്വാർട്ടൈൽസും തമ്മിലുള്ള ബന്ധം **ബോക്സ് പ്ലോട്ട്** എന്ന ചിത്രരൂപത്തിൽ പ്രതിനിധീകരിക്കാം:
<img src="../../../../translated_images/boxplot_explanation.4039b7de08780fd493ef798b41f7291d753f1f84de8955645f00c586e65f16a3.ml.png" alt="Box Plot Explanation" width="50%">
ഇവിടെ **ഇന്റർ-ക്വാർട്ടൈൽ റേഞ്ച്** IQR=Q3-Q1 കണക്കാക്കുന്നു, കൂടാതെ **ഔട്ട്‌ലൈയേഴ്സ്** - [Q1-1.5*IQR, Q3+1.5*IQR] എന്ന പരിധിക്ക് പുറത്തുള്ള മൂല്യങ്ങൾ.
ചെറിയ സംഖ്യയിലുള്ള മൂല്യങ്ങൾ ഉള്ള ഫിനിറ്റ് വിതരണത്തിന്, ഏറ്റവും അധികം ആവർത്തിക്കുന്ന മൂല്യം നല്ല "സാധാരണ" മൂല്യമാണ്, ഇത് **മോഡ്** എന്ന് വിളിക്കുന്നു. ഇത് വർഗ്ഗീകരിച്ച ഡാറ്റയിൽ, ഉദാഹരണത്തിന് നിറങ്ങളിൽ, സാധാരണയായി ഉപയോഗിക്കുന്നു. രണ്ട് ഗ്രൂപ്പുകളുള്ള ഒരു സ്ഥിതിഗതിയെ പരിഗണിക്കൂ - ചിലർ ചുവപ്പ് നിറം ശക്തമായി ഇഷ്ടപ്പെടുന്നു, മറ്റുള്ളവർ നീല നിറം ഇഷ്ടപ്പെടുന്നു. നിറങ്ങളെ സംഖ്യകളായി കോഡ് ചെയ്താൽ, ഇഷ്ടപ്പെട്ട നിറത്തിന്റെ ശരാശരി മൂല്യം ഓറഞ്ച്-പച്ച സ്പെക്ട്രത്തിൽ വരും, ഇത് യാതൊരു ഗ്രൂപ്പിന്റെയും യഥാർത്ഥ ഇഷ്ടം സൂചിപ്പിക്കില്ല. എന്നാൽ മോഡ് ആ നിറങ്ങളിലൊന്നോ, അല്ലെങ്കിൽ രണ്ടും ആയിരിക്കും, അവയ്ക്ക് വോട്ടു ചെയ്ത ആളുകളുടെ എണ്ണം തുല്യമായാൽ (ഇപ്പോൾ സാമ്പിൾ **മൾട്ടിമോഡൽ** ആണെന്ന് വിളിക്കുന്നു).
## യഥാർത്ഥ ലോക ഡാറ്റ
യഥാർത്ഥ ജീവിതത്തിൽ നിന്നുള്ള ഡാറ്റ വിശകലനം ചെയ്യുമ്പോൾ, അവ യാദൃച്ഛിക ചാരത്രങ്ങളല്ല, അർത്ഥത്തിൽ നാം അജ്ഞാത ഫലമുള്ള പരീക്ഷണങ്ങൾ നടത്താറില്ല. ഉദാഹരണത്തിന്, ഒരു ബേസ്ബോൾ കളിക്കാരുടെ സംഘം പരിഗണിക്കൂ, അവരുടെ ശരീര വിവരങ്ങൾ, ഉയരം, ഭാരം, പ്രായം എന്നിവ. ആ സംഖ്യകൾ യാദൃച്ഛികമല്ല, പക്ഷേ നാം അതേ ഗണിത ആശയങ്ങൾ പ്രയോഗിക്കാം. ഉദാഹരണത്തിന്, ആളുകളുടെ ഭാരങ്ങളുടെ ഒരു പരമ്പര ഒരു യാദൃച്ഛിക ചാരത്രത്തിൽ നിന്നുള്ള മൂല്യങ്ങളുടെ പരമ്പരയായി കണക്കാക്കാം. താഴെ [Major League Baseball](http://mlb.mlb.com/index.jsp) യിൽ നിന്നുള്ള യഥാർത്ഥ ബേസ്ബോൾ കളിക്കാരുടെ ഭാരങ്ങളുടെ പരമ്പരയാണ്, [ഈ ഡാറ്റാസെറ്റിൽ നിന്നെടുത്തത്](http://wiki.stat.ucla.edu/socr/index.php/SOCR_Data_MLB_HeightsWeights) (സൗകര്യത്തിന്, ആദ്യ 20 മൂല്യങ്ങൾ മാത്രം കാണിക്കുന്നു):
```
[180.0, 215.0, 210.0, 210.0, 188.0, 176.0, 209.0, 200.0, 231.0, 180.0, 188.0, 180.0, 185.0, 160.0, 180.0, 185.0, 197.0, 189.0, 185.0, 219.0]
```
> **കുറിപ്പ്**: ഈ ഡാറ്റാസെറ്റുമായി പ്രവർത്തിക്കുന്ന ഉദാഹരണം കാണാൻ, [സഹായക നോട്ട്‌ബുക്ക്](notebook.ipynb) കാണുക. ഈ പാഠത്തിൽ നിരവധി ചലഞ്ചുകളും ഉണ്ട്, അവ പൂർത്തിയാക്കാൻ ആ നോട്ട്‌ബുക്കിൽ കുറച്ച് കോഡ് ചേർക്കാം. ഡാറ്റയിൽ എങ്ങനെ പ്രവർത്തിക്കാമെന്ന് അറിയില്ലെങ്കിൽ ആശങ്കപ്പെടേണ്ട, പിന്നീട് Python ഉപയോഗിച്ച് ഡാറ്റയിൽ പ്രവർത്തിക്കുന്നത് വീണ്ടും പഠിക്കും. Jupyter Notebook-ൽ കോഡ് എങ്ങനെ ഓടിക്കാമെന്ന് അറിയില്ലെങ്കിൽ, [ഈ ലേഖനം](https://soshnikov.com/education/how-to-execute-notebooks-from-github/) കാണുക.
ഇവിടെ നമ്മുടെ ഡാറ്റയുടെ ശരാശരി, മീഡിയൻ, ക്വാർട്ടൈൽസ് കാണിക്കുന്ന ബോക്സ് പ്ലോട്ട്:
![Weight Box Plot](../../../../translated_images/weight-boxplot.1dbab1c03af26f8a008fff4e17680082c8ab147d6df646cbac440bbf8f5b9c42.ml.png)
നമ്മുടെ ഡാറ്റയിൽ വിവിധ കളിക്കാരുടെ **പങ്കുകൾ** സംബന്ധിച്ച വിവരങ്ങൾ ഉള്ളതിനാൽ, പങ്ക് അനുസരിച്ച് ബോക്സ് പ്ലോട്ട് ചെയ്യാം - ഇത് പങ്കുകൾക്കിടയിലെ പാരാമീറ്റർ മൂല്യങ്ങൾ എങ്ങനെ വ്യത്യസ്തമാണെന്ന് മനസ്സിലാക്കാൻ സഹായിക്കും. ഈ തവണ ഉയരം പരിഗണിക്കാം:
![Box plot by role](../../../../translated_images/boxplot_byrole.036b27a1c3f52d42f66fba2324ec5cde0a1bca6a01a619eeb0ce7cd054b2527b.ml.png)
ഈ ചിത്രരൂപം സൂചിപ്പിക്കുന്നത്, ശരാശരിയിൽ, ഫസ്റ്റ് ബേസ്മാന്റെ ഉയരം സെക്കന്റ് ബേസ്മാന്റെ ഉയരത്തേക്കാൾ കൂടുതലാണെന്ന്. ഈ പാഠത്തിൽ പിന്നീട് നാം ഈ ഹിപോത്തസിസ് കൂടുതൽ ഔപചാരികമായി പരിശോധിക്കുന്നതും, നമ്മുടെ ഡാറ്റ സാംഖ്യശാസ്ത്രപരമായി പ്രാധാന്യമുള്ളതാണെന്ന് തെളിയിക്കുന്നതും പഠിക്കും.
> യഥാർത്ഥ ലോക ഡാറ്റയിൽ പ്രവർത്തിക്കുമ്പോൾ, എല്ലാ ഡാറ്റ പോയിന്റുകളും ഒരു സാദ്ധ്യത വിതരണത്തിൽ നിന്നുള്ള സാമ്പിളുകൾ ആണെന്ന് നാം കരുതുന്നു. ഈ കരുതൽ മെഷീൻ ലേണിംഗ് സാങ്കേതികവിദ്യകൾ പ്രയോഗിക്കാൻ, പ്രവചന മോഡലുകൾ നിർമ്മിക്കാൻ സഹായിക്കുന്നു.
നമ്മുടെ ഡാറ്റയുടെ വിതരണമോ എന്താണെന്ന് കാണാൻ, **ഹിസ്റ്റോഗ്രാം** എന്ന ഗ്രാഫ് വരച്ചിടാം. X-അക്ഷത്തിൽ വ്യത്യസ്ത ഭാര ഇടവേളകൾ (അഥവാ **ബിൻസ്**) കാണിക്കും, ലംബ അക്ഷത്തിൽ ആ ഇടവേളയിൽ നമ്മുടെ യാദൃച്ഛിക ചാരത്രം എത്ര തവണപ്പെട്ടുവെന്ന് കാണിക്കും.
![Histogram of real world data](../../../../translated_images/weight-histogram.bfd00caf7fc30b145b21e862dba7def41c75635d5280de25d840dd7f0b00545e.ml.png)
ഈ ഹിസ്റ്റോഗ്രാമിൽ നിന്ന് കാണാം എല്ലാ മൂല്യങ്ങളും ഒരു ശരാശരി ഭാരം ചുറ്റും കേന്ദ്രീകരിച്ചിരിക്കുന്നു, ആ ഭാരം വിട്ട് ദൂരെ പോകുമ്പോൾ ആ മൂല്യത്തിന്റെ ഭാരങ്ങൾ കുറവാണ്. അഥവാ, ഒരു ബേസ്ബോൾ കളിക്കാരന്റെ ഭാരം ശരാശരി ഭാരത്തിൽ നിന്ന് വളരെ വ്യത്യസ്തമായിരിക്കാനുള്ള സാധ്യത വളരെ കുറവാണ്. ഭാരങ്ങളുടെ വ്യതിയാനം ശരാശരി മുതൽ വ്യത്യാസം എത്രത്തോളം ഉണ്ടാകാമെന്ന് കാണിക്കുന്നു.
> ബേസ്ബോൾ ലീഗിൽ നിന്നല്ലാത്ത മറ്റുള്ളവരുടെ ഭാരങ്ങൾ എടുത്താൽ, വിതരണം വ്യത്യസ്തമായിരിക്കാം. എന്നാൽ വിതരണത്തിന്റെ രൂപം ഒരുപോലെയാണ്, ശരാശരിയും വ്യതിയാനവും മാറും. അതിനാൽ, ബേസ്ബോൾ കളിക്കാരിൽ പരിശീലിപ്പിച്ച മോഡൽ ഒരു സർവകലാശാലയിലെ വിദ്യാർത്ഥികളിൽ പ്രയോഗിച്ചാൽ തെറ്റായ ഫലങ്ങൾ നൽകാൻ സാധ്യതയുണ്ട്, കാരണം അടിസ്ഥാന വിതരണം വ്യത്യസ്തമാണ്.
## നോർമൽ വിതരണം
മുകളിൽ കാണിച്ച ഭാരങ്ങളുടെ വിതരണം വളരെ സാധാരണമാണ്, യഥാർത്ഥ ലോകത്തിലെ പല അളവുകളും ഇതേ തരത്തിലുള്ള വിതരണമാണ് പിന്തുടരുന്നത്, പക്ഷേ വ്യത്യസ്ത ശരാശരി, വ്യതിയാനങ്ങളോടെ. ഈ വിതരണത്തെ **നോർമൽ വിതരണം** എന്ന് വിളിക്കുന്നു, ഇത് സാംഖ്യശാസ്ത്രത്തിൽ വളരെ പ്രധാനപ്പെട്ടതാണ്.
നോർമൽ വിതരണം ഉപയോഗിച്ച് സാധ്യതയുള്ള ബേസ്ബോൾ കളിക്കാരുടെ യാദൃച്ഛിക ഭാരങ്ങൾ സൃഷ്ടിക്കുന്നത് ശരിയായ മാർഗമാണ്. ശരാശരി ഭാരം `mean` ഉം സ്റ്റാൻഡേർഡ് ഡിവിയേഷൻ `std` ഉം അറിയുമ്പോൾ, 1000 ഭാര സാമ്പിളുകൾ താഴെപ്പറയുന്ന രീതിയിൽ സൃഷ്ടിക്കാം:
```python
samples = np.random.normal(mean,std,1000)
```
സൃഷ്ടിച്ച സാമ്പിളുകളുടെ ഹിസ്റ്റോഗ്രാം വരച്ചാൽ മുകളിൽ കാണിച്ച ചിത്രത്തിന് സമാനമായ ചിത്രം കാണാം. സാമ്പിളുകളുടെ എണ്ണം കൂടുകയും ബിൻസിന്റെ എണ്ണം കൂടുകയും ചെയ്താൽ, നോർമൽ വിതരണത്തിന്റെ ഒരു കൂടുതൽ ഐഡിയൽ ചിത്രം സൃഷ്ടിക്കാം:
![Normal Distribution with mean=0 and std.dev=1](../../../../translated_images/normal-histogram.dfae0d67c202137d552d0015fb87581eca263925e512404f3c12d8885315432e.ml.png)
*ശരാശരി=0, സ്റ്റാൻഡേർഡ് ഡിവിയേഷൻ=1 ഉള്ള നോർമൽ വിതരണം*
## വിശ്വാസ അന്തരീക്ഷങ്ങൾ
ബേസ്ബോൾ കളിക്കാരുടെ ഭാരങ്ങളെക്കുറിച്ച് സംസാരിക്കുമ്പോൾ, എല്ലാ ബേസ്ബോൾ കളിക്കാരുടെയും ഭാരങ്ങളുടെ ഐഡിയൽ സാദ്ധ്യത വിതരണമായ ഒരു **യാദൃച്ഛിക ചാരത്രം W** ഉണ്ട് എന്ന് നാം കരുതുന്നു (അത് **പൊപ്പുലേഷൻ** എന്ന് വിളിക്കുന്നു). നമ്മുടെ ഭാരങ്ങളുടെ പരമ്പര **സാമ്പിൾ** എന്ന ഒരു ഉപസമൂഹമാണ്. W-യുടെ വിതരണത്തിന്റെ പാരാമീറ്ററുകൾ, അഥവാ പൊപ്പുലേഷന്റെ ശരാശരി, വ്യതിയാനം നാം അറിയാമോ എന്നത് ഒരു രസകരമായ ചോദ്യം ആണ്.
ഏറ്റവും എളുപ്പം നൽകാവുന്ന ഉത്തരം നമ്മുടെ സാമ്പിളിന്റെ ശരാശരി, വ്യതിയാനം കണക്കാക്കുക എന്നതാണ്. എന്നാൽ, നമ്മുടെ യാദൃച്ഛിക സാമ്പിൾ മുഴുവൻ പൊപ്പുലേഷനെ ശരിയായി പ്രതിനിധീകരിക്കാതെ പോകാം. അതിനാൽ **വിശ്വാസ അന്തരീക്ഷം** എന്ന ആശയം പ്രസക്തമാണ്.
> **വിശ്വാസ അന്തരീക്ഷം** എന്നത് നമ്മുടെ സാമ്പിള്‍ നൽകിയ പൊപ്പുലേഷന്റെ യഥാർത്ഥ ശരാശരിയുടെ ഒരു കണക്കുകൂട്ടലാണ്, അത് ഒരു നിശ്ചിത സാദ്ധ്യതയോടെ (അഥവാ **വിശ്വാസ നില**) ശരിയാണെന്ന് കരുതപ്പെടുന്നു.
നമ്മുടെ വിതരണത്തിൽ നിന്നുള്ള X<sub>1</sub>, ..., X<sub>n</sub> എന്ന സാമ്പിൾ ഉണ്ടെന്ന് കരുതുക. ഓരോ തവണയും സാമ്പിൾ എടുക്കുമ്പോൾ വ്യത്യസ്തമായ ശരാശരി മൂല്യം &mu; ലഭിക്കും. അതിനാൽ &mu; യാദൃച്ഛിക ചാരത്രമായി കണക്കാക്കാം. വിശ്വാസ p ഉള്ള **വിശ്വാസ അന്തരീക്ഷം** (L<sub>p</sub>,R<sub>p</sub>) എന്ന മൂല്യജോഡിയാണ്, അതായത് **P**(L<sub>p</sub>&leq;&mu;&leq;R<sub>p</sub>) = p, അഥവാ ശരാശരി മൂല്യം ആ അന്തരീക്ഷത്തിനുള്ളിൽപ്പെടാനുള്ള സാദ്ധ്യത p ആണ്.
ഈ വിശ്വാസ അന്തരീക്ഷങ്ങൾ എങ്ങനെ കണക്കാക്കുന്നുവെന്ന് വിശദമായി ചർച്ച ചെയ്യുന്നത് നമ്മുടെ ചെറിയ പരിചയത്തിന് പുറത്താണ്. കൂടുതൽ വിവരങ്ങൾ [വിക്കിപീഡിയയിൽ](https://en.wikipedia.org/wiki/Confidence_interval) ലഭ്യമാണ്. ചുരുക്കത്തിൽ, നാം കണക്കാക്കിയ സാമ്പിൾ ശരാശരിയുടെ വിതരണത്തെ പൊപ്പുലേഷന്റെ യഥാർത്ഥ ശരാശരിയോട് താരതമ്യം ചെയ്ത് നിർവചിക്കുന്നു, ഇത് **സ്റ്റുഡന്റ് വിതരണം** എന്ന് വിളിക്കുന്നു.
> **രസകരമായ വസ്തുത**: സ്റ്റുഡന്റ് വിതരണത്തിന് പേര് നൽകിയത് ഗണിതശാസ്ത്രജ്ഞൻ വില്ല്യം സീലി ഗോസെറ്റ് എന്നയാളുടെ പേരിലാണ്, അദ്ദേഹം "Student" എന്ന ഉപനാമത്തിൽ തന്റെ പേപ്പർ പ്രസിദ്ധീകരിച്ചിരുന്നു. അദ്ദേഹം ഗിന്നസ് ബ്രൂവറിയിൽ ജോലി ചെയ്തിരുന്നു, ഒരു പതിപ്പിന്റെ പ്രകാരം, അവന്റെ തൊഴിലുടമ പൊതുജനങ്ങൾക്ക് അവർ കച്ചവട വസ്തുക്കളുടെ ഗുണനിലവാരം നിർണയിക്കാൻ സാങ്കേതിക പരിശോധനകൾ ഉപയോഗിക്കുന്നുവെന്ന് അറിയിക്കാനാഗ്രഹിച്ചില്ല.
നാം നമ്മുടെ ജനസംഖ്യയുടെ ശരാശരി &mu; വിശ്വാസ്യത p ഉപയോഗിച്ച് കണക്കാക്കാൻ ആഗ്രഹിക്കുന്നുവെങ്കിൽ, നമുക്ക് സ്റ്റുഡന്റ് വിതരണ A യുടെ *(1-p)/2-ആം ശതമാനം* എടുക്കേണ്ടതുണ്ട്, ഇത് പട്ടികകളിൽ നിന്നോ, അല്ലെങ്കിൽ ചില സാങ്കേതിക സോഫ്റ്റ്‌വെയർ (ഉദാ. Python, R, തുടങ്ങിയവ) ന്റെ നിർമിത ഫംഗ്ഷനുകൾ ഉപയോഗിച്ച് കണക്കാക്കാവുന്നതാണ്. പിന്നീട് &mu; നുള്ള ഇടവേള X&pm;A*D/&radic;n ആയി നൽകപ്പെടും, ഇവിടെ X സാമ്പിളിന്റെ ലഭിച്ച ശരാശരിയാണ്, D സ്റ്റാൻഡേർഡ് ഡിവിയേഷൻ ആണ്.
> **കുറിപ്പ്**: സ്റ്റുഡന്റ് വിതരണവുമായി ബന്ധപ്പെട്ട് പ്രധാനമായ [സ്വാതന്ത്ര്യ ഡിഗ്രികൾ](https://en.wikipedia.org/wiki/Degrees_of_freedom_(statistics)) എന്ന ആശയം ഇവിടെ ചർച്ച ചെയ്യുന്നത് ഒഴിവാക്കുന്നു. ഈ ആശയം കൂടുതൽ ആഴത്തിൽ മനസ്സിലാക്കാൻ നിങ്ങൾക്ക് കൂടുതൽ സമഗ്രമായ സാങ്കേതിക പുസ്തകങ്ങൾ കാണാവുന്നതാണ്.
ഭാരം, ഉയരം എന്നിവയ്ക്ക് വിശ്വാസ്യത ഇടവേള കണക്കാക്കാനുള്ള ഉദാഹരണം [സഹായക നോട്ട്‌ബുക്കുകളിൽ](notebook.ipynb) നൽകിയിട്ടുണ്ട്.
| p | ഭാരത്തിന്റെ ശരാശരി |
|-----|-----------|
| 0.85 | 201.73±0.94 |
| 0.90 | 201.73±1.08 |
| 0.95 | 201.73±1.28 |
വിശ്വാസ്യത സാധ്യത ഉയർന്നതുകൊണ്ട്, വിശ്വാസ്യത ഇടവേള കൂടുതൽ വ്യാപകമാണ് എന്ന് ശ്രദ്ധിക്കുക.
## ഹിപോത്തസിസ് ടെസ്റ്റിംഗ്
നമ്മുടെ ബേസ്ബോൾ കളിക്കാരുടെ ഡാറ്റാസെറ്റിൽ, വിവിധ കളിക്കാരുടെ പദവികൾ ഉണ്ട്, അവ താഴെ ചുരുക്കി കൊടുത്തിരിക്കുന്നു ([സഹായക നോട്ട്‌ബുക്ക്](notebook.ipynb) കാണുക ഈ പട്ടിക എങ്ങനെ കണക്കാക്കാമെന്ന്):
| പദവി | ഉയരം | ഭാരം | എണ്ണം |
|------|--------|--------|-------|
| ക്യാച്ചർ | 72.723684 | 204.328947 | 76 |
| ഡിസിഗ്നേറ്റഡ്_ഹിറ്റർ | 74.222222 | 220.888889 | 18 |
| ഫസ്റ്റ്_ബേസ്മാൻ | 74.000000 | 213.109091 | 55 |
| ഔട്ട്‌ഫീൽഡർ | 73.010309 | 199.113402 | 194 |
| റിലീഫ്_പിച്ചർ | 74.374603 | 203.517460 | 315 |
| സെക്കൻഡ്_ബേസ്മാൻ | 71.362069 | 184.344828 | 58 |
| ഷോർട്ട്സ്ടോപ്പ് | 71.903846 | 182.923077 | 52 |
| സ്റ്റാർട്ടിഗ്_പിച്ചർ | 74.719457 | 205.163636 | 221 |
| തേർഡ്_ബേസ്മാൻ | 73.044444 | 200.955556 | 45 |
ഫസ്റ്റ് ബേസ്മാന്റെ ശരാശരി ഉയരം സെക്കൻഡ് ബേസ്മാന്റെ ഉയരത്തേക്കാൾ കൂടുതലാണെന്ന് നാം കാണാം. അതിനാൽ, നാം **ഫസ്റ്റ് ബേസ്മാൻ സെക്കൻഡ് ബേസ്മാനേക്കാൾ ഉയരം കൂടിയവരാണ്** എന്ന് നിഗമനം വരുത്താൻ ആഗ്രഹിക്കാം.
> ഈ പ്രസ്താവന **ഹിപോത്തസിസ്** എന്നാണ് വിളിക്കുന്നത്, കാരണം ഈ വസ്തുത യഥാർത്ഥത്തിൽ ശരിയാണോ അല്ലയോ എന്ന് നമുക്ക് അറിയില്ല.
എങ്കിലും, ഈ നിഗമനം എപ്പോഴും വ്യക്തമായിരിക്കില്ല. മുകളിൽ ചർച്ച ചെയ്തതുപോലെ ഓരോ ശരാശരിക്കും അനുബന്ധിച്ച വിശ്വാസ്യത ഇടവേള ഉണ്ട്, അതിനാൽ ഈ വ്യത്യാസം ഒരു സാങ്കേതിക പിശകായിരിക്കാം. നമുക്ക് നമ്മുടെ ഹിപോത്തസിസ് പരിശോധിക്കാൻ കൂടുതൽ ഔപചാരിക മാർഗ്ഗം വേണം.
ഫസ്റ്റ് ബേസ്മാനും സെക്കൻഡ് ബേസ്മാനും ഉള്ള ഉയരങ്ങൾക്ക് വിശ്വാസ്യത ഇടവേളകൾ പ്രത്യേകം കണക്കാക്കാം:
| വിശ്വാസ്യത | ഫസ്റ്റ് ബേസ്മാൻ | സെക്കൻഡ് ബേസ്മാൻ |
|------------|---------------|----------------|
| 0.85 | 73.62..74.38 | 71.04..71.69 |
| 0.90 | 73.56..74.44 | 70.99..71.73 |
| 0.95 | 73.47..74.53 | 70.92..71.81 |
വിശ്വാസ്യത ഇല്ലാത്തപ്പോൾ പോലും ഇടവേളകൾ ഒത്തുചേരുന്നില്ല. ഇത് ഫസ്റ്റ് ബേസ്മാൻ സെക്കൻഡ് ബേസ്മാനേക്കാൾ ഉയരം കൂടിയവരാണ് എന്ന ഹിപോത്തസിസ് തെളിയിക്കുന്നു.
കൂടുതൽ ഔപചാരികമായി, നാം പരിഹരിക്കുന്നത് **രണ്ട് പ്രൊബബിലിറ്റി വിതരണങ്ങൾ ഒരുപോലെയാണോ എന്ന് പരിശോധിക്കുകയാണ്**, അല്ലെങ്കിൽ കുറഞ്ഞത് അവയ്ക്ക് സമാനമായ പാരാമീറ്ററുകൾ ഉണ്ടോ എന്ന്. വിതരണത്തിന്റെ അടിസ്ഥാനത്തിൽ, നമുക്ക് വ്യത്യസ്ത പരീക്ഷണങ്ങൾ ഉപയോഗിക്കേണ്ടിവരും. നമുക്ക് നമ്മുടെ വിതരണങ്ങൾ സാധാരണമാണ് എന്ന് അറിയാമെങ്കിൽ, നാം **[സ്റ്റുഡന്റ് t-ടെസ്റ്റ്](https://en.wikipedia.org/wiki/Student%27s_t-test)** പ്രയോഗിക്കാം.
സ്റ്റുഡന്റ് t-ടെസ്റ്റിൽ, നാം **t-മൂല്യം** എന്നത് കണക്കാക്കുന്നു, ഇത് ശരാശരികൾ തമ്മിലുള്ള വ്യത്യാസം സൂചിപ്പിക്കുന്നു, വ്യത്യാസം പരിഗണിച്ച്. t-മൂല്യം **സ്റ്റുഡന്റ് വിതരണത്തെ** പിന്തുടരുന്നു എന്ന് തെളിയിച്ചിട്ടുണ്ട്, ഇത് നമുക്ക് ഒരു നൽകിയ വിശ്വാസ്യത നിലയ്ക്ക് **p** (ഇത് കണക്കാക്കാവുന്നതും, സംഖ്യാത്മക പട്ടികകളിൽ നോക്കാവുന്നതും) പരിധി മൂല്യം ലഭ്യമാക്കുന്നു. നാം പിന്നീട് t-മൂല്യം ഈ പരിധി മൂല്യവുമായി താരതമ്യം ചെയ്ത് ഹിപോത്തസിസ് അംഗീകരിക്കാമോ അല്ലയോ എന്ന് തീരുമാനിക്കുന്നു.
Python-ൽ, നാം **SciPy** പാക്കേജ് ഉപയോഗിക്കാം, അതിൽ `ttest_ind` ഫംഗ്ഷൻ ഉൾപ്പെടുന്നു (മറ്റു പല ഉപകാരപ്രദമായ സാങ്കേതിക ഫംഗ്ഷനുകളോടൊപ്പം!). ഇത് നമുക്ക് t-മൂല്യം കണക്കാക്കുകയും, വിശ്വാസ്യത p-മൂല്യത്തിന്റെ റിവേഴ്സ് ലുക്കപ്പ് നടത്തുകയും ചെയ്യുന്നു, അതിനാൽ നാം വിശ്വാസ്യത നോക്കി നിഗമനം എടുക്കാം.
ഉദാഹരണത്തിന്, ഫസ്റ്റ് ബേസ്മാനും സെക്കൻഡ് ബേസ്മാനും ഉള്ള ഉയരങ്ങൾ തമ്മിലുള്ള താരതമ്യം നമുക്ക് താഴെ കാണുന്ന ഫലങ്ങൾ നൽകുന്നു:
```python
from scipy.stats import ttest_ind
tval, pval = ttest_ind(df.loc[df['Role']=='First_Baseman',['Height']], df.loc[df['Role']=='Designated_Hitter',['Height']],equal_var=False)
print(f"T-value = {tval[0]:.2f}\nP-value: {pval[0]}")
```
```
T-value = 7.65
P-value: 9.137321189738925e-12
```
നമ്മുടെ കേസിൽ, p-മൂല്യം വളരെ കുറവാണ്, അതായത് ഫസ്റ്റ് ബേസ്മാൻ ഉയരം കൂടിയവരാണ് എന്നതിന് ശക്തമായ തെളിവുകളുണ്ട്.
മറ്റു പല തരത്തിലുള്ള ഹിപോത്തസിസുകളും നാം പരിശോധിക്കാനാഗ്രഹിക്കാം, ഉദാഹരണത്തിന്:
* ഒരു സാമ്പിൾ ഏതെങ്കിലും വിതരണത്തെ പിന്തുടരുന്നുവെന്ന് തെളിയിക്കാൻ. നമ്മുടെ കേസിൽ, ഉയരങ്ങൾ സാധാരണ വിതരണമാണ് എന്ന് നാം കരുതിയിട്ടുണ്ട്, പക്ഷേ അതിന് ഔപചാരിക സാങ്കേതിക പരിശോധന വേണം.
* ഒരു സാമ്പിളിന്റെ ശരാശരി മൂല്യം മുൻകൂട്ടി നിശ്ചയിച്ച മൂല്യത്തോട് പൊരുത്തപ്പെടുന്നുവെന്ന് തെളിയിക്കാൻ
* പല സാമ്പിളുകളുടെ ശരാശരികൾ തമ്മിൽ താരതമ്യം ചെയ്യാൻ (ഉദാ. വ്യത്യസ്ത പ്രായസംഘങ്ങളിലെ സന്തോഷനിലവാര വ്യത്യാസം)
## വലിയ സംഖ്യകളുടെ നിയമവും സെൻട്രൽ ലിമിറ്റ് തിയറവും
സാധാരണ വിതരണത്തിന് അത്ര പ്രധാന്യമുള്ളതിൽ ഒന്നാണ് **സെൻട്രൽ ലിമിറ്റ് തിയറി**. നമുക്ക് സ്വതന്ത്രമായ N മൂല്യങ്ങളുടെ വലിയ സാമ്പിൾ X<sub>1</sub>, ..., X<sub>N</sub> ഉണ്ടെന്ന് കരുതുക, ഏതെങ്കിലും വിതരണത്തിൽ നിന്നുള്ളവ, ശരാശരി &mu; ഉം വ്യത്യാസം &sigma;<sup>2</sup> ഉം ഉള്ളവ. N വളരെ വലിയപ്പോൾ (അഥവാ N&rarr;&infin;), ശരാശരി &Sigma;<sub>i</sub>X<sub>i</sub> സാധാരണ വിതരണമായിരിക്കും, ശരാശരി &mu; ഉം വ്യത്യാസം &sigma;<sup>2</sup>/N ഉം ഉള്ളത്.
> സെൻട്രൽ ലിമിറ്റ് തിയറിയുടെ മറ്റൊരു വ്യാഖ്യാനം, ഏതെങ്കിലും വിതരണമായാലും, ഏതെങ്കിലും യാദൃച്ഛിക മൂല്യങ്ങളുടെ കൂട്ടത്തിന്റെ ശരാശരി കണക്കാക്കുമ്പോൾ നിങ്ങൾക്ക് സാധാരണ വിതരണമാണ് ലഭിക്കുന്നത് എന്നതാണ്.
സെൻട്രൽ ലിമിറ്റ് തിയറിയിൽ നിന്നു കൂടി, N&rarr;&infin; ആയപ്പോൾ, സാമ്പിൾ ശരാശരി &mu; യുമായി തുല്യമായിരിക്കാനുള്ള സാധ്യത 1 ആകുന്നു. ഇതാണ് **വലിയ സംഖ്യകളുടെ നിയമം** എന്നറിയപ്പെടുന്നത്.
## കോവേറിയൻസ്, കോറിലേഷൻ
ഡാറ്റാ സയൻസ് ചെയ്യുന്ന ഒന്നിൽ ഒന്നാണ് ഡാറ്റകളുടെ ബന്ധങ്ങൾ കണ്ടെത്തുക. രണ്ട് സീക്വൻസുകൾ ഒരേ സമയം സമാന പെരുമാറ്റം കാണിക്കുമ്പോൾ നാം അവ **കോറിലേറ്റ്** ചെയ്യുന്നു എന്ന് പറയുന്നു, അഥവാ അവ ഒരേ സമയം ഉയരുകയോ താഴുകയോ ചെയ്യുന്നു, അല്ലെങ്കിൽ ഒരു സീക്വൻസ് ഉയരുമ്പോൾ മറ്റൊന്ന് താഴുന്നു, അതുപോലെ മറുവശവും. മറ്റൊരു വാക്കിൽ, രണ്ട് സീക്വൻസുകൾ തമ്മിൽ ബന്ധമുണ്ടെന്ന് തോന്നുന്നു.
> കോറിലേഷൻ എപ്പോഴും രണ്ട് സീക്വൻസുകൾ തമ്മിലുള്ള കാരണബന്ധം സൂചിപ്പിക്കുന്നില്ല; ചിലപ്പോൾ രണ്ട് വ്യത്യസ്ത വേരിയബിളുകളും ചില ബാഹ്യ കാരണങ്ങളിൽ ആശ്രയിച്ചിരിക്കാം, അല്ലെങ്കിൽ ഇത് വെറും യാദൃച്ഛികമായിരിക്കാം. എങ്കിലും, ശക്തമായ ഗണിത കോറിലേഷൻ രണ്ട് വേരിയബിളുകൾ തമ്മിൽ ബന്ധമുണ്ടെന്ന് സൂചിപ്പിക്കുന്നു.
ഗണിതശാസ്ത്രത്തിൽ, രണ്ട് യാദൃച്ഛിക വേരിയബിളുകൾ തമ്മിലുള്ള ബന്ധം കാണിക്കുന്ന പ്രധാന ആശയം **കോവേറിയൻസ്** ആണ്, ഇത് ഇങ്ങനെ കണക്കാക്കുന്നു: Cov(X,Y) = **E**\[(X-**E**(X))(Y-**E**(Y))\]. നാം രണ്ട് വേരിയബിളുകളും അവരുടെ ശരാശരികളിൽ നിന്നുള്ള വ്യത്യാസം കണക്കാക്കി, ആ വ്യത്യാസങ്ങളുടെ ഗുണനം കണക്കാക്കുന്നു. രണ്ട് വേരിയബിളുകളും ഒരുമിച്ച് വ്യത്യാസപ്പെടുകയാണെങ്കിൽ, ഗുണനം എല്ലായ്പ്പോഴും പോസിറ്റീവ് മൂല്യം ആയിരിക്കും, ഇത് പോസിറ്റീവ് കോവേറിയൻസിലേക്ക് കൂട്ടിച്ചേർക്കും. രണ്ട് വേരിയബിളുകൾ ഒത്തിരിയാതെ വ്യത്യാസപ്പെടുകയാണെങ്കിൽ (ഉദാ. ഒരാൾ ശരാശരിക്ക് താഴെ പോയപ്പോൾ മറ്റൊന്ന് ശരാശരിക്ക് മുകളിൽ പോകുന്നു), നാം എല്ലായ്പ്പോഴും നെഗറ്റീവ് സംഖ്യകൾ ലഭിക്കും, ഇത് നെഗറ്റീവ് കോവേറിയൻസിലേക്ക് കൂട്ടിച്ചേർക്കും. വ്യത്യാസങ്ങൾ സ്വതന്ത്രമാണെങ്കിൽ, ഏകദേശം പൂജ്യം ആയിരിക്കും.
കോവേറിയൻസിന്റെ ആബ്സല്യൂട്ട് മൂല്യം കോറിലേഷൻ എത്ര വലിയതാണെന്ന് വ്യക്തമാക്കുന്നില്ല, കാരണം അത് യഥാർത്ഥ മൂല്യങ്ങളുടെ വലിപ്പത്തെ ആശ്രയിച്ചിരിക്കുന്നു. അതിനാൽ നാം കോവേറിയൻസിനെ രണ്ട് വേരിയബിളുകളുടെ സ്റ്റാൻഡേർഡ് ഡിവിയേഷനിൽ വിഭജിച്ച് **കോറിലേഷൻ** നേടുന്നു. നല്ല കാര്യം, കോറിലേഷൻ എപ്പോഴും [-1,1] പരിധിയിലാണ്, 1 ശക്തമായ പോസിറ്റീവ് കോറിലേഷൻ സൂചിപ്പിക്കുന്നു, -1 ശക്തമായ നെഗറ്റീവ് കോറിലേഷൻ, 0 - കോറിലേഷൻ ഇല്ല (വേരിയബിളുകൾ സ്വതന്ത്രം).
**ഉദാഹരണം**: മുകളിൽ പറഞ്ഞ ബേസ്ബോൾ കളിക്കാരുടെ ഡാറ്റാസെറ്റിൽ നിന്നുള്ള ഭാരവും ഉയരവും തമ്മിലുള്ള കോറിലേഷൻ കണക്കാക്കാം:
```python
print(np.corrcoef(weights,heights))
```
ഫലമായി, നമുക്ക് ഇങ്ങനെ ഒരു **കോറിലേഷൻ മാട്രിക്സ്** ലഭിക്കുന്നു:
```
array([[1. , 0.52959196],
[0.52959196, 1. ]])
```
> കോറിലേഷൻ മാട്രിക്സ് C ഏതെങ്കിലും എണ്ണം ഇൻപുട്ട് സീക്വൻസുകൾ S<sub>1</sub>, ..., S<sub>n</sub> നായി കണക്കാക്കാം. C<sub>ij</sub> എന്നത് S<sub>i</sub> ഉം S<sub>j</sub> ഉം തമ്മിലുള്ള കോറിലേഷൻ ആണ്, ഡയഗണൽ ഘടകങ്ങൾ എല്ലായ്പ്പോഴും 1 ആണ് (അതും S<sub>i</sub> യുടെ സ്വയം-കോറിലേഷൻ).
നമ്മുടെ കേസിൽ, 0.53 എന്ന മൂല്യം ഒരു വ്യക്തിയുടെ ഭാരം, ഉയരം എന്നിവ തമ്മിൽ ചില കോറിലേഷൻ ഉണ്ടെന്ന് സൂചിപ്പിക്കുന്നു. നാം ഒരു മൂല്യം മറ്റൊന്നിനെതിരെ സ്കാറ്റർ പ്ലോട്ട് ഉണ്ടാക്കുകയും ബന്ധം ദൃശ്യമായി കാണുകയും ചെയ്യാം:
![ഭാരം, ഉയരം തമ്മിലുള്ള ബന്ധം](../../../../translated_images/weight-height-relationship.3f06bde4ca2aba9974182c4ef037ed602acd0fbbbbe2ca91cefd838a9e66bcf9.ml.png)
> കോറിലേഷൻ, കോവേറിയൻസ് എന്നിവയുടെ കൂടുതൽ ഉദാഹരണങ്ങൾ [സഹായക നോട്ട്‌ബുക്കിൽ](notebook.ipynb) കാണാം.
## നിഗമനം
ഈ ഭാഗത്തിൽ നാം പഠിച്ചത്:
* ഡാറ്റയുടെ അടിസ്ഥാന സാങ്കേതിക ഗുണങ്ങൾ, ഉദാ. ശരാശരി, വ്യത്യാസം, മോഡ്, ക്വാർട്ടൈൽസ്
* യാദൃച്ഛിക വേരിയബിളുകളുടെ വ്യത്യസ്ത വിതരണങ്ങൾ, സാധാരണ വിതരണവും ഉൾപ്പെടെ
* വ്യത്യസ്ത ഗുണങ്ങൾ തമ്മിലുള്ള കോറിലേഷൻ കണ്ടെത്തുന്നത് എങ്ങനെ
* ചില ഹിപോത്തസിസുകൾ തെളിയിക്കാൻ ഗണിതവും സാങ്കേതിക വിദ്യയും എങ്ങനെ ഉപയോഗിക്കാമെന്ന്
* ഡാറ്റാ സാമ്പിള്‍ നൽകിയപ്പോൾ യാദൃച്ഛിക വേരിയബിളിന് വിശ്വാസ്യത ഇടവേള എങ്ങനെ കണക്കാക്കാമെന്ന്
ഇത് പ്രൊബബിലിറ്റി, സാങ്കേതിക ശാസ്ത്രം എന്നിവയിലുള്ള വിഷയങ്ങളുടെ പൂർണ്ണമായ പട്ടിക അല്ലെങ്കിലും, ഈ കോഴ്സിൽ നല്ല തുടക്കം നൽകാൻ ഇത് മതിയാകും.
## 🚀 ചലഞ്ച്
നോട്ട്‌ബുക്കിലെ സാമ്പിൾ കോഡ് ഉപയോഗിച്ച് താഴെ പറയുന്ന മറ്റ് ഹിപോത്തസിസുകൾ പരിശോധിക്കുക:
1. ഫസ്റ്റ് ബേസ്മാൻ സെക്കൻഡ് ബേസ്മാനേക്കാൾ പ്രായം കൂടുതലുള്ളവരാണ്
2. ഫസ്റ്റ് ബേസ്മാൻ തേർഡ് ബേസ്മാനേക്കാൾ ഉയരം കൂടിയവരാണ്
3. ഷോർട്ട്സ്ടോപ്പുകൾ സെക്കൻഡ് ബേസ്മാനേക്കാൾ ഉയരം കൂടിയവരാണ്
## [പോസ്റ്റ്-ലെക്ചർ ക്വിസ്](https://ff-quizzes.netlify.app/en/ds/quiz/7)
## അവലോകനം & സ്വയം പഠനം
പ്രൊബബിലിറ്റി, സാങ്കേതിക ശാസ്ത്രം വളരെ വ്യാപകമായ വിഷയമാണ്, അതിനാൽ അതിന് സ്വന്തം കോഴ്സ് വേണം. തിയറിയിൽ കൂടുതൽ ആഴത്തിൽ പോകാൻ താൽപര്യമുണ്ടെങ്കിൽ, താഴെ പറയുന്ന ചില പുസ്തകങ്ങൾ വായിക്കാൻ നിങ്ങൾക്ക് ആഗ്രഹമുണ്ടാകാം:
1. ന്യൂയോർക്ക് യൂണിവേഴ്സിറ്റിയിലെ [Carlos Fernandez-Granda](https://cims.nyu.edu/~cfgranda/) യുടെ മികച്ച ലെക്ചർ നോട്ടുകൾ [Probability and Statistics for Data Science](https://cims.nyu.edu/~cfgranda/pages/stuff/probability_stats_for_DS.pdf) (ഓൺലൈനിൽ ലഭ്യമാണ്)
1. [Peter and Andrew Bruce. Practical Statistics for Data Scientists.](https://www.oreilly.com/library/view/practical-statistics-for/9781491952955/) [[R-ൽ സാമ്പിൾ കോഡ്](https://github.com/andrewgbruce/statistics-for-data-scientists)].
1. [James D. Miller. Statistics for Data Science](https://www.packtpub.com/product/statistics-for-data-science/9781788290678) [[R-ൽ സാമ്പിൾ കോഡ്](https://github.com/PacktPublishing/Statistics-for-Data-Science)]
## അസൈൻമെന്റ്
[ചെറിയ ഡയബറ്റീസ് പഠനം](assignment.md)
## ക്രെഡിറ്റുകൾ
ഈ പാഠം ♥️ കൊണ്ട് രചിച്ചത് [Dmitry Soshnikov](http://soshnikov.com) ആണ്.
---
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
**അസൂയാ**:
ഈ രേഖ AI വിവർത്തന സേവനം [Co-op Translator](https://github.com/Azure/co-op-translator) ഉപയോഗിച്ച് വിവർത്തനം ചെയ്തതാണ്. നാം കൃത്യതയ്ക്ക് ശ്രമിച്ചിട്ടുണ്ടെങ്കിലും, സ്വയം പ്രവർത്തിക്കുന്ന വിവർത്തനങ്ങളിൽ പിശകുകൾ അല്ലെങ്കിൽ തെറ്റുകൾ ഉണ്ടാകാമെന്ന് ദയവായി ശ്രദ്ധിക്കുക. അതിന്റെ മാതൃഭാഷയിലുള്ള യഥാർത്ഥ രേഖ പ്രാമാണികമായ ഉറവിടമായി കണക്കാക്കണം. നിർണായകമായ വിവരങ്ങൾക്ക്, പ്രൊഫഷണൽ മനുഷ്യ വിവർത്തനം ശുപാർശ ചെയ്യപ്പെടുന്നു. ഈ വിവർത്തനം ഉപയോഗിക്കുന്നതിൽ നിന്നുണ്ടാകുന്ന ഏതെങ്കിലും തെറ്റിദ്ധാരണകൾക്കോ തെറ്റായ വ്യാഖ്യാനങ്ങൾക്കോ ഞങ്ങൾ ഉത്തരവാദികളല്ല.
<!-- CO-OP TRANSLATOR DISCLAIMER END -->

@ -0,0 +1,264 @@
{
"cells": [
{
"cell_type": "markdown",
"source": [
"## Introduction to Probability and Statistics\n",
"## Assignment\n",
"\n",
"ഈ അസൈൻമെന്റിൽ, നാം [ഇവിടെ നിന്നുള്ള](https://www4.stat.ncsu.edu/~boos/var.select/diabetes.html) പ്രാപ്തരായ രോഗികളുടെ ഡാറ്റാസെറ്റ് ഉപയോഗിക്കും.\n"
],
"metadata": {}
},
{
"cell_type": "code",
"execution_count": 13,
"source": [
"import pandas as pd\n",
"import numpy as np\n",
"\n",
"df = pd.read_csv(\"../../data/diabetes.tsv\",sep='\\t')\n",
"df.head()"
],
"outputs": [
{
"output_type": "execute_result",
"data": {
"text/plain": [
" AGE SEX BMI BP S1 S2 S3 S4 S5 S6 Y\n",
"0 59 2 32.1 101.0 157 93.2 38.0 4.0 4.8598 87 151\n",
"1 48 1 21.6 87.0 183 103.2 70.0 3.0 3.8918 69 75\n",
"2 72 2 30.5 93.0 156 93.6 41.0 4.0 4.6728 85 141\n",
"3 24 1 25.3 84.0 198 131.4 40.0 5.0 4.8903 89 206\n",
"4 50 1 23.0 101.0 192 125.4 52.0 4.0 4.2905 80 135"
],
"text/html": [
"<div>\n",
"<style scoped>\n",
" .dataframe tbody tr th:only-of-type {\n",
" vertical-align: middle;\n",
" }\n",
"\n",
" .dataframe tbody tr th {\n",
" vertical-align: top;\n",
" }\n",
"\n",
" .dataframe thead th {\n",
" text-align: right;\n",
" }\n",
"</style>\n",
"<table border=\"1\" class=\"dataframe\">\n",
" <thead>\n",
" <tr style=\"text-align: right;\">\n",
" <th></th>\n",
" <th>AGE</th>\n",
" <th>SEX</th>\n",
" <th>BMI</th>\n",
" <th>BP</th>\n",
" <th>S1</th>\n",
" <th>S2</th>\n",
" <th>S3</th>\n",
" <th>S4</th>\n",
" <th>S5</th>\n",
" <th>S6</th>\n",
" <th>Y</th>\n",
" </tr>\n",
" </thead>\n",
" <tbody>\n",
" <tr>\n",
" <th>0</th>\n",
" <td>59</td>\n",
" <td>2</td>\n",
" <td>32.1</td>\n",
" <td>101.0</td>\n",
" <td>157</td>\n",
" <td>93.2</td>\n",
" <td>38.0</td>\n",
" <td>4.0</td>\n",
" <td>4.8598</td>\n",
" <td>87</td>\n",
" <td>151</td>\n",
" </tr>\n",
" <tr>\n",
" <th>1</th>\n",
" <td>48</td>\n",
" <td>1</td>\n",
" <td>21.6</td>\n",
" <td>87.0</td>\n",
" <td>183</td>\n",
" <td>103.2</td>\n",
" <td>70.0</td>\n",
" <td>3.0</td>\n",
" <td>3.8918</td>\n",
" <td>69</td>\n",
" <td>75</td>\n",
" </tr>\n",
" <tr>\n",
" <th>2</th>\n",
" <td>72</td>\n",
" <td>2</td>\n",
" <td>30.5</td>\n",
" <td>93.0</td>\n",
" <td>156</td>\n",
" <td>93.6</td>\n",
" <td>41.0</td>\n",
" <td>4.0</td>\n",
" <td>4.6728</td>\n",
" <td>85</td>\n",
" <td>141</td>\n",
" </tr>\n",
" <tr>\n",
" <th>3</th>\n",
" <td>24</td>\n",
" <td>1</td>\n",
" <td>25.3</td>\n",
" <td>84.0</td>\n",
" <td>198</td>\n",
" <td>131.4</td>\n",
" <td>40.0</td>\n",
" <td>5.0</td>\n",
" <td>4.8903</td>\n",
" <td>89</td>\n",
" <td>206</td>\n",
" </tr>\n",
" <tr>\n",
" <th>4</th>\n",
" <td>50</td>\n",
" <td>1</td>\n",
" <td>23.0</td>\n",
" <td>101.0</td>\n",
" <td>192</td>\n",
" <td>125.4</td>\n",
" <td>52.0</td>\n",
" <td>4.0</td>\n",
" <td>4.2905</td>\n",
" <td>80</td>\n",
" <td>135</td>\n",
" </tr>\n",
" </tbody>\n",
"</table>\n",
"</div>"
]
},
"metadata": {},
"execution_count": 13
}
],
"metadata": {}
},
{
"cell_type": "markdown",
"source": [
"ഈ ഡാറ്റാസെറ്റിൽ, കോളങ്ങൾ താഴെപ്പറയുന്നവയാണ്:\n",
"* പ്രായവും ലിംഗവും സ്വയംവിവരണമാണ്\n",
"* BMI എന്നത് ബോഡി മാസ്സ് ഇൻഡക്സ് ആണ്\n",
"* BP എന്നത് ശരാശരി രക്തസമ്മർദ്ദം ആണ്\n",
"* S1 മുതൽ S6 വരെ വ്യത്യസ്ത രക്ത അളവുകൾ ആണ്\n",
"* Y എന്നത് ഒരു വർഷംക്കുള്ളിൽ രോഗത്തിന്റെ പുരോഗതിയുടെ ഗുണനിലവാര അളവാണ്\n",
"\n",
"സാധ്യതയും സ്ഥിതിവിവരശാസ്ത്രവും ഉപയോഗിച്ച് ഈ ഡാറ്റാസെറ്റ് പഠിക്കാം.\n",
"\n",
"### Task 1: എല്ലാ മൂല്യങ്ങൾക്കും ശരാശരി മൂല്യങ്ങളും വ്യതിയാനവും കണക്കാക്കുക\n"
],
"metadata": {}
},
{
"cell_type": "code",
"execution_count": null,
"source": [],
"outputs": [],
"metadata": {}
},
{
"cell_type": "markdown",
"source": [
"### ടാസ്‌ക് 2: ലിംഗത്തിന്റെ അടിസ്ഥാനത്തിൽ BMI, BP, Y എന്നിവയുടെ ബോക്സ്‌പ്ലോട്ടുകൾ വരയ്ക്കുക\n"
],
"metadata": {}
},
{
"cell_type": "code",
"execution_count": null,
"source": [],
"outputs": [],
"metadata": {}
},
{
"cell_type": "markdown",
"source": [
"### ടാസ്‌ക് 3: പ്രായം, ലിംഗം, ബിഎംഐ, Y വേരിയബിളുകളുടെ വിതരണമെന്താണ്?\n"
],
"metadata": {}
},
{
"cell_type": "code",
"execution_count": null,
"source": [],
"outputs": [],
"metadata": {}
},
{
"cell_type": "markdown",
"source": [
"### Task 4: വ്യത്യസ്ത വേരിയബിളുകളും രോഗ പുരോഗതിയും (Y) തമ്മിലുള്ള സഹസംബന്ധം പരിശോധിക്കുക\n",
"\n",
"> **സൂചന** ഏത് മൂല്യങ്ങൾ ആശ്രിതമാണെന്ന് അറിയാൻ സഹസംബന്ധ മാട്രിക്സ് ഏറ്റവും ഉപകാരപ്രദമായ വിവരങ്ങൾ നൽകും.\n"
],
"metadata": {}
},
{
"cell_type": "markdown",
"source": [],
"metadata": {}
},
{
"cell_type": "markdown",
"source": [
"### ടാസ്‌ക് 5: പുരുഷന്മാരും സ്ത്രീകളും തമ്മിലുള്ള പ്രമേഹത്തിന്റെ പുരോഗതിയുടെ ഡിഗ്രി വ്യത്യസ്തമാണെന്ന് ഹിപോത്തസിസ് പരിശോധിക്കുക\n"
],
"metadata": {}
},
{
"cell_type": "markdown",
"source": [],
"metadata": {}
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"---\n\n<!-- CO-OP TRANSLATOR DISCLAIMER START -->\n**അസൂയാ**: \nഈ രേഖ AI വിവർത്തന സേവനം [Co-op Translator](https://github.com/Azure/co-op-translator) ഉപയോഗിച്ച് വിവർത്തനം ചെയ്തതാണ്. നാം കൃത്യതയ്ക്ക് ശ്രമിച്ചിട്ടുണ്ടെങ്കിലും, സ്വയം പ്രവർത്തിക്കുന്ന വിവർത്തനങ്ങളിൽ പിശകുകൾ അല്ലെങ്കിൽ തെറ്റുകൾ ഉണ്ടാകാമെന്ന് ദയവായി ശ്രദ്ധിക്കുക. അതിന്റെ മാതൃഭാഷയിലുള്ള യഥാർത്ഥ രേഖയാണ് പ്രാമാണികമായ ഉറവിടം എന്ന് പരിഗണിക്കേണ്ടതാണ്. നിർണായകമായ വിവരങ്ങൾക്ക്, പ്രൊഫഷണൽ മനുഷ്യ വിവർത്തനം ശുപാർശ ചെയ്യപ്പെടുന്നു. ഈ വിവർത്തനം ഉപയോഗിക്കുന്നതിൽ നിന്നുണ്ടാകുന്ന ഏതെങ്കിലും തെറ്റിദ്ധാരണകൾക്കോ തെറ്റായ വ്യാഖ്യാനങ്ങൾക്കോ ഞങ്ങൾ ഉത്തരവാദികളല്ല.\n<!-- CO-OP TRANSLATOR DISCLAIMER END -->\n"
]
}
],
"metadata": {
"orig_nbformat": 4,
"language_info": {
"name": "python",
"version": "3.8.8",
"mimetype": "text/x-python",
"codemirror_mode": {
"name": "ipython",
"version": 3
},
"pygments_lexer": "ipython3",
"nbconvert_exporter": "python",
"file_extension": ".py"
},
"kernelspec": {
"name": "python3",
"display_name": "Python 3.8.8 64-bit (conda)"
},
"interpreter": {
"hash": "86193a1ab0ba47eac1c69c1756090baa3b420b3eea7d4aafab8b85f8b312f0c5"
},
"coopTranslator": {
"original_hash": "6d945fd15163f60cb473dbfe04b2d100",
"translation_date": "2025-12-19T17:05:58+00:00",
"source_file": "1-Introduction/04-stats-and-probability/assignment.ipynb",
"language_code": "ml"
}
},
"nbformat": 4,
"nbformat_minor": 2
}

@ -0,0 +1,42 @@
<!--
CO_OP_TRANSLATOR_METADATA:
{
"original_hash": "01d1b493e8b51a6ebb42524f6b1bcfff",
"translation_date": "2025-12-19T13:57:05+00:00",
"source_file": "1-Introduction/04-stats-and-probability/assignment.md",
"language_code": "ml"
}
-->
# ചെറിയ പ്രമേഹ പഠനം
ഈ അസൈൻമെന്റിൽ, നാം [ഇവിടെ](https://www4.stat.ncsu.edu/~boos/var.select/diabetes.html) നിന്നെടുത്ത ചെറിയ പ്രമേഹ രോഗികളുടെ ഡാറ്റാസെറ്റുമായി പ്രവർത്തിക്കും.
| | വയസ്സ് | ലിംഗം | BMI | BP | S1 | S2 | S3 | S4 | S5 | S6 | Y |
|---|-----|-----|-----|----|----|----|----|----|----|----|----|
| 0 | 59 | 2 | 32.1 | 101. | 157 | 93.2 | 38.0 | 4. | 4.8598 | 87 | 151 |
| 1 | 48 | 1 | 21.6 | 87.0 | 183 | 103.2 | 70. | 3. | 3.8918 | 69 | 75 |
| 2 | 72 | 2 | 30.5 | 93.0 | 156 | 93.6 | 41.0 | 4.0 | 4. | 85 | 141 |
| ... | ... | ... | ... | ...| ...| ...| ...| ...| ...| ...| ... |
## നിർദ്ദേശങ്ങൾ
* [assignment.ipynb] അസൈൻമെന്റ് നോട്ട്‌ബുക്ക് ജുപിറ്റർ നോട്ട്‌ബുക്ക് പരിസ്ഥിതിയിൽ തുറക്കുക
* നോട്ട്‌ബുക്കിൽ നൽകിയ എല്ലാ പ്രവർത്തനങ്ങളും പൂർത്തിയാക്കുക, പ്രത്യേകിച്ച്:
* [ ] എല്ലാ മൂല്യങ്ങൾക്കും ശരാശരി മൂല്യങ്ങളും വ്യത്യാസവും കണക്കാക്കുക
* [ ] ലിംഗം അനുസരിച്ച് BMI, BP, Y എന്നിവയുടെ ബോക്സ്‌പ്ലോട്ടുകൾ വരയ്ക്കുക
* [ ] വയസ്സ്, ലിംഗം, BMI, Y എന്നിവയുടെ വിതരണമെന്നത് എന്താണ്?
* [ ] വ്യത്യസ്ത മൂല്യങ്ങൾക്കും രോഗ പുരോഗതിക്കും (Y) ഇടയിലുള്ള സഹബന്ധം പരിശോധിക്കുക
* [ ] പുരുഷന്മാരും സ്ത്രീകളും തമ്മിലുള്ള പ്രമേഹ പുരോഗതിയുടെ വ്യത്യാസം എന്ന ഹിപോത്തസിസ് പരിശോധിക്കുക
## റൂബ്രിക്
ഉദാഹരണാത്മകമായ | മതിയായ | മെച്ചപ്പെടുത്തേണ്ടത്
--- | --- | -- |
ആവശ്യമായ എല്ലാ പ്രവർത്തനങ്ങളും പൂർത്തിയാക്കി, ഗ്രാഫികായി വിശദീകരിക്കുകയും ചെയ്തു | പ്രവർത്തനങ്ങളുടെ ഭൂരിഭാഗവും പൂർത്തിയായി, ഗ്രാഫുകൾ അല്ലെങ്കിൽ ലഭിച്ച മൂല്യങ്ങളിൽ നിന്നുള്ള വിശദീകരണങ്ങൾ അല്ലെങ്കിൽ പ്രധാനപ്പെട്ട കാര്യങ്ങൾ ഇല്ല | ശരാശരി/വ്യത്യാസം കണക്കാക്കൽ, അടിസ്ഥാന പ്ലോട്ടുകൾ തുടങ്ങിയ അടിസ്ഥാന പ്രവർത്തനങ്ങൾ മാത്രമാണ് പൂർത്തിയായത്, ഡാറ്റയിൽ നിന്നുള്ള നിഗമനങ്ങൾ ഇല്ല
---
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
**അസൂയാ**:
ഈ രേഖ AI വിവർത്തന സേവനം [Co-op Translator](https://github.com/Azure/co-op-translator) ഉപയോഗിച്ച് വിവർത്തനം ചെയ്തതാണ്. നാം കൃത്യതയ്ക്ക് ശ്രമിച്ചിട്ടുണ്ടെങ്കിലും, സ്വയം പ്രവർത്തിക്കുന്ന വിവർത്തനങ്ങളിൽ പിശകുകൾ അല്ലെങ്കിൽ തെറ്റുകൾ ഉണ്ടാകാമെന്ന് ദയവായി ശ്രദ്ധിക്കുക. അതിന്റെ മാതൃഭാഷയിലുള്ള യഥാർത്ഥ രേഖയാണ് പ്രാമാണികമായ ഉറവിടം എന്ന് പരിഗണിക്കേണ്ടതാണ്. നിർണായകമായ വിവരങ്ങൾക്ക്, പ്രൊഫഷണൽ മനുഷ്യ വിവർത്തനം ശുപാർശ ചെയ്യപ്പെടുന്നു. ഈ വിവർത്തനം ഉപയോഗിക്കുന്നതിൽ നിന്നുണ്ടാകുന്ന ഏതെങ്കിലും തെറ്റിദ്ധാരണകൾക്കോ തെറ്റായ വ്യാഖ്യാനങ്ങൾക്കോ ഞങ്ങൾ ഉത്തരവാദികളല്ല.
<!-- CO-OP TRANSLATOR DISCLAIMER END -->

File diff suppressed because one or more lines are too long

File diff suppressed because one or more lines are too long

@ -0,0 +1,33 @@
<!--
CO_OP_TRANSLATOR_METADATA:
{
"original_hash": "696a8474a01054281704cbfb09148949",
"translation_date": "2025-12-19T13:23:07+00:00",
"source_file": "1-Introduction/README.md",
"language_code": "ml"
}
-->
# ഡാറ്റാ സയൻസിലേക്ക് പരിചയം
![data in action](../../../translated_images/data.48e22bb7617d8d92188afbc4c48effb920ba79f5cebdc0652cd9f34bbbd90c18.ml.jpg)
> ഫോട്ടോ <a href="https://unsplash.com/@dawson2406?utm_source=unsplash&utm_medium=referral&utm_content=creditCopyText">സ്റ്റീഫൻ ഡോസൺ</a> <a href="https://unsplash.com/s/photos/data?utm_source=unsplash&utm_medium=referral&utm_content=creditCopyText">അൺസ്പ്ലാഷിൽ</a>
ഈ പാഠങ്ങളിൽ, ഡാറ്റാ സയൻസ് എങ്ങനെ നിർവചിക്കപ്പെടുന്നു എന്ന് നിങ്ങൾ കണ്ടെത്തും, ഒരു ഡാറ്റാ സയന്റിസ്റ്റ് പരിഗണിക്കേണ്ട നൈതിക കാര്യങ്ങളെക്കുറിച്ച് പഠിക്കും. ഡാറ്റ എങ്ങനെ നിർവചിക്കപ്പെടുന്നു എന്നും, ഡാറ്റാ സയൻസിന്റെ മേധാവി അക്കാദമിക് മേഖലകളായ സ്ഥിതിവിവരശാസ്ത്രവും സാദ്ധ്യതയും കുറിച്ച് കുറച്ച് പഠിക്കും.
### വിഷയങ്ങൾ
1. [ഡാറ്റാ സയൻസ് നിർവചനം](01-defining-data-science/README.md)
2. [ഡാറ്റാ സയൻസ് നൈതികത](02-ethics/README.md)
3. [ഡാറ്റ നിർവചനം](03-defining-data/README.md)
4. [സ്ഥിതിവിവരശാസ്ത്രവും സാദ്ധ്യതയും പരിചയം](04-stats-and-probability/README.md)
### ക്രെഡിറ്റുകൾ
ഈ പാഠങ്ങൾ ❤️ ഉപയോഗിച്ച് എഴുതിയത് [നിത്യ നരസിംഹൻ](https://twitter.com/nitya) ഉം [ഡ്മിത്രി സോഷ്നികോവ്](https://twitter.com/shwars) ഉം ആണ്.
---
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
**അസൂയാപത്രം**:
ഈ രേഖ AI വിവർത്തന സേവനം [Co-op Translator](https://github.com/Azure/co-op-translator) ഉപയോഗിച്ച് വിവർത്തനം ചെയ്തതാണ്. നാം കൃത്യതയ്ക്ക് ശ്രമിച്ചിട്ടുണ്ടെങ്കിലും, യന്ത്രം ചെയ്ത വിവർത്തനങ്ങളിൽ പിശകുകൾ അല്ലെങ്കിൽ തെറ്റുകൾ ഉണ്ടാകാമെന്ന് ദയവായി ശ്രദ്ധിക്കുക. അതിന്റെ മാതൃഭാഷയിലുള്ള യഥാർത്ഥ രേഖ അധികാരപരമായ ഉറവിടമായി കണക്കാക്കപ്പെടണം. നിർണായക വിവരങ്ങൾക്ക്, പ്രൊഫഷണൽ മനുഷ്യ വിവർത്തനം ശുപാർശ ചെയ്യപ്പെടുന്നു. ഈ വിവർത്തനം ഉപയോഗിക്കുന്നതിൽ നിന്നുണ്ടാകുന്ന ഏതെങ്കിലും തെറ്റിദ്ധാരണകൾക്കോ തെറ്റായ വ്യാഖ്യാനങ്ങൾക്കോ ഞങ്ങൾ ഉത്തരവാദികളല്ല.
<!-- CO-OP TRANSLATOR DISCLAIMER END -->

@ -0,0 +1,199 @@
<!--
CO_OP_TRANSLATOR_METADATA:
{
"original_hash": "11739c7b40e7c6b16ad29e3df4e65862",
"translation_date": "2025-12-19T15:48:02+00:00",
"source_file": "2-Working-With-Data/05-relational-databases/README.md",
"language_code": "ml"
}
-->
# ഡാറ്റയുമായി പ്രവർത്തിക്കൽ: ബന്ധപരമായ ഡാറ്റാബേസുകൾ
|![ Sketchnote by [(@sketchthedocs)](https://sketchthedocs.dev) ](../../sketchnotes/05-RelationalData.png)|
|:---:|
| ഡാറ്റയുമായി പ്രവർത്തിക്കൽ: ബന്ധപരമായ ഡാറ്റാബേസുകൾ - _Sketchnote by [@nitya](https://twitter.com/nitya)_ |
നിങ്ങൾ മുമ്പ് വിവരങ്ങൾ സൂക്ഷിക്കാൻ സ്പ്രെഡ്‌ഷീറ്റ് ഉപയോഗിച്ചിട്ടുണ്ടാകാം. നിങ്ങൾക്കു് ഒരു നിരകളും കോളങ്ങളുമുള്ള ഒരു സെറ്റ് ഉണ്ടായിരുന്നു, അവിടെ നിരകൾ വിവരങ്ങൾ (അഥവാ ഡാറ്റ) ഉൾക്കൊണ്ടിരുന്നു, കോളങ്ങൾ വിവരങ്ങളെ വിവരിച്ചിരുന്നു (കഴിഞ്ഞപ്പോൾ മെറ്റാഡേറ്റ എന്ന് വിളിക്കപ്പെടുന്നു). ഒരു ബന്ധപരമായ ഡാറ്റാബേസ് ഈ കോളങ്ങളും നിരകളും ഉള്ള ടേബിളുകളുടെ അടിസ്ഥാന സിദ്ധാന്തത്തിൽ നിർമ്മിക്കപ്പെട്ടതാണ്, ഇത് നിങ്ങൾക്ക് വിവരങ്ങൾ പല ടേബിളുകളിലായി വ്യാപിപ്പിക്കാൻ അനുവദിക്കുന്നു. ഇത് നിങ്ങൾക്ക് കൂടുതൽ സങ്കീർണ്ണമായ ഡാറ്റയുമായി പ്രവർത്തിക്കാൻ, പുനരാവൃതിയെ ഒഴിവാക്കാൻ, ഡാറ്റ പരിശോധിക്കുന്ന രീതിയിൽ കൂടുതൽ സൗകര്യം നൽകുന്നു. ബന്ധപരമായ ഡാറ്റാബേസിന്റെ ആശയങ്ങൾ പരിശോധിക്കാം.
## [പ്രീ-ലെക്ചർ ക്വിസ്](https://ff-quizzes.netlify.app/en/ds/quiz/8)
## എല്ലാം ടേബിളുകളോടെ ആരംഭിക്കുന്നു
ഒരു ബന്ധപരമായ ഡാറ്റാബേസിന്റെ മദ്ധ്യത്തിൽ ടേബിളുകളുണ്ട്. സ്പ്രെഡ്‌ഷീറ്റിനൊപ്പം പോലെ, ഒരു ടേബിൾ കോളങ്ങളും നിരകളും ഉള്ള ഒരു ശേഖരമാണ്. നിരയിൽ നാം പ്രവർത്തിക്കാൻ ആഗ്രഹിക്കുന്ന ഡാറ്റ അല്ലെങ്കിൽ വിവരങ്ങൾ അടങ്ങിയിരിക്കുന്നു, ഉദാഹരണത്തിന് ഒരു നഗരത്തിന്റെ പേര് അല്ലെങ്കിൽ മഴവെള്ളത്തിന്റെ അളവ്. കോളങ്ങൾ അവർ സൂക്ഷിക്കുന്ന ഡാറ്റയെ വിവരിക്കുന്നു.
നഗരങ്ങളെക്കുറിച്ചുള്ള വിവരങ്ങൾ സൂക്ഷിക്കാൻ ഒരു ടേബിൾ ആരംഭിച്ച് നോക്കാം. നാം അവരുടെ പേര്, രാജ്യം തുടങ്ങിയവ തുടങ്ങാം. നിങ്ങൾ ഇത് ഒരു ടേബിളിൽ ഇങ്ങനെ സൂക്ഷിക്കാം:
| നഗരം | രാജ്യം |
| -------- | ------------- |
| ടോക്കിയോ | ജപ്പാൻ |
| അറ്റ്ലാന്റാ | യുണൈറ്റഡ് സ്റ്റേറ്റ്സ് |
| ഓക്ലാൻഡ് | ന്യൂസിലാൻഡ് |
**നഗരം**, **രാജ്യം** എന്നീ കോളം പേരുകൾ സൂക്ഷിക്കുന്ന ഡാറ്റയെ വിവരിക്കുന്നു, ഓരോ നിരയും ഒരു നഗരത്തെക്കുറിച്ചുള്ള വിവരങ്ങൾ ഉൾക്കൊള്ളുന്നു.
## ഒറ്റ ടേബിൾ സമീപനത്തിന്റെ പരിമിതികൾ
മുകളിൽ കാണിച്ച ടേബിൾ നിങ്ങൾക്ക് പരിചിതമായതായിരിക്കാം. നമുക്ക് നമ്മുടെ ഡാറ്റാബേസിൽ കൂടുതൽ ഡാറ്റ ചേർക്കാം - വാർഷിക മഴവെള്ളം (മില്ലിമീറ്ററിൽ). നാം 2018, 2019, 2020 വർഷങ്ങളിൽ ശ്രദ്ധ കേന്ദ്രീകരിക്കും. ടോക്കിയോയ്ക്ക് ഇത് ചേർക്കുകയാണെങ്കിൽ ഇങ്ങനെ കാണാം:
| നഗരം | രാജ്യം | വർഷം | അളവ് |
| ----- | ------- | ---- | ------ |
| ടോക്കിയോ | ജപ്പാൻ | 2020 | 1690 |
| ടോക്കിയോ | ജപ്പാൻ | 2019 | 1874 |
| ടോക്കിയോ | ജപ്പാൻ | 2018 | 1445 |
നമ്മുടെ ടേബിളിൽ നിങ്ങൾ എന്ത് ശ്രദ്ധിക്കുന്നു? നഗരത്തിന്റെ പേര്, രാജ്യം ആവർത്തിച്ച് പുനരാവൃതിയാകുന്നു. ഇത് വലിയ സംഭരണശേഷി ഉപയോഗിക്കാം, പല പകർപ്പുകൾ ആവശ്യമില്ല. ടോക്കിയോയ്ക്ക് നാം ആഗ്രഹിക്കുന്ന ഒരു പേര് മാത്രമേ ഉള്ളൂ.
ശരി, മറ്റൊരു ശ്രമം ചെയ്യാം. ഓരോ വർഷത്തിനും പുതിയ കോളങ്ങൾ ചേർക്കാം:
| നഗരം | രാജ്യം | 2018 | 2019 | 2020 |
| -------- | ------------- | ---- | ---- | ---- |
| ടോക്കിയോ | ജപ്പാൻ | 1445 | 1874 | 1690 |
| അറ്റ്ലാന്റാ | യുണൈറ്റഡ് സ്റ്റേറ്റ്സ് | 1779 | 1111 | 1683 |
| ഓക്ലാൻഡ് | ന്യൂസിലാൻഡ് | 1386 | 942 | 1176 |
ഇത് നിര പുനരാവൃത്തി ഒഴിവാക്കുന്നു, പക്ഷേ മറ്റൊരു വെല്ലുവിളി ഉണ്ടാക്കുന്നു. ഓരോ പുതിയ വർഷവും ടേബിളിന്റെ ഘടന മാറ്റേണ്ടി വരും. കൂടാതെ, വർഷങ്ങൾ കോളങ്ങളായി ഉള്ളത് മൂലം ഡാറ്റ പുനഃപ്രാപനം, കണക്കുകൂട്ടൽ കൂടുതൽ ബുദ്ധിമുട്ടാകും.
ഇതിനാൽ നമുക്ക് പല ടേബിളുകളും ബന്ധങ്ങളും ആവശ്യമുണ്ട്. ഡാറ്റ വിഭജിച്ച് പുനരാവൃത്തി ഒഴിവാക്കി, കൂടുതൽ സൗകര്യപ്രദമായി ഡാറ്റ കൈകാര്യം ചെയ്യാം.
## ബന്ധങ്ങളുടെ ആശയങ്ങൾ
നമ്മുടെ ഡാറ്റ തിരിച്ചറിയാം, എങ്ങനെ വിഭജിക്കാമെന്ന് തീരുമാനിക്കാം. നഗരങ്ങളുടെ പേര്, രാജ്യം സൂക്ഷിക്കാൻ ഒരു ടേബിൾ മതിയാകും.
| നഗരം | രാജ്യം |
| -------- | ------------- |
| ടോക്കിയോ | ജപ്പാൻ |
| അറ്റ്ലാന്റാ | യുണൈറ്റഡ് സ്റ്റേറ്റ്സ് |
| ഓക്ലാൻഡ് | ന്യൂസിലാൻഡ് |
പിന്നീട് അടുത്ത ടേബിൾ സൃഷ്ടിക്കുന്നതിന് മുമ്പ്, ഓരോ നഗരത്തെയും എങ്ങനെ സൂചിപ്പിക്കാമെന്ന് കണ്ടെത്തണം. ഒരു തിരിച്ചറിയൽ, ഐഡി അല്ലെങ്കിൽ (ടെക്നിക്കൽ ഡാറ്റാബേസ് പദങ്ങളിൽ) പ്രൈമറി കീ ആവശ്യമുണ്ട്. പ്രൈമറി കീ ഒരു ടേബിളിലെ ഒരു പ്രത്യേക നിര തിരിച്ചറിയാൻ ഉപയോഗിക്കുന്ന മൂല്യമാണ്. ഇത് ഒരു മൂല്യത്തെ അടിസ്ഥാനമാക്കാമെങ്കിലും (ഉദാഹരണത്തിന് നഗരത്തിന്റെ പേര്), സാധാരണയായി ഇത് ഒരു സംഖ്യ അല്ലെങ്കിൽ മറ്റൊരു തിരിച്ചറിയൽ ആയിരിക്കണം. ഐഡി മാറാതിരിക്കണം, കാരണം അത് ബന്ധം തകരാറിലാക്കും. സാധാരണയായി പ്രൈമറി കീ സ്വയം സൃഷ്ടിക്കപ്പെട്ട സംഖ്യയാണ്.
> ✅ പ്രൈമറി കീ സാധാരണയായി PK എന്ന് ചുരുക്കി പറയുന്നു
### നഗരങ്ങൾ
| city_id | നഗരം | രാജ്യം |
| ------- | -------- | ------------- |
| 1 | ടോക്കിയോ | ജപ്പാൻ |
| 2 | അറ്റ്ലാന്റാ | യുണൈറ്റഡ് സ്റ്റേറ്റ്സ് |
| 3 | ഓക്ലാൻഡ് | ന്യൂസിലാൻഡ് |
> ✅ ഈ പാഠത്തിൽ "id"യും "primary key"യും പരസ്പരം ഉപയോഗിക്കുന്നതായി കാണും. ഈ ആശയങ്ങൾ DataFrames-ലും ബാധകമാണ്, പിന്നീട് നിങ്ങൾ അവ പരിശോധിക്കും. DataFrames "primary key" പദം ഉപയോഗിക്കാറില്ല, പക്ഷേ അവ സമാനമായി പ്രവർത്തിക്കുന്നു.
നഗരങ്ങളുടെ ടേബിൾ സൃഷ്ടിച്ചതിനുശേഷം, മഴവെള്ളം സൂക്ഷിക്കാം. നഗരത്തെ പൂർണ്ണമായി പുനരാവർത്തിക്കാതെ, id ഉപയോഗിക്കാം. പുതിയ ടേബിളിലും *id* കോളം ഉണ്ടായിരിക്കണം, എല്ലാ ടേബിളുകൾക്കും id അല്ലെങ്കിൽ പ്രൈമറി കീ ഉണ്ടായിരിക്കണം.
### മഴവെള്ളം
| rainfall_id | city_id | വർഷം | അളവ് |
| ----------- | ------- | ---- | ------ |
| 1 | 1 | 2018 | 1445 |
| 2 | 1 | 2019 | 1874 |
| 3 | 1 | 2020 | 1690 |
| 4 | 2 | 2018 | 1779 |
| 5 | 2 | 2019 | 1111 |
| 6 | 2 | 2020 | 1683 |
| 7 | 3 | 2018 | 1386 |
| 8 | 3 | 2019 | 942 |
| 9 | 3 | 2020 | 1176 |
പുതിയ **rainfall** ടേബിളിലെ **city_id** കോളം ശ്രദ്ധിക്കുക. ഈ കോളം **cities** ടേബിളിലെ ഐഡികളെ സൂചിപ്പിക്കുന്നു. ടെക്നിക്കൽ ബന്ധപരമായ ഡാറ്റ പദങ്ങളിൽ ഇത് **ഫോറൻ കീ** എന്ന് വിളിക്കുന്നു; മറ്റൊരു ടേബിളിലെ പ്രൈമറി കീ ആണ്. ഇത് ഒരു റഫറൻസ് അല്ലെങ്കിൽ പോയിന്റർ ആയി കരുതാം. **city_id** 1 ടോക്കിയോയെ സൂചിപ്പിക്കുന്നു.
> [!NOTE]
> ഫോറൻ കീ സാധാരണയായി FK എന്ന് ചുരുക്കി പറയുന്നു
## ഡാറ്റ പുനഃപ്രാപനം
ഡാറ്റ രണ്ട് ടേബിളുകളായി വിഭജിച്ചപ്പോൾ, എങ്ങനെ പുനഃപ്രാപിക്കാമെന്ന് നിങ്ങൾക്ക് സംശയമുണ്ടാകാം. MySQL, SQL Server, Oracle പോലുള്ള ബന്ധപരമായ ഡാറ്റാബേസുകൾ ഉപയോഗിക്കുമ്പോൾ, Structured Query Language അല്ലെങ്കിൽ SQL എന്ന ഭാഷ ഉപയോഗിക്കാം. SQL (കഴിഞ്ഞപ്പോൾ sequel എന്നും ഉച്ചരിക്കാം) ഒരു സ്റ്റാൻഡേർഡ് ഭാഷയാണ്, ബന്ധപരമായ ഡാറ്റാബേസിൽ ഡാറ്റ പുനഃപ്രാപിക്കാനും മാറ്റാനും ഉപയോഗിക്കുന്നു.
ഡാറ്റ പുനഃപ്രാപിക്കാൻ `SELECT` കമാൻഡ് ഉപയോഗിക്കുന്നു. അടിസ്ഥാനത്തിൽ, നിങ്ങൾ കാണാൻ ആഗ്രഹിക്കുന്ന കോളങ്ങൾ **select** ചെയ്യുകയും അവ ഉൾക്കൊള്ളുന്ന ടേബിളിൽ നിന്നാണ് **from** ചെയ്യുകയും ചെയ്യുന്നു. നഗരങ്ങളുടെ പേരുകൾ മാത്രം കാണിക്കാൻ നിങ്ങൾക്ക് താഴെ കാണുന്ന വിധം ഉപയോഗിക്കാം:
```sql
SELECT city
FROM cities;
-- Output:
-- Tokyo
-- Atlanta
-- Auckland
```
`SELECT` നിങ്ങൾ കോളങ്ങൾ പട്ടികപ്പെടുത്തുന്നിടമാണ്, `FROM` ടേബിളുകൾ പട്ടികപ്പെടുത്തുന്നിടമാണ്.
> [!NOTE]
> SQL സിന്റാക്സ് കേസ്-ഇൻസെൻസിറ്റീവ് ആണ്, അതായത് `select` ഉം `SELECT` ഉം ഒരേ അർത്ഥം വഹിക്കുന്നു. എന്നാൽ, നിങ്ങൾ ഉപയോഗിക്കുന്ന ഡാറ്റാബേസിന്റെ തരം അനുസരിച്ച് കോളങ്ങളും ടേബിളുകളും കേസ്-സെൻസിറ്റീവ് ആകാം. അതിനാൽ, പ്രോഗ്രാമിങ്ങിൽ എല്ലാം കേസ്-സെൻസിറ്റീവ് ആണെന്ന് കരുതുന്നത് മികച്ച പ്രാക്ടീസാണ്. SQL ക്വെറിയുകൾ എഴുതുമ്പോൾ സാധാരണയായി കീവേഡുകൾ മുഴുവൻ അപ്പർകേസ് അക്ഷരങ്ങളിൽ എഴുതുന്നു.
മുകളിൽ കാണിച്ച ക്വെറി എല്ലാ നഗരങ്ങളും പ്രദർശിപ്പിക്കും. നമുക്ക് ന്യൂസിലാൻഡിലെ നഗരങ്ങൾ മാത്രം കാണിക്കണമെന്ന് കരുതാം. ഫിൽട്ടർ വേണം. SQL-ൽ ഇതിന് `WHERE` എന്ന കീവേഡ് ഉപയോഗിക്കുന്നു, അർത്ഥം "എവിടെ എന്തെങ്കിലും സത്യമാണെങ്കിൽ".
```sql
SELECT city
FROM cities
WHERE country = 'New Zealand';
-- Output:
-- Auckland
```
## ഡാറ്റ ജോയിൻ ചെയ്യൽ
ഇതുവരെ നാം ഒരു ടേബിളിൽ നിന്നുള്ള ഡാറ്റ പുനഃപ്രാപിച്ചു. ഇപ്പോൾ **cities** ഉം **rainfall** ഉം ഉള്ള ഡാറ്റ ഒന്നിച്ച് കൊണ്ടുവരണം. ഇത് *ജോയിൻ* ചെയ്യലിലൂടെ സാധിക്കും. രണ്ട് ടേബിളുകൾ തമ്മിൽ ഒരു സീം സൃഷ്ടിച്ച്, ഓരോ ടേബിളിലെ ഒരു കോളത്തിലെ മൂല്യങ്ങൾ പൊരുത്തപ്പെടുത്തും.
നമ്മുടെ ഉദാഹരണത്തിൽ, **rainfall** ലെ **city_id** കോളവും **cities** ലെ **city_id** കോളവും പൊരുത്തപ്പെടുത്തും. ഇത് മഴവെള്ളത്തിന്റെ മൂല്യം അതിന്റെ നഗരത്തോടൊപ്പം പൊരുത്തപ്പെടുത്തും. നാം ചെയ്യാൻ പോകുന്ന ജോയിൻ ഒരു *ഇൻറർ* ജോയിൻ ആണ്, അർത്ഥം മറ്റൊരു ടേബിളിൽ പൊരുത്തപ്പെടാത്ത നിരകൾ പ്രദർശിപ്പിക്കപ്പെടില്ല. നമ്മുടെ കേസിൽ എല്ലാ നഗരത്തിനും മഴവെള്ളം ഉള്ളതിനാൽ എല്ലാം പ്രദർശിപ്പിക്കും.
2019-ലെ എല്ലാ നഗരങ്ങളുടെയും മഴവെള്ളം പുനഃപ്രാപിക്കാം.
നാം ഇത് ഘട്ടങ്ങളായി ചെയ്യും. ആദ്യ ഘട്ടം ഡാറ്റ ജോയിൻ ചെയ്യുക, സീമിനായി കോളങ്ങൾ സൂചിപ്പിക്കുക - മുമ്പ് ഹൈലൈറ്റ് ചെയ്ത **city_id**.
```sql
SELECT cities.city
rainfall.amount
FROM cities
INNER JOIN rainfall ON cities.city_id = rainfall.city_id
```
നാം ആവശ്യമായ രണ്ട് കോളങ്ങളും, **city_id** ഉപയോഗിച്ച് ടേബിളുകൾ ജോയിൻ ചെയ്യണമെന്ന് ഹൈലൈറ്റ് ചെയ്തു. ഇപ്പോൾ `WHERE` സ്റ്റേറ്റ്മെന്റ് ചേർത്ത് 2019 വർഷം മാത്രം ഫിൽട്ടർ ചെയ്യാം.
```sql
SELECT cities.city
rainfall.amount
FROM cities
INNER JOIN rainfall ON cities.city_id = rainfall.city_id
WHERE rainfall.year = 2019
-- Output
-- city | amount
-- -------- | ------
-- Tokyo | 1874
-- Atlanta | 1111
-- Auckland | 942
```
## സംഗ്രഹം
ബന്ധപരമായ ഡാറ്റാബേസുകൾ പല ടേബിളുകളായി വിവരങ്ങൾ വിഭജിച്ച്, പിന്നീട് പ്രദർശനത്തിനും വിശകലനത്തിനും ഒന്നിച്ച് കൊണ്ടുവരുന്നതിൽ കേന്ദ്രീകരിക്കുന്നു. ഇത് കണക്കുകൂട്ടലുകൾ നടത്താനും ഡാറ്റ കൈകാര്യം ചെയ്യാനും ഉയർന്ന സൗകര്യം നൽകുന്നു. നിങ്ങൾ ബന്ധപരമായ ഡാറ്റാബേസിന്റെ അടിസ്ഥാന ആശയങ്ങളും രണ്ട് ടേബിളുകൾ തമ്മിൽ ജോയിൻ ചെയ്യുന്നതും കണ്ടു.
## 🚀 ചലഞ്ച്
ഇന്റർനെറ്റിൽ നിരവധി ബന്ധപരമായ ഡാറ്റാബേസുകൾ ലഭ്യമാണ്. മുകളിൽ പഠിച്ച കഴിവുകൾ ഉപയോഗിച്ച് ഡാറ്റ പരിശോധിക്കാം.
## പോസ്റ്റ്-ലെക്ചർ ക്വിസ്
## [പോസ്റ്റ്-ലെക്ചർ ക്വിസ്](https://ff-quizzes.netlify.app/en/ds/quiz/9)
## അവലോകനം & സ്വയം പഠനം
SQL-ഉം ബന്ധപരമായ ഡാറ്റാബേസ് ആശയങ്ങളും തുടർ പഠനത്തിനായി [Microsoft Learn](https://docs.microsoft.com/learn?WT.mc_id=academic-77958-bethanycheum) ൽ നിരവധി വിഭവങ്ങൾ ലഭ്യമാണ്
- [ബന്ധപരമായ ഡാറ്റയുടെ ആശയങ്ങൾ വിവരിക്കുക](https://docs.microsoft.com//learn/modules/describe-concepts-of-relational-data?WT.mc_id=academic-77958-bethanycheum)
- [Transact-SQL ഉപയോഗിച്ച് ക്വെറി ആരംഭിക്കുക](https://docs.microsoft.com//learn/paths/get-started-querying-with-transact-sql?WT.mc_id=academic-77958-bethanycheum) (Transact-SQL SQL-ന്റെ ഒരു പതിപ്പാണ്)
- [Microsoft Learn-ൽ SQL ഉള്ളടക്കം](https://docs.microsoft.com/learn/browse/?products=azure-sql-database%2Csql-server&expanded=azure&WT.mc_id=academic-77958-bethanycheum)
## അസൈൻമെന്റ്
[എയർപോർട്ട് ഡാറ്റ പ്രദർശിപ്പിക്കൽ](assignment.md)
---
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
**അസൂയാ**:
ഈ രേഖ AI വിവർത്തന സേവനം [Co-op Translator](https://github.com/Azure/co-op-translator) ഉപയോഗിച്ച് വിവർത്തനം ചെയ്തതാണ്. നാം കൃത്യതയ്ക്ക് ശ്രമിച്ചിട്ടുണ്ടെങ്കിലും, സ്വയം പ്രവർത്തിക്കുന്ന വിവർത്തനങ്ങളിൽ പിശകുകൾ അല്ലെങ്കിൽ തെറ്റുകൾ ഉണ്ടാകാമെന്ന് ദയവായി ശ്രദ്ധിക്കുക. അതിന്റെ മാതൃഭാഷയിലുള്ള യഥാർത്ഥ രേഖ അധികാരപരമായ ഉറവിടമായി കണക്കാക്കപ്പെടണം. നിർണായക വിവരങ്ങൾക്ക്, പ്രൊഫഷണൽ മനുഷ്യ വിവർത്തനം ശുപാർശ ചെയ്യപ്പെടുന്നു. ഈ വിവർത്തനം ഉപയോഗിക്കുന്നതിൽ നിന്നുണ്ടാകുന്ന ഏതെങ്കിലും തെറ്റിദ്ധാരണകൾക്കോ തെറ്റായ വ്യാഖ്യാനങ്ങൾക്കോ ഞങ്ങൾ ഉത്തരവാദികളല്ല.
<!-- CO-OP TRANSLATOR DISCLAIMER END -->

@ -0,0 +1,76 @@
<!--
CO_OP_TRANSLATOR_METADATA:
{
"original_hash": "25b37acdfb2452917c1aa2e2ca44317a",
"translation_date": "2025-12-19T15:51:22+00:00",
"source_file": "2-Working-With-Data/05-relational-databases/assignment.md",
"language_code": "ml"
}
-->
# വിമാനത്താവള ഡാറ്റ പ്രദർശിപ്പിക്കൽ
നിങ്ങൾക്ക് [SQLite](https://sqlite.org/index.html) അടിസ്ഥാനമാക്കിയുള്ള [ഡാറ്റാബേസ്](https://raw.githubusercontent.com/Microsoft/Data-Science-For-Beginners/main/2-Working-With-Data/05-relational-databases/airports.db) ലഭിച്ചിട്ടുണ്ട്, ഇത് വിമാനത്താവളങ്ങളെക്കുറിച്ചുള്ള വിവരങ്ങൾ ഉൾക്കൊള്ളുന്നു. സ്കീമ താഴെ കാണിക്കുന്നു. വ്യത്യസ്ത നഗരങ്ങളിലെ വിമാനത്താവളങ്ങളുടെ വിവരങ്ങൾ പ്രദർശിപ്പിക്കാൻ നിങ്ങൾ [Visual Studio Code](https://code.visualstudio.com?WT.mc_id=academic-77958-bethanycheum) ൽ [SQLite വിപുലീകരണം](https://marketplace.visualstudio.com/items?itemName=alexcvzz.vscode-sqlite&WT.mc_id=academic-77958-bethanycheum) ഉപയോഗിക്കും.
## നിർദ്ദേശങ്ങൾ
അസൈൻമെന്റ് ആരംഭിക്കാൻ, നിങ്ങൾക്ക് ചില ഘട്ടങ്ങൾ നിർവഹിക്കേണ്ടതാണ്. നിങ്ങൾക്ക് ചില ടൂളുകൾ ഇൻസ്റ്റാൾ ചെയ്ത് സാമ്പിൾ ഡാറ്റാബേസ് ഡൗൺലോഡ് ചെയ്യേണ്ടതുണ്ട്.
### നിങ്ങളുടെ സിസ്റ്റം സജ്ജമാക്കുക
ഡാറ്റാബേസുമായി ഇടപഴകാൻ Visual Studio Codeയു SQLite വിപുലീകരണവും ഉപയോഗിക്കാം.
1. [code.visualstudio.com](https://code.visualstudio.com?WT.mc_id=academic-77958-bethanycheum) സന്ദർശിച്ച് Visual Studio Code ഇൻസ്റ്റാൾ ചെയ്യാനുള്ള നിർദ്ദേശങ്ങൾ പിന്തുടരുക
1. മാർക്കറ്റ്പ്ലേസ് പേജിൽ നൽകിയ നിർദ്ദേശങ്ങൾ അനുസരിച്ച് [SQLite വിപുലീകരണം](https://marketplace.visualstudio.com/items?itemName=alexcvzz.vscode-sqlite&WT.mc_id=academic-77958-bethanycheum) ഇൻസ്റ്റാൾ ചെയ്യുക
### ഡാറ്റാബേസ് ഡൗൺലോഡ് ചെയ്ത് തുറക്കുക
അടുത്തതായി, ഡാറ്റാബേസ് ഡൗൺലോഡ് ചെയ്ത് തുറക്കുക.
1. [GitHub-ൽ നിന്നുള്ള ഡാറ്റാബേസ് ഫയൽ](https://raw.githubusercontent.com/Microsoft/Data-Science-For-Beginners/main/2-Working-With-Data/05-relational-databases/airports.db) ഡൗൺലോഡ് ചെയ്ത് ഒരു ഡയറക്ടറിയിൽ സേവ് ചെയ്യുക
1. Visual Studio Code തുറക്കുക
1. **Ctl-Shift-P** (മാക്കിൽ **Cmd-Shift-P**) അമർത്തി `SQLite: Open database` ടൈപ്പ് ചെയ്ത് SQLite വിപുലീകരണത്തിൽ ഡാറ്റാബേസ് തുറക്കുക
1. **Choose database from file** തിരഞ്ഞെടുക്കുക, മുമ്പ് ഡൗൺലോഡ് ചെയ്ത **airports.db** ഫയൽ തുറക്കുക
1. ഡാറ്റാബേസ് തുറന്ന ശേഷം (സ്ക്രീനിൽ അപ്ഡേറ്റ് കാണിക്കില്ല), **Ctl-Shift-P** (മാക്കിൽ **Cmd-Shift-P**) അമർത്തി `SQLite: New query` ടൈപ്പ് ചെയ്ത് പുതിയ ക്വറി വിൻഡോ സൃഷ്ടിക്കുക
തുറന്ന ശേഷം, പുതിയ ക്വറി വിൻഡോ ഡാറ്റാബേസിൽ SQL സ്റ്റേറ്റ്മെന്റുകൾ പ്രവർത്തിപ്പിക്കാൻ ഉപയോഗിക്കാം. **Ctl-Shift-Q** (മാക്കിൽ **Cmd-Shift-Q**) കമാൻഡ് ഉപയോഗിച്ച് ക്വറികൾ പ്രവർത്തിപ്പിക്കാം.
> [!NOTE]
> SQLite വിപുലീകരണത്തെക്കുറിച്ച് കൂടുതൽ വിവരങ്ങൾക്ക്, നിങ്ങൾ [ഡോക്യുമെന്റേഷൻ](https://marketplace.visualstudio.com/items?itemName=alexcvzz.vscode-sqlite&WT.mc_id=academic-77958-bethanycheum) കാണാം
## ഡാറ്റാബേസ് സ്കീമ
ഒരു ഡാറ്റാബേസിന്റെ സ്കീമ അതിന്റെ പട്ടിക രൂപകൽപ്പനയും ഘടനയുമാണ്. **airports** ഡാറ്റാബേസിൽ രണ്ട് പട്ടികകൾ ഉണ്ട്, യുണൈറ്റഡ് കിംഗ്ഡം, അയർലൻഡ് എന്നിവയിലെ നഗരങ്ങളുടെ പട്ടികയായ `cities`യും എല്ലാ വിമാനത്താവളങ്ങളുടെ പട്ടികയായ `airports`ഉം. ചില നഗരങ്ങൾക്ക് ഒന്നിലധികം വിമാനത്താവളങ്ങൾ ഉണ്ടാകാമെന്നതിനാൽ, വിവരങ്ങൾ സൂക്ഷിക്കാൻ രണ്ട് പട്ടികകൾ സൃഷ്ടിച്ചു. ഈ അഭ്യാസത്തിൽ, വ്യത്യസ്ത നഗരങ്ങളുടെ വിവരങ്ങൾ പ്രദർശിപ്പിക്കാൻ ജോയിനുകൾ ഉപയോഗിക്കും.
| Cities |
| ---------------- |
| id (PK, integer) |
| city (text) |
| country (text) |
| Airports |
| -------------------------------- |
| id (PK, integer) |
| name (text) |
| code (text) |
| city_id (FK to id in **Cities**) |
## അസൈൻമെന്റ്
താഴെ പറയുന്ന വിവരങ്ങൾ തിരികെ നൽകാൻ ക്വറികൾ സൃഷ്ടിക്കുക:
1. `Cities` പട്ടികയിലെ എല്ലാ നഗരങ്ങളുടെ പേരുകൾ
1. `Cities` പട്ടികയിലെ അയർലൻഡിലെ എല്ലാ നഗരങ്ങളും
1. എല്ലാ വിമാനത്താവളങ്ങളുടെ പേരുകൾ അവയുടെ നഗരം, രാജ്യം എന്നിവയോടൊപ്പം
1. ലണ്ടൻ, യുണൈറ്റഡ് കിംഗ്ഡത്തിലെ എല്ലാ വിമാനത്താവളങ്ങളും
## റൂബ്രിക്
| ഉദാഹരണപരമായ | മതിയായ | മെച്ചപ്പെടുത്തേണ്ടത് |
| --------- | -------- | ----------------- |
---
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
**അസൂയാപത്രം**:
ഈ രേഖ AI വിവർത്തന സേവനം [Co-op Translator](https://github.com/Azure/co-op-translator) ഉപയോഗിച്ച് വിവർത്തനം ചെയ്തതാണ്. നാം കൃത്യതയ്ക്ക് ശ്രമിച്ചിട്ടുണ്ടെങ്കിലും, യന്ത്രം ചെയ്ത വിവർത്തനങ്ങളിൽ പിശകുകൾ അല്ലെങ്കിൽ തെറ്റുകൾ ഉണ്ടാകാമെന്ന് ദയവായി ശ്രദ്ധിക്കുക. അതിന്റെ മാതൃഭാഷയിലുള്ള യഥാർത്ഥ രേഖ അധികാരപരമായ ഉറവിടമായി കണക്കാക്കപ്പെടണം. നിർണായക വിവരങ്ങൾക്ക്, പ്രൊഫഷണൽ മനുഷ്യ വിവർത്തനം ശുപാർശ ചെയ്യപ്പെടുന്നു. ഈ വിവർത്തനം ഉപയോഗിക്കുന്നതിൽ നിന്നുണ്ടാകുന്ന ഏതെങ്കിലും തെറ്റിദ്ധാരണകൾക്കോ തെറ്റായ വ്യാഖ്യാനങ്ങൾക്കോ ഞങ്ങൾ ഉത്തരവാദികളല്ല.
<!-- CO-OP TRANSLATOR DISCLAIMER END -->

@ -0,0 +1,160 @@
<!--
CO_OP_TRANSLATOR_METADATA:
{
"original_hash": "c182e87f9f80be7e7cdffc7b40bbfccf",
"translation_date": "2025-12-19T15:38:44+00:00",
"source_file": "2-Working-With-Data/06-non-relational/README.md",
"language_code": "ml"
}
-->
# ഡാറ്റയുമായി പ്രവർത്തിക്കൽ: നോൺ-റിലേഷണൽ ഡാറ്റ
|![ Sketchnote by [(@sketchthedocs)](https://sketchthedocs.dev) ](../../sketchnotes/06-NoSQL.png)|
|:---:|
|NoSQL ഡാറ്റയുമായി പ്രവർത്തിക്കൽ - _Sketchnote by [@nitya](https://twitter.com/nitya)_ |
## [പ്രീ-ലെക്ചർ ക്വിസ്](https://ff-quizzes.netlify.app/en/ds/quiz/10)
ഡാറ്റ റിലേഷണൽ ഡാറ്റാബേസുകളിൽ മാത്രമല്ല. ഈ പാഠം നോൺ-റിലേഷണൽ ഡാറ്റയെക്കുറിച്ചാണ്, സ്പ്രെഡ്‌ഷീറ്റുകളും NoSQL-ഉം അടിസ്ഥാനപരമായി ഉൾക്കൊള്ളുന്നു.
## സ്പ്രെഡ്‌ഷീറ്റുകൾ
സ്പ്രെഡ്‌ഷീറ്റുകൾ ഡാറ്റ സംഭരിക്കാനും പരിശോധിക്കാനും പ്രചാരത്തിലുള്ള മാർഗമാണ്, കാരണം സജ്ജീകരിക്കാനും ആരംഭിക്കാനും കുറച്ച് ശ്രമം മാത്രം ആവശ്യമാണ്. ഈ പാഠത്തിൽ നിങ്ങൾ സ്പ്രെഡ്‌ഷീറ്റിന്റെ അടിസ്ഥാന ഘടകങ്ങളും ഫോർമുലകളും ഫംഗ്ഷനുകളും പഠിക്കും. ഉദാഹരണങ്ങൾ മൈക്രോസോഫ്റ്റ് എക്സെലിൽ കാണിക്കും, പക്ഷേ മറ്റ് സ്പ്രെഡ്‌ഷീറ്റ് സോഫ്റ്റ്‌വെയറുകളുമായി താരതമ്യപ്പെടുത്തുമ്പോൾ പല ഭാഗങ്ങളും വിഷയങ്ങളും സമാനമായ പേരുകളും ഘട്ടങ്ങളും ഉണ്ടാകും.
![രണ്ട് വർക്ക്‌ഷീറ്റുകളുള്ള ഒരു ശൂന്യമായ മൈക്രോസോഫ്റ്റ് എക്സെൽ വർക്ക്‌ബുക്ക്](../../../../translated_images/parts-of-spreadsheet.120711c82aa18a45c3e62a491a15bba0a31ab0e9db407ec022702fed8ffd89bf.ml.png)
ഒരു സ്പ്രെഡ്‌ഷീറ്റ് ഒരു ഫയലാണ്, ഇത് കമ്പ്യൂട്ടർ, ഉപകരണം, അല്ലെങ്കിൽ ക്ലൗഡ് അടിസ്ഥാനമാക്കിയ ഫയൽ സിസ്റ്റത്തിൽ ലഭ്യമാണ്. സോഫ്റ്റ്‌വെയർ ബ്രൗസർ അടിസ്ഥാനമോ കമ്പ്യൂട്ടറിൽ ഇൻസ്റ്റാൾ ചെയ്യേണ്ട ആപ്ലിക്കേഷനോ ആപ്പ് ഡൗൺലോഡ് ചെയ്യേണ്ടതായിരിക്കാം. എക്സെലിൽ ഈ ഫയലുകൾ **വർക്ക്‌ബുക്കുകൾ** എന്നറിയപ്പെടുന്നു, ഈ പദം ഈ പാഠത്തിന്റെ ശേഷിക്കുന്ന ഭാഗത്ത് ഉപയോഗിക്കും.
ഒരു വർക്ക്‌ബുക്കിൽ ഒരു അല്ലെങ്കിൽ കൂടുതൽ **വർക്ക്‌ഷീറ്റുകൾ** ഉണ്ടാകും, ഓരോ വർക്ക്‌ഷീറ്റും ടാബുകൾ കൊണ്ട് ലേബൽ ചെയ്തിരിക്കും. ഒരു വർക്ക്‌ഷീറ്റിനുള്ളിൽ **സെല്ലുകൾ** എന്നറിയപ്പെടുന്ന ചതുരങ്ങൾ ഉണ്ടാകും, അവ യഥാർത്ഥ ഡാറ്റ അടങ്ങിയിരിക്കും. ഒരു സെൽ ഒരു വരിയും ഒരു കോളവും തമ്മിലുള്ള ചേരുവയാണ്, കോളങ്ങൾ അക്ഷരങ്ങളാൽ ലേബൽ ചെയ്തിരിക്കും, വരികൾ സംഖ്യാനുക്രമത്തിൽ ലേബൽ ചെയ്തിരിക്കും. ചില സ്പ്രെഡ്‌ഷീറ്റുകളിൽ സെല്ലിലെ ഡാറ്റ വിവരണം നൽകാൻ ആദ്യ കുറച്ച് വരികളിൽ ഹെഡറുകൾ ഉണ്ടാകും.
എക്സെൽ വർക്ക്‌ബുക്കിന്റെ ഈ അടിസ്ഥാന ഘടകങ്ങളോടൊപ്പം, നാം [Microsoft Templates](https://templates.office.com/) ൽ നിന്നുള്ള ഒരു ഇൻവെന്ററി കേന്ദ്രീകരിച്ച ഉദാഹരണം ഉപയോഗിച്ച് സ്പ്രെഡ്‌ഷീറ്റിന്റെ ചില അധിക ഭാഗങ്ങൾ പരിശോധിക്കും.
### ഇൻവെന്ററി മാനേജ്മെന്റ്
"InventoryExample" എന്ന പേരിലുള്ള സ്പ്രെഡ്‌ഷീറ്റ് ഫയൽ ഒരു ഇൻവെന്ററിയിലുള്ള വസ്തുക്കളുടെ ഫോർമാറ്റ് ചെയ്ത സ്പ്രെഡ്‌ഷീറ്റാണ്, ഇതിൽ മൂന്ന് വർക്ക്‌ഷീറ്റുകൾ ഉണ്ട്, ടാബുകൾ "Inventory List", "Inventory Pick List" , "Bin Lookup" എന്നിങ്ങനെയാണ് ലേബൽ ചെയ്തിരിക്കുന്നത്. Inventory List വർക്ക്‌ഷീറ്റിലെ 4-ആം വരി ഹെഡറാണ്, ഹെഡർ കോളത്തിലെ ഓരോ സെല്ലിന്റെ മൂല്യം വിവരിക്കുന്നു.
![മൈക്രോസോഫ്റ്റ് എക്സെലിൽ ഒരു ഉദാഹരണ ഇൻവെന്ററി ലിസ്റ്റിൽ ഹൈലൈറ്റ് ചെയ്ത ഫോർമുല](../../../../translated_images/formula-excel.ad1068c220892f5ead570d12f2394897961d31a5043a1dd4e6fc5d7690c7a14e.ml.png)
ഒരു സെൽ മറ്റൊരു സെല്ലുകളുടെ മൂല്യങ്ങളിൽ ആശ്രയിച്ചിരിക്കാം അതിന്റെ മൂല്യം നിർമിക്കാൻ. Inventory List സ്പ്രെഡ്‌ഷീറ്റ് ഇൻവെന്ററിയിലെ ഓരോ വസ്തുവിന്റെ ചെലവ് ട്രാക്ക് ചെയ്യുന്നു, പക്ഷേ ഇൻവെന്ററിയിലെ എല്ലാം മൂല്യം അറിയേണ്ടതുണ്ടെങ്കിൽ? [**ഫോർമുലകൾ**](https://support.microsoft.com/en-us/office/overview-of-formulas-34519a4e-1e8d-4f4b-84d4-d642c4f63263) സെൽ ഡാറ്റയിൽ പ്രവർത്തനങ്ങൾ നടത്തുന്നു, ഈ ഉദാഹരണത്തിൽ ഇൻവെന്ററിയുടെ ചെലവ് കണക്കാക്കാൻ ഉപയോഗിക്കുന്നു. ഈ സ്പ്രെഡ്‌ഷീറ്റിൽ Inventory Value കോളത്തിൽ ഒരു ഫോർമുല ഉപയോഗിച്ച് ഓരോ വസ്തുവിന്റെ മൂല്യം കണക്കാക്കുന്നു, QTY ഹെഡറിന്റെ കീഴിലുള്ള അളവും COST ഹെഡറിന്റെ കീഴിലുള്ള ചെലവും ഗുണിച്ച്. ഒരു സെൽ ഡബിൾ ക്ലിക്കുചെയ്യുകയോ ഹൈലൈറ്റ് ചെയ്യുകയോ ചെയ്താൽ ഫോർമുല കാണാം. ഫോർമുലകൾ സമം ചിഹ്നത്തോടെ ആരംഭിക്കുന്നു, തുടർന്ന് കണക്കുകൂട്ടൽ അല്ലെങ്കിൽ പ്രവർത്തനം വരുന്നു.
![മൈക്രോസോഫ്റ്റ് എക്സെലിൽ ഒരു ഉദാഹരണ ഇൻവെന്ററി ലിസ്റ്റിൽ ഹൈലൈറ്റ് ചെയ്ത ഫംഗ്ഷൻ](../../../../translated_images/function-excel.be2ae4feddc10ca089f3d4363040d93b7fd046c8d4f83ba975ec46483ee99895.ml.png)
നാം മറ്റൊരു ഫോർമുല ഉപയോഗിച്ച് Inventory Value യിലെ എല്ലാ മൂല്യങ്ങളും കൂട്ടിച്ചേർത്ത് ആകെ മൂല്യം കണ്ടെത്താം. ഓരോ സെലും കൂട്ടിച്ചേർക്കുന്നത് ഒരു ബുദ്ധിമുട്ടുള്ള ജോലി ആകാം. എക്സെലിൽ [**ഫംഗ്ഷനുകൾ**](https://support.microsoft.com/en-us/office/sum-function-043e1c7d-7726-4e80-8f32-07b23e057f89) ഉണ്ട്, സെൽ മൂല്യങ്ങളിൽ കണക്കുകൂട്ടലുകൾ നടത്താൻ മുൻകൂട്ടി നിർവചിച്ച ഫോർമുലകൾ. ഫംഗ്ഷനുകൾക്ക് ആർഗ്യുമെന്റുകൾ ആവശ്യമുണ്ട്, കണക്കുകൂട്ടലുകൾ നടത്താൻ ആവശ്യമായ മൂല്യങ്ങൾ. ഫംഗ്ഷനുകൾക്ക് ഒരിലധികം ആർഗ്യുമെന്റുകൾ ആവശ്യമെങ്കിൽ, അവ ഒരു പ്രത്യേക ക്രമത്തിൽ ലിസ്റ്റ് ചെയ്യണം അല്ലെങ്കിൽ ഫംഗ്ഷൻ ശരിയായ മൂല്യം കണക്കാക്കില്ല. ഈ ഉദാഹരണത്തിൽ SUM ഫംഗ്ഷൻ ഉപയോഗിക്കുന്നു, Inventory Value യിലെ മൂല്യങ്ങൾ ആർഗ്യുമെന്റായി ഉപയോഗിച്ച് B3 (3-ആം വരി, B കോളം) ൽ ആകെ മൂല്യം കണക്കാക്കുന്നു.
## NoSQL
NoSQL എന്നത് നോൺ-റിലേഷണൽ ഡാറ്റ സംഭരിക്കുന്ന വ്യത്യസ്ത മാർഗങ്ങൾക്കുള്ള ഒരു പൊതുവായ പദമാണ്, ഇത് "non-SQL", "non-relational" അല്ലെങ്കിൽ "not only SQL" എന്നർത്ഥത്തിൽ വ്യാഖ്യാനിക്കാം. ഈ തരം ഡാറ്റാബേസ് സിസ്റ്റങ്ങൾ 4 തരം ആയി വർഗ്ഗീകരിക്കാം.
![കീ-വാല്യു ഡാറ്റ സ്റ്റോർ കാണിക്കുന്ന 4 വ്യത്യസ്ത സംഖ്യാത്മക കീകൾ 4 വ്യത്യസ്ത മൂല്യങ്ങളുമായി ബന്ധിപ്പിച്ചിരിക്കുന്ന ഗ്രാഫിക്കൽ പ്രതിനിധാനം](../../../../translated_images/kv-db.e8f2b75686bbdfcba0c827b9272c10ae0821611ea0fe98429b9d13194383afa6.ml.png)
> സ്രോതസ്സ്: [Michał Białecki Blog](https://www.michalbialecki.com/2018/03/18/azure-cosmos-db-key-value-database-cloud/)
[കീ-വാല്യു](https://docs.microsoft.com/en-us/azure/architecture/data-guide/big-data/non-relational-data#keyvalue-data-stores) ഡാറ്റാബേസുകൾ വ്യത്യസ്ത മൂല്യങ്ങളുമായി ബന്ധപ്പെട്ട ഒരു പ്രത്യേക കീ (അനന്യ തിരിച്ചറിയൽ) യെ ജോഡിക്കുന്നു. ഈ ജോഡികൾ [ഹാഷ് ടേബിൾ](https://www.hackerearth.com/practice/data-structures/hash-tables/basics-of-hash-tables/tutorial/) ഉപയോഗിച്ച് അനുയോജ്യമായ ഹാഷിംഗ് ഫംഗ്ഷൻ ഉപയോഗിച്ച് സംഭരിക്കുന്നു.
![പേര്, താൽപ്പര്യങ്ങൾ, സ്ഥലങ്ങൾ എന്നിവ തമ്മിലുള്ള ബന്ധങ്ങൾ കാണിക്കുന്ന ഗ്രാഫ് ഡാറ്റ സ്റ്റോർ ഗ്രാഫിക്കൽ പ്രതിനിധാനം](../../../../translated_images/graph-db.d13629152f79a9dac895b20fa7d841d4d4d6f6008b1382227c3bbd200fd4cfa1.ml.png)
> സ്രോതസ്സ്: [Microsoft](https://docs.microsoft.com/en-us/azure/cosmos-db/graph/graph-introduction#graph-database-by-example)
[ഗ്രാഫ്](https://docs.microsoft.com/en-us/azure/architecture/data-guide/big-data/non-relational-data#graph-data-stores) ഡാറ്റാബേസുകൾ ഡാറ്റയിലെ ബന്ധങ്ങൾ വിവരിക്കുന്നു, ഇത് നോഡുകളും എഡ്ജുകളും അടങ്ങിയ ഒരു ശേഖരമായി പ്രതിനിധീകരിക്കുന്നു. ഒരു നോഡ് ഒരു സত্ত്വത്തെ പ്രതിനിധീകരിക്കുന്നു, ഉദാഹരണത്തിന് ഒരു വിദ്യാർത്ഥി അല്ലെങ്കിൽ ബാങ്ക് സ്റ്റേറ്റ്മെന്റ് പോലുള്ള യാഥാർത്ഥ്യത്തിൽ ഉള്ള ഒന്നും. എഡ്ജുകൾ രണ്ട് സത്ത്വങ്ങൾ തമ്മിലുള്ള ബന്ധം പ്രതിനിധീകരിക്കുന്നു. ഓരോ നോഡിനും എഡ്ജിനും അവയുടെ അധിക വിവരങ്ങൾ നൽകുന്ന പ്രോപ്പർട്ടികൾ ഉണ്ട്.
![ഐഡന്റിറ്റി, കോൺടാക്റ്റ് ഇൻഫോ എന്നീ രണ്ട് കോളം ഫാമിലികൾ ഉള്ള ഒരു കസ്റ്റമർ ഡാറ്റാബേസ് കാണിക്കുന്ന കോളമ്നാർ ഡാറ്റ സ്റ്റോർ ഗ്രാഫിക്കൽ പ്രതിനിധാനം](../../../../translated_images/columnar-db.ffcfe73c3e9063a8c8f93f8ace85e1200863584b1e324eb5159d8ca10f62ec04.ml.png)
[കോളമ്നാർ](https://docs.microsoft.com/en-us/azure/architecture/data-guide/big-data/non-relational-data#columnar-data-stores) ഡാറ്റ സ്റ്റോറുകൾ ഡാറ്റയെ കോളങ്ങളും വരികളും ആയി ക്രമീകരിക്കുന്നു, റിലേഷണൽ ഡാറ്റ ഘടന പോലെയാണ്, പക്ഷേ ഓരോ കോളവും കോളം ഫാമിലി എന്ന ഗ്രൂപ്പുകളായി വിഭജിച്ചിരിക്കുന്നു, ഒരു കോളത്തിലെ എല്ലാ ഡാറ്റയും ബന്ധപ്പെട്ടതാണ്, ഒറ്റ യൂണിറ്റായി തിരികെ ലഭിക്കാനും മാറ്റാനും കഴിയും.
### Azure Cosmos DB ഉപയോഗിച്ച് ഡോക്യുമെന്റ് ഡാറ്റ സ്റ്റോറുകൾ
[ഡോക്യുമെന്റ്](https://docs.microsoft.com/en-us/azure/architecture/data-guide/big-data/non-relational-data#document-data-stores) ഡാറ്റ സ്റ്റോറുകൾ കീ-വാല്യു ഡാറ്റ സ്റ്റോർ ആശയത്തെ അടിസ്ഥാനമാക്കി നിർമ്മിച്ചവയാണ്, ഫീൽഡുകളും ഒബ്ജക്റ്റുകളും അടങ്ങിയ ഒരു ശേഖരമാണ്. ഈ വിഭാഗം Cosmos DB എമുലേറ്റർ ഉപയോഗിച്ച് ഡോക്യുമെന്റ് ഡാറ്റാബേസുകൾ പരിശോധിക്കും.
Cosmos DB ഡാറ്റാബേസ് "Not Only SQL" എന്ന നിർവചനത്തിന് അനുയോജ്യമാണ്, Cosmos DBയുടെ ഡോക്യുമെന്റ് ഡാറ്റാബേസ് ഡാറ്റ ക്വറി ചെയ്യാൻ SQL ആശ്രയിക്കുന്നു. [മുൻപത്തെ പാഠം](../05-relational-databases/README.md) SQL ഭാഷയുടെ അടിസ്ഥാനങ്ങൾ ഉൾക്കൊള്ളുന്നു, ഇവിടെ ഡോക്യുമെന്റ് ഡാറ്റാബേസിൽ ചില സമാന ക്വറികൾ പ്രയോഗിക്കാം. നാം Cosmos DB എമുലേറ്റർ ഉപയോഗിക്കും, ഇത് കമ്പ്യൂട്ടറിൽ ലൊക്കലായി ഡോക്യുമെന്റ് ഡാറ്റാബേസ് സൃഷ്ടിക്കുകയും പരിശോധിക്കുകയും ചെയ്യാൻ അനുവദിക്കുന്നു. എമുലേറ്ററിനെക്കുറിച്ച് കൂടുതൽ വായിക്കൂ [ഇവിടെ](https://docs.microsoft.com/en-us/azure/cosmos-db/local-emulator?tabs=ssl-netstd21).
ഒരു ഡോക്യുമെന്റ് ഫീൽഡുകളും ഒബ്ജക്റ്റ് മൂല്യങ്ങളും അടങ്ങിയ ശേഖരമാണ്, ഫീൽഡുകൾ ഒബ്ജക്റ്റ് മൂല്യം എന്താണെന്ന് വിവരിക്കുന്നു. താഴെ ഒരു ഡോക്യുമെന്റിന്റെ ഉദാഹരണം.
```json
{
"firstname": "Eva",
"age": 44,
"id": "8c74a315-aebf-4a16-bb38-2430a9896ce5",
"_rid": "bHwDAPQz8s0BAAAAAAAAAA==",
"_self": "dbs/bHwDAA==/colls/bHwDAPQz8s0=/docs/bHwDAPQz8s0BAAAAAAAAAA==/",
"_etag": "\"00000000-0000-0000-9f95-010a691e01d7\"",
"_attachments": "attachments/",
"_ts": 1630544034
}
```
ഈ ഡോക്യുമെന്റിലെ പ്രധാന ഫീൽഡുകൾ: `firstname`, `id`, `age`. ബാക്കി underscore ഉള്ള ഫീൽഡുകൾ Cosmos DB സൃഷ്ടിച്ചവയാണ്.
#### Cosmos DB എമുലേറ്റർ ഉപയോഗിച്ച് ഡാറ്റ പരിശോധിക്കൽ
നിങ്ങൾക്ക് എമുലേറ്റർ [Windows-ക്കായി ഇവിടെ ഡൗൺലോഡ് ചെയ്യാം](https://aka.ms/cosmosdb-emulator). macOS, Linux-ൽ എമുലേറ്റർ എങ്ങനെ പ്രവർത്തിപ്പിക്കാമെന്ന് അറിയാൻ ഈ [ഡോക്യുമെന്റേഷൻ](https://docs.microsoft.com/en-us/azure/cosmos-db/local-emulator?tabs=ssl-netstd21#run-on-linux-macos) കാണുക.
എമുലേറ്റർ ഒരു ബ്രൗസർ വിൻഡോ തുറക്കും, എക്സ്പ്ലോറർ വ്യൂ ഡോക്യുമെന്റുകൾ പരിശോധിക്കാൻ അനുവദിക്കുന്നു.
![Cosmos DB എമുലേറ്ററിന്റെ എക്സ്പ്ലോറർ വ്യൂ](../../../../translated_images/cosmosdb-emulator-explorer.a1c80b1347206fe2f30f88fc123821636587d04fc5a56a9eb350c7da6b31f361.ml.png)
നിങ്ങൾ പിന്തുടരുകയാണെങ്കിൽ, "Start with Sample" ക്ലിക്കുചെയ്യുക, SampleDB എന്ന സാമ്പിൾ ഡാറ്റാബേസ് സൃഷ്ടിക്കും. Sample DB-നെ ആർക്കോ ക്ലിക്കുചെയ്ത് വിപുലീകരിച്ചാൽ `Persons` എന്ന കണ്ടെയ്‌നർ കാണാം, കണ്ടെയ്‌നർ ഒരു വസ്തുക്കളുടെ ശേഖരമാണ്, ഇവ ഡോക്യുമെന്റുകളാണ്. `Items` എന്നതിൽ നാല് വ്യക്തിഗത ഡോക്യുമെന്റുകൾ പരിശോധിക്കാം.
![Cosmos DB എമുലേറ്ററിൽ സാമ്പിൾ ഡാറ്റ പരിശോധിക്കൽ](../../../../translated_images/cosmosdb-emulator-persons.bf640586a7077c8985dfd3071946465c8e074c722c7c202d6d714de99a93b90a.ml.png)
#### Cosmos DB എമുലേറ്റർ ഉപയോഗിച്ച് ഡോക്യുമെന്റ് ഡാറ്റ ക്വറി ചെയ്യൽ
നാം പുതിയ SQL Query ബട്ടൺ (ഇടത്തുനിന്ന് രണ്ടാം ബട്ടൺ) ക്ലിക്കുചെയ്ത് സാമ്പിൾ ഡാറ്റ ക്വറി ചെയ്യാം.
`SELECT * FROM c` കണ്ടെയ്‌നറിലുള്ള എല്ലാ ഡോക്യുമെന്റുകളും തിരികെ നൽകും. ഒരു where ക്ലോസ് ചേർത്ത് 40-ൽ താഴെയുള്ള പ്രായമുള്ളവരെ കണ്ടെത്താം.
`SELECT * FROM c where c.age < 40`
![Cosmos DB എമുലേറ്ററിൽ SELECT ക്വറി പ്രവർത്തിപ്പിച്ച് പ്രായം 40-ൽ താഴെയുള്ള ഡോക്യുമെന്റുകൾ കണ്ടെത്തൽ](../../../../translated_images/cosmosdb-emulator-persons-query.6905ebb497e3cd047cd96e55a0a03f69ce1b91b2b3d8c147e617b746b22b7e33.ml.png)
ക്വറി രണ്ട് ഡോക്യുമെന്റുകൾ തിരികെ നൽകുന്നു, ഓരോ ഡോക്യുമെന്റിന്റെയും പ്രായം 40-ൽ താഴെയാണ്.
#### JSONയു ഡോക്യുമെന്റുകളും
നിങ്ങൾക്ക് ജാവാസ്ക്രിപ്റ്റ് ഒബ്ജക്റ്റ് നോട്ടേഷൻ (JSON) പരിചിതമാണെങ്കിൽ, ഡോക്യുമെന്റുകൾ JSON പോലെയാണ് കാണുന്നത്. ഈ ഡയറക്ടറിയിൽ `PersonsData.json` ഫയൽ ഉണ്ട്, ഇത് നിങ്ങൾ എമുലേറ്ററിലെ Persons കണ്ടെയ്‌നറിലേക്ക് `Upload Item` ബട്ടൺ വഴി അപ്‌ലോഡ് ചെയ്യാം.
പല സാഹചര്യങ്ങളിലും JSON ഡാറ്റ തിരികെ നൽകുന്ന APIകൾ ഡോക്യുമെന്റ് ഡാറ്റാബേസുകളിൽ നേരിട്ട് മാറ്റി സംഭരിക്കാം. താഴെ മറ്റൊരു ഡോക്യുമെന്റ് കാണിക്കുന്നു, ഇത് മൈക്രോസോഫ്റ്റ് ട്വിറ്റർ അക്കൗണ്ടിൽ നിന്നുള്ള ട്വീറ്റുകളാണ്, Twitter API ഉപയോഗിച്ച് ലഭിച്ച് പിന്നീട് Cosmos DB-യിൽ ചേർത്തത്.
```json
{
"created_at": "2021-08-31T19:03:01.000Z",
"id": "1432780985872142341",
"text": "Blank slate. Like this tweet if youve ever painted in Microsoft Paint before. https://t.co/cFeEs8eOPK",
"_rid": "dhAmAIUsA4oHAAAAAAAAAA==",
"_self": "dbs/dhAmAA==/colls/dhAmAIUsA4o=/docs/dhAmAIUsA4oHAAAAAAAAAA==/",
"_etag": "\"00000000-0000-0000-9f84-a0958ad901d7\"",
"_attachments": "attachments/",
"_ts": 1630537000
```
ഈ ഡോക്യുമെന്റിലെ പ്രധാന ഫീൽഡുകൾ: `created_at`, `id`, `text`.
## 🚀 ചലഞ്ച്
SampleDB ഡാറ്റാബേസിലേക്ക് നിങ്ങൾക്ക് അപ്‌ലോഡ് ചെയ്യാവുന്ന `TwitterData.json` ഫയൽ ഉണ്ട്. ഇത് വേർതിരിച്ചിട്ടുള്ള ഒരു കണ്ടെയ്‌നറിലേക്ക് ചേർക്കാൻ ശുപാർശ ചെയ്യുന്നു. ഇത് ചെയ്യാൻ:
1. മുകളിൽ വലത്തുവശം പുതിയ കണ്ടെയ്‌നർ ബട്ടൺ ക്ലിക്കുചെയ്യുക
1. നിലവിലുള്ള ഡാറ്റാബേസ് (SampleDB) തിരഞ്ഞെടുക്കുക, കണ്ടെയ്‌നറിന് ഒരു ഐഡി നൽകുക
1. പാർട്ടിഷൻ കീ `/id` ആയി സജ്ജീകരിക്കുക
1. OK ക്ലിക്കുചെയ്യുക (ഈ കാഴ്ചയിൽ ബാക്കി വിവരങ്ങൾ അവഗണിക്കാം, ഇത് നിങ്ങളുടെ മെഷീനിൽ ലൊക്കലായി പ്രവർത്തിക്കുന്ന ചെറിയ ഡാറ്റാസെറ്റ് ആണ്)
1. പുതിയ കണ്ടെയ്‌നർ തുറന്ന് `Upload Item` ബട്ടൺ ഉപയോഗിച്ച് Twitter Data ഫയൽ അപ്‌ലോഡ് ചെയ്യുക
ടെക്സ്റ്റ് ഫീൽഡിൽ Microsoft ഉള്ള ഡോക്യുമെന്റുകൾ കണ്ടെത്താൻ ചില SELECT ക്വറികൾ പ്രവർത്തിപ്പിക്കാൻ ശ്രമിക്കുക. സൂചന: [LIKE കീവേഡ്](https://docs.microsoft.com/en-us/azure/cosmos-db/sql/sql-query-keywords#using-like-with-the--wildcard-character) ഉപയോഗിക്കാൻ ശ്രമിക്കുക.
## [പോസ്റ്റ്-ലെക്ചർ ക്വിസ്](https://ff-quizzes.netlify.app/en/ds/quiz/11)
## അവലോകനം & സ്വയം പഠനം
- ഈ സ്പ്രെഡ്‌ഷീറ്റിൽ ഈ പാഠം ഉൾക്കൊള്ളാത്ത ചില അധിക ഫോർമാറ്റിംഗുകളും ഫീച്ചറുകളും ഉണ്ട്. കൂടുതൽ അറിയാൻ മൈക്രോസോഫ്റ്റിന്റെ [വ്യാപകമായ ഡോക്യുമെന്റേഷൻ, വീഡിയോകൾ](https://support.microsoft.com/excel) കാണുക.
- വ്യത്യസ്ത തരം നോൺ-റിലേഷണൽ ഡാറ്റയുടെ സവിശേഷതകൾ വിശദീകരിക്കുന്ന ആർക്കിടെക്ചറൽ ഡോക്യുമെന്റേഷൻ: [Non-relational Data and NoSQL](https://docs.microsoft.com/en-us/azure/architecture/data-guide/big-data/non-relational-data)
- Cosmos DB ഒരു ക്ലൗഡ് അടിസ്ഥാനമാക്കിയ നോൺ-റിലേഷണൽ ഡാറ്റാബേസാണ്, ഈ പാഠത്തിൽ പരാമർശിച്ച NoSQL തരം ഡാറ്റയും സംഭരിക്കാം. ഈ തരം ഡാറ്റയെക്കുറിച്ച് കൂടുതൽ അറിയാൻ [Cosmos DB Microsoft Learn Module](https://docs.microsoft.com/en-us/learn/paths/work-with-nosql-data-in-azure-cosmos-db/) കാണുക.
## അസൈൻമെന്റ്
[Soda Profits](assignment.md)
---
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
**അസൂയാ**:
ഈ രേഖ AI വിവർത്തന സേവനം [Co-op Translator](https://github.com/Azure/co-op-translator) ഉപയോഗിച്ച് വിവർത്തനം ചെയ്തതാണ്. നാം കൃത്യതയ്ക്ക് ശ്രമിച്ചിട്ടുണ്ടെങ്കിലും, സ്വയം പ്രവർത്തിക്കുന്ന വിവർത്തനങ്ങളിൽ പിശകുകൾ അല്ലെങ്കിൽ തെറ്റുകൾ ഉണ്ടാകാമെന്ന് ദയവായി ശ്രദ്ധിക്കുക. അതിന്റെ മാതൃഭാഷയിലുള്ള യഥാർത്ഥ രേഖയാണ് പ്രാമാണികമായ ഉറവിടം എന്ന് പരിഗണിക്കേണ്ടതാണ്. നിർണായകമായ വിവരങ്ങൾക്ക്, പ്രൊഫഷണൽ മനുഷ്യ വിവർത്തനം ശുപാർശ ചെയ്യപ്പെടുന്നു. ഈ വിവർത്തനത്തിന്റെ ഉപയോഗത്തിൽ നിന്നുണ്ടാകുന്ന ഏതെങ്കിലും തെറ്റിദ്ധാരണകൾക്കോ തെറ്റായ വ്യാഖ്യാനങ്ങൾക്കോ ഞങ്ങൾ ഉത്തരവാദികളല്ല.
<!-- CO-OP TRANSLATOR DISCLAIMER END -->

@ -0,0 +1,35 @@
<!--
CO_OP_TRANSLATOR_METADATA:
{
"original_hash": "f824bfdb8b12d33293913f76f5c787c5",
"translation_date": "2025-12-19T15:40:57+00:00",
"source_file": "2-Working-With-Data/06-non-relational/assignment.md",
"language_code": "ml"
}
-->
# സോഡ ലാഭം
## നിർദ്ദേശങ്ങൾ
[Coca Cola Co സ്പ്രെഡ്‌ഷീറ്റ്](../../../../2-Working-With-Data/06-non-relational/CocaColaCo.xlsx) ചില കണക്കുകൾ നഷ്ടപ്പെട്ടിരിക്കുന്നു. നിങ്ങളുടെ ജോലി:
1. FY '15, '16, '17, '18 ന്റെ മൊത്തം ലാഭം കണക്കാക്കുക
- മൊത്തം ലാഭം = നെറ്റ് ഓപ്പറേറ്റിംഗ് വരുമാനം - വസ്തുക്കളുടെ വില
1. എല്ലാ മൊത്തം ലാഭങ്ങളുടെ ശരാശരി കണക്കാക്കുക. ഇത് ഒരു ഫംഗ്ഷൻ ഉപയോഗിച്ച് ചെയ്യാൻ ശ്രമിക്കുക.
- ശരാശരി = മൊത്തം ലാഭങ്ങളുടെ മൊത്തം ഫിസ്കൽ വർഷങ്ങളുടെ എണ്ണം (10) കൊണ്ട് വിഭജിക്കുക
- [AVERAGE ഫംഗ്ഷൻ](https://support.microsoft.com/en-us/office/average-function-047bac88-d466-426c-a32b-8f33eb960cf6) സംബന്ധിച്ച ഡോക്യുമെന്റേഷൻ
1. ഇത് ഒരു എക്സൽ ഫയലാണ്, പക്ഷേ ഇത് ഏതെങ്കിലും സ്പ്രെഡ്‌ഷീറ്റ് പ്ലാറ്റ്‌ഫോമിൽ എഡിറ്റബിൾ ആയിരിക്കണം
[ഡാറ്റാ സ്രോതസ്സ് ക്രെഡിറ്റ് Yiyi Wang](https://www.kaggle.com/yiyiwang0826/cocacola-excel)
## റൂബ്രിക്
ഉദാഹരണമായ | മതിയായ | മെച്ചപ്പെടുത്തേണ്ടത്
--- | --- | -- |
---
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
**അസൂയാ**:
ഈ രേഖ AI വിവർത്തന സേവനം [Co-op Translator](https://github.com/Azure/co-op-translator) ഉപയോഗിച്ച് വിവർത്തനം ചെയ്തതാണ്. നാം കൃത്യതയ്ക്ക് ശ്രമിച്ചിട്ടുണ്ടെങ്കിലും, സ്വയം പ്രവർത്തിക്കുന്ന വിവർത്തനങ്ങളിൽ പിശകുകൾ അല്ലെങ്കിൽ തെറ്റുകൾ ഉണ്ടാകാമെന്ന് ദയവായി ശ്രദ്ധിക്കുക. അതിന്റെ മാതൃഭാഷയിലുള്ള യഥാർത്ഥ രേഖ പ്രാമാണികമായ ഉറവിടമായി കണക്കാക്കണം. നിർണായക വിവരങ്ങൾക്ക്, പ്രൊഫഷണൽ മനുഷ്യ വിവർത്തനം ശുപാർശ ചെയ്യപ്പെടുന്നു. ഈ വിവർത്തനം ഉപയോഗിക്കുന്നതിൽ നിന്നുണ്ടാകുന്ന ഏതെങ്കിലും തെറ്റിദ്ധാരണകൾക്കോ തെറ്റായ വ്യാഖ്യാനങ്ങൾക്കോ ഞങ്ങൾ ഉത്തരവാദികളല്ല.
<!-- CO-OP TRANSLATOR DISCLAIMER END -->

File diff suppressed because one or more lines are too long

@ -0,0 +1,297 @@
<!--
CO_OP_TRANSLATOR_METADATA:
{
"original_hash": "7bfec050f4717dcc2dfd028aca9d21f3",
"translation_date": "2025-12-19T15:32:07+00:00",
"source_file": "2-Working-With-Data/07-python/README.md",
"language_code": "ml"
}
-->
# ഡാറ്റയുമായി പ്രവർത്തിക്കൽ: പൈത്തൺയും പാൻഡാസ് ലൈബ്രറിയും
| ![ Sketchnote by [(@sketchthedocs)](https://sketchthedocs.dev) ](../../sketchnotes/07-WorkWithPython.png) |
| :-------------------------------------------------------------------------------------------------------: |
| Python ഉപയോഗിച്ച് പ്രവർത്തിക്കൽ - _Sketchnote by [@nitya](https://twitter.com/nitya)_ |
[![Intro Video](../../../../translated_images/video-ds-python.245247dc811db8e4d5ac420246de8a118c63fd28f6a56578d08b630ae549f260.ml.png)](https://youtu.be/dZjWOGbsN4Y)
ഡാറ്റാബേസുകൾ ഡാറ്റ സംഭരിക്കാനും ക്വറി ഭാഷകൾ ഉപയോഗിച്ച് അവയെ ക്വറി ചെയ്യാനും വളരെ കാര്യക്ഷമമായ മാർഗങ്ങൾ നൽകുമ്പോഴും, ഡാറ്റ പ്രോസസ്സിംഗിന്റെ ഏറ്റവും ലവച്ഛമായ മാർഗം ഡാറ്റ കൈകാര്യം ചെയ്യാൻ നിങ്ങളുടെ സ്വന്തം പ്രോഗ്രാം എഴുതുകയാണ്. പലപ്പോഴും, ഡാറ്റാബേസ് ക്വറി ചെയ്യുന്നത് കൂടുതൽ ഫലപ്രദമായ മാർഗമായിരിക്കും. എന്നാൽ, കൂടുതൽ സങ്കീർണ്ണമായ ഡാറ്റ പ്രോസസ്സിംഗ് ആവശ്യമായപ്പോൾ, അത് എളുപ്പത്തിൽ SQL ഉപയോഗിച്ച് ചെയ്യാനാകില്ല.
ഡാറ്റ പ്രോസസ്സിംഗ് ഏതെങ്കിലും പ്രോഗ്രാമിംഗ് ഭാഷയിൽ പ്രോഗ്രാം ചെയ്യാം, പക്ഷേ ഡാറ്റ കൈകാര്യം ചെയ്യുന്നതിൽ ഉയർന്ന തലത്തിലുള്ള ചില ഭാഷകൾ ഉണ്ട്. ഡാറ്റ സയന്റിസ്റ്റുകൾ സാധാരണയായി താഴെപ്പറയുന്ന ഭാഷകളിൽ ഒന്നിനെ മുൻഗണന നൽകുന്നു:
* **[Python](https://www.python.org/)**, ഒരു പൊതുവായ പ്രോഗ്രാമിംഗ് ഭാഷ, അതിന്റെ ലളിതത്വം കാരണം തുടക്കക്കാർക്ക് ഏറ്റവും മികച്ച ഓപ്ഷനുകളിൽ ഒന്നായി പരിഗണിക്കപ്പെടുന്നു. Python-ന് നിരവധി അധിക ലൈബ്രറികൾ ഉണ്ട്, ഉദാഹരണത്തിന് ZIP ആർക്കൈവ് നിന്ന് ഡാറ്റ എടുക്കൽ, അല്ലെങ്കിൽ ചിത്രം ഗ്രേസ്കെയിലിലേക്ക് മാറ്റൽ പോലുള്ള പ്രായോഗിക പ്രശ്നങ്ങൾ പരിഹരിക്കാൻ സഹായിക്കുന്നവ. ഡാറ്റ സയൻസിനൊപ്പം, Python വെബ് ഡെവലപ്പ്മെന്റിനും വ്യാപകമായി ഉപയോഗിക്കുന്നു.
* **[R](https://www.r-project.org/)**, പാരമ്പര്യമായ ഒരു ടൂൾബോക്സ്, സ്റ്റാറ്റിസ്റ്റിക്കൽ ഡാറ്റ പ്രോസസ്സിംഗിനായി വികസിപ്പിച്ചിരിക്കുന്നു. ഇതിൽ വലിയ ലൈബ്രറി സംഭരണം (CRAN) ഉണ്ട്, ഇത് ഡാറ്റ പ്രോസസ്സിംഗിന് നല്ലൊരു തിരഞ്ഞെടുപ്പാണ്. എന്നാൽ, R ഒരു പൊതുവായ പ്രോഗ്രാമിംഗ് ഭാഷയല്ല, ഡാറ്റ സയൻസ് മേഖലയ്ക്ക് പുറത്തു അപൂർവമായി മാത്രമേ ഉപയോഗിക്കപ്പെടൂ.
* **[Julia](https://julialang.org/)**, ഡാറ്റ സയൻസിനായി പ്രത്യേകമായി വികസിപ്പിച്ച മറ്റൊരു ഭാഷ. Python-നേക്കാൾ മികച്ച പ്രകടനം നൽകാൻ ഉദ്ദേശിച്ചിരിക്കുന്നു, ശാസ്ത്രീയ പരീക്ഷണങ്ങൾക്ക് മികച്ച ഉപകരണം.
ഈ പാഠത്തിൽ, നാം ലളിതമായ ഡാറ്റ പ്രോസസ്സിംഗിനായി Python ഉപയോഗിക്കുന്നതിൽ ശ്രദ്ധ കേന്ദ്രീകരിക്കും. ഭാഷയുടെ അടിസ്ഥാന പരിചയം ഉണ്ടെന്ന് നാം കരുതുന്നു. Python-ന്റെ കൂടുതൽ വിശദമായ പഠനത്തിന്, താഴെപ്പറയുന്ന സ്രോതസുകളിൽ ഒന്നിനെ കാണാം:
* [Learn Python in a Fun Way with Turtle Graphics and Fractals](https://github.com/shwars/pycourse) - GitHub-അധിഷ്ഠിത Python പ്രോഗ്രാമിംഗിന്റെ വേഗത്തിലുള്ള പരിചയക്കുറിപ്പ്
* [Take your First Steps with Python](https://docs.microsoft.com/en-us/learn/paths/python-first-steps/?WT.mc_id=academic-77958-bethanycheum) [Microsoft Learn](http://learn.microsoft.com/?WT.mc_id=academic-77958-bethanycheum) ലെ പഠന പാത
ഡാറ്റ പല രൂപങ്ങളിൽ വരാം. ഈ പാഠത്തിൽ, നാം മൂന്ന് രൂപത്തിലുള്ള ഡാറ്റ പരിഗണിക്കും - **ടാബുലർ ഡാറ്റ**, **ടെക്സ്റ്റ്** , **ചിത്രങ്ങൾ**.
നാം എല്ലാ ബന്ധപ്പെട്ട ലൈബ്രറികളുടെ പൂർണ്ണ അവലോകനം നൽകുന്നതിന് പകരം, ഡാറ്റ പ്രോസസ്സിംഗിന്റെ ചില ഉദാഹരണങ്ങളിൽ ശ്രദ്ധ കേന്ദ്രീകരിക്കും. ഇതിലൂടെ എന്ത് സാധ്യമാണ് എന്നതിന്റെ പ്രധാന ആശയം നിങ്ങൾക്ക് ലഭിക്കും, കൂടാതെ പ്രശ്നങ്ങൾ വന്നപ്പോൾ പരിഹാരങ്ങൾ എവിടെ കണ്ടെത്താമെന്ന് മനസ്സിലാക്കാൻ സഹായിക്കും.
> **ഏറ്റവും പ്രയോജനകരമായ ഉപദേശം**. നിങ്ങൾക്ക് അറിയാത്ത ഒരു ഡാറ്റ ഓപ്പറേഷൻ ചെയ്യേണ്ടിവന്നാൽ, അത് ഇന്റർനെറ്റിൽ തിരയാൻ ശ്രമിക്കുക. [Stackoverflow](https://stackoverflow.com/) സാധാരണയായി Python-ൽ പല സാധാരണ ജോലികൾക്കുള്ള നിരവധി പ്രയോജനകരമായ കോഡ് സാമ്പിളുകൾ അടങ്ങിയിരിക്കുന്നു.
## [പ്രീ-ലെക്ചർ ക്വിസ്](https://ff-quizzes.netlify.app/en/ds/quiz/12)
## ടാബുലർ ഡാറ്റയും ഡാറ്റാഫ്രെയിമുകളും
റിലേഷണൽ ഡാറ്റാബേസുകൾക്കുറിച്ച് സംസാരിക്കുമ്പോൾ നിങ്ങൾ ടാബുലർ ഡാറ്റ നേരത്തെ കണ്ടിട്ടുണ്ട്. നിങ്ങൾക്ക് വലിയ ഡാറ്റ ഉണ്ടെങ്കിൽ, അത് പല വ്യത്യസ്ത ബന്ധമുള്ള പട്ടികകളിൽ ഉൾക്കൊള്ളുന്നുവെങ്കിൽ, അതുമായി പ്രവർത്തിക്കാൻ SQL ഉപയോഗിക്കുന്നത് തീർച്ചയായും ഉചിതമാണ്. എന്നാൽ, പലപ്പോഴും നമുക്ക് ഒരു ഡാറ്റ പട്ടിക ഉണ്ടാകുമ്പോൾ, ആ ഡാറ്റയെക്കുറിച്ച് ചില **അർത്ഥം** അല്ലെങ്കിൽ **അവബോധം** നേടേണ്ടതുണ്ടാകാം, ഉദാഹരണത്തിന് വിതരണവും മൂല്യങ്ങൾ തമ്മിലുള്ള സഹബന്ധവും. ഡാറ്റ സയൻസിൽ, നാം പലപ്പോഴും മൗലിക ഡാറ്റയിൽ ചില പരിവർത്തനങ്ങൾ നടത്തേണ്ടതുണ്ടാകുന്നു, തുടർന്ന് ദൃശ്യവൽക്കരണം നടത്തുന്നു. ഈ രണ്ട് ഘട്ടങ്ങളും Python ഉപയോഗിച്ച് എളുപ്പത്തിൽ ചെയ്യാം.
Python-ൽ ടാബുലർ ഡാറ്റ കൈകാര്യം ചെയ്യാൻ സഹായിക്കുന്ന ഏറ്റവും പ്രയോജനകരമായ രണ്ട് ലൈബ്രറികൾ ഉണ്ട്:
* **[Pandas](https://pandas.pydata.org/)**, **ഡാറ്റാഫ്രെയിമുകൾ** എന്നറിയപ്പെടുന്ന, റിലേഷണൽ പട്ടികകളോട് സമാനമായ ഘടനകളെ കൈകാര്യം ചെയ്യാൻ അനുവദിക്കുന്നു. നിങ്ങൾക്ക് നാമകരിച്ച കോളങ്ങൾ ഉണ്ടാകാം, കൂടാതെ വരി, കോളം, ഡാറ്റാഫ്രെയിമുകൾ എന്നിവയിൽ വ്യത്യസ്ത പ്രവർത്തനങ്ങൾ നടത്താം.
* **[Numpy](https://numpy.org/)**, **ടെൻസറുകൾ** എന്നറിയപ്പെടുന്ന, അഥവാ ബഹുമാനദണ്ഡ **അറേകൾ** കൈകാര്യം ചെയ്യാനുള്ള ലൈബ്രറി. അറേയിൽ ഒരേ തരം മൂല്യങ്ങൾ ഉണ്ടാകണം, ഇത് ഡാറ്റാഫ്രെയിമിനേക്കാൾ ലളിതമാണ്, പക്ഷേ കൂടുതൽ ഗണിത പ്രവർത്തനങ്ങൾ നൽകുന്നു, കൂടാതെ കുറവ് ഓവർഹെഡ് സൃഷ്ടിക്കുന്നു.
കൂടാതെ നിങ്ങൾ അറിയേണ്ട ചില മറ്റ് ലൈബ്രറികളും ഉണ്ട്:
* **[Matplotlib](https://matplotlib.org/)**, ഡാറ്റ ദൃശ്യവൽക്കരണത്തിനും ഗ്രാഫുകൾ വരയ്ക്കുന്നതിനും ഉപയോഗിക്കുന്ന ലൈബ്രറി
* **[SciPy](https://www.scipy.org/)**, ചില അധിക ശാസ്ത്രീയ ഫംഗ്ഷനുകൾ ഉള്ള ലൈബ്രറി. നാം ഇതിനകം പ്രൊബബിലിറ്റി, സ്റ്റാറ്റിസ്റ്റിക്സ് സംബന്ധിച്ച് സംസാരിക്കുമ്പോൾ ഈ ലൈബ്രറി കണ്ടിട്ടുണ്ട്
Python പ്രോഗ്രാമിന്റെ തുടക്കത്തിൽ ഈ ലൈബ്രറികൾ ഇമ്പോർട്ട് ചെയ്യാൻ സാധാരണയായി ഉപയോഗിക്കുന്ന കോഡ് ഇതാണ്:
```python
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from scipy import ... # നിങ്ങൾക്ക് ആവശ്യമായ കൃത്യമായ സബ്-പാക്കേജുകൾ വ്യക്തമാക്കേണ്ടതാണ്
```
Pandas ചില അടിസ്ഥാന ആശയങ്ങൾ ചുറ്റിപ്പറ്റിയാണ്.
### സീരീസ്
**സീരീസ്** മൂല്യങ്ങളുടെ ഒരു ക്രമമാണ്, ലിസ്റ്റ് അല്ലെങ്കിൽ numpy അറേ പോലെയാണ്. പ്രധാന വ്യത്യാസം സീരീസിന് ഒരു **ഇൻഡക്സ്** ഉണ്ടാകുന്നതാണ്, സീരീസുകളിൽ പ്രവർത്തിക്കുമ്പോൾ (ഉദാ., കൂട്ടിച്ചേർക്കുമ്പോൾ) ഇൻഡക്സ് പരിഗണിക്കപ്പെടുന്നു. ഇൻഡക്സ് ലിസ്റ്റ് അല്ലെങ്കിൽ അറേയിൽ നിന്നുള്ള സീരീസ് സൃഷ്ടിക്കുമ്പോൾ ഡിഫോൾട്ട് ഉപയോഗിക്കുന്ന പൂർണ്ണസംഖ്യ വരി നമ്പർ പോലെയോ, അല്ലെങ്കിൽ തീയതി ഇടവേള പോലെയുള്ള സങ്കീർണ്ണ ഘടനയുള്ളതായിരിക്കാം.
> **കുറിപ്പ്**: സഹായി നോട്ട്‌ബുക്കിൽ [`notebook.ipynb`](notebook.ipynb) ചില പരിചയപരമായ Pandas കോഡ് ഉണ്ട്. ഇവിടെ നാം ചില ഉദാഹരണങ്ങൾ മാത്രം ചുരുക്കി കാണിക്കുന്നു, നിങ്ങൾക്ക് പൂർണ്ണ നോട്ട്‌ബുക്ക് പരിശോധിക്കാം.
ഒരു ഉദാഹരണം പരിഗണിക്കാം: നമ്മുടെ ഐസ്‌ക്രീം കടയുടെ വിൽപ്പന വിശകലനം ചെയ്യണം. ഒരു സമയപരിധിക്കായി വിൽപ്പന സംഖ്യകളുടെ സീരീസ് (പ്രതിദിനം വിറ്റ വസ്തുക്കളുടെ എണ്ണം) സൃഷ്ടിക്കാം:
```python
start_date = "Jan 1, 2020"
end_date = "Mar 31, 2020"
idx = pd.date_range(start_date,end_date)
print(f"Length of index is {len(idx)}")
items_sold = pd.Series(np.random.randint(25,50,size=len(idx)),index=idx)
items_sold.plot()
```
![Time Series Plot](../../../../translated_images/timeseries-1.80de678ab1cf727e50e00bcf24009fa2b0a8b90ebc43e34b99a345227d28e467.ml.png)
ഇപ്പോൾ ഓരോ ആഴ്ചയും നാം സുഹൃത്തുക്കൾക്കായി പാർട്ടി സംഘടിപ്പിക്കുന്നു, പാർട്ടിക്കായി അധികം 10 പാക്ക് ഐസ്‌ക്രീം കൊണ്ടുവരുന്നു എന്ന് കരുതുക. ആ ആഴ്ചയുടെ ഇൻഡക്സ് ഉപയോഗിച്ച് മറ്റൊരു സീരീസ് സൃഷ്ടിക്കാം:
```python
additional_items = pd.Series(10,index=pd.date_range(start_date,end_date,freq="W"))
```
രണ്ട് സീരീസുകളും ചേർത്താൽ, മൊത്തം എണ്ണം കിട്ടും:
```python
total_items = items_sold.add(additional_items,fill_value=0)
total_items.plot()
```
![Time Series Plot](../../../../translated_images/timeseries-2.aae51d575c55181ceda81ade8c546a2fc2024f9136934386d57b8a189d7570ff.ml.png)
> **കുറിപ്പ്**: നാം ലളിതമായ `total_items+additional_items` സിന്താക്സ് ഉപയോഗിക്കുന്നില്ല. അതുപയോഗിച്ചാൽ, ഫലസീരീസിൽ പല `NaN` (*Not a Number*) മൂല്യങ്ങളും ഉണ്ടാകുമായിരിക്കും. കാരണം `additional_items` സീരീസിൽ ചില ഇൻഡക്സ് പോയിന്റുകൾക്ക് മൂല്യങ്ങൾ ഇല്ല, `NaN` യെ ഏതെങ്കിലും മൂല്യത്തിലേക്ക് കൂട്ടിച്ചേർക്കുമ്പോൾ ഫലം `NaN` ആകുന്നു. അതിനാൽ കൂട്ടിച്ചേർക്കുമ്പോൾ `fill_value` പാരാമീറ്റർ നിർദ്ദേശിക്കേണ്ടതാണ്.
ടൈം സീരീസുകളുമായി, നാം സീരീസ് വ്യത്യസ്ത സമയ ഇടവേളകളിൽ **റിസാമ്പിൾ** ചെയ്യാം. ഉദാഹരണത്തിന്, മാസത്തിൽ ശരാശരി വിൽപ്പന കണക്കാക്കണം എങ്കിൽ താഴെ കൊടുത്ത കോഡ് ഉപയോഗിക്കാം:
```python
monthly = total_items.resample("1M").mean()
ax = monthly.plot(kind='bar')
```
![Monthly Time Series Averages](../../../../translated_images/timeseries-3.f3147cbc8c624881008564bc0b5d9fcc15e7374d339da91766bd0e1c6bd9e3af.ml.png)
### ഡാറ്റാഫ്രെയിം
ഡാറ്റാഫ്രെയിം അടിസ്ഥാനപരമായി ഒരേ ഇൻഡക്സ് ഉള്ള സീരീസുകളുടെ സമാഹാരമാണ്. നാം പല സീരീസുകളും ചേർത്ത് ഒരു ഡാറ്റാഫ്രെയിം സൃഷ്ടിക്കാം:
```python
a = pd.Series(range(1,10))
b = pd.Series(["I","like","to","play","games","and","will","not","change"],index=range(0,9))
df = pd.DataFrame([a,b])
```
ഇത് താഴെപ്പറയുന്ന പോലെ ഒരു ഹോരിസോണ്ടൽ പട്ടിക സൃഷ്ടിക്കും:
| | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 |
| --- | --- | ---- | --- | --- | ------ | --- | ------ | ---- | ---- |
| 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 |
| 1 | I | like | to | use | Python | and | Pandas | very | much |
നാം സീരീസുകൾ കോളങ്ങളായി ഉപയോഗിച്ച്, നാമകരിച്ച കോളം പേരുകൾ ഡിക്ഷണറി ഉപയോഗിച്ച് നിർദ്ദേശിക്കാം:
```python
df = pd.DataFrame({ 'A' : a, 'B' : b })
```
ഇത് താഴെപ്പറയുന്ന പട്ടിക നൽകും:
| | A | B |
| --- | --- | ------ |
| 0 | 1 | I |
| 1 | 2 | like |
| 2 | 3 | to |
| 3 | 4 | use |
| 4 | 5 | Python |
| 5 | 6 | and |
| 6 | 7 | Pandas |
| 7 | 8 | very |
| 8 | 9 | much |
**കുറിപ്പ്**: നാം മുമ്പത്തെ പട്ടിക ട്രാൻസ്പോസ് ചെയ്ത് (അഥവാ `.T` ഉപയോഗിച്ച്) ഈ പട്ടിക രൂപം ലഭിക്കാമെന്ന് ശ്രദ്ധിക്കുക, ഉദാ.
```python
df = pd.DataFrame([a,b]).T..rename(columns={ 0 : 'A', 1 : 'B' })
```
ഇവിടെ `.T` ഡാറ്റാഫ്രെയിമിന്റെ ട്രാൻസ്പോസിംഗ് (വരി, കോളങ്ങൾ മാറ്റൽ) പ്രവർത്തനമാണ്, `rename` പ്രവർത്തനം കോളം പേരുകൾ മുൻപത്തെ ഉദാഹരണത്തിന് അനുയോജ്യമായി മാറ്റാൻ സഹായിക്കുന്നു.
ഡാറ്റാഫ്രെയിമുകളിൽ നാം ചെയ്യാവുന്ന ചില പ്രധാന പ്രവർത്തനങ്ങൾ:
**കോളം തിരഞ്ഞെടുപ്പ്**. `df['A']` എഴുതിയാൽ വ്യക്തിഗത കോളം തിരഞ്ഞെടുക്കാം - ഇത് ഒരു സീരീസ് നൽകും. `df[['B','A']]` എഴുതിയാൽ കോളങ്ങളുടെ ഒരു ഉപസമൂഹം മറ്റൊരു ഡാറ്റാഫ്രെയിമിൽ തിരഞ്ഞെടുക്കാം.
**നിബന്ധനകൾ പ്രകാരം** ചില വരികൾ മാത്രം ഫിൽട്ടർ ചെയ്യൽ. ഉദാഹരണത്തിന്, `A` കോളത്തിലെ മൂല്യം 5-ൽ കൂടുതലുള്ള വരികൾ മാത്രം വേണമെങ്കിൽ, `df[df['A']>5]` എഴുതാം.
> **കുറിപ്പ്**: ഫിൽട്ടറിംഗ് പ്രവർത്തിക്കുന്നത് ഇങ്ങനെ ആണ്. `df['A']<5` എന്ന പ്രകടനം ഒരു ബൂളിയൻ സീരീസ് നൽകുന്നു, ഇത് `df['A']` യിലെ ഓരോ മൂല്യത്തിനും `True` അല്ലെങ്കിൽ `False` ആണ്. ബൂളിയൻ സീരീസ് ഇൻഡക്സ് ആയി ഉപയോഗിക്കുമ്പോൾ, ഡാറ്റാഫ്രെയിമിലെ വരികളുടെ ഉപസമൂഹം തിരികെ നൽകുന്നു. അതിനാൽ, സാധാരണ Python ബൂളിയൻ പ്രകടനം ഉപയോഗിക്കാനാകില്ല, ഉദാ., `df[df['A']>5 and df['A']<7]` തെറ്റാണ്. പകരം, ബൂളിയൻ സീരീസുകളിൽ പ്രത്യേക `&` ഓപ്പറേഷൻ ഉപയോഗിച്ച്, `df[(df['A']>5) & (df['A']<7)]` എഴുതണം (*ബ്രാക്കറ്റുകൾ നിർണായകമാണ്*).
**പുതിയ കണക്കാക്കാവുന്ന കോളങ്ങൾ സൃഷ്ടിക്കൽ**. നാം ഇങ്ങനെ ലളിതമായ പ്രകടനം ഉപയോഗിച്ച് ഡാറ്റാഫ്രെയിമിന് പുതിയ കണക്കാക്കാവുന്ന കോളങ്ങൾ സൃഷ്ടിക്കാം:
```python
df['DivA'] = df['A']-df['A'].mean()
```
ഈ ഉദാഹരണം `A`-യുടെ ശരാശരിയിൽ നിന്നുള്ള വ്യത്യാസം കണക്കാക്കുന്നു. ഇവിടെ സംഭവിക്കുന്നത് സീരീസ് കണക്കാക്കി, അത് ഇടത് വശത്ത് നിയോഗിച്ച് മറ്റൊരു കോളം സൃഷ്ടിക്കുന്നതാണ്. അതിനാൽ സീരീസിനോട് പൊരുത്തപ്പെടാത്ത പ്രവർത്തനങ്ങൾ ഉപയോഗിക്കാനാകില്ല, ഉദാഹരണത്തിന് താഴെ കൊടുത്ത കോഡ് തെറ്റാണ്:
```python
# തെറ്റായ കോഡ് -> df['ADescr'] = "Low" if df['A'] < 5 else "Hi"
df['LenB'] = len(df['B']) # <-
```
ഇതിൽ, സിന്താക്റ്റിക് ആയി ശരിയാണെങ്കിലും, തെറ്റായ ഫലം നൽകുന്നു, കാരണം `B` സീരീസിന്റെ നീളം എല്ലാ മൂല്യങ്ങൾക്കും നിയോഗിക്കുന്നു, ഓരോ മൂല്യത്തിന്റെ നീളം അല്ല.
സങ്കീർണ്ണ പ്രകടനങ്ങൾ കണക്കാക്കേണ്ടതുണ്ടെങ്കിൽ, `apply` ഫംഗ്ഷൻ ഉപയോഗിക്കാം. അവസാന ഉദാഹരണം ഇങ്ങനെ എഴുതാം:
```python
df['LenB'] = df['B'].apply(lambda x : len(x))
# അല്ലെങ്കിൽ
df['LenB'] = df['B'].apply(len)
```
മുകളിൽ പറഞ്ഞ പ്രവർത്തനങ്ങൾ കഴിഞ്ഞ്, നമുക്ക് താഴെപ്പറയുന്ന ഡാറ്റാഫ്രെയിം ലഭിക്കും:
| | A | B | DivA | LenB |
| --- | --- | ------ | ---- | ---- |
| 0 | 1 | I | -4.0 | 1 |
| 1 | 2 | like | -3.0 | 4 |
| 2 | 3 | to | -2.0 | 2 |
| 3 | 4 | use | -1.0 | 3 |
| 4 | 5 | Python | 0.0 | 6 |
| 5 | 6 | and | 1.0 | 3 |
| 6 | 7 | Pandas | 2.0 | 6 |
| 7 | 8 | very | 3.0 | 4 |
| 8 | 9 | much | 4.0 | 4 |
**സംഖ്യകൾ അടിസ്ഥാനമാക്കി വരികൾ തിരഞ്ഞെടുക്കൽ** `iloc` ഘടന ഉപയോഗിച്ച് ചെയ്യാം. ഉദാഹരണത്തിന്, ഡാറ്റാഫ്രെയിമിൽ നിന്ന് ആദ്യ 5 വരികൾ തിരഞ്ഞെടുക്കാൻ:
```python
df.iloc[:5]
```
**ഗ്രൂപ്പിംഗ്** Excel-ലെ *പിവോട്ട് ടേബിളുകൾ* പോലുള്ള ഫലം ലഭിക്കാൻ സാധാരണ ഉപയോഗിക്കുന്നു. ഉദാഹരണത്തിന്, ഓരോ `LenB` മൂല്യത്തിനും `A`-യുടെ ശരാശരി കണക്കാക്കണം എങ്കിൽ, `LenB` പ്രകാരം ഗ്രൂപ്പ് ചെയ്ത് `mean` വിളിക്കാം:
```python
df.groupby(by='LenB')[['A','DivA']].mean()
```
`mean`-ഉം ഗ്രൂപ്പിലെ മൂല്യങ്ങളുടെ എണ്ണം കണക്കാക്കേണ്ടതുണ്ടെങ്കിൽ, കൂടുതൽ സങ്കീർണ്ണമായ `aggregate` ഫംഗ്ഷൻ ഉപയോഗിക്കാം:
```python
df.groupby(by='LenB') \
.aggregate({ 'DivA' : len, 'A' : lambda x: x.mean() }) \
.rename(columns={ 'DivA' : 'Count', 'A' : 'Mean'})
```
ഇത് താഴെപ്പറയുന്ന പട്ടിക നൽകും:
| LenB | Count | Mean |
| ---- | ----- | -------- |
| 1 | 1 | 1.000000 |
| 2 | 1 | 3.000000 |
| 3 | 2 | 5.000000 |
| 4 | 3 | 6.333333 |
| 6 | 2 | 6.000000 |
### ഡാറ്റ നേടൽ
നാം Python ഒബ്ജക്റ്റുകളിൽ നിന്ന് Series, DataFrames എളുപ്പത്തിൽ നിർമ്മിക്കാമെന്ന് കണ്ടു. എന്നാൽ, ഡാറ്റ സാധാരണയായി ഒരു ടെക്സ്റ്റ് ഫയലോ, Excel പട്ടികയോ ആയിരിക്കും. ഭാഗ്യവശാൽ, Pandas നമുക്ക് ഡിസ്‌കിൽ നിന്ന് ഡാറ്റ ലോഡ് ചെയ്യാനുള്ള ഒരു ലളിതമായ മാർഗം നൽകുന്നു. ഉദാഹരണത്തിന്, CSV ഫയൽ വായിക്കുന്നത് ഇത്ര എളുപ്പമാണ്:
```python
df = pd.read_csv('file.csv')
```
ഡാറ്റ ലോഡിംഗിന്റെ കൂടുതൽ ഉദാഹരണങ്ങൾ, പുറം വെബ് സൈറ്റുകളിൽ നിന്ന് ഡാറ്റ എടുക്കുന്നതും ഉൾപ്പെടെ, "ചലഞ്ച്" വിഭാഗത്തിൽ കാണാം.
### പ്രിന്റിംഗ് ആൻഡ് പ്ലോട്ടിംഗ്
ഒരു ഡാറ്റ സയന്റിസ്റ്റ് പലപ്പോഴും ഡാറ്റ എക്സ്പ്ലോർ ചെയ്യേണ്ടതുണ്ടാകുന്നു, അതിനാൽ അത് ദൃശ്യവൽക്കരിക്കാൻ കഴിയുന്നത് പ്രധാനമാണ്. DataFrame വലുതായിരിക്കുമ്പോൾ, പലപ്പോഴും നാം ശരിയായി പ്രവർത്തിക്കുന്നുണ്ടോ എന്ന് ഉറപ്പാക്കാൻ ആദ്യ കുറച്ച് വരികൾ മാത്രം പ്രിന്റ് ചെയ്യാൻ ആഗ്രഹിക്കുന്നു. ഇത് `df.head()` വിളിച്ച് ചെയ്യാം. നിങ്ങൾ Jupyter Notebook ൽ ഇത് റൺ ചെയ്താൽ, DataFrame ഒരു മനോഹരമായ പട്ടിക രൂപത്തിൽ പ്രിന്റ് ചെയ്യും.
നാം ചില കോളങ്ങൾ ദൃശ്യവൽക്കരിക്കാൻ `plot` ഫംഗ്ഷൻ ഉപയോഗിക്കുന്നതും കണ്ടു. `plot` പല ജോലികൾക്കും വളരെ ഉപകാരപ്രദമാണ്, കൂടാതെ `kind=` പാരാമീറ്റർ വഴി പല തരത്തിലുള്ള ഗ്രാഫുകൾ പിന്തുണയ്ക്കുന്നു, എന്നാൽ നിങ്ങൾക്ക് എപ്പോഴും കൂടുതൽ സങ്കീർണ്ണമായ ഒന്നും പ്ലോട്ട് ചെയ്യാൻ കച്ചവട `matplotlib` ലൈബ്രറി ഉപയോഗിക്കാം. ഡാറ്റ ദൃശ്യവൽക്കരണം വിശദമായി വേർതിരിച്ച കോഴ്‌സ് പാഠങ്ങളിൽ നാം പഠിക്കും.
ഈ അവലോകനം Pandas ന്റെ ഏറ്റവും പ്രധാനപ്പെട്ട ആശയങ്ങൾ ഉൾക്കൊള്ളുന്നു, എങ്കിലും ലൈബ്രറി വളരെ സമ്പന്നമാണ്, അതിൽ നിങ്ങൾ ചെയ്യാൻ കഴിയുന്ന കാര്യങ്ങൾക്ക് പരിധിയില്ല! ഇപ്പോൾ നാം ഈ അറിവ് പ്രത്യേക പ്രശ്നങ്ങൾ പരിഹരിക്കാൻ പ്രയോഗിക്കാം.
## 🚀 ചലഞ്ച് 1: COVID വ്യാപനം വിശകലനം
നാം ശ്രദ്ധിക്കാനിരിക്കുന്ന ആദ്യ പ്രശ്നം COVID-19 മഹാമാരിയുടെ വ്യാപനം മോഡലിംഗ് ആണ്. അതിനായി, വിവിധ രാജ്യങ്ങളിലെ ബാധിതരുടെ എണ്ണം സംബന്ധിച്ച ഡാറ്റ ഉപയോഗിക്കും, ഇത് [Center for Systems Science and Engineering](https://systems.jhu.edu/) (CSSE) [Johns Hopkins University](https://jhu.edu/) നൽകുന്നു. ഡാറ്റാസെറ്റ് [ഈ GitHub റിപോസിറ്ററിയിൽ](https://github.com/CSSEGISandData/COVID-19) ലഭ്യമാണ്.
ഡാറ്റ കൈകാര്യം ചെയ്യുന്നത് എങ്ങനെ എന്ന് കാണിക്കാൻ, നിങ്ങൾക്ക് [`notebook-covidspread.ipynb`](notebook-covidspread.ipynb) തുറന്ന് മുകളിൽ നിന്ന് താഴേക്ക് വായിക്കാൻ ഞങ്ങൾ ക്ഷണിക്കുന്നു. സെല്ലുകൾ പ്രവർത്തിപ്പിക്കാനും, അവസാനം നാം നിങ്ങൾക്കായി വെച്ച ചില ചലഞ്ചുകൾ ചെയ്യാനും കഴിയും.
![COVID Spread](../../../../translated_images/covidspread.f3d131c4f1d260ab0344d79bac0abe7924598dd754859b165955772e1bd5e8a2.ml.png)
> Jupyter Notebook ൽ കോഡ് എങ്ങനെ റൺ ചെയ്യാമെന്ന് അറിയില്ലെങ്കിൽ, [ഈ ലേഖനം](https://soshnikov.com/education/how-to-execute-notebooks-from-github/) കാണുക.
## അസംഘടിത ഡാറ്റയുമായി പ്രവർത്തിക്കൽ
ഡാറ്റ സാധാരണയായി പട്ടിക രൂപത്തിലാണ് ലഭിക്കുന്നത്, എന്നാൽ ചില സാഹചര്യങ്ങളിൽ കുറച്ച് കുറവുള്ള ഘടനയുള്ള ഡാറ്റ, ഉദാഹരണത്തിന്, ടെക്സ്റ്റ് അല്ലെങ്കിൽ ചിത്രങ്ങൾ, കൈകാര്യം ചെയ്യേണ്ടിവരും. ഈ സാഹചര്യത്തിൽ, മുകളിൽ കണ്ട ഡാറ്റ പ്രോസസ്സിംഗ് സാങ്കേതികവിദ്യകൾ പ്രയോഗിക്കാൻ, നാം somehow **ഘടനയുള്ള** ഡാറ്റ **എക്സ്ട്രാക്റ്റ്** ചെയ്യേണ്ടതുണ്ട്. ചില ഉദാഹരണങ്ങൾ:
* ടെക്സ്റ്റിൽ നിന്നുള്ള കീവേഡുകൾ എടുക്കുകയും ആ കീവേഡുകൾ എത്രത്തോളം പ്രത്യക്ഷപ്പെടുന്നു എന്ന് കാണുകയും ചെയ്യുക
* ചിത്രത്തിലെ വസ്തുക്കൾ സംബന്ധിച്ച വിവരങ്ങൾ എടുക്കാൻ ന്യൂറൽ നെറ്റ്വർക്കുകൾ ഉപയോഗിക്കുക
* വീഡിയോ ക്യാമറ ഫീഡിൽ ആളുകളുടെ വികാരങ്ങളെക്കുറിച്ചുള്ള വിവരങ്ങൾ നേടുക
## 🚀 ചലഞ്ച് 2: COVID പേപ്പറുകൾ വിശകലനം
ഈ ചലഞ്ചിൽ, COVID മഹാമാരിയുടെ വിഷയത്തിൽ ശാസ്ത്രീയ പേപ്പറുകൾ പ്രോസസ്സ് ചെയ്യുന്നതിൽ നാം തുടരും. COVID സംബന്ധിച്ച 7000-ലധികം പേപ്പറുകൾ (എഴുതിയ സമയത്ത്) ഉള്ള [CORD-19 Dataset](https://www.kaggle.com/allen-institute-for-ai/CORD-19-research-challenge) ഉണ്ട്, മെടാഡേറ്റയും ആബ്സ്ട്രാക്റ്റുകളും ഉൾപ്പെടെ (അവയിൽ പകുതിയിലധികത്തിനും പൂർണ്ണ ടെക്സ്റ്റും ലഭ്യമാണ്).
[Text Analytics for Health](https://docs.microsoft.com/azure/cognitive-services/text-analytics/how-tos/text-analytics-for-health/?WT.mc_id=academic-77958-bethanycheum) കോഗ്നിറ്റീവ് സർവീസ് ഉപയോഗിച്ച് ഈ ഡാറ്റാസെറ്റ് വിശകലനം ചെയ്യുന്ന ഒരു പൂർണ്ണ ഉദാഹരണം [ഈ ബ്ലോഗ് പോസ്റ്റിൽ](https://soshnikov.com/science/analyzing-medical-papers-with-azure-and-text-analytics-for-health/) വിശദീകരിച്ചിരിക്കുന്നു. നാം ഈ വിശകലനത്തിന്റെ ലളിതമായ പതിപ്പ് ചർച്ച ചെയ്യും.
> **കുറിപ്പ്**: ഈ റിപോസിറ്ററിയുടെ ഭാഗമായിട്ടുള്ള ഡാറ്റാസെറ്റ് നമുക്ക് നൽകുന്നില്ല. ആദ്യം [Kaggle](https://www.kaggle.com/allen-institute-for-ai/CORD-19-research-challenge) ൽ നിന്നുള്ള [`metadata.csv`](https://www.kaggle.com/allen-institute-for-ai/CORD-19-research-challenge?select=metadata.csv) ഫയൽ ഡൗൺലോഡ് ചെയ്യേണ്ടതുണ്ടാകും. Kaggle ൽ രജിസ്ട്രേഷൻ ആവശ്യമായിരിക്കാം. രജിസ്ട്രേഷൻ ഇല്ലാതെ [ഇവിടെ](https://ai2-semanticscholar-cord-19.s3-us-west-2.amazonaws.com/historical_releases.html) നിന്നും ഡാറ്റാസെറ്റ് ഡൗൺലോഡ് ചെയ്യാം, എന്നാൽ അത് മെടാഡേറ്റ ഫയലിനൊപ്പം എല്ലാ പൂർണ്ണ ടെക്സ്റ്റുകളും ഉൾക്കൊള്ളും.
[`notebook-papers.ipynb`](notebook-papers.ipynb) തുറന്ന് മുകളിൽ നിന്ന് താഴേക്ക് വായിക്കുക. സെല്ലുകൾ പ്രവർത്തിപ്പിക്കാനും, അവസാനം നാം നിങ്ങൾക്കായി വെച്ച ചില ചലഞ്ചുകൾ ചെയ്യാനും കഴിയും.
![Covid Medical Treatment](../../../../translated_images/covidtreat.b2ba59f57ca45fbcda36e0ddca3f8cfdddeeed6ca879ea7f866d93fa6ec65791.ml.png)
## ചിത്ര ഡാറ്റ പ്രോസസ്സിംഗ്
സമീപകാലത്ത്, ചിത്രങ്ങൾ മനസ്സിലാക്കാൻ സഹായിക്കുന്ന ശക്തമായ AI മോഡലുകൾ വികസിപ്പിച്ചിരിക്കുന്നു. മുൻകൂട്ടി പരിശീലിപ്പിച്ച ന്യൂറൽ നെറ്റ്വർക്കുകൾ അല്ലെങ്കിൽ ക്ലൗഡ് സർവീസുകൾ ഉപയോഗിച്ച് പല ജോലികളും പരിഹരിക്കാം. ചില ഉദാഹരണങ്ങൾ:
* **ചിത്ര വർഗ്ഗീകരണം**, ഇത് ചിത്രത്തെ മുൻകൂട്ടി നിർവചിച്ച ക്ലാസ്സുകളിൽ ഒന്നിലേക്കു വർഗ്ഗീകരിക്കാൻ സഹായിക്കും. [Custom Vision](https://azure.microsoft.com/services/cognitive-services/custom-vision-service/?WT.mc_id=academic-77958-bethanycheum) പോലുള്ള സർവീസുകൾ ഉപയോഗിച്ച് നിങ്ങൾക്ക് നിങ്ങളുടെ സ്വന്തം ചിത്ര വർഗ്ഗീകരണ മോഡലുകൾ എളുപ്പത്തിൽ പരിശീലിപ്പിക്കാം
* **വസ്തു കണ്ടെത്തൽ**, ചിത്രത്തിലെ വ്യത്യസ്ത വസ്തുക്കൾ കണ്ടെത്താൻ. [computer vision](https://azure.microsoft.com/services/cognitive-services/computer-vision/?WT.mc_id=academic-77958-bethanycheum) പോലുള്ള സർവീസുകൾ സാധാരണ വസ്തുക്കൾ കണ്ടെത്തും, കൂടാതെ നിങ്ങൾക്ക് [Custom Vision](https://azure.microsoft.com/services/cognitive-services/custom-vision-service/?WT.mc_id=academic-77958-bethanycheum) മോഡൽ പരിശീലിപ്പിച്ച് പ്രത്യേക വസ്തുക്കൾ കണ്ടെത്താം.
* **മുഖം കണ്ടെത്തൽ**, പ്രായം, ലിംഗം, വികാരങ്ങൾ ഉൾപ്പെടെ. ഇത് [Face API](https://azure.microsoft.com/services/cognitive-services/face/?WT.mc_id=academic-77958-bethanycheum) വഴി ചെയ്യാം.
ഈ ക്ലൗഡ് സർവീസുകൾ [Python SDKs](https://docs.microsoft.com/samples/azure-samples/cognitive-services-python-sdk-samples/cognitive-services-python-sdk-samples/?WT.mc_id=academic-77958-bethanycheum) ഉപയോഗിച്ച് വിളിക്കാം, അതിനാൽ നിങ്ങളുടെ ഡാറ്റ എക്സ്പ്ലോറേഷൻ പ്രവൃത്തി പ്രവാഹത്തിൽ എളുപ്പത്തിൽ ഉൾപ്പെടുത്താം.
ചിത്ര ഡാറ്റ സ്രോതസ്സുകളിൽ നിന്നുള്ള ഡാറ്റ എങ്ങനെ എക്സ്പ്ലോർ ചെയ്യാമെന്ന് ചില ഉദാഹരണങ്ങൾ:
* [How to Learn Data Science without Coding](https://soshnikov.com/azure/how-to-learn-data-science-without-coding/) എന്ന ബ്ലോഗ് പോസ്റ്റിൽ, നാം Instagram ഫോട്ടോകൾ പരിശോധിച്ച്, ആളുകൾ ഒരു ഫോട്ടോയ്ക്ക് കൂടുതൽ ലൈക്കുകൾ നൽകാൻ കാരണമായത് എന്താണെന്ന് മനസ്സിലാക്കാൻ ശ്രമിക്കുന്നു. ആദ്യം [computer vision](https://azure.microsoft.com/services/cognitive-services/computer-vision/?WT.mc_id=academic-77958-bethanycheum) ഉപയോഗിച്ച് ചിത്രങ്ങളിൽ നിന്ന് കൂടുതൽ വിവരങ്ങൾ എടുക്കുന്നു, പിന്നീട് [Azure Machine Learning AutoML](https://docs.microsoft.com/azure/machine-learning/concept-automated-ml/?WT.mc_id=academic-77958-bethanycheum) ഉപയോഗിച്ച് വ്യാഖ്യാനയോഗ്യമായ മോഡൽ നിർമ്മിക്കുന്നു.
* [Facial Studies Workshop](https://github.com/CloudAdvocacy/FaceStudies) ൽ, നാം [Face API](https://azure.microsoft.com/services/cognitive-services/face/?WT.mc_id=academic-77958-bethanycheum) ഉപയോഗിച്ച് ഇവന്റുകളിൽ നിന്നുള്ള ഫോട്ടോകളിലെ ആളുകളുടെ വികാരങ്ങൾ എടുക്കുന്നു, ആളുകൾ സന്തോഷവാന്മാരാകാൻ കാരണമായത് എന്താണെന്ന് മനസ്സിലാക്കാൻ.
## സമാപനം
നിങ്ങൾക്ക് ഘടനയുള്ളതോ അസംഘടിതമായതോ ആയ ഡാറ്റയുണ്ടാകട്ടെ, Python ഉപയോഗിച്ച് ഡാറ്റ പ്രോസസ്സിംഗ്, മനസ്സിലാക്കൽ എന്നിവയുമായി ബന്ധപ്പെട്ട എല്ലാ ഘട്ടങ്ങളും നിർവഹിക്കാം. ഇത് ഡാറ്റ പ്രോസസ്സിംഗിന് ഏറ്റവും ലവച്ഛമായ മാർഗമാണ്, അതുകൊണ്ടുതന്നെ ഭൂരിഭാഗം ഡാറ്റ സയന്റിസ്റ്റുകൾ Python പ്രധാന ഉപകരണമായി ഉപയോഗിക്കുന്നു. നിങ്ങളുടെ ഡാറ്റ സയൻസ് യാത്രയിൽ ഗൗരവമുണ്ടെങ്കിൽ Python ആഴത്തിൽ പഠിക്കുന്നത് നല്ല ആശയമാണ്!
## [പോസ്റ്റ്-ലെക്ചർ ക്വിസ്](https://ff-quizzes.netlify.app/en/ds/quiz/13)
## അവലോകനം & സ്വയം പഠനം
**പുസ്തകങ്ങൾ**
* [Wes McKinney. Python for Data Analysis: Data Wrangling with Pandas, NumPy, and IPython](https://www.amazon.com/gp/product/1491957662)
**ഓൺലൈൻ വിഭവങ്ങൾ**
* ഔദ്യോഗിക [10 minutes to Pandas](https://pandas.pydata.org/pandas-docs/stable/user_guide/10min.html) ട്യൂട്ടോറിയൽ
* [Pandas Visualization](https://pandas.pydata.org/pandas-docs/stable/user_guide/visualization.html) ഡോക്യുമെന്റേഷൻ
**Python പഠനം**
* [Learn Python in a Fun Way with Turtle Graphics and Fractals](https://github.com/shwars/pycourse)
* [Take your First Steps with Python](https://docs.microsoft.com/learn/paths/python-first-steps/?WT.mc_id=academic-77958-bethanycheum) [Microsoft Learn](http://learn.microsoft.com/?WT.mc_id=academic-77958-bethanycheum) ലേണിംഗ് പാത്ത്
## അസൈൻമെന്റ്
[മുകളിൽ പറഞ്ഞ ചലഞ്ചുകൾക്കായി കൂടുതൽ വിശദമായ ഡാറ്റ പഠനം നടത്തുക](assignment.md)
## ക്രെഡിറ്റുകൾ
ഈ പാഠം ♥️ കൊണ്ട് രചിച്ചത് [Dmitry Soshnikov](http://soshnikov.com) ആണ്.
---
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
**അസൂയാപത്രം**:
ഈ രേഖ AI വിവർത്തന സേവനം [Co-op Translator](https://github.com/Azure/co-op-translator) ഉപയോഗിച്ച് വിവർത്തനം ചെയ്തതാണ്. നാം കൃത്യതയ്ക്ക് ശ്രമിച്ചിട്ടുണ്ടെങ്കിലും, സ്വയം പ്രവർത്തിക്കുന്ന വിവർത്തനങ്ങളിൽ പിശകുകൾ അല്ലെങ്കിൽ തെറ്റുകൾ ഉണ്ടാകാമെന്ന് ദയവായി ശ്രദ്ധിക്കുക. അതിന്റെ മാതൃഭാഷയിലുള്ള യഥാർത്ഥ രേഖയാണ് പ്രാമാണികമായ ഉറവിടം എന്ന് പരിഗണിക്കേണ്ടതാണ്. നിർണായക വിവരങ്ങൾക്ക്, പ്രൊഫഷണൽ മനുഷ്യ വിവർത്തനം ശുപാർശ ചെയ്യപ്പെടുന്നു. ഈ വിവർത്തനം ഉപയോഗിക്കുന്നതിൽ നിന്നുണ്ടാകുന്ന ഏതെങ്കിലും തെറ്റിദ്ധാരണകൾക്കോ തെറ്റായ വ്യാഖ്യാനങ്ങൾക്കോ ഞങ്ങൾ ഉത്തരവാദികളല്ല.
<!-- CO-OP TRANSLATOR DISCLAIMER END -->

@ -0,0 +1,39 @@
<!--
CO_OP_TRANSLATOR_METADATA:
{
"original_hash": "dc8f035ce92e4eaa078ab19caa68267a",
"translation_date": "2025-12-19T15:37:13+00:00",
"source_file": "2-Working-With-Data/07-python/assignment.md",
"language_code": "ml"
}
-->
# പൈത്തണിൽ ഡാറ്റ പ്രോസസ്സിംഗിനുള്ള അസൈൻമെന്റ്
ഈ അസൈൻമെന്റിൽ, ഞങ്ങൾ ഞങ്ങളുടെ ചലഞ്ചുകളിൽ വികസിപ്പിക്കാൻ തുടങ്ങിയ കോഡിനെക്കുറിച്ച് വിശദീകരിക്കാൻ നിങ്ങളോട് ആവശ്യപ്പെടും. അസൈൻമെന്റ് രണ്ട് ഭാഗങ്ങളായി വിഭജിച്ചിരിക്കുന്നു:
## COVID-19 വ്യാപനം മോഡലിംഗ്
- [ ] താരതമ്യത്തിനായി 5-6 വ്യത്യസ്ത രാജ്യങ്ങളുടെ *R<sub>t</sub>* ഗ്രാഫുകൾ ഒരു പ്ലോട്ടിൽ അല്ലെങ്കിൽ പക്കൽപക്കൽ പല പ്ലോട്ടുകളായി വരയ്ക്കുക
- [ ] മരണങ്ങളും സുഖം പ്രാപിച്ചവരും ബാധിച്ച കേസുകളുടെ എണ്ണവുമായി എങ്ങനെ ബന്ധപ്പെടുന്നു എന്ന് കാണുക.
- [ ] ഒരു സാധാരണ രോഗം എത്രകാലം നീണ്ടുനിൽക്കുന്നു എന്ന് രോഗബാധ നിരക്കും മരണ നിരക്കും ദൃശ്യമായി ബന്ധിപ്പിച്ച് ചില അസാധാരണതകൾ കണ്ടെത്തുക. അത് കണ്ടെത്താൻ നിങ്ങൾക്ക് വ്യത്യസ്ത രാജ്യങ്ങൾ പരിശോധിക്കേണ്ടി വരാം.
- [ ] മരണനിരക്ക് കണക്കാക്കുക, അത് സമയത്തിനൊപ്പം എങ്ങനെ മാറുന്നു എന്ന് കാണുക. *കണക്കുകൾ ചെയ്യുന്നതിന് മുമ്പ് രോഗത്തിന്റെ ദൈർഘ്യം ദിവസങ്ങളിൽ പരിഗണിച്ച് ഒരു ടൈം സീരീസ് മാറ്റേണ്ടതുണ്ടാകാം*
## COVID-19 പേപ്പറുകളുടെ വിശകലനം
- [ ] വ്യത്യസ്ത മരുന്നുകളുടെ സഹസംഭവ മാട്രിക്സ് നിർമ്മിക്കുക, ഏത് മരുന്നുകൾ ഒരേ സമയം (ഉദാ: ഒരു അബ്സ്ട്രാക്റ്റിൽ പരാമർശിച്ച) ഉണ്ടാകാറുള്ളത് എന്ന് കാണുക. മരുന്നുകളും രോഗനിർണയങ്ങളും സഹസംഭവ മാട്രിക്സ് നിർമ്മിക്കുന്ന കോഡ് നിങ്ങൾക്ക് മാറ്റാം.
- [ ] ഈ മാട്രിക്സ് ഹീറ്റ്മാപ്പ് ഉപയോഗിച്ച് ദൃശ്യവൽക്കരിക്കുക.
- [ ] ഒരു വിപുലീകരണ ലക്ഷ്യമായി, [chord diagram](https://en.wikipedia.org/wiki/Chord_diagram) ഉപയോഗിച്ച് മരുന്നുകളുടെ സഹസംഭവം ദൃശ്യവൽക്കരിക്കുക. [ഈ ലൈബ്രറി](https://pypi.org/project/chord/) ഒരു കോർഡ് ഡയഗ്രാം വരയ്ക്കാൻ സഹായിക്കാം.
- [ ] മറ്റൊരു വിപുലീകരണ ലക്ഷ്യമായി, വ്യത്യസ്ത മരുന്നുകളുടെ ഡോസുകൾ (ഉദാ: *take 400mg of chloroquine daily* എന്ന വാചകത്തിൽ **400mg**) റെഗുലർ എക്സ്പ്രഷനുകൾ ഉപയോഗിച്ച് എടുക്കുക, വ്യത്യസ്ത മരുന്നുകൾക്കുള്ള വ്യത്യസ്ത ഡോസുകൾ കാണിക്കുന്ന ഡാറ്റാഫ്രെയിം നിർമ്മിക്കുക. **കുറിപ്പ്**: മരുന്നിന്റെ പേരിനടുത്തുള്ള സംഖ്യാത്മക മൂല്യങ്ങൾ പരിഗണിക്കുക.
## റൂബ്രിക്
Exemplary | Adequate | Needs Improvement
--- | --- | -- |
എല്ലാ ടാസ്കുകളും പൂർത്തിയായിട്ടുണ്ട്, ഗ്രാഫിക്കൽ ആയി ചിത്രീകരിക്കുകയും വിശദീകരിക്കുകയും ചെയ്തിട്ടുണ്ട്, രണ്ട് വിപുലീകരണ ലക്ഷ്യങ്ങളിൽ കുറഞ്ഞത് ഒന്ന് ഉൾപ്പെടുന്നു | 5-ൽ കൂടുതൽ ടാസ്കുകൾ പൂർത്തിയായിട്ടുണ്ട്, വിപുലീകരണ ലക്ഷ്യങ്ങൾ ശ്രമിച്ചിട്ടില്ല, അല്ലെങ്കിൽ ഫലങ്ങൾ വ്യക്തമായിട്ടില്ല | 5-ൽ കുറവ് (പക്ഷേ 3-ൽ കൂടുതൽ) ടാസ്കുകൾ പൂർത്തിയായിട്ടുണ്ട്, ദൃശ്യവൽക്കരണങ്ങൾ വിഷയത്തെ തെളിയിക്കാൻ സഹായിക്കുന്നില്ല
---
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
**അസൂയാപത്രം**:
ഈ രേഖ AI വിവർത്തന സേവനം [Co-op Translator](https://github.com/Azure/co-op-translator) ഉപയോഗിച്ച് വിവർത്തനം ചെയ്തതാണ്. നാം കൃത്യതയ്ക്ക് ശ്രമിച്ചിട്ടുണ്ടെങ്കിലും, യന്ത്രം ചെയ്ത വിവർത്തനങ്ങളിൽ പിശകുകൾ അല്ലെങ്കിൽ തെറ്റുകൾ ഉണ്ടാകാമെന്ന് ദയവായി ശ്രദ്ധിക്കുക. അതിന്റെ മാതൃഭാഷയിലുള്ള യഥാർത്ഥ രേഖ അധികാരപരമായ ഉറവിടമായി കണക്കാക്കപ്പെടണം. നിർണായക വിവരങ്ങൾക്ക്, പ്രൊഫഷണൽ മനുഷ്യ വിവർത്തനം ശുപാർശ ചെയ്യപ്പെടുന്നു. ഈ വിവർത്തനം ഉപയോഗിക്കുന്നതിൽ നിന്നുണ്ടാകുന്ന ഏതെങ്കിലും തെറ്റിദ്ധാരണകൾക്കോ തെറ്റായ വ്യാഖ്യാനങ്ങൾക്കോ ഞങ്ങൾ ഉത്തരവാദികളല്ല.
<!-- CO-OP TRANSLATOR DISCLAIMER END -->

File diff suppressed because one or more lines are too long

File diff suppressed because one or more lines are too long

File diff suppressed because one or more lines are too long

@ -0,0 +1,349 @@
<!--
CO_OP_TRANSLATOR_METADATA:
{
"original_hash": "1b560955ff39a2bcf2a049fce474a951",
"translation_date": "2025-12-19T15:42:32+00:00",
"source_file": "2-Working-With-Data/08-data-preparation/README.md",
"language_code": "ml"
}
-->
# ഡാറ്റയുമായി പ്രവർത്തിക്കൽ: ഡാറ്റ തയ്യാറാക്കൽ
|![ Sketchnote by [(@sketchthedocs)](https://sketchthedocs.dev) ](../../sketchnotes/08-DataPreparation.png)|
|:---:|
|ഡാറ്റ തയ്യാറാക്കൽ - _Sketchnote by [@nitya](https://twitter.com/nitya)_ |
## [പ്രീ-ലെക്ചർ ക്വിസ്](https://ff-quizzes.netlify.app/en/ds/quiz/14)
തന്റെ ഉറവിടം അനുസരിച്ച്, റോ ഡാറ്റയിൽ ചില അസംഘടിതത്വങ്ങൾ ഉണ്ടാകാം, അവ വിശകലനത്തിലും മോഡലിംഗിലും വെല്ലുവിളികൾ സൃഷ്ടിക്കും. മറ്റൊരു വാക്കിൽ, ഈ ഡാറ്റ "അഴുക്കായ" എന്ന് വർഗ്ഗീകരിക്കാം, അത് ശുദ്ധീകരിക്കേണ്ടതുണ്ട്. ഈ പാഠം നഷ്ടപ്പെട്ട, തെറ്റായ, അല്ലെങ്കിൽ അപൂർണ്ണമായ ഡാറ്റയുടെ വെല്ലുവിളികൾ കൈകാര്യം ചെയ്യുന്നതിനുള്ള ഡാറ്റ ശുദ്ധീകരണവും പരിവർത്തനവും സംബന്ധിച്ച സാങ്കേതിക വിദ്യകളിൽ കേന്ദ്രീകരിക്കുന്നു. ഈ പാഠത്തിൽ ഉൾപ്പെടുത്തിയ വിഷയങ്ങൾ Python-ഉം Pandas ലൈബ്രറിയും ഉപയോഗിച്ച് [ഈ ഡയറക്ടറിയിലുള്ള നോട്ട്‌ബുക്കിൽ](notebook.ipynb) പ്രദർശിപ്പിക്കും.
## ഡാറ്റ ശുദ്ധീകരണത്തിന്റെ പ്രാധാന്യം
- **ഉപയോഗവും പുനരുപയോഗവും എളുപ്പമാക്കൽ**: ഡാറ്റ ശരിയായി ക്രമീകരിക്കുകയും സാധാരണ രൂപത്തിലാക്കുകയും ചെയ്താൽ അത് തിരയാനും ഉപയോഗിക്കാനും മറ്റുള്ളവരുമായി പങ്കിടാനും എളുപ്പമാകും.
- **സമരൂപത**: ഡാറ്റ സയൻസ് പലപ്പോഴും ഒന്നിലധികം ഡാറ്റാസെറ്റുകളുമായി പ്രവർത്തിക്കേണ്ടതുണ്ട്, വ്യത്യസ്ത ഉറവിടങ്ങളിൽ നിന്നുള്ള ഡാറ്റാസെറ്റുകൾ ചേർക്കേണ്ടതുണ്ട്. ഓരോ ഡാറ്റാസെറ്റിനും സാധാരണ മാനദണ്ഡം ഉറപ്പാക്കുന്നത്, അവ എല്ലാം ഒന്നായി ചേർക്കുമ്പോഴും ഡാറ്റ ഉപയോഗപ്രദമായിരിക്കുമെന്ന് ഉറപ്പാക്കും.
- **മോഡൽ കൃത്യത**: ശുദ്ധീകരിച്ച ഡാറ്റ മോഡലുകളുടെ കൃത്യത മെച്ചപ്പെടുത്തുന്നു.
## സാധാരണ ശുദ്ധീകരണ ലക്ഷ്യങ്ങളും തന്ത്രങ്ങളും
- **ഡാറ്റാസെറ്റ് പരിശോധിക്കൽ**: ഡാറ്റ എക്സ്പ്ലോറേഷൻ, [പിന്നീട് വരുന്ന പാഠത്തിൽ](https://github.com/microsoft/Data-Science-For-Beginners/tree/main/4-Data-Science-Lifecycle/15-analyzing) ഉൾപ്പെടുത്തിയിരിക്കുന്നു, ശുദ്ധീകരിക്കേണ്ട ഡാറ്റ കണ്ടെത്താൻ സഹായിക്കും. ഒരു ഡാറ്റാസെറ്റിലെ മൂല്യങ്ങൾ ദൃശ്യമായി നിരീക്ഷിക്കുന്നത് ബാക്കി ഡാറ്റ എങ്ങനെ കാണപ്പെടും എന്ന് പ്രതീക്ഷകൾ സജ്ജമാക്കാനും പ്രശ്നങ്ങൾ പരിഹരിക്കാൻ ആശയങ്ങൾ നൽകാനും സഹായിക്കും. എക്സ്പ്ലോറേഷൻ അടിസ്ഥാന ക്വെറിയിംഗ്, ദൃശ്യീകരണങ്ങൾ, സാമ്പിളിംഗ് എന്നിവ ഉൾക്കൊള്ളാം.
- **ഫോർമാറ്റിംഗ്**: ഉറവിടം അനുസരിച്ച്, ഡാറ്റയുടെ അവതരണത്തിൽ അസംഘടിതത്വങ്ങൾ ഉണ്ടാകാം. ഇത് മൂല്യം തിരയുന്നതിലും പ്രതിനിധാനം ചെയ്യുന്നതിലും പ്രശ്നങ്ങൾ സൃഷ്ടിക്കും, ഡാറ്റാസെറ്റിൽ കാണപ്പെടുന്നെങ്കിലും ദൃശ്യീകരണങ്ങളിലും ക്വെറി ഫലങ്ങളിലും ശരിയായി പ്രതിനിധാനം ചെയ്യപ്പെടാത്തത്. സാധാരണ ഫോർമാറ്റിംഗ് പ്രശ്നങ്ങൾ വെളിച്ചം, തീയതികൾ, ഡാറ്റാ ടൈപ്പുകൾ എന്നിവ പരിഹരിക്കുന്നതാണ്. ഫോർമാറ്റിംഗ് പ്രശ്നങ്ങൾ പരിഹരിക്കുന്നത് സാധാരണയായി ഡാറ്റ ഉപയോഗിക്കുന്നവരുടെ ഉത്തരവാദിത്വമാണ്. ഉദാഹരണത്തിന്, തീയതികളും സംഖ്യകളും എങ്ങനെ അവതരിപ്പിക്കപ്പെടണം എന്നതിൽ രാജ്യങ്ങൾ വ്യത്യാസപ്പെടാം.
- **പുനരാവൃത്തി**: ഒരേ ഡാറ്റ പല തവണ ഉണ്ടാകുന്നത് തെറ്റായ ഫലങ്ങൾ നൽകും, സാധാരണയായി നീക്കം ചെയ്യണം. രണ്ട് അല്ലെങ്കിൽ കൂടുതൽ ഡാറ്റാസെറ്റുകൾ ചേർക്കുമ്പോൾ ഇത് സാധാരണമാണ്. എന്നാൽ, ചേർന്ന ഡാറ്റാസെറ്റുകളിൽ പുനരാവൃത്തി ചില അധിക വിവരങ്ങൾ നൽകുന്ന ഭാഗങ്ങൾ ഉൾക്കൊള്ളാം, അവ സംരക്ഷിക്കേണ്ടതുണ്ടാകാം.
- **നഷ്ടപ്പെട്ട ഡാറ്റ**: നഷ്ടപ്പെട്ട ഡാറ്റ തെറ്റായതും ദുർബലവുമായ ഫലങ്ങൾ സൃഷ്ടിക്കാം. ചിലപ്പോൾ ഡാറ്റ "പുനഃലോഡ്" ചെയ്യലിലൂടെ, കണക്കുകൂട്ടലും Python പോലുള്ള കോഡും ഉപയോഗിച്ച് നഷ്ടപ്പെട്ട മൂല്യങ്ങൾ പൂരിപ്പിച്ച്, അല്ലെങ്കിൽ മൂല്യം നീക്കം ചെയ്ത് പരിഹരിക്കാം. ഡാറ്റ നഷ്ടപ്പെടാനുള്ള നിരവധി കാരണങ്ങൾ ഉണ്ട്, നഷ്ടപ്പെട്ട മൂല്യങ്ങൾ പരിഹരിക്കുന്ന നടപടികൾ അവ എങ്ങനെ, എന്തുകൊണ്ട് നഷ്ടപ്പെട്ടുവെന്ന് ആശ്രയിച്ചിരിക്കും.
## DataFrame വിവരങ്ങൾ പരിശോധിക്കൽ
> **പഠനലക്ഷ്യം:** ഈ ഉപവിഭാഗം അവസാനിക്കുമ്പോൾ, pandas DataFrame-കളിൽ സൂക്ഷിച്ചിരിക്കുന്ന ഡാറ്റയുടെ പൊതുവായ വിവരങ്ങൾ കണ്ടെത്തുന്നതിൽ നിങ്ങൾ സുഖകരമായി പ്രവർത്തിക്കണം.
നിങ്ങൾ ഡാറ്റ pandas-ലേക്ക് ലോഡ് ചെയ്താൽ, അത് DataFrame ആയിരിക്കാനുള്ള സാധ്യത കൂടുതലാണ് ([മുൻപത്തെ പാഠം](https://github.com/microsoft/Data-Science-For-Beginners/tree/main/2-Working-With-Data/07-python#dataframe) വിശദമായ അവലോകനത്തിന്). എന്നാൽ നിങ്ങളുടെ DataFrame-ൽ 60,000 വരികളും 400 കോളങ്ങളുമുള്ള ഡാറ്റാസെറ്റ് ഉണ്ടെങ്കിൽ, നിങ്ങൾ എന്തിനൊപ്പം പ്രവർത്തിക്കുകയാണ് എന്ന് എങ്ങനെ മനസ്സിലാക്കും? ഭാഗ്യവശാൽ, [pandas](https://pandas.pydata.org/) DataFrame-ന്റെ പൊതുവായ വിവരങ്ങൾ, ആദ്യ കുറച്ച് വരികളും അവസാന കുറച്ച് വരികളും കാണാൻ സൗകര്യപ്രദമായ ഉപകരണങ്ങൾ നൽകുന്നു.
ഈ പ്രവർത്തനം പരിശോധിക്കാൻ, Python scikit-learn ലൈബ്രറി ഇറക്കുമതി ചെയ്ത് ഒരു പ്രശസ്ത ഡാറ്റാസെറ്റ് ഉപയോഗിക്കും: **Iris ഡാറ്റാസെറ്റ്**.
```python
import pandas as pd
from sklearn.datasets import load_iris
iris = load_iris()
iris_df = pd.DataFrame(data=iris['data'], columns=iris['feature_names'])
```
| |sepal length (cm)|sepal width (cm)|petal length (cm)|petal width (cm)|
|----------------------------------------|-----------------|----------------|-----------------|----------------|
|0 |5.1 |3.5 |1.4 |0.2 |
|1 |4.9 |3.0 |1.4 |0.2 |
|2 |4.7 |3.2 |1.3 |0.2 |
|3 |4.6 |3.1 |1.5 |0.2 |
|4 |5.0 |3.6 |1.4 |0.2 |
- **DataFrame.info**: ആരംഭിക്കാൻ, `info()` മെത്തഡ് ഉപയോഗിച്ച് ഒരു `DataFrame`-ൽ ഉള്ള ഉള്ളടക്കത്തിന്റെ സംഗ്രഹം പ്രിന്റ് ചെയ്യാം. ഈ ഡാറ്റാസെറ്റ് നോക്കാം:
```python
iris_df.info()
```
```
RangeIndex: 150 entries, 0 to 149
Data columns (total 4 columns):
# Column Non-Null Count Dtype
--- ------ -------------- -----
0 sepal length (cm) 150 non-null float64
1 sepal width (cm) 150 non-null float64
2 petal length (cm) 150 non-null float64
3 petal width (cm) 150 non-null float64
dtypes: float64(4)
memory usage: 4.8 KB
```
ഇതിൽ നിന്ന്, *Iris* ഡാറ്റാസെറ്റിൽ നാല് കോളങ്ങളിലായി 150 എൻട്രികൾ ഉണ്ടെന്നും, നൾ എൻട്രികൾ ഒന്നും ഇല്ലെന്നും അറിയാം. എല്ലാ ഡാറ്റയും 64-ബിറ്റ് ഫ്ലോട്ടിംഗ് പോയിന്റ് നമ്പറുകളായി സൂക്ഷിച്ചിരിക്കുന്നു.
- **DataFrame.head()**: തുടർന്ന്, `DataFrame`-ന്റെ യഥാർത്ഥ ഉള്ളടക്കം പരിശോധിക്കാൻ `head()` മെത്തഡ് ഉപയോഗിക്കുന്നു. നമ്മുടെ `iris_df`-ന്റെ ആദ്യ കുറച്ച് വരികൾ കാണാം:
```python
iris_df.head()
```
```
sepal length (cm) sepal width (cm) petal length (cm) petal width (cm)
0 5.1 3.5 1.4 0.2
1 4.9 3.0 1.4 0.2
2 4.7 3.2 1.3 0.2
3 4.6 3.1 1.5 0.2
4 5.0 3.6 1.4 0.2
```
- **DataFrame.tail()**: മറുവശത്ത്, `DataFrame`-ന്റെ അവസാന കുറച്ച് വരികൾ പരിശോധിക്കാൻ `tail()` മെത്തഡ് ഉപയോഗിക്കുന്നു:
```python
iris_df.tail()
```
```
sepal length (cm) sepal width (cm) petal length (cm) petal width (cm)
145 6.7 3.0 5.2 2.3
146 6.3 2.5 5.0 1.9
147 6.5 3.0 5.2 2.0
148 6.2 3.4 5.4 2.3
149 5.9 3.0 5.1 1.8
```
> **പാഠം:** DataFrame-ലെ വിവരങ്ങളുടെ മെറ്റാഡാറ്റയും ആദ്യവും അവസാനവും കുറച്ച് മൂല്യങ്ങളും നോക്കിയാൽ പോലും, നിങ്ങൾ കൈകാര്യം ചെയ്യുന്ന ഡാറ്റയുടെ വലിപ്പം, ആകൃതി, ഉള്ളടക്കം എന്നിവയെക്കുറിച്ച് ഉടൻ ഒരു ആശയം ലഭിക്കും.
## നഷ്ടപ്പെട്ട ഡാറ്റ കൈകാര്യം ചെയ്യൽ
> **പഠനലക്ഷ്യം:** ഈ ഉപവിഭാഗം അവസാനിക്കുമ്പോൾ, DataFrame-കളിൽ നിന്നുള്ള നൾ മൂല്യങ്ങൾ മാറ്റുകയോ നീക്കം ചെയ്യുകയോ ചെയ്യുന്നത് അറിയണം.
നിങ്ങൾ ഉപയോഗിക്കാൻ ആഗ്രഹിക്കുന്ന (അല്ലെങ്കിൽ ഉപയോഗിക്കേണ്ട) ഡാറ്റാസെറ്റുകളിൽ പലപ്പോഴും നഷ്ടപ്പെട്ട മൂല്യങ്ങൾ ഉണ്ടാകും. നഷ്ടപ്പെട്ട ഡാറ്റ കൈകാര്യം ചെയ്യുന്നതിൽ സൂക്ഷ്മമായ തുല്യങ്ങൾ ഉണ്ട്, അവ നിങ്ങളുടെ അന്തിമ വിശകലനത്തെയും യാഥാർത്ഥ്യ ഫലങ്ങളെയും ബാധിക്കാം.
Pandas നഷ്ടപ്പെട്ട മൂല്യങ്ങൾ രണ്ട് രീതികളിൽ കൈകാര്യം ചെയ്യുന്നു. ആദ്യത്തേത് നിങ്ങൾ മുമ്പ് കണ്ടിട്ടുണ്ട്: `NaN`, അല്ലെങ്കിൽ Not a Number. ഇത് IEEE ഫ്ലോട്ടിംഗ് പോയിന്റ് സ്പെസിഫിക്കേഷനിലെ പ്രത്യേക മൂല്യമാണ്, നഷ്ടപ്പെട്ട ഫ്ലോട്ടിംഗ് പോയിന്റ് മൂല്യങ്ങൾ സൂചിപ്പിക്കാൻ മാത്രമാണ് ഉപയോഗിക്കുന്നത്.
ഫ്ലോട്ടുകൾ ഒഴികെയുള്ള നഷ്ടപ്പെട്ട മൂല്യങ്ങൾക്ക് pandas Python `None` ഒബ്ജക്റ്റ് ഉപയോഗിക്കുന്നു. രണ്ടും ഒരേ കാര്യം പറയുന്ന രണ്ട് വ്യത്യസ്ത മൂല്യങ്ങൾ കാണുന്നത് ആശയക്കുഴപ്പമുണ്ടാക്കാം, എന്നാൽ ഈ ഡിസൈൻ തിരഞ്ഞെടുപ്പിന് പ്രോഗ്രാമാറ്റിക് കാരണങ്ങൾ ഉണ്ട്, പ്രായോഗികമായി pandas ഭൂരിഭാഗം കേസുകൾക്കായി നല്ല സമന്വയം നൽകുന്നു. എന്നിരുന്നാലും, `None`-ക്കും `NaN`-ക്കും ഉപയോഗത്തിൽ ശ്രദ്ധിക്കേണ്ട നിയന്ത്രണങ്ങൾ ഉണ്ട്.
`NaN`-നും `None`-നും കുറിച്ച് കൂടുതൽ അറിയാൻ [നോട്ട്‌ബുക്ക്](https://github.com/microsoft/Data-Science-For-Beginners/blob/main/4-Data-Science-Lifecycle/15-analyzing/notebook.ipynb) കാണുക!
- **നൾ മൂല്യങ്ങൾ കണ്ടെത്തൽ**: `pandas`-ൽ, `isnull()` ഉം `notnull()` ഉം നൾ ഡാറ്റ കണ്ടെത്താനുള്ള പ്രധാന മെത്തഡുകളാണ്. ഇരുവരും നിങ്ങളുടെ ഡാറ്റയിൽ ബൂളിയൻ മാസ്കുകൾ നൽകുന്നു. `NaN` മൂല്യങ്ങൾക്ക് `numpy` ഉപയോഗിക്കും:
```python
import numpy as np
example1 = pd.Series([0, np.nan, '', None])
example1.isnull()
```
```
0 False
1 True
2 False
3 True
dtype: bool
```
ഫലങ്ങൾ ശ്രദ്ധാപൂർവ്വം നോക്കുക. ഇതിൽ ഏതെങ്കിലും നിങ്ങൾക്ക് അത്ഭുതം ഉണ്ടാക്കുന്നുണ്ടോ? `0` ഒരു ഗണിത നൾ ആണെങ്കിലും, അത് പൂർണ്ണസംഖ്യയായി pandas പരിഗണിക്കുന്നു. `''` (ശൂന്യ സ്ട്രിംഗ്) കുറച്ച് സൂക്ഷ്മമാണ്. സെക്ഷൻ 1-ൽ ഇത് ശൂന്യ സ്ട്രിംഗ് മൂല്യമായി ഉപയോഗിച്ചെങ്കിലും, pandas-നു ഇത് നൾ പ്രതിനിധാനം ചെയ്യാത്ത ഒരു സ്ട്രിംഗ് ഒബ്ജക്റ്റാണ്.
ഇപ്പോൾ, ഈ മെത്തഡുകൾ പ്രായോഗികമായി ഉപയോഗിക്കുന്ന രീതിയിൽ ഉപയോഗിക്കാം. ബൂളിയൻ മാസ്കുകൾ നേരിട്ട് ``Series`` അല്ലെങ്കിൽ ``DataFrame`` ഇൻഡക്സായി ഉപയോഗിക്കാം, ഇത് നഷ്ടപ്പെട്ട (അല്ലെങ്കിൽ ഉള്ള) മൂല്യങ്ങളുമായി പ്രവർത്തിക്കുമ്പോൾ സഹായകരമാണ്.
> **പാഠം**: `isnull()` ഉം `notnull()` ഉം DataFrame-കളിൽ ഉപയോഗിക്കുമ്പോൾ സമാന ഫലങ്ങൾ നൽകുന്നു: ഫലങ്ങളും അവയുടെ ഇൻഡക്സും കാണിക്കുന്നു, ഇത് നിങ്ങളുടെ ഡാറ്റ കൈകാര്യം ചെയ്യുമ്പോൾ വളരെ സഹായകമാണ്.
- **നൾ മൂല്യങ്ങൾ നീക്കം ചെയ്യൽ**: നഷ്ടപ്പെട്ട മൂല്യങ്ങൾ തിരിച്ചറിയുന്നതിന് പുറമേ, pandas `Series`-ലും `DataFrame`-ലും നിന്നുള്ള നൾ മൂല്യങ്ങൾ നീക്കം ചെയ്യാനുള്ള സൗകര്യം നൽകുന്നു. (വലിയ ഡാറ്റാസെറ്റുകളിൽ, നഷ്ടപ്പെട്ട [NA] മൂല്യങ്ങൾ നീക്കം ചെയ്യുന്നത് അവയെ കൈകാര്യം ചെയ്യുന്നതിന് പകരം കൂടുതൽ ശുപാർശ ചെയ്യപ്പെടുന്നു.) ഇത് കാണാൻ `example1`-ലേക്ക് മടങ്ങാം:
```python
example1 = example1.dropna()
example1
```
```
0 0
2
dtype: object
```
ഇത് `example3[example3.notnull()]`-ന്റെ ഔട്ട്പുട്ട് പോലെയാണ്. വ്യത്യാസം, മാസ്ക് ചെയ്ത മൂല്യങ്ങളിൽ ഇൻഡക്സിംഗ് ചെയ്യുന്നതിന് പകരം, `dropna` ആ നഷ്ടപ്പെട്ട മൂല്യങ്ങൾ `Series` `example1`-ൽ നിന്ന് നീക്കം ചെയ്തിരിക്കുന്നു.
DataFrame-കൾക്ക് രണ്ട് ഡൈമെൻഷനുകൾ ഉള്ളതിനാൽ, ഡാറ്റ നീക്കം ചെയ്യാനുള്ള കൂടുതൽ ഓപ്ഷനുകൾ ഉണ്ട്.
```python
example2 = pd.DataFrame([[1, np.nan, 7],
[2, 5, 8],
[np.nan, 6, 9]])
example2
```
| | 0 | 1 | 2 |
|------|---|---|---|
|0 |1.0|NaN|7 |
|1 |2.0|5.0|8 |
|2 |NaN|6.0|9 |
(നിങ്ങൾ ശ്രദ്ധിച്ചോ, pandas `NaN`-കൾ ഉൾക്കൊള്ളാൻ രണ്ട് കോളങ്ങൾ ഫ്ലോട്ടുകളായി അപ്കാസ്റ്റ് ചെയ്തിട്ടുണ്ട്?)
DataFrame-ൽ ഒരു മൂല്യം മാത്രം നീക്കം ചെയ്യാനാകില്ല, അതിനാൽ പൂർണ്ണ വരികളോ കോളങ്ങളോ നീക്കം ചെയ്യണം. നിങ്ങൾ എന്ത് ചെയ്യുകയാണെന്ന് ആശ്രയിച്ച്, ഒരോതും ചെയ്യാം, pandas ഇരുവിധ ഓപ്ഷനുകളും നൽകുന്നു. ഡാറ്റ സയൻസിൽ, കോളങ്ങൾ സാധാരണയായി വേരിയബിളുകളായി, വരികൾ നിരീക്ഷണങ്ങളായി പ്രതിനിധാനം ചെയ്യുന്നതിനാൽ, വരികൾ നീക്കം ചെയ്യാൻ സാധ്യത കൂടുതലാണ്; `dropna()`-യുടെ ഡിഫോൾട്ട് ക്രമീകരണം ഏതെങ്കിലും നൾ മൂല്യം ഉള്ള എല്ലാ വരികളും നീക്കം ചെയ്യുകയാണ്:
```python
example2.dropna()
```
```
0 1 2
1 2.0 5.0 8
```
ആവശ്യമായാൽ, കോളങ്ങളിൽ നിന്നുമുള്ള NA മൂല്യങ്ങൾ നീക്കം ചെയ്യാം. അതിന് `axis=1` ഉപയോഗിക്കുക:
```python
example2.dropna(axis='columns')
```
```
2
0 7
1 8
2 9
```
ഇത് നിങ്ങൾക്ക് സൂക്ഷിക്കേണ്ട ഡാറ്റയുടെ വലിയൊരു ഭാഗം നീക്കം ചെയ്യാം, പ്രത്യേകിച്ച് ചെറിയ ഡാറ്റാസെറ്റുകളിൽ. നിങ്ങൾക്ക് എങ്കിൽ, നൾ മൂല്യങ്ങൾ ഉള്ള ചില വരികളോ കോളങ്ങളോ മാത്രം നീക്കം ചെയ്യണമെങ്കിൽ? `dropna`-യിൽ `how` ഉം `thresh` ഉം പാരാമീറ്ററുകൾ ഉപയോഗിച്ച് ഇത് നിർദ്ദേശിക്കാം.
ഡിഫോൾട്ട് ആയി, `how='any'` ആണ് (സ്വയം പരിശോധിക്കാൻ അല്ലെങ്കിൽ മെത്തഡിന്റെ മറ്റ് പാരാമീറ്ററുകൾ കാണാൻ, കോഡ് സെല്ലിൽ `example4.dropna?` റൺ ചെയ്യുക). നിങ്ങൾക്ക് `how='all'` എന്നത് നിർദ്ദേശിക്കാം, ഇത് മുഴുവൻ നൾ മൂല്യങ്ങൾ ഉള്ള വരികളോ കോളങ്ങളോ മാത്രം നീക്കം ചെയ്യും. ഈ പ്രവർത്തനം കാണാൻ നമ്മുടെ ഉദാഹരണ DataFrame വിപുലീകരിക്കാം.
```python
example2[3] = np.nan
example2
```
| |0 |1 |2 |3 |
|------|---|---|---|---|
|0 |1.0|NaN|7 |NaN|
|1 |2.0|5.0|8 |NaN|
|2 |NaN|6.0|9 |NaN|
`thresh` പാരാമീറ്റർ കൂടുതൽ സൂക്ഷ്മ നിയന്ത്രണം നൽകുന്നു: ഒരു വരിയിലോ കോളത്തിലോ സൂക്ഷിക്കേണ്ട *നൺ-നൾ* മൂല്യങ്ങളുടെ എണ്ണം നിങ്ങൾ സജ്ജമാക്കുന്നു:
```python
example2.dropna(axis='rows', thresh=3)
```
```
0 1 2 3
1 2.0 5.0 8 NaN
```
ഇവിടെ, ആദ്യവും അവസാനവും വരികളും നീക്കം ചെയ്തിരിക്കുന്നു, കാരണം അവയിൽ രണ്ട് മാത്രമാണ് നൺ-നൾ മൂല്യങ്ങൾ.
- **നൾ മൂല്യങ്ങൾ പൂരിപ്പിക്കൽ**: നിങ്ങളുടെ ഡാറ്റാസെറ്റിന്റെ അടിസ്ഥാനത്തിൽ, നൾ മൂല്യങ്ങൾ നീക്കം ചെയ്യുന്നതിന് പകരം സാധുവായ മൂല്യങ്ങൾ കൊണ്ട് പൂരിപ്പിക്കുന്നത് കൂടുതൽ ബുദ്ധിമുട്ടില്ല. `isnull` ഉപയോഗിച്ച് ഇത് ചെയ്യാം, പക്ഷേ ഇത് പ്രയാസകരമായിരിക്കും, പ്രത്യേകിച്ച് പൂരിപ്പിക്കേണ്ട മൂല്യങ്ങൾ 많으면. ഡാറ്റ സയൻസിൽ ഇത് സാധാരണ പ്രവർത്തനമാണെന്ന് കൊണ്ട്, pandas `fillna` നൽകുന്നു, ഇത് `Series` അല്ലെങ്കിൽ `DataFrame`-ന്റെ ഒരു കോപ്പി നൽകുന്നു, നഷ്ടപ്പെട്ട മൂല്യങ്ങൾ നിങ്ങൾ തിരഞ്ഞെടുക്കുന്ന മൂല്യത്തോടെ പകരം വയ്ക്കുന്നു. പ്രായോഗികമായി ഇത് എങ്ങനെ പ്രവർത്തിക്കുന്നുവെന്ന് കാണാൻ മറ്റൊരു ഉദാഹരണ `Series` സൃഷ്ടിക്കാം.
```python
example3 = pd.Series([1, np.nan, 2, None, 3], index=list('abcde'))
example3
```
```
a 1.0
b NaN
c 2.0
d NaN
e 3.0
dtype: float64
```
നൽകിയ മൂല്യമായ `0` ഉപയോഗിച്ച് എല്ലാ നൾ എൻട്രികളും പൂരിപ്പിക്കാം:
```python
example3.fillna(0)
```
```
a 1.0
b 0.0
c 2.0
d 0.0
e 3.0
dtype: float64
```
നൾ മൂല്യങ്ങൾ **ഫോർവേഡ്-ഫിൽ** ചെയ്യാം, അതായത് അവസാനത്തെ സാധുവായ മൂല്യം ഉപയോഗിച്ച് നൾ പൂരിപ്പിക്കുക:
```python
example3.fillna(method='ffill')
```
```
a 1.0
b 1.0
c 2.0
d 2.0
e 3.0
dtype: float64
```
നൽകിയ മൂല്യമായ അടുത്ത സാധുവായ മൂല്യം പിൻവശത്തേക്ക് പ്രചരിപ്പിച്ച് **ബാക്ക്-ഫിൽ** ചെയ്യാം:
```python
example3.fillna(method='bfill')
```
```
a 1.0
b 2.0
c 2.0
d 3.0
e 3.0
dtype: float64
```
ഇത് DataFrame-കളിലും സമാനമായി പ്രവർത്തിക്കുന്നു, പക്ഷേ നൾ മൂല്യങ്ങൾ പൂരിപ്പിക്കാൻ ഒരു `axis` നിർദ്ദേശിക്കാം. മുമ്പ് ഉപയോഗിച്ച `example2` വീണ്ടും എടുത്ത് നോക്കാം:
```python
example2.fillna(method='ffill', axis=1)
```
```
0 1 2 3
0 1.0 1.0 7.0 7.0
1 2.0 5.0 8.0 8.0
2 NaN 6.0 9.0 9.0
```
ഫോർവേഡ്-ഫില്ലിംഗിന് മുമ്പത്തെ മൂല്യം ലഭ്യമല്ലെങ്കിൽ, നൾ മൂല്യം നിലനിൽക്കുന്നതായി ശ്രദ്ധിക്കുക.
> **Takeaway:** നിങ്ങളുടെ ഡാറ്റാസെറ്റുകളിൽ കാണാനാകാത്ത മൂല്യങ്ങൾ കൈകാര്യം ചെയ്യാനുള്ള പല മാർഗ്ഗങ്ങളുമുണ്ട്. നിങ്ങൾ ഉപയോഗിക്കുന്ന പ്രത്യേക തന്ത്രം (അവ നീക്കം ചെയ്യുക, മാറ്റിസ്ഥാപിക്കുക, അല്ലെങ്കിൽ എങ്ങനെ മാറ്റിസ്ഥാപിക്കണം എന്നത്) ആ ഡാറ്റയുടെ പ്രത്യേകതകൾ അനുസരിച്ച് നിർണ്ണയിക്കപ്പെടണം. നിങ്ങൾ കൂടുതൽ ഡാറ്റാസെറ്റുകൾ കൈകാര്യം ചെയ്ത് ഇടപഴകുമ്പോൾ കാണാനാകാത്ത മൂല്യങ്ങൾ എങ്ങനെ കൈകാര്യം ചെയ്യാമെന്ന് നിങ്ങൾക്ക് മെച്ചപ്പെട്ട ധാരണ ഉണ്ടാകും.
## പകർപ്പുകൾ നീക്കം ചെയ്യൽ
> **Learning goal:** ഈ ഉപവിഭാഗത്തിന്റെ അവസാനം, നിങ്ങൾ ഡാറ്റാഫ്രെയിമുകളിൽ നിന്ന് പകർപ്പുകൾ തിരിച്ചറിയാനും നീക്കം ചെയ്യാനും സുഖകരമായി കഴിയണം.
കാണാനാകാത്ത ഡാറ്റയ്ക്ക് പുറമേ, നിങ്ങൾക്ക് യാഥാർത്ഥ്യ ഡാറ്റാസെറ്റുകളിൽ പകർപ്പുകൾ പലപ്പോഴും കാണാം. ഭാഗ്യവശാൽ, `pandas` പകർപ്പുകൾ കണ്ടെത്താനും നീക്കം ചെയ്യാനും എളുപ്പമുള്ള മാർഗ്ഗം നൽകുന്നു.
- **പകർപ്പുകൾ തിരിച്ചറിയൽ: `duplicated`**: pandas-ലെ `duplicated` മെത്തഡ് ഉപയോഗിച്ച് പകർപ്പുകൾ എളുപ്പത്തിൽ കണ്ടെത്താം, ഇത് ഒരു ബൂളിയൻ മാസ്ക് നൽകുന്നു, ഒരു `DataFrame`-ലെ ഒരു എൻട്രി മുമ്പത്തെ ഒരു പകർപ്പാണോ എന്ന് സൂചിപ്പിക്കുന്നു. ഇത് പ്രവർത്തനത്തിൽ കാണാൻ മറ്റൊരു ഉദാഹരണ `DataFrame` സൃഷ്ടിക്കാം.
```python
example4 = pd.DataFrame({'letters': ['A','B'] * 2 + ['B'],
'numbers': [1, 2, 1, 3, 3]})
example4
```
| |letters|numbers|
|------|-------|-------|
|0 |A |1 |
|1 |B |2 |
|2 |A |1 |
|3 |B |3 |
|4 |B |3 |
```python
example4.duplicated()
```
```
0 False
1 False
2 True
3 False
4 True
dtype: bool
```
- **പകർപ്പുകൾ നീക്കം ചെയ്യൽ: `drop_duplicates`:** `duplicated` മൂല്യങ്ങൾ `False` ആയ എല്ലാ ഡാറ്റയുടെ ഒരു പകർപ്പ് മടങ്ങി നൽകുന്നു:
```python
example4.drop_duplicates()
```
```
letters numbers
0 A 1
1 B 2
3 B 3
```
`duplicated` ഉം `drop_duplicates` ഉം ഡിഫോൾട്ടായി എല്ലാ കോളങ്ങളെയും പരിഗണിക്കുന്നു, പക്ഷേ നിങ്ങൾക്ക് നിങ്ങളുടെ `DataFrame`-ലെ ചില കോളങ്ങൾ മാത്രം പരിശോധിക്കാൻ നിർദ്ദേശിക്കാം:
```python
example4.drop_duplicates(['letters'])
```
```
letters numbers
0 A 1
1 B 2
```
> **Takeaway:** പകർപ്പുകൾ നീക്കം ചെയ്യൽ ഏകദേശം എല്ലാ ഡാറ്റാ സയൻസ് പ്രോജക്റ്റുകളുടെയും അനിവാര്യ ഭാഗമാണ്. പകർപ്പുകൾ നിങ്ങളുടെ വിശകലന ഫലങ്ങൾ മാറ്റുകയും തെറ്റായ ഫലങ്ങൾ നൽകുകയും ചെയ്യാം!
## 🚀 ചലഞ്ച്
ചർച്ച ചെയ്ത എല്ലാ വസ്തുക്കളും [Jupyter Notebook](https://github.com/microsoft/Data-Science-For-Beginners/blob/main/2-Working-With-Data/08-data-preparation/notebook.ipynb) ആയി ലഭ്യമാണ്. കൂടാതെ, ഓരോ വിഭാഗത്തിനും ശേഷം വ്യായാമങ്ങൾ ഉണ്ട്, അവ പരീക്ഷിച്ച് നോക്കൂ!
## [പോസ്റ്റ്-ലെക്ചർ ക്വിസ്](https://ff-quizzes.netlify.app/en/ds/quiz/15)
## അവലോകനം & സ്വയം പഠനം
നിങ്ങളുടെ ഡാറ്റ വിശകലനത്തിനും മോഡലിംഗിനും തയ്യാറാക്കുന്നതും ഡാറ്റ ശുദ്ധീകരണവും കണ്ടെത്താനും സമീപിക്കാനും നിരവധി മാർഗ്ഗങ്ങളുണ്ട്, ഡാറ്റ ശുദ്ധീകരണം ഒരു "ഹാൻഡ്‌സ് ഓൺ" അനുഭവമാണ്. ഈ പാഠം ഉൾക്കൊള്ളാത്ത സാങ്കേതിക വിദ്യകൾ അന്വേഷിക്കാൻ Kaggle-ൽ നിന്നുള്ള ഈ ചലഞ്ചുകൾ പരീക്ഷിക്കൂ.
- [ഡാറ്റ ശുദ്ധീകരണ ചലഞ്ച്: തീയതികൾ പാഴ്‌സിംഗ്](https://www.kaggle.com/rtatman/data-cleaning-challenge-parsing-dates/)
- [ഡാറ്റ ശുദ്ധീകരണ ചലഞ്ച്: ഡാറ്റ സ്കെയിൽ ചെയ്യൽ, നോർമലൈസ് ചെയ്യൽ](https://www.kaggle.com/rtatman/data-cleaning-challenge-scale-and-normalize-data)
## അസൈൻമെന്റ്
[ഫോമിൽ നിന്നുള്ള ഡാറ്റ വിലയിരുത്തൽ](assignment.md)
---
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
**അസൂയാപത്രം**:
ഈ രേഖ AI വിവർത്തന സേവനം [Co-op Translator](https://github.com/Azure/co-op-translator) ഉപയോഗിച്ച് വിവർത്തനം ചെയ്തതാണ്. നാം കൃത്യതയ്ക്ക് ശ്രമിച്ചിട്ടുണ്ടെങ്കിലും, സ്വയം പ്രവർത്തിക്കുന്ന വിവർത്തനങ്ങളിൽ പിശകുകൾ അല്ലെങ്കിൽ തെറ്റുകൾ ഉണ്ടാകാമെന്ന് ദയവായി ശ്രദ്ധിക്കുക. അതിന്റെ മാതൃഭാഷയിലുള്ള യഥാർത്ഥ രേഖ അധികാരപരമായ ഉറവിടമായി കണക്കാക്കപ്പെടണം. നിർണായക വിവരങ്ങൾക്ക്, പ്രൊഫഷണൽ മനുഷ്യ വിവർത്തനം ശുപാർശ ചെയ്യപ്പെടുന്നു. ഈ വിവർത്തനം ഉപയോഗിക്കുന്നതിൽ നിന്നുണ്ടാകുന്ന ഏതെങ്കിലും തെറ്റിദ്ധാരണകൾക്കോ തെറ്റായ വ്യാഖ്യാനങ്ങൾക്കോ ഞങ്ങൾ ഉത്തരവാദികളല്ല.
<!-- CO-OP TRANSLATOR DISCLAIMER END -->

File diff suppressed because one or more lines are too long

@ -0,0 +1,30 @@
<!--
CO_OP_TRANSLATOR_METADATA:
{
"original_hash": "f9d5a7275e046223fa6474477674b810",
"translation_date": "2025-12-19T15:45:32+00:00",
"source_file": "2-Working-With-Data/08-data-preparation/assignment.md",
"language_code": "ml"
}
-->
# ഒരു ഫോമിൽ നിന്നുള്ള ഡാറ്റ വിലയിരുത്തൽ
ഒരു ക്ലയന്റ് അവരുടെ ക്ലയന്റ്-ബേസ് സംബന്ധിച്ച ചില അടിസ്ഥാന ഡാറ്റ ശേഖരിക്കാൻ ഒരു [ചെറിയ ഫോം](../../../../2-Working-With-Data/08-data-preparation/index.html) പരീക്ഷിച്ചു വരുന്നു. അവർ ശേഖരിച്ച ഡാറ്റ ശരിയാണോ എന്ന് സ്ഥിരീകരിക്കാൻ അവർ അവരുടെ കണ്ടെത്തലുകൾ നിങ്ങളെ സമീപിച്ചു. ഫോം കാണാൻ ബ്രൗസറിൽ `index.html` പേജ് തുറക്കാം.
നിങ്ങൾക്ക് ഫോമിൽ നിന്നുള്ള എൻട്രികൾ ഉൾപ്പെടുന്ന [csv റെക്കോർഡുകളുടെ ഒരു ഡാറ്റാസെറ്റ്](../../../../data/form.csv) കൂടാതെ ചില അടിസ്ഥാന ദൃശ്യവത്കരണങ്ങളും നൽകിയിട്ടുണ്ട്. ചില ദൃശ്യവത്കരണങ്ങൾ തെറ്റായതായി ക്ലയന്റ് സൂചിപ്പിച്ചു, എന്നാൽ അവ പരിഹരിക്കാൻ എങ്ങനെ എന്നതിൽ അവർ ഉറപ്പില്ല. നിങ്ങൾക്ക് ഇത് [അസൈൻമെന്റ് നോട്ട്‌ബുക്കിൽ](assignment.ipynb) പരിശോധിക്കാം.
## നിർദ്ദേശങ്ങൾ
ഈ പാഠത്തിലെ സാങ്കേതിക വിദ്യകൾ ഉപയോഗിച്ച് ഫോം ശരിയായും സ്ഥിരതയുള്ളതുമായ വിവരങ്ങൾ ശേഖരിക്കുന്നതിന് ശുപാർശകൾ നൽകുക.
## റൂബ്രിക്
Exemplary | Adequate | Needs Improvement
--- | --- | -- |
---
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
**അസൂയാ**:
ഈ രേഖ AI വിവർത്തന സേവനം [Co-op Translator](https://github.com/Azure/co-op-translator) ഉപയോഗിച്ച് വിവർത്തനം ചെയ്തതാണ്. നാം കൃത്യതയ്ക്ക് ശ്രമിച്ചെങ്കിലും, സ്വയം പ്രവർത്തിക്കുന്ന വിവർത്തനങ്ങളിൽ പിശകുകൾ അല്ലെങ്കിൽ തെറ്റുകൾ ഉണ്ടാകാമെന്ന് ദയവായി ശ്രദ്ധിക്കുക. അതിന്റെ മാതൃഭാഷയിലുള്ള യഥാർത്ഥ രേഖയാണ് പ്രാമാണികമായ ഉറവിടം എന്ന് പരിഗണിക്കേണ്ടതാണ്. നിർണായകമായ വിവരങ്ങൾക്ക്, പ്രൊഫഷണൽ മനുഷ്യ വിവർത്തനം ശുപാർശ ചെയ്യപ്പെടുന്നു. ഈ വിവർത്തനം ഉപയോഗിക്കുന്നതിൽ നിന്നുണ്ടാകുന്ന ഏതെങ്കിലും തെറ്റിദ്ധാരണകൾക്കോ തെറ്റായ വ്യാഖ്യാനങ്ങൾക്കോ ഞങ്ങൾ ഉത്തരവാദികളല്ല.
<!-- CO-OP TRANSLATOR DISCLAIMER END -->

@ -0,0 +1,32 @@
<!--
CO_OP_TRANSLATOR_METADATA:
{
"original_hash": "abc3309ab41bc5a7846f70ee1a055838",
"translation_date": "2025-12-19T13:29:38+00:00",
"source_file": "2-Working-With-Data/README.md",
"language_code": "ml"
}
-->
# ഡാറ്റയുമായി പ്രവർത്തിക്കൽ
![data love](../../../translated_images/data-love.a22ef29e6742c852505ada062920956d3d7604870b281a8ca7c7ac6f37381d5a.ml.jpg)
> ഫോട്ടോ <a href="https://unsplash.com/@swimstaralex?utm_source=unsplash&utm_medium=referral&utm_content=creditCopyText">Alexander Sinn</a> യുടെ <a href="https://unsplash.com/s/photos/data?utm_source=unsplash&utm_medium=referral&utm_content=creditCopyText">Unsplash</a> ൽ നിന്നാണ്
ഈ പാഠങ്ങളിൽ, ഡാറ്റ എങ്ങനെ കൈകാര്യം ചെയ്യാമെന്ന്, മാറ്റം വരുത്താമെന്ന്, ആപ്ലിക്കേഷനുകളിൽ ഉപയോഗിക്കാമെന്ന് നിങ്ങൾ പഠിക്കും. ബന്ധപരമായ (relational) ഡാറ്റാബേസുകളും ബന്ധമില്ലാത്ത (non-relational) ഡാറ്റാബേസുകളും എന്താണെന്ന്, അവയിൽ ഡാറ്റ എങ്ങനെ സൂക്ഷിക്കാമെന്ന് നിങ്ങൾ അറിയും. ഡാറ്റ കൈകാര്യം ചെയ്യാൻ പൈത്തൺ ഉപയോഗിക്കുന്നതിന്റെ അടിസ്ഥാനങ്ങൾ നിങ്ങൾ പഠിക്കും, കൂടാതെ പൈത്തൺ ഉപയോഗിച്ച് ഡാറ്റ കൈകാര്യം ചെയ്യാനും ഡാറ്റയിൽ നിന്ന് വിവരങ്ങൾ കണ്ടെത്താനും ഉള്ള നിരവധി മാർഗങ്ങൾ നിങ്ങൾ കണ്ടെത്തും.
### വിഷയങ്ങൾ
1. [ബന്ധപരമായ ഡാറ്റാബേസുകൾ](05-relational-databases/README.md)
2. [ബന്ധമില്ലാത്ത ഡാറ്റാബേസുകൾ](06-non-relational/README.md)
3. [പൈത്തൺ ഉപയോഗിച്ച് പ്രവർത്തിക്കൽ](07-python/README.md)
4. [ഡാറ്റ തയ്യാറാക്കൽ](08-data-preparation/README.md)
### ക്രെഡിറ്റുകൾ
ഈ പാഠങ്ങൾ ❤️ ഉപയോഗിച്ച് എഴുതിയത് [Christopher Harrison](https://twitter.com/geektrainer), [Dmitry Soshnikov](https://twitter.com/shwars) എന്നിവരും [Jasmine Greenaway](https://twitter.com/paladique) യും ആണ്
---
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
**അസൂയാപത്രം**:
ഈ രേഖ AI വിവർത്തന സേവനം [Co-op Translator](https://github.com/Azure/co-op-translator) ഉപയോഗിച്ച് വിവർത്തനം ചെയ്തതാണ്. നാം കൃത്യതയ്ക്ക് ശ്രമിച്ചിട്ടുണ്ടെങ്കിലും, സ്വയം പ്രവർത്തിക്കുന്ന വിവർത്തനങ്ങളിൽ പിശകുകൾ അല്ലെങ്കിൽ തെറ്റുകൾ ഉണ്ടാകാമെന്ന് ദയവായി ശ്രദ്ധിക്കുക. അതിന്റെ മാതൃഭാഷയിലുള്ള യഥാർത്ഥ രേഖ അധികാരപരമായ ഉറവിടമായി കണക്കാക്കപ്പെടണം. നിർണായക വിവരങ്ങൾക്ക്, പ്രൊഫഷണൽ മനുഷ്യ വിവർത്തനം ശുപാർശ ചെയ്യപ്പെടുന്നു. ഈ വിവർത്തനം ഉപയോഗിക്കുന്നതിൽ നിന്നുണ്ടാകുന്ന ഏതെങ്കിലും തെറ്റിദ്ധാരണകൾക്കോ തെറ്റായ വ്യാഖ്യാനങ്ങൾക്കോ ഞങ്ങൾ ഉത്തരവാദികളല്ല.
<!-- CO-OP TRANSLATOR DISCLAIMER END -->

@ -0,0 +1,221 @@
<!--
CO_OP_TRANSLATOR_METADATA:
{
"original_hash": "a49d78e32e280c410f04e5f2a2068e77",
"translation_date": "2025-12-19T16:14:27+00:00",
"source_file": "3-Data-Visualization/09-visualization-quantities/README.md",
"language_code": "ml"
}
-->
# അളവുകൾ ദൃശ്യവൽക്കരിക്കൽ
|![ Sketchnote by [(@sketchthedocs)](https://sketchthedocs.dev) ](../../sketchnotes/09-Visualizing-Quantities.png)|
|:---:|
| അളവുകൾ ദൃശ്യവൽക്കരിക്കൽ - _Sketchnote by [@nitya](https://twitter.com/nitya)_ |
ഈ പാഠത്തിൽ, അളവിന്റെ ആശയത്തെ ചുറ്റിപ്പറ്റി രസകരമായ ദൃശ്യവൽക്കരണങ്ങൾ സൃഷ്ടിക്കാൻ ലഭ്യമായ പല പൈതൺ ലൈബ്രറികളിൽ ഒന്നിനെ എങ്ങനെ ഉപയോഗിക്കാമെന്ന് നിങ്ങൾ പഠിക്കും. മിന്നസോട്ടയുടെ പക്ഷികളെക്കുറിച്ചുള്ള ശുദ്ധീകരിച്ച ഡാറ്റാസെറ്റ് ഉപയോഗിച്ച്, പ്രാദേശിക വന്യജീവികളെക്കുറിച്ചുള്ള പല രസകരമായ വസ്തുതകളും നിങ്ങൾക്ക് അറിയാം.
## [പാഠം മുൻകൂർ ക്വിസ്](https://ff-quizzes.netlify.app/en/ds/quiz/16)
## Matplotlib ഉപയോഗിച്ച് വിങ്‌സ്‌പാൻ നിരീക്ഷിക്കുക
വിവിധ തരത്തിലുള്ള ലളിതവും സങ്കീർണ്ണവുമായ പ്ലോട്ടുകളും ചാർട്ടുകളും സൃഷ്ടിക്കാൻ മികച്ച ലൈബ്രറി [Matplotlib](https://matplotlib.org/stable/index.html) ആണ്. പൊതുവായി, ഈ ലൈബ്രറികൾ ഉപയോഗിച്ച് ഡാറ്റ പ്ലോട്ട് ചെയ്യാനുള്ള പ്രക്രിയയിൽ, നിങ്ങളുടെ ഡാറ്റാഫ്രെയിമിന്റെ ലക്ഷ്യമിടേണ്ട ഭാഗങ്ങൾ തിരിച്ചറിയുക, ആവശ്യമായ മാറ്റങ്ങൾ ചെയ്യുക, അതിന്റെ x, y അക്ഷ മൂല്യങ്ങൾ നിശ്ചയിക്കുക, ഏത് തരത്തിലുള്ള പ്ലോട്ട് കാണിക്കണമെന്ന് തീരുമാനിക്കുക, പിന്നെ പ്ലോട്ട് കാണിക്കുക എന്നിവ ഉൾപ്പെടുന്നു. Matplotlib നിരവധി ദൃശ്യവൽക്കരണങ്ങൾ നൽകുന്നു, പക്ഷേ ഈ പാഠത്തിനായി, അളവ് ദൃശ്യവൽക്കരിക്കാൻ ഏറ്റവും അനുയോജ്യമായവയായ ലൈന്ചാർട്ടുകൾ, സ്കാറ്റർപ്ലോട്ടുകൾ, ബാർ പ്ലോട്ടുകൾ എന്നിവയിൽ ശ്രദ്ധ കേന്ദ്രീകരിക്കാം.
> ✅ നിങ്ങളുടെ ഡാറ്റയുടെ ഘടനക്കും പറയാനുള്ള കഥക്കും ഏറ്റവും അനുയോജ്യമായ ചാർട്ട് ഉപയോഗിക്കുക.
> - സമയാനുസൃത പ്രവണതകൾ വിശകലനം ചെയ്യാൻ: ലൈന്ചാർട്ട്
> - മൂല്യങ്ങൾ താരതമ്യം ചെയ്യാൻ: ബാർ, കോളം, പൈ, സ്കാറ്റർപ്ലോട്ട്
> - ഭാഗങ്ങൾ മുഴുവൻ എങ്ങനെ ബന്ധപ്പെട്ടിരിക്കുന്നു കാണിക്കാൻ: പൈ
> - ഡാറ്റയുടെ വിതരണങ്ങൾ കാണിക്കാൻ: സ്കാറ്റർപ്ലോട്ട്, ബാർ
> - പ്രവണതകൾ കാണിക്കാൻ: ലൈന്ചാർട്ട്, കോളം
> - മൂല്യങ്ങൾ തമ്മിലുള്ള ബന്ധങ്ങൾ കാണിക്കാൻ: ലൈന്ചാർട്ട്, സ്കാറ്റർപ്ലോട്ട്, ബബിൾ
നിങ്ങൾക്ക് ഒരു ഡാറ്റാസെറ്റ് ഉണ്ടെങ്കിൽ, ഒരു നൽകിയ വസ്തുവിന്റെ എത്രമാത്രം ഉൾപ്പെടുന്നുവെന്ന് കണ്ടെത്തേണ്ട ആദ്യ ജോലികളിൽ ഒന്നാണ് അതിന്റെ മൂല്യങ്ങൾ പരിശോധിക്കുക.
✅ Matplotlib-ന് മികച്ച 'ചീറ്റ് ഷീറ്റുകൾ' [ഇവിടെ](https://matplotlib.org/cheatsheets/cheatsheets.pdf) ലഭ്യമാണ്.
## പക്ഷികളുടെ വിങ്‌സ്‌പാൻ മൂല്യങ്ങളെക്കുറിച്ച് ലൈന്പ്ലോട്ട് നിർമ്മിക്കുക
ഈ പാഠ ഫോൾഡറിന്റെ റൂട്ടിലുള്ള `notebook.ipynb` ഫയൽ തുറന്ന് ഒരു സെൽ ചേർക്കുക.
> കുറിപ്പ്: ഡാറ്റ ഈ റീപ്പോയുടെ റൂട്ടിലുള്ള `/data` ഫോൾഡറിലാണ് സൂക്ഷിച്ചിരിക്കുന്നത്.
```python
import pandas as pd
import matplotlib.pyplot as plt
birds = pd.read_csv('../../data/birds.csv')
birds.head()
```
ഈ ഡാറ്റ ടെക്സ്റ്റും സംഖ്യകളും ചേർന്നതാണ്:
| | Name | ScientificName | Category | Order | Family | Genus | ConservationStatus | MinLength | MaxLength | MinBodyMass | MaxBodyMass | MinWingspan | MaxWingspan |
| ---: | :--------------------------- | :--------------------- | :-------------------- | :----------- | :------- | :---------- | :----------------- | --------: | --------: | ----------: | ----------: | ----------: | ----------: |
| 0 | Black-bellied whistling-duck | Dendrocygna autumnalis | Ducks/Geese/Waterfowl | Anseriformes | Anatidae | Dendrocygna | LC | 47 | 56 | 652 | 1020 | 76 | 94 |
| 1 | Fulvous whistling-duck | Dendrocygna bicolor | Ducks/Geese/Waterfowl | Anseriformes | Anatidae | Dendrocygna | LC | 45 | 53 | 712 | 1050 | 85 | 93 |
| 2 | Snow goose | Anser caerulescens | Ducks/Geese/Waterfowl | Anseriformes | Anatidae | Anser | LC | 64 | 79 | 2050 | 4050 | 135 | 165 |
| 3 | Ross's goose | Anser rossii | Ducks/Geese/Waterfowl | Anseriformes | Anatidae | Anser | LC | 57.3 | 64 | 1066 | 1567 | 113 | 116 |
| 4 | Greater white-fronted goose | Anser albifrons | Ducks/Geese/Waterfowl | Anseriformes | Anatidae | Anser | LC | 64 | 81 | 1930 | 3310 | 130 | 165 |
അടിസ്ഥാന ലൈന്പ്ലോട്ട് ഉപയോഗിച്ച് ചില സംഖ്യാത്മക ഡാറ്റ പ്ലോട്ട് ചെയ്യുന്നതിൽ നിന്ന് തുടങ്ങാം. ഈ രസകരമായ പക്ഷികളുടെ പരമാവധി വിങ്‌സ്‌പാനിന്റെ കാഴ്ച നിങ്ങൾക്ക് വേണമെങ്കിൽ.
```python
wingspan = birds['MaxWingspan']
wingspan.plot()
```
![Max Wingspan](../../../../translated_images/max-wingspan-02.e79fd847b2640b89e21e340a3a9f4c5d4b224c4fcd65f54385e84f1c9ed26d52.ml.png)
നിങ്ങൾ ഉടൻ ശ്രദ്ധിക്കുന്നതെന്താണ്? കുറഞ്ഞത് ഒരു ഔട്ട്‌ലൈയർ ഉണ്ടെന്ന് തോന്നുന്നു - അത്ര വലിയ വിങ്‌സ്‌പാൻ! 2300 സെന്റീമീറ്റർ വിങ്‌സ്‌പാൻ 23 മീറ്ററിനാണ് തുല്യമായത് - മിന്നസോട്ടയിൽ പ്റ്റെറോഡാക്ടിലുകൾ നടക്കുകയാണോ? പരിശോധിക്കാം.
Excel-ൽ ഒരു വേഗത്തിലുള്ള സോർട്ട് ചെയ്ത് ആ ഔട്ട്‌ലൈയറുകൾ കണ്ടെത്താമെങ്കിലും, അവ ടൈപ്പോസ് ആകാമെന്ന് കരുതുന്നു, പ്ലോട്ടിൽ നിന്നുള്ള ദൃശ്യവൽക്കരണ പ്രക്രിയ തുടരുക.
x-അക്ഷത്തിൽ ലേബലുകൾ ചേർത്ത് ഏത് തരത്തിലുള്ള പക്ഷികളാണെന്ന് കാണിക്കുക:
```
plt.title('Max Wingspan in Centimeters')
plt.ylabel('Wingspan (CM)')
plt.xlabel('Birds')
plt.xticks(rotation=45)
x = birds['Name']
y = birds['MaxWingspan']
plt.plot(x, y)
plt.show()
```
![wingspan with labels](../../../../translated_images/max-wingspan-labels-02.aa90e826ca49a9d1dde78075e9755c1849ef56a4e9ec60f7e9f3806daf9283e2.ml.png)
45 ഡിഗ്രി ലേബലുകളുടെ റൊട്ടേഷൻ സജ്ജമാക്കിയിട്ടും വായിക്കാൻ വളരെ അധികം ലേബലുകൾ ഉണ്ട്. വ്യത്യസ്തമായ ഒരു തന്ത്രം പരീക്ഷിക്കാം: ഔട്ട്‌ലൈയറുകൾ മാത്രം ലേബൽ ചെയ്യുക, ലേബലുകൾ ചാർട്ടിനുള്ളിൽ സജ്ജമാക്കുക. ലേബലിംഗിന് കൂടുതൽ സ്ഥലം നൽകാൻ സ്കാറ്റർ ചാർട്ട് ഉപയോഗിക്കാം:
```python
plt.title('Max Wingspan in Centimeters')
plt.ylabel('Wingspan (CM)')
plt.tick_params(axis='both',which='both',labelbottom=False,bottom=False)
for i in range(len(birds)):
x = birds['Name'][i]
y = birds['MaxWingspan'][i]
plt.plot(x, y, 'bo')
if birds['MaxWingspan'][i] > 500:
plt.text(x, y * (1 - 0.05), birds['Name'][i], fontsize=12)
plt.show()
```
ഇവിടെ എന്താണ് സംഭവിക്കുന്നത്? നിങ്ങൾ `tick_params` ഉപയോഗിച്ച് താഴെയുള്ള ലേബലുകൾ മറച്ചുവെച്ചു, പിന്നെ നിങ്ങളുടെ പക്ഷികളുടെ ഡാറ്റാസെറ്റിൽ ലൂപ്പ് സൃഷ്ടിച്ചു. `bo` ഉപയോഗിച്ച് ചെറിയ നീല വൃത്താകൃതിയിലുള്ള ഡോട്ടുകൾ പ്ലോട്ട് ചെയ്ത്, പരമാവധി വിങ്‌സ്‌പാൻ 500-ൽ കൂടുതലുള്ള ഏതെങ്കിലും പക്ഷിയെ കണ്ടെത്തി, ആ ഡോട്ടിന് അടുത്ത് ലേബൽ പ്രദർശിപ്പിച്ചു. y അക്ഷത്തിൽ ലേബലുകൾ കുറച്ച് മാറ്റി (`y * (1 - 0.05)`) പക്ഷിയുടെ പേര് ലേബലായി ഉപയോഗിച്ചു.
നിങ്ങൾ എന്ത് കണ്ടെത്തി?
![outliers](../../../../translated_images/labeled-wingspan-02.6110e2d2401cd5238ccc24dfb6d04a6c19436101f6cec151e3992e719f9f1e1f.ml.png)
## നിങ്ങളുടെ ഡാറ്റ ഫിൽട്ടർ ചെയ്യുക
ബാൾഡ് ഈഗിൾക്കും പ്രെയറി ഫാൽക്കണിനും, വളരെ വലിയ പക്ഷികളായിരിക്കാം, പക്ഷേ പരമാവധി വിങ്‌സ്‌പാനിൽ ഒരു അധികം `0` ചേർത്തിട്ടുള്ള തെറ്റായ ലേബലിംഗാണ്. 25 മീറ്റർ വിങ്‌സ്‌പാൻ ഉള്ള ബാൾഡ് ഈഗിൾ കാണാൻ സാധ്യത കുറവാണ്, പക്ഷേ ഉണ്ടെങ്കിൽ ദയവായി ഞങ്ങളെ അറിയിക്കുക! ആ രണ്ട് ഔട്ട്‌ലൈയറുകൾ ഇല്ലാതെ പുതിയ ഡാറ്റാഫ്രെയിം സൃഷ്ടിക്കാം:
```python
plt.title('Max Wingspan in Centimeters')
plt.ylabel('Wingspan (CM)')
plt.xlabel('Birds')
plt.tick_params(axis='both',which='both',labelbottom=False,bottom=False)
for i in range(len(birds)):
x = birds['Name'][i]
y = birds['MaxWingspan'][i]
if birds['Name'][i] not in ['Bald eagle', 'Prairie falcon']:
plt.plot(x, y, 'bo')
plt.show()
```
ഔട്ട്‌ലൈയറുകൾ ഫിൽട്ടർ ചെയ്തതോടെ, നിങ്ങളുടെ ഡാറ്റ കൂടുതൽ ഏകീകൃതവും മനസ്സിലാക്കാൻ എളുപ്പവുമാണ്.
![scatterplot of wingspans](../../../../translated_images/scatterplot-wingspan-02.1c33790094ce36a75f5fb45b25ed2cf27f0356ea609e43c11e97a2cedd7011a4.ml.png)
ഇപ്പോൾ വിങ്‌സ്‌പാൻ സംബന്ധിച്ച് കുറഞ്ഞത് ശുദ്ധമായ ഡാറ്റാസെറ്റ് ഉണ്ടാകുമ്പോൾ, ഈ പക്ഷികളെക്കുറിച്ച് കൂടുതൽ കണ്ടെത്താം.
ലൈനും സ്കാറ്റർ പ്ലോട്ടുകളും ഡാറ്റ മൂല്യങ്ങളും അവയുടെ വിതരണങ്ങളും പ്രദർശിപ്പിക്കുമ്പോൾ, ഈ ഡാറ്റാസെറ്റിൽ ഉള്ള മൂല്യങ്ങളെക്കുറിച്ച് ചിന്തിക്കണം. അളവിനെക്കുറിച്ചുള്ള ചോദ്യങ്ങൾക്ക് ഉത്തരം കണ്ടെത്താൻ ദൃശ്യവൽക്കരണങ്ങൾ സൃഷ്ടിക്കാം:
> പക്ഷികളുടെ എത്ര വിഭാഗങ്ങളുണ്ട്, അവയുടെ എണ്ണം എത്രയാണ്?
> എത്ര പക്ഷികൾ നശിച്ചുപോയവ, അപകടത്തിൽപെട്ടവ, അപൂർവവ, സാധാരണവ?
> ലിനിയസിന്റെ പദവിനുസരിച്ച് വിവിധ ജീനസുകളും ഓർഡറുകളും എത്രയുണ്ട്?
## ബാർ ചാർട്ടുകൾ പരിശോധിക്കുക
ഡാറ്റയുടെ ഗ്രൂപ്പിംഗുകൾ കാണിക്കേണ്ടപ്പോൾ ബാർ ചാർട്ടുകൾ പ്രായോഗികമാണ്. ഈ ഡാറ്റാസെറ്റിലുള്ള പക്ഷികളുടെ വിഭാഗങ്ങൾ പരിശോധിച്ച് ഏതാണ് ഏറ്റവും സാധാരണമായത് എന്ന് കാണാം.
നോട്ട്ബുക്ക് ഫയലിൽ ഒരു അടിസ്ഥാന ബാർ ചാർട്ട് സൃഷ്ടിക്കുക
✅ മുൻപത്തെ വിഭാഗത്തിൽ കണ്ടെത്തിയ രണ്ട് ഔട്ട്‌ലൈയർ പക്ഷികളെ ഫിൽട്ടർ ചെയ്യാം, അവരുടെ വിങ്‌സ്‌പാൻ ടൈപ്പോ തിരുത്താം, അല്ലെങ്കിൽ വിങ്‌സ്‌പാൻ മൂല്യങ്ങളിൽ ആശ്രയിക്കാത്ത ഈ അഭ്യാസങ്ങൾക്ക് അവയെ ഉൾപ്പെടുത്താം.
ബാർ ചാർട്ട് സൃഷ്ടിക്കാൻ, നിങ്ങൾ ശ്രദ്ധിക്കേണ്ട ഡാറ്റ തിരഞ്ഞെടുക്കാം. ബാർ ചാർട്ടുകൾ കച്ച ഡാറ്റയിൽ നിന്നു സൃഷ്ടിക്കാം:
```python
birds.plot(x='Category',
kind='bar',
stacked=True,
title='Birds of Minnesota')
```
![full data as a bar chart](../../../../translated_images/full-data-bar-02.aaa3fda71c63ed564b917841a1886c177dd9a26424142e510c0c0498fd6ca160.ml.png)
എന്നാൽ ഈ ബാർ ചാർട്ട് വായിക്കാൻ കഴിയുന്നില്ല, കാരണം ഗ്രൂപ്പുചെയ്യാത്ത ഡാറ്റ വളരെ കൂടുതലാണ്. നിങ്ങൾ പ്ലോട്ട് ചെയ്യാൻ ആഗ്രഹിക്കുന്ന ഡാറ്റ മാത്രം തിരഞ്ഞെടുക്കണം, അതിനാൽ പക്ഷികളുടെ വിഭാഗം അടിസ്ഥാനമാക്കി നീളം നോക്കാം.
നിങ്ങളുടെ ഡാറ്റയിൽ നിന്ന് പക്ഷികളുടെ വിഭാഗം മാത്രം ഉൾപ്പെടുത്താൻ ഫിൽട്ടർ ചെയ്യുക.
✅ Pandas ഉപയോഗിച്ച് ഡാറ്റ കൈകാര്യം ചെയ്യുകയും Matplotlib ഉപയോഗിച്ച് ചാർട്ട് സൃഷ്ടിക്കുകയും ചെയ്യുന്നതാണ് ശ്രദ്ധിക്കുക.
വിവിധ വിഭാഗങ്ങൾ 많아서, ഈ ചാർട്ട് ലംബമായി പ്രദർശിപ്പിച്ച് ഉയരം ക്രമീകരിക്കാം:
```python
category_count = birds.value_counts(birds['Category'].values, sort=True)
plt.rcParams['figure.figsize'] = [6, 12]
category_count.plot.barh()
```
![category and length](../../../../translated_images/category-counts-02.0b9a0a4de42275ae5096d0f8da590d8bf520d9e7e40aad5cc4fc8d276480cc32.ml.png)
ഈ ബാർ ചാർട്ട് ഓരോ വിഭാഗത്തിലും പക്ഷികളുടെ എണ്ണം നല്ല കാഴ്ച നൽകുന്നു. ഒരു നിമിഷത്തിൽ, ഈ പ്രദേശത്തെ ഏറ്റവും വലിയ പക്ഷി എണ്ണം Ducks/Geese/Waterfowl വിഭാഗത്തിലാണ് എന്ന് കാണാം. മിന്നസോട്ട '10,000 തടാകങ്ങളുടെ നാട്' ആകുന്നതിനാൽ ഇത് അത്ഭുതമല്ല!
✅ ഈ ഡാറ്റാസെറ്റിൽ മറ്റ് എണ്ണങ്ങൾ പരീക്ഷിച്ച് നോക്കൂ. എന്തെങ്കിലും നിങ്ങളെ അത്ഭുതപ്പെടുത്തുന്നുണ്ടോ?
## ഡാറ്റ താരതമ്യം ചെയ്യൽ
പുതിയ അക്ഷങ്ങൾ സൃഷ്ടിച്ച് ഗ്രൂപ്പുചെയ്ത ഡാറ്റയുടെ വ്യത്യസ്ത താരതമ്യങ്ങൾ പരീക്ഷിക്കാം. പക്ഷിയുടെ MaxLength-നെ അതിന്റെ വിഭാഗം അടിസ്ഥാനമാക്കി താരതമ്യം ചെയ്യുക:
```python
maxlength = birds['MaxLength']
plt.barh(y=birds['Category'], width=maxlength)
plt.rcParams['figure.figsize'] = [6, 12]
plt.show()
```
![comparing data](../../../../translated_images/category-length-02.7304bf519375c9807d8165cc7ec60dd2a60f7b365b23098538e287d89adb7d76.ml.png)
ഇവിടെ എന്തും അത്ഭുതപ്പെടുത്തുന്നില്ല: ഹമ്മിംഗ്‌ബേർഡുകൾക്ക് പെലിക്കാനുകളോ ഗീസുകളോ അപേക്ഷിച്ച് ഏറ്റവും കുറഞ്ഞ MaxLength ഉണ്ട്. ഡാറ്റ ലജിക്കൽ ആകുമ്പോൾ നല്ലതാണ്!
ഡാറ്റ സൂപ്പർഇംപോസിംഗ് ചെയ്ത് ബാർ ചാർട്ടുകളുടെ കൂടുതൽ രസകരമായ ദൃശ്യവൽക്കരണങ്ങൾ സൃഷ്ടിക്കാം. ഒരു പക്ഷി വിഭാഗത്തിൽ കുറഞ്ഞതും പരമാവതുമായ നീളം സൂപ്പർഇംപോസ് ചെയ്യാം:
```python
minLength = birds['MinLength']
maxLength = birds['MaxLength']
category = birds['Category']
plt.barh(category, maxLength)
plt.barh(category, minLength)
plt.show()
```
ഈ പ്ലോട്ടിൽ, ഓരോ പക്ഷി വിഭാഗത്തിന്റെയും കുറഞ്ഞ നീളം, പരമാവധി നീളം കാണാം. ഈ ഡാറ്റ പ്രകാരം, പക്ഷി വലുതായാൽ, അതിന്റെ നീളം വ്യത്യാസവും വലുതാണ് എന്ന് പറയാം. അത്ഭുതകരം!
![superimposed values](../../../../translated_images/superimposed-02.f03058536baeb2ed7864f01102538464d4c2fd7ade881ddd7d5ba74dc5d2fdae.ml.png)
## 🚀 ചലഞ്ച്
ഈ പക്ഷി ഡാറ്റാസെറ്റ് ഒരു പ്രത്യേക പരിസ്ഥിതിയിലെ വിവിധ തരത്തിലുള്ള പക്ഷികളെക്കുറിച്ചുള്ള ധാരാളം വിവരങ്ങൾ നൽകുന്നു. ഇന്റർനെറ്റിൽ തിരയുക, മറ്റ് പക്ഷി-കേന്ദ്രിത ഡാറ്റാസെറ്റുകൾ കണ്ടെത്താൻ ശ്രമിക്കുക. ഈ പക്ഷികളെക്കുറിച്ചുള്ള ചാർട്ടുകളും ഗ്രാഫുകളും നിർമ്മിച്ച് നിങ്ങൾ അറിയാത്ത വസ്തുതകൾ കണ്ടെത്താൻ അഭ്യാസം ചെയ്യുക.
## [പാഠം ശേഷം ക്വിസ്](https://ff-quizzes.netlify.app/en/ds/quiz/17)
## അവലോകനം & സ്വയം പഠനം
ഈ ആദ്യ പാഠം Matplotlib ഉപയോഗിച്ച് അളവുകൾ ദൃശ്യവൽക്കരിക്കുന്നതിനെക്കുറിച്ച് ചില വിവരങ്ങൾ നൽകി. ദൃശ്യവൽക്കരണത്തിനായി ഡാറ്റാസെറ്റുകളുമായി പ്രവർത്തിക്കുന്ന മറ്റ് മാർഗങ്ങൾക്കായി കുറച്ച് ഗവേഷണം ചെയ്യുക. [Plotly](https://github.com/plotly/plotly.py) ഒരു ലൈബ്രറിയാണ്, ഇത് ഈ പാഠങ്ങളിൽ ഉൾപ്പെടുത്തുന്നില്ല, അതിനാൽ അത് എന്ത് നൽകുന്നു എന്ന് നോക്കുക.
## അസൈൻമെന്റ്
[ലൈനുകൾ, സ്കാറ്ററുകൾ, ബാറുകൾ](assignment.md)
---
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
**അസൂയാ**:
ഈ രേഖ AI വിവർത്തന സേവനം [Co-op Translator](https://github.com/Azure/co-op-translator) ഉപയോഗിച്ച് വിവർത്തനം ചെയ്തതാണ്. നാം കൃത്യതയ്ക്ക് ശ്രമിച്ചെങ്കിലും, സ്വയം പ്രവർത്തിക്കുന്ന വിവർത്തനങ്ങളിൽ പിശകുകൾ അല്ലെങ്കിൽ തെറ്റുകൾ ഉണ്ടാകാമെന്ന് ദയവായി ശ്രദ്ധിക്കുക. അതിന്റെ മാതൃഭാഷയിലുള്ള യഥാർത്ഥ രേഖ അധികാരപരമായ ഉറവിടമായി കണക്കാക്കണം. നിർണായക വിവരങ്ങൾക്ക്, പ്രൊഫഷണൽ മനുഷ്യ വിവർത്തനം ശുപാർശ ചെയ്യപ്പെടുന്നു. ഈ വിവർത്തനത്തിന്റെ ഉപയോഗത്തിൽ നിന്നുണ്ടാകുന്ന ഏതെങ്കിലും തെറ്റിദ്ധാരണകൾക്കോ തെറ്റായ വ്യാഖ്യാനങ്ങൾക്കോ ഞങ്ങൾ ഉത്തരവാദികളല്ല.
<!-- CO-OP TRANSLATOR DISCLAIMER END -->

@ -0,0 +1,27 @@
<!--
CO_OP_TRANSLATOR_METADATA:
{
"original_hash": "ad163c4fda72c8278280b61cad317ff4",
"translation_date": "2025-12-19T16:17:19+00:00",
"source_file": "3-Data-Visualization/09-visualization-quantities/assignment.md",
"language_code": "ml"
}
-->
# ലൈനുകൾ, സ്‌കാറ്ററുകൾ, ബാറുകൾ
## നിർദ്ദേശങ്ങൾ
ഈ പാഠത്തിൽ, നിങ്ങൾ ലൈന്ചാർട്ടുകൾ, സ്‌കാറ്റർപ്ലോട്ടുകൾ, ബാർ ചാർട്ടുകൾ ഉപയോഗിച്ച് ഈ ഡാറ്റാസെറ്റിനെക്കുറിച്ചുള്ള രസകരമായ വസ്തുതകൾ കാണിച്ചു. ഈ അസൈൻമെന്റിൽ, ഒരു നിശ്ചിത പക്ഷിയുടെ ഒരു വസ്തുത കണ്ടെത്താൻ ഡാറ്റാസെറ്റിൽ കൂടുതൽ ആഴത്തിൽ തിരയുക. ഉദാഹരണത്തിന്, സ്നോ ഗീസിനെക്കുറിച്ചുള്ള എല്ലാ രസകരമായ ഡാറ്റയും ദൃശ്യവൽക്കരിക്കുന്ന ഒരു നോട്ട്‌ബുക്ക് സൃഷ്ടിക്കുക. മുകളിൽ പരാമർശിച്ച മൂന്ന് പ്ലോട്ടുകളും ഉപയോഗിച്ച് നിങ്ങളുടെ നോട്ട്‌ബുക്കിൽ ഒരു കഥ പറയുക.
## റൂബ്രിക്
Exemplary | Adequate | Needs Improvement
--- | --- | -- |
ഒരു നോട്ട്‌ബുക്ക് നല്ല അനോട്ടേഷനുകളോടും, ഉറച്ച കഥ പറയലോടും, ആകർഷകമായ ഗ്രാഫുകളോടും കൂടി അവതരിപ്പിക്കുന്നു | നോട്ട്‌ബുക്കിൽ ഈ ഘടകങ്ങളിൽ ഒന്നോ കുറവാണ് | നോട്ട്‌ബുക്കിൽ ഈ ഘടകങ്ങളിൽ രണ്ട് കുറവാണ്
---
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
**അസൂയാ**:
ഈ രേഖ AI വിവർത്തന സേവനം [Co-op Translator](https://github.com/Azure/co-op-translator) ഉപയോഗിച്ച് വിവർത്തനം ചെയ്തതാണ്. നാം കൃത്യതയ്ക്ക് ശ്രമിച്ചിട്ടുണ്ടെങ്കിലും, സ്വയം പ്രവർത്തിക്കുന്ന വിവർത്തനങ്ങളിൽ പിശകുകൾ അല്ലെങ്കിൽ തെറ്റുകൾ ഉണ്ടാകാമെന്ന് ദയവായി ശ്രദ്ധിക്കുക. അതിന്റെ മാതൃഭാഷയിലുള്ള യഥാർത്ഥ രേഖ അധികാരപരമായ ഉറവിടമായി കണക്കാക്കണം. നിർണായക വിവരങ്ങൾക്ക്, പ്രൊഫഷണൽ മനുഷ്യ വിവർത്തനം ശുപാർശ ചെയ്യപ്പെടുന്നു. ഈ വിവർത്തനത്തിന്റെ ഉപയോഗത്തിൽ നിന്നുണ്ടാകുന്ന ഏതെങ്കിലും തെറ്റിദ്ധാരണകൾക്കോ തെറ്റായ വ്യാഖ്യാനങ്ങൾക്കോ ഞങ്ങൾ ഉത്തരവാദികളല്ല.
<!-- CO-OP TRANSLATOR DISCLAIMER END -->

@ -0,0 +1,48 @@
{
"cells": [
{
"cell_type": "markdown",
"source": [
"# പക്ഷികളെക്കുറിച്ച് പഠിക്കാം\n"
],
"metadata": {}
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"---\n\n<!-- CO-OP TRANSLATOR DISCLAIMER START -->\n**അസൂയാ**: \nഈ രേഖ AI വിവർത്തന സേവനം [Co-op Translator](https://github.com/Azure/co-op-translator) ഉപയോഗിച്ച് വിവർത്തനം ചെയ്തതാണ്. നാം കൃത്യതയ്ക്ക് ശ്രമിച്ചിട്ടുണ്ടെങ്കിലും, സ്വയം പ്രവർത്തിക്കുന്ന വിവർത്തനങ്ങളിൽ പിശകുകൾ അല്ലെങ്കിൽ തെറ്റുകൾ ഉണ്ടാകാമെന്ന് ദയവായി ശ്രദ്ധിക്കുക. അതിന്റെ മാതൃഭാഷയിലുള്ള യഥാർത്ഥ രേഖ അധികാരപരമായ ഉറവിടമായി കണക്കാക്കപ്പെടണം. നിർണായക വിവരങ്ങൾക്ക്, പ്രൊഫഷണൽ മനുഷ്യ വിവർത്തനം ശുപാർശ ചെയ്യപ്പെടുന്നു. ഈ വിവർത്തനം ഉപയോഗിക്കുന്നതിൽ നിന്നുണ്ടാകുന്ന ഏതെങ്കിലും തെറ്റിദ്ധാരണകൾക്കോ തെറ്റായ വ്യാഖ്യാനങ്ങൾക്കോ ഞങ്ങൾ ഉത്തരവാദികളല്ല.\n<!-- CO-OP TRANSLATOR DISCLAIMER END -->\n"
]
}
],
"metadata": {
"orig_nbformat": 4,
"language_info": {
"name": "python",
"version": "3.7.0",
"mimetype": "text/x-python",
"codemirror_mode": {
"name": "ipython",
"version": 3
},
"pygments_lexer": "ipython3",
"nbconvert_exporter": "python",
"file_extension": ".py"
},
"kernelspec": {
"name": "python3",
"display_name": "Python 3.7.0 64-bit"
},
"interpreter": {
"hash": "70b38d7a306a849643e446cd70466270a13445e5987dfa1344ef2b127438fa4d"
},
"coopTranslator": {
"original_hash": "33e5c5d3f0630388e20f2e161bd4cdf3",
"translation_date": "2025-12-19T17:36:43+00:00",
"source_file": "3-Data-Visualization/09-visualization-quantities/notebook.ipynb",
"language_code": "ml"
}
},
"nbformat": 4,
"nbformat_minor": 2
}

File diff suppressed because one or more lines are too long

@ -0,0 +1,220 @@
<!--
CO_OP_TRANSLATOR_METADATA:
{
"original_hash": "80a20467e046d312809d008395051fc7",
"translation_date": "2025-12-19T15:54:16+00:00",
"source_file": "3-Data-Visualization/10-visualization-distributions/README.md",
"language_code": "ml"
}
-->
# വിതരണങ്ങൾ ദൃശ്യവൽക്കരിക്കൽ
|![ Sketchnote by [(@sketchthedocs)](https://sketchthedocs.dev) ](../../sketchnotes/10-Visualizing-Distributions.png)|
|:---:|
| വിതരണങ്ങൾ ദൃശ്യവൽക്കരിക്കൽ - _Sketchnote by [@nitya](https://twitter.com/nitya)_ |
മുൻപത്തെ പാഠത്തിൽ, മിന്നസോട്ടയുടെ പക്ഷികളെക്കുറിച്ചുള്ള ഒരു ഡാറ്റാസെറ്റിനെക്കുറിച്ച് ചില രസകരമായ വസ്തുതകൾ നിങ്ങൾ പഠിച്ചു. ഔട്ട്‌ലൈയർമാരെ ദൃശ്യവൽക്കരിച്ച് ചില തെറ്റായ ഡാറ്റ കണ്ടെത്തി, കൂടാതെ പക്ഷികളുടെ പരമാവധി നീളത്തിന്റെ അടിസ്ഥാനത്തിൽ പക്ഷി വിഭാഗങ്ങൾ തമ്മിലുള്ള വ്യത്യാസങ്ങൾ നോക്കി.
## [പാഠം മുൻകൂർ ക്വിസ്](https://ff-quizzes.netlify.app/en/ds/quiz/18)
## പക്ഷികളുടെ ഡാറ്റാസെറ്റ് പരിശോധിക്കുക
ഡാറ്റയിൽ കൂടുതൽ ആഴത്തിൽ നോക്കാനുള്ള മറ്റൊരു മാർഗം അതിന്റെ വിതരണത്തെ, അല്ലെങ്കിൽ ഡാറ്റ ഒരു അക്ഷം അനുസരിച്ച് എങ്ങനെ ക്രമീകരിച്ചിരിക്കുന്നുവെന്ന് നോക്കുകയാണ്. ഉദാഹരണത്തിന്, മിന്നസോട്ടയിലെ പക്ഷികളുടെ പരമാവധി വിങ്‌സ്‌പാൻ അല്ലെങ്കിൽ പരമാവധി ശരീരഭാരം എന്നിങ്ങനെ ഈ ഡാറ്റാസെറ്റിന്റെ പൊതുവായ വിതരണത്തെക്കുറിച്ച് നിങ്ങൾ അറിയാൻ ആഗ്രഹിക്കാം.
ഈ ഡാറ്റാസെറ്റിലെ ഡാറ്റയുടെ വിതരണങ്ങളെക്കുറിച്ച് ചില വസ്തുതകൾ കണ്ടെത്താം. ഈ പാഠം ഫോൾഡറിന്റെ റൂട്ടിലുള്ള _notebook.ipynb_ ഫയലിൽ, Pandas, Matplotlib, നിങ്ങളുടെ ഡാറ്റ എന്നിവ ഇറക്കുമതി ചെയ്യുക:
```python
import pandas as pd
import matplotlib.pyplot as plt
birds = pd.read_csv('../../data/birds.csv')
birds.head()
```
| | Name | ScientificName | Category | Order | Family | Genus | ConservationStatus | MinLength | MaxLength | MinBodyMass | MaxBodyMass | MinWingspan | MaxWingspan |
| ---: | :--------------------------- | :--------------------- | :-------------------- | :----------- | :------- | :---------- | :----------------- | --------: | --------: | ----------: | ----------: | ----------: | ----------: |
| 0 | Black-bellied whistling-duck | Dendrocygna autumnalis | Ducks/Geese/Waterfowl | Anseriformes | Anatidae | Dendrocygna | LC | 47 | 56 | 652 | 1020 | 76 | 94 |
| 1 | Fulvous whistling-duck | Dendrocygna bicolor | Ducks/Geese/Waterfowl | Anseriformes | Anatidae | Dendrocygna | LC | 45 | 53 | 712 | 1050 | 85 | 93 |
| 2 | Snow goose | Anser caerulescens | Ducks/Geese/Waterfowl | Anseriformes | Anatidae | Anser | LC | 64 | 79 | 2050 | 4050 | 135 | 165 |
| 3 | Ross's goose | Anser rossii | Ducks/Geese/Waterfowl | Anseriformes | Anatidae | Anser | LC | 57.3 | 64 | 1066 | 1567 | 113 | 116 |
| 4 | Greater white-fronted goose | Anser albifrons | Ducks/Geese/Waterfowl | Anseriformes | Anatidae | Anser | LC | 64 | 81 | 1930 | 3310 | 130 | 165 |
സാധാരണയായി, മുൻപത്തെ പാഠത്തിൽ ചെയ്തതുപോലെ സ്കാറ്റർ പ്ലോട്ട് ഉപയോഗിച്ച് ഡാറ്റ എങ്ങനെ വിതരണം ചെയ്തിട്ടുള്ളതെന്ന് നിങ്ങൾക്ക് വേഗത്തിൽ നോക്കാം:
```python
birds.plot(kind='scatter',x='MaxLength',y='Order',figsize=(12,8))
plt.title('Max Length per Order')
plt.ylabel('Order')
plt.xlabel('Max Length')
plt.show()
```
![max length per order](../../../../translated_images/scatter-wb.9d98b0ed7f0388af979441853361a11df5f518f5307938a503ca7913e986111b.ml.png)
ഇത് ഓരോ പക്ഷി ഓർഡറിനും ശരീര നീളത്തിന്റെ പൊതുവായ വിതരണത്തിന്റെ ഒരു അവലോകനമാണ് നൽകുന്നത്, പക്ഷേ യഥാർത്ഥ വിതരണങ്ങൾ പ്രദർശിപ്പിക്കാൻ ഇത് ഏറ്റവും അനുയോജ്യമായ മാർഗം അല്ല. ആ ജോലി സാധാരണയായി ഹിസ്റ്റോഗ്രാം സൃഷ്ടിച്ച് നിർവഹിക്കുന്നു.
## ഹിസ്റ്റോഗ്രാമുകളുമായി പ്രവർത്തിക്കൽ
Matplotlib ഡാറ്റ വിതരണങ്ങൾ ദൃശ്യവൽക്കരിക്കാൻ വളരെ നല്ല മാർഗങ്ങൾ നൽകുന്നു, പ്രത്യേകിച്ച് ഹിസ്റ്റോഗ്രാമുകൾ ഉപയോഗിച്ച്. ഈ തരത്തിലുള്ള ചാർട്ട് ഒരു ബാർ ചാർട്ടുപോലെയാണ്, ബാറുകളുടെ ഉയർച്ചയും താഴ്‌ച്ചയും വഴി വിതരണത്തെ കാണിക്കുന്നു. ഹിസ്റ്റോഗ്രാം നിർമ്മിക്കാൻ, നിങ്ങൾക്ക് സംഖ്യാത്മക ഡാറ്റ വേണം. ഹിസ്റ്റോഗ്രാം നിർമ്മിക്കാൻ, 'hist' എന്ന കിൻഡ് നിർവചിച്ച് ഒരു ചാർട്ട് പ്ലോട്ട് ചെയ്യാം. ഈ ചാർട്ട് മുഴുവൻ ഡാറ്റാസെറ്റിലെ MaxBodyMass ന്റെ വിതരണത്തെ കാണിക്കുന്നു. ഡാറ്റയുടെ അറേയെ ചെറിയ ബിനുകളായി വിഭജിച്ച്, ഡാറ്റയുടെ മൂല്യങ്ങളുടെ വിതരണത്തെ പ്രദർശിപ്പിക്കാം:
```python
birds['MaxBodyMass'].plot(kind = 'hist', bins = 10, figsize = (12,12))
plt.show()
```
![distribution over the entire dataset](../../../../translated_images/dist1-wb.0d0cac82e2974fbbec635826fefead401af795f82e2279e2e2678bf2c117d827.ml.png)
നിങ്ങൾക്ക് കാണാമല്ലോ, ഈ ഡാറ്റാസെറ്റിലെ 400+ പക്ഷികളിൽ ഭൂരിഭാഗവും അവരുടെ പരമാവധി ശരീരഭാരം 2000-ൽ താഴെ ഉള്ള പരിധിയിലാണ്. `bins` പാരാമീറ്റർ 30 പോലുള്ള ഉയർന്ന സംഖ്യയാക്കി മാറ്റി ഡാറ്റയിൽ കൂടുതൽ洞察ം നേടാം:
```python
birds['MaxBodyMass'].plot(kind = 'hist', bins = 30, figsize = (12,12))
plt.show()
```
![distribution over the entire dataset with larger bins param](../../../../translated_images/dist2-wb.2c0a7a3499b2fbf561e9f93b69f265dfc538dc78f6de15088ba84a88152e26ba.ml.png)
ഈ ചാർട്ട് കൂടുതൽ സൂക്ഷ്മമായ രീതിയിൽ വിതരണത്തെ കാണിക്കുന്നു. ഇടത്തരം കുറവുള്ള ഒരു ചാർട്ട് സൃഷ്ടിക്കാൻ, നിങ്ങൾക്ക് ഒരു നിശ്ചിത പരിധിയിലുള്ള ഡാറ്റ മാത്രം തിരഞ്ഞെടുക്കണം:
ശരീരഭാരം 60-ൽ താഴെയുള്ള പക്ഷികളെ മാത്രം ഫിൽട്ടർ ചെയ്ത് 40 `bins` കാണിക്കുക:
```python
filteredBirds = birds[(birds['MaxBodyMass'] > 1) & (birds['MaxBodyMass'] < 60)]
filteredBirds['MaxBodyMass'].plot(kind = 'hist',bins = 40,figsize = (12,12))
plt.show()
```
![filtered histogram](../../../../translated_images/dist3-wb.64b88db7f9780200bd486a2c2a3252548dd439672dbd3f778193db7f654b100c.ml.png)
✅ മറ്റ് ഫിൽട്ടറുകളും ഡാറ്റ പോയിന്റുകളും പരീക്ഷിക്കുക. ഡാറ്റയുടെ മുഴുവൻ വിതരണവും കാണാൻ, `['MaxBodyMass']` ഫിൽട്ടർ നീക്കം ചെയ്ത് ലേബൽ ചെയ്ത വിതരണങ്ങൾ കാണിക്കുക.
ഹിസ്റ്റോഗ്രാം ചില നല്ല നിറവും ലേബലിംഗും നൽകുന്നു:
രണ്ട് വിതരണങ്ങൾ തമ്മിലുള്ള ബന്ധം താരതമ്യം ചെയ്യാൻ 2D ഹിസ്റ്റോഗ്രാം സൃഷ്ടിക്കുക. `MaxBodyMass` vs. `MaxLength` താരതമ്യം ചെയ്യാം. Matplotlib കൂടുതൽ പ്രകാശമുള്ള നിറങ്ങൾ ഉപയോഗിച്ച് സമന്വയം കാണിക്കുന്ന ഒരു ഇൻബിൽറ്റ് മാർഗം നൽകുന്നു:
```python
x = filteredBirds['MaxBodyMass']
y = filteredBirds['MaxLength']
fig, ax = plt.subplots(tight_layout=True)
hist = ax.hist2d(x, y)
```
ഈ രണ്ട് ഘടകങ്ങൾ തമ്മിൽ പ്രതീക്ഷിക്കപ്പെട്ട ബന്ധം ഒരു പ്രതീക്ഷിച്ച അക്ഷം അനുസരിച്ച് കാണപ്പെടുന്നു, പ്രത്യേകിച്ച് ശക്തമായ ഒരു സമന്വയ ബിന്ദു:
![2D plot](../../../../translated_images/2D-wb.ae22fdd33936507a41e3af22e11e4903b04a9be973b23a4e05214efaccfd66c8.ml.png)
ഹിസ്റ്റോഗ്രാമുകൾ സംഖ്യാത്മക ഡാറ്റയ്ക്ക് സാധാരണയായി നല്ലതാണ്. ടെക്സ്റ്റ് ഡാറ്റ അനുസരിച്ച് വിതരണങ്ങൾ കാണേണ്ടത് എങ്കിൽ?
## ടെക്സ്റ്റ് ഡാറ്റ ഉപയോഗിച്ച് വിതരണങ്ങൾ പരിശോധിക്കുക
ഈ ഡാറ്റാസെറ്റിൽ പക്ഷി വിഭാഗം, ജനുസ്, സ്പീഷീസ്, കുടുംബം, സംരക്ഷണ നില എന്നിവയെക്കുറിച്ചും നല്ല വിവരങ്ങൾ ഉൾക്കൊള്ളുന്നു. സംരക്ഷണ വിവരങ്ങൾ പരിശോധിക്കാം. പക്ഷികളുടെ സംരക്ഷണ നില അനുസരിച്ച് വിതരണങ്ങൾ എങ്ങനെയാണ്?
> ✅ ഡാറ്റാസെറ്റിൽ, സംരക്ഷണ നില വിവരിക്കാൻ പല ചുരുക്കപ്പേരുകളും ഉപയോഗിക്കുന്നു. ഈ ചുരുക്കപ്പേരുകൾ [IUCN Red List Categories](https://www.iucnredlist.org/) എന്ന സംഘടനയിൽ നിന്നാണ്.
>
> - CR: അത്യന്തം അപകടത്തിൽ
> - EN: അപകടത്തിൽ
> - EX: നശിച്ചുപോയ
> - LC: കുറഞ്ഞ ആശങ്ക
> - NT: അടുത്ത ഭീഷണി
> - VU: അപകടസാധ്യതയുള്ള
ഇവ ടെക്സ്റ്റ് അടിസ്ഥാനമാക്കിയ മൂല്യങ്ങളാണ്, അതിനാൽ ഹിസ്റ്റോഗ്രാം സൃഷ്ടിക്കാൻ ട്രാൻസ്ഫോം ചെയ്യേണ്ടതുണ്ട്. filteredBirds ഡാറ്റാഫ്രെയിമിൽ, അതിന്റെ സംരക്ഷണ നിലയും കുറഞ്ഞ വിങ്‌സ്‌പാനും പ്രദർശിപ്പിക്കുക. നിങ്ങൾ എന്ത് കാണുന്നു?
```python
x1 = filteredBirds.loc[filteredBirds.ConservationStatus=='EX', 'MinWingspan']
x2 = filteredBirds.loc[filteredBirds.ConservationStatus=='CR', 'MinWingspan']
x3 = filteredBirds.loc[filteredBirds.ConservationStatus=='EN', 'MinWingspan']
x4 = filteredBirds.loc[filteredBirds.ConservationStatus=='NT', 'MinWingspan']
x5 = filteredBirds.loc[filteredBirds.ConservationStatus=='VU', 'MinWingspan']
x6 = filteredBirds.loc[filteredBirds.ConservationStatus=='LC', 'MinWingspan']
kwargs = dict(alpha=0.5, bins=20)
plt.hist(x1, **kwargs, color='red', label='Extinct')
plt.hist(x2, **kwargs, color='orange', label='Critically Endangered')
plt.hist(x3, **kwargs, color='yellow', label='Endangered')
plt.hist(x4, **kwargs, color='green', label='Near Threatened')
plt.hist(x5, **kwargs, color='blue', label='Vulnerable')
plt.hist(x6, **kwargs, color='gray', label='Least Concern')
plt.gca().set(title='Conservation Status', ylabel='Min Wingspan')
plt.legend();
```
![wingspan and conservation collation](../../../../translated_images/histogram-conservation-wb.3c40450eb072c14de7a1a3ec5c0fcba4995531024760741b392911b567fd8b70.ml.png)
കുറഞ്ഞ വിങ്‌സ്‌പാനും സംരക്ഷണ നിലക്കും നല്ല ബന്ധമില്ലെന്ന് തോന്നുന്നു. ഈ രീതിയിൽ ഡാറ്റാസെറ്റിലെ മറ്റ് ഘടകങ്ങളും പരീക്ഷിക്കുക. നിങ്ങൾക്ക് ഏതെങ്കിലും ബന്ധം കണ്ടെത്താമോ?
## ഡെൻസിറ്റി പ്ലോട്ടുകൾ
ഇതുവരെ നോക്കിയ ഹിസ്റ്റോഗ്രാമുകൾ 'സ്റ്റെപ്പ്ഡ്' ആണെന്നും ഒരു മൃദുവായ വക്രരേഖ പോലെ ഒഴുകുന്നില്ലെന്നും നിങ്ങൾ ശ്രദ്ധിച്ചിരിക്കാം. കൂടുതൽ മൃദുവായ ഡെൻസിറ്റി ചാർട്ട് കാണിക്കാൻ, ഡെൻസിറ്റി പ്ലോട്ട് പരീക്ഷിക്കാം.
ഡെൻസിറ്റി പ്ലോട്ടുകളുമായി പ്രവർത്തിക്കാൻ, പുതിയ പ്ലോട്ടിംഗ് ലൈബ്രറി [Seaborn](https://seaborn.pydata.org/generated/seaborn.kdeplot.html) പരിചയപ്പെടുക.
Seaborn ലോഡ് ചെയ്ത് ഒരു അടിസ്ഥാന ഡെൻസിറ്റി പ്ലോട്ട് പരീക്ഷിക്കുക:
```python
import seaborn as sns
import matplotlib.pyplot as plt
sns.kdeplot(filteredBirds['MinWingspan'])
plt.show()
```
![Density plot](../../../../translated_images/density1.8801043bd4af2567b0f706332b5853c7614e5e4b81b457acc27eb4e092a65cbd.ml.png)
മുൻപത്തെ കുറഞ്ഞ വിങ്‌സ്‌പാൻ ഡാറ്റയുടെ പ്ലോട്ടിനെപ്പോലെ ഇത് കാണാം; ഇത് കുറച്ച് മൃദുവാണ്. Seaborn ഡോക്യുമെന്റേഷനുസരിച്ച്, "ഹിസ്റ്റോഗ്രാമിനോട് താരതമ്യപ്പെടുത്തുമ്പോൾ, KDE ഒരു പ്ലോട്ട് കുറച്ച് കുറവുള്ളതും കൂടുതൽ വ്യാഖ്യാനയോഗ്യവുമാകാം, പ്രത്യേകിച്ച് പല വിതരണങ്ങളും വരച്ചപ്പോൾ. എന്നാൽ അടിസ്ഥാന വിതരണത്തിന് അതിരുകൾ ഉണ്ടെങ്കിൽ അല്ലെങ്കിൽ മൃദുവായില്ലെങ്കിൽ, ഇത് വക്രതകൾ സൃഷ്ടിക്കാം. ഹിസ്റ്റോഗ്രാമുപോലെ, പ്രതിനിധാനത്തിന്റെ ഗുണമേന്മയും നല്ല മൃദുവായ പാരാമീറ്ററുകളുടെ തിരഞ്ഞെടുപ്പിൽ ആശ്രയിച്ചിരിക്കുന്നു." [source](https://seaborn.pydata.org/generated/seaborn.kdeplot.html) മറ്റൊരു വാക്കിൽ, ഔട്ട്‌ലൈയർമാർ എപ്പോഴും നിങ്ങളുടെ ചാർട്ടുകൾക്ക് പ്രശ്നങ്ങൾ സൃഷ്ടിക്കും.
നിങ്ങൾ രണ്ടാമത്തെ ചാർട്ടിൽ സൃഷ്ടിച്ച ജാഗ്ഗഡ് MaxBodyMass ലൈനിനെ വീണ്ടും കാണാൻ ആഗ്രഹിക്കുന്നുവെങ്കിൽ, ഈ രീതിയിൽ അതിനെ വളരെ മൃദുവായി പുനഃസൃഷ്ടിക്കാം:
```python
sns.kdeplot(filteredBirds['MaxBodyMass'])
plt.show()
```
![smooth bodymass line](../../../../translated_images/density2.8e7647257060ff544a1aaded57e8dd1887586bfe340139e9b77ac1e5287f7977.ml.png)
മൃദുവായെങ്കിലും അത്ര മൃദുവായില്ലാത്ത ഒരു ലൈനിനായി, `bw_adjust` പാരാമീറ്റർ എഡിറ്റ് ചെയ്യുക:
```python
sns.kdeplot(filteredBirds['MaxBodyMass'], bw_adjust=.2)
plt.show()
```
![less smooth bodymass line](../../../../translated_images/density3.84ae27da82f31e6b83ad977646f029a1d21186574d7581facd70123b3eb257ee.ml.png)
✅ ഈ തരത്തിലുള്ള പ്ലോട്ടിനുള്ള പാരാമീറ്ററുകൾക്കുറിച്ച് വായിച്ച് പരീക്ഷിക്കുക!
ഈ തരത്തിലുള്ള ചാർട്ടുകൾ മനോഹരമായ വ്യാഖ്യാനാത്മക ദൃശ്യവൽക്കരണങ്ങൾ നൽകുന്നു. കുറച്ച് കോഡ് വരികളിൽ, ഉദാഹരണത്തിന്, ഓരോ പക്ഷി ഓർഡറിനും പരമാവധി ശരീരഭാരം ഡെൻസിറ്റി കാണിക്കാം:
```python
sns.kdeplot(
data=filteredBirds, x="MaxBodyMass", hue="Order",
fill=True, common_norm=False, palette="crest",
alpha=.5, linewidth=0,
)
```
![bodymass per order](../../../../translated_images/density4.e9d6c033f15c500fd33df94cb592b9f5cf1ed2a3d213c448a3f9e97ba39573ce.ml.png)
ഒരേ ചാർട്ടിൽ പല വേരിയബിളുകളുടെ ഡെൻസിറ്റികളും മാപ്പ് ചെയ്യാം. ഒരു പക്ഷിയുടെ MaxLength, MinLength സംരക്ഷണ നിലയുമായി താരതമ്യം ചെയ്യുക:
```python
sns.kdeplot(data=filteredBirds, x="MinLength", y="MaxLength", hue="ConservationStatus")
```
![multiple densities, superimposed](../../../../translated_images/multi.56548caa9eae8d0fd9012a8586295538c7f4f426e2abc714ba070e2e4b1fc2c1.ml.png)
'Vulnerable' പക്ഷികളുടെ നീളങ്ങളുടെ ക്ലസ്റ്റർ അർത്ഥവത്താണോ അല്ലയോ എന്ന് അന്വേഷിക്കുന്നത് മൂല്യമുള്ളതായിരിക്കാം.
## 🚀 ചലഞ്ച്
ഹിസ്റ്റോഗ്രാമുകൾ അടിസ്ഥാന സ്കാറ്റർപ്ലോട്ടുകൾ, ബാർ ചാർട്ടുകൾ, ലൈന്ചാർട്ടുകൾ എന്നിവയെക്കാൾ കൂടുതൽ സങ്കീർണ്ണമായ ചാർട്ടുകളാണ്. ഇന്റർനെറ്റിൽ ഹിസ്റ്റോഗ്രാമുകളുടെ നല്ല ഉദാഹരണങ്ങൾ കണ്ടെത്താൻ തിരയുക. അവ എങ്ങനെ ഉപയോഗിക്കുന്നു, എന്ത് തെളിയിക്കുന്നു, ഏത് മേഖലകളിൽ കൂടുതലായി ഉപയോഗിക്കുന്നു?
## [പാഠം ശേഷമുള്ള ക്വിസ്](https://ff-quizzes.netlify.app/en/ds/quiz/19)
## അവലോകനം & സ്വയം പഠനം
ഈ പാഠത്തിൽ, Matplotlib ഉപയോഗിച്ച് പ്രവർത്തിക്കുകയും Seaborn ഉപയോഗിച്ച് കൂടുതൽ സങ്കീർണ്ണമായ ചാർട്ടുകൾ കാണിക്കുകയും ചെയ്തു. Seaborn-ലെ `kdeplot` എന്ന "ഒറ്റ അല്ലെങ്കിൽ കൂടുതൽ ഡൈമെൻഷനുകളിൽ തുടർച്ചയായ പ്രൊബബിലിറ്റി ഡെൻസിറ്റി വളവ്" എന്നതിനെക്കുറിച്ച് കുറച്ച് ഗവേഷണം ചെയ്യുക. [ഡോക്യുമെന്റേഷൻ](https://seaborn.pydata.org/generated/seaborn.kdeplot.html) വായിച്ച് അതിന്റെ പ്രവർത്തനം മനസ്സിലാക്കുക.
## അസൈൻമെന്റ്
[നിങ്ങളുടെ കഴിവുകൾ പ്രയോഗിക്കുക](assignment.md)
---
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
**അസൂയാ**:
ഈ രേഖ AI വിവർത്തന സേവനം [Co-op Translator](https://github.com/Azure/co-op-translator) ഉപയോഗിച്ച് വിവർത്തനം ചെയ്തതാണ്. നാം കൃത്യതയ്ക്ക് ശ്രമിച്ചിട്ടുണ്ടെങ്കിലും, സ്വയം പ്രവർത്തിക്കുന്ന വിവർത്തനങ്ങളിൽ പിശകുകൾ അല്ലെങ്കിൽ തെറ്റുകൾ ഉണ്ടാകാമെന്ന് ദയവായി ശ്രദ്ധിക്കുക. അതിന്റെ മാതൃഭാഷയിലുള്ള യഥാർത്ഥ രേഖയാണ് പ്രാമാണികമായ ഉറവിടം എന്ന് പരിഗണിക്കേണ്ടതാണ്. നിർണായകമായ വിവരങ്ങൾക്ക്, പ്രൊഫഷണൽ മനുഷ്യ വിവർത്തനം ശുപാർശ ചെയ്യപ്പെടുന്നു. ഈ വിവർത്തനം ഉപയോഗിക്കുന്നതിൽ നിന്നുണ്ടാകുന്ന ഏതെങ്കിലും തെറ്റിദ്ധാരണകൾക്കോ തെറ്റായ വ്യാഖ്യാനങ്ങൾക്കോ ഞങ്ങൾ ഉത്തരവാദികളല്ല.
<!-- CO-OP TRANSLATOR DISCLAIMER END -->

@ -0,0 +1,27 @@
<!--
CO_OP_TRANSLATOR_METADATA:
{
"original_hash": "40eeb9b9f94009c537c7811f9f27f037",
"translation_date": "2025-12-19T15:57:01+00:00",
"source_file": "3-Data-Visualization/10-visualization-distributions/assignment.md",
"language_code": "ml"
}
-->
# നിങ്ങളുടെ കഴിവുകൾ പ്രയോഗിക്കുക
## നിർദ്ദേശങ്ങൾ
ഇതുവരെ, പക്ഷികളുടെ എണ്ണം மற்றும் ജനസംഖ്യാ സാന്ദ്രതയെക്കുറിച്ച് വിവരങ്ങൾ കണ്ടെത്താൻ മിന്നസോട്ട പക്ഷികൾ ഡാറ്റാസെറ്റുമായി നിങ്ങൾ പ്രവർത്തിച്ചിട്ടുണ്ട്. ഈ സാങ്കേതികവിദ്യകൾ പ്രയോഗിക്കാൻ വ്യത്യസ്തമായ ഒരു ഡാറ്റാസെറ്റ് പരീക്ഷിച്ച് പ്രാക്ടീസ് ചെയ്യുക, ഉദാഹരണത്തിന് [Kaggle](https://www.kaggle.com/) നിന്നുള്ളത്. ഈ ഡാറ്റാസെറ്റിനെക്കുറിച്ച് ഒരു കഥ പറയാൻ ഒരു നോട്ട്‌ബുക്ക് നിർമ്മിക്കുക, കൂടാതെ അതിനെക്കുറിച്ച് ചർച്ച ചെയ്യുമ്പോൾ ഹിസ്റ്റോഗ്രാമുകൾ ഉപയോഗിക്കുന്നത് ഉറപ്പാക്കുക.
## റൂബ്രിക്
Exemplary | Adequate | Needs Improvement
--- | --- | -- |
ഈ ഡാറ്റാസെറ്റിന്റെ ഉറവിടം ഉൾപ്പെടെ വിശദീകരണങ്ങളോടുകൂടിയ ഒരു നോട്ട്‌ബുക്ക് അവതരിപ്പിക്കുന്നു, കൂടാതെ ഡാറ്റയെക്കുറിച്ച് വിവരങ്ങൾ കണ്ടെത്താൻ കുറഞ്ഞത് 5 ഹിസ്റ്റോഗ്രാമുകൾ ഉപയോഗിക്കുന്നു. | അപൂർണ്ണമായ വിശദീകരണങ്ങളോ ബഗുകളോ ഉള്ള ഒരു നോട്ട്‌ബുക്ക് അവതരിപ്പിക്കുന്നു. | വിശദീകരണങ്ങളില്ലാതെ ബഗുകളുള്ള ഒരു നോട്ട്‌ബുക്ക് അവതരിപ്പിക്കുന്നു.
---
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
**അസൂയാ**:
ഈ രേഖ AI വിവർത്തന സേവനം [Co-op Translator](https://github.com/Azure/co-op-translator) ഉപയോഗിച്ച് വിവർത്തനം ചെയ്തതാണ്. നാം കൃത്യതയ്ക്ക് ശ്രമിച്ചിട്ടുണ്ടെങ്കിലും, സ്വയം പ്രവർത്തിക്കുന്ന വിവർത്തനങ്ങളിൽ പിശകുകൾ അല്ലെങ്കിൽ തെറ്റുകൾ ഉണ്ടാകാമെന്ന് ദയവായി ശ്രദ്ധിക്കുക. അതിന്റെ മാതൃഭാഷയിലുള്ള യഥാർത്ഥ രേഖ പ്രാമാണികമായ ഉറവിടമായി കണക്കാക്കണം. നിർണായക വിവരങ്ങൾക്ക്, പ്രൊഫഷണൽ മനുഷ്യ വിവർത്തനം ശുപാർശ ചെയ്യപ്പെടുന്നു. ഈ വിവർത്തനത്തിന്റെ ഉപയോഗത്തിൽ നിന്നുണ്ടാകുന്ന ഏതെങ്കിലും തെറ്റിദ്ധാരണകൾക്കോ തെറ്റായ വ്യാഖ്യാനങ്ങൾക്കോ ഞങ്ങൾ ഉത്തരവാദികളല്ല.
<!-- CO-OP TRANSLATOR DISCLAIMER END -->

@ -0,0 +1,32 @@
{
"cells": [
{
"cell_type": "markdown",
"source": [
"# പക്ഷികളുടെ വിതരണം\n"
],
"metadata": {}
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"---\n\n<!-- CO-OP TRANSLATOR DISCLAIMER START -->\n**അസൂയാപത്രം**: \nഈ രേഖ AI വിവർത്തന സേവനം [Co-op Translator](https://github.com/Azure/co-op-translator) ഉപയോഗിച്ച് വിവർത്തനം ചെയ്തതാണ്. നാം കൃത്യതയ്ക്ക് ശ്രമിച്ചിട്ടുണ്ടെങ്കിലും, സ്വയം പ്രവർത്തിക്കുന്ന വിവർത്തനങ്ങളിൽ പിശകുകൾ അല്ലെങ്കിൽ തെറ്റുകൾ ഉണ്ടാകാമെന്ന് ദയവായി ശ്രദ്ധിക്കുക. അതിന്റെ മാതൃഭാഷയിലുള്ള യഥാർത്ഥ രേഖ അധികാരപരമായ ഉറവിടമായി കണക്കാക്കപ്പെടണം. നിർണായക വിവരങ്ങൾക്ക്, പ്രൊഫഷണൽ മനുഷ്യ വിവർത്തനം ശുപാർശ ചെയ്യപ്പെടുന്നു. ഈ വിവർത്തനത്തിന്റെ ഉപയോഗത്തിൽ നിന്നുണ്ടാകുന്ന ഏതെങ്കിലും തെറ്റിദ്ധാരണകൾക്കോ തെറ്റായ വ്യാഖ്യാനങ്ങൾക്കോ ഞങ്ങൾ ഉത്തരവാദികളല്ല.\n<!-- CO-OP TRANSLATOR DISCLAIMER END -->\n"
]
}
],
"metadata": {
"orig_nbformat": 4,
"language_info": {
"name": "python"
},
"coopTranslator": {
"original_hash": "e5272cbcbffd1ddcc09e44d3d8e7e8cd",
"translation_date": "2025-12-19T17:35:17+00:00",
"source_file": "3-Data-Visualization/10-visualization-distributions/notebook.ipynb",
"language_code": "ml"
}
},
"nbformat": 4,
"nbformat_minor": 2
}

@ -0,0 +1,206 @@
<!--
CO_OP_TRANSLATOR_METADATA:
{
"original_hash": "42119bcc97bee88254e381156d770f3c",
"translation_date": "2025-12-19T16:02:29+00:00",
"source_file": "3-Data-Visualization/11-visualization-proportions/README.md",
"language_code": "ml"
}
-->
# അനുപാതങ്ങൾ ദൃശ്യവൽക്കരിക്കൽ
|![ Sketchnote by [(@sketchthedocs)](https://sketchthedocs.dev) ](../../sketchnotes/11-Visualizing-Proportions.png)|
|:---:|
|അനുപാതങ്ങൾ ദൃശ്യവൽക്കരിക്കൽ - _Sketchnote by [@nitya](https://twitter.com/nitya)_ |
ഈ പാഠത്തിൽ, നിങ്ങൾ മഷ്‌റൂമുകളെക്കുറിച്ചുള്ള ഒരു നൈസർഗിക-കേന്ദ്രിത ഡാറ്റാസെറ്റ് ഉപയോഗിച്ച് അനുപാതങ്ങൾ ദൃശ്യവൽക്കരിക്കാൻ പഠിക്കും, ഉദാഹരണത്തിന്, ഒരു ഡാറ്റാസെറ്റിൽ എത്ര തരം ഫംഗി ഉണ്ട് എന്നത്. Audubon-ൽ നിന്നുള്ള 23 സ്പീഷീസ് ഉള്ള ഗില്ലഡ് മഷ്‌റൂമുകളുടെ വിവരങ്ങൾ ഉൾക്കൊള്ളുന്ന ഒരു ഡാറ്റാസെറ്റ് ഉപയോഗിച്ച് ഈ മനോഹരമായ ഫംഗികളെ പരിശോധിക്കാം. നിങ്ങൾ പരീക്ഷിക്കാനിരിക്കുന്ന രുചികരമായ ദൃശ്യവൽക്കരണങ്ങൾ:
- പൈ ചാർട്ടുകൾ 🥧
- ഡോണട്ട് ചാർട്ടുകൾ 🍩
- വാഫിൾ ചാർട്ടുകൾ 🧇
> 💡 Microsoft Research-ന്റെ [Charticulator](https://charticulator.com) എന്ന വളരെ രസകരമായ പ്രോജക്ട് ഡാറ്റാ ദൃശ്യവൽക്കരണങ്ങൾക്ക് സൗജന്യമായ ഡ്രാഗ് ആൻഡ് ഡ്രോപ്പ് ഇന്റർഫേസ് നൽകുന്നു. അവരുടെ ട്യൂട്ടോറിയലുകളിൽ ഒന്നിൽ അവർ ഈ മഷ്‌റൂം ഡാറ്റാസെറ്റ് ഉപയോഗിക്കുന്നു! അതിനാൽ നിങ്ങൾ ഡാറ്റ പരിശോധിക്കുകയും ലൈബ്രറി പഠിക്കുകയും ചെയ്യാം: [Charticulator tutorial](https://charticulator.com/tutorials/tutorial4.html).
## [പ്രീ-ലെക്ചർ ക്വിസ്](https://ff-quizzes.netlify.app/en/ds/quiz/20)
## നിങ്ങളുടെ മഷ്‌റൂമുകളെ പരിചയപ്പെടുക 🍄
മഷ്‌റൂമുകൾ വളരെ രസകരമാണ്. അവ പഠിക്കാൻ ഒരു ഡാറ്റാസെറ്റ് ഇറക്കുമതി ചെയ്യാം:
```python
import pandas as pd
import matplotlib.pyplot as plt
mushrooms = pd.read_csv('../../data/mushrooms.csv')
mushrooms.head()
```
ഒരു വിശകലനത്തിനായി ചില മികച്ച ഡാറ്റയോടുകൂടിയ ഒരു പട്ടിക പ്രിന്റ് ചെയ്യുന്നു:
| class | cap-shape | cap-surface | cap-color | bruises | odor | gill-attachment | gill-spacing | gill-size | gill-color | stalk-shape | stalk-root | stalk-surface-above-ring | stalk-surface-below-ring | stalk-color-above-ring | stalk-color-below-ring | veil-type | veil-color | ring-number | ring-type | spore-print-color | population | habitat |
| --------- | --------- | ----------- | --------- | ------- | ------- | --------------- | ------------ | --------- | ---------- | ----------- | ---------- | ------------------------ | ------------------------ | ---------------------- | ---------------------- | --------- | ---------- | ----------- | --------- | ----------------- | ---------- | ------- |
| Poisonous | Convex | Smooth | Brown | Bruises | Pungent | Free | Close | Narrow | Black | Enlarging | Equal | Smooth | Smooth | White | White | Partial | White | One | Pendant | Black | Scattered | Urban |
| Edible | Convex | Smooth | Yellow | Bruises | Almond | Free | Close | Broad | Black | Enlarging | Club | Smooth | Smooth | White | White | Partial | White | One | Pendant | Brown | Numerous | Grasses |
| Edible | Bell | Smooth | White | Bruises | Anise | Free | Close | Broad | Brown | Enlarging | Club | Smooth | Smooth | White | White | Partial | White | One | Pendant | Brown | Numerous | Meadows |
| Poisonous | Convex | Scaly | White | Bruises | Pungent | Free | Close | Narrow | Brown | Enlarging | Equal | Smooth | Smooth | White | White | Partial | White | One | Pendant | Black | Scattered | Urban |
തുടക്കത്തിൽ, എല്ലാ ഡാറ്റയും ടെക്സ്റ്റ് ആണെന്ന് നിങ്ങൾ ശ്രദ്ധിക്കും. ഈ ഡാറ്റ ഒരു ചാർട്ടിൽ ഉപയോഗിക്കാൻ കഴിയുന്നതായി മാറ്റേണ്ടതുണ്ട്. യഥാർത്ഥത്തിൽ, ഡാറ്റയുടെ ഭൂരിഭാഗവും ഒരു ഒബ്ജക്റ്റായി പ്രതിനിധീകരിച്ചിരിക്കുന്നു:
```python
print(mushrooms.select_dtypes(["object"]).columns)
```
ഫലമായി:
```output
Index(['class', 'cap-shape', 'cap-surface', 'cap-color', 'bruises', 'odor',
'gill-attachment', 'gill-spacing', 'gill-size', 'gill-color',
'stalk-shape', 'stalk-root', 'stalk-surface-above-ring',
'stalk-surface-below-ring', 'stalk-color-above-ring',
'stalk-color-below-ring', 'veil-type', 'veil-color', 'ring-number',
'ring-type', 'spore-print-color', 'population', 'habitat'],
dtype='object')
```
ഈ ഡാറ്റ എടുത്ത് 'class' കോളം ഒരു വിഭാഗമായി മാറ്റുക:
```python
cols = mushrooms.select_dtypes(["object"]).columns
mushrooms[cols] = mushrooms[cols].astype('category')
```
```python
edibleclass=mushrooms.groupby(['class']).count()
edibleclass
```
ഇപ്പോൾ, മഷ്‌റൂം ഡാറ്റ പ്രിന്റ് ചെയ്താൽ, വിഷമുള്ള/ഭക്ഷ്യയോഗ്യമായ ക്ലാസുകൾ അനുസരിച്ച് വിഭാഗങ്ങളായി ഗ്രൂപ്പുചെയ്തിട്ടുണ്ടെന്ന് കാണാം:
| | cap-shape | cap-surface | cap-color | bruises | odor | gill-attachment | gill-spacing | gill-size | gill-color | stalk-shape | ... | stalk-surface-below-ring | stalk-color-above-ring | stalk-color-below-ring | veil-type | veil-color | ring-number | ring-type | spore-print-color | population | habitat |
| --------- | --------- | ----------- | --------- | ------- | ---- | --------------- | ------------ | --------- | ---------- | ----------- | --- | ------------------------ | ---------------------- | ---------------------- | --------- | ---------- | ----------- | --------- | ----------------- | ---------- | ------- |
| class | | | | | | | | | | | | | | | | | | | | | |
| Edible | 4208 | 4208 | 4208 | 4208 | 4208 | 4208 | 4208 | 4208 | 4208 | 4208 | ... | 4208 | 4208 | 4208 | 4208 | 4208 | 4208 | 4208 | 4208 | 4208 | 4208 |
| Poisonous | 3916 | 3916 | 3916 | 3916 | 3916 | 3916 | 3916 | 3916 | 3916 | 3916 | ... | 3916 | 3916 | 3916 | 3916 | 3916 | 3916 | 3916 | 3916 | 3916 | 3916 |
ഈ പട്ടികയിൽ നൽകിയ ക്രമം അനുസരിച്ച് ക്ലാസ് വിഭാഗ ലേബലുകൾ സൃഷ്ടിച്ചാൽ, ഒരു പൈ ചാർട്ട് നിർമ്മിക്കാം:
## പൈ!
```python
labels=['Edible','Poisonous']
plt.pie(edibleclass['population'],labels=labels,autopct='%.1f %%')
plt.title('Edible?')
plt.show()
```
ഇവിടെ, ഈ ഡാറ്റയുടെ അനുപാതങ്ങൾ ഈ രണ്ട് മഷ്‌റൂം ക്ലാസുകൾ അനുസരിച്ച് കാണിക്കുന്ന ഒരു പൈ ചാർട്ട്. ലേബലുകളുടെ ക്രമം ശരിയാണെന്ന് ഉറപ്പാക്കുന്നത് വളരെ പ്രധാനമാണ്, പ്രത്യേകിച്ച് ഇവിടെ, അതിനാൽ ലേബൽ അറേ എങ്ങനെ നിർമ്മിക്കപ്പെടുന്നു എന്ന് പരിശോധിക്കുക!
![pie chart](../../../../translated_images/pie1-wb.e201f2fcc335413143ce37650fb7f5f0bb21358e7823a327ed8644dfb84be9db.ml.png)
## ഡോണട്ടുകൾ!
കുറച്ച് കൂടുതൽ ദൃശ്യപരമായി ആകർഷകമായ പൈ ചാർട്ട് ഒരു ഡോണട്ട് ചാർട്ടാണ്, ഇത് മധ്യത്തിൽ ഒരു തുരുവുള്ള പൈ ചാർട്ടാണ്. ഈ രീതിയിൽ നമ്മുടെ ഡാറ്റ പരിശോധിക്കാം.
മഷ്‌റൂമുകൾ വളരുന്ന വിവിധ ഹാബിറ്റാറ്റുകൾ നോക്കാം:
```python
habitat=mushrooms.groupby(['habitat']).count()
habitat
```
ഇവിടെ, നിങ്ങൾ ഡാറ്റ ഹാബിറ്റാറ്റ് അനുസരിച്ച് ഗ്രൂപ്പുചെയ്യുന്നു. 7 ഹാബിറ്റാറ്റുകൾ പട്ടികപ്പെടുത്തിയിട്ടുണ്ട്, അതിനാൽ അവ ഡോണട്ട് ചാർട്ടിന്റെ ലേബലുകളായി ഉപയോഗിക്കുക:
```python
labels=['Grasses','Leaves','Meadows','Paths','Urban','Waste','Wood']
plt.pie(habitat['class'], labels=labels,
autopct='%1.1f%%', pctdistance=0.85)
center_circle = plt.Circle((0, 0), 0.40, fc='white')
fig = plt.gcf()
fig.gca().add_artist(center_circle)
plt.title('Mushroom Habitats')
plt.show()
```
![donut chart](../../../../translated_images/donut-wb.be3c12a22712302b5d10c40014d5389d4a1ae4412fe1655b3cf4af57b64f799a.ml.png)
ഈ കോഡ് ഒരു ചാർട്ട് വരയ്ക്കുകയും മധ്യത്തിൽ ഒരു വൃത്തം വരയ്ക്കുകയും ചെയ്യുന്നു, പിന്നീട് ആ വൃത്തം ചാർട്ടിൽ ചേർക്കുന്നു. മധ്യ വൃത്തത്തിന്റെ വീതി `0.40` എന്ന മൂല്യം മാറ്റി എഡിറ്റ് ചെയ്യാം.
ഡോണട്ട് ചാർട്ടുകൾ ലേബലുകൾ മാറ്റാൻ പലവിധം ക്രമീകരിക്കാം. പ്രത്യേകിച്ച് ലേബലുകൾ വായനാസൗകര്യത്തിന് ഹൈലൈറ്റ് ചെയ്യാം. കൂടുതൽ അറിയാൻ [docs](https://matplotlib.org/stable/gallery/pie_and_polar_charts/pie_and_donut_labels.html?highlight=donut) കാണുക.
ഇപ്പോൾ നിങ്ങൾ ഡാറ്റ ഗ്രൂപ്പുചെയ്യാനും പൈ അല്ലെങ്കിൽ ഡോണട്ട് ആയി പ്രദർശിപ്പിക്കാനും അറിയുന്നു, മറ്റ് ചാർട്ട് തരം പരീക്ഷിക്കാം. വാഫിൾ ചാർട്ട് പരീക്ഷിക്കുക, ഇത് അളവുകൾ പരിശോധിക്കുന്ന മറ്റൊരു രീതി മാത്രമാണ്.
## വാഫിൾസ്!
'വാഫിൾ' തരം ചാർട്ട് അളവുകൾ 2D ചതുരങ്ങളായി ദൃശ്യവൽക്കരിക്കുന്ന മറ്റൊരു രീതി ആണ്. ഈ ഡാറ്റാസെറ്റിലെ മഷ്‌റൂം ക്യാപ് നിറങ്ങളുടെ വ്യത്യസ്ത അളവുകൾ ദൃശ്യവൽക്കരിക്കാൻ ശ്രമിക്കുക. ഇതിന്, [PyWaffle](https://pypi.org/project/pywaffle/) എന്ന സഹായക ലൈബ്രറി ഇൻസ്റ്റാൾ ചെയ്ത് Matplotlib ഉപയോഗിക്കണം:
```python
pip install pywaffle
```
ഡാറ്റയുടെ ഒരു സെഗ്മെന്റ് തിരഞ്ഞെടുക്കുക ഗ്രൂപ്പുചെയ്യാൻ:
```python
capcolor=mushrooms.groupby(['cap-color']).count()
capcolor
```
ലേബലുകൾ സൃഷ്ടിച്ച് ഡാറ്റ ഗ്രൂപ്പുചെയ്യുന്നതിലൂടെ വാഫിൾ ചാർട്ട് സൃഷ്ടിക്കുക:
```python
import pandas as pd
import matplotlib.pyplot as plt
from pywaffle import Waffle
data ={'color': ['brown', 'buff', 'cinnamon', 'green', 'pink', 'purple', 'red', 'white', 'yellow'],
'amount': capcolor['class']
}
df = pd.DataFrame(data)
fig = plt.figure(
FigureClass = Waffle,
rows = 100,
values = df.amount,
labels = list(df.color),
figsize = (30,30),
colors=["brown", "tan", "maroon", "green", "pink", "purple", "red", "whitesmoke", "yellow"],
)
```
വാഫിൾ ചാർട്ട് ഉപയോഗിച്ച്, ഈ മഷ്‌റൂം ഡാറ്റാസെറ്റിലെ ക്യാപ് നിറങ്ങളുടെ അനുപാതങ്ങൾ വ്യക്തമായി കാണാം. രസകരമായി, നിരവധി പച്ച ക്യാപ് മഷ്‌റൂമുകൾ ഉണ്ട്!
![waffle chart](../../../../translated_images/waffle.5455dbae4ccf17d53bb40ff0a657ecef7b8aa967e27a19cc96325bd81598f65e.ml.png)
✅ Pywaffle ചാർട്ടുകളിൽ [Font Awesome](https://fontawesome.com/) ൽ ലഭ്യമായ ഏതെങ്കിലും ഐക്കൺ ഉപയോഗിച്ച് ഐക്കണുകൾ ഉൾപ്പെടുത്താൻ പിന്തുണ നൽകുന്നു. ചതുരങ്ങൾക്കുപകരം ഐക്കണുകൾ ഉപയോഗിച്ച് കൂടുതൽ രസകരമായ വാഫിൾ ചാർട്ട് സൃഷ്ടിക്കാൻ പരീക്ഷണങ്ങൾ നടത്തുക.
ഈ പാഠത്തിൽ, അനുപാതങ്ങൾ ദൃശ്യവൽക്കരിക്കുന്ന മൂന്ന് മാർഗങ്ങൾ നിങ്ങൾ പഠിച്ചു. ആദ്യം, ഡാറ്റയെ വിഭാഗങ്ങളായി ഗ്രൂപ്പുചെയ്യണം, പിന്നെ ഡാറ്റ പ്രദർശിപ്പിക്കാൻ ഏറ്റവും നല്ല മാർഗം - പൈ, ഡോണട്ട്, അല്ലെങ്കിൽ വാഫിൾ - തിരഞ്ഞെടുക്കണം. എല്ലാം രുചികരവും ഉപയോക്താവിന് ഡാറ്റാസെറ്റിന്റെ ഉടൻ ഒരു ദൃശ്യസംഗ്രഹം നൽകുന്നതുമാണ്.
## 🚀 ചലഞ്ച്
ഈ രുചികരമായ ചാർട്ടുകൾ [Charticulator](https://charticulator.com) ൽ പുനഃസൃഷ്ടിക്കാൻ ശ്രമിക്കുക.
## [പോസ്റ്റ്-ലെക്ചർ ക്വിസ്](https://ff-quizzes.netlify.app/en/ds/quiz/21)
## അവലോകനം & സ്വയം പഠനം
എപ്പോൾ പൈ, ഡോണട്ട്, അല്ലെങ്കിൽ വാഫിൾ ചാർട്ട് ഉപയോഗിക്കണമെന്ന് വ്യക്തമല്ല. ഈ വിഷയത്തിൽ വായിക്കാനുള്ള ചില ലേഖനങ്ങൾ:
https://www.beautiful.ai/blog/battle-of-the-charts-pie-chart-vs-donut-chart
https://medium.com/@hypsypops/pie-chart-vs-donut-chart-showdown-in-the-ring-5d24fd86a9ce
https://www.mit.edu/~mbarker/formula1/f1help/11-ch-c6.htm
https://medium.datadriveninvestor.com/data-visualization-done-the-right-way-with-tableau-waffle-chart-fdf2a19be402
ഈ ബുദ്ധിമുട്ടുള്ള തീരുമാനത്തെക്കുറിച്ച് കൂടുതൽ വിവരങ്ങൾ കണ്ടെത്താൻ ഗവേഷണം നടത്തുക.
## അസൈൻമെന്റ്
[Excel-ൽ പരീക്ഷിക്കുക](assignment.md)
---
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
**അസൂയാ**:
ഈ രേഖ AI വിവർത്തന സേവനം [Co-op Translator](https://github.com/Azure/co-op-translator) ഉപയോഗിച്ച് വിവർത്തനം ചെയ്തതാണ്. നാം കൃത്യതയ്ക്ക് ശ്രമിച്ചിട്ടുണ്ടെങ്കിലും, സ്വയം പ്രവർത്തിക്കുന്ന വിവർത്തനങ്ങളിൽ പിശകുകൾ അല്ലെങ്കിൽ തെറ്റുകൾ ഉണ്ടാകാമെന്ന് ദയവായി ശ്രദ്ധിക്കുക. അതിന്റെ മാതൃഭാഷയിലുള്ള യഥാർത്ഥ രേഖ അധികാരപരമായ ഉറവിടമായി കണക്കാക്കപ്പെടണം. നിർണായകമായ വിവരങ്ങൾക്ക്, പ്രൊഫഷണൽ മനുഷ്യ വിവർത്തനം ശുപാർശ ചെയ്യപ്പെടുന്നു. ഈ വിവർത്തനം ഉപയോഗിക്കുന്നതിൽ നിന്നുണ്ടാകുന്ന ഏതെങ്കിലും തെറ്റിദ്ധാരണകൾക്കോ തെറ്റായ വ്യാഖ്യാനങ്ങൾക്കോ ഞങ്ങൾ ഉത്തരവാദികളല്ല.
<!-- CO-OP TRANSLATOR DISCLAIMER END -->

@ -0,0 +1,27 @@
<!--
CO_OP_TRANSLATOR_METADATA:
{
"original_hash": "1e00fe6a244c2f8f9a794c862661dd4f",
"translation_date": "2025-12-19T16:05:10+00:00",
"source_file": "3-Data-Visualization/11-visualization-proportions/assignment.md",
"language_code": "ml"
}
-->
# Excel-ൽ പരീക്ഷിക്കുക
## നിർദ്ദേശങ്ങൾ
Excel-ൽ ഡോണട്ട്, പൈ, വാഫിൾ ചാർട്ടുകൾ സൃഷ്ടിക്കാമെന്ന് നിങ്ങൾ അറിയാമോ? നിങ്ങളുടെ ഇഷ്ടാനുസൃതമായ ഒരു ഡാറ്റാസെറ്റ് ഉപയോഗിച്ച്, ഈ മൂന്ന് ചാർട്ടുകളും Excel സ്പ്രെഡ്‌ഷീറ്റിൽ തന്നെ സൃഷ്ടിക്കുക.
## റൂബ്രിക്
| ഉദാഹരണപരമായത് | മതിയായത് | മെച്ചപ്പെടുത്തേണ്ടത് |
| ------------------------------------------------------- | ------------------------------------------------- | ------------------------------------------------------ |
| എല്ലാ മൂന്ന് ചാർട്ടുകളോടും ഒരു Excel സ്പ്രെഡ്‌ഷീറ്റ് അവതരിപ്പിച്ചിരിക്കുന്നു | രണ്ട് ചാർട്ടുകളോടും ഒരു Excel സ്പ്രെഡ്‌ഷീറ്റ് അവതരിപ്പിച്ചിരിക്കുന്നു | ഒരു ചാർട്ടിനോടെയായുള്ള Excel സ്പ്രെഡ്‌ഷീറ്റ് മാത്രമാണ് അവതരിപ്പിച്ചിരിക്കുന്നത് |
---
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
**അസൂയാ**:
ഈ രേഖ AI വിവർത്തന സേവനം [Co-op Translator](https://github.com/Azure/co-op-translator) ഉപയോഗിച്ച് വിവർത്തനം ചെയ്തതാണ്. നാം കൃത്യതയ്ക്ക് ശ്രമിച്ചെങ്കിലും, സ്വയം പ്രവർത്തിക്കുന്ന വിവർത്തനങ്ങളിൽ പിശകുകൾ അല്ലെങ്കിൽ തെറ്റുകൾ ഉണ്ടാകാമെന്ന് ദയവായി ശ്രദ്ധിക്കുക. അതിന്റെ മാതൃഭാഷയിലുള്ള യഥാർത്ഥ രേഖയാണ് പ്രാമാണികമായ ഉറവിടം എന്ന് പരിഗണിക്കേണ്ടതാണ്. നിർണായക വിവരങ്ങൾക്ക്, പ്രൊഫഷണൽ മനുഷ്യ വിവർത്തനം ശുപാർശ ചെയ്യപ്പെടുന്നു. ഈ വിവർത്തനം ഉപയോഗിക്കുന്നതിൽ നിന്നുണ്ടാകുന്ന ഏതെങ്കിലും തെറ്റിദ്ധാരണകൾക്കോ തെറ്റായ വ്യാഖ്യാനങ്ങൾക്കോ ഞങ്ങൾ ഉത്തരവാദികളല്ല.
<!-- CO-OP TRANSLATOR DISCLAIMER END -->

@ -0,0 +1,32 @@
{
"cells": [
{
"cell_type": "markdown",
"source": [
"# 🍄 കൂൺ അനുപാതങ്ങൾ\n"
],
"metadata": {}
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"---\n\n<!-- CO-OP TRANSLATOR DISCLAIMER START -->\n**അസൂയാ**: \nഈ രേഖ AI വിവർത്തന സേവനം [Co-op Translator](https://github.com/Azure/co-op-translator) ഉപയോഗിച്ച് വിവർത്തനം ചെയ്തതാണ്. നാം കൃത്യതയ്ക്ക് ശ്രമിച്ചിട്ടുണ്ടെങ്കിലും, സ്വയം പ്രവർത്തിക്കുന്ന വിവർത്തനങ്ങളിൽ പിശകുകൾ അല്ലെങ്കിൽ തെറ്റുകൾ ഉണ്ടാകാമെന്ന് ദയവായി ശ്രദ്ധിക്കുക. അതിന്റെ മാതൃഭാഷയിലുള്ള യഥാർത്ഥ രേഖയാണ് പ്രാമാണികമായ ഉറവിടം എന്ന് പരിഗണിക്കേണ്ടതാണ്. നിർണായകമായ വിവരങ്ങൾക്ക്, പ്രൊഫഷണൽ മനുഷ്യ വിവർത്തനം ശുപാർശ ചെയ്യപ്പെടുന്നു. ഈ വിവർത്തനം ഉപയോഗിക്കുന്നതിൽ നിന്നുണ്ടാകുന്ന ഏതെങ്കിലും തെറ്റിദ്ധാരണകൾക്കോ തെറ്റായ വ്യാഖ്യാനങ്ങൾക്കോ ഞങ്ങൾ ഉത്തരവാദികളല്ല.\n<!-- CO-OP TRANSLATOR DISCLAIMER END -->\n"
]
}
],
"metadata": {
"orig_nbformat": 4,
"language_info": {
"name": "python"
},
"coopTranslator": {
"original_hash": "397e9bbc0743761dbf72e5f16b7043e6",
"translation_date": "2025-12-19T17:35:51+00:00",
"source_file": "3-Data-Visualization/11-visualization-proportions/notebook.ipynb",
"language_code": "ml"
}
},
"nbformat": 4,
"nbformat_minor": 2
}

File diff suppressed because one or more lines are too long

@ -0,0 +1,190 @@
<!--
CO_OP_TRANSLATOR_METADATA:
{
"original_hash": "0764fd4077f3f04a1d968ec371227744",
"translation_date": "2025-12-19T15:58:10+00:00",
"source_file": "3-Data-Visualization/12-visualization-relationships/README.md",
"language_code": "ml"
}
-->
# ബന്ധങ്ങൾ ദൃശ്യവൽക്കരിക്കൽ: തേൻ സംബന്ധിച്ച എല്ലാം 🍯
|![ Sketchnote by [(@sketchthedocs)](https://sketchthedocs.dev) ](../../sketchnotes/12-Visualizing-Relationships.png)|
|:---:|
|ബന്ധങ്ങൾ ദൃശ്യവൽക്കരിക്കൽ - _Sketchnote by [@nitya](https://twitter.com/nitya)_ |
നമ്മുടെ ഗവേഷണത്തിന്റെ പ്രകൃതി കേന്ദ്രീകൃതമായ ഭാഗം തുടർന്നുകൊണ്ട്, [United States Department of Agriculture](https://www.nass.usda.gov/About_NASS/index.php) നിന്നുള്ള ഡാറ്റാസെറ്റിൽ നിന്നുള്ള വിവിധ തരത്തിലുള്ള തേൻ തമ്മിലുള്ള ബന്ധങ്ങൾ കാണിക്കുന്ന രസകരമായ ദൃശ്യവൽക്കരണങ്ങൾ കണ്ടെത്താം.
ഏകദേശം 600 ഇനങ്ങളുള്ള ഈ ഡാറ്റാസെറ്റ് അമേരിക്കയിലെ പല സംസ്ഥാനങ്ങളിലെ തേൻ ഉത്പാദനം പ്രദർശിപ്പിക്കുന്നു. ഉദാഹരണത്തിന്, ഓരോ സംസ്ഥാനത്തെയും ഓരോ വർഷത്തെയും കോളനികളുടെ എണ്ണം, ഓരോ കോളനിക്കുള്ള ഉത്പാദനം, മൊത്തം ഉത്പാദനം, സ്റ്റോക്കുകൾ, പൗണ്ട് പ്രതി വില, ഉത്പാദന മൂല്യം എന്നിവ കാണാം.
ഒരു സംസ്ഥാനത്തിന്റെ ഓരോ വർഷവും ഉത്പാദനവും, ഉദാഹരണത്തിന്, ആ സംസ്ഥാനത്തെ തേന്റെ വില തമ്മിലുള്ള ബന്ധം ദൃശ്യവൽക്കരിക്കുന്നത് രസകരമായിരിക്കും. അല്ലെങ്കിൽ, സംസ്ഥാനങ്ങളുടെ കോളനി പ്രതി തേൻ ഉത്പാദനത്തിന്റെ ബന്ധം ദൃശ്യവൽക്കരിക്കാം. 2006-ൽ ആദ്യമായി കണ്ട 'CCD' അല്ലെങ്കിൽ 'Colony Collapse Disorder' (http://npic.orst.edu/envir/ccd.html) ഉൾപ്പെടുന്ന ഈ വർഷങ്ങൾ ഉൾക്കൊള്ളുന്ന ഡാറ്റാസെറ്റ് പഠിക്കാൻ വളരെ പ്രാധാന്യമുള്ളതാണ്. 🐝
## [പ്രീ-ലെക്ചർ ക്വിസ്](https://ff-quizzes.netlify.app/en/ds/quiz/22)
ഈ പാഠത്തിൽ, നിങ്ങൾ മുമ്പ് ഉപയോഗിച്ചിട്ടുള്ള Seaborn ഉപയോഗിച്ച് വ്യത്യസ്ത വേരിയബിളുകൾ തമ്മിലുള്ള ബന്ധങ്ങൾ ദൃശ്യവൽക്കരിക്കാൻ കഴിയും. പ്രത്യേകിച്ച് Seaborn-ന്റെ `relplot` ഫംഗ്ഷൻ ഉപയോഗിച്ച് '[സാംഖ്യിക ബന്ധങ്ങൾ](https://seaborn.pydata.org/tutorial/relational.html?highlight=relationships)' എളുപ്പത്തിൽ കാണിക്കാൻ കഴിയും, ഇത് ഡാറ്റാ സയന്റിസ്റ്റിന് വേരിയബിളുകൾ തമ്മിലുള്ള ബന്ധം മനസ്സിലാക്കാൻ സഹായിക്കുന്നു.
## സ്‌കാറ്റർപ്ലോട്ടുകൾ
തേന്റെ വില വർഷം തോറും ഓരോ സംസ്ഥാനത്തും എങ്ങനെ മാറിയെന്ന് കാണിക്കാൻ സ്‌കാറ്റർപ്ലോട്ട് ഉപയോഗിക്കുക. Seaborn, `relplot` ഉപയോഗിച്ച്, സംസ്ഥാന ഡാറ്റ ഗ്രൂപ്പുചെയ്ത് വർഗ്ഗീയവും സംഖ്യാത്മകവുമായ ഡാറ്റ പോയിന്റുകൾ പ്രദർശിപ്പിക്കുന്നു.
ഡാറ്റയും Seaborn-ഉം ഇറക്കുമതി ചെയ്യുന്നതിൽ നിന്ന് തുടങ്ങാം:
```python
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
honey = pd.read_csv('../../data/honey.csv')
honey.head()
```
തേൻ ഡാറ്റയിൽ വർഷവും പൗണ്ട് പ്രതി വിലയും ഉൾപ്പെടെ പല രസകരമായ കോളങ്ങളുണ്ട്. അമേരിക്കൻ സംസ്ഥാനങ്ങൾ പ്രകാരം ഗ്രൂപ്പുചെയ്ത് ഈ ഡാറ്റ പരിശോധിക്കാം:
| state | numcol | yieldpercol | totalprod | stocks | priceperlb | prodvalue | year |
| ----- | ------ | ----------- | --------- | -------- | ---------- | --------- | ---- |
| AL | 16000 | 71 | 1136000 | 159000 | 0.72 | 818000 | 1998 |
| AZ | 55000 | 60 | 3300000 | 1485000 | 0.64 | 2112000 | 1998 |
| AR | 53000 | 65 | 3445000 | 1688000 | 0.59 | 2033000 | 1998 |
| CA | 450000 | 83 | 37350000 | 12326000 | 0.62 | 23157000 | 1998 |
| CO | 27000 | 72 | 1944000 | 1594000 | 0.7 | 1361000 | 1998 |
തേന്റെ പൗണ്ട് പ്രതി വിലയും അതിന്റെ ഉത്ഭവ സംസ്ഥാനവും തമ്മിലുള്ള ബന്ധം കാണിക്കാൻ ഒരു അടിസ്ഥാന സ്‌കാറ്റർപ്ലോട്ട് സൃഷ്ടിക്കുക. എല്ലാ സംസ്ഥാനങ്ങളും കാണാൻ `y` അക്ഷം ഉയരം നൽകുക:
```python
sns.relplot(x="priceperlb", y="state", data=honey, height=15, aspect=.5);
```
![scatterplot 1](../../../../translated_images/scatter1.5e1aa5fd6706c5d12b5e503ccb77f8a930f8620f539f524ddf56a16c039a5d2f.ml.png)
ഇപ്പോൾ, വർഷം തോറും വില എങ്ങനെ മാറിയെന്ന് കാണിക്കാൻ തേൻ നിറത്തിലുള്ള കളർ സ്കീം ഉപയോഗിച്ച് സമാന ഡാറ്റ കാണിക്കുക. വർഷം തോറും മാറ്റം കാണിക്കാൻ 'hue' പാരാമീറ്റർ ചേർക്കാം:
> ✅ Seaborn-ൽ ഉപയോഗിക്കാവുന്ന [കോളർ പാളറ്റുകൾ](https://seaborn.pydata.org/tutorial/color_palettes.html) കുറിച്ച് കൂടുതൽ അറിയുക - മനോഹരമായ റെയിൻബോ കളർ സ്കീം പരീക്ഷിക്കുക!
```python
sns.relplot(x="priceperlb", y="state", hue="year", palette="YlOrBr", data=honey, height=15, aspect=.5);
```
![scatterplot 2](../../../../translated_images/scatter2.c0041a58621ca702990b001aa0b20cd68c1e1814417139af8a7211a2bed51c5f.ml.png)
ഈ കളർ സ്കീം മാറ്റത്തോടെ, തേന്റെ പൗണ്ട് പ്രതി വില വർഷം തോറും ശക്തമായി ഉയരുന്നുവെന്ന് കാണാം. ഡാറ്റയിൽ ഒരു സാമ്പിൾ സെറ്റ് പരിശോധിച്ചാൽ (ഉദാഹരണത്തിന്, അരിസോണ), വില വർഷം തോറും ഉയരുന്ന ഒരു പാറ്റേൺ കാണാം, കുറച്ച് വ്യത്യാസങ്ങൾ ഒഴികെ:
| state | numcol | yieldpercol | totalprod | stocks | priceperlb | prodvalue | year |
| ----- | ------ | ----------- | --------- | ------- | ---------- | --------- | ---- |
| AZ | 55000 | 60 | 3300000 | 1485000 | 0.64 | 2112000 | 1998 |
| AZ | 52000 | 62 | 3224000 | 1548000 | 0.62 | 1999000 | 1999 |
| AZ | 40000 | 59 | 2360000 | 1322000 | 0.73 | 1723000 | 2000 |
| AZ | 43000 | 59 | 2537000 | 1142000 | 0.72 | 1827000 | 2001 |
| AZ | 38000 | 63 | 2394000 | 1197000 | 1.08 | 2586000 | 2002 |
| AZ | 35000 | 72 | 2520000 | 983000 | 1.34 | 3377000 | 2003 |
| AZ | 32000 | 55 | 1760000 | 774000 | 1.11 | 1954000 | 2004 |
| AZ | 36000 | 50 | 1800000 | 720000 | 1.04 | 1872000 | 2005 |
| AZ | 30000 | 65 | 1950000 | 839000 | 0.91 | 1775000 | 2006 |
| AZ | 30000 | 64 | 1920000 | 902000 | 1.26 | 2419000 | 2007 |
| AZ | 25000 | 64 | 1600000 | 336000 | 1.26 | 2016000 | 2008 |
| AZ | 20000 | 52 | 1040000 | 562000 | 1.45 | 1508000 | 2009 |
| AZ | 24000 | 77 | 1848000 | 665000 | 1.52 | 2809000 | 2010 |
| AZ | 23000 | 53 | 1219000 | 427000 | 1.55 | 1889000 | 2011 |
| AZ | 22000 | 46 | 1012000 | 253000 | 1.79 | 1811000 | 2012 |
ഈ പുരോഗതി കാണിക്കാൻ മറ്റൊരു മാർഗം കളറിന് പകരം വലിപ്പം ഉപയോഗിക്കുകയാണ്. കളർബ്ലൈൻഡ് ഉപയോക്താക്കൾക്ക് ഇത് നല്ല ഓപ്ഷൻ ആകാം. ഡോട്ട് വലിപ്പം വർദ്ധിപ്പിച്ച് വില വർദ്ധനവ് കാണിക്കുക:
```python
sns.relplot(x="priceperlb", y="state", size="year", data=honey, height=15, aspect=.5);
```
ഡോട്ടുകളുടെ വലിപ്പം ക്രമാതീതമായി വർദ്ധിക്കുന്നതായി കാണാം.
![scatterplot 3](../../../../translated_images/scatter3.3c160a3d1dcb36b37900ebb4cf97f34036f28ae2b7b8e6062766c7c1dfc00853.ml.png)
ഇത് സപ്ലൈ ആൻഡ് ഡിമാൻഡ് എന്ന ലളിതമായ കേസ് ആണോ? കാലാവസ്ഥ മാറ്റം, കോളനി തകർച്ച തുടങ്ങിയ ഘടകങ്ങൾ കാരണം വർഷം തോറും വാങ്ങാനുളള തേൻ കുറയുന്നുണ്ടോ, അതിനാൽ വില ഉയരുന്നുണ്ടോ?
ഡാറ്റാസെറ്റിലെ ചില വേരിയബിളുകൾ തമ്മിലുള്ള സഹബന്ധം കണ്ടെത്താൻ, ചില ലൈൻ ചാർട്ടുകൾ പരിശോധിക്കാം.
## ലൈൻ ചാർട്ടുകൾ
ചോദ്യം: തേന്റെ പൗണ്ട് പ്രതി വില വർഷം തോറും വ്യക്തമായി ഉയരുന്നുണ്ടോ? ഇത് കണ്ടെത്താൻ ഒരു ലൈന്ചാർട്ട് സൃഷ്ടിക്കുക:
```python
sns.relplot(x="year", y="priceperlb", kind="line", data=honey);
```
ഉത്തരം: ചില വ്യത്യാസങ്ങൾ കൂടെ 2003-ൽ ചില ഉയർച്ചകൾ കാണാം:
![line chart 1](../../../../translated_images/line1.f36eb465229a3b1fe385cdc93861aab3939de987d504b05de0b6cd567ef79f43.ml.png)
✅ Seaborn ഒരു ലൈനിൽ ഡാറ്റ സംഗ്രഹിക്കുന്നതിനാൽ, "ഓരോ x മൂല്യത്തിലും പല അളവുകൾ ശരാശരി കണക്കാക്കി ശരാശരിയുടെ ചുറ്റും 95% വിശ്വാസപരിധി കാണിക്കുന്നു". [മൂലം](https://seaborn.pydata.org/tutorial/relational.html). ഈ സമയം കൂടുതലുള്ള പ്രവർത്തനം `ci=None` ചേർത്താൽ ഒഴിവാക്കാം.
ചോദ്യം: 2003-ൽ തേൻ സപ്ലൈയിൽ ഒരു ഉയർച്ചയും കാണാമോ? മൊത്തം ഉത്പാദനം വർഷം തോറും നോക്കിയാൽ?
```python
sns.relplot(x="year", y="totalprod", kind="line", data=honey);
```
![line chart 2](../../../../translated_images/line2.a5b3493dc01058af6402e657aaa9ae1125fafb5e7d6630c777aa60f900a544e4.ml.png)
ഉത്തരം: അത്രയുമല്ല. മൊത്തം ഉത്പാദനം ആ വർഷം വർദ്ധിച്ചിട്ടുണ്ടെങ്കിലും, സാധാരണയായി ഈ വർഷങ്ങളിൽ തേൻ ഉത്പാദനം കുറയുകയാണ്.
ചോദ്യം: അപ്പോൾ 2003-ൽ തേന്റെ വില ഉയർന്നതിന്റെ കാരണം എന്തായിരിക്കും?
ഇത് കണ്ടെത്താൻ ഫേസറ്റ് ഗ്രിഡ് പരിശോധിക്കാം.
## ഫേസറ്റ് ഗ്രിഡുകൾ
ഫേസറ്റ് ഗ്രിഡുകൾ ഡാറ്റാസെറ്റിന്റെ ഒരു ഭാഗം (ഇവിടെ 'വർഷം' തിരഞ്ഞെടുക്കാം) എടുത്ത്, ഓരോ ഭാഗത്തിനും x, y കോർഡിനേറ്റുകൾ ഉപയോഗിച്ച് ഗ്രാഫുകൾ സൃഷ്ടിച്ച് എളുപ്പത്തിൽ താരതമ്യം ചെയ്യാൻ സഹായിക്കുന്നു. 2003 ഈ താരതമ്യത്തിൽ വ്യത്യസ്തമാണോ?
[Seaborn-ന്റെ ഡോക്യുമെന്റേഷൻ](https://seaborn.pydata.org/generated/seaborn.FacetGrid.html?highlight=facetgrid#seaborn.FacetGrid) പ്രകാരം `relplot` തുടർന്നും ഉപയോഗിച്ച് ഫേസറ്റ് ഗ്രിഡ് സൃഷ്ടിക്കുക:
```python
sns.relplot(
data=honey,
x="yieldpercol", y="numcol",
col="year",
col_wrap=3,
kind="line"
)
```
ഈ ദൃശ്യവൽക്കരണത്തിൽ, കോളനി പ്രതി ഉത്പാദനവും കോളനികളുടെ എണ്ണവും വർഷം തോറും, 3 കോളങ്ങൾ വച്ച് വശം വശം താരതമ്യം ചെയ്യാം:
![facet grid](../../../../translated_images/facet.6a34851dcd540050dcc0ead741be35075d776741668dd0e42f482c89b114c217.ml.png)
ഈ ഡാറ്റാസെറ്റിൽ, കോളനികളുടെ എണ്ണം, അവയുടെ ഉത്പാദനം വർഷം തോറും, സംസ്ഥാനങ്ങൾ തമ്മിൽ പ്രത്യേകമായ വ്യത്യാസം കാണുന്നില്ല. ഈ രണ്ട് വേരിയബിളുകൾ തമ്മിൽ സഹബന്ധം കണ്ടെത്താൻ മറ്റൊരു മാർഗം ഉണ്ടോ?
## ഡ്യുവൽ-ലൈൻ പ്ലോട്ടുകൾ
Seaborn-ന്റെ 'despine' ഉപയോഗിച്ച് മുകളിൽ വലത്തുഭാഗം സ്പൈൻ നീക്കം ചെയ്ത്, Matplotlib-ൽ നിന്നുള്ള `ax.twinx` ഉപയോഗിച്ച് രണ്ട് ലൈൻപ്ലോട്ടുകൾ ഒരുമിച്ച് സൂപ്പർഇംപോസ് ചെയ്ത് multiline പ്ലോട്ട് ശ്രമിക്കുക. Twinx ഒരു ചാർട്ട് x അക്ഷം പങ്കുവെച്ച് രണ്ട് y അക്ഷങ്ങൾ പ്രദർശിപ്പിക്കാൻ സഹായിക്കുന്നു. കോളനി പ്രതി ഉത്പാദനവും കോളനികളുടെ എണ്ണവും സൂപ്പർഇംപോസ് ചെയ്ത് കാണിക്കുക:
```python
fig, ax = plt.subplots(figsize=(12,6))
lineplot = sns.lineplot(x=honey['year'], y=honey['numcol'], data=honey,
label = 'Number of bee colonies', legend=False)
sns.despine()
plt.ylabel('# colonies')
plt.title('Honey Production Year over Year');
ax2 = ax.twinx()
lineplot2 = sns.lineplot(x=honey['year'], y=honey['yieldpercol'], ax=ax2, color="r",
label ='Yield per colony', legend=False)
sns.despine(right=False)
plt.ylabel('colony yield')
ax.figure.legend();
```
![superimposed plots](../../../../translated_images/dual-line.a4c28ce659603fab2c003f4df816733df2bf41d1facb7de27989ec9afbf01b33.ml.png)
2003-ൽ പ്രത്യേകമായി ഒന്നും കാണാനില്ലെങ്കിലും, ഈ പാഠം ഒരു സന്തോഷകരമായ നോട്ടിൽ അവസാനിപ്പിക്കാം: കോളനികളുടെ എണ്ണം കുറയുന്നുണ്ടെങ്കിലും, അവയുടെ എണ്ണം സ്ഥിരതയുള്ളതും, കോളനി പ്രതി ഉത്പാദനം കുറയുന്നുണ്ടെങ്കിലും.
പോകൂ, തേൻമക്കളേ, പോകൂ!
🐝❤️
## 🚀 ചലഞ്ച്
ഈ പാഠത്തിൽ, സ്‌കാറ്റർപ്ലോട്ടുകളും ലൈൻ ഗ്രിഡുകളും ഉൾപ്പെടെ ഫേസറ്റ് ഗ്രിഡുകൾ ഉപയോഗിക്കുന്നതിനെ കുറിച്ച് കൂടുതൽ പഠിച്ചു. മറ്റൊരു ഡാറ്റാസെറ്റ് ഉപയോഗിച്ച് ഫേസറ്റ് ഗ്രിഡ് സൃഷ്ടിക്കാൻ ശ്രമിക്കുക, മുൻപുള്ള പാഠങ്ങളിൽ ഉപയോഗിച്ച ഡാറ്റാസെറ്റ് ആകാം. എത്ര സമയം എടുക്കുന്നു, എത്ര ഗ്രിഡുകൾ വരയ്ക്കണം എന്ന കാര്യത്തിൽ ശ്രദ്ധിക്കുക.
## [പോസ്റ്റ്-ലെക്ചർ ക്വിസ്](https://ff-quizzes.netlify.app/en/ds/quiz/23)
## അവലോകനം & സ്വയം പഠനം
ലൈൻ പ്ലോട്ടുകൾ ലളിതമോ സങ്കീർണ്ണമോ ആകാം. [Seaborn ഡോക്യുമെന്റേഷൻ](https://seaborn.pydata.org/generated/seaborn.lineplot.html) വായിച്ച് വിവിധ രീതികൾ പഠിക്കുക. ഈ പാഠത്തിൽ നിർമ്മിച്ച ലൈൻ ചാർട്ടുകൾ മറ്റ് രീതികളാൽ മെച്ചപ്പെടുത്താൻ ശ്രമിക്കുക.
## അസൈൻമെന്റ്
[തേൻമടയിൽ ഡൈവ് ചെയ്യുക](assignment.md)
---
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
**അസൂയാപത്രം**:
ഈ രേഖ AI വിവർത്തന സേവനം [Co-op Translator](https://github.com/Azure/co-op-translator) ഉപയോഗിച്ച് വിവർത്തനം ചെയ്തതാണ്. നാം കൃത്യതയ്ക്ക് ശ്രമിച്ചിട്ടുണ്ടെങ്കിലും, സ്വയം പ്രവർത്തിക്കുന്ന വിവർത്തനങ്ങളിൽ പിശകുകൾ അല്ലെങ്കിൽ തെറ്റുകൾ ഉണ്ടാകാമെന്ന് ദയവായി ശ്രദ്ധിക്കുക. അതിന്റെ മാതൃഭാഷയിലുള്ള യഥാർത്ഥ രേഖ അധികാരപരമായ ഉറവിടമായി കണക്കാക്കപ്പെടണം. നിർണായക വിവരങ്ങൾക്ക്, പ്രൊഫഷണൽ മനുഷ്യ വിവർത്തനം ശുപാർശ ചെയ്യപ്പെടുന്നു. ഈ വിവർത്തനം ഉപയോഗിക്കുന്നതിൽ നിന്നുണ്ടാകുന്ന ഏതെങ്കിലും തെറ്റിദ്ധാരണകൾക്കോ തെറ്റായ വ്യാഖ്യാനങ്ങൾക്കോ ഞങ്ങൾ ഉത്തരവാദികളല്ല.
<!-- CO-OP TRANSLATOR DISCLAIMER END -->

@ -0,0 +1,27 @@
<!--
CO_OP_TRANSLATOR_METADATA:
{
"original_hash": "680419753c086eef51be86607c623945",
"translation_date": "2025-12-19T16:00:04+00:00",
"source_file": "3-Data-Visualization/12-visualization-relationships/assignment.md",
"language_code": "ml"
}
-->
# തേനീച്ചകളുടെ കുടിലിലേക്ക് ഡൈവ് ചെയ്യുക
## നിർദ്ദേശങ്ങൾ
ഈ പാഠത്തിൽ നിങ്ങൾ തേനീച്ചകളുടെയും അവയുടെ തേൻ ഉത്പാദനത്തിന്റെയും ഒരു ഡാറ്റാസെറ്റിനെ കുറിച്ച് പരിശോധിക്കാൻ തുടങ്ങിയിരുന്നു, ഇത് ഒരു കാലയളവിൽ തേനീച്ചകളുടെ കോളനി ജനസംഖ്യയിൽ നഷ്ടങ്ങൾ കണ്ടു. ഈ ഡാറ്റാസെറ്റിനെ കൂടുതൽ ആഴത്തിൽ പരിശോധിച്ച്, തേനീച്ചകളുടെ ജനസംഖ്യയുടെ ആരോഗ്യത്തെ സംസ്ഥാനവും വർഷവും അനുസരിച്ച് പറയുന്ന ഒരു നോട്ട്‌ബുക്ക് നിർമ്മിക്കുക. ഈ ഡാറ്റാസെറ്റിനെക്കുറിച്ച് നിങ്ങൾക്ക് എന്തെങ്കിലും രസകരമായ കണ്ടെത്തലുണ്ടോ?
## റൂബ്രിക്
| ഉദാഹരണാർത്ഥം | മതിയായത് | മെച്ചപ്പെടുത്തേണ്ടത് |
| ------------------------------------------------------------------------------------------------------------------------------------------------------- | ---------------------------------------- | ---------------------------------------- |
| ഒരു നോട്ട്‌ബുക്ക് ഒരു കഥയോടുകൂടി അവതരിപ്പിക്കുന്നു, അതിൽ ഡാറ്റാസെറ്റിന്റെ വിവിധ വശങ്ങൾ കാണിക്കുന്ന കുറഞ്ഞത് മൂന്ന് വ്യത്യസ്ത ചാർട്ടുകൾ ഉൾക്കൊള്ളുന്നു, സംസ്ഥാനവും വർഷവും അനുസരിച്ച് | നോട്ട്‌ബുക്കിൽ ഈ ഘടകങ്ങളിൽ ഒന്നും ഇല്ല | നോട്ട്‌ബുക്കിൽ ഈ ഘടകങ്ങളിൽ രണ്ട് ഇല്ല |
---
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
**അസൂയാപത്രം**:
ഈ രേഖ AI വിവർത്തന സേവനം [Co-op Translator](https://github.com/Azure/co-op-translator) ഉപയോഗിച്ച് വിവർത്തനം ചെയ്തതാണ്. നാം കൃത്യതയ്ക്ക് ശ്രമിച്ചിട്ടുണ്ടെങ്കിലും, സ്വയം പ്രവർത്തിക്കുന്ന വിവർത്തനങ്ങളിൽ പിശകുകൾ അല്ലെങ്കിൽ തെറ്റുകൾ ഉണ്ടാകാമെന്ന് ദയവായി ശ്രദ്ധിക്കുക. അതിന്റെ മാതൃഭാഷയിലുള്ള യഥാർത്ഥ രേഖയാണ് പ്രാമാണികമായ ഉറവിടം എന്ന് പരിഗണിക്കേണ്ടതാണ്. നിർണായകമായ വിവരങ്ങൾക്ക്, പ്രൊഫഷണൽ മനുഷ്യ വിവർത്തനം ശുപാർശ ചെയ്യപ്പെടുന്നു. ഈ വിവർത്തനം ഉപയോഗിക്കുന്നതിൽ നിന്നുണ്ടാകുന്ന ഏതെങ്കിലും തെറ്റിദ്ധാരണകൾക്കോ തെറ്റായ വ്യാഖ്യാനങ്ങൾക്കോ ഞങ്ങൾ ഉത്തരവാദികളല്ല.
<!-- CO-OP TRANSLATOR DISCLAIMER END -->

@ -0,0 +1,32 @@
{
"cells": [
{
"cell_type": "markdown",
"source": [
"# തേൻ ഉത്പാദനം ദൃശ്യവൽക്കരണം 🍯 🐝\n"
],
"metadata": {}
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"---\n\n<!-- CO-OP TRANSLATOR DISCLAIMER START -->\n**അസൂയാപത്രം**: \nഈ രേഖ AI വിവർത്തന സേവനം [Co-op Translator](https://github.com/Azure/co-op-translator) ഉപയോഗിച്ച് വിവർത്തനം ചെയ്തതാണ്. നാം കൃത്യതയ്ക്ക് ശ്രമിച്ചിട്ടുണ്ടെങ്കിലും, യന്ത്രം ചെയ്ത വിവർത്തനങ്ങളിൽ പിശകുകൾ അല്ലെങ്കിൽ തെറ്റുകൾ ഉണ്ടാകാമെന്ന് ദയവായി ശ്രദ്ധിക്കുക. അതിന്റെ മാതൃഭാഷയിലുള്ള യഥാർത്ഥ രേഖ അധികാരപരമായ ഉറവിടമായി കണക്കാക്കണം. നിർണായകമായ വിവരങ്ങൾക്ക്, പ്രൊഫഷണൽ മനുഷ്യ വിവർത്തനം ശുപാർശ ചെയ്യപ്പെടുന്നു. ഈ വിവർത്തനം ഉപയോഗിക്കുന്നതിൽ നിന്നുണ്ടാകുന്ന ഏതെങ്കിലും തെറ്റിദ്ധാരണകൾക്കോ വ്യാഖ്യാനക്കേടുകൾക്കോ ഞങ്ങൾ ഉത്തരവാദികളല്ല.\n<!-- CO-OP TRANSLATOR DISCLAIMER END -->\n"
]
}
],
"metadata": {
"orig_nbformat": 4,
"language_info": {
"name": "python"
},
"coopTranslator": {
"original_hash": "0f988634b7192626d91cc33b4b6388c5",
"translation_date": "2025-12-19T17:35:34+00:00",
"source_file": "3-Data-Visualization/12-visualization-relationships/notebook.ipynb",
"language_code": "ml"
}
},
"nbformat": 4,
"nbformat_minor": 2
}

@ -0,0 +1,184 @@
<!--
CO_OP_TRANSLATOR_METADATA:
{
"original_hash": "cfb068050337a36e348debaa502a24fa",
"translation_date": "2025-12-19T16:08:19+00:00",
"source_file": "3-Data-Visualization/13-meaningful-visualizations/README.md",
"language_code": "ml"
}
-->
# അർത്ഥവത്തായ ദൃശ്യവത്കരണങ്ങൾ നിർമ്മിക്കൽ
|![ Sketchnote by [(@sketchthedocs)](https://sketchthedocs.dev) ](../../sketchnotes/13-MeaningfulViz.png)|
|:---:|
| അർത്ഥവത്തായ ദൃശ്യവത്കരണങ്ങൾ - _Sketchnote by [@nitya](https://twitter.com/nitya)_ |
> "നിങ്ങൾ ഡാറ്റയെ മതിയായ സമയം പീഡിപ്പിച്ചാൽ, അത് എന്തും സമ്മതിക്കും" -- [Ronald Coase](https://en.wikiquote.org/wiki/Ronald_Coase)
ഒരു ഡാറ്റ സയന്റിസ്റ്റിന്റെ അടിസ്ഥാന കഴിവുകളിൽ ഒന്നാണ് നിങ്ങൾക്കുണ്ടാകാവുന്ന ചോദ്യങ്ങൾക്ക് ഉത്തരം നൽകാൻ സഹായിക്കുന്ന അർത്ഥവത്തായ ഡാറ്റാ ദൃശ്യവത്കരണം സൃഷ്ടിക്കാൻ കഴിയുക. നിങ്ങളുടെ ഡാറ്റ ദൃശ്യവത്കരിക്കുന്നതിന് മുമ്പ്, അത് ശുദ്ധീകരിക്കുകയും തയ്യാറാക്കുകയും ചെയ്തിട്ടുണ്ടെന്ന് ഉറപ്പാക്കണം, മുമ്പത്തെ പാഠങ്ങളിൽ നിങ്ങൾ ചെയ്തതുപോലെ. അതിനുശേഷം, ഡാറ്റ എങ്ങനെ മികച്ച രീതിയിൽ അവതരിപ്പിക്കാമെന്ന് തീരുമാനിക്കാം.
ഈ പാഠത്തിൽ, നിങ്ങൾ അവലോകനം ചെയ്യും:
1. ശരിയായ ചാർട്ട് തരം എങ്ങനെ തിരഞ്ഞെടുക്കാം
2. വഞ്ചനാപരമായ ചാർട്ടിംഗ് ഒഴിവാക്കാൻ എങ്ങനെ
3. നിറവുമായി എങ്ങനെ പ്രവർത്തിക്കാം
4. വായനാസൗകര്യത്തിനായി നിങ്ങളുടെ ചാർട്ടുകൾ എങ്ങനെ സ്റ്റൈൽ ചെയ്യാം
5. അനിമേറ്റഡ് അല്ലെങ്കിൽ 3D ചാർട്ടിംഗ് പരിഹാരങ്ങൾ എങ്ങനെ നിർമ്മിക്കാം
6. സൃഷ്ടിപരമായ ഒരു ദൃശ്യവത്കരണം എങ്ങനെ നിർമ്മിക്കാം
## [പ്രീ-ലെക്ചർ ക്വിസ്](https://ff-quizzes.netlify.app/en/ds/quiz/24)
## ശരിയായ ചാർട്ട് തരം തിരഞ്ഞെടുക്കുക
മുൻപത്തെ പാഠങ്ങളിൽ, Matplotlib, Seaborn എന്നിവ ഉപയോഗിച്ച് വിവിധ രസകരമായ ഡാറ്റാ ദൃശ്യവത്കരണങ്ങൾ നിർമ്മിക്കാൻ നിങ്ങൾ പരീക്ഷിച്ചു. സാധാരണയായി, നിങ്ങൾ ചോദിക്കുന്ന ചോദ്യത്തിന് അനുയോജ്യമായ [ശരിയായ ചാർട്ട് തരം](https://chartio.com/learn/charts/how-to-select-a-data-vizualization/) ഈ പട്ടിക ഉപയോഗിച്ച് തിരഞ്ഞെടുക്കാം:
| നിങ്ങൾ ചെയ്യേണ്ടത്: | നിങ്ങൾ ഉപയോഗിക്കേണ്ടത്: |
| -------------------------- | ------------------------------- |
| സമയാനുസൃത ഡാറ്റ ട്രെൻഡുകൾ കാണിക്കുക | ലൈൻ |
| വിഭാഗങ്ങൾ താരതമ്യം ചെയ്യുക | ബാർ, പൈ |
| മൊത്തം താരതമ്യം ചെയ്യുക | പൈ, സ്റ്റാക്ക് ബാർ |
| ബന്ധങ്ങൾ കാണിക്കുക | സ്കാറ്റർ, ലൈൻ, ഫേസറ്റ്, ഡ്യുവൽ ലൈൻ |
| വിതരണങ്ങൾ കാണിക്കുക | സ്കാറ്റർ, ഹിസ്റ്റോഗ്രാം, ബോക്സ് |
| അനുപാതങ്ങൾ കാണിക്കുക | പൈ, ഡോണട്ട്, വാഫി |
> ✅ നിങ്ങളുടെ ഡാറ്റയുടെ ഘടന അനുസരിച്ച്, ഒരു നൽകിയ ചാർട്ട് പിന്തുണയ്ക്കാൻ അത് ടെക്സ്റ്റിൽ നിന്ന് സംഖ്യാത്മകത്തിലേക്ക് മാറ്റേണ്ടി വരാം.
## വഞ്ചന ഒഴിവാക്കുക
ഒരു ഡാറ്റ സയന്റിസ്റ്റ് ശരിയായ ഡാറ്റയ്ക്ക് ശരിയായ ചാർട്ട് തിരഞ്ഞെടുക്കാൻ ശ്രദ്ധിച്ചാലും, ഡാറ്റയെ തെളിയിക്കാൻ പലവിധം വഞ്ചനാപരമായി പ്രദർശിപ്പിക്കാനുള്ള മാർഗ്ഗങ്ങൾ ധാരാളമാണ്, പലപ്പോഴും ഡാറ്റയെ തന്നെ അപഹസിക്കുന്ന വിലക്ക് വരുത്തി. വഞ്ചനാപരമായ ചാർട്ടുകളും ഇൻഫോഗ്രാഫിക്സും ധാരാളം ഉദാഹരണങ്ങളുണ്ട്!
[![How Charts Lie by Alberto Cairo](../../../../translated_images/tornado.9f42168791208f970d6faefc11d1226d7ca89518013b14aa66b1c9edcd7678d2.ml.png)](https://www.youtube.com/watch?v=oX74Nge8Wkw "How charts lie")
> 🎥 വഞ്ചനാപരമായ ചാർട്ടുകൾക്കുറിച്ചുള്ള കോൺഫറൻസ് ടോക്കിനായി മുകളിൽ ചിത്രത്തിൽ ക്ലിക്ക് ചെയ്യുക
ഈ ചാർട്ട് X അക്ഷം മറിച്ച് സത്യം മറിച്ച് കാണിക്കുന്നു, തീയതി അടിസ്ഥാനമാക്കി:
![bad chart 1](../../../../translated_images/bad-chart-1.93130f495b748bedfb3423d91b1e754d9026e17f94ad967aecdc9ca7203373bf.ml.png)
[ഈ ചാർട്ട്](https://media.firstcoastnews.com/assets/WTLV/images/170ae16f-4643-438f-b689-50d66ca6a8d8/170ae16f-4643-438f-b689-50d66ca6a8d8_1140x641.jpg) കൂടുതൽ വഞ്ചനാപരമാണ്, കാരണം കണ്ണ് വലത്തേക്ക് ആകർഷിക്കപ്പെടുന്നു, സമയാനുസൃതമായി COVID കേസുകൾ വിവിധ കൗണ്ടികളിൽ കുറയുകയാണെന്ന് നിഗമനം ചെയ്യാൻ. എന്നാൽ, തീയതികൾ ശ്രദ്ധാപൂർവ്വം നോക്കിയാൽ, അവ വഞ്ചനാപരമായ താഴ്ന്ന ട്രെൻഡ് നൽകാൻ പുനഃക്രമീകരിച്ചിട്ടുള്ളതായി കാണാം.
![bad chart 2](../../../../translated_images/bad-chart-2.c20e36dd4e6f617c0c325878dd421a563885bbf30a394884c147438827254e0e.ml.jpg)
ഈ പ്രശസ്ത ഉദാഹരണം നിറവും മറിച്ച Y അക്ഷവും ഉപയോഗിച്ച് വഞ്ചന ചെയ്യുന്നു: തോക്കു-സഹായക നിയമം പാസായതിന് ശേഷം തോക്ക് മരണങ്ങൾ വർധിച്ചതായി നിഗമനം ചെയ്യേണ്ടതിനു പകരം, കണ്ണ് മറിച്ച് സത്യം മറിച്ച് കാണുന്നു:
![bad chart 3](../../../../translated_images/bad-chart-3.6865d0afac4108d737558d90a61547d23a8722896397ec792264ee51a1be4be5.ml.jpg)
ഈ വിചിത്രമായ ചാർട്ട് അനുപാതം എങ്ങനെ മാനിപ്പുലേറ്റ് ചെയ്യാമെന്ന് ഹാസ്യകരമായി കാണിക്കുന്നു:
![bad chart 4](../../../../translated_images/bad-chart-4.68cfdf4011b454471053ee1231172747e1fbec2403b4443567f1dc678134f4f2.ml.jpg)
തുല്യമായവ അല്ലാത്തവ താരതമ്യം ചെയ്യുക മറ്റൊരു സംശയാസ്പദമായ തന്ത്രമാണ്. 'സ്പ്യൂറിയസ് കോറിലേഷൻസ്' എന്ന വിഷയത്തിൽ 'മെയ്നിലെ വിവാഹമോചന നിരക്കും മാർഗറിൻ ഉപഭോഗവും' പോലുള്ള കാര്യങ്ങൾ തമ്മിലുള്ള 'വാസ്തവങ്ങൾ' പ്രദർശിപ്പിക്കുന്ന [അദ്ഭുതകരമായ വെബ്‌സൈറ്റ്](https://tylervigen.com/spurious-correlations) ഉണ്ട്. Reddit ഗ്രൂപ്പ് ഡാറ്റയുടെ [കീഴടക്കം ഉപയോഗങ്ങൾ](https://www.reddit.com/r/dataisugly/top/?t=all) ശേഖരിക്കുന്നു.
വഞ്ചനാപരമായ ചാർട്ടുകൾ കൊണ്ട് കണ്ണ് എളുപ്പത്തിൽ എങ്ങനെ വഞ്ചിക്കപ്പെടാമെന്ന് മനസ്സിലാക്കുന്നത് പ്രധാനമാണ്. ഡാറ്റ സയന്റിസ്റ്റിന്റെ ഉദ്ദേശ്യം നല്ലതായാലും, പൈ ചാർട്ട് പോലുള്ള തെറ്റായ ചാർട്ട് തരം തിരഞ്ഞെടുക്കുന്നത് വഞ്ചനാപരമായിരിക്കാം, പ്രത്യേകിച്ച് വളരെ അധികം വിഭാഗങ്ങൾ കാണിക്കുന്നപ്പോൾ.
## നിറം
മുകളിൽ 'ഫ്ലോറിഡ ഗൺ വയലൻസ്' ചാർട്ടിൽ നിങ്ങൾ കണ്ടതുപോലെ, നിറം ചാർട്ടുകൾക്ക് അധിക അർത്ഥം നൽകാൻ സഹായിക്കുന്നു, പ്രത്യേകിച്ച് Matplotlib, Seaborn പോലുള്ള ലൈബ്രറികൾ ഉപയോഗിച്ച് രൂപകൽപ്പന ചെയ്തിട്ടില്ലാത്തവയ്ക്ക്, അവയിൽ വിവിധ പരിശോധന ചെയ്ത നിറ ലൈബ്രറികളും പാളറ്റുകളും ഉണ്ട്. നിങ്ങൾ കൈകൊണ്ട് ഒരു ചാർട്ട് നിർമ്മിക്കുമ്പോൾ, [നിറ സിദ്ധാന്തം](https://colormatters.com/color-and-design/basic-color-theory) കുറച്ച് പഠിക്കുക.
> ✅ ചാർട്ടുകൾ രൂപകൽപ്പന ചെയ്യുമ്പോൾ, ആക്സസിബിലിറ്റി ഒരു പ്രധാന ഘടകമാണെന്ന് ശ്രദ്ധിക്കുക. നിങ്ങളുടെ ചില ഉപയോക്താക്കൾക്ക് നിറം കാണാനാകാത്തവരായിരിക്കാം - നിങ്ങളുടെ ചാർട്ട് ദൃശ്യ വൈകല്യമുള്ള ഉപയോക്താക്കൾക്ക് നന്നായി പ്രദർശിപ്പിക്കുന്നുണ്ടോ?
നിങ്ങളുടെ ചാർട്ടിനായി നിറങ്ങൾ തിരഞ്ഞെടുക്കുമ്പോൾ ജാഗ്രത പാലിക്കുക, കാരണം നിറം നിങ്ങൾ ഉദ്ദേശിക്കുന്നതിൽ വ്യത്യസ്തമായ അർത്ഥം നൽകാം. മുകളിൽ 'ഉയരം' ചാർട്ടിലെ 'പിങ്ക് ലേഡീസ്' ഒരു വ്യക്തമായ 'സ്ത്രീലിംഗ' അർത്ഥം നൽകുന്നു, ഇത് ചാർട്ടിന്റെ വിചിത്രതയിൽ കൂടി കൂട്ടിച്ചേർക്കുന്നു.
വിവിധ ഭാഗങ്ങളിൽ [നിറത്തിന്റെ അർത്ഥം](https://colormatters.com/color-symbolism/the-meanings-of-colors) വ്യത്യസ്തമായിരിക്കാം, കൂടാതെ അവയുടെ ഷേഡ് അനുസരിച്ച് അർത്ഥം മാറാറുണ്ട്. പൊതുവായി, നിറങ്ങളുടെ അർത്ഥങ്ങൾ ഉൾപ്പെടുന്നു:
| നിറം | അർത്ഥം |
| ------ | ------------------- |
| ചുവപ്പ് | ശക്തി |
| നീലം | വിശ്വാസം, വിശ്വസ്തത |
| മഞ്ഞ | സന്തോഷം, ജാഗ്രത |
| പച്ച | പരിസ്ഥിതി, ഭാഗ്യം, ഇർഷ്യ |
| പർപ്പിൾ | സന്തോഷം |
| ഓറഞ്ച് | ഉജ്ജ്വലത |
നിങ്ങൾക്ക് കസ്റ്റം നിറങ്ങളുള്ള ഒരു ചാർട്ട് നിർമ്മിക്കേണ്ടതുണ്ടെങ്കിൽ, നിങ്ങളുടെ ചാർട്ടുകൾ ആക്സസിബിളും നിങ്ങൾ നൽകാൻ ശ്രമിക്കുന്ന അർത്ഥത്തോടും പൊരുത്തപ്പെടുന്നതുമായിരിക്കണം.
## വായനാസൗകര്യത്തിനായി നിങ്ങളുടെ ചാർട്ടുകൾ സ്റ്റൈൽ ചെയ്യുക
ചാർട്ടുകൾ വായിക്കാൻ കഴിയാത്ത പക്ഷം അർത്ഥവത്തായവയല്ല! നിങ്ങളുടെ ഡാറ്റയ്ക്ക് അനുസരിച്ച് ചാർട്ടിന്റെ വീതി, ഉയരം എന്നിവ സ്കെയിൽ ചെയ്യുന്നതിന് ഒരു നിമിഷം ചെലവഴിക്കുക. ഒരു വേരിയബിൾ (ഉദാ: എല്ലാ 50 സംസ്ഥാനങ്ങളും) പ്രദർശിപ്പിക്കേണ്ടതുണ്ടെങ്കിൽ, അവയെ Y അക്ഷത്തിൽ ലംബമായി കാണിക്കുക, അതുവഴി കൂറ്റൻ ഹോരിസോണ്ടൽ സ്ക്രോൾ ചാർട്ട് ഒഴിവാക്കാം.
നിങ്ങളുടെ അക്ഷങ്ങൾ ലേബൽ ചെയ്യുക, ആവശ്യമെങ്കിൽ ലെജൻഡ് നൽകുക, ഡാറ്റയുടെ മികച്ച മനസ്സിലാക്കലിനായി ടൂൾടിപ്പുകൾ നൽകുക.
നിങ്ങളുടെ ഡാറ്റ ടെക്സ്റ്റ് ആണെങ്കിൽ, X അക്ഷ上的 വാചകം വായനാസൗകര്യത്തിനായി കോണിൽ വയ്ക്കാം. [Matplotlib](https://matplotlib.org/stable/tutorials/toolkits/mplot3d.html) 3D പ്ലോട്ടിംഗ് നൽകുന്നു, നിങ്ങളുടെ ഡാറ്റ അത് പിന്തുണയ്ക്കുന്നുവെങ്കിൽ. സങ്കീർണ്ണമായ ഡാറ്റാ ദൃശ്യവത്കരണങ്ങൾ `mpl_toolkits.mplot3d` ഉപയോഗിച്ച് നിർമ്മിക്കാം.
![3d plots](../../../../translated_images/3d.0cec12bcc60f0ce7284c63baed1411a843e24716f7d7425de878715ebad54a15.ml.png)
## അനിമേഷൻ, 3D ചാർട്ട് പ്രദർശനം
ഇന്നത്തെ മികച്ച ഡാറ്റാ ദൃശ്യവത്കരണങ്ങളിൽ ചിലത് അനിമേറ്റഡ് ആണ്. Shirley Wu D3 ഉപയോഗിച്ച് '[film flowers](http://bl.ocks.org/sxywu/raw/d612c6c653fb8b4d7ff3d422be164a5d/)' പോലുള്ള അത്ഭുതകരമായവ ഉണ്ടാക്കി, ഓരോ പൂവും ഒരു സിനിമയുടെ ദൃശ്യവത്കരണമാണ്. Guardian-നായി മറ്റൊരു ഉദാഹരണം 'bussed out' ആണ്, Greensock, D3 എന്നിവയുമായി സംയോജിപ്പിച്ച ഒരു ഇന്ററാക്ടീവ് അനുഭവം, സ്ക്രോൾടെല്ലിംഗ് ലേഖന ഫോർമാറ്റിൽ, NYC എങ്ങനെ നഗരത്തിലെ ഹോമ്ലെസ്സ് പ്രശ്നം ബസ്സിലൂടെ പുറത്തേക്ക് കൊണ്ടുപോകുന്നു എന്ന് കാണിക്കുന്നു.
![busing](../../../../translated_images/busing.7b9e3b41cd4b981c6d63922cd82004cc1cf18895155536c1d98fcc0999bdd23e.ml.png)
> "Bussed Out: How America Moves its Homeless" from [the Guardian](https://www.theguardian.com/us-news/ng-interactive/2017/dec/20/bussed-out-america-moves-homeless-people-country-study). Visualizations by Nadieh Bremer & Shirley Wu
ഈ പാഠം ഈ ശക്തമായ ദൃശ്യവത്കരണ ലൈബ്രറികൾ പഠിപ്പിക്കാൻ മതിയാകാത്തതിനാൽ, Vue.js ആപ്പിൽ D3 ഉപയോഗിച്ച് "Dangerous Liaisons" എന്ന പുസ്തകത്തിന്റെ അനിമേറ്റഡ് സോഷ്യൽ നെറ്റ്‌വർക്ക് ദൃശ്യവത്കരണം പ്രദർശിപ്പിക്കാൻ ശ്രമിക്കുക.
> "Les Liaisons Dangereuses" ഒരു കത്ത് നോവലാണ്, അഥവാ കത്തുകളുടെ ഒരു പരമ്പരയായി അവതരിപ്പിച്ച നോവൽ. 1782-ൽ Choderlos de Laclos എഴുതിയ ഇത് ഫ്രഞ്ച് അരിപ്പ്രതിഷ്ഠയുടെ 18-ാം നൂറ്റാണ്ടിന്റെ അവസാനം രണ്ട് മുഖ്യ കഥാപാത്രങ്ങളായ Vicomte de Valmont, Marquise de Merteuil എന്നിവരുടെ ദുഷ്ടമായ, നൈതികമായി തകർന്ന സാമൂഹിക തന്ത്രങ്ങൾ പറയുന്നു. ഇരുവരും അവസാനം മരണപ്പെടുന്നു, പക്ഷേ വലിയ സാമൂഹിക നാശം സൃഷ്ടിച്ചുകൊണ്ട്. നോവൽ അവരുടെ വൃത്തങ്ങളിൽ വിവിധ ആളുകൾക്ക് എഴുതിയ കത്തുകളുടെ പരമ്പരയായി തുറക്കുന്നു, പ്രതികാരം ചെയ്യാനോ പ്രശ്നങ്ങൾ സൃഷ്ടിക്കാനോ. ഈ കത്തുകളുടെ ദൃശ്യവത്കരണം സൃഷ്ടിച്ച് കഥയിലെ പ്രധാന കഥാപാത്രങ്ങളെ ദൃശ്യമായി കണ്ടെത്തുക.
നിങ്ങൾ ഒരു വെബ് ആപ്പ് പൂർത്തിയാക്കും, ഇത് ഈ സോഷ്യൽ നെറ്റ്‌വർക്ക് അനിമേറ്റഡ് ദൃശ്യമായി കാണിക്കും. ഇത് Vue.js, D3 ഉപയോഗിച്ച് [നെറ്റ്‌വർക്ക് ദൃശ്യവത്കരണം](https://github.com/emiliorizzo/vue-d3-network) സൃഷ്ടിക്കാൻ നിർമ്മിച്ച ഒരു ലൈബ്രറി ഉപയോഗിക്കുന്നു. ആപ്പ് പ്രവർത്തിക്കുമ്പോൾ, സ്ക്രീനിൽ നോഡുകൾ നീക്കി ഡാറ്റ മാറ്റാം.
![liaisons](../../../../translated_images/liaisons.7b440b28f6d07ea430244fdf1fc4c64ff48f473f143b8e921846eda1c302aeba.ml.png)
## പ്രോജക്ട്: D3.js ഉപയോഗിച്ച് ഒരു നെറ്റ്‌വർക്ക് കാണിക്കുന്ന ചാർട്ട് നിർമ്മിക്കുക
> ഈ പാഠം ഉൾപ്പെടുന്ന ഫോൾഡറിൽ `solution` ഫോൾഡർ ഉണ്ട്, പൂർത്തിയായ പ്രോജക്ട് അവിടെ കാണാം, നിങ്ങളുടെ റഫറൻസിനായി.
1. സ്റ്റാർട്ടർ ഫോൾഡറിന്റെ റൂട്ടിലുള്ള README.md ഫയലിലെ നിർദ്ദേശങ്ങൾ പാലിക്കുക. നിങ്ങളുടെ മെഷീനിൽ NPM, Node.js പ്രവർത്തിക്കുന്നുണ്ടെന്ന് ഉറപ്പാക്കുക, തുടർന്ന് പ്രോജക്ടിന്റെ ഡിപ്പൻഡൻസികൾ ഇൻസ്റ്റാൾ ചെയ്യുക.
2. `starter/src` ഫോൾഡർ തുറക്കുക. അവിടെ ഒരു `assets` ഫോൾഡർ കാണും, അതിൽ നോവലിലെ എല്ലാ കത്തുകളും നമ്പർ ചെയ്തും 'to' 'from' അനോട്ടേഷനോടും ഉള്ള .json ഫയൽ കാണാം.
3. `components/Nodes.vue`-ൽ കോഡ് പൂർത്തിയാക്കുക, ദൃശ്യവത്കരണം സജ്ജമാക്കാൻ. `createLinks()` എന്ന മെത്തഡ് കണ്ടെത്തി താഴെ കൊടുത്ത നസ്റ്റഡ് ലൂപ്പ് ചേർക്കുക.
.json ഒബ്ജക്റ്റിൽ 'to' 'from' ഡാറ്റ പിടിച്ച് `links` ഒബ്ജക്റ്റ് നിർമ്മിക്കുക, ദൃശ്യവത്കരണ ലൈബ്രറി അത് ഉപയോഗിക്കാനായി:
```javascript
//അക്ഷരങ്ങളിലൂടെ ലൂപ്പ് ചെയ്യുക
let f = 0;
let t = 0;
for (var i = 0; i < letters.length; i++) {
for (var j = 0; j < characters.length; j++) {
if (characters[j] == letters[i].from) {
f = j;
}
if (characters[j] == letters[i].to) {
t = j;
}
}
this.links.push({ sid: f, tid: t });
}
```
ടെർമിനലിൽ നിന്ന് നിങ്ങളുടെ ആപ്പ് (npm run serve) ഓടിച്ച് ദൃശ്യവത്കരണം ആസ്വദിക്കുക!
## 🚀 ചലഞ്ച്
ഇന്റർനെറ്റിൽ വഞ്ചനാപരമായ ദൃശ്യവത്കരണങ്ങൾ കണ്ടെത്താൻ ഒരു യാത്ര നടത്തുക. എഴുത്തുകാരൻ ഉപയോക്താവിനെ എങ്ങനെ വഞ്ചിക്കുന്നു, അത് ഉദ്ദേശിച്ചിട്ടുള്ളതാണോ? ദൃശ്യവത്കരണങ്ങൾ ശരിയാക്കാൻ ശ്രമിച്ച് അവ എങ്ങനെ കാണിക്കണം എന്ന് കാണിക്കുക.
## [പോസ്റ്റ്-ലെക്ചർ ക്വിസ്](https://ff-quizzes.netlify.app/en/ds/quiz/25)
## അവലോകനം & സ്വയം പഠനം
വഞ്ചനാപരമായ ഡാറ്റാ ദൃശ്യവത്കരണങ്ങളെക്കുറിച്ച് വായിക്കാൻ ചില ലേഖനങ്ങൾ:
https://gizmodo.com/how-to-lie-with-data-visualization-1563576606
http://ixd.prattsi.org/2017/12/visual-lies-usability-in-deceptive-data-visualizations/
ചരിത്ര ആസ്തികളും കലാസാമഗ്രികളും സംബന്ധിച്ച രസകരമായ ദൃശ്യവത്കരണങ്ങൾ കാണുക:
https://handbook.pubpub.org/
അനിമേഷൻ നിങ്ങളുടെ ദൃശ്യവത്കരണങ്ങൾ എങ്ങനെ മെച്ചപ്പെടുത്താമെന്ന് ഈ ലേഖനം കാണുക:
https://medium.com/@EvanSinar/use-animation-to-supercharge-data-visualization-cd905a882ad4
## അസൈൻമെന്റ്
[നിങ്ങളുടെ സ്വന്തം കസ്റ്റം ദൃശ്യവത്കരണം നിർമ്മിക്കുക](assignment.md)
---
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
**അസൂയാ**:
ഈ രേഖ AI വിവർത്തന സേവനം [Co-op Translator](https://github.com/Azure/co-op-translator) ഉപയോഗിച്ച് വിവർത്തനം ചെയ്തതാണ്. നാം കൃത്യതയ്ക്ക് ശ്രമിച്ചിട്ടുണ്ടെങ്കിലും, സ്വയം പ്രവർത്തിക്കുന്ന വിവർത്തനങ്ങളിൽ പിശകുകൾ അല്ലെങ്കിൽ തെറ്റുകൾ ഉണ്ടാകാമെന്ന് ദയവായി ശ്രദ്ധിക്കുക. അതിന്റെ മാതൃഭാഷയിലുള്ള യഥാർത്ഥ രേഖയാണ് പ്രാമാണികമായ ഉറവിടം എന്ന് പരിഗണിക്കേണ്ടതാണ്. നിർണായകമായ വിവരങ്ങൾക്ക്, പ്രൊഫഷണൽ മനുഷ്യ വിവർത്തനം ശുപാർശ ചെയ്യപ്പെടുന്നു. ഈ വിവർത്തനം ഉപയോഗിക്കുന്നതിൽ നിന്നുണ്ടാകുന്ന ഏതെങ്കിലും തെറ്റിദ്ധാരണകൾക്കോ തെറ്റായ വ്യാഖ്യാനങ്ങൾക്കോ ഞങ്ങൾ ഉത്തരവാദികളല്ല.
<!-- CO-OP TRANSLATOR DISCLAIMER END -->

@ -0,0 +1,27 @@
<!--
CO_OP_TRANSLATOR_METADATA:
{
"original_hash": "e56df4c0f49357e30ac8fc77aa439dd4",
"translation_date": "2025-12-19T16:11:28+00:00",
"source_file": "3-Data-Visualization/13-meaningful-visualizations/assignment.md",
"language_code": "ml"
}
-->
# നിങ്ങളുടെ സ്വന്തം കസ്റ്റം വിസ് നിർമ്മിക്കുക
## നിർദ്ദേശങ്ങൾ
ഈ പ്രോജക്റ്റിലെ കോഡ് സാമ്പിൾ ഉപയോഗിച്ച് ഒരു സോഷ്യൽ നെറ്റ്‌വർക്ക് സൃഷ്ടിച്ച്, നിങ്ങളുടെ സ്വന്തം സോഷ്യൽ ഇടപെടലുകളുടെ മോക് ഡാറ്റ തയ്യാറാക്കുക. നിങ്ങൾ സോഷ്യൽ മീഡിയ ഉപയോഗം മാപ്പ് ചെയ്യുകയോ നിങ്ങളുടെ കുടുംബാംഗങ്ങളുടെ ഒരു ഡയഗ്രാം ഉണ്ടാക്കുകയോ ചെയ്യാം. ഒരു സവിശേഷമായ സോഷ്യൽ നെറ്റ്‌വർക്ക് ദൃശ്യവത്കരണം കാണിക്കുന്ന ഒരു രസകരമായ വെബ് ആപ്പ് സൃഷ്ടിക്കുക.
## റൂബ്രിക്
Exemplary | Adequate | Needs Improvement
--- | --- | -- |
GitHub റിപോ ഒരു സ്റ്റാറ്റിക് വെബ് ആപ്പായി ഡിപ്ലോയ് ചെയ്യാൻ ശ്രമിച്ച് ശരിയായി പ്രവർത്തിക്കുന്ന കോഡും പ്രോജക്റ്റ് വിശദീകരിക്കുന്ന READMEയു ഉള്ളതാണ് | റിപോ ശരിയായി പ്രവർത്തിക്കുന്നില്ല അല്ലെങ്കിൽ നന്നായി ഡോക്യുമെന്റ് ചെയ്തിട്ടില്ല | റിപോ ശരിയായി പ്രവർത്തിക്കുന്നില്ല കൂടാതെ നന്നായി ഡോക്യുമെന്റ് ചെയ്തിട്ടില്ല
---
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
**അസൂയാപത്രം**:
ഈ രേഖ AI വിവർത്തന സേവനം [Co-op Translator](https://github.com/Azure/co-op-translator) ഉപയോഗിച്ച് വിവർത്തനം ചെയ്തതാണ്. നാം കൃത്യതയ്ക്ക് ശ്രമിച്ചിട്ടുണ്ടെങ്കിലും, യന്ത്രം ചെയ്ത വിവർത്തനങ്ങളിൽ പിശകുകൾ അല്ലെങ്കിൽ തെറ്റുകൾ ഉണ്ടാകാമെന്ന് ദയവായി ശ്രദ്ധിക്കുക. അതിന്റെ മാതൃഭാഷയിലുള്ള യഥാർത്ഥ രേഖ അധികാരപരമായ ഉറവിടമായി കണക്കാക്കപ്പെടണം. നിർണായകമായ വിവരങ്ങൾക്ക്, പ്രൊഫഷണൽ മനുഷ്യ വിവർത്തനം ശുപാർശ ചെയ്യപ്പെടുന്നു. ഈ വിവർത്തനം ഉപയോഗിക്കുന്നതിൽ നിന്നുണ്ടാകുന്ന ഏതെങ്കിലും തെറ്റിദ്ധാരണകൾക്കോ തെറ്റായ വ്യാഖ്യാനങ്ങൾക്കോ ഞങ്ങൾ ഉത്തരവാദികളല്ല.
<!-- CO-OP TRANSLATOR DISCLAIMER END -->

@ -0,0 +1,42 @@
<!--
CO_OP_TRANSLATOR_METADATA:
{
"original_hash": "5c51a54dd89075a7a362890117b7ed9e",
"translation_date": "2025-12-19T16:18:53+00:00",
"source_file": "3-Data-Visualization/13-meaningful-visualizations/solution/README.md",
"language_code": "ml"
}
-->
# ഡേഞ്ചറസ് ലിയാസൺസ് ഡാറ്റാ വിസ്വലൈസേഷൻ പ്രോജക്ട്
ആരംഭിക്കാൻ, നിങ്ങളുടെ മെഷീനിൽ NPMയു Nodeയു പ്രവർത്തനക്ഷമമാണെന്ന് ഉറപ്പാക്കണം. ഡിപ്പൻഡൻസികൾ ഇൻസ്റ്റാൾ ചെയ്യുക (npm install) പിന്നെ പ്രോജക്ട് ലോക്കലായി റൺ ചെയ്യുക (npm run serve):
## പ്രോജക്ട് സെറ്റപ്പ്
```
npm install
```
### ഡെവലപ്പ്മെന്റിനായി കോമ്പൈൽ ചെയ്ത് ഹോട്ട്-റീലോഡ് ചെയ്യുന്നു
```
npm run serve
```
### പ്രൊഡക്ഷനായി കോമ്പൈൽ ചെയ്ത് മിനിഫൈ ചെയ്യുന്നു
```
npm run build
```
### ഫയലുകൾ ലിന്റ് ചെയ്ത് ശരിയാക്കുന്നു
```
npm run lint
```
### കോൺഫിഗറേഷൻ കസ്റ്റമൈസ് ചെയ്യുക
കാണുക [Configuration Reference](https://cli.vuejs.org/config/).
---
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
**അസൂയാ**:
ഈ രേഖ AI വിവർത്തന സേവനം [Co-op Translator](https://github.com/Azure/co-op-translator) ഉപയോഗിച്ച് വിവർത്തനം ചെയ്തതാണ്. നാം കൃത്യതയ്ക്ക് ശ്രമിച്ചെങ്കിലും, സ്വയം പ്രവർത്തിക്കുന്ന വിവർത്തനങ്ങളിൽ പിശകുകൾ അല്ലെങ്കിൽ തെറ്റുകൾ ഉണ്ടാകാമെന്ന് ദയവായി ശ്രദ്ധിക്കുക. അതിന്റെ മാതൃഭാഷയിലുള്ള യഥാർത്ഥ രേഖ പ്രാമാണികമായ ഉറവിടമായി കണക്കാക്കണം. നിർണായക വിവരങ്ങൾക്ക്, പ്രൊഫഷണൽ മനുഷ്യ വിവർത്തനം ശുപാർശ ചെയ്യപ്പെടുന്നു. ഈ വിവർത്തനത്തിന്റെ ഉപയോഗത്തിൽ നിന്നുണ്ടാകുന്ന ഏതെങ്കിലും തെറ്റിദ്ധാരണകൾക്കോ തെറ്റായ വ്യാഖ്യാനങ്ങൾക്കോ ഞങ്ങൾ ഉത്തരവാദികളല്ല.
<!-- CO-OP TRANSLATOR DISCLAIMER END -->

@ -0,0 +1,42 @@
<!--
CO_OP_TRANSLATOR_METADATA:
{
"original_hash": "5c51a54dd89075a7a362890117b7ed9e",
"translation_date": "2025-12-19T16:18:07+00:00",
"source_file": "3-Data-Visualization/13-meaningful-visualizations/starter/README.md",
"language_code": "ml"
}
-->
# ഡേഞ്ചറസ് ലിയാസൺസ് ഡാറ്റാ വിസ്വലൈസേഷൻ പ്രോജക്ട്
ആരംഭിക്കാൻ, നിങ്ങളുടെ മെഷീനിൽ NPMയു Nodeയു പ്രവർത്തനക്ഷമമാണെന്ന് ഉറപ്പാക്കണം. ഡിപ്പൻഡൻസികൾ ഇൻസ്റ്റാൾ ചെയ്യുക (npm install) പിന്നെ പ്രോജക്ട് ലോക്കലായി റൺ ചെയ്യുക (npm run serve):
## പ്രോജക്ട് സെറ്റപ്പ്
```
npm install
```
### ഡെവലപ്പ്മെന്റിനായി കോമ്പൈൽ ചെയ്ത് ഹോട്ട്-റീലോഡ് ചെയ്യുന്നു
```
npm run serve
```
### പ്രൊഡക്ഷനായി കോമ്പൈൽ ചെയ്ത് മിനിഫൈ ചെയ്യുന്നു
```
npm run build
```
### ഫയലുകൾ ലിന്റ് ചെയ്ത് ശരിയാക്കുന്നു
```
npm run lint
```
### കോൺഫിഗറേഷൻ കസ്റ്റമൈസ് ചെയ്യുക
കാണുക [Configuration Reference](https://cli.vuejs.org/config/).
---
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
**അസൂയാ**:
ഈ രേഖ AI വിവർത്തന സേവനം [Co-op Translator](https://github.com/Azure/co-op-translator) ഉപയോഗിച്ച് വിവർത്തനം ചെയ്തതാണ്. നാം കൃത്യതയ്ക്ക് ശ്രമിച്ചിട്ടുണ്ടെങ്കിലും, സ്വയം പ്രവർത്തിക്കുന്ന വിവർത്തനങ്ങളിൽ പിശകുകൾ അല്ലെങ്കിൽ തെറ്റായ വിവരങ്ങൾ ഉണ്ടാകാമെന്ന് ദയവായി ശ്രദ്ധിക്കുക. അതിന്റെ മാതൃഭാഷയിലുള്ള യഥാർത്ഥ രേഖ പ്രാമാണികമായ ഉറവിടമായി കണക്കാക്കണം. നിർണായകമായ വിവരങ്ങൾക്ക്, പ്രൊഫഷണൽ മനുഷ്യ വിവർത്തനം ശുപാർശ ചെയ്യപ്പെടുന്നു. ഈ വിവർത്തനത്തിന്റെ ഉപയോഗത്തിൽ നിന്നുണ്ടാകുന്ന ഏതെങ്കിലും തെറ്റിദ്ധാരണകൾക്കോ തെറ്റായ വ്യാഖ്യാനങ്ങൾക്കോ ഞങ്ങൾ ഉത്തരവാദികളല്ല.
<!-- CO-OP TRANSLATOR DISCLAIMER END -->

@ -0,0 +1,233 @@
<!--
CO_OP_TRANSLATOR_METADATA:
{
"original_hash": "22acf28f518a4769ea14fa42f4734b9f",
"translation_date": "2025-12-19T16:32:46+00:00",
"source_file": "3-Data-Visualization/R/09-visualization-quantities/README.md",
"language_code": "ml"
}
-->
# അളവുകൾ ദൃശ്യവൽക്കരിക്കൽ
|![ [(@sketchthedocs)](https://sketchthedocs.dev) എന്നവരുടെ സ്കെച്ച്നോട്ട് ](https://github.com/microsoft/Data-Science-For-Beginners/blob/main/sketchnotes/09-Visualizing-Quantities.png)|
|:---:|
| അളവുകൾ ദൃശ്യവൽക്കരിക്കൽ - _[@nitya](https://twitter.com/nitya) എന്നവരുടെ സ്കെച്ച്നോട്ട്_ |
ഈ പാഠത്തിൽ, അളവിന്റെ ആശയത്തെ ചുറ്റിപ്പറ്റി രസകരമായ ദൃശ്യവൽക്കരണങ്ങൾ സൃഷ്ടിക്കാൻ ഉപയോഗിക്കാവുന്ന നിരവധി R പാക്കേജുകൾ എങ്ങനെ ഉപയോഗിക്കാമെന്ന് നിങ്ങൾ പഠിക്കും. മിന്നസോട്ടയുടെ പക്ഷികളെക്കുറിച്ചുള്ള ശുദ്ധീകരിച്ച ഡാറ്റാസെറ്റ് ഉപയോഗിച്ച്, പ്രാദേശിക വന്യജീവികളെക്കുറിച്ചുള്ള നിരവധി രസകരമായ വസ്തുതകൾ നിങ്ങൾക്ക് അറിയാം.
## [പാഠം മുൻകൂർ ക്വിസ്](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/16)
## ggplot2 ഉപയോഗിച്ച് വിങ്‌സ്പാൻ നിരീക്ഷിക്കുക
വിവിധ തരത്തിലുള്ള ലളിതവും സങ്കീർണ്ണവുമായ പ്ലോട്ടുകളും ചാർട്ടുകളും സൃഷ്ടിക്കാൻ മികച്ച ലൈബ്രറി [ggplot2](https://cran.r-project.org/web/packages/ggplot2/index.html) ആണ്. പൊതുവായി, ഈ ലൈബ്രറികൾ ഉപയോഗിച്ച് ഡാറ്റ പ്ലോട്ട് ചെയ്യാനുള്ള പ്രക്രിയയിൽ നിങ്ങളുടെ ഡാറ്റാഫ്രെയിമിന്റെ ലക്ഷ്യമിടേണ്ട ഭാഗങ്ങൾ തിരിച്ചറിയുക, ആവശ്യമായ മാറ്റങ്ങൾ ചെയ്യുക, അതിന്റെ x, y അക്ഷ മൂല്യങ്ങൾ നിശ്ചയിക്കുക, ഏത് തരത്തിലുള്ള പ്ലോട്ട് കാണിക്കണമെന്ന് തീരുമാനിക്കുക, പിന്നെ പ്ലോട്ട് കാണിക്കുക എന്നിവ ഉൾപ്പെടുന്നു.
`ggplot2` The Grammar of Graphics-നെ അടിസ്ഥാനമാക്കി ഗ്രാഫിക്സ് പ്രഖ്യാപനാത്മകമായി സൃഷ്ടിക്കുന്ന ഒരു സിസ്റ്റമാണ്. [The Grammar of Graphics](https://en.wikipedia.org/wiki/Ggplot2) ഡാറ്റാ ദൃശ്യവൽക്കരണത്തിന് ഒരു പൊതുവായ പദ്ധതി ആണ്, ഇത് ഗ്രാഫുകളെ സ്കെയിലുകളും ലെയറുകളും പോലുള്ള സാംവേദനാത്മക ഘടകങ്ങളായി വിഭജിക്കുന്നു. മറ്റൊരു വാക്കിൽ പറഞ്ഞാൽ, കുറച്ച് കോഡിൽ ഏകവിവരശേഷിയുള്ളതോ ബഹുവിവരശേഷിയുള്ളതോ ആയ ഡാറ്റയ്ക്ക് പ്ലോട്ടുകളും ഗ്രാഫുകളും സൃഷ്ടിക്കാൻ എളുപ്പം ഉള്ളതിനാൽ `ggplot2` R-ൽ ദൃശ്യവൽക്കരണത്തിന് ഏറ്റവും ജനപ്രിയമായ പാക്കേജാണ്. ഉപയോക്താവ് `ggplot2`-ന് എങ്ങനെ വേരിയബിളുകൾ എസ്റ്ററ്റിക്സിലേക്ക് മാപ്പ് ചെയ്യാമെന്ന്, ഉപയോഗിക്കേണ്ട ഗ്രാഫിക്കൽ പ്രിമിറ്റീവുകൾ എന്തെന്ന് പറയുന്നു, പിന്നെ ബാക്കി കാര്യങ്ങൾ `ggplot2` കൈകാര്യം ചെയ്യുന്നു.
> ✅ പ്ലോട്ട് = ഡാറ്റ + എസ്റ്ററ്റിക്സ് + ജ്യാമിതി
> - ഡാറ്റ ഡാറ്റാസെറ്റിനെ സൂചിപ്പിക്കുന്നു
> - എസ്റ്ററ്റിക്സ് പഠിക്കേണ്ട വേരിയബിളുകൾ (x, y വേരിയബിളുകൾ) സൂചിപ്പിക്കുന്നു
> - ജ്യാമിതി പ്ലോട്ടിന്റെ തരം (ലൈൻ പ്ലോട്ട്, ബാർ പ്ലോട്ട്, മുതലായവ) സൂചിപ്പിക്കുന്നു
നിങ്ങളുടെ ഡാറ്റയും പ്ലോട്ടിലൂടെ പറയാൻ ആഗ്രഹിക്കുന്ന കഥയും അനുസരിച്ച് മികച്ച ജ്യാമിതി (പ്ലോട്ടിന്റെ തരം) തിരഞ്ഞെടുക്കുക.
> - പ്രവണതകൾ വിശകലനം ചെയ്യാൻ: ലൈൻ, കോളം
> - മൂല്യങ്ങൾ താരതമ്യം ചെയ്യാൻ: ബാർ, കോളം, പൈ, സ്കാറ്റർപ്ലോട്ട്
> - ഭാഗങ്ങൾ മുഴുവൻ എങ്ങനെ ബന്ധപ്പെട്ടിരിക്കുന്നു കാണിക്കാൻ: പൈ
> - ഡാറ്റയുടെ വിതരണങ്ങൾ കാണിക്കാൻ: സ്കാറ്റർപ്ലോട്ട്, ബാർ
> - മൂല്യങ്ങൾ തമ്മിലുള്ള ബന്ധങ്ങൾ കാണിക്കാൻ: ലൈൻ, സ്കാറ്റർപ്ലോട്ട്, ബബിൾ
✅ ggplot2-ക്കായി ഈ വിവരണാത്മക [ചീറ്റ്ഷീറ്റ്](https://nyu-cdsc.github.io/learningr/assets/data-visualization-2.1.pdf) നിങ്ങൾക്ക് പരിശോധിക്കാം.
## പക്ഷികളുടെ വിങ്‌സ്പാൻ മൂല്യങ്ങളെക്കുറിച്ച് ഒരു ലൈൻ പ്ലോട്ട് നിർമ്മിക്കുക
R കൺസോൾ തുറന്ന് ഡാറ്റാസെറ്റ് ഇറക്കുമതി ചെയ്യുക.
> കുറിപ്പ്: ഡാറ്റാസെറ്റ് ഈ റിപോസിറ്ററിയുടെ റൂട്ടിലുള്ള `/data` ഫോൾഡറിൽ സൂക്ഷിച്ചിരിക്കുന്നു.
ഡാറ്റാസെറ്റ് ഇറക്കുമതി ചെയ്ത് ഡാറ്റയുടെ മുകളിൽ (മുകളിൽ 5 വരികൾ) നോക്കാം.
```r
birds <- read.csv("../../data/birds.csv",fileEncoding="UTF-8-BOM")
head(birds)
```
ഡാറ്റയുടെ മുകളിൽ ടെക്സ്റ്റും സംഖ്യകളും ചേർന്നിരിക്കുന്നു:
| | Name | ScientificName | Category | Order | Family | Genus | ConservationStatus | MinLength | MaxLength | MinBodyMass | MaxBodyMass | MinWingspan | MaxWingspan |
| ---: | :--------------------------- | :--------------------- | :-------------------- | :----------- | :------- | :---------- | :----------------- | --------: | --------: | ----------: | ----------: | ----------: | ----------: |
| 0 | Black-bellied whistling-duck | Dendrocygna autumnalis | Ducks/Geese/Waterfowl | Anseriformes | Anatidae | Dendrocygna | LC | 47 | 56 | 652 | 1020 | 76 | 94 |
| 1 | Fulvous whistling-duck | Dendrocygna bicolor | Ducks/Geese/Waterfowl | Anseriformes | Anatidae | Dendrocygna | LC | 45 | 53 | 712 | 1050 | 85 | 93 |
| 2 | Snow goose | Anser caerulescens | Ducks/Geese/Waterfowl | Anseriformes | Anatidae | Anser | LC | 64 | 79 | 2050 | 4050 | 135 | 165 |
| 3 | Ross's goose | Anser rossii | Ducks/Geese/Waterfowl | Anseriformes | Anatidae | Anser | LC | 57.3 | 64 | 1066 | 1567 | 113 | 116 |
| 4 | Greater white-fronted goose | Anser albifrons | Ducks/Geese/Waterfowl | Anseriformes | Anatidae | Anser | LC | 64 | 81 | 1930 | 3310 | 130 | 165 |
അടിസ്ഥാന ലൈൻ പ്ലോട്ട് ഉപയോഗിച്ച് ചില സംഖ്യാത്മക ഡാറ്റ പ്ലോട്ട് ചെയ്യുന്നതിലൂടെ തുടങ്ങാം. ഈ രസകരമായ പക്ഷികളുടെ പരമാവധി വിങ്‌സ്പാൻ കാണാൻ നിങ്ങൾ ആഗ്രഹിക്കുന്നുവെന്ന് കരുതുക.
```r
install.packages("ggplot2")
library("ggplot2")
ggplot(data=birds, aes(x=Name, y=MaxWingspan,group=1)) +
geom_line()
```
ഇവിടെ, `ggplot2` പാക്കേജ് ഇൻസ്റ്റാൾ ചെയ്ത് `library("ggplot2")` കമാൻഡ് ഉപയോഗിച്ച് വർക്ക്‌സ്പേസിലേക്ക് ഇറക്കുമതി ചെയ്യുന്നു. ggplot-ൽ ഏതെങ്കിലും പ്ലോട്ട് ചെയ്യാൻ `ggplot()` ഫംഗ്ഷൻ ഉപയോഗിക്കുന്നു, ഡാറ്റാസെറ്റ്, x, y വേരിയബിളുകൾ ആട്രിബ്യൂട്ടുകളായി നിശ്ചയിക്കുന്നു. ഈ കേസിൽ, ലൈൻ പ്ലോട്ട് സൃഷ്ടിക്കാനാണ് ഉദ്ദേശം, അതിനാൽ `geom_line()` ഫംഗ്ഷൻ ഉപയോഗിക്കുന്നു.
![MaxWingspan-lineplot](../../../../../translated_images/MaxWingspan-lineplot.b12169f99d26fdd263f291008dfd73c18a4ba8f3d32b1fda3d74af51a0a28616.ml.png)
നിങ്ങൾ ഉടൻ ശ്രദ്ധിക്കുന്നതെന്താണ്? കുറഞ്ഞത് ഒരു ഔട്ട്‌ലൈയർ ഉണ്ടെന്ന് തോന്നുന്നു - അത്ര വലിയ വിങ്‌സ്പാൻ! 2000+ സെന്റീമീറ്റർ വിങ്‌സ്പാൻ 20 മീറ്ററിലധികമാണ് - മിന്നസോട്ടയിൽ പ്റ്റെറോഡാക്റ്റിലുകൾ നടക്കുകയാണോ? പരിശോധിക്കാം.
Excel-ൽ ഒരു വേഗത്തിലുള്ള സോർട്ട് ചെയ്ത് ആ ഔട്ട്‌ലൈയറുകൾ കണ്ടെത്താമെങ്കിലും, അവ ടൈപ്പോസ് ആകാമെന്ന് കരുതുന്നു, പ്ലോട്ടിൽ നിന്നുള്ള ദൃശ്യവൽക്കരണ പ്രക്രിയ തുടരുക.
x-അക്ഷത്തിൽ ലേബലുകൾ ചേർക്കുക, ഏത് തരത്തിലുള്ള പക്ഷികളാണെന്ന് കാണിക്കാൻ:
```r
ggplot(data=birds, aes(x=Name, y=MaxWingspan,group=1)) +
geom_line() +
theme(axis.text.x = element_text(angle = 45, hjust=1))+
xlab("Birds") +
ylab("Wingspan (CM)") +
ggtitle("Max Wingspan in Centimeters")
```
`theme`-ൽ ആംഗിൾ നിശ്ചയിച്ച് `xlab()`-ൽ x അക്ഷ ലേബൽ, `ylab()`-ൽ y അക്ഷ ലേബൽ നിശ്ചയിക്കുന്നു. `ggtitle()` ഗ്രാഫ്/പ്ലോട്ടിന് പേര് നൽകുന്നു.
![MaxWingspan-lineplot-improved](../../../../../translated_images/MaxWingspan-lineplot-improved.04b73b4d5a59552a6bc7590678899718e1f065abe9eada9ebb4148939b622fd4.ml.png)
45 ഡിഗ്രി ലേബലുകൾ തിരിയിച്ചിട്ടും വായിക്കാൻ വളരെ അധികം ലേബലുകൾ ഉണ്ട്. വ്യത്യസ്തമായ ഒരു തന്ത്രം പരീക്ഷിക്കാം: ആ ഔട്ട്‌ലൈയറുകൾക്ക് മാത്രമേ ലേബലുകൾ നൽകൂ, ലേബലുകൾ ചാർട്ടിനുള്ളിൽ സജ്ജമാക്കൂ. ലേബലിംഗിന് കൂടുതൽ സ്ഥലം നൽകാൻ സ്കാറ്റർ ചാർട്ട് ഉപയോഗിക്കാം:
```r
ggplot(data=birds, aes(x=Name, y=MaxWingspan,group=1)) +
geom_point() +
geom_text(aes(label=ifelse(MaxWingspan>500,as.character(Name),'')),hjust=0,vjust=0) +
theme(axis.title.x=element_blank(), axis.text.x=element_blank(), axis.ticks.x=element_blank())
ylab("Wingspan (CM)") +
ggtitle("Max Wingspan in Centimeters") +
```
ഇവിടെ എന്താണ് സംഭവിക്കുന്നത്? `geom_point()` ഫംഗ്ഷൻ ഉപയോഗിച്ച് സ്കാറ്റർ പോയിന്റുകൾ പ്ലോട്ട് ചെയ്തു. `MaxWingspan > 500` ഉള്ള പക്ഷികൾക്ക് ലേബലുകൾ ചേർത്തു, പ്ലോട്ടിന്റെ ക്ലട്ടർ കുറയ്ക്കാൻ x അക്ഷ上的 ലേബലുകൾ മറച്ചു.
നിങ്ങൾ എന്ത് കണ്ടെത്തുന്നു?
![MaxWingspan-scatterplot](../../../../../translated_images/MaxWingspan-scatterplot.60dc9e0e19d32700283558f253841fdab5104abb62bc96f7d97f9c0ee857fa8b.ml.png)
## നിങ്ങളുടെ ഡാറ്റ ഫിൽട്ടർ ചെയ്യുക
ബാൾഡ് ഈഗിൾ, പ്രെയറി ഫാൽക്കൺ എന്നിവ വലിയ പക്ഷികളായിരിക്കാം, പക്ഷേ പരമാവധി വിങ്‌സ്പാനിൽ ഒരു അധികം 0 ചേർത്തു തെറ്റായി ലേബൽ ചെയ്തതായി തോന്നുന്നു. 25 മീറ്റർ വിങ്‌സ്പാൻ ഉള്ള ബാൾഡ് ഈഗിൾ കാണാൻ സാധ്യത കുറവാണ്, പക്ഷേ ഉണ്ടെങ്കിൽ ഞങ്ങളെ അറിയിക്കുക! ആ രണ്ട് ഔട്ട്‌ലൈയറുകൾ ഇല്ലാതെ പുതിയ ഡാറ്റാഫ്രെയിം സൃഷ്ടിക്കാം:
```r
birds_filtered <- subset(birds, MaxWingspan < 500)
ggplot(data=birds_filtered, aes(x=Name, y=MaxWingspan,group=1)) +
geom_point() +
ylab("Wingspan (CM)") +
xlab("Birds") +
ggtitle("Max Wingspan in Centimeters") +
geom_text(aes(label=ifelse(MaxWingspan>500,as.character(Name),'')),hjust=0,vjust=0) +
theme(axis.text.x=element_blank(), axis.ticks.x=element_blank())
```
പുതിയ ഡാറ്റാഫ്രെയിം `birds_filtered` സൃഷ്ടിച്ച് സ്കാറ്റർ പ്ലോട്ട് ചെയ്തു. ഔട്ട്‌ലൈയറുകൾ ഫിൽട്ടർ ചെയ്തതിനാൽ, നിങ്ങളുടെ ഡാറ്റ കൂടുതൽ ഏകീകൃതവും മനസ്സിലാക്കാൻ എളുപ്പവുമാണ്.
![MaxWingspan-scatterplot-improved](../../../../../translated_images/MaxWingspan-scatterplot-improved.7d0af81658c65f3e75b8fedeb2335399e31108257e48db15d875ece608272051.ml.png)
ഇപ്പോൾ വിങ്‌സ്പാൻ സംബന്ധിച്ച് കുറഞ്ഞത് ശുദ്ധമായ ഡാറ്റാസെറ്റ് ഉണ്ടെന്ന് കരുതി, ഈ പക്ഷികളെക്കുറിച്ച് കൂടുതൽ കണ്ടെത്താം.
ലൈൻ, സ്കാറ്റർ പ്ലോട്ടുകൾ ഡാറ്റ മൂല്യങ്ങളും അവയുടെ വിതരണങ്ങളും പ്രദർശിപ്പിക്കുമ്പോൾ, ഈ ഡാറ്റാസെറ്റിൽ ഉള്ള മൂല്യങ്ങളെക്കുറിച്ച് ചിന്തിക്കണം. അളവിനെക്കുറിച്ച് താഴെ പറയുന്ന ചോദ്യങ്ങൾക്ക് ഉത്തരം കണ്ടെത്താൻ ദൃശ്യവൽക്കരണങ്ങൾ സൃഷ്ടിക്കാം:
> പക്ഷികളുടെ എത്ര വിഭാഗങ്ങളുണ്ട്, അവയുടെ എണ്ണം എത്ര?
> എത്ര പക്ഷികൾ നശിച്ചുപോയവ, അപകടത്തിൽപെട്ടവ, അപൂർവം, സാധാരണ?
> ലിനിയസിന്റെ പദവ്യവസ്ഥയിൽ വിവിധ ജീനസുകളും ഓർഡറുകളും എത്ര?
## ബാർ ചാർട്ടുകൾ പരിശോധിക്കുക
ഡാറ്റ ഗ്രൂപ്പുകൾ കാണിക്കേണ്ടപ്പോൾ ബാർ ചാർട്ടുകൾ പ്രായോഗികമാണ്. ഈ ഡാറ്റാസെറ്റിലെ പക്ഷികളുടെ വിഭാഗങ്ങൾ പരിശോധിച്ച് ഏത് വിഭാഗം ഏറ്റവും സാധാരണമാണെന്ന് കാണാം. ഫിൽട്ടർ ചെയ്ത ഡാറ്റയിൽ ബാർ ചാർട്ട് സൃഷ്ടിക്കാം.
```r
install.packages("dplyr")
install.packages("tidyverse")
library(lubridate)
library(scales)
library(dplyr)
library(ggplot2)
library(tidyverse)
birds_filtered %>% group_by(Category) %>%
summarise(n=n(),
MinLength = mean(MinLength),
MaxLength = mean(MaxLength),
MinBodyMass = mean(MinBodyMass),
MaxBodyMass = mean(MaxBodyMass),
MinWingspan=mean(MinWingspan),
MaxWingspan=mean(MaxWingspan)) %>%
gather("key", "value", - c(Category, n)) %>%
ggplot(aes(x = Category, y = value, group = key, fill = key)) +
geom_bar(stat = "identity") +
scale_fill_manual(values = c("#D62728", "#FF7F0E", "#8C564B","#2CA02C", "#1F77B4", "#9467BD")) +
xlab("Category")+ggtitle("Birds of Minnesota")
```
താഴെ കൊടുത്തിരിക്കുന്ന കോഡിൽ, ഡാറ്റ മാനിപ്പുലേറ്റ് ചെയ്ത് ഗ്രൂപ്പ് ചെയ്യാൻ സഹായിക്കുന്ന [dplyr](https://www.rdocumentation.org/packages/dplyr/versions/0.7.8)യും [lubridate](https://www.rdocumentation.org/packages/lubridate/versions/1.8.0)യും പാക്കേജുകൾ ഇൻസ്റ്റാൾ ചെയ്യുന്നു. ആദ്യം, പക്ഷികളുടെ `Category` പ്രകാരം ഡാറ്റ ഗ്രൂപ്പ് ചെയ്ത് `MinLength`, `MaxLength`, `MinBodyMass`, `MaxBodyMass`, `MinWingspan`, `MaxWingspan` കോളങ്ങൾ സംഗ്രഹിക്കുന്നു. പിന്നെ `ggplot2` ഉപയോഗിച്ച് ബാർ ചാർട്ട് പ്ലോട്ട് ചെയ്യുന്നു, വ്യത്യസ്ത വിഭാഗങ്ങൾക്ക് നിറങ്ങൾ നിശ്ചയിച്ച് ലേബലുകൾ ചേർക്കുന്നു.
![Stacked bar chart](../../../../../translated_images/stacked-bar-chart.0c92264e89da7b391a7490224d1e7059a020e8b74dcd354414aeac78871c02f1.ml.png)
ഈ ബാർ ചാർട്ട് വായിക്കാൻ ബുദ്ധിമുട്ടാണ്, കാരണം ഗ്രൂപ്പ് ചെയ്യാത്ത ഡാറ്റ വളരെ കൂടുതലാണ്. നിങ്ങൾ പ്ലോട്ട് ചെയ്യാൻ ആഗ്രഹിക്കുന്ന ഡാറ്റ മാത്രം തിരഞ്ഞെടുക്കണം, അതിനാൽ പക്ഷികളുടെ നീളം അവരുടെ വിഭാഗം അടിസ്ഥാനമാക്കി നോക്കാം.
പക്ഷികളുടെ വിഭാഗം മാത്രം ഉൾപ്പെടുത്താൻ ഡാറ്റ ഫിൽട്ടർ ചെയ്യുക.
വിവിധ വിഭാഗങ്ങൾ 많아서, ഈ ചാർട്ട് ലംബമായി പ്രദർശിപ്പിച്ച് ഉയരം ക്രമീകരിച്ച് എല്ലാ ഡാറ്റയും ഉൾപ്പെടുത്താം:
```r
birds_count<-dplyr::count(birds_filtered, Category, sort = TRUE)
birds_count$Category <- factor(birds_count$Category, levels = birds_count$Category)
ggplot(birds_count,aes(Category,n))+geom_bar(stat="identity")+coord_flip()
```
`Category` കോളത്തിൽ ഉള്ള വ്യത്യസ്ത മൂല്യങ്ങൾ എണ്ണുകയും അവ `birds_count` എന്ന പുതിയ ഡാറ്റാഫ്രെയിമിൽ ക്രമീകരിക്കുകയും ചെയ്യുന്നു. ഈ ക്രമീകരിച്ച ഡാറ്റയെ ഫാക്ടർ ലെവലിൽ ഉൾപ്പെടുത്തി ക്രമീകരിച്ച രീതിയിൽ പ്ലോട്ട് ചെയ്യുന്നു. `ggplot2` ഉപയോഗിച്ച് ബാർ ചാർട്ട് സൃഷ്ടിക്കുന്നു. `coord_flip()` ഉപയോഗിച്ച് ഹോരിസോണ്ടൽ ബാറുകൾ പ്ലോട്ട് ചെയ്യുന്നു.
![category-length](../../../../../translated_images/category-length.7e34c296690e85d64f7e4d25a56077442683eca96c4f5b4eae120a64c0755636.ml.png)
ഈ ബാർ ചാർട്ട് ഓരോ വിഭാഗത്തിലും പക്ഷികളുടെ എണ്ണം നല്ല രീതിയിൽ കാണിക്കുന്നു. ഒരു നിമിഷത്തിൽ, ഈ പ്രദേശത്തെ ഏറ്റവും വലിയ പക്ഷി എണ്ണം Ducks/Geese/Waterfowl വിഭാഗത്തിലാണ് എന്ന് കാണാം. മിന്നസോട്ട '10,000 തടാകങ്ങളുടെ നാട്' ആകുന്നതിനാൽ ഇത് അത്ഭുതകരമല്ല!
✅ ഈ ഡാറ്റാസെറ്റിൽ മറ്റ് എണ്ണങ്ങൾ പരീക്ഷിച്ച് നോക്കൂ. എന്തെങ്കിലും അത്ഭുതപ്പെടുത്തുന്നുണ്ടോ?
## ഡാറ്റ താരതമ്യം ചെയ്യൽ
ഗ്രൂപ്പ് ചെയ്ത ഡാറ്റയുടെ വ്യത്യസ്ത താരതമ്യങ്ങൾ പുതിയ അക്ഷങ്ങൾ സൃഷ്ടിച്ച് പരീക്ഷിക്കാം. പക്ഷിയുടെ പരമാവധി നീളം (MaxLength) അവയുടെ വിഭാഗം അടിസ്ഥാനമാക്കി താരതമ്യം ചെയ്യുക:
```r
birds_grouped <- birds_filtered %>%
group_by(Category) %>%
summarise(
MaxLength = max(MaxLength, na.rm = T),
MinLength = max(MinLength, na.rm = T)
) %>%
arrange(Category)
ggplot(birds_grouped,aes(Category,MaxLength))+geom_bar(stat="identity")+coord_flip()
```
`birds_filtered` ഡാറ്റ `Category` പ്രകാരം ഗ്രൂപ്പ് ചെയ്ത് ബാർ ഗ്രാഫ് പ്ലോട്ട് ചെയ്യുന്നു.
![comparing data](../../../../../translated_images/comparingdata.f486a450d61c7ca5416f27f3f55a6a4465d00df3be5e6d33936e9b07b95e2fdd.ml.png)
ഇവിടെ അത്ഭുതകരമായ ഒന്നുമില്ല: ഹമ്മിംഗ്‌ബർഡുകൾക്ക് പെലിക്കാനുകളോ ഗീസുകളോ അപേക്ഷിച്ച് ഏറ്റവും കുറഞ്ഞ MaxLength ഉണ്ട്. ഡാറ്റ ലജിക്കൽ ആകുമ്പോൾ നല്ലതാണ്!
ബാർ ചാർട്ടുകളുടെ കൂടുതൽ രസകരമായ ദൃശ്യവൽക്കരണങ്ങൾ സൃഷ്ടിക്കാൻ ഡാറ്റ സൂപ്പറിംപോസ് ചെയ്യാം. ഒരു പക്ഷി വിഭാഗത്തിൽ കുറഞ്ഞതും പരമാവതുമായ നീളം സൂപ്പറിംപോസ് ചെയ്യാം:
```r
ggplot(data=birds_grouped, aes(x=Category)) +
geom_bar(aes(y=MaxLength), stat="identity", position ="identity", fill='blue') +
geom_bar(aes(y=MinLength), stat="identity", position="identity", fill='orange')+
coord_flip()
```
![super-imposed values](../../../../../translated_images/superimposed-values.5363f0705a1da4167625a373a1064331ea3cb7a06a297297d0734fcc9b3819a0.ml.png)
## 🚀 ചലഞ്ച്
ഈ പക്ഷി ഡാറ്റാസെറ്റ് ഒരു പ്രത്യേക പരിസ്ഥിതിയിലെ വിവിധ തരത്തിലുള്ള പക്ഷികളെക്കുറിച്ചുള്ള ധാരാളം വിവരങ്ങൾ നൽകുന്നു. ഇന്റർനെറ്റിൽ തിരയുക, മറ്റ് പക്ഷി-കേന്ദ്രിത ഡാറ്റാസെറ്റുകൾ കണ്ടെത്താൻ ശ്രമിക്കുക. ഈ പക്ഷികളെക്കുറിച്ച് നിങ്ങൾ അറിയാത്ത വസ്തുതകൾ കണ്ടെത്താൻ ചാർട്ടുകളും ഗ്രാഫുകളും നിർമ്മിക്കാൻ അഭ്യാസം ചെയ്യുക.
## [പാഠം ശേഷം ക്വിസ്](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/17)
## അവലോകനം & സ്വയം പഠനം
ഈ ആദ്യ പാഠം `ggplot2` ഉപയോഗിച്ച് അളവുകൾ ദൃശ്യവൽക്കരിക്കുന്നതിനെക്കുറിച്ച് ചില വിവരങ്ങൾ നൽകി. ദൃശ്യവൽക്കരണത്തിനായി ഡാറ്റാസെറ്റുകൾ ഉപയോഗിക്കുന്ന മറ്റ് മാർഗങ്ങൾക്കായി കുറച്ച് ഗവേഷണം ചെയ്യുക. [Lattice](https://stat.ethz.ch/R-manual/R-devel/library/lattice/html/Lattice.html)യും [Plotly](https://github.com/plotly/plotly.R#readme) പോലുള്ള മറ്റ് പാക്കേജുകൾ ഉപയോഗിച്ച് ദൃശ്യവൽക്കരിക്കാൻ കഴിയുന്ന ഡാറ്റാസെറ്റുകൾ അന്വേഷിക്കുക.
## അസൈൻമെന്റ്
[ലൈൻസ്, സ്കാറ്റേഴ്സ്, ആൻഡ് ബാർസ്](assignment.md)
---
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
**അസൂയാ**:
ഈ രേഖ AI വിവർത്തന സേവനം [Co-op Translator](https://github.com/Azure/co-op-translator) ഉപയോഗിച്ച് വിവർത്തനം ചെയ്തതാണ്. നാം കൃത്യതയ്ക്ക് ശ്രമിച്ചെങ്കിലും, സ്വയം പ്രവർത്തിക്കുന്ന വിവർത്തനങ്ങളിൽ പിശകുകൾ അല്ലെങ്കിൽ തെറ്റുകൾ ഉണ്ടാകാമെന്ന് ദയവായി ശ്രദ്ധിക്കുക. അതിന്റെ മാതൃഭാഷയിലുള്ള യഥാർത്ഥ രേഖയാണ് പ്രാമാണികമായ ഉറവിടം എന്ന് പരിഗണിക്കേണ്ടതാണ്. നിർണായകമായ വിവരങ്ങൾക്ക്, പ്രൊഫഷണൽ മനുഷ്യ വിവർത്തനം ശുപാർശ ചെയ്യപ്പെടുന്നു. ഈ വിവർത്തനം ഉപയോഗിക്കുന്നതിൽ നിന്നുണ്ടാകുന്ന ഏതെങ്കിലും തെറ്റിദ്ധാരണകൾക്കോ തെറ്റായ വ്യാഖ്യാനങ്ങൾക്കോ ഞങ്ങൾ ഉത്തരവാദികളല്ല.
<!-- CO-OP TRANSLATOR DISCLAIMER END -->

@ -0,0 +1,27 @@
<!--
CO_OP_TRANSLATOR_METADATA:
{
"original_hash": "0ea21b6513df5ade7419c6b7d65f10b1",
"translation_date": "2025-12-19T16:34:47+00:00",
"source_file": "3-Data-Visualization/R/09-visualization-quantities/assignment.md",
"language_code": "ml"
}
-->
# ലൈനുകൾ, സ്‌കാറ്ററുകൾ, ബാറുകൾ
## നിർദ്ദേശങ്ങൾ
ഈ പാഠത്തിൽ, നിങ്ങൾ ലൈന്ചാർട്ടുകൾ, സ്‌കാറ്റർപ്ലോട്ടുകൾ, ബാർ ചാർട്ടുകൾ ഉപയോഗിച്ച് ഈ ഡാറ്റാസെറ്റിനെക്കുറിച്ചുള്ള രസകരമായ വസ്തുതകൾ കാണിച്ചു. ഈ അസൈൻമെന്റിൽ, ഒരു നിശ്ചിത പക്ഷിയുടെ ഒരു വസ്തുത കണ്ടെത്താൻ ഡാറ്റാസെറ്റിൽ കൂടുതൽ ആഴത്തിൽ തിരയുക. ഉദാഹരണത്തിന്, സ്നോ ഗീസിനെക്കുറിച്ചുള്ള എല്ലാ രസകരമായ ഡാറ്റയും ദൃശ്യവൽക്കരിക്കുന്ന ഒരു സ്ക്രിപ്റ്റ് സൃഷ്ടിക്കുക. മുകളിൽ പരാമർശിച്ച മൂന്ന് പ്ലോട്ടുകളും ഉപയോഗിച്ച് നിങ്ങളുടെ നോട്ട്‌ബുക്കിൽ ഒരു കഥ പറയുക.
## റൂബ്രിക്
Exemplary | Adequate | Needs Improvement
--- | --- | -- |
ഒരു സ്ക്രിപ്റ്റ് നല്ല അനോട്ടേഷനുകളോടും, ഉറച്ച കഥ പറയലോടും, ആകർഷകമായ ഗ്രാഫുകളോടും അവതരിപ്പിക്കുന്നു | സ്ക്രിപ്റ്റിൽ ഈ ഘടകങ്ങളിൽ ഒന്നൊന്നും ഇല്ല | സ്ക്രിപ്റ്റിൽ ഈ ഘടകങ്ങളിൽ രണ്ട് ഇല്ല
---
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
**അസൂയാ**:
ഈ രേഖ AI വിവർത്തന സേവനം [Co-op Translator](https://github.com/Azure/co-op-translator) ഉപയോഗിച്ച് വിവർത്തനം ചെയ്തതാണ്. നാം കൃത്യതയ്ക്ക് ശ്രമിച്ചിട്ടുണ്ടെങ്കിലും, സ്വയം പ്രവർത്തിക്കുന്ന വിവർത്തനങ്ങളിൽ പിശകുകൾ അല്ലെങ്കിൽ തെറ്റുകൾ ഉണ്ടാകാമെന്ന് ദയവായി ശ്രദ്ധിക്കുക. അതിന്റെ മാതൃഭാഷയിലുള്ള യഥാർത്ഥ രേഖയാണ് പ്രാമാണികമായ ഉറവിടം എന്ന് പരിഗണിക്കേണ്ടതാണ്. നിർണായകമായ വിവരങ്ങൾക്ക്, പ്രൊഫഷണൽ മനുഷ്യ വിവർത്തനം ശുപാർശ ചെയ്യപ്പെടുന്നു. ഈ വിവർത്തനം ഉപയോഗിക്കുന്നതിൽ നിന്നുണ്ടാകുന്ന ഏതെങ്കിലും തെറ്റിദ്ധാരണകൾക്കോ തെറ്റായ വ്യാഖ്യാനങ്ങൾക്കോ ഞങ്ങൾ ഉത്തരവാദികളല്ല.
<!-- CO-OP TRANSLATOR DISCLAIMER END -->

@ -0,0 +1,186 @@
<!--
CO_OP_TRANSLATOR_METADATA:
{
"original_hash": "ea67c0c40808fd723594de6896c37ccf",
"translation_date": "2025-12-19T16:21:13+00:00",
"source_file": "3-Data-Visualization/R/10-visualization-distributions/README.md",
"language_code": "ml"
}
-->
# വിതരണങ്ങൾ ദൃശ്യവൽക്കരിക്കൽ
|![ Sketchnote by [(@sketchthedocs)](https://sketchthedocs.dev) ](https://github.com/microsoft/Data-Science-For-Beginners/blob/main/sketchnotes/10-Visualizing-Distributions.png)|
|:---:|
| വിതരണങ്ങൾ ദൃശ്യവൽക്കരിക്കൽ - _Sketchnote by [@nitya](https://twitter.com/nitya)_ |
മുൻപത്തെ പാഠത്തിൽ, മിന്നസോട്ടയുടെ പക്ഷികളെക്കുറിച്ചുള്ള ഒരു ഡാറ്റാസെറ്റിനെക്കുറിച്ച് ചില രസകരമായ വസ്തുതകൾ നിങ്ങൾ പഠിച്ചു. ഔട്ട്ലയറുകൾ ദൃശ്യവൽക്കരിച്ച് ചില തെറ്റായ ഡാറ്റ കണ്ടെത്തി, കൂടാതെ പക്ഷികളുടെ പരമാവധി നീളത്തിന്റെ അടിസ്ഥാനത്തിൽ പക്ഷി വിഭാഗങ്ങൾ തമ്മിലുള്ള വ്യത്യാസങ്ങൾ നോക്കി.
## [പാഠം മുൻകൂർ ക്വിസ്](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/18)
## പക്ഷികളുടെ ഡാറ്റാസെറ്റ് പരിശോധിക്കുക
ഡാറ്റയിൽ കൂടുതൽ ആഴത്തിൽ നോക്കാനുള്ള മറ്റൊരു മാർഗം അതിന്റെ വിതരണത്തെ, അല്ലെങ്കിൽ ഡാറ്റ ഒരു അക്ഷരേഖയിലുടനീളം എങ്ങനെ ക്രമീകരിച്ചിരിക്കുന്നുവെന്ന് നോക്കുകയാണ്. ഉദാഹരണത്തിന്, മിന്നസോട്ടയിലെ പക്ഷികളുടെ പരമാവധി വിങ്‌സ്‌പാൻ അല്ലെങ്കിൽ പരമാവധി ശരീരഭാരം എന്ന ഡാറ്റാസെറ്റിന്റെ പൊതുവായ വിതരണത്തെക്കുറിച്ച് നിങ്ങൾ അറിയാൻ ആഗ്രഹിക്കാം.
ഈ ഡാറ്റാസെറ്റിലെ ഡാറ്റയുടെ വിതരണങ്ങളെക്കുറിച്ച് ചില വസ്തുതകൾ കണ്ടെത്താം. നിങ്ങളുടെ R കോൺസോളിൽ `ggplot2`യും ഡാറ്റാബേസും ഇറക്കുമതി ചെയ്യുക. മുൻപത്തെ വിഷയത്തിൽപോലെ ഡാറ്റാബേസിൽ നിന്നുള്ള ഔട്ട്ലയറുകൾ നീക്കം ചെയ്യുക.
```r
library(ggplot2)
birds <- read.csv("../../data/birds.csv",fileEncoding="UTF-8-BOM")
birds_filtered <- subset(birds, MaxWingspan < 500)
head(birds_filtered)
```
| | Name | ScientificName | Category | Order | Family | Genus | ConservationStatus | MinLength | MaxLength | MinBodyMass | MaxBodyMass | MinWingspan | MaxWingspan |
| ---: | :--------------------------- | :--------------------- | :-------------------- | :----------- | :------- | :---------- | :----------------- | --------: | --------: | ----------: | ----------: | ----------: | ----------: |
| 0 | Black-bellied whistling-duck | Dendrocygna autumnalis | Ducks/Geese/Waterfowl | Anseriformes | Anatidae | Dendrocygna | LC | 47 | 56 | 652 | 1020 | 76 | 94 |
| 1 | Fulvous whistling-duck | Dendrocygna bicolor | Ducks/Geese/Waterfowl | Anseriformes | Anatidae | Dendrocygna | LC | 45 | 53 | 712 | 1050 | 85 | 93 |
| 2 | Snow goose | Anser caerulescens | Ducks/Geese/Waterfowl | Anseriformes | Anatidae | Anser | LC | 64 | 79 | 2050 | 4050 | 135 | 165 |
| 3 | Ross's goose | Anser rossii | Ducks/Geese/Waterfowl | Anseriformes | Anatidae | Anser | LC | 57.3 | 64 | 1066 | 1567 | 113 | 116 |
| 4 | Greater white-fronted goose | Anser albifrons | Ducks/Geese/Waterfowl | Anseriformes | Anatidae | Anser | LC | 64 | 81 | 1930 | 3310 | 130 | 165 |
സാധാരണയായി, മുൻപത്തെ പാഠത്തിൽ ചെയ്തതുപോലെ സ്കാറ്റർ പ്ലോട്ട് ഉപയോഗിച്ച് ഡാറ്റ എങ്ങനെ വിതരണം ചെയ്തിട്ടുള്ളതെന്ന് നിങ്ങൾക്ക് വേഗത്തിൽ നോക്കാം:
```r
ggplot(data=birds_filtered, aes(x=Order, y=MaxLength,group=1)) +
geom_point() +
ggtitle("Max Length per order") + coord_flip()
```
![max length per order](../../../../../translated_images/max-length-per-order.e5b283d952c78c12b091307c5d3cf67132dad6fefe80a073353b9dc5c2bd3eb8.ml.png)
ഇത് ഓരോ പക്ഷി ഓർഡറിനും ശരീര നീളത്തിന്റെ പൊതുവായ വിതരണത്തിന്റെ ഒരു അവലോകനമാണ് നൽകുന്നത്, പക്ഷേ യഥാർത്ഥ വിതരണങ്ങൾ പ്രദർശിപ്പിക്കാൻ ഇത് ഏറ്റവും അനുയോജ്യമായ മാർഗം അല്ല. ആ ജോലി സാധാരണയായി ഹിസ്റ്റോഗ്രാം സൃഷ്ടിച്ച് കൈകാര്യം ചെയ്യുന്നു.
## ഹിസ്റ്റോഗ്രാമുകളുമായി പ്രവർത്തിക്കൽ
`ggplot2` ഡാറ്റ വിതരണങ്ങൾ ഹിസ്റ്റോഗ്രാമുകൾ ഉപയോഗിച്ച് ദൃശ്യവൽക്കരിക്കാൻ വളരെ നല്ല മാർഗങ്ങൾ നൽകുന്നു. ഈ തരം ചാർട്ട് ഒരു ബാർ ചാർട്ടിനുപോലെയാണ്, ബാറുകളുടെ ഉയർച്ചയും താഴ്വാരവും വഴി വിതരണത്തെ കാണിക്കാൻ കഴിയും. ഹിസ്റ്റോഗ്രാം നിർമ്മിക്കാൻ, നിങ്ങൾക്ക് സംഖ്യാത്മക ഡാറ്റ വേണം. ഹിസ്റ്റോഗ്രാം നിർമ്മിക്കാൻ, 'hist' എന്ന തരത്തിൽ ഒരു ചാർട്ട് പ്ലോട്ട് ചെയ്യാം. ഈ ചാർട്ട് മുഴുവൻ ഡാറ്റാസെറ്റിലെ MaxBodyMass ന്റെ വിതരണത്തെ കാണിക്കുന്നു. ഡാറ്റയുടെ നിരയെ ചെറിയ ബിനുകളായി വിഭജിച്ച്, ഡാറ്റയുടെ മൂല്യങ്ങളുടെ വിതരണത്തെ പ്രദർശിപ്പിക്കാം:
```r
ggplot(data = birds_filtered, aes(x = MaxBodyMass)) +
geom_histogram(bins=10)+ylab('Frequency')
```
![distribution over entire dataset](../../../../../translated_images/distribution-over-the-entire-dataset.d22afd3fa96be854e4c82213fedec9e3703cba753d07fad4606aadf58cf7e78e.ml.png)
നിങ്ങൾക്ക് കാണാമല്ലോ, ഈ ഡാറ്റാസെറ്റിലെ 400+ പക്ഷികളിൽ ഭൂരിഭാഗവും അവരുടെ പരമാവധി ശരീരഭാരം 2000-ൽ താഴെ വരുന്ന പരിധിയിലാണ്. `bins` പാരാമീറ്റർ ഉയർന്ന ഒരു സംഖ്യയാക്കി, ഉദാഹരണത്തിന് 30 ആക്കി, ഡാറ്റയിൽ കൂടുതൽ洞察ം നേടാം:
```r
ggplot(data = birds_filtered, aes(x = MaxBodyMass)) + geom_histogram(bins=30)+ylab('Frequency')
```
![distribution-30bins](../../../../../translated_images/distribution-30bins.6a3921ea7a421bf71f06bf5231009e43d1146f1b8da8dc254e99b5779a4983e5.ml.png)
ഈ ചാർട്ട് വിതരണത്തെ കുറച്ച് കൂടുതൽ സൂക്ഷ്മമായി കാണിക്കുന്നു. ഇടതുവശത്തേക്ക് കുറച്ച് കുറവുള്ള ചാർട്ട് സൃഷ്ടിക്കാൻ, നിങ്ങൾക്ക് ഒരു നിശ്ചിത പരിധിയിലുള്ള ഡാറ്റ മാത്രം തിരഞ്ഞെടുക്കണം:
ശരീരഭാരം 60-ൽ താഴെയുള്ള പക്ഷികളെ മാത്രം ഫിൽട്ടർ ചെയ്ത് 30 `bins` കാണിക്കുക:
```r
birds_filtered_1 <- subset(birds_filtered, MaxBodyMass > 1 & MaxBodyMass < 60)
ggplot(data = birds_filtered_1, aes(x = MaxBodyMass)) +
geom_histogram(bins=30)+ylab('Frequency')
```
![filtered histogram](../../../../../translated_images/filtered-histogram.6bf5d2bfd82533220e1bd4bc4f7d14308f43746ed66721d9ec8f460732be6674.ml.png)
✅ മറ്റ് ഫിൽട്ടറുകളും ഡാറ്റ പോയിന്റുകളും പരീക്ഷിക്കുക. ഡാറ്റയുടെ മുഴുവൻ വിതരണവും കാണാൻ, `['MaxBodyMass']` ഫിൽട്ടർ നീക്കം ചെയ്ത് ലേബൽ ചെയ്ത വിതരണങ്ങൾ കാണിക്കുക.
ഹിസ്റ്റോഗ്രാമിന് ചില നല്ല നിറവും ലേബലിംഗും ചേർക്കാം:
രണ്ട് വിതരണങ്ങൾ തമ്മിലുള്ള ബന്ധം താരതമ്യം ചെയ്യാൻ 2D ഹിസ്റ്റോഗ്രാം സൃഷ്ടിക്കുക. `MaxBodyMass` vs. `MaxLength` താരതമ്യം ചെയ്യാം. `ggplot2` കൂടുതൽ പ്രകാശമുള്ള നിറങ്ങൾ ഉപയോഗിച്ച് സമന്വയം കാണിക്കുന്ന ഒരു ഇൻബിൽറ്റ് മാർഗം നൽകുന്നു:
```r
ggplot(data=birds_filtered_1, aes(x=MaxBodyMass, y=MaxLength) ) +
geom_bin2d() +scale_fill_continuous(type = "viridis")
```
ഈ രണ്ട് ഘടകങ്ങൾ തമ്മിൽ പ്രതീക്ഷിക്കപ്പെട്ട ബന്ധം ഒരു പ്രതീക്ഷിച്ച അക്ഷരേഖയിൽ കാണപ്പെടുന്നു, പ്രത്യേകിച്ച് ശക്തമായ ഒരു സമന്വയ ബിന്ദു:
![2d plot](../../../../../translated_images/2d-plot.c504786f439bd7ebceebf2465c70ca3b124103e06c7ff7214bf24e26f7aec21e.ml.png)
ഹിസ്റ്റോഗ്രാമുകൾ സംഖ്യാത്മക ഡാറ്റയ്ക്ക് സാധാരണയായി നല്ല രീതിയിൽ പ്രവർത്തിക്കുന്നു. എന്നാൽ നിങ്ങൾക്ക് ടെക്സ്റ്റ് ഡാറ്റയുടെ അടിസ്ഥാനത്തിൽ വിതരണങ്ങൾ കാണേണ്ടതുണ്ടെങ്കിൽ?
## ടെക്സ്റ്റ് ഡാറ്റ ഉപയോഗിച്ച് ഡാറ്റാസെറ്റ് വിതരണങ്ങൾ പരിശോധിക്കുക
ഈ ഡാറ്റാസെറ്റിൽ പക്ഷി വിഭാഗം, ജനുസ്, സ്പീഷീസ്, കുടുംബം, കൂടാതെ സംരക്ഷണ നിലയെക്കുറിച്ചും നല്ല വിവരങ്ങൾ ഉൾക്കൊള്ളുന്നു. ഈ സംരക്ഷണ വിവരത്തിൽ കൂടുതൽ ആഴത്തിൽ നോക്കാം. പക്ഷികളുടെ സംരക്ഷണ നില അനുസരിച്ച് വിതരണങ്ങൾ എങ്ങനെയാണ്?
> ✅ ഡാറ്റാസെറ്റിൽ, സംരക്ഷണ നില വിവരിക്കാൻ പല ചുരുക്കപ്പേരുകളും ഉപയോഗിക്കുന്നു. ഈ ചുരുക്കപ്പേരുകൾ [IUCN Red List Categories](https://www.iucnredlist.org/) എന്ന സംഘടനയിൽ നിന്നാണ്.
>
> - CR: അത്യന്തം അപകടത്തിൽ
> - EN: അപകടത്തിൽ
> - EX: നശിച്ചുപോയ
> - LC: കുറഞ്ഞ ആശങ്ക
> - NT: അടുത്ത ഭീഷണി
> - VU: ഭീഷണിയുള്ള
ഇവ ടെക്സ്റ്റ് അടിസ്ഥാനമാക്കിയ മൂല്യങ്ങളാണ്, അതിനാൽ ഹിസ്റ്റോഗ്രാം സൃഷ്ടിക്കാൻ ഒരു ട്രാൻസ്ഫോം ചെയ്യേണ്ടതുണ്ട്. filteredBirds ഡാറ്റാഫ്രെയിമിൽ നിന്ന്, അതിന്റെ സംരക്ഷണ നിലയും കുറഞ്ഞ വിങ്‌സ്‌പാനും പ്രദർശിപ്പിക്കുക. നിങ്ങൾ എന്ത് കാണുന്നു?
```r
birds_filtered_1$ConservationStatus[birds_filtered_1$ConservationStatus == 'EX'] <- 'x1'
birds_filtered_1$ConservationStatus[birds_filtered_1$ConservationStatus == 'CR'] <- 'x2'
birds_filtered_1$ConservationStatus[birds_filtered_1$ConservationStatus == 'EN'] <- 'x3'
birds_filtered_1$ConservationStatus[birds_filtered_1$ConservationStatus == 'NT'] <- 'x4'
birds_filtered_1$ConservationStatus[birds_filtered_1$ConservationStatus == 'VU'] <- 'x5'
birds_filtered_1$ConservationStatus[birds_filtered_1$ConservationStatus == 'LC'] <- 'x6'
ggplot(data=birds_filtered_1, aes(x = MinWingspan, fill = ConservationStatus)) +
geom_histogram(position = "identity", alpha = 0.4, bins = 20) +
scale_fill_manual(name="Conservation Status",values=c("red","green","blue","pink"),labels=c("Endangered","Near Threathened","Vulnerable","Least Concern"))
```
![wingspan and conservation collation](../../../../../translated_images/wingspan-conservation-collation.4024e9aa6910866aa82f0c6cb6a6b4b925bd10079e6b0ef8f92eefa5a6792f76.ml.png)
കുറഞ്ഞ വിങ്‌സ്‌പാനും സംരക്ഷണ നിലയ്ക്കും ഇടയിൽ നല്ല ബന്ധമില്ലെന്ന് തോന്നുന്നു. ഈ രീതിയിൽ ഡാറ്റാസെറ്റിലെ മറ്റ് ഘടകങ്ങളും പരീക്ഷിക്കുക. നിങ്ങൾക്ക് ഏതെങ്കിലും ബന്ധം കണ്ടെത്താമോ?
## ഡെൻസിറ്റി പ്ലോട്ടുകൾ
ഇതുവരെ നോക്കിയ ഹിസ്റ്റോഗ്രാമുകൾ 'സ്റ്റെപ്പ്ഡ്' ആണെന്നും ഒരു സ്മൂത്ത് വക്രം പോലെ ഒഴുകുന്നില്ലെന്നും നിങ്ങൾ ശ്രദ്ധിച്ചിരിക്കാം. കൂടുതൽ സ്മൂത്ത് ഡെൻസിറ്റി ചാർട്ട് കാണിക്കാൻ, ഡെൻസിറ്റി പ്ലോട്ട് പരീക്ഷിക്കാം.
ഇപ്പോൾ ഡെൻസിറ്റി പ്ലോട്ടുമായി പ്രവർത്തിക്കാം!
```r
ggplot(data = birds_filtered_1, aes(x = MinWingspan)) +
geom_density()
```
![density plot](../../../../../translated_images/density-plot.675ccf865b76c690487fb7f69420a8444a3515f03bad5482886232d4330f5c85.ml.png)
മുൻപത്തെ കുറഞ്ഞ വിങ്‌സ്‌പാൻ ഡാറ്റയ്ക്കുള്ള പ്ലോട്ടിനെ പോലെ ഇത് കാണാം; ഇത് കുറച്ച് സ്മൂത്താണ്. നിങ്ങൾ രണ്ടാമത്തെ ചാർട്ടിൽ നിർമ്മിച്ച ജാഗ്ഗഡ് MaxBodyMass ലൈനിനെ സ്മൂത്ത് ആക്കാൻ ആഗ്രഹിക്കുന്നുവെങ്കിൽ, ഈ രീതിയിൽ പുനഃസൃഷ്ടിച്ച് വളരെ നന്നായി സ്മൂത്ത് ആക്കാം:
```r
ggplot(data = birds_filtered_1, aes(x = MaxBodyMass)) +
geom_density()
```
![bodymass density](../../../../../translated_images/bodymass-smooth.d31ce526d82b0a1f19a073815dea28ecfbe58145ec5337e4ef7e8cdac81120b3.ml.png)
കുറച്ച് സ്മൂത്ത്, എന്നാൽ വളരെ സ്മൂത്ത് അല്ലാത്ത ഒരു ലൈനിനായി, `adjust` പാരാമീറ്റർ എഡിറ്റ് ചെയ്യുക:
```r
ggplot(data = birds_filtered_1, aes(x = MaxBodyMass)) +
geom_density(adjust = 1/5)
```
![less smooth bodymass](../../../../../translated_images/less-smooth-bodymass.10f4db8b683cc17d17b2d33f22405413142004467a1493d416608dafecfdee23.ml.png)
✅ ഈ തരം പ്ലോട്ടിനുള്ള പാരാമീറ്ററുകൾക്കുറിച്ച് വായിച്ച് പരീക്ഷണങ്ങൾ നടത്തുക!
ഈ തരം ചാർട്ടുകൾ മനോഹരമായ വിശദീകരണ ദൃശ്യവൽക്കരണങ്ങൾ നൽകുന്നു. കുറച്ച് കോഡ് വരികളിൽ, ഉദാഹരണത്തിന്, ഓരോ പക്ഷി ഓർഡറിനും പരമാവധി ശരീരഭാരം ഡെൻസിറ്റി കാണിക്കാം:
```r
ggplot(data=birds_filtered_1,aes(x = MaxBodyMass, fill = Order)) +
geom_density(alpha=0.5)
```
![bodymass per order](../../../../../translated_images/bodymass-per-order.9d2b065dd931b928c839d8cdbee63067ab1ae52218a1b90717f4bc744354f485.ml.png)
## 🚀 വെല്ലുവിളി
ഹിസ്റ്റോഗ്രാമുകൾ അടിസ്ഥാന സ്കാറ്റർപ്ലോട്ടുകൾ, ബാർ ചാർട്ടുകൾ, അല്ലെങ്കിൽ ലൈൻ ചാർട്ടുകളേക്കാൾ കൂടുതൽ സങ്കീർണ്ണമായ ചാർട്ടുകളാണ്. ഇന്റർനെറ്റിൽ ഹിസ്റ്റോഗ്രാമുകളുടെ നല്ല ഉദാഹരണങ്ങൾ കണ്ടെത്താൻ തിരയുക. അവ എങ്ങനെ ഉപയോഗിക്കുന്നു, എന്ത് പ്രദർശിപ്പിക്കുന്നു, ഏത് മേഖലകളിൽ അല്ലെങ്കിൽ അന്വേഷണ മേഖലകളിൽ സാധാരണയായി ഉപയോഗിക്കുന്നു?
## [പാഠം ശേഷമുള്ള ക്വിസ്](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/19)
## അവലോകനം & സ്വയം പഠനം
ഈ പാഠത്തിൽ, നിങ്ങൾ `ggplot2` ഉപയോഗിച്ച് കൂടുതൽ സങ്കീർണ്ണമായ ചാർട്ടുകൾ കാണിക്കാൻ പ്രവർത്തിച്ചു. `geom_density_2d()` എന്ന "ഒറ്റ അല്ലെങ്കിൽ കൂടുതൽ അളവുകളിൽ തുടർച്ചയായ സാധ്യതാ ഡെൻസിറ്റി വക്രം" എന്നതിനെക്കുറിച്ച് കുറച്ച് ഗവേഷണം ചെയ്യുക. അതിന്റെ പ്രവർത്തനം മനസ്സിലാക്കാൻ [ഡോക്യുമെന്റേഷൻ](https://ggplot2.tidyverse.org/reference/geom_density_2d.html) വായിക്കുക.
## അസൈൻമെന്റ്
[നിങ്ങളുടെ കഴിവുകൾ പ്രയോഗിക്കുക](assignment.md)
---
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
**അസൂയാ**:
ഈ രേഖ AI വിവർത്തന സേവനം [Co-op Translator](https://github.com/Azure/co-op-translator) ഉപയോഗിച്ച് വിവർത്തനം ചെയ്തതാണ്. നാം കൃത്യതയ്ക്ക് ശ്രമിച്ചിട്ടുണ്ടെങ്കിലും, സ്വയം പ്രവർത്തിക്കുന്ന വിവർത്തനങ്ങളിൽ പിശകുകൾ അല്ലെങ്കിൽ തെറ്റുകൾ ഉണ്ടാകാമെന്ന് ദയവായി ശ്രദ്ധിക്കുക. അതിന്റെ മാതൃഭാഷയിലുള്ള യഥാർത്ഥ രേഖയാണ് പ്രാമാണികമായ ഉറവിടം എന്ന് പരിഗണിക്കേണ്ടതാണ്. നിർണായകമായ വിവരങ്ങൾക്ക്, പ്രൊഫഷണൽ മനുഷ്യ വിവർത്തനം ശുപാർശ ചെയ്യപ്പെടുന്നു. ഈ വിവർത്തനം ഉപയോഗിക്കുന്നതിൽ നിന്നുണ്ടാകുന്ന ഏതെങ്കിലും തെറ്റിദ്ധാരണകൾക്കോ തെറ്റായ വ്യാഖ്യാനങ്ങൾക്കോ ഞങ്ങൾ ഉത്തരവാദികളല്ല.
<!-- CO-OP TRANSLATOR DISCLAIMER END -->

@ -0,0 +1,27 @@
<!--
CO_OP_TRANSLATOR_METADATA:
{
"original_hash": "a233d542512136c4dd29aad38ca0175f",
"translation_date": "2025-12-19T16:23:38+00:00",
"source_file": "3-Data-Visualization/R/10-visualization-distributions/assignment.md",
"language_code": "ml"
}
-->
# നിങ്ങളുടെ കഴിവുകൾ പ്രയോഗിക്കുക
## നിർദ്ദേശങ്ങൾ
ഇതുവരെ, നിങ്ങൾ മിന്നസോട്ട ബേർഡ്സ് ഡാറ്റാസെറ്റുമായി പ്രവർത്തിച്ച് പക്ഷികളുടെ എണ്ണം மற்றும் ജനസംഖ്യ സാന്ദ്രതയെക്കുറിച്ച് വിവരങ്ങൾ കണ്ടെത്തിയിട്ടുണ്ട്. ഈ സാങ്കേതികവിദ്യകൾ പ്രയോഗിക്കാൻ വ്യത്യസ്തമായ ഒരു ഡാറ്റാസെറ്റ് പരീക്ഷിച്ച് പ്രാക്ടീസ് ചെയ്യുക, ഉദാഹരണത്തിന് [Kaggle](https://www.kaggle.com/) നിന്നുള്ളത്. ഈ ഡാറ്റാസെറ്റിനെക്കുറിച്ച് ഒരു കഥ പറയാൻ R സ്ക്രിപ്റ്റ് നിർമ്മിക്കുക, കൂടാതെ അതിനെക്കുറിച്ച് ചർച്ച ചെയ്യുമ്പോൾ ഹിസ്റ്റോഗ്രാമുകൾ ഉപയോഗിക്കുന്നത് ഉറപ്പാക്കുക.
## റൂബ്രിക്
Exemplary | Adequate | Needs Improvement
--- | --- | -- |
ഈ ഡാറ്റാസെറ്റിന്റെ ഉറവിടം ഉൾപ്പെടെ വിശദീകരണങ്ങളോടുകൂടിയ ഒരു സ്ക്രിപ്റ്റ് അവതരിപ്പിച്ചിരിക്കുന്നു, കൂടാതെ ഡാറ്റയെക്കുറിച്ച് വിവരങ്ങൾ കണ്ടെത്താൻ കുറഞ്ഞത് 5 ഹിസ്റ്റോഗ്രാമുകൾ ഉപയോഗിക്കുന്നു. | അപൂർണ്ണമായ വിശദീകരണങ്ങളോ ബഗുകളോ ഉള്ള ഒരു സ്ക്രിപ്റ്റ് അവതരിപ്പിച്ചിരിക്കുന്നു. | വിശദീകരണങ്ങളില്ലാതെ ബഗുകളുള്ള ഒരു സ്ക്രിപ്റ്റ് അവതരിപ്പിച്ചിരിക്കുന്നു.
---
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
**അസൂയാപത്രം**:
ഈ രേഖ AI വിവർത്തന സേവനം [Co-op Translator](https://github.com/Azure/co-op-translator) ഉപയോഗിച്ച് വിവർത്തനം ചെയ്തതാണ്. നാം കൃത്യതയ്ക്ക് ശ്രമിച്ചിട്ടുണ്ടെങ്കിലും, യന്ത്രം ചെയ്ത വിവർത്തനങ്ങളിൽ പിശകുകൾ അല്ലെങ്കിൽ തെറ്റുകൾ ഉണ്ടാകാമെന്ന് ദയവായി ശ്രദ്ധിക്കുക. അതിന്റെ മാതൃഭാഷയിലുള്ള യഥാർത്ഥ രേഖയാണ് പ്രാമാണികമായ ഉറവിടം എന്ന് പരിഗണിക്കേണ്ടതാണ്. നിർണായകമായ വിവരങ്ങൾക്ക്, പ്രൊഫഷണൽ മനുഷ്യ വിവർത്തനം ശുപാർശ ചെയ്യപ്പെടുന്നു. ഈ വിവർത്തനം ഉപയോഗിക്കുന്നതിൽ നിന്നുണ്ടാകുന്ന ഏതെങ്കിലും തെറ്റിദ്ധാരണകൾക്കോ വ്യാഖ്യാനക്കേടുകൾക്കോ ഞങ്ങൾ ഉത്തരവാദികളല്ല.
<!-- CO-OP TRANSLATOR DISCLAIMER END -->

@ -0,0 +1,203 @@
<!--
CO_OP_TRANSLATOR_METADATA:
{
"original_hash": "47028abaaafa2bcb1079702d20569066",
"translation_date": "2025-12-19T16:28:20+00:00",
"source_file": "3-Data-Visualization/R/11-visualization-proportions/README.md",
"language_code": "ml"
}
-->
# അനുപാതങ്ങൾ ദൃശ്യവൽക്കരിക്കൽ
|![ Sketchnote by [(@sketchthedocs)](https://sketchthedocs.dev) ](../../../sketchnotes/11-Visualizing-Proportions.png)|
|:---:|
|അനുപാതങ്ങൾ ദൃശ്യവൽക്കരിക്കൽ - _സ്കെച്ച്നോട്ട് [@nitya](https://twitter.com/nitya) യിൽ നിന്നുള്ളത്_ |
ഈ പാഠത്തിൽ, നിങ്ങൾ മഷ്‌റൂമുകളെക്കുറിച്ചുള്ള ഒരു dataset-ൽ വിവിധ തരത്തിലുള്ള ഫംഗികൾ എത്രമാത്രം ഉള്ളുവെന്ന് പോലുള്ള അനുപാതങ്ങൾ ദൃശ്യവൽക്കരിക്കാൻ പ്രകൃതിനിരീക്ഷണ dataset ഉപയോഗിക്കും. Audubon-ൽ നിന്നുള്ള 23 സ്പീഷീസുകളുള്ള Agaricus, Lepiota കുടുംബങ്ങളിലെ ഗില്ലഡ് മഷ്‌റൂമുകളുടെ വിവരങ്ങൾ ഉൾക്കൊള്ളുന്ന dataset ഉപയോഗിച്ച് ഈ രസകരമായ ഫംഗികൾ പരിശോധിക്കാം. നിങ്ങൾ പരീക്ഷിക്കാനിരിക്കുന്ന രുചികരമായ ദൃശ്യവൽക്കരണങ്ങൾ:
- പൈ ചാർട്ടുകൾ 🥧
- ഡോണട്ട് ചാർട്ടുകൾ 🍩
- വാഫിൾ ചാർട്ടുകൾ 🧇
> 💡 Microsoft Research-ന്റെ [Charticulator](https://charticulator.com) എന്ന വളരെ രസകരമായ പ്രോജക്ട് ഡാറ്റാ ദൃശ്യവൽക്കരണങ്ങൾക്ക് സൗജന്യമായ ഡ്രാഗ് ആൻഡ് ഡ്രോപ്പ് ഇന്റർഫേസ് നൽകുന്നു. അവരുടെ ട്യൂട്ടോറിയലുകളിൽ ഒന്നിൽ ഈ മഷ്‌റൂം dataset-ഉം ഉപയോഗിക്കുന്നു! അതിനാൽ നിങ്ങൾക്ക് ഡാറ്റ പരിശോധിക്കാനും ലൈബ്രറി പഠിക്കാനും ഒരേ സമയം സാധിക്കും: [Charticulator tutorial](https://charticulator.com/tutorials/tutorial4.html).
## [പാഠം മുൻകൂർ ക്വിസ്](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/20)
## നിങ്ങളുടെ മഷ്‌റൂമുകളെ പരിചയപ്പെടുക 🍄
മഷ്‌റൂമുകൾ വളരെ രസകരമാണ്. അവ പഠിക്കാൻ ഒരു dataset ഇറക്കുമതി ചെയ്യാം:
```r
mushrooms = read.csv('../../data/mushrooms.csv')
head(mushrooms)
```
ഒരു പട്ടിക വിശകലനത്തിന് മികച്ച ഡാറ്റയോടുകൂടി പ്രിന്റ് ചെയ്യുന്നു:
| class | cap-shape | cap-surface | cap-color | bruises | odor | gill-attachment | gill-spacing | gill-size | gill-color | stalk-shape | stalk-root | stalk-surface-above-ring | stalk-surface-below-ring | stalk-color-above-ring | stalk-color-below-ring | veil-type | veil-color | ring-number | ring-type | spore-print-color | population | habitat |
| --------- | --------- | ----------- | --------- | ------- | ------- | --------------- | ------------ | --------- | ---------- | ----------- | ---------- | ------------------------ | ------------------------ | ---------------------- | ---------------------- | --------- | ---------- | ----------- | --------- | ----------------- | ---------- | ------- |
| Poisonous | Convex | Smooth | Brown | Bruises | Pungent | Free | Close | Narrow | Black | Enlarging | Equal | Smooth | Smooth | White | White | Partial | White | One | Pendant | Black | Scattered | Urban |
| Edible | Convex | Smooth | Yellow | Bruises | Almond | Free | Close | Broad | Black | Enlarging | Club | Smooth | Smooth | White | White | Partial | White | One | Pendant | Brown | Numerous | Grasses |
| Edible | Bell | Smooth | White | Bruises | Anise | Free | Close | Broad | Brown | Enlarging | Club | Smooth | Smooth | White | White | Partial | White | One | Pendant | Brown | Numerous | Meadows |
| Poisonous | Convex | Scaly | White | Bruises | Pungent | Free | Close | Narrow | Brown | Enlarging | Equal | Smooth | Smooth | White | White | Partial | White | One | Pendant | Black | Scattered | Urban
| Edible | Convex |Smooth | Green | No Bruises| None |Free | Crowded | Broad | Black | Tapering | Equal | Smooth | Smooth | White | White | Partial | White | One | Evanescent | Brown | Abundant | Grasses
|Edible | Convex | Scaly | Yellow | Bruises | Almond | Free | Close | Broad | Brown | Enlarging | Club | Smooth | Smooth | White | White | Partial | White | One | Pendant | Black | Numerous | Grasses
തുടക്കത്തിൽ, നിങ്ങൾ കാണും എല്ലാ ഡാറ്റയും വാചകരൂപത്തിലാണ്. ഈ ഡാറ്റ ഒരു ചാർട്ടിൽ ഉപയോഗിക്കാൻ കഴിയുന്നതായി മാറ്റേണ്ടതുണ്ട്. വാസ്തവത്തിൽ, ഡാറ്റയുടെ ഭൂരിഭാഗവും ഒരു ഒബ്ജക്റ്റായി പ്രതിനിധീകരിച്ചിരിക്കുന്നു:
```r
names(mushrooms)
```
ഫലമായി:
```output
[1] "class" "cap.shape"
[3] "cap.surface" "cap.color"
[5] "bruises" "odor"
[7] "gill.attachment" "gill.spacing"
[9] "gill.size" "gill.color"
[11] "stalk.shape" "stalk.root"
[13] "stalk.surface.above.ring" "stalk.surface.below.ring"
[15] "stalk.color.above.ring" "stalk.color.below.ring"
[17] "veil.type" "veil.color"
[19] "ring.number" "ring.type"
[21] "spore.print.color" "population"
[23] "habitat"
```
ഈ ഡാറ്റ എടുത്ത് 'class' കോളം ഒരു category ആയി മാറ്റുക:
```r
library(dplyr)
grouped=mushrooms %>%
group_by(class) %>%
summarise(count=n())
```
ഇപ്പോൾ, മഷ്‌റൂം ഡാറ്റ പ്രിന്റ് ചെയ്താൽ, വിഷം ഉള്ള/ഭക്ഷ്യയോഗ്യമായ ക്ലാസുകൾ അനുസരിച്ച് വിഭാഗീകരിച്ചിട്ടുണ്ടെന്ന് കാണാം:
```r
View(grouped)
```
| class | count |
| --------- | --------- |
| Edible | 4208 |
| Poisonous| 3916 |
ഈ പട്ടികയിൽ നൽകിയ ക്രമം അനുസരിച്ച് നിങ്ങളുടെ ക്ലാസ് category ലേബലുകൾ സൃഷ്ടിച്ചാൽ, ഒരു പൈ ചാർട്ട് നിർമ്മിക്കാം.
## പൈ!
```r
pie(grouped$count,grouped$class, main="Edible?")
```
ഇവിടെ, ഈ ഡാറ്റയുടെ അനുപാതങ്ങൾ ഈ രണ്ട് മഷ്‌റൂം ക്ലാസുകൾ അനുസരിച്ച് കാണിക്കുന്ന ഒരു പൈ ചാർട്ട്. ലേബലുകളുടെ ക്രമം ശരിയാണെന്ന് ഉറപ്പാക്കുന്നത് വളരെ പ്രധാനമാണ്, പ്രത്യേകിച്ച് ഇവിടെ, അതിനാൽ ലേബൽ അറേ എങ്ങനെ നിർമ്മിക്കപ്പെടുന്നു എന്ന് പരിശോധിക്കുക!
![pie chart](../../../../../translated_images/pie1-wb.685df063673751f4b0b82127f7a52c7f9a920192f22ae61ad28412ba9ace97bf.ml.png)
## ഡോണട്ടുകൾ!
കുറച്ച് കൂടുതൽ ദൃശ്യപരമായി ആകർഷകമായ പൈ ചാർട്ട് ഒരു ഡോണട്ട് ചാർട്ടാണ്, ഇത് മധ്യത്തിൽ ഒരു തുരുവുള്ള പൈ ചാർട്ടാണ്. ഈ രീതിയിൽ നമ്മുടെ ഡാറ്റ നോക്കാം.
മഷ്‌റൂമുകൾ വളരുന്ന വിവിധ ഹാബിറ്റാറ്റുകൾ നോക്കാം:
```r
library(dplyr)
habitat=mushrooms %>%
group_by(habitat) %>%
summarise(count=n())
View(habitat)
```
ഫലമായി:
| habitat| count |
| --------- | --------- |
| Grasses | 2148 |
| Leaves| 832 |
| Meadows | 292 |
| Paths| 1144 |
| Urban | 368 |
| Waste| 192 |
| Wood| 3148 |
ഇവിടെ, നിങ്ങൾ ഡാറ്റ ഹാബിറ്റാറ്റ് അനുസരിച്ച് ഗ്രൂപ്പ് ചെയ്യുന്നു. 7 ഹാബിറ്റാറ്റുകൾ പട്ടികപ്പെടുത്തിയിട്ടുണ്ട്, അതിനാൽ അവ ഡോണട്ട് ചാർട്ടിന്റെ ലേബലുകളായി ഉപയോഗിക്കുക:
```r
library(ggplot2)
library(webr)
PieDonut(habitat, aes(habitat, count=count))
```
![donut chart](../../../../../translated_images/donut-wb.34e6fb275da9d834c2205145e39a3de9b6878191dcdba6f7a9e85f4b520449bc.ml.png)
ഈ കോഡ് രണ്ട് ലൈബ്രറികൾ ഉപയോഗിക്കുന്നു - ggplot2, webr. webr ലൈബ്രറിയുടെ PieDonut ഫംഗ്ഷൻ ഉപയോഗിച്ച്, ഡോണട്ട് ചാർട്ട് എളുപ്പത്തിൽ സൃഷ്ടിക്കാം!
R-ൽ ഡോണട്ട് ചാർട്ടുകൾ ggplot2 ലൈബ്രറി മാത്രം ഉപയോഗിച്ച് ഉണ്ടാക്കാം. അതിനെക്കുറിച്ച് കൂടുതൽ അറിയാൻ [ഇവിടെ](https://www.r-graph-gallery.com/128-ring-or-donut-plot.html) കാണുക, സ്വയം പരീക്ഷിക്കാം.
ഇപ്പോൾ നിങ്ങൾക്ക് ഡാറ്റ ഗ്രൂപ്പ് ചെയ്ത് പൈ അല്ലെങ്കിൽ ഡോണട്ട് ആയി പ്രദർശിപ്പിക്കാമെന്ന് അറിയാം, മറ്റ് ചാർട്ട് തരങ്ങൾ പരീക്ഷിക്കാം. വാഫിൾ ചാർട്ട് പരീക്ഷിക്കുക, ഇത് അളവുകൾ പരിശോധിക്കുന്ന മറ്റൊരു രീതി മാത്രമാണ്.
## വാഫിൾസ്!
'വാഫിൾ' തരം ചാർട്ട് അളവുകൾ 2D ചതുരങ്ങളായി ദൃശ്യവൽക്കരിക്കുന്ന മറ്റൊരു രീതി ആണ്. ഈ dataset-ലെ മഷ്‌റൂം ക്യാപ് നിറങ്ങളുടെ വ്യത്യസ്ത അളവുകൾ ദൃശ്യവൽക്കരിക്കാൻ ശ്രമിക്കുക. ഇതിന്, [waffle](https://cran.r-project.org/web/packages/waffle/waffle.pdf) എന്ന സഹായക ലൈബ്രറി ഇൻസ്റ്റാൾ ചെയ്ത് ഉപയോഗിക്കണം:
```r
install.packages("waffle", repos = "https://cinc.rud.is")
```
ഡാറ്റയുടെ ഒരു സെഗ്മെന്റ് തിരഞ്ഞെടുക്കുക ഗ്രൂപ്പ് ചെയ്യാൻ:
```r
library(dplyr)
cap_color=mushrooms %>%
group_by(cap.color) %>%
summarise(count=n())
View(cap_color)
```
ലേബലുകൾ സൃഷ്ടിച്ച് ഡാറ്റ ഗ്രൂപ്പ് ചെയ്ത് വാഫിൾ ചാർട്ട് സൃഷ്ടിക്കുക:
```r
library(waffle)
names(cap_color$count) = paste0(cap_color$cap.color)
waffle((cap_color$count/10), rows = 7, title = "Waffle Chart")+scale_fill_manual(values=c("brown", "#F0DC82", "#D2691E", "green",
"pink", "purple", "red", "grey",
"yellow","white"))
```
വാഫിൾ ചാർട്ട് ഉപയോഗിച്ച്, ഈ മഷ്‌റൂം dataset-ലെ ക്യാപ് നിറങ്ങളുടെ അനുപാതങ്ങൾ വ്യക്തമായി കാണാം. രസകരമായി, പച്ച ക്യാപ് ഉള്ള മഷ്‌റൂമുകൾ വളരെ കൂടുതലാണ്!
![waffle chart](../../../../../translated_images/waffle.aaa75c5337735a6ef32ace0ffb6506ef49e5aefe870ffd72b1bb080f4843c217.ml.png)
ഈ പാഠത്തിൽ, നിങ്ങൾക്ക് അനുപാതങ്ങൾ ദൃശ്യവൽക്കരിക്കുന്ന മൂന്ന് മാർഗങ്ങൾ പഠിച്ചു. ആദ്യം, ഡാറ്റയെ വിഭാഗങ്ങളായി ഗ്രൂപ്പ് ചെയ്യണം, പിന്നെ ഡാറ്റ പ്രദർശിപ്പിക്കാൻ ഏറ്റവും നല്ല മാർഗം - പൈ, ഡോണട്ട്, അല്ലെങ്കിൽ വാഫിൾ - തിരഞ്ഞെടുക്കണം. എല്ലാം രുചികരവും ഉപയോക്താവിന് dataset-ന്റെ ഉടൻ ഒരു ദൃശ്യസംഗ്രഹം നൽകുന്നതുമാണ്.
## 🚀 ചലഞ്ച്
ഈ രുചികരമായ ചാർട്ടുകൾ [Charticulator](https://charticulator.com) ൽ പുനഃസൃഷ്ടിക്കാൻ ശ്രമിക്കുക.
## [പാഠം ശേഷം ക്വിസ്](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/21)
## അവലോകനം & സ്വയം പഠനം
പൈ, ഡോണട്ട്, വാഫിൾ ചാർട്ട് എപ്പോൾ ഉപയോഗിക്കണമെന്ന് എപ്പോഴും വ്യക്തമായിരിക്കില്ല. ഈ വിഷയത്തിൽ വായിക്കാനുള്ള ചില ലേഖനങ്ങൾ:
https://www.beautiful.ai/blog/battle-of-the-charts-pie-chart-vs-donut-chart
https://medium.com/@hypsypops/pie-chart-vs-donut-chart-showdown-in-the-ring-5d24fd86a9ce
https://www.mit.edu/~mbarker/formula1/f1help/11-ch-c6.htm
https://medium.datadriveninvestor.com/data-visualization-done-the-right-way-with-tableau-waffle-chart-fdf2a19be402
ഈ ബുദ്ധിമുട്ടുള്ള തീരുമാനത്തെക്കുറിച്ച് കൂടുതൽ വിവരങ്ങൾ കണ്ടെത്താൻ ഗവേഷണം ചെയ്യുക.
## അസൈൻമെന്റ്
[Excel-ൽ പരീക്ഷിക്കുക](assignment.md)
---
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
**അസൂയാ**:
ഈ രേഖ AI വിവർത്തന സേവനം [Co-op Translator](https://github.com/Azure/co-op-translator) ഉപയോഗിച്ച് വിവർത്തനം ചെയ്തതാണ്. നാം കൃത്യതയ്ക്ക് ശ്രമിച്ചെങ്കിലും, സ്വയം പ്രവർത്തിക്കുന്ന വിവർത്തനങ്ങളിൽ പിശകുകൾ അല്ലെങ്കിൽ തെറ്റുകൾ ഉണ്ടാകാമെന്ന് ദയവായി ശ്രദ്ധിക്കുക. അതിന്റെ മാതൃഭാഷയിലുള്ള യഥാർത്ഥ രേഖയാണ് പ്രാമാണികമായ ഉറവിടം എന്ന് പരിഗണിക്കേണ്ടതാണ്. നിർണായകമായ വിവരങ്ങൾക്ക്, പ്രൊഫഷണൽ മനുഷ്യ വിവർത്തനം ശുപാർശ ചെയ്യപ്പെടുന്നു. ഈ വിവർത്തനം ഉപയോഗിക്കുന്നതിൽ നിന്നുണ്ടാകുന്ന ഏതെങ്കിലും തെറ്റിദ്ധാരണകൾക്കോ തെറ്റായ വ്യാഖ്യാനങ്ങൾക്കോ ഞങ്ങൾ ഉത്തരവാദികളല്ല.
<!-- CO-OP TRANSLATOR DISCLAIMER END -->
Loading…
Cancel
Save