parent
2a56f44f51
commit
c945bd6341
@ -0,0 +1,231 @@
|
||||
<!--
|
||||
CO_OP_TRANSLATOR_METADATA:
|
||||
{
|
||||
"original_hash": "22acf28f518a4769ea14fa42f4734b9f",
|
||||
"translation_date": "2025-12-19T16:33:36+00:00",
|
||||
"source_file": "3-Data-Visualization/R/09-visualization-quantities/README.md",
|
||||
"language_code": "kn"
|
||||
}
|
||||
-->
|
||||
# ಪ್ರಮಾಣಗಳನ್ನು ದೃಶ್ಯೀಕರಿಸುವುದು
|
||||
| ಅವರಿಂದ ಸ್ಕೆಚ್ ನೋಟ್ ](https://github.com/microsoft/Data-Science-For-Beginners/blob/main/sketchnotes/09-Visualizing-Quantities.png)|
|
||||
|:---:|
|
||||
| ಪ್ರಮಾಣಗಳನ್ನು ದೃಶ್ಯೀಕರಿಸುವುದು - _[@nitya](https://twitter.com/nitya) ಅವರಿಂದ ಸ್ಕೆಚ್ ನೋಟ್_ |
|
||||
|
||||
ಈ ಪಾಠದಲ್ಲಿ ನೀವು ಪ್ರಮಾಣದ ಸಂಧರ್ಭದಲ್ಲಿ ರೋಚಕ ದೃಶ್ಯೀಕರಣಗಳನ್ನು ರಚಿಸುವುದನ್ನು ಕಲಿಯಲು ಲಭ್ಯವಿರುವ ಹಲವಾರು R ಪ್ಯಾಕೇಜ್ ಗ್ರಂಥಾಲಯಗಳನ್ನು ಹೇಗೆ ಬಳಸಬೇಕೆಂದು ಅನ್ವೇಷಿಸುವಿರಿ. ಮಿನೆಸೋಟಾದ ಪಕ್ಷಿಗಳ ಬಗ್ಗೆ ಸ್ವಚ್ಛಗೊಳಿಸಿದ ಡೇಟಾಸೆಟ್ ಬಳಸಿ, ನೀವು ಸ್ಥಳೀಯ ವನ್ಯಜೀವಿಗಳ ಬಗ್ಗೆ ಹಲವಾರು ರೋಚಕ ವಾಸ್ತವಗಳನ್ನು ತಿಳಿದುಕೊಳ್ಳಬಹುದು.
|
||||
## [ಪೂರ್ವ-ಪಾಠ ಪ್ರಶ್ನೋತ್ತರ](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/16)
|
||||
|
||||
## ggplot2 ಬಳಸಿ ರೆಕ್ಕೆ ವ್ಯಾಪ್ತಿಯನ್ನು ಗಮನಿಸಿ
|
||||
ವಿವಿಧ ರೀತಿಯ ಸರಳ ಮತ್ತು ಸುಕ್ಷ್ಮ ಪ್ಲಾಟ್ಗಳು ಮತ್ತು ಚಾರ್ಟ್ಗಳನ್ನು ರಚಿಸಲು ಅತ್ಯುತ್ತಮ ಗ್ರಂಥಾಲಯವೆಂದರೆ [ggplot2](https://cran.r-project.org/web/packages/ggplot2/index.html). ಸಾಮಾನ್ಯವಾಗಿ, ಈ ಗ್ರಂಥಾಲಯಗಳನ್ನು ಬಳಸಿ ಡೇಟಾವನ್ನು ಪ್ಲಾಟ್ ಮಾಡುವ ಪ್ರಕ್ರಿಯೆಯಲ್ಲಿ ನಿಮ್ಮ ಡೇಟಾಫ್ರೇಮ್ನ ಯಾವ ಭಾಗಗಳನ್ನು ಗುರಿಯಾಗಿಸಬೇಕೆಂದು ಗುರುತಿಸುವುದು, ಆ ಡೇಟಾದ ಮೇಲೆ ಅಗತ್ಯವಿರುವ ಪರಿವರ್ತನೆಗಳನ್ನು ಮಾಡುವುದು, ಅದರ x ಮತ್ತು y ಅಕ್ಷ ಮೌಲ್ಯಗಳನ್ನು ನಿಗದಿಪಡಿಸುವುದು, ಯಾವ ರೀತಿಯ ಪ್ಲಾಟ್ ತೋರಿಸಬೇಕೆಂದು ನಿರ್ಧರಿಸುವುದು ಮತ್ತು ನಂತರ ಪ್ಲಾಟ್ ತೋರಿಸುವುದು ಸೇರಿದೆ.
|
||||
|
||||
`ggplot2` ಒಂದು ಘೋಷಣಾತ್ಮಕವಾಗಿ ಗ್ರಾಫಿಕ್ಸ್ ರಚಿಸುವ ವ್ಯವಸ್ಥೆಯಾಗಿದ್ದು, The Grammar of Graphics ಆಧಾರಿತವಾಗಿದೆ. [The Grammar of Graphics](https://en.wikipedia.org/wiki/Ggplot2) ಒಂದು ಸಾಮಾನ್ಯ ಡೇಟಾ ದೃಶ್ಯೀಕರಣ ಯೋಜನೆಯಾಗಿದ್ದು, ಗ್ರಾಫ್ಗಳನ್ನು ಸ್ಕೇಲ್ಗಳು ಮತ್ತು ಲೇಯರ್ಗಳಂತಹ ಅರ್ಥಪೂರ್ಣ ಘಟಕಗಳಾಗಿ ವಿಭಜಿಸುತ್ತದೆ. ಬೇರೆ ಮಾತಿನಲ್ಲಿ ಹೇಳುವುದಾದರೆ, ಕಡಿಮೆ ಕೋಡ್ನೊಂದಿಗೆ ಏಕವ್ಯತ್ಯಯ ಅಥವಾ ಬಹುವ್ಯತ್ಯಯ ಡೇಟಾಗಾಗಿ ಪ್ಲಾಟ್ಗಳು ಮತ್ತು ಗ್ರಾಫ್ಗಳನ್ನು ಸುಲಭವಾಗಿ ರಚಿಸುವುದರಿಂದ `ggplot2` R ನಲ್ಲಿ ದೃಶ್ಯೀಕರಣಗಳಿಗೆ ಅತ್ಯಂತ ಜನಪ್ರಿಯ ಪ್ಯಾಕೇಜಾಗಿದೆ. ಬಳಕೆದಾರರು `ggplot2` ಗೆ ಚರಗಳನ್ನು ಎಸ್ಟೆಟಿಕ್ಸ್ಗೆ ಹೇಗೆ ನಕ್ಷೆ ಮಾಡಬೇಕೆಂದು, ಬಳಸಬೇಕಾದ ಗ್ರಾಫಿಕಲ್ ಪ್ರಿಮಿಟಿವ್ಗಳನ್ನು ಹೇಳುತ್ತಾರೆ ಮತ್ತು ಉಳಿದುದನ್ನು `ggplot2` ನೋಡಿಕೊಳ್ಳುತ್ತದೆ.
|
||||
|
||||
> ✅ ಪ್ಲಾಟ್ = ಡೇಟಾ + ಎಸ್ಟೆಟಿಕ್ಸ್ + ಜ್ಯಾಮಿತಿ
|
||||
> - ಡೇಟಾ ಎಂದರೆ ಡೇಟಾಸೆಟ್
|
||||
> - ಎಸ್ಟೆಟಿಕ್ಸ್ ಎಂದರೆ ಅಧ್ಯಯನ ಮಾಡಬೇಕಾದ ಚರಗಳು (x ಮತ್ತು y ಚರಗಳು)
|
||||
> - ಜ್ಯಾಮಿತಿ ಎಂದರೆ ಪ್ಲಾಟ್ನ ಪ್ರಕಾರ (ರೇಖಾ ಪ್ಲಾಟ್, ಬಾರ್ ಪ್ಲಾಟ್, ಇತ್ಯಾದಿ)
|
||||
|
||||
ನಿಮ್ಮ ಡೇಟಾ ಮತ್ತು ಪ್ಲಾಟ್ ಮೂಲಕ ಹೇಳಬೇಕಾದ ಕಥೆಯ ಪ್ರಕಾರ ಉತ್ತಮ ಜ್ಯಾಮಿತಿಯನ್ನು (ಪ್ಲಾಟ್ ಪ್ರಕಾರ) ಆಯ್ಕೆಮಾಡಿ.
|
||||
|
||||
> - ಪ್ರವೃತ್ತಿಗಳನ್ನು ವಿಶ್ಲೇಷಿಸಲು: ರೇಖೆ, ಕಾಲಮ್
|
||||
> - ಮೌಲ್ಯಗಳನ್ನು ಹೋಲಿಸಲು: ಬಾರ್, ಕಾಲಮ್, ಪೈ, ಸ್ಕ್ಯಾಟರ್ಪ್ಲಾಟ್
|
||||
> - ಭಾಗಗಳು ಒಟ್ಟಿಗೆ ಹೇಗೆ ಸಂಬಂಧ ಹೊಂದಿವೆ ಎಂದು ತೋರಿಸಲು: ಪೈ
|
||||
> - ಡೇಟಾ ವಿತರಣೆ ತೋರಿಸಲು: ಸ್ಕ್ಯಾಟರ್ಪ್ಲಾಟ್, ಬಾರ್
|
||||
> - ಮೌಲ್ಯಗಳ ನಡುವಿನ ಸಂಬಂಧ ತೋರಿಸಲು: ರೇಖೆ, ಸ್ಕ್ಯಾಟರ್ಪ್ಲಾಟ್, ಬಬಲ್
|
||||
|
||||
✅ ನೀವು ggplot2 ಗಾಗಿ ಈ ವಿವರಣಾತ್ಮಕ [ಚೀಟ್ಶೀಟ್](https://nyu-cdsc.github.io/learningr/assets/data-visualization-2.1.pdf) ಅನ್ನು ಸಹ ಪರಿಶೀಲಿಸಬಹುದು.
|
||||
|
||||
## ಪಕ್ಷಿ ರೆಕ್ಕೆ ವ್ಯಾಪ್ತಿಯ ಮೌಲ್ಯಗಳ ಬಗ್ಗೆ ರೇಖಾ ಪ್ಲಾಟ್ ರಚಿಸಿ
|
||||
|
||||
R ಕಾನ್ಸೋಲ್ ತೆರೆಯಿರಿ ಮತ್ತು ಡೇಟಾಸೆಟ್ ಅನ್ನು ಆಮದುಮಾಡಿ.
|
||||
> ಟಿಪ್ಪಣಿ: ಡೇಟಾಸೆಟ್ ಈ ರೆಪೊನ ಮೂಲದಲ್ಲಿ `/data` ಫೋಲ್ಡರ್ನಲ್ಲಿ ಸಂಗ್ರಹಿಸಲಾಗಿದೆ.
|
||||
|
||||
ಡೇಟಾಸೆಟ್ ಅನ್ನು ಆಮದುಮಾಡಿ ಮತ್ತು ಡೇಟಾದ ತಲೆ (ಮೇಲಿನ 5 ಸಾಲುಗಳು) ಅನ್ನು ಗಮನಿಸೋಣ.
|
||||
|
||||
```r
|
||||
birds <- read.csv("../../data/birds.csv",fileEncoding="UTF-8-BOM")
|
||||
head(birds)
|
||||
```
|
||||
ಡೇಟಾದ ತಲೆಯು ಪಠ್ಯ ಮತ್ತು ಸಂಖ್ಯೆಗಳ ಮಿಶ್ರಣವಾಗಿದೆ:
|
||||
|
||||
| | ಹೆಸರು | ವೈಜ್ಞಾನಿಕ ಹೆಸರು | ವರ್ಗ | ಕ್ರಮ | ಕುಟುಂಬ | ಜೀನಸ್ | ಸಂರಕ್ಷಣಾ ಸ್ಥಿತಿ | ಕನಿಷ್ಠ ಉದ್ದ | ಗರಿಷ್ಠ ಉದ್ದ | ಕನಿಷ್ಠ ದೇಹದ ಭಾರ | ಗರಿಷ್ಠ ದೇಹದ ಭಾರ | ಕನಿಷ್ಠ ರೆಕ್ಕೆ ವ್ಯಾಪ್ತಿ | ಗರಿಷ್ಠ ರೆಕ್ಕೆ ವ್ಯಾಪ್ತಿ |
|
||||
| ---: | :--------------------------- | :--------------------- | :-------------------- | :----------- | :------- | :---------- | :----------------- | --------: | --------: | ----------: | ----------: | ----------: | ----------: |
|
||||
| 0 | ಬ್ಲ್ಯಾಕ್-ಬೆಲ್ಡ್ ವಿಸ್ಲಿಂಗ್-ಡಕ್ | Dendrocygna autumnalis | ಬಾತುಗಳು/ಗೀಸೆಗಳು/ನೀರಾಜೀವಿಗಳು | Anseriformes | Anatidae | Dendrocygna | LC | 47 | 56 | 652 | 1020 | 76 | 94 |
|
||||
| 1 | ಫುಲ್ವಸ್ ವಿಸ್ಲಿಂಗ್-ಡಕ್ | Dendrocygna bicolor | ಬಾತುಗಳು/ಗೀಸೆಗಳು/ನೀರಾಜೀವಿಗಳು | Anseriformes | Anatidae | Dendrocygna | LC | 45 | 53 | 712 | 1050 | 85 | 93 |
|
||||
| 2 | ಸ್ನೋ ಗೂಸ್ | Anser caerulescens | ಬಾತುಗಳು/ಗೀಸೆಗಳು/ನೀರಾಜೀವಿಗಳು | Anseriformes | Anatidae | Anser | LC | 64 | 79 | 2050 | 4050 | 135 | 165 |
|
||||
| 3 | ರಾಸ್ ಗೂಸ್ | Anser rossii | ಬಾತುಗಳು/ಗೀಸೆಗಳು/ನೀರಾಜೀವಿಗಳು | Anseriformes | Anatidae | Anser | LC | 57.3 | 64 | 1066 | 1567 | 113 | 116 |
|
||||
| 4 | ಗ್ರೇಟರ್ ವೈಟ್-ಫ್ರಂಟ್ ಗೂಸ್ | Anser albifrons | ಬಾತುಗಳು/ಗೀಸೆಗಳು/ನೀರಾಜೀವಿಗಳು | Anseriformes | Anatidae | Anser | LC | 64 | 81 | 1930 | 3310 | 130 | 165 |
|
||||
|
||||
ನಾವು ಕೆಲವು ಸಂಖ್ಯಾತ್ಮಕ ಡೇಟಾವನ್ನು ಮೂಲ ರೇಖಾ ಪ್ಲಾಟ್ ಬಳಸಿ ಪ್ಲಾಟ್ ಮಾಡೋಣ. ಈ ರೋಚಕ ಪಕ್ಷಿಗಳ ಗರಿಷ್ಠ ರೆಕ್ಕೆ ವ್ಯಾಪ್ತಿಯ ದೃಶ್ಯವನ್ನು ನೀವು ಬಯಸಿದರೆ.
|
||||
|
||||
```r
|
||||
install.packages("ggplot2")
|
||||
library("ggplot2")
|
||||
ggplot(data=birds, aes(x=Name, y=MaxWingspan,group=1)) +
|
||||
geom_line()
|
||||
```
|
||||
ಇಲ್ಲಿ, ನೀವು `ggplot2` ಪ್ಯಾಕೇಜ್ ಅನ್ನು ಸ್ಥಾಪಿಸಿ ನಂತರ `library("ggplot2")` ಕಮಾಂಡ್ ಬಳಸಿ ವರ್ಕ್ಸ್ಪೇಸ್ಗೆ ಆಮದುಮಾಡುತ್ತೀರಿ. ggplot ನಲ್ಲಿ ಯಾವುದೇ ಪ್ಲಾಟ್ ರಚಿಸಲು `ggplot()` ಫಂಕ್ಷನ್ ಬಳಸಲಾಗುತ್ತದೆ ಮತ್ತು ಡೇಟಾಸೆಟ್, x ಮತ್ತು y ಚರಗಳನ್ನು ಗುಣಲಕ್ಷಣಗಳಾಗಿ ಸೂಚಿಸಲಾಗುತ್ತದೆ. ಈ ಪ್ರಕರಣದಲ್ಲಿ, ನಾವು ರೇಖಾ ಪ್ಲಾಟ್ ರಚಿಸಲು `geom_line()` ಫಂಕ್ಷನ್ ಬಳಸುತ್ತೇವೆ.
|
||||
|
||||

|
||||
|
||||
ನೀವು ತಕ್ಷಣವೇ ಏನು ಗಮನಿಸುತ್ತೀರಿ? ಕನಿಷ್ಠ ಒಂದು ಹೊರಗಿನ ಮೌಲ್ಯವಿದೆ - ಅದು ತುಂಬಾ ದೊಡ್ಡ ರೆಕ್ಕೆ ವ್ಯಾಪ್ತಿ! 2000+ ಸೆಂ.ಮೀ. ರೆಕ್ಕೆ ವ್ಯಾಪ್ತಿ 20 ಮೀಟರ್ಗಿಂತ ಹೆಚ್ಚು - ಮಿನೆಸೋಟಾದಲ್ಲಿ ಪ್ಟೆರೋಡ್ಯಾಕ್ಟೈಲ್ಸ್ ಓಡಾಡುತ್ತಿವೆಯೇ? ಪರಿಶೀಲಿಸೋಣ.
|
||||
|
||||
ನೀವು ಆ ಹೊರಗಿನ ಮೌಲ್ಯಗಳನ್ನು ಕಂಡುಹಿಡಿಯಲು ಎಕ್ಸೆಲ್ನಲ್ಲಿ ತ್ವರಿತವಾಗಿ ಸರಿಸುಮಾರು ಮಾಡಬಹುದು, ಅವು ಬಹುಶಃ ಟೈಪೋಗಳಾಗಿರಬಹುದು, ಆದರೆ ಪ್ಲಾಟ್ನೊಳಗಿಂದಲೇ ದೃಶ್ಯೀಕರಣ ಪ್ರಕ್ರಿಯೆಯನ್ನು ಮುಂದುವರಿಸಿ.
|
||||
|
||||
x-ಅಕ್ಷಕ್ಕೆ ಲೇಬಲ್ಗಳನ್ನು ಸೇರಿಸಿ ಯಾವ ರೀತಿಯ ಪಕ್ಷಿಗಳು ಪ್ರಶ್ನೆಯಲ್ಲಿವೆ ಎಂದು ತೋರಿಸಲು:
|
||||
|
||||
```r
|
||||
ggplot(data=birds, aes(x=Name, y=MaxWingspan,group=1)) +
|
||||
geom_line() +
|
||||
theme(axis.text.x = element_text(angle = 45, hjust=1))+
|
||||
xlab("Birds") +
|
||||
ylab("Wingspan (CM)") +
|
||||
ggtitle("Max Wingspan in Centimeters")
|
||||
```
|
||||
ನಾವು `theme` ನಲ್ಲಿ ಕೋನವನ್ನು ಸೂಚಿಸುತ್ತೇವೆ ಮತ್ತು `xlab()` ಮತ್ತು `ylab()` ನಲ್ಲಿ ಕ್ರಮವಾಗಿ x ಮತ್ತು y ಅಕ್ಷದ ಲೇಬಲ್ಗಳನ್ನು ನಿಗದಿಪಡಿಸುತ್ತೇವೆ. `ggtitle()` ಗ್ರಾಫ್/ಪ್ಲಾಟ್ಗೆ ಹೆಸರು ನೀಡುತ್ತದೆ.
|
||||
|
||||

|
||||
|
||||
ಲೇಬಲ್ಗಳ ತಿರುಗುವಿಕೆಯನ್ನು 45 ಡಿಗ್ರಿ ಗೆ ಹೊಂದಿಸಿದರೂ, ಓದಲು ತುಂಬಾ ಹೆಚ್ಚು ಇದೆ. ಬೇರೆ ತಂತ್ರವನ್ನು ಪ್ರಯತ್ನಿಸೋಣ: ಹೊರಗಿನ ಮೌಲ್ಯಗಳಿಗೆ ಮಾತ್ರ ಲೇಬಲ್ಗಳನ್ನು ನೀಡಿ ಮತ್ತು ಲೇಬಲ್ಗಳನ್ನು ಚಾರ್ಟ್ ಒಳಗೆ ಸೆಟ್ ಮಾಡಿ. ಲೇಬಲಿಂಗ್ಗೆ ಹೆಚ್ಚು ಜಾಗ ಮಾಡಲು ಸ್ಕ್ಯಾಟರ್ ಚಾರ್ಟ್ ಬಳಸಬಹುದು:
|
||||
|
||||
```r
|
||||
ggplot(data=birds, aes(x=Name, y=MaxWingspan,group=1)) +
|
||||
geom_point() +
|
||||
geom_text(aes(label=ifelse(MaxWingspan>500,as.character(Name),'')),hjust=0,vjust=0) +
|
||||
theme(axis.title.x=element_blank(), axis.text.x=element_blank(), axis.ticks.x=element_blank())
|
||||
ylab("Wingspan (CM)") +
|
||||
ggtitle("Max Wingspan in Centimeters") +
|
||||
```
|
||||
ಇಲ್ಲಿ ಏನಾಗುತ್ತಿದೆ? ನೀವು `geom_point()` ಫಂಕ್ಷನ್ ಬಳಸಿ ಸ್ಕ್ಯಾಟರ್ ಪಾಯಿಂಟ್ಗಳನ್ನು ಪ್ಲಾಟ್ ಮಾಡಿದ್ದೀರಿ. ಇದರಿಂದ, `MaxWingspan > 500` ಇರುವ ಪಕ್ಷಿಗಳಿಗೆ ಲೇಬಲ್ಗಳನ್ನು ಸೇರಿಸಿದ್ದೀರಿ ಮತ್ತು ಪ್ಲಾಟ್ ಅನ್ನು ಅಳವಡಿಸಲು x ಅಕ್ಷದ ಲೇಬಲ್ಗಳನ್ನು ಮರೆಮಾಚಿದ್ದೀರಿ.
|
||||
|
||||
ನೀವು ಏನು ಕಂಡುಹಿಡಿದಿರಿ?
|
||||
|
||||

|
||||
|
||||
## ನಿಮ್ಮ ಡೇಟಾವನ್ನು ಫಿಲ್ಟರ್ ಮಾಡಿ
|
||||
|
||||
ಬಾಲ್ಡ್ ಈಗಲ್ ಮತ್ತು ಪ್ರೇರೀ ಫಾಲ್ಕನ್, ಬಹುಶಃ ತುಂಬಾ ದೊಡ್ಡ ಪಕ್ಷಿಗಳು, ಗರಿಷ್ಠ ರೆಕ್ಕೆ ವ್ಯಾಪ್ತಿಗೆ ಹೆಚ್ಚುವರಿ 0 ಸೇರಿಸಿರುವುದರಿಂದ ತಪ್ಪಾಗಿ ಲೇಬಲಾದಂತೆ ಕಾಣುತ್ತವೆ. 25 ಮೀಟರ್ ರೆಕ್ಕೆ ವ್ಯಾಪ್ತಿಯ ಬಾಲ್ಡ್ ಈಗಲ್ ಅನ್ನು ನೀವು ಭೇಟಿಯಾಗುವುದಿಲ್ಲ, ಆದರೆ ಆಗಿದ್ದರೆ ದಯವಿಟ್ಟು ನಮಗೆ ತಿಳಿಸಿ! ಆ ಎರಡು ಹೊರಗಿನ ಮೌಲ್ಯಗಳನ್ನು ಹೊರತುಪಡಿಸಿ ಹೊಸ ಡೇಟಾಫ್ರೇಮ್ ರಚಿಸೋಣ:
|
||||
|
||||
```r
|
||||
birds_filtered <- subset(birds, MaxWingspan < 500)
|
||||
|
||||
ggplot(data=birds_filtered, aes(x=Name, y=MaxWingspan,group=1)) +
|
||||
geom_point() +
|
||||
ylab("Wingspan (CM)") +
|
||||
xlab("Birds") +
|
||||
ggtitle("Max Wingspan in Centimeters") +
|
||||
geom_text(aes(label=ifelse(MaxWingspan>500,as.character(Name),'')),hjust=0,vjust=0) +
|
||||
theme(axis.text.x=element_blank(), axis.ticks.x=element_blank())
|
||||
```
|
||||
ನಾವು ಹೊಸ ಡೇಟಾಫ್ರೇಮ್ `birds_filtered` ರಚಿಸಿ ನಂತರ ಸ್ಕ್ಯಾಟರ್ ಪ್ಲಾಟ್ ರಚಿಸಿದ್ದೇವೆ. ಹೊರಗಿನ ಮೌಲ್ಯಗಳನ್ನು ಫಿಲ್ಟರ್ ಮಾಡಿದ ನಂತರ, ನಿಮ್ಮ ಡೇಟಾ ಈಗ ಹೆಚ್ಚು ಸಮ್ಮಿಲಿತ ಮತ್ತು ಅರ್ಥಮಾಡಿಕೊಳ್ಳಬಹುದಾಗಿದೆ.
|
||||
|
||||

|
||||
|
||||
ಈಗ ರೆಕ್ಕೆ ವ್ಯಾಪ್ತಿಯ ದೃಷ್ಟಿಯಿಂದ ಸ್ವಚ್ಛವಾದ ಡೇಟಾಸೆಟ್ ಇದ್ದು, ಈ ಪಕ್ಷಿಗಳ ಬಗ್ಗೆ ಇನ್ನಷ್ಟು ತಿಳಿದುಕೊಳ್ಳೋಣ.
|
||||
|
||||
ರೇಖಾ ಮತ್ತು ಸ್ಕ್ಯಾಟರ್ ಪ್ಲಾಟ್ಗಳು ಡೇಟಾ ಮೌಲ್ಯಗಳು ಮತ್ತು ಅವುಗಳ ವಿತರಣೆಗಳ ಬಗ್ಗೆ ಮಾಹಿತಿ ತೋರಿಸಬಹುದು, ಆದರೆ ನಾವು ಈ ಡೇಟಾಸೆಟ್ನಲ್ಲಿರುವ ಮೌಲ್ಯಗಳ ಬಗ್ಗೆ ಯೋಚಿಸಬೇಕು. ನೀವು ಪ್ರಮಾಣದ ಬಗ್ಗೆ ಕೆಳಗಿನ ಪ್ರಶ್ನೆಗಳಿಗೆ ಉತ್ತರ ನೀಡುವ ದೃಶ್ಯೀಕರಣಗಳನ್ನು ರಚಿಸಬಹುದು:
|
||||
|
||||
> ಎಷ್ಟು ವರ್ಗದ ಪಕ್ಷಿಗಳು ಇವೆ ಮತ್ತು ಅವುಗಳ ಸಂಖ್ಯೆ ಎಷ್ಟು?
|
||||
> ಎಷ್ಟು ಪಕ್ಷಿಗಳು ನಾಶವಾಗಿವೆ, ಅಪಾಯದಲ್ಲಿವೆ, ಅಪರೂಪವಾಗಿವೆ ಅಥವಾ ಸಾಮಾನ್ಯವಾಗಿವೆ?
|
||||
> ಲಿನಿಯಸ್ ಅವರ ಪದಬಳಕೆಯ ಪ್ರಕಾರ ವಿವಿಧ ಜೀನಸ್ ಮತ್ತು ಕ್ರಮಗಳಲ್ಲಿ ಎಷ್ಟು ಪಕ್ಷಿಗಳು ಇವೆ?
|
||||
## ಬಾರ್ ಚಾರ್ಟ್ಗಳನ್ನು ಅನ್ವೇಷಿಸಿ
|
||||
|
||||
ಬಾರ್ ಚಾರ್ಟ್ಗಳು ಡೇಟಾ ಗುಂಪುಗಳನ್ನು ತೋರಿಸಲು ಉಪಯುಕ್ತವಾಗಿವೆ. ಈ ಡೇಟಾಸೆಟ್ನಲ್ಲಿ ಇರುವ ಪಕ್ಷಿಗಳ ವರ್ಗಗಳನ್ನು ಅನ್ವೇಷಿಸಿ ಯಾವುದು ಸಂಖ್ಯೆಯಲ್ಲಿ ಅತ್ಯಂತ ಸಾಮಾನ್ಯವಾಗಿದೆ ಎಂದು ನೋಡೋಣ. ಫಿಲ್ಟರ್ ಮಾಡಿದ ಡೇಟಾದ ಮೇಲೆ ಬಾರ್ ಚಾರ್ಟ್ ರಚಿಸೋಣ.
|
||||
|
||||
```r
|
||||
install.packages("dplyr")
|
||||
install.packages("tidyverse")
|
||||
|
||||
library(lubridate)
|
||||
library(scales)
|
||||
library(dplyr)
|
||||
library(ggplot2)
|
||||
library(tidyverse)
|
||||
|
||||
birds_filtered %>% group_by(Category) %>%
|
||||
summarise(n=n(),
|
||||
MinLength = mean(MinLength),
|
||||
MaxLength = mean(MaxLength),
|
||||
MinBodyMass = mean(MinBodyMass),
|
||||
MaxBodyMass = mean(MaxBodyMass),
|
||||
MinWingspan=mean(MinWingspan),
|
||||
MaxWingspan=mean(MaxWingspan)) %>%
|
||||
gather("key", "value", - c(Category, n)) %>%
|
||||
ggplot(aes(x = Category, y = value, group = key, fill = key)) +
|
||||
geom_bar(stat = "identity") +
|
||||
scale_fill_manual(values = c("#D62728", "#FF7F0E", "#8C564B","#2CA02C", "#1F77B4", "#9467BD")) +
|
||||
xlab("Category")+ggtitle("Birds of Minnesota")
|
||||
|
||||
```
|
||||
ಕೆಳಗಿನ ಸ্নಿಪೆಟ್ನಲ್ಲಿ, ಡೇಟಾ ಮ್ಯಾನಿಪ್ಯುಲೇಶನ್ ಮತ್ತು ಗುಂಪು ಮಾಡಲು ಸಹಾಯ ಮಾಡುವ [dplyr](https://www.rdocumentation.org/packages/dplyr/versions/0.7.8) ಮತ್ತು [lubridate](https://www.rdocumentation.org/packages/lubridate/versions/1.8.0) ಪ್ಯಾಕೇಜ್ಗಳನ್ನು ಸ್ಥಾಪಿಸುತ್ತೇವೆ. ಮೊದಲು, ನೀವು ಪಕ್ಷಿಯ `Category` ಮೂಲಕ ಡೇಟಾವನ್ನು ಗುಂಪುಮಾಡಿ ನಂತರ `MinLength`, `MaxLength`, `MinBodyMass`, `MaxdyMass`, `MinWingspan`, `MaxWingspan` ಕಾಲಮ್ಗಳನ್ನು ಸಾರಾಂಶಗೊಳಿಸುತ್ತೀರಿ. ನಂತರ, `ggplot2` ಪ್ಯಾಕೇಜ್ ಬಳಸಿ ಬಾರ್ ಚಾರ್ಟ್ ಅನ್ನು ಪ್ಲಾಟ್ ಮಾಡಿ ವಿಭಿನ್ನ ವರ್ಗಗಳಿಗೆ ಬಣ್ಣಗಳನ್ನು ಮತ್ತು ಲೇಬಲ್ಗಳನ್ನು ಸೂಚಿಸುತ್ತೀರಿ.
|
||||
|
||||

|
||||
|
||||
ಈ ಬಾರ್ ಚಾರ್ಟ್ ಓದಲು ಅಸಾಧ್ಯವಾಗಿದೆ ಏಕೆಂದರೆ ಅತಿಯಾದ ಗುಂಪುಮಾಡದ ಡೇಟಾ ಇದೆ. ನೀವು ಪ್ಲಾಟ್ ಮಾಡಲು ಬಯಸುವ ಡೇಟಾವನ್ನು ಮಾತ್ರ ಆಯ್ಕೆಮಾಡಬೇಕು, ಆದ್ದರಿಂದ ಪಕ್ಷಿಗಳ ಉದ್ದವನ್ನು ಅವುಗಳ ವರ್ಗದ ಆಧಾರದ ಮೇಲೆ ನೋಡೋಣ.
|
||||
|
||||
ನಿಮ್ಮ ಡೇಟಾವನ್ನು ಪಕ್ಷಿಯ ವರ್ಗವನ್ನು ಮಾತ್ರ ಒಳಗೊಂಡಂತೆ ಫಿಲ್ಟರ್ ಮಾಡಿ.
|
||||
|
||||
ಬಹುಮಾನ ವರ್ಗಗಳಿದ್ದರಿಂದ, ನೀವು ಈ ಚಾರ್ಟ್ ಅನ್ನು ಲಂಬವಾಗಿ ಪ್ರದರ್ಶಿಸಿ ಎಲ್ಲಾ ಡೇಟಾವನ್ನು ಒಳಗೊಂಡಂತೆ ಅದರ ಎತ್ತರವನ್ನು ಸರಿಹೊಂದಿಸಬಹುದು:
|
||||
|
||||
```r
|
||||
birds_count<-dplyr::count(birds_filtered, Category, sort = TRUE)
|
||||
birds_count$Category <- factor(birds_count$Category, levels = birds_count$Category)
|
||||
ggplot(birds_count,aes(Category,n))+geom_bar(stat="identity")+coord_flip()
|
||||
```
|
||||
ಮೊದಲು ನೀವು `Category` ಕಾಲಮ್ನ ವಿಶಿಷ್ಟ ಮೌಲ್ಯಗಳನ್ನು ಎಣಿಸಿ ನಂತರ ಅವುಗಳನ್ನು ಹೊಸ ಡೇಟಾಫ್ರೇಮ್ `birds_count` ಗೆ ಸರಿಸುಮಾರು ಮಾಡುತ್ತೀರಿ. ಈ ಸರಿಗೊಳಿಸಿದ ಡೇಟಾವನ್ನು ಅದೇ ಮಟ್ಟದಲ್ಲಿ ಫ್ಯಾಕ್ಟರ್ ಮಾಡಿ ಆದ್ದರಿಂದ ಅದು ಸರಿಗೊಳಿಸಿದ ರೀತಿಯಲ್ಲಿ ಪ್ಲಾಟ್ ಆಗುತ್ತದೆ. ನಂತರ `ggplot2` ಬಳಸಿ ಬಾರ್ ಚಾರ್ಟ್ ರಚಿಸುತ್ತೀರಿ. `coord_flip()` ಹೋರಿಜಾಂಟಲ್ ಬಾರ್ಗಳನ್ನು ಪ್ಲಾಟ್ ಮಾಡುತ್ತದೆ.
|
||||
|
||||

|
||||
|
||||
ಈ ಬಾರ್ ಚಾರ್ಟ್ ಪ್ರತಿ ವರ್ಗದಲ್ಲಿನ ಪಕ್ಷಿಗಳ ಸಂಖ್ಯೆಯ ಉತ್ತಮ ದೃಶ್ಯವನ್ನು ತೋರಿಸುತ್ತದೆ. ಕ್ಷಣದಲ್ಲಿಯೇ ನೀವು ಈ ಪ್ರದೇಶದಲ್ಲಿ Ducks/Geese/Waterfowl ವರ್ಗದಲ್ಲಿರುವ ಪಕ್ಷಿಗಳ ಸಂಖ್ಯೆ ಅತ್ಯಂತ ಹೆಚ್ಚು ಎಂದು ನೋಡಬಹುದು. ಮಿನೆಸೋಟಾ '10,000 ಸರೋವರಗಳ ಭೂಮಿ' ಆಗಿರುವುದರಿಂದ ಇದು ಆಶ್ಚರ್ಯಕರವಲ್ಲ!
|
||||
|
||||
✅ ಈ ಡೇಟಾಸೆಟ್ನಲ್ಲಿ ಇನ್ನಷ್ಟು ಎಣಿಕೆಗಳನ್ನು ಪ್ರಯತ್ನಿಸಿ. ಏನಾದರೂ ನಿಮಗೆ ಆಶ್ಚರ್ಯಕರವಿದೆಯೇ?
|
||||
|
||||
## ಡೇಟಾ ಹೋಲಿಕೆ
|
||||
|
||||
ನೀವು ಗುಂಪುಮಾಡಲಾದ ಡೇಟಾದ ವಿಭಿನ್ನ ಹೋಲಿಕೆಗಳನ್ನು ಹೊಸ ಅಕ್ಷಗಳನ್ನು ರಚಿಸುವ ಮೂಲಕ ಪ್ರಯತ್ನಿಸಬಹುದು. ಪಕ್ಷಿಯ ಗರಿಷ್ಠ ಉದ್ದವನ್ನು ಅದರ ವರ್ಗದ ಆಧಾರದ ಮೇಲೆ ಹೋಲಿಸಿ:
|
||||
|
||||
```r
|
||||
birds_grouped <- birds_filtered %>%
|
||||
group_by(Category) %>%
|
||||
summarise(
|
||||
MaxLength = max(MaxLength, na.rm = T),
|
||||
MinLength = max(MinLength, na.rm = T)
|
||||
) %>%
|
||||
arrange(Category)
|
||||
|
||||
ggplot(birds_grouped,aes(Category,MaxLength))+geom_bar(stat="identity")+coord_flip()
|
||||
```
|
||||
ನಾವು `birds_filtered` ಡೇಟಾವನ್ನು `Category` ಮೂಲಕ ಗುಂಪುಮಾಡಿ ನಂತರ ಬಾರ್ ಗ್ರಾಫ್ ರಚಿಸುತ್ತೇವೆ.
|
||||
|
||||

|
||||
|
||||
ಇಲ್ಲಿ ಏನೂ ಆಶ್ಚರ್ಯಕರವಿಲ್ಲ: ಹುಮ್ಮಿಂಗ್ಬರ್ಡ್ಗಳು ಪೆಲಿಕಾನ್ಸ್ ಅಥವಾ ಗೀಸೆಗಳಿಗಿಂತ ಕಡಿಮೆ ಗರಿಷ್ಠ ಉದ್ದ ಹೊಂದಿವೆ. ಡೇಟಾ ತಾರ್ಕಿಕವಾಗಿದ್ದರೆ ಚೆನ್ನಾಗಿದೆ!
|
||||
|
||||
ನೀವು ಬಾರ್ ಚಾರ್ಟ್ಗಳ ರೋಚಕ ದೃಶ್ಯೀಕರಣಗಳನ್ನು ಹೆಚ್ಚು ರೋಚಕವಾಗಿಸಲು ಡೇಟಾವನ್ನು ಒಟ್ಟುಗೂಡಿಸಬಹುದು. ನೀಡಲಾದ ಪಕ್ಷಿ ವರ್ಗದ ಮೇಲೆ ಕನಿಷ್ಠ ಮತ್ತು ಗರಿಷ್ಠ ಉದ್ದವನ್ನು ಒಟ್ಟುಗೂಡಿಸೋಣ:
|
||||
|
||||
```r
|
||||
ggplot(data=birds_grouped, aes(x=Category)) +
|
||||
geom_bar(aes(y=MaxLength), stat="identity", position ="identity", fill='blue') +
|
||||
geom_bar(aes(y=MinLength), stat="identity", position="identity", fill='orange')+
|
||||
coord_flip()
|
||||
```
|
||||

|
||||
|
||||
## 🚀 ಸವಾಲು
|
||||
|
||||
ಈ ಪಕ್ಷಿ ಡೇಟಾಸೆಟ್ ಒಂದು ನಿರ್ದಿಷ್ಟ ಪರಿಸರದಲ್ಲಿ ವಿವಿಧ ರೀತಿಯ ಪಕ್ಷಿಗಳ ಬಗ್ಗೆ ಸಮೃದ್ಧ ಮಾಹಿತಿಯನ್ನು ನೀಡುತ್ತದೆ. ಇಂಟರ್ನೆಟ್ನಲ್ಲಿ ಹುಡುಕಿ ಮತ್ತು ಇನ್ನಷ್ಟು ಪಕ್ಷಿ-ಕೇಂದ್ರಿತ ಡೇಟಾಸೆಟ್ಗಳನ್ನು ಕಂಡುಹಿಡಿಯಿರಿ. ಈ ಪಕ್ಷಿಗಳ ಸುತ್ತಲೂ ಚಾರ್ಟ್ಗಳು ಮತ್ತು ಗ್ರಾಫ್ಗಳನ್ನು ರಚಿಸುವ ಅಭ್ಯಾಸ ಮಾಡಿ ನೀವು ತಿಳಿಯದ ವಾಸ್ತವಗಳನ್ನು ಅನ್ವೇಷಿಸಿ.
|
||||
## [ಪೋಸ್ಟ್-ಪಾಠ ಪ್ರಶ್ನೋತ್ತರ](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/17)
|
||||
|
||||
## ವಿಮರ್ಶೆ ಮತ್ತು ಸ್ವಯಂ ಅಧ್ಯಯನ
|
||||
|
||||
ಈ ಮೊದಲ ಪಾಠವು ಪ್ರಮಾಣಗಳನ್ನು ದೃಶ್ಯೀಕರಿಸಲು `ggplot2` ಅನ್ನು ಹೇಗೆ ಬಳಸಬೇಕೆಂಬ ಬಗ್ಗೆ ನಿಮಗೆ ಕೆಲವು ಮಾಹಿತಿ ನೀಡಿದೆ. ದೃಶ್ಯೀಕರಣಕ್ಕಾಗಿ ಡೇಟಾಸೆಟ್ಗಳೊಂದಿಗೆ ಕೆಲಸ ಮಾಡುವ ಇತರ ಮಾರ್ಗಗಳನ್ನು ಕುರಿತು ಸಂಶೋಧನೆ ಮಾಡಿ. [Lattice](https://stat.ethz.ch/R-manual/R-devel/library/lattice/html/Lattice.html) ಮತ್ತು [Plotly](https://github.com/plotly/plotly.R#readme) ಮುಂತಾದ ಇತರ ಪ್ಯಾಕೇಜ್ಗಳನ್ನು ಬಳಸಿ ನೀವು ದೃಶ್ಯೀಕರಿಸಬಹುದಾದ ಡೇಟಾಸೆಟ್ಗಳನ್ನು ಹುಡುಕಿ.
|
||||
|
||||
## ನಿಯೋಜನೆ
|
||||
[ರೆಖೆಗಳು, ಸ್ಕ್ಯಾಟರ್ಗಳು ಮತ್ತು ಬಾರ್ಗಳು](assignment.md)
|
||||
|
||||
---
|
||||
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
|
||||
**ಅಸ್ವೀಕರಣ**:
|
||||
ಈ ದಸ್ತಾವೇಜು AI ಅನುವಾದ ಸೇವೆ [Co-op Translator](https://github.com/Azure/co-op-translator) ಬಳಸಿ ಅನುವಾದಿಸಲಾಗಿದೆ. ನಾವು ನಿಖರತೆಯಿಗಾಗಿ ಪ್ರಯತ್ನಿಸುತ್ತಿದ್ದರೂ, ಸ್ವಯಂಚಾಲಿತ ಅನುವಾದಗಳಲ್ಲಿ ದೋಷಗಳು ಅಥವಾ ತಪ್ಪುಗಳು ಇರಬಹುದು ಎಂದು ದಯವಿಟ್ಟು ಗಮನಿಸಿ. ಮೂಲ ಭಾಷೆಯಲ್ಲಿರುವ ಮೂಲ ದಸ್ತಾವೇಜನ್ನು ಅಧಿಕೃತ ಮೂಲವೆಂದು ಪರಿಗಣಿಸಬೇಕು. ಮಹತ್ವದ ಮಾಹಿತಿಗಾಗಿ, ವೃತ್ತಿಪರ ಮಾನವ ಅನುವಾದವನ್ನು ಶಿಫಾರಸು ಮಾಡಲಾಗುತ್ತದೆ. ಈ ಅನುವಾದ ಬಳಕೆಯಿಂದ ಉಂಟಾಗುವ ಯಾವುದೇ ತಪ್ಪು ಅರ್ಥಮಾಡಿಕೊಳ್ಳುವಿಕೆ ಅಥವಾ ತಪ್ಪು ವಿವರಣೆಗಳಿಗೆ ನಾವು ಹೊಣೆಗಾರರಾಗುವುದಿಲ್ಲ.
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER END -->
|
||||
@ -0,0 +1,27 @@
|
||||
<!--
|
||||
CO_OP_TRANSLATOR_METADATA:
|
||||
{
|
||||
"original_hash": "0ea21b6513df5ade7419c6b7d65f10b1",
|
||||
"translation_date": "2025-12-19T16:35:04+00:00",
|
||||
"source_file": "3-Data-Visualization/R/09-visualization-quantities/assignment.md",
|
||||
"language_code": "kn"
|
||||
}
|
||||
-->
|
||||
# ರೇಖೆಗಳು, ಚಿತ್ತಾರಗಳು ಮತ್ತು ಬಾರ್ಗಳು
|
||||
|
||||
## ಸೂಚನೆಗಳು
|
||||
|
||||
ಈ ಪಾಠದಲ್ಲಿ, ನೀವು ರೇಖಾ ಚಾರ್ಟ್ಗಳು, ಚಿತ್ತಾರ ಪ್ಲಾಟ್ಗಳು ಮತ್ತು ಬಾರ್ ಚಾರ್ಟ್ಗಳೊಂದಿಗೆ ಈ ಡೇಟಾಸೆಟ್ ಬಗ್ಗೆ ಆಸಕ್ತಿದಾಯಕ ವಾಸ್ತವಗಳನ್ನು ತೋರಿಸಲು ಕೆಲಸ ಮಾಡಿದ್ದೀರಿ. ಈ ನಿಯೋಜನೆಯಲ್ಲಿ, ನೀಡಲಾದ ಪಕ್ಷಿಯ ಪ್ರಕಾರದ ಬಗ್ಗೆ ಒಂದು ವಾಸ್ತವವನ್ನು ಕಂಡುಹಿಡಿಯಲು ಡೇಟಾಸೆಟ್ ಅನ್ನು ಇನ್ನಷ್ಟು ಆಳವಾಗಿ ಪರಿಶೀಲಿಸಿ. ಉದಾಹರಣೆಗೆ, ಸ್ನೋ ಗೀಸ್ ಬಗ್ಗೆ ನೀವು ಕಂಡುಹಿಡಿಯಬಹುದಾದ ಎಲ್ಲಾ ಆಸಕ್ತಿದಾಯಕ ಡೇಟಾವನ್ನು ದೃಶ್ಯೀಕರಿಸುವ ಸ್ಕ್ರಿಪ್ಟ್ ರಚಿಸಿ. ಮೇಲ್ಕಂಡ ಮೂರು ಪ್ಲಾಟ್ಗಳನ್ನು ಬಳಸಿಕೊಂಡು ನಿಮ್ಮ ನೋಟ್ಬುಕ್ನಲ್ಲಿ ಒಂದು ಕಥೆಯನ್ನು ಹೇಳಿ.
|
||||
|
||||
## ಮೌಲ್ಯಮಾಪನ
|
||||
|
||||
ಉದಾಹರಣೆಯಾದ | ತೃಪ್ತಿಕರ | ಸುಧಾರಣೆಯ ಅಗತ್ಯವಿದೆ
|
||||
--- | --- | -- |
|
||||
ಒಳ್ಳೆಯ ಟಿಪ್ಪಣಿಗಳು, ದೃಢ ಕಥನಶೈಲಿ ಮತ್ತು ಆಕರ್ಷಕ ಗ್ರಾಫ್ಗಳೊಂದಿಗೆ ಸ್ಕ್ರಿಪ್ಟ್ ಪ್ರಸ್ತುತಪಡಿಸಲಾಗಿದೆ | ಈ ಅಂಶಗಳಲ್ಲಿ ಒಂದನ್ನು ಸ್ಕ್ರಿಪ್ಟ್ ತಪ್ಪಿಸಿದೆ | ಈ ಅಂಶಗಳಲ್ಲಿ ಎರಡು ತಪ್ಪಿವೆ
|
||||
|
||||
---
|
||||
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
|
||||
**ಅಸ್ವೀಕಾರ**:
|
||||
ಈ ದಸ್ತಾವೇಜು AI ಅನುವಾದ ಸೇವೆ [Co-op Translator](https://github.com/Azure/co-op-translator) ಬಳಸಿ ಅನುವಾದಿಸಲಾಗಿದೆ. ನಾವು ನಿಖರತೆಯಿಗಾಗಿ ಪ್ರಯತ್ನಿಸುತ್ತಿದ್ದರೂ, ಸ್ವಯಂಚಾಲಿತ ಅನುವಾದಗಳಲ್ಲಿ ತಪ್ಪುಗಳು ಅಥವಾ ಅಸತ್ಯತೆಗಳು ಇರಬಹುದು ಎಂದು ದಯವಿಟ್ಟು ಗಮನಿಸಿ. ಮೂಲ ಭಾಷೆಯಲ್ಲಿರುವ ಮೂಲ ದಸ್ತಾವೇಜನ್ನು ಅಧಿಕೃತ ಮೂಲವೆಂದು ಪರಿಗಣಿಸಬೇಕು. ಪ್ರಮುಖ ಮಾಹಿತಿಗಾಗಿ, ವೃತ್ತಿಪರ ಮಾನವ ಅನುವಾದವನ್ನು ಶಿಫಾರಸು ಮಾಡಲಾಗುತ್ತದೆ. ಈ ಅನುವಾದ ಬಳಕೆಯಿಂದ ಉಂಟಾಗುವ ಯಾವುದೇ ತಪ್ಪು ಅರ್ಥಮಾಡಿಕೊಳ್ಳುವಿಕೆ ಅಥವಾ ತಪ್ಪು ವಿವರಣೆಗಳಿಗೆ ನಾವು ಹೊಣೆಗಾರರಾಗುವುದಿಲ್ಲ.
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER END -->
|
||||
@ -0,0 +1,185 @@
|
||||
<!--
|
||||
CO_OP_TRANSLATOR_METADATA:
|
||||
{
|
||||
"original_hash": "ea67c0c40808fd723594de6896c37ccf",
|
||||
"translation_date": "2025-12-19T16:22:32+00:00",
|
||||
"source_file": "3-Data-Visualization/R/10-visualization-distributions/README.md",
|
||||
"language_code": "kn"
|
||||
}
|
||||
-->
|
||||
# ವಿತರಣೆಯ ದೃಶ್ಯೀಕರಣ
|
||||
|
||||
| ಅವರ ಸ್ಕೆಚ್ ನೋಟ್ ](https://github.com/microsoft/Data-Science-For-Beginners/blob/main/sketchnotes/10-Visualizing-Distributions.png)|
|
||||
|:---:|
|
||||
| ವಿತರಣೆಯ ದೃಶ್ಯೀಕರಣ - _[@nitya](https://twitter.com/nitya) ಅವರ ಸ್ಕೆಚ್ ನೋಟ್_ |
|
||||
|
||||
ಹಿಂದಿನ ಪಾಠದಲ್ಲಿ, ನೀವು ಮಿನೆಸೋಟಾದ ಪಕ್ಷಿಗಳ ಬಗ್ಗೆ ಇರುವ ಡೇಟಾಸೆಟ್ ಬಗ್ಗೆ ಕೆಲವು ಆಸಕ್ತಿದಾಯಕ ವಾಸ್ತವಗಳನ್ನು ಕಲಿತಿರಿ. ನೀವು ಔಟ್ಲೈಯರ್ಗಳನ್ನು ದೃಶ್ಯೀಕರಿಸುವ ಮೂಲಕ ಕೆಲವು ತಪ್ಪು ಡೇಟಾವನ್ನು ಕಂಡುಹಿಡಿದಿರಿ ಮತ್ತು ಪಕ್ಷಿಗಳ ವರ್ಗಗಳ ಗರಿಷ್ಠ ಉದ್ದದ ನಡುವಿನ ವ್ಯತ್ಯಾಸಗಳನ್ನು ನೋಡಿದಿರಿ.
|
||||
|
||||
## [ಪೂರ್ವ-ಪಾಠ ಪ್ರಶ್ನೋತ್ತರ](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/18)
|
||||
## ಪಕ್ಷಿಗಳ ಡೇಟಾಸೆಟ್ ಅನ್ನು ಅನ್ವೇಷಿಸಿ
|
||||
|
||||
ಡೇಟಾವನ್ನು ವಿಶ್ಲೇಷಿಸುವ ಮತ್ತೊಂದು ವಿಧಾನವೆಂದರೆ ಅದರ ವಿತರಣೆಯನ್ನು ನೋಡುವುದು, ಅಥವಾ ಡೇಟಾ ಒಂದು ಅಕ್ಷದ ಮೇಲೆ ಹೇಗೆ ಸಂಘಟಿತವಾಗಿದೆ ಎಂಬುದನ್ನು ತಿಳಿದುಕೊಳ್ಳುವುದು. ಉದಾಹರಣೆಗೆ, ನೀವು ಈ ಡೇಟಾಸೆಟ್ನಲ್ಲಿ ಮಿನೆಸೋಟಾದ ಪಕ್ಷಿಗಳ ಗರಿಷ್ಠ ರೆಕ್ಕೆ ವಿಸ್ತಾರ ಅಥವಾ ಗರಿಷ್ಠ ದೇಹ ಭಾರದ ಸಾಮಾನ್ಯ ವಿತರಣೆಯನ್ನು ತಿಳಿದುಕೊಳ್ಳಲು ಇಚ್ಛಿಸಬಹುದು.
|
||||
|
||||
ಈ ಡೇಟಾಸೆಟ್ನ ಡೇಟಾ ವಿತರಣೆಯ ಬಗ್ಗೆ ಕೆಲವು ವಾಸ್ತವಗಳನ್ನು ಕಂಡುಹಿಡಿಯೋಣ. ನಿಮ್ಮ R ಕಾನ್ಸೋಲ್ನಲ್ಲಿ `ggplot2` ಮತ್ತು ಡೇಟಾಬೇಸ್ ಅನ್ನು ಆಮದುಮಾಡಿ. ಹಿಂದಿನ ವಿಷಯದಲ್ಲಿ ಮಾಡಿದಂತೆ ಔಟ್ಲೈಯರ್ಗಳನ್ನು ಡೇಟಾಬೇಸ್ನಿಂದ ತೆಗೆದುಹಾಕಿ.
|
||||
|
||||
```r
|
||||
library(ggplot2)
|
||||
|
||||
birds <- read.csv("../../data/birds.csv",fileEncoding="UTF-8-BOM")
|
||||
|
||||
birds_filtered <- subset(birds, MaxWingspan < 500)
|
||||
head(birds_filtered)
|
||||
```
|
||||
| | ಹೆಸರು | ವೈಜ್ಞಾನಿಕ ಹೆಸರು | ವರ್ಗ | ಕ್ರಮ | ಕುಟುಂಬ | ಜೀನಸ್ | ಸಂರಕ್ಷಣಾ ಸ್ಥಿತಿ | ಕನಿಷ್ಠ ಉದ್ದ | ಗರಿಷ್ಠ ಉದ್ದ | ಕನಿಷ್ಠ ದೇಹ ಭಾರ | ಗರಿಷ್ಠ ದೇಹ ಭಾರ | ಕನಿಷ್ಠ ರೆಕ್ಕೆ ವಿಸ್ತಾರ | ಗರಿಷ್ಠ ರೆಕ್ಕೆ ವಿಸ್ತಾರ |
|
||||
| ---: | :--------------------------- | :--------------------- | :-------------------- | :----------- | :------- | :---------- | :----------------- | --------: | --------: | ----------: | ----------: | ----------: | ----------: |
|
||||
| 0 | ಬ್ಲ್ಯಾಕ್-ಬೆಲ್ಡ್ ವಿಸ್ಲಿಂಗ್-ಡಕ್ | Dendrocygna autumnalis | ಬಾತುಗಳು/ಗೀಸೆ/ನೀರಿನ ಪಕ್ಷಿಗಳು | Anseriformes | Anatidae | Dendrocygna | LC | 47 | 56 | 652 | 1020 | 76 | 94 |
|
||||
| 1 | ಫುಲ್ವಸ್ ವಿಸ್ಲಿಂಗ್-ಡಕ್ | Dendrocygna bicolor | ಬಾತುಗಳು/ಗೀಸೆ/ನೀರಿನ ಪಕ್ಷಿಗಳು | Anseriformes | Anatidae | Dendrocygna | LC | 45 | 53 | 712 | 1050 | 85 | 93 |
|
||||
| 2 | ಸ್ನೋ ಗೂಸ್ | Anser caerulescens | ಬಾತುಗಳು/ಗೀಸೆ/ನೀರಿನ ಪಕ್ಷಿಗಳು | Anseriformes | Anatidae | Anser | LC | 64 | 79 | 2050 | 4050 | 135 | 165 |
|
||||
| 3 | ರಾಸ್ ಗೂಸ್ | Anser rossii | ಬಾತುಗಳು/ಗೀಸೆ/ನೀರಿನ ಪಕ್ಷಿಗಳು | Anseriformes | Anatidae | Anser | LC | 57.3 | 64 | 1066 | 1567 | 113 | 116 |
|
||||
| 4 | ಗ್ರೇಟರ್ ವೈಟ್-ಫ್ರಂಟ್ ಗೂಸ್ | Anser albifrons | ಬಾತುಗಳು/ಗೀಸೆ/ನೀರಿನ ಪಕ್ಷಿಗಳು | Anseriformes | Anatidae | Anser | LC | 64 | 81 | 1930 | 3310 | 130 | 165 |
|
||||
|
||||
ಸಾಮಾನ್ಯವಾಗಿ, ನೀವು ಹಿಂದಿನ ಪಾಠದಲ್ಲಿ ಮಾಡಿದಂತೆ ಸ್ಕ್ಯಾಟರ್ ಪ್ಲಾಟ್ ಬಳಸಿ ಡೇಟಾ ಹೇಗೆ ವಿತರಿಸಲಾಗಿದೆ ಎಂಬುದನ್ನು ತ್ವರಿತವಾಗಿ ನೋಡಬಹುದು:
|
||||
|
||||
```r
|
||||
ggplot(data=birds_filtered, aes(x=Order, y=MaxLength,group=1)) +
|
||||
geom_point() +
|
||||
ggtitle("Max Length per order") + coord_flip()
|
||||
```
|
||||

|
||||
|
||||
ಇದು ಪಕ್ಷಿ ಕ್ರಮದ ಪ್ರತಿ ದೇಹ ಉದ್ದದ ಸಾಮಾನ್ಯ ವಿತರಣೆಯ ಅವಲೋಕನವನ್ನು ನೀಡುತ್ತದೆ, ಆದರೆ ಇದು ನಿಜವಾದ ವಿತರಣೆಯನ್ನು ಪ್ರದರ್ಶಿಸಲು ಅತ್ಯುತ್ತಮ ವಿಧಾನವಲ್ಲ. ಆ ಕಾರ್ಯವನ್ನು ಸಾಮಾನ್ಯವಾಗಿ ಹಿಸ್ಟೋಗ್ರಾಮ್ ರಚಿಸುವ ಮೂಲಕ ನಿರ್ವಹಿಸಲಾಗುತ್ತದೆ.
|
||||
## ಹಿಸ್ಟೋಗ್ರಾಮ್ಗಳೊಂದಿಗೆ ಕೆಲಸ
|
||||
|
||||
`ggplot2` ಡೇಟಾ ವಿತರಣೆಯನ್ನು ಹಿಸ್ಟೋಗ್ರಾಮ್ಗಳ ಮೂಲಕ ದೃಶ್ಯೀಕರಿಸಲು ಅತ್ಯುತ್ತಮ ವಿಧಾನಗಳನ್ನು ಒದಗಿಸುತ್ತದೆ. ಈ ರೀತಿಯ ಚಾರ್ಟ್ ಒಂದು ಬಾರ್ ಚಾರ್ಟ್ ಹೋಲುತ್ತದೆ, ಇಲ್ಲಿ ಬಾರ್ಗಳ ಏರಿಕೆ ಮತ್ತು ಇಳಿಕೆಯಿಂದ ವಿತರಣೆಯನ್ನು ನೋಡಬಹುದು. ಹಿಸ್ಟೋಗ್ರಾಮ್ ರಚಿಸಲು, ನಿಮಗೆ ಸಂಖ್ಯಾತ್ಮಕ ಡೇಟಾ ಬೇಕಾಗುತ್ತದೆ. ಹಿಸ್ಟೋಗ್ರಾಮ್ ರಚಿಸಲು, ನೀವು ಚಾರ್ಟ್ ಅನ್ನು 'hist' ಪ್ರಕಾರವಾಗಿ ನಿರ್ಧರಿಸಿ ಪ್ಲಾಟ್ ಮಾಡಬಹುದು. ಈ ಚಾರ್ಟ್ ಸಂಪೂರ್ಣ ಡೇಟಾಸೆಟ್ನ ಸಂಖ್ಯಾತ್ಮಕ ಡೇಟಾದ ವ್ಯಾಪ್ತಿಯ ಗರಿಷ್ಠ ದೇಹ ಭಾರದ ವಿತರಣೆಯನ್ನು ತೋರಿಸುತ್ತದೆ. ಡೇಟಾ ಸರಣಿಯನ್ನು ಸಣ್ಣ ಬಿನ್ಗಳಾಗಿ ವಿಭಜಿಸುವ ಮೂಲಕ, ಅದು ಡೇಟಾ ಮೌಲ್ಯಗಳ ವಿತರಣೆಯನ್ನು ಪ್ರದರ್ಶಿಸಬಹುದು:
|
||||
|
||||
```r
|
||||
ggplot(data = birds_filtered, aes(x = MaxBodyMass)) +
|
||||
geom_histogram(bins=10)+ylab('Frequency')
|
||||
```
|
||||

|
||||
|
||||
ನೀವು ನೋಡಬಹುದು, ಈ ಡೇಟಾಸೆಟ್ನ 400+ ಪಕ್ಷಿಗಳ ಬಹುತೇಕವು ಗರಿಷ್ಠ ದೇಹ ಭಾರದ 2000 ಕ್ಕಿಂತ ಕಡಿಮೆ ವ್ಯಾಪ್ತಿಯಲ್ಲಿ ಬರುತ್ತವೆ. `bins` ಪರಿಮಾಣವನ್ನು 30 ರಂತಹ ಹೆಚ್ಚಿನ ಸಂಖ್ಯೆಗೆ ಬದಲಾಯಿಸುವ ಮೂಲಕ ಡೇಟಾದ ಬಗ್ಗೆ ಹೆಚ್ಚಿನ ಒಳನೋಟವನ್ನು ಪಡೆಯಿರಿ:
|
||||
|
||||
```r
|
||||
ggplot(data = birds_filtered, aes(x = MaxBodyMass)) + geom_histogram(bins=30)+ylab('Frequency')
|
||||
```
|
||||
|
||||

|
||||
|
||||
ಈ ಚಾರ್ಟ್ ಸ್ವಲ್ಪ ಹೆಚ್ಚು ಸೂಕ್ಷ್ಮ ರೀತಿಯಲ್ಲಿ ವಿತರಣೆಯನ್ನು ತೋರಿಸುತ್ತದೆ. ಎಡಕ್ಕೆ ಕಡಿಮೆ ತಿರುವು ಹೊಂದಿರುವ ಚಾರ್ಟ್ ಅನ್ನು ನೀವು ನಿರ್ದಿಷ್ಟ ವ್ಯಾಪ್ತಿಯೊಳಗಿನ ಡೇಟಾವನ್ನು ಮಾತ್ರ ಆಯ್ಕೆಮಾಡುವ ಮೂಲಕ ರಚಿಸಬಹುದು:
|
||||
|
||||
ನಿಮ್ಮ ಡೇಟಾವನ್ನು ಫಿಲ್ಟರ್ ಮಾಡಿ, ದೇಹ ಭಾರವು 60 ಕ್ಕಿಂತ ಕಡಿಮೆ ಇರುವ ಪಕ್ಷಿಗಳನ್ನು ಮಾತ್ರ ತೆಗೆದುಕೊಳ್ಳಿ ಮತ್ತು 30 `bins` ತೋರಿಸಿ:
|
||||
|
||||
```r
|
||||
birds_filtered_1 <- subset(birds_filtered, MaxBodyMass > 1 & MaxBodyMass < 60)
|
||||
ggplot(data = birds_filtered_1, aes(x = MaxBodyMass)) +
|
||||
geom_histogram(bins=30)+ylab('Frequency')
|
||||
```
|
||||
|
||||

|
||||
|
||||
✅ ಇನ್ನಷ್ಟು ಫಿಲ್ಟರ್ಗಳು ಮತ್ತು ಡೇಟಾ ಪಾಯಿಂಟ್ಗಳನ್ನು ಪ್ರಯತ್ನಿಸಿ. ಡೇಟಾದ ಸಂಪೂರ್ಣ ವಿತರಣೆಯನ್ನು ನೋಡಲು, ಲೇಬಲ್ ಮಾಡಲಾದ ವಿತರಣೆಯನ್ನು ತೋರಿಸಲು `['MaxBodyMass']` ಫಿಲ್ಟರ್ ಅನ್ನು ತೆಗೆದುಹಾಕಿ.
|
||||
|
||||
ಹಿಸ್ಟೋಗ್ರಾಮ್ ಕೆಲವು ಸುಂದರ ಬಣ್ಣ ಮತ್ತು ಲೇಬಲಿಂಗ್ ಸುಧಾರಣೆಗಳನ್ನು ಸಹ ಒದಗಿಸುತ್ತದೆ:
|
||||
|
||||
ಎರಡು ವಿತರಣೆಗಳ ನಡುವಿನ ಸಂಬಂಧವನ್ನು ಹೋಲಿಸಲು 2D ಹಿಸ್ಟೋಗ್ರಾಮ್ ರಚಿಸಿ. `MaxBodyMass` ಮತ್ತು `MaxLength` ಅನ್ನು ಹೋಲಿಸಿ. `ggplot2` ಪ್ರಕಾಶಮಾನ ಬಣ್ಣಗಳನ್ನು ಬಳಸಿ ಸಂಯೋಜನೆಯನ್ನು ತೋರಿಸುವ ಒಳಗೊಂಡ ವಿಧಾನವನ್ನು ಒದಗಿಸುತ್ತದೆ:
|
||||
|
||||
```r
|
||||
ggplot(data=birds_filtered_1, aes(x=MaxBodyMass, y=MaxLength) ) +
|
||||
geom_bin2d() +scale_fill_continuous(type = "viridis")
|
||||
```
|
||||
ಈ ಎರಡು ಅಂಶಗಳ ನಡುವೆ ನಿರೀಕ್ಷಿತ ಅಕ್ಷದ ಮೇಲೆ ನಿರೀಕ್ಷಿತ ಸಂಬಂಧವಿದೆ, ಒಂದು ವಿಶೇಷವಾಗಿ ಬಲವಾದ ಸಂಯೋಜನೆಯ ಬಿಂದುವಿನೊಂದಿಗೆ:
|
||||
|
||||

|
||||
|
||||
ಹಿಸ್ಟೋಗ್ರಾಮ್ಗಳು ಸಂಖ್ಯಾತ್ಮಕ ಡೇಟಾಗಾಗಿ ಡೀಫಾಲ್ಟ್ನಲ್ಲಿ ಚೆನ್ನಾಗಿ ಕೆಲಸ ಮಾಡುತ್ತವೆ. ಪಠ್ಯ ಡೇಟಾ ಪ್ರಕಾರ ವಿತರಣೆಯನ್ನು ನೋಡಬೇಕಾದರೆ ಏನು ಮಾಡಬೇಕು?
|
||||
## ಪಠ್ಯ ಡೇಟಾ ಬಳಸಿ ವಿತರಣೆಯನ್ನು ಅನ್ವೇಷಿಸಿ
|
||||
|
||||
ಈ ಡೇಟಾಸೆಟ್ ಪಕ್ಷಿ ವರ್ಗ ಮತ್ತು ಅದರ ಜೀನಸ್, ಪ್ರಭೇದ ಮತ್ತು ಕುಟುಂಬದ ಜೊತೆಗೆ ಅದರ ಸಂರಕ್ಷಣಾ ಸ್ಥಿತಿಯ ಬಗ್ಗೆ ಉತ್ತಮ ಮಾಹಿತಿಯನ್ನು ಒಳಗೊಂಡಿದೆ. ಈ ಸಂರಕ್ಷಣಾ ಮಾಹಿತಿಯನ್ನು ಅನ್ವೇಷಿಸೋಣ. ಪಕ್ಷಿಗಳ ಸಂರಕ್ಷಣಾ ಸ್ಥಿತಿಯ ಪ್ರಕಾರ ವಿತರಣೆಯೇನು?
|
||||
|
||||
> ✅ ಡೇಟಾಸೆಟ್ನಲ್ಲಿ, ಸಂರಕ್ಷಣಾ ಸ್ಥಿತಿಯನ್ನು ವಿವರಿಸಲು ಹಲವಾರು ಸಂಕ್ಷಿಪ್ತ ಪದಗಳನ್ನು ಬಳಸಲಾಗಿದೆ. ಈ ಸಂಕ್ಷಿಪ್ತ ಪದಗಳು [IUCN ರೆಡ್ ಲಿಸ್ಟ್ ವರ್ಗಗಳು](https://www.iucnredlist.org/) ನಿಂದ ಬಂದಿವೆ, ಇದು ಪ್ರಭೇದಗಳ ಸ್ಥಿತಿಯನ್ನು ದಾಖಲಿಸುವ ಸಂಸ್ಥೆ.
|
||||
>
|
||||
> - CR: ಗಂಭೀರವಾಗಿ ಅಪಾಯದಲ್ಲಿರುವುದು
|
||||
> - EN: ಅಪಾಯದಲ್ಲಿರುವುದು
|
||||
> - EX: ನಾಶವಾದುದು
|
||||
> - LC: ಕನಿಷ್ಠ ಚಿಂತನೆ
|
||||
> - NT: ಸಮೀಪದ ಅಪಾಯ
|
||||
> - VU: ಅಸುರಕ್ಷಿತ
|
||||
|
||||
ಇವು ಪಠ್ಯ ಆಧಾರಿತ ಮೌಲ್ಯಗಳು ಆದ್ದರಿಂದ ನೀವು ಹಿಸ್ಟೋಗ್ರಾಮ್ ರಚಿಸಲು ಪರಿವರ್ತನೆ ಮಾಡಬೇಕಾಗುತ್ತದೆ. filteredBirds ಡೇಟಾಫ್ರೇಮ್ ಬಳಸಿ, ಅದರ ಸಂರಕ್ಷಣಾ ಸ್ಥಿತಿಯನ್ನು ಕನಿಷ್ಠ ರೆಕ್ಕೆ ವಿಸ್ತಾರದೊಂದಿಗೆ ಪ್ರದರ್ಶಿಸಿ. ನೀವು ಏನು ನೋಡುತ್ತೀರಿ?
|
||||
|
||||
```r
|
||||
birds_filtered_1$ConservationStatus[birds_filtered_1$ConservationStatus == 'EX'] <- 'x1'
|
||||
birds_filtered_1$ConservationStatus[birds_filtered_1$ConservationStatus == 'CR'] <- 'x2'
|
||||
birds_filtered_1$ConservationStatus[birds_filtered_1$ConservationStatus == 'EN'] <- 'x3'
|
||||
birds_filtered_1$ConservationStatus[birds_filtered_1$ConservationStatus == 'NT'] <- 'x4'
|
||||
birds_filtered_1$ConservationStatus[birds_filtered_1$ConservationStatus == 'VU'] <- 'x5'
|
||||
birds_filtered_1$ConservationStatus[birds_filtered_1$ConservationStatus == 'LC'] <- 'x6'
|
||||
|
||||
ggplot(data=birds_filtered_1, aes(x = MinWingspan, fill = ConservationStatus)) +
|
||||
geom_histogram(position = "identity", alpha = 0.4, bins = 20) +
|
||||
scale_fill_manual(name="Conservation Status",values=c("red","green","blue","pink"),labels=c("Endangered","Near Threathened","Vulnerable","Least Concern"))
|
||||
```
|
||||
|
||||

|
||||
|
||||
ಕನಿಷ್ಠ ರೆಕ್ಕೆ ವಿಸ್ತಾರ ಮತ್ತು ಸಂರಕ್ಷಣಾ ಸ್ಥಿತಿಯ ನಡುವೆ ಉತ್ತಮ ಸಂಬಂಧವಿಲ್ಲದಂತೆ ತೋರುತ್ತದೆ. ಈ ವಿಧಾನವನ್ನು ಬಳಸಿ ಡೇಟಾಸೆಟ್ನ ಇತರ ಅಂಶಗಳನ್ನು ಪರೀಕ್ಷಿಸಿ. ನೀವು ಯಾವುದೇ ಸಂಬಂಧವನ್ನು ಕಂಡುಕೊಳ್ಳುತ್ತೀರಾ?
|
||||
|
||||
## ಡೆನ್ಸಿಟಿ ಪ್ಲಾಟ್ಗಳು
|
||||
|
||||
ನೀವು ಗಮನಿಸಿದ್ದೀರಾ, ನಾವು ಈಗಾಗಲೇ ನೋಡಿದ ಹಿಸ್ಟೋಗ್ರಾಮ್ಗಳು 'ಹಂತದ' ಆಗಿದ್ದು, ಸ್ಮೂತ್ ಆಗಿ ವಕ್ರವಾಗಿ ಹರಿಯುವುದಿಲ್ಲ. ಸ್ಮೂತ್ ಡೆನ್ಸಿಟಿ ಚಾರ್ಟ್ ತೋರಿಸಲು, ನೀವು ಡೆನ್ಸಿಟಿ ಪ್ಲಾಟ್ ಪ್ರಯತ್ನಿಸಬಹುದು.
|
||||
|
||||
ಇದೀಗ ಡೆನ್ಸಿಟಿ ಪ್ಲಾಟ್ಗಳೊಂದಿಗೆ ಕೆಲಸ ಮಾಡೋಣ!
|
||||
|
||||
```r
|
||||
ggplot(data = birds_filtered_1, aes(x = MinWingspan)) +
|
||||
geom_density()
|
||||
```
|
||||

|
||||
|
||||
ನೀವು ನೋಡಬಹುದು, ಈ ಪ್ಲಾಟ್ ಕನಿಷ್ಠ ರೆಕ್ಕೆ ವಿಸ್ತಾರದ ಡೇಟಾಗಾಗಿ ಹಿಂದಿನದನ್ನು ಪ್ರತಿಧ್ವನಿಸುತ್ತದೆ; ಅದು ಸ್ವಲ್ಪ ಸ್ಮೂತ್ ಆಗಿದೆ. ನೀವು ಎರಡನೇ ಚಾರ್ಟ್ನಲ್ಲಿ ರಚಿಸಿದ ಜಾಗೃತ MaxBodyMass ರೇಖೆಯನ್ನು ಮರುಸೃಷ್ಟಿಸುವ ಮೂಲಕ ಅದನ್ನು ಚೆನ್ನಾಗಿ ಸ್ಮೂತ್ ಮಾಡಬಹುದು:
|
||||
|
||||
```r
|
||||
ggplot(data = birds_filtered_1, aes(x = MaxBodyMass)) +
|
||||
geom_density()
|
||||
```
|
||||

|
||||
|
||||
ನೀವು ಸ್ಮೂತ್ ಆದರೆ ತುಂಬಾ ಸ್ಮೂತ್ ಅಲ್ಲದ ರೇಖೆಯನ್ನು ಬಯಸಿದರೆ, `adjust` ಪರಿಮಾಣವನ್ನು ಸಂಪಾದಿಸಿ:
|
||||
|
||||
```r
|
||||
ggplot(data = birds_filtered_1, aes(x = MaxBodyMass)) +
|
||||
geom_density(adjust = 1/5)
|
||||
```
|
||||

|
||||
|
||||
✅ ಈ ರೀತಿಯ ಪ್ಲಾಟ್ಗೆ ಲಭ್ಯವಿರುವ ಪರಿಮಾಣಗಳ ಬಗ್ಗೆ ಓದಿ ಮತ್ತು ಪ್ರಯೋಗ ಮಾಡಿ!
|
||||
|
||||
ಈ ರೀತಿಯ ಚಾರ್ಟ್ ಸುಂದರವಾಗಿ ವಿವರಣಾತ್ಮಕ ದೃಶ್ಯೀಕರಣಗಳನ್ನು ಒದಗಿಸುತ್ತದೆ. ಕೆಲವು ಸಾಲುಗಳ ಕೋಡ್ನೊಂದಿಗೆ, ಉದಾಹರಣೆಗೆ, ನೀವು ಪಕ್ಷಿ ಕ್ರಮದ ಪ್ರತಿ ಗರಿಷ್ಠ ದೇಹ ಭಾರದ ಡೆನ್ಸಿಟಿಯನ್ನು ತೋರಿಸಬಹುದು:
|
||||
|
||||
```r
|
||||
ggplot(data=birds_filtered_1,aes(x = MaxBodyMass, fill = Order)) +
|
||||
geom_density(alpha=0.5)
|
||||
```
|
||||

|
||||
|
||||
## 🚀 ಸವಾಲು
|
||||
|
||||
ಹಿಸ್ಟೋಗ್ರಾಮ್ಗಳು ಮೂಲ ಸ್ಕ್ಯಾಟರ್ ಪ್ಲಾಟ್ಗಳು, ಬಾರ್ ಚಾರ್ಟ್ಗಳು ಅಥವಾ ಲೈನ್ ಚಾರ್ಟ್ಗಳಿಗಿಂತ ಹೆಚ್ಚು ಸುಧಾರಿತ ಚಾರ್ಟ್ ಪ್ರಕಾರ. ಇಂಟರ್ನೆಟ್ನಲ್ಲಿ ಹಿಸ್ಟೋಗ್ರಾಮ್ಗಳ ಬಳಕೆಯ ಉತ್ತಮ ಉದಾಹರಣೆಗಳನ್ನು ಹುಡುಕಿ. ಅವು ಹೇಗೆ ಬಳಸಲಾಗುತ್ತವೆ, ಏನು ಪ್ರದರ್ಶಿಸುತ್ತವೆ ಮತ್ತು ಯಾವ ಕ್ಷೇತ್ರಗಳು ಅಥವಾ ವಿಚಾರಣಾ ಕ್ಷೇತ್ರಗಳಲ್ಲಿ ಅವು ಸಾಮಾನ್ಯವಾಗಿ ಬಳಸಲಾಗುತ್ತವೆ?
|
||||
|
||||
## [ಪೋಸ್ಟ್-ಪಾಠ ಪ್ರಶ್ನೋತ್ತರ](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/19)
|
||||
|
||||
## ವಿಮರ್ಶೆ ಮತ್ತು ಸ್ವಯಂ ಅಧ್ಯಯನ
|
||||
|
||||
ಈ ಪಾಠದಲ್ಲಿ, ನೀವು `ggplot2` ಬಳಸಿ ಹೆಚ್ಚು ಸುಧಾರಿತ ಚಾರ್ಟ್ಗಳನ್ನು ತೋರಿಸಲು ಕೆಲಸ ಪ್ರಾರಂಭಿಸಿದ್ದೀರಿ. `geom_density_2d()` ಎಂಬ "ಒಂದು ಅಥವಾ ಹೆಚ್ಚು ಆಯಾಮಗಳಲ್ಲಿ ನಿರಂತರ ಸಾಧ್ಯತೆ ಡೆನ್ಸಿಟಿ ವಕ್ರ" ಬಗ್ಗೆ ಸಂಶೋಧನೆ ಮಾಡಿ. ಅದು ಹೇಗೆ ಕೆಲಸ ಮಾಡುತ್ತದೆ ಎಂಬುದನ್ನು ಅರ್ಥಮಾಡಿಕೊಳ್ಳಲು [ಡಾಕ್ಯುಮೆಂಟೇಶನ್](https://ggplot2.tidyverse.org/reference/geom_density_2d.html) ಓದಿ.
|
||||
|
||||
## ನಿಯೋಜನೆ
|
||||
|
||||
[ನಿಮ್ಮ ಕೌಶಲ್ಯಗಳನ್ನು ಅನ್ವಯಿಸಿ](assignment.md)
|
||||
|
||||
---
|
||||
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
|
||||
**ಅಸ್ವೀಕರಣ**:
|
||||
ಈ ದಸ್ತಾವೇಜು [Co-op Translator](https://github.com/Azure/co-op-translator) ಎಂಬ AI ಅನುವಾದ ಸೇವೆಯನ್ನು ಬಳಸಿ ಅನುವಾದಿಸಲಾಗಿದೆ. ನಾವು ಶುದ್ಧತೆಯತ್ತ ಪ್ರಯತ್ನಿಸುತ್ತಿದ್ದರೂ, ಸ್ವಯಂಚಾಲಿತ ಅನುವಾದಗಳಲ್ಲಿ ತಪ್ಪುಗಳು ಅಥವಾ ಅಸತ್ಯತೆಗಳು ಇರಬಹುದು ಎಂಬುದನ್ನು ದಯವಿಟ್ಟು ಗಮನಿಸಿ. ಮೂಲ ಭಾಷೆಯಲ್ಲಿರುವ ಮೂಲ ದಸ್ತಾವೇಜನ್ನು ಅಧಿಕೃತ ಮೂಲವೆಂದು ಪರಿಗಣಿಸಬೇಕು. ಮಹತ್ವದ ಮಾಹಿತಿಗಾಗಿ, ವೃತ್ತಿಪರ ಮಾನವ ಅನುವಾದವನ್ನು ಶಿಫಾರಸು ಮಾಡಲಾಗುತ್ತದೆ. ಈ ಅನುವಾದ ಬಳಕೆಯಿಂದ ಉಂಟಾಗುವ ಯಾವುದೇ ತಪ್ಪು ಅರ್ಥಮಾಡಿಕೊಳ್ಳುವಿಕೆ ಅಥವಾ ತಪ್ಪು ವಿವರಣೆಗಳಿಗೆ ನಾವು ಹೊಣೆಗಾರರಾಗುವುದಿಲ್ಲ.
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER END -->
|
||||
@ -0,0 +1,27 @@
|
||||
<!--
|
||||
CO_OP_TRANSLATOR_METADATA:
|
||||
{
|
||||
"original_hash": "a233d542512136c4dd29aad38ca0175f",
|
||||
"translation_date": "2025-12-19T16:23:54+00:00",
|
||||
"source_file": "3-Data-Visualization/R/10-visualization-distributions/assignment.md",
|
||||
"language_code": "kn"
|
||||
}
|
||||
-->
|
||||
# ನಿಮ್ಮ ಕೌಶಲ್ಯಗಳನ್ನು ಅನ್ವಯಿಸಿ
|
||||
|
||||
## ಸೂಚನೆಗಳು
|
||||
|
||||
ಇದುವರೆಗೆ, ನೀವು ಮಿನೆಸೋಟಾ ಪಕ್ಷಿಗಳ ಡೇಟಾಸೆಟ್ನೊಂದಿಗೆ ಪಕ್ಷಿಗಳ ಪ್ರಮಾಣ ಮತ್ತು ಜನಸಂಖ್ಯಾ ಸಾಂದ್ರತೆ ಬಗ್ಗೆ ಮಾಹಿತಿ ಕಂಡುಹಿಡಿಯಲು ಕೆಲಸ ಮಾಡಿದ್ದೀರಿ. ಈ ತಂತ್ರಗಳನ್ನು ಅನ್ವಯಿಸುವ ಅಭ್ಯಾಸವನ್ನು ಬೇರೆ ಡೇಟಾಸೆಟ್ನೊಂದಿಗೆ ಪ್ರಯತ್ನಿಸಿ, ಬಹುಶಃ [Kaggle](https://www.kaggle.com/) ನಿಂದ ಪಡೆದಿರಬಹುದು. ಈ ಡೇಟಾಸೆಟ್ ಬಗ್ಗೆ ಕಥೆಯನ್ನು ಹೇಳಲು R ಸ್ಕ್ರಿಪ್ಟ್ ರಚಿಸಿ, ಮತ್ತು ಅದನ್ನು ಚರ್ಚಿಸುವಾಗ ಹಿಸ್ಟೋಗ್ರಾಮ್ಗಳನ್ನು ಬಳಸುವುದನ್ನು ಖಚಿತಪಡಿಸಿಕೊಳ್ಳಿ.
|
||||
|
||||
## ಮೌಲ್ಯಮಾಪನ
|
||||
|
||||
ಉದಾಹರಣೆಯಾಗಿ | ತೃಪ್ತಿಕರ | ಸುಧಾರಣೆಯ ಅಗತ್ಯವಿದೆ
|
||||
--- | --- | -- |
|
||||
ಈ ಡೇಟಾಸೆಟ್ನ ಮೂಲವನ್ನು ಒಳಗೊಂಡಂತೆ ಟಿಪ್ಪಣಿಗಳೊಂದಿಗೆ ಸ್ಕ್ರಿಪ್ಟ್ ಅನ್ನು ಪ್ರಸ್ತುತಪಡಿಸಲಾಗಿದೆ ಮತ್ತು ಡೇಟಾದ ಬಗ್ಗೆ ತಥ್ಯಗಳನ್ನು ಕಂಡುಹಿಡಿಯಲು ಕನಿಷ್ಠ 5 ಹಿಸ್ಟೋಗ್ರಾಮ್ಗಳನ್ನು ಬಳಸಲಾಗಿದೆ. | ಅಪೂರ್ಣ ಟಿಪ್ಪಣಿಗಳು ಅಥವಾ ದೋಷಗಳೊಂದಿಗೆ ಸ್ಕ್ರಿಪ್ಟ್ ಅನ್ನು ಪ್ರಸ್ತುತಪಡಿಸಲಾಗಿದೆ. | ಟಿಪ್ಪಣಿಗಳಿಲ್ಲದೆ ಮತ್ತು ದೋಷಗಳೊಂದಿಗೆ ಸ್ಕ್ರಿಪ್ಟ್ ಅನ್ನು ಪ್ರಸ್ತುತಪಡಿಸಲಾಗಿದೆ.
|
||||
|
||||
---
|
||||
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
|
||||
**ಅಸ್ವೀಕರಣ**:
|
||||
ಈ ದಸ್ತಾವೇಜು [Co-op Translator](https://github.com/Azure/co-op-translator) ಎಂಬ AI ಅನುವಾದ ಸೇವೆಯನ್ನು ಬಳಸಿ ಅನುವಾದಿಸಲಾಗಿದೆ. ನಾವು ಶುದ್ಧತೆಯತ್ತ ಪ್ರಯತ್ನಿಸುತ್ತಿದ್ದರೂ, ಸ್ವಯಂಚಾಲಿತ ಅನುವಾದಗಳಲ್ಲಿ ತಪ್ಪುಗಳು ಅಥವಾ ಅಸತ್ಯತೆಗಳು ಇರಬಹುದು ಎಂದು ದಯವಿಟ್ಟು ಗಮನಿಸಿ. ಮೂಲ ಭಾಷೆಯಲ್ಲಿರುವ ಮೂಲ ದಸ್ತಾವೇಜನ್ನು ಅಧಿಕೃತ ಮೂಲವೆಂದು ಪರಿಗಣಿಸಬೇಕು. ಮಹತ್ವದ ಮಾಹಿತಿಗಾಗಿ, ವೃತ್ತಿಪರ ಮಾನವ ಅನುವಾದವನ್ನು ಶಿಫಾರಸು ಮಾಡಲಾಗುತ್ತದೆ. ಈ ಅನುವಾದ ಬಳಕೆಯಿಂದ ಉಂಟಾಗುವ ಯಾವುದೇ ತಪ್ಪು ಅರ್ಥಮಾಡಿಕೊಳ್ಳುವಿಕೆ ಅಥವಾ ತಪ್ಪು ವಿವರಣೆಗಳಿಗೆ ನಾವು ಹೊಣೆಗಾರರಾಗುವುದಿಲ್ಲ.
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER END -->
|
||||
@ -0,0 +1,206 @@
|
||||
<!--
|
||||
CO_OP_TRANSLATOR_METADATA:
|
||||
{
|
||||
"original_hash": "47028abaaafa2bcb1079702d20569066",
|
||||
"translation_date": "2025-12-19T16:29:36+00:00",
|
||||
"source_file": "3-Data-Visualization/R/11-visualization-proportions/README.md",
|
||||
"language_code": "kn"
|
||||
}
|
||||
-->
|
||||
# ಪ್ರಮಾಣಗಳನ್ನು ದೃಶ್ಯೀಕರಿಸುವುದು
|
||||
|
||||
| ಅವರ ಸ್ಕೆಚ್ ನೋಟ್ ](../../../sketchnotes/11-Visualizing-Proportions.png)|
|
||||
|:---:|
|
||||
|ಪ್ರಮಾಣಗಳನ್ನು ದೃಶ್ಯೀಕರಿಸುವುದು - _[@nitya](https://twitter.com/nitya) ಅವರ ಸ್ಕೆಚ್ ನೋಟ್_ |
|
||||
|
||||
ಈ ಪಾಠದಲ್ಲಿ, ನೀವು ಪ್ರಾಕೃತಿಕ-ಕೇಂದ್ರೀಕೃತ ಬೇರೆ ಡೇಟಾಸೆಟ್ ಅನ್ನು ಬಳಸಿಕೊಂಡು ಪ್ರಮಾಣಗಳನ್ನು ದೃಶ್ಯೀಕರಿಸುವಿರಿ, ಉದಾಹರಣೆಗೆ, ಒಂದು ಡೇಟಾಸೆಟ್ನಲ್ಲಿ ಎಷ್ಟು ವಿಭಿನ್ನ ಪ್ರಕಾರದ ಫಂಗಿ ಇದ್ದಾರೆ ಎಂಬುದನ್ನು. ನಾವು ಈ ಆಕರ್ಷಕ ಫಂಗಿಗಳನ್ನು Audubon ನಿಂದ ಪಡೆದ 23 ಪ್ರಭೇದಗಳ ಗಿಲ್ಲ್ಡ್ ಮಶ್ರೂಮ್ಗಳ ವಿವರಗಳನ್ನು ಹೊಂದಿರುವ ಡೇಟಾಸೆಟ್ ಬಳಸಿ ಅನ್ವೇಷಿಸೋಣ. ನೀವು ರುಚಿಕರವಾದ ದೃಶ್ಯೀಕರಣಗಳನ್ನು ಪ್ರಯೋಗಿಸುವಿರಿ, ಉದಾಹರಣೆಗೆ:
|
||||
|
||||
- ಪೈ ಚಾರ್ಟ್ಗಳು 🥧
|
||||
- ಡೋನಟ್ ಚಾರ್ಟ್ಗಳು 🍩
|
||||
- ವಾಫಲ್ ಚಾರ್ಟ್ಗಳು 🧇
|
||||
|
||||
> 💡 ಮೈಕ್ರೋಸಾಫ್ಟ್ ರಿಸರ್ಚ್ನಿಂದ [Charticulator](https://charticulator.com) ಎಂಬ ಬಹಳ ಆಸಕ್ತಿದಾಯಕ ಯೋಜನೆ ಉಚಿತ ಡ್ರ್ಯಾಗ್ ಮತ್ತು ಡ್ರಾಪ್ ಇಂಟರ್ಫೇಸ್ ಅನ್ನು ಡೇಟಾ ದೃಶ್ಯೀಕರಣಗಳಿಗೆ ನೀಡುತ್ತದೆ. ಅವರ ಟ್ಯುಟೋರಿಯಲ್ಗಳಲ್ಲಿ ಒಂದರಲ್ಲಿ ಅವರು ಈ ಮಶ್ರೂಮ್ ಡೇಟಾಸೆಟ್ ಅನ್ನು ಕೂಡ ಬಳಸುತ್ತಾರೆ! ಆದ್ದರಿಂದ ನೀವು ಡೇಟಾವನ್ನು ಅನ್ವೇಷಿಸಿ ಲೈಬ್ರರಿಯನ್ನು ಒಂದೇ ಸಮಯದಲ್ಲಿ ಕಲಿಯಬಹುದು: [Charticulator ಟ್ಯುಟೋರಿಯಲ್](https://charticulator.com/tutorials/tutorial4.html).
|
||||
|
||||
## [ಪೂರ್ವ-ಪಾಠ ಪ್ರಶ್ನೋತ್ತರ](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/20)
|
||||
|
||||
## ನಿಮ್ಮ ಮಶ್ರೂಮ್ಗಳನ್ನು ಪರಿಚಯಿಸಿಕೊಳ್ಳಿ 🍄
|
||||
|
||||
ಮಶ್ರೂಮ್ಗಳು ಬಹಳ ಆಸಕ್ತಿದಾಯಕವಾಗಿವೆ. ಅವುಗಳನ್ನು ಅಧ್ಯಯನ ಮಾಡಲು ಡೇಟಾಸೆಟ್ ಅನ್ನು ಆಮದು ಮಾಡೋಣ:
|
||||
|
||||
```r
|
||||
mushrooms = read.csv('../../data/mushrooms.csv')
|
||||
head(mushrooms)
|
||||
```
|
||||
ಒಂದು ಟೇಬಲ್ ವಿಶ್ಲೇಷಣೆಗೆ ಉತ್ತಮ ಡೇಟಾ ಜೊತೆಗೆ ಮುದ್ರಿತವಾಗಿದೆ:
|
||||
|
||||
|
||||
| ವರ್ಗ | ಕ್ಯಾಪ್-ಆಕಾರ | ಕ್ಯಾಪ್-ಮೇಲ್ಮೈ | ಕ್ಯಾಪ್-ಬಣ್ಣ | ಗಾಯಗಳು | ವಾಸನೆ | ಗಿಲ್-ಸಂಯೋಜನೆ | ಗಿಲ್-ಅಂತರ | ಗಿಲ್-ಗಾತ್ರ | ಗಿಲ್-ಬಣ್ಣ | ಸ್ಟಾಕ್-ಆಕಾರ | ಸ್ಟಾಕ್-ಮೂಲ | ಸ್ಟಾಕ್-ಮೇಲ್ಮೈ-ರಿಂಗ್ಮೇಲೆ | ಸ್ಟಾಕ್-ಮೇಲ್ಮೈ-ರಿಂಗ್ಕೆಳಗೆ | ಸ್ಟಾಕ್-ಬಣ್ಣ-ರಿಂಗ್ಮೇಲೆ | ಸ್ಟಾಕ್-ಬಣ್ಣ-ರಿಂಗ್ಕೆಳಗೆ | ವೀಲ್-ಪ್ರಕಾರ | ವೀಲ್-ಬಣ್ಣ | ರಿಂಗ್-ಸಂಖ್ಯೆ | ರಿಂಗ್-ಪ್ರಕಾರ | ಸ್ಪೋರ್-ಪ್ರಿಂಟ್-ಬಣ್ಣ | ಜನಸಂಖ್ಯೆ | ವಾಸಸ್ಥಳ |
|
||||
| --------- | --------- | ----------- | --------- | ------- | ------- | --------------- | ------------ | --------- | ---------- | ----------- | ---------- | ------------------------ | ------------------------ | ---------------------- | ---------------------- | --------- | ---------- | ----------- | --------- | ----------------- | ---------- | ------- |
|
||||
| ವಿಷಕಾರಿ | ಉಬ್ಬು | ಮೃದುವು | ಕಂದು | ಗಾಯಗಳು | ತೀವ್ರ | ಮುಕ್ತ | ಹತ್ತಿರ | ಸಣ್ಣ | ಕಪ್ಪು | ವಿಸ್ತಾರಗೊಳ್ಳುವ | ಸಮಾನ | ಮೃದುವು | ಮೃದುವು | ಬಿಳಿ | ಬಿಳಿ | ಭಾಗಶಃ | ಬಿಳಿ | ಒಂದು | ಲटकಿಸುವ | ಕಪ್ಪು | ಹರಡಿದ | ನಗರ |
|
||||
| ತಿನ್ನಬಹುದಾದ | ಉಬ್ಬು | ಮೃದುವು | ಹಳದಿ | ಗಾಯಗಳು | ಬಾದಾಮಿ | ಮುಕ್ತ | ಹತ್ತಿರ | ಅಗಲ | ಕಪ್ಪು | ವಿಸ್ತಾರಗೊಳ್ಳುವ | ಕ್ಲಬ್ | ಮೃದುವು | ಮೃದುವು | ಬಿಳಿ | ಬಿಳಿ | ಭಾಗಶಃ | ಬಿಳಿ | ಒಂದು | ಲटकಿಸುವ | ಕಂದು | ಬಹಳ | ಹುಲ್ಲುಗಳು |
|
||||
| ತಿನ್ನಬಹುದಾದ | ಘಂಟೆ | ಮೃದುವು | ಬಿಳಿ | ಗಾಯಗಳು | ಅನೀಸ್ | ಮುಕ್ತ | ಹತ್ತಿರ | ಅಗಲ | ಕಂದು | ವಿಸ್ತಾರಗೊಳ್ಳುವ | ಕ್ಲಬ್ | ಮೃದುವು | ಮೃದುವು | ಬಿಳಿ | ಬಿಳಿ | ಭಾಗಶಃ | ಬಿಳಿ | ಒಂದು | ಲटकಿಸುವ | ಕಂದು | ಬಹಳ | ಮೇದಾನಗಳು |
|
||||
| ವಿಷಕಾರಿ | ಉಬ್ಬು | ತೊಗರಿ | ಬಿಳಿ | ಗಾಯಗಳು | ತೀವ್ರ | ಮುಕ್ತ | ಹತ್ತಿರ | ಸಣ್ಣ | ಕಂದು | ವಿಸ್ತಾರಗೊಳ್ಳುವ | ಸಮಾನ | ಮೃದುವು | ಮೃದುವು | ಬಿಳಿ | ಬಿಳಿ | ಭಾಗಶಃ | ಬಿಳಿ | ಒಂದು | ಲटकಿಸುವ | ಕಪ್ಪು | ಹರಡಿದ | ನಗರ
|
||||
| ತಿನ್ನಬಹುದಾದ | ಉಬ್ಬು | ಮೃದುವು | ಹಸಿರು | ಗಾಯಗಳಿಲ್ಲ| ಇಲ್ಲ | ಮುಕ್ತ | ತುಂಬಿದ | ಅಗಲ | ಕಪ್ಪು | ಸಣ್ಣಗೊಳ್ಳುವ | ಸಮಾನ | ಮೃದುವು | ಮೃದುವು | ಬಿಳಿ | ಬಿಳಿ | ಭಾಗಶಃ | ಬಿಳಿ | ಒಂದು | ಅಸ್ತಮಿಸುವ | ಕಂದು | ಬಹಳ | ಹುಲ್ಲುಗಳು
|
||||
| ತಿನ್ನಬಹುದಾದ | ಉಬ್ಬು | ತೊಗರಿ | ಹಳದಿ | ಗಾಯಗಳು | ಬಾದಾಮಿ | ಮುಕ್ತ | ಹತ್ತಿರ | ಅಗಲ | ಕಂದು | ವಿಸ್ತಾರಗೊಳ್ಳುವ | ಕ್ಲಬ್ | ಮೃದುವು | ಮೃದುವು | ಬಿಳಿ | ಬಿಳಿ | ಭಾಗಶಃ | ಬಿಳಿ | ಒಂದು | ಲटकಿಸುವ | ಕಪ್ಪು | ಬಹಳ | ಹುಲ್ಲುಗಳು
|
||||
|
||||
ತಕ್ಷಣವೇ, ನೀವು ಗಮನಿಸುತ್ತೀರಿ ಎಲ್ಲಾ ಡೇಟಾ ಪಠ್ಯರೂಪದಲ್ಲಿದೆ. ನೀವು ಈ ಡೇಟಾವನ್ನು ಚಾರ್ಟ್ನಲ್ಲಿ ಬಳಸಲು ಪರಿವರ್ತಿಸಬೇಕಾಗುತ್ತದೆ. ಬಹುತೇಕ ಡೇಟಾ ವಾಸ್ತವವಾಗಿ ಒಂದು ವಸ್ತುವಾಗಿ ಪ್ರತಿನಿಧಿಸಲಾಗಿದೆ:
|
||||
|
||||
```r
|
||||
names(mushrooms)
|
||||
```
|
||||
|
||||
ಫಲಿತಾಂಶ:
|
||||
|
||||
```output
|
||||
[1] "class" "cap.shape"
|
||||
[3] "cap.surface" "cap.color"
|
||||
[5] "bruises" "odor"
|
||||
[7] "gill.attachment" "gill.spacing"
|
||||
[9] "gill.size" "gill.color"
|
||||
[11] "stalk.shape" "stalk.root"
|
||||
[13] "stalk.surface.above.ring" "stalk.surface.below.ring"
|
||||
[15] "stalk.color.above.ring" "stalk.color.below.ring"
|
||||
[17] "veil.type" "veil.color"
|
||||
[19] "ring.number" "ring.type"
|
||||
[21] "spore.print.color" "population"
|
||||
[23] "habitat"
|
||||
```
|
||||
ಈ ಡೇಟಾವನ್ನು ತೆಗೆದುಕೊಂಡು 'class' ಕಾಲಮ್ ಅನ್ನು ವರ್ಗವಾಗಿ ಪರಿವರ್ತಿಸಿ:
|
||||
|
||||
```r
|
||||
library(dplyr)
|
||||
grouped=mushrooms %>%
|
||||
group_by(class) %>%
|
||||
summarise(count=n())
|
||||
```
|
||||
|
||||
|
||||
ಈಗ, ನೀವು ಮಶ್ರೂಮ್ ಡೇಟಾವನ್ನು ಮುದ್ರಿಸಿದರೆ, ಅದು ವಿಷಕಾರಿ/ತಿನ್ನಬಹುದಾದ ವರ್ಗಗಳ ಪ್ರಕಾರ ವರ್ಗೀಕೃತವಾಗಿದೆ ಎಂದು ಕಾಣಬಹುದು:
|
||||
```r
|
||||
View(grouped)
|
||||
```
|
||||
|
||||
|
||||
| ವರ್ಗ | ಎಣಿಕೆ |
|
||||
| --------- | --------- |
|
||||
| ತಿನ್ನಬಹುದಾದ | 4208 |
|
||||
| ವಿಷಕಾರಿ | 3916 |
|
||||
|
||||
|
||||
|
||||
ನೀವು ಈ ಟೇಬಲ್ನಲ್ಲಿ ನೀಡಲಾದ ಕ್ರಮವನ್ನು ಅನುಸರಿಸಿ ನಿಮ್ಮ ವರ್ಗದ ಲೇಬಲ್ಗಳನ್ನು ರಚಿಸಿದರೆ, ನೀವು ಪೈ ಚಾರ್ಟ್ ರಚಿಸಬಹುದು.
|
||||
|
||||
## ಪೈ!
|
||||
|
||||
```r
|
||||
pie(grouped$count,grouped$class, main="Edible?")
|
||||
```
|
||||
ಇದು, ಈ ಡೇಟಾದ ಪ್ರಮಾಣಗಳನ್ನು ಈ ಎರಡು ಮಶ್ರೂಮ್ ವರ್ಗಗಳ ಪ್ರಕಾರ ತೋರಿಸುವ ಪೈ ಚಾರ್ಟ್. ಲೇಬಲ್ಗಳ ಕ್ರಮವನ್ನು ಸರಿಯಾಗಿ ಪಡೆಯುವುದು ಬಹಳ ಮುಖ್ಯ, ವಿಶೇಷವಾಗಿ ಇಲ್ಲಿ, ಆದ್ದರಿಂದ ಲೇಬಲ್ ಅರೆ ಅನ್ನು ರಚಿಸುವ ಕ್ರಮವನ್ನು ಖಚಿತಪಡಿಸಿಕೊಳ್ಳಿ!
|
||||
|
||||

|
||||
|
||||
## ಡೋನಟ್ಸ್!
|
||||
|
||||
ಒಂದು ಸ್ವಲ್ಪ ಹೆಚ್ಚು ದೃಶ್ಯಾತ್ಮಕವಾಗಿ ಆಸಕ್ತಿದಾಯಕ ಪೈ ಚಾರ್ಟ್ ಡೋನಟ್ ಚಾರ್ಟ್ ಆಗಿದೆ, ಇದು ಮಧ್ಯದಲ್ಲಿ ರಂಧ್ರವಿರುವ ಪೈ ಚಾರ್ಟ್. ಈ ವಿಧಾನವನ್ನು ಬಳಸಿ ನಮ್ಮ ಡೇಟಾವನ್ನು ನೋಡೋಣ.
|
||||
|
||||
ಮಶ್ರೂಮ್ ಬೆಳೆಯುವ ವಿವಿಧ ವಾಸಸ್ಥಳಗಳನ್ನು ನೋಡಿ:
|
||||
|
||||
```r
|
||||
library(dplyr)
|
||||
habitat=mushrooms %>%
|
||||
group_by(habitat) %>%
|
||||
summarise(count=n())
|
||||
View(habitat)
|
||||
```
|
||||
ಫಲಿತಾಂಶ:
|
||||
| ವಾಸಸ್ಥಳ | ಎಣಿಕೆ |
|
||||
| --------- | --------- |
|
||||
| ಹುಲ್ಲುಗಳು | 2148 |
|
||||
| ಎಲೆಗಳು | 832 |
|
||||
| ಮೇದಾನಗಳು | 292 |
|
||||
| ದಾರಿಗಳು | 1144 |
|
||||
| ನಗರ | 368 |
|
||||
| ತ್ಯಾಜ್ಯ | 192 |
|
||||
| ಮರ | 3148 |
|
||||
|
||||
|
||||
ಇಲ್ಲಿ, ನೀವು ನಿಮ್ಮ ಡೇಟಾವನ್ನು ವಾಸಸ್ಥಳದ ಪ್ರಕಾರ ಗುಂಪುಮಾಡುತ್ತಿದ್ದೀರಿ. 7 ವಾಸಸ್ಥಳಗಳಿವೆ, ಅವುಗಳನ್ನು ನಿಮ್ಮ ಡೋನಟ್ ಚಾರ್ಟ್ ಲೇಬಲ್ಗಾಗಿ ಬಳಸಿ:
|
||||
|
||||
```r
|
||||
library(ggplot2)
|
||||
library(webr)
|
||||
PieDonut(habitat, aes(habitat, count=count))
|
||||
```
|
||||
|
||||

|
||||
|
||||
ಈ ಕೋಡ್ ಎರಡು ಲೈಬ್ರರಿಗಳನ್ನು ಬಳಸುತ್ತದೆ - ggplot2 ಮತ್ತು webr. webr ಲೈಬ್ರರಿಯ PieDonut ಫಂಕ್ಷನ್ ಬಳಸಿ, ನಾವು ಸುಲಭವಾಗಿ ಡೋನಟ್ ಚಾರ್ಟ್ ರಚಿಸಬಹುದು!
|
||||
|
||||
R ನಲ್ಲಿ ಡೋನಟ್ ಚಾರ್ಟ್ಗಳನ್ನು ಕೇವಲ ggplot2 ಲೈಬ್ರರಿಯೊಂದಿಗೆ ಕೂಡ ಮಾಡಬಹುದು. ನೀವು ಅದನ್ನು [ಇಲ್ಲಿ](https://www.r-graph-gallery.com/128-ring-or-donut-plot.html) ಹೆಚ್ಚು ತಿಳಿದುಕೊಳ್ಳಬಹುದು ಮತ್ತು ಸ್ವತಃ ಪ್ರಯತ್ನಿಸಬಹುದು.
|
||||
|
||||
ನೀವು ಈಗ ನಿಮ್ಮ ಡೇಟಾವನ್ನು ಗುಂಪುಮಾಡುವುದು ಮತ್ತು ಅದನ್ನು ಪೈ ಅಥವಾ ಡೋನಟ್ ಆಗಿ ಪ್ರದರ್ಶಿಸುವುದನ್ನು ತಿಳಿದಿದ್ದೀರಿ, ನೀವು ಇತರ ಚಾರ್ಟ್ ಪ್ರಕಾರಗಳನ್ನು ಅನ್ವೇಷಿಸಬಹುದು. ವಾಫಲ್ ಚಾರ್ಟ್ ಅನ್ನು ಪ್ರಯತ್ನಿಸಿ, ಇದು ಪ್ರಮಾಣವನ್ನು ಅನ್ವೇಷಿಸುವ ಬೇರೆ ವಿಧಾನ.
|
||||
|
||||
## ವಾಫಲ್ಸ್!
|
||||
|
||||
'ವಾಫಲ್' ಪ್ರಕಾರದ ಚಾರ್ಟ್ ಒಂದು 2D ಚದರಗಳ ಸರಣಿಯಾಗಿ ಪ್ರಮಾಣಗಳನ್ನು ದೃಶ್ಯೀಕರಿಸುವ ಬೇರೆ ವಿಧಾನ. ಈ ಡೇಟಾಸೆಟ್ನ ಮಶ್ರೂಮ್ ಕ್ಯಾಪ್ ಬಣ್ಣಗಳ ವಿಭಿನ್ನ ಪ್ರಮಾಣಗಳನ್ನು ದೃಶ್ಯೀಕರಿಸಲು ಪ್ರಯತ್ನಿಸಿ. ಇದಕ್ಕಾಗಿ, ನೀವು [waffle](https://cran.r-project.org/web/packages/waffle/waffle.pdf) ಎಂಬ ಸಹಾಯಕ ಲೈಬ್ರರಿಯನ್ನು ಸ್ಥಾಪಿಸಿ ಅದನ್ನು ಬಳಸಿ ನಿಮ್ಮ ದೃಶ್ಯೀಕರಣವನ್ನು ರಚಿಸಬೇಕು:
|
||||
|
||||
```r
|
||||
install.packages("waffle", repos = "https://cinc.rud.is")
|
||||
```
|
||||
|
||||
ನಿಮ್ಮ ಡೇಟಾದ ಒಂದು ವಿಭಾಗವನ್ನು ಗುಂಪುಮಾಡಿ:
|
||||
|
||||
```r
|
||||
library(dplyr)
|
||||
cap_color=mushrooms %>%
|
||||
group_by(cap.color) %>%
|
||||
summarise(count=n())
|
||||
View(cap_color)
|
||||
```
|
||||
|
||||
ಲೇಬಲ್ಗಳನ್ನು ರಚಿಸಿ ನಂತರ ನಿಮ್ಮ ಡೇಟಾವನ್ನು ಗುಂಪುಮಾಡಿ ವಾಫಲ್ ಚಾರ್ಟ್ ರಚಿಸಿ:
|
||||
|
||||
```r
|
||||
library(waffle)
|
||||
names(cap_color$count) = paste0(cap_color$cap.color)
|
||||
waffle((cap_color$count/10), rows = 7, title = "Waffle Chart")+scale_fill_manual(values=c("brown", "#F0DC82", "#D2691E", "green",
|
||||
"pink", "purple", "red", "grey",
|
||||
"yellow","white"))
|
||||
```
|
||||
|
||||
ವಾಫಲ್ ಚಾರ್ಟ್ ಬಳಸಿ, ನೀವು ಈ ಮಶ್ರೂಮ್ ಡೇಟಾಸೆಟ್ನ ಕ್ಯಾಪ್ ಬಣ್ಣಗಳ ಪ್ರಮಾಣಗಳನ್ನು ಸ್ಪಷ್ಟವಾಗಿ ನೋಡಬಹುದು. ಆಸಕ್ತಿದಾಯಕವಾಗಿ, ಹಸಿರು ಕ್ಯಾಪ್ ಇರುವ ಮಶ್ರೂಮ್ಗಳು ಬಹಳಿವೆ!
|
||||
|
||||

|
||||
|
||||
ಈ ಪಾಠದಲ್ಲಿ, ನೀವು ಪ್ರಮಾಣಗಳನ್ನು ದೃಶ್ಯೀಕರಿಸುವ ಮೂರು ವಿಧಾನಗಳನ್ನು ಕಲಿತಿರಿ. ಮೊದಲು, ನಿಮ್ಮ ಡೇಟಾವನ್ನು ವರ್ಗಗಳಾಗಿ ಗುಂಪುಮಾಡಬೇಕು ಮತ್ತು ನಂತರ ಡೇಟಾವನ್ನು ಪ್ರದರ್ಶಿಸುವ ಅತ್ಯುತ್ತಮ ವಿಧಾನವನ್ನು ನಿರ್ಧರಿಸಬೇಕು - ಪೈ, ಡೋನಟ್ ಅಥವಾ ವಾಫಲ್. ಎಲ್ಲವೂ ರುಚಿಕರವಾಗಿವೆ ಮತ್ತು ಬಳಕೆದಾರರಿಗೆ ಡೇಟಾಸೆಟ್ನ ತಕ್ಷಣದ ದೃಶ್ಯವನ್ನು ನೀಡುತ್ತವೆ.
|
||||
|
||||
## 🚀 ಸವಾಲು
|
||||
|
||||
ಈ ರುಚಿಕರ ಚಾರ್ಟ್ಗಳನ್ನು [Charticulator](https://charticulator.com) ನಲ್ಲಿ ಪುನರಾವರ್ತಿಸಿ.
|
||||
|
||||
## [ಪೋಸ್ಟ್-ಪಾಠ ಪ್ರಶ್ನೋತ್ತರ](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/21)
|
||||
|
||||
## ವಿಮರ್ಶೆ ಮತ್ತು ಸ್ವಯಂ ಅಧ್ಯಯನ
|
||||
|
||||
ಯಾವಾಗ ಪೈ, ಡೋನಟ್ ಅಥವಾ ವಾಫಲ್ ಚಾರ್ಟ್ ಬಳಸಬೇಕೆಂದು ಸ್ಪಷ್ಟವಾಗದಿದ್ದಾಗ ಕೆಲವೊಂದು ಲೇಖನಗಳನ್ನು ಓದಿ:
|
||||
|
||||
https://www.beautiful.ai/blog/battle-of-the-charts-pie-chart-vs-donut-chart
|
||||
|
||||
https://medium.com/@hypsypops/pie-chart-vs-donut-chart-showdown-in-the-ring-5d24fd86a9ce
|
||||
|
||||
https://www.mit.edu/~mbarker/formula1/f1help/11-ch-c6.htm
|
||||
|
||||
https://medium.datadriveninvestor.com/data-visualization-done-the-right-way-with-tableau-waffle-chart-fdf2a19be402
|
||||
|
||||
ಈ ಸಂಕೀರ್ಣ ನಿರ್ಧಾರ ಕುರಿತು ಹೆಚ್ಚಿನ ಮಾಹಿತಿಗಾಗಿ ಸಂಶೋಧನೆ ಮಾಡಿ.
|
||||
|
||||
## ನಿಯೋಜನೆ
|
||||
|
||||
[Excel ನಲ್ಲಿ ಪ್ರಯತ್ನಿಸಿ](assignment.md)
|
||||
|
||||
---
|
||||
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
|
||||
**ಅಸ್ವೀಕರಣ**:
|
||||
ಈ ದಸ್ತಾವೇಜು AI ಅನುವಾದ ಸೇವೆ [Co-op Translator](https://github.com/Azure/co-op-translator) ಬಳಸಿ ಅನುವಾದಿಸಲಾಗಿದೆ. ನಾವು ನಿಖರತೆಯಿಗಾಗಿ ಪ್ರಯತ್ನಿಸುತ್ತಿದ್ದರೂ, ಸ್ವಯಂಚಾಲಿತ ಅನುವಾದಗಳಲ್ಲಿ ದೋಷಗಳು ಅಥವಾ ತಪ್ಪುಗಳು ಇರಬಹುದು ಎಂಬುದನ್ನು ದಯವಿಟ್ಟು ಗಮನಿಸಿ. ಮೂಲ ಭಾಷೆಯಲ್ಲಿರುವ ಮೂಲ ದಸ್ತಾವೇಜನ್ನು ಅಧಿಕೃತ ಮೂಲವೆಂದು ಪರಿಗಣಿಸಬೇಕು. ಮಹತ್ವದ ಮಾಹಿತಿಗಾಗಿ ವೃತ್ತಿಪರ ಮಾನವ ಅನುವಾದವನ್ನು ಶಿಫಾರಸು ಮಾಡಲಾಗುತ್ತದೆ. ಈ ಅನುವಾದ ಬಳಕೆಯಿಂದ ಉಂಟಾಗುವ ಯಾವುದೇ ತಪ್ಪು ಅರ್ಥಮಾಡಿಕೊಳ್ಳುವಿಕೆ ಅಥವಾ ತಪ್ಪು ವಿವರಣೆಗಳಿಗೆ ನಾವು ಹೊಣೆಗಾರರಾಗುವುದಿಲ್ಲ.
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER END -->
|
||||
@ -0,0 +1,179 @@
|
||||
<!--
|
||||
CO_OP_TRANSLATOR_METADATA:
|
||||
{
|
||||
"original_hash": "a33c5d4b4156a2b41788d8720b6f724c",
|
||||
"translation_date": "2025-12-19T16:25:43+00:00",
|
||||
"source_file": "3-Data-Visualization/R/12-visualization-relationships/README.md",
|
||||
"language_code": "kn"
|
||||
}
|
||||
-->
|
||||
# ಸಂಬಂಧಗಳನ್ನು ದೃಶ್ಯೀಕರಿಸುವುದು: ಜೇನುತುಪ್ಪ ಬಗ್ಗೆ ಎಲ್ಲವೂ 🍯
|
||||
|
||||
| ಅವರ ಸ್ಕೆಚ್ ನೋಟ್ ](../../../sketchnotes/12-Visualizing-Relationships.png)|
|
||||
|:---:|
|
||||
|ಸಂಬಂಧಗಳನ್ನು ದೃಶ್ಯೀಕರಿಸುವುದು - _[@nitya](https://twitter.com/nitya) ಅವರ ಸ್ಕೆಚ್ ನೋಟ್_ |
|
||||
|
||||
ನಮ್ಮ ಸಂಶೋಧನೆಯ ಪ್ರಕೃತಿ ಕೇಂದ್ರೀಕೃತ ವಿಷಯವನ್ನು ಮುಂದುವರೆಸುತ್ತಾ, [ಯುನೈಟೆಡ್ ಸ್ಟೇಟ್ಸ್ ಡಿಪಾರ್ಟ್ಮೆಂಟ್ ಆಫ್ ಅಗ್ರಿಕಲ್ಚರ್](https://www.nass.usda.gov/About_NASS/index.php) ನಿಂದ ಪಡೆದ ಡೇಟಾಸೆಟ್ ಪ್ರಕಾರ ವಿವಿಧ ರೀತಿಯ ಜೇನುತುಪ್ಪಗಳ ನಡುವಿನ ಸಂಬಂಧಗಳನ್ನು ತೋರಿಸಲು ಆಸಕ್ತಿದಾಯಕ ದೃಶ್ಯೀಕರಣಗಳನ್ನು ಕಂಡುಹಿಡಿಯೋಣ.
|
||||
|
||||
ಈ ಸುಮಾರು 600 ಐಟಂಗಳ ಡೇಟಾಸೆಟ್ ಅಮೆರಿಕದ ಹಲವಾರು ರಾಜ್ಯಗಳಲ್ಲಿ ಜೇನುತುಪ್ಪ ಉತ್ಪಾದನೆಯನ್ನು ಪ್ರದರ್ಶಿಸುತ್ತದೆ. ಉದಾಹರಣೆಗೆ, ನೀವು ಪ್ರತಿ ರಾಜ್ಯದಲ್ಲಿ 1998-2012 ರವರೆಗೆ ಪ್ರತಿ ವರ್ಷಕ್ಕೆ ಒಂದು ಸಾಲಿನಲ್ಲಿ ಕಾಲೋನಿಗಳ ಸಂಖ್ಯೆ, ಪ್ರತಿ ಕಾಲೋನಿಗೆ ಉತ್ಪಾದನೆ, ಒಟ್ಟು ಉತ್ಪಾದನೆ, ಸ್ಟಾಕ್ಗಳು, ಪೌಂಡ್ ಪ್ರತಿ ಬೆಲೆ ಮತ್ತು ಉತ್ಪಾದನೆಯ ಮೌಲ್ಯವನ್ನು ನೋಡಬಹುದು.
|
||||
|
||||
ನೀವು ಒಂದು ರಾಜ್ಯದ ಪ್ರತಿ ವರ್ಷದ ಉತ್ಪಾದನೆ ಮತ್ತು ಉದಾಹರಣೆಗೆ ಆ ರಾಜ್ಯದಲ್ಲಿ ಜೇನುತುಪ್ಪದ ಬೆಲೆಯ ನಡುವಿನ ಸಂಬಂಧವನ್ನು ದೃಶ್ಯೀಕರಿಸುವುದು ಆಸಕ್ತಿದಾಯಕವಾಗಿರುತ್ತದೆ. ಬದಲಾಗಿ, ರಾಜ್ಯಗಳ ಜೇನುತುಪ್ಪದ ಪ್ರತಿ ಕಾಲೋನಿಗೆ ಉತ್ಪಾದನೆಯ ನಡುವಿನ ಸಂಬಂಧವನ್ನು ದೃಶ್ಯೀಕರಿಸಬಹುದು. ಈ ವರ್ಷಾವಧಿ 2006 ರಲ್ಲಿ ಮೊದಲ ಬಾರಿಗೆ ಕಂಡುಬಂದ 'CCD' ಅಥವಾ 'ಕಾಲೋನಿ ಕಾಲಾಪ್ಸ್ ಡಿಸಾರ್ಡರ್' (http://npic.orst.edu/envir/ccd.html) ನಾಶಕಾರಿ ಪರಿಣಾಮಗಳನ್ನು ಒಳಗೊಂಡಿದೆ, ಆದ್ದರಿಂದ ಇದು ಅಧ್ಯಯನಕ್ಕೆ ಸೂಕ್ತವಾದ ಡೇಟಾಸೆಟ್ ಆಗಿದೆ. 🐝
|
||||
|
||||
## [ಪೂರ್ವ-ಪಾಠ ಪ್ರಶ್ನೋತ್ತರ](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/22)
|
||||
|
||||
ಈ ಪಾಠದಲ್ಲಿ, ನೀವು ಹಿಂದಿನಂತೆ ಬಳಸಿದ ggplot2 ಅನ್ನು ವ್ಯತ್ಯಾಸಗಳ ನಡುವಿನ ಸಂಬಂಧಗಳನ್ನು ದೃಶ್ಯೀಕರಿಸಲು ಉತ್ತಮ ಗ್ರಂಥಾಲಯವಾಗಿ ಬಳಸಬಹುದು. ವಿಶೇಷವಾಗಿ ggplot2 ನ `geom_point` ಮತ್ತು `qplot` ಫಂಕ್ಷನ್ಗಳ ಬಳಕೆ ಆಸಕ್ತಿದಾಯಕವಾಗಿದೆ, ಇದು ಸ್ಕ್ಯಾಟರ್ ಪ್ಲಾಟ್ಗಳು ಮತ್ತು ಲೈನ್ ಪ್ಲಾಟ್ಗಳನ್ನು ತ್ವರಿತವಾಗಿ ದೃಶ್ಯೀಕರಿಸಲು ಅನುಮತಿಸುತ್ತದೆ, ಇದು ಡೇಟಾ ವಿಜ್ಞಾನಿಗೆ ವ್ಯತ್ಯಾಸಗಳು ಪರಸ್ಪರ ಹೇಗೆ ಸಂಬಂಧ ಹೊಂದಿವೆ ಎಂಬುದನ್ನು ಉತ್ತಮವಾಗಿ ಅರ್ಥಮಾಡಿಕೊಳ್ಳಲು ಸಹಾಯ ಮಾಡುತ್ತದೆ.
|
||||
|
||||
## ಸ್ಕ್ಯಾಟರ್ ಪ್ಲಾಟ್ಗಳು
|
||||
|
||||
ಪ್ರತಿ ರಾಜ್ಯದ ಪ್ರತಿ ವರ್ಷದ ಜೇನುತುಪ್ಪದ ಬೆಲೆ ಹೇಗೆ ಬದಲಾಗಿದೆ ಎಂಬುದನ್ನು ತೋರಿಸಲು ಸ್ಕ್ಯಾಟರ್ ಪ್ಲಾಟ್ ಬಳಸಿ. ggplot2, `ggplot` ಮತ್ತು `geom_point` ಬಳಸಿ, ರಾಜ್ಯದ ಡೇಟಾವನ್ನು ಗುಂಪುಮಾಡಿ ವರ್ಗೀಕೃತ ಮತ್ತು ಸಂಖ್ಯಾತ್ಮಕ ಡೇಟಾ ಎರಡಕ್ಕೂ ಡೇಟಾ ಪಾಯಿಂಟ್ಗಳನ್ನು ಪ್ರದರ್ಶಿಸುತ್ತದೆ.
|
||||
|
||||
ಡೇಟಾ ಮತ್ತು Seaborn ಅನ್ನು ಆಮದುಮಾಡುವುದರಿಂದ ಪ್ರಾರಂಭಿಸೋಣ:
|
||||
|
||||
```r
|
||||
honey=read.csv('../../data/honey.csv')
|
||||
head(honey)
|
||||
```
|
||||
ನೀವು ಗಮನಿಸುವಿರಿ ಜೇನುತುಪ್ಪ ಡೇಟಾದಲ್ಲಿ ವರ್ಷ ಮತ್ತು ಪೌಂಡ್ ಪ್ರತಿ ಬೆಲೆ ಸೇರಿದಂತೆ ಹಲವಾರು ಆಸಕ್ತಿದಾಯಕ ಕಾಲಮ್ಗಳಿವೆ. ಅಮೆರಿಕದ ರಾಜ್ಯಗಳ ಪ್ರಕಾರ ಈ ಡೇಟಾವನ್ನು ಗುಂಪುಮಾಡಿ ಅನ್ವೇಷಿಸೋಣ:
|
||||
|
||||
| state | numcol | yieldpercol | totalprod | stocks | priceperlb | prodvalue | year |
|
||||
| ----- | ------ | ----------- | --------- | -------- | ---------- | --------- | ---- |
|
||||
| AL | 16000 | 71 | 1136000 | 159000 | 0.72 | 818000 | 1998 |
|
||||
| AZ | 55000 | 60 | 3300000 | 1485000 | 0.64 | 2112000 | 1998 |
|
||||
| AR | 53000 | 65 | 3445000 | 1688000 | 0.59 | 2033000 | 1998 |
|
||||
| CA | 450000 | 83 | 37350000 | 12326000 | 0.62 | 23157000 | 1998 |
|
||||
| CO | 27000 | 72 | 1944000 | 1594000 | 0.7 | 1361000 | 1998 |
|
||||
| FL | 230000 | 98 |22540000 | 4508000 | 0.64 | 14426000 | 1998 |
|
||||
|
||||
ಜೇನುತುಪ್ಪದ ಪೌಂಡ್ ಪ್ರತಿ ಬೆಲೆ ಮತ್ತು ಅದರ ಅಮೆರಿಕದ ರಾಜ್ಯದ ಮೂಲದ ನಡುವಿನ ಸಂಬಂಧವನ್ನು ತೋರಿಸಲು ಮೂಲಭೂತ ಸ್ಕ್ಯಾಟರ್ ಪ್ಲಾಟ್ ರಚಿಸಿ. ಎಲ್ಲಾ ರಾಜ್ಯಗಳನ್ನು ಪ್ರದರ್ಶಿಸಲು `y` ಅಕ್ಷವನ್ನು ಎತ್ತರವಾಗಿ ಮಾಡಿ:
|
||||
|
||||
```r
|
||||
library(ggplot2)
|
||||
ggplot(honey, aes(x = priceperlb, y = state)) +
|
||||
geom_point(colour = "blue")
|
||||
```
|
||||

|
||||
|
||||
ಈಗ, ವರ್ಷಗಳ ಪ್ರಗತಿಯನ್ನು ತೋರಿಸಲು ಜೇನುತುಪ್ಪ ಬಣ್ಣದ ಸ್ಕೀಮ್ ಬಳಸಿ ಅದೇ ಡೇಟಾವನ್ನು ತೋರಿಸಿ. ವರ್ಷದಿಂದ ವರ್ಷಕ್ಕೆ ಬದಲಾವಣೆಯನ್ನು ತೋರಿಸಲು 'scale_color_gradientn' ಪರಿಮಾಣವನ್ನು ಸೇರಿಸಬಹುದು:
|
||||
|
||||
> ✅ [scale_color_gradientn](https://www.rdocumentation.org/packages/ggplot2/versions/0.9.1/topics/scale_colour_gradientn) ಬಗ್ಗೆ ಇನ್ನಷ್ಟು ತಿಳಿದುಕೊಳ್ಳಿ - ಸುಂದರವಾದ ರೇನ್ಬೋ ಬಣ್ಣದ ಸ್ಕೀಮ್ ಪ್ರಯತ್ನಿಸಿ!
|
||||
|
||||
```r
|
||||
ggplot(honey, aes(x = priceperlb, y = state, color=year)) +
|
||||
geom_point()+scale_color_gradientn(colours = colorspace::heat_hcl(7))
|
||||
```
|
||||

|
||||
|
||||
ಈ ಬಣ್ಣದ ಸ್ಕೀಮ್ ಬದಲಾವಣೆಯಿಂದ, ಜೇನುತುಪ್ಪದ ಪೌಂಡ್ ಪ್ರತಿ ಬೆಲೆಯು ವರ್ಷದಿಂದ ವರ್ಷಕ್ಕೆ ಸ್ಪಷ್ಟವಾಗಿ ಹೆಚ್ಚುತ್ತಿರುವುದು ಕಾಣುತ್ತದೆ. ನಿಜವಾಗಿಯೂ, ಡೇಟಾದ ಒಂದು ಮಾದರಿ ಸೆಟ್ (ಉದಾಹರಣೆಗೆ ಅರೆಜೋನಾದ ಒಂದು ರಾಜ್ಯ) ನೋಡಿದರೆ, ವರ್ಷದಿಂದ ವರ್ಷಕ್ಕೆ ಬೆಲೆ ಏರಿಕೆಯ ಮಾದರಿಯನ್ನು ಕಾಣಬಹುದು, ಕೆಲವೊಂದು ಹೊರತುಪಡಿಸಿ:
|
||||
|
||||
| state | numcol | yieldpercol | totalprod | stocks | priceperlb | prodvalue | year |
|
||||
| ----- | ------ | ----------- | --------- | ------- | ---------- | --------- | ---- |
|
||||
| AZ | 55000 | 60 | 3300000 | 1485000 | 0.64 | 2112000 | 1998 |
|
||||
| AZ | 52000 | 62 | 3224000 | 1548000 | 0.62 | 1999000 | 1999 |
|
||||
| AZ | 40000 | 59 | 2360000 | 1322000 | 0.73 | 1723000 | 2000 |
|
||||
| AZ | 43000 | 59 | 2537000 | 1142000 | 0.72 | 1827000 | 2001 |
|
||||
| AZ | 38000 | 63 | 2394000 | 1197000 | 1.08 | 2586000 | 2002 |
|
||||
| AZ | 35000 | 72 | 2520000 | 983000 | 1.34 | 3377000 | 2003 |
|
||||
| AZ | 32000 | 55 | 1760000 | 774000 | 1.11 | 1954000 | 2004 |
|
||||
| AZ | 36000 | 50 | 1800000 | 720000 | 1.04 | 1872000 | 2005 |
|
||||
| AZ | 30000 | 65 | 1950000 | 839000 | 0.91 | 1775000 | 2006 |
|
||||
| AZ | 30000 | 64 | 1920000 | 902000 | 1.26 | 2419000 | 2007 |
|
||||
| AZ | 25000 | 64 | 1600000 | 336000 | 1.26 | 2016000 | 2008 |
|
||||
| AZ | 20000 | 52 | 1040000 | 562000 | 1.45 | 1508000 | 2009 |
|
||||
| AZ | 24000 | 77 | 1848000 | 665000 | 1.52 | 2809000 | 2010 |
|
||||
| AZ | 23000 | 53 | 1219000 | 427000 | 1.55 | 1889000 | 2011 |
|
||||
| AZ | 22000 | 46 | 1012000 | 253000 | 1.79 | 1811000 | 2012 |
|
||||
|
||||
ಬಣ್ಣದ ಬದಲು ಗಾತ್ರವನ್ನು ಬಳಸಿ ಈ ಪ್ರಗತಿಯನ್ನು ದೃಶ್ಯೀಕರಿಸುವ ಮತ್ತೊಂದು ವಿಧಾನ ಇದೆ. ಬಣ್ಣದ ದೃಷ್ಟಿ ಸಮಸ್ಯೆ ಇರುವ ಬಳಕೆದಾರರಿಗೆ ಇದು ಉತ್ತಮ ಆಯ್ಕೆಯಾಗಬಹುದು. ಬೆಲೆಯ ಏರಿಕೆಯನ್ನು ಬಿಂದುಗಳ ವೃತ್ತಾಕಾರದ ವಿಸ್ತಾರದಲ್ಲಿ ತೋರಿಸಲು ನಿಮ್ಮ ದೃಶ್ಯೀಕರಣವನ್ನು ಸಂಪಾದಿಸಿ:
|
||||
|
||||
```r
|
||||
ggplot(honey, aes(x = priceperlb, y = state)) +
|
||||
geom_point(aes(size = year),colour = "blue") +
|
||||
scale_size_continuous(range = c(0.25, 3))
|
||||
```
|
||||
ನೀವು ಬಿಂದುಗಳ ಗಾತ್ರ ಕ್ರಮೇಣ ಹೆಚ್ಚುತ್ತಿರುವುದನ್ನು ಕಾಣಬಹುದು.
|
||||
|
||||

|
||||
|
||||
ಇದು ಸರಳ ಸರಬರಾಜು ಮತ್ತು ಬೇಡಿಕೆ ಪ್ರಕರಣವೇ? ಹವಾಮಾನ ಬದಲಾವಣೆ ಮತ್ತು ಕಾಲೋನಿ ಕಾಲಾಪ್ಸ್ ಮುಂತಾದ ಕಾರಣಗಳಿಂದ, ವರ್ಷದಿಂದ ವರ್ಷಕ್ಕೆ ಖರೀದಿಗೆ ಲಭ್ಯವಿರುವ ಜೇನುತುಪ್ಪ ಕಡಿಮೆಯಾಗುತ್ತಿದೆಯೇ, ಆದ್ದರಿಂದ ಬೆಲೆ ಏರುತ್ತಿದೆಯೇ?
|
||||
|
||||
ಈ ಡೇಟಾಸೆಟ್ನ ಕೆಲವು ವ್ಯತ್ಯಾಸಗಳ ನಡುವಿನ ಸಂಬಂಧವನ್ನು ಕಂಡುಹಿಡಿಯಲು, ಕೆಲವು ಲೈನ್ ಚಾರ್ಟ್ಗಳನ್ನು ಅನ್ವೇಷಿಸೋಣ.
|
||||
|
||||
## ಲೈನ್ ಚಾರ್ಟ್ಗಳು
|
||||
|
||||
ಪ್ರಶ್ನೆ: ಜೇನುತುಪ್ಪದ ಪೌಂಡ್ ಪ್ರತಿ ಬೆಲೆಯು ವರ್ಷದಿಂದ ವರ್ಷಕ್ಕೆ ಸ್ಪಷ್ಟವಾಗಿ ಏರಿದೆಯೇ? ನೀವು ಇದನ್ನು ಸುಲಭವಾಗಿ ಕಂಡುಹಿಡಿಯಬಹುದು ಒಂದು ಲೈನ್ ಚಾರ್ಟ್ ರಚಿಸುವ ಮೂಲಕ:
|
||||
|
||||
```r
|
||||
qplot(honey$year,honey$priceperlb, geom='smooth', span =0.5, xlab = "year",ylab = "priceperlb")
|
||||
```
|
||||
ಉತ್ತರ: ಹೌದು, 2003 ರ ಸುತ್ತಲೂ ಕೆಲವು ಹೊರತುಪಡಿಸಿ:
|
||||
|
||||

|
||||
|
||||
ಪ್ರಶ್ನೆ: 2003 ರಲ್ಲಿ ಜೇನುತುಪ್ಪದ ಸರಬರಾಜಿನಲ್ಲಿ ಏರಿಕೆಯನ್ನು ನೋಡಬಹುದೇ? ಒಟ್ಟು ಉತ್ಪಾದನೆಯನ್ನು ವರ್ಷದಿಂದ ವರ್ಷಕ್ಕೆ ನೋಡಿದರೆ?
|
||||
|
||||
```python
|
||||
qplot(honey$year,honey$totalprod, geom='smooth', span =0.5, xlab = "year",ylab = "totalprod")
|
||||
```
|
||||
|
||||

|
||||
|
||||
ಉತ್ತರ: ಅಷ್ಟು ಅಲ್ಲ. ಒಟ್ಟು ಉತ್ಪಾದನೆಯನ್ನು ನೋಡಿದರೆ, ಆ ವಿಶೇಷ ವರ್ಷದಲ್ಲಿ ಅದು ಹೆಚ್ಚಿದಂತೆ ತೋರುತ್ತದೆ, ಆದರೂ ಸಾಮಾನ್ಯವಾಗಿ ಈ ವರ್ಷಗಳಲ್ಲಿ ಜೇನುತುಪ್ಪದ ಉತ್ಪಾದನೆ ಕಡಿಮೆಯಾಗುತ್ತಿದೆ.
|
||||
|
||||
ಪ್ರಶ್ನೆ: ಆ ಸಂದರ್ಭದಲ್ಲಿ, 2003 ರ ಸುತ್ತಲೂ ಜೇನುತುಪ್ಪದ ಬೆಲೆಯ ಏರಿಕೆಗೆ ಕಾರಣವೇನು?
|
||||
|
||||
ಇದನ್ನು ಕಂಡುಹಿಡಿಯಲು, ನೀವು ಫೇಸಟ್ ಗ್ರಿಡ್ ಅನ್ನು ಅನ್ವೇಷಿಸಬಹುದು.
|
||||
|
||||
## ಫೇಸಟ್ ಗ್ರಿಡ್ಗಳು
|
||||
|
||||
ಫೇಸಟ್ ಗ್ರಿಡ್ ನಿಮ್ಮ ಡೇಟಾಸೆಟ್ನ ಒಂದು ಭಾಗವನ್ನು ತೆಗೆದುಕೊಳ್ಳುತ್ತದೆ (ನಮ್ಮ ಪ್ರಕರಣದಲ್ಲಿ, ನೀವು 'ವರ್ಷ' ಆಯ್ಕೆಮಾಡಬಹುದು ಹೆಚ್ಚು ಫೇಸಟ್ಗಳು ಉತ್ಪಾದನೆಯಾಗದಂತೆ). Seaborn ನಂತರ ಆಯ್ಕೆಮಾಡಿದ x ಮತ್ತು y ಸಂಯೋಜನೆಗಳ ಪ್ರತಿಯೊಂದು ಫೇಸಟ್ಗೆ ಪ್ಲಾಟ್ ರಚಿಸುತ್ತದೆ, ಇದರಿಂದ ಸುಲಭ ದೃಶ್ಯಾತ್ಮಕ ಹೋಲಿಕೆ ಸಾಧ್ಯವಾಗುತ್ತದೆ. 2003 ಈ ರೀತಿಯ ಹೋಲಿಕೆಯಲ್ಲಿ ಹೊರಹೊಮ್ಮುತ್ತದೆಯೇ?
|
||||
|
||||
[ggplot2 ನ ಡಾಕ್ಯುಮೆಂಟೇಶನ್](https://ggplot2.tidyverse.org/reference/facet_wrap.html) ಪ್ರಕಾರ `facet_wrap` ಬಳಸಿ ಫೇಸಟ್ ಗ್ರಿಡ್ ರಚಿಸಿ.
|
||||
|
||||
```r
|
||||
ggplot(honey, aes(x=yieldpercol, y = numcol,group = 1)) +
|
||||
geom_line() + facet_wrap(vars(year))
|
||||
```
|
||||
ಈ ದೃಶ್ಯೀಕರಣದಲ್ಲಿ, ನೀವು ವರ್ಷದಿಂದ ವರ್ಷಕ್ಕೆ ಮತ್ತು ರಾಜ್ಯದಿಂದ ರಾಜ್ಯಕ್ಕೆ yield per colony ಮತ್ತು ಕಾಲೋನಿಗಳ ಸಂಖ್ಯೆಯನ್ನು ಪಕ್ಕಪಕ್ಕವಾಗಿ 3 ಕಾಲಮ್ಗಳೊಂದಿಗೆ ಹೋಲಿಸಬಹುದು:
|
||||
|
||||

|
||||
|
||||
ಈ ಡೇಟಾಸೆಟ್ಗೆ, ಕಾಲೋನಿಗಳ ಸಂಖ್ಯೆ ಮತ್ತು ಅವರ ಉತ್ಪಾದನೆಯ ಕುರಿತು ವರ್ಷದಿಂದ ವರ್ಷಕ್ಕೆ ಮತ್ತು ರಾಜ್ಯದಿಂದ ರಾಜ್ಯಕ್ಕೆ ವಿಶೇಷವಾಗಿ ಏನೂ ಹೊರಹೊಮ್ಮುವುದಿಲ್ಲ. ಈ ಎರಡು ವ್ಯತ್ಯಾಸಗಳ ನಡುವಿನ ಸಂಬಂಧವನ್ನು ಕಂಡುಹಿಡಿಯಲು ಬೇರೆ ವಿಧಾನವಿದೆಯೇ?
|
||||
|
||||
## ಡ್ಯುಯಲ್-ಲೈನ್ ಪ್ಲಾಟ್ಗಳು
|
||||
|
||||
R ನ `par` ಮತ್ತು `plot` ಫಂಕ್ಷನ್ ಬಳಸಿ ಎರಡು ಲೈನ್ ಪ್ಲಾಟ್ಗಳನ್ನು ಒಟ್ಟಿಗೆ ಮ-superimpose ಮಾಡಿ ಬಹು-ಲೈನ್ ಪ್ಲಾಟ್ ಪ್ರಯತ್ನಿಸಿ. ನಾವು x ಅಕ್ಷದಲ್ಲಿ ವರ್ಷವನ್ನು ಮತ್ತು ಎರಡು y ಅಕ್ಷಗಳನ್ನು ಪ್ರದರ್ಶಿಸುವೆವು. ಆದ್ದರಿಂದ, yield per colony ಮತ್ತು ಕಾಲೋನಿಗಳ ಸಂಖ್ಯೆಯನ್ನು ಒಟ್ಟಿಗೆ ಪ್ರದರ್ಶಿಸಿ:
|
||||
|
||||
```r
|
||||
par(mar = c(5, 4, 4, 4) + 0.3)
|
||||
plot(honey$year, honey$numcol, pch = 16, col = 2,type="l")
|
||||
par(new = TRUE)
|
||||
plot(honey$year, honey$yieldpercol, pch = 17, col = 3,
|
||||
axes = FALSE, xlab = "", ylab = "",type="l")
|
||||
axis(side = 4, at = pretty(range(y2)))
|
||||
mtext("colony yield", side = 4, line = 3)
|
||||
```
|
||||

|
||||
|
||||
2003 ರ ಸುತ್ತಲೂ ಏನೂ ವಿಶೇಷವಾಗಿ ಗಮನ ಸೆಳೆಯದಿದ್ದರೂ, ಈ ಪಾಠವನ್ನು ಸ್ವಲ್ಪ ಸಂತೋಷಕರವಾಗಿ ಮುಗಿಸಲು ಇದು ಸಹಾಯ ಮಾಡುತ್ತದೆ: ಒಟ್ಟಾರೆ ಕಾಲೋನಿಗಳ ಸಂಖ್ಯೆ ಕಡಿಮೆಯಾಗುತ್ತಿದೆಯಾದರೂ, ಕಾಲೋನಿಗಳ ಸಂಖ್ಯೆ ಸ್ಥಿರವಾಗುತ್ತಿದೆ ಮತ್ತು ಅವರ yield per colony ಕಡಿಮೆಯಾಗುತ್ತಿದೆ.
|
||||
|
||||
ಹೋಗಿ, ಜೇನುಗಳು, ಹೋಗಿ!
|
||||
|
||||
🐝❤️
|
||||
## 🚀 ಸವಾಲು
|
||||
|
||||
ಈ ಪಾಠದಲ್ಲಿ, ನೀವು ಸ್ಕ್ಯಾಟರ್ ಪ್ಲಾಟ್ಗಳು ಮತ್ತು ಲೈನ್ ಗ್ರಿಡ್ಗಳ ಇತರ ಬಳಕೆಗಳ ಬಗ್ಗೆ ಸ್ವಲ್ಪ ತಿಳಿದುಕೊಂಡಿದ್ದೀರಿ, ಫೇಸಟ್ ಗ್ರಿಡ್ಗಳ ಸಹಿತ. ಬೇರೆ ಡೇಟಾಸೆಟ್ ಬಳಸಿ ಫೇಸಟ್ ಗ್ರಿಡ್ ರಚಿಸುವ ಸವಾಲು ಸ್ವೀಕರಿಸಿ, ಬಹುಶಃ ನೀವು ಈ ಪಾಠಗಳ ಮೊದಲು ಬಳಸಿದ ಡೇಟಾಸೆಟ್. ಅವು ರಚಿಸಲು ಎಷ್ಟು ಸಮಯ ಬೇಕಾಗುತ್ತದೆ ಮತ್ತು ಈ ತಂತ್ರಗಳನ್ನು ಬಳಸಿ ಎಷ್ಟು ಗ್ರಿಡ್ಗಳನ್ನು ರಚಿಸಬೇಕೆಂದು ಎಚ್ಚರಿಕೆಯಿಂದ ಇರಬೇಕಾಗುತ್ತದೆ ಎಂಬುದನ್ನು ಗಮನಿಸಿ.
|
||||
## [ಪೋಸ್ಟ್-ಪಾಠ ಪ್ರಶ್ನೋತ್ತರ](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/23)
|
||||
|
||||
## ವಿಮರ್ಶೆ ಮತ್ತು ಸ್ವಯಂ ಅಧ್ಯಯನ
|
||||
|
||||
ಲೈನ್ ಪ್ಲಾಟ್ಗಳು ಸರಳವಾಗಿರಬಹುದು ಅಥವಾ ಬಹಳ ಸಂಕೀರ್ಣವಾಗಿರಬಹುದು. ನೀವು ಅವುಗಳನ್ನು ಹೇಗೆ ರಚಿಸಬಹುದು ಎಂಬುದರ ಬಗ್ಗೆ [ggplot2 ಡಾಕ್ಯುಮೆಂಟೇಶನ್](https://ggplot2.tidyverse.org/reference/geom_path.html#:~:text=geom_line()%20connects%20them%20in,which%20cases%20are%20connected%20together) ನಲ್ಲಿ ಸ್ವಲ್ಪ ಓದಿಕೊಳ್ಳಿ. ಈ ಪಾಠದಲ್ಲಿ ನೀವು ರಚಿಸಿದ ಲೈನ್ ಚಾರ್ಟ್ಗಳನ್ನು ಡಾಕ್ಸ್ನಲ್ಲಿ ನೀಡಲಾದ ಇತರ ವಿಧಾನಗಳೊಂದಿಗೆ ಸುಧಾರಿಸಲು ಪ್ರಯತ್ನಿಸಿ.
|
||||
## ನಿಯೋಜನೆ
|
||||
|
||||
[ಜೇನುಮಡಿಗೆ ಒಳಗೆ ನುಗ್ಗಿ](assignment.md)
|
||||
|
||||
---
|
||||
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
|
||||
**ಅಸ್ವೀಕರಣ**:
|
||||
ಈ ದಸ್ತಾವೇಜು AI ಅನುವಾದ ಸೇವೆ [Co-op Translator](https://github.com/Azure/co-op-translator) ಬಳಸಿ ಅನುವಾದಿಸಲಾಗಿದೆ. ನಾವು ನಿಖರತೆಯಿಗಾಗಿ ಪ್ರಯತ್ನಿಸುತ್ತಿದ್ದರೂ, ಸ್ವಯಂಚಾಲಿತ ಅನುವಾದಗಳಲ್ಲಿ ತಪ್ಪುಗಳು ಅಥವಾ ಅಸತ್ಯತೆಗಳು ಇರಬಹುದು ಎಂದು ದಯವಿಟ್ಟು ಗಮನಿಸಿ. ಮೂಲ ಭಾಷೆಯಲ್ಲಿರುವ ಮೂಲ ದಸ್ತಾವೇಜನ್ನು ಅಧಿಕೃತ ಮೂಲವೆಂದು ಪರಿಗಣಿಸಬೇಕು. ಮಹತ್ವದ ಮಾಹಿತಿಗಾಗಿ ವೃತ್ತಿಪರ ಮಾನವ ಅನುವಾದವನ್ನು ಶಿಫಾರಸು ಮಾಡಲಾಗುತ್ತದೆ. ಈ ಅನುವಾದ ಬಳಕೆಯಿಂದ ಉಂಟಾಗುವ ಯಾವುದೇ ತಪ್ಪು ಅರ್ಥಮಾಡಿಕೊಳ್ಳುವಿಕೆ ಅಥವಾ ತಪ್ಪು ವಿವರಣೆಗಳಿಗೆ ನಾವು ಹೊಣೆಗಾರರಾಗುವುದಿಲ್ಲ.
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER END -->
|
||||
@ -0,0 +1,184 @@
|
||||
<!--
|
||||
CO_OP_TRANSLATOR_METADATA:
|
||||
{
|
||||
"original_hash": "b4039f1c76548d144a0aee0bf28304ec",
|
||||
"translation_date": "2025-12-19T16:39:52+00:00",
|
||||
"source_file": "3-Data-Visualization/R/13-meaningful-vizualizations/README.md",
|
||||
"language_code": "kn"
|
||||
}
|
||||
-->
|
||||
# ಅರ್ಥಪೂರ್ಣ ದೃಶ್ಯೀಕರಣಗಳನ್ನು ಮಾಡುವುದು
|
||||
|
||||
| ಅವರಿಂದ ಸ್ಕೆಚ್ ನೋಟ್ ](../../../sketchnotes/13-MeaningfulViz.png)|
|
||||
|:---:|
|
||||
| ಅರ್ಥಪೂರ್ಣ ದೃಶ್ಯೀಕರಣಗಳು - _[@nitya](https://twitter.com/nitya) ಅವರಿಂದ ಸ್ಕೆಚ್ ನೋಟ್_ |
|
||||
|
||||
> "ನೀವು ಡೇಟಾವನ್ನು ಸಾಕಷ್ಟು ಕಾಲ ಹಿಂಸಿಸಿದರೆ, ಅದು ಯಾವುದಕ್ಕೂ ಒಪ್ಪಿಕೊಳ್ಳುತ್ತದೆ" -- [ರೋನಾಲ್ಡ್ ಕೋಸ್](https://en.wikiquote.org/wiki/Ronald_Coase)
|
||||
|
||||
ಡೇಟಾ ವಿಜ್ಞಾನಿಯ ಮೂಲ ಕೌಶಲ್ಯಗಳಲ್ಲಿ ಒಂದಾಗಿದೆ ಅರ್ಥಪೂರ್ಣ ಡೇಟಾ ದೃಶ್ಯೀಕರಣವನ್ನು ಸೃಷ್ಟಿಸುವ ಸಾಮರ್ಥ್ಯ, ಇದು ನೀವು ಹೊಂದಿರುವ ಪ್ರಶ್ನೆಗಳಿಗೆ ಉತ್ತರ ನೀಡಲು ಸಹಾಯ ಮಾಡುತ್ತದೆ. ನಿಮ್ಮ ಡೇಟಾವನ್ನು ದೃಶ್ಯೀಕರಿಸುವ ಮೊದಲು, ನೀವು ಅದನ್ನು ಸ್ವಚ್ಛಗೊಳಿಸಿ ಸಿದ್ಧಪಡಿಸಿರುವುದನ್ನು ಖಚಿತಪಡಿಸಿಕೊಳ್ಳಬೇಕು, ನೀವು ಹಿಂದಿನ ಪಾಠಗಳಲ್ಲಿ ಮಾಡಿದಂತೆ. ಅದಾದ ನಂತರ, ನೀವು ಡೇಟಾವನ್ನು ಹೇಗೆ ಉತ್ತಮವಾಗಿ ಪ್ರದರ್ಶಿಸಬಹುದು ಎಂದು ನಿರ್ಧರಿಸಬಹುದು.
|
||||
|
||||
ಈ ಪಾಠದಲ್ಲಿ, ನೀವು ಪರಿಶೀಲಿಸುವಿರಿ:
|
||||
|
||||
1. ಸರಿಯಾದ ಚಾರ್ಟ್ ಪ್ರಕಾರವನ್ನು ಹೇಗೆ ಆಯ್ಕೆಮಾಡುವುದು
|
||||
2. ಮೋಸಮಯ ಚಾರ್ಟಿಂಗ್ ಅನ್ನು ಹೇಗೆ ತಪ್ಪಿಸುವುದು
|
||||
3. ಬಣ್ಣದೊಂದಿಗೆ ಹೇಗೆ ಕೆಲಸ ಮಾಡುವುದು
|
||||
4. ಓದಲು ಸುಲಭವಾಗುವಂತೆ ನಿಮ್ಮ ಚಾರ್ಟ್ಗಳನ್ನು ಹೇಗೆ ಶೈಲಿಮಾಡುವುದು
|
||||
5. ಅನಿಮೇಟೆಡ್ ಅಥವಾ 3D ಚಾರ್ಟಿಂಗ್ ಪರಿಹಾರಗಳನ್ನು ಹೇಗೆ ನಿರ್ಮಿಸುವುದು
|
||||
6. ಸೃಜನಾತ್ಮಕ ದೃಶ್ಯೀಕರಣವನ್ನು ಹೇಗೆ ನಿರ್ಮಿಸುವುದು
|
||||
|
||||
## [ಪೂರ್ವ-ಪಾಠ ಕ್ವಿಜ್](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/24)
|
||||
|
||||
## ಸರಿಯಾದ ಚಾರ್ಟ್ ಪ್ರಕಾರವನ್ನು ಆಯ್ಕೆಮಾಡಿ
|
||||
|
||||
ಹಿಂದಿನ ಪಾಠಗಳಲ್ಲಿ, ನೀವು Matplotlib ಮತ್ತು Seaborn ಬಳಸಿ ವಿವಿಧ ರಕಮದ ಆಸಕ್ತಿದಾಯಕ ಡೇಟಾ ದೃಶ್ಯೀಕರಣಗಳನ್ನು ನಿರ್ಮಿಸುವ ಪ್ರಯೋಗ ಮಾಡಿದ್ದೀರಿ. ಸಾಮಾನ್ಯವಾಗಿ, ನೀವು ಕೇಳುತ್ತಿರುವ ಪ್ರಶ್ನೆಗೆ ಸರಿಯಾದ ಚಾರ್ಟ್ ಪ್ರಕಾರವನ್ನು ಈ ಟೇಬಲ್ ಬಳಸಿ ಆಯ್ಕೆಮಾಡಬಹುದು:
|
||||
|
||||
| ನೀವು ಬೇಕಾದದ್ದು: | ನೀವು ಬಳಸಬೇಕು: |
|
||||
| -------------------------- | ----------------------------- |
|
||||
| ಸಮಯದೊಂದಿಗೆ ಡೇಟಾ ಪ್ರವೃತ್ತಿಗಳನ್ನು ತೋರಿಸಿ | ಲೈನ್ |
|
||||
| ವರ್ಗಗಳನ್ನು ಹೋಲಿಸಿ | ಬಾರ್, ಪೈ |
|
||||
| ಒಟ್ಟುಗಳನ್ನು ಹೋಲಿಸಿ | ಪೈ, ಸ್ಟ್ಯಾಕ್ಡ್ ಬಾರ್ |
|
||||
| ಸಂಬಂಧಗಳನ್ನು ತೋರಿಸಿ | ಸ್ಕ್ಯಾಟರ್, ಲೈನ್, ಫೇಸಟ್, ಡ್ಯುಯಲ್ ಲೈನ್ |
|
||||
| ವಿತರಣೆಗಳನ್ನು ತೋರಿಸಿ | ಸ್ಕ್ಯಾಟರ್, ಹಿಸ್ಟೋಗ್ರಾಮ್, ಬಾಕ್ಸ್ |
|
||||
| ಅನುಪಾತಗಳನ್ನು ತೋರಿಸಿ | ಪೈ, ಡೋನಟ್, ವಾಫಲ್ |
|
||||
|
||||
> ✅ ನಿಮ್ಮ ಡೇಟಾದ ರಚನೆಯ ಮೇಲೆ ಅವಲಂಬಿಸಿ, ನೀವು ಡೇಟಾವನ್ನು ಪಠ್ಯದಿಂದ ಸಂಖ್ಯಾತ್ಮಕಕ್ಕೆ ಪರಿವರ್ತಿಸಲು ಅಗತ್ಯವಿರಬಹುದು, ನಿರ್ದಿಷ್ಟ ಚಾರ್ಟ್ ಅದನ್ನು ಬೆಂಬಲಿಸಲು.
|
||||
|
||||
## ಮೋಸ ತಪ್ಪಿಸಿ
|
||||
|
||||
ಒಂದು ಡೇಟಾ ವಿಜ್ಞಾನಿ ಸರಿಯಾದ ಡೇಟಾ ಗೆ ಸರಿಯಾದ ಚಾರ್ಟ್ ಆಯ್ಕೆಮಾಡಿದರೂ ಸಹ, ಡೇಟಾವನ್ನು ತೋರಿಸುವ ಹಲವು ಮಾರ್ಗಗಳಿವೆ, ಅವು ಡೇಟಾವನ್ನು ಹಾಳುಮಾಡುವ ಬೆಲೆಗಾಗಿ ಒಂದು ವಿಷಯವನ್ನು ಸಾಬೀತುಪಡಿಸಲು. ಮೋಸಮಯ ಚಾರ್ಟ್ಗಳು ಮತ್ತು ಇನ್ಫೋಗ್ರಾಫಿಕ್ಸ್ಗಳ ಅನೇಕ ಉದಾಹರಣೆಗಳಿವೆ!
|
||||
|
||||
[](https://www.youtube.com/watch?v=oX74Nge8Wkw "ಹೌ ಚಾರ್ಟ್ಸ್ ಲೈ")
|
||||
|
||||
> 🎥 ಮೇಲಿನ ಚಿತ್ರವನ್ನು ಕ್ಲಿಕ್ ಮಾಡಿ ಮೋಸಮಯ ಚಾರ್ಟ್ಗಳ ಬಗ್ಗೆ ಸಮ್ಮೇಳನ ಮಾತುಕತೆ ನೋಡಿರಿ
|
||||
|
||||
ಈ ಚಾರ್ಟ್ X ಅಕ್ಷವನ್ನು ತಿರುಗಿಸಿ ಸತ್ಯದ ವಿರುದ್ಧ ತೋರಿಸುತ್ತದೆ, ದಿನಾಂಕ ಆಧಾರಿತ:
|
||||
|
||||

|
||||
|
||||
[ಈ ಚಾರ್ಟ್](https://media.firstcoastnews.com/assets/WTLV/images/170ae16f-4643-438f-b689-50d66ca6a8d8/170ae16f-4643-438f-b689-50d66ca6a8d8_1140x641.jpg) ಇನ್ನೂ ಹೆಚ್ಚು ಮೋಸಮಯವಾಗಿದೆ, ಕಣ್ಣು ಬಲಕ್ಕೆ ಸೆಳೆಯುತ್ತದೆ ಮತ್ತು ಸಮಯದೊಂದಿಗೆ COVID ಪ್ರಕರಣಗಳು ವಿವಿಧ ಜಿಲ್ಲೆಗಳಲ್ಲಿ ಕಡಿಮೆಯಾದಂತೆ ತೋರುತ್ತದೆ. ನಿಜವಾಗಿ, ದಿನಾಂಕಗಳನ್ನು ಗಮನದಿಂದ ನೋಡಿದರೆ, ಅವು ಮೋಸಮಯ ಇಳಿಜಾರಿನ ಪ್ರವೃತ್ತಿಯನ್ನು ನೀಡಲು ಮರುಕ್ರಮಿಸಲಾಗಿದೆ.
|
||||
|
||||

|
||||
|
||||
ಈ ಪ್ರಸಿದ್ಧ ಉದಾಹರಣೆ ಬಣ್ಣ ಮತ್ತು ತಿರುಗಿದ Y ಅಕ್ಷವನ್ನು ಬಳಸಿಕೊಂಡು ಮೋಸ ಮಾಡುತ್ತದೆ: ಗನ್-ಸ್ನೇಹಿ ಕಾನೂನುಗಳ ಅಂಗೀಕಾರದ ನಂತರ ಗನ್ ಸಾವುಗಳು ಏರಿಕೆಯಾಗಿವೆ ಎಂದು ನಿರ್ಣಯಿಸುವ ಬದಲು, ಕಣ್ಣು ವಿರುದ್ಧವನ್ನು ನಂಬುವಂತೆ ಮಾಡುತ್ತದೆ:
|
||||
|
||||

|
||||
|
||||
ಈ ವಿಚಿತ್ರ ಚಾರ್ಟ್ ಅನುಪಾತವನ್ನು ಹೇಗೆ ಮ್ಯಾನಿಪ್ಯುಲೇಟ್ ಮಾಡಬಹುದು ಎಂಬುದನ್ನು ಹಾಸ್ಯಾಸ್ಪದ ಪರಿಣಾಮದೊಂದಿಗೆ ತೋರಿಸುತ್ತದೆ:
|
||||
|
||||

|
||||
|
||||
ತೂಕಮಾಡಲಾಗದ ವಸ್ತುಗಳನ್ನು ಹೋಲಿಸುವುದು ಇನ್ನೊಂದು ಅನುಮಾನಾಸ್ಪದ ತಂತ್ರ. 'ಸ್ಪ್ಯೂರಿಯಸ್ ಕೊರಿಲೇಶನ್ಸ್' ಬಗ್ಗೆ ಒಂದು [ಅದ್ಭುತ ವೆಬ್ ಸೈಟ್](https://tylervigen.com/spurious-correlations) ಇದೆ, ಇದು ಮೇನ್ನ ವಿಚ್ಛೇದನ ದರ ಮತ್ತು ಮಾರ್ಜರಿನ್ ಬಳಕೆಯಂತಹ ವಿಷಯಗಳನ್ನು ಹೊಂದಿರುವ 'ವಾಸ್ತವಗಳನ್ನು' ತೋರಿಸುತ್ತದೆ. ರೆಡ್ಡಿಟ್ ಗುಂಪು ಕೂಡ ಡೇಟಾ ಬಳಕೆಯ [ಕಿರುಕುಳಗಳನ್ನು](https://www.reddit.com/r/dataisugly/top/?t=all) ಸಂಗ್ರಹಿಸುತ್ತದೆ.
|
||||
|
||||
ಮೋಸಮಯ ಚಾರ್ಟ್ಗಳಿಂದ ಕಣ್ಣು ಎಷ್ಟು ಸುಲಭವಾಗಿ ಮೋಸಗೊಳ್ಳಬಹುದು ಎಂಬುದನ್ನು ಅರ್ಥಮಾಡಿಕೊಳ್ಳುವುದು ಮುಖ್ಯ. ಡೇಟಾ ವಿಜ್ಞಾನಿಯ ಉದ್ದೇಶ ಉತ್ತಮವಾದರೂ ಸಹ, ಪೈ ಚಾರ್ಟ್ನಲ್ಲಿ ಬಹಳಷ್ಟು ವರ್ಗಗಳನ್ನು ತೋರಿಸುವಂತಹ ಕೆಟ್ಟ ಚಾರ್ಟ್ ಆಯ್ಕೆ ಮೋಸಮಯವಾಗಬಹುದು.
|
||||
|
||||
## ಬಣ್ಣ
|
||||
|
||||
ಮೇಲಿನ 'ಫ್ಲೋರಿಡಾ ಗನ್ ಹಿಂಸಾಚಾರ' ಚಾರ್ಟ್ನಲ್ಲಿ ನೀವು ನೋಡಿದಂತೆ, ಬಣ್ಣವು ಚಾರ್ಟ್ಗಳಿಗೆ ಹೆಚ್ಚುವರಿ ಅರ್ಥದ ಪದರವನ್ನು ನೀಡಬಹುದು, ವಿಶೇಷವಾಗಿ ggplot2 ಮತ್ತು RColorBrewer ಮುಂತಾದ ಗ್ರಂಥಾಲಯಗಳನ್ನು ಬಳಸದೆ ಕೈಯಿಂದ ಚಾರ್ಟ್ ಮಾಡುತ್ತಿದ್ದರೆ. ನೀವು ಕೈಯಿಂದ ಚಾರ್ಟ್ ಮಾಡುತ್ತಿದ್ದರೆ, [ಬಣ್ಣ ಸಿದ್ಧಾಂತ](https://colormatters.com/color-and-design/basic-color-theory) ಬಗ್ಗೆ ಸ್ವಲ್ಪ ಅಧ್ಯಯನ ಮಾಡಿ.
|
||||
|
||||
> ✅ ಚಾರ್ಟ್ ವಿನ್ಯಾಸ ಮಾಡುವಾಗ, ಪ್ರವೇಶಾರ್ಹತೆ ದೃಶ್ಯೀಕರಣದ ಪ್ರಮುಖ ಅಂಶವಾಗಿದೆ ಎಂದು ಗಮನಿಸಿ. ನಿಮ್ಮ ಬಳಕೆದಾರರಲ್ಲಿ ಕೆಲವರು ಬಣ್ಣ ಅಂಧರಾಗಿರಬಹುದು - ನಿಮ್ಮ ಚಾರ್ಟ್ ದೃಷ್ಟಿ ಅಶಕ್ತರ ಬಳಕೆದಾರರಿಗೆ ಚೆನ್ನಾಗಿ ತೋರಿಸುತ್ತದೆಯೇ?
|
||||
|
||||
ನಿಮ್ಮ ಚಾರ್ಟ್ಗೆ ಬಣ್ಣಗಳನ್ನು ಆಯ್ಕೆಮಾಡುವಾಗ ಜಾಗರೂಕವಾಗಿರಿ, ಏಕೆಂದರೆ ಬಣ್ಣವು ನೀವು ಉದ್ದೇಶಿಸದ ಅರ್ಥವನ್ನು ನೀಡಬಹುದು. ಮೇಲಿನ 'ಎತ್ತರ' ಚಾರ್ಟ್ನ 'ಪಿಂಕ್ ಲೇಡೀಸ್' ಸ್ಪಷ್ಟವಾಗಿ 'ಸ್ತ್ರೀಯ' ಅರ್ಥವನ್ನು ನೀಡುತ್ತವೆ, ಇದು ಚಾರ್ಟ್ನ ವಿಚಿತ್ರತೆಯನ್ನು ಹೆಚ್ಚಿಸುತ್ತದೆ.
|
||||
|
||||
ವಿಶ್ವದ ವಿಭಿನ್ನ ಭಾಗಗಳಲ್ಲಿ [ಬಣ್ಣದ ಅರ್ಥ](https://colormatters.com/color-symbolism/the-meanings-of-colors) ವಿಭಿನ್ನವಾಗಿರಬಹುದು ಮತ್ತು ಅವುಗಳ ಛಾಯೆಯ ಪ್ರಕಾರ ಅರ್ಥ ಬದಲಾಗಬಹುದು. ಸಾಮಾನ್ಯವಾಗಿ, ಬಣ್ಣದ ಅರ್ಥಗಳು ಇವು:
|
||||
|
||||
| ಬಣ್ಣ | ಅರ್ಥ |
|
||||
| ------- | -------------------- |
|
||||
| ಕೆಂಪು | ಶಕ್ತಿ |
|
||||
| ನೀಲಿ | ನಂಬಿಕೆ, ನಿಷ್ಠೆ |
|
||||
| ಹಳದಿ | ಸಂತೋಷ, ಎಚ್ಚರಿಕೆ |
|
||||
| ಹಸಿರು | ಪರಿಸರ, ಭಾಗ್ಯ, ಹಿಂಸೆ |
|
||||
| ನೇರಳೆ | ಸಂತೋಷ |
|
||||
| ಕಿತ್ತಳೆ | ಚೈತನ್ಯ |
|
||||
|
||||
ನೀವು ಕಸ್ಟಮ್ ಬಣ್ಣಗಳೊಂದಿಗೆ ಚಾರ್ಟ್ ನಿರ್ಮಿಸುವ ಜವಾಬ್ದಾರಿಯನ್ನು ಹೊಂದಿದ್ದರೆ, ನಿಮ್ಮ ಚಾರ್ಟ್ಗಳು ಪ್ರವೇಶಾರ್ಹವಾಗಿರಬೇಕು ಮತ್ತು ನೀವು ನೀಡಲು ಯತ್ನಿಸುವ ಅರ್ಥಕ್ಕೆ ಬಣ್ಣ ಹೊಂದಿರಬೇಕು ಎಂದು ಖಚಿತಪಡಿಸಿಕೊಳ್ಳಿ.
|
||||
|
||||
## ಓದಲು ಸುಲಭವಾಗುವಂತೆ ನಿಮ್ಮ ಚಾರ್ಟ್ಗಳನ್ನು ಶೈಲಿಮಾಡುವುದು
|
||||
|
||||
ಚಾರ್ಟ್ಗಳು ಓದಲು ಸಾಧ್ಯವಾಗದಿದ್ದರೆ ಅರ್ಥಪೂರ್ಣವಾಗುವುದಿಲ್ಲ! ನಿಮ್ಮ ಡೇಟಾ ಅನುಗುಣವಾಗಿ ಚಾರ್ಟ್ನ ಅಗಲ ಮತ್ತು ಎತ್ತರವನ್ನು ಶೈಲಿಮಾಡಲು ಸ್ವಲ್ಪ ಸಮಯ ತೆಗೆದುಕೊಳ್ಳಿ. ಒಂದು ವ್ಯತ್ಯಯ (ಉದಾಹರಣೆಗೆ ಎಲ್ಲಾ 50 ರಾಜ್ಯಗಳು) ತೋರಿಸಬೇಕಾದರೆ, ಸಾಧ್ಯವಾದರೆ ಅವುಗಳನ್ನು Y ಅಕ್ಷದಲ್ಲಿ ಲಂಬವಾಗಿ ತೋರಿಸಿ, ಹೋರಿಜಾಂಟಲ್ ಸ್ಕ್ರೋಲಿಂಗ್ ಚಾರ್ಟ್ ತಪ್ಪಿಸಲು.
|
||||
|
||||
ನಿಮ್ಮ ಅಕ್ಷಗಳನ್ನು ಲೇಬಲ್ ಮಾಡಿ, ಅಗತ್ಯವಿದ್ದರೆ ಲೆಜೆಂಡ್ ನೀಡಿ, ಮತ್ತು ಡೇಟಾ ಉತ್ತಮವಾಗಿ ಅರ್ಥಮಾಡಿಕೊಳ್ಳಲು ಟೂಲ್ಟಿಪ್ಗಳನ್ನು ಒದಗಿಸಿ.
|
||||
|
||||
ನಿಮ್ಮ ಡೇಟಾ ಪಠ್ಯಾತ್ಮಕ ಮತ್ತು X ಅಕ್ಷದಲ್ಲಿ ವಿಸ್ತಾರವಾಗಿದ್ದರೆ, ಓದಲು ಸುಲಭವಾಗಲು ಪಠ್ಯವನ್ನು ತಿರುಗಿಸಬಹುದು. [plot3D](https://cran.r-project.org/web/packages/plot3D/index.html) 3D ಪ್ಲಾಟಿಂಗ್ ಅನ್ನು ಒದಗಿಸುತ್ತದೆ, ನಿಮ್ಮ ಡೇಟಾ ಅದನ್ನು ಬೆಂಬಲಿಸಿದರೆ. ಅದನ್ನು ಬಳಸಿ ಸುಧಾರಿತ ಡೇಟಾ ದೃಶ್ಯೀಕರಣಗಳನ್ನು ಸೃಷ್ಟಿಸಬಹುದು.
|
||||
|
||||

|
||||
|
||||
## ಅನಿಮೇಷನ್ ಮತ್ತು 3D ಚಾರ್ಟ್ ಪ್ರದರ್ಶನ
|
||||
|
||||
ಇಂದಿನ ಅತ್ಯುತ್ತಮ ಡೇಟಾ ದೃಶ್ಯೀಕರಣಗಳಲ್ಲಿ ಕೆಲವು ಅನಿಮೇಟೆಡ್ ಆಗಿವೆ. ಶಿರ್ಲಿ ವು D3 ಬಳಸಿ ಅದ್ಭುತ ಅನಿಮೇಟೆಡ್ ದೃಶ್ಯೀಕರಣಗಳನ್ನು ಮಾಡಿದ್ದಾಳೆ, ಉದಾಹರಣೆಗೆ '[ಫಿಲ್ಮ್ ಫ್ಲವರ್ಸ್](http://bl.ocks.org/sxywu/raw/d612c6c653fb8b4d7ff3d422be164a5d/)', ಇಲ್ಲಿ ಪ್ರತಿ ಹೂವು ಒಂದು ಚಲನಚಿತ್ರದ ದೃಶ್ಯೀಕರಣವಾಗಿದೆ. ಇನ್ನೊಂದು ಉದಾಹರಣೆ ಗಾರ್ಡಿಯನ್ನ 'ಬಸ್ಸ್ಡ್ ಔಟ್', ಇದು ಗ್ರೀನ್ಸಾಕ್ ಮತ್ತು D3 ಜೊತೆಗೆ ಇಂಟರಾಕ್ಟಿವ್ ಅನುಭವ ಮತ್ತು ಸ್ಕ್ರೋಲಿಟೆಲ್ಲಿಂಗ್ ಲೇಖನ ರೂಪದಲ್ಲಿ NYC ತನ್ನ ಗೃಹವಿಹೀನ ಸಮಸ್ಯೆಯನ್ನು ಬಸ್ಸಿಂಗ್ ಮೂಲಕ ಹೇಗೆ ನಿರ್ವಹಿಸುತ್ತದೆ ಎಂಬುದನ್ನು ತೋರಿಸುತ್ತದೆ.
|
||||
|
||||

|
||||
|
||||
> "ಬಸ್ಸ್ಡ್ ಔಟ್: ಅಮೆರಿಕ ಗೃಹವಿಹೀನರನ್ನು ಹೇಗೆ ಸಾಗಿಸುತ್ತದೆ" [ಗಾರ್ಡಿಯನ್](https://www.theguardian.com/us-news/ng-interactive/2017/dec/20/bussed-out-america-moves-homeless-people-country-study) ನಿಂದ. ದೃಶ್ಯೀಕರಣಗಳು ನಾಡಿಯೆ ಬ್ರೆಮರ್ ಮತ್ತು ಶಿರ್ಲಿ ವು ಅವರಿಂದ
|
||||
|
||||
ಈ ಪಾಠವು ಈ ಶಕ್ತಿಶಾಲಿ ದೃಶ್ಯೀಕರಣ ಗ್ರಂಥಾಲಯಗಳನ್ನು ಆಳವಾಗಿ ಕಲಿಸಲು ಸಾಕಾಗದಿದ್ದರೂ, Vue.js ಅಪ್ಲಿಕೇಶನ್ನಲ್ಲಿ D3 ಬಳಸಿ "Dangerous Liaisons" ಪುಸ್ತಕದ ಅನಿಮೇಟೆಡ್ ಸಾಮಾಜಿಕ ಜಾಲದೃಶ್ಯೀಕರಣವನ್ನು ಪ್ರದರ್ಶಿಸಲು ಪ್ರಯತ್ನಿಸಿ.
|
||||
|
||||
> "Les Liaisons Dangereuses" ಒಂದು ಪತ್ರಿಕಾದ ಕಾದಂಬರಿ, ಅಥವಾ ಸರಣಿಯ ಪತ್ರಗಳಾಗಿ ಪ್ರಸ್ತುತಪಡಿಸಲಾದ ಕಾದಂಬರಿ. 1782 ರಲ್ಲಿ ಚೋಡರ್ಲೋಸ್ ಡೆ ಲಾಕ್ಲೋಸ್ ಬರೆದಿದ್ದು, 18ನೇ ಶತಮಾನದ ಕೊನೆಯಲ್ಲಿ ಫ್ರೆಂಚ್ ಅರಿಸ್ಟೊಕ್ರಸಿ ಎರಡು ಪ್ರತಿಸ್ಪರ್ಧಿ ನಾಯಕರು ವಿಕಾಂಟ್ ಡೆ ವಾಲ್ಮೋಂಟ್ ಮತ್ತು ಮಾರ್ಕ್ವಿಸ್ ಡೆ ಮೆರ್ಟೆಯುಲ್ ಅವರ ದುಷ್ಟ, ನೈತಿಕವಾಗಿ ಕುಸಿದ ಸಾಮಾಜಿಕ ಯುಕ್ತಿಗಳ ಕಥೆಯನ್ನು ಹೇಳುತ್ತದೆ. ಇಬ್ಬರೂ ಕೊನೆಯಲ್ಲಿ ತಮ್ಮ ಅಂತ್ಯವನ್ನು ಎದುರಿಸುತ್ತಾರೆ ಆದರೆ ಬಹಳಷ್ಟು ಸಾಮಾಜಿಕ ಹಾನಿಯನ್ನುಂಟುಮಾಡಿ. ಕಾದಂಬರಿ ಅವರ ವಲಯದ ವಿವಿಧ ಜನರಿಗೆ ಬರೆದ ಪತ್ರಗಳ ಸರಣಿಯಾಗಿ ಬೆಳೆಯುತ್ತದೆ, ಪ್ರತೀಕಾರಕ್ಕಾಗಿ ಅಥವಾ ಕೇವಲ ಸಮಸ್ಯೆ ಸೃಷ್ಟಿಸಲು ಯೋಜನೆ ಮಾಡುತ್ತಾ. ಈ ಪತ್ರಗಳ ದೃಶ್ಯೀಕರಣವನ್ನು ಸೃಷ್ಟಿಸಿ ಕಥೆಯ ಪ್ರಮುಖ ನಾಯಕರು ಯಾರು ಎಂದು ದೃಶ್ಯವಾಗಿ ಕಂಡುಹಿಡಿಯಿರಿ.
|
||||
|
||||
ನೀವು ಈ ಸಾಮಾಜಿಕ ಜಾಲದೃಶ್ಯೀಕರಣದ ಅನಿಮೇಟೆಡ್ ವೀಕ್ಷಣೆಯನ್ನು ಪ್ರದರ್ಶಿಸುವ ವೆಬ್ ಅಪ್ಲಿಕೇಶನ್ ಅನ್ನು ಪೂರ್ಣಗೊಳಿಸುವಿರಿ. ಇದು Vue.js ಮತ್ತು D3 ಬಳಸಿ [ಜಾಲದೃಶ್ಯ](https://github.com/emiliorizzo/vue-d3-network) ಸೃಷ್ಟಿಸಲು ನಿರ್ಮಿಸಲಾದ ಗ್ರಂಥಾಲಯವನ್ನು ಬಳಸುತ್ತದೆ. ಅಪ್ಲಿಕೇಶನ್ ಚಾಲನೆಯಲ್ಲಿದ್ದಾಗ, ನೀವು ನೊಡ್ಗಳನ್ನು ಪರದೆ ಮೇಲೆ ಎಳೆಯಬಹುದು ಮತ್ತು ಡೇಟಾವನ್ನು ಮರುಸಂರಚಿಸಬಹುದು.
|
||||
|
||||

|
||||
|
||||
## ಪ್ರಾಜೆಕ್ಟ್: D3.js ಬಳಸಿ ಜಾಲವನ್ನು ತೋರಿಸಲು ಚಾರ್ಟ್ ನಿರ್ಮಿಸಿ
|
||||
|
||||
> ಈ ಪಾಠ ಫೋಲ್ಡರ್ನಲ್ಲಿ `solution` ಫೋಲ್ಡರ್ ಇದೆ, ಅಲ್ಲಿ ಪೂರ್ಣಗೊಂಡ ಪ್ರಾಜೆಕ್ಟ್ ನಿಮ್ಮ ಉಲ್ಲೇಖಕ್ಕಾಗಿ ಇದೆ.
|
||||
|
||||
1. ಸ್ಟಾರ್ಟರ್ ಫೋಲ್ಡರ್ನ ರೂಟ್ನಲ್ಲಿ README.md ಫೈಲ್ನ ಸೂಚನೆಗಳನ್ನು ಅನುಸರಿಸಿ. ನಿಮ್ಮ ಯಂತ್ರದಲ್ಲಿ NPM ಮತ್ತು Node.js ಚಾಲನೆಯಲ್ಲಿರುವುದನ್ನು ಖಚಿತಪಡಿಸಿ, ನಂತರ ನಿಮ್ಮ ಪ್ರಾಜೆಕ್ಟ್ ಅವಲಂಬನೆಗಳನ್ನು ಸ್ಥಾಪಿಸಿ.
|
||||
|
||||
2. `starter/src` ಫೋಲ್ಡರ್ ತೆರೆಯಿರಿ. ಅಲ್ಲಿ ನೀವು `assets` ಫೋಲ್ಡರ್ ಕಂಡುಹಿಡಿಯುತ್ತೀರಿ, ಅದರಲ್ಲಿ ಕಾದಂಬರಿಯಿಂದ ಎಲ್ಲಾ ಪತ್ರಗಳ .json ಫೈಲ್ ಇದೆ, ಸಂಖ್ಯೆಬದ್ಧವಾಗಿ, 'to' ಮತ್ತು 'from' ಟ್ಯಾಗ್ಗಳೊಂದಿಗೆ.
|
||||
|
||||
3. `components/Nodes.vue` ನಲ್ಲಿ ಕೋಡ್ ಪೂರ್ಣಗೊಳಿಸಿ ದೃಶ್ಯೀಕರಣಕ್ಕೆ ಅನುಕೂಲವಾಗುವಂತೆ. `createLinks()` ಎಂಬ ವಿಧಾನವನ್ನು ಹುಡುಕಿ ಮತ್ತು ಕೆಳಗಿನ ನೆಸ್ಟೆಡ್ ಲೂಪ್ ಅನ್ನು ಸೇರಿಸಿ.
|
||||
|
||||
.json ವಸ್ತುವಿನ ಮೂಲಕ ಲೂಪ್ ಮಾಡಿ ಪತ್ರಗಳ 'to' ಮತ್ತು 'from' ಡೇಟಾವನ್ನು ಹಿಡಿದು `links` ವಸ್ತುವನ್ನು ನಿರ್ಮಿಸಿ, ಇದರಿಂದ ದೃಶ್ಯೀಕರಣ ಗ್ರಂಥಾಲಯ ಅದನ್ನು ಬಳಸಬಹುದು:
|
||||
|
||||
```javascript
|
||||
//ಅಕ್ಷರಗಳ ಮೂಲಕ ಲೂಪ್ ಮಾಡಿ
|
||||
let f = 0;
|
||||
let t = 0;
|
||||
for (var i = 0; i < letters.length; i++) {
|
||||
for (var j = 0; j < characters.length; j++) {
|
||||
|
||||
if (characters[j] == letters[i].from) {
|
||||
f = j;
|
||||
}
|
||||
if (characters[j] == letters[i].to) {
|
||||
t = j;
|
||||
}
|
||||
}
|
||||
this.links.push({ sid: f, tid: t });
|
||||
}
|
||||
```
|
||||
|
||||
ಟರ್ಮಿನಲ್ನಿಂದ ನಿಮ್ಮ ಅಪ್ಲಿಕೇಶನ್ ಅನ್ನು ಚಾಲನೆ ಮಾಡಿ (npm run serve) ಮತ್ತು ದೃಶ್ಯೀಕರಣವನ್ನು ಆನಂದಿಸಿ!
|
||||
|
||||
## 🚀 ಸವಾಲು
|
||||
|
||||
ಮೋಸಮಯ ದೃಶ್ಯೀಕರಣಗಳನ್ನು ಕಂಡುಹಿಡಿಯಲು ಇಂಟರ್ನೆಟ್ನಲ್ಲಿ ಸುತ್ತಾಡಿ. ಲೇಖಕ ಬಳಕೆದಾರರನ್ನು ಹೇಗೆ ಮೋಸಗೊಳಿಸುತ್ತಾನೆ, ಮತ್ತು ಅದು ಉದ್ದೇಶಿತವೇ? ದೃಶ್ಯೀಕರಣಗಳನ್ನು ಸರಿಪಡಿಸಲು ಪ್ರಯತ್ನಿಸಿ ಅವು ಹೇಗೆ ಕಾಣಬೇಕು ಎಂದು ತೋರಿಸಲು.
|
||||
|
||||
## [ಪೋಸ್ಟ್-ಪಾಠ ಕ್ವಿಜ್](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/25)
|
||||
|
||||
## ವಿಮರ್ಶೆ ಮತ್ತು ಸ್ವಯಂ ಅಧ್ಯಯನ
|
||||
|
||||
ಮೋಸಮಯ ಡೇಟಾ ದೃಶ್ಯೀಕರಣಗಳ ಬಗ್ಗೆ ಓದಲು ಕೆಲವು ಲೇಖನಗಳು ಇಲ್ಲಿವೆ:
|
||||
|
||||
https://gizmodo.com/how-to-lie-with-data-visualization-1563576606
|
||||
|
||||
http://ixd.prattsi.org/2017/12/visual-lies-usability-in-deceptive-data-visualizations/
|
||||
|
||||
ಇತಿಹಾಸಿಕ ಆಸ್ತಿ ಮತ್ತು ವಸ್ತುಗಳ ಆಸಕ್ತಿದಾಯಕ ದೃಶ್ಯೀಕರಣಗಳನ್ನು ನೋಡಿ:
|
||||
|
||||
https://handbook.pubpub.org/
|
||||
|
||||
ಅನಿಮೇಷನ್ ನಿಮ್ಮ ದೃಶ್ಯೀಕರಣಗಳನ್ನು ಹೇಗೆ ಸುಧಾರಿಸಬಹುದು ಎಂಬ ಲೇಖನವನ್ನು ನೋಡಿ:
|
||||
|
||||
https://medium.com/@EvanSinar/use-animation-to-supercharge-data-visualization-cd905a882ad4
|
||||
|
||||
## ಹುದ್ದೆ
|
||||
|
||||
[ನಿಮ್ಮ ಸ್ವಂತ ಕಸ್ಟಮ್ ದೃಶ್ಯೀಕರಣವನ್ನು ನಿರ್ಮಿಸಿ](assignment.md)
|
||||
|
||||
---
|
||||
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
|
||||
**ಅಸ್ವೀಕರಣ**:
|
||||
ಈ ದಸ್ತಾವೇಜು [Co-op Translator](https://github.com/Azure/co-op-translator) ಎಂಬ AI ಅನುವಾದ ಸೇವೆಯನ್ನು ಬಳಸಿ ಅನುವಾದಿಸಲಾಗಿದೆ. ನಾವು ಶುದ್ಧತೆಯತ್ತ ಪ್ರಯತ್ನಿಸುತ್ತಿದ್ದರೂ, ಸ್ವಯಂಚಾಲಿತ ಅನುವಾದಗಳಲ್ಲಿ ತಪ್ಪುಗಳು ಅಥವಾ ಅಸತ್ಯತೆಗಳು ಇರಬಹುದು ಎಂದು ದಯವಿಟ್ಟು ಗಮನಿಸಿ. ಮೂಲ ಭಾಷೆಯಲ್ಲಿರುವ ಮೂಲ ದಸ್ತಾವೇಜನ್ನು ಅಧಿಕೃತ ಮೂಲವೆಂದು ಪರಿಗಣಿಸಬೇಕು. ಮಹತ್ವದ ಮಾಹಿತಿಗಾಗಿ, ವೃತ್ತಿಪರ ಮಾನವ ಅನುವಾದವನ್ನು ಶಿಫಾರಸು ಮಾಡಲಾಗುತ್ತದೆ. ಈ ಅನುವಾದ ಬಳಕೆಯಿಂದ ಉಂಟಾಗುವ ಯಾವುದೇ ತಪ್ಪು ಅರ್ಥಮಾಡಿಕೊಳ್ಳುವಿಕೆ ಅಥವಾ ತಪ್ಪು ವಿವರಣೆಗಳಿಗೆ ನಾವು ಹೊಣೆಗಾರರಾಗುವುದಿಲ್ಲ.
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER END -->
|
||||
@ -0,0 +1,45 @@
|
||||
<!--
|
||||
CO_OP_TRANSLATOR_METADATA:
|
||||
{
|
||||
"original_hash": "1441550a0d789796b2821e04f7f4cc94",
|
||||
"translation_date": "2025-12-19T13:36:00+00:00",
|
||||
"source_file": "3-Data-Visualization/README.md",
|
||||
"language_code": "kn"
|
||||
}
|
||||
-->
|
||||
# ದೃಶ್ಯೀಕರಣಗಳು
|
||||
|
||||

|
||||
> ಫೋಟೋ <a href="https://unsplash.com/@jenna2980?utm_source=unsplash&utm_medium=referral&utm_content=creditCopyText">ಜೆನ್ನಾ ಲೀ</a> ಅವರಿಂದ <a href="https://unsplash.com/s/photos/bees-in-a-meadow?utm_source=unsplash&utm_medium=referral&utm_content=creditCopyText">ಅನ್ಸ್ಪ್ಲ್ಯಾಶ್</a> ನಲ್ಲಿ
|
||||
|
||||
|
||||
ಡೇಟಾ ವಿಜ್ಞಾನಿಯೊಬ್ಬರ ಪ್ರಮುಖ ಕಾರ್ಯಗಳಲ್ಲಿ ಒಂದಾಗಿದೆ ಡೇಟಾವನ್ನು ದೃಶ್ಯೀಕರಿಸುವುದು. ಚಿತ್ರಗಳು 1000 ಪದಗಳ ಮೌಲ್ಯವನ್ನು ಹೊಂದಿವೆ, ಮತ್ತು ಒಂದು ದೃಶ್ಯೀಕರಣವು ನಿಮ್ಮ ಡೇಟಾದ ಎಲ್ಲಾ ರೀತಿಯ ಆಸಕ್ತಿದಾಯಕ ಭಾಗಗಳನ್ನು ಗುರುತಿಸಲು ಸಹಾಯ ಮಾಡಬಹುದು, ಉದಾಹರಣೆಗೆ ಶಿಖರಗಳು, ಹೊರಗಿನ ಅಂಶಗಳು, ಗುಂಪುಗಳು, ಪ್ರವೃತ್ತಿಗಳು ಮತ್ತು ಇನ್ನಷ್ಟು, ಇದು ನಿಮ್ಮ ಡೇಟಾ ಹೇಳಲು ಯತ್ನಿಸುತ್ತಿರುವ ಕಥೆಯನ್ನು ಅರ್ಥಮಾಡಿಕೊಳ್ಳಲು ಸಹಾಯ ಮಾಡುತ್ತದೆ.
|
||||
|
||||
ಈ ಐದು ಪಾಠಗಳಲ್ಲಿ, ನೀವು ಪ್ರಕೃತಿಯಿಂದ ಪಡೆದ ಡೇಟಾವನ್ನು ಅನ್ವೇಷಿಸಿ ವಿವಿಧ ತಂತ್ರಗಳನ್ನು ಬಳಸಿ ಆಸಕ್ತಿದಾಯಕ ಮತ್ತು ಸುಂದರ ದೃಶ್ಯೀಕರಣಗಳನ್ನು ರಚಿಸುವಿರಿ.
|
||||
|
||||
| ವಿಷಯ ಸಂಖ್ಯೆ | ವಿಷಯ | ಲಿಂಕ್ ಮಾಡಿದ ಪಾಠ | ಲೇಖಕರು |
|
||||
| :-----------: | :--: | :-----------: | :----: |
|
||||
| 1. | ಪ್ರಮಾಣಗಳನ್ನು ದೃಶ್ಯೀಕರಿಸುವುದು | <ul> <li> [Python](09-visualization-quantities/README.md)</li> <li>[R](../../../3-Data-Visualization/R/09-visualization-quantities) </li> </ul>|<ul> <li> [ಜೆನ್ ಲೂಪರ್](https://twitter.com/jenlooper)</li><li> [ವಿದುಷಿ ಗುಪ್ತ](https://github.com/Vidushi-Gupta)</li> <li>[ಜಸ್ಲೀನ್ ಸೊಂಡಿ](https://github.com/jasleen101010)</li></ul> |
|
||||
| 2. | ವಿತರಣೆಗಳನ್ನು ದೃಶ್ಯೀಕರಿಸುವುದು | <ul> <li> [Python](10-visualization-distributions/README.md)</li> <li>[R](../../../3-Data-Visualization/R/10-visualization-distributions) </li> </ul>|<ul> <li> [ಜೆನ್ ಲೂಪರ್](https://twitter.com/jenlooper)</li><li> [ವಿದುಷಿ ಗುಪ್ತ](https://github.com/Vidushi-Gupta)</li> <li>[ಜಸ್ಲೀನ್ ಸೊಂಡಿ](https://github.com/jasleen101010)</li></ul> |
|
||||
| 3. | ಅನುಪಾತಗಳನ್ನು ದೃಶ್ಯೀಕರಿಸುವುದು | <ul> <li> [Python](11-visualization-proportions/README.md)</li> <li>[R](../../../3-Data-Visualization) </li> </ul>|<ul> <li> [ಜೆನ್ ಲೂಪರ್](https://twitter.com/jenlooper)</li><li> [ವಿದುಷಿ ಗುಪ್ತ](https://github.com/Vidushi-Gupta)</li> <li>[ಜಸ್ಲೀನ್ ಸೊಂಡಿ](https://github.com/jasleen101010)</li></ul> |
|
||||
| 4. | ಸಂಬಂಧಗಳನ್ನು ದೃಶ್ಯೀಕರಿಸುವುದು | <ul> <li> [Python](12-visualization-relationships/README.md)</li> <li>[R](../../../3-Data-Visualization) </li> </ul>|<ul> <li> [ಜೆನ್ ಲೂಪರ್](https://twitter.com/jenlooper)</li><li> [ವಿದುಷಿ ಗುಪ್ತ](https://github.com/Vidushi-Gupta)</li> <li>[ಜಸ್ಲೀನ್ ಸೊಂಡಿ](https://github.com/jasleen101010)</li></ul> |
|
||||
| 5. | ಅರ್ಥಪೂರ್ಣ ದೃಶ್ಯೀಕರಣಗಳನ್ನು ಮಾಡುವುದು | <ul> <li> [Python](13-meaningful-visualizations/README.md)</li> <li>[R](../../../3-Data-Visualization) </li> </ul>|<ul> <li> [ಜೆನ್ ಲೂಪರ್](https://twitter.com/jenlooper)</li><li> [ವಿದುಷಿ ಗುಪ್ತ](https://github.com/Vidushi-Gupta)</li> <li>[ಜಸ್ಲೀನ್ ಸೊಂಡಿ](https://github.com/jasleen101010)</li></ul> |
|
||||
|
||||
### ಕ್ರೆಡಿಟ್ಸ್
|
||||
|
||||
ಈ ದೃಶ್ಯೀಕರಣ ಪಾಠಗಳನ್ನು 🌸 [ಜೆನ್ ಲೂಪರ್](https://twitter.com/jenlooper), [ಜಸ್ಲೀನ್ ಸೊಂಡಿ](https://github.com/jasleen101010) ಮತ್ತು [ವಿದುಷಿ ಗುಪ್ತ](https://github.com/Vidushi-Gupta) ರವರು ಬರೆಯಲಾಗಿದೆ.
|
||||
|
||||
🍯 US ಹನಿ ಉತ್ಪಾದನೆಗೆ ಸಂಬಂಧಿಸಿದ ಡೇಟಾ ಜೆಸಿಕಾ ಲಿ ಅವರ ಪ್ರಾಜೆಕ್ಟ್ನಿಂದ [Kaggle](https://www.kaggle.com/jessicali9530/honey-production) ನಲ್ಲಿ ಪಡೆದಿದೆ. [ಡೇಟಾ](https://usda.library.cornell.edu/concern/publications/rn301137d) ಯು [ಯುನೈಟೆಡ್ ಸ್ಟೇಟ್ಸ್ ಡಿಪಾರ್ಟ್ಮೆಂಟ್ ಆಫ್ ಅಗ್ರಿಕಲ್ಚರ್](https://www.nass.usda.gov/About_NASS/index.php) ನಿಂದ ಪಡೆದಿದೆ.
|
||||
|
||||
🍄 ಕಾಳುಮರಿಗಳು ಸಂಬಂಧಿಸಿದ ಡೇಟಾ ಕೂಡ [Kaggle](https://www.kaggle.com/hatterasdunton/mushroom-classification-updated-dataset) ನಿಂದ ಹ್ಯಾಟೆರಾಸ್ ಡಂಟನ್ ಅವರಿಂದ ಪರಿಷ್ಕೃತವಾಗಿದೆ. ಈ ಡೇಟಾಸೆಟ್ 23 ಪ್ರಭೇದಗಳ ಗಿಲ್ಲುಳ್ಳ ಕಾಳುಮರಿಗಳ ಹೈಪೋಥೆಟಿಕಲ್ ಮಾದರಿಗಳ ವಿವರಣೆಗಳನ್ನು ಒಳಗೊಂಡಿದೆ, ಆಗರಿಕಸ್ ಮತ್ತು ಲೆಪಿಯೋಟಾ ಕುಟುಂಬಗಳಿಗೆ ಸಂಬಂಧಿಸಿದವು. ಕಾಳುಮರಿಗಳನ್ನು ನಾರ್ತ್ ಅಮೆರಿಕನ್ ಮಶ್ರೂಮ್ಗಳ ಆಡಿಯುಬನ್ ಸೊಸೈಟಿ ಫೀಲ್ಡ್ ಗೈಡ್ (1981) ನಿಂದ ಚಿತ್ರಿಸಲಾಗಿದೆ. ಈ ಡೇಟಾಸೆಟ್ 1987 ರಲ್ಲಿ UCI ML 27 ಗೆ ದಾನ ಮಾಡಲಾಯಿತು.
|
||||
|
||||
🦆 ಮಿನೆಸೋಟಾ ಪಕ್ಷಿಗಳ ಡೇಟಾ [Kaggle](https://www.kaggle.com/hannahcollins/minnesota-birds) ನಿಂದ [ವಿಕಿಪೀಡಿಯಾ](https://en.wikipedia.org/wiki/List_of_birds_of_Minnesota) ಯಿಂದ ಹನ್ನಾ ಕೊಲಿನ್ಸ್ ಅವರಿಂದ ಸ್ಕ್ರೇಪ್ ಮಾಡಲಾಗಿದೆ.
|
||||
|
||||
ಈ ಎಲ್ಲಾ ಡೇಟಾಸೆಟ್ಗಳು [CC0: ಕ್ರಿಯೇಟಿವ್ ಕಾಮನ್ಸ್](https://creativecommons.org/publicdomain/zero/1.0/) ಅಡಿಯಲ್ಲಿ ಪರವಾನಗಿ ಪಡೆದಿವೆ.
|
||||
|
||||
---
|
||||
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
|
||||
**ಅಸ್ವೀಕರಣ**:
|
||||
ಈ ದಸ್ತಾವೇಜು [Co-op Translator](https://github.com/Azure/co-op-translator) ಎಂಬ AI ಅನುವಾದ ಸೇವೆಯನ್ನು ಬಳಸಿ ಅನುವಾದಿಸಲಾಗಿದೆ. ನಾವು ಶುದ್ಧತೆಯತ್ತ ಪ್ರಯತ್ನಿಸುತ್ತಿದ್ದರೂ, ಸ್ವಯಂಚಾಲಿತ ಅನುವಾದಗಳಲ್ಲಿ ತಪ್ಪುಗಳು ಅಥವಾ ಅಸತ್ಯತೆಗಳು ಇರಬಹುದು ಎಂದು ದಯವಿಟ್ಟು ಗಮನಿಸಿ. ಮೂಲ ಭಾಷೆಯಲ್ಲಿರುವ ಮೂಲ ದಸ್ತಾವೇಜನ್ನು ಅಧಿಕೃತ ಮೂಲವೆಂದು ಪರಿಗಣಿಸಬೇಕು. ಮಹತ್ವದ ಮಾಹಿತಿಗಾಗಿ, ವೃತ್ತಿಪರ ಮಾನವ ಅನುವಾದವನ್ನು ಶಿಫಾರಸು ಮಾಡಲಾಗುತ್ತದೆ. ಈ ಅನುವಾದ ಬಳಕೆಯಿಂದ ಉಂಟಾಗುವ ಯಾವುದೇ ತಪ್ಪು ಅರ್ಥಮಾಡಿಕೊಳ್ಳುವಿಕೆ ಅಥವಾ ತಪ್ಪು ವಿವರಣೆಗಳಿಗೆ ನಾವು ಹೊಣೆಗಾರರಾಗುವುದಿಲ್ಲ.
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER END -->
|
||||
@ -0,0 +1,121 @@
|
||||
<!--
|
||||
CO_OP_TRANSLATOR_METADATA:
|
||||
{
|
||||
"original_hash": "07e12a25d20b8f191e3cb651c27fdb2b",
|
||||
"translation_date": "2025-12-19T15:27:40+00:00",
|
||||
"source_file": "4-Data-Science-Lifecycle/14-Introduction/README.md",
|
||||
"language_code": "kn"
|
||||
}
|
||||
-->
|
||||
# ಡೇಟಾ ಸೈನ್ಸ್ ಜೀವನಚಕ್ರಕ್ಕೆ ಪರಿಚಯ
|
||||
|
||||
| ಅವರಿಂದ ಸ್ಕೆಚ್ ನೋಟ್ ](../../sketchnotes/14-DataScience-Lifecycle.png)|
|
||||
|:---:|
|
||||
| ಡೇಟಾ ಸೈನ್ಸ್ ಜೀವನಚಕ್ರಕ್ಕೆ ಪರಿಚಯ - _[@nitya](https://twitter.com/nitya) ಅವರಿಂದ ಸ್ಕೆಚ್ ನೋಟ್_ |
|
||||
|
||||
## [ಪೂರ್ವ-ಲೇಕ್ಚರ್ ಕ್ವಿಜ್](https://ff-quizzes.netlify.app/en/ds/quiz/26)
|
||||
|
||||
ಈ ಸಮಯದಲ್ಲಿ ನೀವು ಬಹುಶಃ ತಿಳಿದುಕೊಂಡಿರಬಹುದು ಡೇಟಾ ಸೈನ್ಸ್ ಒಂದು ಪ್ರಕ್ರಿಯೆ ಎಂದು. ಈ ಪ್ರಕ್ರಿಯೆಯನ್ನು 5 ಹಂತಗಳಾಗಿ ವಿಭಜಿಸಬಹುದು:
|
||||
|
||||
- ಸೆರೆಹಿಡಿಯುವುದು
|
||||
- ಪ್ರಕ್ರಿಯೆಗೊಳಿಸುವುದು
|
||||
- ವಿಶ್ಲೇಷಣೆ
|
||||
- ಸಂವಹನ
|
||||
- ನಿರ್ವಹಣೆ
|
||||
|
||||
ಈ ಪಾಠವು ಜೀವನಚಕ್ರದ 3 ಭಾಗಗಳ ಮೇಲೆ ಕೇಂದ್ರೀಕರಿಸುತ್ತದೆ: ಸೆರೆಹಿಡಿಯುವುದು, ಪ್ರಕ್ರಿಯೆಗೊಳಿಸುವುದು ಮತ್ತು ನಿರ್ವಹಣೆ.
|
||||
|
||||

|
||||
> ಚಿತ್ರ: [ಬರ್ಕ್ಲಿ ಮಾಹಿತಿ ಶಾಲೆ](https://ischoolonline.berkeley.edu/data-science/what-is-data-science/)
|
||||
|
||||
## ಸೆರೆಹಿಡಿಯುವುದು
|
||||
|
||||
ಜೀವನಚಕ್ರದ ಮೊದಲ ಹಂತ ಬಹಳ ಮುಖ್ಯ, ಏಕೆಂದರೆ ಮುಂದಿನ ಹಂತಗಳು ಇದಕ್ಕೆ ಅವಲಂಬಿತವಾಗಿವೆ. ಇದು ಪ್ರಾಯೋಗಿಕವಾಗಿ ಎರಡು ಹಂತಗಳನ್ನು ಒಟ್ಟುಗೂಡಿಸಿದೆ: ಡೇಟಾವನ್ನು ಪಡೆಯುವುದು ಮತ್ತು ಪರಿಹರಿಸಬೇಕಾದ ಉದ್ದೇಶ ಮತ್ತು ಸಮಸ್ಯೆಗಳನ್ನು ನಿರ್ಧರಿಸುವುದು.
|
||||
ಪ್ರಾಜೆಕ್ಟಿನ ಗುರಿಗಳನ್ನು ನಿರ್ಧರಿಸುವುದು ಸಮಸ್ಯೆ ಅಥವಾ ಪ್ರಶ್ನೆಯ ಆಳವಾದ ಸನ್ನಿವೇಶವನ್ನು ಅಗತ್ಯವಿರುತ್ತದೆ. ಮೊದಲು, ನಾವು ಪರಿಹಾರ ಬೇಕಾದವರನ್ನು ಗುರುತಿಸಿ ಪಡೆಯಬೇಕು. ಇವರು ವ್ಯವಹಾರದ ಹಿತಾಸಕ್ತಿದಾರರು ಅಥವಾ ಪ್ರಾಜೆಕ್ಟಿನ ಪ್ರಾಯೋಜಕರು ಆಗಿರಬಹುದು, ಅವರು ಯಾರು ಅಥವಾ ಏನು ಈ ಪ್ರಾಜೆಕ್ಟಿನಿಂದ ಲಾಭ ಪಡೆಯುತ್ತಾರೋ ಮತ್ತು ಏಕೆ ಅವಶ್ಯಕತೆ ಇದೆ ಎಂದು ಗುರುತಿಸಲು ಸಹಾಯ ಮಾಡುತ್ತಾರೆ. ಚೆನ್ನಾಗಿ ನಿರ್ಧರಿಸಿದ ಗುರಿ ಅಳತೆ ಮಾಡಬಹುದಾದ ಮತ್ತು ಪ್ರಮಾಣೀಕರಿಸಬಹುದಾದ ಫಲಿತಾಂಶವನ್ನು ನಿರ್ಧರಿಸಬೇಕು.
|
||||
|
||||
ಡೇಟಾ ವಿಜ್ಞಾನಿ ಕೇಳಬಹುದಾದ ಪ್ರಶ್ನೆಗಳು:
|
||||
- ಈ ಸಮಸ್ಯೆಯನ್ನು ಮೊದಲು ಎದುರಿಸಲಾಗಿದೆ? ಏನು ಕಂಡುಬಂದಿತು?
|
||||
- ಉದ್ದೇಶ ಮತ್ತು ಗುರಿ ಎಲ್ಲರಿಗೂ ಅರ್ಥವಾಗಿದೆಯೇ?
|
||||
- ಅಸ್ಪಷ್ಟತೆ ಇದೆಯೇ ಮತ್ತು ಅದನ್ನು ಹೇಗೆ ಕಡಿಮೆ ಮಾಡುವುದು?
|
||||
- ನಿರ್ಬಂಧಗಳು ಯಾವುವು?
|
||||
- ಅಂತಿಮ ಫಲಿತಾಂಶ ಹೇಗಿರಬಹುದು?
|
||||
- ಎಷ್ಟು ಸಂಪನ್ಮೂಲಗಳು (ಸಮಯ, ಜನರು, ಗಣನೀಯ) ಲಭ್ಯವಿವೆ?
|
||||
|
||||
ಮುಂದೆ, ಈ ನಿರ್ಧರಿಸಿದ ಗುರಿಗಳನ್ನು ಸಾಧಿಸಲು ಅಗತ್ಯವಿರುವ ಡೇಟಾವನ್ನು ಗುರುತಿಸಿ, ಸಂಗ್ರಹಿಸಿ, ನಂತರ ಅನ್ವೇಷಿಸುವುದು. ಈ ಪಡೆಯುವ ಹಂತದಲ್ಲಿ, ಡೇಟಾ ವಿಜ್ಞಾನಿಗಳು ಡೇಟಾದ ಪ್ರಮಾಣ ಮತ್ತು ಗುಣಮಟ್ಟವನ್ನು ಮೌಲ್ಯಮಾಪನ ಮಾಡಬೇಕು. ಇದಕ್ಕಾಗಿ ಡೇಟಾ ಅನ್ವೇಷಣೆ ಅಗತ್ಯವಿದೆ, ಏಕೆಂದರೆ ಪಡೆದಿರುವುದು ಬಯಸಿದ ಫಲಿತಾಂಶವನ್ನು ಬೆಂಬಲಿಸುವುದೇ ಎಂದು ದೃಢೀಕರಿಸಲು.
|
||||
|
||||
ಡೇಟಾ ಬಗ್ಗೆ ಡೇಟಾ ವಿಜ್ಞಾನಿ ಕೇಳಬಹುದಾದ ಪ್ರಶ್ನೆಗಳು:
|
||||
- ನನಗೆ ಈಗಾಗಲೇ ಯಾವ ಡೇಟಾ ಲಭ್ಯವಿದೆ?
|
||||
- ಈ ಡೇಟಾ ಯಾರು ಹೊಂದಿದ್ದಾರೆ?
|
||||
- ಗೌಪ್ಯತೆ ಸಂಬಂಧಿ ಚಿಂತೆಗಳೇನು?
|
||||
- ಈ ಸಮಸ್ಯೆಯನ್ನು ಪರಿಹರಿಸಲು ನನಗೆ ಸಾಕಷ್ಟು ಡೇಟಾ ಇದೆಯೇ?
|
||||
- ಈ ಸಮಸ್ಯೆಗೆ ಡೇಟಾದ ಗುಣಮಟ್ಟ ತಕ್ಕಮಟ್ಟದಲ್ಲಿದೆಯೇ?
|
||||
- ಈ ಡೇಟಾದ ಮೂಲಕ ಹೆಚ್ಚುವರಿ ಮಾಹಿತಿ ಕಂಡುಬಂದರೆ, ಗುರಿಗಳನ್ನು ಬದಲಾಯಿಸುವ ಅಥವಾ ಮರುನಿರ್ಧರಿಸುವ ಬಗ್ಗೆ ಪರಿಗಣಿಸಬೇಕೇ?
|
||||
|
||||
## ಪ್ರಕ್ರಿಯೆಗೊಳಿಸುವುದು
|
||||
|
||||
ಜೀವನಚಕ್ರದ ಪ್ರಕ್ರಿಯೆ ಹಂತವು ಡೇಟಾದಲ್ಲಿನ ಮಾದರಿಗಳನ್ನು ಕಂಡುಹಿಡಿಯುವುದರ ಜೊತೆಗೆ ಮಾದರಿಗಳನ್ನು ನಿರ್ಮಿಸುವುದರ ಮೇಲೆ ಕೇಂದ್ರೀಕರಿಸುತ್ತದೆ. ಪ್ರಕ್ರಿಯೆ ಹಂತದಲ್ಲಿ ಬಳಸುವ ಕೆಲವು ತಂತ್ರಗಳು ಮಾದರಿಗಳನ್ನು ಅನಾವರಣಗೊಳಿಸಲು ಸಂಖ್ಯಾಶಾಸ್ತ್ರೀಯ ವಿಧಾನಗಳನ್ನು ಅಗತ್ಯವಿರುತ್ತದೆ. ಸಾಮಾನ್ಯವಾಗಿ, ದೊಡ್ಡ ಡೇಟಾ ಸೆಟ್ನೊಂದಿಗೆ ಮಾನವನಿಗೆ ಇದು ಕಷ್ಟಕರ ಕೆಲಸವಾಗಿದ್ದು, ಪ್ರಕ್ರಿಯೆಯನ್ನು ವೇಗಗೊಳಿಸಲು ಕಂಪ್ಯೂಟರ್ಗಳ ಮೇಲೆ ಅವಲಂಬಿತವಾಗಿರುತ್ತದೆ. ಈ ಹಂತದಲ್ಲಿ ಡೇಟಾ ಸೈನ್ಸ್ ಮತ್ತು ಯಂತ್ರ ಅಧ್ಯಯನ (machine learning) ಸಂಧಿಸುತ್ತವೆ. ಮೊದಲ ಪಾಠದಲ್ಲಿ ನೀವು ಕಲಿತಂತೆ, ಯಂತ್ರ ಅಧ್ಯಯನವು ಡೇಟಾವನ್ನು ಅರ್ಥಮಾಡಿಕೊಳ್ಳಲು ಮಾದರಿಗಳನ್ನು ನಿರ್ಮಿಸುವ ಪ್ರಕ್ರಿಯೆ. ಮಾದರಿಗಳು ಡೇಟಾದಲ್ಲಿನ ಚರಗಳ ನಡುವಿನ ಸಂಬಂಧವನ್ನು ಪ್ರತಿನಿಧಿಸುತ್ತವೆ ಮತ್ತು ಫಲಿತಾಂಶಗಳನ್ನು ಭವಿಷ್ಯವಾಣಿ ಮಾಡಲು ಸಹಾಯ ಮಾಡುತ್ತವೆ.
|
||||
|
||||
ಈ ಹಂತದಲ್ಲಿ ಸಾಮಾನ್ಯವಾಗಿ ಬಳಸುವ ತಂತ್ರಗಳು ML for Beginners ಪಠ್ಯಕ್ರಮದಲ್ಲಿ ಒಳಗೊಂಡಿವೆ. ಅವುಗಳ ಬಗ್ಗೆ ತಿಳಿಯಲು ಕೆಳಗಿನ ಲಿಂಕ್ಗಳನ್ನು ಅನುಸರಿಸಿ:
|
||||
|
||||
- [ವರ್ಗೀಕರಣ](https://github.com/microsoft/ML-For-Beginners/tree/main/4-Classification): ಡೇಟಾವನ್ನು ವರ್ಗಗಳಾಗಿ ಸಂಘಟಿಸುವುದು, ಹೆಚ್ಚು ಪರಿಣಾಮಕಾರಿಯಾಗಿ ಬಳಸಲು.
|
||||
- [ಗುಚ್ಛೀಕರಣ](https://github.com/microsoft/ML-For-Beginners/tree/main/5-Clustering): ಸಮಾನ ಗುಚ್ಛಗಳಾಗಿ ಡೇಟಾವನ್ನು ಗುಚ್ಛೀಕರಿಸುವುದು.
|
||||
- [ಪ್ರತಿಗಮನ](https://github.com/microsoft/ML-For-Beginners/tree/main/2-Regression): ಮೌಲ್ಯಗಳನ್ನು ಭವಿಷ್ಯವಾಣಿ ಮಾಡಲು ಚರಗಳ ನಡುವಿನ ಸಂಬಂಧಗಳನ್ನು ನಿರ್ಧರಿಸುವುದು.
|
||||
|
||||
## ನಿರ್ವಹಣೆ
|
||||
ಜೀವನಚಕ್ರದ ಚಿತ್ರಣದಲ್ಲಿ, ನೀವು ಗಮನಿಸಿದ್ದೀರಾ ನಿರ್ವಹಣೆ ಸೆರೆಹಿಡಿಯುವುದು ಮತ್ತು ಪ್ರಕ್ರಿಯೆಗೊಳಿಸುವುದರ ನಡುವೆ ಇದೆ. ನಿರ್ವಹಣೆ ಒಂದು ನಿರಂತರ ಪ್ರಕ್ರಿಯೆಯಾಗಿದೆ, ಪ್ರಾಜೆಕ್ಟಿನ ಪ್ರಕ್ರಿಯೆಗೊಳಿಸುವುದರಲ್ಲಿಯೂ ಡೇಟಾವನ್ನು ನಿರ್ವಹಿಸುವುದು, ಸಂಗ್ರಹಿಸುವುದು ಮತ್ತು ಸುರಕ್ಷಿತವಾಗಿಡುವುದು ಮತ್ತು ಪ್ರಾಜೆಕ್ಟಿನ ಸಂಪೂರ್ಣ ಅವಧಿಯಲ್ಲಿ ಪರಿಗಣಿಸಬೇಕಾಗಿದೆ.
|
||||
|
||||
### ಡೇಟಾ ಸಂಗ್ರಹಣೆ
|
||||
ಡೇಟಾವನ್ನು ಹೇಗೆ ಮತ್ತು ಎಲ್ಲಿಗೆ ಸಂಗ್ರಹಿಸುವುದು ಎಂಬ ವಿಚಾರಗಳು ಅದರ ಸಂಗ್ರಹಣೆಯ ವೆಚ್ಚ ಮತ್ತು ಡೇಟಾ ತ್ವರಿತವಾಗಿ ಪ್ರವೇಶಿಸುವ ಕಾರ್ಯಕ್ಷಮತೆಯನ್ನು ಪ್ರಭಾವಿಸುತ್ತವೆ. ಇಂತಹ ನಿರ್ಧಾರಗಳನ್ನು ಡೇಟಾ ವಿಜ್ಞಾನಿ ಒಬ್ಬನೇ ಮಾಡುವುದು ಸಾಧ್ಯವಿಲ್ಲ, ಆದರೆ ಡೇಟಾ ಸಂಗ್ರಹಣೆಯ ಆಧಾರದ ಮೇಲೆ ಡೇಟಾ ಜೊತೆ ಹೇಗೆ ಕೆಲಸ ಮಾಡಬೇಕೆಂದು ಆಯ್ಕೆಮಾಡಬಹುದು.
|
||||
|
||||
ಇವು ಕೆಲವು ಆಧುನಿಕ ಡೇಟಾ ಸಂಗ್ರಹಣಾ ವ್ಯವಸ್ಥೆಗಳ ಅಂಶಗಳು, ಅವು ಈ ಆಯ್ಕೆಗಳನ್ನು ಪ್ರಭಾವಿಸುತ್ತವೆ:
|
||||
|
||||
**ಆನ್ ಪ್ರೆಮೈಸ್ vs ಆಫ್ ಪ್ರೆಮೈಸ್ vs ಸಾರ್ವಜನಿಕ ಅಥವಾ ಖಾಸಗಿ ಕ್ಲೌಡ್**
|
||||
|
||||
ಆನ್ ಪ್ರೆಮೈಸ್ ಎಂದರೆ ನಿಮ್ಮ ಸ್ವಂತ ಉಪಕರಣಗಳಲ್ಲಿ ಡೇಟಾವನ್ನು ನಿರ್ವಹಿಸುವುದು, ಉದಾಹರಣೆಗೆ ಡೇಟಾವನ್ನು ಸಂಗ್ರಹಿಸುವ ಹಾರ್ಡ್ ಡ್ರೈವ್ಗಳಿರುವ ಸರ್ವರ್ ಹೊಂದಿರುವುದು, ಆದರೆ ಆಫ್ ಪ್ರೆಮೈಸ್ ಎಂದರೆ ನೀವು ಹೊಂದಿಲ್ಲದ ಉಪಕರಣಗಳ ಮೇಲೆ ಅವಲಂಬಿತವಾಗಿರುವುದು, ಉದಾಹರಣೆಗೆ ಡೇಟಾ ಸೆಂಟರ್. ಸಾರ್ವಜನಿಕ ಕ್ಲೌಡ್ ಒಂದು ಜನಪ್ರಿಯ ಆಯ್ಕೆ, ಇದರಲ್ಲಿ ಡೇಟಾ ಹೇಗೆ ಮತ್ತು ಎಲ್ಲಿಗೆ ಸಂಗ್ರಹಿಸಲಾಗಿದೆ ಎಂಬುದರ ಬಗ್ಗೆ ತಿಳಿವಳಿಕೆ ಅಗತ್ಯವಿಲ್ಲ, ಸಾರ್ವಜನಿಕ ಎಂದರೆ ಕ್ಲೌಡ್ ಬಳಸುವ ಎಲ್ಲರಿಗೂ ಹಂಚಿಕೊಳ್ಳುವ ಒಕ್ಕೂಟದ ಮೂಲಭೂತ ಮೂಲಸೌಕರ್ಯ. ಕೆಲವು ಸಂಸ್ಥೆಗಳು ಕಟ್ಟುನಿಟ್ಟಾದ ಭದ್ರತಾ ನೀತಿಗಳನ್ನು ಹೊಂದಿದ್ದು, ಡೇಟಾ ಹೋಸ್ಟ್ ಆಗಿರುವ ಉಪಕರಣಗಳಿಗೆ ಸಂಪೂರ್ಣ ಪ್ರವೇಶ ಹೊಂದಬೇಕೆಂದು ಬಯಸುತ್ತವೆ ಮತ್ತು ತಮ್ಮದೇ ಖಾಸಗಿ ಕ್ಲೌಡ್ ಸೇವೆಗಳನ್ನು ಬಳಸುತ್ತವೆ. ನೀವು [ನಂತರದ ಪಾಠಗಳಲ್ಲಿ](https://github.com/microsoft/Data-Science-For-Beginners/tree/main/5-Data-Science-In-Cloud) ಕ್ಲೌಡ್ನಲ್ಲಿನ ಡೇಟಾ ಬಗ್ಗೆ ಹೆಚ್ಚು ತಿಳಿಯುತ್ತೀರಿ.
|
||||
|
||||
**ತಣಿತ ಡೇಟಾ vs ಬಿಸಿ ಡೇಟಾ**
|
||||
|
||||
ನಿಮ್ಮ ಮಾದರಿಗಳನ್ನು ತರಬೇತುಗೊಳಿಸುವಾಗ, ನೀವು ಹೆಚ್ಚು ತರಬೇತಿ ಡೇಟಾ ಬೇಕಾಗಬಹುದು. ನಿಮ್ಮ ಮಾದರಿಯಿಂದ ತೃಪ್ತರಾಗಿದ್ದರೆ, ಇನ್ನಷ್ಟು ಡೇಟಾ ಬರುತ್ತದೆ, ಮಾದರಿ ತನ್ನ ಉದ್ದೇಶವನ್ನು ಸೇವೆ ಮಾಡುತ್ತದೆ. ಯಾವುದೇ ಸಂದರ್ಭದಲ್ಲಿಯೂ, ಡೇಟಾ ಸಂಗ್ರಹಣೆ ಮತ್ತು ಪ್ರವೇಶಿಸುವ ವೆಚ್ಚವು ಹೆಚ್ಚಾಗುತ್ತದೆ. ಕಡಿಮೆ ಬಳಕೆಯ ಡೇಟಾವನ್ನು (ತಣಿತ ಡೇಟಾ) ಮತ್ತು ಹೆಚ್ಚು ಪ್ರವೇಶಿಸುವ ಡೇಟಾವನ್ನು (ಬಿಸಿ ಡೇಟಾ) ವಿಭಜಿಸುವುದು, ಹಾರ್ಡ್ವೇರ್ ಅಥವಾ ಸಾಫ್ಟ್ವೇರ್ ಸೇವೆಗಳ ಮೂಲಕ ಕಡಿಮೆ ವೆಚ್ಚದ ಡೇಟಾ ಸಂಗ್ರಹಣೆಯ ಆಯ್ಕೆಯಾಗಬಹುದು. ತಣಿತ ಡೇಟಾವನ್ನು ಪ್ರವೇಶಿಸುವಾಗ, ಬಿಸಿ ಡೇಟಾ ಹೋಲಿಸಿದರೆ ಸ್ವಲ್ಪ ಹೆಚ್ಚು ಸಮಯ ತೆಗೆದುಕೊಳ್ಳಬಹುದು.
|
||||
|
||||
### ಡೇಟಾ ನಿರ್ವಹಣೆ
|
||||
ನೀವು ಡೇಟಾ ಜೊತೆ ಕೆಲಸ ಮಾಡುವಾಗ, ಕೆಲವು ಡೇಟಾವನ್ನು ಸ್ವಚ್ಛಗೊಳಿಸುವ ಅಗತ್ಯವಿರಬಹುದು, ಇದು [ಡೇಟಾ ತಯಾರಿಕೆ](https://github.com/microsoft/Data-Science-For-Beginners/tree/main/2-Working-With-Data/08-data-preparation) ಪಾಠದಲ್ಲಿ ಒಳಗೊಂಡ ತಂತ್ರಗಳನ್ನು ಬಳಸಬಹುದು, ಸರಿಯಾದ ಮಾದರಿಗಳನ್ನು ನಿರ್ಮಿಸಲು. ಹೊಸ ಡೇಟಾ ಬಂದಾಗ, ಗುಣಮಟ್ಟದಲ್ಲಿ ಸತತತೆ ಕಾಯ್ದುಕೊಳ್ಳಲು ಅದೇ ಅನ್ವಯಿಕೆಗಳು ಬೇಕಾಗಬಹುದು. ಕೆಲವು ಪ್ರಾಜೆಕ್ಟುಗಳು ಸ್ವಯಂಚಾಲಿತ ಸಾಧನಗಳನ್ನು ಬಳಸುತ್ತವೆ, ಸ್ವಚ್ಛಗೊಳಿಸುವಿಕೆ, ಸಂಗ್ರಹಣೆ ಮತ್ತು ಸಂಕುಚಿತಗೊಳಿಸುವಿಕೆಗಾಗಿ, ನಂತರ ಡೇಟಾವನ್ನು ಅಂತಿಮ ಸ್ಥಳಕ್ಕೆ ಕಳುಹಿಸುವ ಮೊದಲು. Azure Data Factory ಇವುಗಳಲ್ಲಿ ಒಂದು ಉದಾಹರಣೆ.
|
||||
|
||||
### ಡೇಟಾ ಸುರಕ್ಷತೆ
|
||||
ಡೇಟಾ ಸುರಕ್ಷತೆಯ ಪ್ರಮುಖ ಗುರಿಗಳಲ್ಲಿ ಒಂದಾಗಿದೆ, ಡೇಟಾ ಕೆಲಸ ಮಾಡುವವರು ಏನು ಸಂಗ್ರಹಿಸುತ್ತಿದ್ದಾರೆ ಮತ್ತು ಯಾವ ಸನ್ನಿವೇಶದಲ್ಲಿ ಬಳಸಲಾಗುತ್ತಿದೆ ಎಂಬುದರ ನಿಯಂತ್ರಣದಲ್ಲಿರುವುದು. ಡೇಟಾವನ್ನು ಸುರಕ್ಷಿತವಾಗಿಡುವುದು, ಅದಕ್ಕೆ ಪ್ರವೇಶ ಹೊಂದಬೇಕಾದವರಿಗೆ ಮಾತ್ರ ಪ್ರವೇಶವನ್ನು ಮಿತಿಗೊಳಿಸುವುದು, ಸ್ಥಳೀಯ ಕಾನೂನುಗಳು ಮತ್ತು ನಿಯಮಗಳನ್ನು ಪಾಲಿಸುವುದು, ಮತ್ತು ನೈತಿಕ ಮಾನದಂಡಗಳನ್ನು ಕಾಯ್ದುಕೊಳ್ಳುವುದು, [ನೈತಿಕತೆ ಪಾಠದಲ್ಲಿ](https://github.com/microsoft/Data-Science-For-Beginners/tree/main/1-Introduction/02-ethics) ವಿವರಿಸಲಾಗಿದೆ.
|
||||
|
||||
ಸುರಕ್ಷತೆಗಾಗಿ ತಂಡ ಮಾಡಬಹುದಾದ ಕೆಲವು ಕಾರ್ಯಗಳು:
|
||||
- ಎಲ್ಲಾ ಡೇಟಾ ಎನ್ಕ್ರಿಪ್ಟ್ ಆಗಿರುವುದನ್ನು ದೃಢೀಕರಿಸುವುದು
|
||||
- ಗ್ರಾಹಕರಿಗೆ ಅವರ ಡೇಟಾ ಹೇಗೆ ಬಳಸಲಾಗುತ್ತಿದೆ ಎಂಬ ಮಾಹಿತಿ ನೀಡುವುದು
|
||||
- ಪ್ರಾಜೆಕ್ಟ್ ಬಿಟ್ಟುಹೋಗಿದವರಿಂದ ಡೇಟಾ ಪ್ರವೇಶವನ್ನು ತೆಗೆದುಹಾಕುವುದು
|
||||
- ಕೆಲವು ಪ್ರಾಜೆಕ್ಟ್ ಸದಸ್ಯರಿಗೆ ಮಾತ್ರ ಡೇಟಾ ಬದಲಾಯಿಸಲು ಅವಕಾಶ ನೀಡುವುದು
|
||||
|
||||
## 🚀 ಸವಾಲು
|
||||
|
||||
ಡೇಟಾ ಸೈನ್ಸ್ ಜೀವನಚಕ್ರದ ಅನೇಕ ಆವೃತ್ತಿಗಳು ಇವೆ, ಪ್ರತಿಯೊಂದು ಹಂತವು ವಿಭಿನ್ನ ಹೆಸರುಗಳು ಮತ್ತು ಹಂತಗಳ ಸಂಖ್ಯೆಯನ್ನು ಹೊಂದಿರಬಹುದು ಆದರೆ ಈ ಪಾಠದಲ್ಲಿ ಉಲ್ಲೇಖಿಸಿದ ಪ್ರಕ್ರಿಯೆಗಳೇ ಇರುತ್ತವೆ.
|
||||
|
||||
[ಟೀಮ್ ಡೇಟಾ ಸೈನ್ಸ್ ಪ್ರಕ್ರಿಯೆ ಜೀವನಚಕ್ರ](https://docs.microsoft.com/en-us/azure/architecture/data-science-process/lifecycle) ಮತ್ತು [ಕ್ರಾಸ್-ಇಂಡಸ್ಟ್ರಿ ಸ್ಟ್ಯಾಂಡರ್ಡ್ ಪ್ರಕ್ರಿಯೆ ಫಾರ್ ಡೇಟಾ ಮೈನಿಂಗ್](https://www.datascience-pm.com/crisp-dm-2/) ಅನ್ನು ಅನ್ವೇಷಿಸಿ. ಎರಡರ ನಡುವೆ 3 ಸಾಮ್ಯತೆಗಳು ಮತ್ತು ಭೇದಗಳನ್ನು ಹೆಸರಿಸಿ.
|
||||
|
||||
|ಟೀಮ್ ಡೇಟಾ ಸೈನ್ಸ್ ಪ್ರಕ್ರಿಯೆ (TDSP)|ಕ್ರಾಸ್-ಇಂಡಸ್ಟ್ರಿ ಸ್ಟ್ಯಾಂಡರ್ಡ್ ಪ್ರಕ್ರಿಯೆ ಫಾರ್ ಡೇಟಾ ಮೈನಿಂಗ್ (CRISP-DM)|
|
||||
|--|--|
|
||||
| |  |
|
||||
| ಚಿತ್ರ: [Microsoft](https://docs.microsoft.comazure/architecture/data-science-process/lifecycle) | ಚಿತ್ರ: [ಡೇಟಾ ಸೈನ್ಸ್ ಪ್ರಕ್ರಿಯೆ ಅಲಯನ್ಸ್](https://www.datascience-pm.com/crisp-dm-2/) |
|
||||
|
||||
## [ಪೋಸ್ಟ್-ಲೇಕ್ಚರ್ ಕ್ವಿಜ್](https://ff-quizzes.netlify.app/en/ds/quiz/27)
|
||||
|
||||
## ವಿಮರ್ಶೆ ಮತ್ತು ಸ್ವಯಂ ಅಧ್ಯಯನ
|
||||
|
||||
ಡೇಟಾ ಸೈನ್ಸ್ ಜೀವನಚಕ್ರವನ್ನು ಅನ್ವಯಿಸುವುದು ಹಲವಾರು ಪಾತ್ರಗಳು ಮತ್ತು ಕಾರ್ಯಗಳನ್ನು ಒಳಗೊಂಡಿದೆ, ಕೆಲವು ವ್ಯಕ್ತಿಗಳು ಪ್ರತಿ ಹಂತದ ನಿರ್ದಿಷ್ಟ ಭಾಗಗಳ ಮೇಲೆ ಕೇಂದ್ರೀಕರಿಸುತ್ತಾರೆ. ಟೀಮ್ ಡೇಟಾ ಸೈನ್ಸ್ ಪ್ರಕ್ರಿಯೆ ಕೆಲವು ಸಂಪನ್ಮೂಲಗಳನ್ನು ಒದಗಿಸುತ್ತದೆ, ಅವು ಪ್ರಾಜೆಕ್ಟಿನಲ್ಲಿ ಯಾರಿಗೆ ಯಾವ ರೀತಿಯ ಪಾತ್ರಗಳು ಮತ್ತು ಕಾರ್ಯಗಳಿರಬಹುದು ಎಂಬುದನ್ನು ವಿವರಿಸುತ್ತವೆ.
|
||||
|
||||
* [ಟೀಮ್ ಡೇಟಾ ಸೈನ್ಸ್ ಪ್ರಕ್ರಿಯೆ ಪಾತ್ರಗಳು ಮತ್ತು ಕಾರ್ಯಗಳು](https://docs.microsoft.com/en-us/azure/architecture/data-science-process/roles-tasks)
|
||||
* [ಡೇಟಾ ಸೈನ್ಸ್ ಕಾರ್ಯಗಳನ್ನು ನಿರ್ವಹಿಸುವುದು: ಅನ್ವೇಷಣೆ, ಮಾದರೀಕರಣ ಮತ್ತು ನಿಯೋಜನೆ](https://docs.microsoft.com/en-us/azure/architecture/data-science-process/execute-data-science-tasks)
|
||||
|
||||
## ನಿಯೋಜನೆ
|
||||
|
||||
[ಡೇಟಾಸೆಟ್ ಮೌಲ್ಯಮಾಪನ](assignment.md)
|
||||
|
||||
---
|
||||
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
|
||||
**ಅಸ್ವೀಕಾರ**:
|
||||
ಈ ದಸ್ತಾವೇಜು AI ಅನುವಾದ ಸೇವೆ [Co-op Translator](https://github.com/Azure/co-op-translator) ಬಳಸಿ ಅನುವಾದಿಸಲಾಗಿದೆ. ನಾವು ನಿಖರತೆಯಿಗಾಗಿ ಪ್ರಯತ್ನಿಸುತ್ತಿದ್ದರೂ, ಸ್ವಯಂಚಾಲಿತ ಅನುವಾದಗಳಲ್ಲಿ ತಪ್ಪುಗಳು ಅಥವಾ ಅಸತ್ಯತೆಗಳು ಇರಬಹುದು ಎಂದು ದಯವಿಟ್ಟು ಗಮನಿಸಿ. ಮೂಲ ಭಾಷೆಯಲ್ಲಿರುವ ಮೂಲ ದಸ್ತಾವೇಜನ್ನು ಅಧಿಕೃತ ಮೂಲವೆಂದು ಪರಿಗಣಿಸಬೇಕು. ಮಹತ್ವದ ಮಾಹಿತಿಗಾಗಿ ವೃತ್ತಿಪರ ಮಾನವ ಅನುವಾದವನ್ನು ಶಿಫಾರಸು ಮಾಡಲಾಗುತ್ತದೆ. ಈ ಅನುವಾದ ಬಳಕೆಯಿಂದ ಉಂಟಾಗುವ ಯಾವುದೇ ತಪ್ಪು ಅರ್ಥಮಾಡಿಕೊಳ್ಳುವಿಕೆ ಅಥವಾ ತಪ್ಪು ವಿವರಣೆಗಳಿಗೆ ನಾವು ಹೊಣೆಗಾರರಾಗುವುದಿಲ್ಲ.
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER END -->
|
||||
@ -0,0 +1,39 @@
|
||||
<!--
|
||||
CO_OP_TRANSLATOR_METADATA:
|
||||
{
|
||||
"original_hash": "564445c39ad29a491abcb9356fc4d47d",
|
||||
"translation_date": "2025-12-19T15:29:05+00:00",
|
||||
"source_file": "4-Data-Science-Lifecycle/14-Introduction/assignment.md",
|
||||
"language_code": "kn"
|
||||
}
|
||||
-->
|
||||
# ಡೇಟಾಸೆಟ್ ಅನ್ನು ಅಂದಾಜಿಸುವುದು
|
||||
|
||||
ನಿಮ್ಮ ತಂಡಕ್ಕೆ ನ್ಯೂಯಾರ್ಕ್ ನಗರದಲ್ಲಿ ಟ್ಯಾಕ್ಸಿ ಗ್ರಾಹಕರ ಋತುಮಾನ ಖರ್ಚು عادತಗಳನ್ನು ಪರಿಶೀಲಿಸಲು ಸಹಾಯ ಮಾಡಲು ಒಂದು ಗ್ರಾಹಕ ಸಂಪರ್ಕಿಸಿದ್ದಾರೆ.
|
||||
|
||||
ಅವರು ತಿಳಿಯಲು ಬಯಸುತ್ತಾರೆ: **ನ್ಯೂಯಾರ್ಕ್ ನಗರದಲ್ಲಿ ಹಳದಿ ಟ್ಯಾಕ್ಸಿ ಪ್ರಯಾಣಿಕರು ಚಳಿಗಾಲದಲ್ಲಿ ಅಥವಾ ಬೇಸಿಗೆಯಲ್ಲಿ ಚಾಲಕರಿಗೆ ಹೆಚ್ಚು ಟಿಪ್ ನೀಡುತ್ತಾರಾ?**
|
||||
|
||||
ನಿಮ್ಮ ತಂಡ ಡೇಟಾ ಸೈನ್ಸ್ ಜೀವನಚಕ್ರದ [ಕ್ಯಾಪ್ಚರಿಂಗ್](Readme.md#Capturing) ಹಂತದಲ್ಲಿದ್ದು, ನೀವು ಡೇಟಾಸೆಟ್ ನಿರ್ವಹಣೆಗೆ ಜವಾಬ್ದಾರರಾಗಿದ್ದೀರಿ. ನೀವು ಪರಿಶೀಲಿಸಲು ಒಂದು ನೋಟ್ಬುಕ್ ಮತ್ತು [ಡೇಟಾ](../../../../data/taxi.csv) ಅನ್ನು ಒದಗಿಸಲಾಗಿದೆ.
|
||||
|
||||
ಈ ಡೈರೆಕ್ಟರಿಯಲ್ಲಿ [ನೋಟ್ಬುಕ್](notebook.ipynb) ಇದೆ, ಇದು ಪೈಥಾನ್ ಬಳಸಿ [NYC ಟ್ಯಾಕ್ಸಿ & ಲಿಮೋಸಿನ್ ಕಮಿಷನ್](https://docs.microsoft.com/en-us/azure/open-datasets/dataset-taxi-yellow?tabs=azureml-opendatasets) ನಿಂದ ಹಳದಿ ಟ್ಯಾಕ್ಸಿ ಪ್ರಯಾಣದ ಡೇಟಾವನ್ನು ಲೋಡ್ ಮಾಡುತ್ತದೆ.
|
||||
ನೀವು ಟ್ಯಾಕ್ಸಿ ಡೇಟಾ ಫೈಲ್ ಅನ್ನು ಪಠ್ಯ ಸಂಪಾದಕ ಅಥವಾ ಎಕ್ಸೆಲ್ ಮುಂತಾದ ಸ್ಪ್ರೆಡ್ಶೀಟ್ ಸಾಫ್ಟ್ವೇರ್ನಲ್ಲಿ ಕೂಡ ತೆರೆಯಬಹುದು.
|
||||
|
||||
## ಸೂಚನೆಗಳು
|
||||
|
||||
- ಈ ಡೇಟಾಸೆಟ್ನಲ್ಲಿರುವ ಡೇಟಾ ಪ್ರಶ್ನೆಗೆ ಉತ್ತರಿಸಲು ಸಹಾಯ ಮಾಡಬಹುದೇ ಎಂದು ಅಂದಾಜಿಸಿ.
|
||||
- [NYC ಓಪನ್ ಡೇಟಾ ಕ್ಯಾಟಲಾಗ್](https://data.cityofnewyork.us/browse?sortBy=most_accessed&utf8=%E2%9C%93) ಅನ್ನು ಅನ್ವೇಷಿಸಿ. ಗ್ರಾಹಕರ ಪ್ರಶ್ನೆಗೆ ಉತ್ತರಿಸಲು ಸಹಾಯವಾಗಬಹುದಾದ ಮತ್ತೊಂದು ಡೇಟಾಸೆಟ್ ಅನ್ನು ಗುರುತಿಸಿ.
|
||||
- ಸಮಸ್ಯೆಯ ಬಗ್ಗೆ ಹೆಚ್ಚಿನ ಸ್ಪಷ್ಟತೆ ಮತ್ತು ಉತ್ತಮ ಅರ್ಥಮಾಡಿಕೊಳ್ಳಲು ನೀವು ಗ್ರಾಹಕರಿಗೆ ಕೇಳಬಹುದಾದ 3 ಪ್ರಶ್ನೆಗಳನ್ನು ಬರೆಯಿರಿ.
|
||||
|
||||
ಡೇಟಾ ಬಗ್ಗೆ ಹೆಚ್ಚಿನ ಮಾಹಿತಿಗಾಗಿ [ಡೇಟಾಸೆಟ್ನ ಡಿಕ್ಷನರಿ](https://www1.nyc.gov/assets/tlc/downloads/pdf/data_dictionary_trip_records_yellow.pdf) ಮತ್ತು [ಬಳಕೆದಾರ ಮಾರ್ಗದರ್ಶಿ](https://www1.nyc.gov/assets/tlc/downloads/pdf/trip_record_user_guide.pdf) ಅನ್ನು ನೋಡಿ.
|
||||
|
||||
## ರೂಬ್ರಿಕ್
|
||||
|
||||
ಉತ್ತಮ | ತೃಪ್ತಿಕರ | ಸುಧಾರಣೆ ಅಗತ್ಯ
|
||||
--- | --- | --
|
||||
|
||||
---
|
||||
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
|
||||
**ಅಸ್ವೀಕರಣ**:
|
||||
ಈ ದಸ್ತಾವೇಜು [Co-op Translator](https://github.com/Azure/co-op-translator) ಎಂಬ AI ಅನುವಾದ ಸೇವೆಯನ್ನು ಬಳಸಿ ಅನುವಾದಿಸಲಾಗಿದೆ. ನಾವು ಶುದ್ಧತೆಯತ್ತ ಪ್ರಯತ್ನಿಸುತ್ತಿದ್ದರೂ, ಸ್ವಯಂಚಾಲಿತ ಅನುವಾದಗಳಲ್ಲಿ ತಪ್ಪುಗಳು ಅಥವಾ ಅಸತ್ಯತೆಗಳು ಇರಬಹುದು ಎಂದು ದಯವಿಟ್ಟು ಗಮನಿಸಿ. ಮೂಲ ಭಾಷೆಯಲ್ಲಿರುವ ಮೂಲ ದಸ್ತಾವೇಜನ್ನು ಅಧಿಕೃತ ಮೂಲವೆಂದು ಪರಿಗಣಿಸಬೇಕು. ಮಹತ್ವದ ಮಾಹಿತಿಗಾಗಿ, ವೃತ್ತಿಪರ ಮಾನವ ಅನುವಾದವನ್ನು ಶಿಫಾರಸು ಮಾಡಲಾಗುತ್ತದೆ. ಈ ಅನುವಾದ ಬಳಕೆಯಿಂದ ಉಂಟಾಗುವ ಯಾವುದೇ ತಪ್ಪು ಅರ್ಥಮಾಡಿಕೊಳ್ಳುವಿಕೆ ಅಥವಾ ತಪ್ಪು ವಿವರಣೆಗಳಿಗೆ ನಾವು ಹೊಣೆಗಾರರಾಗುವುದಿಲ್ಲ.
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER END -->
|
||||
@ -0,0 +1,140 @@
|
||||
{
|
||||
"cells": [
|
||||
{
|
||||
"cell_type": "markdown",
|
||||
"source": [
|
||||
"# ಶೀತಕಾಲ ಮತ್ತು ಬೇಸಿಗೆಗಳಲ್ಲಿ NYC ಟ್ಯಾಕ್ಸಿ ಡೇಟಾ\n",
|
||||
"\n",
|
||||
"ಕೊಟ್ಟಿರುವ ಕಾಲಮ್ಗಳ ಬಗ್ಗೆ ಹೆಚ್ಚಿನ ಮಾಹಿತಿಗಾಗಿ [ಡೇಟಾ ನಿಘಂಟು](https://www1.nyc.gov/assets/tlc/downloads/pdf/data_dictionary_trip_records_yellow.pdf) ಅನ್ನು ನೋಡಿ.\n"
|
||||
],
|
||||
"metadata": {}
|
||||
},
|
||||
{
|
||||
"cell_type": "code",
|
||||
"execution_count": null,
|
||||
"source": [
|
||||
"#Install the pandas library\r\n",
|
||||
"!pip install pandas"
|
||||
],
|
||||
"outputs": [],
|
||||
"metadata": {
|
||||
"scrolled": true
|
||||
}
|
||||
},
|
||||
{
|
||||
"cell_type": "code",
|
||||
"execution_count": 7,
|
||||
"source": [
|
||||
"import pandas as pd\r\n",
|
||||
"\r\n",
|
||||
"path = '../../data/taxi.csv'\r\n",
|
||||
"\r\n",
|
||||
"#Load the csv file into a dataframe\r\n",
|
||||
"df = pd.read_csv(path)\r\n",
|
||||
"\r\n",
|
||||
"#Print the dataframe\r\n",
|
||||
"print(df)\r\n"
|
||||
],
|
||||
"outputs": [
|
||||
{
|
||||
"output_type": "stream",
|
||||
"name": "stdout",
|
||||
"text": [
|
||||
" VendorID tpep_pickup_datetime tpep_dropoff_datetime passenger_count \\\n",
|
||||
"0 2.0 2019-07-15 16:27:53 2019-07-15 16:44:21 3.0 \n",
|
||||
"1 2.0 2019-07-17 20:26:35 2019-07-17 20:40:09 6.0 \n",
|
||||
"2 2.0 2019-07-06 16:01:08 2019-07-06 16:10:25 1.0 \n",
|
||||
"3 1.0 2019-07-18 22:32:23 2019-07-18 22:35:08 1.0 \n",
|
||||
"4 2.0 2019-07-19 14:54:29 2019-07-19 15:19:08 1.0 \n",
|
||||
".. ... ... ... ... \n",
|
||||
"195 2.0 2019-01-18 08:42:15 2019-01-18 08:56:57 1.0 \n",
|
||||
"196 1.0 2019-01-19 04:34:45 2019-01-19 04:43:44 1.0 \n",
|
||||
"197 2.0 2019-01-05 10:37:39 2019-01-05 10:42:03 1.0 \n",
|
||||
"198 2.0 2019-01-23 10:36:29 2019-01-23 10:44:34 2.0 \n",
|
||||
"199 2.0 2019-01-30 06:55:58 2019-01-30 07:07:02 5.0 \n",
|
||||
"\n",
|
||||
" trip_distance RatecodeID store_and_fwd_flag PULocationID DOLocationID \\\n",
|
||||
"0 2.02 1.0 N 186 233 \n",
|
||||
"1 1.59 1.0 N 141 161 \n",
|
||||
"2 1.69 1.0 N 246 249 \n",
|
||||
"3 0.90 1.0 N 229 141 \n",
|
||||
"4 4.79 1.0 N 237 107 \n",
|
||||
".. ... ... ... ... ... \n",
|
||||
"195 1.18 1.0 N 43 237 \n",
|
||||
"196 2.30 1.0 N 148 234 \n",
|
||||
"197 0.83 1.0 N 237 263 \n",
|
||||
"198 1.12 1.0 N 144 113 \n",
|
||||
"199 2.41 1.0 N 209 107 \n",
|
||||
"\n",
|
||||
" payment_type fare_amount extra mta_tax tip_amount tolls_amount \\\n",
|
||||
"0 1.0 12.0 1.0 0.5 4.08 0.0 \n",
|
||||
"1 2.0 10.0 0.5 0.5 0.00 0.0 \n",
|
||||
"2 2.0 8.5 0.0 0.5 0.00 0.0 \n",
|
||||
"3 1.0 4.5 3.0 0.5 1.65 0.0 \n",
|
||||
"4 1.0 19.5 0.0 0.5 5.70 0.0 \n",
|
||||
".. ... ... ... ... ... ... \n",
|
||||
"195 1.0 10.0 0.0 0.5 2.16 0.0 \n",
|
||||
"196 1.0 9.5 0.5 0.5 2.15 0.0 \n",
|
||||
"197 1.0 5.0 0.0 0.5 1.16 0.0 \n",
|
||||
"198 2.0 7.0 0.0 0.5 0.00 0.0 \n",
|
||||
"199 1.0 10.5 0.0 0.5 1.00 0.0 \n",
|
||||
"\n",
|
||||
" improvement_surcharge total_amount congestion_surcharge \n",
|
||||
"0 0.3 20.38 2.5 \n",
|
||||
"1 0.3 13.80 2.5 \n",
|
||||
"2 0.3 11.80 2.5 \n",
|
||||
"3 0.3 9.95 2.5 \n",
|
||||
"4 0.3 28.50 2.5 \n",
|
||||
".. ... ... ... \n",
|
||||
"195 0.3 12.96 0.0 \n",
|
||||
"196 0.3 12.95 0.0 \n",
|
||||
"197 0.3 6.96 0.0 \n",
|
||||
"198 0.3 7.80 0.0 \n",
|
||||
"199 0.3 12.30 0.0 \n",
|
||||
"\n",
|
||||
"[200 rows x 18 columns]\n"
|
||||
]
|
||||
}
|
||||
],
|
||||
"metadata": {}
|
||||
},
|
||||
{
|
||||
"cell_type": "markdown",
|
||||
"metadata": {},
|
||||
"source": [
|
||||
"---\n\n<!-- CO-OP TRANSLATOR DISCLAIMER START -->\n**ಅಸ್ವೀಕರಣ**: \nಈ ದಸ್ತಾವೇಜು AI ಅನುವಾದ ಸೇವೆ [Co-op Translator](https://github.com/Azure/co-op-translator) ಬಳಸಿ ಅನುವಾದಿಸಲಾಗಿದೆ. ನಾವು ನಿಖರತೆಯಿಗಾಗಿ ಪ್ರಯತ್ನಿಸುತ್ತಿದ್ದರೂ, ಸ್ವಯಂಚಾಲಿತ ಅನುವಾದಗಳಲ್ಲಿ ದೋಷಗಳು ಅಥವಾ ಅಸತ್ಯತೆಗಳು ಇರಬಹುದು ಎಂದು ದಯವಿಟ್ಟು ಗಮನಿಸಿ. ಮೂಲ ಭಾಷೆಯಲ್ಲಿರುವ ಮೂಲ ದಸ್ತಾವೇಜನ್ನು ಅಧಿಕೃತ ಮೂಲವಾಗಿ ಪರಿಗಣಿಸಬೇಕು. ಮಹತ್ವದ ಮಾಹಿತಿಗಾಗಿ, ವೃತ್ತಿಪರ ಮಾನವ ಅನುವಾದವನ್ನು ಶಿಫಾರಸು ಮಾಡಲಾಗುತ್ತದೆ. ಈ ಅನುವಾದ ಬಳಕೆಯಿಂದ ಉಂಟಾಗುವ ಯಾವುದೇ ತಪ್ಪು ಅರ್ಥಮಾಡಿಕೊಳ್ಳುವಿಕೆ ಅಥವಾ ತಪ್ಪು ವಿವರಣೆಗಳಿಗೆ ನಾವು ಹೊಣೆಗಾರರಾಗುವುದಿಲ್ಲ.\n<!-- CO-OP TRANSLATOR DISCLAIMER END -->\n"
|
||||
]
|
||||
}
|
||||
],
|
||||
"metadata": {
|
||||
"kernelspec": {
|
||||
"name": "python3",
|
||||
"display_name": "Python 3.9.7 64-bit ('venv': venv)"
|
||||
},
|
||||
"language_info": {
|
||||
"mimetype": "text/x-python",
|
||||
"name": "python",
|
||||
"pygments_lexer": "ipython3",
|
||||
"codemirror_mode": {
|
||||
"name": "ipython",
|
||||
"version": 3
|
||||
},
|
||||
"version": "3.9.7",
|
||||
"nbconvert_exporter": "python",
|
||||
"file_extension": ".py"
|
||||
},
|
||||
"name": "04-nyc-taxi-join-weather-in-pandas",
|
||||
"notebookId": 1709144033725344,
|
||||
"interpreter": {
|
||||
"hash": "6b9b57232c4b57163d057191678da2030059e733b8becc68f245de5a75abe84e"
|
||||
},
|
||||
"coopTranslator": {
|
||||
"original_hash": "3bd4c20c4e8f3158f483f0f1cc543bb1",
|
||||
"translation_date": "2025-12-19T17:11:57+00:00",
|
||||
"source_file": "4-Data-Science-Lifecycle/14-Introduction/notebook.ipynb",
|
||||
"language_code": "kn"
|
||||
}
|
||||
},
|
||||
"nbformat": 4,
|
||||
"nbformat_minor": 2
|
||||
}
|
||||
@ -0,0 +1,60 @@
|
||||
<!--
|
||||
CO_OP_TRANSLATOR_METADATA:
|
||||
{
|
||||
"original_hash": "661dad02c3ac239644d34c1eb51e76f8",
|
||||
"translation_date": "2025-12-19T15:25:24+00:00",
|
||||
"source_file": "4-Data-Science-Lifecycle/15-analyzing/README.md",
|
||||
"language_code": "kn"
|
||||
}
|
||||
-->
|
||||
# ಡೇಟಾ ಸೈನ್ಸ್ ಜೀವನಚಕ್ರ: ವಿಶ್ಲೇಷಣೆ
|
||||
|
||||
| ಅವರ ಸ್ಕೆಚ್ ನೋಟ್ ](../../sketchnotes/15-Analyzing.png)|
|
||||
|:---:|
|
||||
| ಡೇಟಾ ಸೈನ್ಸ್ ಜೀವನಚಕ್ರ: ವಿಶ್ಲೇಷಣೆ - _[@nitya](https://twitter.com/nitya) ಅವರ ಸ್ಕೆಚ್ ನೋಟ್_ |
|
||||
|
||||
## [ಪೂರ್ವ-ಲೇಕ್ಚರ್ ಕ್ವಿಜ್](https://ff-quizzes.netlify.app/en/ds/quiz/28)
|
||||
|
||||
ಡೇಟಾ ಜೀವನಚಕ್ರದಲ್ಲಿ ವಿಶ್ಲೇಷಣೆ ಎಂದರೆ, ಡೇಟಾ ಪ್ರಸ್ತಾಪಿಸಿದ ಪ್ರಶ್ನೆಗಳಿಗೆ ಉತ್ತರ ನೀಡಬಹುದೇ ಅಥವಾ ನಿರ್ದಿಷ್ಟ ಸಮಸ್ಯೆಯನ್ನು ಪರಿಹರಿಸಬಹುದೇ ಎಂದು ದೃಢೀಕರಿಸುವುದು. ಈ ಹಂತವು ಮಾದರಿಯು ಈ ಪ್ರಶ್ನೆಗಳು ಮತ್ತು ಸಮಸ್ಯೆಗಳನ್ನು ಸರಿಯಾಗಿ ಪರಿಹರಿಸುತ್ತಿದೆಯೇ ಎಂದು ದೃಢೀಕರಿಸುವುದರ ಮೇಲೂ ಕೇಂದ್ರೀಕರಿಸಬಹುದು. ಈ ಪಾಠವು ಅನ್ವೇಷಣಾತ್ಮಕ ಡೇಟಾ ವಿಶ್ಲೇಷಣೆ ಅಥವಾ EDA ಮೇಲೆ ಕೇಂದ್ರೀಕರಿಸಿದೆ, ಇದು ಡೇಟಾದೊಳಗಿನ ಲಕ್ಷಣಗಳು ಮತ್ತು ಸಂಬಂಧಗಳನ್ನು ನಿರ್ಧರಿಸುವ ತಂತ್ರಗಳು ಮತ್ತು ಮಾದರಿಗಾಗಿ ಡೇಟಾವನ್ನು ಸಿದ್ಧಪಡಿಸಲು ಬಳಸಬಹುದು.
|
||||
|
||||
ನಾವು [Kaggle](https://www.kaggle.com/balaka18/email-spam-classification-dataset-csv/version/1) ನಿಂದ ಉದಾಹರಣಾ ಡೇಟಾಸೆಟ್ ಅನ್ನು ಬಳಸುತ್ತೇವೆ, ಇದನ್ನು Python ಮತ್ತು Pandas ಗ್ರಂಥಾಲಯದೊಂದಿಗೆ ಹೇಗೆ ಅನ್ವಯಿಸಬಹುದು ಎಂದು ತೋರಿಸಲು. ಈ ಡೇಟಾಸೆಟ್ ಇಮೇಲ್ಗಳಲ್ಲಿ ಕಂಡುಬರುವ ಕೆಲವು ಸಾಮಾನ್ಯ ಪದಗಳ ಎಣಿಕೆಯನ್ನು ಹೊಂದಿದೆ, ಈ ಇಮೇಲ್ಗಳ ಮೂಲಗಳು ಅನಾಮಧೇಯವಾಗಿವೆ. ಈ ಡೈರೆಕ್ಟರಿಯಲ್ಲಿರುವ [ನೋಟ್ಬುಕ್](notebook.ipynb) ಅನ್ನು ಅನುಸರಿಸಿ.
|
||||
|
||||
## ಅನ್ವೇಷಣಾತ್ಮಕ ಡೇಟಾ ವಿಶ್ಲೇಷಣೆ
|
||||
|
||||
ಜೀವನಚಕ್ರದ ಕ್ಯಾಪ್ಚರ್ ಹಂತದಲ್ಲಿ ಡೇಟಾ ಮತ್ತು ಸಮಸ್ಯೆಗಳು ಮತ್ತು ಪ್ರಶ್ನೆಗಳು ಪಡೆಯಲ್ಪಡುತ್ತವೆ, ಆದರೆ ಡೇಟಾ ಅಂತಿಮ ಫಲಿತಾಂಶವನ್ನು ಬೆಂಬಲಿಸಬಹುದೆಂದು ನಾವು ಹೇಗೆ ತಿಳಿದುಕೊಳ್ಳಬಹುದು?
|
||||
ಡೇಟಾ ವಿಜ್ಞಾನಿ ಡೇಟಾ ಪಡೆಯುವಾಗ ಕೆಳಗಿನ ಪ್ರಶ್ನೆಗಳನ್ನು ಕೇಳಬಹುದು ಎಂದು ನೆನಪಿಸಿಕೊಳ್ಳಿ:
|
||||
- ಈ ಸಮಸ್ಯೆಯನ್ನು ಪರಿಹರಿಸಲು ನನಗೆ ಸಾಕಷ್ಟು ಡೇಟಾ ಇದೆಯೇ?
|
||||
- ಈ ಸಮಸ್ಯೆಗೆ ಡೇಟಾ ಸ್ವೀಕಾರ್ಯ ಗುಣಮಟ್ಟದಿದೆಯೇ?
|
||||
- ಈ ಡೇಟಾದ ಮೂಲಕ ಹೆಚ್ಚುವರಿ ಮಾಹಿತಿಯನ್ನು ಕಂಡುಹಿಡಿದರೆ, ಗುರಿಗಳನ್ನು ಬದಲಾಯಿಸುವ ಅಥವಾ ಮರುನಿರ್ಧರಿಸುವ ಬಗ್ಗೆ ಪರಿಗಣಿಸಬೇಕೇ?
|
||||
ಅನ್ವೇಷಣಾತ್ಮಕ ಡೇಟಾ ವಿಶ್ಲೇಷಣೆ ಎಂದರೆ ಆ ಡೇಟಾವನ್ನು ತಿಳಿದುಕೊಳ್ಳುವ ಪ್ರಕ್ರಿಯೆ ಮತ್ತು ಈ ಪ್ರಶ್ನೆಗಳಿಗೆ ಉತ್ತರ ನೀಡಲು, ಜೊತೆಗೆ ಡೇಟಾಸೆಟ್ನೊಂದಿಗೆ ಕೆಲಸ ಮಾಡುವ ಸವಾಲುಗಳನ್ನು ಗುರುತಿಸಲು ಬಳಸಬಹುದು. ಇದನ್ನು ಸಾಧಿಸಲು ಬಳಸುವ ಕೆಲವು ತಂತ್ರಗಳ ಮೇಲೆ ಗಮನಹರಿಸೋಣ.
|
||||
|
||||
## ಡೇಟಾ ಪ್ರೊಫೈಲಿಂಗ್, ವರ್ಣನಾತ್ಮಕ ಅಂಕಿಅಂಶಗಳು ಮತ್ತು Pandas
|
||||
ನಾವು ಈ ಸಮಸ್ಯೆಯನ್ನು ಪರಿಹರಿಸಲು ಸಾಕಷ್ಟು ಡೇಟಾ ಹೊಂದಿದ್ದೇವೆ ಎಂದು ಹೇಗೆ ಮೌಲ್ಯಮಾಪನ ಮಾಡಬಹುದು? ಡೇಟಾ ಪ್ರೊಫೈಲಿಂಗ್ ನಮ್ಮ ಡೇಟಾಸೆಟ್ ಬಗ್ಗೆ ಕೆಲವು ಸಾಮಾನ್ಯ ಮಾಹಿತಿಯನ್ನು ಸಂಗ್ರಹಿಸಿ ಸಾರಾಂಶ ನೀಡಬಹುದು, ಇದು ವರ್ಣನಾತ್ಮಕ ಅಂಕಿಅಂಶಗಳ ತಂತ್ರಗಳ ಮೂಲಕ ಸಾಧ್ಯ. ಡೇಟಾ ಪ್ರೊಫೈಲಿಂಗ್ ನಮಗೆ ಲಭ್ಯವಿರುವುದನ್ನು ಅರ್ಥಮಾಡಿಕೊಳ್ಳಲು ಸಹಾಯ ಮಾಡುತ್ತದೆ, ಮತ್ತು ವರ್ಣನಾತ್ಮಕ ಅಂಕಿಅಂಶಗಳು ನಮಗೆ ಎಷ್ಟು ವಸ್ತುಗಳು ಲಭ್ಯವಿವೆ ಎಂದು ತಿಳಿಯಲು ಸಹಾಯ ಮಾಡುತ್ತವೆ.
|
||||
|
||||
ಹಿಂದಿನ ಕೆಲವು ಪಾಠಗಳಲ್ಲಿ, ನಾವು Pandas ನ [`describe()` ಫಂಕ್ಷನ್](https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.describe.html) ಅನ್ನು ಬಳಸಿದ್ದೇವೆ. ಇದು ಸಂಖ್ಯಾತ್ಮಕ ಡೇಟಾದ ಮೇಲೆ ಎಣಿಕೆ, ಗರಿಷ್ಠ ಮತ್ತು ಕನಿಷ್ಠ ಮೌಲ್ಯಗಳು, ಸರಾಸರಿ, ಮಾನಕ ವ್ಯತ್ಯಾಸ ಮತ್ತು ಕ್ವಾಂಟೈಲ್ಗಳನ್ನು ಒದಗಿಸುತ್ತದೆ. `describe()` ಫಂಕ್ಷನ್ ಹೋಲುವ ವರ್ಣನಾತ್ಮಕ ಅಂಕಿಅಂಶಗಳನ್ನು ಬಳಸಿಕೊಂಡು ನೀವು ಎಷ್ಟು ಡೇಟಾ ಹೊಂದಿದ್ದೀರಿ ಮತ್ತು ಇನ್ನಷ್ಟು ಬೇಕೇ ಎಂದು ಅಂದಾಜು ಮಾಡಬಹುದು.
|
||||
|
||||
## ಸ್ಯಾಂಪ್ಲಿಂಗ್ ಮತ್ತು ಕ್ವೆರಿಂಗ್
|
||||
ದೊಡ್ಡ ಡೇಟಾಸೆಟ್ನಲ್ಲಿನ ಎಲ್ಲವನ್ನೂ ಅನ್ವೇಷಿಸುವುದು ಬಹಳ ಸಮಯ ತೆಗೆದುಕೊಳ್ಳಬಹುದು ಮತ್ತು ಸಾಮಾನ್ಯವಾಗಿ ಕಂಪ್ಯೂಟರ್ಗೆ ಬಿಟ್ಟುಕೊಡಲಾಗುವ ಕೆಲಸ. ಆದಾಗ್ಯೂ, ಸ್ಯಾಂಪ್ಲಿಂಗ್ ಡೇಟಾವನ್ನು ಅರ್ಥಮಾಡಿಕೊಳ್ಳಲು ಸಹಾಯಕ ಸಾಧನವಾಗಿದೆ ಮತ್ತು ಡೇಟಾಸೆಟ್ನಲ್ಲಿ ಏನಿದೆ ಮತ್ತು ಅದು ಏನನ್ನು ಪ್ರತಿನಿಧಿಸುತ್ತದೆ ಎಂಬುದರ ಉತ್ತಮ ಅರ್ಥವನ್ನು ನೀಡುತ್ತದೆ. ಸ್ಯಾಂಪಲ್ ಮೂಲಕ, ನೀವು ಪ್ರಾಬಬಿಲಿಟಿ ಮತ್ತು ಅಂಕಿಅಂಶಗಳನ್ನು ಅನ್ವಯಿಸಿ ನಿಮ್ಮ ಡೇಟಾ ಬಗ್ಗೆ ಸಾಮಾನ್ಯ ನಿರ್ಣಯಗಳಿಗೆ ಬರಬಹುದು. ನೀವು ಎಷ್ಟು ಡೇಟಾ ಸ್ಯಾಂಪಲ್ ಮಾಡಬೇಕು ಎಂಬುದಕ್ಕೆ ನಿರ್ದಿಷ್ಟ ನಿಯಮವಿಲ್ಲ, ಆದರೆ ಹೆಚ್ಚು ಡೇಟಾ ಸ್ಯಾಂಪಲ್ ಮಾಡಿದರೆ, ಡೇಟಾ ಬಗ್ಗೆ ನೀವು ಮಾಡಬಹುದಾದ ಸಾಮಾನ್ಯೀಕರಣ ಹೆಚ್ಚು ನಿಖರವಾಗಿರುತ್ತದೆ.
|
||||
Pandas ನಲ್ಲಿ [`sample()` ಫಂಕ್ಷನ್](https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.sample.html) ಇದೆ, ಇದರಲ್ಲಿ ನೀವು ಎಷ್ಟು ಯಾದೃಚ್ಛಿಕ ಸ್ಯಾಂಪಲ್ಗಳನ್ನು ಪಡೆಯಲು ಇಚ್ಛಿಸುತ್ತೀರಿ ಎಂಬ ಆರ್ಗ್ಯುಮೆಂಟ್ ಅನ್ನು ಪಾಸ್ ಮಾಡಬಹುದು.
|
||||
|
||||
ಡೇಟಾದ ಸಾಮಾನ್ಯ ಕ್ವೆರಿಗಳು ನಿಮಗೆ ಕೆಲವು ಸಾಮಾನ್ಯ ಪ್ರಶ್ನೆಗಳು ಮತ್ತು ಸಿದ್ಧಾಂತಗಳಿಗೆ ಉತ್ತರ ನೀಡಲು ಸಹಾಯ ಮಾಡಬಹುದು. ಸ್ಯಾಂಪ್ಲಿಂಗ್ಗೆ ವಿರುದ್ಧವಾಗಿ, ಕ್ವೆರಿಗಳು ನಿಮಗೆ ನಿಯಂತ್ರಣ ಮತ್ತು ನಿಮ್ಮ ಪ್ರಶ್ನೆಗಳಿರುವ ಡೇಟಾದ ನಿರ್ದಿಷ್ಟ ಭಾಗಗಳ ಮೇಲೆ ಕೇಂದ್ರೀಕರಿಸಲು ಅವಕಾಶ ನೀಡುತ್ತವೆ.
|
||||
Pandas ಗ್ರಂಥಾಲಯದ [`query()` ಫಂಕ್ಷನ್](https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.query.html) ನಿಮಗೆ ಕಾಲಮ್ಗಳನ್ನು ಆಯ್ಕೆಮಾಡಲು ಮತ್ತು ಪಡೆಯಲಾದ ಸಾಲುಗಳ ಮೂಲಕ ಡೇಟಾ ಬಗ್ಗೆ ಸರಳ ಉತ್ತರಗಳನ್ನು ಪಡೆಯಲು ಅನುಮತಿಸುತ್ತದೆ.
|
||||
|
||||
## ದೃಶ್ಯೀಕರಣಗಳೊಂದಿಗೆ ಅನ್ವೇಷಣೆ
|
||||
ಡೇಟಾ ಸಂಪೂರ್ಣವಾಗಿ ಶುದ್ಧೀಕರಿಸಿ ವಿಶ್ಲೇಷಿಸುವವರೆಗೆ ಕಾಯಬೇಕಾಗಿಲ್ಲ, ದೃಶ್ಯೀಕರಣಗಳನ್ನು ಸೃಷ್ಟಿಸುವುದನ್ನು ಪ್ರಾರಂಭಿಸಲು. ವಾಸ್ತವದಲ್ಲಿ, ಅನ್ವೇಷಿಸುವಾಗ ದೃಶ್ಯಾತ್ಮಕ ಪ್ರತಿನಿಧಾನವು ಮಾದರಿಗಳು, ಸಂಬಂಧಗಳು ಮತ್ತು ಸಮಸ್ಯೆಗಳನ್ನು ಗುರುತಿಸಲು ಸಹಾಯ ಮಾಡುತ್ತದೆ. ಜೊತೆಗೆ, ದೃಶ್ಯೀಕರಣಗಳು ಡೇಟಾ ನಿರ್ವಹಣೆಯಲ್ಲಿ ಭಾಗವಹಿಸದವರೊಂದಿಗೆ ಸಂವಹನದ ಮಾರ್ಗವನ್ನು ಒದಗಿಸುತ್ತವೆ ಮತ್ತು ಕ್ಯಾಪ್ಚರ್ ಹಂತದಲ್ಲಿ ಸ್ಪರ್ಶಿಸಲ್ಪಟ್ಟಿಲ್ಲದ ಹೆಚ್ಚುವರಿ ಪ್ರಶ್ನೆಗಳನ್ನು ಹಂಚಿಕೊಳ್ಳಲು ಮತ್ತು ಸ್ಪಷ್ಟಪಡಿಸಲು ಅವಕಾಶ ನೀಡಬಹುದು. ದೃಶ್ಯೀಕರಣಗಳ ಬಗ್ಗೆ ಹೆಚ್ಚು ತಿಳಿಯಲು [ದೃಶ್ಯೀಕರಣಗಳ ವಿಭಾಗ](../../../../../../../../../3-Data-Visualization) ಅನ್ನು ನೋಡಿ.
|
||||
|
||||
## ಅಸಂಗತಿಗಳನ್ನು ಗುರುತಿಸಲು ಅನ್ವೇಷಣೆ
|
||||
ಈ ಪಾಠದ ಎಲ್ಲಾ ವಿಷಯಗಳು ಕಳೆದುಹೋಗಿದ ಅಥವಾ ಅಸಂಗತ ಮೌಲ್ಯಗಳನ್ನು ಗುರುತಿಸಲು ಸಹಾಯ ಮಾಡಬಹುದು, ಆದರೆ Pandas ಕೆಲವು ಫಂಕ್ಷನ್ಗಳನ್ನು ಒದಗಿಸುತ್ತದೆ. [isna() ಅಥವಾ isnull()](https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.isna.html) ಕಳೆದುಹೋಗಿದ ಮೌಲ್ಯಗಳನ್ನು ಪರಿಶೀಲಿಸಬಹುದು. ನಿಮ್ಮ ಡೇಟಾದೊಳಗಿನ ಈ ಮೌಲ್ಯಗಳನ್ನು ಅನ್ವೇಷಿಸುವ ಪ್ರಮುಖ ಭಾಗವೆಂದರೆ ಅವು ಮೊದಲಿಗೆ ಏಕೆ ಹಾಗಾಗಿವೆ ಎಂದು ಅನ್ವೇಷಿಸುವುದು. ಇದು ಅವುಗಳನ್ನು ಪರಿಹರಿಸಲು ತೆಗೆದುಕೊಳ್ಳಬೇಕಾದ [ಕ್ರಿಯೆಗಳ ಬಗ್ಗೆ ನಿರ್ಧಾರ ಮಾಡಲು](/2-Working-With-Data/08-data-preparation/notebook.ipynb) ಸಹಾಯ ಮಾಡುತ್ತದೆ.
|
||||
|
||||
## [ಪೋಸ್ಟ್-ಲೇಕ್ಚರ್ ಕ್ವಿಜ್](https://ff-quizzes.netlify.app/en/ds/quiz/29)
|
||||
|
||||
## ಅಸೈನ್ಮೆಂಟ್
|
||||
|
||||
[ಉತ್ತರಗಳನ್ನು ಅನ್ವೇಷಿಸುವುದು](assignment.md)
|
||||
|
||||
---
|
||||
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
|
||||
**ಅಸ್ವೀಕರಣ**:
|
||||
ಈ ದಸ್ತಾವೇಜು [Co-op Translator](https://github.com/Azure/co-op-translator) ಎಂಬ AI ಅನುವಾದ ಸೇವೆಯನ್ನು ಬಳಸಿ ಅನುವಾದಿಸಲಾಗಿದೆ. ನಾವು ಶುದ್ಧತೆಯತ್ತ ಪ್ರಯತ್ನಿಸುತ್ತಿದ್ದರೂ, ಸ್ವಯಂಚಾಲಿತ ಅನುವಾದಗಳಲ್ಲಿ ತಪ್ಪುಗಳು ಅಥವಾ ಅಸತ್ಯತೆಗಳು ಇರಬಹುದು ಎಂಬುದನ್ನು ದಯವಿಟ್ಟು ಗಮನಿಸಿ. ಮೂಲ ಭಾಷೆಯಲ್ಲಿರುವ ಮೂಲ ದಸ್ತಾವೇಜನ್ನು ಅಧಿಕೃತ ಮೂಲವೆಂದು ಪರಿಗಣಿಸಬೇಕು. ಮಹತ್ವದ ಮಾಹಿತಿಗಾಗಿ, ವೃತ್ತಿಪರ ಮಾನವ ಅನುವಾದವನ್ನು ಶಿಫಾರಸು ಮಾಡಲಾಗುತ್ತದೆ. ಈ ಅನುವಾದ ಬಳಕೆಯಿಂದ ಉಂಟಾಗುವ ಯಾವುದೇ ತಪ್ಪು ಅರ್ಥಮಾಡಿಕೊಳ್ಳುವಿಕೆ ಅಥವಾ ತಪ್ಪು ವಿವರಣೆಗಳಿಗೆ ನಾವು ಹೊಣೆಗಾರರಾಗುವುದಿಲ್ಲ.
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER END -->
|
||||
@ -0,0 +1,154 @@
|
||||
{
|
||||
"cells": [
|
||||
{
|
||||
"cell_type": "markdown",
|
||||
"source": [
|
||||
"# ಶೀತಕಾಲ ಮತ್ತು ಬೇಸಿಗೆಗಳಲ್ಲಿ NYC ಟ್ಯಾಕ್ಸಿ ಡೇಟಾ\n",
|
||||
"\n",
|
||||
"ಕೊಟ್ಟಿರುವ ಕಾಲಮ್ಗಳ ಬಗ್ಗೆ ಹೆಚ್ಚಿನ ಮಾಹಿತಿಗಾಗಿ [ಡೇಟಾ ನಿಘಂಟು](https://www1.nyc.gov/assets/tlc/downloads/pdf/data_dictionary_trip_records_yellow.pdf) ಅನ್ನು ನೋಡಿ.\n"
|
||||
],
|
||||
"metadata": {}
|
||||
},
|
||||
{
|
||||
"cell_type": "code",
|
||||
"execution_count": null,
|
||||
"source": [
|
||||
"#Install the pandas library\r\n",
|
||||
"!pip install pandas"
|
||||
],
|
||||
"outputs": [],
|
||||
"metadata": {
|
||||
"scrolled": true
|
||||
}
|
||||
},
|
||||
{
|
||||
"cell_type": "code",
|
||||
"execution_count": 7,
|
||||
"source": [
|
||||
"import pandas as pd\r\n",
|
||||
"\r\n",
|
||||
"path = '../../data/taxi.csv'\r\n",
|
||||
"\r\n",
|
||||
"#Load the csv file into a dataframe\r\n",
|
||||
"df = pd.read_csv(path)\r\n",
|
||||
"\r\n",
|
||||
"#Print the dataframe\r\n",
|
||||
"print(df)\r\n"
|
||||
],
|
||||
"outputs": [
|
||||
{
|
||||
"output_type": "stream",
|
||||
"name": "stdout",
|
||||
"text": [
|
||||
" VendorID tpep_pickup_datetime tpep_dropoff_datetime passenger_count \\\n",
|
||||
"0 2.0 2019-07-15 16:27:53 2019-07-15 16:44:21 3.0 \n",
|
||||
"1 2.0 2019-07-17 20:26:35 2019-07-17 20:40:09 6.0 \n",
|
||||
"2 2.0 2019-07-06 16:01:08 2019-07-06 16:10:25 1.0 \n",
|
||||
"3 1.0 2019-07-18 22:32:23 2019-07-18 22:35:08 1.0 \n",
|
||||
"4 2.0 2019-07-19 14:54:29 2019-07-19 15:19:08 1.0 \n",
|
||||
".. ... ... ... ... \n",
|
||||
"195 2.0 2019-01-18 08:42:15 2019-01-18 08:56:57 1.0 \n",
|
||||
"196 1.0 2019-01-19 04:34:45 2019-01-19 04:43:44 1.0 \n",
|
||||
"197 2.0 2019-01-05 10:37:39 2019-01-05 10:42:03 1.0 \n",
|
||||
"198 2.0 2019-01-23 10:36:29 2019-01-23 10:44:34 2.0 \n",
|
||||
"199 2.0 2019-01-30 06:55:58 2019-01-30 07:07:02 5.0 \n",
|
||||
"\n",
|
||||
" trip_distance RatecodeID store_and_fwd_flag PULocationID DOLocationID \\\n",
|
||||
"0 2.02 1.0 N 186 233 \n",
|
||||
"1 1.59 1.0 N 141 161 \n",
|
||||
"2 1.69 1.0 N 246 249 \n",
|
||||
"3 0.90 1.0 N 229 141 \n",
|
||||
"4 4.79 1.0 N 237 107 \n",
|
||||
".. ... ... ... ... ... \n",
|
||||
"195 1.18 1.0 N 43 237 \n",
|
||||
"196 2.30 1.0 N 148 234 \n",
|
||||
"197 0.83 1.0 N 237 263 \n",
|
||||
"198 1.12 1.0 N 144 113 \n",
|
||||
"199 2.41 1.0 N 209 107 \n",
|
||||
"\n",
|
||||
" payment_type fare_amount extra mta_tax tip_amount tolls_amount \\\n",
|
||||
"0 1.0 12.0 1.0 0.5 4.08 0.0 \n",
|
||||
"1 2.0 10.0 0.5 0.5 0.00 0.0 \n",
|
||||
"2 2.0 8.5 0.0 0.5 0.00 0.0 \n",
|
||||
"3 1.0 4.5 3.0 0.5 1.65 0.0 \n",
|
||||
"4 1.0 19.5 0.0 0.5 5.70 0.0 \n",
|
||||
".. ... ... ... ... ... ... \n",
|
||||
"195 1.0 10.0 0.0 0.5 2.16 0.0 \n",
|
||||
"196 1.0 9.5 0.5 0.5 2.15 0.0 \n",
|
||||
"197 1.0 5.0 0.0 0.5 1.16 0.0 \n",
|
||||
"198 2.0 7.0 0.0 0.5 0.00 0.0 \n",
|
||||
"199 1.0 10.5 0.0 0.5 1.00 0.0 \n",
|
||||
"\n",
|
||||
" improvement_surcharge total_amount congestion_surcharge \n",
|
||||
"0 0.3 20.38 2.5 \n",
|
||||
"1 0.3 13.80 2.5 \n",
|
||||
"2 0.3 11.80 2.5 \n",
|
||||
"3 0.3 9.95 2.5 \n",
|
||||
"4 0.3 28.50 2.5 \n",
|
||||
".. ... ... ... \n",
|
||||
"195 0.3 12.96 0.0 \n",
|
||||
"196 0.3 12.95 0.0 \n",
|
||||
"197 0.3 6.96 0.0 \n",
|
||||
"198 0.3 7.80 0.0 \n",
|
||||
"199 0.3 12.30 0.0 \n",
|
||||
"\n",
|
||||
"[200 rows x 18 columns]\n"
|
||||
]
|
||||
}
|
||||
],
|
||||
"metadata": {}
|
||||
},
|
||||
{
|
||||
"cell_type": "markdown",
|
||||
"source": [
|
||||
"# ನಿಮ್ಮ ಸ್ವಂತ ಅನ್ವೇಷಣಾತ್ಮಕ ಡೇಟಾ ವಿಶ್ಲೇಷಣೆಯನ್ನು ಮಾಡಲು ಕೆಳಗಿನ ಸೆಲ್ಗಳನ್ನು ಬಳಸಿ\n"
|
||||
],
|
||||
"metadata": {}
|
||||
},
|
||||
{
|
||||
"cell_type": "code",
|
||||
"execution_count": null,
|
||||
"source": [],
|
||||
"outputs": [],
|
||||
"metadata": {}
|
||||
},
|
||||
{
|
||||
"cell_type": "markdown",
|
||||
"metadata": {},
|
||||
"source": [
|
||||
"---\n\n<!-- CO-OP TRANSLATOR DISCLAIMER START -->\n**ಅಸ್ವೀಕರಣ**: \nಈ ದಸ್ತಾವೇಜು [Co-op Translator](https://github.com/Azure/co-op-translator) ಎಂಬ AI ಅನುವಾದ ಸೇವೆಯನ್ನು ಬಳಸಿ ಅನುವಾದಿಸಲಾಗಿದೆ. ನಾವು ಶುದ್ಧತೆಯತ್ತ ಪ್ರಯತ್ನಿಸುತ್ತಿದ್ದರೂ, ಸ್ವಯಂಚಾಲಿತ ಅನುವಾದಗಳಲ್ಲಿ ತಪ್ಪುಗಳು ಅಥವಾ ಅಸತ್ಯತೆಗಳು ಇರಬಹುದು ಎಂದು ದಯವಿಟ್ಟು ಗಮನಿಸಿ. ಮೂಲ ಭಾಷೆಯಲ್ಲಿರುವ ಮೂಲ ದಸ್ತಾವೇಜನ್ನು ಅಧಿಕೃತ ಮೂಲವೆಂದು ಪರಿಗಣಿಸಬೇಕು. ಮಹತ್ವದ ಮಾಹಿತಿಗಾಗಿ, ವೃತ್ತಿಪರ ಮಾನವ ಅನುವಾದವನ್ನು ಶಿಫಾರಸು ಮಾಡಲಾಗುತ್ತದೆ. ಈ ಅನುವಾದ ಬಳಕೆಯಿಂದ ಉಂಟಾಗುವ ಯಾವುದೇ ತಪ್ಪು ಅರ್ಥಮಾಡಿಕೊಳ್ಳುವಿಕೆ ಅಥವಾ ತಪ್ಪು ವಿವರಣೆಗಳಿಗೆ ನಾವು ಹೊಣೆಗಾರರಾಗುವುದಿಲ್ಲ.\n<!-- CO-OP TRANSLATOR DISCLAIMER END -->\n"
|
||||
]
|
||||
}
|
||||
],
|
||||
"metadata": {
|
||||
"kernelspec": {
|
||||
"name": "python3",
|
||||
"display_name": "Python 3.9.7 64-bit ('venv': venv)"
|
||||
},
|
||||
"language_info": {
|
||||
"mimetype": "text/x-python",
|
||||
"name": "python",
|
||||
"pygments_lexer": "ipython3",
|
||||
"codemirror_mode": {
|
||||
"name": "ipython",
|
||||
"version": 3
|
||||
},
|
||||
"version": "3.9.7",
|
||||
"nbconvert_exporter": "python",
|
||||
"file_extension": ".py"
|
||||
},
|
||||
"name": "04-nyc-taxi-join-weather-in-pandas",
|
||||
"notebookId": 1709144033725344,
|
||||
"interpreter": {
|
||||
"hash": "6b9b57232c4b57163d057191678da2030059e733b8becc68f245de5a75abe84e"
|
||||
},
|
||||
"coopTranslator": {
|
||||
"original_hash": "7bca1c1abc1e55842817b62e44e1a963",
|
||||
"translation_date": "2025-12-19T17:11:38+00:00",
|
||||
"source_file": "4-Data-Science-Lifecycle/15-analyzing/assignment.ipynb",
|
||||
"language_code": "kn"
|
||||
}
|
||||
},
|
||||
"nbformat": 4,
|
||||
"nbformat_minor": 2
|
||||
}
|
||||
@ -0,0 +1,38 @@
|
||||
<!--
|
||||
CO_OP_TRANSLATOR_METADATA:
|
||||
{
|
||||
"original_hash": "fcc7547171f4530f159676dd73ed772e",
|
||||
"translation_date": "2025-12-19T15:26:15+00:00",
|
||||
"source_file": "4-Data-Science-Lifecycle/15-analyzing/assignment.md",
|
||||
"language_code": "kn"
|
||||
}
|
||||
-->
|
||||
# ಉತ್ತರಗಳನ್ನು ಅನ್ವೇಷಿಸುವುದು
|
||||
|
||||
ಇದು ಹಿಂದಿನ ಪಾಠದ [ಕಾರ್ಯ](../14-Introduction/assignment.md)ನ ಮುಂದುವರಿದ ಭಾಗವಾಗಿದ್ದು, ಅಲ್ಲಿ ನಾವು ಡೇಟಾ ಸೆಟ್ ಅನ್ನು ಸಂಕ್ಷಿಪ್ತವಾಗಿ ನೋಡಿದ್ದೇವೆ. ಈಗ ನಾವು ಡೇಟಾವನ್ನು ಹೆಚ್ಚು ಆಳವಾಗಿ ಪರಿಶೀಲಿಸುವೆವು.
|
||||
|
||||
ಮತ್ತೆ, ಗ್ರಾಹಕರು ತಿಳಿದುಕೊಳ್ಳಲು ಬಯಸುವ ಪ್ರಶ್ನೆ: **ನ್ಯೂಯಾರ್ಕ್ ಸಿಟಿಯ ಹಳದಿ ಟ್ಯಾಕ್ಸಿ ಪ್ರಯಾಣಿಕರು ಚಳಿಗಾಲದಲ್ಲಿ ಅಥವಾ ಬೇಸಿಗೆಯಲ್ಲಿ ಚಾಲಕರಿಗೆ ಹೆಚ್ಚು ಟಿಪ್ ನೀಡುತ್ತಾರಾ?**
|
||||
|
||||
ನಿಮ್ಮ ತಂಡ ಡೇಟಾ ಸೈನ್ಸ್ ಜೀವನಚಕ್ರದ [ವಿಶ್ಲೇಷಣೆ](README.md) ಹಂತದಲ್ಲಿದ್ದು, ಡೇಟಾ ಸೆಟ್ ಮೇಲೆ ಅನ್ವೇಷಣಾತ್ಮಕ ಡೇಟಾ ವಿಶ್ಲೇಷಣೆ ಮಾಡಲು ಜವಾಬ್ದಾರಿಯಲ್ಲಿದೆ. ನಿಮಗೆ ಜನವರಿ ಮತ್ತು ಜುಲೈ 2019 ರ 200 ಟ್ಯಾಕ್ಸಿ ವ್ಯವಹಾರಗಳನ್ನು ಒಳಗೊಂಡ ನೋಟ್ಬುಕ್ ಮತ್ತು ಡೇಟಾ ಸೆಟ್ ಒದಗಿಸಲಾಗಿದೆ.
|
||||
|
||||
## ಸೂಚನೆಗಳು
|
||||
|
||||
ಈ ಡೈರೆಕ್ಟರಿಯಲ್ಲಿ [ನೋಟ್ಬುಕ್](assignment.ipynb) ಮತ್ತು [ಟ್ಯಾಕ್ಸಿ & ಲಿಮೋಸಿನ್ ಕಮಿಷನ್](https://docs.microsoft.com/en-us/azure/open-datasets/dataset-taxi-yellow?tabs=azureml-opendatasets)ನ ಡೇಟಾ ಇದೆ. ಡೇಟಾ ಬಗ್ಗೆ ಹೆಚ್ಚಿನ ಮಾಹಿತಿಗಾಗಿ [ಡೇಟಾ ಸೆಟ್ ನ ಡಿಕ್ಷನರಿ](https://www1.nyc.gov/assets/tlc/downloads/pdf/data_dictionary_trip_records_yellow.pdf) ಮತ್ತು [ಬಳಕೆದಾರ ಮಾರ್ಗದರ್ಶಿ](https://www1.nyc.gov/assets/tlc/downloads/pdf/trip_record_user_guide.pdf) ಅನ್ನು ನೋಡಿ.
|
||||
|
||||
ಈ ಪಾಠದಲ್ಲಿ ಕೆಲವು ತಂತ್ರಗಳನ್ನು ಬಳಸಿ ನಿಮ್ಮ ಸ್ವಂತ EDA ನೋಟ್ಬುಕ್ನಲ್ಲಿ ಮಾಡಿ (ನೀವು ಇಚ್ಛಿಸಿದರೆ ಸೆಲ್ಗಳನ್ನು ಸೇರಿಸಬಹುದು) ಮತ್ತು ಕೆಳಗಿನ ಪ್ರಶ್ನೆಗಳಿಗೆ ಉತ್ತರ ನೀಡಿ:
|
||||
|
||||
- ಟಿಪ್ ಮೊತ್ತವನ್ನು ಪ್ರಭಾವಿಸುವ ಇನ್ನಾವುದೇ ಡೇಟಾ ಪ್ರಭಾವಗಳು ಏನು ಇರಬಹುದು?
|
||||
- ಗ್ರಾಹಕರ ಪ್ರಶ್ನೆಗಳಿಗೆ ಉತ್ತರಿಸಲು ಯಾವ ಕಾಲಮ್ಗಳು ಬಹುಶಃ ಅಗತ್ಯವಿಲ್ಲ?
|
||||
- ಇದುವರೆಗೆ ಒದಗಿಸಲಾದ ಮಾಹಿತಿಯ ಆಧಾರದ ಮೇಲೆ, ಡೇಟಾ ಋತುಚಕ್ರದ ಟಿಪ್ ನೀಡುವ ವರ್ತನೆಗೆ ಯಾವುದೇ ಸಾಕ್ಷ್ಯವನ್ನು ನೀಡುತ್ತದೆಯೇ?
|
||||
|
||||
## ಮೌಲ್ಯಮಾಪನ
|
||||
|
||||
ಉತ್ತಮ | ತೃಪ್ತಿಕರ | ಸುಧಾರಣೆಯ ಅಗತ್ಯ
|
||||
--- | --- | --
|
||||
|
||||
---
|
||||
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
|
||||
**ಅಸ್ವೀಕರಣ**:
|
||||
ಈ ದಸ್ತಾವೇಜು AI ಅನುವಾದ ಸೇವೆ [Co-op Translator](https://github.com/Azure/co-op-translator) ಬಳಸಿ ಅನುವಾದಿಸಲಾಗಿದೆ. ನಾವು ನಿಖರತೆಯಿಗಾಗಿ ಪ್ರಯತ್ನಿಸುತ್ತಿದ್ದರೂ, ಸ್ವಯಂಚಾಲಿತ ಅನುವಾದಗಳಲ್ಲಿ ದೋಷಗಳು ಅಥವಾ ಅಸತ್ಯತೆಗಳು ಇರಬಹುದು ಎಂದು ದಯವಿಟ್ಟು ಗಮನಿಸಿ. ಮೂಲ ಭಾಷೆಯಲ್ಲಿರುವ ಮೂಲ ದಸ್ತಾವೇಜನ್ನು ಅಧಿಕೃತ ಮೂಲವಾಗಿ ಪರಿಗಣಿಸಬೇಕು. ಮಹತ್ವದ ಮಾಹಿತಿಗಾಗಿ, ವೃತ್ತಿಪರ ಮಾನವ ಅನುವಾದವನ್ನು ಶಿಫಾರಸು ಮಾಡಲಾಗುತ್ತದೆ. ಈ ಅನುವಾದ ಬಳಕೆಯಿಂದ ಉಂಟಾಗುವ ಯಾವುದೇ ತಪ್ಪು ಅರ್ಥಮಾಡಿಕೊಳ್ಳುವಿಕೆ ಅಥವಾ ತಪ್ಪು ವಿವರಣೆಗಳಿಗೆ ನಾವು ಹೊಣೆಗಾರರಾಗುವುದಿಲ್ಲ.
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER END -->
|
||||
@ -0,0 +1,193 @@
|
||||
{
|
||||
"cells": [
|
||||
{
|
||||
"cell_type": "markdown",
|
||||
"source": [
|
||||
"# ಡೇಟಾ ವಿಶ್ಲೇಷಣೆ\r\n",
|
||||
"[ಪಾಠ](README.md)ದಲ್ಲಿ ಉಲ್ಲೇಖಿಸಲಾದ Pandas ಫಂಕ್ಷನ್ಗಳ ಉದಾಹರಣೆಗಳು.\n"
|
||||
],
|
||||
"metadata": {}
|
||||
},
|
||||
{
|
||||
"cell_type": "code",
|
||||
"execution_count": 1,
|
||||
"source": [
|
||||
"import pandas as pd\r\n",
|
||||
"import glob\r\n",
|
||||
"\r\n",
|
||||
"#Loading the dataset\r\n",
|
||||
"path = '../../data/emails.csv'\r\n",
|
||||
"email_df = pd.read_csv(path)"
|
||||
],
|
||||
"outputs": [],
|
||||
"metadata": {}
|
||||
},
|
||||
{
|
||||
"cell_type": "code",
|
||||
"execution_count": 2,
|
||||
"source": [
|
||||
"# Using Describe on the email dataset\r\n",
|
||||
"print(email_df.describe())"
|
||||
],
|
||||
"outputs": [
|
||||
{
|
||||
"output_type": "stream",
|
||||
"name": "stdout",
|
||||
"text": [
|
||||
" the to ect and for of \\\n",
|
||||
"count 406.000000 406.000000 406.000000 406.000000 406.000000 406.000000 \n",
|
||||
"mean 7.022167 6.519704 4.948276 3.059113 3.502463 2.662562 \n",
|
||||
"std 10.945522 9.801907 9.293820 6.267806 4.901372 5.443939 \n",
|
||||
"min 0.000000 0.000000 1.000000 0.000000 0.000000 0.000000 \n",
|
||||
"25% 1.000000 1.000000 1.000000 0.000000 1.000000 0.000000 \n",
|
||||
"50% 3.000000 3.000000 2.000000 1.000000 2.000000 1.000000 \n",
|
||||
"75% 9.000000 7.750000 4.000000 3.000000 4.750000 3.000000 \n",
|
||||
"max 99.000000 88.000000 79.000000 69.000000 39.000000 57.000000 \n",
|
||||
"\n",
|
||||
" a you in on is this \\\n",
|
||||
"count 406.000000 406.000000 406.000000 406.000000 406.000000 406.000000 \n",
|
||||
"mean 57.017241 2.394089 10.817734 11.591133 5.901478 1.485222 \n",
|
||||
"std 78.868243 4.067015 19.050972 16.407175 8.793103 2.912473 \n",
|
||||
"min 0.000000 0.000000 0.000000 0.000000 0.000000 0.000000 \n",
|
||||
"25% 15.000000 0.000000 1.250000 3.000000 1.000000 0.000000 \n",
|
||||
"50% 29.000000 1.000000 5.000000 6.000000 3.000000 0.000000 \n",
|
||||
"75% 61.000000 3.000000 12.000000 13.000000 7.000000 2.000000 \n",
|
||||
"max 843.000000 31.000000 223.000000 125.000000 61.000000 24.000000 \n",
|
||||
"\n",
|
||||
" i be that will \n",
|
||||
"count 406.000000 406.000000 406.000000 406.000000 \n",
|
||||
"mean 47.155172 2.950739 1.034483 0.955665 \n",
|
||||
"std 71.043009 4.297865 1.904846 2.042271 \n",
|
||||
"min 0.000000 0.000000 0.000000 0.000000 \n",
|
||||
"25% 11.000000 1.000000 0.000000 0.000000 \n",
|
||||
"50% 24.000000 1.000000 0.000000 0.000000 \n",
|
||||
"75% 50.750000 3.000000 1.000000 1.000000 \n",
|
||||
"max 754.000000 40.000000 14.000000 24.000000 \n"
|
||||
]
|
||||
}
|
||||
],
|
||||
"metadata": {}
|
||||
},
|
||||
{
|
||||
"cell_type": "code",
|
||||
"execution_count": 5,
|
||||
"source": [
|
||||
"# Sampling 10 emails\r\n",
|
||||
"print(email_df.sample(10))"
|
||||
],
|
||||
"outputs": [
|
||||
{
|
||||
"output_type": "stream",
|
||||
"name": "stdout",
|
||||
"text": [
|
||||
" Email No. the to ect and for of a you in on is this i \\\n",
|
||||
"150 Email 151 0 1 2 0 3 0 15 0 0 5 0 0 7 \n",
|
||||
"380 Email 5147 0 3 2 0 0 0 7 0 1 1 0 0 3 \n",
|
||||
"19 Email 20 3 4 11 0 4 2 32 1 1 3 9 5 25 \n",
|
||||
"300 Email 301 2 1 1 0 1 1 15 2 2 3 2 0 8 \n",
|
||||
"307 Email 308 0 0 1 0 0 0 1 0 1 0 0 0 2 \n",
|
||||
"167 Email 168 2 2 2 1 5 1 24 2 5 6 4 0 30 \n",
|
||||
"320 Email 321 10 12 4 6 8 6 187 5 26 28 23 2 171 \n",
|
||||
"61 Email 62 0 1 1 0 4 1 15 4 4 3 3 0 19 \n",
|
||||
"26 Email 27 5 4 1 1 4 4 51 0 8 6 6 2 44 \n",
|
||||
"73 Email 74 0 0 1 0 0 0 7 0 4 3 0 0 6 \n",
|
||||
"\n",
|
||||
" be that will \n",
|
||||
"150 1 0 0 \n",
|
||||
"380 0 0 0 \n",
|
||||
"19 3 0 1 \n",
|
||||
"300 0 0 0 \n",
|
||||
"307 0 0 0 \n",
|
||||
"167 2 0 0 \n",
|
||||
"320 5 1 1 \n",
|
||||
"61 2 0 0 \n",
|
||||
"26 6 0 0 \n",
|
||||
"73 0 0 0 \n"
|
||||
]
|
||||
}
|
||||
],
|
||||
"metadata": {}
|
||||
},
|
||||
{
|
||||
"cell_type": "code",
|
||||
"execution_count": 14,
|
||||
"source": [
|
||||
"# Returns rows where there are more occurrences of \"to\" than \"the\"\r\n",
|
||||
"print(email_df.query('the < to'))"
|
||||
],
|
||||
"outputs": [
|
||||
{
|
||||
"output_type": "stream",
|
||||
"name": "stdout",
|
||||
"text": [
|
||||
" Email No. the to ect and for of a you in on is this i \\\n",
|
||||
"1 Email 2 8 13 24 6 6 2 102 1 18 21 13 0 61 \n",
|
||||
"3 Email 4 0 5 22 0 5 1 51 2 1 5 9 2 16 \n",
|
||||
"5 Email 6 4 5 1 4 2 3 45 1 16 12 8 1 52 \n",
|
||||
"7 Email 8 0 2 2 3 1 2 21 6 2 6 2 0 28 \n",
|
||||
"13 Email 14 4 5 7 1 5 1 37 1 8 8 6 1 43 \n",
|
||||
".. ... ... .. ... ... ... .. ... ... .. .. .. ... .. \n",
|
||||
"390 Email 5157 4 13 1 0 3 1 48 2 8 26 9 1 45 \n",
|
||||
"393 Email 5160 2 13 1 0 2 1 38 2 7 24 6 1 34 \n",
|
||||
"396 Email 5163 2 3 1 2 1 2 32 0 7 3 2 0 26 \n",
|
||||
"404 Email 5171 2 7 1 0 2 1 28 2 8 11 7 1 39 \n",
|
||||
"405 Email 5172 22 24 5 1 6 5 148 8 23 13 5 4 99 \n",
|
||||
"\n",
|
||||
" be that will \n",
|
||||
"1 4 2 0 \n",
|
||||
"3 2 0 0 \n",
|
||||
"5 2 0 0 \n",
|
||||
"7 1 0 1 \n",
|
||||
"13 1 0 1 \n",
|
||||
".. .. ... ... \n",
|
||||
"390 1 0 0 \n",
|
||||
"393 1 0 0 \n",
|
||||
"396 3 0 0 \n",
|
||||
"404 1 0 0 \n",
|
||||
"405 6 4 1 \n",
|
||||
"\n",
|
||||
"[169 rows x 17 columns]\n"
|
||||
]
|
||||
}
|
||||
],
|
||||
"metadata": {}
|
||||
},
|
||||
{
|
||||
"cell_type": "markdown",
|
||||
"metadata": {},
|
||||
"source": [
|
||||
"---\n\n<!-- CO-OP TRANSLATOR DISCLAIMER START -->\n**ಅಸ್ವೀಕಾರ**: \nಈ ದಸ್ತಾವೇಜು AI ಅನುವಾದ ಸೇವೆ [Co-op Translator](https://github.com/Azure/co-op-translator) ಬಳಸಿ ಅನುವಾದಿಸಲಾಗಿದೆ. ನಾವು ನಿಖರತೆಯಿಗಾಗಿ ಪ್ರಯತ್ನಿಸುತ್ತಿದ್ದರೂ, ಸ್ವಯಂಚಾಲಿತ ಅನುವಾದಗಳಲ್ಲಿ ತಪ್ಪುಗಳು ಅಥವಾ ಅಸತ್ಯತೆಗಳು ಇರಬಹುದು ಎಂದು ದಯವಿಟ್ಟು ಗಮನಿಸಿ. ಮೂಲ ಭಾಷೆಯಲ್ಲಿರುವ ಮೂಲ ದಸ್ತಾವೇಜನ್ನು ಅಧಿಕೃತ ಮೂಲವೆಂದು ಪರಿಗಣಿಸಬೇಕು. ಮಹತ್ವದ ಮಾಹಿತಿಗಾಗಿ, ವೃತ್ತಿಪರ ಮಾನವ ಅನುವಾದವನ್ನು ಶಿಫಾರಸು ಮಾಡಲಾಗುತ್ತದೆ. ಈ ಅನುವಾದ ಬಳಕೆಯಿಂದ ಉಂಟಾಗುವ ಯಾವುದೇ ತಪ್ಪು ಅರ್ಥಮಾಡಿಕೊಳ್ಳುವಿಕೆ ಅಥವಾ ತಪ್ಪು ವಿವರಣೆಗಳಿಗೆ ನಾವು ಹೊಣೆಗಾರರಾಗುವುದಿಲ್ಲ.\n<!-- CO-OP TRANSLATOR DISCLAIMER END -->\n"
|
||||
]
|
||||
}
|
||||
],
|
||||
"metadata": {
|
||||
"orig_nbformat": 4,
|
||||
"language_info": {
|
||||
"name": "python",
|
||||
"version": "3.9.7",
|
||||
"mimetype": "text/x-python",
|
||||
"codemirror_mode": {
|
||||
"name": "ipython",
|
||||
"version": 3
|
||||
},
|
||||
"pygments_lexer": "ipython3",
|
||||
"nbconvert_exporter": "python",
|
||||
"file_extension": ".py"
|
||||
},
|
||||
"kernelspec": {
|
||||
"name": "python3",
|
||||
"display_name": "Python 3.9.7 64-bit ('venv': venv)"
|
||||
},
|
||||
"interpreter": {
|
||||
"hash": "6b9b57232c4b57163d057191678da2030059e733b8becc68f245de5a75abe84e"
|
||||
},
|
||||
"coopTranslator": {
|
||||
"original_hash": "9d102c8c3cdbc8ea4e92fc32593462c6",
|
||||
"translation_date": "2025-12-19T17:11:15+00:00",
|
||||
"source_file": "4-Data-Science-Lifecycle/15-analyzing/notebook.ipynb",
|
||||
"language_code": "kn"
|
||||
}
|
||||
},
|
||||
"nbformat": 4,
|
||||
"nbformat_minor": 2
|
||||
}
|
||||
@ -0,0 +1,28 @@
|
||||
<!--
|
||||
CO_OP_TRANSLATOR_METADATA:
|
||||
{
|
||||
"original_hash": "8980d7efd101c82d6d6ffc3458214120",
|
||||
"translation_date": "2025-12-19T15:23:15+00:00",
|
||||
"source_file": "4-Data-Science-Lifecycle/16-communication/assignment.md",
|
||||
"language_code": "kn"
|
||||
}
|
||||
-->
|
||||
# ಕಥೆಯನ್ನು ಹೇಳಿ
|
||||
|
||||
## ಸೂಚನೆಗಳು
|
||||
|
||||
ಡೇಟಾ ಸೈನ್ಸ್ ಎಂದರೆ ಕಥೆ ಹೇಳುವ ಕಲೆಯೇ. ಯಾವುದೇ ಡೇಟಾಸೆಟ್ ಅನ್ನು ಆಯ್ಕೆಮಾಡಿ ಅದರ ಬಗ್ಗೆ ನೀವು ಹೇಳಬಹುದಾದ ಕಥೆಯ ಕುರಿತು ಒಂದು ಚಿಕ್ಕ ಪ್ರಬಂಧವನ್ನು ಬರೆಯಿರಿ. ನಿಮ್ಮ ಡೇಟಾಸೆಟ್ ಏನು ಬಹಿರಂಗಪಡಿಸಬಹುದು ಎಂದು ನೀವು ನಿರೀಕ್ಷಿಸುತ್ತೀರಿ? ಅದರ ಬಹಿರಂಗಪಡಿಸುವಿಕೆಗಳು ಸಮಸ್ಯೆಕಾರಿಯಾಗಿದ್ದರೆ ನೀವು ಏನು ಮಾಡುತ್ತೀರಿ? ನಿಮ್ಮ ಡೇಟಾ ಸುಲಭವಾಗಿ ಅದರ ರಹಸ್ಯಗಳನ್ನು ಅನಾವರಣ ಮಾಡದಿದ್ದರೆ ಏನು? ನಿಮ್ಮ ಡೇಟಾಸೆಟ್ ನೀಡಬಹುದಾದ ಸಂದರ್ಭಗಳನ್ನು ಯೋಚಿಸಿ ಅವುಗಳನ್ನು ಬರೆಯಿರಿ.
|
||||
|
||||
## ಮೌಲ್ಯಮಾಪನ
|
||||
|
||||
ಉದಾಹರಣೆಯಾದ | ತೃಪ್ತಿಕರ | ಸುಧಾರಣೆಯ ಅಗತ್ಯವಿದೆ
|
||||
--- | --- | -- |
|
||||
|
||||
ಡೇಟಾಸೆಟ್ ವಿವರಿಸಲ್ಪಟ್ಟಿದ್ದು, ದಾಖಲೆ ಮಾಡಲ್ಪಟ್ಟಿದ್ದು, ಕ್ರೆಡಿಟ್ ನೀಡಲ್ಪಟ್ಟಿದ್ದು, ಅದರ ಬಗ್ಗೆ ಸಮಗ್ರ ಕಥೆಯನ್ನು ವಿವರಿಸಿದ ಒಂದು ಪುಟದ ಪ್ರಬಂಧ .doc ಫಾರ್ಮ್ಯಾಟ್ನಲ್ಲಿ ನೀಡಲಾಗಿದೆ, ಡೇಟಾದಿಂದ ವಿವರವಾದ ಉದಾಹರಣೆಗಳೊಂದಿಗೆ. | ಕಡಿಮೆ ವಿವರಗಳೊಂದಿಗೆ ಚಿಕ್ಕ ಪ್ರಬಂಧ ನೀಡಲಾಗಿದೆ | ಮೇಲ್ಕಂಡ ವಿವರಗಳಲ್ಲಿ ಒಂದರಲ್ಲಿ ಕೊರತೆ ಕಂಡುಬರುತ್ತದೆ.
|
||||
|
||||
---
|
||||
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
|
||||
**ಅಸ್ವೀಕರಣ**:
|
||||
ಈ ದಸ್ತಾವೇಜು [Co-op Translator](https://github.com/Azure/co-op-translator) ಎಂಬ AI ಅನುವಾದ ಸೇವೆಯನ್ನು ಬಳಸಿ ಅನುವಾದಿಸಲಾಗಿದೆ. ನಾವು ಶುದ್ಧತೆಯತ್ತ ಪ್ರಯತ್ನಿಸುತ್ತಿದ್ದರೂ, ಸ್ವಯಂಚಾಲಿತ ಅನುವಾದಗಳಲ್ಲಿ ತಪ್ಪುಗಳು ಅಥವಾ ಅಸತ್ಯತೆಗಳು ಇರಬಹುದು ಎಂದು ದಯವಿಟ್ಟು ಗಮನಿಸಿ. ಮೂಲ ಭಾಷೆಯಲ್ಲಿರುವ ಮೂಲ ದಸ್ತಾವೇಜನ್ನು ಅಧಿಕೃತ ಮೂಲವೆಂದು ಪರಿಗಣಿಸಬೇಕು. ಮಹತ್ವದ ಮಾಹಿತಿಗಾಗಿ, ವೃತ್ತಿಪರ ಮಾನವ ಅನುವಾದವನ್ನು ಶಿಫಾರಸು ಮಾಡಲಾಗುತ್ತದೆ. ಈ ಅನುವಾದ ಬಳಕೆಯಿಂದ ಉಂಟಾಗುವ ಯಾವುದೇ ತಪ್ಪು ಅರ್ಥಮಾಡಿಕೊಳ್ಳುವಿಕೆ ಅಥವಾ ತಪ್ಪು ವಿವರಣೆಗಳಿಗೆ ನಾವು ಹೊಣೆಗಾರರಾಗುವುದಿಲ್ಲ.
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER END -->
|
||||
@ -0,0 +1,32 @@
|
||||
<!--
|
||||
CO_OP_TRANSLATOR_METADATA:
|
||||
{
|
||||
"original_hash": "dd173fd30fc039a7a299898920680723",
|
||||
"translation_date": "2025-12-19T13:24:49+00:00",
|
||||
"source_file": "4-Data-Science-Lifecycle/README.md",
|
||||
"language_code": "kn"
|
||||
}
|
||||
-->
|
||||
# ಡೇಟಾ ಸೈನ್ಸ್ ಜೀವನಚಕ್ರ
|
||||
|
||||

|
||||
> ಫೋಟೋ <a href="https://unsplash.com/@headwayio?utm_source=unsplash&utm_medium=referral&utm_content=creditCopyText">ಹೆಡ್ವೇ</a> ಅವರಿಂದ <a href="https://unsplash.com/s/photos/communication?utm_source=unsplash&utm_medium=referral&utm_content=creditCopyText">ಅನ್ಸ್ಪ್ಲ್ಯಾಶ್</a> ನಲ್ಲಿ
|
||||
|
||||
ಈ ಪಾಠಗಳಲ್ಲಿ, ನೀವು ಡೇಟಾ ಸೈನ್ಸ್ ಜೀವನಚಕ್ರದ ಕೆಲವು ಅಂಶಗಳನ್ನು, ಡೇಟಾ ಸುತ್ತಲೂ ವಿಶ್ಲೇಷಣೆ ಮತ್ತು ಸಂವಹನವನ್ನು ಅನ್ವೇಷಿಸುವಿರಿ.
|
||||
|
||||
### ವಿಷಯಗಳು
|
||||
|
||||
1. [ಪರಿಚಯ](14-Introduction/README.md)
|
||||
2. [ವಿಶ್ಲೇಷಣೆ](15-analyzing/README.md)
|
||||
3. [ಸಂವಹನ](16-communication/README.md)
|
||||
|
||||
### ಕ್ರೆಡಿಟ್ಸ್
|
||||
|
||||
ಈ ಪಾಠಗಳನ್ನು ❤️ ಸಹಿತ [ಜೆಲೆನ್ ಮ್ಯಾಕ್ಗೀ](https://twitter.com/JalenMCG) ಮತ್ತು [ಜಾಸ್ಮಿನ್ ಗ್ರೀನವೇ](https://twitter.com/paladique) ರವರು ಬರೆಯಲಾಗಿದೆ
|
||||
|
||||
---
|
||||
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
|
||||
**ಅಸ್ವೀಕಾರ**:
|
||||
ಈ ದಸ್ತಾವೇಜು [Co-op Translator](https://github.com/Azure/co-op-translator) ಎಂಬ AI ಅನುವಾದ ಸೇವೆಯನ್ನು ಬಳಸಿ ಅನುವಾದಿಸಲಾಗಿದೆ. ನಾವು ಶುದ್ಧತೆಯತ್ತ ಪ್ರಯತ್ನಿಸುತ್ತಿದ್ದರೂ, ಸ್ವಯಂಚಾಲಿತ ಅನುವಾದಗಳಲ್ಲಿ ತಪ್ಪುಗಳು ಅಥವಾ ಅಸತ್ಯತೆಗಳು ಇರಬಹುದು ಎಂದು ದಯವಿಟ್ಟು ಗಮನಿಸಿ. ಮೂಲ ಭಾಷೆಯಲ್ಲಿರುವ ಮೂಲ ದಸ್ತಾವೇಜನ್ನು ಅಧಿಕೃತ ಮೂಲವೆಂದು ಪರಿಗಣಿಸಬೇಕು. ಮಹತ್ವದ ಮಾಹಿತಿಗಾಗಿ, ವೃತ್ತಿಪರ ಮಾನವ ಅನುವಾದವನ್ನು ಶಿಫಾರಸು ಮಾಡಲಾಗುತ್ತದೆ. ಈ ಅನುವಾದ ಬಳಕೆಯಿಂದ ಉಂಟಾಗುವ ಯಾವುದೇ ತಪ್ಪು ಅರ್ಥಮಾಡಿಕೊಳ್ಳುವಿಕೆ ಅಥವಾ ತಪ್ಪು ವಿವರಣೆಗಳಿಗೆ ನಾವು ಹೊಣೆಗಾರರಾಗುವುದಿಲ್ಲ.
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER END -->
|
||||
@ -0,0 +1,116 @@
|
||||
<!--
|
||||
CO_OP_TRANSLATOR_METADATA:
|
||||
{
|
||||
"original_hash": "5f8e7cdefa096664ae86f795be571580",
|
||||
"translation_date": "2025-12-19T15:16:46+00:00",
|
||||
"source_file": "5-Data-Science-In-Cloud/17-Introduction/README.md",
|
||||
"language_code": "kn"
|
||||
}
|
||||
-->
|
||||
# ಕ್ಲೌಡ್ನಲ್ಲಿ ಡೇಟಾ ಸೈನ್ಸ್ಗೆ ಪರಿಚಯ
|
||||
|
||||
| ಅವರಿಂದ ಸ್ಕೆಚ್ ನೋಟ್ ](../../sketchnotes/17-DataScience-Cloud.png)|
|
||||
|:---:|
|
||||
| ಕ್ಲೌಡ್ನಲ್ಲಿ ಡೇಟಾ ಸೈನ್ಸ್: ಪರಿಚಯ - _[@nitya](https://twitter.com/nitya) ಅವರಿಂದ ಸ್ಕೆಚ್ ನೋಟ್_ |
|
||||
|
||||
|
||||
ಈ ಪಾಠದಲ್ಲಿ, ನೀವು ಕ್ಲೌಡ್ನ ಮೂಲಭೂತ ತತ್ವಗಳನ್ನು ಕಲಿಯುತ್ತೀರಿ, ನಂತರ ನಿಮ್ಮ ಡೇಟಾ ಸೈನ್ಸ್ ಯೋಜನೆಗಳನ್ನು ನಡೆಸಲು ಕ್ಲೌಡ್ ಸೇವೆಗಳನ್ನು ಬಳಸುವುದು ನಿಮಗೆ ಏಕೆ ಆಸಕ್ತಿದಾಯಕವಾಗಬಹುದು ಎಂದು ನೋಡುತ್ತೀರಿ ಮತ್ತು ಕ್ಲೌಡ್ನಲ್ಲಿ ನಡೆಸಲ್ಪಡುವ ಕೆಲವು ಡೇಟಾ ಸೈನ್ಸ್ ಯೋಜನೆಗಳ ಉದಾಹರಣೆಗಳನ್ನು ನೋಡುತ್ತೇವೆ.
|
||||
|
||||
|
||||
## [ಪೂರ್ವ-ಪಾಠ ಪ್ರಶ್ನೋತ್ತರ](https://ff-quizzes.netlify.app/en/ds/quiz/32)
|
||||
|
||||
|
||||
## ಕ್ಲೌಡ್ ಎಂದರೆ ಏನು?
|
||||
|
||||
ಕ್ಲೌಡ್ ಅಥವಾ ಕ್ಲೌಡ್ ಕಂಪ್ಯೂಟಿಂಗ್ ಎಂದರೆ ಇಂಟರ್ನೆಟ್ ಮೂಲಕ ಹೋಸ್ಟ್ ಮಾಡಲಾದ ಮೂಲಸೌಕರ್ಯದಲ್ಲಿ ಪಾವತಿಸು-ಬಳಸುವ ಆಧಾರದ ಮೇಲೆ ವಿವಿಧ ಕಂಪ್ಯೂಟಿಂಗ್ ಸೇವೆಗಳ ವಿತರಣೆ. ಸೇವೆಗಳಲ್ಲಿ ಸಂಗ್ರಹಣೆ, ಡೇಟಾಬೇಸ್ಗಳು, ನೆಟ್ವರ್ಕಿಂಗ್, ಸಾಫ್ಟ್ವೇರ್, ವಿಶ್ಲೇಷಣೆ ಮತ್ತು ಬುದ್ಧಿವಂತ ಸೇವೆಗಳು ಸೇರಿವೆ.
|
||||
|
||||
ನಾವು ಸಾಮಾನ್ಯವಾಗಿ ಸಾರ್ವಜನಿಕ, ಖಾಸಗಿ ಮತ್ತು ಸಂಯುಕ್ತ ಕ್ಲೌಡ್ಗಳನ್ನು ಹೀಗಾಗಿ ವಿಭಜಿಸುತ್ತೇವೆ:
|
||||
|
||||
* ಸಾರ್ವಜನಿಕ ಕ್ಲೌಡ್: ಸಾರ್ವಜನಿಕ ಕ್ಲೌಡ್ ಅನ್ನು ಮೂರನೇ ಪಕ್ಷದ ಕ್ಲೌಡ್ ಸೇವಾ ಪೂರೈಕೆದಾರರು ಹೊಂದಿದ್ದು, ಇಂಟರ್ನೆಟ್ ಮೂಲಕ ಸಾರ್ವಜನಿಕರಿಗೆ ಕಂಪ್ಯೂಟಿಂಗ್ ಸಂಪನ್ಮೂಲಗಳನ್ನು ವಿತರಿಸುತ್ತಾರೆ.
|
||||
* ಖಾಸಗಿ ಕ್ಲೌಡ್: ಖಾಸಗಿ ಕ್ಲೌಡ್ ಎಂದರೆ ಒಂದು ವ್ಯವಹಾರ ಅಥವಾ ಸಂಸ್ಥೆ ಮಾತ್ರ ಬಳಸುವ ಕ್ಲೌಡ್ ಕಂಪ್ಯೂಟಿಂಗ್ ಸಂಪನ್ಮೂಲಗಳು, ಸೇವೆಗಳು ಮತ್ತು ಮೂಲಸೌಕರ್ಯ ಖಾಸಗಿ ನೆಟ್ವರ್ಕ್ನಲ್ಲಿ ನಿರ್ವಹಿಸಲಾಗುತ್ತದೆ.
|
||||
* ಸಂಯುಕ್ತ ಕ್ಲೌಡ್: ಸಂಯುಕ್ತ ಕ್ಲೌಡ್ ಎಂದರೆ ಸಾರ್ವಜನಿಕ ಮತ್ತು ಖಾಸಗಿ ಕ್ಲೌಡ್ಗಳನ್ನು ಸಂಯೋಜಿಸುವ ವ್ಯವಸ್ಥೆ. ಬಳಕೆದಾರರು ಆನ್-ಪ್ರೆಮೈಸಸ್ ಡೇಟಾಸೆಂಟರ್ ಆಯ್ಕೆಮಾಡುತ್ತಾರೆ, ಆದರೆ ಡೇಟಾ ಮತ್ತು ಅಪ್ಲಿಕೇಶನ್ಗಳನ್ನು ಒಂದು ಅಥವಾ ಹೆಚ್ಚು ಸಾರ್ವಜನಿಕ ಕ್ಲೌಡ್ಗಳಲ್ಲಿ ನಡೆಸಲು ಅನುಮತಿಸುತ್ತಾರೆ.
|
||||
|
||||
ಬಹುತೇಕ ಕ್ಲೌಡ್ ಕಂಪ್ಯೂಟಿಂಗ್ ಸೇವೆಗಳು ಮೂರು ವರ್ಗಗಳಲ್ಲಿ ಬರುತ್ತವೆ: ಮೂಲಸೌಕರ್ಯ ಸೇವೆಯಾಗಿ (IaaS), ವೇದಿಕೆ ಸೇವೆಯಾಗಿ (PaaS) ಮತ್ತು ಸಾಫ್ಟ್ವೇರ್ ಸೇವೆಯಾಗಿ (SaaS).
|
||||
|
||||
* ಮೂಲಸೌಕರ್ಯ ಸೇವೆಯಾಗಿ (IaaS): ಬಳಕೆದಾರರು ಸರ್ವರ್ಗಳು ಮತ್ತು ವರ್ಚುವಲ್ ಮಷೀನ್ಗಳು (VMs), ಸಂಗ್ರಹಣೆ, ನೆಟ್ವರ್ಕ್ಗಳು, ಆಪರೇಟಿಂಗ್ ಸಿಸ್ಟಮ್ಗಳಂತಹ ಐಟಿ ಮೂಲಸೌಕರ್ಯವನ್ನು ಬಾಡಿಗೆಗೆ ಪಡೆಯುತ್ತಾರೆ
|
||||
* ವೇದಿಕೆ ಸೇವೆಯಾಗಿ (PaaS): ಬಳಕೆದಾರರು ಸಾಫ್ಟ್ವೇರ್ ಅಪ್ಲಿಕೇಶನ್ಗಳನ್ನು ಅಭಿವೃದ್ಧಿಪಡಿಸುವ, ಪರೀಕ್ಷಿಸುವ, ವಿತರಿಸುವ ಮತ್ತು ನಿರ್ವಹಿಸುವ ಪರಿಸರವನ್ನು ಬಾಡಿಗೆಗೆ ಪಡೆಯುತ್ತಾರೆ. ಅಭಿವೃದ್ಧಿಗೆ ಅಗತ್ಯವಿರುವ ಸರ್ವರ್ಗಳು, ಸಂಗ್ರಹಣೆ, ನೆಟ್ವರ್ಕ್ ಮತ್ತು ಡೇಟಾಬೇಸ್ಗಳ ಮೂಲಸೌಕರ್ಯವನ್ನು ಹೊಂದಿಸುವ ಅಥವಾ ನಿರ್ವಹಿಸುವ ಬಗ್ಗೆ ಬಳಕೆದಾರರು ಚಿಂತಿಸಬೇಕಾಗಿಲ್ಲ.
|
||||
* ಸಾಫ್ಟ್ವೇರ್ ಸೇವೆಯಾಗಿ (SaaS): ಬಳಕೆದಾರರು ಇಂಟರ್ನೆಟ್ ಮೂಲಕ, ಬೇಡಿಕೆಯಂತೆ ಮತ್ತು ಸಾಮಾನ್ಯವಾಗಿ ಚಂದಾದಾರಿಕೆಯ ಆಧಾರದ ಮೇಲೆ ಸಾಫ್ಟ್ವೇರ್ ಅಪ್ಲಿಕೇಶನ್ಗಳಿಗೆ ಪ್ರವೇಶ ಪಡೆಯುತ್ತಾರೆ. ಸಾಫ್ಟ್ವೇರ್ ಅಪ್ಲಿಕೇಶನ್, ಮೂಲಸೌಕರ್ಯ ಅಥವಾ ನಿರ್ವಹಣೆ, ಉದಾಹರಣೆಗೆ ಸಾಫ್ಟ್ವೇರ್ ಅಪ್ಗ್ರೇಡ್ಗಳು ಮತ್ತು ಭದ್ರತಾ ಪ್ಯಾಚ್ಗಳನ್ನು ನಿರ್ವಹಿಸುವ ಬಗ್ಗೆ ಬಳಕೆದಾರರು ಚಿಂತಿಸಬೇಕಾಗಿಲ್ಲ.
|
||||
|
||||
ಅಮೆಜಾನ್ ವೆಬ್ ಸರ್ವಿಸಸ್, ಗೂಗಲ್ ಕ್ಲೌಡ್ ಪ್ಲಾಟ್ಫಾರ್ಮ್ ಮತ್ತು ಮೈಕ್ರೋಸಾಫ್ಟ್ ಅಜೂರ್ ಕೆಲವು ದೊಡ್ಡ ಕ್ಲೌಡ್ ಪೂರೈಕೆದಾರರು.
|
||||
|
||||
## ಡೇಟಾ ಸೈನ್ಸ್ಗೆ ಕ್ಲೌಡ್ ಆಯ್ಕೆಮಾಡಬೇಕಾದ ಕಾರಣ?
|
||||
|
||||
ವಿಕಸಕರೂ ಮತ್ತು ಐಟಿ ವೃತ್ತಿಪರರೂ ಹಲವಾರು ಕಾರಣಗಳಿಂದ ಕ್ಲೌಡ್ನಲ್ಲಿ ಕೆಲಸ ಮಾಡಲು ಆಯ್ಕೆಮಾಡುತ್ತಾರೆ, ಅವುಗಳಲ್ಲಿ ಕೆಲವು ಈ ಕೆಳಗಿನಂತಿವೆ:
|
||||
|
||||
* ನವೀನತೆ: ನೀವು ನಿಮ್ಮ ಅಪ್ಲಿಕೇಶನ್ಗಳನ್ನು ನೇರವಾಗಿ ಕ್ಲೌಡ್ ಪೂರೈಕೆದಾರರಿಂದ ರಚಿಸಲಾದ ನವೀನ ಸೇವೆಗಳನ್ನು ಸಂಯೋಜಿಸುವ ಮೂಲಕ ಶಕ್ತಿಶಾಲಿ ಮಾಡಬಹುದು.
|
||||
* ಲವಚಿಕತೆ: ನೀವು ಬೇಕಾದ ಸೇವೆಗಳಿಗೆ ಮಾತ್ರ ಪಾವತಿಸುತ್ತೀರಿ ಮತ್ತು ವಿವಿಧ ಸೇವೆಗಳಲ್ಲಿಂದ ಆಯ್ಕೆಮಾಡಬಹುದು. ಸಾಮಾನ್ಯವಾಗಿ ನೀವು ಬಳಕೆಮಾಡಿದಷ್ಟು ಪಾವತಿಸುತ್ತೀರಿ ಮತ್ತು ನಿಮ್ಮ ಬದಲಾಗುತ್ತಿರುವ ಅಗತ್ಯಗಳಿಗೆ ಅನುಗುಣವಾಗಿ ಸೇವೆಗಳನ್ನು ಹೊಂದಿಕೊಳ್ಳಬಹುದು.
|
||||
* ಬಜೆಟ್: ನೀವು ಹಾರ್ಡ್ವೇರ್ ಮತ್ತು ಸಾಫ್ಟ್ವೇರ್ ಖರೀದಿಸಲು ಪ್ರಾಥಮಿಕ ಹೂಡಿಕೆ ಮಾಡಬೇಕಾಗಿಲ್ಲ, ಆನ್-ಸೈಟ್ ಡೇಟಾಸೆಂಟರ್ಗಳನ್ನು ಸ್ಥಾಪಿಸಿ ನಡೆಸಬೇಕಾಗಿಲ್ಲ ಮತ್ತು ನೀವು ಬಳಸಿದಷ್ಟು ಮಾತ್ರ ಪಾವತಿಸಬಹುದು.
|
||||
* ವಿಸ್ತರಣೆ ಸಾಮರ್ಥ್ಯ: ನಿಮ್ಮ ಸಂಪನ್ಮೂಲಗಳು ನಿಮ್ಮ ಯೋಜನೆಯ ಅಗತ್ಯಗಳಿಗೆ ಅನುಗುಣವಾಗಿ ವಿಸ್ತರಿಸಬಹುದು, ಅಂದರೆ ನಿಮ್ಮ ಅಪ್ಲಿಕೇಶನ್ಗಳು ಹೆಚ್ಚು ಅಥವಾ ಕಡಿಮೆ ಕಂಪ್ಯೂಟಿಂಗ್ ಶಕ್ತಿ, ಸಂಗ್ರಹಣೆ ಮತ್ತು ಬ್ಯಾಂಡ್ವಿಡ್ತ್ ಬಳಸಬಹುದು, ಯಾವುದೇ ಸಮಯದಲ್ಲಿ ಬಾಹ್ಯ ಕಾರಣಗಳಿಗೆ ಹೊಂದಿಕೊಳ್ಳುತ್ತವೆ.
|
||||
* ಉತ್ಪಾದಕತೆ: ಡೇಟಾಸೆಂಟರ್ಗಳನ್ನು ನಿರ್ವಹಿಸುವಂತಹ ಕೆಲಸಗಳಿಗೆ ಸಮಯ ವ್ಯಯಿಸುವ ಬದಲು ನಿಮ್ಮ ವ್ಯವಹಾರಕ್ಕೆ ಗಮನಹರಿಸಬಹುದು.
|
||||
* ನಂಬಿಕೆ: ಕ್ಲೌಡ್ ಕಂಪ್ಯೂಟಿಂಗ್ ನಿಮ್ಮ ಡೇಟಾವನ್ನು ನಿರಂತರವಾಗಿ ಬ್ಯಾಕಪ್ ಮಾಡಲು ಹಲವಾರು ಮಾರ್ಗಗಳನ್ನು ಒದಗಿಸುತ್ತದೆ ಮತ್ತು ಸಂಕಷ್ಟದ ಸಮಯದಲ್ಲೂ ನಿಮ್ಮ ವ್ಯವಹಾರ ಮತ್ತು ಸೇವೆಗಳನ್ನು ಮುಂದುವರಿಸಲು ವಿಪತ್ತು ಪುನರುತ್ಥಾನ ಯೋಜನೆಗಳನ್ನು ಸ್ಥಾಪಿಸಬಹುದು.
|
||||
* ಭದ್ರತೆ: ನಿಮ್ಮ ಯೋಜನೆಯ ಭದ್ರತೆಯನ್ನು ಬಲಪಡಿಸುವ ನೀತಿಗಳು, ತಂತ್ರಜ್ಞಾನಗಳು ಮತ್ತು ನಿಯಂತ್ರಣಗಳಿಂದ ನೀವು ಲಾಭ ಪಡೆಯಬಹುದು.
|
||||
|
||||
ಇವು ಕೆಲವೇ ಸಾಮಾನ್ಯ ಕಾರಣಗಳು, ಜನರು ಕ್ಲೌಡ್ ಸೇವೆಗಳನ್ನು ಬಳಸಲು ಆಯ್ಕೆಮಾಡುವ. ಈಗ ನಾವು ಕ್ಲೌಡ್ ಎಂದರೇನು ಮತ್ತು ಅದರ ಪ್ರಮುಖ ಲಾಭಗಳು ಏನೆಂದು ಉತ್ತಮವಾಗಿ ಅರ್ಥಮಾಡಿಕೊಂಡಿದ್ದೇವೆ, ಡೇಟಾ ವಿಜ್ಞಾನಿಗಳು ಮತ್ತು ಡೇಟಾ ಜೊತೆ ಕೆಲಸ ಮಾಡುವ ವಿಕಸಕರ ಕೆಲಸಗಳನ್ನು ಮತ್ತು ಅವರು ಎದುರಿಸಬಹುದಾದ ಹಲವು ಸವಾಲುಗಳಲ್ಲಿ ಕ್ಲೌಡ್ ಹೇಗೆ ಸಹಾಯ ಮಾಡಬಹುದು ಎಂಬುದನ್ನು ವಿಶೇಷವಾಗಿ ನೋಡೋಣ:
|
||||
|
||||
* ದೊಡ್ಡ ಪ್ರಮಾಣದ ಡೇಟಾವನ್ನು ಸಂಗ್ರಹಿಸುವುದು: ದೊಡ್ಡ ಸರ್ವರ್ಗಳನ್ನು ಖರೀದಿಸುವ, ನಿರ್ವಹಿಸುವ ಮತ್ತು ರಕ್ಷಿಸುವ ಬದಲು, ನೀವು ನಿಮ್ಮ ಡೇಟಾವನ್ನು ನೇರವಾಗಿ ಕ್ಲೌಡ್ನಲ್ಲಿ ಸಂಗ್ರಹಿಸಬಹುದು, ಉದಾಹರಣೆಗೆ Azure Cosmos DB, Azure SQL Database ಮತ್ತು Azure Data Lake Storage.
|
||||
* ಡೇಟಾ ಏಕೀಕರಣವನ್ನು ನಿರ್ವಹಿಸುವುದು: ಡೇಟಾ ಏಕೀಕರಣವು ಡೇಟಾ ಸಂಗ್ರಹಣೆಯಿಂದ ಕ್ರಮ ಕೈಗೊಳ್ಳುವಿಕೆಗೆ ಪರಿವರ್ತನೆ ಮಾಡಲು ಅಗತ್ಯವಿರುವ ಡೇಟಾ ಸೈನ್ಸ್ನ ಅವಿಭಾಜ್ಯ ಭಾಗ. ಕ್ಲೌಡ್ನಲ್ಲಿ ನೀಡಲಾದ ಡೇಟಾ ಏಕೀಕರಣ ಸೇವೆಗಳೊಂದಿಗೆ, ನೀವು ವಿವಿಧ ಮೂಲಗಳಿಂದ ಡೇಟಾವನ್ನು ಸಂಗ್ರಹಿಸಿ, ಪರಿವರ್ತಿಸಿ ಮತ್ತು Data Factory ಮೂಲಕ ಒಟ್ಟಾರೆ ಡೇಟಾ ವೇರ್ಹೌಸ್ಗೆ ಏಕೀಕರಿಸಬಹುದು.
|
||||
* ಡೇಟಾ ಪ್ರಕ್ರಿಯೆಗೊಳಿಸುವುದು: ದೊಡ್ಡ ಪ್ರಮಾಣದ ಡೇಟಾವನ್ನು ಪ್ರಕ್ರಿಯೆಗೊಳಿಸಲು ಹೆಚ್ಚಿನ ಕಂಪ್ಯೂಟಿಂಗ್ ಶಕ್ತಿ ಬೇಕಾಗುತ್ತದೆ, ಮತ್ತು ಎಲ್ಲರಿಗೂ ಅದಕ್ಕೆ ತಕ್ಕಷ್ಟು ಶಕ್ತಿಶಾಲಿ ಯಂತ್ರಗಳ ಪ್ರವೇಶವಿಲ್ಲ, ಆದ್ದರಿಂದ ಅನೇಕರು ತಮ್ಮ ಪರಿಹಾರಗಳನ್ನು ನಡೆಸಲು ಮತ್ತು ನಿಯೋಜಿಸಲು ನೇರವಾಗಿ ಕ್ಲೌಡ್ನ ಭಾರೀ ಕಂಪ್ಯೂಟಿಂಗ್ ಶಕ್ತಿಯನ್ನು ಬಳಸಲು ಆಯ್ಕೆಮಾಡುತ್ತಾರೆ.
|
||||
* ಡೇಟಾ ವಿಶ್ಲೇಷಣೆ ಸೇವೆಗಳನ್ನು ಬಳಸುವುದು: Azure Synapse Analytics, Azure Stream Analytics ಮತ್ತು Azure Databricks ಮುಂತಾದ ಕ್ಲೌಡ್ ಸೇವೆಗಳು ನಿಮ್ಮ ಡೇಟಾವನ್ನು ಕಾರ್ಯನಿರ್ವಹಣೀಯ ಒಳನೋಟಗಳಾಗಿ ಪರಿವರ್ತಿಸಲು ಸಹಾಯ ಮಾಡುತ್ತವೆ.
|
||||
* ಯಂತ್ರ ಅಧ್ಯಯನ ಮತ್ತು ಡೇಟಾ ಬುದ್ಧಿವಂತಿಕೆ ಸೇವೆಗಳನ್ನು ಬಳಸುವುದು: ಆರಂಭದಿಂದಲೇ ಪ್ರಾರಂಭಿಸುವ ಬದಲು, ನೀವು ಕ್ಲೌಡ್ ಪೂರೈಕೆದಾರರಿಂದ ನೀಡಲಾದ ಯಂತ್ರ ಅಧ್ಯಯನ ಆಲ್ಗಾರಿದಮ್ಗಳನ್ನು, ಉದಾಹರಣೆಗೆ AzureML ಸೇವೆಗಳನ್ನು ಬಳಸಬಹುದು. ನೀವು ಮಾತು-ದಿಂದ-ಪಠ್ಯ, ಪಠ್ಯ-ದಿಂದ-ಮಾತು, ಕಂಪ್ಯೂಟರ್ ದೃಷ್ಟಿ ಮತ್ತು ಇನ್ನಷ್ಟು ಜ್ಞಾನ ಸೇವೆಗಳನ್ನು ಕೂಡ ಬಳಸಬಹುದು.
|
||||
|
||||
## ಕ್ಲೌಡ್ನಲ್ಲಿ ಡೇಟಾ ಸೈನ್ಸ್ ಉದಾಹರಣೆಗಳು
|
||||
|
||||
ಇದನ್ನು ಇನ್ನಷ್ಟು ಸ್ಪಷ್ಟಗೊಳಿಸಲು ಕೆಲವು ದೃಶ್ಯಗಳನ್ನು ನೋಡೋಣ.
|
||||
|
||||
### ನೈಜ-ಸಮಯ ಸಾಮಾಜಿಕ ಮಾಧ್ಯಮ ಭಾವನೆ ವಿಶ್ಲೇಷಣೆ
|
||||
ನಾವು ಯಂತ್ರ ಅಧ್ಯಯನದಿಂದ ಪ್ರಾರಂಭಿಸುವ ಜನರು ಸಾಮಾನ್ಯವಾಗಿ ಅಧ್ಯಯನ ಮಾಡುವ ದೃಶ್ಯದಿಂದ ಪ್ರಾರಂಭಿಸೋಣ: ನೈಜ-ಸಮಯ ಸಾಮಾಜಿಕ ಮಾಧ್ಯಮ ಭಾವನೆ ವಿಶ್ಲೇಷಣೆ.
|
||||
|
||||
ನೀವು ಸುದ್ದಿಮಾಧ್ಯಮ ವೆಬ್ಸೈಟ್ ಅನ್ನು ನಡೆಸುತ್ತಿರುವಿರಿ ಎಂದು ಹೇಳೋಣ ಮತ್ತು ನಿಮ್ಮ ಓದುಗರಿಗೆ ಯಾವ ವಿಷಯ ಆಸಕ್ತಿದಾಯಕವಾಗಬಹುದು ಎಂದು ತಿಳಿಯಲು ನೈಜ-ಸಮಯ ಡೇಟಾವನ್ನು ಬಳಸಲು ಬಯಸುತ್ತೀರಿ. ಅದನ್ನು ತಿಳಿಯಲು, ನೀವು ಟ್ವಿಟ್ಟರ್ ಪ್ರಕಟಣೆಗಳಿಂದ ನೈಜ-ಸಮಯ ಭಾವನೆ ವಿಶ್ಲೇಷಣೆ ಮಾಡುವ ಕಾರ್ಯಕ್ರಮವನ್ನು ನಿರ್ಮಿಸಬಹುದು, ನಿಮ್ಮ ಓದುಗರಿಗೆ ಸಂಬಂಧಿಸಿದ ವಿಷಯಗಳ ಮೇಲೆ.
|
||||
|
||||
ನೀವು ನೋಡಬೇಕಾದ ಪ್ರಮುಖ ಸೂಚಕಗಳು ನಿರ್ದಿಷ್ಟ ವಿಷಯಗಳ (ಹ್ಯಾಷ್ಟ್ಯಾಗ್ಗಳು) ಮೇಲೆ ಟ್ವೀಟ್ಗಳ ಪ್ರಮಾಣ ಮತ್ತು ಭಾವನೆ, ಇದು analytics ಉಪಕರಣಗಳನ್ನು ಬಳಸಿ ಆ ವಿಷಯಗಳ ಸುತ್ತಲೂ ಭಾವನೆ ವಿಶ್ಲೇಷಣೆ ಮಾಡುವ ಮೂಲಕ ಸ್ಥಾಪಿಸಲಾಗುತ್ತದೆ.
|
||||
|
||||
ಈ ಯೋಜನೆಯನ್ನು ರಚಿಸಲು ಅಗತ್ಯವಿರುವ ಹಂತಗಳು ಇವು:
|
||||
|
||||
* ಟ್ವಿಟ್ಟರ್ನಿಂದ ಡೇಟಾ ಸಂಗ್ರಹಿಸಲು ಸ್ಟ್ರೀಮಿಂಗ್ ಇನ್ಪುಟ್ಗಾಗಿ ಇವೆಂಟ್ ಹಬ್ ರಚಿಸಿ
|
||||
* ಟ್ವಿಟ್ಟರ್ ಸ್ಟ್ರೀಮಿಂಗ್ APIಗಳನ್ನು ಕರೆಮಾಡುವ ಟ್ವಿಟ್ಟರ್ ಕ್ಲೈಂಟ್ ಅಪ್ಲಿಕೇಶನ್ ಅನ್ನು ಸಂರಚಿಸಿ ಮತ್ತು ಪ್ರಾರಂಭಿಸಿ
|
||||
* ಸ್ಟ್ರೀಮ್ ಅನಾಲಿಟಿಕ್ಸ್ ಕೆಲಸವನ್ನು ರಚಿಸಿ
|
||||
* ಕೆಲಸದ ಇನ್ಪುಟ್ ಮತ್ತು ಕ್ವೆರಿಯನ್ನು ನಿರ್ದಿಷ್ಟಪಡಿಸಿ
|
||||
* ಔಟ್ಪುಟ್ ಸಿಂಕ್ ರಚಿಸಿ ಮತ್ತು ಕೆಲಸದ ಔಟ್ಪುಟ್ ಅನ್ನು ನಿರ್ದಿಷ್ಟಪಡಿಸಿ
|
||||
* ಕೆಲಸವನ್ನು ಪ್ರಾರಂಭಿಸಿ
|
||||
|
||||
ಪೂರ್ಣ ಪ್ರಕ್ರಿಯೆಯನ್ನು ನೋಡಲು, [ದಾಖಲೆಗಳನ್ನು](https://docs.microsoft.com/azure/stream-analytics/stream-analytics-twitter-sentiment-analysis-trends?WT.mc_id=academic-77958-bethanycheum&ocid=AID30411099) ಪರಿಶೀಲಿಸಿ.
|
||||
### ವೈಜ್ಞಾನಿಕ ಪೇಪರ್ಗಳ ವಿಶ್ಲೇಷಣೆ
|
||||
ಇನ್ನೊಂದು ಉದಾಹರಣೆಯಾಗಿ, ಈ ಪಠ್ಯಕ್ರಮದ ಲೇಖಕರಲ್ಲಿ ಒಬ್ಬರಾದ [Dmitry Soshnikov](http://soshnikov.com) ರಚಿಸಿದ ಯೋಜನೆಯನ್ನು ನೋಡೋಣ.
|
||||
|
||||
Dmitry COVID ಪೇಪರ್ಗಳನ್ನು ವಿಶ್ಲೇಷಿಸುವ ಉಪಕರಣವನ್ನು ರಚಿಸಿದ್ದಾರೆ. ಈ ಯೋಜನೆಯನ್ನು ಪರಿಶೀಲಿಸುವ ಮೂಲಕ, ನೀವು ವೈಜ್ಞಾನಿಕ ಪೇಪರ್ಗಳಿಂದ ಜ್ಞಾನವನ್ನು ಹೊರತೆಗೆಯುವ, ಒಳನೋಟಗಳನ್ನು ಪಡೆಯುವ ಮತ್ತು ಸಂಶೋಧಕರಿಗೆ ದೊಡ್ಡ ಪೇಪರ್ ಸಂಗ್ರಹಗಳನ್ನು ಪರಿಣಾಮಕಾರಿಯಾಗಿ ನಾವಿಗೇಟ್ ಮಾಡಲು ಸಹಾಯ ಮಾಡುವ ಉಪಕರಣವನ್ನು ಹೇಗೆ ರಚಿಸಬಹುದು ಎಂದು ನೋಡಬಹುದು.
|
||||
|
||||
ಇದಕ್ಕೆ ಬಳಸಲಾದ ವಿವಿಧ ಹಂತಗಳು:
|
||||
* [Text Analytics for Health](https://docs.microsoft.com/azure/cognitive-services/text-analytics/how-tos/text-analytics-for-health?WT.mc_id=academic-77958-bethanycheum&ocid=AID3041109) ಬಳಸಿ ಮಾಹಿತಿ ಹೊರತೆಗೆಯುವುದು ಮತ್ತು ಪೂರ್ವ-ಪ್ರಕ್ರಿಯೆಗೊಳಿಸುವುದು
|
||||
* ಪ್ರಕ್ರಿಯೆಯನ್ನು ಸಮಾಂತರಗೊಳಿಸಲು [Azure ML](https://azure.microsoft.com/services/machine-learning?WT.mc_id=academic-77958-bethanycheum&ocid=AID3041109) ಬಳಸುವುದು
|
||||
* [Cosmos DB](https://azure.microsoft.com/services/cosmos-db?WT.mc_id=academic-77958-bethanycheum&ocid=AID3041109) ಬಳಸಿ ಮಾಹಿತಿ ಸಂಗ್ರಹಿಸುವುದು ಮತ್ತು ಕ್ವೇರಿ ಮಾಡುವುದು
|
||||
* Power BI ಬಳಸಿ ಡೇಟಾ ಅನ್ವೇಷಣೆ ಮತ್ತು ದೃಶ್ಯೀಕರಣಕ್ಕಾಗಿ ಸಂವಹನಾತ್ಮಕ ಡ್ಯಾಶ್ಬೋರ್ಡ್ ರಚಿಸುವುದು
|
||||
|
||||
ಪೂರ್ಣ ಪ್ರಕ್ರಿಯೆಯನ್ನು ನೋಡಲು [Dmitry ಅವರ ಬ್ಲಾಗ್](https://soshnikov.com/science/analyzing-medical-papers-with-azure-and-text-analytics-for-health/) ಗೆ ಭೇಟಿ ನೀಡಿ.
|
||||
|
||||
ನೀವು ನೋಡಿದಂತೆ, ನಾವು ಡೇಟಾ ಸೈನ್ಸ್ ನಡೆಸಲು ಹಲವಾರು ರೀತಿಯಲ್ಲಿ ಕ್ಲೌಡ್ ಸೇವೆಗಳನ್ನು ಬಳಸಬಹುದು.
|
||||
## ಪಾದಟಿಪ್ಪಣಿ
|
||||
|
||||
ಮೂಲಗಳು:
|
||||
* https://azure.microsoft.com/overview/what-is-cloud-computing?ocid=AID3041109
|
||||
* https://docs.microsoft.com/azure/stream-analytics/stream-analytics-twitter-sentiment-analysis-trends?ocid=AID3041109
|
||||
* https://soshnikov.com/science/analyzing-medical-papers-with-azure-and-text-analytics-for-health/
|
||||
|
||||
## ಪಾಠೋತ್ತರ ಪ್ರಶ್ನೋತ್ತರ
|
||||
|
||||
## [ಪಾಠೋತ್ತರ ಪ್ರಶ್ನೋತ್ತರ](https://ff-quizzes.netlify.app/en/ds/quiz/33)
|
||||
|
||||
## ಹುದ್ದೆ
|
||||
|
||||
[ಮಾರುಕಟ್ಟೆ ಸಂಶೋಧನೆ](assignment.md)
|
||||
|
||||
---
|
||||
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
|
||||
**ಅಸ್ವೀಕರಣ**:
|
||||
ಈ ದಸ್ತಾವೇಜು [Co-op Translator](https://github.com/Azure/co-op-translator) ಎಂಬ AI ಅನುವಾದ ಸೇವೆಯನ್ನು ಬಳಸಿ ಅನುವಾದಿಸಲಾಗಿದೆ. ನಾವು ನಿಖರತೆಯಿಗಾಗಿ ಪ್ರಯತ್ನಿಸುತ್ತಿದ್ದರೂ, ಸ್ವಯಂಚಾಲಿತ ಅನುವಾದಗಳಲ್ಲಿ ತಪ್ಪುಗಳು ಅಥವಾ ಅಸತ್ಯತೆಗಳು ಇರಬಹುದು ಎಂಬುದನ್ನು ದಯವಿಟ್ಟು ಗಮನಿಸಿ. ಮೂಲ ಭಾಷೆಯಲ್ಲಿರುವ ಮೂಲ ದಸ್ತಾವೇಜನ್ನು ಅಧಿಕೃತ ಮೂಲವೆಂದು ಪರಿಗಣಿಸಬೇಕು. ಪ್ರಮುಖ ಮಾಹಿತಿಗಾಗಿ, ವೃತ್ತಿಪರ ಮಾನವ ಅನುವಾದವನ್ನು ಶಿಫಾರಸು ಮಾಡಲಾಗುತ್ತದೆ. ಈ ಅನುವಾದ ಬಳಕೆಯಿಂದ ಉಂಟಾಗುವ ಯಾವುದೇ ತಪ್ಪು ಅರ್ಥಮಾಡಿಕೊಳ್ಳುವಿಕೆ ಅಥವಾ ತಪ್ಪು ವಿವರಣೆಗಳಿಗೆ ನಾವು ಹೊಣೆಗಾರರಾಗುವುದಿಲ್ಲ.
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER END -->
|
||||
@ -0,0 +1,27 @@
|
||||
<!--
|
||||
CO_OP_TRANSLATOR_METADATA:
|
||||
{
|
||||
"original_hash": "96f3696153d9ed54b19a1bb65438c104",
|
||||
"translation_date": "2025-12-19T15:18:09+00:00",
|
||||
"source_file": "5-Data-Science-In-Cloud/17-Introduction/assignment.md",
|
||||
"language_code": "kn"
|
||||
}
|
||||
-->
|
||||
# ಮಾರುಕಟ್ಟೆ ಸಂಶೋಧನೆ
|
||||
|
||||
## ಸೂಚನೆಗಳು
|
||||
|
||||
ಈ ಪಾಠದಲ್ಲಿ ನೀವು ಹಲವು ಪ್ರಮುಖ ಕ್ಲೌಡ್ ಪೂರೈಕೆದಾರರು ಇದ್ದಾರೆ ಎಂದು ಕಲಿತಿರಿ. ಪ್ರತಿ ಒಬ್ಬರೂ ಡೇಟಾ ಸೈನ್ಟಿಸ್ಟ್ಗೆ ಏನು ನೀಡಬಹುದು ಎಂದು ಕಂಡುಹಿಡಿಯಲು ಕೆಲವು ಮಾರುಕಟ್ಟೆ ಸಂಶೋಧನೆ ಮಾಡಿ. ಆ ಕೊಡುಗೆಗಳು ಹೋಲಿಕೆ ಮಾಡಬಹುದುವೇ? ಈ ಕ್ಲೌಡ್ ಪೂರೈಕೆದಾರರ ಮೂವರು ಅಥವಾ ಹೆಚ್ಚು ಅವರ ಕೊಡುಗೆಗಳನ್ನು ವರ್ಣಿಸುವ ಒಂದು ಪ್ರಬಂಧವನ್ನು ಬರೆಯಿರಿ.
|
||||
|
||||
## ಮೌಲ್ಯಮಾಪನ
|
||||
|
||||
ಉದಾಹರಣೆಯಾಗಿ | ತೃಪ್ತಿಕರ | ಸುಧಾರಣೆಯ ಅಗತ್ಯವಿದೆ
|
||||
--- | --- | ---
|
||||
ಒಂದು ಪುಟದ ಪ್ರಬಂಧವು ಮೂರು ಕ್ಲೌಡ್ ಪೂರೈಕೆದಾರರ ಡೇಟಾ ಸೈನ್ಸ್ ಕೊಡುಗೆಗಳನ್ನು ವರ್ಣಿಸಿ ಅವುಗಳ ನಡುವಿನ ವ್ಯತ್ಯಾಸವನ್ನು ವಿವರಿಸುತ್ತದೆ. | ಒಂದು ಚಿಕ್ಕ ಪ್ರಬಂಧವನ್ನು ಪ್ರಸ್ತುತಪಡಿಸಲಾಗಿದೆ | ವಿಶ್ಲೇಷಣೆಯನ್ನು ಪೂರ್ಣಗೊಳಿಸದೆ ಪ್ರಬಂಧವನ್ನು ಪ್ರಸ್ತುತಪಡಿಸಲಾಗಿದೆ
|
||||
|
||||
---
|
||||
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
|
||||
**ಅಸ್ವೀಕರಣ**:
|
||||
ಈ ದಸ್ತಾವೇಜು [Co-op Translator](https://github.com/Azure/co-op-translator) ಎಂಬ AI ಅನುವಾದ ಸೇವೆಯನ್ನು ಬಳಸಿ ಅನುವಾದಿಸಲಾಗಿದೆ. ನಾವು ಶುದ್ಧತೆಯತ್ತ ಪ್ರಯತ್ನಿಸುತ್ತಿದ್ದರೂ, ಸ್ವಯಂಚಾಲಿತ ಅನುವಾದಗಳಲ್ಲಿ ತಪ್ಪುಗಳು ಅಥವಾ ಅಸತ್ಯತೆಗಳು ಇರಬಹುದು ಎಂಬುದನ್ನು ದಯವಿಟ್ಟು ಗಮನಿಸಿ. ಮೂಲ ಭಾಷೆಯಲ್ಲಿರುವ ಮೂಲ ದಸ್ತಾವೇಜನ್ನು ಅಧಿಕೃತ ಮೂಲವೆಂದು ಪರಿಗಣಿಸಬೇಕು. ಪ್ರಮುಖ ಮಾಹಿತಿಗಾಗಿ, ವೃತ್ತಿಪರ ಮಾನವ ಅನುವಾದವನ್ನು ಶಿಫಾರಸು ಮಾಡಲಾಗುತ್ತದೆ. ಈ ಅನುವಾದ ಬಳಕೆಯಿಂದ ಉಂಟಾಗುವ ಯಾವುದೇ ತಪ್ಪು ಅರ್ಥಮಾಡಿಕೊಳ್ಳುವಿಕೆ ಅಥವಾ ತಪ್ಪು ವಿವರಣೆಗಳಿಗೆ ನಾವು ಹೊಣೆಗಾರರಾಗುವುದಿಲ್ಲ.
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER END -->
|
||||
@ -0,0 +1,355 @@
|
||||
<!--
|
||||
CO_OP_TRANSLATOR_METADATA:
|
||||
{
|
||||
"original_hash": "bd4da10766c64fce4294a98f6479dfb0",
|
||||
"translation_date": "2025-12-19T15:01:15+00:00",
|
||||
"source_file": "5-Data-Science-In-Cloud/18-Low-Code/README.md",
|
||||
"language_code": "kn"
|
||||
}
|
||||
-->
|
||||
# ಕ್ಲೌಡ್ನಲ್ಲಿ ಡೇಟಾ ಸೈನ್ಸ್: "ಲೋ ಕೋಡ್/ನೋ ಕೋಡ್" ವಿಧಾನ
|
||||
|
||||
| ಅವರ ಸ್ಕೆಚ್ ನೋಟ್ ](../../sketchnotes/18-DataScience-Cloud.png)|
|
||||
|:---:|
|
||||
| ಕ್ಲೌಡ್ನಲ್ಲಿ ಡೇಟಾ ಸೈನ್ಸ್: ಲೋ ಕೋಡ್ - _[@nitya](https://twitter.com/nitya) ಅವರ ಸ್ಕೆಚ್ ನೋಟ್_ |
|
||||
|
||||
ವಿಷಯಗಳ ಪಟ್ಟಿಃ
|
||||
|
||||
- [ಕ್ಲೌಡ್ನಲ್ಲಿ ಡೇಟಾ ಸೈನ್ಸ್: "ಲೋ ಕೋಡ್/ನೋ ಕೋಡ್" ವಿಧಾನ](../../../../5-Data-Science-In-Cloud/18-Low-Code)
|
||||
- [ಪೂರ್ವ-ಲೇಕ್ಚರ್ ಕ್ವಿಜ್](../../../../5-Data-Science-In-Cloud/18-Low-Code)
|
||||
- [1. ಪರಿಚಯ](../../../../5-Data-Science-In-Cloud/18-Low-Code)
|
||||
- [1.1 ಅಜೂರ್ ಮೆಷಿನ್ ಲರ್ನಿಂಗ್ ಎಂದರೆ ಏನು?](../../../../5-Data-Science-In-Cloud/18-Low-Code)
|
||||
- [1.2 ಹೃದಯ ವೈಫಲ್ಯ ಭವಿಷ್ಯವಾಣಿ ಯೋಜನೆ:](../../../../5-Data-Science-In-Cloud/18-Low-Code)
|
||||
- [1.3 ಹೃದಯ ವೈಫಲ್ಯ ಡೇಟಾಸೆಟ್:](../../../../5-Data-Science-In-Cloud/18-Low-Code)
|
||||
- [2. ಅಜೂರ್ ಎಂಎಲ್ ಸ್ಟುಡಿಯೋದಲ್ಲಿ ಲೋ ಕೋಡ್/ನೋ ಕೋಡ್ ಮಾದರಿ ತರಬೇತಿ](../../../../5-Data-Science-In-Cloud/18-Low-Code)
|
||||
- [2.1 ಅಜೂರ್ ಎಂಎಲ್ ವರ್ಕ್ಸ್ಪೇಸ್ ರಚನೆ](../../../../5-Data-Science-In-Cloud/18-Low-Code)
|
||||
- [2.2 ಗಣನೆ ಸಂಪನ್ಮೂಲಗಳು](../../../../5-Data-Science-In-Cloud/18-Low-Code)
|
||||
- [2.2.1 ನಿಮ್ಮ ಗಣನೆ ಸಂಪನ್ಮೂಲಗಳಿಗೆ ಸರಿಯಾದ ಆಯ್ಕೆಗಳು](../../../../5-Data-Science-In-Cloud/18-Low-Code)
|
||||
- [2.2.2 ಗಣನೆ ಕ್ಲಸ್ಟರ್ ರಚನೆ](../../../../5-Data-Science-In-Cloud/18-Low-Code)
|
||||
- [2.3 ಡೇಟಾಸೆಟ್ ಲೋಡ್ ಮಾಡುವುದು](../../../../5-Data-Science-In-Cloud/18-Low-Code)
|
||||
- [2.4 AutoML ಮೂಲಕ ಲೋ ಕೋಡ್/ನೋ ಕೋಡ್ ತರಬೇತಿ](../../../../5-Data-Science-In-Cloud/18-Low-Code)
|
||||
- [3. ಲೋ ಕೋಡ್/ನೋ ಕೋಡ್ ಮಾದರಿ ನಿಯೋಜನೆ ಮತ್ತು ಎಂಡ್ಪಾಯಿಂಟ್ ಬಳಕೆ](../../../../5-Data-Science-In-Cloud/18-Low-Code)
|
||||
- [3.1 ಮಾದರಿ ನಿಯೋಜನೆ](../../../../5-Data-Science-In-Cloud/18-Low-Code)
|
||||
- [3.2 ಎಂಡ್ಪಾಯಿಂಟ್ ಬಳಕೆ](../../../../5-Data-Science-In-Cloud/18-Low-Code)
|
||||
- [🚀 ಸವಾಲು](../../../../5-Data-Science-In-Cloud/18-Low-Code)
|
||||
- [ಪೋಸ್ಟ್-ಲೇಕ್ಚರ್ ಕ್ವಿಜ್](../../../../5-Data-Science-In-Cloud/18-Low-Code)
|
||||
- [ಪುನರ್ ವಿಮರ್ಶೆ ಮತ್ತು ಸ್ವಯಂ ಅಧ್ಯಯನ](../../../../5-Data-Science-In-Cloud/18-Low-Code)
|
||||
- [ಕಾರ್ಯನಿರ್ವಹಣೆ](../../../../5-Data-Science-In-Cloud/18-Low-Code)
|
||||
|
||||
## [ಪೂರ್ವ-ಲೇಕ್ಚರ್ ಕ್ವಿಜ್](https://ff-quizzes.netlify.app/en/ds/quiz/34)
|
||||
|
||||
## 1. ಪರಿಚಯ
|
||||
### 1.1 ಅಜೂರ್ ಮೆಷಿನ್ ಲರ್ನಿಂಗ್ ಎಂದರೆ ಏನು?
|
||||
|
||||
ಅಜೂರ್ ಕ್ಲೌಡ್ ವೇದಿಕೆ 200 ಕ್ಕೂ ಹೆಚ್ಚು ಉತ್ಪನ್ನಗಳು ಮತ್ತು ಕ್ಲೌಡ್ ಸೇವೆಗಳನ್ನು ಒಳಗೊಂಡಿದ್ದು, ಹೊಸ ಪರಿಹಾರಗಳನ್ನು ಜೀವಂತಗೊಳಿಸಲು ಸಹಾಯ ಮಾಡುತ್ತದೆ.
|
||||
ಡೇಟಾ ವಿಜ್ಞಾನಿಗಳು ಡೇಟಾವನ್ನು ಅನ್ವೇಷಿಸುವುದು ಮತ್ತು ಪೂರ್ವ-ಪ್ರಕ್ರಿಯೆ ಮಾಡುವುದರಲ್ಲಿ ಬಹಳ ಶ್ರಮವನ್ನು ಖರ್ಚುಮಾಡುತ್ತಾರೆ, ಮತ್ತು ನಿಖರ ಮಾದರಿಗಳನ್ನು ಉತ್ಪಾದಿಸಲು ವಿವಿಧ ಮಾದರಿ ತರಬೇತಿ ಆಲ್ಗಾರಿದಮ್ಗಳನ್ನು ಪ್ರಯತ್ನಿಸುತ್ತಾರೆ. ಈ ಕಾರ್ಯಗಳು ಸಮಯ ತೆಗೆದುಕೊಳ್ಳುತ್ತವೆ ಮತ್ತು ದುಬಾರಿ ಗಣನೆ ಹಾರ್ಡ್ವೇರ್ ಅನ್ನು ಅಸಮರ್ಥವಾಗಿ ಬಳಸುತ್ತವೆ.
|
||||
|
||||
[ಅಜೂರ್ ಎಂಎಲ್](https://docs.microsoft.com/azure/machine-learning/overview-what-is-azure-machine-learning?WT.mc_id=academic-77958-bethanycheum&ocid=AID3041109) ಅಜೂರ್ನಲ್ಲಿ ಮೆಷಿನ್ ಲರ್ನಿಂಗ್ ಪರಿಹಾರಗಳನ್ನು ನಿರ್ಮಿಸಲು ಮತ್ತು ಕಾರ್ಯಗತಗೊಳಿಸಲು ಕ್ಲೌಡ್ ಆಧಾರಿತ ವೇದಿಕೆ. ಇದು ಡೇಟಾ ವಿಜ್ಞಾನಿಗಳಿಗೆ ಡೇಟಾ ಸಿದ್ಧತೆ, ಮಾದರಿ ತರಬೇತಿ, ಭವಿಷ್ಯವಾಣಿ ಸೇವೆಗಳ ಪ್ರಕಟಣೆ ಮತ್ತು ಬಳಕೆಯ ಮೇಲ್ವಿಚಾರಣೆಗೆ ಸಹಾಯ ಮಾಡುವ ವೈಶಿಷ್ಟ್ಯಗಳು ಮತ್ತು ಸಾಮರ್ಥ್ಯಗಳನ್ನು ಒಳಗೊಂಡಿದೆ. ಮುಖ್ಯವಾಗಿ, ಇದು ಮಾದರಿ ತರಬೇತಿಗೆ ಸಂಬಂಧಿಸಿದ ಸಮಯ-ತೊಡಗಿಸುವ ಕಾರ್ಯಗಳನ್ನು ಸ್ವಯಂಚಾಲಿತಗೊಳಿಸುವ ಮೂಲಕ ಅವರ ಕಾರ್ಯಕ್ಷಮತೆಯನ್ನು ಹೆಚ್ಚಿಸುತ್ತದೆ; ಮತ್ತು ದೊಡ್ಡ ಪ್ರಮಾಣದ ಡೇಟಾವನ್ನು ಪರಿಣಾಮಕಾರಿಯಾಗಿ ನಿರ್ವಹಿಸಲು ಕ್ಲೌಡ್ ಆಧಾರಿತ ಗಣನೆ ಸಂಪನ್ಮೂಲಗಳನ್ನು ಬಳಸಲು ಸಹಾಯ ಮಾಡುತ್ತದೆ, ಮತ್ತು ಬಳಕೆಯ ಸಮಯದಲ್ಲಿ ಮಾತ್ರ ವೆಚ್ಚವನ್ನು ಹೊರುತ್ತದೆ.
|
||||
|
||||
ಅಜೂರ್ ಎಂಎಲ್ ಅಭಿವೃದ್ಧಿಪಡಕರಿಗೆ ಮತ್ತು ಡೇಟಾ ವಿಜ್ಞಾನಿಗಳಿಗೆ ಅವರ ಮೆಷಿನ್ ಲರ್ನಿಂಗ್ ಕಾರ್ಯಪ್ರವಾಹಗಳಿಗೆ ಅಗತ್ಯವಿರುವ ಎಲ್ಲಾ ಸಾಧನಗಳನ್ನು ಒದಗಿಸುತ್ತದೆ. ಅವುಗಳೆಂದರೆ:
|
||||
|
||||
- **ಅಜೂರ್ ಮೆಷಿನ್ ಲರ್ನಿಂಗ್ ಸ್ಟುಡಿಯೋ**: ಇದು ಅಜೂರ್ ಮೆಷಿನ್ ಲರ್ನಿಂಗ್ನಲ್ಲಿ ಲೋ-ಕೋಡ್ ಮತ್ತು ನೋ-ಕೋಡ್ ಆಯ್ಕೆಗಳೊಂದಿಗೆ ಮಾದರಿ ತರಬೇತಿ, ನಿಯೋಜನೆ, ಸ್ವಯಂಚಾಲನೆ, ಟ್ರ್ಯಾಕಿಂಗ್ ಮತ್ತು ಆಸ್ತಿ ನಿರ್ವಹಣೆಗೆ ವೆಬ್ ಪೋರ್ಟಲ್. ಸ್ಟುಡಿಯೋ ಅಜೂರ್ ಮೆಷಿನ್ ಲರ್ನಿಂಗ್ SDK ಜೊತೆಗೆ ಸಮ್ಮಿಲನ ಹೊಂದಿದೆ.
|
||||
- **ಜುಪೈಟರ್ ನೋಟ್ಬುಕ್ಗಳು**: ML ಮಾದರಿಗಳನ್ನು ತ್ವರಿತವಾಗಿ ಪ್ರೋಟೋಟೈಪ್ ಮತ್ತು ಪರೀಕ್ಷೆ ಮಾಡಬಹುದು.
|
||||
- **ಅಜೂರ್ ಮೆಷಿನ್ ಲರ್ನಿಂಗ್ ಡಿಸೈನರ್**: ಪ್ರಯೋಗಗಳನ್ನು ನಿರ್ಮಿಸಲು ಮತ್ತು ನಂತರ ಪೈಪ್ಲೈನ್ಗಳನ್ನು ನಿಯೋಜಿಸಲು ಡ್ರ್ಯಾಗ್-ಅಂಡ್-ಡ್ರಾಪ್ ಮಾಡಬಹುದಾದ ಲೋ-ಕೋಡ್ ಪರಿಸರ.
|
||||
- **ಸ್ವಯಂಚಾಲಿತ ಮೆಷಿನ್ ಲರ್ನಿಂಗ್ UI (AutoML)**: ಮೆಷಿನ್ ಲರ್ನಿಂಗ್ ಮಾದರಿ ಅಭಿವೃದ್ಧಿಯ ಪುನರಾವರ್ತಿತ ಕಾರ್ಯಗಳನ್ನು ಸ್ವಯಂಚಾಲಿತಗೊಳಿಸುತ್ತದೆ, ಹೆಚ್ಚಿನ ಪ್ರಮಾಣ, ಕಾರ್ಯಕ್ಷಮತೆ ಮತ್ತು ಉತ್ಪಾದಕತೆ ಹೊಂದಿರುವ ML ಮಾದರಿಗಳನ್ನು ನಿರ್ಮಿಸಲು ಸಹಾಯ ಮಾಡುತ್ತದೆ, ಮತ್ತು ಮಾದರಿ ಗುಣಮಟ್ಟವನ್ನು ಕಾಪಾಡುತ್ತದೆ.
|
||||
- **ಡೇಟಾ ಲೇಬಲಿಂಗ್**: ಡೇಟಾವನ್ನು ಸ್ವಯಂಚಾಲಿತವಾಗಿ ಲೇಬಲ್ ಮಾಡಲು ಸಹಾಯ ಮಾಡುವ ML ಸಾಧನ.
|
||||
- **ವಿಜುವಲ್ ಸ್ಟುಡಿಯೋ ಕೋಡ್ಗೆ ಮೆಷಿನ್ ಲರ್ನಿಂಗ್ ವಿಸ್ತರಣೆ**: ML ಯೋಜನೆಗಳನ್ನು ನಿರ್ಮಿಸಲು ಮತ್ತು ನಿರ್ವಹಿಸಲು ಸಂಪೂರ್ಣ ವೈಶಿಷ್ಟ್ಯಗಳ ಅಭಿವೃದ್ಧಿ ಪರಿಸರ.
|
||||
- **ಮೆಷಿನ್ ಲರ್ನಿಂಗ್ CLI**: ಕಮಾಂಡ್ ಲೈನ್ನಿಂದ ಅಜೂರ್ ಎಂಎಲ್ ಸಂಪನ್ಮೂಲಗಳನ್ನು ನಿರ್ವಹಿಸಲು ಕಮಾಂಡ್ಗಳು.
|
||||
- **ಪೈಟಾರ್ಚ್, ಟೆನ್ಸರ್ಫ್ಲೋ, ಸ್ಕಿಕಿಟ್-ಲರ್ನ್ ಮತ್ತು ಇನ್ನಿತರ ಮುಕ್ತ ಮೂಲ ಫ್ರೇಮ್ವರ್ಕ್ಗಳೊಂದಿಗೆ ಏಕೀಕರಣ**: ತರಬೇತಿ, ನಿಯೋಜನೆ ಮತ್ತು ಸಂಪೂರ್ಣ ಮೆಷಿನ್ ಲರ್ನಿಂಗ್ ಪ್ರಕ್ರಿಯೆಯನ್ನು ನಿರ್ವಹಿಸಲು.
|
||||
- **MLflow**: ನಿಮ್ಮ ಮೆಷಿನ್ ಲರ್ನಿಂಗ್ ಪ್ರಯೋಗಗಳ ಜೀವನಚಕ್ರವನ್ನು ನಿರ್ವಹಿಸಲು ಮುಕ್ತ ಮೂಲ ಗ್ರಂಥಾಲಯ. **MLFlow ಟ್ರ್ಯಾಕಿಂಗ್** ನಿಮ್ಮ ತರಬೇತಿ ರನ್ ಮೆಟ್ರಿಕ್ಸ್ ಮತ್ತು ಮಾದರಿ ವಸ್ತುಗಳನ್ನು ಲಾಗ್ ಮತ್ತು ಟ್ರ್ಯಾಕ್ ಮಾಡುವ MLflow ಘಟಕ, ನಿಮ್ಮ ಪ್ರಯೋಗದ ಪರಿಸರದಿಂದ ಸ್ವತಂತ್ರವಾಗಿ.
|
||||
|
||||
### 1.2 ಹೃದಯ ವೈಫಲ್ಯ ಭವಿಷ್ಯವಾಣಿ ಯೋಜನೆ:
|
||||
|
||||
ಯೋಜನೆಗಳನ್ನು ರಚಿಸುವುದು ಮತ್ತು ನಿರ್ಮಿಸುವುದು ನಿಮ್ಮ ಕೌಶಲ್ಯ ಮತ್ತು ಜ್ಞಾನವನ್ನು ಪರೀಕ್ಷಿಸಲು ಅತ್ಯುತ್ತಮ ಮಾರ್ಗವೆಂದು ಯಾವುದೇ ಸಂಶಯವಿಲ್ಲ. ಈ ಪಾಠದಲ್ಲಿ, ನಾವು ಅಜೂರ್ ಎಂಎಲ್ ಸ್ಟುಡಿಯೋದಲ್ಲಿ ಹೃದಯ ವೈಫಲ್ಯ ದಾಳಿಗಳ ಭವಿಷ್ಯವಾಣಿಗಾಗಿ ಡೇಟಾ ಸೈನ್ಸ್ ಯೋಜನೆಯನ್ನು ಎರಡು ವಿಭಿನ್ನ ವಿಧಾನಗಳಲ್ಲಿ ಅನ್ವೇಷಿಸುವೆವು: ಲೋ ಕೋಡ್/ನೋ ಕೋಡ್ ಮತ್ತು ಅಜೂರ್ ಎಂಎಲ್ SDK ಮೂಲಕ, ಕೆಳಗಿನ ಚಿತ್ರಣದಂತೆ:
|
||||
|
||||

|
||||
|
||||
ಪ್ರತಿ ವಿಧಾನಕ್ಕೂ ತನ್ನದೇ ಆದ ಲಾಭ ಮತ್ತು ನಷ್ಟಗಳಿವೆ. ಲೋ ಕೋಡ್/ನೋ ಕೋಡ್ ವಿಧಾನವು GUI (ಗ್ರಾಫಿಕಲ್ ಯೂಸರ್ ಇಂಟರ್ಫೇಸ್) ಜೊತೆಗೆ ಸಂವಹನ ಮಾಡುವುದರಿಂದ ಪ್ರಾರಂಭಿಸಲು ಸುಲಭವಾಗಿದೆ, ಕೋಡ್ ಬಗ್ಗೆ ಪೂರ್ವಜ್ಞಾನ ಅಗತ್ಯವಿಲ್ಲ. ಈ ವಿಧಾನವು ಯೋಜನೆಯ ಸಾಧ್ಯತೆಯನ್ನು ತ್ವರಿತವಾಗಿ ಪರೀಕ್ಷಿಸಲು ಮತ್ತು POC (ಪ್ರೂಫ್ ಆಫ್ ಕಾಂಸೆಪ್ಟ್) ರಚಿಸಲು ಸಹಾಯ ಮಾಡುತ್ತದೆ. ಆದರೆ, ಯೋಜನೆ ವಿಸ್ತಾರವಾಗುತ್ತಾ ಮತ್ತು ಉತ್ಪಾದನೆಗೆ ಸಿದ್ಧವಾಗಬೇಕಾದಾಗ, GUI ಮೂಲಕ ಸಂಪನ್ಮೂಲಗಳನ್ನು ರಚಿಸುವುದು ಸಾಧ್ಯವಿಲ್ಲ. ಸಂಪನ್ಮೂಲಗಳ ರಚನೆ, ಮಾದರಿ ನಿಯೋಜನೆ ಸೇರಿದಂತೆ ಎಲ್ಲವನ್ನೂ ಪ್ರೋಗ್ರಾಮ್ಯಾಟಿಕಾಗಿ ಸ್ವಯಂಚಾಲಿತಗೊಳಿಸಬೇಕಾಗುತ್ತದೆ. ಈ ಸಂದರ್ಭದಲ್ಲಿ ಅಜೂರ್ ಎಂಎಲ್ SDK ಬಳಕೆ ತಿಳಿದುಕೊಳ್ಳುವುದು ಅತ್ಯಂತ ಮುಖ್ಯ.
|
||||
|
||||
| | ಲೋ ಕೋಡ್/ನೋ ಕೋಡ್ | ಅಜೂರ್ ಎಂಎಲ್ SDK |
|
||||
|-------------------|------------------|---------------------------|
|
||||
| ಕೋಡ್ ಪರಿಣತಿ | ಅಗತ್ಯವಿಲ್ಲ | ಅಗತ್ಯವಿದೆ |
|
||||
| ಅಭಿವೃದ್ಧಿ ಸಮಯ | ವೇಗವಾಗಿ ಮತ್ತು ಸುಲಭವಾಗಿ | ಕೋಡ್ ಪರಿಣತಿಗೆ ಅವಲಂಬಿತವಾಗಿದೆ |
|
||||
| ಉತ್ಪಾದನೆಗೆ ಸಿದ್ಧ | ಇಲ್ಲ | ಹೌದು |
|
||||
|
||||
### 1.3 ಹೃದಯ ವೈಫಲ್ಯ ಡೇಟಾಸೆಟ್:
|
||||
|
||||
ಹೃದಯರೋಗಗಳು (CVDs) ಜಾಗತಿಕವಾಗಿ ಮರಣದ ಪ್ರಮುಖ ಕಾರಣವಾಗಿದ್ದು, ಎಲ್ಲಾ ಮರಣಗಳ 31% ಅನ್ನು占ಿಸುತ್ತವೆ. ತಂಬಾಕು ಬಳಕೆ, ಅಸ್ವಸ್ಥ ಆಹಾರ ಮತ್ತು ಸ್ಥೂಲತೆ, ದೈಹಿಕ ಚಟುವಟಿಕೆ ಕೊರತೆ ಮತ್ತು ಮದ್ಯಪಾನದ ಹಾನಿಕಾರಕ ಬಳಕೆ ಮುಂತಾದ ಪರಿಸರ ಮತ್ತು ವರ್ತನೆ ಸಂಬಂಧಿತ ಅಪಾಯಕಾರಕ ಅಂಶಗಳನ್ನು ಅಂದಾಜು ಮಾದರಿಗಳ ವೈಶಿಷ್ಟ್ಯಗಳಾಗಿ ಬಳಸಬಹುದು. CVD ಅಭಿವೃದ್ಧಿಯ ಸಾಧ್ಯತೆಯನ್ನು ಅಂದಾಜಿಸಲು ಸಾಧ್ಯವಾಗುವುದರಿಂದ, ಅಪಾಯದೊಳಗಿನ ಜನರಲ್ಲಿ ದಾಳಿಗಳನ್ನು ತಡೆಯಲು ಬಹುಮೌಲ್ಯವಾಗಬಹುದು.
|
||||
|
||||
ಕಾಗಲ್ [ಹೃದಯ ವೈಫಲ್ಯ ಡೇಟಾಸೆಟ್](https://www.kaggle.com/andrewmvd/heart-failure-clinical-data) ಅನ್ನು ಸಾರ್ವಜನಿಕವಾಗಿ ಲಭ್ಯವಿದೆ, ಇದನ್ನು ನಾವು ಈ ಯೋಜನೆಗೆ ಬಳಸಲಿದ್ದೇವೆ. ನೀವು ಈಗಲೇ ಡೇಟಾಸೆಟ್ ಡೌನ್ಲೋಡ್ ಮಾಡಬಹುದು. ಇದು 13 ಕಾಲಮ್ಗಳ (12 ವೈಶಿಷ್ಟ್ಯಗಳು ಮತ್ತು 1 ಗುರಿ ಚರ) ಮತ್ತು 299 ಸಾಲುಗಳ ಟೇಬ್ಯುಲರ್ ಡೇಟಾಸೆಟ್.
|
||||
|
||||
| | ಚರದ ಹೆಸರು | ಪ್ರಕಾರ | ವಿವರಣೆ | ಉದಾಹರಣೆ |
|
||||
|----|-------------------------|-----------------|-------------------------------------------------------|-------------------|
|
||||
| 1 | ವಯಸ್ಸು | ಸಂಖ್ಯಾತ್ಮಕ | ರೋಗಿಯ ವಯಸ್ಸು | 25 |
|
||||
| 2 | ಅನೀಮಿಯಾ | ಬೂಲಿಯನ್ | ರಕ್ತಕಣಗಳು ಅಥವಾ ಹೀಮೋಗ್ಲೋಬಿನ್ ಕಡಿಮೆಯಾಗುವುದು | 0 ಅಥವಾ 1 |
|
||||
| 3 | ಕ್ರಿಯಾಟಿನಿನ್ ಫಾಸ್ಫೋಕಿನೇಸ್ | ಸಂಖ್ಯಾತ್ಮಕ | ರಕ್ತದಲ್ಲಿ CPK ಎನ್ಜೈಮ್ ಮಟ್ಟ | 542 |
|
||||
| 4 | ಮಧುಮೇಹ | ಬೂಲಿಯನ್ | ರೋಗಿಗೆ ಮಧುಮೇಹವಿದೆಯೇ | 0 ಅಥವಾ 1 |
|
||||
| 5 | ಇಜೆಕ್ಷನ್ ಫ್ರಾಕ್ಷನ್ | ಸಂಖ್ಯಾತ್ಮಕ | ಪ್ರತಿ ಸಂಕುಚನೆಯಲ್ಲಿ ಹೃದಯದಿಂದ ರಕ್ತದ ಶೇಕಡಾವಾರು | 45 |
|
||||
| 6 | ಉನ್ನತ ರಕ್ತದೊತ್ತಡ | ಬೂಲಿಯನ್ | ರೋಗಿಗೆ ಹೈಪರ್ಟೆನ್ಷನ್ ಇದೆಯೇ | 0 ಅಥವಾ 1 |
|
||||
| 7 | ಪ್ಲೇಟ್ಲೆಟ್ಸ್ | ಸಂಖ್ಯಾತ್ಮಕ | ರಕ್ತದಲ್ಲಿನ ಪ್ಲೇಟ್ಲೆಟ್ಸ್ | 149000 |
|
||||
| 8 | ಸೀರಮ್ ಕ್ರಿಯಾಟಿನಿನ್ | ಸಂಖ್ಯಾತ್ಮಕ | ರಕ್ತದಲ್ಲಿನ ಸೀರಮ್ ಕ್ರಿಯಾಟಿನಿನ್ ಮಟ್ಟ | 0.5 |
|
||||
| 9 | ಸೀರಮ್ ಸೋಡಿಯಂ | ಸಂಖ್ಯಾತ್ಮಕ | ರಕ್ತದಲ್ಲಿನ ಸೀರಮ್ ಸೋಡಿಯಂ ಮಟ್ಟ | ಜೂನ್ |
|
||||
| 10 | ಲಿಂಗ | ಬೂಲಿಯನ್ | ಮಹಿಳೆ ಅಥವಾ ಪುರುಷ | 0 ಅಥವಾ 1 |
|
||||
| 11 | ಧೂಮಪಾನ | ಬೂಲಿಯನ್ | ರೋಗಿ ಧೂಮಪಾನ ಮಾಡುತ್ತಾನೆಯೇ | 0 ಅಥವಾ 1 |
|
||||
| 12 | ಸಮಯ | ಸಂಖ್ಯಾತ್ಮಕ | ಅನುಸರಣೆ ಅವಧಿ (ದಿನಗಳು) | 4 |
|
||||
|----|-------------------------|-----------------|-------------------------------------------------------|-------------------|
|
||||
| 21 | DEATH_EVENT [ಗುರಿ] | ಬೂಲಿಯನ್ | ಅನುಸರಣೆ ಅವಧಿಯಲ್ಲಿ ರೋಗಿ ಸಾವು ಸಂಭವಿಸಿದೆಯೇ | 0 ಅಥವಾ 1 |
|
||||
|
||||
ನೀವು ಡೇಟಾಸೆಟ್ ಪಡೆದ ನಂತರ, ನಾವು ಅಜೂರ್ನಲ್ಲಿ ಯೋಜನೆಯನ್ನು ಪ್ರಾರಂಭಿಸಬಹುದು.
|
||||
|
||||
## 2. ಅಜೂರ್ ಎಂಎಲ್ ಸ್ಟುಡಿಯೋದಲ್ಲಿ ಲೋ ಕೋಡ್/ನೋ ಕೋಡ್ ಮಾದರಿ ತರಬೇತಿ
|
||||
### 2.1 ಅಜೂರ್ ಎಂಎಲ್ ವರ್ಕ್ಸ್ಪೇಸ್ ರಚನೆ
|
||||
ಅಜೂರ್ ಎಂಎಲ್ನಲ್ಲಿ ಮಾದರಿಯನ್ನು ತರಬೇತಿಗೆ ಮೊದಲು ಅಜೂರ್ ಎಂಎಲ್ ವರ್ಕ್ಸ್ಪೇಸ್ ರಚಿಸಬೇಕು. ವರ್ಕ್ಸ್ಪೇಸ್ ಅಜೂರ್ ಮೆಷಿನ್ ಲರ್ನಿಂಗ್ನ ಟಾಪ್-ಲೆವೆಲ್ ಸಂಪನ್ಮೂಲವಾಗಿದೆ, ನೀವು ಅಜೂರ್ ಮೆಷಿನ್ ಲರ್ನಿಂಗ್ ಬಳಸುವಾಗ ರಚಿಸುವ ಎಲ್ಲಾ ವಸ್ತುಗಳನ್ನು ಕೇಂದ್ರಿತವಾಗಿ ನಿರ್ವಹಿಸಲು ಸ್ಥಳ ಒದಗಿಸುತ್ತದೆ. ವರ್ಕ್ಸ್ಪೇಸ್ ಎಲ್ಲಾ ತರಬೇತಿ ರನ್ಗಳ ಇತಿಹಾಸವನ್ನು, ಲಾಗ್ಗಳು, ಮೆಟ್ರಿಕ್ಸ್, ಔಟ್ಪುಟ್ ಮತ್ತು ನಿಮ್ಮ ಸ್ಕ್ರಿಪ್ಟ್ಗಳ ಸ্ন್ಯಾಪ್ಶಾಟ್ ಅನ್ನು ಸಂಗ್ರಹಿಸುತ್ತದೆ. ನೀವು ಈ ಮಾಹಿತಿಯನ್ನು ಬಳಸಿಕೊಂಡು ಯಾವ ತರಬೇತಿ ರನ್ ಉತ್ತಮ ಮಾದರಿಯನ್ನು ಉತ್ಪಾದಿಸುತ್ತದೆ ಎಂದು ನಿರ್ಧರಿಸಬಹುದು. [ಹೆಚ್ಚು ತಿಳಿಯಿರಿ](https://docs.microsoft.com/azure/machine-learning/concept-workspace?WT.mc_id=academic-77958-bethanycheum&ocid=AID3041109)
|
||||
|
||||
ನಿಮ್ಮ ಆಪರೇಟಿಂಗ್ ಸಿಸ್ಟಮ್ಗೆ ಹೊಂದಿಕೊಳ್ಳುವ ಅತ್ಯಂತ ನವೀಕೃತ ಬ್ರೌಸರ್ ಬಳಸಲು ಶಿಫಾರಸು ಮಾಡಲಾಗಿದೆ. ಕೆಳಗಿನ ಬ್ರೌಸರ್ಗಳು ಬೆಂಬಲಿತವಾಗಿವೆ:
|
||||
|
||||
- ಮೈಕ್ರೋಸಾಫ್ಟ್ ಎಡ್ಜ್ (ಹೊಸ ಮೈಕ್ರೋಸಾಫ್ಟ್ ಎಡ್ಜ್, ಇತ್ತೀಚಿನ ಆವೃತ್ತಿ. ಮೈಕ್ರೋಸಾಫ್ಟ್ ಎಡ್ಜ್ ಲೆಗಸಿ ಅಲ್ಲ)
|
||||
- ಸಫಾರಿ (ಇತ್ತೀಚಿನ ಆವೃತ್ತಿ, ಮ್ಯಾಕ್ ಮಾತ್ರ)
|
||||
- ಕ್ರೋಮ್ (ಇತ್ತೀಚಿನ ಆವೃತ್ತಿ)
|
||||
- ಫೈರ್ಫಾಕ್ಸ್ (ಇತ್ತೀಚಿನ ಆವೃತ್ತಿ)
|
||||
|
||||
ಅಜೂರ್ ಮೆಷಿನ್ ಲರ್ನಿಂಗ್ ಬಳಸಲು, ನಿಮ್ಮ ಅಜೂರ್ ಸಬ್ಸ್ಕ್ರಿಪ್ಷನ್ನಲ್ಲಿ ವರ್ಕ್ಸ್ಪೇಸ್ ರಚಿಸಿ. ನಂತರ ನೀವು ಈ ವರ್ಕ್ಸ್ಪೇಸ್ ಅನ್ನು ಡೇಟಾ, ಗಣನೆ ಸಂಪನ್ಮೂಲಗಳು, ಕೋಡ್, ಮಾದರಿಗಳು ಮತ್ತು ನಿಮ್ಮ ಮೆಷಿನ್ ಲರ್ನಿಂಗ್ ಕಾರ್ಯಭಾರಗಳಿಗೆ ಸಂಬಂಧಿಸಿದ ಇತರ ವಸ್ತುಗಳನ್ನು ನಿರ್ವಹಿಸಲು ಬಳಸಬಹುದು.
|
||||
|
||||
> **_ಗಮನಿಸಿ:_** ಅಜೂರ್ ಮೆಷಿನ್ ಲರ್ನಿಂಗ್ ವರ್ಕ್ಸ್ಪೇಸ್ ನಿಮ್ಮ ಸಬ್ಸ್ಕ್ರಿಪ್ಷನ್ನಲ್ಲಿ ಇರುವವರೆಗೆ ಡೇಟಾ ಸಂಗ್ರಹಣೆಗೆ ಸಣ್ಣ ಶುಲ್ಕ ವಿಧಿಸಲಾಗುತ್ತದೆ, ಆದ್ದರಿಂದ ನೀವು ಬಳಸದಾಗ ಅಜೂರ್ ಮೆಷಿನ್ ಲರ್ನಿಂಗ್ ವರ್ಕ್ಸ್ಪೇಸ್ ಅನ್ನು ಅಳಿಸುವುದನ್ನು ಶಿಫಾರಸು ಮಾಡುತ್ತೇವೆ.
|
||||
|
||||
1. ನಿಮ್ಮ ಅಜೂರ್ ಸಬ್ಸ್ಕ್ರಿಪ್ಷನ್ಗೆ ಸಂಬಂಧಿಸಿದ ಮೈಕ್ರೋಸಾಫ್ಟ್ ಕ್ರೆಡೆನ್ಷಿಯಲ್ಸ್ ಬಳಸಿ [ಅಜೂರ್ ಪೋರ್ಟಲ್](https://ms.portal.azure.com/) ಗೆ ಸೈನ್ ಇನ್ ಆಗಿ.
|
||||
2. **+ಸಂಪನ್ಮೂಲ ರಚಿಸಿ** ಆಯ್ಕೆಮಾಡಿ
|
||||
|
||||

|
||||
|
||||
ಮೆಷಿನ್ ಲರ್ನಿಂಗ್ ಅನ್ನು ಹುಡುಕಿ ಮತ್ತು ಮೆಷಿನ್ ಲರ್ನಿಂಗ್ ಟೈಲ್ ಆಯ್ಕೆಮಾಡಿ
|
||||
|
||||

|
||||
|
||||
ರಚನೆ ಬಟನ್ ಕ್ಲಿಕ್ ಮಾಡಿ
|
||||
|
||||

|
||||
|
||||
ಕೆಳಗಿನಂತೆ ಸೆಟ್ಟಿಂಗ್ಗಳನ್ನು ಭರ್ತಿ ಮಾಡಿ:
|
||||
- ಸಬ್ಸ್ಕ್ರಿಪ್ಷನ್: ನಿಮ್ಮ ಅಜೂರ್ ಸಬ್ಸ್ಕ್ರಿಪ್ಷನ್
|
||||
- ಸಂಪನ್ಮೂಲ ಗುಂಪು: ಸಂಪನ್ಮೂಲ ಗುಂಪನ್ನು ರಚಿಸಿ ಅಥವಾ ಆಯ್ಕೆಮಾಡಿ
|
||||
- ವರ್ಕ್ಸ್ಪೇಸ್ ಹೆಸರು: ನಿಮ್ಮ ವರ್ಕ್ಸ್ಪೇಸ್ಗೆ ವಿಶಿಷ್ಟ ಹೆಸರು ನಮೂದಿಸಿ
|
||||
- ಪ್ರದೇಶ: ನಿಮ್ಮ ಹತ್ತಿರದ ಭೌಗೋಳಿಕ ಪ್ರದೇಶ ಆಯ್ಕೆಮಾಡಿ
|
||||
- ಸಂಗ್ರಹಣಾ ಖಾತೆ: ನಿಮ್ಮ ವರ್ಕ್ಸ್ಪೇಸ್ಗೆ ಹೊಸ ಡೀಫಾಲ್ಟ್ ಸಂಗ್ರಹಣಾ ಖಾತೆ ಸೃಷ್ಟಿಸಲಾಗುತ್ತದೆ
|
||||
- ಕೀ ವಾಲ್ಟ್: ನಿಮ್ಮ ವರ್ಕ್ಸ್ಪೇಸ್ಗೆ ಹೊಸ ಡೀಫಾಲ್ಟ್ ಕೀ ವಾಲ್ಟ್ ಸೃಷ್ಟಿಸಲಾಗುತ್ತದೆ
|
||||
- ಅಪ್ಲಿಕೇಶನ್ ಇನ್ಸೈಟ್ಸ್: ನಿಮ್ಮ ವರ್ಕ್ಸ್ಪೇಸ್ಗೆ ಹೊಸ ಡೀಫಾಲ್ಟ್ ಅಪ್ಲಿಕೇಶನ್ ಇನ್ಸೈಟ್ಸ್ ಸಂಪನ್ಮೂಲ ಸೃಷ್ಟಿಸಲಾಗುತ್ತದೆ
|
||||
- ಕಂಟೈನರ್ ರಿಜಿಸ್ಟ್ರಿ: ಇಲ್ಲ (ನೀವು ಮೊದಲ ಬಾರಿಗೆ ಮಾದರಿಯನ್ನು ಕಂಟೈನರ್ಗೆ ನಿಯೋಜಿಸುವಾಗ ಸ್ವಯಂಚಾಲಿತವಾಗಿ ಸೃಷ್ಟಿಸಲಾಗುತ್ತದೆ)
|
||||
|
||||

|
||||
|
||||
- ರಚಿಸಿ + ಪರಿಶೀಲಿಸಿ ಕ್ಲಿಕ್ ಮಾಡಿ ಮತ್ತು ನಂತರ ರಚನೆ ಬಟನ್ ಕ್ಲಿಕ್ ಮಾಡಿ
|
||||
3. ನಿಮ್ಮ ವರ್ಕ್ಸ್ಪೇಸ್ ರಚನೆಗೆ ಕೆಲವು ನಿಮಿಷಗಳು ಬೇಕಾಗಬಹುದು. ನಂತರ ಪೋರ್ಟಲ್ನಲ್ಲಿ ಅದಕ್ಕೆ ಹೋಗಿ. ನೀವು ಅದನ್ನು ಮೆಷಿನ್ ಲರ್ನಿಂಗ್ ಅಜೂರ್ ಸೇವೆಯ ಮೂಲಕ ಹುಡುಕಬಹುದು.
|
||||
4. ನಿಮ್ಮ ವರ್ಕ್ಸ್ಪೇಸ್ನ ಅವಲೋಕನ ಪುಟದಲ್ಲಿ, ಅಜೂರ್ ಮೆಷಿನ್ ಲರ್ನಿಂಗ್ ಸ್ಟುಡಿಯೋವನ್ನು ಪ್ರಾರಂಭಿಸಿ (ಅಥವಾ ಹೊಸ ಬ್ರೌಸರ್ ಟ್ಯಾಬ್ ತೆರೆಯಿರಿ ಮತ್ತು https://ml.azure.com ಗೆ ಹೋಗಿ), ಮತ್ತು ನಿಮ್ಮ ಮೈಕ್ರೋಸಾಫ್ಟ್ ಖಾತೆ ಬಳಸಿ ಅಜೂರ್ ಮೆಷಿನ್ ಲರ್ನಿಂಗ್ ಸ್ಟುಡಿಯೋದಲ್ಲಿ ಸೈನ್ ಇನ್ ಆಗಿ. ಕೇಳಿದರೆ, ನಿಮ್ಮ ಅಜೂರ್ ಡೈರೆಕ್ಟರಿ ಮತ್ತು ಸಬ್ಸ್ಕ್ರಿಪ್ಷನ್ ಮತ್ತು ಅಜೂರ್ ಮೆಷಿನ್ ಲರ್ನಿಂಗ್ ವರ್ಕ್ಸ್ಪೇಸ್ ಆಯ್ಕೆಮಾಡಿ.
|
||||
|
||||

|
||||
|
||||
5. ಅಜೂರ್ ಮೆಷಿನ್ ಲರ್ನಿಂಗ್ ಸ್ಟುಡಿಯೋದಲ್ಲಿ, ಎಡಮೇಲೆ ಇರುವ ☰ ಐಕಾನ್ ಅನ್ನು ಟಾಗಲ್ ಮಾಡಿ ಇಂಟರ್ಫೇಸ್ನ ವಿವಿಧ ಪುಟಗಳನ್ನು ವೀಕ್ಷಿಸಿ. ನೀವು ಈ ಪುಟಗಳನ್ನು ನಿಮ್ಮ ವರ್ಕ್ಸ್ಪೇಸ್ನ ಸಂಪನ್ಮೂಲಗಳನ್ನು ನಿರ್ವಹಿಸಲು ಬಳಸಬಹುದು.
|
||||
|
||||

|
||||
|
||||
ನೀವು ಅಜೂರ್ ಪೋರ್ಟಲ್ ಬಳಸಿ ನಿಮ್ಮ ವರ್ಕ್ಸ್ಪೇಸ್ ಅನ್ನು ನಿರ್ವಹಿಸಬಹುದು, ಆದರೆ ಡೇಟಾ ವಿಜ್ಞಾನಿಗಳು ಮತ್ತು ಮೆಷಿನ್ ಲರ್ನಿಂಗ್ ಕಾರ್ಯಾಚರಣೆ ಇಂಜಿನಿಯರ್ಗಳಿಗೆ, ಅಜೂರ್ ಮೆಷಿನ್ ಲರ್ನಿಂಗ್ ಸ್ಟುಡಿಯೋ ವರ್ಕ್ಸ್ಪೇಸ್ ಸಂಪನ್ಮೂಲಗಳನ್ನು ನಿರ್ವಹಿಸಲು ಹೆಚ್ಚು ಕೇಂದ್ರೀಕೃತ ಬಳಕೆದಾರ ಇಂಟರ್ಫೇಸ್ ಒದಗಿಸುತ್ತದೆ.
|
||||
|
||||
### 2.2 ಗಣನೆ ಸಂಪನ್ಮೂಲಗಳು
|
||||
|
||||
ಗಣನೆ ಸಂಪನ್ಮೂಲಗಳು ಕ್ಲೌಡ್ ಆಧಾರಿತ ಸಂಪನ್ಮೂಲಗಳು, ಅವುಗಳಲ್ಲಿ ನೀವು ಮಾದರಿ ತರಬೇತಿ ಮತ್ತು ಡೇಟಾ ಅನ್ವೇಷಣೆ ಪ್ರಕ್ರಿಯೆಗಳನ್ನು ನಡೆಸಬಹುದು. ನೀವು ರಚಿಸಬಹುದಾದ ನಾಲ್ಕು ವಿಧದ ಗಣನೆ ಸಂಪನ್ಮೂಲಗಳಿವೆ:
|
||||
|
||||
- **ಗಣನೆ ಇನ್ಸ್ಟಾನ್ಸ್ಗಳು**: ಡೇಟಾ ವಿಜ್ಞಾನಿಗಳು ಡೇಟಾ ಮತ್ತು ಮಾದರಿಗಳೊಂದಿಗೆ ಕೆಲಸ ಮಾಡಲು ಬಳಸಬಹುದಾದ ಅಭಿವೃದ್ಧಿ ವರ್ಕ್ಸ್ಟೇಷನ್ಗಳು. ಇದರಲ್ಲಿ ವರ್ಚುವಲ್ ಮಷೀನ್ (VM) ರಚನೆ ಮತ್ತು ನೋಟ್ಬುಕ್ ಇನ್ಸ್ಟಾನ್ಸ್ ಪ್ರಾರಂಭಿಸುವುದು ಸೇರಿದೆ. ನಂತರ ನೀವು ನೋಟ್ಬುಕ್ನಿಂದ ಗಣನೆ ಕ್ಲಸ್ಟರ್ ಅನ್ನು ಕರೆದು ಮಾದರಿಯನ್ನು ತರಬೇತಿಗೆ ತೆಗೆದುಕೊಳ್ಳಬಹುದು.
|
||||
- **ಗಣನೆ ಕ್ಲಸ್ಟರ್ಗಳು**: ಪ್ರಯೋಗ ಕೋಡ್ನ ಆನ್-ಡಿಮ್ಯಾಂಡ್ ಪ್ರಕ್ರಿಯೆಗೆ VM ಗಳ ಸ್ಕೇಲಬಲ್ ಕ್ಲಸ್ಟರ್ಗಳು. ನೀವು ಮಾದರಿ ತರಬೇತಿಗೆ ಇದನ್ನು ಬಳಸುತ್ತೀರಿ. ಗಣನೆ ಕ್ಲಸ್ಟರ್ಗಳು ವಿಶೇಷ GPU ಅಥವಾ CPU ಸಂಪನ್ಮೂಲಗಳನ್ನು ಸಹ ಬಳಸಬಹುದು.
|
||||
- **ಅನುವಾದ ಕ್ಲಸ್ಟರ್ಗಳು**: ನಿಮ್ಮ ತರಬೇತುದಾರ ಮಾದರಿಗಳನ್ನು ಬಳಸುವ ಭವಿಷ್ಯವಾಣಿ ಸೇವೆಗಳ ನಿಯೋಜನೆ ಗುರಿಗಳು.
|
||||
- **ಸಂಯೋಜಿತ ಗಣನೆ**: ವಾಸ್ತವಿಕ ಯಂತ್ರಗಳು ಅಥವಾ ಅಜೂರ್ ಡೇಟಾಬ್ರಿಕ್ಸ್ ಕ್ಲಸ್ಟರ್ಗಳಂತಹ ಅಸ್ತಿತ್ವದಲ್ಲಿರುವ ಅಜೂರ್ ಗಣನೆ ಸಂಪನ್ಮೂಲಗಳಿಗೆ ಲಿಂಕ್ಗಳು.
|
||||
|
||||
|
||||
#### 2.2.1 ನಿಮ್ಮ ಗಣನೆ ಸಂಪನ್ಮೂಲಗಳಿಗೆ ಸರಿಯಾದ ಆಯ್ಕೆಗಳನ್ನು ಮಾಡುವುದು
|
||||
|
||||
ಗಣನೆ ಸಂಪನ್ಮೂಲವನ್ನು ರಚಿಸುವಾಗ ಪರಿಗಣಿಸಬೇಕಾದ ಕೆಲವು ಪ್ರಮುಖ ಅಂಶಗಳಿವೆ ಮತ್ತು ಆ ಆಯ್ಕೆಗಳು ಮಹತ್ವದ ನಿರ್ಧಾರಗಳಾಗಬಹುದು.
|
||||
|
||||
**ನೀವು CPU ಅಥವಾ GPU ಬೇಕೇ?**
|
||||
|
||||
CPU (ಸೆಂಟ್ರಲ್ ಪ್ರೊಸೆಸಿಂಗ್ ಯೂನಿಟ್) ಎಂದರೆ ಕಂಪ್ಯೂಟರ್ ಪ್ರೋಗ್ರಾಂ ಒಳಗೊಂಡ ಸೂಚನೆಗಳನ್ನು ನಿರ್ವಹಿಸುವ ಎಲೆಕ್ಟ್ರಾನಿಕ್ ಸರ್ಕ್ಯೂಟ್. GPU (ಗ್ರಾಫಿಕ್ಸ್ ಪ್ರೊಸೆಸಿಂಗ್ ಯೂನಿಟ್) ಎಂದರೆ ಅತ್ಯಂತ ವೇಗವಾಗಿ ಗ್ರಾಫಿಕ್ಸ್ ಸಂಬಂಧಿತ ಕೋಡ್ ಅನ್ನು ನಿರ್ವಹಿಸಲು ವಿಶೇಷವಾಗಿ ವಿನ್ಯಾಸಗೊಳಿಸಿದ ಎಲೆಕ್ಟ್ರಾನಿಕ್ ಸರ್ಕ್ಯೂಟ್.
|
||||
|
||||
CPU ಮತ್ತು GPU ವಾಸ್ತುಶಿಲ್ಪದ ಮುಖ್ಯ ವ್ಯತ್ಯಾಸವೆಂದರೆ CPU ವೇಗವಾಗಿ ವಿವಿಧ ಕಾರ್ಯಗಳನ್ನು ನಿರ್ವಹಿಸಲು ವಿನ್ಯಾಸಗೊಳಿಸಲಾಗಿದೆ (CPU ಕ್ಲಾಕ್ ವೇಗದಿಂದ ಅಳೆಯಲ್ಪಡುವುದು), ಆದರೆ ಕಾರ್ಯಗಳ ಸಮಕಾಲೀನತೆಯಲ್ಲಿ ಮಿತಿಯಿದೆ. GPU ಗಳು ಸಮಾಂತರ ಗಣನೆಗಾಗಿ ವಿನ್ಯಾಸಗೊಳಿಸಲ್ಪಟ್ಟಿದ್ದು, ಆದುದರಿಂದ ಆಳವಾದ ಕಲಿಕೆ ಕಾರ್ಯಗಳಲ್ಲಿ ಉತ್ತಮವಾಗಿವೆ.
|
||||
|
||||
| CPU | GPU |
|
||||
|-----------------------------------------|-----------------------------|
|
||||
| ಕಡಿಮೆ ವೆಚ್ಚದ | ಹೆಚ್ಚು ವೆಚ್ಚದ |
|
||||
| ಕಡಿಮೆ ಮಟ್ಟದ ಸಮಕಾಲೀನತೆ | ಹೆಚ್ಚು ಮಟ್ಟದ ಸಮಕಾಲೀನತೆ |
|
||||
| ಆಳವಾದ ಕಲಿಕೆ ಮಾದರಿಗಳನ್ನು ತರಬೇತಿಯಲ್ಲಿ ನಿಧಾನ | ಆಳವಾದ ಕಲಿಕೆಗೆ ಸೂಕ್ತ |
|
||||
|
||||
|
||||
**ಕ್ಲಸ್ಟರ್ ಗಾತ್ರ**
|
||||
|
||||
ದೊಡ್ಡ ಕ್ಲಸ್ಟರ್ಗಳು ಹೆಚ್ಚು ವೆಚ್ಚದಾಗಿವೆ ಆದರೆ ಉತ್ತಮ ಪ್ರತಿಕ್ರಿಯಾಶೀಲತೆಯನ್ನು ನೀಡುತ್ತವೆ. ಆದ್ದರಿಂದ, ನಿಮಗೆ ಸಮಯವಿದ್ದರೂ ಹಣ ಕಡಿಮೆ ಇದ್ದರೆ, ನೀವು ಸಣ್ಣ ಕ್ಲಸ್ಟರ್ನಿಂದ ಪ್ರಾರಂಭಿಸಬೇಕು. ವಿರುದ್ಧವಾಗಿ, ನಿಮಗೆ ಹಣ ಇದ್ದರೂ ಸಮಯ ಕಡಿಮೆ ಇದ್ದರೆ, ನೀವು ದೊಡ್ಡ ಕ್ಲಸ್ಟರ್ನಿಂದ ಪ್ರಾರಂಭಿಸಬೇಕು.
|
||||
|
||||
**VM ಗಾತ್ರ**
|
||||
|
||||
ನಿಮ್ಮ ಸಮಯ ಮತ್ತು ಬಜೆಟ್ ನಿರ್ಬಂಧಗಳ ಆಧಾರದ ಮೇಲೆ, ನೀವು ನಿಮ್ಮ RAM, ಡಿಸ್ಕ್, ಕೋರ್ಗಳ ಸಂಖ್ಯೆ ಮತ್ತು ಕ್ಲಾಕ್ ವೇಗವನ್ನು ಬದಲಾಯಿಸಬಹುದು. ಈ ಎಲ್ಲಾ ಪರಿಮಾಣಗಳನ್ನು ಹೆಚ್ಚಿಸುವುದು ಹೆಚ್ಚು ವೆಚ್ಚದಾಗುತ್ತದೆ, ಆದರೆ ಉತ್ತಮ ಕಾರ್ಯಕ್ಷಮತೆಯನ್ನು ನೀಡುತ್ತದೆ.
|
||||
|
||||
**ನಿರ್ದಿಷ್ಟ ಅಥವಾ ಕಡಿಮೆ ಪ್ರಾಥಮಿಕತೆ ಇರುವ ಉದಾಹರಣೆಗಳು?**
|
||||
|
||||
ಕಡಿಮೆ ಪ್ರಾಥಮಿಕತೆ ಇರುವ ಉದಾಹರಣೆ ಎಂದರೆ ಅದು ಮಧ್ಯಂತರವಾಗಬಹುದು: ಅರ್ಥಾತ್, ಮೈಕ್ರೋಸಾಫ್ಟ್ ಅಜೂರ್ ಆ ಸಂಪನ್ಮೂಲಗಳನ್ನು ತೆಗೆದುಕೊಂಡು ಬೇರೆ ಕಾರ್ಯಕ್ಕೆ ನಿಯೋಜಿಸಬಹುದು, ಹೀಗಾಗಿ ಕೆಲಸವನ್ನು ಮಧ್ಯಂತರಗೊಳಿಸುತ್ತದೆ. ನಿರ್ದಿಷ್ಟ ಉದಾಹರಣೆ ಅಥವಾ ಮಧ್ಯಂತರವಲ್ಲದ ಉದಾಹರಣೆ ಎಂದರೆ ನಿಮ್ಮ ಅನುಮತಿಯಿಲ್ಲದೆ ಕೆಲಸವನ್ನು ಎಂದಿಗೂ ನಿಲ್ಲಿಸಲಾಗುವುದಿಲ್ಲ.
|
||||
ಇದು ಸಮಯ ಮತ್ತು ಹಣದ ಮತ್ತೊಂದು ಪರಿಗಣನೆ, ಏಕೆಂದರೆ ಮಧ್ಯಂತರ ಉದಾಹರಣೆಗಳು ನಿರ್ದಿಷ್ಟ ಉದಾಹರಣೆಗಳಿಗಿಂತ ಕಡಿಮೆ ವೆಚ್ಚದವಾಗಿವೆ.
|
||||
|
||||
#### 2.2.2 ಗಣನೆ ಕ್ಲಸ್ಟರ್ ರಚನೆ
|
||||
|
||||
ನಾವು ಮೊದಲು ರಚಿಸಿದ [ಅಜೂರ್ ML ವರ್ಕ್ಸ್ಪೇಸ್](https://ml.azure.com/) ನಲ್ಲಿ, ಗಣನೆಗೆ ಹೋಗಿ ನಾವು ಈಗಾಗಲೇ ಚರ್ಚಿಸಿದ ವಿವಿಧ ಗಣನೆ ಸಂಪನ್ಮೂಲಗಳನ್ನು ನೋಡಬಹುದು (ಅಂದರೆ ಗಣನೆ ಉದಾಹರಣೆಗಳು, ಗಣನೆ ಕ್ಲಸ್ಟರ್ಗಳು, ಅನುವಾದ ಕ್ಲಸ್ಟರ್ಗಳು ಮತ್ತು ಸಂಯೋಜಿತ ಗಣನೆ). ಈ ಯೋಜನೆಗಾಗಿ, ನಮಗೆ ಮಾದರಿ ತರಬೇತಿಗೆ ಗಣನೆ ಕ್ಲಸ್ಟರ್ ಬೇಕಾಗುತ್ತದೆ. ಸ್ಟುಡಿಯೋದಲ್ಲಿ, "Compute" ಮೆನು ಕ್ಲಿಕ್ ಮಾಡಿ, ನಂತರ "Compute cluster" ಟ್ಯಾಬ್ ಕ್ಲಿಕ್ ಮಾಡಿ ಮತ್ತು "+ New" ಬಟನ್ ಕ್ಲಿಕ್ ಮಾಡಿ ಗಣನೆ ಕ್ಲಸ್ಟರ್ ರಚಿಸಲು.
|
||||
|
||||

|
||||
|
||||
1. ನಿಮ್ಮ ಆಯ್ಕೆಗಳನ್ನು ಆರಿಸಿ: ನಿರ್ದಿಷ್ಟ ವಿರುದ್ಧ ಕಡಿಮೆ ಪ್ರಾಥಮಿಕತೆ, CPU ಅಥವಾ GPU, VM ಗಾತ್ರ ಮತ್ತು ಕೋರ್ ಸಂಖ್ಯೆ (ಈ ಯೋಜನೆಗಾಗಿ ಡೀಫಾಲ್ಟ್ ಸೆಟ್ಟಿಂಗ್ಗಳನ್ನು ಇಡಬಹುದು).
|
||||
2. ಮುಂದಿನ ಬಟನ್ ಕ್ಲಿಕ್ ಮಾಡಿ.
|
||||
|
||||

|
||||
|
||||
3. ಕ್ಲಸ್ಟರ್ಗೆ ಗಣನೆ ಹೆಸರು ನೀಡಿ
|
||||
4. ನಿಮ್ಮ ಆಯ್ಕೆಗಳನ್ನು ಆರಿಸಿ: ಕನಿಷ್ಠ/ಗರಿಷ್ಠ ನೋಡ್ಗಳ ಸಂಖ್ಯೆ, ಸ್ಕೇಲ್ ಡೌನ್ ಮಾಡುವ ಮೊದಲು ನಿರ್ಜೀವ ಸೆಕೆಂಡುಗಳು, SSH ಪ್ರವೇಶ. ಕನಿಷ್ಠ ನೋಡ್ಗಳ ಸಂಖ್ಯೆ 0 ಇದ್ದರೆ, ಕ್ಲಸ್ಟರ್ ನಿರ್ಜೀವವಾಗಿರುವಾಗ ನೀವು ಹಣ ಉಳಿಸಬಹುದು. ಗರಿಷ್ಠ ನೋಡ್ಗಳ ಸಂಖ್ಯೆ ಹೆಚ್ಚಾದರೆ ತರಬೇತಿ ಕಡಿಮೆ ಸಮಯ ತೆಗೆದುಕೊಳ್ಳುತ್ತದೆ. ಶಿಫಾರಸು ಮಾಡಲಾದ ಗರಿಷ್ಠ ನೋಡ್ಗಳ ಸಂಖ್ಯೆ 3.
|
||||
5. "Create" ಬಟನ್ ಕ್ಲಿಕ್ ಮಾಡಿ. ಈ ಹಂತಕ್ಕೆ ಕೆಲವು ನಿಮಿಷಗಳು ಬೇಕಾಗಬಹುದು.
|
||||
|
||||

|
||||
|
||||
ಅದ್ಭುತ! ಈಗ ನಮಗೆ ಗಣನೆ ಕ್ಲಸ್ಟರ್ ಇದೆ, ನಾವು ಡೇಟಾವನ್ನು ಅಜೂರ್ ML ಸ್ಟುಡಿಯೋಗೆ ಲೋಡ್ ಮಾಡಬೇಕಾಗಿದೆ.
|
||||
|
||||
### 2.3 ಡೇಟಾಸೆಟ್ ಲೋಡ್ ಮಾಡುವುದು
|
||||
|
||||
1. ನಾವು ಮೊದಲು ರಚಿಸಿದ [ಅಜೂರ್ ML ವರ್ಕ್ಸ್ಪೇಸ್](https://ml.azure.com/) ನಲ್ಲಿ, ಎಡ ಮೆನುದಲ್ಲಿ "Datasets" ಕ್ಲಿಕ್ ಮಾಡಿ ಮತ್ತು "+ Create dataset" ಬಟನ್ ಕ್ಲಿಕ್ ಮಾಡಿ ಡೇಟಾಸೆಟ್ ರಚಿಸಲು. "From local files" ಆಯ್ಕೆ ಮಾಡಿ ಮತ್ತು ನಾವು ಮೊದಲು ಡೌನ್ಲೋಡ್ ಮಾಡಿದ ಕಾಗಲ್ ಡೇಟಾಸೆಟ್ ಆಯ್ಕೆಮಾಡಿ.
|
||||
|
||||

|
||||
|
||||
2. ನಿಮ್ಮ ಡೇಟಾಸೆಟ್ಗೆ ಹೆಸರು, ಪ್ರಕಾರ ಮತ್ತು ವಿವರಣೆ ನೀಡಿ. ಮುಂದಿನ ಬಟನ್ ಕ್ಲಿಕ್ ಮಾಡಿ. ಫೈಲ್ಗಳಿಂದ ಡೇಟಾ ಅಪ್ಲೋಡ್ ಮಾಡಿ. ಮುಂದಿನ ಬಟನ್ ಕ್ಲಿಕ್ ಮಾಡಿ.
|
||||
|
||||

|
||||
|
||||
3. ಸ್ಕೀಮಾನಲ್ಲಿ, ಕೆಳಗಿನ ವೈಶಿಷ್ಟ್ಯಗಳಿಗಾಗಿ ಡೇಟಾ ಪ್ರಕಾರವನ್ನು ಬೂಲಿಯನ್ಗೆ ಬದಲಾಯಿಸಿ: ಅನೀಮಿಯಾ, ಡಯಾಬಿಟಿಸ್, ಹೈ ಬ್ಲಡ್ ಪ್ರೆಶರ್, ಲಿಂಗ, ಧೂಮಪಾನ, ಮತ್ತು DEATH_EVENT. ಮುಂದಿನ ಬಟನ್ ಕ್ಲಿಕ್ ಮಾಡಿ ಮತ್ತು ರಚಿಸಿ ಕ್ಲಿಕ್ ಮಾಡಿ.
|
||||
|
||||

|
||||
|
||||
ಚೆನ್ನಾಗಿದೆ! ಈಗ ಡೇಟಾಸೆಟ್ ಸಿದ್ಧವಾಗಿದೆ ಮತ್ತು ಗಣನೆ ಕ್ಲಸ್ಟರ್ ರಚಿಸಲಾಗಿದೆ, ನಾವು ಮಾದರಿ ತರಬೇತಿಯನ್ನು ಪ್ರಾರಂಭಿಸಬಹುದು!
|
||||
|
||||
### 2.4 ಕಡಿಮೆ ಕೋಡ್/ಕೋಡ್ ಇಲ್ಲದ ತರಬೇತಿ AutoML ಮೂಲಕ
|
||||
|
||||
ಪಾರಂಪರಿಕ ಯಂತ್ರ ಕಲಿಕೆ ಮಾದರಿ ಅಭಿವೃದ್ಧಿ ಸಂಪನ್ಮೂಲ-ತೀವ್ರ, ಮಹತ್ವದ ಕ್ಷೇತ್ರ ಜ್ಞಾನ ಮತ್ತು ಸಮಯವನ್ನು ಅಗತ್ಯವಿದೆ ಮತ್ತು ಅನೇಕ ಮಾದರಿಗಳನ್ನು ಉತ್ಪಾದಿಸಿ ಹೋಲಿಸಲು ಬೇಕಾಗುತ್ತದೆ.
|
||||
ಸ್ವಯಂಚಾಲಿತ ಯಂತ್ರ ಕಲಿಕೆ (AutoML) ಎಂದರೆ ಯಂತ್ರ ಕಲಿಕೆ ಮಾದರಿ ಅಭಿವೃದ್ಧಿಯ ಸಮಯ-ತೀವ್ರ, ಪುನರಾವರ್ತಿತ ಕಾರ್ಯಗಳನ್ನು ಸ್ವಯಂಚಾಲಿತಗೊಳಿಸುವ ಪ್ರಕ್ರಿಯೆ. ಇದು ಡೇಟಾ ವಿಜ್ಞಾನಿಗಳು, ವಿಶ್ಲೇಷಕರು ಮತ್ತು ಅಭಿವೃದ್ಧಿಪಡಿಸುವವರಿಗೆ ಹೆಚ್ಚಿನ ಪ್ರಮಾಣ, ಕಾರ್ಯಕ್ಷಮತೆ ಮತ್ತು ಉತ್ಪಾದಕತೆ ಜೊತೆಗೆ ML ಮಾದರಿಗಳನ್ನು ನಿರ್ಮಿಸಲು ಅನುಮತಿಸುತ್ತದೆ, ಮತ್ತು ಮಾದರಿ ಗುಣಮಟ್ಟವನ್ನು ಕಾಪಾಡುತ್ತದೆ. ಇದು ಉತ್ಪಾದನೆಗೆ ಸಿದ್ಧ ML ಮಾದರಿಗಳನ್ನು ಪಡೆಯಲು ಬೇಕಾದ ಸಮಯವನ್ನು ಕಡಿಮೆ ಮಾಡುತ್ತದೆ, ಸುಲಭ ಮತ್ತು ಪರಿಣಾಮಕಾರಿಯಾಗಿ. [ಹೆಚ್ಚು ತಿಳಿಯಿರಿ](https://docs.microsoft.com/azure/machine-learning/concept-automated-ml?WT.mc_id=academic-77958-bethanycheum&ocid=AID3041109)
|
||||
|
||||
1. ನಾವು ಮೊದಲು ರಚಿಸಿದ [ಅಜೂರ್ ML ವರ್ಕ್ಸ್ಪೇಸ್](https://ml.azure.com/) ನಲ್ಲಿ ಎಡ ಮೆನುದಲ್ಲಿ "Automated ML" ಕ್ಲಿಕ್ ಮಾಡಿ ಮತ್ತು ನೀವು appena ಅಪ್ಲೋಡ್ ಮಾಡಿದ ಡೇಟಾಸೆಟ್ ಆಯ್ಕೆಮಾಡಿ. ಮುಂದಿನ ಬಟನ್ ಕ್ಲಿಕ್ ಮಾಡಿ.
|
||||
|
||||

|
||||
|
||||
2. ಹೊಸ ಪ್ರಯೋಗದ ಹೆಸರು, ಗುರಿ ಕಾಲಮ್ (DEATH_EVENT) ಮತ್ತು ನಾವು ರಚಿಸಿದ ಗಣನೆ ಕ್ಲಸ್ಟರ್ ನಮೂದಿಸಿ. ಮುಂದಿನ ಬಟನ್ ಕ್ಲಿಕ್ ಮಾಡಿ.
|
||||
|
||||

|
||||
|
||||
3. "Classification" ಆಯ್ಕೆ ಮಾಡಿ ಮತ್ತು Finish ಕ್ಲಿಕ್ ಮಾಡಿ. ಈ ಹಂತವು ನಿಮ್ಮ ಗಣನೆ ಕ್ಲಸ್ಟರ್ ಗಾತ್ರದ ಮೇಲೆ ಅವಲಂಬಿತವಾಗಿ 30 ನಿಮಿಷದಿಂದ 1 ಗಂಟೆ ತೆಗೆದುಕೊಳ್ಳಬಹುದು.
|
||||
|
||||

|
||||
|
||||
4. ರನ್ ಪೂರ್ಣಗೊಂಡ ನಂತರ, "Automated ML" ಟ್ಯಾಬ್ ಕ್ಲಿಕ್ ಮಾಡಿ, ನಿಮ್ಮ ರನ್ ಕ್ಲಿಕ್ ಮಾಡಿ, ಮತ್ತು "Best model summary" ಕಾರ್ಡ್ನಲ್ಲಿನ ಆಲ್ಗೋರಿದಮ್ ಕ್ಲಿಕ್ ಮಾಡಿ.
|
||||
|
||||

|
||||
|
||||
ಇಲ್ಲಿ ನೀವು AutoML ರಚಿಸಿದ ಅತ್ಯುತ್ತಮ ಮಾದರಿಯ ವಿವರವಾದ ವಿವರಣೆಯನ್ನು ನೋಡಬಹುದು. ನೀವು ಮಾದರಿಗಳ ಟ್ಯಾಬ್ನಲ್ಲಿ ಇತರ ಮಾದರಿಗಳನ್ನು ಸಹ ಅನ್ವೇಷಿಸಬಹುದು. ವಿವರಣೆಗಳಲ್ಲಿ (ಪೂರ್ವವೀಕ್ಷಣಾ ಬಟನ್) ಕೆಲವು ನಿಮಿಷಗಳನ್ನು ತೆಗೆದು ಮಾದರಿಗಳನ್ನು ಪರಿಶೀಲಿಸಿ. ನೀವು ಬಳಸಲು ಬಯಸುವ ಮಾದರಿಯನ್ನು ಆಯ್ಕೆಮಾಡಿದ ನಂತರ (ಇಲ್ಲಿ ನಾವು AutoML ಆಯ್ಕೆಮಾಡಿದ ಅತ್ಯುತ್ತಮ ಮಾದರಿಯನ್ನು ಆಯ್ಕೆಮಾಡುತ್ತೇವೆ), ನಾವು ಅದನ್ನು ಹೇಗೆ ನಿಯೋಜಿಸಬಹುದು ಎಂದು ನೋಡೋಣ.
|
||||
|
||||
## 3. ಕಡಿಮೆ ಕೋಡ್/ಕೋಡ್ ಇಲ್ಲದ ಮಾದರಿ ನಿಯೋಜನೆ ಮತ್ತು ಎಂಡ್ಪಾಯಿಂಟ್ ಬಳಕೆ
|
||||
### 3.1 ಮಾದರಿ ನಿಯೋಜನೆ
|
||||
|
||||
ಸ್ವಯಂಚಾಲಿತ ಯಂತ್ರ ಕಲಿಕೆ ಇಂಟರ್ಫೇಸ್ ನಿಮಗೆ ಅತ್ಯುತ್ತಮ ಮಾದರಿಯನ್ನು ವೆಬ್ ಸೇವೆಯಾಗಿ ಕೆಲವು ಹಂತಗಳಲ್ಲಿ ನಿಯೋಜಿಸಲು ಅನುಮತಿಸುತ್ತದೆ. ನಿಯೋಜನೆ ಎಂದರೆ ಮಾದರಿಯನ್ನು ಸಂಯೋಜಿಸುವುದು, ಅದು ಹೊಸ ಡೇಟಾದ ಆಧಾರದ ಮೇಲೆ ಭವಿಷ್ಯವಾಣಿಗಳನ್ನು ಮಾಡಬಹುದು ಮತ್ತು ಸಾಧ್ಯತೆಗಳ ಪ್ರದೇಶಗಳನ್ನು ಗುರುತಿಸಬಹುದು. ಈ ಯೋಜನೆಗಾಗಿ, ವೆಬ್ ಸೇವೆಗೆ ನಿಯೋಜನೆ ಎಂದರೆ ವೈದ್ಯಕೀಯ ಅಪ್ಲಿಕೇಶನ್ಗಳು ಮಾದರಿಯನ್ನು ಬಳಸಿ ತಮ್ಮ ರೋಗಿಗಳ ಹೃದಯಾಘಾತದ ಅಪಾಯವನ್ನು ನೇರವಾಗಿ ಭವಿಷ್ಯವಾಣಿ ಮಾಡಲು ಸಾಧ್ಯವಾಗುತ್ತದೆ.
|
||||
|
||||
ಅತ್ಯುತ್ತಮ ಮಾದರಿ ವಿವರಣೆಯಲ್ಲಿ, "Deploy" ಬಟನ್ ಕ್ಲಿಕ್ ಮಾಡಿ.
|
||||
|
||||

|
||||
|
||||
15. ಅದಕ್ಕೆ ಹೆಸರು, ವಿವರಣೆ, ಗಣನೆ ಪ್ರಕಾರ (Azure Container Instance), ಪ್ರಮಾಣೀಕರಣ ಸಕ್ರಿಯಗೊಳಿಸಿ ಮತ್ತು Deploy ಕ್ಲಿಕ್ ಮಾಡಿ. ಈ ಹಂತವು ಪೂರ್ಣಗೊಳ್ಳಲು ಸುಮಾರು 20 ನಿಮಿಷ ತೆಗೆದುಕೊಳ್ಳಬಹುದು. ನಿಯೋಜನೆ ಪ್ರಕ್ರಿಯೆಯಲ್ಲಿ ಮಾದರಿಯನ್ನು ನೋಂದಾಯಿಸುವುದು, ಸಂಪನ್ಮೂಲಗಳನ್ನು ರಚಿಸುವುದು ಮತ್ತು ಅವುಗಳನ್ನು ವೆಬ್ ಸೇವೆಗೆ ಸಂರಚಿಸುವುದು ಸೇರಿವೆ. Deploy ಸ್ಥಿತಿಯಡಿ ಸ್ಥಿತಿ ಸಂದೇಶ ಕಾಣಿಸುತ್ತದೆ. ನಿಯೋಜನೆ ಸ್ಥಿತಿಯನ್ನು ಪರಿಶೀಲಿಸಲು Refresh periodically ಆಯ್ಕೆಮಾಡಿ. ಸ್ಥಿತಿ "Healthy" ಆಗಿದ್ದಾಗ ಅದು ನಿಯೋಜಿತ ಮತ್ತು ಚಾಲನೆಯಲ್ಲಿ ಇದೆ.
|
||||
|
||||

|
||||
|
||||
16. ನಿಯೋಜನೆಯಾದ ನಂತರ, Endpoint ಟ್ಯಾಬ್ ಕ್ಲಿಕ್ ಮಾಡಿ ಮತ್ತು ನೀವು appena ನಿಯೋಜಿಸಿದ ಎಂಡ್ಪಾಯಿಂಟ್ ಕ್ಲಿಕ್ ಮಾಡಿ. ಇಲ್ಲಿ ನೀವು ಎಂಡ್ಪಾಯಿಂಟ್ ಬಗ್ಗೆ ಬೇಕಾದ ಎಲ್ಲಾ ವಿವರಗಳನ್ನು ಕಾಣಬಹುದು.
|
||||
|
||||

|
||||
|
||||
ಅದ್ಭುತ! ಈಗ ನಮಗೆ ಮಾದರಿ ನಿಯೋಜಿಸಲಾಗಿದೆ, ನಾವು ಎಂಡ್ಪಾಯಿಂಟ್ ಬಳಕೆಯನ್ನು ಪ್ರಾರಂಭಿಸಬಹುದು.
|
||||
|
||||
### 3.2 ಎಂಡ್ಪಾಯಿಂಟ್ ಬಳಕೆ
|
||||
|
||||
"Consume" ಟ್ಯಾಬ್ ಕ್ಲಿಕ್ ಮಾಡಿ. ಇಲ್ಲಿ ನೀವು REST ಎಂಡ್ಪಾಯಿಂಟ್ ಮತ್ತು ಪೈಥಾನ್ ಸ್ಕ್ರಿಪ್ಟ್ ಅನ್ನು ಬಳಕೆ ಆಯ್ಕೆಯಲ್ಲಿ ಕಾಣಬಹುದು. ಪೈಥಾನ್ ಕೋಡ್ ಓದಲು ಸ್ವಲ್ಪ ಸಮಯ ತೆಗೆದುಕೊಳ್ಳಿ.
|
||||
|
||||
ಈ ಸ್ಕ್ರಿಪ್ಟ್ ನೇರವಾಗಿ ನಿಮ್ಮ ಸ್ಥಳೀಯ ಯಂತ್ರದಿಂದ ಚಾಲನೆ ಮಾಡಬಹುದು ಮತ್ತು ನಿಮ್ಮ ಎಂಡ್ಪಾಯಿಂಟ್ ಅನ್ನು ಬಳಕೆ ಮಾಡುತ್ತದೆ.
|
||||
|
||||

|
||||
|
||||
ಆ ಎರಡು ಸಾಲುಗಳ ಕೋಡ್ ಪರಿಶೀಲಿಸಲು ಒಂದು ಕ್ಷಣ ತೆಗೆದುಕೊಳ್ಳಿ:
|
||||
|
||||
```python
|
||||
url = 'http://98e3715f-xxxx-xxxx-xxxx-9ec22d57b796.centralus.azurecontainer.io/score'
|
||||
api_key = '' # ವೆಬ್ ಸೇವೆಯ API ಕೀಲಿಯನ್ನು ಇದರಿಂದ ಬದಲಾಯಿಸಿ
|
||||
```
|
||||
`url` ಚರವು REST ಎಂಡ್ಪಾಯಿಂಟ್ ಆಗಿದ್ದು consume ಟ್ಯಾಬ್ನಲ್ಲಿ ಕಂಡುಬರುತ್ತದೆ ಮತ್ತು `api_key` ಚರವು ಪ್ರಾಥಮಿಕ ಕೀ ಆಗಿದ್ದು consume ಟ್ಯಾಬ್ನಲ್ಲಿ (ನೀವು ಪ್ರಮಾಣೀಕರಣ ಸಕ್ರಿಯಗೊಳಿಸಿದ್ದರೆ ಮಾತ್ರ) ಕಂಡುಬರುತ್ತದೆ. ಈ ರೀತಿಯಾಗಿ ಸ್ಕ್ರಿಪ್ಟ್ ಎಂಡ್ಪಾಯಿಂಟ್ ಅನ್ನು ಬಳಕೆ ಮಾಡಬಹುದು.
|
||||
|
||||
18. ಸ್ಕ್ರಿಪ್ಟ್ ಚಾಲನೆ ಮಾಡಿದಾಗ, ನೀವು ಕೆಳಗಿನ ಔಟ್ಪುಟ್ ನೋಡಬಹುದು:
|
||||
```python
|
||||
b'"{\\"result\\": [true]}"'
|
||||
```
|
||||
ಇದು ನೀಡಲಾದ ಡೇಟಾದ ಹೃದಯ ವೈಫಲ್ಯದ ಭವಿಷ್ಯವಾಣಿ ಸತ್ಯವಾಗಿದೆ ಎಂದು ಅರ್ಥ. ಇದು ಅರ್ಥಪೂರ್ಣ, ಏಕೆಂದರೆ ನೀವು ಸ್ಕ್ರಿಪ್ಟ್ನಲ್ಲಿ ಸ್ವಯಂಚಾಲಿತವಾಗಿ ರಚಿಸಲಾದ ಡೇಟಾವನ್ನು ಹೆಚ್ಚು ಗಮನಿಸಿದರೆ, ಎಲ್ಲವೂ ಡೀಫಾಲ್ಟ್ ಆಗಿ 0 ಮತ್ತು ತಪ್ಪು ಆಗಿವೆ. ನೀವು ಕೆಳಗಿನ ಇನ್ಪುಟ್ ಮಾದರಿಯನ್ನು ಬಳಸಿ ಡೇಟಾವನ್ನು ಬದಲಾಯಿಸಬಹುದು:
|
||||
|
||||
```python
|
||||
data = {
|
||||
"data":
|
||||
[
|
||||
{
|
||||
'age': "0",
|
||||
'anaemia': "false",
|
||||
'creatinine_phosphokinase': "0",
|
||||
'diabetes': "false",
|
||||
'ejection_fraction': "0",
|
||||
'high_blood_pressure': "false",
|
||||
'platelets': "0",
|
||||
'serum_creatinine': "0",
|
||||
'serum_sodium': "0",
|
||||
'sex': "false",
|
||||
'smoking': "false",
|
||||
'time': "0",
|
||||
},
|
||||
{
|
||||
'age': "60",
|
||||
'anaemia': "false",
|
||||
'creatinine_phosphokinase': "500",
|
||||
'diabetes': "false",
|
||||
'ejection_fraction': "38",
|
||||
'high_blood_pressure': "false",
|
||||
'platelets': "260000",
|
||||
'serum_creatinine': "1.40",
|
||||
'serum_sodium': "137",
|
||||
'sex': "false",
|
||||
'smoking': "false",
|
||||
'time': "130",
|
||||
},
|
||||
],
|
||||
}
|
||||
```
|
||||
ಸ್ಕ್ರಿಪ್ಟ್ ಹೀಗೆ ಪ್ರತಿಕ್ರಿಯಿಸಬೇಕು:
|
||||
```python
|
||||
b'"{\\"result\\": [true, false]}"'
|
||||
```
|
||||
|
||||
ಅಭಿನಂದನೆಗಳು! ನೀವು appena ನಿಯೋಜಿಸಿದ ಮತ್ತು ಅಜೂರ್ ML ನಲ್ಲಿ ತರಬೇತುದಾರ ಮಾದರಿಯನ್ನು ಬಳಕೆ ಮಾಡಿದ್ದೀರಿ!
|
||||
|
||||
> **_ಗಮನಿಸಿ:_** ಯೋಜನೆ ಮುಗಿದ ನಂತರ, ಎಲ್ಲಾ ಸಂಪನ್ಮೂಲಗಳನ್ನು ಅಳಿಸುವುದನ್ನು ಮರೆತಬೇಡಿ.
|
||||
## 🚀 ಸವಾಲು
|
||||
|
||||
AutoML ರಚಿಸಿದ ಶ್ರೇಷ್ಠ ಮಾದರಿಗಳ ವಿವರಣೆಗಳು ಮತ್ತು ವಿವರಗಳನ್ನು ಗಮನದಿಂದ ನೋಡಿ. ಶ್ರೇಷ್ಠ ಮಾದರಿ ಇತರ ಮಾದರಿಗಳಿಗಿಂತ ಉತ್ತಮವಾಗಿರುವ ಕಾರಣವನ್ನು ಅರ್ಥಮಾಡಿಕೊಳ್ಳಲು ಪ್ರಯತ್ನಿಸಿ. ಯಾವ ಆಲ್ಗೋರಿದಮ್ಗಳನ್ನು ಹೋಲಿಸಲಾಗಿದೆ? ಅವುಗಳ ನಡುವಿನ ವ್ಯತ್ಯಾಸಗಳು ಏನು? ಈ ಪ್ರಕರಣದಲ್ಲಿ ಶ್ರೇಷ್ಠ ಮಾದರಿ ಉತ್ತಮವಾಗಿ ಕಾರ್ಯನಿರ್ವಹಿಸುವ ಕಾರಣವೇನು?
|
||||
|
||||
## [ಪೋಸ್ಟ್-ಲೆಕ್ಚರ್ ಕ್ವಿಜ್](https://ff-quizzes.netlify.app/en/ds/quiz/35)
|
||||
|
||||
## ವಿಮರ್ಶೆ ಮತ್ತು ಸ್ವಯಂ ಅಧ್ಯಯನ
|
||||
|
||||
ಈ ಪಾಠದಲ್ಲಿ, ನೀವು ಕಡಿಮೆ ಕೋಡ್/ಕೋಡ್ ಇಲ್ಲದ ರೀತಿಯಲ್ಲಿ ಹೃದಯ ವೈಫಲ್ಯದ ಅಪಾಯವನ್ನು ಭವಿಷ್ಯವಾಣಿ ಮಾಡಲು ಮಾದರಿಯನ್ನು ತರಬೇತು, ನಿಯೋಜಿಸಿ ಮತ್ತು ಬಳಕೆ ಮಾಡುವುದು ಹೇಗೆ ಎಂಬುದನ್ನು ಕಲಿತಿರಿ. ನೀವು ಇನ್ನೂ ಮಾಡದಿದ್ದರೆ, AutoML ರಚಿಸಿದ ಶ್ರೇಷ್ಠ ಮಾದರಿಗಳ ವಿವರಣೆಗಳನ್ನು ಆಳವಾಗಿ ಅಧ್ಯಯನ ಮಾಡಿ ಮತ್ತು ಶ್ರೇಷ್ಠ ಮಾದರಿ ಇತರ ಮಾದರಿಗಳಿಗಿಂತ ಉತ್ತಮವಾಗಿರುವ ಕಾರಣವನ್ನು ಅರ್ಥಮಾಡಿಕೊಳ್ಳಿ.
|
||||
|
||||
ನೀವು ಈ [ಡಾಕ್ಯುಮೆಂಟೇಶನ್](https://docs.microsoft.com/azure/machine-learning/tutorial-first-experiment-automated-ml?WT.mc_id=academic-77958-bethanycheum&ocid=AID3041109) ಓದಿ ಕಡಿಮೆ ಕೋಡ್/ಕೋಡ್ ಇಲ್ಲದ AutoML ಬಗ್ಗೆ ಇನ್ನಷ್ಟು ತಿಳಿದುಕೊಳ್ಳಬಹುದು.
|
||||
|
||||
## ಹುದ್ದೆ
|
||||
|
||||
[ಅಜೂರ್ ML ನಲ್ಲಿ ಕಡಿಮೆ ಕೋಡ್/ಕೋಡ್ ಇಲ್ಲದ ಡೇಟಾ ಸೈನ್ಸ್ ಯೋಜನೆ](assignment.md)
|
||||
|
||||
---
|
||||
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
|
||||
**ಅಸ್ವೀಕರಣ**:
|
||||
ಈ ದಸ್ತಾವೇಜು AI ಅನುವಾದ ಸೇವೆ [Co-op Translator](https://github.com/Azure/co-op-translator) ಬಳಸಿ ಅನುವಾದಿಸಲಾಗಿದೆ. ನಾವು ನಿಖರತೆಯಿಗಾಗಿ ಪ್ರಯತ್ನಿಸುತ್ತಿದ್ದರೂ, ಸ್ವಯಂಚಾಲಿತ ಅನುವಾದಗಳಲ್ಲಿ ದೋಷಗಳು ಅಥವಾ ಅಸತ್ಯತೆಗಳು ಇರಬಹುದು ಎಂದು ದಯವಿಟ್ಟು ಗಮನಿಸಿ. ಮೂಲ ಭಾಷೆಯಲ್ಲಿರುವ ಮೂಲ ದಸ್ತಾವೇಜನ್ನು ಅಧಿಕೃತ ಮೂಲವೆಂದು ಪರಿಗಣಿಸಬೇಕು. ಮಹತ್ವದ ಮಾಹಿತಿಗಾಗಿ, ವೃತ್ತಿಪರ ಮಾನವ ಅನುವಾದವನ್ನು ಶಿಫಾರಸು ಮಾಡಲಾಗುತ್ತದೆ. ಈ ಅನುವಾದ ಬಳಕೆಯಿಂದ ಉಂಟಾಗುವ ಯಾವುದೇ ತಪ್ಪು ಅರ್ಥಮಾಡಿಕೊಳ್ಳುವಿಕೆ ಅಥವಾ ತಪ್ಪು ವಿವರಣೆಗಳಿಗೆ ನಾವು ಹೊಣೆಗಾರರಾಗುವುದಿಲ್ಲ.
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER END -->
|
||||
@ -0,0 +1,27 @@
|
||||
<!--
|
||||
CO_OP_TRANSLATOR_METADATA:
|
||||
{
|
||||
"original_hash": "8fdc4a5fd9bc27a8d2ebef995dfbf73f",
|
||||
"translation_date": "2025-12-19T15:04:10+00:00",
|
||||
"source_file": "5-Data-Science-In-Cloud/18-Low-Code/assignment.md",
|
||||
"language_code": "kn"
|
||||
}
|
||||
-->
|
||||
# ಕಡಿಮೆ ಕೋಡ್/ಕೋಡ್ ಇಲ್ಲದ ಡೇಟಾ ಸೈನ್ಸ್ ಪ್ರಾಜೆಕ್ಟ್ ಆನ್ ಅಜೂರ್ ಎಂಎಲ್
|
||||
|
||||
## ಸೂಚನೆಗಳು
|
||||
|
||||
ನಾವು ಅಜೂರ್ ಎಂಎಲ್ ವೇದಿಕೆಯನ್ನು ಕಡಿಮೆ ಕೋಡ್/ಕೋಡ್ ಇಲ್ಲದ ರೀತಿಯಲ್ಲಿ ಮಾದರಿಯನ್ನು ತರಬೇತಿ, ನಿಯೋಜನೆ ಮತ್ತು ಬಳಕೆ ಮಾಡುವುದನ್ನು ಹೇಗೆ ಮಾಡುವುದು ಎಂದು ನೋಡಿದೆವು. ಈಗ ನೀವು ಇನ್ನೊಂದು ಮಾದರಿಯನ್ನು ತರಬೇತಿ ಮಾಡಲು, ನಿಯೋಜಿಸಲು ಮತ್ತು ಬಳಸಲು ಬಳಸಬಹುದಾದ ಕೆಲವು ಡೇಟಾವನ್ನು ಹುಡುಕಿ. ನೀವು [Kaggle](https://kaggle.com) ಮತ್ತು [Azure Open Datasets](https://azure.microsoft.com/services/open-datasets/catalog?WT.mc_id=academic-77958-bethanycheum&ocid=AID3041109) ನಲ್ಲಿ ಡೇಟಾಸೆಟ್ಗಳನ್ನು ಹುಡುಕಬಹುದು.
|
||||
|
||||
## ರೂಬ್ರಿಕ್
|
||||
|
||||
| ಉದಾಹರಣೀಯ | ಯೋಗ್ಯ | ಸುಧಾರಣೆಯ ಅಗತ್ಯವಿದೆ |
|
||||
|-----------|----------|-------------------|
|
||||
|ಡೇಟಾವನ್ನು ಅಪ್ಲೋಡ್ ಮಾಡುವಾಗ ಅಗತ್ಯವಿದ್ದರೆ ವೈಶಿಷ್ಟ್ಯದ ಪ್ರಕಾರವನ್ನು ಬದಲಾಯಿಸುವುದನ್ನು ನೀವು ಗಮನಿಸಿದ್ದೀರಿ. ಅಗತ್ಯವಿದ್ದರೆ ಡೇಟಾವನ್ನು ನೀವು ಶುದ್ಧೀಕರಿಸಿದ್ದೀರಿ. ನೀವು AutoML ಮೂಲಕ ಡೇಟಾಸೆಟ್ನಲ್ಲಿ ತರಬೇತಿ ನಡೆಸಿದ್ದೀರಿ ಮತ್ತು ಮಾದರಿ ವಿವರಣೆಗಳನ್ನು ಪರಿಶೀಲಿಸಿದ್ದೀರಿ. ನೀವು ಅತ್ಯುತ್ತಮ ಮಾದರಿಯನ್ನು ನಿಯೋಜಿಸಿದ್ದೀರಿ ಮತ್ತು ಅದನ್ನು ಬಳಸಲು ಸಾಧ್ಯವಾಯಿತು. |ಡೇಟಾವನ್ನು ಅಪ್ಲೋಡ್ ಮಾಡುವಾಗ ಅಗತ್ಯವಿದ್ದರೆ ವೈಶಿಷ್ಟ್ಯದ ಪ್ರಕಾರವನ್ನು ಬದಲಾಯಿಸುವುದನ್ನು ನೀವು ಗಮನಿಸಿದ್ದೀರಿ. ನೀವು AutoML ಮೂಲಕ ಡೇಟಾಸೆಟ್ನಲ್ಲಿ ತರಬೇತಿ ನಡೆಸಿದ್ದೀರಿ, ಅತ್ಯುತ್ತಮ ಮಾದರಿಯನ್ನು ನಿಯೋಜಿಸಿದ್ದೀರಿ ಮತ್ತು ಅದನ್ನು ಬಳಸಲು ಸಾಧ್ಯವಾಯಿತು. |ನೀವು AutoML ಮೂಲಕ ತರಬೇತಿಗೊಂಡ ಅತ್ಯುತ್ತಮ ಮಾದರಿಯನ್ನು ನಿಯೋಜಿಸಿದ್ದೀರಿ ಮತ್ತು ಅದನ್ನು ಬಳಸಲು ಸಾಧ್ಯವಾಯಿತು. |
|
||||
|
||||
---
|
||||
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
|
||||
**ಅಸ್ವೀಕಾರ**:
|
||||
ಈ ದಸ್ತಾವೇಜು AI ಅನುವಾದ ಸೇವೆ [Co-op Translator](https://github.com/Azure/co-op-translator) ಬಳಸಿ ಅನುವಾದಿಸಲಾಗಿದೆ. ನಾವು ನಿಖರತೆಯಿಗಾಗಿ ಪ್ರಯತ್ನಿಸುತ್ತಿದ್ದರೂ, ಸ್ವಯಂಚಾಲಿತ ಅನುವಾದಗಳಲ್ಲಿ ತಪ್ಪುಗಳು ಅಥವಾ ಅಸತ್ಯತೆಗಳು ಇರಬಹುದು ಎಂದು ದಯವಿಟ್ಟು ಗಮನಿಸಿ. ಮೂಲ ಭಾಷೆಯಲ್ಲಿರುವ ಮೂಲ ದಸ್ತಾವೇಜನ್ನು ಅಧಿಕೃತ ಮೂಲವೆಂದು ಪರಿಗಣಿಸಬೇಕು. ಪ್ರಮುಖ ಮಾಹಿತಿಗಾಗಿ, ವೃತ್ತಿಪರ ಮಾನವ ಅನುವಾದವನ್ನು ಶಿಫಾರಸು ಮಾಡಲಾಗುತ್ತದೆ. ಈ ಅನುವಾದ ಬಳಕೆಯಿಂದ ಉಂಟಾಗುವ ಯಾವುದೇ ತಪ್ಪು ಅರ್ಥಮಾಡಿಕೊಳ್ಳುವಿಕೆ ಅಥವಾ ತಪ್ಪು ವಿವರಣೆಗಳಿಗೆ ನಾವು ಹೊಣೆಗಾರರಾಗುವುದಿಲ್ಲ.
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER END -->
|
||||
@ -0,0 +1,27 @@
|
||||
<!--
|
||||
CO_OP_TRANSLATOR_METADATA:
|
||||
{
|
||||
"original_hash": "386efdbc19786951341f6956247ee990",
|
||||
"translation_date": "2025-12-19T14:47:52+00:00",
|
||||
"source_file": "5-Data-Science-In-Cloud/19-Azure/assignment.md",
|
||||
"language_code": "kn"
|
||||
}
|
||||
-->
|
||||
# ಅಜೂರ್ ಎಂಎಲ್ ಎಸ್ಡಿಕೆ ಬಳಸಿ ಡೇಟಾ ಸೈನ್ಸ್ ಪ್ರಾಜೆಕ್ಟ್
|
||||
|
||||
## ಸೂಚನೆಗಳು
|
||||
|
||||
ನಾವು ಅಜೂರ್ ಎಂಎಲ್ ಪ್ಲಾಟ್ಫಾರ್ಮ್ ಅನ್ನು ಬಳಸಿಕೊಂಡು ಅಜೂರ್ ಎಂಎಲ್ ಎಸ್ಡಿಕೆ ಮೂಲಕ ಮಾದರಿಯನ್ನು ತರಬೇತಿ, ನಿಯೋಜನೆ ಮತ್ತು ಉಪಯೋಗಿಸುವ ವಿಧಾನವನ್ನು ನೋಡಿದ್ದೇವೆ. ಈಗ ನೀವು ಇನ್ನೊಂದು ಮಾದರಿಯನ್ನು ತರಬೇತಿ ಮಾಡಲು, ನಿಯೋಜಿಸಲು ಮತ್ತು ಉಪಯೋಗಿಸಲು ಬಳಸಬಹುದಾದ ಕೆಲವು ಡೇಟಾವನ್ನು ಹುಡುಕಿ. ನೀವು [Kaggle](https://kaggle.com) ಮತ್ತು [Azure Open Datasets](https://azure.microsoft.com/services/open-datasets/catalog?WT.mc_id=academic-77958-bethanycheum&ocid=AID3041109) ನಲ್ಲಿ ಡೇಟಾಸೆಟ್ಗಳನ್ನು ಹುಡುಕಬಹುದು.
|
||||
|
||||
## ರೂಬ್ರಿಕ್
|
||||
|
||||
| ಉದಾಹರಣೀಯ | ಸಮರ್ಪಕ | ಸುಧಾರಣೆಯ ಅಗತ್ಯವಿದೆ |
|
||||
|-----------|----------|-------------------|
|
||||
|AutoML ಸಂರಚನೆಯನ್ನು ಮಾಡುವಾಗ, ನೀವು SDK ಡಾಕ್ಯುಮೆಂಟೇಶನ್ ಮೂಲಕ ಯಾವ ಪ್ಯಾರಾಮೀಟರ್ಗಳನ್ನು ಬಳಸಬಹುದು ಎಂದು ನೋಡಿದ್ದೀರಿ. ನೀವು ಅಜೂರ್ ಎಂಎಲ್ SDK ಬಳಸಿ AutoML ಮೂಲಕ ಡೇಟಾಸೆಟ್ನಲ್ಲಿ ತರಬೇತಿ ನಡೆಸಿದ್ದೀರಿ ಮತ್ತು ಮಾದರಿ ವಿವರಣೆಗಳನ್ನು ಪರಿಶೀಲಿಸಿದ್ದೀರಿ. ನೀವು ಅತ್ಯುತ್ತಮ ಮಾದರಿಯನ್ನು ನಿಯೋಜಿಸಿದ್ದೀರಿ ಮತ್ತು ಅದನ್ನು ಅಜೂರ್ ಎಂಎಲ್ SDK ಮೂಲಕ ಉಪಯೋಗಿಸಲು ಸಾಧ್ಯವಾಯಿತು. | ನೀವು ಅಜೂರ್ ಎಂಎಲ್ SDK ಬಳಸಿ AutoML ಮೂಲಕ ಡೇಟಾಸೆಟ್ನಲ್ಲಿ ತರಬೇತಿ ನಡೆಸಿದ್ದೀರಿ ಮತ್ತು ಮಾದರಿ ವಿವರಣೆಗಳನ್ನು ಪರಿಶೀಲಿಸಿದ್ದೀರಿ. ನೀವು ಅತ್ಯುತ್ತಮ ಮಾದರಿಯನ್ನು ನಿಯೋಜಿಸಿದ್ದೀರಿ ಮತ್ತು ಅದನ್ನು ಅಜೂರ್ ಎಂಎಲ್ SDK ಮೂಲಕ ಉಪಯೋಗಿಸಲು ಸಾಧ್ಯವಾಯಿತು. | ನೀವು ಅಜೂರ್ ಎಂಎಲ್ SDK ಬಳಸಿ AutoML ಮೂಲಕ ಡೇಟಾಸೆಟ್ನಲ್ಲಿ ತರಬೇತಿ ನಡೆಸಿದ್ದೀರಿ. ನೀವು ಅತ್ಯುತ್ತಮ ಮಾದರಿಯನ್ನು ನಿಯೋಜಿಸಿದ್ದೀರಿ ಮತ್ತು ಅದನ್ನು ಅಜೂರ್ ಎಂಎಲ್ SDK ಮೂಲಕ ಉಪಯೋಗಿಸಲು ಸಾಧ್ಯವಾಯಿತು. |
|
||||
|
||||
---
|
||||
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
|
||||
**ಅಸ್ವೀಕರಣ**:
|
||||
ಈ ದಸ್ತಾವೇಜು [Co-op Translator](https://github.com/Azure/co-op-translator) ಎಂಬ AI ಅನುವಾದ ಸೇವೆಯನ್ನು ಬಳಸಿ ಅನುವಾದಿಸಲಾಗಿದೆ. ನಾವು ಶುದ್ಧತೆಯತ್ತ ಪ್ರಯತ್ನಿಸುತ್ತಿದ್ದರೂ, ಸ್ವಯಂಚಾಲಿತ ಅನುವಾದಗಳಲ್ಲಿ ತಪ್ಪುಗಳು ಅಥವಾ ಅಸತ್ಯತೆಗಳು ಇರಬಹುದು ಎಂದು ದಯವಿಟ್ಟು ಗಮನಿಸಿ. ಮೂಲ ಭಾಷೆಯಲ್ಲಿರುವ ಮೂಲ ದಸ್ತಾವೇಜನ್ನು ಅಧಿಕೃತ ಮೂಲವೆಂದು ಪರಿಗಣಿಸಬೇಕು. ಪ್ರಮುಖ ಮಾಹಿತಿಗಾಗಿ, ವೃತ್ತಿಪರ ಮಾನವ ಅನುವಾದವನ್ನು ಶಿಫಾರಸು ಮಾಡಲಾಗುತ್ತದೆ. ಈ ಅನುವಾದ ಬಳಕೆಯಿಂದ ಉಂಟಾಗುವ ಯಾವುದೇ ತಪ್ಪು ಅರ್ಥಮಾಡಿಕೊಳ್ಳುವಿಕೆ ಅಥವಾ ತಪ್ಪು ವಿವರಣೆಗಳಿಗೆ ನಾವು ಹೊಣೆಗಾರರಾಗುವುದಿಲ್ಲ.
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER END -->
|
||||
@ -0,0 +1,325 @@
|
||||
{
|
||||
"cells": [
|
||||
{
|
||||
"cell_type": "markdown",
|
||||
"source": [
|
||||
"# ಕ್ಲೌಡ್ನಲ್ಲಿ ಡೇಟಾ ಸೈನ್ಸ್: \"ಅಜೂರ್ ಎಂಎಲ್ ಎಸ್ಡಿಕೆ\" ವಿಧಾನ\n",
|
||||
"\n",
|
||||
"## ಪರಿಚಯ\n",
|
||||
"\n",
|
||||
"ಈ ನೋಟ್ಬುಕ್ನಲ್ಲಿ, ನಾವು ಅಜೂರ್ ಎಂಎಲ್ ಮೂಲಕ ಮಾದರಿಯನ್ನು ತರಬೇತಿ, ನಿಯೋಜನೆ ಮತ್ತು ಬಳಕೆ ಮಾಡಲು ಅಜೂರ್ ಎಂಎಲ್ ಎಸ್ಡಿಕೆ ಅನ್ನು ಹೇಗೆ ಬಳಸುವುದು ಎಂದು ಕಲಿಯುತ್ತೇವೆ.\n",
|
||||
"\n",
|
||||
"ಪೂರ್ವಾಪೇಕ್ಷಿತಗಳು:\n",
|
||||
"1. ನೀವು ಅಜೂರ್ ಎಂಎಲ್ ವರ್ಕ್ಸ್ಪೇಸ್ ಅನ್ನು ರಚಿಸಿದ್ದೀರಿ.\n",
|
||||
"2. ನೀವು [ಹಾರ್ಟ್ ಫೇಲ್ಯೂರ್ ಡೇಟಾಸೆಟ್](https://www.kaggle.com/andrewmvd/heart-failure-clinical-data) ಅನ್ನು ಅಜೂರ್ ಎಂಎಲ್ಗೆ ಲೋಡ್ ಮಾಡಿದ್ದೀರಿ.\n",
|
||||
"3. ನೀವು ಈ ನೋಟ್ಬುಕ್ ಅನ್ನು ಅಜೂರ್ ಎಂಎಲ್ ಸ್ಟುಡಿಯೋಗೆ ಅಪ್ಲೋಡ್ ಮಾಡಿದ್ದೀರಿ.\n",
|
||||
"\n",
|
||||
"ಮುಂದಿನ ಹಂತಗಳು:\n",
|
||||
"\n",
|
||||
"1. ಇರುವ ವರ್ಕ್ಸ್ಪೇಸ್ನಲ್ಲಿ ಒಂದು ಪ್ರಯೋಗವನ್ನು ರಚಿಸಿ.\n",
|
||||
"2. ಒಂದು ಕಂಪ್ಯೂಟ್ ಕ್ಲಸ್ಟರ್ ರಚಿಸಿ.\n",
|
||||
"3. ಡೇಟಾಸೆಟ್ ಅನ್ನು ಲೋಡ್ ಮಾಡಿ.\n",
|
||||
"4. AutoMLConfig ಬಳಸಿ AutoML ಅನ್ನು ಸಂರಚಿಸಿ.\n",
|
||||
"5. AutoML ಪ್ರಯೋಗವನ್ನು ಚಾಲನೆ ಮಾಡಿ.\n",
|
||||
"6. ಫಲಿತಾಂಶಗಳನ್ನು ಅನ್ವೇಷಿಸಿ ಮತ್ತು ಉತ್ತಮ ಮಾದರಿಯನ್ನು ಪಡೆಯಿರಿ.\n",
|
||||
"7. ಉತ್ತಮ ಮಾದರಿಯನ್ನು ನೋಂದಣಿ ಮಾಡಿ.\n",
|
||||
"8. ಉತ್ತಮ ಮಾದರಿಯನ್ನು ನಿಯೋಜಿಸಿ.\n",
|
||||
"9. ಎಂಡ್ಪಾಯಿಂಟ್ ಅನ್ನು ಬಳಸಿ.\n",
|
||||
"\n",
|
||||
"## ಅಜೂರ್ ಮೆಷಿನ್ ಲರ್ನಿಂಗ್ SDK-ನಿರ್ದಿಷ್ಟ ಆಮದುಗಳು\n"
|
||||
],
|
||||
"metadata": {}
|
||||
},
|
||||
{
|
||||
"cell_type": "code",
|
||||
"execution_count": null,
|
||||
"source": [
|
||||
"from azureml.core import Workspace, Experiment\n",
|
||||
"from azureml.core.compute import AmlCompute\n",
|
||||
"from azureml.train.automl import AutoMLConfig\n",
|
||||
"from azureml.widgets import RunDetails\n",
|
||||
"from azureml.core.model import InferenceConfig, Model\n",
|
||||
"from azureml.core.webservice import AciWebservice"
|
||||
],
|
||||
"outputs": [],
|
||||
"metadata": {}
|
||||
},
|
||||
{
|
||||
"cell_type": "markdown",
|
||||
"source": [
|
||||
"## ಕಾರ್ಯಸ್ಥಳವನ್ನು ಪ್ರಾರಂಭಿಸಿ\n",
|
||||
"ಸ್ಥಿರಗೊಂಡ ಸಂರಚನೆಯಿಂದ ಕಾರ್ಯಸ್ಥಳ ವಸ್ತುವನ್ನು ಪ್ರಾರಂಭಿಸಿ. .\\config.json ನಲ್ಲಿ ಸಂರಚನಾ ಕಡತವು ಇರುವುದನ್ನು ಖಚಿತಪಡಿಸಿಕೊಳ್ಳಿ.\n"
|
||||
],
|
||||
"metadata": {}
|
||||
},
|
||||
{
|
||||
"cell_type": "code",
|
||||
"execution_count": null,
|
||||
"source": [
|
||||
"ws = Workspace.from_config()\n",
|
||||
"print(ws.name, ws.resource_group, ws.location, ws.subscription_id, sep = '\\n')"
|
||||
],
|
||||
"outputs": [],
|
||||
"metadata": {}
|
||||
},
|
||||
{
|
||||
"cell_type": "markdown",
|
||||
"source": [
|
||||
"## Azure ML ಪ್ರಯೋಗವನ್ನು ರಚಿಸಿ\n",
|
||||
"\n",
|
||||
"ನಾವು ಇತ್ತೀಚೆಗೆ ಪ್ರಾರಂಭಿಸಿದ ವರ್ಕ್ಸ್ಪೇಸ್ನಲ್ಲಿ 'aml-experiment' ಎಂಬ ಪ್ರಯೋಗವನ್ನು ರಚಿಸೋಣ.\n"
|
||||
],
|
||||
"metadata": {}
|
||||
},
|
||||
{
|
||||
"cell_type": "code",
|
||||
"execution_count": null,
|
||||
"source": [
|
||||
"experiment_name = 'aml-experiment'\n",
|
||||
"experiment = Experiment(ws, experiment_name)\n",
|
||||
"experiment"
|
||||
],
|
||||
"outputs": [],
|
||||
"metadata": {}
|
||||
},
|
||||
{
|
||||
"cell_type": "markdown",
|
||||
"source": [
|
||||
"## ಕಂಪ್ಯೂಟ್ ಕ್ಲಸ್ಟರ್ ರಚಿಸಿ\n",
|
||||
"ನೀವು ನಿಮ್ಮ AutoML ರನ್ಗಾಗಿ [ಕಂಪ್ಯೂಟ್ ಗುರಿ](https://docs.microsoft.com/azure/machine-learning/concept-azure-machine-learning-architecture#compute-target) ರಚಿಸಬೇಕಾಗುತ್ತದೆ.\n"
|
||||
],
|
||||
"metadata": {}
|
||||
},
|
||||
{
|
||||
"cell_type": "code",
|
||||
"execution_count": null,
|
||||
"source": [
|
||||
"aml_name = \"heart-f-cluster\"\n",
|
||||
"try:\n",
|
||||
" aml_compute = AmlCompute(ws, aml_name)\n",
|
||||
" print('Found existing AML compute context.')\n",
|
||||
"except:\n",
|
||||
" print('Creating new AML compute context.')\n",
|
||||
" aml_config = AmlCompute.provisioning_configuration(vm_size = \"Standard_D2_v2\", min_nodes=1, max_nodes=3)\n",
|
||||
" aml_compute = AmlCompute.create(ws, name = aml_name, provisioning_configuration = aml_config)\n",
|
||||
" aml_compute.wait_for_completion(show_output = True)\n",
|
||||
"\n",
|
||||
"cts = ws.compute_targets\n",
|
||||
"compute_target = cts[aml_name]"
|
||||
],
|
||||
"outputs": [],
|
||||
"metadata": {}
|
||||
},
|
||||
{
|
||||
"cell_type": "markdown",
|
||||
"source": [
|
||||
"## ಡೇಟಾ\n",
|
||||
"ನೀವು ಡೇಟಾಸೆಟ್ ಅನ್ನು Azure ML ಗೆ ಅಪ್ಲೋಡ್ ಮಾಡಿರುವುದನ್ನು ಖಚಿತಪಡಿಸಿಕೊಳ್ಳಿ ಮತ್ತು ಕೀ ಡೇಟಾಸೆಟ್ನ ಅದೇ ಹೆಸರಾಗಿರಬೇಕು.\n"
|
||||
],
|
||||
"metadata": {}
|
||||
},
|
||||
{
|
||||
"cell_type": "code",
|
||||
"execution_count": null,
|
||||
"source": [
|
||||
"key = 'heart-failure-records'\n",
|
||||
"dataset = ws.datasets[key]\n",
|
||||
"df = dataset.to_pandas_dataframe()\n",
|
||||
"df.describe()"
|
||||
],
|
||||
"outputs": [],
|
||||
"metadata": {}
|
||||
},
|
||||
{
|
||||
"cell_type": "markdown",
|
||||
"source": [
|
||||
"## AutoML ಸಂರಚನೆ\n"
|
||||
],
|
||||
"metadata": {}
|
||||
},
|
||||
{
|
||||
"cell_type": "code",
|
||||
"execution_count": null,
|
||||
"source": [
|
||||
"automl_settings = {\n",
|
||||
" \"experiment_timeout_minutes\": 20,\n",
|
||||
" \"max_concurrent_iterations\": 3,\n",
|
||||
" \"primary_metric\" : 'AUC_weighted'\n",
|
||||
"}\n",
|
||||
"\n",
|
||||
"automl_config = AutoMLConfig(compute_target=compute_target,\n",
|
||||
" task = \"classification\",\n",
|
||||
" training_data=dataset,\n",
|
||||
" label_column_name=\"DEATH_EVENT\",\n",
|
||||
" enable_early_stopping= True,\n",
|
||||
" featurization= 'auto',\n",
|
||||
" debug_log = \"automl_errors.log\",\n",
|
||||
" **automl_settings\n",
|
||||
" )"
|
||||
],
|
||||
"outputs": [],
|
||||
"metadata": {}
|
||||
},
|
||||
{
|
||||
"cell_type": "markdown",
|
||||
"source": [
|
||||
"## AutoML ರನ್\n"
|
||||
],
|
||||
"metadata": {}
|
||||
},
|
||||
{
|
||||
"cell_type": "code",
|
||||
"execution_count": null,
|
||||
"source": [
|
||||
"remote_run = experiment.submit(automl_config)"
|
||||
],
|
||||
"outputs": [],
|
||||
"metadata": {}
|
||||
},
|
||||
{
|
||||
"cell_type": "code",
|
||||
"execution_count": null,
|
||||
"source": [
|
||||
"RunDetails(remote_run).show()"
|
||||
],
|
||||
"outputs": [],
|
||||
"metadata": {}
|
||||
},
|
||||
{
|
||||
"cell_type": "markdown",
|
||||
"source": [
|
||||
"## ಅತ್ಯುತ್ತಮ ಮಾದರಿಯನ್ನು ಉಳಿಸಿ\n"
|
||||
],
|
||||
"metadata": {}
|
||||
},
|
||||
{
|
||||
"cell_type": "code",
|
||||
"execution_count": null,
|
||||
"source": [
|
||||
"best_run, fitted_model = remote_run.get_output()"
|
||||
],
|
||||
"outputs": [],
|
||||
"metadata": {}
|
||||
},
|
||||
{
|
||||
"cell_type": "code",
|
||||
"execution_count": null,
|
||||
"source": [
|
||||
"best_run.get_properties()"
|
||||
],
|
||||
"outputs": [],
|
||||
"metadata": {}
|
||||
},
|
||||
{
|
||||
"cell_type": "code",
|
||||
"execution_count": null,
|
||||
"source": [
|
||||
"model_name = best_run.properties['model_name']\n",
|
||||
"script_file_name = 'inference/score.py'\n",
|
||||
"best_run.download_file('outputs/scoring_file_v_1_0_0.py', 'inference/score.py')\n",
|
||||
"description = \"aml heart failure project sdk\"\n",
|
||||
"model = best_run.register_model(model_name = model_name,\n",
|
||||
" description = description,\n",
|
||||
" tags = None)"
|
||||
],
|
||||
"outputs": [],
|
||||
"metadata": {}
|
||||
},
|
||||
{
|
||||
"cell_type": "markdown",
|
||||
"source": [
|
||||
"## ಅತ್ಯುತ್ತಮ ಮಾದರಿಯನ್ನು ನಿಯೋಜಿಸಿ\n",
|
||||
"\n",
|
||||
"ಅತ್ಯುತ್ತಮ ಮಾದರಿಯನ್ನು ನಿಯೋಜಿಸಲು ಕೆಳಗಿನ ಕೋಡ್ ಅನ್ನು ಚಾಲನೆ ಮಾಡಿ. ನಿಯೋಜನೆಯ ಸ್ಥಿತಿಯನ್ನು ನೀವು Azure ML ಪೋರ್ಟಲ್ನಲ್ಲಿ ನೋಡಬಹುದು. ಈ ಹಂತಕ್ಕೆ ಕೆಲವು ನಿಮಿಷಗಳು ಬೇಕಾಗಬಹುದು.\n"
|
||||
],
|
||||
"metadata": {}
|
||||
},
|
||||
{
|
||||
"cell_type": "code",
|
||||
"execution_count": null,
|
||||
"source": [
|
||||
"inference_config = InferenceConfig(entry_script=script_file_name, environment=best_run.get_environment())\n",
|
||||
"\n",
|
||||
"aciconfig = AciWebservice.deploy_configuration(cpu_cores = 1,\n",
|
||||
" memory_gb = 1,\n",
|
||||
" tags = {'type': \"automl-heart-failure-prediction\"},\n",
|
||||
" description = 'Sample service for AutoML Heart Failure Prediction')\n",
|
||||
"\n",
|
||||
"aci_service_name = 'automl-hf-sdk'\n",
|
||||
"aci_service = Model.deploy(ws, aci_service_name, [model], inference_config, aciconfig)\n",
|
||||
"aci_service.wait_for_deployment(True)\n",
|
||||
"print(aci_service.state)"
|
||||
],
|
||||
"outputs": [],
|
||||
"metadata": {}
|
||||
},
|
||||
{
|
||||
"cell_type": "markdown",
|
||||
"source": [
|
||||
"## ಎಂಡ್ಪಾಯಿಂಟ್ ಅನ್ನು ಬಳಸಿ\n",
|
||||
"ನೀವು ಕೆಳಗಿನ ಇನ್ಪುಟ್ ಮಾದರಿಗೆ ಇನ್ಪುಟ್ಗಳನ್ನು ಸೇರಿಸಬಹುದು.\n"
|
||||
],
|
||||
"metadata": {}
|
||||
},
|
||||
{
|
||||
"cell_type": "code",
|
||||
"execution_count": null,
|
||||
"source": [
|
||||
"data = {\n",
|
||||
" \"data\":\n",
|
||||
" [\n",
|
||||
" {\n",
|
||||
" 'age': \"60\",\n",
|
||||
" 'anaemia': \"false\",\n",
|
||||
" 'creatinine_phosphokinase': \"500\",\n",
|
||||
" 'diabetes': \"false\",\n",
|
||||
" 'ejection_fraction': \"38\",\n",
|
||||
" 'high_blood_pressure': \"false\",\n",
|
||||
" 'platelets': \"260000\",\n",
|
||||
" 'serum_creatinine': \"1.40\",\n",
|
||||
" 'serum_sodium': \"137\",\n",
|
||||
" 'sex': \"false\",\n",
|
||||
" 'smoking': \"false\",\n",
|
||||
" 'time': \"130\",\n",
|
||||
" },\n",
|
||||
" ],\n",
|
||||
"}\n",
|
||||
"\n",
|
||||
"test_sample = str.encode(json.dumps(data))"
|
||||
],
|
||||
"outputs": [],
|
||||
"metadata": {}
|
||||
},
|
||||
{
|
||||
"cell_type": "code",
|
||||
"execution_count": null,
|
||||
"source": [
|
||||
"response = aci_service.run(input_data=test_sample)\n",
|
||||
"response"
|
||||
],
|
||||
"outputs": [],
|
||||
"metadata": {}
|
||||
},
|
||||
{
|
||||
"cell_type": "markdown",
|
||||
"metadata": {},
|
||||
"source": [
|
||||
"---\n\n<!-- CO-OP TRANSLATOR DISCLAIMER START -->\n**ಅಸ್ವೀಕಾರ**: \nಈ ದಸ್ತಾವೇಜು AI ಅನುವಾದ ಸೇವೆ [Co-op Translator](https://github.com/Azure/co-op-translator) ಬಳಸಿ ಅನುವಾದಿಸಲಾಗಿದೆ. ನಾವು ನಿಖರತೆಯಿಗಾಗಿ ಪ್ರಯತ್ನಿಸುತ್ತಿದ್ದರೂ, ಸ್ವಯಂಚಾಲಿತ ಅನುವಾದಗಳಲ್ಲಿ ದೋಷಗಳು ಅಥವಾ ಅಸತ್ಯತೆಗಳು ಇರಬಹುದು ಎಂದು ದಯವಿಟ್ಟು ಗಮನಿಸಿ. ಮೂಲ ಭಾಷೆಯಲ್ಲಿರುವ ಮೂಲ ದಸ್ತಾವೇಜನ್ನು ಅಧಿಕೃತ ಮೂಲವೆಂದು ಪರಿಗಣಿಸಬೇಕು. ಮಹತ್ವದ ಮಾಹಿತಿಗಾಗಿ ವೃತ್ತಿಪರ ಮಾನವ ಅನುವಾದವನ್ನು ಶಿಫಾರಸು ಮಾಡಲಾಗುತ್ತದೆ. ಈ ಅನುವಾದ ಬಳಕೆಯಿಂದ ಉಂಟಾಗುವ ಯಾವುದೇ ತಪ್ಪು ಅರ್ಥಮಾಡಿಕೊಳ್ಳುವಿಕೆ ಅಥವಾ ತಪ್ಪು ವಿವರಣೆಗಳಿಗೆ ನಾವು ಹೊಣೆಗಾರರಾಗುವುದಿಲ್ಲ.\n<!-- CO-OP TRANSLATOR DISCLAIMER END -->\n"
|
||||
]
|
||||
}
|
||||
],
|
||||
"metadata": {
|
||||
"orig_nbformat": 4,
|
||||
"language_info": {
|
||||
"name": "python"
|
||||
},
|
||||
"coopTranslator": {
|
||||
"original_hash": "af42669556d5dc19fc4cc3866f7d2597",
|
||||
"translation_date": "2025-12-19T17:10:35+00:00",
|
||||
"source_file": "5-Data-Science-In-Cloud/19-Azure/notebook.ipynb",
|
||||
"language_code": "kn"
|
||||
}
|
||||
},
|
||||
"nbformat": 4,
|
||||
"nbformat_minor": 2
|
||||
}
|
||||
@ -0,0 +1,36 @@
|
||||
<!--
|
||||
CO_OP_TRANSLATOR_METADATA:
|
||||
{
|
||||
"original_hash": "8dfe141a0f46f7d253e07f74913c7f44",
|
||||
"translation_date": "2025-12-19T13:23:55+00:00",
|
||||
"source_file": "5-Data-Science-In-Cloud/README.md",
|
||||
"language_code": "kn"
|
||||
}
|
||||
-->
|
||||
# ಕ್ಲೌಡ್ನಲ್ಲಿ ಡೇಟಾ ಸೈನ್ಸ್
|
||||
|
||||

|
||||
|
||||
> ಫೋಟೋ [Jelleke Vanooteghem](https://unsplash.com/@ilumire) ಅವರಿಂದ [Unsplash](https://unsplash.com/s/photos/cloud?orientation=landscape)
|
||||
|
||||
ಬೃಹತ್ ಡೇಟಾ ಜೊತೆಗೆ ಡೇಟಾ ಸೈನ್ಸ್ ಮಾಡುವಾಗ, ಕ್ಲೌಡ್ ಒಂದು ಆಟ ಬದಲಿಸುವುದಾಗಿ ಇರಬಹುದು. ಮುಂದಿನ ಮೂರು ಪಾಠಗಳಲ್ಲಿ, ನಾವು ಕ್ಲೌಡ್ ಎಂದರೇನು ಮತ್ತು ಅದು ಏಕೆ ಬಹಳ ಸಹಾಯಕವಾಗಬಹುದು ಎಂಬುದನ್ನು ನೋಡಲಿದ್ದೇವೆ. ನಾವು ಹೃದಯ ವೈಫಲ್ಯ ಡೇಟಾಸೆಟ್ ಅನ್ನು ಅನ್ವೇಷಿಸಿ, ಯಾರಿಗಾದರೂ ಹೃದಯ ವೈಫಲ್ಯ ಇರುವ ಸಾಧ್ಯತೆಯನ್ನು ಅಂದಾಜಿಸಲು ಸಹಾಯ ಮಾಡುವ ಮಾದರಿಯನ್ನು ನಿರ್ಮಿಸಲಿದ್ದೇವೆ. ನಾವು ಮಾದರಿಯನ್ನು ತರಬೇತಿ, ನಿಯೋಜನೆ ಮತ್ತು ಬಳಕೆ ಮಾಡಲು ಕ್ಲೌಡ್ ಶಕ್ತಿಯನ್ನು ಎರಡು ವಿಭಿನ್ನ ರೀತಿಗಳಲ್ಲಿ ಬಳಸಲಿದ್ದೇವೆ. ಒಂದು ಮಾರ್ಗವು ಕೇವಲ ಬಳಕೆದಾರ ಇಂಟರ್ಫೇಸ್ ಅನ್ನು ಬಳಸಿಕೊಂಡು ಲೋ ಕೋಡ್/ನೋ ಕೋಡ್ ಶೈಲಿಯಲ್ಲಿ, ಮತ್ತೊಂದು ಮಾರ್ಗವು ಅಜೂರ್ ಮೆಷಿನ್ ಲರ್ನಿಂಗ್ ಸಾಫ್ಟ್ವೇರ್ ಡೆವಲಪರ್ ಕಿಟ್ (Azure ML SDK) ಬಳಸಿ.
|
||||
|
||||

|
||||
|
||||
### ವಿಷಯಗಳು
|
||||
|
||||
1. [ಡೇಟಾ ಸೈನ್ಸ್ಗೆ ಕ್ಲೌಡ್ ಅನ್ನು ಏಕೆ ಬಳಸಬೇಕು?](17-Introduction/README.md)
|
||||
2. [ಕ್ಲೌಡ್ನಲ್ಲಿ ಡೇಟಾ ಸೈನ್ಸ್: "ಲೋ ಕೋಡ್/ನೋ ಕೋಡ್" ಮಾರ್ಗ](18-Low-Code/README.md)
|
||||
3. [ಕ್ಲೌಡ್ನಲ್ಲಿ ಡೇಟಾ ಸೈನ್ಸ್: "ಅಜೂರ್ ML SDK" ಮಾರ್ಗ](19-Azure/README.md)
|
||||
|
||||
### ಕ್ರೆಡಿಟ್ಸ್
|
||||
ಈ ಪಾಠಗಳನ್ನು ☁️ ಮತ್ತು 💕 ಸಹಿತ [Maud Levy](https://twitter.com/maudstweets) ಮತ್ತು [Tiffany Souterre](https://twitter.com/TiffanySouterre) ರವರು ಬರೆಯಲಾಗಿದೆ
|
||||
|
||||
ಹೃದಯ ವೈಫಲ್ಯ ಭವಿಷ್ಯವಾಣಿ ಯೋಜನೆಗೆ ಡೇಟಾ [Larxel](https://www.kaggle.com/andrewmvd) ಅವರಿಂದ [Kaggle](https://www.kaggle.com/andrewmvd/heart-failure-clinical-data) ನಲ್ಲಿ ದೊರಕಿದೆ. ಇದು [Attribution 4.0 International (CC BY 4.0)](https://creativecommons.org/licenses/by/4.0/) ಅಡಿಯಲ್ಲಿ ಪರವಾನಗಿಯಾಗಿದೆ.
|
||||
|
||||
---
|
||||
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
|
||||
**ಅಸ್ವೀಕರಣ**:
|
||||
ಈ ದಸ್ತಾವೇಜು [Co-op Translator](https://github.com/Azure/co-op-translator) ಎಂಬ AI ಅನುವಾದ ಸೇವೆಯನ್ನು ಬಳಸಿ ಅನುವಾದಿಸಲಾಗಿದೆ. ನಾವು ಶುದ್ಧತೆಯತ್ತ ಪ್ರಯತ್ನಿಸುತ್ತಿದ್ದರೂ, ಸ್ವಯಂಚಾಲಿತ ಅನುವಾದಗಳಲ್ಲಿ ತಪ್ಪುಗಳು ಅಥವಾ ಅಸತ್ಯತೆಗಳು ಇರಬಹುದು ಎಂದು ದಯವಿಟ್ಟು ಗಮನಿಸಿ. ಮೂಲ ಭಾಷೆಯಲ್ಲಿರುವ ಮೂಲ ದಸ್ತಾವೇಜನ್ನು ಅಧಿಕೃತ ಮೂಲವೆಂದು ಪರಿಗಣಿಸಬೇಕು. ಮಹತ್ವದ ಮಾಹಿತಿಗಾಗಿ, ವೃತ್ತಿಪರ ಮಾನವ ಅನುವಾದವನ್ನು ಶಿಫಾರಸು ಮಾಡಲಾಗುತ್ತದೆ. ಈ ಅನುವಾದ ಬಳಕೆಯಿಂದ ಉಂಟಾಗುವ ಯಾವುದೇ ತಪ್ಪು ಅರ್ಥಮಾಡಿಕೊಳ್ಳುವಿಕೆ ಅಥವಾ ತಪ್ಪು ವಿವರಣೆಗಳಿಗೆ ನಾವು ಹೊಣೆಗಾರರಾಗುವುದಿಲ್ಲ.
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER END -->
|
||||
@ -0,0 +1,27 @@
|
||||
<!--
|
||||
CO_OP_TRANSLATOR_METADATA:
|
||||
{
|
||||
"original_hash": "07faf02ff163e609edf0b0308dc5d4e6",
|
||||
"translation_date": "2025-12-19T13:36:52+00:00",
|
||||
"source_file": "6-Data-Science-In-Wild/README.md",
|
||||
"language_code": "kn"
|
||||
}
|
||||
-->
|
||||
# ಕಾಡಿನಲ್ಲಿ ಡೇಟಾ ಸೈನ್ಸ್
|
||||
|
||||
ವ್ಯವಸ್ಥೆಗಳಾದ್ಯಂತ ಡೇಟಾ ಸೈನ್ಸ್ನ ನೈಜ ಜಗತ್ತಿನ ಅನ್ವಯಿಕೆಗಳು.
|
||||
|
||||
### ವಿಷಯಗಳು
|
||||
|
||||
1. [ನೈಜ ಜಗತ್ತಿನಲ್ಲಿ ಡೇಟಾ ಸೈನ್ಸ್](20-Real-World-Examples/README.md)
|
||||
|
||||
### ಕ್ರೆಡಿಟ್ಸ್
|
||||
|
||||
❤️ ಸಹಿತ ಬರೆಯಲಾಗಿದೆ [ನಿತ್ಯ ನಾರಸಿಂಹನ್](https://twitter.com/nitya)
|
||||
|
||||
---
|
||||
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
|
||||
**ಅಸ್ವೀಕರಣ**:
|
||||
ಈ ದಸ್ತಾವೇಜು [Co-op Translator](https://github.com/Azure/co-op-translator) ಎಂಬ AI ಅನುವಾದ ಸೇವೆಯನ್ನು ಬಳಸಿ ಅನುವಾದಿಸಲಾಗಿದೆ. ನಾವು ಶುದ್ಧತೆಯತ್ತ ಪ್ರಯತ್ನಿಸುತ್ತಿದ್ದರೂ, ಸ್ವಯಂಚಾಲಿತ ಅನುವಾದಗಳಲ್ಲಿ ತಪ್ಪುಗಳು ಅಥವಾ ಅಸತ್ಯತೆಗಳು ಇರಬಹುದು ಎಂಬುದನ್ನು ದಯವಿಟ್ಟು ಗಮನಿಸಿ. ಮೂಲ ಭಾಷೆಯಲ್ಲಿರುವ ಮೂಲ ದಸ್ತಾವೇಜನ್ನು ಅಧಿಕೃತ ಮೂಲವೆಂದು ಪರಿಗಣಿಸಬೇಕು. ಪ್ರಮುಖ ಮಾಹಿತಿಗಾಗಿ, ವೃತ್ತಿಪರ ಮಾನವ ಅನುವಾದವನ್ನು ಶಿಫಾರಸು ಮಾಡಲಾಗುತ್ತದೆ. ಈ ಅನುವಾದ ಬಳಕೆಯಿಂದ ಉಂಟಾಗುವ ಯಾವುದೇ ತಪ್ಪು ಅರ್ಥಮಾಡಿಕೊಳ್ಳುವಿಕೆ ಅಥವಾ ತಪ್ಪು ವಿವರಣೆಗಳಿಗೆ ನಾವು ಹೊಣೆಗಾರರಾಗುವುದಿಲ್ಲ.
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER END -->
|
||||
@ -0,0 +1,374 @@
|
||||
<!--
|
||||
CO_OP_TRANSLATOR_METADATA:
|
||||
{
|
||||
"original_hash": "cc2e18ab65df63e75d3619c4752e9b22",
|
||||
"translation_date": "2025-12-19T13:07:24+00:00",
|
||||
"source_file": "AGENTS.md",
|
||||
"language_code": "kn"
|
||||
}
|
||||
-->
|
||||
# AGENTS.md
|
||||
|
||||
## ಪ್ರಾಜೆಕ್ಟ್ ಅವಲೋಕನ
|
||||
|
||||
ಡೇಟಾ ಸೈನ್ಸ್ ಫಾರ್ ಬಿಗಿನರ್ಸ್ ಎಂಬುದು ಮೈಕ್ರೋಸಾಫ್ಟ್ ಅಜೂರ್ ಕ್ಲೌಡ್ ಅಡ್ವೊಕೇಟ್ಸ್ ರಚಿಸಿದ ಸಮಗ್ರ 10-ವಾರ, 20-ಪಾಠಗಳ ಪಠ್ಯಕ್ರಮವಾಗಿದೆ. ಈ ರೆಪೊಸಿಟರಿ ಪ್ರಾಜೆಕ್ಟ್ ಆಧಾರಿತ ಪಾಠಗಳ ಮೂಲಕ ಮೂಲಭೂತ ಡೇಟಾ ಸೈನ್ಸ್ ತತ್ವಗಳನ್ನು ಕಲಿಸುವ ಕಲಿಕಾ ಸಂಪನ್ಮೂಲವಾಗಿದೆ, ಇದರಲ್ಲಿ ಜುಪೈಟರ್ ನೋಟ್ಬುಕ್ಗಳು, ಇಂಟರಾಕ್ಟಿವ್ ಕ್ವಿಜ್ಗಳು ಮತ್ತು ಹ್ಯಾಂಡ್ಸ್-ಆನ್ ಅಸೈನ್ಮೆಂಟ್ಗಳು ಸೇರಿವೆ.
|
||||
|
||||
**ಪ್ರಮುಖ ತಂತ್ರಜ್ಞಾನಗಳು:**
|
||||
- **ಜುಪೈಟರ್ ನೋಟ್ಬುಕ್ಗಳು**: ಪೈಥಾನ್ 3 ಬಳಸಿ ಪ್ರಾಥಮಿಕ ಕಲಿಕಾ ಮಾಧ್ಯಮ
|
||||
- **ಪೈಥಾನ್ ಲೈಬ್ರರಿಗಳು**: pandas, numpy, matplotlib ಡೇಟಾ ವಿಶ್ಲೇಷಣೆ ಮತ್ತು ದೃಶ್ಯೀಕರಣಕ್ಕಾಗಿ
|
||||
- **Vue.js 2**: ಕ್ವಿಜ್ ಅಪ್ಲಿಕೇಶನ್ (quiz-app ಫೋಲ್ಡರ್)
|
||||
- **Docsify**: ಆಫ್ಲೈನ್ ಪ್ರವೇಶಕ್ಕಾಗಿ ಡಾಕ್ಯುಮೆಂಟೇಶನ್ ಸೈಟ್ ಜನರೇಟರ್
|
||||
- **Node.js/npm**: ಜಾವಾಸ್ಕ್ರಿಪ್ಟ್ ಘಟಕಗಳ ಪ್ಯಾಕೇಜ್ ನಿರ್ವಹಣೆ
|
||||
- **Markdown**: ಎಲ್ಲಾ ಪಾಠ ವಿಷಯ ಮತ್ತು ಡಾಕ್ಯುಮೆಂಟೇಶನ್
|
||||
|
||||
**ವಾಸ್ತುಶಿಲ್ಪ:**
|
||||
- ವ್ಯಾಪಕ ಅನುವಾದಗಳೊಂದಿಗೆ ಬಹುಭಾಷಾ ಶೈಕ್ಷಣಿಕ ರೆಪೊಸಿಟರಿ
|
||||
- ಪಾಠ ಮಾಯಾಜಾಲಗಳಾಗಿ ರಚಿಸಲಾಗಿದೆ (1-ಪರಿಚಯದಿಂದ 6-ಡೇಟಾ-ಸೈನ್ಸ್-ಇನ್-ವೈಲ್ಡ್)
|
||||
- ಪ್ರತಿ ಪಾಠದಲ್ಲಿ README, ನೋಟ್ಬುಕ್ಗಳು, ಅಸೈನ್ಮೆಂಟ್ಗಳು ಮತ್ತು ಕ್ವಿಜ್ಗಳು ಸೇರಿವೆ
|
||||
- ಪೂರ್ವ/ಪೋಸ್ಟ್ ಪಾಠ ಮೌಲ್ಯಮಾಪನಕ್ಕಾಗಿ ಸ್ವತಂತ್ರ Vue.js ಕ್ವಿಜ್ ಅಪ್ಲಿಕೇಶನ್
|
||||
- GitHub Codespaces ಮತ್ತು VS Code ಡೆವ್ ಕಂಟೈನರ್ಗಳಿಗೆ ಬೆಂಬಲ
|
||||
|
||||
## ಸೆಟಪ್ ಕಮಾಂಡ್ಗಳು
|
||||
|
||||
### ರೆಪೊಸಿಟರಿ ಸೆಟಪ್
|
||||
```bash
|
||||
# ರೆಪೊಸಿಟರಿಯನ್ನು ಕ್ಲೋನ್ ಮಾಡಿ (ಇನ್ನೂ ಕ್ಲೋನ್ ಮಾಡದಿದ್ದರೆ)
|
||||
git clone https://github.com/microsoft/Data-Science-For-Beginners.git
|
||||
cd Data-Science-For-Beginners
|
||||
```
|
||||
|
||||
### ಪೈಥಾನ್ ಪರಿಸರ ಸೆಟಪ್
|
||||
```bash
|
||||
# ವರ್ಚುವಲ್ ಪರಿಸರವನ್ನು ರಚಿಸಿ (ಶಿಫಾರಸು ಮಾಡಲಾಗಿದೆ)
|
||||
python -m venv venv
|
||||
source venv/bin/activate # ವಿಂಡೋಸ್ನಲ್ಲಿ: venv\Scripts\activate
|
||||
|
||||
# ಸಾಮಾನ್ಯ ಡೇಟಾ ಸೈನ್ಸ್ ಲೈಬ್ರರಿಗಳನ್ನು ಸ್ಥಾಪಿಸಿ (requirements.txt ಇಲ್ಲ)
|
||||
pip install jupyter pandas numpy matplotlib seaborn scikit-learn
|
||||
```
|
||||
|
||||
### ಕ್ವಿಜ್ ಅಪ್ಲಿಕೇಶನ್ ಸೆಟಪ್
|
||||
```bash
|
||||
# ಕ್ವಿಜ್ ಅಪ್ಲಿಕೇಶನ್ಗೆ ನಾವಿಗೇಟ್ ಮಾಡಿ
|
||||
cd quiz-app
|
||||
|
||||
# ಅವಲಂಬನೆಗಳನ್ನು ಸ್ಥಾಪಿಸಿ
|
||||
npm install
|
||||
|
||||
# ಅಭಿವೃದ್ಧಿ ಸರ್ವರ್ ಪ್ರಾರಂಭಿಸಿ
|
||||
npm run serve
|
||||
|
||||
# ಉತ್ಪಾದನೆಗಾಗಿ ನಿರ್ಮಿಸಿ
|
||||
npm run build
|
||||
|
||||
# ಲಿಂಟ್ ಮಾಡಿ ಮತ್ತು ಫೈಲ್ಗಳನ್ನು ಸರಿಪಡಿಸಿ
|
||||
npm run lint
|
||||
```
|
||||
|
||||
### Docsify ಡಾಕ್ಯುಮೆಂಟೇಶನ್ ಸರ್ವರ್
|
||||
```bash
|
||||
# ಡಾಕ್ಸಿಫೈ ಅನ್ನು ಜಾಗತಿಕವಾಗಿ ಸ್ಥಾಪಿಸಿ
|
||||
npm install -g docsify-cli
|
||||
|
||||
# ಡಾಕ್ಯುಮೆಂಟೇಶನ್ ಅನ್ನು ಸ್ಥಳೀಯವಾಗಿ ಸೇವೆ ಮಾಡಿ
|
||||
docsify serve
|
||||
|
||||
# ಡಾಕ್ಯುಮೆಂಟೇಶನ್ localhost:3000 ನಲ್ಲಿ ಲಭ್ಯವಿರುತ್ತದೆ
|
||||
```
|
||||
|
||||
### ದೃಶ್ಯೀಕರಣ ಪ್ರಾಜೆಕ್ಟ್ಗಳ ಸೆಟಪ್
|
||||
meaningful-visualizations (ಪಾಠ 13) ಮುಂತಾದ ದೃಶ್ಯೀಕರಣ ಪ್ರಾಜೆಕ್ಟ್ಗಳಿಗೆ:
|
||||
```bash
|
||||
# ಸ್ಟಾರ್ಟರ್ ಅಥವಾ ಸೊಲ್ಯೂಶನ್ ಫೋಲ್ಡರ್ಗೆ ನ್ಯಾವಿಗೇಟ್ ಮಾಡಿ
|
||||
cd 3-Data-Visualization/13-meaningful-visualizations/starter
|
||||
|
||||
# ಅವಲಂಬನೆಗಳನ್ನು ಸ್ಥಾಪಿಸಿ
|
||||
npm install
|
||||
|
||||
# ಡೆವಲಪ್ಮೆಂಟ್ ಸರ್ವರ್ ಪ್ರಾರಂಭಿಸಿ
|
||||
npm run serve
|
||||
|
||||
# ಉತ್ಪಾದನೆಗಾಗಿ ನಿರ್ಮಿಸಿ
|
||||
npm run build
|
||||
|
||||
# ಫೈಲ್ಗಳನ್ನು ಲಿಂಟ್ ಮಾಡಿ
|
||||
npm run lint
|
||||
```
|
||||
|
||||
## ಅಭಿವೃದ್ಧಿ ಕಾರ್ಯಪ್ರವಾಹ
|
||||
|
||||
### ಜುಪೈಟರ್ ನೋಟ್ಬುಕ್ಗಳೊಂದಿಗೆ ಕೆಲಸ
|
||||
1. ರೆಪೊಸಿಟರಿ ರೂಟ್ನಲ್ಲಿ ಜುಪೈಟರ್ ಪ್ರಾರಂಭಿಸಿ: `jupyter notebook`
|
||||
2. ಬೇಕಾದ ಪಾಠ ಫೋಲ್ಡರ್ಗೆ ನ್ಯಾವಿಗೇಟ್ ಮಾಡಿ
|
||||
3. ವ್ಯಾಯಾಮಗಳನ್ನು ಮಾಡಲು `.ipynb` ಫೈಲ್ಗಳನ್ನು ತೆರೆಯಿರಿ
|
||||
4. ನೋಟ್ಬುಕ್ಗಳು ಸ್ವಯಂ-ಸಂಯೋಜಿತವಾಗಿದ್ದು ವಿವರಣೆಗಳು ಮತ್ತು ಕೋಡ್ ಸೆಲ್ಗಳನ್ನು ಒಳಗೊಂಡಿವೆ
|
||||
5. ಹೆಚ್ಚಿನ ನೋಟ್ಬುಕ್ಗಳು pandas, numpy ಮತ್ತು matplotlib ಬಳಸುತ್ತವೆ - ಇವುಗಳನ್ನು ಸ್ಥಾಪಿಸಿಕೊಳ್ಳಿ
|
||||
|
||||
### ಪಾಠ ರಚನೆ
|
||||
ಪ್ರತಿ ಪಾಠ ಸಾಮಾನ್ಯವಾಗಿ ಹೊಂದಿರುವುದು:
|
||||
- `README.md` - ಸಿದ್ಧಾಂತ ಮತ್ತು ಉದಾಹರಣೆಗಳೊಂದಿಗೆ ಮುಖ್ಯ ಪಾಠ ವಿಷಯ
|
||||
- `notebook.ipynb` - ಹ್ಯಾಂಡ್ಸ್-ಆನ್ ಜುಪೈಟರ್ ನೋಟ್ಬುಕ್ ವ್ಯಾಯಾಮಗಳು
|
||||
- `assignment.ipynb` ಅಥವಾ `assignment.md` - ಅಭ್ಯಾಸ ಅಸೈನ್ಮೆಂಟ್ಗಳು
|
||||
- `solution/` ಫೋಲ್ಡರ್ - ಪರಿಹಾರ ನೋಟ್ಬುಕ್ಗಳು ಮತ್ತು ಕೋಡ್
|
||||
- `images/` ಫೋಲ್ಡರ್ - ಬೆಂಬಲ ದೃಶ್ಯ ಸಾಮಗ್ರಿಗಳು
|
||||
|
||||
### ಕ್ವಿಜ್ ಅಪ್ಲಿಕೇಶನ್ ಅಭಿವೃದ್ಧಿ
|
||||
- ಅಭಿವೃದ್ಧಿ ಸಮಯದಲ್ಲಿ ಹಾಟ್-ರಿಲೋಡ್ ಹೊಂದಿರುವ Vue.js 2 ಅಪ್ಲಿಕೇಶನ್
|
||||
- ಕ್ವಿಜ್ಗಳು `quiz-app/src/assets/translations/` ನಲ್ಲಿ ಸಂಗ್ರಹಿಸಲಾಗಿದೆ
|
||||
- ಪ್ರತಿ ಭಾಷೆಗೆ ತನ್ನದೇ ಆದ ಅನುವಾದ ಫೋಲ್ಡರ್ ಇದೆ (en, fr, es, ಇತ್ಯಾದಿ)
|
||||
- ಕ್ವಿಜ್ ಸಂಖ್ಯೆ 0 ರಿಂದ ಪ್ರಾರಂಭವಾಗಿ 39 ರವರೆಗೆ (ಒಟ್ಟು 40 ಕ್ವಿಜ್ಗಳು)
|
||||
|
||||
### ಅನುವಾದಗಳನ್ನು ಸೇರಿಸುವುದು
|
||||
- ಅನುವಾದಗಳು ರೆಪೊಸಿಟರಿ ರೂಟ್ನ `translations/` ಫೋಲ್ಡರ್ನಲ್ಲಿ ಇರುತ್ತವೆ
|
||||
- ಪ್ರತಿ ಭಾಷೆಗೆ ಇಂಗ್ಲಿಷ್ನಿಂದ ಪೂರ್ಣ ಪಾಠ ರಚನೆ ಪ್ರತಿಬಿಂಬಿತವಾಗಿದೆ
|
||||
- GitHub Actions ಮೂಲಕ ಸ್ವಯಂಚಾಲಿತ ಅನುವಾದ (co-op-translator.yml)
|
||||
|
||||
## ಪರೀಕ್ಷಾ ಸೂಚನೆಗಳು
|
||||
|
||||
### ಕ್ವಿಜ್ ಅಪ್ಲಿಕೇಶನ್ ಪರೀಕ್ಷೆ
|
||||
```bash
|
||||
cd quiz-app
|
||||
|
||||
# ಲಿಂಟ್ ಪರಿಶೀಲನೆಗಳನ್ನು ನಡೆಸಿ
|
||||
npm run lint
|
||||
|
||||
# ನಿರ್ಮಾಣ ಪ್ರಕ್ರಿಯೆಯನ್ನು ಪರೀಕ್ಷಿಸಿ
|
||||
npm run build
|
||||
|
||||
# ಕೈಯಿಂದ ಪರೀಕ್ಷೆ: ಡೆವ್ ಸರ್ವರ್ ಪ್ರಾರಂಭಿಸಿ ಮತ್ತು ಕ್ವಿಜ್ ಕಾರ್ಯಕ್ಷಮತೆಯನ್ನು ಪರಿಶೀಲಿಸಿ
|
||||
npm run serve
|
||||
```
|
||||
|
||||
### ನೋಟ್ಬುಕ್ ಪರೀಕ್ಷೆ
|
||||
- ನೋಟ್ಬುಕ್ಗಳಿಗೆ ಸ್ವಯಂಚಾಲಿತ ಪರೀಕ್ಷಾ ಫ್ರೇಮ್ವರ್ಕ್ ಇಲ್ಲ
|
||||
- ಕೈಯಿಂದ ಪರಿಶೀಲನೆ: ಎಲ್ಲಾ ಸೆಲ್ಗಳನ್ನು ಕ್ರಮವಾಗಿ ಓಡಿಸಿ ದೋಷಗಳಿಲ್ಲದಿರುವುದನ್ನು ಖಚಿತಪಡಿಸಿಕೊಳ್ಳಿ
|
||||
- ಡೇಟಾ ಫೈಲ್ಗಳು ಲಭ್ಯವಿರುವುದನ್ನು ಮತ್ತು ಔಟ್ಪುಟ್ಗಳು ಸರಿಯಾಗಿ ಉತ್ಪಾದಿತವಾಗಿರುವುದನ್ನು ಪರಿಶೀಲಿಸಿ
|
||||
- ದೃಶ್ಯೀಕರಣಗಳು ಸರಿಯಾಗಿ ರೆಂಡರ್ ಆಗುತ್ತಿವೆಯೇ ಎಂದು ಪರಿಶೀಲಿಸಿ
|
||||
|
||||
### ಡಾಕ್ಯುಮೆಂಟೇಶನ್ ಪರೀಕ್ಷೆ
|
||||
```bash
|
||||
# ಡಾಕ್ಸಿಫೈ ಸರಿಯಾಗಿ ರೆಂಡರ್ ಆಗುತ್ತದೆಯೇ ಎಂದು ಪರಿಶೀಲಿಸಿ
|
||||
docsify serve
|
||||
|
||||
# ವಿಷಯವನ್ನು ನಾವಿಗೇಟ್ ಮಾಡಿ ಮುರಿದ ಲಿಂಕ್ಗಳನ್ನು ಕೈಯಿಂದ ಪರಿಶೀಲಿಸಿ
|
||||
# ರೆಂಡರ್ ಮಾಡಿದ ಡಾಕ್ಯುಮೆಂಟೇಶನ್ನಲ್ಲಿ ಎಲ್ಲಾ ಪಾಠ ಲಿಂಕ್ಗಳು ಕಾರ್ಯನಿರ್ವಹಿಸುತ್ತವೆಯೇ ಎಂದು ಪರಿಶೀಲಿಸಿ
|
||||
```
|
||||
|
||||
### ಕೋಡ್ ಗುಣಮಟ್ಟ ಪರಿಶೀಲನೆ
|
||||
```bash
|
||||
# Vue.js ಪ್ರಾಜೆಕ್ಟ್ಗಳು (quiz-app ಮತ್ತು ದೃಶ್ಯೀಕರಣ ಪ್ರಾಜೆಕ್ಟ್ಗಳು)
|
||||
cd quiz-app # ಅಥವಾ ದೃಶ್ಯೀಕರಣ ಪ್ರಾಜೆಕ್ಟ್ ಫೋಲ್ಡರ್
|
||||
npm run lint
|
||||
|
||||
# ಪೈಥಾನ್ ನೋಟ್ಬುಕ್ಗಳು - ಕೈಯಿಂದ ಪರಿಶೀಲನೆ ಶಿಫಾರಸು ಮಾಡಲಾಗಿದೆ
|
||||
# ಆಮದುಗಳು ಸರಿಯಾಗಿ ಕಾರ್ಯನಿರ್ವಹಿಸುತ್ತವೆ ಮತ್ತು ಸೆಲ್ಗಳು ದೋಷರಹಿತವಾಗಿ ಕಾರ್ಯನಿರ್ವಹಿಸುತ್ತವೆ ಎಂದು ಖಚಿತಪಡಿಸಿಕೊಳ್ಳಿ
|
||||
```
|
||||
|
||||
## ಕೋಡ್ ಶೈಲಿ ಮಾರ್ಗಸೂಚಿಗಳು
|
||||
|
||||
### ಪೈಥಾನ್ (ಜುಪೈಟರ್ ನೋಟ್ಬುಕ್ಗಳು)
|
||||
- ಪೈಥಾನ್ ಕೋಡ್ಗೆ PEP 8 ಶೈಲಿ ಮಾರ್ಗಸೂಚಿಗಳನ್ನು ಅನುಸರಿಸಿ
|
||||
- ವಿಶ್ಲೇಷಿಸುತ್ತಿರುವ ಡೇಟಾವನ್ನು ವಿವರಿಸುವ ಸ್ಪಷ್ಟ ವ್ಯತ್ಯಯ ಹೆಸರುಗಳನ್ನು ಬಳಸಿ
|
||||
- ಕೋಡ್ ಸೆಲ್ಗಳ ಮುಂಚೆ ವಿವರಣೆಗಳೊಂದಿಗೆ ಮಾರ್ಕ್ಡೌನ್ ಸೆಲ್ಗಳನ್ನು ಸೇರಿಸಿ
|
||||
- ಕೋಡ್ ಸೆಲ್ಗಳನ್ನು ಏಕಾಂಗಿ ತತ್ವಗಳು ಅಥವಾ ಕಾರ್ಯಾಚರಣೆಗಳ ಮೇಲೆ ಕೇಂದ್ರೀಕರಿಸಿ
|
||||
- ಡೇಟಾ ಸಂಚಲನಕ್ಕೆ pandas, ದೃಶ್ಯೀಕರಣಕ್ಕೆ matplotlib ಬಳಸಿ
|
||||
- ಸಾಮಾನ್ಯ ಆಮದು ಮಾದರಿ:
|
||||
```python
|
||||
import pandas as pd
|
||||
import numpy as np
|
||||
import matplotlib.pyplot as plt
|
||||
```
|
||||
|
||||
### ಜಾವಾಸ್ಕ್ರಿಪ್ಟ್/Vue.js
|
||||
- Vue.js 2 ಶೈಲಿ ಮಾರ್ಗಸೂಚಿ ಮತ್ತು ಉತ್ತಮ ಅಭ್ಯಾಸಗಳನ್ನು ಅನುಸರಿಸಿ
|
||||
- ESLint ಸಂರಚನೆ `quiz-app/package.json` ನಲ್ಲಿ ಇದೆ
|
||||
- Vue ಸಿಂಗಲ್-ಫೈಲ್ ಕಾಂಪೋನಂಟ್ಗಳು (.vue ಫೈಲ್ಗಳು) ಬಳಸಿ
|
||||
- ಕಾಂಪೋನಂಟ್ ಆಧಾರಿತ ವಾಸ್ತುಶಿಲ್ಪವನ್ನು ಕಾಪಾಡಿ
|
||||
- ಬದಲಾವಣೆಗಳನ್ನು ಕಮಿಟ್ ಮಾಡುವ ಮೊದಲು `npm run lint` ಓಡಿಸಿ
|
||||
|
||||
### ಮಾರ್ಕ್ಡೌನ್ ಡಾಕ್ಯುಮೆಂಟೇಶನ್
|
||||
- ಸ್ಪಷ್ಟ ಶೀರ್ಷಿಕೆ ಹೈರಾರ್ಕಿಯನ್ನು ಬಳಸಿ (# ## ### ಇತ್ಯಾದಿ)
|
||||
- ಭಾಷಾ ಸೂಚಕಗಳೊಂದಿಗೆ ಕೋಡ್ ಬ್ಲಾಕ್ಗಳನ್ನು ಸೇರಿಸಿ
|
||||
- ಚಿತ್ರಗಳಿಗೆ alt ಪಠ್ಯವನ್ನು ಸೇರಿಸಿ
|
||||
- ಸಂಬಂಧಿತ ಪಾಠಗಳು ಮತ್ತು ಸಂಪನ್ಮೂಲಗಳಿಗೆ ಲಿಂಕ್ ಮಾಡಿ
|
||||
- ಓದಲು ಸುಲಭವಾಗುವಂತೆ ಸಾಲಿನ ಉದ್ದವನ್ನು ಯುಕ್ತವಾಗಿ ಇಡಿ
|
||||
|
||||
### ಫೈಲ್ ಸಂಘಟನೆ
|
||||
- ಪಾಠ ವಿಷಯ ಸಂಖ್ಯಿತ ಫೋಲ್ಡರ್ಗಳಲ್ಲಿ (01-defining-data-science ಮುಂತಾದವು)
|
||||
- ಪರಿಹಾರಗಳು ಸಮರ್ಪಿತ `solution/` ಉಪಫೋಲ್ಡರ್ಗಳಲ್ಲಿ
|
||||
- ಅನುವಾದಗಳು ಇಂಗ್ಲಿಷ್ ರಚನೆಯನ್ನು ಪ್ರತಿಬಿಂಬಿಸುವ `translations/` ಫೋಲ್ಡರ್ನಲ್ಲಿ
|
||||
- ಡೇಟಾ ಫೈಲ್ಗಳನ್ನು `data/` ಅಥವಾ ಪಾಠ-ನಿರ್ದಿಷ್ಟ ಫೋಲ್ಡರ್ಗಳಲ್ಲಿ ಇಡಿ
|
||||
|
||||
## ನಿರ್ಮಾಣ ಮತ್ತು ನಿಯೋಜನೆ
|
||||
|
||||
### ಕ್ವಿಜ್ ಅಪ್ಲಿಕೇಶನ್ ನಿಯೋಜನೆ
|
||||
```bash
|
||||
cd quiz-app
|
||||
|
||||
# ಉತ್ಪಾದನಾ ಆವೃತ್ತಿಯನ್ನು ನಿರ್ಮಿಸಿ
|
||||
npm run build
|
||||
|
||||
# ಔಟ್ಪುಟ್ dist/ ಫೋಲ್ಡರ್ನಲ್ಲಿ ಇದೆ
|
||||
# dist/ ಫೋಲ್ಡರ್ ಅನ್ನು ಸ್ಥಿರ ಹೋಸ್ಟಿಂಗ್ಗೆ ನಿಯೋಜಿಸಿ (Azure Static Web Apps, Netlify, ಇತ್ಯಾದಿ)
|
||||
```
|
||||
|
||||
### ಅಜೂರ್ ಸ್ಟ್ಯಾಟಿಕ್ ವೆಬ್ ಅಪ್ಲಿಕೇಶನ್ ನಿಯೋಜನೆ
|
||||
quiz-app ಅನ್ನು ಅಜೂರ್ ಸ್ಟ್ಯಾಟಿಕ್ ವೆಬ್ ಅಪ್ಲಿಕೇಶನ್ಗಳಿಗೆ ನಿಯೋಜಿಸಬಹುದು:
|
||||
1. ಅಜೂರ್ ಸ್ಟ್ಯಾಟಿಕ್ ವೆಬ್ ಅಪ್ಲಿಕೇಶನ್ ಸಂಪನ್ಮೂಲವನ್ನು ರಚಿಸಿ
|
||||
2. GitHub ರೆಪೊಸಿಟರಿಯನ್ನು ಸಂಪರ್ಕಿಸಿ
|
||||
3. ನಿರ್ಮಾಣ ಸೆಟ್ಟಿಂಗ್ಗಳನ್ನು ಸಂರಚಿಸಿ:
|
||||
- ಅಪ್ಲಿಕೇಶನ್ ಸ್ಥಳ: `quiz-app`
|
||||
- ಔಟ್ಪುಟ್ ಸ್ಥಳ: `dist`
|
||||
4. GitHub Actions ಕಾರ್ಯಪ್ರವಾಹವು ಪುಷ್ ಮಾಡಿದಾಗ ಸ್ವಯಂಚಾಲಿತವಾಗಿ ನಿಯೋಜಿಸುತ್ತದೆ
|
||||
|
||||
### ಡಾಕ್ಯುಮೆಂಟೇಶನ್ ಸೈಟ್
|
||||
```bash
|
||||
# ಡಾಕ್ಸಿಫಿಯಿಂದ PDF ನಿರ್ಮಿಸಿ (ಐಚ್ಛಿಕ)
|
||||
npm run convert
|
||||
|
||||
# ಡಾಕ್ಸಿಫಿ ಡಾಕ್ಯುಮೆಂಟೇಶನ್ ನೇರವಾಗಿ ಮಾರ್ಕ್ಡೌನ್ ಫೈಲ್ಗಳಿಂದ ಸೇವೆ ಮಾಡಲಾಗುತ್ತದೆ
|
||||
# ನಿಯೋಜನೆಗಾಗಿ ಯಾವುದೇ ನಿರ್ಮಾಣ ಹಂತ ಅಗತ್ಯವಿಲ್ಲ
|
||||
# ಡಾಕ್ಸಿಫಿ ಬಳಸಿ ರೆಪೊಸಿಟರಿಯನ್ನು ಸ್ಥಿರ ಹೋಸ್ಟಿಂಗ್ಗೆ ನಿಯೋಜಿಸಿ
|
||||
```
|
||||
|
||||
### GitHub Codespaces
|
||||
- ರೆಪೊಸಿಟರಿಯಲ್ಲಿ ಡೆವ್ ಕಂಟೈನರ್ ಸಂರಚನೆ ಸೇರಿದೆ
|
||||
- Codespaces ಸ್ವಯಂಚಾಲಿತವಾಗಿ ಪೈಥಾನ್ ಮತ್ತು Node.js ಪರಿಸರವನ್ನು ಸೆಟ್ ಮಾಡುತ್ತದೆ
|
||||
- GitHub UI ಮೂಲಕ Codespace ನಲ್ಲಿ ರೆಪೊಸಿಟರಿ ತೆರೆಯಿರಿ
|
||||
- ಎಲ್ಲಾ ಅವಲಂಬನೆಗಳು ಸ್ವಯಂಚಾಲಿತವಾಗಿ ಸ್ಥಾಪಿತವಾಗುತ್ತವೆ
|
||||
|
||||
## ಪುಲ್ ರಿಕ್ವೆಸ್ಟ್ ಮಾರ್ಗಸೂಚಿಗಳು
|
||||
|
||||
### ಸಲ್ಲಿಸುವ ಮೊದಲು
|
||||
```bash
|
||||
# quiz-app ನಲ್ಲಿ Vue.js ಬದಲಾವಣೆಗಳಿಗೆ
|
||||
cd quiz-app
|
||||
npm run lint
|
||||
npm run build
|
||||
|
||||
# ಬದಲಾವಣೆಗಳನ್ನು ಸ್ಥಳೀಯವಾಗಿ ಪರೀಕ್ಷಿಸಿ
|
||||
npm run serve
|
||||
```
|
||||
|
||||
### PR ಶೀರ್ಷಿಕೆ ಸ್ವರೂಪ
|
||||
- ಸ್ಪಷ್ಟ, ವಿವರಣಾತ್ಮಕ ಶೀರ್ಷಿಕೆಗಳನ್ನು ಬಳಸಿ
|
||||
- ಸ್ವರೂಪ: `[Component] ಸಂಕ್ಷಿಪ್ತ ವಿವರಣೆ`
|
||||
- ಉದಾಹರಣೆಗಳು:
|
||||
- `[Lesson 7] ಪೈಥಾನ್ ನೋಟ್ಬುಕ್ ಆಮದು ದೋಷವನ್ನು ಸರಿಪಡಿಸಿ`
|
||||
- `[Quiz App] ಜರ್ಮನ್ ಅನುವಾದವನ್ನು ಸೇರಿಸಿ`
|
||||
- `[Docs] README ನ್ನು ಹೊಸ ಪೂರ್ವಾಪೇಕ್ಷೆಗಳೊಂದಿಗೆ ನವೀಕರಿಸಿ`
|
||||
|
||||
### ಅಗತ್ಯ ಪರಿಶೀಲನೆಗಳು
|
||||
- ಎಲ್ಲಾ ಕೋಡ್ ದೋಷರಹಿತವಾಗಿ ಓಡುತ್ತದೆಯೇ ಎಂದು ಖಚಿತಪಡಿಸಿಕೊಳ್ಳಿ
|
||||
- ನೋಟ್ಬುಕ್ಗಳು ಸಂಪೂರ್ಣವಾಗಿ ಕಾರ್ಯನಿರ್ವಹಿಸುತ್ತವೆಯೇ ಎಂದು ಪರಿಶೀಲಿಸಿ
|
||||
- Vue.js ಅಪ್ಲಿಕೇಶನ್ಗಳು ಯಶಸ್ವಿಯಾಗಿ ನಿರ್ಮಿತವಾಗುತ್ತವೆಯೇ ಎಂದು ದೃಢೀಕರಿಸಿ
|
||||
- ಡಾಕ್ಯುಮೆಂಟೇಶನ್ ಲಿಂಕ್ಗಳು ಕಾರ್ಯನಿರ್ವಹಿಸುತ್ತವೆಯೇ ಎಂದು ಪರಿಶೀಲಿಸಿ
|
||||
- ಬದಲಾವಣೆ ಮಾಡಿದರೆ ಕ್ವಿಜ್ ಅಪ್ಲಿಕೇಶನ್ ಪರೀಕ್ಷಿಸಿ
|
||||
- ಅನುವಾದಗಳು ಸुसಂಗತ ರಚನೆಯನ್ನು ಕಾಪಾಡುತ್ತವೆಯೇ ಎಂದು ಖಚಿತಪಡಿಸಿಕೊಳ್ಳಿ
|
||||
|
||||
### ಕೊಡುಗೆ ಮಾರ್ಗಸೂಚಿಗಳು
|
||||
- ಇತ್ತೀಚಿನ ಕೋಡ್ ಶೈಲಿ ಮತ್ತು ಮಾದರಿಗಳನ್ನು ಅನುಸರಿಸಿ
|
||||
- ಸಂಕೀರ್ಣ ತರ್ಕಕ್ಕೆ ವಿವರಣಾತ್ಮಕ ಕಾಮೆಂಟ್ಗಳನ್ನು ಸೇರಿಸಿ
|
||||
- ಸಂಬಂಧಿತ ಡಾಕ್ಯುಮೆಂಟೇಶನ್ ನವೀಕರಿಸಿ
|
||||
- ಅನ್ವಯಿಸಿದರೆ ವಿಭಿನ್ನ ಪಾಠ ಮಾಯಾಜಾಲಗಳಲ್ಲಿ ಬದಲಾವಣೆಗಳನ್ನು ಪರೀಕ್ಷಿಸಿ
|
||||
- CONTRIBUTING.md ಫೈಲ್ ಪರಿಶೀಲಿಸಿ
|
||||
|
||||
## ಹೆಚ್ಚುವರಿ ಟಿಪ್ಪಣಿಗಳು
|
||||
|
||||
### ಸಾಮಾನ್ಯವಾಗಿ ಬಳಸುವ ಲೈಬ್ರರಿಗಳು
|
||||
- **pandas**: ಡೇಟಾ ಸಂಚಲನ ಮತ್ತು ವಿಶ್ಲೇಷಣೆ
|
||||
- **numpy**: ಸಂಖ್ಯಾತ್ಮಕ ಗಣನೆ
|
||||
- **matplotlib**: ಡೇಟಾ ದೃಶ್ಯೀಕರಣ ಮತ್ತು ಪ್ಲಾಟಿಂಗ್
|
||||
- **seaborn**: ಸಾಂಖ್ಯಿಕ ಡೇಟಾ ದೃಶ್ಯೀಕರಣ (ಕೆಲವು ಪಾಠಗಳು)
|
||||
- **scikit-learn**: ಯಂತ್ರ ಅಧ್ಯಯನ (ಅಧಿಕೃತ ಪಾಠಗಳು)
|
||||
|
||||
### ಡೇಟಾ ಫೈಲ್ಗಳೊಂದಿಗೆ ಕೆಲಸ
|
||||
- ಡೇಟಾ ಫೈಲ್ಗಳು `data/` ಫೋಲ್ಡರ್ ಅಥವಾ ಪಾಠ-ನಿರ್ದಿಷ್ಟ ಡೈರೆಕ್ಟರಿಗಳಲ್ಲಿ ಇರುತ್ತವೆ
|
||||
- ಹೆಚ್ಚಿನ ನೋಟ್ಬುಕ್ಗಳು ಸಂಬಂಧಿತ ಮಾರ್ಗಗಳಲ್ಲಿ ಡೇಟಾ ಫೈಲ್ಗಳನ್ನು ನಿರೀಕ್ಷಿಸುತ್ತವೆ
|
||||
- CSV ಫೈಲ್ಗಳು ಪ್ರಾಥಮಿಕ ಡೇಟಾ ಸ್ವರೂಪ
|
||||
- ಕೆಲವು ಪಾಠಗಳು JSON ಅನ್ನು ಅಸಂಬಂಧಿತ ಡೇಟಾ ಉದಾಹರಣೆಗಳಿಗೆ ಬಳಸುತ್ತವೆ
|
||||
|
||||
### ಬಹುಭಾಷಾ ಬೆಂಬಲ
|
||||
- 40+ ಭಾಷಾ ಅನುವಾದಗಳು ಸ್ವಯಂಚಾಲಿತ GitHub Actions ಮೂಲಕ
|
||||
- ಅನುವಾದ ಕಾರ್ಯಪ್ರವಾಹ `.github/workflows/co-op-translator.yml` ನಲ್ಲಿ
|
||||
- ಅನುವಾದಗಳು `translations/` ಫೋಲ್ಡರ್ನಲ್ಲಿ ಭಾಷಾ ಕೋಡ್ಗಳೊಂದಿಗೆ
|
||||
- ಕ್ವಿಜ್ ಅನುವಾದಗಳು `quiz-app/src/assets/translations/` ನಲ್ಲಿ
|
||||
|
||||
### ಅಭಿವೃದ್ಧಿ ಪರಿಸರ ಆಯ್ಕೆಗಳು
|
||||
1. **ಸ್ಥಳೀಯ ಅಭಿವೃದ್ಧಿ**: ಪೈಥಾನ್, ಜುಪೈಟರ್, Node.js ಸ್ಥಳೀಯವಾಗಿ ಸ್ಥಾಪಿಸಿ
|
||||
2. **GitHub Codespaces**: ಕ್ಲೌಡ್ ಆಧಾರಿತ ತಕ್ಷಣದ ಅಭಿವೃದ್ಧಿ ಪರಿಸರ
|
||||
3. **VS Code ಡೆವ್ ಕಂಟೈನರ್ಗಳು**: ಸ್ಥಳೀಯ ಕಂಟೈನರ್ ಆಧಾರಿತ ಅಭಿವೃದ್ಧಿ
|
||||
4. **ಬಿಂಡರ್**: ಕ್ಲೌಡ್ನಲ್ಲಿ ನೋಟ್ಬುಕ್ಗಳನ್ನು ಪ್ರಾರಂಭಿಸಿ (ಸೆಟ್ ಮಾಡಿದರೆ)
|
||||
|
||||
### ಪಾಠ ವಿಷಯ ಮಾರ್ಗಸೂಚಿಗಳು
|
||||
- ಪ್ರತಿ ಪಾಠ ಸ್ವತಂತ್ರವಾಗಿದ್ದು ಹಿಂದಿನ ತತ್ವಗಳ ಮೇಲೆ ನಿರ್ಮಿತವಾಗಿದೆ
|
||||
- ಪೂರ್ವ ಪಾಠ ಕ್ವಿಜ್ಗಳು ಹಿಂದಿನ ಜ್ಞಾನವನ್ನು ಪರೀಕ್ಷಿಸುತ್ತವೆ
|
||||
- ಪೋಸ್ಟ್ ಪಾಠ ಕ್ವಿಜ್ಗಳು ಕಲಿಕೆಯನ್ನು ಬಲಪಡಿಸುತ್ತವೆ
|
||||
- ಅಸೈನ್ಮೆಂಟ್ಗಳು ಹ್ಯಾಂಡ್ಸ್-ಆನ್ ಅಭ್ಯಾಸವನ್ನು ಒದಗಿಸುತ್ತವೆ
|
||||
- ಸ್ಕೆಚ್ನೋಟ್ಗಳು ದೃಶ್ಯ ಸಾರಾಂಶಗಳನ್ನು ಒದಗಿಸುತ್ತವೆ
|
||||
|
||||
### ಸಾಮಾನ್ಯ ಸಮಸ್ಯೆಗಳ ಪರಿಹಾರ
|
||||
|
||||
**ಜುಪೈಟರ್ ಕರ್ಣಲ್ ಸಮಸ್ಯೆಗಳು:**
|
||||
```bash
|
||||
# ಸರಿಯಾದ ಕರ್ಣಲ್ ಸ್ಥಾಪಿತವಾಗಿದೆ ಎಂದು ಖಚಿತಪಡಿಸಿಕೊಳ್ಳಿ
|
||||
python -m ipykernel install --user --name=datascience
|
||||
```
|
||||
|
||||
**npm ಸ್ಥಾಪನೆ ವಿಫಲತೆಗಳು:**
|
||||
```bash
|
||||
# npm ಕ್ಯಾಶೆ ತೆರವುಗೊಳಿಸಿ ಮತ್ತು ಮರುಪ್ರಯತ್ನಿಸಿ
|
||||
npm cache clean --force
|
||||
rm -rf node_modules package-lock.json
|
||||
npm install
|
||||
```
|
||||
|
||||
**ನೋಟ್ಬುಕ್ಗಳಲ್ಲಿ ಆಮದು ದೋಷಗಳು:**
|
||||
- ಅಗತ್ಯವಿರುವ ಎಲ್ಲಾ ಲೈಬ್ರರಿಗಳು ಸ್ಥಾಪಿತವಾಗಿವೆ ಎಂದು ಖಚಿತಪಡಿಸಿಕೊಳ್ಳಿ
|
||||
- ಪೈಥಾನ್ ಆವೃತ್ತಿ ಹೊಂದಾಣಿಕೆ ಪರಿಶೀಲಿಸಿ (ಪೈಥಾನ್ 3.7+ ಶಿಫಾರಸು)
|
||||
- ವರ್ಚುವಲ್ ಪರಿಸರ ಸಕ್ರಿಯವಾಗಿದೆ ಎಂದು ಖಚಿತಪಡಿಸಿಕೊಳ್ಳಿ
|
||||
|
||||
**Docsify ಲೋಡ್ ಆಗುತ್ತಿಲ್ಲ:**
|
||||
- ನೀವು ರೆಪೊಸಿಟರಿ ರೂಟ್ನಿಂದ ಸರ್ವ್ ಮಾಡುತ್ತಿದ್ದೀರಾ ಎಂದು ಪರಿಶೀಲಿಸಿ
|
||||
- `index.html` ಇದೆ ಎಂದು ಖಚಿತಪಡಿಸಿಕೊಳ್ಳಿ
|
||||
- ಸರಿಯಾದ ನೆಟ್ವರ್ಕ್ ಪ್ರವೇಶ (ಪೋರ್ಟ್ 3000) ಇದೆ ಎಂದು ಖಚಿತಪಡಿಸಿಕೊಳ್ಳಿ
|
||||
|
||||
### ಕಾರ್ಯಕ್ಷಮತೆ ಪರಿಗಣನೆಗಳು
|
||||
- ದೊಡ್ಡ ಡೇಟಾಸೆಟ್ಗಳು ನೋಟ್ಬುಕ್ಗಳಲ್ಲಿ ಲೋಡ್ ಆಗಲು ಸಮಯ ತೆಗೆದುಕೊಳ್ಳಬಹುದು
|
||||
- ಸಂಕೀರ್ಣ ಪ್ಲಾಟ್ಗಳ ದೃಶ್ಯೀಕರಣ ನಿಧಾನವಾಗಬಹುದು
|
||||
- Vue.js ಡೆವ್ ಸರ್ವರ್ ತ್ವರಿತ ಪುನರಾವೃತ್ತಿಗಾಗಿ ಹಾಟ್-ರಿಲೋಡ್ ಸೌಲಭ್ಯ ನೀಡುತ್ತದೆ
|
||||
- ಉತ್ಪಾದನಾ ನಿರ್ಮಾಣಗಳು ಆಪ್ಟಿಮೈಸ್ ಮತ್ತು ಮಿನಿಫೈ ಮಾಡಲ್ಪಟ್ಟಿವೆ
|
||||
|
||||
### ಭದ್ರತಾ ಟಿಪ್ಪಣಿಗಳು
|
||||
- ಯಾವುದೇ ಸಂವೇದನಾಶೀಲ ಡೇಟಾ ಅಥವಾ ಪ್ರಮಾಣಪತ್ರಗಳನ್ನು ಕಮಿಟ್ ಮಾಡಬಾರದು
|
||||
- ಕ್ಲೌಡ್ ಪಾಠಗಳಲ್ಲಿ ಯಾವುದೇ API ಕೀಗಳಿಗೆ ಪರಿಸರ ಚರಗಳನ್ನು ಬಳಸಿ
|
||||
- ಅಜೂರ್ ಸಂಬಂಧಿತ ಪಾಠಗಳಿಗೆ ಅಜೂರ್ ಖಾತೆ ಪ್ರಮಾಣಪತ್ರಗಳು ಅಗತ್ಯವಿರಬಹುದು
|
||||
- ಭದ್ರತಾ ಪ್ಯಾಚ್ಗಳಿಗೆ ಅವಲಂಬನೆಗಳನ್ನು ನವೀಕರಿಸಿ
|
||||
|
||||
## ಅನುವಾದಗಳಿಗೆ ಕೊಡುಗೆ ನೀಡುವುದು
|
||||
- ಸ್ವಯಂಚಾಲಿತ ಅನುವಾದಗಳನ್ನು GitHub Actions ಮೂಲಕ ನಿರ್ವಹಿಸಲಾಗುತ್ತದೆ
|
||||
- ಅನುವಾದದ ನಿಖರತೆಗಾಗಿ ಕೈಯಿಂದ ತಿದ್ದುಪಡಿ ಸ್ವಾಗತ
|
||||
- ಇತ್ತೀಚಿನ ಅನುವಾದ ಫೋಲ್ಡರ್ ರಚನೆಯನ್ನು ಅನುಸರಿಸಿ
|
||||
- ಕ್ವಿಜ್ ಲಿಂಕ್ಗಳನ್ನು ಭಾಷಾ ಪರಿಮಾಣದೊಂದಿಗೆ ನವೀಕರಿಸಿ: `?loc=fr`
|
||||
- ಸರಿಯಾಗಿ ರೆಂಡರ್ ಆಗುವಂತೆ ಅನುವಾದಿತ ಪಾಠಗಳನ್ನು ಪರೀಕ್ಷಿಸಿ
|
||||
|
||||
## ಸಂಬಂಧಿತ ಸಂಪನ್ಮೂಲಗಳು
|
||||
- ಮುಖ್ಯ ಪಠ್ಯಕ್ರಮ: https://aka.ms/datascience-beginners
|
||||
- ಮೈಕ್ರೋಸಾಫ್ಟ್ ಲರ್ನ್: https://docs.microsoft.com/learn/
|
||||
- ವಿದ್ಯಾರ್ಥಿ ಹಬ್: https://docs.microsoft.com/learn/student-hub
|
||||
- ಚರ್ಚಾ ವೇದಿಕೆ: https://github.com/microsoft/Data-Science-For-Beginners/discussions
|
||||
- ಇತರ ಮೈಕ್ರೋಸಾಫ್ಟ್ ಪಠ್ಯಕ್ರಮಗಳು: ML for Beginners, AI for Beginners, Web Dev for Beginners
|
||||
|
||||
## ಪ್ರಾಜೆಕ್ಟ್ ನಿರ್ವಹಣೆ
|
||||
- ವಿಷಯವನ್ನು ನವೀನಗೊಳಿಸಲು ನಿಯಮಿತ ನವೀಕರಣಗಳು
|
||||
- ಸಮುದಾಯ ಕೊಡುಗೆಗಳಿಗೆ ಸ್ವಾಗತ
|
||||
- ಸಮಸ್ಯೆಗಳು GitHub ನಲ್ಲಿ ಟ್ರ್ಯಾಕ್ ಮಾಡಲಾಗುತ್ತವೆ
|
||||
- ಪಿಆರ್ಗಳನ್ನು ಪಠ್ಯಕ್ರಮ ನಿರ್ವಹಕರು ಪರಿಶೀಲಿಸುತ್ತಾರೆ
|
||||
- ಮಾಸಿಕ ವಿಷಯ ವಿಮರ್ಶೆಗಳು ಮತ್ತು ನವೀಕರಣಗಳು
|
||||
|
||||
---
|
||||
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
|
||||
**ಅಸ್ವೀಕರಣ**:
|
||||
ಈ ದಸ್ತಾವೇಜು AI ಅನುವಾದ ಸೇವೆ [Co-op Translator](https://github.com/Azure/co-op-translator) ಬಳಸಿ ಅನುವಾದಿಸಲಾಗಿದೆ. ನಾವು ನಿಖರತೆಯಿಗಾಗಿ ಪ್ರಯತ್ನಿಸುತ್ತಿದ್ದರೂ, ಸ್ವಯಂಚಾಲಿತ ಅನುವಾದಗಳಲ್ಲಿ ದೋಷಗಳು ಅಥವಾ ಅಸತ್ಯತೆಗಳು ಇರಬಹುದು ಎಂದು ದಯವಿಟ್ಟು ಗಮನಿಸಿ. ಮೂಲ ಭಾಷೆಯಲ್ಲಿರುವ ಮೂಲ ದಸ್ತಾವೇಜನ್ನು ಅಧಿಕೃತ ಮೂಲವಾಗಿ ಪರಿಗಣಿಸಬೇಕು. ಮಹತ್ವದ ಮಾಹಿತಿಗಾಗಿ, ವೃತ್ತಿಪರ ಮಾನವ ಅನುವಾದವನ್ನು ಶಿಫಾರಸು ಮಾಡಲಾಗುತ್ತದೆ. ಈ ಅನುವಾದ ಬಳಕೆಯಿಂದ ಉಂಟಾಗುವ ಯಾವುದೇ ತಪ್ಪು ಅರ್ಥಮಾಡಿಕೊಳ್ಳುವಿಕೆ ಅಥವಾ ತಪ್ಪು ವಿವರಣೆಗಳಿಗೆ ನಾವು ಹೊಣೆಗಾರರಾಗುವುದಿಲ್ಲ.
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER END -->
|
||||
@ -0,0 +1,25 @@
|
||||
<!--
|
||||
CO_OP_TRANSLATOR_METADATA:
|
||||
{
|
||||
"original_hash": "c06b12caf3c901eb3156e3dd5b0aea56",
|
||||
"translation_date": "2025-12-19T13:09:19+00:00",
|
||||
"source_file": "CODE_OF_CONDUCT.md",
|
||||
"language_code": "kn"
|
||||
}
|
||||
-->
|
||||
# ಮೈಕ್ರೋಸಾಫ್ಟ್ ಓಪನ್ ಸೋರ್ಸ್ ಕೋಡ್ ಆಫ್ ಕಂಡಕ್ಟ್
|
||||
|
||||
ಈ ಯೋಜನೆ [ಮೈಕ್ರೋಸಾಫ್ಟ್ ಓಪನ್ ಸೋರ್ಸ್ ಕೋಡ್ ಆಫ್ ಕಂಡಕ್ಟ್](https://opensource.microsoft.com/codeofconduct/) ಅನ್ನು ಅಂಗೀಕರಿಸಿದೆ.
|
||||
|
||||
ಸಂಪನ್ಮೂಲಗಳು:
|
||||
|
||||
- [ಮೈಕ್ರೋಸಾಫ್ಟ್ ಓಪನ್ ಸೋರ್ಸ್ ಕೋಡ್ ಆಫ್ ಕಂಡಕ್ಟ್](https://opensource.microsoft.com/codeofconduct/)
|
||||
- [ಮೈಕ್ರೋಸಾಫ್ಟ್ ಕೋಡ್ ಆಫ್ ಕಂಡಕ್ಟ್ FAQ](https://opensource.microsoft.com/codeofconduct/faq/)
|
||||
- ಪ್ರಶ್ನೆಗಳು ಅಥವಾ ಚಿಂತೆಗಳಿಗಾಗಿ [opencode@microsoft.com](mailto:opencode@microsoft.com) ಸಂಪರ್ಕಿಸಿ
|
||||
|
||||
---
|
||||
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
|
||||
**ಅಸ್ವೀಕರಣ**:
|
||||
ಈ ದಸ್ತಾವೇಜು [Co-op Translator](https://github.com/Azure/co-op-translator) ಎಂಬ AI ಅನುವಾದ ಸೇವೆಯನ್ನು ಬಳಸಿ ಅನುವಾದಿಸಲಾಗಿದೆ. ನಾವು ಶುದ್ಧತೆಯತ್ತ ಪ್ರಯತ್ನಿಸುತ್ತಿದ್ದರೂ, ಸ್ವಯಂಚಾಲಿತ ಅನುವಾದಗಳಲ್ಲಿ ತಪ್ಪುಗಳು ಅಥವಾ ಅಸತ್ಯತೆಗಳು ಇರಬಹುದು ಎಂದು ದಯವಿಟ್ಟು ಗಮನಿಸಿ. ಮೂಲ ಭಾಷೆಯಲ್ಲಿರುವ ಮೂಲ ದಸ್ತಾವೇಜನ್ನು ಅಧಿಕೃತ ಮೂಲವೆಂದು ಪರಿಗಣಿಸಬೇಕು. ಮಹತ್ವದ ಮಾಹಿತಿಗಾಗಿ, ವೃತ್ತಿಪರ ಮಾನವ ಅನುವಾದವನ್ನು ಶಿಫಾರಸು ಮಾಡಲಾಗುತ್ತದೆ. ಈ ಅನುವಾದ ಬಳಕೆಯಿಂದ ಉಂಟಾಗುವ ಯಾವುದೇ ತಪ್ಪು ಅರ್ಥಮಾಡಿಕೊಳ್ಳುವಿಕೆ ಅಥವಾ ತಪ್ಪು ವಿವರಣೆಗಳಿಗೆ ನಾವು ಹೊಣೆಗಾರರಾಗುವುದಿಲ್ಲ.
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER END -->
|
||||
@ -0,0 +1,368 @@
|
||||
<!--
|
||||
CO_OP_TRANSLATOR_METADATA:
|
||||
{
|
||||
"original_hash": "10f86fb29b5407088445ac803b3d0ed1",
|
||||
"translation_date": "2025-12-19T12:50:17+00:00",
|
||||
"source_file": "CONTRIBUTING.md",
|
||||
"language_code": "kn"
|
||||
}
|
||||
-->
|
||||
# ಆರಂಭಿಕರಿಗಾಗಿ ಡೇಟಾ ಸೈನ್ಸ್ಗೆ ಕೊಡುಗೆ ನೀಡುವುದು
|
||||
|
||||
ಡೇಟಾ ಸೈನ್ಸ್ ಫಾರ್ ಬಿಗಿನರ್ಸ್ ಪಠ್ಯಕ್ರಮಕ್ಕೆ ಕೊಡುಗೆ ನೀಡಲು ನಿಮ್ಮ ಆಸಕ್ತಿಗೆ ಧನ್ಯವಾದಗಳು! ನಾವು ಸಮುದಾಯದಿಂದ ಕೊಡುಗೆಗಳನ್ನು ಸ್ವಾಗತಿಸುತ್ತೇವೆ.
|
||||
|
||||
## ವಿಷಯಗಳ ಪಟ್ಟಿಕೆ
|
||||
|
||||
- [ನಡವಳಿಕೆ ಸಂಹಿತೆ](../..)
|
||||
- [ನಾನು ಹೇಗೆ ಕೊಡುಗೆ ನೀಡಬಹುದು?](../..)
|
||||
- [ಪ್ರಾರಂಭಿಸುವುದು](../..)
|
||||
- [ಕೊಡುಗೆ ಮಾರ್ಗಸೂಚಿಗಳು](../..)
|
||||
- [ಪುಲ್ ರಿಕ್ವೆಸ್ಟ್ ಪ್ರಕ್ರಿಯೆ](../..)
|
||||
- [ಶೈಲಿ ಮಾರ್ಗಸೂಚಿಗಳು](../..)
|
||||
- [ಕೊಡುಗೆದಾರ ಪರವಾನಗಿ ಒಪ್ಪಂದ](../..)
|
||||
|
||||
## ನಡವಳಿಕೆ ಸಂಹಿತೆ
|
||||
|
||||
ಈ ಯೋಜನೆ [Microsoft Open Source Code of Conduct](https://opensource.microsoft.com/codeofconduct/) ಅನ್ನು ಅಳವಡಿಸಿಕೊಂಡಿದೆ.
|
||||
ಹೆಚ್ಚಿನ ಮಾಹಿತಿಗಾಗಿ [ನಡವಳಿಕೆ ಸಂಹಿತೆ FAQ](https://opensource.microsoft.com/codeofconduct/faq/) ನೋಡಿ
|
||||
ಅಥವಾ ಯಾವುದೇ ಹೆಚ್ಚುವರಿ ಪ್ರಶ್ನೆಗಳು ಅಥವಾ ಟಿಪ್ಪಣಿಗಳಿಗಾಗಿ [opencode@microsoft.com](mailto:opencode@microsoft.com) ಸಂಪರ್ಕಿಸಿ.
|
||||
|
||||
## ನಾನು ಹೇಗೆ ಕೊಡುಗೆ ನೀಡಬಹುದು?
|
||||
|
||||
### ದೋಷಗಳನ್ನು ವರದಿ ಮಾಡುವುದು
|
||||
|
||||
ದೋಷ ವರದಿಗಳನ್ನು ರಚಿಸುವ ಮೊದಲು, ನಕಲಿ ವರದಿಗಳನ್ನು ತಪ್ಪಿಸಲು ಇತ್ತೀಚಿನ ಸಮಸ್ಯೆಗಳನ್ನು ಪರಿಶೀಲಿಸಿ. ನೀವು ದೋಷ ವರದಿ ರಚಿಸುವಾಗ, ಸಾಧ್ಯವಾದಷ್ಟು ವಿವರಗಳನ್ನು ಸೇರಿಸಿ:
|
||||
|
||||
- **ಸ್ಪಷ್ಟ ಮತ್ತು ವಿವರಣಾತ್ಮಕ ಶೀರ್ಷಿಕೆ ಬಳಸಿ**
|
||||
- **ಸಮಸ್ಯೆಯನ್ನು ಪುನರಾವರ್ತಿಸಲು ನಿಖರವಾದ ಹಂತಗಳನ್ನು ವಿವರಿಸಿ**
|
||||
- **ನಿರ್ದಿಷ್ಟ ಉದಾಹರಣೆಗಳನ್ನು ಒದಗಿಸಿ** (ಕೋಡ್ ತುಣುಕುಗಳು, ಸ್ಕ್ರೀನ್ಶಾಟ್ಗಳು)
|
||||
- **ನೀವು ಕಂಡ ವರ್ತನೆ ಮತ್ತು ನಿರೀಕ್ಷಿತ ವರ್ತನೆಯನ್ನು ವಿವರಿಸಿ**
|
||||
- **ನಿಮ್ಮ ಪರಿಸರ ವಿವರಗಳನ್ನು ಸೇರಿಸಿ** (OS, Python ಆವೃತ್ತಿ, ಬ್ರೌಸರ್)
|
||||
|
||||
### ಸುಧಾರಣೆಗಳನ್ನು ಸೂಚಿಸುವುದು
|
||||
|
||||
ಸುಧಾರಣೆ ಸಲಹೆಗಳು ಸ್ವಾಗತಾರ್ಹ! ಸುಧಾರಣೆಗಳನ್ನು ಸೂಚಿಸುವಾಗ:
|
||||
|
||||
- **ಸ್ಪಷ್ಟ ಮತ್ತು ವಿವರಣಾತ್ಮಕ ಶೀರ್ಷಿಕೆ ಬಳಸಿ**
|
||||
- **ಸುಧಾರಣೆಯ ವಿವರವಾದ ವಿವರಣೆಯನ್ನು ಒದಗಿಸಿ**
|
||||
- **ಈ ಸುಧಾರಣೆ ಯಾಕೆ ಉಪಯುಕ್ತವಾಗುತ್ತದೆ ಎಂದು ವಿವರಿಸಿ**
|
||||
- **ಇತರ ಯೋಜನೆಗಳಲ್ಲಿ ಇರುವ ಸಮಾನ ವೈಶಿಷ್ಟ್ಯಗಳನ್ನು ಪಟ್ಟಿ ಮಾಡಿ, ಅನ್ವಯಿಸಿದರೆ**
|
||||
|
||||
### ಡಾಕ್ಯುಮೆಂಟೇಶನ್ಗೆ ಕೊಡುಗೆ ನೀಡುವುದು
|
||||
|
||||
ಡಾಕ್ಯುಮೆಂಟೇಶನ್ ಸುಧಾರಣೆಗಳನ್ನು ಯಾವಾಗಲೂ ಮೆಚ್ಚಲಾಗುತ್ತದೆ:
|
||||
|
||||
- **ಟೈಪೋಗಳು ಮತ್ತು ವ್ಯಾಕರಣ ದೋಷಗಳನ್ನು ಸರಿಪಡಿಸಿ**
|
||||
- **ವಿವರಣೆಗಳ ಸ್ಪಷ್ಟತೆಯನ್ನು ಸುಧಾರಿಸಿ**
|
||||
- **ಕಾಣದಿರುವ ಡಾಕ್ಯುಮೆಂಟೇಶನ್ ಸೇರಿಸಿ**
|
||||
- **ಹಳೆಯ ಮಾಹಿತಿಯನ್ನು ನವೀಕರಿಸಿ**
|
||||
- **ಉದಾಹರಣೆಗಳು ಅಥವಾ ಬಳಕೆ ಪ್ರಕರಣಗಳನ್ನು ಸೇರಿಸಿ**
|
||||
|
||||
### ಕೋಡ್ಗೆ ಕೊಡುಗೆ ನೀಡುವುದು
|
||||
|
||||
ನಾವು ಕೆಳಗಿನ ಕೋಡ್ ಕೊಡುಗೆಗಳನ್ನು ಸ್ವಾಗತಿಸುತ್ತೇವೆ:
|
||||
|
||||
- **ಹೊಸ ಪಾಠಗಳು ಅಥವಾ ವ್ಯಾಯಾಮಗಳು**
|
||||
- **ದೋಷ ಸರಿಪಡಿಸುವಿಕೆಗಳು**
|
||||
- **ಇದೀಗಿರುವ ನೋಟ್ಬುಕ್ಗಳ ಸುಧಾರಣೆಗಳು**
|
||||
- **ಹೊಸ ಡೇಟಾಸೆಟ್ಗಳು ಅಥವಾ ಉದಾಹರಣೆಗಳು**
|
||||
- **ಕ್ವಿಜ್ ಅಪ್ಲಿಕೇಶನ್ ಸುಧಾರಣೆಗಳು**
|
||||
|
||||
## ಪ್ರಾರಂಭಿಸುವುದು
|
||||
|
||||
### ಪೂರ್ವಾಪೇಕ್ಷಿತಗಳು
|
||||
|
||||
ಕೊಡುಗೆ ನೀಡುವ ಮೊದಲು, ನೀವು ಹೊಂದಿರಬೇಕು:
|
||||
|
||||
1. GitHub ಖಾತೆ
|
||||
2. ನಿಮ್ಮ ವ್ಯವಸ್ಥೆಯಲ್ಲಿ Git ಸ್ಥಾಪನೆ
|
||||
3. Python 3.7+ ಮತ್ತು Jupyter ಸ್ಥಾಪನೆ
|
||||
4. Node.js ಮತ್ತು npm (ಕ್ವಿಜ್ ಅಪ್ಲಿಕೇಶನ್ ಕೊಡುಗೆಗಳಿಗೆ)
|
||||
5. ಪಠ್ಯಕ್ರಮ ರಚನೆಗೆ ಪರಿಚಯ
|
||||
|
||||
ವಿಸ್ತೃತ ಸ್ಥಾಪನೆ ಸೂಚನೆಗಳಿಗಾಗಿ [INSTALLATION.md](INSTALLATION.md) ನೋಡಿ.
|
||||
|
||||
### ಫೋರ್ಕ್ ಮತ್ತು ಕ್ಲೋನ್
|
||||
|
||||
1. GitHub ನಲ್ಲಿ **ರಿಪೊಸಿಟರಿಯನ್ನು ಫೋರ್ಕ್ ಮಾಡಿ**
|
||||
2. **ನಿಮ್ಮ ಫೋರ್ಕ್ ಅನ್ನು ಸ್ಥಳೀಯವಾಗಿ ಕ್ಲೋನ್ ಮಾಡಿ**:
|
||||
```bash
|
||||
git clone https://github.com/YOUR-USERNAME/Data-Science-For-Beginners.git
|
||||
cd Data-Science-For-Beginners
|
||||
```
|
||||
3. **ಅಪ್ಸ್ಟ್ರೀಮ್ ರಿಮೋಟ್ ಸೇರಿಸಿ**:
|
||||
```bash
|
||||
git remote add upstream https://github.com/microsoft/Data-Science-For-Beginners.git
|
||||
```
|
||||
|
||||
### ಶಾಖೆಯನ್ನು ರಚಿಸಿ
|
||||
|
||||
ನಿಮ್ಮ ಕೆಲಸಕ್ಕೆ ಹೊಸ ಶಾಖೆಯನ್ನು ರಚಿಸಿ:
|
||||
|
||||
```bash
|
||||
git checkout -b feature/your-feature-name
|
||||
# ಅಥವಾ
|
||||
git checkout -b fix/your-bug-fix
|
||||
```
|
||||
|
||||
ಶಾಖೆ ಹೆಸರು ನಿಯಮಗಳು:
|
||||
- `feature/` - ಹೊಸ ವೈಶಿಷ್ಟ್ಯಗಳು ಅಥವಾ ಪಾಠಗಳು
|
||||
- `fix/` - ದೋಷ ಸರಿಪಡಿಸುವಿಕೆಗಳು
|
||||
- `docs/` - ಡಾಕ್ಯುಮೆಂಟೇಶನ್ ಬದಲಾವಣೆಗಳು
|
||||
- `refactor/` - ಕೋಡ್ ಪುನರ್ರಚನೆ
|
||||
|
||||
## ಕೊಡುಗೆ ಮಾರ್ಗಸೂಚಿಗಳು
|
||||
|
||||
### ಪಾಠ ವಿಷಯಕ್ಕಾಗಿ
|
||||
|
||||
ಪಾಠಗಳನ್ನು ಕೊಡುಗೆ ನೀಡುವಾಗ ಅಥವಾ ಇತ್ತೀಚಿನ ಪಾಠಗಳನ್ನು ಬದಲಾಯಿಸುವಾಗ:
|
||||
|
||||
1. **ಇದೀಗಿರುವ ರಚನೆಯನ್ನು ಅನುಸರಿಸಿ**:
|
||||
- README.md ನಲ್ಲಿ ಪಾಠ ವಿಷಯ
|
||||
- ವ್ಯಾಯಾಮಗಳೊಂದಿಗೆ Jupyter ನೋಟ್ಬುಕ್
|
||||
- ನಿಯೋಜನೆ (ಅನ್ವಯಿಸಿದರೆ)
|
||||
- ಪೂರ್ವ ಮತ್ತು ನಂತರದ ಕ್ವಿಜ್ಗಳಿಗೆ ಲಿಂಕ್
|
||||
|
||||
2. **ಈ ಅಂಶಗಳನ್ನು ಸೇರಿಸಿ**:
|
||||
- ಸ್ಪಷ್ಟ ಕಲಿಕೆ ಗುರಿಗಳು
|
||||
- ಹಂತ ಹಂತವಾಗಿ ವಿವರಣೆಗಳು
|
||||
- ಕಾಮೆಂಟ್ಗಳೊಂದಿಗೆ ಕೋಡ್ ಉದಾಹರಣೆಗಳು
|
||||
- ಅಭ್ಯಾಸಕ್ಕಾಗಿ ವ್ಯಾಯಾಮಗಳು
|
||||
- ಹೆಚ್ಚುವರಿ ಸಂಪನ್ಮೂಲಗಳಿಗೆ ಲಿಂಕ್ಗಳು
|
||||
|
||||
3. **ಪ್ರವೇಶಾರ್ಹತೆಯನ್ನು ಖಚಿತಪಡಿಸಿ**:
|
||||
- ಸ್ಪಷ್ಟ, ಸರಳ ಭಾಷೆ ಬಳಸಿ
|
||||
- ಚಿತ್ರಗಳಿಗೆ alt ಪಠ್ಯ ಒದಗಿಸಿ
|
||||
- ಕೋಡ್ ಕಾಮೆಂಟ್ಗಳನ್ನು ಸೇರಿಸಿ
|
||||
- ವಿಭಿನ್ನ ಕಲಿಕೆ ಶೈಲಿಗಳನ್ನು ಪರಿಗಣಿಸಿ
|
||||
|
||||
### Jupyter ನೋಟ್ಬುಕ್ಗಳಿಗೆ
|
||||
|
||||
1. **ಕಮಿಟ್ ಮಾಡುವ ಮೊದಲು ಎಲ್ಲಾ ಔಟ್ಪುಟ್ಗಳನ್ನು ತೆರವುಗೊಳಿಸಿ**:
|
||||
```bash
|
||||
jupyter nbconvert --clear-output --inplace notebook.ipynb
|
||||
```
|
||||
|
||||
2. **ವಿವರಣೆಗಳೊಂದಿಗೆ ಮಾರ್ಕ್ಡೌನ್ ಸೆಲ್ಗಳನ್ನು ಸೇರಿಸಿ**
|
||||
|
||||
3. **ಸಮರಸಿತ ಫಾರ್ಮ್ಯಾಟಿಂಗ್ ಬಳಸಿ**:
|
||||
```python
|
||||
# ಮೇಲ್ಭಾಗದಲ್ಲಿ ಗ್ರಂಥಾಲಯಗಳನ್ನು ಆಮದುಮಾಡಿ
|
||||
import pandas as pd
|
||||
import numpy as np
|
||||
import matplotlib.pyplot as plt
|
||||
|
||||
# ಅರ್ಥಪೂರ್ಣ ಚರ ನಾಮಗಳನ್ನು ಬಳಸಿ
|
||||
# ಸಂಕೀರ್ಣ ಕಾರ್ಯಾಚರಣೆಗಳಿಗೆ ಟಿಪ್ಪಣಿಗಳನ್ನು ಸೇರಿಸಿ
|
||||
# PEP 8 ಶೈಲಿ ಮಾರ್ಗಸೂಚಿಗಳನ್ನು ಅನುಸರಿಸಿ
|
||||
```
|
||||
|
||||
4. **ನಿಮ್ಮ ನೋಟ್ಬುಕ್ ಅನ್ನು ಸಂಪೂರ್ಣವಾಗಿ ಪರೀಕ್ಷಿಸಿ** ಸಲ್ಲಿಸುವ ಮೊದಲು
|
||||
|
||||
### Python ಕೋಡ್ಗೆ
|
||||
|
||||
[PEP 8](https://www.python.org/dev/peps/pep-0008/) ಶೈಲಿ ಮಾರ್ಗಸೂಚಿಗಳನ್ನು ಅನುಸರಿಸಿ:
|
||||
|
||||
```python
|
||||
# ಉತ್ತಮ ಅಭ್ಯಾಸಗಳು
|
||||
import pandas as pd
|
||||
|
||||
def calculate_mean(data):
|
||||
"""Calculate the mean of a dataset.
|
||||
|
||||
Args:
|
||||
data (list): List of numerical values
|
||||
|
||||
Returns:
|
||||
float: Mean of the dataset
|
||||
"""
|
||||
return sum(data) / len(data)
|
||||
```
|
||||
|
||||
### ಕ್ವಿಜ್ ಅಪ್ಲಿಕೇಶನ್ ಕೊಡುಗೆಗಳಿಗೆ
|
||||
|
||||
ಕ್ವಿಜ್ ಅಪ್ಲಿಕೇಶನ್ ಬದಲಾಯಿಸುವಾಗ:
|
||||
|
||||
1. **ಸ್ಥಳೀಯವಾಗಿ ಪರೀಕ್ಷಿಸಿ**:
|
||||
```bash
|
||||
cd quiz-app
|
||||
npm install
|
||||
npm run serve
|
||||
```
|
||||
|
||||
2. **ಲಿಂಟರ್ ಅನ್ನು ಓಡಿಸಿ**:
|
||||
```bash
|
||||
npm run lint
|
||||
```
|
||||
|
||||
3. **ಯಶಸ್ವಿಯಾಗಿ ನಿರ್ಮಿಸಿ**:
|
||||
```bash
|
||||
npm run build
|
||||
```
|
||||
|
||||
4. **Vue.js ಶೈಲಿ ಮಾರ್ಗಸೂಚಿ ಮತ್ತು ಇತ್ತೀಚಿನ ಮಾದರಿಗಳನ್ನು ಅನುಸರಿಸಿ**
|
||||
|
||||
### ಅನುವಾದಗಳಿಗೆ
|
||||
|
||||
ಅನುವಾದಗಳನ್ನು ಸೇರಿಸುವಾಗ ಅಥವಾ ನವೀಕರಿಸುವಾಗ:
|
||||
|
||||
1. `translations/` ಫೋಲ್ಡರ್ ರಚನೆಯನ್ನು ಅನುಸರಿಸಿ
|
||||
2. ಭಾಷಾ ಕೋಡ್ ಅನ್ನು ಫೋಲ್ಡರ್ ಹೆಸರಾಗಿ ಬಳಸಿ (ಉದಾ: ಫ್ರೆಂಚ್ಗೆ `fr`)
|
||||
3. ಇಂಗ್ಲಿಷ್ ಆವೃತ್ತಿಯಂತೆ ಫೈಲ್ ರಚನೆಯನ್ನು ಕಾಯ್ದುಕೊಳ್ಳಿ
|
||||
4. ಕ್ವಿಜ್ ಲಿಂಕ್ಗಳನ್ನು ಭಾಷಾ ಪರಿಮಾಣದೊಂದಿಗೆ ನವೀಕರಿಸಿ: `?loc=fr`
|
||||
5. ಎಲ್ಲಾ ಲಿಂಕ್ಗಳು ಮತ್ತು ಫಾರ್ಮ್ಯಾಟಿಂಗ್ ಅನ್ನು ಪರೀಕ್ಷಿಸಿ
|
||||
|
||||
## ಪುಲ್ ರಿಕ್ವೆಸ್ಟ್ ಪ್ರಕ್ರಿಯೆ
|
||||
|
||||
### ಸಲ್ಲಿಸುವ ಮೊದಲು
|
||||
|
||||
1. **ನಿಮ್ಮ ಶಾಖೆಯನ್ನು ಇತ್ತೀಚಿನ ಬದಲಾವಣೆಗಳೊಂದಿಗೆ ನವೀಕರಿಸಿ**:
|
||||
```bash
|
||||
git fetch upstream
|
||||
git rebase upstream/main
|
||||
```
|
||||
|
||||
2. **ನಿಮ್ಮ ಬದಲಾವಣೆಗಳನ್ನು ಪರೀಕ್ಷಿಸಿ**:
|
||||
- ಎಲ್ಲಾ ಬದಲಾಯಿಸಿದ ನೋಟ್ಬುಕ್ಗಳನ್ನು ಓಡಿಸಿ
|
||||
- ಬದಲಾಯಿಸಿದರೆ ಕ್ವಿಜ್ ಅಪ್ಲಿಕೇಶನ್ ಪರೀಕ್ಷಿಸಿ
|
||||
- ಎಲ್ಲಾ ಲಿಂಕ್ಗಳು ಕಾರ್ಯನಿರ್ವಹಿಸುತ್ತವೆ ಎಂದು ಖಚಿತಪಡಿಸಿ
|
||||
- ವ್ಯಾಕರಣ ಮತ್ತು ಶಬ್ದದೋಷಗಳಿಗಾಗಿ ಪರಿಶೀಲಿಸಿ
|
||||
|
||||
3. **ನಿಮ್ಮ ಬದಲಾವಣೆಗಳನ್ನು ಕಮಿಟ್ ಮಾಡಿ**:
|
||||
```bash
|
||||
git add .
|
||||
git commit -m "Brief description of changes"
|
||||
```
|
||||
|
||||
ಸ್ಪಷ್ಟ ಕಮಿಟ್ ಸಂದೇಶಗಳನ್ನು ಬರೆಯಿರಿ:
|
||||
- ವರ್ತಮಾನ ಕಾಲ ಬಳಸಿ ("Add feature" "Added feature" ಅಲ್ಲ)
|
||||
- ಆಜ್ಞಾಪದ ಭಾವ ಬಳಸಿ ("Move cursor to..." "Moves cursor to..." ಅಲ್ಲ)
|
||||
- ಮೊದಲ ಸಾಲು 72 ಅಕ್ಷರಗಳಿಗೆ ಮಿತಿಮಾಡಿ
|
||||
- ಸಂಬಂಧಿತ ಸಮಸ್ಯೆಗಳು ಮತ್ತು ಪುಲ್ ರಿಕ್ವೆಸ್ಟ್ಗಳನ್ನು ಉಲ್ಲೇಖಿಸಿ
|
||||
|
||||
4. **ನಿಮ್ಮ ಫೋರ್ಕ್ಗೆ ಪುಷ್ ಮಾಡಿ**:
|
||||
```bash
|
||||
git push origin feature/your-feature-name
|
||||
```
|
||||
|
||||
### ಪುಲ್ ರಿಕ್ವೆಸ್ಟ್ ರಚನೆ
|
||||
|
||||
1. [ರಿಪೊಸಿಟರಿಯ](https://github.com/microsoft/Data-Science-For-Beginners) ಗೆ ಹೋಗಿ
|
||||
2. "Pull requests" → "New pull request" ಕ್ಲಿಕ್ ಮಾಡಿ
|
||||
3. "compare across forks" ಕ್ಲಿಕ್ ಮಾಡಿ
|
||||
4. ನಿಮ್ಮ ಫೋರ್ಕ್ ಮತ್ತು ಶಾಖೆಯನ್ನು ಆಯ್ಕೆಮಾಡಿ
|
||||
5. "Create pull request" ಕ್ಲಿಕ್ ಮಾಡಿ
|
||||
|
||||
### PR ಶೀರ್ಷಿಕೆ ಸ್ವರೂಪ
|
||||
|
||||
ಈ ಸ್ವರೂಪವನ್ನು ಅನುಸರಿಸಿ ಸ್ಪಷ್ಟ, ವಿವರಣಾತ್ಮಕ ಶೀರ್ಷಿಕೆಗಳನ್ನು ಬಳಸಿ:
|
||||
|
||||
```
|
||||
[Component] Brief description
|
||||
```
|
||||
|
||||
ಉದಾಹರಣೆಗಳು:
|
||||
- `[Lesson 7] Python ನೋಟ್ಬುಕ್ ಆಮದು ದೋಷವನ್ನು ಸರಿಪಡಿಸಿ`
|
||||
- `[Quiz App] ಜರ್ಮನ್ ಅನುವಾದವನ್ನು ಸೇರಿಸಿ`
|
||||
- `[Docs] README ನವೀಕರಣ ಹೊಸ ಪೂರ್ವಾಪೇಕ್ಷಿತಗಳೊಂದಿಗೆ`
|
||||
- `[Fix] ದೃಶ್ಯೀಕರಣ ಪಾಠದಲ್ಲಿ ಡೇಟಾ ಮಾರ್ಗವನ್ನು ಸರಿಪಡಿಸಿ`
|
||||
|
||||
### PR ವಿವರಣೆ
|
||||
|
||||
ನಿಮ್ಮ PR ವಿವರಣೆಯಲ್ಲಿ ಸೇರಿಸಿ:
|
||||
|
||||
- **ಏನು**: ನೀವು ಯಾವ ಬದಲಾವಣೆಗಳನ್ನು ಮಾಡಿದ್ದೀರಿ?
|
||||
- **ಯಾಕೆ**: ಈ ಬದಲಾವಣೆಗಳು ಯಾಕೆ ಅಗತ್ಯ?
|
||||
- **ಹೇಗೆ**: ನೀವು ಬದಲಾವಣೆಗಳನ್ನು ಹೇಗೆ ಜಾರಿಗೆ ತಂದಿರಿ?
|
||||
- **ಪರೀಕ್ಷೆ**: ನೀವು ಬದಲಾವಣೆಗಳನ್ನು ಹೇಗೆ ಪರೀಕ್ಷಿಸಿದ್ದೀರಿ?
|
||||
- **ಸ್ಕ್ರೀನ್ಶಾಟ್ಗಳು**: ದೃಶ್ಯ ಬದಲಾವಣೆಗಳಿಗೆ ಸ್ಕ್ರೀನ್ಶಾಟ್ಗಳನ್ನು ಸೇರಿಸಿ
|
||||
- **ಸಂಬಂಧಿತ ಸಮಸ್ಯೆಗಳು**: ಸಂಬಂಧಿತ ಸಮಸ್ಯೆಗಳಿಗೆ ಲಿಂಕ್ (ಉದಾ: "Fixes #123")
|
||||
|
||||
### ವಿಮರ್ಶಾ ಪ್ರಕ್ರಿಯೆ
|
||||
|
||||
1. **ಸ್ವಯಂಚಾಲಿತ ಪರಿಶೀಲನೆಗಳು** ನಿಮ್ಮ PR ಮೇಲೆ ನಡೆಯುತ್ತವೆ
|
||||
2. **ನಿರ್ವಹಕರು ನಿಮ್ಮ ಕೊಡುಗೆ ಪರಿಶೀಲಿಸುತ್ತಾರೆ**
|
||||
3. **ಪ್ರತಿಕ್ರಿಯೆಗಳನ್ನು ಗಮನಿಸಿ ಹೆಚ್ಚುವರಿ ಕಮಿಟ್ಗಳನ್ನು ಮಾಡಿ**
|
||||
4. ಒಪ್ಪಿಗೆಯಾದ ನಂತರ, **ನಿರ್ವಹಕರು ನಿಮ್ಮ PR ಅನ್ನು ಮರ್ಜ್ ಮಾಡುತ್ತಾರೆ**
|
||||
|
||||
### ನಿಮ್ಮ PR ಮರ್ಜ್ ಆದ ನಂತರ
|
||||
|
||||
1. ನಿಮ್ಮ ಶಾಖೆಯನ್ನು ಅಳಿಸಿ:
|
||||
```bash
|
||||
git branch -d feature/your-feature-name
|
||||
git push origin --delete feature/your-feature-name
|
||||
```
|
||||
|
||||
2. ನಿಮ್ಮ ಫೋರ್ಕ್ ಅನ್ನು ನವೀಕರಿಸಿ:
|
||||
```bash
|
||||
git checkout main
|
||||
git pull upstream main
|
||||
git push origin main
|
||||
```
|
||||
|
||||
## ಶೈಲಿ ಮಾರ್ಗಸೂಚಿಗಳು
|
||||
|
||||
### ಮಾರ್ಕ್ಡೌನ್
|
||||
|
||||
- ಸತತ ಶೀರ್ಷಿಕೆ ಮಟ್ಟಗಳನ್ನು ಬಳಸಿ
|
||||
- ವಿಭಾಗಗಳ ನಡುವೆ ಖಾಲಿ ಸಾಲುಗಳನ್ನು ಸೇರಿಸಿ
|
||||
- ಭಾಷಾ ಸೂಚಕಗಳೊಂದಿಗೆ ಕೋಡ್ ಬ್ಲಾಕ್ಗಳನ್ನು ಬಳಸಿ:
|
||||
````markdown
|
||||
```python
|
||||
import pandas as pd
|
||||
```
|
||||
````
|
||||
- ಚಿತ್ರಗಳಿಗೆ alt ಪಠ್ಯ ಸೇರಿಸಿ: ``
|
||||
- ಸಾಲಿನ ಉದ್ದವನ್ನು ಯುಕ್ತಮಟ್ಟದಲ್ಲಿ ಇಡಿ (ಸುಮಾರು 80-100 ಅಕ್ಷರಗಳು)
|
||||
|
||||
### Python
|
||||
|
||||
- PEP 8 ಶೈಲಿ ಮಾರ್ಗಸೂಚಿಯನ್ನು ಅನುಸರಿಸಿ
|
||||
- ಅರ್ಥಪೂರ್ಣ ಚರಗಳ ಹೆಸರುಗಳನ್ನು ಬಳಸಿ
|
||||
- ಫಂಕ್ಷನ್ಗಳಿಗೆ ಡಾಕ್ಸ್ಟ್ರಿಂಗ್ಗಳನ್ನು ಸೇರಿಸಿ
|
||||
- ಅಗತ್ಯವಿದ್ದಲ್ಲಿ ಟೈಪ್ ಸೂಚನೆಗಳನ್ನು ಸೇರಿಸಿ:
|
||||
```python
|
||||
def process_data(df: pd.DataFrame) -> pd.DataFrame:
|
||||
"""Process the input dataframe."""
|
||||
return df
|
||||
```
|
||||
|
||||
### JavaScript/Vue.js
|
||||
|
||||
- Vue.js 2 ಶೈಲಿ ಮಾರ್ಗಸೂಚಿಯನ್ನು ಅನುಸರಿಸಿ
|
||||
- ESLint ಸಂರಚನೆಯನ್ನು ಬಳಸಿ
|
||||
- ಮಡ್ಯೂಲರ್, ಮರುಬಳಕೆ ಮಾಡಬಹುದಾದ ಘಟಕಗಳನ್ನು ಬರೆಯಿರಿ
|
||||
- ಸಂಕೀರ್ಣ ತರ್ಕಕ್ಕೆ ಕಾಮೆಂಟ್ಗಳನ್ನು ಸೇರಿಸಿ
|
||||
|
||||
### ಫೈಲ್ ಸಂಘಟನೆ
|
||||
|
||||
- ಸಂಬಂಧಿತ ಫೈಲ್ಗಳನ್ನು ಒಟ್ಟಿಗೆ ಇಡಿ
|
||||
- ವಿವರಣಾತ್ಮಕ ಫೈಲ್ ಹೆಸರುಗಳನ್ನು ಬಳಸಿ
|
||||
- ಇತ್ತೀಚಿನ ಡೈರೆಕ್ಟರಿ ರಚನೆಯನ್ನು ಅನುಸರಿಸಿ
|
||||
- ಅನಗತ್ಯ ಫೈಲ್ಗಳನ್ನು ಕಮಿಟ್ ಮಾಡಬೇಡಿ (.DS_Store, .pyc, node_modules, ಇತ್ಯಾದಿ)
|
||||
|
||||
## ಕೊಡುಗೆದಾರ ಪರವಾನಗಿ ಒಪ್ಪಂದ
|
||||
|
||||
ಈ ಯೋಜನೆ ಕೊಡುಗೆಗಳು ಮತ್ತು ಸಲಹೆಗಳನ್ನು ಸ್ವಾಗತಿಸುತ್ತದೆ. ಬಹುತೇಕ ಕೊಡುಗೆಗಳಿಗೆ ನೀವು
|
||||
ಕೊಡುಗೆದಾರ ಪರವಾನಗಿ ಒಪ್ಪಂದ (CLA) ಗೆ ಒಪ್ಪಿಗೆ ನೀಡಬೇಕಾಗುತ್ತದೆ, ಇದು ನೀವು ನಿಮ್ಮ ಕೊಡುಗೆ ಬಳಸಲು
|
||||
ನಮ್ಮಿಗೆ ಹಕ್ಕುಗಳನ್ನು ನೀಡಲು ಹಕ್ಕು ಹೊಂದಿದ್ದೀರಿ ಮತ್ತು ನಿಜವಾಗಿಯೂ ನೀಡುತ್ತೀರಿ ಎಂದು ಘೋಷಿಸುತ್ತದೆ. ವಿವರಗಳಿಗೆ,
|
||||
https://cla.microsoft.com ನೋಡಿ.
|
||||
|
||||
ನೀವು ಪುಲ್ ರಿಕ್ವೆಸ್ಟ್ ಸಲ್ಲಿಸುವಾಗ, CLA-ಬಾಟ್ ಸ್ವಯಂಚಾಲಿತವಾಗಿ ನೀವು CLA ಒದಗಿಸಬೇಕೇ ಎಂದು ನಿರ್ಧರಿಸಿ PR ಅನ್ನು ಸೂಕ್ತವಾಗಿ ಅಲಂಕರಿಸುತ್ತದೆ (ಉದಾ: ಲೇಬಲ್, ಕಾಮೆಂಟ್). ಬಾಟ್ ನೀಡುವ ಸೂಚನೆಗಳನ್ನು ಅನುಸರಿಸಿ. ನಮ್ಮ CLA ಬಳಸಿ ಎಲ್ಲಾ ರಿಪೊಸಿಟರಿಗಳಲ್ಲಿ ನೀವು ಇದನ್ನು ಒಂದೇ ಬಾರಿ ಮಾಡಬೇಕಾಗುತ್ತದೆ.
|
||||
|
||||
## ಪ್ರಶ್ನೆಗಳು?
|
||||
|
||||
- ನಮ್ಮ [Discord ಚಾನೆಲ್ #data-science-for-beginners](https://aka.ms/ds4beginners/discord) ಪರಿಶೀಲಿಸಿ
|
||||
- ನಮ್ಮ [Discord ಸಮುದಾಯ](https://aka.ms/ds4beginners/discord) ಸೇರಿ
|
||||
- ಇತ್ತೀಚಿನ [ಸಮಸ್ಯೆಗಳು](https://github.com/microsoft/Data-Science-For-Beginners/issues) ಮತ್ತು [ಪುಲ್ ರಿಕ್ವೆಸ್ಟ್ಗಳು](https://github.com/microsoft/Data-Science-For-Beginners/pulls) ಪರಿಶೀಲಿಸಿ
|
||||
|
||||
## ಧನ್ಯವಾದಗಳು!
|
||||
|
||||
ನಿಮ್ಮ ಕೊಡುಗೆಗಳು ಈ ಪಠ್ಯಕ್ರಮವನ್ನು ಎಲ್ಲರಿಗೂ ಉತ್ತಮವಾಗಿಸುತ್ತವೆ. ಕೊಡುಗೆ ನೀಡಲು ಸಮಯ ತೆಗೆದುಕೊಂಡಿದ್ದಕ್ಕೆ ಧನ್ಯವಾದಗಳು!
|
||||
|
||||
---
|
||||
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
|
||||
**ಅಸ್ವೀಕರಣ**:
|
||||
ಈ ದಸ್ತಾವೇಜು AI ಅನುವಾದ ಸೇವೆ [Co-op Translator](https://github.com/Azure/co-op-translator) ಬಳಸಿ ಅನುವಾದಿಸಲಾಗಿದೆ. ನಾವು ನಿಖರತೆಯಿಗಾಗಿ ಪ್ರಯತ್ನಿಸುತ್ತಿದ್ದರೂ, ಸ್ವಯಂಚಾಲಿತ ಅನುವಾದಗಳಲ್ಲಿ ತಪ್ಪುಗಳು ಅಥವಾ ಅಸತ್ಯತೆಗಳು ಇರಬಹುದು ಎಂದು ದಯವಿಟ್ಟು ಗಮನಿಸಿ. ಮೂಲ ಭಾಷೆಯಲ್ಲಿರುವ ಮೂಲ ದಸ್ತಾವೇಜನ್ನು ಅಧಿಕೃತ ಮೂಲವಾಗಿ ಪರಿಗಣಿಸಬೇಕು. ಮಹತ್ವದ ಮಾಹಿತಿಗಾಗಿ, ವೃತ್ತಿಪರ ಮಾನವ ಅನುವಾದವನ್ನು ಶಿಫಾರಸು ಮಾಡಲಾಗುತ್ತದೆ. ಈ ಅನುವಾದ ಬಳಕೆಯಿಂದ ಉಂಟಾಗುವ ಯಾವುದೇ ತಪ್ಪು ಅರ್ಥಮಾಡಿಕೊಳ್ಳುವಿಕೆ ಅಥವಾ ತಪ್ಪು ವಿವರಣೆಗಳಿಗೆ ನಾವು ಹೊಣೆಗಾರರಾಗುವುದಿಲ್ಲ.
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER END -->
|
||||
@ -0,0 +1,263 @@
|
||||
<!--
|
||||
CO_OP_TRANSLATOR_METADATA:
|
||||
{
|
||||
"original_hash": "a64d8afa22ffcc2016bb239188d6acb1",
|
||||
"translation_date": "2025-12-19T13:13:01+00:00",
|
||||
"source_file": "INSTALLATION.md",
|
||||
"language_code": "kn"
|
||||
}
|
||||
-->
|
||||
# ಸ್ಥಾಪನೆ ಮಾರ್ಗದರ್ಶಿ
|
||||
|
||||
ಈ ಮಾರ್ಗದರ್ಶಿ ನಿಮಗೆ Data Science for Beginners ಪಠ್ಯಕ್ರಮದೊಂದಿಗೆ ಕೆಲಸ ಮಾಡಲು ನಿಮ್ಮ ಪರಿಸರವನ್ನು ಸೆಟ್ ಅಪ್ ಮಾಡಲು ಸಹಾಯ ಮಾಡುತ್ತದೆ.
|
||||
|
||||
## ವಿಷಯಗಳ ಪಟ್ಟಿಯು
|
||||
|
||||
- [ಪೂರ್ವಾಪೇಕ್ಷೆಗಳು](../..)
|
||||
- [ತ್ವರಿತ ಪ್ರಾರಂಭ ಆಯ್ಕೆಗಳು](../..)
|
||||
- [ಸ್ಥಳೀಯ ಸ್ಥಾಪನೆ](../..)
|
||||
- [ನಿಮ್ಮ ಸ್ಥಾಪನೆಯನ್ನು ಪರಿಶೀಲಿಸಿ](../..)
|
||||
|
||||
## ಪೂರ್ವಾಪೇಕ್ಷೆಗಳು
|
||||
|
||||
ನೀವು ಪ್ರಾರಂಭಿಸುವ ಮೊದಲು, ನಿಮಗೆ ಇರಬೇಕು:
|
||||
|
||||
- ಕಮಾಂಡ್ ಲೈನ್/ಟರ್ಮಿನಲ್ ಬಗ್ಗೆ ಮೂಲ ಪರಿಚಯ
|
||||
- GitHub ಖಾತೆ (ಉಚಿತ)
|
||||
- ಪ್ರಾಥಮಿಕ ಸೆಟ್ ಅಪ್ಗಾಗಿ ಸ್ಥಿರ ಇಂಟರ್ನೆಟ್ ಸಂಪರ್ಕ
|
||||
|
||||
## ತ್ವರಿತ ಪ್ರಾರಂಭ ಆಯ್ಕೆಗಳು
|
||||
|
||||
### ಆಯ್ಕೆ 1: GitHub Codespaces (ಆರಂಭಿಕರಿಗೆ ಶಿಫಾರಸು)
|
||||
|
||||
ತ್ವರಿತವಾಗಿ ಪ್ರಾರಂಭಿಸುವ ಸುಲಭ ಮಾರ್ಗ GitHub Codespaces, ಇದು ನಿಮ್ಮ ಬ್ರೌಸರ್ನಲ್ಲಿ ಸಂಪೂರ್ಣ ಅಭಿವೃದ್ಧಿ ಪರಿಸರವನ್ನು ಒದಗಿಸುತ್ತದೆ.
|
||||
|
||||
1. [repository](https://github.com/microsoft/Data-Science-For-Beginners) ಗೆ ಹೋಗಿ
|
||||
2. **Code** ಡ್ರಾಪ್ಡೌನ್ ಮೆನು ಕ್ಲಿಕ್ ಮಾಡಿ
|
||||
3. **Codespaces** ಟ್ಯಾಬ್ ಆಯ್ಕೆಮಾಡಿ
|
||||
4. **Create codespace on main** ಕ್ಲಿಕ್ ಮಾಡಿ
|
||||
5. ಪರಿಸರ ಆರಂಭವಾಗಲು ಕಾಯಿರಿ (2-3 ನಿಮಿಷಗಳು)
|
||||
|
||||
ನಿಮ್ಮ ಪರಿಸರ ಈಗ ಎಲ್ಲಾ ಅವಲಂಬನೆಗಳೊಂದಿಗೆ ಸಿದ್ಧವಾಗಿದೆ!
|
||||
|
||||
### ಆಯ್ಕೆ 2: ಸ್ಥಳೀಯ ಅಭಿವೃದ್ಧಿ
|
||||
|
||||
ನಿಮ್ಮ ಸ್ವಂತ ಕಂಪ್ಯೂಟರ್ನಲ್ಲಿ ಕೆಲಸ ಮಾಡಲು, ಕೆಳಗಿನ ವಿವರವಾದ ಸೂಚನೆಗಳನ್ನು ಅನುಸರಿಸಿ.
|
||||
|
||||
## ಸ್ಥಳೀಯ ಸ್ಥಾಪನೆ
|
||||
|
||||
### ಹಂತ 1: Git ಅನ್ನು ಸ್ಥಾಪಿಸಿ
|
||||
|
||||
Git ಅನ್ನು ರೆಪೊಸಿಟರಿಯನ್ನು ಕ್ಲೋನ್ ಮಾಡಲು ಮತ್ತು ನಿಮ್ಮ ಬದಲಾವಣೆಗಳನ್ನು ಟ್ರ್ಯಾಕ್ ಮಾಡಲು ಅಗತ್ಯವಿದೆ.
|
||||
|
||||
**Windows:**
|
||||
- [git-scm.com](https://git-scm.com/download/win) ನಿಂದ ಡೌನ್ಲೋಡ್ ಮಾಡಿ
|
||||
- ಡೀಫಾಲ್ಟ್ ಸೆಟ್ಟಿಂಗ್ಗಳೊಂದಿಗೆ ಇನ್ಸ್ಟಾಲರ್ ಅನ್ನು ರನ್ ಮಾಡಿ
|
||||
|
||||
**macOS:**
|
||||
- Homebrew ಮೂಲಕ ಇನ್ಸ್ಟಾಲ್ ಮಾಡಿ: `brew install git`
|
||||
- ಅಥವಾ [git-scm.com](https://git-scm.com/download/mac) ನಿಂದ ಡೌನ್ಲೋಡ್ ಮಾಡಿ
|
||||
|
||||
**Linux:**
|
||||
```bash
|
||||
# ಡೆಬಿಯನ್/ಉಬುಂಟು
|
||||
sudo apt-get update
|
||||
sudo apt-get install git
|
||||
|
||||
# ಫೆಡೋರಾ
|
||||
sudo dnf install git
|
||||
|
||||
# ಆರ್ಚ್
|
||||
sudo pacman -S git
|
||||
```
|
||||
|
||||
### ಹಂತ 2: ರೆಪೊಸಿಟರಿಯನ್ನು ಕ್ಲೋನ್ ಮಾಡಿ
|
||||
|
||||
```bash
|
||||
# ರೆಪೊಸಿಟರಿಯನ್ನು ಕ್ಲೋನ್ ಮಾಡಿ
|
||||
git clone https://github.com/microsoft/Data-Science-For-Beginners.git
|
||||
|
||||
# ಡೈರೆಕ್ಟರಿಯ ಕಡೆಗೆ ನವಿಗೇಟ್ ಮಾಡಿ
|
||||
cd Data-Science-For-Beginners
|
||||
```
|
||||
|
||||
### ಹಂತ 3: Python ಮತ್ತು Jupyter ಅನ್ನು ಸ್ಥಾಪಿಸಿ
|
||||
|
||||
Python 3.7 ಅಥವಾ ಹೆಚ್ಚಿನ ಆವೃತ್ತಿ ಡೇಟಾ ಸೈನ್ಸ್ ಪಾಠಗಳಿಗೆ ಅಗತ್ಯವಿದೆ.
|
||||
|
||||
**Windows:**
|
||||
1. [python.org](https://www.python.org/downloads/) ನಿಂದ Python ಡೌನ್ಲೋಡ್ ಮಾಡಿ
|
||||
2. ಸ್ಥಾಪನೆಯ ಸಮಯದಲ್ಲಿ "Add Python to PATH" ಅನ್ನು ಪರಿಶೀಲಿಸಿ
|
||||
3. ಸ್ಥಾಪನೆಯನ್ನು ಪರಿಶೀಲಿಸಿ:
|
||||
```bash
|
||||
python --version
|
||||
```
|
||||
|
||||
**macOS:**
|
||||
```bash
|
||||
# ಹೋಮ್ಬ್ರೂ ಬಳಸಿ
|
||||
brew install python3
|
||||
|
||||
# ಸ್ಥಾಪನೆಯನ್ನು ಪರಿಶೀಲಿಸಿ
|
||||
python3 --version
|
||||
```
|
||||
|
||||
**Linux:**
|
||||
```bash
|
||||
# ಬಹುತೇಕ ಲಿನಕ್ಸ್ನ ವಿತರಣೆಗಳು ಪೈಥಾನ್ ಅನ್ನು ಪೂರ್ವಸ್ಥಾಪಿತವಾಗಿ ಹೊಂದಿವೆ
|
||||
python3 --version
|
||||
|
||||
# ಸ್ಥಾಪಿಸಲಾಗದಿದ್ದರೆ:
|
||||
# ಡೆಬಿಯನ್/ಉಬುಂಟು
|
||||
sudo apt-get install python3 python3-pip
|
||||
|
||||
# ಫೆಡೋರಾ
|
||||
sudo dnf install python3 python3-pip
|
||||
```
|
||||
|
||||
### ಹಂತ 4: Python ಪರಿಸರವನ್ನು ಸೆಟ್ ಅಪ್ ಮಾಡಿ
|
||||
|
||||
ಅವಲಂಬನೆಗಳನ್ನು ಪ್ರತ್ಯೇಕವಾಗಿ ಇಡಲು ವರ್ಚುವಲ್ ಪರಿಸರವನ್ನು ಬಳಸಲು ಶಿಫಾರಸು ಮಾಡಲಾಗಿದೆ.
|
||||
|
||||
```bash
|
||||
# ವರ್ಚುವಲ್ ಪರಿಸರವನ್ನು ರಚಿಸಿ
|
||||
python -m venv venv
|
||||
|
||||
# ವರ್ಚುವಲ್ ಪರಿಸರವನ್ನು ಸಕ್ರಿಯಗೊಳಿಸಿ
|
||||
# ವಿಂಡೋಸ್ನಲ್ಲಿ:
|
||||
venv\Scripts\activate
|
||||
|
||||
# ಮ್ಯಾಕ್ಒಎಸ್/ಲಿನಕ್ಸ್ನಲ್ಲಿ:
|
||||
source venv/bin/activate
|
||||
```
|
||||
|
||||
### ಹಂತ 5: Python ಪ್ಯಾಕೇಜುಗಳನ್ನು ಸ್ಥಾಪಿಸಿ
|
||||
|
||||
ಅಗತ್ಯವಿರುವ ಡೇಟಾ ಸೈನ್ಸ್ ಲೈಬ್ರರಿಗಳನ್ನು ಸ್ಥಾಪಿಸಿ:
|
||||
|
||||
```bash
|
||||
pip install jupyter pandas numpy matplotlib seaborn scikit-learn
|
||||
```
|
||||
|
||||
### ಹಂತ 6: Node.js ಮತ್ತು npm ಅನ್ನು ಸ್ಥಾಪಿಸಿ (Quiz ಅಪ್ಲಿಕೇಶನ್ಗಾಗಿ)
|
||||
|
||||
ಕ್ವಿಜ್ ಅಪ್ಲಿಕೇಶನ್ಗೆ Node.js ಮತ್ತು npm ಅಗತ್ಯವಿದೆ.
|
||||
|
||||
**Windows/macOS:**
|
||||
- [nodejs.org](https://nodejs.org/) ನಿಂದ ಡೌನ್ಲೋಡ್ ಮಾಡಿ (LTS ಆವೃತ್ತಿ ಶಿಫಾರಸು)
|
||||
- ಇನ್ಸ್ಟಾಲರ್ ಅನ್ನು ರನ್ ಮಾಡಿ
|
||||
|
||||
**Linux:**
|
||||
```bash
|
||||
# ಡೆಬಿಯನ್/ಉಬುಂಟು
|
||||
# ಎಚ್ಚರಿಕೆ: ಇಂಟರ್ನೆಟ್ನಿಂದ ಸ್ಕ್ರಿಪ್ಟ್ಗಳನ್ನು ನೇರವಾಗಿ ಬಾಷ್ಗೆ ಪೈಪ್ ಮಾಡುವುದು ಭದ್ರತಾ ಅಪಾಯವಾಗಬಹುದು.
|
||||
# ಸ್ಕ್ರಿಪ್ಟ್ ಅನ್ನು ಚಾಲನೆ ಮಾಡುವ ಮೊದಲು ಪರಿಶೀಲಿಸುವುದು ಶಿಫಾರಸು ಮಾಡಲಾಗಿದೆ:
|
||||
# curl -fsSL https://deb.nodesource.com/setup_lts.x -o setup_lts.x
|
||||
# less setup_lts.x
|
||||
# ನಂತರ ಚಾಲನೆ ಮಾಡಿ:
|
||||
# sudo -E bash setup_lts.x
|
||||
#
|
||||
# ಬದಲಾಗಿ, ಕೆಳಗಿನ ಒನ್-ಲೈನರ್ ಅನ್ನು ನಿಮ್ಮ ಸ್ವಂತ ಅಪಾಯದಲ್ಲಿ ಬಳಸಬಹುದು:
|
||||
curl -fsSL https://deb.nodesource.com/setup_lts.x | sudo -E bash -
|
||||
sudo apt-get install -y nodejs
|
||||
|
||||
# ಫೆಡೋರಾ
|
||||
sudo dnf install nodejs
|
||||
|
||||
# ಸ್ಥಾಪನೆಯನ್ನು ಪರಿಶೀಲಿಸಿ
|
||||
node --version
|
||||
npm --version
|
||||
```
|
||||
|
||||
### ಹಂತ 7: Quiz ಅಪ್ಲಿಕೇಶನ್ ಅವಲಂಬನೆಗಳನ್ನು ಸ್ಥಾಪಿಸಿ
|
||||
|
||||
```bash
|
||||
# ಕ್ವಿಜ್ ಅಪ್ಲಿಕೇಶನ್ ಡೈರೆಕ್ಟರಿಗೆ ನ್ಯಾವಿಗೇಟ್ ಮಾಡಿ
|
||||
cd quiz-app
|
||||
|
||||
# ಅವಲಂಬನೆಗಳನ್ನು ಸ್ಥಾಪಿಸಿ
|
||||
npm install
|
||||
|
||||
# ರೂಟ್ ಡೈರೆಕ್ಟರಿಗೆ ಮರಳಿ ಹೋಗಿ
|
||||
cd ..
|
||||
```
|
||||
|
||||
### ಹಂತ 8: Docsify ಅನ್ನು ಸ್ಥಾಪಿಸಿ (ಐಚ್ಛಿಕ)
|
||||
|
||||
ಡಾಕ್ಯುಮೆಂಟೇಶನ್ಗೆ ಆಫ್ಲೈನ್ ಪ್ರವೇಶಕ್ಕಾಗಿ:
|
||||
|
||||
```bash
|
||||
npm install -g docsify-cli
|
||||
```
|
||||
|
||||
## ನಿಮ್ಮ ಸ್ಥಾಪನೆಯನ್ನು ಪರಿಶೀಲಿಸಿ
|
||||
|
||||
### Python ಮತ್ತು Jupyter ಅನ್ನು ಪರೀಕ್ಷಿಸಿ
|
||||
|
||||
```bash
|
||||
# ನಿಮ್ಮ ವರ್ಚುವಲ್ ಪರಿಸರವನ್ನು ಈಗಾಗಲೇ ಸಕ್ರಿಯಗೊಳಿಸದಿದ್ದರೆ ಸಕ್ರಿಯಗೊಳಿಸಿ
|
||||
# ವಿಂಡೋಸ್ನಲ್ಲಿ:
|
||||
venv\Scripts\activate
|
||||
# ಮ್ಯಾಕ್ಒಎಸ್/ಲಿನಕ್ಸ್ನಲ್ಲಿ:
|
||||
source venv/bin/activate
|
||||
|
||||
# ಜುಪೈಟರ್ ನೋಟ್ಬುಕ್ ಪ್ರಾರಂಭಿಸಿ
|
||||
jupyter notebook
|
||||
```
|
||||
|
||||
ನಿಮ್ಮ ಬ್ರೌಸರ್ Jupyter ಇಂಟರ್ಫೇಸ್ ಅನ್ನು ತೆರೆಯಬೇಕು. ನೀವು ಈಗ ಯಾವುದೇ ಪಾಠದ `.ipynb` ಫೈಲ್ಗೆ ಹೋಗಬಹುದು.
|
||||
|
||||
### Quiz ಅಪ್ಲಿಕೇಶನ್ ಅನ್ನು ಪರೀಕ್ಷಿಸಿ
|
||||
|
||||
```bash
|
||||
# ಕ್ವಿಜ್ ಅಪ್ಲಿಕೇಶನ್ಗೆ ನ್ಯಾವಿಗೇಟ್ ಮಾಡಿ
|
||||
cd quiz-app
|
||||
|
||||
# ಅಭಿವೃದ್ಧಿ ಸರ್ವರ್ ಪ್ರಾರಂಭಿಸಿ
|
||||
npm run serve
|
||||
```
|
||||
|
||||
ಕ್ವಿಜ್ ಅಪ್ಲಿಕೇಶನ್ `http://localhost:8080` (ಅಥವಾ 8080 ಬ್ಯುಸಿ ಇದ್ದರೆ ಬೇರೆ ಪೋರ್ಟ್) ನಲ್ಲಿ ಲಭ್ಯವಿರಬೇಕು.
|
||||
|
||||
### ಡಾಕ್ಯುಮೆಂಟೇಶನ್ ಸರ್ವರ್ ಅನ್ನು ಪರೀಕ್ಷಿಸಿ
|
||||
|
||||
```bash
|
||||
# ಸಂಗ್ರಹಣೆಯ ಮೂಲ ಡೈರೆಕ್ಟರಿಯಿಂದ
|
||||
docsify serve
|
||||
```
|
||||
|
||||
ಡಾಕ್ಯುಮೆಂಟೇಶನ್ `http://localhost:3000` ನಲ್ಲಿ ಲಭ್ಯವಿರಬೇಕು.
|
||||
|
||||
## VS Code Dev Containers ಬಳಕೆ
|
||||
|
||||
ನೀವು Docker ಅನ್ನು ಸ್ಥಾಪಿಸಿಕೊಂಡಿದ್ದರೆ, ನೀವು VS Code Dev Containers ಅನ್ನು ಬಳಸಬಹುದು:
|
||||
|
||||
1. [Docker Desktop](https://www.docker.com/products/docker-desktop) ಅನ್ನು ಸ್ಥಾಪಿಸಿ
|
||||
2. [Visual Studio Code](https://code.visualstudio.com/) ಅನ್ನು ಸ್ಥಾಪಿಸಿ
|
||||
3. [Remote - Containers extension](https://marketplace.visualstudio.com/items?itemName=ms-vscode-remote.remote-containers) ಅನ್ನು ಸ್ಥಾಪಿಸಿ
|
||||
4. ರೆಪೊಸಿಟರಿಯನ್ನು VS Code ನಲ್ಲಿ ತೆರೆಯಿರಿ
|
||||
5. `F1` ಒತ್ತಿ ಮತ್ತು "Remote-Containers: Reopen in Container" ಆಯ್ಕೆಮಾಡಿ
|
||||
6. ಕಂಟೈನರ್ ನಿರ್ಮಾಣವಾಗಲು ಕಾಯಿರಿ (ಮೊದಲ ಬಾರಿ ಮಾತ್ರ)
|
||||
|
||||
## ಮುಂದಿನ ಹಂತಗಳು
|
||||
|
||||
- ಪಠ್ಯಕ್ರಮದ ಅವಲೋಕನಕ್ಕಾಗಿ [README.md](README.md) ಅನ್ನು ಅನ್ವೇಷಿಸಿ
|
||||
- ಸಾಮಾನ್ಯ ಕಾರ್ಯಪ್ರವಾಹಗಳು ಮತ್ತು ಉದಾಹರಣೆಗಳಿಗಾಗಿ [USAGE.md](USAGE.md) ಓದಿ
|
||||
- ಸಮಸ್ಯೆಗಳು ಎದುರಾದರೆ [TROUBLESHOOTING.md](TROUBLESHOOTING.md) ಪರಿಶೀಲಿಸಿ
|
||||
- ಕೊಡುಗೆ ನೀಡಲು ಬಯಸಿದರೆ [CONTRIBUTING.md](CONTRIBUTING.md) ಪರಿಶೀಲಿಸಿ
|
||||
|
||||
## ಸಹಾಯ ಪಡೆಯುವುದು
|
||||
|
||||
ನೀವು ಸಮಸ್ಯೆಗಳನ್ನು ಎದುರಿಸಿದರೆ:
|
||||
|
||||
1. [TROUBLESHOOTING.md](TROUBLESHOOTING.md) ಮಾರ್ಗದರ್ಶಿಯನ್ನು ಪರಿಶೀಲಿಸಿ
|
||||
2. ಇತ್ತೀಚಿನ [GitHub Issues](https://github.com/microsoft/Data-Science-For-Beginners/issues) ಹುಡುಕಿ
|
||||
3. ನಮ್ಮ [Discord ಸಮುದಾಯ](https://aka.ms/ds4beginners/discord) ಸೇರಿ
|
||||
4. ನಿಮ್ಮ ಸಮಸ್ಯೆಯ ವಿವರಗಳೊಂದಿಗೆ ಹೊಸ issue ರಚಿಸಿ
|
||||
|
||||
---
|
||||
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
|
||||
**ಅಸ್ವೀಕರಣ**:
|
||||
ಈ ದಸ್ತಾವೇಜು [Co-op Translator](https://github.com/Azure/co-op-translator) ಎಂಬ AI ಅನುವಾದ ಸೇವೆಯನ್ನು ಬಳಸಿ ಅನುವಾದಿಸಲಾಗಿದೆ. ನಾವು ಶುದ್ಧತೆಯತ್ತ ಪ್ರಯತ್ನಿಸುತ್ತಿದ್ದರೂ, ಸ್ವಯಂಚಾಲಿತ ಅನುವಾದಗಳಲ್ಲಿ ತಪ್ಪುಗಳು ಅಥವಾ ಅಸತ್ಯತೆಗಳು ಇರಬಹುದು ಎಂಬುದನ್ನು ದಯವಿಟ್ಟು ಗಮನಿಸಿ. ಮೂಲ ಭಾಷೆಯಲ್ಲಿರುವ ಮೂಲ ದಸ್ತಾವೇಜನ್ನು ಅಧಿಕೃತ ಮೂಲವೆಂದು ಪರಿಗಣಿಸಬೇಕು. ಮಹತ್ವದ ಮಾಹಿತಿಗಾಗಿ, ವೃತ್ತಿಪರ ಮಾನವ ಅನುವಾದವನ್ನು ಶಿಫಾರಸು ಮಾಡಲಾಗುತ್ತದೆ. ಈ ಅನುವಾದ ಬಳಕೆಯಿಂದ ಉಂಟಾಗುವ ಯಾವುದೇ ತಪ್ಪು ಅರ್ಥಮಾಡಿಕೊಳ್ಳುವಿಕೆ ಅಥವಾ ತಪ್ಪು ವಿವರಣೆಗಳಿಗೆ ನಾವು ಹೊಣೆಗಾರರಾಗುವುದಿಲ್ಲ.
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER END -->
|
||||
@ -0,0 +1,53 @@
|
||||
<!--
|
||||
CO_OP_TRANSLATOR_METADATA:
|
||||
{
|
||||
"original_hash": "0d575483100c332b2dbaefef915bb3c4",
|
||||
"translation_date": "2025-12-19T13:14:12+00:00",
|
||||
"source_file": "SECURITY.md",
|
||||
"language_code": "kn"
|
||||
}
|
||||
-->
|
||||
## ಭದ್ರತೆ
|
||||
|
||||
Microsoft ನಮ್ಮ ಸಾಫ್ಟ್ವೇರ್ ಉತ್ಪನ್ನಗಳು ಮತ್ತು ಸೇವೆಗಳ ಭದ್ರತೆಯನ್ನು ಗಂಭೀರವಾಗಿ ತೆಗೆದುಕೊಳ್ಳುತ್ತದೆ, ಇದರಲ್ಲಿ ನಮ್ಮ GitHub ಸಂಸ್ಥೆಗಳ ಮೂಲಕ ನಿರ್ವಹಿಸಲಾದ ಎಲ್ಲಾ ಮೂಲ ಕೋಡ್ ರೆಪೊಸಿಟರಿಗಳು ಸೇರಿವೆ, ಅವುಗಳಲ್ಲಿ [Microsoft](https://github.com/Microsoft), [Azure](https://github.com/Azure), [DotNet](https://github.com/dotnet), [AspNet](https://github.com/aspnet), [Xamarin](https://github.com/xamarin), ಮತ್ತು [ನಮ್ಮ GitHub ಸಂಸ್ಥೆಗಳು](https://opensource.microsoft.com/) ಸೇರಿವೆ.
|
||||
|
||||
ನೀವು ಯಾವುದೇ Microsoft-ಸ್ವಂತ ರೆಪೊಸಿಟರಿಯಲ್ಲಿ [Microsoft ಭದ್ರತಾ ದುರ್ಬಲತೆಯ ವ್ಯಾಖ್ಯಾನ](https://docs.microsoft.com/en-us/previous-versions/tn-archive/cc751383(v=technet.10))ಗೆ ಹೊಂದಿಕೆಯಾಗುವ ಭದ್ರತಾ ದುರ್ಬಲತೆಯನ್ನು ಕಂಡುಹಿಡಿದಿದ್ದೀರಿ ಎಂದು ನಂಬಿದರೆ, ದಯವಿಟ್ಟು ಕೆಳಗಿನಂತೆ ನಮಗೆ ವರದಿ ಮಾಡಿ.
|
||||
|
||||
## ಭದ್ರತಾ ಸಮಸ್ಯೆಗಳ ವರದಿ
|
||||
|
||||
**ದಯವಿಟ್ಟು ಸಾರ್ವಜನಿಕ GitHub ಸಮಸ್ಯೆಗಳ ಮೂಲಕ ಭದ್ರತಾ ದುರ್ಬಲತೆಗಳನ್ನು ವರದಿ ಮಾಡಬೇಡಿ.**
|
||||
|
||||
ಬದಲಾಗಿ, ದಯವಿಟ್ಟು Microsoft Security Response Center (MSRC) ಗೆ [https://msrc.microsoft.com/create-report](https://msrc.microsoft.com/create-report) ನಲ್ಲಿ ವರದಿ ಮಾಡಿ.
|
||||
|
||||
ನೀವು ಲಾಗಿನ್ ಮಾಡದೆ ಸಲ್ಲಿಸಲು ಇಚ್ಛಿಸಿದರೆ, [secure@microsoft.com](mailto:secure@microsoft.com) ಗೆ ಇಮೇಲ್ ಕಳುಹಿಸಿ. ಸಾಧ್ಯವಾದರೆ, ನಮ್ಮ PGP ಕೀ ಬಳಸಿ ನಿಮ್ಮ ಸಂದೇಶವನ್ನು ಎನ್ಕ್ರಿಪ್ಟ್ ಮಾಡಿ; ದಯವಿಟ್ಟು ಅದನ್ನು [Microsoft Security Response Center PGP Key ಪುಟದಿಂದ](https://www.microsoft.com/en-us/msrc/pgp-key-msrc) ಡೌನ್ಲೋಡ್ ಮಾಡಿ.
|
||||
|
||||
ನೀವು 24 ಗಂಟೆಗಳ ಒಳಗೆ ಪ್ರತಿಕ್ರಿಯೆ ಪಡೆಯಬೇಕು. ಯಾವುದೋ ಕಾರಣಕ್ಕಾಗಿ ನೀವು ಪಡೆಯದಿದ್ದರೆ, ದಯವಿಟ್ಟು ನಮ್ಮ ಮೂಲ ಸಂದೇಶವನ್ನು ಸ್ವೀಕರಿಸಿದ್ದೇವೆ ಎಂದು ಖಚಿತಪಡಿಸಲು ಇಮೇಲ್ ಮೂಲಕ ಅನುಸರಿಸಿ. ಹೆಚ್ಚಿನ ಮಾಹಿತಿಯನ್ನು [microsoft.com/msrc](https://www.microsoft.com/msrc) ನಲ್ಲಿ ಕಾಣಬಹುದು.
|
||||
|
||||
ದಯವಿಟ್ಟು ಕೆಳಗಿನ ವಿನಂತಿಸಿದ ಮಾಹಿತಿಯನ್ನು (ನೀವು ನೀಡಬಹುದಾದಷ್ಟು) ಸೇರಿಸಿ, ಇದರಿಂದ ನಾವು ಸಾಧ್ಯವಿರುವ ಸಮಸ್ಯೆಯ ಸ್ವಭಾವ ಮತ್ತು ವ್ಯಾಪ್ತಿಯನ್ನು ಉತ್ತಮವಾಗಿ ಅರ್ಥಮಾಡಿಕೊಳ್ಳಲು ಸಹಾಯವಾಗುತ್ತದೆ:
|
||||
|
||||
* ಸಮಸ್ಯೆಯ ಪ್ರಕಾರ (ಉದಾ: ಬಫರ್ ಓವರ್ಫ್ಲೋ, SQL ಇಂಜೆಕ್ಷನ್, ಕ್ರಾಸ್-ಸೈಟ್ ಸ್ಕ್ರಿಪ್ಟಿಂಗ್, ಇತ್ಯಾದಿ)
|
||||
* ಸಮಸ್ಯೆಯ ಪ್ರತ್ಯಕ್ಷತೆಯೊಂದಿಗೆ ಸಂಬಂಧಿಸಿದ ಮೂಲ ಫೈಲ್ಗಳ ಸಂಪೂರ್ಣ ಮಾರ್ಗಗಳು
|
||||
* ಪ್ರಭಾವಿತ ಮೂಲ ಕೋಡ್ನ ಸ್ಥಳ (ಟ್ಯಾಗ್/ಬ್ರಾಂಚ್/ಕಮಿಟ್ ಅಥವಾ ನೇರ URL)
|
||||
* ಸಮಸ್ಯೆಯನ್ನು ಪುನರಾವರ್ತಿಸಲು ಅಗತ್ಯವಿರುವ ಯಾವುದೇ ವಿಶೇಷ ಸಂರಚನೆ
|
||||
* ಸಮಸ್ಯೆಯನ್ನು ಪುನರಾವರ್ತಿಸಲು ಹಂತ-ಹಂತದ ಸೂಚನೆಗಳು
|
||||
* ಸಾಬೀತು-ಆಫ್-ಕಾನ್ಸೆಪ್ಟ್ ಅಥವಾ ಎಕ್ಸ್ಪ್ಲಾಯಿಟ್ ಕೋಡ್ (ಸಾಧ್ಯವಾದರೆ)
|
||||
* ಸಮಸ್ಯೆಯ ಪ್ರಭಾವ, ಮತ್ತು ಹೇಗೆ ಹ್ಯಾಕರ್ ಅದನ್ನು ದುರುಪಯೋಗ ಮಾಡಬಹುದು ಎಂಬುದು
|
||||
|
||||
ಈ ಮಾಹಿತಿ ನಿಮ್ಮ ವರದಿಯನ್ನು ವೇಗವಾಗಿ ತಪಾಸಣೆಗೆ ಸಹಾಯ ಮಾಡುತ್ತದೆ.
|
||||
|
||||
ನೀವು ಬಗ್ ಬೌಂಟಿಗಾಗಿ ವರದಿ ಮಾಡುತ್ತಿದ್ದರೆ, ಹೆಚ್ಚು ಸಂಪೂರ್ಣ ವರದಿಗಳು ಹೆಚ್ಚಿನ ಬೌಂಟಿ ಬಹುಮಾನಕ್ಕೆ ಸಹಾಯ ಮಾಡಬಹುದು. ದಯವಿಟ್ಟು ನಮ್ಮ [Microsoft Bug Bounty Program](https://microsoft.com/msrc/bounty) ಪುಟವನ್ನು ನಮ್ಮ ಸಕ್ರಿಯ ಕಾರ್ಯಕ್ರಮಗಳ ಬಗ್ಗೆ ಹೆಚ್ಚಿನ ವಿವರಗಳಿಗೆ ಭೇಟಿ ನೀಡಿ.
|
||||
|
||||
## ಇಚ್ಛಿತ ಭಾಷೆಗಳು
|
||||
|
||||
ನಾವು ಎಲ್ಲಾ ಸಂವಹನಗಳು ಇಂಗ್ಲಿಷ್ನಲ್ಲಿ ಇರಬೇಕೆಂದು ಇಚ್ಛಿಸುತ್ತೇವೆ.
|
||||
|
||||
## ನೀತಿ
|
||||
|
||||
Microsoft [ಸಂಯೋಜಿತ ದುರ್ಬಲತೆ ಬಹಿರಂಗಪಡಿಸುವಿಕೆ](https://www.microsoft.com/en-us/msrc/cvd) ತತ್ವವನ್ನು ಅನುಸರಿಸುತ್ತದೆ.
|
||||
|
||||
---
|
||||
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
|
||||
**ಅಸ್ವೀಕಾರ**:
|
||||
ಈ ದಸ್ತಾವೇಜು AI ಅನುವಾದ ಸೇವೆ [Co-op Translator](https://github.com/Azure/co-op-translator) ಬಳಸಿ ಅನುವಾದಿಸಲಾಗಿದೆ. ನಾವು ನಿಖರತೆಯಿಗಾಗಿ ಪ್ರಯತ್ನಿಸುತ್ತಿದ್ದರೂ, ಸ್ವಯಂಚಾಲಿತ ಅನುವಾದಗಳಲ್ಲಿ ದೋಷಗಳು ಅಥವಾ ಅಸತ್ಯತೆಗಳು ಇರಬಹುದು ಎಂದು ದಯವಿಟ್ಟು ಗಮನಿಸಿ. ಮೂಲ ಭಾಷೆಯಲ್ಲಿರುವ ಮೂಲ ದಸ್ತಾವೇಜನ್ನು ಅಧಿಕೃತ ಮೂಲವಾಗಿ ಪರಿಗಣಿಸಬೇಕು. ಮಹತ್ವದ ಮಾಹಿತಿಗಾಗಿ, ವೃತ್ತಿಪರ ಮಾನವ ಅನುವಾದವನ್ನು ಶಿಫಾರಸು ಮಾಡಲಾಗುತ್ತದೆ. ಈ ಅನುವಾದ ಬಳಕೆಯಿಂದ ಉಂಟಾಗುವ ಯಾವುದೇ ತಪ್ಪು ಅರ್ಥಮಾಡಿಕೊಳ್ಳುವಿಕೆ ಅಥವಾ ತಪ್ಪು ವಿವರಣೆಗಳಿಗೆ ನಾವು ಹೊಣೆಗಾರರಾಗುವುದಿಲ್ಲ.
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER END -->
|
||||
@ -0,0 +1,26 @@
|
||||
<!--
|
||||
CO_OP_TRANSLATOR_METADATA:
|
||||
{
|
||||
"original_hash": "872be8bc1b93ef1dd9ac3d6e8f99f6ab",
|
||||
"translation_date": "2025-12-19T12:48:40+00:00",
|
||||
"source_file": "SUPPORT.md",
|
||||
"language_code": "kn"
|
||||
}
|
||||
-->
|
||||
# ಬೆಂಬಲ
|
||||
## ಸಮಸ್ಯೆಗಳನ್ನು ದಾಖಲಿಸುವುದು ಮತ್ತು ಸಹಾಯ ಪಡೆಯುವುದು ಹೇಗೆ
|
||||
|
||||
ಈ ಯೋಜನೆ ದೋಷಗಳು ಮತ್ತು ವೈಶಿಷ್ಟ್ಯ ವಿನಂತಿಗಳನ್ನು ಟ್ರ್ಯಾಕ್ ಮಾಡಲು GitHub Issues ಅನ್ನು ಬಳಸುತ್ತದೆ. ನಕಲುಗಳನ್ನು ತಪ್ಪಿಸಲು ಹೊಸ ಸಮಸ್ಯೆಗಳನ್ನು ದಾಖಲಿಸುವ ಮೊದಲು ದಯವಿಟ್ಟು ಇತ್ತೀಚಿನ ಸಮಸ್ಯೆಗಳನ್ನು ಹುಡುಕಿ. ಹೊಸ ಸಮಸ್ಯೆಗಳಿಗೆ, ನಿಮ್ಮ ದೋಷ ಅಥವಾ ವೈಶಿಷ್ಟ್ಯ ವಿನಂತಿಯನ್ನು ಹೊಸ ಸಮಸ್ಯೆಯಾಗಿ ದಾಖಲಿಸಿ.
|
||||
|
||||
ಈ ಯೋಜನೆಯನ್ನು ಬಳಸುವ ಬಗ್ಗೆ ಸಹಾಯ ಮತ್ತು ಪ್ರಶ್ನೆಗಳಿಗಾಗಿ, ಸಮಸ್ಯೆಯನ್ನು ದಾಖಲಿಸಿ.
|
||||
|
||||
## ಮೈಕ್ರೋಸಾಫ್ಟ್ ಬೆಂಬಲ ನೀತಿ
|
||||
|
||||
ಈ ಸಂಗ್ರಹಣೆಗೆ ಬೆಂಬಲವು ಮೇಲ್ಕಂಡ ಸಂಪನ್ಮೂಲಗಳಿಗೆ ಮಾತ್ರ ಸೀಮಿತವಾಗಿದೆ.
|
||||
|
||||
---
|
||||
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
|
||||
**ಅಸ್ವೀಕಾರ**:
|
||||
ಈ ದಸ್ತಾವೇಜು AI ಅನುವಾದ ಸೇವೆ [Co-op Translator](https://github.com/Azure/co-op-translator) ಬಳಸಿ ಅನುವಾದಿಸಲಾಗಿದೆ. ನಾವು ನಿಖರತೆಯಿಗಾಗಿ ಪ್ರಯತ್ನಿಸುತ್ತಿದ್ದರೂ, ಸ್ವಯಂಚಾಲಿತ ಅನುವಾದಗಳಲ್ಲಿ ದೋಷಗಳು ಅಥವಾ ಅಸತ್ಯತೆಗಳು ಇರಬಹುದು ಎಂದು ದಯವಿಟ್ಟು ಗಮನಿಸಿ. ಮೂಲ ಭಾಷೆಯಲ್ಲಿರುವ ಮೂಲ ದಸ್ತಾವೇಜನ್ನು ಅಧಿಕೃತ ಮೂಲವೆಂದು ಪರಿಗಣಿಸಬೇಕು. ಮಹತ್ವದ ಮಾಹಿತಿಗಾಗಿ ವೃತ್ತಿಪರ ಮಾನವ ಅನುವಾದವನ್ನು ಶಿಫಾರಸು ಮಾಡಲಾಗುತ್ತದೆ. ಈ ಅನುವಾದ ಬಳಕೆಯಿಂದ ಉಂಟಾಗುವ ಯಾವುದೇ ತಪ್ಪು ಅರ್ಥಮಾಡಿಕೊಳ್ಳುವಿಕೆ ಅಥವಾ ತಪ್ಪು ವಿವರಣೆಗಳಿಗೆ ನಾವು ಹೊಣೆಗಾರರಾಗುವುದಿಲ್ಲ.
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER END -->
|
||||
@ -0,0 +1,629 @@
|
||||
<!--
|
||||
CO_OP_TRANSLATOR_METADATA:
|
||||
{
|
||||
"original_hash": "93a6a8a8a209128cbfedcbc076ee21b0",
|
||||
"translation_date": "2025-12-19T12:59:04+00:00",
|
||||
"source_file": "TROUBLESHOOTING.md",
|
||||
"language_code": "kn"
|
||||
}
|
||||
-->
|
||||
# ಸಮಸ್ಯೆ ಪರಿಹಾರ ಮಾರ್ಗದರ್ಶಿ
|
||||
|
||||
ಈ ಮಾರ್ಗದರ್ಶಿ ಡೇಟಾ ಸೈನ್ಸ್ ಫಾರ್ ಬಿಗಿನರ್ಸ್ ಪಠ್ಯಕ್ರಮದೊಂದಿಗೆ ಕೆಲಸ ಮಾಡುವಾಗ ನೀವು ಎದುರಿಸಬಹುದಾದ ಸಾಮಾನ್ಯ ಸಮಸ್ಯೆಗಳಿಗೆ ಪರಿಹಾರಗಳನ್ನು ಒದಗಿಸುತ್ತದೆ.
|
||||
|
||||
## ವಿಷಯಗಳ ಪಟ್ಟಿಯು
|
||||
|
||||
- [ಪೈಥಾನ್ ಮತ್ತು ಜುಪಿಟರ್ ಸಮಸ್ಯೆಗಳು](../..)
|
||||
- [ಪ್ಯಾಕೇಜ್ ಮತ್ತು ಅವಲಂಬನೆ ಸಮಸ್ಯೆಗಳು](../..)
|
||||
- [ಜುಪಿಟರ್ ನೋಟ್ಬುಕ್ ಸಮಸ್ಯೆಗಳು](../..)
|
||||
- [ಕ್ವಿಜ್ ಅಪ್ಲಿಕೇಶನ್ ಸಮಸ್ಯೆಗಳು](../..)
|
||||
- [ಗಿಟ್ ಮತ್ತು ಗಿಟ್ಹಬ್ ಸಮಸ್ಯೆಗಳು](../..)
|
||||
- [ಡಾಕ್ಸಿಫೈ ಡಾಕ್ಯುಮೆಂಟೇಶನ್ ಸಮಸ್ಯೆಗಳು](../..)
|
||||
- [ಡೇಟಾ ಮತ್ತು ಫೈಲ್ ಸಮಸ್ಯೆಗಳು](../..)
|
||||
- [ಕಾರ್ಯಕ್ಷಮತೆ ಸಮಸ್ಯೆಗಳು](../..)
|
||||
- [ಹೆಚ್ಚಿನ ಸಹಾಯ ಪಡೆಯುವುದು](../..)
|
||||
|
||||
## ಪೈಥಾನ್ ಮತ್ತು ಜುಪಿಟರ್ ಸಮಸ್ಯೆಗಳು
|
||||
|
||||
### ಪೈಥಾನ್ ಕಂಡುಬರಲಿಲ್ಲ ಅಥವಾ ತಪ್ಪು ಆವೃತ್ತಿ
|
||||
|
||||
**ಸಮಸ್ಯೆ:** `python: command not found` ಅಥವಾ ತಪ್ಪು ಪೈಥಾನ್ ಆವೃತ್ತಿ
|
||||
|
||||
**ಪರಿಹಾರ:**
|
||||
|
||||
```bash
|
||||
# ಪೈಥಾನ್ ಆವೃತ್ತಿಯನ್ನು ಪರಿಶೀಲಿಸಿ
|
||||
python --version
|
||||
python3 --version
|
||||
|
||||
# ಪೈಥಾನ್ 3 'python3' ಎಂದು ಸ್ಥಾಪಿತವಾಗಿದ್ದರೆ, ಒಂದು ಅಲಿಯಾಸ್ ರಚಿಸಿ
|
||||
# macOS/Linux ನಲ್ಲಿ, ~/.bashrc ಅಥವಾ ~/.zshrc ಗೆ ಸೇರಿಸಿ:
|
||||
alias python=python3
|
||||
alias pip=pip3
|
||||
|
||||
# ಅಥವಾ python3 ಅನ್ನು ಸ್ಪಷ್ಟವಾಗಿ ಬಳಸಿ
|
||||
python3 -m pip install jupyter
|
||||
```
|
||||
|
||||
**ವಿಂಡೋಸ್ ಪರಿಹಾರ:**
|
||||
1. [python.org](https://www.python.org/) ನಿಂದ ಪೈಥಾನ್ ಮರುಸ್ಥಾಪಿಸಿ
|
||||
2. ಸ್ಥಾಪನೆಯಾಗುತ್ತಿರುವಾಗ, "Add Python to PATH" ಅನ್ನು ಪರಿಶೀಲಿಸಿ
|
||||
3. ನಿಮ್ಮ ಟರ್ಮಿನಲ್/ಕಮಾಂಡ್ ಪ್ರಾಂಪ್ಟ್ ಅನ್ನು ಮರುಪ್ರಾರಂಭಿಸಿ
|
||||
|
||||
### ವರ್ಚುವಲ್ ಎನ್ವಿರಾನ್ಮೆಂಟ್ ಸಕ್ರಿಯಗೊಳಿಸುವ ಸಮಸ್ಯೆಗಳು
|
||||
|
||||
**ಸಮಸ್ಯೆ:** ವರ್ಚುವಲ್ ಎನ್ವಿರಾನ್ಮೆಂಟ್ ಸಕ್ರಿಯಗೊಳ್ಳುತ್ತಿಲ್ಲ
|
||||
|
||||
**ಪರಿಹಾರ:**
|
||||
|
||||
**ವಿಂಡೋಸ್:**
|
||||
```bash
|
||||
# ನೀವು ಕಾರ್ಯಗತಗೊಳಿಸುವ ನೀತಿ ದೋಷವನ್ನು ಪಡೆದರೆ
|
||||
Set-ExecutionPolicy -ExecutionPolicy RemoteSigned -Scope CurrentUser
|
||||
|
||||
# ನಂತರ ಸಕ್ರಿಯಗೊಳಿಸಿ
|
||||
venv\Scripts\activate
|
||||
```
|
||||
|
||||
**ಮ್ಯಾಕ್ಒಎಸ್/ಲಿನಕ್ಸ್ನಲ್ಲಿ:**
|
||||
```bash
|
||||
# ಸಕ್ರಿಯಗೊಳಿಸುವ ಸ್ಕ್ರಿಪ್ಟ್ ಕಾರ್ಯನಿರ್ವಹಣೀಯವಾಗಿರುವುದನ್ನು ಖಚಿತಪಡಿಸಿಕೊಳ್ಳಿ
|
||||
chmod +x venv/bin/activate
|
||||
|
||||
# ನಂತರ ಸಕ್ರಿಯಗೊಳಿಸಿ
|
||||
source venv/bin/activate
|
||||
```
|
||||
|
||||
**ಸಕ್ರಿಯಗೊಳಿಸುವಿಕೆ ಪರಿಶೀಲಿಸಿ:**
|
||||
```bash
|
||||
# ನಿಮ್ಮ ಪ್ರಾಂಪ್ಟ್ (venv) ಅನ್ನು ತೋರಿಸಬೇಕು
|
||||
# ಪೈಥಾನ್ ಸ್ಥಳವನ್ನು ಪರಿಶೀಲಿಸಿ
|
||||
which python # venv ಗೆ ಸೂಚಿಸಬೇಕು
|
||||
```
|
||||
|
||||
### ಜುಪಿಟರ್ ಕರ್ಣಲ್ ಸಮಸ್ಯೆಗಳು
|
||||
|
||||
**ಸಮಸ್ಯೆ:** "Kernel not found" ಅಥವಾ "Kernel keeps dying"
|
||||
|
||||
**ಪರಿಹಾರ:**
|
||||
|
||||
```bash
|
||||
# ಕರ್ಣಲ್ ಅನ್ನು ಮರುಸ್ಥಾಪಿಸಿ
|
||||
python -m ipykernel install --user --name=datascience --display-name="Python (Data Science)"
|
||||
|
||||
# ಅಥವಾ ಡೀಫಾಲ್ಟ್ ಕರ್ಣಲ್ ಅನ್ನು ಬಳಸಿ
|
||||
python -m ipykernel install --user
|
||||
|
||||
# ಜುಪೈಟರ್ ಅನ್ನು ಮರುಪ್ರಾರಂಭಿಸಿ
|
||||
jupyter notebook
|
||||
```
|
||||
|
||||
**ಸಮಸ್ಯೆ:** ಜುಪಿಟರ್ನಲ್ಲಿ ತಪ್ಪು ಪೈಥಾನ್ ಆವೃತ್ತಿ
|
||||
|
||||
**ಪರಿಹಾರ:**
|
||||
```bash
|
||||
# ನಿಮ್ಮ ವರ್ಚುವಲ್ ಪರಿಸರದಲ್ಲಿ ಜುಪೈಟರ್ ಅನ್ನು ಸ್ಥಾಪಿಸಿ
|
||||
source venv/bin/activate # ಮೊದಲು ಸಕ್ರಿಯಗೊಳಿಸಿ
|
||||
pip install jupyter ipykernel
|
||||
|
||||
# ಕರ್ಣಲ್ ಅನ್ನು ನೋಂದಣಿ ಮಾಡಿ
|
||||
python -m ipykernel install --user --name=venv --display-name="Python (venv)"
|
||||
|
||||
# ಜುಪೈಟರ್ನಲ್ಲಿ, Kernel -> Change kernel -> Python (venv) ಆಯ್ಕೆಮಾಡಿ
|
||||
```
|
||||
|
||||
## ಪ್ಯಾಕೇಜ್ ಮತ್ತು ಅವಲಂಬನೆ ಸಮಸ್ಯೆಗಳು
|
||||
|
||||
### ಆಮದು ದೋಷಗಳು
|
||||
|
||||
**ಸಮಸ್ಯೆ:** `ModuleNotFoundError: No module named 'pandas'` (ಅಥವಾ ಇತರ ಪ್ಯಾಕೇಜ್ಗಳು)
|
||||
|
||||
**ಪರಿಹಾರ:**
|
||||
|
||||
```bash
|
||||
# ವರ್ಚುವಲ್ ಪರಿಸರ ಸಕ್ರಿಯವಾಗಿದೆ ಎಂದು ಖಚಿತಪಡಿಸಿಕೊಳ್ಳಿ
|
||||
source venv/bin/activate # macOS/Linux
|
||||
venv\Scripts\activate # ವಿಂಡೋಸ್
|
||||
|
||||
# ಕಾಣೆಯಾದ ಪ್ಯಾಕೇಜ್ ಅನ್ನು ಸ್ಥಾಪಿಸಿ
|
||||
pip install pandas
|
||||
|
||||
# ಎಲ್ಲಾ ಸಾಮಾನ್ಯ ಪ್ಯಾಕೇಜ್ಗಳನ್ನು ಸ್ಥಾಪಿಸಿ
|
||||
pip install jupyter pandas numpy matplotlib seaborn scikit-learn
|
||||
|
||||
# ಸ್ಥಾಪನೆ ಪರಿಶೀಲಿಸಿ
|
||||
python -c "import pandas; print(pandas.__version__)"
|
||||
```
|
||||
|
||||
### ಪಿಪ್ ಸ್ಥಾಪನೆ ವಿಫಲತೆಗಳು
|
||||
|
||||
**ಸಮಸ್ಯೆ:** ಅನುಮತಿ ದೋಷಗಳೊಂದಿಗೆ `pip install` ವಿಫಲವಾಗಿದೆ
|
||||
|
||||
**ಪರಿಹಾರ:**
|
||||
|
||||
```bash
|
||||
# --user ಧ್ವಜವನ್ನು ಬಳಸಿ
|
||||
pip install --user package-name
|
||||
|
||||
# ಅಥವಾ ವರ್ಚುವಲ್ ಪರಿಸರವನ್ನು ಬಳಸಿ (ಶಿಫಾರಸು ಮಾಡಲಾಗಿದೆ)
|
||||
python -m venv venv
|
||||
source venv/bin/activate
|
||||
pip install package-name
|
||||
```
|
||||
|
||||
**ಸಮಸ್ಯೆ:** SSL ಪ್ರಮಾಣಪತ್ರ ದೋಷಗಳೊಂದಿಗೆ `pip install` ವಿಫಲವಾಗಿದೆ
|
||||
|
||||
**ಪರಿಹಾರ:**
|
||||
|
||||
```bash
|
||||
# ಮೊದಲು ಪಿಪ್ ಅನ್ನು ನವೀಕರಿಸಿ
|
||||
python -m pip install --upgrade pip
|
||||
|
||||
# ನಂಬಿಗಸ್ತ ಹೋಸ್ಟ್ನೊಂದಿಗೆ ಸ್ಥಾಪಿಸಲು ಪ್ರಯತ್ನಿಸಿ (ತಾತ್ಕಾಲಿಕ ಪರಿಹಾರ)
|
||||
pip install --trusted-host pypi.org --trusted-host files.pythonhosted.org package-name
|
||||
```
|
||||
|
||||
### ಪ್ಯಾಕೇಜ್ ಆವೃತ್ತಿ ಸಂಘರ್ಷಗಳು
|
||||
|
||||
**ಸಮಸ್ಯೆ:** ಅಸಂಗತ ಪ್ಯಾಕೇಜ್ ಆವೃತ್ತಿಗಳು
|
||||
|
||||
**ಪರಿಹಾರ:**
|
||||
|
||||
```bash
|
||||
# ಹೊಸ ವರ್ಚುವಲ್ ಪರಿಸರವನ್ನು ರಚಿಸಿ
|
||||
python -m venv venv-new
|
||||
source venv-new/bin/activate # ಅಥವಾ ವಿಂಡೋಸ್ನಲ್ಲಿ venv-new\Scripts\activate
|
||||
|
||||
# ಅಗತ್ಯವಿದ್ದರೆ ನಿರ್ದಿಷ್ಟ ಆವೃತ್ತಿಗಳೊಂದಿಗೆ ಪ್ಯಾಕೇಜುಗಳನ್ನು ಸ್ಥಾಪಿಸಿ
|
||||
pip install pandas==1.3.0
|
||||
pip install numpy==1.21.0
|
||||
|
||||
# ಅಥವಾ pip ಗೆ ಅವಲಂಬನೆಗಳನ್ನು ಪರಿಹರಿಸಲು ಬಿಡಿ
|
||||
pip install jupyter pandas numpy matplotlib seaborn scikit-learn
|
||||
```
|
||||
|
||||
## ಜುಪಿಟರ್ ನೋಟ್ಬುಕ್ ಸಮಸ್ಯೆಗಳು
|
||||
|
||||
### ಜುಪಿಟರ್ ಪ್ರಾರಂಭವಾಗುತ್ತಿಲ್ಲ
|
||||
|
||||
**ಸಮಸ್ಯೆ:** `jupyter notebook` ಕಮಾಂಡ್ ಕಂಡುಬರಲಿಲ್ಲ
|
||||
|
||||
**ಪರಿಹಾರ:**
|
||||
|
||||
```bash
|
||||
# ಜುಪೈಟರ್ ಅನ್ನು ಸ್ಥಾಪಿಸಿ
|
||||
pip install jupyter
|
||||
|
||||
# ಅಥವಾ python -m ಬಳಸಿ
|
||||
python -m jupyter notebook
|
||||
|
||||
# ಅಗತ್ಯವಿದ್ದರೆ PATH ಗೆ ಸೇರಿಸಿ (macOS/Linux)
|
||||
export PATH="$HOME/.local/bin:$PATH"
|
||||
```
|
||||
|
||||
### ನೋಟ್ಬುಕ್ ಲೋಡ್ ಅಥವಾ ಉಳಿಸುವುದಿಲ್ಲ
|
||||
|
||||
**ಸಮಸ್ಯೆ:** "Notebook failed to load" ಅಥವಾ ಉಳಿಸುವ ದೋಷಗಳು
|
||||
|
||||
**ಪರಿಹಾರ:**
|
||||
|
||||
1. ಫೈಲ್ ಅನುಮತಿಗಳನ್ನು ಪರಿಶೀಲಿಸಿ
|
||||
```bash
|
||||
# ನೀವು ಬರೆಯಲು ಅನುಮತಿಗಳನ್ನು ಹೊಂದಿರುವುದನ್ನು ಖಚಿತಪಡಿಸಿಕೊಳ್ಳಿ
|
||||
ls -l notebook.ipynb
|
||||
chmod 644 notebook.ipynb # ಅಗತ್ಯವಿದ್ದರೆ
|
||||
```
|
||||
|
||||
2. ಫೈಲ್ ಹಾಳಾಗಿರುವುದಿಲ್ಲ ಎಂದು ಪರಿಶೀಲಿಸಿ
|
||||
```bash
|
||||
# JSON ರಚನೆಯನ್ನು ಪರಿಶೀಲಿಸಲು ಪಠ್ಯ ಸಂಪಾದಕದಲ್ಲಿ ತೆರೆಯಲು ಪ್ರಯತ್ನಿಸಿ
|
||||
# ಹಾಳಾಗಿದ್ದರೆ ವಿಷಯವನ್ನು ಹೊಸ ನೋಟ್ಬುಕ್ಗೆ ನಕಲಿಸಿ
|
||||
```
|
||||
|
||||
3. ಜುಪಿಟರ್ ಕ್ಯಾಶೆ ತೆರವುಗೊಳಿಸಿ
|
||||
```bash
|
||||
jupyter notebook --clear-cache
|
||||
```
|
||||
|
||||
### ಸೆಲ್ ಕಾರ್ಯಗತಗೊಳ್ಳುತ್ತಿಲ್ಲ
|
||||
|
||||
**ಸಮಸ್ಯೆ:** ಸೆಲ್ "In [*]" ನಲ್ಲಿ ಅಂಟಿಕೊಂಡಿದೆ ಅಥವಾ ಬಹಳ ಸಮಯ ತೆಗೆದುಕೊಳ್ಳುತ್ತಿದೆ
|
||||
|
||||
**ಪರಿಹಾರ:**
|
||||
|
||||
1. **ಕರ್ಣಲ್ ಅನ್ನು ಮಧ್ಯಂತರಗೊಳಿಸಿ**: "Interrupt" ಬಟನ್ ಕ್ಲಿಕ್ ಮಾಡಿ ಅಥವಾ `I, I` ಒತ್ತಿ
|
||||
2. **ಕರ್ಣಲ್ ಮರುಪ್ರಾರಂಭಿಸಿ**: Kernel ಮೆನು → Restart
|
||||
3. ನಿಮ್ಮ ಕೋಡ್ನಲ್ಲಿ **ಅನಂತ ಲೂಪ್ಗಳಿಗಾಗಿ ಪರಿಶೀಲಿಸಿ**
|
||||
4. **ಔಟ್ಪುಟ್ ತೆರವುಗೊಳಿಸಿ**: ಸೆಲ್ → All Output → Clear
|
||||
|
||||
### ಪ್ಲಾಟ್ಗಳು ಪ್ರದರ್ಶಿಸಲಾಗುತ್ತಿಲ್ಲ
|
||||
|
||||
**ಸಮಸ್ಯೆ:** `matplotlib` ಪ್ಲಾಟ್ಗಳು ನೋಟ್ಬುಕ್ನಲ್ಲಿ ತೋರಿಸುತ್ತಿಲ್ಲ
|
||||
|
||||
**ಪರಿಹಾರ:**
|
||||
|
||||
```python
|
||||
# ನೋಟ್ಬುಕ್ನ ಮೇಲ್ಭಾಗದಲ್ಲಿ ಮಾಯಾಜಾಲ ಆಜ್ಞೆಯನ್ನು ಸೇರಿಸಿ
|
||||
%matplotlib inline
|
||||
|
||||
import matplotlib.pyplot as plt
|
||||
|
||||
# ಚಿತ್ರ ರಚಿಸಿ
|
||||
plt.plot([1, 2, 3, 4])
|
||||
plt.show() # show() ಅನ್ನು ಕರೆಮಾಡುವುದು ಖಚಿತಪಡಿಸಿಕೊಳ್ಳಿ
|
||||
```
|
||||
|
||||
**ಇಂಟರಾಕ್ಟಿವ್ ಪ್ಲಾಟ್ಗಳಿಗೆ ಪರ್ಯಾಯ:**
|
||||
```python
|
||||
%matplotlib notebook
|
||||
# ಅಥವಾ
|
||||
%matplotlib widget
|
||||
```
|
||||
|
||||
## ಕ್ವಿಜ್ ಅಪ್ಲಿಕೇಶನ್ ಸಮಸ್ಯೆಗಳು
|
||||
|
||||
### npm install ವಿಫಲವಾಗಿದೆ
|
||||
|
||||
**ಸಮಸ್ಯೆ:** `npm install` ಸಮಯದಲ್ಲಿ ದೋಷಗಳು
|
||||
|
||||
**ಪರಿಹಾರ:**
|
||||
|
||||
```bash
|
||||
# npm ಕ್ಯಾಶೆ ತೆರವುಗೊಳಿಸಿ
|
||||
npm cache clean --force
|
||||
|
||||
# node_modules ಮತ್ತು package-lock.json ಅನ್ನು ತೆಗೆದುಹಾಕಿ
|
||||
rm -rf node_modules package-lock.json
|
||||
|
||||
# ಮರುಸ್ಥಾಪಿಸಿ
|
||||
npm install
|
||||
|
||||
# ಇನ್ನೂ ವಿಫಲವಾಗಿದ್ದರೆ, ಹಳೆಯ ಪಿಯರ್ ಡಿಪ್ಸ್ ಜೊತೆಗೆ ಪ್ರಯತ್ನಿಸಿ
|
||||
npm install --legacy-peer-deps
|
||||
```
|
||||
|
||||
### ಕ್ವಿಜ್ ಅಪ್ಲಿಕೇಶನ್ ಪ್ರಾರಂಭವಾಗುತ್ತಿಲ್ಲ
|
||||
|
||||
**ಸಮಸ್ಯೆ:** `npm run serve` ವಿಫಲವಾಗಿದೆ
|
||||
|
||||
**ಪರಿಹಾರ:**
|
||||
|
||||
```bash
|
||||
# Node.js ಆವೃತ್ತಿಯನ್ನು ಪರಿಶೀಲಿಸಿ
|
||||
node --version # 12.x ಅಥವಾ ಅದಕ್ಕಿಂತ ಹೆಚ್ಚಿನದಾಗಿರಬೇಕು
|
||||
|
||||
# ಅವಲಂಬನೆಗಳನ್ನು ಮರುಸ್ಥಾಪಿಸಿ
|
||||
cd quiz-app
|
||||
rm -rf node_modules package-lock.json
|
||||
npm install
|
||||
|
||||
# ವಿಭಿನ್ನ ಪೋರ್ಟ್ ಪ್ರಯತ್ನಿಸಿ
|
||||
npm run serve -- --port 8081
|
||||
```
|
||||
|
||||
### ಪೋರ್ಟ್ ಈಗಾಗಲೇ ಬಳಕೆಯಲ್ಲಿದೆ
|
||||
|
||||
**ಸಮಸ್ಯೆ:** "Port 8080 is already in use"
|
||||
|
||||
**ಪರಿಹಾರ:**
|
||||
|
||||
```bash
|
||||
# 8080 ಪೋರ್ಟ್ನಲ್ಲಿ ಪ್ರಕ್ರಿಯೆಯನ್ನು ಹುಡುಕಿ ಮತ್ತು ಕೊಲ್ಲಿರಿ
|
||||
# macOS/Linux:
|
||||
lsof -ti:8080 | xargs kill -9
|
||||
|
||||
# Windows:
|
||||
netstat -ano | findstr :8080
|
||||
taskkill /PID <PID> /F
|
||||
|
||||
# ಅಥವಾ ಬೇರೆ ಪೋರ್ಟ್ ಬಳಸಿ
|
||||
npm run serve -- --port 8081
|
||||
```
|
||||
|
||||
### ಕ್ವಿಜ್ ಲೋಡ್ ಆಗುತ್ತಿಲ್ಲ ಅಥವಾ ಖಾಲಿ ಪುಟ
|
||||
|
||||
**ಸಮಸ್ಯೆ:** ಕ್ವಿಜ್ ಅಪ್ಲಿಕೇಶನ್ ಲೋಡ್ ಆಗುತ್ತದೆ ಆದರೆ ಖಾಲಿ ಪುಟ ತೋರಿಸುತ್ತದೆ
|
||||
|
||||
**ಪರಿಹಾರ:**
|
||||
|
||||
1. ಬ್ರೌಸರ್ ಕಾನ್ಸೋಲ್ನಲ್ಲಿ ದೋಷಗಳನ್ನು ಪರಿಶೀಲಿಸಿ (F12)
|
||||
2. ಬ್ರೌಸರ್ ಕ್ಯಾಶೆ ಮತ್ತು ಕುಕೀಸ್ ತೆರವುಗೊಳಿಸಿ
|
||||
3. ಬೇರೆ ಬ್ರೌಸರ್ ಪ್ರಯತ್ನಿಸಿ
|
||||
4. ಜಾವಾಸ್ಕ್ರಿಪ್ಟ್ ಸಕ್ರಿಯವಾಗಿದೆ ಎಂದು ಖಚಿತಪಡಿಸಿಕೊಳ್ಳಿ
|
||||
5. ಜಾಹೀರಾತು ತಡೆಗಟ್ಟುವವರನ್ನು ಪರಿಶೀಲಿಸಿ
|
||||
|
||||
```bash
|
||||
# ಆಪ್ ಅನ್ನು ಮರುನಿರ್ಮಿಸಿ
|
||||
npm run build
|
||||
npm run serve
|
||||
```
|
||||
|
||||
## ಗಿಟ್ ಮತ್ತು ಗಿಟ್ಹಬ್ ಸಮಸ್ಯೆಗಳು
|
||||
|
||||
### ಗಿಟ್ ಗುರುತಿಸಲಾಗುತ್ತಿಲ್ಲ
|
||||
|
||||
**ಸಮಸ್ಯೆ:** `git: command not found`
|
||||
|
||||
**ಪರಿಹಾರ:**
|
||||
|
||||
**ವಿಂಡೋಸ್:**
|
||||
- [git-scm.com](https://git-scm.com/) ನಿಂದ ಗಿಟ್ ಅನ್ನು ಸ್ಥಾಪಿಸಿ
|
||||
- ಸ್ಥಾಪನೆಯ ನಂತರ ಟರ್ಮಿನಲ್ ಮರುಪ್ರಾರಂಭಿಸಿ
|
||||
|
||||
**ಮ್ಯಾಕ್ಒಎಸ್:**
|
||||
|
||||
> **ಗಮನಿಸಿ:** ನೀವು ಹೋಮ್ಬ್ರೂ ಸ್ಥಾಪಿಸದಿದ್ದರೆ, ಮೊದಲು ಅದನ್ನು ಸ್ಥಾಪಿಸಲು [https://brew.sh/](https://brew.sh/) ನಲ್ಲಿ ಸೂಚನೆಗಳನ್ನು ಅನುಸರಿಸಿ.
|
||||
```bash
|
||||
# ಹೋಮ್ಬ್ರೂ ಮೂಲಕ ಸ್ಥಾಪಿಸಿ
|
||||
brew install git
|
||||
|
||||
# ಅಥವಾ Xcode ಕಮಾಂಡ್ ಲೈನ್ ಟೂಲ್ಸ್ ಅನ್ನು ಸ್ಥಾಪಿಸಿ
|
||||
xcode-select --install
|
||||
```
|
||||
|
||||
**ಲಿನಕ್ಸ್ನಲ್ಲಿ:**
|
||||
```bash
|
||||
sudo apt-get install git # ಡೆಬಿಯನ್/ಉಬುಂಟು
|
||||
sudo dnf install git # ಫೆಡೋರಾ
|
||||
```
|
||||
|
||||
### ಕ್ಲೋನ್ ವಿಫಲವಾಗಿದೆ
|
||||
|
||||
**ಸಮಸ್ಯೆ:** `git clone` ಪ್ರಮಾಣೀಕರಣ ದೋಷಗಳೊಂದಿಗೆ ವಿಫಲವಾಗಿದೆ
|
||||
|
||||
**ಪರಿಹಾರ:**
|
||||
|
||||
```bash
|
||||
# HTTPS URL ಅನ್ನು ಬಳಸಿ
|
||||
git clone https://github.com/microsoft/Data-Science-For-Beginners.git
|
||||
|
||||
# ನೀವು GitHub ನಲ್ಲಿ 2FA ಸಕ್ರಿಯಗೊಳಿಸಿದ್ದರೆ, ವೈಯಕ್ತಿಕ ಪ್ರವೇಶ ಟೋಕನ್ ಅನ್ನು ಬಳಸಿ
|
||||
# ಟೋಕನ್ ಅನ್ನು ರಚಿಸಿ: https://github.com/settings/tokens
|
||||
# ಕೇಳಿದಾಗ ಪಾಸ್ವರ್ಡ್ ಆಗಿ ಟೋಕನ್ ಅನ್ನು ಬಳಸಿ
|
||||
```
|
||||
|
||||
### ಅನುಮತಿ ನಿರಾಕರಿಸಲಾಗಿದೆ (publickey)
|
||||
|
||||
**ಸಮಸ್ಯೆ:** SSH ಕೀ ಪ್ರಮಾಣೀಕರಣ ವಿಫಲವಾಗಿದೆ
|
||||
|
||||
**ಪರಿಹಾರ:**
|
||||
|
||||
```bash
|
||||
# SSH ಕೀ ರಚಿಸಿ
|
||||
ssh-keygen -t ed25519 -C "your_email@example.com"
|
||||
|
||||
# ಕೀ ಅನ್ನು ssh-agent ಗೆ ಸೇರಿಸಿ
|
||||
eval "$(ssh-agent -s)"
|
||||
ssh-add ~/.ssh/id_ed25519
|
||||
|
||||
# ಸಾರ್ವಜನಿಕ ಕೀ GitHub ಗೆ ಸೇರಿಸಿ
|
||||
# ಕೀ ನಕಲಿಸಿ: cat ~/.ssh/id_ed25519.pub
|
||||
# ಇಲ್ಲಿ ಸೇರಿಸಿ: https://github.com/settings/keys
|
||||
```
|
||||
|
||||
## ಡಾಕ್ಸಿಫೈ ಡಾಕ್ಯುಮೆಂಟೇಶನ್ ಸಮಸ್ಯೆಗಳು
|
||||
|
||||
### ಡಾಕ್ಸಿಫೈ ಕಮಾಂಡ್ ಕಂಡುಬರಲಿಲ್ಲ
|
||||
|
||||
**ಸಮಸ್ಯೆ:** `docsify: command not found`
|
||||
|
||||
**ಪರಿಹಾರ:**
|
||||
|
||||
```bash
|
||||
# ಜಾಗತಿಕವಾಗಿ ಸ್ಥಾಪಿಸಿ
|
||||
npm install -g docsify-cli
|
||||
|
||||
# macOS/Linux ನಲ್ಲಿ ಅನುಮತಿ ದೋಷ ಇದ್ದರೆ
|
||||
sudo npm install -g docsify-cli
|
||||
|
||||
# ಸ್ಥಾಪನೆಯನ್ನು ಪರಿಶೀಲಿಸಿ
|
||||
docsify --version
|
||||
|
||||
# ಇನ್ನೂ ಕಂಡುಬಂದಿಲ್ಲದಿದ್ದರೆ, npm ಜಾಗತಿಕ ಮಾರ್ಗವನ್ನು ಸೇರಿಸಿ
|
||||
# npm ಜಾಗತಿಕ ಮಾರ್ಗವನ್ನು ಹುಡುಕಿ
|
||||
npm config get prefix
|
||||
|
||||
# PATH ಗೆ ಸೇರಿಸಿ (~/.bashrc ಅಥವಾ ~/.zshrc ಗೆ ಸೇರಿಸಿ)
|
||||
export PATH="$PATH:/usr/local/bin"
|
||||
```
|
||||
|
||||
### ಡಾಕ್ಯುಮೆಂಟೇಶನ್ ಲೋಡ್ ಆಗುತ್ತಿಲ್ಲ
|
||||
|
||||
**ಸಮಸ್ಯೆ:** ಡಾಕ್ಸಿಫೈ ಸೇವ್ ಮಾಡುತ್ತದೆ ಆದರೆ ವಿಷಯ ಲೋಡ್ ಆಗುವುದಿಲ್ಲ
|
||||
|
||||
**ಪರಿಹಾರ:**
|
||||
|
||||
```bash
|
||||
# ನೀವು ರೆಪೊಸಿಟರಿ ರೂಟ್ನಲ್ಲಿ ಇದ್ದೀರಾ ಎಂದು ಖಚಿತಪಡಿಸಿಕೊಳ್ಳಿ
|
||||
cd Data-Science-For-Beginners
|
||||
|
||||
# index.html ಅನ್ನು ಪರಿಶೀಲಿಸಿ
|
||||
ls index.html
|
||||
|
||||
# ನಿರ್ದಿಷ್ಟ ಪೋರ್ಟ್ನೊಂದಿಗೆ ಸೇವೆ ನೀಡಿ
|
||||
docsify serve --port 3000
|
||||
|
||||
# ದೋಷಗಳಿಗಾಗಿ ಬ್ರೌಸರ್ ಕಾನ್ಸೋಲ್ ಪರಿಶೀಲಿಸಿ (F12)
|
||||
```
|
||||
|
||||
### ಚಿತ್ರಗಳು ಪ್ರದರ್ಶಿಸಲಾಗುತ್ತಿಲ್ಲ
|
||||
|
||||
**ಸಮಸ್ಯೆ:** ಚಿತ್ರಗಳು ಮುರಿದ ಲಿಂಕ್ ಐಕಾನ್ ತೋರಿಸುತ್ತಿವೆ
|
||||
|
||||
**ಪರಿಹಾರ:**
|
||||
|
||||
1. ಚಿತ್ರ ಮಾರ್ಗಗಳು ಸಂಬಂಧಿತವಾಗಿವೆ ಎಂದು ಪರಿಶೀಲಿಸಿ
|
||||
2. ಚಿತ್ರ ಫೈಲ್ಗಳು ರೆಪೊಸಿಟರಿಯಲ್ಲಿ ಇವೆ ಎಂದು ಖಚಿತಪಡಿಸಿಕೊಳ್ಳಿ
|
||||
3. ಬ್ರೌಸರ್ ಕ್ಯಾಶೆ ತೆರವುಗೊಳಿಸಿ
|
||||
4. ಫೈಲ್ ವಿಸ್ತರಣೆಗಳು ಹೊಂದಿಕೆಯಾಗಿವೆ ಎಂದು ಪರಿಶೀಲಿಸಿ (ಕೆಲವು ವ್ಯವಸ್ಥೆಗಳಲ್ಲಿ ಕೇಸ್-ಸೆನ್ಸಿಟಿವ್)
|
||||
|
||||
## ಡೇಟಾ ಮತ್ತು ಫೈಲ್ ಸಮಸ್ಯೆಗಳು
|
||||
|
||||
### ಫೈಲ್ ಕಂಡುಬರದ ದೋಷಗಳು
|
||||
|
||||
**ಸಮಸ್ಯೆ:** ಡೇಟಾ ಲೋಡ್ ಮಾಡುವಾಗ `FileNotFoundError`
|
||||
|
||||
**ಪರಿಹಾರ:**
|
||||
|
||||
```python
|
||||
import os
|
||||
|
||||
# ಪ್ರಸ್ತುತ ಕಾರ್ಯನಿರ್ವಹಣಾ ಡೈರೆಕ್ಟರಿಯನ್ನು ಪರಿಶೀಲಿಸಿ
|
||||
print(os.getcwd())
|
||||
|
||||
# ಪೂರ್ಣ ಪಥವನ್ನು ಬಳಸಿ
|
||||
data_path = os.path.join(os.getcwd(), 'data', 'filename.csv')
|
||||
df = pd.read_csv(data_path)
|
||||
|
||||
# ಅಥವಾ ನೋಟ್ಬುಕ್ ಸ್ಥಳದಿಂದ ಸಂಬಂಧಿತ ಪಥವನ್ನು ಬಳಸಿ
|
||||
df = pd.read_csv('../data/filename.csv')
|
||||
|
||||
# ಫೈಲ್ ಅಸ್ತಿತ್ವದಲ್ಲಿದೆಯೇ ಎಂದು ಪರಿಶೀಲಿಸಿ
|
||||
print(os.path.exists('data/filename.csv'))
|
||||
```
|
||||
|
||||
### CSV ಓದುವ ದೋಷಗಳು
|
||||
|
||||
**ಸಮಸ್ಯೆ:** CSV ಫೈಲ್ಗಳನ್ನು ಓದುವಾಗ ದೋಷಗಳು
|
||||
|
||||
**ಪರಿಹಾರ:**
|
||||
|
||||
```python
|
||||
import pandas as pd
|
||||
|
||||
# ವಿಭಿನ್ನ ಎನ್ಕೋಡಿಂಗ್ಗಳನ್ನು ಪ್ರಯತ್ನಿಸಿ
|
||||
df = pd.read_csv('file.csv', encoding='utf-8')
|
||||
# ಅಥವಾ
|
||||
df = pd.read_csv('file.csv', encoding='latin-1')
|
||||
# ಅಥವಾ
|
||||
df = pd.read_csv('file.csv', encoding='ISO-8859-1')
|
||||
|
||||
# ಕಾಣೆಯಾದ ಮೌಲ್ಯಗಳನ್ನು ನಿರ್ವಹಿಸಿ
|
||||
df = pd.read_csv('file.csv', na_values=['NA', 'N/A', ''])
|
||||
|
||||
# ಕಾಮಾ ಅಲ್ಲದಿದ್ದರೆ ಡೆಲಿಮಿಟರ್ ಅನ್ನು ಸೂಚಿಸಿ
|
||||
df = pd.read_csv('file.csv', delimiter=';')
|
||||
```
|
||||
|
||||
### ದೊಡ್ಡ ಡೇಟಾಸೆಟ್ಗಳೊಂದಿಗೆ ಮೆಮೊರಿ ದೋಷಗಳು
|
||||
|
||||
**ಸಮಸ್ಯೆ:** ದೊಡ್ಡ ಫೈಲ್ಗಳನ್ನು ಲೋಡ್ ಮಾಡುವಾಗ `MemoryError`
|
||||
|
||||
**ಪರಿಹಾರ:**
|
||||
|
||||
```python
|
||||
# ತುಂಡುಗಳಾಗಿ ಓದಿ
|
||||
chunk_size = 10000
|
||||
chunks = []
|
||||
for chunk in pd.read_csv('large_file.csv', chunksize=chunk_size):
|
||||
# ತುಂಡನ್ನು ಪ್ರಕ್ರಿಯೆಗೊಳಿಸಿ
|
||||
chunks.append(chunk)
|
||||
df = pd.concat(chunks)
|
||||
|
||||
# ಅಥವಾ ನಿರ್ದಿಷ್ಟ ಕಾಲಮ್ಗಳನ್ನು ಮಾತ್ರ ಓದಿ
|
||||
df = pd.read_csv('file.csv', usecols=['col1', 'col2'])
|
||||
|
||||
# ಹೆಚ್ಚು ಪರಿಣಾಮಕಾರಿಯಾದ ಡೇಟಾ ಪ್ರಕಾರಗಳನ್ನು ಬಳಸಿ
|
||||
df = pd.read_csv('file.csv', dtype={'column_name': 'int32'})
|
||||
```
|
||||
|
||||
## ಕಾರ್ಯಕ್ಷಮತೆ ಸಮಸ್ಯೆಗಳು
|
||||
|
||||
### ನೋಟ್ಬುಕ್ ನಿಧಾನ ಕಾರ್ಯಕ್ಷಮತೆ
|
||||
|
||||
**ಸಮಸ್ಯೆ:** ನೋಟ್ಬುಕ್ಗಳು ಬಹಳ ನಿಧಾನವಾಗಿ ಕಾರ್ಯನಿರ್ವಹಿಸುತ್ತಿವೆ
|
||||
|
||||
**ಪರಿಹಾರ:**
|
||||
|
||||
1. **ಕರ್ಣಲ್ ಮರುಪ್ರಾರಂಭಿಸಿ ಮತ್ತು ಔಟ್ಪುಟ್ ತೆರವುಗೊಳಿಸಿ**
|
||||
- Kernel → Restart & Clear Output
|
||||
|
||||
2. **ಬಳಸದ ನೋಟ್ಬುಕ್ಗಳನ್ನು ಮುಚ್ಚಿ**
|
||||
|
||||
3. **ಕೋಡ್ ಅನ್ನು ಆಪ್ಟಿಮೈಸ್ ಮಾಡಿ:**
|
||||
```python
|
||||
# ಲೂಪ್ಗಳ ಬದಲು ವೆಕ್ಟರೈಜ್ಡ್ ಕಾರ್ಯಾಚರಣೆಗಳನ್ನು ಬಳಸಿ
|
||||
# ಕೆಟ್ಟದು:
|
||||
result = []
|
||||
for x in data:
|
||||
result.append(x * 2)
|
||||
|
||||
# ಉತ್ತಮ:
|
||||
result = data * 2 # ನಮ್ಪೈ/ಪಾಂಡಾಸ್ ವೆಕ್ಟರೈಜೆಷನ್
|
||||
```
|
||||
|
||||
4. **ದೊಡ್ಡ ಡೇಟಾಸೆಟ್ಗಳ ಮಾದರಿಯನ್ನು ತೆಗೆದುಕೊಳ್ಳಿ:**
|
||||
```python
|
||||
# ಅಭಿವೃದ್ಧಿಯ ಸಮಯದಲ್ಲಿ ಮಾದರಿಯೊಂದಿಗೆ ಕೆಲಸ ಮಾಡಿ
|
||||
df_sample = df.sample(n=1000) # ಅಥವಾ df.head(1000)
|
||||
```
|
||||
|
||||
### ಬ್ರೌಸರ್ ಕ್ರ್ಯಾಶ್ ಆಗುವುದು
|
||||
|
||||
**ಸಮಸ್ಯೆ:** ಬ್ರೌಸರ್ ಕ್ರ್ಯಾಶ್ ಆಗುತ್ತದೆ ಅಥವಾ ಪ್ರತಿಕ್ರಿಯೆ ನೀಡುವುದಿಲ್ಲ
|
||||
|
||||
**ಪರಿಹಾರ:**
|
||||
|
||||
1. ಬಳಸದ ಟ್ಯಾಬ್ಗಳನ್ನು ಮುಚ್ಚಿ
|
||||
2. ಬ್ರೌಸರ್ ಕ್ಯಾಶೆ ತೆರವುಗೊಳಿಸಿ
|
||||
3. ಬ್ರೌಸರ್ ಮೆಮೊರಿ ಹೆಚ್ಚಿಸಿ (ಕ್ರೋಮ್: `chrome://settings/system`)
|
||||
4. ಜುಪಿಟರ್ಲ್ಯಾಬ್ ಬಳಸಿ:
|
||||
```bash
|
||||
pip install jupyterlab
|
||||
jupyter lab
|
||||
```
|
||||
|
||||
## ಹೆಚ್ಚುವರಿ ಸಹಾಯ ಪಡೆಯುವುದು
|
||||
|
||||
### ಸಹಾಯ ಕೇಳುವ ಮೊದಲು
|
||||
|
||||
1. ಈ ಸಮಸ್ಯೆ ಪರಿಹಾರ ಮಾರ್ಗದರ್ಶಿಯನ್ನು ಪರಿಶೀಲಿಸಿ
|
||||
2. [GitHub Issues](https://github.com/microsoft/Data-Science-For-Beginners/issues) ನಲ್ಲಿ ಹುಡುಕಿ
|
||||
3. [INSTALLATION.md](INSTALLATION.md) ಮತ್ತು [USAGE.md](USAGE.md) ಪರಿಶೀಲಿಸಿ
|
||||
4. ದೋಷ ಸಂದೇಶವನ್ನು ಆನ್ಲೈನ್ನಲ್ಲಿ ಹುಡುಕಿ
|
||||
|
||||
### ಸಹಾಯ ಕೇಳುವುದು ಹೇಗೆ
|
||||
|
||||
ಸಮಸ್ಯೆ ಸೃಷ್ಟಿಸುವಾಗ ಅಥವಾ ಸಹಾಯ ಕೇಳುವಾಗ, ಈ ಮಾಹಿತಿಯನ್ನು ಸೇರಿಸಿ:
|
||||
|
||||
1. **ಆಪರೇಟಿಂಗ್ ಸಿಸ್ಟಮ್**: ವಿಂಡೋಸ್, ಮ್ಯಾಕ್ಒಎಸ್ ಅಥವಾ ಲಿನಕ್ಸ್ (ಯಾವ ಡಿಸ್ಟ್ರಿಬ್ಯೂಷನ್)
|
||||
2. **ಪೈಥಾನ್ ಆವೃತ್ತಿ**: `python --version` ಅನ್ನು ರನ್ ಮಾಡಿ
|
||||
3. **ದೋಷ ಸಂದೇಶ**: ಸಂಪೂರ್ಣ ದೋಷ ಸಂದೇಶವನ್ನು ನಕಲಿಸಿ
|
||||
4. **ಪುನರಾವರ್ತಿಸುವ ಹಂತಗಳು**: ದೋಷ ಸಂಭವಿಸುವ ಮೊದಲು ನೀವು ಏನು ಮಾಡಿದ್ದೀರಿ
|
||||
5. **ನೀವು ಪ್ರಯತ್ನಿಸಿದವು**: ನೀವು ಈಗಾಗಲೇ ಪ್ರಯತ್ನಿಸಿದ ಪರಿಹಾರಗಳು
|
||||
|
||||
**ಉದಾಹರಣೆ:**
|
||||
```
|
||||
**Operating System:** macOS 12.0
|
||||
**Python Version:** 3.9.7
|
||||
**Error Message:** ModuleNotFoundError: No module named 'pandas'
|
||||
**Steps to Reproduce:**
|
||||
1. Activated virtual environment
|
||||
2. Started Jupyter notebook
|
||||
3. Tried to import pandas
|
||||
|
||||
**What I've Tried:**
|
||||
- Ran pip install pandas
|
||||
- Restarted Jupyter
|
||||
```
|
||||
|
||||
### ಸಮುದಾಯ ಸಂಪನ್ಮೂಲಗಳು
|
||||
|
||||
- **GitHub Issues**: [ಸಮಸ್ಯೆ ಸೃಷ್ಟಿಸಿ](https://github.com/microsoft/Data-Science-For-Beginners/issues/new)
|
||||
- **Discord**: [ನಮ್ಮ ಸಮುದಾಯದಲ್ಲಿ ಸೇರಿ](https://aka.ms/ds4beginners/discord)
|
||||
- **ಚರ್ಚೆಗಳು**: [GitHub Discussions](https://github.com/microsoft/Data-Science-For-Beginners/discussions)
|
||||
- **Microsoft Learn**: [ಪ್ರಶ್ನೋತ್ತರ ವೇದಿಕೆಗಳು](https://docs.microsoft.com/answers/)
|
||||
|
||||
### ಸಂಬಂಧಿತ ಡಾಕ್ಯುಮೆಂಟೇಶನ್
|
||||
|
||||
- [INSTALLATION.md](INSTALLATION.md) - ಸ್ಥಾಪನೆ ಸೂಚನೆಗಳು
|
||||
- [USAGE.md](USAGE.md) - ಪಠ್ಯಕ್ರಮವನ್ನು ಹೇಗೆ ಬಳಸುವುದು
|
||||
- [CONTRIBUTING.md](CONTRIBUTING.md) - ಹೇಗೆ ಕೊಡುಗೆ ನೀಡುವುದು
|
||||
- [README.md](README.md) - ಯೋಜನೆಯ ಅವಲೋಕನ
|
||||
|
||||
---
|
||||
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
|
||||
**ಅಸ್ವೀಕರಣ**:
|
||||
ಈ ದಸ್ತಾವೇಜು AI ಅನುವಾದ ಸೇವೆ [Co-op Translator](https://github.com/Azure/co-op-translator) ಬಳಸಿ ಅನುವಾದಿಸಲಾಗಿದೆ. ನಾವು ನಿಖರತೆಯಿಗಾಗಿ ಪ್ರಯತ್ನಿಸುತ್ತಿದ್ದರೂ, ಸ್ವಯಂಚಾಲಿತ ಅನುವಾದಗಳಲ್ಲಿ ದೋಷಗಳು ಅಥವಾ ಅಸತ್ಯತೆಗಳು ಇರಬಹುದು ಎಂದು ದಯವಿಟ್ಟು ಗಮನಿಸಿ. ಮೂಲ ಭಾಷೆಯಲ್ಲಿರುವ ಮೂಲ ದಸ್ತಾವೇಜನ್ನು ಅಧಿಕೃತ ಮೂಲವೆಂದು ಪರಿಗಣಿಸಬೇಕು. ಮಹತ್ವದ ಮಾಹಿತಿಗಾಗಿ, ವೃತ್ತಿಪರ ಮಾನವ ಅನುವಾದವನ್ನು ಶಿಫಾರಸು ಮಾಡಲಾಗುತ್ತದೆ. ಈ ಅನುವಾದ ಬಳಕೆಯಿಂದ ಉಂಟಾಗುವ ಯಾವುದೇ ತಪ್ಪು ಅರ್ಥಮಾಡಿಕೊಳ್ಳುವಿಕೆ ಅಥವಾ ತಪ್ಪು ವಿವರಣೆಗಳಿಗೆ ನಾವು ಹೊಣೆಗಾರರಾಗುವುದಿಲ್ಲ.
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER END -->
|
||||
@ -0,0 +1,376 @@
|
||||
<!--
|
||||
CO_OP_TRANSLATOR_METADATA:
|
||||
{
|
||||
"original_hash": "f546349678757508d69ce9e1d2688446",
|
||||
"translation_date": "2025-12-19T12:47:17+00:00",
|
||||
"source_file": "USAGE.md",
|
||||
"language_code": "kn"
|
||||
}
|
||||
-->
|
||||
# ಬಳಕೆ ಮಾರ್ಗದರ್ಶಿ
|
||||
|
||||
ಈ ಮಾರ್ಗದರ್ಶಿ ಡೇಟಾ ಸೈನ್ಸ್ ಫಾರ್ ಬಿಗಿನರ್ಸ್ ಪಠ್ಯಕ್ರಮವನ್ನು ಬಳಸಲು ಉದಾಹರಣೆಗಳು ಮತ್ತು ಸಾಮಾನ್ಯ ಕಾರ್ಯಪ್ರವಾಹಗಳನ್ನು ಒದಗಿಸುತ್ತದೆ.
|
||||
|
||||
## ವಿಷಯಗಳ ಪಟ್ಟಿಕೆ
|
||||
|
||||
- [ಈ ಪಠ್ಯಕ್ರಮವನ್ನು ಹೇಗೆ ಬಳಸುವುದು](../..)
|
||||
- [ಪಾಠಗಳೊಂದಿಗೆ ಕೆಲಸ ಮಾಡುವುದು](../..)
|
||||
- [ಜುಪೈಟರ್ ನೋಟ್ಬುಕ್ಗಳೊಂದಿಗೆ ಕೆಲಸ ಮಾಡುವುದು](../..)
|
||||
- [ಕ್ವಿಜ್ ಅಪ್ಲಿಕೇಶನ್ ಬಳಕೆ](../..)
|
||||
- [ಸಾಮಾನ್ಯ ಕಾರ್ಯಪ್ರವಾಹಗಳು](../..)
|
||||
- [ಸ್ವಯಂ ಅಧ್ಯಯನಕ್ಕಾಗಿ ಸಲಹೆಗಳು](../..)
|
||||
- [ಶಿಕ್ಷಕರಿಗಾಗಿ ಸಲಹೆಗಳು](../..)
|
||||
|
||||
## ಈ ಪಠ್ಯಕ್ರಮವನ್ನು ಹೇಗೆ ಬಳಸುವುದು
|
||||
|
||||
ಈ ಪಠ್ಯಕ್ರಮವು ಲವಚಿಕವಾಗಿದ್ದು, ವಿವಿಧ ರೀತಿಯಲ್ಲಿ ಬಳಸಬಹುದು:
|
||||
|
||||
- **ಸ್ವಯಂ-ಗತಿಯ ಅಧ್ಯಯನ**: ನಿಮ್ಮ ಸ್ವಂತ ವೇಗದಲ್ಲಿ ಪಾಠಗಳನ್ನು ಸ್ವತಂತ್ರವಾಗಿ ಮಾಡಿ
|
||||
- **ತರಗತಿ ಬೋಧನೆ**: ಮಾರ್ಗದರ್ಶಿತ ಬೋಧನೆಯೊಂದಿಗೆ ರಚಿಸಲಾದ ಕೋರ್ಸ್ ಆಗಿ ಬಳಸಿ
|
||||
- **ಅಧ್ಯಯನ ಗುಂಪುಗಳು**: ಸಹಪಾಠಿಗಳೊಂದಿಗೆ ಸಹಕಾರದಿಂದ ಕಲಿಯಿರಿ
|
||||
- **ಕಾರ್ಖಾನೆ ರೂಪ**: ತೀವ್ರ ಸ್ವಲ್ಪಕಾಲಿಕ ಅಧ್ಯಯನ ಸೆಷನ್ಗಳು
|
||||
|
||||
## ಪಾಠಗಳೊಂದಿಗೆ ಕೆಲಸ ಮಾಡುವುದು
|
||||
|
||||
ಪ್ರತಿ ಪಾಠವು ಕಲಿಕೆಯನ್ನು ಗರಿಷ್ಠಗೊಳಿಸಲು ಸತತ ರಚನೆಯನ್ನು ಅನುಸರಿಸುತ್ತದೆ:
|
||||
|
||||
### ಪಾಠ ರಚನೆ
|
||||
|
||||
1. **ಪೂರ್ವ ಪಾಠ ಕ್ವಿಜ್**: ನಿಮ್ಮ ಇತ್ತೀಚಿನ ಜ್ಞಾನವನ್ನು ಪರೀಕ್ಷಿಸಿ
|
||||
2. **ಸ್ಕೆಚ್ನೋಟ್** (ಐಚ್ಛಿಕ): ಪ್ರಮುಖ ತತ್ವಗಳ ದೃಶ್ಯ ಸಾರಾಂಶ
|
||||
3. **ವೀಡಿಯೊ** (ಐಚ್ಛಿಕ): ಪೂರಕ ವೀಡಿಯೊ ವಿಷಯ
|
||||
4. **ಲೇಖಿತ ಪಾಠ**: ಮೂಲ ತತ್ವಗಳು ಮತ್ತು ವಿವರಣೆಗಳು
|
||||
5. **ಜುಪೈಟರ್ ನೋಟ್ಬುಕ್**: ಕೈಯಿಂದ ಕೋಡಿಂಗ್ ಅಭ್ಯಾಸಗಳು
|
||||
6. **ಕಾರ್ಯನಿರ್ವಹಣೆ**: ನೀವು ಕಲಿತದ್ದನ್ನು ಅಭ್ಯಾಸ ಮಾಡಿ
|
||||
7. **ಪೋಸ್ಟ್-ಪಾಠ ಕ್ವಿಜ್**: ನಿಮ್ಮ ಅರ್ಥವನ್ನು ಬಲಪಡಿಸಿ
|
||||
|
||||
### ಪಾಠದ ಉದಾಹರಣಾ ಕಾರ್ಯಪ್ರವಾಹ
|
||||
|
||||
```bash
|
||||
# 1. ಪಾಠ ಡೈರೆಕ್ಟರಿಗೆ ನಾವಿಗೇಟ್ ಮಾಡಿ
|
||||
cd 1-Introduction/01-defining-data-science
|
||||
|
||||
# 2. README.md ಓದಿ
|
||||
# README.md ಅನ್ನು ನಿಮ್ಮ ಬ್ರೌಸರ್ ಅಥವಾ ಸಂಪಾದಕದಲ್ಲಿ ತೆರೆಯಿರಿ
|
||||
|
||||
# 3. ಪೂರ್ವ-ಪಾಠ ಕ್ವಿಜ್ ತೆಗೆದುಕೊಳ್ಳಿ
|
||||
# README ನಲ್ಲಿ ಕ್ವಿಜ್ ಲಿಂಕ್ ಕ್ಲಿಕ್ ಮಾಡಿ
|
||||
|
||||
# 4. ಜುಪೈಟರ್ ನೋಟ್ಬುಕ್ ತೆರೆಯಿರಿ (ಲಭ್ಯವಿದ್ದರೆ)
|
||||
jupyter notebook
|
||||
|
||||
# 5. ನೋಟ್ಬುಕ್ನ ವ್ಯಾಯಾಮಗಳನ್ನು ಪೂರ್ಣಗೊಳಿಸಿ
|
||||
|
||||
# 6. ನಿಯೋಜನೆ ಮೇಲೆ ಕೆಲಸ ಮಾಡಿ
|
||||
|
||||
# 7. ಪಾಠದ ನಂತರದ ಕ್ವಿಜ್ ತೆಗೆದುಕೊಳ್ಳಿ
|
||||
```
|
||||
|
||||
## ಜುಪೈಟರ್ ನೋಟ್ಬುಕ್ಗಳೊಂದಿಗೆ ಕೆಲಸ ಮಾಡುವುದು
|
||||
|
||||
### ಜುಪೈಟರ್ ಪ್ರಾರಂಭಿಸುವುದು
|
||||
|
||||
```bash
|
||||
# ನಿಮ್ಮ ವರ್ಚುವಲ್ ಪರಿಸರವನ್ನು ಸಕ್ರಿಯಗೊಳಿಸಿ
|
||||
source venv/bin/activate # macOS/Linux ನಲ್ಲಿ
|
||||
# ಅಥವಾ
|
||||
venv\Scripts\activate # Windows ನಲ್ಲಿ
|
||||
|
||||
# ರೆಪೊಸಿಟರಿ ರೂಟ್ನಿಂದ Jupyter ಪ್ರಾರಂಭಿಸಿ
|
||||
jupyter notebook
|
||||
```
|
||||
|
||||
### ನೋಟ್ಬುಕ್ ಸೆಲ್ಗಳನ್ನು ಚಾಲನೆ ಮಾಡುವುದು
|
||||
|
||||
1. **ಸೆಲ್ ಅನ್ನು ಕಾರ್ಯಗತಗೊಳಿಸಿ**: `Shift + Enter` ಒತ್ತಿ ಅಥವಾ "Run" ಬಟನ್ ಕ್ಲಿಕ್ ಮಾಡಿ
|
||||
2. **ಎಲ್ಲಾ ಸೆಲ್ಗಳನ್ನು ಕಾರ್ಯಗತಗೊಳಿಸಿ**: ಮೆನುದಿಂದ "Cell" → "Run All" ಆಯ್ಕೆಮಾಡಿ
|
||||
3. **ಕರ್ಣಲ್ ಮರುಪ್ರಾರಂಭಿಸಿ**: ಸಮಸ್ಯೆ ಎದುರಾದರೆ "Kernel" → "Restart" ಆಯ್ಕೆಮಾಡಿ
|
||||
|
||||
### ಉದಾಹರಣೆ: ನೋಟ್ಬುಕ್ನಲ್ಲಿ ಡೇಟಾ ಜೊತೆ ಕೆಲಸ ಮಾಡುವುದು
|
||||
|
||||
```python
|
||||
# ಅಗತ್ಯ ಲೈಬ್ರರಿಗಳನ್ನು ಆಮದುಮಾಡಿ
|
||||
import pandas as pd
|
||||
import numpy as np
|
||||
import matplotlib.pyplot as plt
|
||||
|
||||
# ಡೇಟಾಸೆಟ್ ಅನ್ನು ಲೋಡ್ ಮಾಡಿ
|
||||
df = pd.read_csv('data/sample.csv')
|
||||
|
||||
# ಡೇಟಾವನ್ನು ಅನ್ವೇಷಿಸಿ
|
||||
df.head()
|
||||
df.info()
|
||||
df.describe()
|
||||
|
||||
# ದೃಶ್ಯೀಕರಣವನ್ನು ರಚಿಸಿ
|
||||
plt.figure(figsize=(10, 6))
|
||||
plt.plot(df['column_name'])
|
||||
plt.title('Sample Visualization')
|
||||
plt.xlabel('X-axis Label')
|
||||
plt.ylabel('Y-axis Label')
|
||||
plt.show()
|
||||
```
|
||||
|
||||
### ನಿಮ್ಮ ಕೆಲಸವನ್ನು ಉಳಿಸುವುದು
|
||||
|
||||
- ಜುಪೈಟರ್ ಸ್ವಯಂಚಾಲಿತವಾಗಿ ಅವಧಿ ಅವಧಿಗೆ ಉಳಿಸುತ್ತದೆ
|
||||
- ಕೈಯಿಂದ ಉಳಿಸುವುದು: `Ctrl + S` (ಅಥವಾ macOS ನಲ್ಲಿ `Cmd + S`) ಒತ್ತಿ
|
||||
- ನಿಮ್ಮ ಪ್ರಗತಿ `.ipynb` ಫೈಲ್ನಲ್ಲಿ ಉಳಿಯುತ್ತದೆ
|
||||
|
||||
## ಕ್ವಿಜ್ ಅಪ್ಲಿಕೇಶನ್ ಬಳಕೆ
|
||||
|
||||
### ಕ್ವಿಜ್ ಅಪ್ಲಿಕೇಶನ್ ಅನ್ನು ಸ್ಥಳೀಯವಾಗಿ ಚಾಲನೆ ಮಾಡುವುದು
|
||||
|
||||
```bash
|
||||
# ಕ್ವಿಜ್ ಅಪ್ಲಿಕೇಶನ್ ಡೈರೆಕ್ಟರಿಗೆ ನಾವಿಗೇಟ್ ಮಾಡಿ
|
||||
cd quiz-app
|
||||
|
||||
# ಡೆವಲಪ್ಮೆಂಟ್ ಸರ್ವರ್ ಪ್ರಾರಂಭಿಸಿ
|
||||
npm run serve
|
||||
|
||||
# http://localhost:8080 ನಲ್ಲಿ ಪ್ರವೇಶಿಸಿ
|
||||
```
|
||||
|
||||
### ಕ್ವಿಜ್ಗಳನ್ನು ತೆಗೆದುಕೊಳ್ಳುವುದು
|
||||
|
||||
1. ಪೂರ್ವ ಪಾಠ ಕ್ವಿಜ್ಗಳು ಪ್ರತಿ ಪಾಠದ ಮೇಲ್ಭಾಗದಲ್ಲಿ ಲಿಂಕ್ ಮಾಡಲ್ಪಟ್ಟಿವೆ
|
||||
2. ಪೋಸ್ಟ್-ಪಾಠ ಕ್ವಿಜ್ಗಳು ಪ್ರತಿ ಪಾಠದ ಕೆಳಭಾಗದಲ್ಲಿ ಲಿಂಕ್ ಮಾಡಲ್ಪಟ್ಟಿವೆ
|
||||
3. ಪ್ರತಿ ಕ್ವಿಜ್ಗೆ 3 ಪ್ರಶ್ನೆಗಳಿವೆ
|
||||
4. ಕ್ವಿಜ್ಗಳು ಕಲಿಕೆಯನ್ನು ಬಲಪಡಿಸಲು ವಿನ್ಯಾಸಗೊಳಿಸಲಾಗಿದೆ, ಸಂಪೂರ್ಣ ಪರೀಕ್ಷೆಗಾಗಿ ಅಲ್ಲ
|
||||
|
||||
### ಕ್ವಿಜ್ ಸಂಖ್ಯೆಕರಣ
|
||||
|
||||
- ಕ್ವಿಜ್ಗಳು 0-39 (ಒಟ್ಟು 40 ಕ್ವಿಜ್ಗಳು) ಸಂಖ್ಯೆಯಾಗಿದೆ
|
||||
- ಪ್ರತಿ ಪಾಠದಲ್ಲಿ ಸಾಮಾನ್ಯವಾಗಿ ಪೂರ್ವ ಮತ್ತು ಪೋಸ್ಟ್ ಕ್ವಿಜ್ ಇರುತ್ತದೆ
|
||||
- ಕ್ವಿಜ್ URL ಗಳು ಕ್ವಿಜ್ ಸಂಖ್ಯೆಯನ್ನು ಒಳಗೊಂಡಿವೆ: `https://ff-quizzes.netlify.app/en/ds/quiz/0`
|
||||
|
||||
## ಸಾಮಾನ್ಯ ಕಾರ್ಯಪ್ರವಾಹಗಳು
|
||||
|
||||
### ಕಾರ್ಯಪ್ರವಾಹ 1: ಸಂಪೂರ್ಣ ಪ್ರಾರಂಭಿಕ ಮಾರ್ಗ
|
||||
|
||||
```bash
|
||||
# 1. ನಿಮ್ಮ ಪರಿಸರವನ್ನು ಸೆಟ್ ಅಪ್ ಮಾಡಿ (INSTALLATION.md ನೋಡಿ)
|
||||
|
||||
# 2. ಪಾಠ 1 ರಿಂದ ಪ್ರಾರಂಭಿಸಿ
|
||||
cd 1-Introduction/01-defining-data-science
|
||||
|
||||
# 3. ಪ್ರತಿ ಪಾಠಕ್ಕೆ:
|
||||
# - ಪಾಠದ ಮುಂಚಿನ ಕ್ವಿಜ್ ತೆಗೆದುಕೊಳ್ಳಿ
|
||||
# - ಪಾಠದ ವಿಷಯವನ್ನು ಓದಿ
|
||||
# - ನೋಟ್ಬುಕ್ ಮೂಲಕ ಕೆಲಸ ಮಾಡಿ
|
||||
# - ನಿಯೋಜನೆಯನ್ನು ಪೂರ್ಣಗೊಳಿಸಿ
|
||||
# - ಪಾಠದ ನಂತರದ ಕ್ವಿಜ್ ತೆಗೆದುಕೊಳ್ಳಿ
|
||||
|
||||
# 4. ಎಲ್ಲಾ 20 ಪಾಠಗಳನ್ನು ಕ್ರಮವಾಗಿ ಮುಂದುವರಿಸಿ
|
||||
```
|
||||
|
||||
### ಕಾರ್ಯಪ್ರವಾಹ 2: ವಿಷಯ-ನಿರ್ದಿಷ್ಟ ಅಧ್ಯಯನ
|
||||
|
||||
ನೀವು ನಿರ್ದಿಷ್ಟ ವಿಷಯದಲ್ಲಿ ಆಸಕ್ತಿ ಹೊಂದಿದ್ದರೆ:
|
||||
|
||||
```bash
|
||||
# ಉದಾಹರಣೆ: ಡೇಟಾ ದೃಶ್ಯೀಕರಣದ ಮೇಲೆ ಗಮನಹರಿಸಿ
|
||||
cd 3-Data-Visualization
|
||||
|
||||
# ಪಾಠಗಳು 9-13 ಅನ್ನು ಅನ್ವೇಷಿಸಿ:
|
||||
# - ಪಾಠ 9: ಪ್ರಮಾಣಗಳನ್ನು ದೃಶ್ಯೀಕರಿಸುವುದು
|
||||
# - ಪಾಠ 10: ವಿತರಣೆಗಳನ್ನು ದೃಶ್ಯೀಕರಿಸುವುದು
|
||||
# - ಪಾಠ 11: ಅನುಪಾತಗಳನ್ನು ದೃಶ್ಯೀಕರಿಸುವುದು
|
||||
# - ಪಾಠ 12: ಸಂಬಂಧಗಳನ್ನು ದೃಶ್ಯೀಕರಿಸುವುದು
|
||||
# - ಪಾಠ 13: ಅರ್ಥಪೂರ್ಣ ದೃಶ್ಯೀಕರಣಗಳು
|
||||
```
|
||||
|
||||
### ಕಾರ್ಯಪ್ರವಾಹ 3: ಯೋಜನೆ ಆಧಾರಿತ ಅಧ್ಯಯನ
|
||||
|
||||
```bash
|
||||
# 1. ಡೇಟಾ ಸೈನ್ಸ್ ಲೈಫ್ಸೈಕಲ್ ಪಾಠಗಳನ್ನು ಪರಿಶೀಲಿಸಿ (14-16)
|
||||
cd 4-Data-Science-Lifecycle
|
||||
|
||||
# 2. ನೈಜ ಜಗತ್ತಿನ ಉದಾಹರಣೆಯನ್ನು ಕಾರ್ಯಗತಗೊಳಿಸಿ (ಪಾಠ 20)
|
||||
cd ../6-Data-Science-In-Wild/20-Real-World-Examples
|
||||
|
||||
# 3. ನಿಮ್ಮ ಸ್ವಂತ ಯೋಜನೆಗೆ ತತ್ವಗಳನ್ನು ಅನ್ವಯಿಸಿ
|
||||
```
|
||||
|
||||
### ಕಾರ್ಯಪ್ರವಾಹ 4: ಕ್ಲೌಡ್ ಆಧಾರಿತ ಡೇಟಾ ಸೈನ್ಸ್
|
||||
|
||||
```bash
|
||||
# ಕ್ಲೌಡ್ ಡೇಟಾ ಸೈನ್ಸ್ ಬಗ್ಗೆ ತಿಳಿದುಕೊಳ್ಳಿ (ಪಾಠಗಳು 17-19)
|
||||
cd 5-Data-Science-In-Cloud
|
||||
|
||||
# 17: ಕ್ಲೌಡ್ ಡೇಟಾ ಸೈನ್ಸ್ ಪರಿಚಯ
|
||||
# 18: ಕಡಿಮೆ-ಕೋಡ್ ಎಂಎಲ್ ಉಪಕರಣಗಳು
|
||||
# 19: ಅಜೂರ್ ಮೆಷಿನ್ ಲರ್ನಿಂಗ್ ಸ್ಟುಡಿಯೋ
|
||||
```
|
||||
|
||||
## ಸ್ವಯಂ ಅಧ್ಯಯನಕ್ಕಾಗಿ ಸಲಹೆಗಳು
|
||||
|
||||
### ಸಂಘಟಿತವಾಗಿರಿ
|
||||
|
||||
```bash
|
||||
# ಕಲಿಕೆಯ ದಿನಚರಿಯನ್ನು ರಚಿಸಿ
|
||||
mkdir my-learning-journal
|
||||
|
||||
# ಪ್ರತಿ ಪಾಠಕ್ಕೆ, ಟಿಪ್ಪಣಿಗಳನ್ನು ರಚಿಸಿ
|
||||
echo "# Lesson 1 Notes" > my-learning-journal/lesson-01-notes.md
|
||||
```
|
||||
|
||||
### ನಿಯಮಿತ ಅಭ್ಯಾಸ ಮಾಡಿ
|
||||
|
||||
- ಪ್ರತಿದಿನ ಅಥವಾ ವಾರಕ್ಕೆ ನಿಗದಿತ ಸಮಯ ಮೀಸಲಿಡಿ
|
||||
- ವಾರಕ್ಕೆ ಕನಿಷ್ಠ ಒಂದು ಪಾಠವನ್ನು ಪೂರ್ಣಗೊಳಿಸಿ
|
||||
- ಹಿಂದಿನ ಪಾಠಗಳನ್ನು ನಿಯಮಿತವಾಗಿ ಪರಿಶೀಲಿಸಿ
|
||||
|
||||
### ಸಮುದಾಯದೊಂದಿಗೆ ಸಂವಹನ ಮಾಡಿ
|
||||
|
||||
- [Discord ಸಮುದಾಯ](https://aka.ms/ds4beginners/discord) ಸೇರಿ
|
||||
- Discord ನಲ್ಲಿ #Data-Science-for-Beginners ಚಾನೆಲ್ನಲ್ಲಿ ಭಾಗವಹಿಸಿ [Discord ಚರ್ಚೆಗಳು](https://aka.ms/ds4beginners/discord)
|
||||
- ನಿಮ್ಮ ಪ್ರಗತಿಯನ್ನು ಹಂಚಿಕೊಳ್ಳಿ ಮತ್ತು ಪ್ರಶ್ನೆಗಳನ್ನು ಕೇಳಿ
|
||||
|
||||
### ನಿಮ್ಮ ಸ್ವಂತ ಯೋಜನೆಗಳನ್ನು ನಿರ್ಮಿಸಿ
|
||||
|
||||
ಪಾಠಗಳನ್ನು ಪೂರ್ಣಗೊಳಿಸಿದ ನಂತರ, ತತ್ವಗಳನ್ನು ವೈಯಕ್ತಿಕ ಯೋಜನೆಗಳಿಗೆ ಅನ್ವಯಿಸಿ:
|
||||
|
||||
```python
|
||||
# ಉದಾಹರಣೆ: ನಿಮ್ಮ ಸ್ವಂತ ಡೇಟಾಸೆಟ್ ಅನ್ನು ವಿಶ್ಲೇಷಿಸಿ
|
||||
import pandas as pd
|
||||
|
||||
# ನಿಮ್ಮ ಸ್ವಂತ ಡೇಟಾವನ್ನು ಲೋಡ್ ಮಾಡಿ
|
||||
my_data = pd.read_csv('my-project/data.csv')
|
||||
|
||||
# ಕಲಿತ ತಂತ್ರಗಳನ್ನು ಅನ್ವಯಿಸಿ
|
||||
# - ಡೇಟಾ ಶುದ್ಧೀಕರಣ (ಪಾಠ 8)
|
||||
# - ಅನ್ವೇಷಣಾತ್ಮಕ ಡೇಟಾ ವಿಶ್ಲೇಷಣೆ (ಪಾಠ 7)
|
||||
# - ದೃಶ್ಯೀಕರಣ (ಪಾಠಗಳು 9-13)
|
||||
# - ವಿಶ್ಲೇಷಣೆ (ಪಾಠ 15)
|
||||
```
|
||||
|
||||
## ಶಿಕ್ಷಕರಿಗಾಗಿ ಸಲಹೆಗಳು
|
||||
|
||||
### ತರಗತಿ ವ್ಯವಸ್ಥೆ
|
||||
|
||||
1. ವಿವರವಾದ ಮಾರ್ಗದರ್ಶನಕ್ಕಾಗಿ [for-teachers.md](for-teachers.md) ಪರಿಶೀಲಿಸಿ
|
||||
2. ಹಂಚಿಕೊಂಡ ಪರಿಸರವನ್ನು ಸ್ಥಾಪಿಸಿ (GitHub Classroom ಅಥವಾ Codespaces)
|
||||
3. ಸಂವಹನ ಚಾನೆಲ್ ಸ್ಥಾಪಿಸಿ (Discord, Slack, ಅಥವಾ Teams)
|
||||
|
||||
### ಪಾಠ ಯೋಜನೆ
|
||||
|
||||
**ಸೂಚಿತ 10-ವಾರಗಳ ವೇಳಾಪಟ್ಟಿ:**
|
||||
|
||||
- **ವಾರ 1-2**: ಪರಿಚಯ (ಪಾಠಗಳು 1-4)
|
||||
- **ವಾರ 3-4**: ಡೇಟಾ ಜೊತೆ ಕೆಲಸ (ಪಾಠಗಳು 5-8)
|
||||
- **ವಾರ 5-6**: ಡೇಟಾ ದೃಶ್ಯೀಕರಣ (ಪಾಠಗಳು 9-13)
|
||||
- **ವಾರ 7-8**: ಡೇಟಾ ಸೈನ್ಸ್ ಜೀವನಚಕ್ರ (ಪಾಠಗಳು 14-16)
|
||||
- **ವಾರ 9**: ಕ್ಲೌಡ್ ಡೇಟಾ ಸೈನ್ಸ್ (ಪಾಠಗಳು 17-19)
|
||||
- **ವಾರ 10**: ವಾಸ್ತವಿಕ ಅನ್ವಯಿಕೆಗಳು ಮತ್ತು ಅಂತಿಮ ಯೋಜನೆಗಳು (ಪಾಠ 20)
|
||||
|
||||
### ಆಫ್ಲೈನ್ ಪ್ರವೇಶಕ್ಕಾಗಿ Docsify ಚಾಲನೆ
|
||||
|
||||
```bash
|
||||
# ತರಗತಿ ಬಳಕೆಗೆ ಸ್ಥಳೀಯವಾಗಿ ಡಾಕ್ಯುಮೆಂಟೇಶನ್ ಸೇವೆ ನೀಡುವುದು
|
||||
docsify serve
|
||||
|
||||
# ವಿದ್ಯಾರ್ಥಿಗಳು localhost:3000 ನಲ್ಲಿ ಪ್ರವೇಶಿಸಬಹುದು
|
||||
# ಪ್ರಾಥಮಿಕ ಸೆಟಪ್ ನಂತರ ಇಂಟರ್ನೆಟ್ ಅಗತ್ಯವಿಲ್ಲ
|
||||
```
|
||||
|
||||
### ಕಾರ್ಯನಿರ್ವಹಣೆ ಮೌಲ್ಯಮಾಪನ
|
||||
|
||||
- ಪೂರ್ಣಗೊಂಡ ಅಭ್ಯಾಸಗಳಿಗಾಗಿ ವಿದ್ಯಾರ್ಥಿಗಳ ನೋಟ್ಬುಕ್ಗಳನ್ನು ಪರಿಶೀಲಿಸಿ
|
||||
- ಕ್ವಿಜ್ ಅಂಕಗಳ ಮೂಲಕ ಅರ್ಥಮಾಡಿಕೊಳ್ಳುವಿಕೆಯನ್ನು ಪರಿಶೀಲಿಸಿ
|
||||
- ಡೇಟಾ ಸೈನ್ಸ್ ಜೀವನಚಕ್ರ ತತ್ವಗಳನ್ನು ಬಳಸಿ ಅಂತಿಮ ಯೋಜನೆಗಳನ್ನು ಮೌಲ್ಯಮಾಪನ ಮಾಡಿ
|
||||
|
||||
### ಕಾರ್ಯನಿರ್ವಹಣೆ ರಚನೆ
|
||||
|
||||
```python
|
||||
# ಉದಾಹರಣೆಯ ಕಸ್ಟಮ್ ನಿಯೋಜನೆ ಟೆಂಪ್ಲೇಟು
|
||||
"""
|
||||
Assignment: [Topic]
|
||||
|
||||
Objective: [Learning goal]
|
||||
|
||||
Dataset: [Provide or have students find one]
|
||||
|
||||
Tasks:
|
||||
1. Load and explore the dataset
|
||||
2. Clean and prepare the data
|
||||
3. Create at least 3 visualizations
|
||||
4. Perform analysis
|
||||
5. Communicate findings
|
||||
|
||||
Deliverables:
|
||||
- Jupyter notebook with code and explanations
|
||||
- Written summary of findings
|
||||
"""
|
||||
```
|
||||
|
||||
## ಆಫ್ಲೈನ್ನಲ್ಲಿ ಕೆಲಸ ಮಾಡುವುದು
|
||||
|
||||
### ಸಂಪನ್ಮೂಲಗಳನ್ನು ಡೌನ್ಲೋಡ್ ಮಾಡಿ
|
||||
|
||||
```bash
|
||||
# ಸಂಪೂರ್ಣ ರೆಪೊಸಿಟರಿಯನ್ನು ಕ್ಲೋನ್ ಮಾಡಿ
|
||||
git clone https://github.com/microsoft/Data-Science-For-Beginners.git
|
||||
|
||||
# ಡೇಟಾಸೆಟ್ಗಳನ್ನು ಮುಂಚಿತವಾಗಿ ಡೌನ್ಲೋಡ್ ಮಾಡಿ
|
||||
# ಹೆಚ್ಚಿನ ಡೇಟಾಸೆಟ್ಗಳು ರೆಪೊಸಿಟರಿಯಲ್ಲಿ ಸೇರಿಸಲಾಗಿದೆ
|
||||
```
|
||||
|
||||
### ಡಾಕ್ಯುಮೆಂಟೇಶನ್ ಅನ್ನು ಸ್ಥಳೀಯವಾಗಿ ಚಾಲನೆ ಮಾಡಿ
|
||||
|
||||
```bash
|
||||
# ಡಾಕ್ಸಿಫಿಯೊಂದಿಗೆ ಸೇವೆ ನೀಡಿ
|
||||
docsify serve
|
||||
|
||||
# localhost:3000 ನಲ್ಲಿ ಪ್ರವೇಶಿಸಿ
|
||||
```
|
||||
|
||||
### ಕ್ವಿಜ್ ಅಪ್ಲಿಕೇಶನ್ ಅನ್ನು ಸ್ಥಳೀಯವಾಗಿ ಚಾಲನೆ ಮಾಡಿ
|
||||
|
||||
```bash
|
||||
cd quiz-app
|
||||
npm run serve
|
||||
```
|
||||
|
||||
## ಅನುವಾದಿತ ವಿಷಯಗಳಿಗೆ ಪ್ರವೇಶ
|
||||
|
||||
40+ ಭಾಷೆಗಳಲ್ಲಿ ಅನುವಾದಗಳು ಲಭ್ಯವಿವೆ:
|
||||
|
||||
```bash
|
||||
# ಅನುವಾದಿತ ಪಾಠಗಳನ್ನು ಪ್ರವೇಶಿಸಿ
|
||||
cd translations/fr # ಫ್ರೆಂಚ್
|
||||
cd translations/es # ಸ್ಪ್ಯಾನಿಷ್
|
||||
cd translations/de # ಜರ್ಮನ್
|
||||
# ... ಮತ್ತು ಇನ್ನೂ ಅನೇಕ
|
||||
```
|
||||
|
||||
ಪ್ರತಿ ಅನುವಾದವು ಇಂಗ್ಲಿಷ್ ಆವೃತ್ತಿಯಂತೆ ಅದೇ ರಚನೆಯನ್ನು ಕಾಯ್ದುಕೊಳ್ಳುತ್ತದೆ.
|
||||
|
||||
## ಹೆಚ್ಚುವರಿ ಸಂಪನ್ಮೂಲಗಳು
|
||||
|
||||
### ಅಧ್ಯಯನ ಮುಂದುವರಿಸಿ
|
||||
|
||||
- [Microsoft Learn](https://docs.microsoft.com/learn/) - ಹೆಚ್ಚುವರಿ ಅಧ್ಯಯನ ಮಾರ್ಗಗಳು
|
||||
- [ವಿದ್ಯಾರ್ಥಿ ಹಬ್](https://docs.microsoft.com/learn/student-hub) - ವಿದ್ಯಾರ್ಥಿಗಳಿಗಾಗಿ ಸಂಪನ್ಮೂಲಗಳು
|
||||
- [Azure AI Foundry](https://aka.ms/foundry/forum) - ಸಮುದಾಯ ವೇದಿಕೆ
|
||||
|
||||
### ಸಂಬಂಧಿತ ಪಠ್ಯಕ್ರಮಗಳು
|
||||
|
||||
- [ಬಿಗಿನರ್ಸ್ಗಾಗಿ AI](https://aka.ms/ai-beginners)
|
||||
- [ಬಿಗಿನರ್ಸ್ಗಾಗಿ ML](https://aka.ms/ml-beginners)
|
||||
- [ಬಿಗಿನರ್ಸ್ಗಾಗಿ ವೆಬ್ ಡೆವ್](https://aka.ms/webdev-beginners)
|
||||
- [ಬಿಗಿನರ್ಸ್ಗಾಗಿ ಜನರೇಟಿವ್ AI](https://aka.ms/genai-beginners)
|
||||
|
||||
## ಸಹಾಯ ಪಡೆಯುವುದು
|
||||
|
||||
- ಸಾಮಾನ್ಯ ಸಮಸ್ಯೆಗಳಿಗಾಗಿ [TROUBLESHOOTING.md](TROUBLESHOOTING.md) ಪರಿಶೀಲಿಸಿ
|
||||
- [GitHub Issues](https://github.com/microsoft/Data-Science-For-Beginners/issues) ನಲ್ಲಿ ಹುಡುಕಿ
|
||||
- ನಮ್ಮ [Discord](https://aka.ms/ds4beginners/discord) ಸೇರಿ
|
||||
- ಸಮಸ್ಯೆಗಳನ್ನು ವರದಿ ಮಾಡಲು ಅಥವಾ ಕೊಡುಗೆ ನೀಡಲು [CONTRIBUTING.md](CONTRIBUTING.md) ಪರಿಶೀಲಿಸಿ
|
||||
|
||||
---
|
||||
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
|
||||
**ಅಸ್ವೀಕರಣ**:
|
||||
ಈ ದಸ್ತಾವೇಜು AI ಅನುವಾದ ಸೇವೆ [Co-op Translator](https://github.com/Azure/co-op-translator) ಬಳಸಿ ಅನುವಾದಿಸಲಾಗಿದೆ. ನಾವು ನಿಖರತೆಯಿಗಾಗಿ ಪ್ರಯತ್ನಿಸುತ್ತಿದ್ದರೂ, ಸ್ವಯಂಚಾಲಿತ ಅನುವಾದಗಳಲ್ಲಿ ದೋಷಗಳು ಅಥವಾ ತಪ್ಪುಗಳು ಇರಬಹುದು ಎಂದು ದಯವಿಟ್ಟು ಗಮನಿಸಿ. ಮೂಲ ಭಾಷೆಯಲ್ಲಿರುವ ಮೂಲ ದಸ್ತಾವೇಜನ್ನು ಅಧಿಕೃತ ಮೂಲವೆಂದು ಪರಿಗಣಿಸಬೇಕು. ಮಹತ್ವದ ಮಾಹಿತಿಗಾಗಿ, ವೃತ್ತಿಪರ ಮಾನವ ಅನುವಾದವನ್ನು ಶಿಫಾರಸು ಮಾಡಲಾಗುತ್ತದೆ. ಈ ಅನುವಾದ ಬಳಕೆಯಿಂದ ಉಂಟಾಗುವ ಯಾವುದೇ ತಪ್ಪು ಅರ್ಥಮಾಡಿಕೊಳ್ಳುವಿಕೆ ಅಥವಾ ತಪ್ಪು ವಿವರಣೆಗಳಿಗೆ ನಾವು ಹೊಣೆಗಾರರಾಗುವುದಿಲ್ಲ.
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER END -->
|
||||
@ -0,0 +1,42 @@
|
||||
<!--
|
||||
CO_OP_TRANSLATOR_METADATA:
|
||||
{
|
||||
"original_hash": "3767555b3cc28a2865c79202f4374204",
|
||||
"translation_date": "2025-12-19T13:31:12+00:00",
|
||||
"source_file": "docs/_sidebar.md",
|
||||
"language_code": "kn"
|
||||
}
|
||||
-->
|
||||
- ಪರಿಚಯ
|
||||
- [ಡೇಟಾ ಸೈನ್ಸ್ ಅನ್ನು ವ್ಯಾಖ್ಯಾನಿಸುವುದು](../1-Introduction/01-defining-data-science/README.md)
|
||||
- [ಡೇಟಾ ಸೈನ್ಸ್ ನ ನೈತಿಕತೆ](../1-Introduction/02-ethics/README.md)
|
||||
- [ಡೇಟಾ ಅನ್ನು ವ್ಯಾಖ್ಯಾನಿಸುವುದು](../1-Introduction/03-defining-data/README.md)
|
||||
- [ಸಂಭಾವ್ಯತೆ ಮತ್ತು ಅಂಕಿಅಂಶಗಳು](../1-Introduction/04-stats-and-probability/README.md)
|
||||
- ಡೇಟಾ ಜೊತೆಗೆ ಕೆಲಸ ಮಾಡುವುದು
|
||||
- [ಸಂಬಂಧಿತ ಡೇಟಾಬೇಸ್ಗಳು](../2-Working-With-Data/05-relational-databases/README.md)
|
||||
- [ಅಸಂಬಂಧಿತ ಡೇಟಾಬೇಸ್ಗಳು](../2-Working-With-Data/06-non-relational/README.md)
|
||||
- [ಪೈಥಾನ್](../2-Working-With-Data/07-python/README.md)
|
||||
- [ಡೇಟಾ ತಯಾರಿ](../2-Working-With-Data/08-data-preparation/README.md)
|
||||
- ಡೇಟಾ ದೃಶ್ಯೀಕರಣ
|
||||
- [ಪ್ರಮಾಣಗಳನ್ನು ದೃಶ್ಯೀಕರಿಸುವುದು](../3-Data-Visualization/09-visualization-quantities/README.md)
|
||||
- [ವಿತರಣೆಯನ್ನು ದೃಶ್ಯೀಕರಿಸುವುದು](../3-Data-Visualization/10-visualization-distributions/README.md)
|
||||
- [ಪ್ರಮಾಣಾಂಶಗಳನ್ನು ದೃಶ್ಯೀಕರಿಸುವುದು](../3-Data-Visualization/11-visualization-proportions/README.md)
|
||||
- [ಸಂಬಂಧಗಳನ್ನು ದೃಶ್ಯೀಕರಿಸುವುದು](../3-Data-Visualization/12-visualization-relationships/README.md)
|
||||
- [ಅರ್ಥಪೂರ್ಣ ದೃಶ್ಯೀಕರಣಗಳು](../3-Data-Visualization/13-meaningful-visualizations/README.md)
|
||||
- ಡೇಟಾ ಸೈನ್ಸ್ ಜೀವನಚಕ್ರ
|
||||
- [ಪರಿಚಯ](../4-Data-Science-Lifecycle/14-Introduction/README.md)
|
||||
- [ವಿಶ್ಲೇಷಣೆ](../4-Data-Science-Lifecycle/15-analyzing/README.md)
|
||||
- [ಸಂವಹನ](../4-Data-Science-Lifecycle/16-communication/README.md)
|
||||
- ಕ್ಲೌಡ್ನಲ್ಲಿ ಡೇಟಾ ಸೈನ್ಸ್
|
||||
- [ಪರಿಚಯ](../5-Data-Science-In-Cloud/17-Introduction/README.md)
|
||||
- [ಕಡಿಮೆ ಕೋಡ್](../5-Data-Science-In-Cloud/18-Low-Code/README.md)
|
||||
- [ಅಜೂರ್](../5-Data-Science-In-Cloud/19-Azure/README.md)
|
||||
- ಕಾಡಿನಲ್ಲಿ ಡೇಟಾ ಸೈನ್ಸ್
|
||||
- [ಕಾಡಿನಲ್ಲಿ ಡಿಎಸ್](../6-Data-Science-In-Wild/README.md)
|
||||
|
||||
---
|
||||
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
|
||||
**ಅಸ್ವೀಕರಣ**:
|
||||
ಈ ದಸ್ತಾವೇಜು [Co-op Translator](https://github.com/Azure/co-op-translator) ಎಂಬ AI ಅನುವಾದ ಸೇವೆಯನ್ನು ಬಳಸಿ ಅನುವಾದಿಸಲಾಗಿದೆ. ನಾವು ಶುದ್ಧತೆಯತ್ತ ಪ್ರಯತ್ನಿಸುತ್ತಿದ್ದರೂ, ಸ್ವಯಂಚಾಲಿತ ಅನುವಾದಗಳಲ್ಲಿ ತಪ್ಪುಗಳು ಅಥವಾ ಅಸತ್ಯತೆಗಳು ಇರಬಹುದು ಎಂದು ದಯವಿಟ್ಟು ಗಮನಿಸಿ. ಮೂಲ ಭಾಷೆಯಲ್ಲಿರುವ ಮೂಲ ದಸ್ತಾವೇಜನ್ನು ಅಧಿಕೃತ ಮೂಲವೆಂದು ಪರಿಗಣಿಸಬೇಕು. ಮಹತ್ವದ ಮಾಹಿತಿಗಾಗಿ, ವೃತ್ತಿಪರ ಮಾನವ ಅನುವಾದವನ್ನು ಶಿಫಾರಸು ಮಾಡಲಾಗುತ್ತದೆ. ಈ ಅನುವಾದ ಬಳಕೆಯಿಂದ ಉಂಟಾಗುವ ಯಾವುದೇ ತಪ್ಪು ಅರ್ಥಮಾಡಿಕೊಳ್ಳುವಿಕೆ ಅಥವಾ ತಪ್ಪು ವಿವರಣೆಗಳಿಗೆ ನಾವು ಹೊಣೆಗಾರರಾಗುವುದಿಲ್ಲ.
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER END -->
|
||||
@ -0,0 +1,151 @@
|
||||
<!--
|
||||
CO_OP_TRANSLATOR_METADATA:
|
||||
{
|
||||
"original_hash": "9bef7fd96c8f262339933117d9b3e342",
|
||||
"translation_date": "2025-12-19T13:28:44+00:00",
|
||||
"source_file": "examples/README.md",
|
||||
"language_code": "kn"
|
||||
}
|
||||
-->
|
||||
# ಆರಂಭಿಕರಿಗಾಗಿ ಸ್ನೇಹಪರ ಡೇಟಾ ಸೈನ್ಸ್ ಉದಾಹರಣೆಗಳು
|
||||
|
||||
ಉದಾಹರಣೆಗಳ ಡೈರೆಕ್ಟರಿಗೆ ಸ್ವಾಗತ! ಈ ಸರಳ, ಚೆನ್ನಾಗಿ ಕಾಮೆಂಟ್ ಮಾಡಲಾದ ಉದಾಹರಣೆಗಳ ಸಂಗ್ರಹವು ನೀವು ಸಂಪೂರ್ಣ ಆರಂಭಿಕರಾಗಿದ್ದರೂ ಸಹ ಡೇಟಾ ಸೈನ್ಸ್ ಪ್ರಾರಂಭಿಸಲು ಸಹಾಯ ಮಾಡಲು ವಿನ್ಯಾಸಗೊಳಿಸಲಾಗಿದೆ.
|
||||
|
||||
## 📚 ನೀವು ಇಲ್ಲಿ ಏನು ಕಾಣುತ್ತೀರಿ
|
||||
|
||||
ಪ್ರತಿ ಉದಾಹರಣೆ ಸ್ವತಂತ್ರವಾಗಿದ್ದು ಮತ್ತು ಒಳಗೊಂಡಿದೆ:
|
||||
- **ಪ್ರತಿ ಹಂತವನ್ನು ವಿವರಿಸುವ ಸ್ಪಷ್ಟ ಕಾಮೆಂಟ್ಗಳು**
|
||||
- **ಒಂದು ಸಮಯದಲ್ಲಿ ಒಂದು ತತ್ವವನ್ನು ತೋರಿಸುವ ಸರಳ, ಓದಲು ಸುಲಭವಾದ ಕೋಡ್**
|
||||
- **ಈ ತಂತ್ರಗಳನ್ನು ಯಾವಾಗ ಮತ್ತು ಏಕೆ ಬಳಸಬೇಕು ಎಂಬುದನ್ನು ಅರ್ಥಮಾಡಿಕೊಳ್ಳಲು ನೈಜ-ಜಗತ್ತಿನ ಸನ್ನಿವೇಶ**
|
||||
- **ನಿರೀಕ್ಷಿತ ಔಟ್ಪುಟ್** ನೀವು ಏನು ನೋಡಬೇಕೆಂದು ತಿಳಿಯಲು
|
||||
|
||||
## 🚀 ಪ್ರಾರಂಭಿಸುವುದು
|
||||
|
||||
### ಪೂರ್ವಾಪೇಕ್ಷಿತಗಳು
|
||||
ಈ ಉದಾಹರಣೆಗಳನ್ನು ಚಾಲನೆ ಮಾಡುವ ಮೊದಲು, ಖಚಿತಪಡಿಸಿಕೊಳ್ಳಿ ನೀವು ಹೊಂದಿರುವುದು:
|
||||
- Python 3.7 ಅಥವಾ ಅದಕ್ಕಿಂತ ಮೇಲಿನ ಆವೃತ್ತಿ ಸ್ಥಾಪಿಸಲಾಗಿದೆ
|
||||
- Python ಸ್ಕ್ರಿಪ್ಟ್ಗಳನ್ನು ಹೇಗೆ ಚಾಲನೆ ಮಾಡುವುದು ಎಂಬ ಮೂಲಭೂತ ಅರ್ಥ
|
||||
|
||||
### ಅಗತ್ಯ ಗ್ರಂಥಾಲಯಗಳನ್ನು ಸ್ಥಾಪಿಸುವುದು
|
||||
```bash
|
||||
pip install pandas numpy matplotlib
|
||||
```
|
||||
|
||||
## 📖 ಉದಾಹರಣೆಗಳ ಅವಲೋಕನ
|
||||
|
||||
### 1. ಹಲೋ ವರ್ಲ್ಡ್ - ಡೇಟಾ ಸೈನ್ಸ್ ಶೈಲಿ
|
||||
**ಫೈಲ್:** `01_hello_world_data_science.py`
|
||||
|
||||
ನಿಮ್ಮ ಮೊದಲ ಡೇಟಾ ಸೈನ್ಸ್ ಪ್ರೋಗ್ರಾಂ! ಕಲಿಯಿರಿ ಹೇಗೆ:
|
||||
- ಸರಳ ಡೇಟಾಸೆಟ್ ಅನ್ನು ಲೋಡ್ ಮಾಡುವುದು
|
||||
- ನಿಮ್ಮ ಡೇಟಾ ಬಗ್ಗೆ ಮೂಲಭೂತ ಮಾಹಿತಿಯನ್ನು ಪ್ರದರ್ಶಿಸುವುದು
|
||||
- ನಿಮ್ಮ ಮೊದಲ ಡೇಟಾ ಸೈನ್ಸ್ ಔಟ್ಪುಟ್ ಅನ್ನು ಮುದ್ರಿಸುವುದು
|
||||
|
||||
ನಿಜವಾಗಿಯೂ ಆರಂಭಿಕರಿಗೆ ಇದು ಅವರ ಮೊದಲ ಡೇಟಾ ಸೈನ್ಸ್ ಪ್ರೋಗ್ರಾಂ ಅನ್ನು ಕಾರ್ಯನಿರ್ವಹಿಸುವುದನ್ನು ನೋಡಲು ಪರಿಪೂರ್ಣ.
|
||||
|
||||
---
|
||||
|
||||
### 2. ಡೇಟಾ ಲೋಡ್ ಮಾಡುವುದು ಮತ್ತು ಅನ್ವೇಷಿಸುವುದು
|
||||
**ಫೈಲ್:** `02_loading_data.py`
|
||||
|
||||
ಡೇಟಾ ಜೊತೆ ಕೆಲಸ ಮಾಡುವ ಮೂಲಭೂತಗಳನ್ನು ಕಲಿಯಿರಿ:
|
||||
- CSV ಫೈಲ್ಗಳಿಂದ ಡೇಟಾ ಓದುವುದು
|
||||
- ನಿಮ್ಮ ಡೇಟಾಸೆಟ್ನ ಮೊದಲ ಕೆಲವು ಸಾಲುಗಳನ್ನು ವೀಕ್ಷಿಸುವುದು
|
||||
- ನಿಮ್ಮ ಡೇಟಾ ಬಗ್ಗೆ ಮೂಲಭೂತ ಅಂಕಿಅಂಶಗಳನ್ನು ಪಡೆಯುವುದು
|
||||
- ಡೇಟಾ ಪ್ರಕಾರಗಳನ್ನು ಅರ್ಥಮಾಡಿಕೊಳ್ಳುವುದು
|
||||
|
||||
ಇದು ಯಾವುದೇ ಡೇಟಾ ಸೈನ್ಸ್ ಯೋಜನೆಯ ಮೊದಲ ಹಂತವಾಗಿರುತ್ತದೆ!
|
||||
|
||||
---
|
||||
|
||||
### 3. ಸರಳ ಡೇಟಾ ವಿಶ್ಲೇಷಣೆ
|
||||
**ಫೈಲ್:** `03_simple_analysis.py`
|
||||
|
||||
ನಿಮ್ಮ ಮೊದಲ ಡೇಟಾ ವಿಶ್ಲೇಷಣೆಯನ್ನು ನಿರ್ವಹಿಸಿ:
|
||||
- ಮೂಲಭೂತ ಅಂಕಿಅಂಶಗಳನ್ನು ಲೆಕ್ಕಹಾಕಿ (ಸರಾಸರಿ, ಮಧ್ಯಮ, ಮೋಡ್)
|
||||
- ಗರಿಷ್ಠ ಮತ್ತು ಕನಿಷ್ಠ ಮೌಲ್ಯಗಳನ್ನು ಕಂಡುಹಿಡಿಯಿರಿ
|
||||
- ಮೌಲ್ಯಗಳ ಸಂಭವನೆಯನ್ನು ಎಣಿಸಿ
|
||||
- ಶರತ್ತುಗಳ ಆಧಾರದ ಮೇಲೆ ಡೇಟಾವನ್ನು ಫಿಲ್ಟರ್ ಮಾಡಿ
|
||||
|
||||
ನಿಮ್ಮ ಡೇಟಾ ಬಗ್ಗೆ ಸರಳ ಪ್ರಶ್ನೆಗಳಿಗೆ ಉತ್ತರಿಸುವುದನ್ನು ನೋಡಿ.
|
||||
|
||||
---
|
||||
|
||||
### 4. ಡೇಟಾ ದೃಶ್ಯೀಕರಣ ಮೂಲಭೂತಗಳು
|
||||
**ಫೈಲ್:** `04_basic_visualization.py`
|
||||
|
||||
ನಿಮ್ಮ ಮೊದಲ ದೃಶ್ಯೀಕರಣಗಳನ್ನು ರಚಿಸಿ:
|
||||
- ಸರಳ ಬಾರ್ ಚಾರ್ಟ್ ಮಾಡಿ
|
||||
- ಲೈನ್ ಪ್ಲಾಟ್ ರಚಿಸಿ
|
||||
- ಪೈ ಚಾರ್ಟ್ ತಯಾರಿಸಿ
|
||||
- ನಿಮ್ಮ ದೃಶ್ಯೀಕರಣಗಳನ್ನು ಚಿತ್ರಗಳಾಗಿ ಉಳಿಸಿ
|
||||
|
||||
ನಿಮ್ಮ ಕಂಡುಹಿಡಿತಗಳನ್ನು ದೃಶ್ಯವಾಗಿ ಸಂವಹನ ಮಾಡಲು ಕಲಿಯಿರಿ!
|
||||
|
||||
---
|
||||
|
||||
### 5. ನೈಜ ಡೇಟಾ ಜೊತೆ ಕೆಲಸ ಮಾಡುವುದು
|
||||
**ಫೈಲ್:** `05_real_world_example.py`
|
||||
|
||||
ಎಲ್ಲವನ್ನು ಒಟ್ಟುಗೂಡಿಸಿ ಸಂಪೂರ್ಣ ಉದಾಹರಣೆಯನ್ನು ಮಾಡಿ:
|
||||
- ರೆಪೊಸಿಟರಿಯಿಂದ ನೈಜ ಡೇಟಾ ಲೋಡ್ ಮಾಡುವುದು
|
||||
- ಡೇಟಾವನ್ನು ಸ್ವಚ್ಛಗೊಳಿಸಿ ಮತ್ತು ಸಿದ್ಧಪಡಿಸಿ
|
||||
- ವಿಶ್ಲೇಷಣೆ ನಡೆಸಿ
|
||||
- ಅರ್ಥಪೂರ್ಣ ದೃಶ್ಯೀಕರಣಗಳನ್ನು ರಚಿಸಿ
|
||||
- ನಿರ್ಣಯಗಳನ್ನು ತೆಗೆದುಕೊಳ್ಳಿ
|
||||
|
||||
ಈ ಉದಾಹರಣೆ ಆರಂಭದಿಂದ ಕೊನೆವರೆಗೆ ಸಂಪೂರ್ಣ ಕಾರ್ಯಪ್ರವಾಹವನ್ನು ತೋರಿಸುತ್ತದೆ.
|
||||
|
||||
---
|
||||
|
||||
## 🎯 ಈ ಉದಾಹರಣೆಗಳನ್ನು ಹೇಗೆ ಬಳಸುವುದು
|
||||
|
||||
1. **ಆರಂಭದಿಂದ ಪ್ರಾರಂಭಿಸಿ**: ಉದಾಹರಣೆಗಳು ಕಷ್ಟದ ಕ್ರಮದಲ್ಲಿ ಸಂಖ್ಯೆಬದ್ಧವಾಗಿವೆ. `01_hello_world_data_science.py` ನಿಂದ ಪ್ರಾರಂಭಿಸಿ ಮತ್ತು ಕ್ರಮವಾಗಿ ಮುಂದುವರಿಯಿರಿ.
|
||||
|
||||
2. **ಕಾಮೆಂಟ್ಗಳನ್ನು ಓದಿ**: ಪ್ರತಿ ಫೈಲ್ನಲ್ಲಿ ಕೋಡ್ ಏನು ಮಾಡುತ್ತದೆ ಮತ್ತು ಏಕೆ ಎಂದು ವಿವರಿಸುವ ವಿವರವಾದ ಕಾಮೆಂಟ್ಗಳಿವೆ. ಅವುಗಳನ್ನು ಗಮನದಿಂದ ಓದಿ!
|
||||
|
||||
3. **ಪ್ರಯೋಗ ಮಾಡಿ**: ಕೋಡ್ ಅನ್ನು ಬದಲಾಯಿಸಲು ಪ್ರಯತ್ನಿಸಿ. ಮೌಲ್ಯವನ್ನು ಬದಲಾಯಿಸಿದರೆ ಏನಾಗುತ್ತದೆ? ತಪ್ಪುಗಳನ್ನು ಮಾಡಿ ಮತ್ತು ಸರಿಪಡಿಸಿ - ಹೀಗೆ ನೀವು ಕಲಿಯುತ್ತೀರಿ!
|
||||
|
||||
4. **ಕೋಡ್ ಅನ್ನು ಚಾಲನೆ ಮಾಡಿ**: ಪ್ರತಿ ಉದಾಹರಣೆಯನ್ನು ಕಾರ್ಯಗತಗೊಳಿಸಿ ಮತ್ತು ಔಟ್ಪುಟ್ ಅನ್ನು ಗಮನಿಸಿ. ನೀವು ನಿರೀಕ್ಷಿಸಿದದನ್ನು ಹೋಲಿಸಿ.
|
||||
|
||||
5. **ಅದರ ಮೇಲೆ ನಿರ್ಮಿಸಿ**: ಒಂದು ಉದಾಹರಣೆಯನ್ನು ಅರ್ಥಮಾಡಿಕೊಂಡ ನಂತರ, ನಿಮ್ಮ ಸ್ವಂತ ಆಲೋಚನೆಗಳೊಂದಿಗೆ ಅದನ್ನು ವಿಸ್ತರಿಸಲು ಪ್ರಯತ್ನಿಸಿ.
|
||||
|
||||
## 💡 ಆರಂಭಿಕರಿಗಾಗಿ ಸಲಹೆಗಳು
|
||||
|
||||
- **ತ್ವರೆಯಲ್ಲದೆ**: ಮುಂದಿನ ಉದಾಹರಣೆಗೆ ಹೋಗುವ ಮೊದಲು ಪ್ರತಿ ಉದಾಹರಣೆಯನ್ನು ಅರ್ಥಮಾಡಿಕೊಳ್ಳಲು ಸಮಯ ತೆಗೆದುಕೊಳ್ಳಿ
|
||||
- **ಕೋಡ್ ಅನ್ನು ಸ್ವತಃ ಟೈಪ್ ಮಾಡಿ**: ಕಾಪಿ-ಪೇಸ್ಟ್ ಮಾಡಬೇಡಿ. ಟೈಪಿಂಗ್ ನಿಮಗೆ ಕಲಿಯಲು ಮತ್ತು ನೆನಪಿಡಲು ಸಹಾಯ ಮಾಡುತ್ತದೆ
|
||||
- **ಅಪರಿಚಿತ ತತ್ವಗಳನ್ನು ಹುಡುಕಿ**: ನೀವು ಅರ್ಥಮಾಡಿಕೊಳ್ಳದ ಯಾವುದಾದರೂ ಕಂಡರೆ, ಅದನ್ನು ಆನ್ಲೈನ್ ಅಥವಾ ಮುಖ್ಯ ಪಾಠಗಳಲ್ಲಿ ಹುಡುಕಿ
|
||||
- **ಪ್ರಶ್ನೆಗಳನ್ನು ಕೇಳಿ**: ಸಹಾಯ ಬೇಕಾದರೆ [ಚರ್ಚಾ ವೇದಿಕೆ](https://github.com/microsoft/Data-Science-For-Beginners/discussions) ಸೇರಿ
|
||||
- **ನಿಯಮಿತವಾಗಿ ಅಭ್ಯಾಸ ಮಾಡಿ**: ವಾರಕ್ಕೆ ಒಂದು ಬಾರಿ ದೀರ್ಘ ಅವಧಿ ಬದಲು ಪ್ರತಿದಿನ ಸ್ವಲ್ಪ ಕೋಡ್ ಮಾಡಲು ಪ್ರಯತ್ನಿಸಿ
|
||||
|
||||
## 🔗 ಮುಂದಿನ ಹಂತಗಳು
|
||||
|
||||
ಈ ಉದಾಹರಣೆಗಳನ್ನು ಪೂರ್ಣಗೊಳಿಸಿದ ನಂತರ, ನೀವು ಸಿದ್ಧರಾಗಿದ್ದೀರಿ:
|
||||
- ಮುಖ್ಯ ಪಠ್ಯಕ್ರಮ ಪಾಠಗಳನ್ನು ಅನುಸರಿಸಲು
|
||||
- ಪ್ರತಿ ಪಾಠ ಫೋಲ್ಡರ್ನಲ್ಲಿನ ನಿಯೋಜನೆಗಳನ್ನು ಪ್ರಯತ್ನಿಸಲು
|
||||
- ಹೆಚ್ಚಿನ ಆಳವಾದ ಕಲಿಕೆಗೆ ಜುಪಿಟರ್ ನೋಟ್ಬುಕ್ಗಳನ್ನು ಅನ್ವೇಷಿಸಲು
|
||||
- ನಿಮ್ಮ ಸ್ವಂತ ಡೇಟಾ ಸೈನ್ಸ್ ಯೋಜನೆಗಳನ್ನು ರಚಿಸಲು
|
||||
|
||||
## 📚 ಹೆಚ್ಚುವರಿ ಸಂಪನ್ಮೂಲಗಳು
|
||||
|
||||
- [ಮುಖ್ಯ ಪಠ್ಯಕ್ರಮ](../README.md) - ಸಂಪೂರ್ಣ 20-ಪಾಠ ಕೋರ್ಸ್
|
||||
- [ಶಿಕ್ಷಕರಿಗಾಗಿ](../for-teachers.md) - ನಿಮ್ಮ ತರಗತಿಯಲ್ಲಿ ಈ ಪಠ್ಯಕ್ರಮವನ್ನು ಬಳಸುವುದು
|
||||
- [Microsoft Learn](https://docs.microsoft.com/learn/) - ಉಚಿತ ಆನ್ಲೈನ್ ಕಲಿಕೆ ಸಂಪನ್ಮೂಲಗಳು
|
||||
- [Python ಡಾಕ್ಯುಮೆಂಟೇಶನ್](https://docs.python.org/3/) - ಅಧಿಕೃತ Python ರೆಫರೆನ್ಸ್
|
||||
|
||||
## 🤝 ಕೊಡುಗೆ ನೀಡುವುದು
|
||||
|
||||
ದೋಷ ಕಂಡುಹಿಡಿದಿದ್ದೀರಾ ಅಥವಾ ಹೊಸ ಉದಾಹರಣೆಗೆ ಐಡಿಯಾ ಇದೆಯಾ? ನಾವು ಕೊಡುಗೆಗಳನ್ನು ಸ್ವಾಗತಿಸುತ್ತೇವೆ! ದಯವಿಟ್ಟು ನಮ್ಮ [ಕೊಡುಗೆ ಮಾರ್ಗದರ್ಶಿ](../CONTRIBUTING.md) ನೋಡಿ.
|
||||
|
||||
---
|
||||
|
||||
**ಸಂತೋಷಕರ ಕಲಿಕೆ! 🎉**
|
||||
|
||||
ಮರೆಮಾಡಬೇಡಿ: ಪ್ರತಿಯೊಬ್ಬ ಪರಿಣಿತರೂ ಒಮ್ಮೆ ಆರಂಭಿಕರಾಗಿದ್ದರು. ಒಂದು ಹಂತವನ್ನು ಒಂದು ಸಮಯದಲ್ಲಿ ತೆಗೆದುಕೊಳ್ಳಿ, ಮತ್ತು ತಪ್ಪುಗಳನ್ನು ಮಾಡಲು ಭಯಪಡಬೇಡಿ - ಅವು ಕಲಿಕೆಯ ಭಾಗವಾಗಿವೆ!
|
||||
|
||||
---
|
||||
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
|
||||
**ಅಸ್ವೀಕಾರ**:
|
||||
ಈ ದಸ್ತಾವೇಜು AI ಅನುವಾದ ಸೇವೆ [Co-op Translator](https://github.com/Azure/co-op-translator) ಬಳಸಿ ಅನುವಾದಿಸಲಾಗಿದೆ. ನಾವು ನಿಖರತೆಯಿಗಾಗಿ ಪ್ರಯತ್ನಿಸುತ್ತಿದ್ದರೂ, ಸ್ವಯಂಚಾಲಿತ ಅನುವಾದಗಳಲ್ಲಿ ದೋಷಗಳು ಅಥವಾ ಅಸತ್ಯತೆಗಳು ಇರಬಹುದು ಎಂದು ದಯವಿಟ್ಟು ಗಮನಿಸಿ. ಮೂಲ ಭಾಷೆಯಲ್ಲಿರುವ ಮೂಲ ದಸ್ತಾವೇಜನ್ನು ಅಧಿಕೃತ ಮೂಲವೆಂದು ಪರಿಗಣಿಸಬೇಕು. ಮಹತ್ವದ ಮಾಹಿತಿಗಾಗಿ, ವೃತ್ತಿಪರ ಮಾನವ ಅನುವಾದವನ್ನು ಶಿಫಾರಸು ಮಾಡಲಾಗುತ್ತದೆ. ಈ ಅನುವಾದ ಬಳಕೆಯಿಂದ ಉಂಟಾಗುವ ಯಾವುದೇ ತಪ್ಪು ಅರ್ಥಮಾಡಿಕೊಳ್ಳುವಿಕೆ ಅಥವಾ ತಪ್ಪು ವಿವರಣೆಗಳಿಗೆ ನಾವು ಹೊಣೆಗಾರರಾಗುವುದಿಲ್ಲ.
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER END -->
|
||||
@ -0,0 +1,78 @@
|
||||
<!--
|
||||
CO_OP_TRANSLATOR_METADATA:
|
||||
{
|
||||
"original_hash": "f7440be10c17a8a9262713af3d2818a9",
|
||||
"translation_date": "2025-12-19T12:41:35+00:00",
|
||||
"source_file": "for-teachers.md",
|
||||
"language_code": "kn"
|
||||
}
|
||||
-->
|
||||
## ಶಿಕ್ಷಕರಿಗಾಗಿ
|
||||
|
||||
ನೀವು ಈ ಪಠ್ಯಕ್ರಮವನ್ನು ನಿಮ್ಮ ತರಗತಿಯಲ್ಲಿ ಬಳಸಲು ಇಚ್ಛಿಸುತ್ತೀರಾ? ದಯವಿಟ್ಟು ಮುಕ್ತವಾಗಿ ಬಳಸಿಕೊಳ್ಳಿ!
|
||||
|
||||
ವಾಸ್ತವದಲ್ಲಿ, ನೀವು GitHub Classroom ಬಳಸಿ GitHub ನೊಳಗೆ ಇದನ್ನು ಬಳಸಬಹುದು.
|
||||
|
||||
ಅದಕ್ಕಾಗಿ, ಈ ರೆಪೊವನ್ನು ಫೋರ್ಕ್ ಮಾಡಿ. ಪ್ರತಿಯೊಂದು ಪಾಠಕ್ಕಾಗಿ ನೀವು ಒಂದು ರೆಪೊ ಸೃಷ್ಟಿಸಬೇಕಾಗುತ್ತದೆ, ಆದ್ದರಿಂದ ಪ್ರತಿಯೊಂದು ಫೋಲ್ಡರ್ ಅನ್ನು ಪ್ರತ್ಯೇಕ ರೆಪೊಗೆ ಹೊರತೆಗೆಯಬೇಕಾಗುತ್ತದೆ. ಆ ರೀತಿಯಲ್ಲಿ, [GitHub Classroom](https://classroom.github.com/classrooms) ಪ್ರತಿ ಪಾಠವನ್ನು ಪ್ರತ್ಯೇಕವಾಗಿ ಹಿಡಿಯಬಹುದು.
|
||||
|
||||
ಈ [ಪೂರ್ಣ ಸೂಚನೆಗಳು](https://github.blog/2020-03-18-set-up-your-digital-classroom-with-github-classroom/) ನಿಮ್ಮ ತರಗತಿಯನ್ನು ಹೇಗೆ ಸೆಟ್ ಅಪ್ ಮಾಡುವುದು ಎಂಬುದರ ಬಗ್ಗೆ ನಿಮಗೆ ಒಂದು ಕಲ್ಪನೆ ನೀಡುತ್ತವೆ.
|
||||
|
||||
## ರೆಪೊವನ್ನು ಹಾಗೆ ಬಳಸುವುದು
|
||||
|
||||
ನೀವು GitHub Classroom ಬಳಸದೆ ಈ ರೆಪೊವನ್ನು ಪ್ರಸ್ತುತ ಸ್ಥಿತಿಯಲ್ಲಿ ಬಳಸಲು ಇಚ್ಛಿಸಿದರೆ, ಅದು ಸಹ ಸಾಧ್ಯ. ನೀವು ನಿಮ್ಮ ವಿದ್ಯಾರ್ಥಿಗಳೊಂದಿಗೆ ಯಾವ ಪಾಠವನ್ನು ಒಟ್ಟಿಗೆ ಕೆಲಸ ಮಾಡಬೇಕೆಂದು ಸಂವಹನ ಮಾಡಬೇಕಾಗುತ್ತದೆ.
|
||||
|
||||
ಆನ್ಲೈನ್ ಫಾರ್ಮ್ಯಾಟ್ (Zoom, Teams, ಅಥವಾ ಇತರೆ) ನಲ್ಲಿ ನೀವು ಕ್ವಿಜ್ಗಳಿಗಾಗಿ ಬ್ರೇಕ್ಔಟ್ ರೂಮ್ಗಳನ್ನು ರಚಿಸಬಹುದು ಮತ್ತು ವಿದ್ಯಾರ್ಥಿಗಳನ್ನು ಕಲಿಯಲು ಸಿದ್ಧರಾಗಲು ಮಾರ್ಗದರ್ಶನ ಮಾಡಬಹುದು. ನಂತರ ವಿದ್ಯಾರ್ಥಿಗಳನ್ನು ಕ್ವಿಜ್ಗಳಿಗೆ ಆಹ್ವಾನಿಸಿ, ನಿರ್ದಿಷ್ಟ ಸಮಯದಲ್ಲಿ 'issues' ಆಗಿ ಉತ್ತರಗಳನ್ನು ಸಲ್ಲಿಸಲು ಹೇಳಬಹುದು. ನೀವು ಬಯಸಿದರೆ, ವಿದ್ಯಾರ್ಥಿಗಳು ಸಹಕಾರದಿಂದ ಹೊರಗೆ ಕೆಲಸ ಮಾಡಲು, ಅಸೈನ್ಮೆಂಟ್ಗಳಿಗೂ ಇದೇ ರೀತಿಯ ವ್ಯವಸ್ಥೆ ಮಾಡಬಹುದು.
|
||||
|
||||
ನೀವು ಹೆಚ್ಚು ಖಾಸಗಿ ಫಾರ್ಮ್ಯಾಟ್ ಇಚ್ಛಿಸಿದರೆ, ನಿಮ್ಮ ವಿದ್ಯಾರ್ಥಿಗಳಿಗೆ ಪಠ್ಯಕ್ರಮವನ್ನು ಪಾಠದ ಮೂಲಕ ಫೋರ್ಕ್ ಮಾಡಿ, ತಮ್ಮ ಸ್ವಂತ GitHub ರೆಪೊಗಳಲ್ಲಿ ಖಾಸಗಿ ರೆಪೊಗಳಾಗಿ ಇಟ್ಟುಕೊಳ್ಳಲು ಹೇಳಿ, ಮತ್ತು ನಿಮಗೆ ಪ್ರವೇಶವನ್ನು ನೀಡಿ. ನಂತರ ಅವರು ಖಾಸಗಿ ರೀತಿಯಲ್ಲಿ ಕ್ವಿಜ್ಗಳು ಮತ್ತು ಅಸೈನ್ಮೆಂಟ್ಗಳನ್ನು ಪೂರ್ಣಗೊಳಿಸಿ, ನಿಮ್ಮ ತರಗತಿ ರೆಪೊದಲ್ಲಿ issues ಮೂಲಕ ನಿಮಗೆ ಸಲ್ಲಿಸಬಹುದು.
|
||||
|
||||
ಆನ್ಲೈನ್ ತರಗತಿ ಫಾರ್ಮ್ಯಾಟ್ನಲ್ಲಿ ಇದನ್ನು ಕಾರ್ಯಗತಗೊಳಿಸುವ ಅನೇಕ ಮಾರ್ಗಗಳಿವೆ. ದಯವಿಟ್ಟು ನಿಮಗೆ ಯಾವುದು ಉತ್ತಮವಾಗಿ ಕೆಲಸ ಮಾಡುತ್ತದೆ ಎಂದು ನಮಗೆ ತಿಳಿಸಿ!
|
||||
|
||||
## ಈ ಪಠ್ಯಕ್ರಮದಲ್ಲಿ ಸೇರಿಸಲಾಗಿದೆ:
|
||||
|
||||
20 ಪಾಠಗಳು, 40 ಕ್ವಿಜ್ಗಳು, ಮತ್ತು 20 ಅಸೈನ್ಮೆಂಟ್ಗಳು. ದೃಶ್ಯ ಕಲಿಕಾರ್ಥಿಗಳಿಗೆ ಪಾಠಗಳಿಗೆ ಸ್ಕೆಚ್ನೋಟ್ಸ್ ಸಹ ಸೇರಿವೆ. ಅನೇಕ ಪಾಠಗಳು Python ಮತ್ತು R ಎರಡೂ ಭಾಷೆಗಳಲ್ಲಿ ಲಭ್ಯವಿದ್ದು, VS Code ನಲ್ಲಿ Jupyter ನೋಟ್ಬುಕ್ಗಳನ್ನು ಬಳಸಿಕೊಂಡು ಪೂರ್ಣಗೊಳಿಸಬಹುದು. ಈ ತಂತ್ರಜ್ಞಾನ ಸ್ಟ್ಯಾಕ್ ಅನ್ನು ಬಳಸಲು ನಿಮ್ಮ ತರಗತಿಯನ್ನು ಹೇಗೆ ಸೆಟ್ ಅಪ್ ಮಾಡುವುದು ಎಂಬುದರ ಬಗ್ಗೆ ಹೆಚ್ಚಿನ ಮಾಹಿತಿಗಾಗಿ: https://code.visualstudio.com/docs/datascience/jupyter-notebooks.
|
||||
|
||||
ಎಲ್ಲಾ ಸ್ಕೆಚ್ನೋಟ್ಸ್, ದೊಡ್ಡ ಫಾರ್ಮ್ಯಾಟ್ ಪೋಸ್ಟರ್ ಸೇರಿದಂತೆ, [ಈ ಫೋಲ್ಡರ್](../../sketchnotes) ನಲ್ಲಿ ಇವೆ.
|
||||
|
||||
ನೀವು ಈ ಪಠ್ಯಕ್ರಮವನ್ನು ಸ್ವತಂತ್ರ, ಆಫ್ಲೈನ್-ಸ್ನೇಹಿ ವೆಬ್ಸೈಟ್ ಆಗಿ [Docsify](https://docsify.js.org/#/) ಬಳಸಿ ನಡೆಸಬಹುದು. ನಿಮ್ಮ ಸ್ಥಳೀಯ ಯಂತ್ರದಲ್ಲಿ [Docsify ಅನ್ನು ಇನ್ಸ್ಟಾಲ್ ಮಾಡಿ](https://docsify.js.org/#/quickstart), ನಂತರ ಈ ರೆಪೊನ ಸ್ಥಳೀಯ ಪ್ರತಿಯುತದ ರೂಟ್ ಫೋಲ್ಡರ್ನಲ್ಲಿ `docsify serve` ಟೈಪ್ ಮಾಡಿ. ವೆಬ್ಸೈಟ್ ನಿಮ್ಮ ಲೋಕಲ್ಹೋಸ್ಟ್ನಲ್ಲಿ 3000 ಪೋರ್ಟ್ನಲ್ಲಿ ಸರ್ವ್ ಆಗುತ್ತದೆ: `localhost:3000`.
|
||||
|
||||
ಪಠ್ಯಕ್ರಮದ ಆಫ್ಲೈನ್-ಸ್ನೇಹಿ ಆವೃತ್ತಿ ಸ್ವತಂತ್ರ ವೆಬ್ ಪುಟವಾಗಿ ತೆರೆಯುತ್ತದೆ: https://localhost:3000
|
||||
|
||||
ಪಾಠಗಳು 6 ಭಾಗಗಳಾಗಿ ಗುಂಪುಮಾಡಲಾಗಿದೆ:
|
||||
|
||||
- 1: ಪರಿಚಯ
|
||||
- 1: ಡೇಟಾ ಸೈನ್ಸ್ ವ್ಯಾಖ್ಯಾನ
|
||||
- 2: ನೈತಿಕತೆ
|
||||
- 3: ಡೇಟಾ ವ್ಯಾಖ್ಯಾನ
|
||||
- 4: ಪ್ರಾಬಬಿಲಿಟಿ ಮತ್ತು ಸ್ಟಾಟಿಸ್ಟಿಕ್ಸ್ ಅವಲೋಕನ
|
||||
- 2: ಡೇಟಾ ಜೊತೆಗೆ ಕೆಲಸ
|
||||
- 5: ಸಂಬಂಧಿತ ಡೇಟಾಬೇಸ್ಗಳು
|
||||
- 6: ಅಸಂಬಂಧಿತ ಡೇಟಾಬೇಸ್ಗಳು
|
||||
- 7: ಪೈಥಾನ್
|
||||
- 8: ಡೇಟಾ ತಯಾರಿ
|
||||
- 3: ಡೇಟಾ ದೃಶ್ಯೀಕರಣ
|
||||
- 9: ಪ್ರಮಾಣಗಳ ದೃಶ್ಯೀಕರಣ
|
||||
- 10: ವಿತರಣೆಯ ದೃಶ್ಯೀಕರಣ
|
||||
- 11: ಅನುಪಾತಗಳ ದೃಶ್ಯೀಕರಣ
|
||||
- 12: ಸಂಬಂಧಗಳ ದೃಶ್ಯೀಕರಣ
|
||||
- 13: ಅರ್ಥಪೂರ್ಣ ದೃಶ್ಯೀಕರಣಗಳು
|
||||
- 4: ಡೇಟಾ ಸೈನ್ಸ್ ಜೀವನಚಕ್ರ
|
||||
- 14: ಪರಿಚಯ
|
||||
- 15: ವಿಶ್ಲೇಷಣೆ
|
||||
- 16: ಸಂವಹನ
|
||||
- 5: ಕ್ಲೌಡ್ನಲ್ಲಿ ಡೇಟಾ ಸೈನ್ಸ್
|
||||
- 17: ಪರಿಚಯ
|
||||
- 18: ಲೋ-ಕೋಡ್ ಆಯ್ಕೆಗಳು
|
||||
- 19: ಅಜೂರ್
|
||||
- 6: ವನ್ಯಜೀವನದಲ್ಲಿ ಡೇಟಾ ಸೈನ್ಸ್
|
||||
- 20: ಅವಲೋಕನ
|
||||
|
||||
## ದಯವಿಟ್ಟು ನಿಮ್ಮ ಅಭಿಪ್ರಾಯಗಳನ್ನು ನಮಗೆ ನೀಡಿ!
|
||||
|
||||
ನಾವು ಈ ಪಠ್ಯಕ್ರಮವನ್ನು ನಿಮಗೂ ನಿಮ್ಮ ವಿದ್ಯಾರ್ಥಿಗಳಿಗೂ ಅನುಕೂಲವಾಗುವಂತೆ ಮಾಡಲು ಬಯಸುತ್ತೇವೆ. ದಯವಿಟ್ಟು ಚರ್ಚಾ ಫಲಕಗಳಲ್ಲಿ ಪ್ರತಿಕ್ರಿಯೆ ನೀಡಿ! ನಿಮ್ಮ ವಿದ್ಯಾರ್ಥಿಗಳಿಗಾಗಿ ಚರ್ಚಾ ಫಲಕಗಳಲ್ಲಿ ತರಗತಿ ಪ್ರದೇಶವನ್ನು ಸೃಷ್ಟಿಸಲು ಮುಕ್ತವಾಗಿರಿ.
|
||||
|
||||
---
|
||||
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
|
||||
**ಅಸ್ವೀಕರಣ**:
|
||||
ಈ ದಸ್ತಾವೇಜು [Co-op Translator](https://github.com/Azure/co-op-translator) ಎಂಬ AI ಅನುವಾದ ಸೇವೆಯನ್ನು ಬಳಸಿ ಅನುವಾದಿಸಲಾಗಿದೆ. ನಾವು ಶುದ್ಧತೆಯತ್ತ ಪ್ರಯತ್ನಿಸುತ್ತಿದ್ದರೂ, ಸ್ವಯಂಚಾಲಿತ ಅನುವಾದಗಳಲ್ಲಿ ತಪ್ಪುಗಳು ಅಥವಾ ಅಸತ್ಯತೆಗಳು ಇರಬಹುದು ಎಂದು ದಯವಿಟ್ಟು ಗಮನಿಸಿ. ಮೂಲ ಭಾಷೆಯಲ್ಲಿರುವ ಮೂಲ ದಸ್ತಾವೇಜನ್ನು ಅಧಿಕೃತ ಮೂಲವೆಂದು ಪರಿಗಣಿಸಬೇಕು. ಮಹತ್ವದ ಮಾಹಿತಿಗಾಗಿ, ವೃತ್ತಿಪರ ಮಾನವ ಅನುವಾದವನ್ನು ಶಿಫಾರಸು ಮಾಡಲಾಗುತ್ತದೆ. ಈ ಅನುವಾದ ಬಳಕೆಯಿಂದ ಉಂಟಾಗುವ ಯಾವುದೇ ತಪ್ಪು ಅರ್ಥಮಾಡಿಕೊಳ್ಳುವಿಕೆ ಅಥವಾ ತಪ್ಪು ವಿವರಣೆಗಳಿಗೆ ನಾವು ಹೊಣೆಗಾರರಾಗುವುದಿಲ್ಲ.
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER END -->
|
||||
@ -0,0 +1,141 @@
|
||||
<!--
|
||||
CO_OP_TRANSLATOR_METADATA:
|
||||
{
|
||||
"original_hash": "e92c33ea498915a13c9aec162616db18",
|
||||
"translation_date": "2025-12-19T13:26:21+00:00",
|
||||
"source_file": "quiz-app/README.md",
|
||||
"language_code": "kn"
|
||||
}
|
||||
-->
|
||||
# ಪ್ರಶ್ನೋತ್ತರಗಳು
|
||||
|
||||
ಈ ಪ್ರಶ್ನೋತ್ತರಗಳು https://aka.ms/datascience-beginners ನಲ್ಲಿ ಡೇಟಾ ಸೈನ್ಸ್ ಪಠ್ಯಕ್ರಮದ ಪೂರ್ವ ಮತ್ತು ನಂತರದ ಉಪನ್ಯಾಸ ಪ್ರಶ್ನೋತ್ತರಗಳಾಗಿವೆ
|
||||
## ಅನುವಾದಿತ ಪ್ರಶ್ನೋತ್ತರ ಸೆಟ್ ಸೇರಿಸುವುದು
|
||||
|
||||
`assets/translations` ಫೋಲ್ಡರ್ಗಳಲ್ಲಿ ಹೊಂದಾಣಿಕೆಯ ಪ್ರಶ್ನೋತ್ತರ ರಚನೆಗಳನ್ನು ಸೃಷ್ಟಿಸುವ ಮೂಲಕ ಪ್ರಶ್ನೋತ್ತರ ಅನುವಾದವನ್ನು ಸೇರಿಸಿ. ಮೂಲ ಪ್ರಶ್ನೋತ್ತರಗಳು `assets/translations/en` ನಲ್ಲಿ ಇವೆ. ಪ್ರಶ್ನೋತ್ತರಗಳನ್ನು ಹಲವಾರು ಗುಂಪುಗಳಾಗಿ ವಿಭಜಿಸಲಾಗಿದೆ. ಸರಿಯಾದ ಪ್ರಶ್ನೋತ್ತರ ವಿಭಾಗದ ಸಂಖ್ಯೆಯನ್ನು ಹೊಂದಾಣಿಕೆ ಮಾಡಿಕೊಳ್ಳಿ. ಈ ಪಠ್ಯಕ್ರಮದಲ್ಲಿ ಒಟ್ಟು 40 ಪ್ರಶ್ನೋತ್ತರಗಳಿವೆ, ಎಣಿಕೆ 0 ರಿಂದ ಪ್ರಾರಂಭವಾಗುತ್ತದೆ.
|
||||
|
||||
ಅನುವಾದಗಳನ್ನು ಸಂಪಾದಿಸಿದ ನಂತರ, `en` ನಲ್ಲಿ ಇರುವ ನಿಯಮಗಳನ್ನು ಅನುಸರಿಸಿ ಅನುವಾದ ಫೋಲ್ಡರ್ನ `index.js` ಫೈಲ್ ಅನ್ನು ಸಂಪಾದಿಸಿ ಎಲ್ಲಾ ಫೈಲ್ಗಳನ್ನು ಆಮದುಮಾಡಿ.
|
||||
|
||||
`assets/translations` ನಲ್ಲಿ ಇರುವ `index.js` ಫೈಲ್ ಅನ್ನು ಸಂಪಾದಿಸಿ ಹೊಸ ಅನುವಾದಿತ ಫೈಲ್ಗಳನ್ನು ಆಮದುಮಾಡಿ.
|
||||
|
||||
ನಂತರ, ಈ ಅಪ್ಲಿಕೇಶನ್ನ `App.vue` ನಲ್ಲಿ ಇರುವ ಡ್ರಾಪ್ಡೌನ್ ಅನ್ನು ಸಂಪಾದಿಸಿ ನಿಮ್ಮ ಭಾಷೆಯನ್ನು ಸೇರಿಸಿ. ಸ್ಥಳೀಯೀಕೃತ ಸಂಕ್ಷಿಪ್ತ ರೂಪವನ್ನು ನಿಮ್ಮ ಭಾಷೆಯ ಫೋಲ್ಡರ್ ಹೆಸರಿಗೆ ಹೊಂದಾಣಿಕೆ ಮಾಡಿ.
|
||||
|
||||
ಕೊನೆಗೆ, ಅನುವಾದಿತ ಪಾಠಗಳಲ್ಲಿ ಇದ್ದರೆ ಎಲ್ಲಾ ಪ್ರಶ್ನೋತ್ತರ ಲಿಂಕ್ಗಳನ್ನು ಸಂಪಾದಿಸಿ ಈ ಸ್ಥಳೀಯೀಕರಣವನ್ನು ಪ್ರಶ್ನಾ ಪರಿಮಾಣವಾಗಿ ಸೇರಿಸಿ: ಉದಾಹರಣೆಗೆ `?loc=fr`.
|
||||
|
||||
|
||||
|
||||
## ಪ್ರಾಜೆಕ್ಟ್ ಸೆಟಪ್
|
||||
|
||||
```
|
||||
npm install
|
||||
```
|
||||
|
||||
### ಅಭಿವೃದ್ಧಿಗಾಗಿ ಸಂಯೋಜನೆ ಮತ್ತು ಹಾಟ್-ರಿಲೋಡ್
|
||||
|
||||
```
|
||||
npm run serve
|
||||
```
|
||||
|
||||
### ಉತ್ಪಾದನೆಗಾಗಿ ಸಂಯೋಜನೆ ಮತ್ತು ಸಂಕ್ಷಿಪ್ತಗೊಳಿಸುವಿಕೆ
|
||||
|
||||
```
|
||||
npm run build
|
||||
```
|
||||
|
||||
### ಫೈಲ್ಗಳನ್ನು ಲಿಂಟ್ ಮಾಡಿ ಸರಿಪಡಿಸುವಿಕೆ
|
||||
|
||||
```
|
||||
npm run lint
|
||||
```
|
||||
|
||||
### ಸಂರಚನೆಯನ್ನು ಕಸ್ಟಮೈಸ್ ಮಾಡುವುದು
|
||||
|
||||
[Configuration Reference](https://cli.vuejs.org/config/) ನೋಡಿ.
|
||||
|
||||
ಕ್ರೆಡಿಟ್ಸ್: ಈ ಪ್ರಶ್ನೋತ್ತರ ಅಪ್ಲಿಕೇಶನ್ನ ಮೂಲ ಆವೃತ್ತಿಗೆ ಧನ್ಯವಾದಗಳು: https://github.com/arpan45/simple-quiz-vue
|
||||
|
||||
## ಅಜೂರ್ಗೆ ನಿಯೋಜಿಸುವುದು
|
||||
|
||||
ನಿಮಗೆ ಪ್ರಾರಂಭಿಸಲು ಸಹಾಯ ಮಾಡುವ ಹಂತ ಹಂತದ ಮಾರ್ಗದರ್ಶಿ ಇಲ್ಲಿದೆ:
|
||||
|
||||
1. ಗಿಥಬ್ ರೆಪೊಸಿಟರಿಯನ್ನು ಫೋರ್ಕ್ ಮಾಡಿ
|
||||
ನಿಮ್ಮ ಸ್ಥಿರ ವೆಬ್ ಅಪ್ಲಿಕೇಶನ್ ಕೋಡ್ ನಿಮ್ಮ ಗಿಥಬ್ ರೆಪೊಸಿಟರಿಯಲ್ಲಿ ಇರಬೇಕು. ಈ ರೆಪೊಸಿಟರಿಯನ್ನು ಫೋರ್ಕ್ ಮಾಡಿ.
|
||||
|
||||
2. ಅಜೂರ್ ಸ್ಥಿರ ವೆಬ್ ಅಪ್ಲಿಕೇಶನ್ ಸೃಷ್ಟಿಸಿ
|
||||
- [ಅಜೂರ್ ಖಾತೆ](http://azure.microsoft.com) ಸೃಷ್ಟಿಸಿ
|
||||
- [ಅಜೂರ್ ಪೋರ್ಟಲ್](https://portal.azure.com) ಗೆ ಹೋಗಿ
|
||||
- “Create a resource” ಕ್ಲಿಕ್ ಮಾಡಿ ಮತ್ತು “Static Web App” ಅನ್ನು ಹುಡುಕಿ.
|
||||
- “Create” ಕ್ಲಿಕ್ ಮಾಡಿ.
|
||||
|
||||
3. ಸ್ಥಿರ ವೆಬ್ ಅಪ್ಲಿಕೇಶನ್ ಅನ್ನು ಸಂರಚಿಸಿ
|
||||
- ಮೂಲಭೂತಗಳು: ಸಬ್ಸ್ಕ್ರಿಪ್ಷನ್: ನಿಮ್ಮ ಅಜೂರ್ ಸಬ್ಸ್ಕ್ರಿಪ್ಷನ್ ಆಯ್ಕೆಮಾಡಿ.
|
||||
- ರಿಸೋರ್ಸ್ ಗ್ರೂಪ್: ಹೊಸ ರಿಸೋರ್ಸ್ ಗ್ರೂಪ್ ಸೃಷ್ಟಿಸಿ ಅಥವಾ ಇತ್ತೀಚಿನದನ್ನು ಬಳಸಿ.
|
||||
- ಹೆಸರು: ನಿಮ್ಮ ಸ್ಥಿರ ವೆಬ್ ಅಪ್ಲಿಕೇಶನ್ಗೆ ಹೆಸರು ನೀಡಿ.
|
||||
- ಪ್ರದೇಶ: ನಿಮ್ಮ ಬಳಕೆದಾರರಿಗೆ ಸಮೀಪದ ಪ್ರದೇಶವನ್ನು ಆಯ್ಕೆಮಾಡಿ.
|
||||
|
||||
- #### ನಿಯೋಜನೆ ವಿವರಗಳು:
|
||||
- ಮೂಲ: “GitHub” ಆಯ್ಕೆಮಾಡಿ.
|
||||
- GitHub ಖಾತೆ: ಅಜೂರ್ಗೆ ನಿಮ್ಮ GitHub ಖಾತೆಯನ್ನು ಪ್ರವೇಶಿಸಲು ಅನುಮತಿಸಿ.
|
||||
- ಸಂಸ್ಥೆ: ನಿಮ್ಮ GitHub ಸಂಸ್ಥೆಯನ್ನು ಆಯ್ಕೆಮಾಡಿ.
|
||||
- ರೆಪೊಸಿಟರಿ: ನಿಮ್ಮ ಸ್ಥಿರ ವೆಬ್ ಅಪ್ಲಿಕೇಶನ್ ಹೊಂದಿರುವ ರೆಪೊಸಿಟರಿಯನ್ನು ಆಯ್ಕೆಮಾಡಿ.
|
||||
- ಶಾಖೆ: ನೀವು ನಿಯೋಜಿಸಲು ಬಯಸುವ ಶಾಖೆಯನ್ನು ಆಯ್ಕೆಮಾಡಿ.
|
||||
|
||||
- #### ನಿರ್ಮಾಣ ವಿವರಗಳು:
|
||||
- ನಿರ್ಮಾಣ ಪೂರ್ವನಿಯೋಜನೆಗಳು: ನಿಮ್ಮ ಅಪ್ಲಿಕೇಶನ್ ನಿರ್ಮಿತವಾಗಿರುವ ಫ್ರೇಮ್ವರ್ಕ್ ಆಯ್ಕೆಮಾಡಿ (ಉದಾ: React, Angular, Vue, ಇತ್ಯಾದಿ).
|
||||
- ಅಪ್ಲಿಕೇಶನ್ ಸ್ಥಳ: ನಿಮ್ಮ ಅಪ್ಲಿಕೇಶನ್ ಕೋಡ್ ಇರುವ ಫೋಲ್ಡರ್ ಸೂಚಿಸಿ (ಉದಾ: / ಮೂಲದಲ್ಲಿ ಇದ್ದರೆ).
|
||||
- API ಸ್ಥಳ: ನೀವು API ಹೊಂದಿದ್ದರೆ, ಅದರ ಸ್ಥಳವನ್ನು ಸೂಚಿಸಿ (ಐಚ್ಛಿಕ).
|
||||
- ಔಟ್ಪುಟ್ ಸ್ಥಳ: ನಿರ್ಮಾಣ ಔಟ್ಪುಟ್ ಉತ್ಪಾದನೆಯಾಗುವ ಫೋಲ್ಡರ್ ಸೂಚಿಸಿ (ಉದಾ: build ಅಥವಾ dist).
|
||||
|
||||
4. ಪರಿಶೀಲಿಸಿ ಮತ್ತು ಸೃಷ್ಟಿಸಿ
|
||||
ನಿಮ್ಮ ಸೆಟ್ಟಿಂಗ್ಗಳನ್ನು ಪರಿಶೀಲಿಸಿ ಮತ್ತು “Create” ಕ್ಲಿಕ್ ಮಾಡಿ. ಅಜೂರ್ ಅಗತ್ಯವಿರುವ ಸಂಪನ್ಮೂಲಗಳನ್ನು ಸಿದ್ಧಪಡಿಸಿ ನಿಮ್ಮ ರೆಪೊಸಿಟರಿಯಲ್ಲಿ GitHub Actions ವರ್ಕ್ಫ್ಲೋವನ್ನು ಸೃಷ್ಟಿಸುತ್ತದೆ.
|
||||
|
||||
5. GitHub Actions ವರ್ಕ್ಫ್ಲೋ
|
||||
ಅಜೂರ್ ಸ್ವಯಂಚಾಲಿತವಾಗಿ ನಿಮ್ಮ ರೆಪೊಸಿಟರಿಯಲ್ಲಿ GitHub Actions ವರ್ಕ್ಫ್ಲೋ ಫೈಲ್ (.github/workflows/azure-static-web-apps-<name>.yml) ಅನ್ನು ಸೃಷ್ಟಿಸುತ್ತದೆ. ಈ ವರ್ಕ್ಫ್ಲೋ ನಿರ್ಮಾಣ ಮತ್ತು ನಿಯೋಜನೆ ಪ್ರಕ್ರಿಯೆಯನ್ನು ನಿರ್ವಹಿಸುತ್ತದೆ.
|
||||
|
||||
6. ನಿಯೋಜನೆಯನ್ನು ಮೇಲ್ವಿಚಾರಣೆ ಮಾಡಿ
|
||||
ನಿಮ್ಮ GitHub ರೆಪೊಸಿಟರಿಯಲ್ಲಿ “Actions” ಟ್ಯಾಬ್ಗೆ ಹೋಗಿ.
|
||||
ನೀವು ಒಂದು ವರ್ಕ್ಫ್ಲೋ ಚಲಿಸುತ್ತಿರುವುದನ್ನು ನೋಡಬಹುದು. ಈ ವರ್ಕ್ಫ್ಲೋ ನಿಮ್ಮ ಸ್ಥಿರ ವೆಬ್ ಅಪ್ಲಿಕೇಶನ್ ಅನ್ನು ಅಜೂರ್ಗೆ ನಿರ್ಮಿಸಿ ನಿಯೋಜಿಸುತ್ತದೆ.
|
||||
ವರ್ಕ್ಫ್ಲೋ ಪೂರ್ಣಗೊಂಡ ನಂತರ, ನಿಮ್ಮ ಅಪ್ಲಿಕೇಶನ್ ನೀಡಲಾದ ಅಜೂರ್ URL ನಲ್ಲಿ ಲೈವ್ ಆಗಿರುತ್ತದೆ.
|
||||
|
||||
### ಉದಾಹರಣೆಯ ವರ್ಕ್ಫ್ಲೋ ಫೈಲ್
|
||||
|
||||
GitHub Actions ವರ್ಕ್ಫ್ಲೋ ಫೈಲ್ ಹೇಗಿರಬಹುದು ಎಂಬ ಉದಾಹರಣೆ ಇಲ್ಲಿದೆ:
|
||||
name: Azure Static Web Apps CI/CD
|
||||
```
|
||||
on:
|
||||
push:
|
||||
branches:
|
||||
- main
|
||||
pull_request:
|
||||
types: [opened, synchronize, reopened, closed]
|
||||
branches:
|
||||
- main
|
||||
|
||||
jobs:
|
||||
build_and_deploy_job:
|
||||
runs-on: ubuntu-latest
|
||||
name: Build and Deploy Job
|
||||
steps:
|
||||
- uses: actions/checkout@v2
|
||||
- name: Build And Deploy
|
||||
id: builddeploy
|
||||
uses: Azure/static-web-apps-deploy@v1
|
||||
with:
|
||||
azure_static_web_apps_api_token: ${{ secrets.AZURE_STATIC_WEB_APPS_API_TOKEN }}
|
||||
repo_token: ${{ secrets.GITHUB_TOKEN }}
|
||||
action: "upload"
|
||||
app_location: "quiz-app" # App source code path
|
||||
api_location: ""API source code path optional
|
||||
output_location: "dist" #Built app content directory - optional
|
||||
```
|
||||
|
||||
### ಹೆಚ್ಚುವರಿ ಸಂಪನ್ಮೂಲಗಳು
|
||||
- [Azure Static Web Apps Documentation](https://learn.microsoft.com/azure/static-web-apps/getting-started)
|
||||
- [GitHub Actions Documentation](https://docs.github.com/actions/use-cases-and-examples/deploying/deploying-to-azure-static-web-app)
|
||||
|
||||
---
|
||||
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
|
||||
**ಅಸ್ವೀಕಾರ**:
|
||||
ಈ ದಸ್ತಾವೇಜು [Co-op Translator](https://github.com/Azure/co-op-translator) ಎಂಬ AI ಅನುವಾದ ಸೇವೆಯನ್ನು ಬಳಸಿ ಅನುವಾದಿಸಲಾಗಿದೆ. ನಾವು ನಿಖರತೆಯಿಗಾಗಿ ಪ್ರಯತ್ನಿಸುತ್ತಿದ್ದರೂ, ಸ್ವಯಂಚಾಲಿತ ಅನುವಾದಗಳಲ್ಲಿ ತಪ್ಪುಗಳು ಅಥವಾ ಅಸತ್ಯತೆಗಳು ಇರಬಹುದು ಎಂದು ದಯವಿಟ್ಟು ಗಮನಿಸಿ. ಮೂಲ ಭಾಷೆಯಲ್ಲಿರುವ ಮೂಲ ದಸ್ತಾವೇಜನ್ನು ಅಧಿಕೃತ ಮೂಲವಾಗಿ ಪರಿಗಣಿಸಬೇಕು. ಮಹತ್ವದ ಮಾಹಿತಿಗಾಗಿ, ವೃತ್ತಿಪರ ಮಾನವ ಅನುವಾದವನ್ನು ಶಿಫಾರಸು ಮಾಡಲಾಗುತ್ತದೆ. ಈ ಅನುವಾದ ಬಳಕೆಯಿಂದ ಉಂಟಾಗುವ ಯಾವುದೇ ತಪ್ಪು ಅರ್ಥಮಾಡಿಕೊಳ್ಳುವಿಕೆ ಅಥವಾ ತಪ್ಪು ವಿವರಣೆಗಳಿಗೆ ನಾವು ಹೊಣೆಗಾರರಾಗುವುದಿಲ್ಲ.
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER END -->
|
||||
@ -0,0 +1,23 @@
|
||||
<!--
|
||||
CO_OP_TRANSLATOR_METADATA:
|
||||
{
|
||||
"original_hash": "3a848466cb63aff1a93411affb152c2a",
|
||||
"translation_date": "2025-12-19T13:32:13+00:00",
|
||||
"source_file": "sketchnotes/README.md",
|
||||
"language_code": "kn"
|
||||
}
|
||||
-->
|
||||
ಎಲ್ಲಾ ಸ್ಕೆಚ್ನೋಟ್ಗಳನ್ನು ಇಲ್ಲಿ ಕಂಡುಹಿಡಿಯಿರಿ!
|
||||
|
||||
## ಕ್ರೆಡಿಟ್ಸ್
|
||||
|
||||
ನಿತ್ಯ ನಾರಸಿಂಹನ್, ಕಲಾವಿದ
|
||||
|
||||

|
||||
|
||||
---
|
||||
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
|
||||
**ಅಸ್ವೀಕಾರ**:
|
||||
ಈ ದಸ್ತಾವೇಜು [Co-op Translator](https://github.com/Azure/co-op-translator) ಎಂಬ AI ಅನುವಾದ ಸೇವೆಯನ್ನು ಬಳಸಿ ಅನುವಾದಿಸಲಾಗಿದೆ. ನಾವು ಶುದ್ಧತೆಯತ್ತ ಪ್ರಯತ್ನಿಸುತ್ತಿದ್ದರೂ, ಸ್ವಯಂಚಾಲಿತ ಅನುವಾದಗಳಲ್ಲಿ ತಪ್ಪುಗಳು ಅಥವಾ ಅಸತ್ಯತೆಗಳು ಇರಬಹುದು ಎಂದು ದಯವಿಟ್ಟು ಗಮನಿಸಿ. ಮೂಲ ಭಾಷೆಯಲ್ಲಿರುವ ಮೂಲ ದಸ್ತಾವೇಜನ್ನು ಅಧಿಕೃತ ಮೂಲವೆಂದು ಪರಿಗಣಿಸಬೇಕು. ಮಹತ್ವದ ಮಾಹಿತಿಗಾಗಿ, ವೃತ್ತಿಪರ ಮಾನವ ಅನುವಾದವನ್ನು ಶಿಫಾರಸು ಮಾಡಲಾಗುತ್ತದೆ. ಈ ಅನುವಾದ ಬಳಕೆಯಿಂದ ಉಂಟಾಗುವ ಯಾವುದೇ ತಪ್ಪು ಅರ್ಥಮಾಡಿಕೊಳ್ಳುವಿಕೆ ಅಥವಾ ತಪ್ಪು ವಿವರಣೆಗಳಿಗೆ ನಾವು ಹೊಣೆಗಾರರಾಗುವುದಿಲ್ಲ.
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER END -->
|
||||
@ -0,0 +1,178 @@
|
||||
<!--
|
||||
CO_OP_TRANSLATOR_METADATA:
|
||||
{
|
||||
"original_hash": "43212cc1ac137b7bb1dcfb37ca06b0f4",
|
||||
"translation_date": "2025-12-19T13:37:59+00:00",
|
||||
"source_file": "1-Introduction/01-defining-data-science/README.md",
|
||||
"language_code": "ml"
|
||||
}
|
||||
-->
|
||||
# ഡാറ്റാ സയൻസ് നിർവചിക്കൽ
|
||||
|
||||
|  ](../../sketchnotes/01-Definitions.png) |
|
||||
| :----------------------------------------------------------------------------------------------------: |
|
||||
| ഡാറ്റാ സയൻസ് നിർവചിക്കൽ - _Sketchnote by [@nitya](https://twitter.com/nitya)_ |
|
||||
|
||||
---
|
||||
|
||||
[](https://youtu.be/beZ7Mb_oz9I)
|
||||
|
||||
## [പ്രീ-ലെക്ചർ ക്വിസ്](https://ff-quizzes.netlify.app/en/ds/quiz/0)
|
||||
|
||||
## ഡാറ്റ എന്താണ്?
|
||||
നമ്മുടെ ദൈനംദിന ജീവിതത്തിൽ, നാം നിരന്തരം ഡാറ്റയാൽ ചുറ്റപ്പെട്ടിരിക്കുന്നു. നിങ്ങൾ ഇപ്പോൾ വായിക്കുന്ന എഴുത്ത് ഡാറ്റയാണ്. നിങ്ങളുടെ സ്മാർട്ട്ഫോണിലുള്ള സുഹൃത്തുക്കളുടെ ഫോൺ നമ്പറുകളുടെ പട്ടിക ഡാറ്റയാണ്, കൂടാതെ നിങ്ങളുടെ വാച്ചിൽ കാണിക്കുന്ന നിലവിലെ സമയവും ഡാറ്റയാണ്. മനുഷ്യരായി, നാം സ്വാഭാവികമായി ഡാറ്റ ഉപയോഗിച്ച് പ്രവർത്തിക്കുന്നു, ഉദാഹരണത്തിന് നമുക്ക് ഉള്ള പണം എണ്ണുകയോ സുഹൃത്തുക്കൾക്ക് കത്ത് എഴുതുകയോ ചെയ്യുന്നു.
|
||||
|
||||
എങ്കിലും, കമ്പ്യൂട്ടറുകളുടെ സൃഷ്ടിയോടെ ഡാറ്റ വളരെ പ്രധാനപ്പെട്ടതായി മാറി. കമ്പ്യൂട്ടറുകളുടെ പ്രധാന പങ്ക് കണക്കുകൂട്ടലുകൾ നടത്തുകയാണ്, പക്ഷേ അവ പ്രവർത്തിക്കാൻ ഡാറ്റ ആവശ്യമാണ്. അതിനാൽ, കമ്പ്യൂട്ടറുകൾ ഡാറ്റ എങ്ങനെ സംഭരിക്കുകയും പ്രോസസ്സ് ചെയ്യുകയും ചെയ്യുന്നതെന്ന് നമുക്ക് മനസ്സിലാക്കേണ്ടതുണ്ട്.
|
||||
|
||||
ഇന്റർനെറ്റിന്റെ ഉദയം കൊണ്ട്, കമ്പ്യൂട്ടറുകളുടെ ഡാറ്റ കൈകാര്യം ചെയ്യുന്ന ഉപകരണങ്ങളായ പങ്ക് വർദ്ധിച്ചു. നിങ്ങൾ ചിന്തിച്ചാൽ, നാം ഇപ്പോൾ കമ്പ്യൂട്ടറുകൾ കണക്കുകൂട്ടലുകൾക്കേക്കാൾ ഡാറ്റ പ്രോസസ്സിംഗിനും ആശയവിനിമയത്തിനും കൂടുതൽ ഉപയോഗിക്കുന്നു. നാം സുഹൃത്തുക്കൾക്ക് ഇമെയിൽ എഴുതുമ്പോഴും ഇന്റർനെറ്റിൽ വിവരങ്ങൾ തിരയുമ്പോഴും - നാം അടിസ്ഥാനപരമായി ഡാറ്റ സൃഷ്ടിക്കുകയും, സംഭരിക്കുകയും, പ്രേഷിപ്പിക്കുകയും, കൈകാര്യം ചെയ്യുകയും ചെയ്യുന്നു.
|
||||
> നിങ്ങൾക്ക് ഓർമ്മയുണ്ടോ, അവസാനമായി കമ്പ്യൂട്ടർ ഉപയോഗിച്ച് യഥാർത്ഥത്തിൽ എന്തെങ്കിലും കണക്കുകൂട്ടിയത്?
|
||||
|
||||
## ഡാറ്റാ സയൻസ് എന്താണ്?
|
||||
|
||||
[വിക്കിപീഡിയയിൽ](https://en.wikipedia.org/wiki/Data_science), **ഡാറ്റാ സയൻസ്** എന്നത് *സംഘടിതവും അസംഘടിതവുമായ ഡാറ്റയിൽ നിന്നുള്ള അറിവും洞察ങ്ങളും ശാസ്ത്രീയ രീതികൾ ഉപയോഗിച്ച് എടുക്കുകയും, ഡാറ്റയിൽ നിന്നുള്ള അറിവും പ്രായോഗിക洞察ങ്ങളും വ്യാപകമായ പ്രയോഗ മേഖലകളിൽ പ്രയോഗിക്കുകയും ചെയ്യുന്ന ശാസ്ത്രീയ മേഖലയായി* നിർവചിച്ചിരിക്കുന്നു.
|
||||
|
||||
ഈ നിർവചനത്തിൽ ഡാറ്റാ സയൻസിന്റെ താഴെപ്പറയുന്ന പ്രധാന അംശങ്ങൾ ഉണ്ട്:
|
||||
|
||||
* ഡാറ്റാ സയൻസിന്റെ പ്രധാന ലക്ഷ്യം ഡാറ്റയിൽ നിന്നുള്ള **അറിവ്** എടുക്കുക, മറ്റൊരു വാക്കിൽ - ഡാറ്റ **അറിയുക**, ചില മറഞ്ഞിരിക്കുന്ന ബന്ധങ്ങൾ കണ്ടെത്തുക, ഒരു **മോഡൽ** നിർമ്മിക്കുക.
|
||||
* ഡാറ്റാ സയൻസ് **ശാസ്ത്രീയ രീതികൾ** ഉപയോഗിക്കുന്നു, ഉദാഹരണത്തിന് സാധ്യതാ സിദ്ധാന്തവും സ്ഥിതിവിവരശാസ്ത്രവും. യഥാർത്ഥത്തിൽ, *ഡാറ്റാ സയൻസ്* എന്ന പദം ആദ്യമായി പരിചയപ്പെടുത്തിയപ്പോൾ, ചിലർ ഡാറ്റാ സയൻസ് സ്ഥിതിവിവരശാസ്ത്രത്തിന് പുതിയ ഒരു ആകർഷകമായ പേര് മാത്രമാണെന്ന് വാദിച്ചിരുന്നു. ഇപ്പോൾ ഈ മേഖല വളരെ വ്യാപകമാണെന്ന് വ്യക്തമാണ്.
|
||||
* ലഭിച്ച അറിവ് ചില **പ്രായോഗിക洞察ങ്ങൾ** ഉൽപ്പാദിപ്പിക്കാൻ ഉപയോഗിക്കണം, അതായത് യഥാർത്ഥ ബിസിനസ് സാഹചര്യങ്ങളിൽ പ്രയോഗിക്കാവുന്ന洞察ങ്ങൾ.
|
||||
* നാം **സംഘടിത**യും **അസംഘടിത**വുമായ ഡാറ്റയിൽ പ്രവർത്തിക്കാൻ കഴിയണം. കോഴ്സിന്റെ പിന്നീട് ഭാഗങ്ങളിൽ നാം ഡാറ്റയുടെ വ്യത്യസ്ത തരം വിശദീകരിക്കും.
|
||||
* **പ്രയോഗ മേഖല** ഒരു പ്രധാന ആശയമാണ്, ഡാറ്റാ സയന്റിസ്റ്റുകൾക്ക് സാധാരണയായി പ്രശ്ന മേഖലയിൽ കുറച്ച് പരിചയം വേണം, ഉദാഹരണത്തിന്: ധനകാര്യ, മെഡിസിൻ, മാർക്കറ്റിംഗ് തുടങ്ങിയവ.
|
||||
|
||||
> ഡാറ്റാ സയൻസിന്റെ മറ്റൊരു പ്രധാന അംശം ഡാറ്റ എങ്ങനെ ശേഖരിക്കാമെന്ന്, സംഭരിക്കാമെന്ന്, കമ്പ്യൂട്ടറുകൾ ഉപയോഗിച്ച് എങ്ങനെ പ്രവർത്തിക്കാമെന്ന് പഠിക്കുന്നതാണ്. സ്ഥിതിവിവരശാസ്ത്രം ഗണിത അടിസ്ഥാനങ്ങൾ നൽകുമ്പോൾ, ഡാറ്റാ സയൻസ് ഗണിത ആശയങ്ങൾ പ്രയോഗിച്ച് ഡാറ്റയിൽ നിന്നുള്ള洞察ങ്ങൾ എടുക്കുന്നു.
|
||||
|
||||
ഡാറ്റാ സയൻസ് കാണാനുള്ള ഒരു മാർഗം ([ജിം ഗ്രേ](https://en.wikipedia.org/wiki/Jim_Gray_(computer_scientist)) എന്നവനോട് ബന്ധപ്പെട്ടത്) ഡാറ്റാ സയൻസ് ഒരു വ്യത്യസ്ത ശാസ്ത്രപരമായ പാരഡൈം ആയി കാണുക എന്നതാണ്:
|
||||
* **പരീക്ഷണാത്മക** - പ്രധാനമായും നിരീക്ഷണങ്ങളും പരീക്ഷണ ഫലങ്ങളും ആശ്രയിക്കുന്നു
|
||||
* **സിദ്ധാന്തപരമായ** - നിലവിലുള്ള ശാസ്ത്രീയ അറിവിൽ നിന്നുള്ള പുതിയ ആശയങ്ങൾ ഉദയം ചെയ്യുന്നു
|
||||
* **കമ്പ്യൂട്ടേഷണൽ** - ചില കമ്പ്യൂട്ടേഷൻ പരീക്ഷണങ്ങളുടെ അടിസ്ഥാനത്തിൽ പുതിയ സിദ്ധാന്തങ്ങൾ കണ്ടെത്തുന്നു
|
||||
* **ഡാറ്റാ-ഡ്രിവൻ** - ഡാറ്റയിൽ ബന്ധങ്ങളും മാതൃകകളും കണ്ടെത്തുന്നതിൽ അടിസ്ഥാനമാക്കിയുള്ളത്
|
||||
|
||||
## മറ്റ് ബന്ധപ്പെട്ട മേഖലകൾ
|
||||
|
||||
ഡാറ്റ വ്യാപകമായതിനാൽ, ഡാറ്റാ സയൻസ് തന്നെ ഒരു വ്യാപകമായ മേഖലയാണ്, പല ശാസ്ത്രശാഖകളെയും സ്പർശിക്കുന്നു.
|
||||
|
||||
<dl>
|
||||
<dt>ഡാറ്റാബേസുകൾ</dt>
|
||||
<dd>
|
||||
ഒരു പ്രധാന പരിഗണനയാണ് ഡാറ്റ എങ്ങനെ <b>സംഭരിക്കണം</b>, അതായത് അതിനെ എങ്ങനെ ഘടിപ്പിക്കണം എന്നത്, അതിലൂടെ വേഗത്തിൽ പ്രോസസ്സ് ചെയ്യാൻ കഴിയും. വിവിധ തരത്തിലുള്ള ഡാറ്റാബേസുകൾ ഉണ്ട്, അവ ഘടിതവും അസംഘടിതവുമായ ഡാറ്റ സംഭരിക്കുന്നു, അവയെക്കുറിച്ച് <a href="../../2-Working-With-Data/README.md">നമ്മുടെ കോഴ്സിൽ പരിഗണിക്കും</a>.
|
||||
</dd>
|
||||
<dt>ബിഗ് ഡാറ്റ</dt>
|
||||
<dd>
|
||||
പലപ്പോഴും വളരെ വലിയ അളവിലുള്ള ഡാറ്റ സംഭരിക്കുകയും പ്രോസസ്സ് ചെയ്യുകയും ചെയ്യേണ്ടതുണ്ട്, സാധാരണയായി ലളിതമായ ഘടനയുള്ളത്. ഈ ഡാറ്റ കമ്പ്യൂട്ടർ ക്ലസ്റ്ററിൽ വിതരണം ചെയ്ത് സംഭരിക്കുകയും കാര്യക്ഷമമായി പ്രോസസ്സ് ചെയ്യുന്നതിനുള്ള പ്രത്യേക സമീപനങ്ങളും ഉപകരണങ്ങളും ഉണ്ട്.
|
||||
</dd>
|
||||
<dt>മെഷീൻ ലേണിംഗ്</dt>
|
||||
<dd>
|
||||
ഡാറ്റ മനസ്സിലാക്കാനുള്ള ഒരു മാർഗം ഒരു മോഡൽ <b>നിർമിക്കുക</b> എന്നതാണ്, അത് ആഗ്രഹിക്കുന്ന ഫലം പ്രവചിക്കാൻ കഴിയും. ഡാറ്റയിൽ നിന്നുള്ള മോഡലുകൾ വികസിപ്പിക്കുന്നത് <b>മെഷീൻ ലേണിംഗ്</b> എന്നാണ് വിളിക്കുന്നത്. ഇതിനെക്കുറിച്ച് കൂടുതൽ അറിയാൻ ഞങ്ങളുടെ <a href="https://aka.ms/ml-beginners">Machine Learning for Beginners</a> പാഠ്യപദ്ധതി കാണാം.
|
||||
</dd>
|
||||
<dt>കൃത്രിമ ബുദ്ധിമുട്ട്</dt>
|
||||
<dd>
|
||||
മെഷീൻ ലേണിംഗിന്റെ ഒരു മേഖലയായ കൃത്രിമ ബുദ്ധിമുട്ട് (AI) ഡാറ്റയിൽ ആശ്രയിച്ചിരിക്കുന്നു, കൂടാതെ മനുഷ്യ ചിന്താ പ്രക്രിയകൾ അനുകരിക്കുന്ന ഉയർന്ന സങ്കീർണ്ണതയുള്ള മോഡലുകൾ നിർമ്മിക്കുന്നതും ഉൾപ്പെടുന്നു. AI രീതികൾ അസംഘടിത ഡാറ്റ (ഉദാഹരണത്തിന് സ്വാഭാവിക ഭാഷ) ഘടിത洞察ങ്ങളായി മാറ്റാൻ സാധിക്കുന്നു.
|
||||
</dd>
|
||||
<dt>ദൃശ്യവൽക്കരണം</dt>
|
||||
<dd>
|
||||
വലിയ അളവിലുള്ള ഡാറ്റ മനുഷ്യനായി മനസ്സിലാക്കാൻ ബുദ്ധിമുട്ടാണ്, പക്ഷേ ആ ഡാറ്റ ഉപയോഗിച്ച് ഉപകാരപ്രദമായ ദൃശ്യവൽക്കരണങ്ങൾ സൃഷ്ടിച്ചാൽ, നാം ഡാറ്റയെ കൂടുതൽ മനസ്സിലാക്കുകയും ചില നിഗമനങ്ങൾ വരുത്തുകയും ചെയ്യാം. അതിനാൽ, വിവരങ്ങൾ ദൃശ്യവൽക്കരിക്കുന്ന നിരവധി മാർഗങ്ങൾ അറിയുന്നത് പ്രധാനമാണ് - ഇത് ഞങ്ങളുടെ കോഴ്സിന്റെ <a href="../../3-Data-Visualization/README.md">മൂന്നാം ഭാഗം</a>യിൽ ഉൾപ്പെടും. ബന്ധപ്പെട്ട മേഖലകൾക്ക് <b>ഇൻഫോഗ്രാഫിക്സ്</b>യും, പൊതുവായി <b>മനുഷ്യ-കമ്പ്യൂട്ടർ ഇടപെടൽ</b>യും ഉൾപ്പെടുന്നു.
|
||||
</dd>
|
||||
</dl>
|
||||
|
||||
## ഡാറ്റയുടെ തരം
|
||||
|
||||
നാം ഇതിനകം പറഞ്ഞതുപോലെ, ഡാറ്റ എല്ലായിടത്തും ഉണ്ട്. നമുക്ക് അത് ശരിയായ രീതിയിൽ പിടിച്ചെടുക്കേണ്ടതാണ്! **സംഘടിത**വും **അസംഘടിത**വുമായ ഡാറ്റ തമ്മിൽ വ്യത്യാസം കാണുന്നത് ഉപകാരപ്രദമാണ്. മുൻപുള്ളത് സാധാരണയായി ഒരു നന്നായി ഘടിപ്പിച്ച രൂപത്തിലാണ് പ്രതിനിധാനം ചെയ്യപ്പെടുന്നത്, സാധാരണയായി ഒരു പട്ടിക അല്ലെങ്കിൽ പല പട്ടികകളായി, പിന്നെ അസംഘടിത ഡാറ്റ ഫയലുകളുടെ ശേഖരമാണ്. ചിലപ്പോൾ നാം **അർദ്ധഘടിത** ഡാറ്റയെക്കുറിച്ച് സംസാരിക്കാം, അതിന് ചില ഘടനയുണ്ടെങ്കിലും അത് വളരെ വ്യത്യസ്തമായിരിക്കും.
|
||||
|
||||
| ഘടിതം | അർദ്ധഘടിതം | അസംഘടിതം |
|
||||
| ---------------------------------------------------------------------------- | ---------------------------------------------------------------------------------------------- | --------------------------------------- |
|
||||
| ആളുകളുടെ ഫോൺ നമ്പറുകളുള്ള പട്ടിക | ലിങ്കുകളുള്ള വിക്കിപീഡിയ പേജുകൾ | എൻസൈക്ലോപീഡിയ ബ്രിട്ടാനിക്കയുടെ എഴുത്ത് |
|
||||
| കഴിഞ്ഞ 20 വർഷം ഓരോ മിനിറ്റിലും ഒരു കെട്ടിടത്തിലെ എല്ലാ മുറികളിലെ താപനില | ലേഖകരും പ്രസിദ്ധീകരണ തീയതിയും സാരാംശവും ഉള്ള JSON ഫോർമാറ്റിലുള്ള ശാസ്ത്രീയ ലേഖനങ്ങളുടെ ശേഖരം | കോർപ്പറേറ്റ് ഡോക്യുമെന്റുകളുള്ള ഫയൽ ഷെയർ |
|
||||
| കെട്ടിടത്തിലേക്ക് പ്രവേശിക്കുന്ന എല്ലാ ആളുകളുടെ പ്രായവും ലിംഗവും സംബന്ധിച്ച ഡാറ്റ | ഇന്റർനെറ്റ് പേജുകൾ | നിരീക്ഷണ ക്യാമറയിൽ നിന്നുള്ള കച്ചവട വീഡിയോ ഫീഡ് |
|
||||
|
||||
## ഡാറ്റ എവിടെ നിന്ന് ലഭിക്കും
|
||||
|
||||
ഡാറ്റ ലഭിക്കുന്ന നിരവധി സ്രോതസ്സുകൾ ഉണ്ട്, അവയെല്ലാം പട്ടികപ്പെടുത്തുന്നത് അസാധ്യമാണ്! എങ്കിലും, നിങ്ങൾക്ക് ഡാറ്റ ലഭിക്കാവുന്ന ചില സാധാരണ സ്ഥലങ്ങൾ പറയാം:
|
||||
|
||||
* **സംഘടിത**
|
||||
- **ഇന്റർനെറ്റ് ഓഫ് തിങ്സ്** (IoT), താപനില അല്ലെങ്കിൽ മർദ്ദം സെൻസറുകൾ പോലുള്ള വിവിധ സെൻസറുകളിൽ നിന്നുള്ള ഡാറ്റ ഉൾപ്പെടെ, വളരെ ഉപകാരപ്രദമായ ഡാറ്റ നൽകുന്നു. ഉദാഹരണത്തിന്, ഒരു ഓഫീസ് കെട്ടിടം IoT സെൻസറുകളാൽ സജ്ജമാക്കിയാൽ, ചെലവുകൾ കുറയ്ക്കാൻ താപനിലയും ലൈറ്റിംഗും സ്വയം നിയന്ത്രിക്കാം.
|
||||
- **സർവേകൾ** ഉപഭോക്താക്കൾക്ക് വാങ്ങിയതിന് ശേഷം അല്ലെങ്കിൽ വെബ്സൈറ്റ് സന്ദർശിച്ചതിന് ശേഷം പൂരിപ്പിക്കാൻ പറയുന്നവ.
|
||||
- **പ്രവർത്തന വിശകലനം** ഉദാഹരണത്തിന്, ഒരു ഉപയോക്താവ് ഒരു സൈറ്റിൽ എത്ര ആഴത്തിൽ പോകുന്നു, സൈറ്റ് വിടാനുള്ള സാധാരണ കാരണം എന്താണെന്ന് മനസ്സിലാക്കാൻ സഹായിക്കും.
|
||||
* **അസംഘടിത**
|
||||
- **എഴുത്തുകൾ**洞察ങ്ങളുടെ സമൃദ്ധമായ സ്രോതസ്സാകാം, ഉദാഹരണത്തിന് ഒരു മൊത്തം **ഭാവനാ സ്കോർ**, അല്ലെങ്കിൽ പ്രധാനവാക്കുകളും സാംവേദനാത്മക അർത്ഥവും എടുക്കൽ.
|
||||
- **ചിത്രങ്ങൾ** അല്ലെങ്കിൽ **വീഡിയോ**. നിരീക്ഷണ ക്യാമറയിൽ നിന്നുള്ള ഒരു വീഡിയോ റോഡിലെ ഗതാഗതം അളക്കാനും ഗതാഗത തടസ്സങ്ങളെക്കുറിച്ച് ആളുകളെ അറിയിക്കാനും ഉപയോഗിക്കാം.
|
||||
- വെബ് സെർവർ **ലോഗുകൾ** നമ്മുടെ സൈറ്റിലെ ഏത് പേജുകൾ ഏറ്റവും അധികം സന്ദർശിക്കപ്പെടുന്നു, എത്ര സമയം ചെലവഴിക്കുന്നു എന്നിവ മനസ്സിലാക്കാൻ ഉപയോഗിക്കാം.
|
||||
* അർദ്ധഘടിത
|
||||
- **സോഷ്യൽ നെറ്റ്വർക്ക്** ഗ്രാഫുകൾ ഉപയോക്തൃ വ്യക്തിത്വങ്ങളും വിവരങ്ങൾ പ്രചരിപ്പിക്കുന്നതിലെ സാധ്യതകളും സംബന്ധിച്ച മികച്ച ഡാറ്റ സ്രോതസ്സുകളാകാം.
|
||||
- ഒരു പാർട്ടിയിൽ നിന്നുള്ള നിരവധി ഫോട്ടോകൾ ഉണ്ടെങ്കിൽ, ഒരുമിച്ച് ഫോട്ടോ എടുക്കുന്ന ആളുകളുടെ ഗ്രാഫ് നിർമ്മിച്ച് **ഗ്രൂപ്പ് ഡൈനാമിക്സ്** ഡാറ്റ എടുക്കാൻ ശ്രമിക്കാം.
|
||||
|
||||
വിവിധ ഡാറ്റ സ്രോതസ്സുകൾ അറിയുന്നതിലൂടെ, ഡാറ്റാ സയൻസ് സാങ്കേതികവിദ്യകൾ പ്രയോഗിച്ച് സ്ഥിതിഗതികൾ കൂടുതൽ മനസ്സിലാക്കാനും ബിസിനസ് പ്രക്രിയകൾ മെച്ചപ്പെടുത്താനും നിങ്ങൾക്ക് വ്യത്യസ്ത സാഹചര്യങ്ങൾ ചിന്തിക്കാം.
|
||||
|
||||
## ഡാറ്റയുമായി നിങ്ങൾ ചെയ്യാൻ കഴിയുന്നത്
|
||||
|
||||
ഡാറ്റാ സയൻസിൽ, നാം ഡാറ്റയുടെ യാത്രയുടെ താഴെപ്പറയുന്ന ഘട്ടങ്ങളിൽ ശ്രദ്ധ കേന്ദ്രീകരിക്കുന്നു:
|
||||
|
||||
<dl>
|
||||
<dt>1) ഡാറ്റ ശേഖരണം</dt>
|
||||
<dd>
|
||||
ആദ്യ ഘട്ടം ഡാറ്റ ശേഖരിക്കുകയാണ്. പലപ്പോഴും ഇത് നേരിട്ടുള്ള പ്രക്രിയയായിരിക്കാം, ഉദാഹരണത്തിന് ഒരു വെബ് ആപ്ലിക്കേഷനിൽ നിന്നുള്ള ഡാറ്റ ഒരു ഡാറ്റാബേസിലേക്ക് വരുന്നത് പോലുള്ളത്, ചിലപ്പോൾ പ്രത്യേക സാങ്കേതിക വിദ്യകൾ ഉപയോഗിക്കേണ്ടി വരും. ഉദാഹരണത്തിന്, IoT സെൻസറുകളിൽ നിന്നുള്ള ഡാറ്റ വളരെ വലുതായിരിക്കാം, അതിനാൽ എല്ലാ ഡാറ്റയും കൂടുതൽ പ്രോസസ്സിംഗിന് മുമ്പ് ശേഖരിക്കാൻ IoT ഹബ് പോലുള്ള ബഫറിംഗ് എന്റ്പോയിന്റുകൾ ഉപയോഗിക്കുന്നത് നല്ല പ്രക്രിയയാണ്.
|
||||
</dd>
|
||||
<dt>2) ഡാറ്റ സംഭരണം</dt>
|
||||
<dd>
|
||||
ഡാറ്റ സംഭരിക്കുന്നത് വെല്ലുവിളിയാകാം, പ്രത്യേകിച്ച് ബിഗ് ഡാറ്റയെക്കുറിച്ചാണ് സംസാരിക്കുന്നത്. ഡാറ്റ എങ്ങനെ സംഭരിക്കണമെന്ന് തീരുമാനിക്കുമ്പോൾ, ഭാവിയിൽ നിങ്ങൾ ഡാറ്റയെ എങ്ങനെ ക്വറി ചെയ്യണമെന്ന് മുൻകൂട്ടി കരുതുന്നത് ബുദ്ധിമുട്ടില്ല. ഡാറ്റ സംഭരിക്കുന്ന ചില മാർഗങ്ങൾ:
|
||||
<ul>
|
||||
<li>ഒരു റിലേഷണൽ ഡാറ്റാബേസ് പട്ടികകളുടെ ശേഖരം സംഭരിക്കുന്നു, അവയെ ക്വറി ചെയ്യാൻ SQL എന്ന പ്രത്യേക ഭാഷ ഉപയോഗിക്കുന്നു. സാധാരണയായി, പട്ടികകൾ സ്കീമകൾ എന്ന വ്യത്യസ്ത ഗ്രൂപ്പുകളായി ക്രമീകരിച്ചിരിക്കുന്നു. പലപ്പോഴും ഡാറ്റയുടെ യഥാർത്ഥ രൂപം സ്കീമയ്ക്ക് അനുയോജ്യമായി മാറ്റേണ്ടി വരും.</li>
|
||||
<li><a href="https://en.wikipedia.org/wiki/NoSQL">NoSQL</a> ഡാറ്റാബേസ്, ഉദാഹരണത്തിന് <a href="https://azure.microsoft.com/services/cosmos-db/?WT.mc_id=academic-77958-bethanycheum">CosmosDB</a>, ഡാറ്റയിൽ സ്കീമകൾ നിർബന്ധമാക്കുന്നില്ല, കൂടുതൽ സങ്കീർണ്ണമായ ഡാറ്റ സംഭരിക്കാൻ അനുവദിക്കുന്നു, ഉദാഹരണത്തിന്, ഹയർആർക്കിക്കൽ JSON ഡോക്യുമെന്റുകൾ അല്ലെങ്കിൽ ഗ്രാഫുകൾ. എന്നാൽ NoSQL ഡാറ്റാബേസുകൾക്ക് SQL പോലുള്ള സമ്പന്നമായ ക്വറി കഴിവുകൾ ഇല്ല, കൂടാതെ റഫറൻഷ്യൽ ഇന്റഗ്രിറ്റി നിർബന്ധമാക്കാൻ കഴിയില്ല, അതായത് പട്ടികകളിലെ ഡാറ്റ എങ്ങനെ ഘടിപ്പിക്കപ്പെട്ടിരിക്കുന്നു എന്നതും പട്ടികകളിലെ ബന്ധങ്ങൾ നിയന്ത്രിക്കുന്ന നിയമങ്ങളും.</li>
|
||||
<li><a href="https://en.wikipedia.org/wiki/Data_lake">ഡാറ്റാ ലേക്ക്</a> സംഭരണം കച്ചവട, അസംഘടിത രൂപത്തിലുള്ള വലിയ ഡാറ്റ ശേഖരങ്ങൾക്ക് ഉപയോഗിക്കുന്നു. ഡാറ്റാ ലേക്ക് സാധാരണയായി ബിഗ് ഡാറ്റയുമായി ഉപയോഗിക്കുന്നു, എല്ലാ ഡാറ്റയും ഒരു യന്ത്രത്തിൽ ഫിറ്റ് ചെയ്യാനാകാത്തപ്പോൾ, ക്ലസ്റ്റർ സർവറുകളുടെ കൂട്ടത്തിൽ സംഭരിക്കുകയും പ്രോസസ്സ് ചെയ്യുകയും ചെയ്യേണ്ടതുണ്ട്. <a href="https://en.wikipedia.org/wiki/Apache_Parquet">Parquet</a> ബിഗ് ഡാറ്റയുമായി ചേർന്ന് ഉപയോഗിക്കുന്ന ഡാറ്റ ഫോർമാറ്റാണ്.</li>
|
||||
</ul>
|
||||
</dd>
|
||||
<dt>3) ഡാറ്റ പ്രോസസ്സിംഗ്</dt>
|
||||
<dd>
|
||||
ഡാറ്റയുടെ യാത്രയിലെ ഏറ്റവും രസകരമായ ഭാഗമാണ് ഇത്, യഥാർത്ഥ രൂപത്തിൽ നിന്നുള്ള ഡാറ്റ ദൃശ്യവൽക്കരണത്തിനും മോഡൽ പരിശീലനത്തിനും ഉപയോഗിക്കാവുന്ന രൂപത്തിലേക്ക് മാറ്റുന്നതാണ്. എഴുത്ത് അല്ലെങ്കിൽ ചിത്രങ്ങൾ പോലുള്ള അസംഘടിത ഡാറ്റ കൈകാര്യം ചെയ്യുമ്പോൾ, ഡാറ്റയിൽ നിന്നുള്ള <b>ഫീച്ചറുകൾ</b> എടുക്കാൻ ചില AI സാങ്കേതിക വിദ്യകൾ ഉപയോഗിക്കേണ്ടി വരാം, അതിലൂടെ അത് ഘടിത രൂപത്തിലേക്ക് മാറ്റുന്നു.
|
||||
</dd>
|
||||
<dt>4) ദൃശ്യവൽക്കരണം / മനുഷ്യ洞察ങ്ങൾ</dt>
|
||||
<dd>
|
||||
ഡാറ്റ മനസ്സിലാക്കാൻ പലപ്പോഴും അതിനെ ദൃശ്യവൽക്കരിക്കേണ്ടതുണ്ട്. വിവിധ ദൃശ്യവൽക്കരണ സാങ്കേതിക വിദ്യകൾ നമ്മുടെ ഉപകരണസഞ്ചയത്തിൽ ഉണ്ടെങ്കിൽ,洞察ം കണ്ടെത്താൻ ശരിയായ കാഴ്ച കണ്ടെത്താം. പലപ്പോഴും, ഒരു ഡാറ്റാ സയന്റിസ്റ്റ് ഡാറ്റയുമായി "കളിയാക്കണം", പല തവണ ദൃശ്യവൽക്കരിച്ച് ചില ബന്ധങ്ങൾ അന്വേഷിക്കണം. കൂടാതെ, നാം സ്ഥിതിവിവരശാസ്ത്ര സാങ്കേതിക വിദ്യകൾ ഉപയോഗിച്ച് ഒരു ഹിപോത്തസിസ് പരിശോധിക്കുകയോ ഡാറ്റയിലെ വിവിധ ഭാഗങ്ങൾ തമ്മിലുള്ള ബന്ധം തെളിയിക്കുകയോ ചെയ്യാം.
|
||||
</dd>
|
||||
<dt>5) പ്രവചന മോഡൽ പരിശീലനം</dt>
|
||||
<dd>
|
||||
ഡാറ്റാ സയൻസിന്റെ അന്തിമ ലക്ഷ്യം ഡാറ്റയുടെ അടിസ്ഥാനത്തിൽ തീരുമാനങ്ങൾ എടുക്കാനാകുക എന്നതാണ്, അതിനാൽ <a href="http://github.com/microsoft/ml-for-beginners">മെഷീൻ ലേണിംഗ്</a> സാങ്കേതിക വിദ്യകൾ ഉപയോഗിച്ച് പ്രവചന മോഡൽ നിർമ്മിക്കാൻ ആഗ്രഹിക്കാം. പിന്നീട് സമാന ഘടനകളുള്ള പുതിയ ഡാറ്റാ സെറ്റുകൾ ഉപയോഗിച്ച് പ്രവചനങ്ങൾ നടത്താൻ ഇത് ഉപയോഗിക്കാം.
|
||||
</dd>
|
||||
</dl>
|
||||
|
||||
തികച്ചും, യഥാർത്ഥ ഡാറ്റയെ ആശ്രയിച്ച് ചില ഘട്ടങ്ങൾ ഇല്ലാതിരിക്കാം (ഉദാഹരണത്തിന്, ഡാറ്റാബേസിൽ ഡാറ്റ ഇതിനകം ഉണ്ടെങ്കിൽ, അല്ലെങ്കിൽ മോഡൽ പരിശീലനം ആവശ്യമില്ലെങ്കിൽ), അല്ലെങ്കിൽ ചില ഘട്ടങ്ങൾ പല തവണ ആവർത്തിക്കപ്പെടാം (ഉദാഹരണത്തിന്, ഡാറ്റ പ്രോസസ്സിംഗ്).
|
||||
|
||||
## ഡിജിറ്റലൈസേഷൻയും ഡിജിറ്റൽ ട്രാൻസ്ഫർമേഷനും
|
||||
|
||||
കഴിഞ്ഞ ദശകത്തിൽ, പല ബിസിനസുകളും ബിസിനസ് തീരുമാനങ്ങൾ എടുക്കുമ്പോൾ ഡാറ്റയുടെ പ്രാധാന്യം മനസ്സിലാക്കാൻ തുടങ്ങി. ബിസിനസ് പ്രക്രിയകൾ ഡിജിറ്റൽ രൂപത്തിലേക്ക് മാറ്റി ഡാറ്റ ശേഖരിക്കുകയാണ് ആദ്യഘട്ടം, ഇതാണ് **ഡിജിറ്റലൈസേഷൻ** എന്ന് അറിയപ്പെടുന്നത്. ഈ ഡാറ്റയിൽ ഡാറ്റാ സയൻസ് സാങ്കേതിക വിദ്യകൾ പ്രയോഗിച്ച് തീരുമാനങ്ങൾ നയിക്കുന്നത് **ഡിജിറ്റൽ ട്രാൻസ്ഫർമേഷൻ** എന്ന് വിളിക്കുന്നു, ഇത് ഉൽപാദനക്ഷമതയിൽ വലിയ വർദ്ധനവുകൾ (അല്ലെങ്കിൽ ബിസിനസ് പിവോട്ട്) ഉണ്ടാക്കാം.
|
||||
|
||||
ഒരു ഉദാഹരണം പരിഗണിക്കാം. നമുക്ക് ഒരു ഡാറ്റാ സയൻസ് കോഴ്സ് (ഇതുപോലുള്ളത്) ഓൺലൈനായി വിദ്യാർത്ഥികൾക്ക് നൽകുന്നു, അതിൽ ഡാറ്റാ സയൻസ് ഉപയോഗിച്ച് മെച്ചപ്പെടുത്താൻ ആഗ്രഹിക്കുന്നു. എങ്ങനെ ചെയ്യാം?
|
||||
|
||||
"എന്ത് ഡിജിറ്റലൈസ് ചെയ്യാം?" എന്ന് ചോദിച്ച് തുടങ്ങാം. ഏറ്റവും ലളിതമായ മാർഗം ഓരോ വിദ്യാർത്ഥിയും ഓരോ മോഡ്യൂളും പൂർത്തിയാക്കാൻ എത്ര സമയം എടുക്കുന്നു എന്ന് അളക്കുകയും, ഓരോ മോഡ്യൂളിന്റെ അവസാനം മൾട്ടി-ചോയ്സ് ടെസ്റ്റ് നൽകി ലഭിച്ച അറിവ് അളക്കുകയും ചെയ്യുക ആണ്. എല്ലാ വിദ്യാർത്ഥികളുടെയും പൂർത്തിയാക്കാനുള്ള സമയം ശരാശരി എടുത്ത്, ഏത് മോഡ്യൂളുകൾ വിദ്യാർത്ഥികൾക്ക് ഏറ്റവും ബുദ്ധിമുട്ടുള്ളതാണെന്ന് കണ്ടെത്തി അവ ലളിതമാക്കാൻ പ്രവർത്തിക്കാം.
|
||||
> നിങ്ങൾ ഈ സമീപനം അനുയോജ്യമല്ലെന്ന് വാദിക്കാം, കാരണം മോഡ്യൂളുകൾ വ്യത്യസ്ത നീളമുള്ളവയായിരിക്കാം. മോഡ്യൂളിന്റെ നീളം (അക്ഷരങ്ങളുടെ എണ്ണം) അനുസരിച്ച് സമയം വിഭജിച്ച് ആ മൂല്യങ്ങൾ താരതമ്യം ചെയ്യുന്നത് കൂടുതൽ നീതിപൂർണമായിരിക്കാം.
|
||||
|
||||
നാം ബഹുവികല്പ പരീക്ഷകളുടെ ഫലങ്ങൾ വിശകലനം തുടങ്ങുമ്പോൾ, വിദ്യാർത്ഥികൾക്ക് ബുദ്ധിമുട്ട് ഉണ്ടാകുന്ന ആശയങ്ങൾ കണ്ടെത്താൻ ശ്രമിക്കാം, ആ വിവരങ്ങൾ ഉള്ളടക്കം മെച്ചപ്പെടുത്താൻ ഉപയോഗിക്കാം. അതിനായി, ഓരോ ചോദ്യവും ഒരു പ്രത്യേക ആശയത്തോടോ അറിവിന്റെ ഒരു ഭാഗത്തോടോ ബന്ധിപ്പിക്കുന്ന വിധത്തിൽ പരീക്ഷകൾ രൂപകൽപ്പന ചെയ്യേണ്ടതുണ്ട്.
|
||||
|
||||
കൂടുതൽ സങ്കീർണ്ണമാക്കാൻ ആഗ്രഹിക്കുന്നുവെങ്കിൽ, ഓരോ മോഡ്യൂളിനും വേണ്ടി എടുത്ത സമയം വിദ്യാർത്ഥികളുടെ പ്രായ വിഭാഗത്തോടൊപ്പം പ്ലോട്ട് ചെയ്യാം. ചില പ്രായ വിഭാഗങ്ങൾക്ക് മോഡ്യൂൾ പൂർത്തിയാക്കാൻ അനാവശ്യമായി കൂടുതൽ സമയം എടുക്കുന്നുണ്ടോ, അല്ലെങ്കിൽ വിദ്യാർത്ഥികൾ പൂർത്തിയാക്കുന്നതിന് മുമ്പ് വിട്ടുപോകുന്നുണ്ടോ എന്ന് കണ്ടെത്താം. ഇത് മോഡ്യൂളിനായി പ്രായ ശുപാർശകൾ നൽകാനും തെറ്റായ പ്രതീക്ഷകളാൽ ആളുകളുടെ അസന്തോഷം കുറയ്ക്കാനും സഹായിക്കും.
|
||||
|
||||
## 🚀 വെല്ലുവിളി
|
||||
|
||||
ഈ വെല്ലുവിളിയിൽ, ഡാറ്റാ സയൻസ് മേഖലയുമായി ബന്ധപ്പെട്ട ആശയങ്ങൾ വാചകങ്ങൾ പരിശോധിച്ച് കണ്ടെത്താൻ ശ്രമിക്കും. ഡാറ്റാ സയൻസിനെക്കുറിച്ചുള്ള ഒരു വിക്കിപീഡിയ ലേഖനം എടുത്ത്, ടെക്സ്റ്റ് ഡൗൺലോഡ് ചെയ്ത് പ്രോസസ് ചെയ്ത്, താഴെ കാണുന്ന പോലെ ഒരു വാക്ക് ക്ലൗഡ് നിർമ്മിക്കും:
|
||||
|
||||

|
||||
|
||||
കോഡ് വായിക്കാൻ [`notebook.ipynb`](../../../../1-Introduction/01-defining-data-science/notebook.ipynb ':ignore') സന്ദർശിക്കുക. നിങ്ങൾക്ക് കോഡ് പ്രവർത്തിപ്പിച്ച് എല്ലാ ഡാറ്റാ പരിവർത്തനങ്ങളും യഥാർത്ഥ സമയത്ത് എങ്ങനെ നടക്കുന്നതെന്ന് കാണാം.
|
||||
|
||||
> Jupyter Notebook-ൽ കോഡ് എങ്ങനെ പ്രവർത്തിപ്പിക്കാമെന്ന് അറിയില്ലെങ്കിൽ, [ഈ ലേഖനം](https://soshnikov.com/education/how-to-execute-notebooks-from-github/) കാണുക.
|
||||
|
||||
## [പോസ്റ്റ്-ലെക്ചർ ക്വിസ്](https://ff-quizzes.netlify.app/en/ds/quiz/1)
|
||||
|
||||
## അസൈൻമെന്റുകൾ
|
||||
|
||||
* **ടാസ്ക് 1**: മുകളിൽ നൽകിയ കോഡ് മാറ്റി **Big Data** ഉം **Machine Learning** ഉം മേഖലകളുമായി ബന്ധപ്പെട്ട ആശയങ്ങൾ കണ്ടെത്തുക
|
||||
* **ടാസ്ക് 2**: [ഡാറ്റാ സയൻസ് സീനാരിയോകൾ ചിന്തിക്കുക](assignment.md)
|
||||
|
||||
## ക്രെഡിറ്റുകൾ
|
||||
|
||||
ഈ പാഠം ♥️ കൊണ്ട് രചിച്ചത് [Dmitry Soshnikov](http://soshnikov.com) ആണ്.
|
||||
|
||||
---
|
||||
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
|
||||
**അസൂയാ**:
|
||||
ഈ രേഖ AI വിവർത്തന സേവനം [Co-op Translator](https://github.com/Azure/co-op-translator) ഉപയോഗിച്ച് വിവർത്തനം ചെയ്തതാണ്. നാം കൃത്യതയ്ക്ക് ശ്രമിച്ചിട്ടുണ്ടെങ്കിലും, സ്വയം പ്രവർത്തിക്കുന്ന വിവർത്തനങ്ങളിൽ പിശകുകൾ അല്ലെങ്കിൽ തെറ്റുകൾ ഉണ്ടാകാമെന്ന് ദയവായി ശ്രദ്ധിക്കുക. അതിന്റെ മാതൃഭാഷയിലുള്ള യഥാർത്ഥ രേഖ പ്രാമാണികമായ ഉറവിടമായി കണക്കാക്കണം. നിർണായക വിവരങ്ങൾക്ക്, പ്രൊഫഷണൽ മനുഷ്യ വിവർത്തനം ശുപാർശ ചെയ്യപ്പെടുന്നു. ഈ വിവർത്തനത്തിന്റെ ഉപയോഗത്തിൽ നിന്നുണ്ടാകുന്ന ഏതെങ്കിലും തെറ്റിദ്ധാരണകൾക്കോ തെറ്റായ വ്യാഖ്യാനങ്ങൾക്കോ ഞങ്ങൾ ഉത്തരവാദികളല്ല.
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER END -->
|
||||
@ -0,0 +1,17 @@
|
||||
<!--
|
||||
CO_OP_TRANSLATOR_METADATA:
|
||||
{
|
||||
"original_hash": "4e0f1773b9bee1be3b28f9fe2c71b3de",
|
||||
"translation_date": "2025-12-19T13:41:01+00:00",
|
||||
"source_file": "1-Introduction/01-defining-data-science/assignment.md",
|
||||
"language_code": "ml"
|
||||
}
|
||||
-->
|
||||
Translation for chunk 1 of 'assignment.md' skipped due to timeout.
|
||||
|
||||
---
|
||||
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
|
||||
**അസൂയാ**:
|
||||
ഈ രേഖ AI വിവർത്തന സേവനം [Co-op Translator](https://github.com/Azure/co-op-translator) ഉപയോഗിച്ച് വിവർത്തനം ചെയ്തതാണ്. നാം കൃത്യതയ്ക്ക് ശ്രമിച്ചിട്ടുണ്ടെങ്കിലും, സ്വയം പ്രവർത്തിക്കുന്ന വിവർത്തനങ്ങളിൽ പിശകുകൾ അല്ലെങ്കിൽ തെറ്റുകൾ ഉണ്ടാകാമെന്ന് ദയവായി ശ്രദ്ധിക്കുക. അതിന്റെ മാതൃഭാഷയിലുള്ള യഥാർത്ഥ രേഖയാണ് പ്രാമാണികമായ ഉറവിടം എന്ന് പരിഗണിക്കേണ്ടതാണ്. നിർണായകമായ വിവരങ്ങൾക്ക്, പ്രൊഫഷണൽ മനുഷ്യ വിവർത്തനം ശുപാർശ ചെയ്യപ്പെടുന്നു. ഈ വിവർത്തനം ഉപയോഗിക്കുന്നതിൽ നിന്നുണ്ടാകുന്ന ഏതെങ്കിലും തെറ്റിദ്ധാരണകൾക്കോ തെറ്റായ വ്യാഖ്യാനങ്ങൾക്കോ ഞങ്ങൾ ഉത്തരവാദികളല്ല.
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER END -->
|
||||
File diff suppressed because one or more lines are too long
@ -0,0 +1,17 @@
|
||||
<!--
|
||||
CO_OP_TRANSLATOR_METADATA:
|
||||
{
|
||||
"original_hash": "a8f79b9c0484c35b4f26e8aec7fc4d56",
|
||||
"translation_date": "2025-12-19T14:34:45+00:00",
|
||||
"source_file": "1-Introduction/01-defining-data-science/solution/assignment.md",
|
||||
"language_code": "ml"
|
||||
}
|
||||
-->
|
||||
Translation for chunk 1 of 'assignment.md' skipped due to timeout.
|
||||
|
||||
---
|
||||
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
|
||||
**അസൂയാപത്രം**:
|
||||
ഈ രേഖ AI വിവർത്തന സേവനം [Co-op Translator](https://github.com/Azure/co-op-translator) ഉപയോഗിച്ച് വിവർത്തനം ചെയ്തതാണ്. നാം കൃത്യതയ്ക്ക് ശ്രമിച്ചിട്ടുണ്ടെങ്കിലും, യന്ത്രം ചെയ്ത വിവർത്തനങ്ങളിൽ പിശകുകൾ അല്ലെങ്കിൽ തെറ്റുകൾ ഉണ്ടാകാമെന്ന് ദയവായി ശ്രദ്ധിക്കുക. അതിന്റെ മാതൃഭാഷയിലുള്ള യഥാർത്ഥ രേഖ അധികാരപരമായ ഉറവിടമായി കണക്കാക്കണം. നിർണായക വിവരങ്ങൾക്ക്, പ്രൊഫഷണൽ മനുഷ്യ വിവർത്തനം ശുപാർശ ചെയ്യപ്പെടുന്നു. ഈ വിവർത്തനം ഉപയോഗിക്കുന്നതിൽ നിന്നുണ്ടാകുന്ന ഏതെങ്കിലും തെറ്റിദ്ധാരണകൾക്കോ തെറ്റായ വ്യാഖ്യാനങ്ങൾക്കോ ഞങ്ങൾ ഉത്തരവാദികളല്ല.
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER END -->
|
||||
File diff suppressed because one or more lines are too long
@ -0,0 +1,35 @@
|
||||
<!--
|
||||
CO_OP_TRANSLATOR_METADATA:
|
||||
{
|
||||
"original_hash": "b588c0fc73014f52520c666efc3e0cc3",
|
||||
"translation_date": "2025-12-19T14:28:24+00:00",
|
||||
"source_file": "1-Introduction/02-ethics/assignment.md",
|
||||
"language_code": "ml"
|
||||
}
|
||||
-->
|
||||
## ഡാറ്റ എതിക്സ് കേസ് സ്റ്റഡി എഴുതുക
|
||||
|
||||
## നിർദ്ദേശങ്ങൾ
|
||||
|
||||
നിങ്ങൾ വിവിധ [ഡാറ്റ എതിക്സ് ചലഞ്ചുകൾ](README.md#2-ethics-challenges) പഠിച്ചിട്ടുണ്ട്, കൂടാതെ യാഥാർത്ഥ്യ സാഹചര്യങ്ങളിൽ ഡാറ്റ എതിക്സ് ചലഞ്ചുകൾ പ്രതിഫലിപ്പിക്കുന്ന ചില [കേസ് സ്റ്റഡികൾ](README.md#3-case-studies) കണ്ടിട്ടുണ്ട്.
|
||||
|
||||
ഈ അസൈൻമെന്റിൽ, നിങ്ങളുടെ സ്വന്തം അനുഭവത്തിൽ നിന്നോ നിങ്ങൾ പരിചയമുള്ള യഥാർത്ഥ ലോക സാഹചര്യത്തിൽ നിന്നോ ഒരു ഡാറ്റ എതിക്സ് ചലഞ്ച് പ്രതിഫലിപ്പിക്കുന്ന നിങ്ങളുടെ സ്വന്തം കേസ് സ്റ്റഡി എഴുതും. ഈ ഘട്ടങ്ങൾ പിന്തുടരുക:
|
||||
|
||||
1. `ഒരു ഡാറ്റ എതിക്സ് ചലഞ്ച് തിരഞ്ഞെടുക്കുക`. [പാഠം ഉദാഹരണങ്ങൾ](README.md#2-ethics-challenges) നോക്കുക അല്ലെങ്കിൽ പ്രചോദനത്തിനായി ഓൺലൈൻ ഉദാഹരണങ്ങൾ പോലുള്ള [Deon ചെക്ക്ലിസ്റ്റ്](https://deon.drivendata.org/examples/) പരിശോധിക്കുക.
|
||||
|
||||
2. `ഒരു യഥാർത്ഥ ലോക ഉദാഹരണം വിവരിക്കുക`. നിങ്ങൾ കേട്ടിട്ടുള്ള (ഹെഡ്ലൈനുകൾ, ഗവേഷണ പഠനം മുതലായവ) അല്ലെങ്കിൽ അനുഭവിച്ച (പ്രാദേശിക സമൂഹം) ഒരു സാഹചര്യത്തെക്കുറിച്ച് ചിന്തിക്കുക, ഈ പ്രത്യേക ചലഞ്ച് സംഭവിച്ച സ്ഥലം. ഈ ചലഞ്ചുമായി ബന്ധപ്പെട്ട ഡാറ്റ എതിക്സ് ചോദ്യങ്ങളെക്കുറിച്ച് ചിന്തിക്കുക - ഈ പ്രശ്നം മൂലം ഉണ്ടാകുന്ന സാധ്യതയുള്ള ഹാനികൾ അല്ലെങ്കിൽ അനിഷ്ടഫലങ്ങൾ ചർച്ച ചെയ്യുക. ബോണസ് പോയിന്റുകൾ: ഈ ചലഞ്ചിന്റെ ദോഷപ്രഭാവം ഒഴിവാക്കാൻ അല്ലെങ്കിൽ കുറയ്ക്കാൻ സഹായിക്കുന്ന സാധ്യതയുള്ള പരിഹാരങ്ങൾ അല്ലെങ്കിൽ പ്രക്രിയകൾ ചിന്തിക്കുക.
|
||||
|
||||
3. `ബന്ധപ്പെട്ട റിസോഴ്സുകളുടെ പട്ടിക നൽകുക`. ഇത് യഥാർത്ഥ ലോക സംഭവമായിരുന്നുവെന്ന് തെളിയിക്കാൻ ഒരു അല്ലെങ്കിൽ കൂടുതൽ റിസോഴ്സുകൾ (ആർട്ടിക്കിള് ലിങ്കുകൾ, വ്യക്തിഗത ബ്ലോഗ് പോസ്റ്റ് അല്ലെങ്കിൽ ചിത്രം, ഓൺലൈൻ ഗവേഷണ പേപ്പർ മുതലായവ) പങ്കുവെക്കുക. ബോണസ് പോയിന്റുകൾ: സംഭവത്തിൽ നിന്നുള്ള സാധ്യതയുള്ള ഹാനികളും ഫലങ്ങളും കാണിക്കുന്ന, അല്ലെങ്കിൽ അതിന്റെ ആവർത്തനം തടയാൻ എടുത്ത പോസിറ്റീവ് നടപടികൾ ഹൈലൈറ്റ് ചെയ്യുന്ന റിസോഴ്സുകൾ പങ്കുവെക്കുക.
|
||||
|
||||
## റൂബ്രിക്
|
||||
|
||||
Exemplary | Adequate | Needs Improvement
|
||||
--- | --- | -- |
|
||||
ഒരു അല്ലെങ്കിൽ കൂടുതൽ ഡാറ്റ എതിക്സ് ചലഞ്ചുകൾ തിരിച്ചറിയപ്പെട്ടിട്ടുണ്ട്. <br/> <br/> കേസ് സ്റ്റഡി ആ ചലഞ്ച് പ്രതിഫലിപ്പിക്കുന്ന യഥാർത്ഥ ലോക സംഭവത്തെ വ്യക്തമായി വിവരിക്കുന്നു, അതും അതിന്റെ അനിഷ്ടഫലങ്ങൾ അല്ലെങ്കിൽ ഹാനികൾ ഹൈലൈറ്റ് ചെയ്യുന്നു. <br/><br/> ഇത് സംഭവിച്ചതായി തെളിയിക്കാൻ കുറഞ്ഞത് ഒരു ലിങ്കുചെയ്ത റിസോഴ്സ് ഉണ്ട്. | ഒരു ഡാറ്റ എതിക്സ് ചലഞ്ച് തിരിച്ചറിയപ്പെട്ടിട്ടുണ്ട്. <br/><br/> കുറഞ്ഞത് ഒരു ബന്ധപ്പെട്ട ഹാനി അല്ലെങ്കിൽ ഫലം സംക്ഷിപ്തമായി ചർച്ച ചെയ്യപ്പെട്ടിട്ടുണ്ട്. <br/><br/> എന്നാൽ ചർച്ച പരിമിതമാണ് അല്ലെങ്കിൽ യഥാർത്ഥ ലോക സംഭവമെന്ന തെളിവ് കുറവാണ്. | ഒരു ഡാറ്റ ചലഞ്ച് തിരിച്ചറിയപ്പെട്ടിട്ടുണ്ട്. <br/><br/> എന്നാൽ വിവരണം അല്ലെങ്കിൽ റിസോഴ്സുകൾ ചലഞ്ച് ശരിയായി പ്രതിഫലിപ്പിക്കുന്നില്ല അല്ലെങ്കിൽ യഥാർത്ഥ ലോക സംഭവമെന്നു തെളിയിക്കുന്നില്ല. |
|
||||
|
||||
---
|
||||
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
|
||||
**അസൂയാ**:
|
||||
ഈ രേഖ AI വിവർത്തന സേവനം [Co-op Translator](https://github.com/Azure/co-op-translator) ഉപയോഗിച്ച് വിവർത്തനം ചെയ്തതാണ്. നാം കൃത്യതയ്ക്ക് ശ്രമിച്ചെങ്കിലും, സ്വയം പ്രവർത്തിക്കുന്ന വിവർത്തനങ്ങളിൽ പിശകുകൾ അല്ലെങ്കിൽ തെറ്റുകൾ ഉണ്ടാകാമെന്ന് ദയവായി ശ്രദ്ധിക്കുക. അതിന്റെ മാതൃഭാഷയിലുള്ള യഥാർത്ഥ രേഖ പ്രാമാണികമായ ഉറവിടമായി കണക്കാക്കണം. നിർണായക വിവരങ്ങൾക്ക്, പ്രൊഫഷണൽ മനുഷ്യ വിവർത്തനം ശുപാർശ ചെയ്യപ്പെടുന്നു. ഈ വിവർത്തനത്തിന്റെ ഉപയോഗത്തിൽ നിന്നുണ്ടാകുന്ന ഏതെങ്കിലും തെറ്റിദ്ധാരണകൾക്കോ തെറ്റായ വ്യാഖ്യാനങ്ങൾക്കോ ഞങ്ങൾ ഉത്തരവാദികളല്ല.
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER END -->
|
||||
@ -0,0 +1,88 @@
|
||||
<!--
|
||||
CO_OP_TRANSLATOR_METADATA:
|
||||
{
|
||||
"original_hash": "12339119c0165da569a93ddba05f9339",
|
||||
"translation_date": "2025-12-19T13:59:33+00:00",
|
||||
"source_file": "1-Introduction/03-defining-data/README.md",
|
||||
"language_code": "ml"
|
||||
}
|
||||
-->
|
||||
# ഡാറ്റ നിർവചിക്കൽ
|
||||
|
||||
| ](../../sketchnotes/03-DefiningData.png)|
|
||||
|:---:|
|
||||
|ഡാറ്റ നിർവചിക്കൽ - _Sketchnote by [@nitya](https://twitter.com/nitya)_ |
|
||||
|
||||
ഡാറ്റ എന്നത് കണ്ടെത്തലുകൾ നടത്താനും വിവരസമ്പന്നമായ തീരുമാനങ്ങൾ പിന്തുണയ്ക്കാനും ഉപയോഗിക്കുന്ന വാസ്തവങ്ങൾ, വിവരങ്ങൾ, നിരീക്ഷണങ്ങൾ, അളവുകൾ എന്നിവയാണ്. ഒരു ഡാറ്റ പോയിന്റ് എന്നത് ഒരു ഡാറ്റാസെറ്റിനുള്ളിൽ ഉള്ള ഒരു ഏകക ഡാറ്റയാണ്, ഡാറ്റ പോയിന്റുകളുടെ സമാഹാരമാണ് ഡാറ്റാസെറ്റ്. ഡാറ്റാസെറ്റുകൾ വ്യത്യസ്ത ഫോർമാറ്റുകളിലും ഘടനകളിലും വരാം, സാധാരണയായി അതിന്റെ ഉറവിടം അല്ലെങ്കിൽ ഡാറ്റ എവിടെ നിന്നാണ് വന്നത് എന്നതിന്റെ അടിസ്ഥാനത്തിലാണ്. ഉദാഹരണത്തിന്, ഒരു കമ്പനിയുടെ മാസവരുമാനം ഒരു സ്പ്രെഡ്ഷീറ്റിൽ ഉണ്ടാകാം, എന്നാൽ ഒരു സ്മാർട്ട്വാച്ചിൽ നിന്നുള്ള മണിക്കൂറിൽ ഹൃദയമിടിപ്പ് ഡാറ്റ [JSON](https://stackoverflow.com/a/383699) ഫോർമാറ്റിൽ ഉണ്ടാകാം. ഒരു ഡാറ്റാസെറ്റിനുള്ളിൽ ഡാറ്റ സയന്റിസ്റ്റുകൾ വ്യത്യസ്ത തരത്തിലുള്ള ഡാറ്റകളുമായി പ്രവർത്തിക്കുന്നത് സാധാരണമാണ്.
|
||||
|
||||
ഈ പാഠം ഡാറ്റയുടെ സവിശേഷതകളും ഉറവിടങ്ങളും അടിസ്ഥാനമാക്കി ഡാറ്റ തിരിച്ചറിയാനും വർഗ്ഗീകരിക്കാനും ശ്രദ്ധ കേന്ദ്രീകരിക്കുന്നു.
|
||||
|
||||
## [പ്രീ-ലെക്ചർ ക്വിസ്](https://ff-quizzes.netlify.app/en/ds/quiz/4)
|
||||
## ഡാറ്റ എങ്ങനെ വിവരണമാണ്
|
||||
|
||||
### റോ ഡാറ്റ
|
||||
റോ ഡാറ്റ എന്നത് അതിന്റെ ഉറവിടത്തിൽ നിന്നുള്ള പ്രാഥമിക അവസ്ഥയിലുള്ള ഡാറ്റയാണ്, ഇത് വിശകലനം ചെയ്യപ്പെടുകയോ ക്രമീകരിക്കപ്പെടുകയോ ചെയ്തിട്ടില്ല. ഒരു ഡാറ്റാസെറ്റിൽ എന്ത് സംഭവിക്കുന്നു എന്ന് മനസ്സിലാക്കാൻ, അത് മനുഷ്യരും അവയെ കൂടുതൽ വിശകലനം ചെയ്യാൻ ഉപയോഗിക്കുന്ന സാങ്കേതികവിദ്യയും മനസ്സിലാക്കാൻ കഴിയുന്ന ഫോർമാറ്റിലേക്ക് ക്രമീകരിക്കേണ്ടതുണ്ട്. ഒരു ഡാറ്റാസെറ്റിന്റെ ഘടന അതെങ്ങനെ ക്രമീകരിച്ചിരിക്കുന്നു എന്ന് വിവരിക്കുന്നു, ഇത് ഘടനയുള്ള, ഘടനയില്ലാത്ത, അർദ്ധഘടനയുള്ള എന്നിങ്ങനെ വർഗ്ഗീകരിക്കാം. ഈ ഘടനാ തരം ഉറവിടത്തിന്റെ അടിസ്ഥാനത്തിൽ വ്യത്യാസപ്പെടും, പക്ഷേ ഒടുവിൽ ഈ മൂന്ന് വിഭാഗങ്ങളിൽ പെടും.
|
||||
|
||||
### അളവുകൂട്ടിയ ഡാറ്റ
|
||||
അളവുകൂട്ടിയ ഡാറ്റ എന്നത് ഒരു ഡാറ്റാസെറ്റിനുള്ളിലെ സംഖ്യാത്മക നിരീക്ഷണങ്ങളാണ്, സാധാരണയായി ഇത് വിശകലനം ചെയ്യാനും അളക്കാനും ഗണിതപരമായി ഉപയോഗിക്കാനും കഴിയും. അളവുകൂട്ടിയ ഡാറ്റയുടെ ചില ഉദാഹരണങ്ങൾ: ഒരു രാജ്യത്തിന്റെ ജനസംഖ്യ, ഒരു വ്യക്തിയുടെ ഉയരം, ഒരു കമ്പനിയുടെ ത്രൈമാസ വരുമാനം. കൂടുതൽ വിശകലനത്തോടെ, അളവുകൂട്ടിയ ഡാറ്റ ഉപയോഗിച്ച് എയർ ക്വാളിറ്റി ഇൻഡക്സ് (AQI) ന്റെ സീസണൽ ട്രെൻഡുകൾ കണ്ടെത്താനോ സാധാരണ ജോലി ദിവസത്തിലെ തിരക്കുള്ള സമയത്തിന്റെ സാധ്യത കണക്കാക്കാനോ കഴിയും.
|
||||
|
||||
### ഗുണപരമായ ഡാറ്റ
|
||||
ഗുണപരമായ ഡാറ്റ, അല്ലെങ്കിൽ വർഗ്ഗീയ ഡാറ്റ എന്നറിയപ്പെടുന്നത്, അളവുകൂട്ടിയ ഡാറ്റ പോലെയുള്ള വസ്തുനിഷ്ഠമായി അളക്കാനാകാത്ത ഡാറ്റയാണ്. സാധാരണയായി ഇത് ഉൽപ്പന്നം അല്ലെങ്കിൽ പ്രക്രിയ പോലുള്ള ഒന്നിന്റെ ഗുണനിലവാരം പിടിച്ചെടുക്കുന്ന വിവിധ സ്വഭാവത്തിലുള്ള വിഷയപരമായ ഡാറ്റയാണ്. ചിലപ്പോൾ, ഗുണപരമായ ഡാറ്റ സംഖ്യാത്മകമായിരിക്കാം, എന്നാൽ സാധാരണ ഗണിതപരമായി ഉപയോഗിക്കാറില്ല, ഉദാഹരണത്തിന് ഫോൺ നമ്പറുകൾ അല്ലെങ്കിൽ ടൈംസ്റ്റാമ്പുകൾ. ഗുണപരമായ ഡാറ്റയുടെ ചില ഉദാഹരണങ്ങൾ: വീഡിയോ കമന്റുകൾ, ഒരു കാറിന്റെ നിർമ്മാതാവ് മോഡൽ, നിങ്ങളുടെ അടുത്ത സുഹൃത്തുക്കളുടെ പ്രിയപ്പെട്ട നിറം. ഗുണപരമായ ഡാറ്റ ഉപഭോക്താക്കൾക്ക് ഏറ്റവും ഇഷ്ടപ്പെട്ട ഉൽപ്പന്നങ്ങൾ മനസ്സിലാക്കാനോ ജോലി അപേക്ഷാ റിസ്യൂമുകളിൽ ജനപ്രിയമായ കീവേഡുകൾ തിരിച്ചറിയാനോ ഉപയോഗിക്കാം.
|
||||
|
||||
### ഘടനയുള്ള ഡാറ്റ
|
||||
ഘടനയുള്ള ഡാറ്റ എന്നത് വരികളും കോളങ്ങളുമായി ക്രമീകരിച്ചിരിക്കുന്ന ഡാറ്റയാണ്, ഓരോ വരിയിലും ഒരേ സെറ്റ് കോളങ്ങൾ ഉണ്ടാകും. കോളങ്ങൾ ഒരു പ്രത്യേക തരം മൂല്യത്തെ പ്രതിനിധീകരിക്കുന്നു, ആ മൂല്യം എന്താണെന്ന് വിവരിക്കുന്ന പേരോടെ തിരിച്ചറിയപ്പെടും, വരികൾ യഥാർത്ഥ മൂല്യങ്ങൾ അടങ്ങിയിരിക്കും. കോളങ്ങളിൽ സാധാരണയായി മൂല്യങ്ങൾക്ക് പ്രത്യേക നിയമങ്ങളോ നിയന്ത്രണങ്ങളോ ഉണ്ടാകും, മൂല്യങ്ങൾ കോളത്തെ ശരിയായി പ്രതിനിധീകരിക്കുന്നുവെന്ന് ഉറപ്പാക്കാൻ. ഉദാഹരണത്തിന്, ഓരോ വരിയിലും ഫോൺ നമ്പർ ഉണ്ടായിരിക്കേണ്ട ഒരു ഉപഭോക്തൃ സ്പ്രെഡ്ഷീറ്റിനെ കണക്കാക്കുക, ഫോൺ നമ്പറുകളിൽ അക്ഷരങ്ങൾ ഉണ്ടായിരിക്കരുത്. ഫോൺ നമ്പർ കോളത്തിൽ ശൂന്യമാകരുത്, നമ്പറുകൾ മാത്രമേ അടങ്ങിയിരിക്കൂ എന്നിങ്ങനെ നിയമങ്ങൾ പ്രയോഗിക്കാം.
|
||||
|
||||
ഘടനയുള്ള ഡാറ്റയുടെ ഒരു ഗുണം, അത് മറ്റൊരു ഘടനയുള്ള ഡാറ്റയുമായി ബന്ധിപ്പിക്കാവുന്നതാണ്. എന്നാൽ, ഡാറ്റ ഒരു പ്രത്യേക രീതിയിൽ ക്രമീകരിക്കാൻ രൂപകൽപ്പന ചെയ്തതിനാൽ, അതിന്റെ മൊത്തം ഘടനയിൽ മാറ്റം വരുത്താൻ വലിയ ശ്രമം വേണം. ഉദാഹരണത്തിന്, ഉപഭോക്തൃ സ്പ്രെഡ്ഷീറ്റിൽ ശൂന്യമാകരുതാത്ത ഒരു ഇമെയിൽ കോളം ചേർക്കുന്നത്, നിലവിലുള്ള വരികളിൽ ഈ മൂല്യങ്ങൾ എങ്ങനെ ചേർക്കാമെന്ന് കണ്ടെത്തേണ്ടതായിരിക്കും.
|
||||
|
||||
ഘടനയുള്ള ഡാറ്റയുടെ ഉദാഹരണങ്ങൾ: സ്പ്രെഡ്ഷീറ്റുകൾ, റിലേഷണൽ ഡാറ്റാബേസുകൾ, ഫോൺ നമ്പറുകൾ, ബാങ്ക് സ്റ്റേറ്റ്മെന്റുകൾ
|
||||
|
||||
### ഘടനയില്ലാത്ത ഡാറ്റ
|
||||
ഘടനയില്ലാത്ത ഡാറ്റ സാധാരണയായി വരികളിലോ കോളങ്ങളിലോ വർഗ്ഗീകരിക്കാനാകാത്തതും ഒരു ഫോർമാറ്റോ നിയമങ്ങളോ ഇല്ലാത്തതുമാണ്. ഘടനയില്ലാത്ത ഡാറ്റയുടെ ഘടനയിൽ കുറവ് നിയന്ത്രണങ്ങൾ ഉള്ളതിനാൽ, പുതിയ വിവരങ്ങൾ ചേർക്കുന്നത് ഘടനയുള്ള ഡാറ്റാസെറ്റിനേക്കാൾ എളുപ്പമാണ്. ഒരു സെൻസർ 2 മിനിറ്റിൽ ഒരു തവണ ബാരോമെട്രിക് പ്രഷർ ഡാറ്റ ശേഖരിക്കുന്നുണ്ടെങ്കിൽ, ഇപ്പോൾ താപനില അളക്കാനും രേഖപ്പെടുത്താനും കഴിയുന്ന അപ്ഡേറ്റ് ലഭിച്ചാൽ, അത് ഘടനയില്ലാത്ത ഡാറ്റ ആണെങ്കിൽ നിലവിലുള്ള ഡാറ്റ മാറ്റേണ്ടതില്ല. എന്നാൽ, ഈ തരത്തിലുള്ള ഡാറ്റ വിശകലനം ചെയ്യുന്നതിന് കൂടുതൽ സമയം എടുക്കാം. ഉദാഹരണത്തിന്, ഒരു ശാസ്ത്രജ്ഞൻ സെൻസർ ഡാറ്റയിൽ നിന്നുള്ള കഴിഞ്ഞ മാസത്തെ ശരാശരി താപനില കണ്ടെത്താൻ ശ്രമിക്കുമ്പോൾ, ചില രേഖപ്പെടുത്തിയ ഡാറ്റയിൽ "e" എന്നത് സെൻസർ തകരാറിലായിരുന്നുവെന്ന് സൂചിപ്പിക്കാൻ ഉപയോഗിച്ചതായി കണ്ടെത്തുന്നു, അതായത് ഡാറ്റ അപൂർണ്ണമാണ്.
|
||||
|
||||
ഘടനയില്ലാത്ത ഡാറ്റയുടെ ഉദാഹരണങ്ങൾ: ടെക്സ്റ്റ് ഫയലുകൾ, ടെക്സ്റ്റ് സന്ദേശങ്ങൾ, വീഡിയോ ഫയലുകൾ
|
||||
|
||||
### അർദ്ധഘടനയുള്ള ഡാറ്റ
|
||||
അർദ്ധഘടനയുള്ള ഡാറ്റ ഘടനയുള്ളതും ഘടനയില്ലാത്തതുമായ ഡാറ്റയുടെ സംയോജനം പോലെയാണ്. സാധാരണയായി വരികളും കോളങ്ങളുമായുള്ള ഫോർമാറ്റിൽ ഒത്തുപോകുന്നില്ല, പക്ഷേ ഘടനയുള്ളതായും സ്ഥിരമായ ഫോർമാറ്റോ നിയമങ്ങളോ പാലിക്കുന്നതുമായ രീതിയിൽ ക്രമീകരിച്ചിരിക്കുന്നു. ഘടന ഉറവിടങ്ങൾക്കിടയിൽ വ്യത്യാസപ്പെടും, ഉദാഹരണത്തിന് നന്നായി നിർവചിച്ച ഹയർആർക്കി മുതൽ പുതിയ വിവരങ്ങൾ എളുപ്പത്തിൽ സംയോജിപ്പിക്കാൻ അനുവദിക്കുന്ന കൂടുതൽ സൗകര്യമുള്ള ഘടന വരെ. മെറ്റാഡേറ്റ എന്നത് ഡാറ്റ എങ്ങനെ ക്രമീകരിച്ചിരിക്കുന്നു എന്ന് തീരുമാനിക്കാൻ സഹായിക്കുന്ന സൂചകങ്ങളാണ്, ഡാറ്റയുടെ തരം അനുസരിച്ച് വിവിധ പേരുകൾ ഉണ്ടാകും. മെറ്റാഡേറ്റയ്ക്ക് സാധാരണ പേരുകൾ: ടാഗുകൾ, ഘടകങ്ങൾ, ഘടനകൾ, ഗുണങ്ങൾ. ഉദാഹരണത്തിന്, ഒരു സാധാരണ ഇമെയിൽ സന്ദേശത്തിന് വിഷയം, ശരീരം, സ്വീകരിക്കുന്നവരുടെ ഒരു സെറ്റ് ഉണ്ടാകും, അയച്ചത് ആരാണെന്നും എപ്പോൾ ആണെന്നും ക്രമീകരിക്കാവുന്നതാണ്.
|
||||
|
||||
അർദ്ധഘടനയുള്ള ഡാറ്റയുടെ ഉദാഹരണങ്ങൾ: HTML, CSV ഫയലുകൾ, ജാവാസ്ക്രിപ്റ്റ് ഒബ്ജക്റ്റ് നോട്ടേഷൻ (JSON)
|
||||
|
||||
## ഡാറ്റയുടെ ഉറവിടങ്ങൾ
|
||||
|
||||
ഡാറ്റ ഉറവിടം എന്നത് ഡാറ്റ എവിടെ സൃഷ്ടിക്കപ്പെട്ടുവോ "വസിക്കുന്നിടമോ" ആ പ്രാഥമിക സ്ഥലം ആണ്, ഇത് എങ്ങനെ എപ്പോൾ ശേഖരിച്ചതിന്റെ അടിസ്ഥാനത്തിൽ വ്യത്യാസപ്പെടും. ഉപയോക്താക്കൾ സൃഷ്ടിച്ച ഡാറ്റ പ്രാഥമിക ഡാറ്റയായി അറിയപ്പെടുന്നു, പൊതുവായ ഉപയോഗത്തിനായി ശേഖരിച്ച ഡാറ്റ രണ്ടാമത്തെ ഡാറ്റയാണ്. ഉദാഹരണത്തിന്, ഒരു ഗ്രൂപ്പ് ശാസ്ത്രജ്ഞർ ഒരു മഴക്കാടിൽ നിരീക്ഷണങ്ങൾ ശേഖരിക്കുന്നത് പ്രാഥമികമായി കണക്കാക്കപ്പെടും, അവർ അത് മറ്റ് ശാസ്ത്രജ്ഞരുമായി പങ്കുവെക്കാൻ തീരുമാനിച്ചാൽ അത് ഉപയോഗിക്കുന്നവർക്കു രണ്ടാമത്തെ ഡാറ്റയായി കണക്കാക്കപ്പെടും.
|
||||
|
||||
ഡാറ്റാബേസുകൾ സാധാരണ ഉറവിടമാണ്, ഡാറ്റാബേസ് മാനേജ്മെന്റ് സിസ്റ്റം ഡാറ്റ ഹോസ്റ്റ് ചെയ്യാനും പരിപാലിക്കാനും ഉപയോഗിക്കുന്നു, ഉപയോക്താക്കൾ ക്വെറിയുകൾ എന്ന കമാൻഡുകൾ ഉപയോഗിച്ച് ഡാറ്റ പരിശോധിക്കുന്നു. ഫയലുകൾ ഡാറ്റ ഉറവിടങ്ങളായി ഓഡിയോ, ഇമേജ്, വീഡിയോ ഫയലുകൾ കൂടാതെ എക്സൽ പോലുള്ള സ്പ്രെഡ്ഷീറ്റുകളും ആകാം. ഇന്റർനെറ്റ് ഉറവിടങ്ങൾ ഡാറ്റ ഹോസ്റ്റ് ചെയ്യാനുള്ള സാധാരണ സ്ഥലമാണ്, ഡാറ്റാബേസുകളും ഫയലുകളും അവിടെ കാണാം. ആപ്ലിക്കേഷൻ പ്രോഗ്രാമിംഗ് ഇന്റർഫേസുകൾ (APIs) പ്രോഗ്രാമർമാർക്ക് ഡാറ്റ ഇന്റർനെറ്റിലൂടെ ബാഹ്യ ഉപയോക്താക്കളുമായി പങ്കുവെക്കാനുള്ള മാർഗങ്ങൾ സൃഷ്ടിക്കാൻ അനുവദിക്കുന്നു, വെബ് സ്ക്രാപ്പിംഗ് എന്ന പ്രക്രിയ വെബ് പേജിൽ നിന്നുള്ള ഡാറ്റ എടുക്കുന്നു. [ഡാറ്റയുമായി പ്രവർത്തിക്കൽ](../../../../../../../../../2-Working-With-Data) പാഠങ്ങൾ വിവിധ ഡാറ്റ ഉറവിടങ്ങൾ എങ്ങനെ ഉപയോഗിക്കാമെന്ന് ശ്രദ്ധിക്കുന്നു.
|
||||
|
||||
## സമാപനം
|
||||
|
||||
ഈ പാഠത്തിൽ നാം പഠിച്ചത്:
|
||||
|
||||
- ഡാറ്റ എന്താണെന്ന്
|
||||
- ഡാറ്റ എങ്ങനെ വിവരണമാണ്
|
||||
- ഡാറ്റ എങ്ങനെ വർഗ്ഗീകരിക്കപ്പെടുന്നു
|
||||
- ഡാറ്റ എവിടെ കണ്ടെത്താം
|
||||
|
||||
## 🚀 ചലഞ്ച്
|
||||
|
||||
കാഗിൾ തുറന്ന ഡാറ്റാസെറ്റുകളുടെ മികച്ച ഉറവിടമാണ്. [ഡാറ്റാസെറ്റ് തിരയൽ ഉപകരണം](https://www.kaggle.com/datasets) ഉപയോഗിച്ച് ചില രസകരമായ ഡാറ്റാസെറ്റുകൾ കണ്ടെത്തി ഈ മാനദണ്ഡങ്ങൾ ഉപയോഗിച്ച് 3-5 ഡാറ്റാസെറ്റുകൾ വർഗ്ഗീകരിക്കുക:
|
||||
|
||||
- ഡാറ്റ അളവുകൂട്ടിയതാണോ ഗുണപരമായതാണോ?
|
||||
- ഡാറ്റ ഘടനയുള്ളതാണോ, ഘടനയില്ലാത്തതാണോ, അർദ്ധഘടനയുള്ളതാണോ?
|
||||
|
||||
## [പോസ്റ്റ്-ലെക്ചർ ക്വിസ്](https://ff-quizzes.netlify.app/en/ds/quiz/5)
|
||||
|
||||
|
||||
|
||||
## അവലോകനം & സ്വയം പഠനം
|
||||
|
||||
- [Classify your Data](https://docs.microsoft.com/en-us/learn/modules/choose-storage-approach-in-azure/2-classify-data) എന്ന മൈക്രോസോഫ്റ്റ് ലേൺ യൂണിറ്റ് ഘടനയുള്ള, അർദ്ധഘടനയുള്ള, ഘടനയില്ലാത്ത ഡാറ്റയുടെ വിശദമായ വിഭജനം നൽകുന്നു.
|
||||
|
||||
## അസൈൻമെന്റ്
|
||||
|
||||
[Classifying Datasets](assignment.md)
|
||||
|
||||
---
|
||||
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
|
||||
**അസൂയാ**:
|
||||
ഈ രേഖ AI വിവർത്തന സേവനം [Co-op Translator](https://github.com/Azure/co-op-translator) ഉപയോഗിച്ച് വിവർത്തനം ചെയ്തതാണ്. നാം കൃത്യതയ്ക്ക് ശ്രമിച്ചിട്ടുണ്ടെങ്കിലും, സ്വയം പ്രവർത്തിക്കുന്ന വിവർത്തനങ്ങളിൽ പിശകുകൾ അല്ലെങ്കിൽ തെറ്റുകൾ ഉണ്ടാകാമെന്ന് ദയവായി ശ്രദ്ധിക്കുക. അതിന്റെ മാതൃഭാഷയിലുള്ള യഥാർത്ഥ രേഖയാണ് പ്രാമാണികമായ ഉറവിടം എന്ന് പരിഗണിക്കേണ്ടതാണ്. നിർണായകമായ വിവരങ്ങൾക്ക്, പ്രൊഫഷണൽ മനുഷ്യ വിവർത്തനം ശുപാർശ ചെയ്യപ്പെടുന്നു. ഈ വിവർത്തനം ഉപയോഗിക്കുന്നതിൽ നിന്നുണ്ടാകുന്ന ഏതെങ്കിലും തെറ്റിദ്ധാരണകൾക്കോ തെറ്റായ വ്യാഖ്യാനങ്ങൾക്കോ ഞങ്ങൾ ഉത്തരവാദികളല്ല.
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER END -->
|
||||
@ -0,0 +1,81 @@
|
||||
<!--
|
||||
CO_OP_TRANSLATOR_METADATA:
|
||||
{
|
||||
"original_hash": "2e5cacb967c1e9dfd07809bfc441a0b4",
|
||||
"translation_date": "2025-12-19T14:01:37+00:00",
|
||||
"source_file": "1-Introduction/03-defining-data/assignment.md",
|
||||
"language_code": "ml"
|
||||
}
|
||||
-->
|
||||
# ഡാറ്റാസെറ്റുകൾ വർഗ്ഗീകരിക്കൽ
|
||||
|
||||
## നിർദ്ദേശങ്ങൾ
|
||||
|
||||
ഈ അസൈൻമെന്റിലെ പ്രോംപ്റ്റുകൾ പിന്തുടർന്ന് താഴെ കൊടുത്തിരിക്കുന്ന ഓരോ ഡാറ്റാ തരം ഓരോന്നായി തിരിച്ചറിയുകയും വർഗ്ഗീകരിക്കുകയും ചെയ്യുക:
|
||||
|
||||
**സ്ട്രക്ചർ തരം**: സ്ട്രക്ചർഡ്, സെമി-സ്ട്രക്ചർഡ്, അല്ലെങ്കിൽ അൺസ്ട്രക്ചർഡ്
|
||||
|
||||
**വാല്യു തരം**: ഗുണപരമായ (Qualitative) അല്ലെങ്കിൽ അളവുപരമായ (Quantitative)
|
||||
|
||||
**സോഴ്സ് തരം**: പ്രൈമറി അല്ലെങ്കിൽ സെക്കൻഡറി
|
||||
|
||||
1. ഒരു കമ്പനി ഏറ്റെടുത്ത് ഇപ്പോൾ ഒരു പാരന്റ് കമ്പനി ഉണ്ട്. ഡാറ്റാ സയന്റിസ്റ്റുകൾക്ക് പാരന്റ് കമ്പനിയിൽ നിന്നുള്ള കസ്റ്റമർ ഫോൺ നമ്പറുകളുടെ സ്പ്രെഡ്ഷീറ്റ് ലഭിച്ചു.
|
||||
|
||||
Structure Type:
|
||||
|
||||
Value Type:
|
||||
|
||||
Source Type:
|
||||
|
||||
---
|
||||
|
||||
2. ഒരു സ്മാർട്ട് വാച്ച് ധാരകൻ്റെ ഹൃദയമിടിപ്പ് ഡാറ്റ ശേഖരിച്ച് വരികയാണ്, ആ റോ ഡാറ്റ JSON ഫോർമാറ്റിലാണ്.
|
||||
|
||||
Structure Type:
|
||||
|
||||
Value Type:
|
||||
|
||||
Source Type:
|
||||
|
||||
---
|
||||
|
||||
3. ഒരു CSV ഫയലിൽ സൂക്ഷിച്ചിരിക്കുന്ന ജീവനക്കാരുടെ മനോഭാവം സംബന്ധിച്ച ജോലി സ്ഥല സർവേ.
|
||||
|
||||
Structure Type:
|
||||
|
||||
Value Type:
|
||||
|
||||
Source Type:
|
||||
|
||||
---
|
||||
|
||||
4. ആസ്ട്രോഫിസിസ്റുകൾ ഒരു സ്പേസ് പ്രോബിൽ ശേഖരിച്ച ഗാലക്സികളുടെ ഡാറ്റാബേസ് ആക്സസ് ചെയ്യുന്നു. ഡാറ്റയിൽ ഓരോ ഗാലക്സിയിലുമുള്ള ഗ്രഹങ്ങളുടെ എണ്ണം ഉൾപ്പെടുന്നു.
|
||||
|
||||
Structure Type:
|
||||
|
||||
Value Type:
|
||||
|
||||
Source Type:
|
||||
|
||||
---
|
||||
|
||||
5. ഒരു വ്യക്തിഗത ധനകാര്യ ആപ്പ് ഉപയോക്താവിന്റെ ധനകാര്യ അക്കൗണ്ടുകളുമായി APIകൾ വഴി ബന്ധപ്പെടുന്നു, അവരുടെ നെറ്റ് വർത്ത് കണക്കാക്കാൻ. അവർക്ക് എല്ലാ ഇടപാടുകളും വരികളും കോളങ്ങളുമായി ഉള്ള സ്പ്രെഡ്ഷീറ്റിനോട് സമാനമായ ഫോർമാറ്റിൽ കാണാം.
|
||||
|
||||
Structure Type:
|
||||
|
||||
Value Type:
|
||||
|
||||
Source Type:
|
||||
|
||||
## റൂബ്രിക്
|
||||
|
||||
Exemplary | Adequate | Needs Improvement
|
||||
--- | --- | -- |
|
||||
സ്ട്രക്ചർ, വാല്യു, സോഴ്സ് തരം എല്ലാം ശരിയായി തിരിച്ചറിയുന്നു |സ്ട്രക്ചർ, വാല്യു, സോഴ്സ് തരം 3 ശരിയായി തിരിച്ചറിയുന്നു|സ്ട്രക്ചർ, വാല്യു, സോഴ്സ് തരം 2 അല്ലെങ്കിൽ കുറവ് ശരിയായി തിരിച്ചറിയുന്നു|
|
||||
|
||||
---
|
||||
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
|
||||
**അസൂയാ**:
|
||||
ഈ രേഖ AI വിവർത്തന സേവനം [Co-op Translator](https://github.com/Azure/co-op-translator) ഉപയോഗിച്ച് വിവർത്തനം ചെയ്തതാണ്. നാം കൃത്യതയ്ക്ക് ശ്രമിച്ചെങ്കിലും, സ്വയം പ്രവർത്തിക്കുന്ന വിവർത്തനങ്ങളിൽ പിശകുകൾ അല്ലെങ്കിൽ തെറ്റുകൾ ഉണ്ടാകാമെന്ന് ദയവായി ശ്രദ്ധിക്കുക. അതിന്റെ മാതൃഭാഷയിലുള്ള യഥാർത്ഥ രേഖ അധികാരപരമായ ഉറവിടമായി കണക്കാക്കപ്പെടണം. നിർണായക വിവരങ്ങൾക്ക്, പ്രൊഫഷണൽ മനുഷ്യ വിവർത്തനം ശുപാർശ ചെയ്യപ്പെടുന്നു. ഈ വിവർത്തനത്തിന്റെ ഉപയോഗത്തിൽ നിന്നുണ്ടാകുന്ന ഏതെങ്കിലും തെറ്റിദ്ധാരണകൾക്കോ തെറ്റായ വ്യാഖ്യാനങ്ങൾക്കോ ഞങ്ങൾ ഉത്തരവാദികളല്ല.
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER END -->
|
||||
@ -0,0 +1,264 @@
|
||||
{
|
||||
"cells": [
|
||||
{
|
||||
"cell_type": "markdown",
|
||||
"source": [
|
||||
"## Introduction to Probability and Statistics\n",
|
||||
"## Assignment\n",
|
||||
"\n",
|
||||
"ഈ അസൈൻമെന്റിൽ, നാം [ഇവിടെ നിന്നുള്ള](https://www4.stat.ncsu.edu/~boos/var.select/diabetes.html) പ്രാപ്തരായ രോഗികളുടെ ഡാറ്റാസെറ്റ് ഉപയോഗിക്കും.\n"
|
||||
],
|
||||
"metadata": {}
|
||||
},
|
||||
{
|
||||
"cell_type": "code",
|
||||
"execution_count": 13,
|
||||
"source": [
|
||||
"import pandas as pd\n",
|
||||
"import numpy as np\n",
|
||||
"\n",
|
||||
"df = pd.read_csv(\"../../data/diabetes.tsv\",sep='\\t')\n",
|
||||
"df.head()"
|
||||
],
|
||||
"outputs": [
|
||||
{
|
||||
"output_type": "execute_result",
|
||||
"data": {
|
||||
"text/plain": [
|
||||
" AGE SEX BMI BP S1 S2 S3 S4 S5 S6 Y\n",
|
||||
"0 59 2 32.1 101.0 157 93.2 38.0 4.0 4.8598 87 151\n",
|
||||
"1 48 1 21.6 87.0 183 103.2 70.0 3.0 3.8918 69 75\n",
|
||||
"2 72 2 30.5 93.0 156 93.6 41.0 4.0 4.6728 85 141\n",
|
||||
"3 24 1 25.3 84.0 198 131.4 40.0 5.0 4.8903 89 206\n",
|
||||
"4 50 1 23.0 101.0 192 125.4 52.0 4.0 4.2905 80 135"
|
||||
],
|
||||
"text/html": [
|
||||
"<div>\n",
|
||||
"<style scoped>\n",
|
||||
" .dataframe tbody tr th:only-of-type {\n",
|
||||
" vertical-align: middle;\n",
|
||||
" }\n",
|
||||
"\n",
|
||||
" .dataframe tbody tr th {\n",
|
||||
" vertical-align: top;\n",
|
||||
" }\n",
|
||||
"\n",
|
||||
" .dataframe thead th {\n",
|
||||
" text-align: right;\n",
|
||||
" }\n",
|
||||
"</style>\n",
|
||||
"<table border=\"1\" class=\"dataframe\">\n",
|
||||
" <thead>\n",
|
||||
" <tr style=\"text-align: right;\">\n",
|
||||
" <th></th>\n",
|
||||
" <th>AGE</th>\n",
|
||||
" <th>SEX</th>\n",
|
||||
" <th>BMI</th>\n",
|
||||
" <th>BP</th>\n",
|
||||
" <th>S1</th>\n",
|
||||
" <th>S2</th>\n",
|
||||
" <th>S3</th>\n",
|
||||
" <th>S4</th>\n",
|
||||
" <th>S5</th>\n",
|
||||
" <th>S6</th>\n",
|
||||
" <th>Y</th>\n",
|
||||
" </tr>\n",
|
||||
" </thead>\n",
|
||||
" <tbody>\n",
|
||||
" <tr>\n",
|
||||
" <th>0</th>\n",
|
||||
" <td>59</td>\n",
|
||||
" <td>2</td>\n",
|
||||
" <td>32.1</td>\n",
|
||||
" <td>101.0</td>\n",
|
||||
" <td>157</td>\n",
|
||||
" <td>93.2</td>\n",
|
||||
" <td>38.0</td>\n",
|
||||
" <td>4.0</td>\n",
|
||||
" <td>4.8598</td>\n",
|
||||
" <td>87</td>\n",
|
||||
" <td>151</td>\n",
|
||||
" </tr>\n",
|
||||
" <tr>\n",
|
||||
" <th>1</th>\n",
|
||||
" <td>48</td>\n",
|
||||
" <td>1</td>\n",
|
||||
" <td>21.6</td>\n",
|
||||
" <td>87.0</td>\n",
|
||||
" <td>183</td>\n",
|
||||
" <td>103.2</td>\n",
|
||||
" <td>70.0</td>\n",
|
||||
" <td>3.0</td>\n",
|
||||
" <td>3.8918</td>\n",
|
||||
" <td>69</td>\n",
|
||||
" <td>75</td>\n",
|
||||
" </tr>\n",
|
||||
" <tr>\n",
|
||||
" <th>2</th>\n",
|
||||
" <td>72</td>\n",
|
||||
" <td>2</td>\n",
|
||||
" <td>30.5</td>\n",
|
||||
" <td>93.0</td>\n",
|
||||
" <td>156</td>\n",
|
||||
" <td>93.6</td>\n",
|
||||
" <td>41.0</td>\n",
|
||||
" <td>4.0</td>\n",
|
||||
" <td>4.6728</td>\n",
|
||||
" <td>85</td>\n",
|
||||
" <td>141</td>\n",
|
||||
" </tr>\n",
|
||||
" <tr>\n",
|
||||
" <th>3</th>\n",
|
||||
" <td>24</td>\n",
|
||||
" <td>1</td>\n",
|
||||
" <td>25.3</td>\n",
|
||||
" <td>84.0</td>\n",
|
||||
" <td>198</td>\n",
|
||||
" <td>131.4</td>\n",
|
||||
" <td>40.0</td>\n",
|
||||
" <td>5.0</td>\n",
|
||||
" <td>4.8903</td>\n",
|
||||
" <td>89</td>\n",
|
||||
" <td>206</td>\n",
|
||||
" </tr>\n",
|
||||
" <tr>\n",
|
||||
" <th>4</th>\n",
|
||||
" <td>50</td>\n",
|
||||
" <td>1</td>\n",
|
||||
" <td>23.0</td>\n",
|
||||
" <td>101.0</td>\n",
|
||||
" <td>192</td>\n",
|
||||
" <td>125.4</td>\n",
|
||||
" <td>52.0</td>\n",
|
||||
" <td>4.0</td>\n",
|
||||
" <td>4.2905</td>\n",
|
||||
" <td>80</td>\n",
|
||||
" <td>135</td>\n",
|
||||
" </tr>\n",
|
||||
" </tbody>\n",
|
||||
"</table>\n",
|
||||
"</div>"
|
||||
]
|
||||
},
|
||||
"metadata": {},
|
||||
"execution_count": 13
|
||||
}
|
||||
],
|
||||
"metadata": {}
|
||||
},
|
||||
{
|
||||
"cell_type": "markdown",
|
||||
"source": [
|
||||
"ഈ ഡാറ്റാസെറ്റിൽ, കോളങ്ങൾ താഴെപ്പറയുന്നവയാണ്:\n",
|
||||
"* പ്രായവും ലിംഗവും സ്വയംവിവരണമാണ്\n",
|
||||
"* BMI എന്നത് ബോഡി മാസ്സ് ഇൻഡക്സ് ആണ്\n",
|
||||
"* BP എന്നത് ശരാശരി രക്തസമ്മർദ്ദം ആണ്\n",
|
||||
"* S1 മുതൽ S6 വരെ വ്യത്യസ്ത രക്ത അളവുകൾ ആണ്\n",
|
||||
"* Y എന്നത് ഒരു വർഷംക്കുള്ളിൽ രോഗത്തിന്റെ പുരോഗതിയുടെ ഗുണനിലവാര അളവാണ്\n",
|
||||
"\n",
|
||||
"സാധ്യതയും സ്ഥിതിവിവരശാസ്ത്രവും ഉപയോഗിച്ച് ഈ ഡാറ്റാസെറ്റ് പഠിക്കാം.\n",
|
||||
"\n",
|
||||
"### Task 1: എല്ലാ മൂല്യങ്ങൾക്കും ശരാശരി മൂല്യങ്ങളും വ്യതിയാനവും കണക്കാക്കുക\n"
|
||||
],
|
||||
"metadata": {}
|
||||
},
|
||||
{
|
||||
"cell_type": "code",
|
||||
"execution_count": null,
|
||||
"source": [],
|
||||
"outputs": [],
|
||||
"metadata": {}
|
||||
},
|
||||
{
|
||||
"cell_type": "markdown",
|
||||
"source": [
|
||||
"### ടാസ്ക് 2: ലിംഗത്തിന്റെ അടിസ്ഥാനത്തിൽ BMI, BP, Y എന്നിവയുടെ ബോക്സ്പ്ലോട്ടുകൾ വരയ്ക്കുക\n"
|
||||
],
|
||||
"metadata": {}
|
||||
},
|
||||
{
|
||||
"cell_type": "code",
|
||||
"execution_count": null,
|
||||
"source": [],
|
||||
"outputs": [],
|
||||
"metadata": {}
|
||||
},
|
||||
{
|
||||
"cell_type": "markdown",
|
||||
"source": [
|
||||
"### ടാസ്ക് 3: പ്രായം, ലിംഗം, ബിഎംഐ, Y വേരിയബിളുകളുടെ വിതരണമെന്താണ്?\n"
|
||||
],
|
||||
"metadata": {}
|
||||
},
|
||||
{
|
||||
"cell_type": "code",
|
||||
"execution_count": null,
|
||||
"source": [],
|
||||
"outputs": [],
|
||||
"metadata": {}
|
||||
},
|
||||
{
|
||||
"cell_type": "markdown",
|
||||
"source": [
|
||||
"### Task 4: വ്യത്യസ്ത വേരിയബിളുകളും രോഗ പുരോഗതിയും (Y) തമ്മിലുള്ള സഹസംബന്ധം പരിശോധിക്കുക\n",
|
||||
"\n",
|
||||
"> **സൂചന** ഏത് മൂല്യങ്ങൾ ആശ്രിതമാണെന്ന് അറിയാൻ സഹസംബന്ധ മാട്രിക്സ് ഏറ്റവും ഉപകാരപ്രദമായ വിവരങ്ങൾ നൽകും.\n"
|
||||
],
|
||||
"metadata": {}
|
||||
},
|
||||
{
|
||||
"cell_type": "markdown",
|
||||
"source": [],
|
||||
"metadata": {}
|
||||
},
|
||||
{
|
||||
"cell_type": "markdown",
|
||||
"source": [
|
||||
"### ടാസ്ക് 5: പുരുഷന്മാരും സ്ത്രീകളും തമ്മിലുള്ള പ്രമേഹത്തിന്റെ പുരോഗതിയുടെ ഡിഗ്രി വ്യത്യസ്തമാണെന്ന് ഹിപോത്തസിസ് പരിശോധിക്കുക\n"
|
||||
],
|
||||
"metadata": {}
|
||||
},
|
||||
{
|
||||
"cell_type": "markdown",
|
||||
"source": [],
|
||||
"metadata": {}
|
||||
},
|
||||
{
|
||||
"cell_type": "markdown",
|
||||
"metadata": {},
|
||||
"source": [
|
||||
"---\n\n<!-- CO-OP TRANSLATOR DISCLAIMER START -->\n**അസൂയാ**: \nഈ രേഖ AI വിവർത്തന സേവനം [Co-op Translator](https://github.com/Azure/co-op-translator) ഉപയോഗിച്ച് വിവർത്തനം ചെയ്തതാണ്. നാം കൃത്യതയ്ക്ക് ശ്രമിച്ചിട്ടുണ്ടെങ്കിലും, സ്വയം പ്രവർത്തിക്കുന്ന വിവർത്തനങ്ങളിൽ പിശകുകൾ അല്ലെങ്കിൽ തെറ്റുകൾ ഉണ്ടാകാമെന്ന് ദയവായി ശ്രദ്ധിക്കുക. അതിന്റെ മാതൃഭാഷയിലുള്ള യഥാർത്ഥ രേഖയാണ് പ്രാമാണികമായ ഉറവിടം എന്ന് പരിഗണിക്കേണ്ടതാണ്. നിർണായകമായ വിവരങ്ങൾക്ക്, പ്രൊഫഷണൽ മനുഷ്യ വിവർത്തനം ശുപാർശ ചെയ്യപ്പെടുന്നു. ഈ വിവർത്തനം ഉപയോഗിക്കുന്നതിൽ നിന്നുണ്ടാകുന്ന ഏതെങ്കിലും തെറ്റിദ്ധാരണകൾക്കോ തെറ്റായ വ്യാഖ്യാനങ്ങൾക്കോ ഞങ്ങൾ ഉത്തരവാദികളല്ല.\n<!-- CO-OP TRANSLATOR DISCLAIMER END -->\n"
|
||||
]
|
||||
}
|
||||
],
|
||||
"metadata": {
|
||||
"orig_nbformat": 4,
|
||||
"language_info": {
|
||||
"name": "python",
|
||||
"version": "3.8.8",
|
||||
"mimetype": "text/x-python",
|
||||
"codemirror_mode": {
|
||||
"name": "ipython",
|
||||
"version": 3
|
||||
},
|
||||
"pygments_lexer": "ipython3",
|
||||
"nbconvert_exporter": "python",
|
||||
"file_extension": ".py"
|
||||
},
|
||||
"kernelspec": {
|
||||
"name": "python3",
|
||||
"display_name": "Python 3.8.8 64-bit (conda)"
|
||||
},
|
||||
"interpreter": {
|
||||
"hash": "86193a1ab0ba47eac1c69c1756090baa3b420b3eea7d4aafab8b85f8b312f0c5"
|
||||
},
|
||||
"coopTranslator": {
|
||||
"original_hash": "6d945fd15163f60cb473dbfe04b2d100",
|
||||
"translation_date": "2025-12-19T17:05:58+00:00",
|
||||
"source_file": "1-Introduction/04-stats-and-probability/assignment.ipynb",
|
||||
"language_code": "ml"
|
||||
}
|
||||
},
|
||||
"nbformat": 4,
|
||||
"nbformat_minor": 2
|
||||
}
|
||||
@ -0,0 +1,42 @@
|
||||
<!--
|
||||
CO_OP_TRANSLATOR_METADATA:
|
||||
{
|
||||
"original_hash": "01d1b493e8b51a6ebb42524f6b1bcfff",
|
||||
"translation_date": "2025-12-19T13:57:05+00:00",
|
||||
"source_file": "1-Introduction/04-stats-and-probability/assignment.md",
|
||||
"language_code": "ml"
|
||||
}
|
||||
-->
|
||||
# ചെറിയ പ്രമേഹ പഠനം
|
||||
|
||||
ഈ അസൈൻമെന്റിൽ, നാം [ഇവിടെ](https://www4.stat.ncsu.edu/~boos/var.select/diabetes.html) നിന്നെടുത്ത ചെറിയ പ്രമേഹ രോഗികളുടെ ഡാറ്റാസെറ്റുമായി പ്രവർത്തിക്കും.
|
||||
|
||||
| | വയസ്സ് | ലിംഗം | BMI | BP | S1 | S2 | S3 | S4 | S5 | S6 | Y |
|
||||
|---|-----|-----|-----|----|----|----|----|----|----|----|----|
|
||||
| 0 | 59 | 2 | 32.1 | 101. | 157 | 93.2 | 38.0 | 4. | 4.8598 | 87 | 151 |
|
||||
| 1 | 48 | 1 | 21.6 | 87.0 | 183 | 103.2 | 70. | 3. | 3.8918 | 69 | 75 |
|
||||
| 2 | 72 | 2 | 30.5 | 93.0 | 156 | 93.6 | 41.0 | 4.0 | 4. | 85 | 141 |
|
||||
| ... | ... | ... | ... | ...| ...| ...| ...| ...| ...| ...| ... |
|
||||
|
||||
## നിർദ്ദേശങ്ങൾ
|
||||
|
||||
* [assignment.ipynb] അസൈൻമെന്റ് നോട്ട്ബുക്ക് ജുപിറ്റർ നോട്ട്ബുക്ക് പരിസ്ഥിതിയിൽ തുറക്കുക
|
||||
* നോട്ട്ബുക്കിൽ നൽകിയ എല്ലാ പ്രവർത്തനങ്ങളും പൂർത്തിയാക്കുക, പ്രത്യേകിച്ച്:
|
||||
* [ ] എല്ലാ മൂല്യങ്ങൾക്കും ശരാശരി മൂല്യങ്ങളും വ്യത്യാസവും കണക്കാക്കുക
|
||||
* [ ] ലിംഗം അനുസരിച്ച് BMI, BP, Y എന്നിവയുടെ ബോക്സ്പ്ലോട്ടുകൾ വരയ്ക്കുക
|
||||
* [ ] വയസ്സ്, ലിംഗം, BMI, Y എന്നിവയുടെ വിതരണമെന്നത് എന്താണ്?
|
||||
* [ ] വ്യത്യസ്ത മൂല്യങ്ങൾക്കും രോഗ പുരോഗതിക്കും (Y) ഇടയിലുള്ള സഹബന്ധം പരിശോധിക്കുക
|
||||
* [ ] പുരുഷന്മാരും സ്ത്രീകളും തമ്മിലുള്ള പ്രമേഹ പുരോഗതിയുടെ വ്യത്യാസം എന്ന ഹിപോത്തസിസ് പരിശോധിക്കുക
|
||||
|
||||
## റൂബ്രിക്
|
||||
|
||||
ഉദാഹരണാത്മകമായ | മതിയായ | മെച്ചപ്പെടുത്തേണ്ടത്
|
||||
--- | --- | -- |
|
||||
ആവശ്യമായ എല്ലാ പ്രവർത്തനങ്ങളും പൂർത്തിയാക്കി, ഗ്രാഫികായി വിശദീകരിക്കുകയും ചെയ്തു | പ്രവർത്തനങ്ങളുടെ ഭൂരിഭാഗവും പൂർത്തിയായി, ഗ്രാഫുകൾ അല്ലെങ്കിൽ ലഭിച്ച മൂല്യങ്ങളിൽ നിന്നുള്ള വിശദീകരണങ്ങൾ അല്ലെങ്കിൽ പ്രധാനപ്പെട്ട കാര്യങ്ങൾ ഇല്ല | ശരാശരി/വ്യത്യാസം കണക്കാക്കൽ, അടിസ്ഥാന പ്ലോട്ടുകൾ തുടങ്ങിയ അടിസ്ഥാന പ്രവർത്തനങ്ങൾ മാത്രമാണ് പൂർത്തിയായത്, ഡാറ്റയിൽ നിന്നുള്ള നിഗമനങ്ങൾ ഇല്ല
|
||||
|
||||
---
|
||||
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
|
||||
**അസൂയാ**:
|
||||
ഈ രേഖ AI വിവർത്തന സേവനം [Co-op Translator](https://github.com/Azure/co-op-translator) ഉപയോഗിച്ച് വിവർത്തനം ചെയ്തതാണ്. നാം കൃത്യതയ്ക്ക് ശ്രമിച്ചിട്ടുണ്ടെങ്കിലും, സ്വയം പ്രവർത്തിക്കുന്ന വിവർത്തനങ്ങളിൽ പിശകുകൾ അല്ലെങ്കിൽ തെറ്റുകൾ ഉണ്ടാകാമെന്ന് ദയവായി ശ്രദ്ധിക്കുക. അതിന്റെ മാതൃഭാഷയിലുള്ള യഥാർത്ഥ രേഖയാണ് പ്രാമാണികമായ ഉറവിടം എന്ന് പരിഗണിക്കേണ്ടതാണ്. നിർണായകമായ വിവരങ്ങൾക്ക്, പ്രൊഫഷണൽ മനുഷ്യ വിവർത്തനം ശുപാർശ ചെയ്യപ്പെടുന്നു. ഈ വിവർത്തനം ഉപയോഗിക്കുന്നതിൽ നിന്നുണ്ടാകുന്ന ഏതെങ്കിലും തെറ്റിദ്ധാരണകൾക്കോ തെറ്റായ വ്യാഖ്യാനങ്ങൾക്കോ ഞങ്ങൾ ഉത്തരവാദികളല്ല.
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER END -->
|
||||
File diff suppressed because one or more lines are too long
File diff suppressed because one or more lines are too long
@ -0,0 +1,33 @@
|
||||
<!--
|
||||
CO_OP_TRANSLATOR_METADATA:
|
||||
{
|
||||
"original_hash": "696a8474a01054281704cbfb09148949",
|
||||
"translation_date": "2025-12-19T13:23:07+00:00",
|
||||
"source_file": "1-Introduction/README.md",
|
||||
"language_code": "ml"
|
||||
}
|
||||
-->
|
||||
# ഡാറ്റാ സയൻസിലേക്ക് പരിചയം
|
||||
|
||||

|
||||
> ഫോട്ടോ <a href="https://unsplash.com/@dawson2406?utm_source=unsplash&utm_medium=referral&utm_content=creditCopyText">സ്റ്റീഫൻ ഡോസൺ</a> <a href="https://unsplash.com/s/photos/data?utm_source=unsplash&utm_medium=referral&utm_content=creditCopyText">അൺസ്പ്ലാഷിൽ</a>
|
||||
|
||||
ഈ പാഠങ്ങളിൽ, ഡാറ്റാ സയൻസ് എങ്ങനെ നിർവചിക്കപ്പെടുന്നു എന്ന് നിങ്ങൾ കണ്ടെത്തും, ഒരു ഡാറ്റാ സയന്റിസ്റ്റ് പരിഗണിക്കേണ്ട നൈതിക കാര്യങ്ങളെക്കുറിച്ച് പഠിക്കും. ഡാറ്റ എങ്ങനെ നിർവചിക്കപ്പെടുന്നു എന്നും, ഡാറ്റാ സയൻസിന്റെ മേധാവി അക്കാദമിക് മേഖലകളായ സ്ഥിതിവിവരശാസ്ത്രവും സാദ്ധ്യതയും കുറിച്ച് കുറച്ച് പഠിക്കും.
|
||||
|
||||
### വിഷയങ്ങൾ
|
||||
|
||||
1. [ഡാറ്റാ സയൻസ് നിർവചനം](01-defining-data-science/README.md)
|
||||
2. [ഡാറ്റാ സയൻസ് നൈതികത](02-ethics/README.md)
|
||||
3. [ഡാറ്റ നിർവചനം](03-defining-data/README.md)
|
||||
4. [സ്ഥിതിവിവരശാസ്ത്രവും സാദ്ധ്യതയും പരിചയം](04-stats-and-probability/README.md)
|
||||
|
||||
### ക്രെഡിറ്റുകൾ
|
||||
|
||||
ഈ പാഠങ്ങൾ ❤️ ഉപയോഗിച്ച് എഴുതിയത് [നിത്യ നരസിംഹൻ](https://twitter.com/nitya) ഉം [ഡ്മിത്രി സോഷ്നികോവ്](https://twitter.com/shwars) ഉം ആണ്.
|
||||
|
||||
---
|
||||
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
|
||||
**അസൂയാപത്രം**:
|
||||
ഈ രേഖ AI വിവർത്തന സേവനം [Co-op Translator](https://github.com/Azure/co-op-translator) ഉപയോഗിച്ച് വിവർത്തനം ചെയ്തതാണ്. നാം കൃത്യതയ്ക്ക് ശ്രമിച്ചിട്ടുണ്ടെങ്കിലും, യന്ത്രം ചെയ്ത വിവർത്തനങ്ങളിൽ പിശകുകൾ അല്ലെങ്കിൽ തെറ്റുകൾ ഉണ്ടാകാമെന്ന് ദയവായി ശ്രദ്ധിക്കുക. അതിന്റെ മാതൃഭാഷയിലുള്ള യഥാർത്ഥ രേഖ അധികാരപരമായ ഉറവിടമായി കണക്കാക്കപ്പെടണം. നിർണായക വിവരങ്ങൾക്ക്, പ്രൊഫഷണൽ മനുഷ്യ വിവർത്തനം ശുപാർശ ചെയ്യപ്പെടുന്നു. ഈ വിവർത്തനം ഉപയോഗിക്കുന്നതിൽ നിന്നുണ്ടാകുന്ന ഏതെങ്കിലും തെറ്റിദ്ധാരണകൾക്കോ തെറ്റായ വ്യാഖ്യാനങ്ങൾക്കോ ഞങ്ങൾ ഉത്തരവാദികളല്ല.
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER END -->
|
||||
@ -0,0 +1,199 @@
|
||||
<!--
|
||||
CO_OP_TRANSLATOR_METADATA:
|
||||
{
|
||||
"original_hash": "11739c7b40e7c6b16ad29e3df4e65862",
|
||||
"translation_date": "2025-12-19T15:48:02+00:00",
|
||||
"source_file": "2-Working-With-Data/05-relational-databases/README.md",
|
||||
"language_code": "ml"
|
||||
}
|
||||
-->
|
||||
# ഡാറ്റയുമായി പ്രവർത്തിക്കൽ: ബന്ധപരമായ ഡാറ്റാബേസുകൾ
|
||||
|
||||
| ](../../sketchnotes/05-RelationalData.png)|
|
||||
|:---:|
|
||||
| ഡാറ്റയുമായി പ്രവർത്തിക്കൽ: ബന്ധപരമായ ഡാറ്റാബേസുകൾ - _Sketchnote by [@nitya](https://twitter.com/nitya)_ |
|
||||
|
||||
നിങ്ങൾ മുമ്പ് വിവരങ്ങൾ സൂക്ഷിക്കാൻ സ്പ്രെഡ്ഷീറ്റ് ഉപയോഗിച്ചിട്ടുണ്ടാകാം. നിങ്ങൾക്കു് ഒരു നിരകളും കോളങ്ങളുമുള്ള ഒരു സെറ്റ് ഉണ്ടായിരുന്നു, അവിടെ നിരകൾ വിവരങ്ങൾ (അഥവാ ഡാറ്റ) ഉൾക്കൊണ്ടിരുന്നു, കോളങ്ങൾ വിവരങ്ങളെ വിവരിച്ചിരുന്നു (കഴിഞ്ഞപ്പോൾ മെറ്റാഡേറ്റ എന്ന് വിളിക്കപ്പെടുന്നു). ഒരു ബന്ധപരമായ ഡാറ്റാബേസ് ഈ കോളങ്ങളും നിരകളും ഉള്ള ടേബിളുകളുടെ അടിസ്ഥാന സിദ്ധാന്തത്തിൽ നിർമ്മിക്കപ്പെട്ടതാണ്, ഇത് നിങ്ങൾക്ക് വിവരങ്ങൾ പല ടേബിളുകളിലായി വ്യാപിപ്പിക്കാൻ അനുവദിക്കുന്നു. ഇത് നിങ്ങൾക്ക് കൂടുതൽ സങ്കീർണ്ണമായ ഡാറ്റയുമായി പ്രവർത്തിക്കാൻ, പുനരാവൃതിയെ ഒഴിവാക്കാൻ, ഡാറ്റ പരിശോധിക്കുന്ന രീതിയിൽ കൂടുതൽ സൗകര്യം നൽകുന്നു. ബന്ധപരമായ ഡാറ്റാബേസിന്റെ ആശയങ്ങൾ പരിശോധിക്കാം.
|
||||
|
||||
## [പ്രീ-ലെക്ചർ ക്വിസ്](https://ff-quizzes.netlify.app/en/ds/quiz/8)
|
||||
|
||||
## എല്ലാം ടേബിളുകളോടെ ആരംഭിക്കുന്നു
|
||||
|
||||
ഒരു ബന്ധപരമായ ഡാറ്റാബേസിന്റെ മദ്ധ്യത്തിൽ ടേബിളുകളുണ്ട്. സ്പ്രെഡ്ഷീറ്റിനൊപ്പം പോലെ, ഒരു ടേബിൾ കോളങ്ങളും നിരകളും ഉള്ള ഒരു ശേഖരമാണ്. നിരയിൽ നാം പ്രവർത്തിക്കാൻ ആഗ്രഹിക്കുന്ന ഡാറ്റ അല്ലെങ്കിൽ വിവരങ്ങൾ അടങ്ങിയിരിക്കുന്നു, ഉദാഹരണത്തിന് ഒരു നഗരത്തിന്റെ പേര് അല്ലെങ്കിൽ മഴവെള്ളത്തിന്റെ അളവ്. കോളങ്ങൾ അവർ സൂക്ഷിക്കുന്ന ഡാറ്റയെ വിവരിക്കുന്നു.
|
||||
|
||||
നഗരങ്ങളെക്കുറിച്ചുള്ള വിവരങ്ങൾ സൂക്ഷിക്കാൻ ഒരു ടേബിൾ ആരംഭിച്ച് നോക്കാം. നാം അവരുടെ പേര്, രാജ്യം തുടങ്ങിയവ തുടങ്ങാം. നിങ്ങൾ ഇത് ഒരു ടേബിളിൽ ഇങ്ങനെ സൂക്ഷിക്കാം:
|
||||
|
||||
| നഗരം | രാജ്യം |
|
||||
| -------- | ------------- |
|
||||
| ടോക്കിയോ | ജപ്പാൻ |
|
||||
| അറ്റ്ലാന്റാ | യുണൈറ്റഡ് സ്റ്റേറ്റ്സ് |
|
||||
| ഓക്ലാൻഡ് | ന്യൂസിലാൻഡ് |
|
||||
|
||||
**നഗരം**, **രാജ്യം** എന്നീ കോളം പേരുകൾ സൂക്ഷിക്കുന്ന ഡാറ്റയെ വിവരിക്കുന്നു, ഓരോ നിരയും ഒരു നഗരത്തെക്കുറിച്ചുള്ള വിവരങ്ങൾ ഉൾക്കൊള്ളുന്നു.
|
||||
|
||||
## ഒറ്റ ടേബിൾ സമീപനത്തിന്റെ പരിമിതികൾ
|
||||
|
||||
മുകളിൽ കാണിച്ച ടേബിൾ നിങ്ങൾക്ക് പരിചിതമായതായിരിക്കാം. നമുക്ക് നമ്മുടെ ഡാറ്റാബേസിൽ കൂടുതൽ ഡാറ്റ ചേർക്കാം - വാർഷിക മഴവെള്ളം (മില്ലിമീറ്ററിൽ). നാം 2018, 2019, 2020 വർഷങ്ങളിൽ ശ്രദ്ധ കേന്ദ്രീകരിക്കും. ടോക്കിയോയ്ക്ക് ഇത് ചേർക്കുകയാണെങ്കിൽ ഇങ്ങനെ കാണാം:
|
||||
|
||||
| നഗരം | രാജ്യം | വർഷം | അളവ് |
|
||||
| ----- | ------- | ---- | ------ |
|
||||
| ടോക്കിയോ | ജപ്പാൻ | 2020 | 1690 |
|
||||
| ടോക്കിയോ | ജപ്പാൻ | 2019 | 1874 |
|
||||
| ടോക്കിയോ | ജപ്പാൻ | 2018 | 1445 |
|
||||
|
||||
നമ്മുടെ ടേബിളിൽ നിങ്ങൾ എന്ത് ശ്രദ്ധിക്കുന്നു? നഗരത്തിന്റെ പേര്, രാജ്യം ആവർത്തിച്ച് പുനരാവൃതിയാകുന്നു. ഇത് വലിയ സംഭരണശേഷി ഉപയോഗിക്കാം, പല പകർപ്പുകൾ ആവശ്യമില്ല. ടോക്കിയോയ്ക്ക് നാം ആഗ്രഹിക്കുന്ന ഒരു പേര് മാത്രമേ ഉള്ളൂ.
|
||||
|
||||
ശരി, മറ്റൊരു ശ്രമം ചെയ്യാം. ഓരോ വർഷത്തിനും പുതിയ കോളങ്ങൾ ചേർക്കാം:
|
||||
|
||||
| നഗരം | രാജ്യം | 2018 | 2019 | 2020 |
|
||||
| -------- | ------------- | ---- | ---- | ---- |
|
||||
| ടോക്കിയോ | ജപ്പാൻ | 1445 | 1874 | 1690 |
|
||||
| അറ്റ്ലാന്റാ | യുണൈറ്റഡ് സ്റ്റേറ്റ്സ് | 1779 | 1111 | 1683 |
|
||||
| ഓക്ലാൻഡ് | ന്യൂസിലാൻഡ് | 1386 | 942 | 1176 |
|
||||
|
||||
ഇത് നിര പുനരാവൃത്തി ഒഴിവാക്കുന്നു, പക്ഷേ മറ്റൊരു വെല്ലുവിളി ഉണ്ടാക്കുന്നു. ഓരോ പുതിയ വർഷവും ടേബിളിന്റെ ഘടന മാറ്റേണ്ടി വരും. കൂടാതെ, വർഷങ്ങൾ കോളങ്ങളായി ഉള്ളത് മൂലം ഡാറ്റ പുനഃപ്രാപനം, കണക്കുകൂട്ടൽ കൂടുതൽ ബുദ്ധിമുട്ടാകും.
|
||||
|
||||
ഇതിനാൽ നമുക്ക് പല ടേബിളുകളും ബന്ധങ്ങളും ആവശ്യമുണ്ട്. ഡാറ്റ വിഭജിച്ച് പുനരാവൃത്തി ഒഴിവാക്കി, കൂടുതൽ സൗകര്യപ്രദമായി ഡാറ്റ കൈകാര്യം ചെയ്യാം.
|
||||
|
||||
## ബന്ധങ്ങളുടെ ആശയങ്ങൾ
|
||||
|
||||
നമ്മുടെ ഡാറ്റ തിരിച്ചറിയാം, എങ്ങനെ വിഭജിക്കാമെന്ന് തീരുമാനിക്കാം. നഗരങ്ങളുടെ പേര്, രാജ്യം സൂക്ഷിക്കാൻ ഒരു ടേബിൾ മതിയാകും.
|
||||
|
||||
| നഗരം | രാജ്യം |
|
||||
| -------- | ------------- |
|
||||
| ടോക്കിയോ | ജപ്പാൻ |
|
||||
| അറ്റ്ലാന്റാ | യുണൈറ്റഡ് സ്റ്റേറ്റ്സ് |
|
||||
| ഓക്ലാൻഡ് | ന്യൂസിലാൻഡ് |
|
||||
|
||||
പിന്നീട് അടുത്ത ടേബിൾ സൃഷ്ടിക്കുന്നതിന് മുമ്പ്, ഓരോ നഗരത്തെയും എങ്ങനെ സൂചിപ്പിക്കാമെന്ന് കണ്ടെത്തണം. ഒരു തിരിച്ചറിയൽ, ഐഡി അല്ലെങ്കിൽ (ടെക്നിക്കൽ ഡാറ്റാബേസ് പദങ്ങളിൽ) പ്രൈമറി കീ ആവശ്യമുണ്ട്. പ്രൈമറി കീ ഒരു ടേബിളിലെ ഒരു പ്രത്യേക നിര തിരിച്ചറിയാൻ ഉപയോഗിക്കുന്ന മൂല്യമാണ്. ഇത് ഒരു മൂല്യത്തെ അടിസ്ഥാനമാക്കാമെങ്കിലും (ഉദാഹരണത്തിന് നഗരത്തിന്റെ പേര്), സാധാരണയായി ഇത് ഒരു സംഖ്യ അല്ലെങ്കിൽ മറ്റൊരു തിരിച്ചറിയൽ ആയിരിക്കണം. ഐഡി മാറാതിരിക്കണം, കാരണം അത് ബന്ധം തകരാറിലാക്കും. സാധാരണയായി പ്രൈമറി കീ സ്വയം സൃഷ്ടിക്കപ്പെട്ട സംഖ്യയാണ്.
|
||||
|
||||
> ✅ പ്രൈമറി കീ സാധാരണയായി PK എന്ന് ചുരുക്കി പറയുന്നു
|
||||
|
||||
### നഗരങ്ങൾ
|
||||
|
||||
| city_id | നഗരം | രാജ്യം |
|
||||
| ------- | -------- | ------------- |
|
||||
| 1 | ടോക്കിയോ | ജപ്പാൻ |
|
||||
| 2 | അറ്റ്ലാന്റാ | യുണൈറ്റഡ് സ്റ്റേറ്റ്സ് |
|
||||
| 3 | ഓക്ലാൻഡ് | ന്യൂസിലാൻഡ് |
|
||||
|
||||
> ✅ ഈ പാഠത്തിൽ "id"യും "primary key"യും പരസ്പരം ഉപയോഗിക്കുന്നതായി കാണും. ഈ ആശയങ്ങൾ DataFrames-ലും ബാധകമാണ്, പിന്നീട് നിങ്ങൾ അവ പരിശോധിക്കും. DataFrames "primary key" പദം ഉപയോഗിക്കാറില്ല, പക്ഷേ അവ സമാനമായി പ്രവർത്തിക്കുന്നു.
|
||||
|
||||
നഗരങ്ങളുടെ ടേബിൾ സൃഷ്ടിച്ചതിനുശേഷം, മഴവെള്ളം സൂക്ഷിക്കാം. നഗരത്തെ പൂർണ്ണമായി പുനരാവർത്തിക്കാതെ, id ഉപയോഗിക്കാം. പുതിയ ടേബിളിലും *id* കോളം ഉണ്ടായിരിക്കണം, എല്ലാ ടേബിളുകൾക്കും id അല്ലെങ്കിൽ പ്രൈമറി കീ ഉണ്ടായിരിക്കണം.
|
||||
|
||||
### മഴവെള്ളം
|
||||
|
||||
| rainfall_id | city_id | വർഷം | അളവ് |
|
||||
| ----------- | ------- | ---- | ------ |
|
||||
| 1 | 1 | 2018 | 1445 |
|
||||
| 2 | 1 | 2019 | 1874 |
|
||||
| 3 | 1 | 2020 | 1690 |
|
||||
| 4 | 2 | 2018 | 1779 |
|
||||
| 5 | 2 | 2019 | 1111 |
|
||||
| 6 | 2 | 2020 | 1683 |
|
||||
| 7 | 3 | 2018 | 1386 |
|
||||
| 8 | 3 | 2019 | 942 |
|
||||
| 9 | 3 | 2020 | 1176 |
|
||||
|
||||
പുതിയ **rainfall** ടേബിളിലെ **city_id** കോളം ശ്രദ്ധിക്കുക. ഈ കോളം **cities** ടേബിളിലെ ഐഡികളെ സൂചിപ്പിക്കുന്നു. ടെക്നിക്കൽ ബന്ധപരമായ ഡാറ്റ പദങ്ങളിൽ ഇത് **ഫോറൻ കീ** എന്ന് വിളിക്കുന്നു; മറ്റൊരു ടേബിളിലെ പ്രൈമറി കീ ആണ്. ഇത് ഒരു റഫറൻസ് അല്ലെങ്കിൽ പോയിന്റർ ആയി കരുതാം. **city_id** 1 ടോക്കിയോയെ സൂചിപ്പിക്കുന്നു.
|
||||
|
||||
> [!NOTE]
|
||||
> ഫോറൻ കീ സാധാരണയായി FK എന്ന് ചുരുക്കി പറയുന്നു
|
||||
|
||||
## ഡാറ്റ പുനഃപ്രാപനം
|
||||
|
||||
ഡാറ്റ രണ്ട് ടേബിളുകളായി വിഭജിച്ചപ്പോൾ, എങ്ങനെ പുനഃപ്രാപിക്കാമെന്ന് നിങ്ങൾക്ക് സംശയമുണ്ടാകാം. MySQL, SQL Server, Oracle പോലുള്ള ബന്ധപരമായ ഡാറ്റാബേസുകൾ ഉപയോഗിക്കുമ്പോൾ, Structured Query Language അല്ലെങ്കിൽ SQL എന്ന ഭാഷ ഉപയോഗിക്കാം. SQL (കഴിഞ്ഞപ്പോൾ sequel എന്നും ഉച്ചരിക്കാം) ഒരു സ്റ്റാൻഡേർഡ് ഭാഷയാണ്, ബന്ധപരമായ ഡാറ്റാബേസിൽ ഡാറ്റ പുനഃപ്രാപിക്കാനും മാറ്റാനും ഉപയോഗിക്കുന്നു.
|
||||
|
||||
ഡാറ്റ പുനഃപ്രാപിക്കാൻ `SELECT` കമാൻഡ് ഉപയോഗിക്കുന്നു. അടിസ്ഥാനത്തിൽ, നിങ്ങൾ കാണാൻ ആഗ്രഹിക്കുന്ന കോളങ്ങൾ **select** ചെയ്യുകയും അവ ഉൾക്കൊള്ളുന്ന ടേബിളിൽ നിന്നാണ് **from** ചെയ്യുകയും ചെയ്യുന്നു. നഗരങ്ങളുടെ പേരുകൾ മാത്രം കാണിക്കാൻ നിങ്ങൾക്ക് താഴെ കാണുന്ന വിധം ഉപയോഗിക്കാം:
|
||||
|
||||
```sql
|
||||
SELECT city
|
||||
FROM cities;
|
||||
|
||||
-- Output:
|
||||
-- Tokyo
|
||||
-- Atlanta
|
||||
-- Auckland
|
||||
```
|
||||
|
||||
`SELECT` നിങ്ങൾ കോളങ്ങൾ പട്ടികപ്പെടുത്തുന്നിടമാണ്, `FROM` ടേബിളുകൾ പട്ടികപ്പെടുത്തുന്നിടമാണ്.
|
||||
|
||||
> [!NOTE]
|
||||
> SQL സിന്റാക്സ് കേസ്-ഇൻസെൻസിറ്റീവ് ആണ്, അതായത് `select` ഉം `SELECT` ഉം ഒരേ അർത്ഥം വഹിക്കുന്നു. എന്നാൽ, നിങ്ങൾ ഉപയോഗിക്കുന്ന ഡാറ്റാബേസിന്റെ തരം അനുസരിച്ച് കോളങ്ങളും ടേബിളുകളും കേസ്-സെൻസിറ്റീവ് ആകാം. അതിനാൽ, പ്രോഗ്രാമിങ്ങിൽ എല്ലാം കേസ്-സെൻസിറ്റീവ് ആണെന്ന് കരുതുന്നത് മികച്ച പ്രാക്ടീസാണ്. SQL ക്വെറിയുകൾ എഴുതുമ്പോൾ സാധാരണയായി കീവേഡുകൾ മുഴുവൻ അപ്പർകേസ് അക്ഷരങ്ങളിൽ എഴുതുന്നു.
|
||||
|
||||
മുകളിൽ കാണിച്ച ക്വെറി എല്ലാ നഗരങ്ങളും പ്രദർശിപ്പിക്കും. നമുക്ക് ന്യൂസിലാൻഡിലെ നഗരങ്ങൾ മാത്രം കാണിക്കണമെന്ന് കരുതാം. ഫിൽട്ടർ വേണം. SQL-ൽ ഇതിന് `WHERE` എന്ന കീവേഡ് ഉപയോഗിക്കുന്നു, അർത്ഥം "എവിടെ എന്തെങ്കിലും സത്യമാണെങ്കിൽ".
|
||||
|
||||
```sql
|
||||
SELECT city
|
||||
FROM cities
|
||||
WHERE country = 'New Zealand';
|
||||
|
||||
-- Output:
|
||||
-- Auckland
|
||||
```
|
||||
|
||||
## ഡാറ്റ ജോയിൻ ചെയ്യൽ
|
||||
|
||||
ഇതുവരെ നാം ഒരു ടേബിളിൽ നിന്നുള്ള ഡാറ്റ പുനഃപ്രാപിച്ചു. ഇപ്പോൾ **cities** ഉം **rainfall** ഉം ഉള്ള ഡാറ്റ ഒന്നിച്ച് കൊണ്ടുവരണം. ഇത് *ജോയിൻ* ചെയ്യലിലൂടെ സാധിക്കും. രണ്ട് ടേബിളുകൾ തമ്മിൽ ഒരു സീം സൃഷ്ടിച്ച്, ഓരോ ടേബിളിലെ ഒരു കോളത്തിലെ മൂല്യങ്ങൾ പൊരുത്തപ്പെടുത്തും.
|
||||
|
||||
നമ്മുടെ ഉദാഹരണത്തിൽ, **rainfall** ലെ **city_id** കോളവും **cities** ലെ **city_id** കോളവും പൊരുത്തപ്പെടുത്തും. ഇത് മഴവെള്ളത്തിന്റെ മൂല്യം അതിന്റെ നഗരത്തോടൊപ്പം പൊരുത്തപ്പെടുത്തും. നാം ചെയ്യാൻ പോകുന്ന ജോയിൻ ഒരു *ഇൻറർ* ജോയിൻ ആണ്, അർത്ഥം മറ്റൊരു ടേബിളിൽ പൊരുത്തപ്പെടാത്ത നിരകൾ പ്രദർശിപ്പിക്കപ്പെടില്ല. നമ്മുടെ കേസിൽ എല്ലാ നഗരത്തിനും മഴവെള്ളം ഉള്ളതിനാൽ എല്ലാം പ്രദർശിപ്പിക്കും.
|
||||
|
||||
2019-ലെ എല്ലാ നഗരങ്ങളുടെയും മഴവെള്ളം പുനഃപ്രാപിക്കാം.
|
||||
|
||||
നാം ഇത് ഘട്ടങ്ങളായി ചെയ്യും. ആദ്യ ഘട്ടം ഡാറ്റ ജോയിൻ ചെയ്യുക, സീമിനായി കോളങ്ങൾ സൂചിപ്പിക്കുക - മുമ്പ് ഹൈലൈറ്റ് ചെയ്ത **city_id**.
|
||||
|
||||
```sql
|
||||
SELECT cities.city
|
||||
rainfall.amount
|
||||
FROM cities
|
||||
INNER JOIN rainfall ON cities.city_id = rainfall.city_id
|
||||
```
|
||||
|
||||
നാം ആവശ്യമായ രണ്ട് കോളങ്ങളും, **city_id** ഉപയോഗിച്ച് ടേബിളുകൾ ജോയിൻ ചെയ്യണമെന്ന് ഹൈലൈറ്റ് ചെയ്തു. ഇപ്പോൾ `WHERE` സ്റ്റേറ്റ്മെന്റ് ചേർത്ത് 2019 വർഷം മാത്രം ഫിൽട്ടർ ചെയ്യാം.
|
||||
|
||||
```sql
|
||||
SELECT cities.city
|
||||
rainfall.amount
|
||||
FROM cities
|
||||
INNER JOIN rainfall ON cities.city_id = rainfall.city_id
|
||||
WHERE rainfall.year = 2019
|
||||
|
||||
-- Output
|
||||
|
||||
-- city | amount
|
||||
-- -------- | ------
|
||||
-- Tokyo | 1874
|
||||
-- Atlanta | 1111
|
||||
-- Auckland | 942
|
||||
```
|
||||
|
||||
## സംഗ്രഹം
|
||||
|
||||
ബന്ധപരമായ ഡാറ്റാബേസുകൾ പല ടേബിളുകളായി വിവരങ്ങൾ വിഭജിച്ച്, പിന്നീട് പ്രദർശനത്തിനും വിശകലനത്തിനും ഒന്നിച്ച് കൊണ്ടുവരുന്നതിൽ കേന്ദ്രീകരിക്കുന്നു. ഇത് കണക്കുകൂട്ടലുകൾ നടത്താനും ഡാറ്റ കൈകാര്യം ചെയ്യാനും ഉയർന്ന സൗകര്യം നൽകുന്നു. നിങ്ങൾ ബന്ധപരമായ ഡാറ്റാബേസിന്റെ അടിസ്ഥാന ആശയങ്ങളും രണ്ട് ടേബിളുകൾ തമ്മിൽ ജോയിൻ ചെയ്യുന്നതും കണ്ടു.
|
||||
|
||||
## 🚀 ചലഞ്ച്
|
||||
|
||||
ഇന്റർനെറ്റിൽ നിരവധി ബന്ധപരമായ ഡാറ്റാബേസുകൾ ലഭ്യമാണ്. മുകളിൽ പഠിച്ച കഴിവുകൾ ഉപയോഗിച്ച് ഡാറ്റ പരിശോധിക്കാം.
|
||||
|
||||
## പോസ്റ്റ്-ലെക്ചർ ക്വിസ്
|
||||
|
||||
## [പോസ്റ്റ്-ലെക്ചർ ക്വിസ്](https://ff-quizzes.netlify.app/en/ds/quiz/9)
|
||||
|
||||
## അവലോകനം & സ്വയം പഠനം
|
||||
|
||||
SQL-ഉം ബന്ധപരമായ ഡാറ്റാബേസ് ആശയങ്ങളും തുടർ പഠനത്തിനായി [Microsoft Learn](https://docs.microsoft.com/learn?WT.mc_id=academic-77958-bethanycheum) ൽ നിരവധി വിഭവങ്ങൾ ലഭ്യമാണ്
|
||||
|
||||
- [ബന്ധപരമായ ഡാറ്റയുടെ ആശയങ്ങൾ വിവരിക്കുക](https://docs.microsoft.com//learn/modules/describe-concepts-of-relational-data?WT.mc_id=academic-77958-bethanycheum)
|
||||
- [Transact-SQL ഉപയോഗിച്ച് ക്വെറി ആരംഭിക്കുക](https://docs.microsoft.com//learn/paths/get-started-querying-with-transact-sql?WT.mc_id=academic-77958-bethanycheum) (Transact-SQL SQL-ന്റെ ഒരു പതിപ്പാണ്)
|
||||
- [Microsoft Learn-ൽ SQL ഉള്ളടക്കം](https://docs.microsoft.com/learn/browse/?products=azure-sql-database%2Csql-server&expanded=azure&WT.mc_id=academic-77958-bethanycheum)
|
||||
|
||||
## അസൈൻമെന്റ്
|
||||
|
||||
[എയർപോർട്ട് ഡാറ്റ പ്രദർശിപ്പിക്കൽ](assignment.md)
|
||||
|
||||
---
|
||||
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
|
||||
**അസൂയാ**:
|
||||
ഈ രേഖ AI വിവർത്തന സേവനം [Co-op Translator](https://github.com/Azure/co-op-translator) ഉപയോഗിച്ച് വിവർത്തനം ചെയ്തതാണ്. നാം കൃത്യതയ്ക്ക് ശ്രമിച്ചിട്ടുണ്ടെങ്കിലും, സ്വയം പ്രവർത്തിക്കുന്ന വിവർത്തനങ്ങളിൽ പിശകുകൾ അല്ലെങ്കിൽ തെറ്റുകൾ ഉണ്ടാകാമെന്ന് ദയവായി ശ്രദ്ധിക്കുക. അതിന്റെ മാതൃഭാഷയിലുള്ള യഥാർത്ഥ രേഖ അധികാരപരമായ ഉറവിടമായി കണക്കാക്കപ്പെടണം. നിർണായക വിവരങ്ങൾക്ക്, പ്രൊഫഷണൽ മനുഷ്യ വിവർത്തനം ശുപാർശ ചെയ്യപ്പെടുന്നു. ഈ വിവർത്തനം ഉപയോഗിക്കുന്നതിൽ നിന്നുണ്ടാകുന്ന ഏതെങ്കിലും തെറ്റിദ്ധാരണകൾക്കോ തെറ്റായ വ്യാഖ്യാനങ്ങൾക്കോ ഞങ്ങൾ ഉത്തരവാദികളല്ല.
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER END -->
|
||||
@ -0,0 +1,35 @@
|
||||
<!--
|
||||
CO_OP_TRANSLATOR_METADATA:
|
||||
{
|
||||
"original_hash": "f824bfdb8b12d33293913f76f5c787c5",
|
||||
"translation_date": "2025-12-19T15:40:57+00:00",
|
||||
"source_file": "2-Working-With-Data/06-non-relational/assignment.md",
|
||||
"language_code": "ml"
|
||||
}
|
||||
-->
|
||||
# സോഡ ലാഭം
|
||||
|
||||
## നിർദ്ദേശങ്ങൾ
|
||||
|
||||
[Coca Cola Co സ്പ്രെഡ്ഷീറ്റ്](../../../../2-Working-With-Data/06-non-relational/CocaColaCo.xlsx) ചില കണക്കുകൾ നഷ്ടപ്പെട്ടിരിക്കുന്നു. നിങ്ങളുടെ ജോലി:
|
||||
|
||||
1. FY '15, '16, '17, '18 ന്റെ മൊത്തം ലാഭം കണക്കാക്കുക
|
||||
- മൊത്തം ലാഭം = നെറ്റ് ഓപ്പറേറ്റിംഗ് വരുമാനം - വസ്തുക്കളുടെ വില
|
||||
1. എല്ലാ മൊത്തം ലാഭങ്ങളുടെ ശരാശരി കണക്കാക്കുക. ഇത് ഒരു ഫംഗ്ഷൻ ഉപയോഗിച്ച് ചെയ്യാൻ ശ്രമിക്കുക.
|
||||
- ശരാശരി = മൊത്തം ലാഭങ്ങളുടെ മൊത്തം ഫിസ്കൽ വർഷങ്ങളുടെ എണ്ണം (10) കൊണ്ട് വിഭജിക്കുക
|
||||
- [AVERAGE ഫംഗ്ഷൻ](https://support.microsoft.com/en-us/office/average-function-047bac88-d466-426c-a32b-8f33eb960cf6) സംബന്ധിച്ച ഡോക്യുമെന്റേഷൻ
|
||||
1. ഇത് ഒരു എക്സൽ ഫയലാണ്, പക്ഷേ ഇത് ഏതെങ്കിലും സ്പ്രെഡ്ഷീറ്റ് പ്ലാറ്റ്ഫോമിൽ എഡിറ്റബിൾ ആയിരിക്കണം
|
||||
|
||||
[ഡാറ്റാ സ്രോതസ്സ് ക്രെഡിറ്റ് Yiyi Wang](https://www.kaggle.com/yiyiwang0826/cocacola-excel)
|
||||
|
||||
## റൂബ്രിക്
|
||||
|
||||
ഉദാഹരണമായ | മതിയായ | മെച്ചപ്പെടുത്തേണ്ടത്
|
||||
--- | --- | -- |
|
||||
|
||||
---
|
||||
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
|
||||
**അസൂയാ**:
|
||||
ഈ രേഖ AI വിവർത്തന സേവനം [Co-op Translator](https://github.com/Azure/co-op-translator) ഉപയോഗിച്ച് വിവർത്തനം ചെയ്തതാണ്. നാം കൃത്യതയ്ക്ക് ശ്രമിച്ചിട്ടുണ്ടെങ്കിലും, സ്വയം പ്രവർത്തിക്കുന്ന വിവർത്തനങ്ങളിൽ പിശകുകൾ അല്ലെങ്കിൽ തെറ്റുകൾ ഉണ്ടാകാമെന്ന് ദയവായി ശ്രദ്ധിക്കുക. അതിന്റെ മാതൃഭാഷയിലുള്ള യഥാർത്ഥ രേഖ പ്രാമാണികമായ ഉറവിടമായി കണക്കാക്കണം. നിർണായക വിവരങ്ങൾക്ക്, പ്രൊഫഷണൽ മനുഷ്യ വിവർത്തനം ശുപാർശ ചെയ്യപ്പെടുന്നു. ഈ വിവർത്തനം ഉപയോഗിക്കുന്നതിൽ നിന്നുണ്ടാകുന്ന ഏതെങ്കിലും തെറ്റിദ്ധാരണകൾക്കോ തെറ്റായ വ്യാഖ്യാനങ്ങൾക്കോ ഞങ്ങൾ ഉത്തരവാദികളല്ല.
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER END -->
|
||||
File diff suppressed because one or more lines are too long
@ -0,0 +1,39 @@
|
||||
<!--
|
||||
CO_OP_TRANSLATOR_METADATA:
|
||||
{
|
||||
"original_hash": "dc8f035ce92e4eaa078ab19caa68267a",
|
||||
"translation_date": "2025-12-19T15:37:13+00:00",
|
||||
"source_file": "2-Working-With-Data/07-python/assignment.md",
|
||||
"language_code": "ml"
|
||||
}
|
||||
-->
|
||||
# പൈത്തണിൽ ഡാറ്റ പ്രോസസ്സിംഗിനുള്ള അസൈൻമെന്റ്
|
||||
|
||||
ഈ അസൈൻമെന്റിൽ, ഞങ്ങൾ ഞങ്ങളുടെ ചലഞ്ചുകളിൽ വികസിപ്പിക്കാൻ തുടങ്ങിയ കോഡിനെക്കുറിച്ച് വിശദീകരിക്കാൻ നിങ്ങളോട് ആവശ്യപ്പെടും. അസൈൻമെന്റ് രണ്ട് ഭാഗങ്ങളായി വിഭജിച്ചിരിക്കുന്നു:
|
||||
|
||||
## COVID-19 വ്യാപനം മോഡലിംഗ്
|
||||
|
||||
- [ ] താരതമ്യത്തിനായി 5-6 വ്യത്യസ്ത രാജ്യങ്ങളുടെ *R<sub>t</sub>* ഗ്രാഫുകൾ ഒരു പ്ലോട്ടിൽ അല്ലെങ്കിൽ പക്കൽപക്കൽ പല പ്ലോട്ടുകളായി വരയ്ക്കുക
|
||||
- [ ] മരണങ്ങളും സുഖം പ്രാപിച്ചവരും ബാധിച്ച കേസുകളുടെ എണ്ണവുമായി എങ്ങനെ ബന്ധപ്പെടുന്നു എന്ന് കാണുക.
|
||||
- [ ] ഒരു സാധാരണ രോഗം എത്രകാലം നീണ്ടുനിൽക്കുന്നു എന്ന് രോഗബാധ നിരക്കും മരണ നിരക്കും ദൃശ്യമായി ബന്ധിപ്പിച്ച് ചില അസാധാരണതകൾ കണ്ടെത്തുക. അത് കണ്ടെത്താൻ നിങ്ങൾക്ക് വ്യത്യസ്ത രാജ്യങ്ങൾ പരിശോധിക്കേണ്ടി വരാം.
|
||||
- [ ] മരണനിരക്ക് കണക്കാക്കുക, അത് സമയത്തിനൊപ്പം എങ്ങനെ മാറുന്നു എന്ന് കാണുക. *കണക്കുകൾ ചെയ്യുന്നതിന് മുമ്പ് രോഗത്തിന്റെ ദൈർഘ്യം ദിവസങ്ങളിൽ പരിഗണിച്ച് ഒരു ടൈം സീരീസ് മാറ്റേണ്ടതുണ്ടാകാം*
|
||||
|
||||
## COVID-19 പേപ്പറുകളുടെ വിശകലനം
|
||||
|
||||
- [ ] വ്യത്യസ്ത മരുന്നുകളുടെ സഹസംഭവ മാട്രിക്സ് നിർമ്മിക്കുക, ഏത് മരുന്നുകൾ ഒരേ സമയം (ഉദാ: ഒരു അബ്സ്ട്രാക്റ്റിൽ പരാമർശിച്ച) ഉണ്ടാകാറുള്ളത് എന്ന് കാണുക. മരുന്നുകളും രോഗനിർണയങ്ങളും സഹസംഭവ മാട്രിക്സ് നിർമ്മിക്കുന്ന കോഡ് നിങ്ങൾക്ക് മാറ്റാം.
|
||||
- [ ] ഈ മാട്രിക്സ് ഹീറ്റ്മാപ്പ് ഉപയോഗിച്ച് ദൃശ്യവൽക്കരിക്കുക.
|
||||
- [ ] ഒരു വിപുലീകരണ ലക്ഷ്യമായി, [chord diagram](https://en.wikipedia.org/wiki/Chord_diagram) ഉപയോഗിച്ച് മരുന്നുകളുടെ സഹസംഭവം ദൃശ്യവൽക്കരിക്കുക. [ഈ ലൈബ്രറി](https://pypi.org/project/chord/) ഒരു കോർഡ് ഡയഗ്രാം വരയ്ക്കാൻ സഹായിക്കാം.
|
||||
- [ ] മറ്റൊരു വിപുലീകരണ ലക്ഷ്യമായി, വ്യത്യസ്ത മരുന്നുകളുടെ ഡോസുകൾ (ഉദാ: *take 400mg of chloroquine daily* എന്ന വാചകത്തിൽ **400mg**) റെഗുലർ എക്സ്പ്രഷനുകൾ ഉപയോഗിച്ച് എടുക്കുക, വ്യത്യസ്ത മരുന്നുകൾക്കുള്ള വ്യത്യസ്ത ഡോസുകൾ കാണിക്കുന്ന ഡാറ്റാഫ്രെയിം നിർമ്മിക്കുക. **കുറിപ്പ്**: മരുന്നിന്റെ പേരിനടുത്തുള്ള സംഖ്യാത്മക മൂല്യങ്ങൾ പരിഗണിക്കുക.
|
||||
|
||||
## റൂബ്രിക്
|
||||
|
||||
Exemplary | Adequate | Needs Improvement
|
||||
--- | --- | -- |
|
||||
എല്ലാ ടാസ്കുകളും പൂർത്തിയായിട്ടുണ്ട്, ഗ്രാഫിക്കൽ ആയി ചിത്രീകരിക്കുകയും വിശദീകരിക്കുകയും ചെയ്തിട്ടുണ്ട്, രണ്ട് വിപുലീകരണ ലക്ഷ്യങ്ങളിൽ കുറഞ്ഞത് ഒന്ന് ഉൾപ്പെടുന്നു | 5-ൽ കൂടുതൽ ടാസ്കുകൾ പൂർത്തിയായിട്ടുണ്ട്, വിപുലീകരണ ലക്ഷ്യങ്ങൾ ശ്രമിച്ചിട്ടില്ല, അല്ലെങ്കിൽ ഫലങ്ങൾ വ്യക്തമായിട്ടില്ല | 5-ൽ കുറവ് (പക്ഷേ 3-ൽ കൂടുതൽ) ടാസ്കുകൾ പൂർത്തിയായിട്ടുണ്ട്, ദൃശ്യവൽക്കരണങ്ങൾ വിഷയത്തെ തെളിയിക്കാൻ സഹായിക്കുന്നില്ല
|
||||
|
||||
---
|
||||
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
|
||||
**അസൂയാപത്രം**:
|
||||
ഈ രേഖ AI വിവർത്തന സേവനം [Co-op Translator](https://github.com/Azure/co-op-translator) ഉപയോഗിച്ച് വിവർത്തനം ചെയ്തതാണ്. നാം കൃത്യതയ്ക്ക് ശ്രമിച്ചിട്ടുണ്ടെങ്കിലും, യന്ത്രം ചെയ്ത വിവർത്തനങ്ങളിൽ പിശകുകൾ അല്ലെങ്കിൽ തെറ്റുകൾ ഉണ്ടാകാമെന്ന് ദയവായി ശ്രദ്ധിക്കുക. അതിന്റെ മാതൃഭാഷയിലുള്ള യഥാർത്ഥ രേഖ അധികാരപരമായ ഉറവിടമായി കണക്കാക്കപ്പെടണം. നിർണായക വിവരങ്ങൾക്ക്, പ്രൊഫഷണൽ മനുഷ്യ വിവർത്തനം ശുപാർശ ചെയ്യപ്പെടുന്നു. ഈ വിവർത്തനം ഉപയോഗിക്കുന്നതിൽ നിന്നുണ്ടാകുന്ന ഏതെങ്കിലും തെറ്റിദ്ധാരണകൾക്കോ തെറ്റായ വ്യാഖ്യാനങ്ങൾക്കോ ഞങ്ങൾ ഉത്തരവാദികളല്ല.
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER END -->
|
||||
File diff suppressed because one or more lines are too long
File diff suppressed because one or more lines are too long
File diff suppressed because one or more lines are too long
@ -0,0 +1,349 @@
|
||||
<!--
|
||||
CO_OP_TRANSLATOR_METADATA:
|
||||
{
|
||||
"original_hash": "1b560955ff39a2bcf2a049fce474a951",
|
||||
"translation_date": "2025-12-19T15:42:32+00:00",
|
||||
"source_file": "2-Working-With-Data/08-data-preparation/README.md",
|
||||
"language_code": "ml"
|
||||
}
|
||||
-->
|
||||
# ഡാറ്റയുമായി പ്രവർത്തിക്കൽ: ഡാറ്റ തയ്യാറാക്കൽ
|
||||
|
||||
| ](../../sketchnotes/08-DataPreparation.png)|
|
||||
|:---:|
|
||||
|ഡാറ്റ തയ്യാറാക്കൽ - _Sketchnote by [@nitya](https://twitter.com/nitya)_ |
|
||||
|
||||
## [പ്രീ-ലെക്ചർ ക്വിസ്](https://ff-quizzes.netlify.app/en/ds/quiz/14)
|
||||
|
||||
|
||||
|
||||
തന്റെ ഉറവിടം അനുസരിച്ച്, റോ ഡാറ്റയിൽ ചില അസംഘടിതത്വങ്ങൾ ഉണ്ടാകാം, അവ വിശകലനത്തിലും മോഡലിംഗിലും വെല്ലുവിളികൾ സൃഷ്ടിക്കും. മറ്റൊരു വാക്കിൽ, ഈ ഡാറ്റ "അഴുക്കായ" എന്ന് വർഗ്ഗീകരിക്കാം, അത് ശുദ്ധീകരിക്കേണ്ടതുണ്ട്. ഈ പാഠം നഷ്ടപ്പെട്ട, തെറ്റായ, അല്ലെങ്കിൽ അപൂർണ്ണമായ ഡാറ്റയുടെ വെല്ലുവിളികൾ കൈകാര്യം ചെയ്യുന്നതിനുള്ള ഡാറ്റ ശുദ്ധീകരണവും പരിവർത്തനവും സംബന്ധിച്ച സാങ്കേതിക വിദ്യകളിൽ കേന്ദ്രീകരിക്കുന്നു. ഈ പാഠത്തിൽ ഉൾപ്പെടുത്തിയ വിഷയങ്ങൾ Python-ഉം Pandas ലൈബ്രറിയും ഉപയോഗിച്ച് [ഈ ഡയറക്ടറിയിലുള്ള നോട്ട്ബുക്കിൽ](notebook.ipynb) പ്രദർശിപ്പിക്കും.
|
||||
|
||||
## ഡാറ്റ ശുദ്ധീകരണത്തിന്റെ പ്രാധാന്യം
|
||||
|
||||
- **ഉപയോഗവും പുനരുപയോഗവും എളുപ്പമാക്കൽ**: ഡാറ്റ ശരിയായി ക്രമീകരിക്കുകയും സാധാരണ രൂപത്തിലാക്കുകയും ചെയ്താൽ അത് തിരയാനും ഉപയോഗിക്കാനും മറ്റുള്ളവരുമായി പങ്കിടാനും എളുപ്പമാകും.
|
||||
|
||||
- **സമരൂപത**: ഡാറ്റ സയൻസ് പലപ്പോഴും ഒന്നിലധികം ഡാറ്റാസെറ്റുകളുമായി പ്രവർത്തിക്കേണ്ടതുണ്ട്, വ്യത്യസ്ത ഉറവിടങ്ങളിൽ നിന്നുള്ള ഡാറ്റാസെറ്റുകൾ ചേർക്കേണ്ടതുണ്ട്. ഓരോ ഡാറ്റാസെറ്റിനും സാധാരണ മാനദണ്ഡം ഉറപ്പാക്കുന്നത്, അവ എല്ലാം ഒന്നായി ചേർക്കുമ്പോഴും ഡാറ്റ ഉപയോഗപ്രദമായിരിക്കുമെന്ന് ഉറപ്പാക്കും.
|
||||
|
||||
- **മോഡൽ കൃത്യത**: ശുദ്ധീകരിച്ച ഡാറ്റ മോഡലുകളുടെ കൃത്യത മെച്ചപ്പെടുത്തുന്നു.
|
||||
|
||||
## സാധാരണ ശുദ്ധീകരണ ലക്ഷ്യങ്ങളും തന്ത്രങ്ങളും
|
||||
|
||||
- **ഡാറ്റാസെറ്റ് പരിശോധിക്കൽ**: ഡാറ്റ എക്സ്പ്ലോറേഷൻ, [പിന്നീട് വരുന്ന പാഠത്തിൽ](https://github.com/microsoft/Data-Science-For-Beginners/tree/main/4-Data-Science-Lifecycle/15-analyzing) ഉൾപ്പെടുത്തിയിരിക്കുന്നു, ശുദ്ധീകരിക്കേണ്ട ഡാറ്റ കണ്ടെത്താൻ സഹായിക്കും. ഒരു ഡാറ്റാസെറ്റിലെ മൂല്യങ്ങൾ ദൃശ്യമായി നിരീക്ഷിക്കുന്നത് ബാക്കി ഡാറ്റ എങ്ങനെ കാണപ്പെടും എന്ന് പ്രതീക്ഷകൾ സജ്ജമാക്കാനും പ്രശ്നങ്ങൾ പരിഹരിക്കാൻ ആശയങ്ങൾ നൽകാനും സഹായിക്കും. എക്സ്പ്ലോറേഷൻ അടിസ്ഥാന ക്വെറിയിംഗ്, ദൃശ്യീകരണങ്ങൾ, സാമ്പിളിംഗ് എന്നിവ ഉൾക്കൊള്ളാം.
|
||||
|
||||
- **ഫോർമാറ്റിംഗ്**: ഉറവിടം അനുസരിച്ച്, ഡാറ്റയുടെ അവതരണത്തിൽ അസംഘടിതത്വങ്ങൾ ഉണ്ടാകാം. ഇത് മൂല്യം തിരയുന്നതിലും പ്രതിനിധാനം ചെയ്യുന്നതിലും പ്രശ്നങ്ങൾ സൃഷ്ടിക്കും, ഡാറ്റാസെറ്റിൽ കാണപ്പെടുന്നെങ്കിലും ദൃശ്യീകരണങ്ങളിലും ക്വെറി ഫലങ്ങളിലും ശരിയായി പ്രതിനിധാനം ചെയ്യപ്പെടാത്തത്. സാധാരണ ഫോർമാറ്റിംഗ് പ്രശ്നങ്ങൾ വെളിച്ചം, തീയതികൾ, ഡാറ്റാ ടൈപ്പുകൾ എന്നിവ പരിഹരിക്കുന്നതാണ്. ഫോർമാറ്റിംഗ് പ്രശ്നങ്ങൾ പരിഹരിക്കുന്നത് സാധാരണയായി ഡാറ്റ ഉപയോഗിക്കുന്നവരുടെ ഉത്തരവാദിത്വമാണ്. ഉദാഹരണത്തിന്, തീയതികളും സംഖ്യകളും എങ്ങനെ അവതരിപ്പിക്കപ്പെടണം എന്നതിൽ രാജ്യങ്ങൾ വ്യത്യാസപ്പെടാം.
|
||||
|
||||
- **പുനരാവൃത്തി**: ഒരേ ഡാറ്റ പല തവണ ഉണ്ടാകുന്നത് തെറ്റായ ഫലങ്ങൾ നൽകും, സാധാരണയായി നീക്കം ചെയ്യണം. രണ്ട് അല്ലെങ്കിൽ കൂടുതൽ ഡാറ്റാസെറ്റുകൾ ചേർക്കുമ്പോൾ ഇത് സാധാരണമാണ്. എന്നാൽ, ചേർന്ന ഡാറ്റാസെറ്റുകളിൽ പുനരാവൃത്തി ചില അധിക വിവരങ്ങൾ നൽകുന്ന ഭാഗങ്ങൾ ഉൾക്കൊള്ളാം, അവ സംരക്ഷിക്കേണ്ടതുണ്ടാകാം.
|
||||
|
||||
- **നഷ്ടപ്പെട്ട ഡാറ്റ**: നഷ്ടപ്പെട്ട ഡാറ്റ തെറ്റായതും ദുർബലവുമായ ഫലങ്ങൾ സൃഷ്ടിക്കാം. ചിലപ്പോൾ ഡാറ്റ "പുനഃലോഡ്" ചെയ്യലിലൂടെ, കണക്കുകൂട്ടലും Python പോലുള്ള കോഡും ഉപയോഗിച്ച് നഷ്ടപ്പെട്ട മൂല്യങ്ങൾ പൂരിപ്പിച്ച്, അല്ലെങ്കിൽ മൂല്യം നീക്കം ചെയ്ത് പരിഹരിക്കാം. ഡാറ്റ നഷ്ടപ്പെടാനുള്ള നിരവധി കാരണങ്ങൾ ഉണ്ട്, നഷ്ടപ്പെട്ട മൂല്യങ്ങൾ പരിഹരിക്കുന്ന നടപടികൾ അവ എങ്ങനെ, എന്തുകൊണ്ട് നഷ്ടപ്പെട്ടുവെന്ന് ആശ്രയിച്ചിരിക്കും.
|
||||
|
||||
## DataFrame വിവരങ്ങൾ പരിശോധിക്കൽ
|
||||
> **പഠനലക്ഷ്യം:** ഈ ഉപവിഭാഗം അവസാനിക്കുമ്പോൾ, pandas DataFrame-കളിൽ സൂക്ഷിച്ചിരിക്കുന്ന ഡാറ്റയുടെ പൊതുവായ വിവരങ്ങൾ കണ്ടെത്തുന്നതിൽ നിങ്ങൾ സുഖകരമായി പ്രവർത്തിക്കണം.
|
||||
|
||||
നിങ്ങൾ ഡാറ്റ pandas-ലേക്ക് ലോഡ് ചെയ്താൽ, അത് DataFrame ആയിരിക്കാനുള്ള സാധ്യത കൂടുതലാണ് ([മുൻപത്തെ പാഠം](https://github.com/microsoft/Data-Science-For-Beginners/tree/main/2-Working-With-Data/07-python#dataframe) വിശദമായ അവലോകനത്തിന്). എന്നാൽ നിങ്ങളുടെ DataFrame-ൽ 60,000 വരികളും 400 കോളങ്ങളുമുള്ള ഡാറ്റാസെറ്റ് ഉണ്ടെങ്കിൽ, നിങ്ങൾ എന്തിനൊപ്പം പ്രവർത്തിക്കുകയാണ് എന്ന് എങ്ങനെ മനസ്സിലാക്കും? ഭാഗ്യവശാൽ, [pandas](https://pandas.pydata.org/) DataFrame-ന്റെ പൊതുവായ വിവരങ്ങൾ, ആദ്യ കുറച്ച് വരികളും അവസാന കുറച്ച് വരികളും കാണാൻ സൗകര്യപ്രദമായ ഉപകരണങ്ങൾ നൽകുന്നു.
|
||||
|
||||
ഈ പ്രവർത്തനം പരിശോധിക്കാൻ, Python scikit-learn ലൈബ്രറി ഇറക്കുമതി ചെയ്ത് ഒരു പ്രശസ്ത ഡാറ്റാസെറ്റ് ഉപയോഗിക്കും: **Iris ഡാറ്റാസെറ്റ്**.
|
||||
|
||||
```python
|
||||
import pandas as pd
|
||||
from sklearn.datasets import load_iris
|
||||
|
||||
iris = load_iris()
|
||||
iris_df = pd.DataFrame(data=iris['data'], columns=iris['feature_names'])
|
||||
```
|
||||
| |sepal length (cm)|sepal width (cm)|petal length (cm)|petal width (cm)|
|
||||
|----------------------------------------|-----------------|----------------|-----------------|----------------|
|
||||
|0 |5.1 |3.5 |1.4 |0.2 |
|
||||
|1 |4.9 |3.0 |1.4 |0.2 |
|
||||
|2 |4.7 |3.2 |1.3 |0.2 |
|
||||
|3 |4.6 |3.1 |1.5 |0.2 |
|
||||
|4 |5.0 |3.6 |1.4 |0.2 |
|
||||
|
||||
- **DataFrame.info**: ആരംഭിക്കാൻ, `info()` മെത്തഡ് ഉപയോഗിച്ച് ഒരു `DataFrame`-ൽ ഉള്ള ഉള്ളടക്കത്തിന്റെ സംഗ്രഹം പ്രിന്റ് ചെയ്യാം. ഈ ഡാറ്റാസെറ്റ് നോക്കാം:
|
||||
```python
|
||||
iris_df.info()
|
||||
```
|
||||
```
|
||||
RangeIndex: 150 entries, 0 to 149
|
||||
Data columns (total 4 columns):
|
||||
# Column Non-Null Count Dtype
|
||||
--- ------ -------------- -----
|
||||
0 sepal length (cm) 150 non-null float64
|
||||
1 sepal width (cm) 150 non-null float64
|
||||
2 petal length (cm) 150 non-null float64
|
||||
3 petal width (cm) 150 non-null float64
|
||||
dtypes: float64(4)
|
||||
memory usage: 4.8 KB
|
||||
```
|
||||
ഇതിൽ നിന്ന്, *Iris* ഡാറ്റാസെറ്റിൽ നാല് കോളങ്ങളിലായി 150 എൻട്രികൾ ഉണ്ടെന്നും, നൾ എൻട്രികൾ ഒന്നും ഇല്ലെന്നും അറിയാം. എല്ലാ ഡാറ്റയും 64-ബിറ്റ് ഫ്ലോട്ടിംഗ് പോയിന്റ് നമ്പറുകളായി സൂക്ഷിച്ചിരിക്കുന്നു.
|
||||
|
||||
- **DataFrame.head()**: തുടർന്ന്, `DataFrame`-ന്റെ യഥാർത്ഥ ഉള്ളടക്കം പരിശോധിക്കാൻ `head()` മെത്തഡ് ഉപയോഗിക്കുന്നു. നമ്മുടെ `iris_df`-ന്റെ ആദ്യ കുറച്ച് വരികൾ കാണാം:
|
||||
```python
|
||||
iris_df.head()
|
||||
```
|
||||
```
|
||||
sepal length (cm) sepal width (cm) petal length (cm) petal width (cm)
|
||||
0 5.1 3.5 1.4 0.2
|
||||
1 4.9 3.0 1.4 0.2
|
||||
2 4.7 3.2 1.3 0.2
|
||||
3 4.6 3.1 1.5 0.2
|
||||
4 5.0 3.6 1.4 0.2
|
||||
```
|
||||
- **DataFrame.tail()**: മറുവശത്ത്, `DataFrame`-ന്റെ അവസാന കുറച്ച് വരികൾ പരിശോധിക്കാൻ `tail()` മെത്തഡ് ഉപയോഗിക്കുന്നു:
|
||||
```python
|
||||
iris_df.tail()
|
||||
```
|
||||
```
|
||||
sepal length (cm) sepal width (cm) petal length (cm) petal width (cm)
|
||||
145 6.7 3.0 5.2 2.3
|
||||
146 6.3 2.5 5.0 1.9
|
||||
147 6.5 3.0 5.2 2.0
|
||||
148 6.2 3.4 5.4 2.3
|
||||
149 5.9 3.0 5.1 1.8
|
||||
```
|
||||
> **പാഠം:** DataFrame-ലെ വിവരങ്ങളുടെ മെറ്റാഡാറ്റയും ആദ്യവും അവസാനവും കുറച്ച് മൂല്യങ്ങളും നോക്കിയാൽ പോലും, നിങ്ങൾ കൈകാര്യം ചെയ്യുന്ന ഡാറ്റയുടെ വലിപ്പം, ആകൃതി, ഉള്ളടക്കം എന്നിവയെക്കുറിച്ച് ഉടൻ ഒരു ആശയം ലഭിക്കും.
|
||||
|
||||
## നഷ്ടപ്പെട്ട ഡാറ്റ കൈകാര്യം ചെയ്യൽ
|
||||
> **പഠനലക്ഷ്യം:** ഈ ഉപവിഭാഗം അവസാനിക്കുമ്പോൾ, DataFrame-കളിൽ നിന്നുള്ള നൾ മൂല്യങ്ങൾ മാറ്റുകയോ നീക്കം ചെയ്യുകയോ ചെയ്യുന്നത് അറിയണം.
|
||||
|
||||
നിങ്ങൾ ഉപയോഗിക്കാൻ ആഗ്രഹിക്കുന്ന (അല്ലെങ്കിൽ ഉപയോഗിക്കേണ്ട) ഡാറ്റാസെറ്റുകളിൽ പലപ്പോഴും നഷ്ടപ്പെട്ട മൂല്യങ്ങൾ ഉണ്ടാകും. നഷ്ടപ്പെട്ട ഡാറ്റ കൈകാര്യം ചെയ്യുന്നതിൽ സൂക്ഷ്മമായ തുല്യങ്ങൾ ഉണ്ട്, അവ നിങ്ങളുടെ അന്തിമ വിശകലനത്തെയും യാഥാർത്ഥ്യ ഫലങ്ങളെയും ബാധിക്കാം.
|
||||
|
||||
Pandas നഷ്ടപ്പെട്ട മൂല്യങ്ങൾ രണ്ട് രീതികളിൽ കൈകാര്യം ചെയ്യുന്നു. ആദ്യത്തേത് നിങ്ങൾ മുമ്പ് കണ്ടിട്ടുണ്ട്: `NaN`, അല്ലെങ്കിൽ Not a Number. ഇത് IEEE ഫ്ലോട്ടിംഗ് പോയിന്റ് സ്പെസിഫിക്കേഷനിലെ പ്രത്യേക മൂല്യമാണ്, നഷ്ടപ്പെട്ട ഫ്ലോട്ടിംഗ് പോയിന്റ് മൂല്യങ്ങൾ സൂചിപ്പിക്കാൻ മാത്രമാണ് ഉപയോഗിക്കുന്നത്.
|
||||
|
||||
ഫ്ലോട്ടുകൾ ഒഴികെയുള്ള നഷ്ടപ്പെട്ട മൂല്യങ്ങൾക്ക് pandas Python `None` ഒബ്ജക്റ്റ് ഉപയോഗിക്കുന്നു. രണ്ടും ഒരേ കാര്യം പറയുന്ന രണ്ട് വ്യത്യസ്ത മൂല്യങ്ങൾ കാണുന്നത് ആശയക്കുഴപ്പമുണ്ടാക്കാം, എന്നാൽ ഈ ഡിസൈൻ തിരഞ്ഞെടുപ്പിന് പ്രോഗ്രാമാറ്റിക് കാരണങ്ങൾ ഉണ്ട്, പ്രായോഗികമായി pandas ഭൂരിഭാഗം കേസുകൾക്കായി നല്ല സമന്വയം നൽകുന്നു. എന്നിരുന്നാലും, `None`-ക്കും `NaN`-ക്കും ഉപയോഗത്തിൽ ശ്രദ്ധിക്കേണ്ട നിയന്ത്രണങ്ങൾ ഉണ്ട്.
|
||||
|
||||
`NaN`-നും `None`-നും കുറിച്ച് കൂടുതൽ അറിയാൻ [നോട്ട്ബുക്ക്](https://github.com/microsoft/Data-Science-For-Beginners/blob/main/4-Data-Science-Lifecycle/15-analyzing/notebook.ipynb) കാണുക!
|
||||
|
||||
- **നൾ മൂല്യങ്ങൾ കണ്ടെത്തൽ**: `pandas`-ൽ, `isnull()` ഉം `notnull()` ഉം നൾ ഡാറ്റ കണ്ടെത്താനുള്ള പ്രധാന മെത്തഡുകളാണ്. ഇരുവരും നിങ്ങളുടെ ഡാറ്റയിൽ ബൂളിയൻ മാസ്കുകൾ നൽകുന്നു. `NaN` മൂല്യങ്ങൾക്ക് `numpy` ഉപയോഗിക്കും:
|
||||
```python
|
||||
import numpy as np
|
||||
|
||||
example1 = pd.Series([0, np.nan, '', None])
|
||||
example1.isnull()
|
||||
```
|
||||
```
|
||||
0 False
|
||||
1 True
|
||||
2 False
|
||||
3 True
|
||||
dtype: bool
|
||||
```
|
||||
ഫലങ്ങൾ ശ്രദ്ധാപൂർവ്വം നോക്കുക. ഇതിൽ ഏതെങ്കിലും നിങ്ങൾക്ക് അത്ഭുതം ഉണ്ടാക്കുന്നുണ്ടോ? `0` ഒരു ഗണിത നൾ ആണെങ്കിലും, അത് പൂർണ്ണസംഖ്യയായി pandas പരിഗണിക്കുന്നു. `''` (ശൂന്യ സ്ട്രിംഗ്) കുറച്ച് സൂക്ഷ്മമാണ്. സെക്ഷൻ 1-ൽ ഇത് ശൂന്യ സ്ട്രിംഗ് മൂല്യമായി ഉപയോഗിച്ചെങ്കിലും, pandas-നു ഇത് നൾ പ്രതിനിധാനം ചെയ്യാത്ത ഒരു സ്ട്രിംഗ് ഒബ്ജക്റ്റാണ്.
|
||||
|
||||
ഇപ്പോൾ, ഈ മെത്തഡുകൾ പ്രായോഗികമായി ഉപയോഗിക്കുന്ന രീതിയിൽ ഉപയോഗിക്കാം. ബൂളിയൻ മാസ്കുകൾ നേരിട്ട് ``Series`` അല്ലെങ്കിൽ ``DataFrame`` ഇൻഡക്സായി ഉപയോഗിക്കാം, ഇത് നഷ്ടപ്പെട്ട (അല്ലെങ്കിൽ ഉള്ള) മൂല്യങ്ങളുമായി പ്രവർത്തിക്കുമ്പോൾ സഹായകരമാണ്.
|
||||
|
||||
> **പാഠം**: `isnull()` ഉം `notnull()` ഉം DataFrame-കളിൽ ഉപയോഗിക്കുമ്പോൾ സമാന ഫലങ്ങൾ നൽകുന്നു: ഫലങ്ങളും അവയുടെ ഇൻഡക്സും കാണിക്കുന്നു, ഇത് നിങ്ങളുടെ ഡാറ്റ കൈകാര്യം ചെയ്യുമ്പോൾ വളരെ സഹായകമാണ്.
|
||||
|
||||
- **നൾ മൂല്യങ്ങൾ നീക്കം ചെയ്യൽ**: നഷ്ടപ്പെട്ട മൂല്യങ്ങൾ തിരിച്ചറിയുന്നതിന് പുറമേ, pandas `Series`-ലും `DataFrame`-ലും നിന്നുള്ള നൾ മൂല്യങ്ങൾ നീക്കം ചെയ്യാനുള്ള സൗകര്യം നൽകുന്നു. (വലിയ ഡാറ്റാസെറ്റുകളിൽ, നഷ്ടപ്പെട്ട [NA] മൂല്യങ്ങൾ നീക്കം ചെയ്യുന്നത് അവയെ കൈകാര്യം ചെയ്യുന്നതിന് പകരം കൂടുതൽ ശുപാർശ ചെയ്യപ്പെടുന്നു.) ഇത് കാണാൻ `example1`-ലേക്ക് മടങ്ങാം:
|
||||
```python
|
||||
example1 = example1.dropna()
|
||||
example1
|
||||
```
|
||||
```
|
||||
0 0
|
||||
2
|
||||
dtype: object
|
||||
```
|
||||
ഇത് `example3[example3.notnull()]`-ന്റെ ഔട്ട്പുട്ട് പോലെയാണ്. വ്യത്യാസം, മാസ്ക് ചെയ്ത മൂല്യങ്ങളിൽ ഇൻഡക്സിംഗ് ചെയ്യുന്നതിന് പകരം, `dropna` ആ നഷ്ടപ്പെട്ട മൂല്യങ്ങൾ `Series` `example1`-ൽ നിന്ന് നീക്കം ചെയ്തിരിക്കുന്നു.
|
||||
|
||||
DataFrame-കൾക്ക് രണ്ട് ഡൈമെൻഷനുകൾ ഉള്ളതിനാൽ, ഡാറ്റ നീക്കം ചെയ്യാനുള്ള കൂടുതൽ ഓപ്ഷനുകൾ ഉണ്ട്.
|
||||
|
||||
```python
|
||||
example2 = pd.DataFrame([[1, np.nan, 7],
|
||||
[2, 5, 8],
|
||||
[np.nan, 6, 9]])
|
||||
example2
|
||||
```
|
||||
| | 0 | 1 | 2 |
|
||||
|------|---|---|---|
|
||||
|0 |1.0|NaN|7 |
|
||||
|1 |2.0|5.0|8 |
|
||||
|2 |NaN|6.0|9 |
|
||||
|
||||
(നിങ്ങൾ ശ്രദ്ധിച്ചോ, pandas `NaN`-കൾ ഉൾക്കൊള്ളാൻ രണ്ട് കോളങ്ങൾ ഫ്ലോട്ടുകളായി അപ്കാസ്റ്റ് ചെയ്തിട്ടുണ്ട്?)
|
||||
|
||||
DataFrame-ൽ ഒരു മൂല്യം മാത്രം നീക്കം ചെയ്യാനാകില്ല, അതിനാൽ പൂർണ്ണ വരികളോ കോളങ്ങളോ നീക്കം ചെയ്യണം. നിങ്ങൾ എന്ത് ചെയ്യുകയാണെന്ന് ആശ്രയിച്ച്, ഒരോതും ചെയ്യാം, pandas ഇരുവിധ ഓപ്ഷനുകളും നൽകുന്നു. ഡാറ്റ സയൻസിൽ, കോളങ്ങൾ സാധാരണയായി വേരിയബിളുകളായി, വരികൾ നിരീക്ഷണങ്ങളായി പ്രതിനിധാനം ചെയ്യുന്നതിനാൽ, വരികൾ നീക്കം ചെയ്യാൻ സാധ്യത കൂടുതലാണ്; `dropna()`-യുടെ ഡിഫോൾട്ട് ക്രമീകരണം ഏതെങ്കിലും നൾ മൂല്യം ഉള്ള എല്ലാ വരികളും നീക്കം ചെയ്യുകയാണ്:
|
||||
|
||||
```python
|
||||
example2.dropna()
|
||||
```
|
||||
```
|
||||
0 1 2
|
||||
1 2.0 5.0 8
|
||||
```
|
||||
ആവശ്യമായാൽ, കോളങ്ങളിൽ നിന്നുമുള്ള NA മൂല്യങ്ങൾ നീക്കം ചെയ്യാം. അതിന് `axis=1` ഉപയോഗിക്കുക:
|
||||
```python
|
||||
example2.dropna(axis='columns')
|
||||
```
|
||||
```
|
||||
2
|
||||
0 7
|
||||
1 8
|
||||
2 9
|
||||
```
|
||||
ഇത് നിങ്ങൾക്ക് സൂക്ഷിക്കേണ്ട ഡാറ്റയുടെ വലിയൊരു ഭാഗം നീക്കം ചെയ്യാം, പ്രത്യേകിച്ച് ചെറിയ ഡാറ്റാസെറ്റുകളിൽ. നിങ്ങൾക്ക് എങ്കിൽ, നൾ മൂല്യങ്ങൾ ഉള്ള ചില വരികളോ കോളങ്ങളോ മാത്രം നീക്കം ചെയ്യണമെങ്കിൽ? `dropna`-യിൽ `how` ഉം `thresh` ഉം പാരാമീറ്ററുകൾ ഉപയോഗിച്ച് ഇത് നിർദ്ദേശിക്കാം.
|
||||
|
||||
ഡിഫോൾട്ട് ആയി, `how='any'` ആണ് (സ്വയം പരിശോധിക്കാൻ അല്ലെങ്കിൽ മെത്തഡിന്റെ മറ്റ് പാരാമീറ്ററുകൾ കാണാൻ, കോഡ് സെല്ലിൽ `example4.dropna?` റൺ ചെയ്യുക). നിങ്ങൾക്ക് `how='all'` എന്നത് നിർദ്ദേശിക്കാം, ഇത് മുഴുവൻ നൾ മൂല്യങ്ങൾ ഉള്ള വരികളോ കോളങ്ങളോ മാത്രം നീക്കം ചെയ്യും. ഈ പ്രവർത്തനം കാണാൻ നമ്മുടെ ഉദാഹരണ DataFrame വിപുലീകരിക്കാം.
|
||||
|
||||
```python
|
||||
example2[3] = np.nan
|
||||
example2
|
||||
```
|
||||
| |0 |1 |2 |3 |
|
||||
|------|---|---|---|---|
|
||||
|0 |1.0|NaN|7 |NaN|
|
||||
|1 |2.0|5.0|8 |NaN|
|
||||
|2 |NaN|6.0|9 |NaN|
|
||||
|
||||
`thresh` പാരാമീറ്റർ കൂടുതൽ സൂക്ഷ്മ നിയന്ത്രണം നൽകുന്നു: ഒരു വരിയിലോ കോളത്തിലോ സൂക്ഷിക്കേണ്ട *നൺ-നൾ* മൂല്യങ്ങളുടെ എണ്ണം നിങ്ങൾ സജ്ജമാക്കുന്നു:
|
||||
```python
|
||||
example2.dropna(axis='rows', thresh=3)
|
||||
```
|
||||
```
|
||||
0 1 2 3
|
||||
1 2.0 5.0 8 NaN
|
||||
```
|
||||
ഇവിടെ, ആദ്യവും അവസാനവും വരികളും നീക്കം ചെയ്തിരിക്കുന്നു, കാരണം അവയിൽ രണ്ട് മാത്രമാണ് നൺ-നൾ മൂല്യങ്ങൾ.
|
||||
|
||||
- **നൾ മൂല്യങ്ങൾ പൂരിപ്പിക്കൽ**: നിങ്ങളുടെ ഡാറ്റാസെറ്റിന്റെ അടിസ്ഥാനത്തിൽ, നൾ മൂല്യങ്ങൾ നീക്കം ചെയ്യുന്നതിന് പകരം സാധുവായ മൂല്യങ്ങൾ കൊണ്ട് പൂരിപ്പിക്കുന്നത് കൂടുതൽ ബുദ്ധിമുട്ടില്ല. `isnull` ഉപയോഗിച്ച് ഇത് ചെയ്യാം, പക്ഷേ ഇത് പ്രയാസകരമായിരിക്കും, പ്രത്യേകിച്ച് പൂരിപ്പിക്കേണ്ട മൂല്യങ്ങൾ 많으면. ഡാറ്റ സയൻസിൽ ഇത് സാധാരണ പ്രവർത്തനമാണെന്ന് കൊണ്ട്, pandas `fillna` നൽകുന്നു, ഇത് `Series` അല്ലെങ്കിൽ `DataFrame`-ന്റെ ഒരു കോപ്പി നൽകുന്നു, നഷ്ടപ്പെട്ട മൂല്യങ്ങൾ നിങ്ങൾ തിരഞ്ഞെടുക്കുന്ന മൂല്യത്തോടെ പകരം വയ്ക്കുന്നു. പ്രായോഗികമായി ഇത് എങ്ങനെ പ്രവർത്തിക്കുന്നുവെന്ന് കാണാൻ മറ്റൊരു ഉദാഹരണ `Series` സൃഷ്ടിക്കാം.
|
||||
```python
|
||||
example3 = pd.Series([1, np.nan, 2, None, 3], index=list('abcde'))
|
||||
example3
|
||||
```
|
||||
```
|
||||
a 1.0
|
||||
b NaN
|
||||
c 2.0
|
||||
d NaN
|
||||
e 3.0
|
||||
dtype: float64
|
||||
```
|
||||
നൽകിയ മൂല്യമായ `0` ഉപയോഗിച്ച് എല്ലാ നൾ എൻട്രികളും പൂരിപ്പിക്കാം:
|
||||
```python
|
||||
example3.fillna(0)
|
||||
```
|
||||
```
|
||||
a 1.0
|
||||
b 0.0
|
||||
c 2.0
|
||||
d 0.0
|
||||
e 3.0
|
||||
dtype: float64
|
||||
```
|
||||
നൾ മൂല്യങ്ങൾ **ഫോർവേഡ്-ഫിൽ** ചെയ്യാം, അതായത് അവസാനത്തെ സാധുവായ മൂല്യം ഉപയോഗിച്ച് നൾ പൂരിപ്പിക്കുക:
|
||||
```python
|
||||
example3.fillna(method='ffill')
|
||||
```
|
||||
```
|
||||
a 1.0
|
||||
b 1.0
|
||||
c 2.0
|
||||
d 2.0
|
||||
e 3.0
|
||||
dtype: float64
|
||||
```
|
||||
നൽകിയ മൂല്യമായ അടുത്ത സാധുവായ മൂല്യം പിൻവശത്തേക്ക് പ്രചരിപ്പിച്ച് **ബാക്ക്-ഫിൽ** ചെയ്യാം:
|
||||
```python
|
||||
example3.fillna(method='bfill')
|
||||
```
|
||||
```
|
||||
a 1.0
|
||||
b 2.0
|
||||
c 2.0
|
||||
d 3.0
|
||||
e 3.0
|
||||
dtype: float64
|
||||
```
|
||||
ഇത് DataFrame-കളിലും സമാനമായി പ്രവർത്തിക്കുന്നു, പക്ഷേ നൾ മൂല്യങ്ങൾ പൂരിപ്പിക്കാൻ ഒരു `axis` നിർദ്ദേശിക്കാം. മുമ്പ് ഉപയോഗിച്ച `example2` വീണ്ടും എടുത്ത് നോക്കാം:
|
||||
```python
|
||||
example2.fillna(method='ffill', axis=1)
|
||||
```
|
||||
```
|
||||
0 1 2 3
|
||||
0 1.0 1.0 7.0 7.0
|
||||
1 2.0 5.0 8.0 8.0
|
||||
2 NaN 6.0 9.0 9.0
|
||||
```
|
||||
ഫോർവേഡ്-ഫില്ലിംഗിന് മുമ്പത്തെ മൂല്യം ലഭ്യമല്ലെങ്കിൽ, നൾ മൂല്യം നിലനിൽക്കുന്നതായി ശ്രദ്ധിക്കുക.
|
||||
> **Takeaway:** നിങ്ങളുടെ ഡാറ്റാസെറ്റുകളിൽ കാണാനാകാത്ത മൂല്യങ്ങൾ കൈകാര്യം ചെയ്യാനുള്ള പല മാർഗ്ഗങ്ങളുമുണ്ട്. നിങ്ങൾ ഉപയോഗിക്കുന്ന പ്രത്യേക തന്ത്രം (അവ നീക്കം ചെയ്യുക, മാറ്റിസ്ഥാപിക്കുക, അല്ലെങ്കിൽ എങ്ങനെ മാറ്റിസ്ഥാപിക്കണം എന്നത്) ആ ഡാറ്റയുടെ പ്രത്യേകതകൾ അനുസരിച്ച് നിർണ്ണയിക്കപ്പെടണം. നിങ്ങൾ കൂടുതൽ ഡാറ്റാസെറ്റുകൾ കൈകാര്യം ചെയ്ത് ഇടപഴകുമ്പോൾ കാണാനാകാത്ത മൂല്യങ്ങൾ എങ്ങനെ കൈകാര്യം ചെയ്യാമെന്ന് നിങ്ങൾക്ക് മെച്ചപ്പെട്ട ധാരണ ഉണ്ടാകും.
|
||||
|
||||
## പകർപ്പുകൾ നീക്കം ചെയ്യൽ
|
||||
|
||||
> **Learning goal:** ഈ ഉപവിഭാഗത്തിന്റെ അവസാനം, നിങ്ങൾ ഡാറ്റാഫ്രെയിമുകളിൽ നിന്ന് പകർപ്പുകൾ തിരിച്ചറിയാനും നീക്കം ചെയ്യാനും സുഖകരമായി കഴിയണം.
|
||||
|
||||
കാണാനാകാത്ത ഡാറ്റയ്ക്ക് പുറമേ, നിങ്ങൾക്ക് യാഥാർത്ഥ്യ ഡാറ്റാസെറ്റുകളിൽ പകർപ്പുകൾ പലപ്പോഴും കാണാം. ഭാഗ്യവശാൽ, `pandas` പകർപ്പുകൾ കണ്ടെത്താനും നീക്കം ചെയ്യാനും എളുപ്പമുള്ള മാർഗ്ഗം നൽകുന്നു.
|
||||
|
||||
- **പകർപ്പുകൾ തിരിച്ചറിയൽ: `duplicated`**: pandas-ലെ `duplicated` മെത്തഡ് ഉപയോഗിച്ച് പകർപ്പുകൾ എളുപ്പത്തിൽ കണ്ടെത്താം, ഇത് ഒരു ബൂളിയൻ മാസ്ക് നൽകുന്നു, ഒരു `DataFrame`-ലെ ഒരു എൻട്രി മുമ്പത്തെ ഒരു പകർപ്പാണോ എന്ന് സൂചിപ്പിക്കുന്നു. ഇത് പ്രവർത്തനത്തിൽ കാണാൻ മറ്റൊരു ഉദാഹരണ `DataFrame` സൃഷ്ടിക്കാം.
|
||||
```python
|
||||
example4 = pd.DataFrame({'letters': ['A','B'] * 2 + ['B'],
|
||||
'numbers': [1, 2, 1, 3, 3]})
|
||||
example4
|
||||
```
|
||||
| |letters|numbers|
|
||||
|------|-------|-------|
|
||||
|0 |A |1 |
|
||||
|1 |B |2 |
|
||||
|2 |A |1 |
|
||||
|3 |B |3 |
|
||||
|4 |B |3 |
|
||||
|
||||
```python
|
||||
example4.duplicated()
|
||||
```
|
||||
```
|
||||
0 False
|
||||
1 False
|
||||
2 True
|
||||
3 False
|
||||
4 True
|
||||
dtype: bool
|
||||
```
|
||||
- **പകർപ്പുകൾ നീക്കം ചെയ്യൽ: `drop_duplicates`:** `duplicated` മൂല്യങ്ങൾ `False` ആയ എല്ലാ ഡാറ്റയുടെ ഒരു പകർപ്പ് മടങ്ങി നൽകുന്നു:
|
||||
```python
|
||||
example4.drop_duplicates()
|
||||
```
|
||||
```
|
||||
letters numbers
|
||||
0 A 1
|
||||
1 B 2
|
||||
3 B 3
|
||||
```
|
||||
`duplicated` ഉം `drop_duplicates` ഉം ഡിഫോൾട്ടായി എല്ലാ കോളങ്ങളെയും പരിഗണിക്കുന്നു, പക്ഷേ നിങ്ങൾക്ക് നിങ്ങളുടെ `DataFrame`-ലെ ചില കോളങ്ങൾ മാത്രം പരിശോധിക്കാൻ നിർദ്ദേശിക്കാം:
|
||||
```python
|
||||
example4.drop_duplicates(['letters'])
|
||||
```
|
||||
```
|
||||
letters numbers
|
||||
0 A 1
|
||||
1 B 2
|
||||
```
|
||||
|
||||
> **Takeaway:** പകർപ്പുകൾ നീക്കം ചെയ്യൽ ഏകദേശം എല്ലാ ഡാറ്റാ സയൻസ് പ്രോജക്റ്റുകളുടെയും അനിവാര്യ ഭാഗമാണ്. പകർപ്പുകൾ നിങ്ങളുടെ വിശകലന ഫലങ്ങൾ മാറ്റുകയും തെറ്റായ ഫലങ്ങൾ നൽകുകയും ചെയ്യാം!
|
||||
|
||||
## 🚀 ചലഞ്ച്
|
||||
|
||||
ചർച്ച ചെയ്ത എല്ലാ വസ്തുക്കളും [Jupyter Notebook](https://github.com/microsoft/Data-Science-For-Beginners/blob/main/2-Working-With-Data/08-data-preparation/notebook.ipynb) ആയി ലഭ്യമാണ്. കൂടാതെ, ഓരോ വിഭാഗത്തിനും ശേഷം വ്യായാമങ്ങൾ ഉണ്ട്, അവ പരീക്ഷിച്ച് നോക്കൂ!
|
||||
|
||||
## [പോസ്റ്റ്-ലെക്ചർ ക്വിസ്](https://ff-quizzes.netlify.app/en/ds/quiz/15)
|
||||
|
||||
|
||||
|
||||
## അവലോകനം & സ്വയം പഠനം
|
||||
|
||||
നിങ്ങളുടെ ഡാറ്റ വിശകലനത്തിനും മോഡലിംഗിനും തയ്യാറാക്കുന്നതും ഡാറ്റ ശുദ്ധീകരണവും കണ്ടെത്താനും സമീപിക്കാനും നിരവധി മാർഗ്ഗങ്ങളുണ്ട്, ഡാറ്റ ശുദ്ധീകരണം ഒരു "ഹാൻഡ്സ് ഓൺ" അനുഭവമാണ്. ഈ പാഠം ഉൾക്കൊള്ളാത്ത സാങ്കേതിക വിദ്യകൾ അന്വേഷിക്കാൻ Kaggle-ൽ നിന്നുള്ള ഈ ചലഞ്ചുകൾ പരീക്ഷിക്കൂ.
|
||||
|
||||
- [ഡാറ്റ ശുദ്ധീകരണ ചലഞ്ച്: തീയതികൾ പാഴ്സിംഗ്](https://www.kaggle.com/rtatman/data-cleaning-challenge-parsing-dates/)
|
||||
|
||||
- [ഡാറ്റ ശുദ്ധീകരണ ചലഞ്ച്: ഡാറ്റ സ്കെയിൽ ചെയ്യൽ, നോർമലൈസ് ചെയ്യൽ](https://www.kaggle.com/rtatman/data-cleaning-challenge-scale-and-normalize-data)
|
||||
|
||||
|
||||
## അസൈൻമെന്റ്
|
||||
|
||||
[ഫോമിൽ നിന്നുള്ള ഡാറ്റ വിലയിരുത്തൽ](assignment.md)
|
||||
|
||||
---
|
||||
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
|
||||
**അസൂയാപത്രം**:
|
||||
ഈ രേഖ AI വിവർത്തന സേവനം [Co-op Translator](https://github.com/Azure/co-op-translator) ഉപയോഗിച്ച് വിവർത്തനം ചെയ്തതാണ്. നാം കൃത്യതയ്ക്ക് ശ്രമിച്ചിട്ടുണ്ടെങ്കിലും, സ്വയം പ്രവർത്തിക്കുന്ന വിവർത്തനങ്ങളിൽ പിശകുകൾ അല്ലെങ്കിൽ തെറ്റുകൾ ഉണ്ടാകാമെന്ന് ദയവായി ശ്രദ്ധിക്കുക. അതിന്റെ മാതൃഭാഷയിലുള്ള യഥാർത്ഥ രേഖ അധികാരപരമായ ഉറവിടമായി കണക്കാക്കപ്പെടണം. നിർണായക വിവരങ്ങൾക്ക്, പ്രൊഫഷണൽ മനുഷ്യ വിവർത്തനം ശുപാർശ ചെയ്യപ്പെടുന്നു. ഈ വിവർത്തനം ഉപയോഗിക്കുന്നതിൽ നിന്നുണ്ടാകുന്ന ഏതെങ്കിലും തെറ്റിദ്ധാരണകൾക്കോ തെറ്റായ വ്യാഖ്യാനങ്ങൾക്കോ ഞങ്ങൾ ഉത്തരവാദികളല്ല.
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER END -->
|
||||
File diff suppressed because one or more lines are too long
@ -0,0 +1,30 @@
|
||||
<!--
|
||||
CO_OP_TRANSLATOR_METADATA:
|
||||
{
|
||||
"original_hash": "f9d5a7275e046223fa6474477674b810",
|
||||
"translation_date": "2025-12-19T15:45:32+00:00",
|
||||
"source_file": "2-Working-With-Data/08-data-preparation/assignment.md",
|
||||
"language_code": "ml"
|
||||
}
|
||||
-->
|
||||
# ഒരു ഫോമിൽ നിന്നുള്ള ഡാറ്റ വിലയിരുത്തൽ
|
||||
|
||||
ഒരു ക്ലയന്റ് അവരുടെ ക്ലയന്റ്-ബേസ് സംബന്ധിച്ച ചില അടിസ്ഥാന ഡാറ്റ ശേഖരിക്കാൻ ഒരു [ചെറിയ ഫോം](../../../../2-Working-With-Data/08-data-preparation/index.html) പരീക്ഷിച്ചു വരുന്നു. അവർ ശേഖരിച്ച ഡാറ്റ ശരിയാണോ എന്ന് സ്ഥിരീകരിക്കാൻ അവർ അവരുടെ കണ്ടെത്തലുകൾ നിങ്ങളെ സമീപിച്ചു. ഫോം കാണാൻ ബ്രൗസറിൽ `index.html` പേജ് തുറക്കാം.
|
||||
|
||||
നിങ്ങൾക്ക് ഫോമിൽ നിന്നുള്ള എൻട്രികൾ ഉൾപ്പെടുന്ന [csv റെക്കോർഡുകളുടെ ഒരു ഡാറ്റാസെറ്റ്](../../../../data/form.csv) കൂടാതെ ചില അടിസ്ഥാന ദൃശ്യവത്കരണങ്ങളും നൽകിയിട്ടുണ്ട്. ചില ദൃശ്യവത്കരണങ്ങൾ തെറ്റായതായി ക്ലയന്റ് സൂചിപ്പിച്ചു, എന്നാൽ അവ പരിഹരിക്കാൻ എങ്ങനെ എന്നതിൽ അവർ ഉറപ്പില്ല. നിങ്ങൾക്ക് ഇത് [അസൈൻമെന്റ് നോട്ട്ബുക്കിൽ](assignment.ipynb) പരിശോധിക്കാം.
|
||||
|
||||
## നിർദ്ദേശങ്ങൾ
|
||||
|
||||
ഈ പാഠത്തിലെ സാങ്കേതിക വിദ്യകൾ ഉപയോഗിച്ച് ഫോം ശരിയായും സ്ഥിരതയുള്ളതുമായ വിവരങ്ങൾ ശേഖരിക്കുന്നതിന് ശുപാർശകൾ നൽകുക.
|
||||
|
||||
## റൂബ്രിക്
|
||||
|
||||
Exemplary | Adequate | Needs Improvement
|
||||
--- | --- | -- |
|
||||
|
||||
---
|
||||
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
|
||||
**അസൂയാ**:
|
||||
ഈ രേഖ AI വിവർത്തന സേവനം [Co-op Translator](https://github.com/Azure/co-op-translator) ഉപയോഗിച്ച് വിവർത്തനം ചെയ്തതാണ്. നാം കൃത്യതയ്ക്ക് ശ്രമിച്ചെങ്കിലും, സ്വയം പ്രവർത്തിക്കുന്ന വിവർത്തനങ്ങളിൽ പിശകുകൾ അല്ലെങ്കിൽ തെറ്റുകൾ ഉണ്ടാകാമെന്ന് ദയവായി ശ്രദ്ധിക്കുക. അതിന്റെ മാതൃഭാഷയിലുള്ള യഥാർത്ഥ രേഖയാണ് പ്രാമാണികമായ ഉറവിടം എന്ന് പരിഗണിക്കേണ്ടതാണ്. നിർണായകമായ വിവരങ്ങൾക്ക്, പ്രൊഫഷണൽ മനുഷ്യ വിവർത്തനം ശുപാർശ ചെയ്യപ്പെടുന്നു. ഈ വിവർത്തനം ഉപയോഗിക്കുന്നതിൽ നിന്നുണ്ടാകുന്ന ഏതെങ്കിലും തെറ്റിദ്ധാരണകൾക്കോ തെറ്റായ വ്യാഖ്യാനങ്ങൾക്കോ ഞങ്ങൾ ഉത്തരവാദികളല്ല.
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER END -->
|
||||
File diff suppressed because it is too large
Load Diff
@ -0,0 +1,32 @@
|
||||
<!--
|
||||
CO_OP_TRANSLATOR_METADATA:
|
||||
{
|
||||
"original_hash": "abc3309ab41bc5a7846f70ee1a055838",
|
||||
"translation_date": "2025-12-19T13:29:38+00:00",
|
||||
"source_file": "2-Working-With-Data/README.md",
|
||||
"language_code": "ml"
|
||||
}
|
||||
-->
|
||||
# ഡാറ്റയുമായി പ്രവർത്തിക്കൽ
|
||||
|
||||

|
||||
> ഫോട്ടോ <a href="https://unsplash.com/@swimstaralex?utm_source=unsplash&utm_medium=referral&utm_content=creditCopyText">Alexander Sinn</a> യുടെ <a href="https://unsplash.com/s/photos/data?utm_source=unsplash&utm_medium=referral&utm_content=creditCopyText">Unsplash</a> ൽ നിന്നാണ്
|
||||
|
||||
ഈ പാഠങ്ങളിൽ, ഡാറ്റ എങ്ങനെ കൈകാര്യം ചെയ്യാമെന്ന്, മാറ്റം വരുത്താമെന്ന്, ആപ്ലിക്കേഷനുകളിൽ ഉപയോഗിക്കാമെന്ന് നിങ്ങൾ പഠിക്കും. ബന്ധപരമായ (relational) ഡാറ്റാബേസുകളും ബന്ധമില്ലാത്ത (non-relational) ഡാറ്റാബേസുകളും എന്താണെന്ന്, അവയിൽ ഡാറ്റ എങ്ങനെ സൂക്ഷിക്കാമെന്ന് നിങ്ങൾ അറിയും. ഡാറ്റ കൈകാര്യം ചെയ്യാൻ പൈത്തൺ ഉപയോഗിക്കുന്നതിന്റെ അടിസ്ഥാനങ്ങൾ നിങ്ങൾ പഠിക്കും, കൂടാതെ പൈത്തൺ ഉപയോഗിച്ച് ഡാറ്റ കൈകാര്യം ചെയ്യാനും ഡാറ്റയിൽ നിന്ന് വിവരങ്ങൾ കണ്ടെത്താനും ഉള്ള നിരവധി മാർഗങ്ങൾ നിങ്ങൾ കണ്ടെത്തും.
|
||||
### വിഷയങ്ങൾ
|
||||
|
||||
1. [ബന്ധപരമായ ഡാറ്റാബേസുകൾ](05-relational-databases/README.md)
|
||||
2. [ബന്ധമില്ലാത്ത ഡാറ്റാബേസുകൾ](06-non-relational/README.md)
|
||||
3. [പൈത്തൺ ഉപയോഗിച്ച് പ്രവർത്തിക്കൽ](07-python/README.md)
|
||||
4. [ഡാറ്റ തയ്യാറാക്കൽ](08-data-preparation/README.md)
|
||||
|
||||
### ക്രെഡിറ്റുകൾ
|
||||
|
||||
ഈ പാഠങ്ങൾ ❤️ ഉപയോഗിച്ച് എഴുതിയത് [Christopher Harrison](https://twitter.com/geektrainer), [Dmitry Soshnikov](https://twitter.com/shwars) എന്നിവരും [Jasmine Greenaway](https://twitter.com/paladique) യും ആണ്
|
||||
|
||||
---
|
||||
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
|
||||
**അസൂയാപത്രം**:
|
||||
ഈ രേഖ AI വിവർത്തന സേവനം [Co-op Translator](https://github.com/Azure/co-op-translator) ഉപയോഗിച്ച് വിവർത്തനം ചെയ്തതാണ്. നാം കൃത്യതയ്ക്ക് ശ്രമിച്ചിട്ടുണ്ടെങ്കിലും, സ്വയം പ്രവർത്തിക്കുന്ന വിവർത്തനങ്ങളിൽ പിശകുകൾ അല്ലെങ്കിൽ തെറ്റുകൾ ഉണ്ടാകാമെന്ന് ദയവായി ശ്രദ്ധിക്കുക. അതിന്റെ മാതൃഭാഷയിലുള്ള യഥാർത്ഥ രേഖ അധികാരപരമായ ഉറവിടമായി കണക്കാക്കപ്പെടണം. നിർണായക വിവരങ്ങൾക്ക്, പ്രൊഫഷണൽ മനുഷ്യ വിവർത്തനം ശുപാർശ ചെയ്യപ്പെടുന്നു. ഈ വിവർത്തനം ഉപയോഗിക്കുന്നതിൽ നിന്നുണ്ടാകുന്ന ഏതെങ്കിലും തെറ്റിദ്ധാരണകൾക്കോ തെറ്റായ വ്യാഖ്യാനങ്ങൾക്കോ ഞങ്ങൾ ഉത്തരവാദികളല്ല.
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER END -->
|
||||
@ -0,0 +1,221 @@
|
||||
<!--
|
||||
CO_OP_TRANSLATOR_METADATA:
|
||||
{
|
||||
"original_hash": "a49d78e32e280c410f04e5f2a2068e77",
|
||||
"translation_date": "2025-12-19T16:14:27+00:00",
|
||||
"source_file": "3-Data-Visualization/09-visualization-quantities/README.md",
|
||||
"language_code": "ml"
|
||||
}
|
||||
-->
|
||||
# അളവുകൾ ദൃശ്യവൽക്കരിക്കൽ
|
||||
|
||||
| ](../../sketchnotes/09-Visualizing-Quantities.png)|
|
||||
|:---:|
|
||||
| അളവുകൾ ദൃശ്യവൽക്കരിക്കൽ - _Sketchnote by [@nitya](https://twitter.com/nitya)_ |
|
||||
|
||||
ഈ പാഠത്തിൽ, അളവിന്റെ ആശയത്തെ ചുറ്റിപ്പറ്റി രസകരമായ ദൃശ്യവൽക്കരണങ്ങൾ സൃഷ്ടിക്കാൻ ലഭ്യമായ പല പൈതൺ ലൈബ്രറികളിൽ ഒന്നിനെ എങ്ങനെ ഉപയോഗിക്കാമെന്ന് നിങ്ങൾ പഠിക്കും. മിന്നസോട്ടയുടെ പക്ഷികളെക്കുറിച്ചുള്ള ശുദ്ധീകരിച്ച ഡാറ്റാസെറ്റ് ഉപയോഗിച്ച്, പ്രാദേശിക വന്യജീവികളെക്കുറിച്ചുള്ള പല രസകരമായ വസ്തുതകളും നിങ്ങൾക്ക് അറിയാം.
|
||||
## [പാഠം മുൻകൂർ ക്വിസ്](https://ff-quizzes.netlify.app/en/ds/quiz/16)
|
||||
|
||||
## Matplotlib ഉപയോഗിച്ച് വിങ്സ്പാൻ നിരീക്ഷിക്കുക
|
||||
|
||||
വിവിധ തരത്തിലുള്ള ലളിതവും സങ്കീർണ്ണവുമായ പ്ലോട്ടുകളും ചാർട്ടുകളും സൃഷ്ടിക്കാൻ മികച്ച ലൈബ്രറി [Matplotlib](https://matplotlib.org/stable/index.html) ആണ്. പൊതുവായി, ഈ ലൈബ്രറികൾ ഉപയോഗിച്ച് ഡാറ്റ പ്ലോട്ട് ചെയ്യാനുള്ള പ്രക്രിയയിൽ, നിങ്ങളുടെ ഡാറ്റാഫ്രെയിമിന്റെ ലക്ഷ്യമിടേണ്ട ഭാഗങ്ങൾ തിരിച്ചറിയുക, ആവശ്യമായ മാറ്റങ്ങൾ ചെയ്യുക, അതിന്റെ x, y അക്ഷ മൂല്യങ്ങൾ നിശ്ചയിക്കുക, ഏത് തരത്തിലുള്ള പ്ലോട്ട് കാണിക്കണമെന്ന് തീരുമാനിക്കുക, പിന്നെ പ്ലോട്ട് കാണിക്കുക എന്നിവ ഉൾപ്പെടുന്നു. Matplotlib നിരവധി ദൃശ്യവൽക്കരണങ്ങൾ നൽകുന്നു, പക്ഷേ ഈ പാഠത്തിനായി, അളവ് ദൃശ്യവൽക്കരിക്കാൻ ഏറ്റവും അനുയോജ്യമായവയായ ലൈന്ചാർട്ടുകൾ, സ്കാറ്റർപ്ലോട്ടുകൾ, ബാർ പ്ലോട്ടുകൾ എന്നിവയിൽ ശ്രദ്ധ കേന്ദ്രീകരിക്കാം.
|
||||
|
||||
> ✅ നിങ്ങളുടെ ഡാറ്റയുടെ ഘടനക്കും പറയാനുള്ള കഥക്കും ഏറ്റവും അനുയോജ്യമായ ചാർട്ട് ഉപയോഗിക്കുക.
|
||||
> - സമയാനുസൃത പ്രവണതകൾ വിശകലനം ചെയ്യാൻ: ലൈന്ചാർട്ട്
|
||||
> - മൂല്യങ്ങൾ താരതമ്യം ചെയ്യാൻ: ബാർ, കോളം, പൈ, സ്കാറ്റർപ്ലോട്ട്
|
||||
> - ഭാഗങ്ങൾ മുഴുവൻ എങ്ങനെ ബന്ധപ്പെട്ടിരിക്കുന്നു കാണിക്കാൻ: പൈ
|
||||
> - ഡാറ്റയുടെ വിതരണങ്ങൾ കാണിക്കാൻ: സ്കാറ്റർപ്ലോട്ട്, ബാർ
|
||||
> - പ്രവണതകൾ കാണിക്കാൻ: ലൈന്ചാർട്ട്, കോളം
|
||||
> - മൂല്യങ്ങൾ തമ്മിലുള്ള ബന്ധങ്ങൾ കാണിക്കാൻ: ലൈന്ചാർട്ട്, സ്കാറ്റർപ്ലോട്ട്, ബബിൾ
|
||||
|
||||
നിങ്ങൾക്ക് ഒരു ഡാറ്റാസെറ്റ് ഉണ്ടെങ്കിൽ, ഒരു നൽകിയ വസ്തുവിന്റെ എത്രമാത്രം ഉൾപ്പെടുന്നുവെന്ന് കണ്ടെത്തേണ്ട ആദ്യ ജോലികളിൽ ഒന്നാണ് അതിന്റെ മൂല്യങ്ങൾ പരിശോധിക്കുക.
|
||||
|
||||
✅ Matplotlib-ന് മികച്ച 'ചീറ്റ് ഷീറ്റുകൾ' [ഇവിടെ](https://matplotlib.org/cheatsheets/cheatsheets.pdf) ലഭ്യമാണ്.
|
||||
|
||||
## പക്ഷികളുടെ വിങ്സ്പാൻ മൂല്യങ്ങളെക്കുറിച്ച് ലൈന്പ്ലോട്ട് നിർമ്മിക്കുക
|
||||
|
||||
ഈ പാഠ ഫോൾഡറിന്റെ റൂട്ടിലുള്ള `notebook.ipynb` ഫയൽ തുറന്ന് ഒരു സെൽ ചേർക്കുക.
|
||||
|
||||
> കുറിപ്പ്: ഡാറ്റ ഈ റീപ്പോയുടെ റൂട്ടിലുള്ള `/data` ഫോൾഡറിലാണ് സൂക്ഷിച്ചിരിക്കുന്നത്.
|
||||
|
||||
```python
|
||||
import pandas as pd
|
||||
import matplotlib.pyplot as plt
|
||||
birds = pd.read_csv('../../data/birds.csv')
|
||||
birds.head()
|
||||
```
|
||||
ഈ ഡാറ്റ ടെക്സ്റ്റും സംഖ്യകളും ചേർന്നതാണ്:
|
||||
|
||||
|
||||
| | Name | ScientificName | Category | Order | Family | Genus | ConservationStatus | MinLength | MaxLength | MinBodyMass | MaxBodyMass | MinWingspan | MaxWingspan |
|
||||
| ---: | :--------------------------- | :--------------------- | :-------------------- | :----------- | :------- | :---------- | :----------------- | --------: | --------: | ----------: | ----------: | ----------: | ----------: |
|
||||
| 0 | Black-bellied whistling-duck | Dendrocygna autumnalis | Ducks/Geese/Waterfowl | Anseriformes | Anatidae | Dendrocygna | LC | 47 | 56 | 652 | 1020 | 76 | 94 |
|
||||
| 1 | Fulvous whistling-duck | Dendrocygna bicolor | Ducks/Geese/Waterfowl | Anseriformes | Anatidae | Dendrocygna | LC | 45 | 53 | 712 | 1050 | 85 | 93 |
|
||||
| 2 | Snow goose | Anser caerulescens | Ducks/Geese/Waterfowl | Anseriformes | Anatidae | Anser | LC | 64 | 79 | 2050 | 4050 | 135 | 165 |
|
||||
| 3 | Ross's goose | Anser rossii | Ducks/Geese/Waterfowl | Anseriformes | Anatidae | Anser | LC | 57.3 | 64 | 1066 | 1567 | 113 | 116 |
|
||||
| 4 | Greater white-fronted goose | Anser albifrons | Ducks/Geese/Waterfowl | Anseriformes | Anatidae | Anser | LC | 64 | 81 | 1930 | 3310 | 130 | 165 |
|
||||
|
||||
അടിസ്ഥാന ലൈന്പ്ലോട്ട് ഉപയോഗിച്ച് ചില സംഖ്യാത്മക ഡാറ്റ പ്ലോട്ട് ചെയ്യുന്നതിൽ നിന്ന് തുടങ്ങാം. ഈ രസകരമായ പക്ഷികളുടെ പരമാവധി വിങ്സ്പാനിന്റെ കാഴ്ച നിങ്ങൾക്ക് വേണമെങ്കിൽ.
|
||||
|
||||
```python
|
||||
wingspan = birds['MaxWingspan']
|
||||
wingspan.plot()
|
||||
```
|
||||

|
||||
|
||||
നിങ്ങൾ ഉടൻ ശ്രദ്ധിക്കുന്നതെന്താണ്? കുറഞ്ഞത് ഒരു ഔട്ട്ലൈയർ ഉണ്ടെന്ന് തോന്നുന്നു - അത്ര വലിയ വിങ്സ്പാൻ! 2300 സെന്റീമീറ്റർ വിങ്സ്പാൻ 23 മീറ്ററിനാണ് തുല്യമായത് - മിന്നസോട്ടയിൽ പ്റ്റെറോഡാക്ടിലുകൾ നടക്കുകയാണോ? പരിശോധിക്കാം.
|
||||
|
||||
Excel-ൽ ഒരു വേഗത്തിലുള്ള സോർട്ട് ചെയ്ത് ആ ഔട്ട്ലൈയറുകൾ കണ്ടെത്താമെങ്കിലും, അവ ടൈപ്പോസ് ആകാമെന്ന് കരുതുന്നു, പ്ലോട്ടിൽ നിന്നുള്ള ദൃശ്യവൽക്കരണ പ്രക്രിയ തുടരുക.
|
||||
|
||||
x-അക്ഷത്തിൽ ലേബലുകൾ ചേർത്ത് ഏത് തരത്തിലുള്ള പക്ഷികളാണെന്ന് കാണിക്കുക:
|
||||
|
||||
```
|
||||
plt.title('Max Wingspan in Centimeters')
|
||||
plt.ylabel('Wingspan (CM)')
|
||||
plt.xlabel('Birds')
|
||||
plt.xticks(rotation=45)
|
||||
x = birds['Name']
|
||||
y = birds['MaxWingspan']
|
||||
|
||||
plt.plot(x, y)
|
||||
|
||||
plt.show()
|
||||
```
|
||||

|
||||
|
||||
45 ഡിഗ്രി ലേബലുകളുടെ റൊട്ടേഷൻ സജ്ജമാക്കിയിട്ടും വായിക്കാൻ വളരെ അധികം ലേബലുകൾ ഉണ്ട്. വ്യത്യസ്തമായ ഒരു തന്ത്രം പരീക്ഷിക്കാം: ഔട്ട്ലൈയറുകൾ മാത്രം ലേബൽ ചെയ്യുക, ലേബലുകൾ ചാർട്ടിനുള്ളിൽ സജ്ജമാക്കുക. ലേബലിംഗിന് കൂടുതൽ സ്ഥലം നൽകാൻ സ്കാറ്റർ ചാർട്ട് ഉപയോഗിക്കാം:
|
||||
|
||||
```python
|
||||
plt.title('Max Wingspan in Centimeters')
|
||||
plt.ylabel('Wingspan (CM)')
|
||||
plt.tick_params(axis='both',which='both',labelbottom=False,bottom=False)
|
||||
|
||||
for i in range(len(birds)):
|
||||
x = birds['Name'][i]
|
||||
y = birds['MaxWingspan'][i]
|
||||
plt.plot(x, y, 'bo')
|
||||
if birds['MaxWingspan'][i] > 500:
|
||||
plt.text(x, y * (1 - 0.05), birds['Name'][i], fontsize=12)
|
||||
|
||||
plt.show()
|
||||
```
|
||||
ഇവിടെ എന്താണ് സംഭവിക്കുന്നത്? നിങ്ങൾ `tick_params` ഉപയോഗിച്ച് താഴെയുള്ള ലേബലുകൾ മറച്ചുവെച്ചു, പിന്നെ നിങ്ങളുടെ പക്ഷികളുടെ ഡാറ്റാസെറ്റിൽ ലൂപ്പ് സൃഷ്ടിച്ചു. `bo` ഉപയോഗിച്ച് ചെറിയ നീല വൃത്താകൃതിയിലുള്ള ഡോട്ടുകൾ പ്ലോട്ട് ചെയ്ത്, പരമാവധി വിങ്സ്പാൻ 500-ൽ കൂടുതലുള്ള ഏതെങ്കിലും പക്ഷിയെ കണ്ടെത്തി, ആ ഡോട്ടിന് അടുത്ത് ലേബൽ പ്രദർശിപ്പിച്ചു. y അക്ഷത്തിൽ ലേബലുകൾ കുറച്ച് മാറ്റി (`y * (1 - 0.05)`) പക്ഷിയുടെ പേര് ലേബലായി ഉപയോഗിച്ചു.
|
||||
|
||||
നിങ്ങൾ എന്ത് കണ്ടെത്തി?
|
||||
|
||||

|
||||
## നിങ്ങളുടെ ഡാറ്റ ഫിൽട്ടർ ചെയ്യുക
|
||||
|
||||
ബാൾഡ് ഈഗിൾക്കും പ്രെയറി ഫാൽക്കണിനും, വളരെ വലിയ പക്ഷികളായിരിക്കാം, പക്ഷേ പരമാവധി വിങ്സ്പാനിൽ ഒരു അധികം `0` ചേർത്തിട്ടുള്ള തെറ്റായ ലേബലിംഗാണ്. 25 മീറ്റർ വിങ്സ്പാൻ ഉള്ള ബാൾഡ് ഈഗിൾ കാണാൻ സാധ്യത കുറവാണ്, പക്ഷേ ഉണ്ടെങ്കിൽ ദയവായി ഞങ്ങളെ അറിയിക്കുക! ആ രണ്ട് ഔട്ട്ലൈയറുകൾ ഇല്ലാതെ പുതിയ ഡാറ്റാഫ്രെയിം സൃഷ്ടിക്കാം:
|
||||
|
||||
```python
|
||||
plt.title('Max Wingspan in Centimeters')
|
||||
plt.ylabel('Wingspan (CM)')
|
||||
plt.xlabel('Birds')
|
||||
plt.tick_params(axis='both',which='both',labelbottom=False,bottom=False)
|
||||
for i in range(len(birds)):
|
||||
x = birds['Name'][i]
|
||||
y = birds['MaxWingspan'][i]
|
||||
if birds['Name'][i] not in ['Bald eagle', 'Prairie falcon']:
|
||||
plt.plot(x, y, 'bo')
|
||||
plt.show()
|
||||
```
|
||||
|
||||
ഔട്ട്ലൈയറുകൾ ഫിൽട്ടർ ചെയ്തതോടെ, നിങ്ങളുടെ ഡാറ്റ കൂടുതൽ ഏകീകൃതവും മനസ്സിലാക്കാൻ എളുപ്പവുമാണ്.
|
||||
|
||||

|
||||
|
||||
ഇപ്പോൾ വിങ്സ്പാൻ സംബന്ധിച്ച് കുറഞ്ഞത് ശുദ്ധമായ ഡാറ്റാസെറ്റ് ഉണ്ടാകുമ്പോൾ, ഈ പക്ഷികളെക്കുറിച്ച് കൂടുതൽ കണ്ടെത്താം.
|
||||
|
||||
ലൈനും സ്കാറ്റർ പ്ലോട്ടുകളും ഡാറ്റ മൂല്യങ്ങളും അവയുടെ വിതരണങ്ങളും പ്രദർശിപ്പിക്കുമ്പോൾ, ഈ ഡാറ്റാസെറ്റിൽ ഉള്ള മൂല്യങ്ങളെക്കുറിച്ച് ചിന്തിക്കണം. അളവിനെക്കുറിച്ചുള്ള ചോദ്യങ്ങൾക്ക് ഉത്തരം കണ്ടെത്താൻ ദൃശ്യവൽക്കരണങ്ങൾ സൃഷ്ടിക്കാം:
|
||||
|
||||
> പക്ഷികളുടെ എത്ര വിഭാഗങ്ങളുണ്ട്, അവയുടെ എണ്ണം എത്രയാണ്?
|
||||
> എത്ര പക്ഷികൾ നശിച്ചുപോയവ, അപകടത്തിൽപെട്ടവ, അപൂർവവ, സാധാരണവ?
|
||||
> ലിനിയസിന്റെ പദവിനുസരിച്ച് വിവിധ ജീനസുകളും ഓർഡറുകളും എത്രയുണ്ട്?
|
||||
## ബാർ ചാർട്ടുകൾ പരിശോധിക്കുക
|
||||
|
||||
ഡാറ്റയുടെ ഗ്രൂപ്പിംഗുകൾ കാണിക്കേണ്ടപ്പോൾ ബാർ ചാർട്ടുകൾ പ്രായോഗികമാണ്. ഈ ഡാറ്റാസെറ്റിലുള്ള പക്ഷികളുടെ വിഭാഗങ്ങൾ പരിശോധിച്ച് ഏതാണ് ഏറ്റവും സാധാരണമായത് എന്ന് കാണാം.
|
||||
|
||||
നോട്ട്ബുക്ക് ഫയലിൽ ഒരു അടിസ്ഥാന ബാർ ചാർട്ട് സൃഷ്ടിക്കുക
|
||||
|
||||
✅ മുൻപത്തെ വിഭാഗത്തിൽ കണ്ടെത്തിയ രണ്ട് ഔട്ട്ലൈയർ പക്ഷികളെ ഫിൽട്ടർ ചെയ്യാം, അവരുടെ വിങ്സ്പാൻ ടൈപ്പോ തിരുത്താം, അല്ലെങ്കിൽ വിങ്സ്പാൻ മൂല്യങ്ങളിൽ ആശ്രയിക്കാത്ത ഈ അഭ്യാസങ്ങൾക്ക് അവയെ ഉൾപ്പെടുത്താം.
|
||||
|
||||
ബാർ ചാർട്ട് സൃഷ്ടിക്കാൻ, നിങ്ങൾ ശ്രദ്ധിക്കേണ്ട ഡാറ്റ തിരഞ്ഞെടുക്കാം. ബാർ ചാർട്ടുകൾ കച്ച ഡാറ്റയിൽ നിന്നു സൃഷ്ടിക്കാം:
|
||||
|
||||
```python
|
||||
birds.plot(x='Category',
|
||||
kind='bar',
|
||||
stacked=True,
|
||||
title='Birds of Minnesota')
|
||||
|
||||
```
|
||||

|
||||
|
||||
എന്നാൽ ഈ ബാർ ചാർട്ട് വായിക്കാൻ കഴിയുന്നില്ല, കാരണം ഗ്രൂപ്പുചെയ്യാത്ത ഡാറ്റ വളരെ കൂടുതലാണ്. നിങ്ങൾ പ്ലോട്ട് ചെയ്യാൻ ആഗ്രഹിക്കുന്ന ഡാറ്റ മാത്രം തിരഞ്ഞെടുക്കണം, അതിനാൽ പക്ഷികളുടെ വിഭാഗം അടിസ്ഥാനമാക്കി നീളം നോക്കാം.
|
||||
|
||||
നിങ്ങളുടെ ഡാറ്റയിൽ നിന്ന് പക്ഷികളുടെ വിഭാഗം മാത്രം ഉൾപ്പെടുത്താൻ ഫിൽട്ടർ ചെയ്യുക.
|
||||
|
||||
✅ Pandas ഉപയോഗിച്ച് ഡാറ്റ കൈകാര്യം ചെയ്യുകയും Matplotlib ഉപയോഗിച്ച് ചാർട്ട് സൃഷ്ടിക്കുകയും ചെയ്യുന്നതാണ് ശ്രദ്ധിക്കുക.
|
||||
|
||||
വിവിധ വിഭാഗങ്ങൾ 많아서, ഈ ചാർട്ട് ലംബമായി പ്രദർശിപ്പിച്ച് ഉയരം ക്രമീകരിക്കാം:
|
||||
|
||||
```python
|
||||
category_count = birds.value_counts(birds['Category'].values, sort=True)
|
||||
plt.rcParams['figure.figsize'] = [6, 12]
|
||||
category_count.plot.barh()
|
||||
```
|
||||

|
||||
|
||||
ഈ ബാർ ചാർട്ട് ഓരോ വിഭാഗത്തിലും പക്ഷികളുടെ എണ്ണം നല്ല കാഴ്ച നൽകുന്നു. ഒരു നിമിഷത്തിൽ, ഈ പ്രദേശത്തെ ഏറ്റവും വലിയ പക്ഷി എണ്ണം Ducks/Geese/Waterfowl വിഭാഗത്തിലാണ് എന്ന് കാണാം. മിന്നസോട്ട '10,000 തടാകങ്ങളുടെ നാട്' ആകുന്നതിനാൽ ഇത് അത്ഭുതമല്ല!
|
||||
|
||||
✅ ഈ ഡാറ്റാസെറ്റിൽ മറ്റ് എണ്ണങ്ങൾ പരീക്ഷിച്ച് നോക്കൂ. എന്തെങ്കിലും നിങ്ങളെ അത്ഭുതപ്പെടുത്തുന്നുണ്ടോ?
|
||||
|
||||
## ഡാറ്റ താരതമ്യം ചെയ്യൽ
|
||||
|
||||
പുതിയ അക്ഷങ്ങൾ സൃഷ്ടിച്ച് ഗ്രൂപ്പുചെയ്ത ഡാറ്റയുടെ വ്യത്യസ്ത താരതമ്യങ്ങൾ പരീക്ഷിക്കാം. പക്ഷിയുടെ MaxLength-നെ അതിന്റെ വിഭാഗം അടിസ്ഥാനമാക്കി താരതമ്യം ചെയ്യുക:
|
||||
|
||||
```python
|
||||
maxlength = birds['MaxLength']
|
||||
plt.barh(y=birds['Category'], width=maxlength)
|
||||
plt.rcParams['figure.figsize'] = [6, 12]
|
||||
plt.show()
|
||||
```
|
||||

|
||||
|
||||
ഇവിടെ എന്തും അത്ഭുതപ്പെടുത്തുന്നില്ല: ഹമ്മിംഗ്ബേർഡുകൾക്ക് പെലിക്കാനുകളോ ഗീസുകളോ അപേക്ഷിച്ച് ഏറ്റവും കുറഞ്ഞ MaxLength ഉണ്ട്. ഡാറ്റ ലജിക്കൽ ആകുമ്പോൾ നല്ലതാണ്!
|
||||
|
||||
ഡാറ്റ സൂപ്പർഇംപോസിംഗ് ചെയ്ത് ബാർ ചാർട്ടുകളുടെ കൂടുതൽ രസകരമായ ദൃശ്യവൽക്കരണങ്ങൾ സൃഷ്ടിക്കാം. ഒരു പക്ഷി വിഭാഗത്തിൽ കുറഞ്ഞതും പരമാവതുമായ നീളം സൂപ്പർഇംപോസ് ചെയ്യാം:
|
||||
|
||||
```python
|
||||
minLength = birds['MinLength']
|
||||
maxLength = birds['MaxLength']
|
||||
category = birds['Category']
|
||||
|
||||
plt.barh(category, maxLength)
|
||||
plt.barh(category, minLength)
|
||||
|
||||
plt.show()
|
||||
```
|
||||
ഈ പ്ലോട്ടിൽ, ഓരോ പക്ഷി വിഭാഗത്തിന്റെയും കുറഞ്ഞ നീളം, പരമാവധി നീളം കാണാം. ഈ ഡാറ്റ പ്രകാരം, പക്ഷി വലുതായാൽ, അതിന്റെ നീളം വ്യത്യാസവും വലുതാണ് എന്ന് പറയാം. അത്ഭുതകരം!
|
||||
|
||||

|
||||
|
||||
## 🚀 ചലഞ്ച്
|
||||
|
||||
ഈ പക്ഷി ഡാറ്റാസെറ്റ് ഒരു പ്രത്യേക പരിസ്ഥിതിയിലെ വിവിധ തരത്തിലുള്ള പക്ഷികളെക്കുറിച്ചുള്ള ധാരാളം വിവരങ്ങൾ നൽകുന്നു. ഇന്റർനെറ്റിൽ തിരയുക, മറ്റ് പക്ഷി-കേന്ദ്രിത ഡാറ്റാസെറ്റുകൾ കണ്ടെത്താൻ ശ്രമിക്കുക. ഈ പക്ഷികളെക്കുറിച്ചുള്ള ചാർട്ടുകളും ഗ്രാഫുകളും നിർമ്മിച്ച് നിങ്ങൾ അറിയാത്ത വസ്തുതകൾ കണ്ടെത്താൻ അഭ്യാസം ചെയ്യുക.
|
||||
|
||||
## [പാഠം ശേഷം ക്വിസ്](https://ff-quizzes.netlify.app/en/ds/quiz/17)
|
||||
|
||||
## അവലോകനം & സ്വയം പഠനം
|
||||
|
||||
ഈ ആദ്യ പാഠം Matplotlib ഉപയോഗിച്ച് അളവുകൾ ദൃശ്യവൽക്കരിക്കുന്നതിനെക്കുറിച്ച് ചില വിവരങ്ങൾ നൽകി. ദൃശ്യവൽക്കരണത്തിനായി ഡാറ്റാസെറ്റുകളുമായി പ്രവർത്തിക്കുന്ന മറ്റ് മാർഗങ്ങൾക്കായി കുറച്ച് ഗവേഷണം ചെയ്യുക. [Plotly](https://github.com/plotly/plotly.py) ഒരു ലൈബ്രറിയാണ്, ഇത് ഈ പാഠങ്ങളിൽ ഉൾപ്പെടുത്തുന്നില്ല, അതിനാൽ അത് എന്ത് നൽകുന്നു എന്ന് നോക്കുക.
|
||||
## അസൈൻമെന്റ്
|
||||
|
||||
[ലൈനുകൾ, സ്കാറ്ററുകൾ, ബാറുകൾ](assignment.md)
|
||||
|
||||
---
|
||||
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
|
||||
**അസൂയാ**:
|
||||
ഈ രേഖ AI വിവർത്തന സേവനം [Co-op Translator](https://github.com/Azure/co-op-translator) ഉപയോഗിച്ച് വിവർത്തനം ചെയ്തതാണ്. നാം കൃത്യതയ്ക്ക് ശ്രമിച്ചെങ്കിലും, സ്വയം പ്രവർത്തിക്കുന്ന വിവർത്തനങ്ങളിൽ പിശകുകൾ അല്ലെങ്കിൽ തെറ്റുകൾ ഉണ്ടാകാമെന്ന് ദയവായി ശ്രദ്ധിക്കുക. അതിന്റെ മാതൃഭാഷയിലുള്ള യഥാർത്ഥ രേഖ അധികാരപരമായ ഉറവിടമായി കണക്കാക്കണം. നിർണായക വിവരങ്ങൾക്ക്, പ്രൊഫഷണൽ മനുഷ്യ വിവർത്തനം ശുപാർശ ചെയ്യപ്പെടുന്നു. ഈ വിവർത്തനത്തിന്റെ ഉപയോഗത്തിൽ നിന്നുണ്ടാകുന്ന ഏതെങ്കിലും തെറ്റിദ്ധാരണകൾക്കോ തെറ്റായ വ്യാഖ്യാനങ്ങൾക്കോ ഞങ്ങൾ ഉത്തരവാദികളല്ല.
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER END -->
|
||||
@ -0,0 +1,27 @@
|
||||
<!--
|
||||
CO_OP_TRANSLATOR_METADATA:
|
||||
{
|
||||
"original_hash": "ad163c4fda72c8278280b61cad317ff4",
|
||||
"translation_date": "2025-12-19T16:17:19+00:00",
|
||||
"source_file": "3-Data-Visualization/09-visualization-quantities/assignment.md",
|
||||
"language_code": "ml"
|
||||
}
|
||||
-->
|
||||
# ലൈനുകൾ, സ്കാറ്ററുകൾ, ബാറുകൾ
|
||||
|
||||
## നിർദ്ദേശങ്ങൾ
|
||||
|
||||
ഈ പാഠത്തിൽ, നിങ്ങൾ ലൈന്ചാർട്ടുകൾ, സ്കാറ്റർപ്ലോട്ടുകൾ, ബാർ ചാർട്ടുകൾ ഉപയോഗിച്ച് ഈ ഡാറ്റാസെറ്റിനെക്കുറിച്ചുള്ള രസകരമായ വസ്തുതകൾ കാണിച്ചു. ഈ അസൈൻമെന്റിൽ, ഒരു നിശ്ചിത പക്ഷിയുടെ ഒരു വസ്തുത കണ്ടെത്താൻ ഡാറ്റാസെറ്റിൽ കൂടുതൽ ആഴത്തിൽ തിരയുക. ഉദാഹരണത്തിന്, സ്നോ ഗീസിനെക്കുറിച്ചുള്ള എല്ലാ രസകരമായ ഡാറ്റയും ദൃശ്യവൽക്കരിക്കുന്ന ഒരു നോട്ട്ബുക്ക് സൃഷ്ടിക്കുക. മുകളിൽ പരാമർശിച്ച മൂന്ന് പ്ലോട്ടുകളും ഉപയോഗിച്ച് നിങ്ങളുടെ നോട്ട്ബുക്കിൽ ഒരു കഥ പറയുക.
|
||||
|
||||
## റൂബ്രിക്
|
||||
|
||||
Exemplary | Adequate | Needs Improvement
|
||||
--- | --- | -- |
|
||||
ഒരു നോട്ട്ബുക്ക് നല്ല അനോട്ടേഷനുകളോടും, ഉറച്ച കഥ പറയലോടും, ആകർഷകമായ ഗ്രാഫുകളോടും കൂടി അവതരിപ്പിക്കുന്നു | നോട്ട്ബുക്കിൽ ഈ ഘടകങ്ങളിൽ ഒന്നോ കുറവാണ് | നോട്ട്ബുക്കിൽ ഈ ഘടകങ്ങളിൽ രണ്ട് കുറവാണ്
|
||||
|
||||
---
|
||||
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
|
||||
**അസൂയാ**:
|
||||
ഈ രേഖ AI വിവർത്തന സേവനം [Co-op Translator](https://github.com/Azure/co-op-translator) ഉപയോഗിച്ച് വിവർത്തനം ചെയ്തതാണ്. നാം കൃത്യതയ്ക്ക് ശ്രമിച്ചിട്ടുണ്ടെങ്കിലും, സ്വയം പ്രവർത്തിക്കുന്ന വിവർത്തനങ്ങളിൽ പിശകുകൾ അല്ലെങ്കിൽ തെറ്റുകൾ ഉണ്ടാകാമെന്ന് ദയവായി ശ്രദ്ധിക്കുക. അതിന്റെ മാതൃഭാഷയിലുള്ള യഥാർത്ഥ രേഖ അധികാരപരമായ ഉറവിടമായി കണക്കാക്കണം. നിർണായക വിവരങ്ങൾക്ക്, പ്രൊഫഷണൽ മനുഷ്യ വിവർത്തനം ശുപാർശ ചെയ്യപ്പെടുന്നു. ഈ വിവർത്തനത്തിന്റെ ഉപയോഗത്തിൽ നിന്നുണ്ടാകുന്ന ഏതെങ്കിലും തെറ്റിദ്ധാരണകൾക്കോ തെറ്റായ വ്യാഖ്യാനങ്ങൾക്കോ ഞങ്ങൾ ഉത്തരവാദികളല്ല.
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER END -->
|
||||
@ -0,0 +1,48 @@
|
||||
{
|
||||
"cells": [
|
||||
{
|
||||
"cell_type": "markdown",
|
||||
"source": [
|
||||
"# പക്ഷികളെക്കുറിച്ച് പഠിക്കാം\n"
|
||||
],
|
||||
"metadata": {}
|
||||
},
|
||||
{
|
||||
"cell_type": "markdown",
|
||||
"metadata": {},
|
||||
"source": [
|
||||
"---\n\n<!-- CO-OP TRANSLATOR DISCLAIMER START -->\n**അസൂയാ**: \nഈ രേഖ AI വിവർത്തന സേവനം [Co-op Translator](https://github.com/Azure/co-op-translator) ഉപയോഗിച്ച് വിവർത്തനം ചെയ്തതാണ്. നാം കൃത്യതയ്ക്ക് ശ്രമിച്ചിട്ടുണ്ടെങ്കിലും, സ്വയം പ്രവർത്തിക്കുന്ന വിവർത്തനങ്ങളിൽ പിശകുകൾ അല്ലെങ്കിൽ തെറ്റുകൾ ഉണ്ടാകാമെന്ന് ദയവായി ശ്രദ്ധിക്കുക. അതിന്റെ മാതൃഭാഷയിലുള്ള യഥാർത്ഥ രേഖ അധികാരപരമായ ഉറവിടമായി കണക്കാക്കപ്പെടണം. നിർണായക വിവരങ്ങൾക്ക്, പ്രൊഫഷണൽ മനുഷ്യ വിവർത്തനം ശുപാർശ ചെയ്യപ്പെടുന്നു. ഈ വിവർത്തനം ഉപയോഗിക്കുന്നതിൽ നിന്നുണ്ടാകുന്ന ഏതെങ്കിലും തെറ്റിദ്ധാരണകൾക്കോ തെറ്റായ വ്യാഖ്യാനങ്ങൾക്കോ ഞങ്ങൾ ഉത്തരവാദികളല്ല.\n<!-- CO-OP TRANSLATOR DISCLAIMER END -->\n"
|
||||
]
|
||||
}
|
||||
],
|
||||
"metadata": {
|
||||
"orig_nbformat": 4,
|
||||
"language_info": {
|
||||
"name": "python",
|
||||
"version": "3.7.0",
|
||||
"mimetype": "text/x-python",
|
||||
"codemirror_mode": {
|
||||
"name": "ipython",
|
||||
"version": 3
|
||||
},
|
||||
"pygments_lexer": "ipython3",
|
||||
"nbconvert_exporter": "python",
|
||||
"file_extension": ".py"
|
||||
},
|
||||
"kernelspec": {
|
||||
"name": "python3",
|
||||
"display_name": "Python 3.7.0 64-bit"
|
||||
},
|
||||
"interpreter": {
|
||||
"hash": "70b38d7a306a849643e446cd70466270a13445e5987dfa1344ef2b127438fa4d"
|
||||
},
|
||||
"coopTranslator": {
|
||||
"original_hash": "33e5c5d3f0630388e20f2e161bd4cdf3",
|
||||
"translation_date": "2025-12-19T17:36:43+00:00",
|
||||
"source_file": "3-Data-Visualization/09-visualization-quantities/notebook.ipynb",
|
||||
"language_code": "ml"
|
||||
}
|
||||
},
|
||||
"nbformat": 4,
|
||||
"nbformat_minor": 2
|
||||
}
|
||||
File diff suppressed because one or more lines are too long
@ -0,0 +1,220 @@
|
||||
<!--
|
||||
CO_OP_TRANSLATOR_METADATA:
|
||||
{
|
||||
"original_hash": "80a20467e046d312809d008395051fc7",
|
||||
"translation_date": "2025-12-19T15:54:16+00:00",
|
||||
"source_file": "3-Data-Visualization/10-visualization-distributions/README.md",
|
||||
"language_code": "ml"
|
||||
}
|
||||
-->
|
||||
# വിതരണങ്ങൾ ദൃശ്യവൽക്കരിക്കൽ
|
||||
|
||||
| ](../../sketchnotes/10-Visualizing-Distributions.png)|
|
||||
|:---:|
|
||||
| വിതരണങ്ങൾ ദൃശ്യവൽക്കരിക്കൽ - _Sketchnote by [@nitya](https://twitter.com/nitya)_ |
|
||||
|
||||
മുൻപത്തെ പാഠത്തിൽ, മിന്നസോട്ടയുടെ പക്ഷികളെക്കുറിച്ചുള്ള ഒരു ഡാറ്റാസെറ്റിനെക്കുറിച്ച് ചില രസകരമായ വസ്തുതകൾ നിങ്ങൾ പഠിച്ചു. ഔട്ട്ലൈയർമാരെ ദൃശ്യവൽക്കരിച്ച് ചില തെറ്റായ ഡാറ്റ കണ്ടെത്തി, കൂടാതെ പക്ഷികളുടെ പരമാവധി നീളത്തിന്റെ അടിസ്ഥാനത്തിൽ പക്ഷി വിഭാഗങ്ങൾ തമ്മിലുള്ള വ്യത്യാസങ്ങൾ നോക്കി.
|
||||
|
||||
## [പാഠം മുൻകൂർ ക്വിസ്](https://ff-quizzes.netlify.app/en/ds/quiz/18)
|
||||
## പക്ഷികളുടെ ഡാറ്റാസെറ്റ് പരിശോധിക്കുക
|
||||
|
||||
ഡാറ്റയിൽ കൂടുതൽ ആഴത്തിൽ നോക്കാനുള്ള മറ്റൊരു മാർഗം അതിന്റെ വിതരണത്തെ, അല്ലെങ്കിൽ ഡാറ്റ ഒരു അക്ഷം അനുസരിച്ച് എങ്ങനെ ക്രമീകരിച്ചിരിക്കുന്നുവെന്ന് നോക്കുകയാണ്. ഉദാഹരണത്തിന്, മിന്നസോട്ടയിലെ പക്ഷികളുടെ പരമാവധി വിങ്സ്പാൻ അല്ലെങ്കിൽ പരമാവധി ശരീരഭാരം എന്നിങ്ങനെ ഈ ഡാറ്റാസെറ്റിന്റെ പൊതുവായ വിതരണത്തെക്കുറിച്ച് നിങ്ങൾ അറിയാൻ ആഗ്രഹിക്കാം.
|
||||
|
||||
ഈ ഡാറ്റാസെറ്റിലെ ഡാറ്റയുടെ വിതരണങ്ങളെക്കുറിച്ച് ചില വസ്തുതകൾ കണ്ടെത്താം. ഈ പാഠം ഫോൾഡറിന്റെ റൂട്ടിലുള്ള _notebook.ipynb_ ഫയലിൽ, Pandas, Matplotlib, നിങ്ങളുടെ ഡാറ്റ എന്നിവ ഇറക്കുമതി ചെയ്യുക:
|
||||
|
||||
```python
|
||||
import pandas as pd
|
||||
import matplotlib.pyplot as plt
|
||||
birds = pd.read_csv('../../data/birds.csv')
|
||||
birds.head()
|
||||
```
|
||||
|
||||
| | Name | ScientificName | Category | Order | Family | Genus | ConservationStatus | MinLength | MaxLength | MinBodyMass | MaxBodyMass | MinWingspan | MaxWingspan |
|
||||
| ---: | :--------------------------- | :--------------------- | :-------------------- | :----------- | :------- | :---------- | :----------------- | --------: | --------: | ----------: | ----------: | ----------: | ----------: |
|
||||
| 0 | Black-bellied whistling-duck | Dendrocygna autumnalis | Ducks/Geese/Waterfowl | Anseriformes | Anatidae | Dendrocygna | LC | 47 | 56 | 652 | 1020 | 76 | 94 |
|
||||
| 1 | Fulvous whistling-duck | Dendrocygna bicolor | Ducks/Geese/Waterfowl | Anseriformes | Anatidae | Dendrocygna | LC | 45 | 53 | 712 | 1050 | 85 | 93 |
|
||||
| 2 | Snow goose | Anser caerulescens | Ducks/Geese/Waterfowl | Anseriformes | Anatidae | Anser | LC | 64 | 79 | 2050 | 4050 | 135 | 165 |
|
||||
| 3 | Ross's goose | Anser rossii | Ducks/Geese/Waterfowl | Anseriformes | Anatidae | Anser | LC | 57.3 | 64 | 1066 | 1567 | 113 | 116 |
|
||||
| 4 | Greater white-fronted goose | Anser albifrons | Ducks/Geese/Waterfowl | Anseriformes | Anatidae | Anser | LC | 64 | 81 | 1930 | 3310 | 130 | 165 |
|
||||
|
||||
|
||||
സാധാരണയായി, മുൻപത്തെ പാഠത്തിൽ ചെയ്തതുപോലെ സ്കാറ്റർ പ്ലോട്ട് ഉപയോഗിച്ച് ഡാറ്റ എങ്ങനെ വിതരണം ചെയ്തിട്ടുള്ളതെന്ന് നിങ്ങൾക്ക് വേഗത്തിൽ നോക്കാം:
|
||||
|
||||
```python
|
||||
birds.plot(kind='scatter',x='MaxLength',y='Order',figsize=(12,8))
|
||||
|
||||
plt.title('Max Length per Order')
|
||||
plt.ylabel('Order')
|
||||
plt.xlabel('Max Length')
|
||||
|
||||
plt.show()
|
||||
```
|
||||

|
||||
|
||||
ഇത് ഓരോ പക്ഷി ഓർഡറിനും ശരീര നീളത്തിന്റെ പൊതുവായ വിതരണത്തിന്റെ ഒരു അവലോകനമാണ് നൽകുന്നത്, പക്ഷേ യഥാർത്ഥ വിതരണങ്ങൾ പ്രദർശിപ്പിക്കാൻ ഇത് ഏറ്റവും അനുയോജ്യമായ മാർഗം അല്ല. ആ ജോലി സാധാരണയായി ഹിസ്റ്റോഗ്രാം സൃഷ്ടിച്ച് നിർവഹിക്കുന്നു.
|
||||
## ഹിസ്റ്റോഗ്രാമുകളുമായി പ്രവർത്തിക്കൽ
|
||||
|
||||
Matplotlib ഡാറ്റ വിതരണങ്ങൾ ദൃശ്യവൽക്കരിക്കാൻ വളരെ നല്ല മാർഗങ്ങൾ നൽകുന്നു, പ്രത്യേകിച്ച് ഹിസ്റ്റോഗ്രാമുകൾ ഉപയോഗിച്ച്. ഈ തരത്തിലുള്ള ചാർട്ട് ഒരു ബാർ ചാർട്ടുപോലെയാണ്, ബാറുകളുടെ ഉയർച്ചയും താഴ്ച്ചയും വഴി വിതരണത്തെ കാണിക്കുന്നു. ഹിസ്റ്റോഗ്രാം നിർമ്മിക്കാൻ, നിങ്ങൾക്ക് സംഖ്യാത്മക ഡാറ്റ വേണം. ഹിസ്റ്റോഗ്രാം നിർമ്മിക്കാൻ, 'hist' എന്ന കിൻഡ് നിർവചിച്ച് ഒരു ചാർട്ട് പ്ലോട്ട് ചെയ്യാം. ഈ ചാർട്ട് മുഴുവൻ ഡാറ്റാസെറ്റിലെ MaxBodyMass ന്റെ വിതരണത്തെ കാണിക്കുന്നു. ഡാറ്റയുടെ അറേയെ ചെറിയ ബിനുകളായി വിഭജിച്ച്, ഡാറ്റയുടെ മൂല്യങ്ങളുടെ വിതരണത്തെ പ്രദർശിപ്പിക്കാം:
|
||||
|
||||
```python
|
||||
birds['MaxBodyMass'].plot(kind = 'hist', bins = 10, figsize = (12,12))
|
||||
plt.show()
|
||||
```
|
||||

|
||||
|
||||
നിങ്ങൾക്ക് കാണാമല്ലോ, ഈ ഡാറ്റാസെറ്റിലെ 400+ പക്ഷികളിൽ ഭൂരിഭാഗവും അവരുടെ പരമാവധി ശരീരഭാരം 2000-ൽ താഴെ ഉള്ള പരിധിയിലാണ്. `bins` പാരാമീറ്റർ 30 പോലുള്ള ഉയർന്ന സംഖ്യയാക്കി മാറ്റി ഡാറ്റയിൽ കൂടുതൽ洞察ം നേടാം:
|
||||
|
||||
```python
|
||||
birds['MaxBodyMass'].plot(kind = 'hist', bins = 30, figsize = (12,12))
|
||||
plt.show()
|
||||
```
|
||||

|
||||
|
||||
ഈ ചാർട്ട് കൂടുതൽ സൂക്ഷ്മമായ രീതിയിൽ വിതരണത്തെ കാണിക്കുന്നു. ഇടത്തരം കുറവുള്ള ഒരു ചാർട്ട് സൃഷ്ടിക്കാൻ, നിങ്ങൾക്ക് ഒരു നിശ്ചിത പരിധിയിലുള്ള ഡാറ്റ മാത്രം തിരഞ്ഞെടുക്കണം:
|
||||
|
||||
ശരീരഭാരം 60-ൽ താഴെയുള്ള പക്ഷികളെ മാത്രം ഫിൽട്ടർ ചെയ്ത് 40 `bins` കാണിക്കുക:
|
||||
|
||||
```python
|
||||
filteredBirds = birds[(birds['MaxBodyMass'] > 1) & (birds['MaxBodyMass'] < 60)]
|
||||
filteredBirds['MaxBodyMass'].plot(kind = 'hist',bins = 40,figsize = (12,12))
|
||||
plt.show()
|
||||
```
|
||||

|
||||
|
||||
✅ മറ്റ് ഫിൽട്ടറുകളും ഡാറ്റ പോയിന്റുകളും പരീക്ഷിക്കുക. ഡാറ്റയുടെ മുഴുവൻ വിതരണവും കാണാൻ, `['MaxBodyMass']` ഫിൽട്ടർ നീക്കം ചെയ്ത് ലേബൽ ചെയ്ത വിതരണങ്ങൾ കാണിക്കുക.
|
||||
|
||||
ഹിസ്റ്റോഗ്രാം ചില നല്ല നിറവും ലേബലിംഗും നൽകുന്നു:
|
||||
|
||||
രണ്ട് വിതരണങ്ങൾ തമ്മിലുള്ള ബന്ധം താരതമ്യം ചെയ്യാൻ 2D ഹിസ്റ്റോഗ്രാം സൃഷ്ടിക്കുക. `MaxBodyMass` vs. `MaxLength` താരതമ്യം ചെയ്യാം. Matplotlib കൂടുതൽ പ്രകാശമുള്ള നിറങ്ങൾ ഉപയോഗിച്ച് സമന്വയം കാണിക്കുന്ന ഒരു ഇൻബിൽറ്റ് മാർഗം നൽകുന്നു:
|
||||
|
||||
```python
|
||||
x = filteredBirds['MaxBodyMass']
|
||||
y = filteredBirds['MaxLength']
|
||||
|
||||
fig, ax = plt.subplots(tight_layout=True)
|
||||
hist = ax.hist2d(x, y)
|
||||
```
|
||||
ഈ രണ്ട് ഘടകങ്ങൾ തമ്മിൽ പ്രതീക്ഷിക്കപ്പെട്ട ബന്ധം ഒരു പ്രതീക്ഷിച്ച അക്ഷം അനുസരിച്ച് കാണപ്പെടുന്നു, പ്രത്യേകിച്ച് ശക്തമായ ഒരു സമന്വയ ബിന്ദു:
|
||||
|
||||

|
||||
|
||||
ഹിസ്റ്റോഗ്രാമുകൾ സംഖ്യാത്മക ഡാറ്റയ്ക്ക് സാധാരണയായി നല്ലതാണ്. ടെക്സ്റ്റ് ഡാറ്റ അനുസരിച്ച് വിതരണങ്ങൾ കാണേണ്ടത് എങ്കിൽ?
|
||||
|
||||
## ടെക്സ്റ്റ് ഡാറ്റ ഉപയോഗിച്ച് വിതരണങ്ങൾ പരിശോധിക്കുക
|
||||
|
||||
ഈ ഡാറ്റാസെറ്റിൽ പക്ഷി വിഭാഗം, ജനുസ്, സ്പീഷീസ്, കുടുംബം, സംരക്ഷണ നില എന്നിവയെക്കുറിച്ചും നല്ല വിവരങ്ങൾ ഉൾക്കൊള്ളുന്നു. സംരക്ഷണ വിവരങ്ങൾ പരിശോധിക്കാം. പക്ഷികളുടെ സംരക്ഷണ നില അനുസരിച്ച് വിതരണങ്ങൾ എങ്ങനെയാണ്?
|
||||
|
||||
> ✅ ഡാറ്റാസെറ്റിൽ, സംരക്ഷണ നില വിവരിക്കാൻ പല ചുരുക്കപ്പേരുകളും ഉപയോഗിക്കുന്നു. ഈ ചുരുക്കപ്പേരുകൾ [IUCN Red List Categories](https://www.iucnredlist.org/) എന്ന സംഘടനയിൽ നിന്നാണ്.
|
||||
>
|
||||
> - CR: അത്യന്തം അപകടത്തിൽ
|
||||
> - EN: അപകടത്തിൽ
|
||||
> - EX: നശിച്ചുപോയ
|
||||
> - LC: കുറഞ്ഞ ആശങ്ക
|
||||
> - NT: അടുത്ത ഭീഷണി
|
||||
> - VU: അപകടസാധ്യതയുള്ള
|
||||
|
||||
ഇവ ടെക്സ്റ്റ് അടിസ്ഥാനമാക്കിയ മൂല്യങ്ങളാണ്, അതിനാൽ ഹിസ്റ്റോഗ്രാം സൃഷ്ടിക്കാൻ ട്രാൻസ്ഫോം ചെയ്യേണ്ടതുണ്ട്. filteredBirds ഡാറ്റാഫ്രെയിമിൽ, അതിന്റെ സംരക്ഷണ നിലയും കുറഞ്ഞ വിങ്സ്പാനും പ്രദർശിപ്പിക്കുക. നിങ്ങൾ എന്ത് കാണുന്നു?
|
||||
|
||||
```python
|
||||
x1 = filteredBirds.loc[filteredBirds.ConservationStatus=='EX', 'MinWingspan']
|
||||
x2 = filteredBirds.loc[filteredBirds.ConservationStatus=='CR', 'MinWingspan']
|
||||
x3 = filteredBirds.loc[filteredBirds.ConservationStatus=='EN', 'MinWingspan']
|
||||
x4 = filteredBirds.loc[filteredBirds.ConservationStatus=='NT', 'MinWingspan']
|
||||
x5 = filteredBirds.loc[filteredBirds.ConservationStatus=='VU', 'MinWingspan']
|
||||
x6 = filteredBirds.loc[filteredBirds.ConservationStatus=='LC', 'MinWingspan']
|
||||
|
||||
kwargs = dict(alpha=0.5, bins=20)
|
||||
|
||||
plt.hist(x1, **kwargs, color='red', label='Extinct')
|
||||
plt.hist(x2, **kwargs, color='orange', label='Critically Endangered')
|
||||
plt.hist(x3, **kwargs, color='yellow', label='Endangered')
|
||||
plt.hist(x4, **kwargs, color='green', label='Near Threatened')
|
||||
plt.hist(x5, **kwargs, color='blue', label='Vulnerable')
|
||||
plt.hist(x6, **kwargs, color='gray', label='Least Concern')
|
||||
|
||||
plt.gca().set(title='Conservation Status', ylabel='Min Wingspan')
|
||||
plt.legend();
|
||||
```
|
||||
|
||||

|
||||
|
||||
കുറഞ്ഞ വിങ്സ്പാനും സംരക്ഷണ നിലക്കും നല്ല ബന്ധമില്ലെന്ന് തോന്നുന്നു. ഈ രീതിയിൽ ഡാറ്റാസെറ്റിലെ മറ്റ് ഘടകങ്ങളും പരീക്ഷിക്കുക. നിങ്ങൾക്ക് ഏതെങ്കിലും ബന്ധം കണ്ടെത്താമോ?
|
||||
|
||||
## ഡെൻസിറ്റി പ്ലോട്ടുകൾ
|
||||
|
||||
ഇതുവരെ നോക്കിയ ഹിസ്റ്റോഗ്രാമുകൾ 'സ്റ്റെപ്പ്ഡ്' ആണെന്നും ഒരു മൃദുവായ വക്രരേഖ പോലെ ഒഴുകുന്നില്ലെന്നും നിങ്ങൾ ശ്രദ്ധിച്ചിരിക്കാം. കൂടുതൽ മൃദുവായ ഡെൻസിറ്റി ചാർട്ട് കാണിക്കാൻ, ഡെൻസിറ്റി പ്ലോട്ട് പരീക്ഷിക്കാം.
|
||||
|
||||
ഡെൻസിറ്റി പ്ലോട്ടുകളുമായി പ്രവർത്തിക്കാൻ, പുതിയ പ്ലോട്ടിംഗ് ലൈബ്രറി [Seaborn](https://seaborn.pydata.org/generated/seaborn.kdeplot.html) പരിചയപ്പെടുക.
|
||||
|
||||
Seaborn ലോഡ് ചെയ്ത് ഒരു അടിസ്ഥാന ഡെൻസിറ്റി പ്ലോട്ട് പരീക്ഷിക്കുക:
|
||||
|
||||
```python
|
||||
import seaborn as sns
|
||||
import matplotlib.pyplot as plt
|
||||
sns.kdeplot(filteredBirds['MinWingspan'])
|
||||
plt.show()
|
||||
```
|
||||

|
||||
|
||||
മുൻപത്തെ കുറഞ്ഞ വിങ്സ്പാൻ ഡാറ്റയുടെ പ്ലോട്ടിനെപ്പോലെ ഇത് കാണാം; ഇത് കുറച്ച് മൃദുവാണ്. Seaborn ഡോക്യുമെന്റേഷനുസരിച്ച്, "ഹിസ്റ്റോഗ്രാമിനോട് താരതമ്യപ്പെടുത്തുമ്പോൾ, KDE ഒരു പ്ലോട്ട് കുറച്ച് കുറവുള്ളതും കൂടുതൽ വ്യാഖ്യാനയോഗ്യവുമാകാം, പ്രത്യേകിച്ച് പല വിതരണങ്ങളും വരച്ചപ്പോൾ. എന്നാൽ അടിസ്ഥാന വിതരണത്തിന് അതിരുകൾ ഉണ്ടെങ്കിൽ അല്ലെങ്കിൽ മൃദുവായില്ലെങ്കിൽ, ഇത് വക്രതകൾ സൃഷ്ടിക്കാം. ഹിസ്റ്റോഗ്രാമുപോലെ, പ്രതിനിധാനത്തിന്റെ ഗുണമേന്മയും നല്ല മൃദുവായ പാരാമീറ്ററുകളുടെ തിരഞ്ഞെടുപ്പിൽ ആശ്രയിച്ചിരിക്കുന്നു." [source](https://seaborn.pydata.org/generated/seaborn.kdeplot.html) മറ്റൊരു വാക്കിൽ, ഔട്ട്ലൈയർമാർ എപ്പോഴും നിങ്ങളുടെ ചാർട്ടുകൾക്ക് പ്രശ്നങ്ങൾ സൃഷ്ടിക്കും.
|
||||
|
||||
നിങ്ങൾ രണ്ടാമത്തെ ചാർട്ടിൽ സൃഷ്ടിച്ച ജാഗ്ഗഡ് MaxBodyMass ലൈനിനെ വീണ്ടും കാണാൻ ആഗ്രഹിക്കുന്നുവെങ്കിൽ, ഈ രീതിയിൽ അതിനെ വളരെ മൃദുവായി പുനഃസൃഷ്ടിക്കാം:
|
||||
|
||||
```python
|
||||
sns.kdeplot(filteredBirds['MaxBodyMass'])
|
||||
plt.show()
|
||||
```
|
||||

|
||||
|
||||
മൃദുവായെങ്കിലും അത്ര മൃദുവായില്ലാത്ത ഒരു ലൈനിനായി, `bw_adjust` പാരാമീറ്റർ എഡിറ്റ് ചെയ്യുക:
|
||||
|
||||
```python
|
||||
sns.kdeplot(filteredBirds['MaxBodyMass'], bw_adjust=.2)
|
||||
plt.show()
|
||||
```
|
||||

|
||||
|
||||
✅ ഈ തരത്തിലുള്ള പ്ലോട്ടിനുള്ള പാരാമീറ്ററുകൾക്കുറിച്ച് വായിച്ച് പരീക്ഷിക്കുക!
|
||||
|
||||
ഈ തരത്തിലുള്ള ചാർട്ടുകൾ മനോഹരമായ വ്യാഖ്യാനാത്മക ദൃശ്യവൽക്കരണങ്ങൾ നൽകുന്നു. കുറച്ച് കോഡ് വരികളിൽ, ഉദാഹരണത്തിന്, ഓരോ പക്ഷി ഓർഡറിനും പരമാവധി ശരീരഭാരം ഡെൻസിറ്റി കാണിക്കാം:
|
||||
|
||||
```python
|
||||
sns.kdeplot(
|
||||
data=filteredBirds, x="MaxBodyMass", hue="Order",
|
||||
fill=True, common_norm=False, palette="crest",
|
||||
alpha=.5, linewidth=0,
|
||||
)
|
||||
```
|
||||
|
||||

|
||||
|
||||
ഒരേ ചാർട്ടിൽ പല വേരിയബിളുകളുടെ ഡെൻസിറ്റികളും മാപ്പ് ചെയ്യാം. ഒരു പക്ഷിയുടെ MaxLength, MinLength സംരക്ഷണ നിലയുമായി താരതമ്യം ചെയ്യുക:
|
||||
|
||||
```python
|
||||
sns.kdeplot(data=filteredBirds, x="MinLength", y="MaxLength", hue="ConservationStatus")
|
||||
```
|
||||
|
||||

|
||||
|
||||
'Vulnerable' പക്ഷികളുടെ നീളങ്ങളുടെ ക്ലസ്റ്റർ അർത്ഥവത്താണോ അല്ലയോ എന്ന് അന്വേഷിക്കുന്നത് മൂല്യമുള്ളതായിരിക്കാം.
|
||||
|
||||
## 🚀 ചലഞ്ച്
|
||||
|
||||
ഹിസ്റ്റോഗ്രാമുകൾ അടിസ്ഥാന സ്കാറ്റർപ്ലോട്ടുകൾ, ബാർ ചാർട്ടുകൾ, ലൈന്ചാർട്ടുകൾ എന്നിവയെക്കാൾ കൂടുതൽ സങ്കീർണ്ണമായ ചാർട്ടുകളാണ്. ഇന്റർനെറ്റിൽ ഹിസ്റ്റോഗ്രാമുകളുടെ നല്ല ഉദാഹരണങ്ങൾ കണ്ടെത്താൻ തിരയുക. അവ എങ്ങനെ ഉപയോഗിക്കുന്നു, എന്ത് തെളിയിക്കുന്നു, ഏത് മേഖലകളിൽ കൂടുതലായി ഉപയോഗിക്കുന്നു?
|
||||
|
||||
## [പാഠം ശേഷമുള്ള ക്വിസ്](https://ff-quizzes.netlify.app/en/ds/quiz/19)
|
||||
|
||||
## അവലോകനം & സ്വയം പഠനം
|
||||
|
||||
ഈ പാഠത്തിൽ, Matplotlib ഉപയോഗിച്ച് പ്രവർത്തിക്കുകയും Seaborn ഉപയോഗിച്ച് കൂടുതൽ സങ്കീർണ്ണമായ ചാർട്ടുകൾ കാണിക്കുകയും ചെയ്തു. Seaborn-ലെ `kdeplot` എന്ന "ഒറ്റ അല്ലെങ്കിൽ കൂടുതൽ ഡൈമെൻഷനുകളിൽ തുടർച്ചയായ പ്രൊബബിലിറ്റി ഡെൻസിറ്റി വളവ്" എന്നതിനെക്കുറിച്ച് കുറച്ച് ഗവേഷണം ചെയ്യുക. [ഡോക്യുമെന്റേഷൻ](https://seaborn.pydata.org/generated/seaborn.kdeplot.html) വായിച്ച് അതിന്റെ പ്രവർത്തനം മനസ്സിലാക്കുക.
|
||||
|
||||
## അസൈൻമെന്റ്
|
||||
|
||||
[നിങ്ങളുടെ കഴിവുകൾ പ്രയോഗിക്കുക](assignment.md)
|
||||
|
||||
---
|
||||
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
|
||||
**അസൂയാ**:
|
||||
ഈ രേഖ AI വിവർത്തന സേവനം [Co-op Translator](https://github.com/Azure/co-op-translator) ഉപയോഗിച്ച് വിവർത്തനം ചെയ്തതാണ്. നാം കൃത്യതയ്ക്ക് ശ്രമിച്ചിട്ടുണ്ടെങ്കിലും, സ്വയം പ്രവർത്തിക്കുന്ന വിവർത്തനങ്ങളിൽ പിശകുകൾ അല്ലെങ്കിൽ തെറ്റുകൾ ഉണ്ടാകാമെന്ന് ദയവായി ശ്രദ്ധിക്കുക. അതിന്റെ മാതൃഭാഷയിലുള്ള യഥാർത്ഥ രേഖയാണ് പ്രാമാണികമായ ഉറവിടം എന്ന് പരിഗണിക്കേണ്ടതാണ്. നിർണായകമായ വിവരങ്ങൾക്ക്, പ്രൊഫഷണൽ മനുഷ്യ വിവർത്തനം ശുപാർശ ചെയ്യപ്പെടുന്നു. ഈ വിവർത്തനം ഉപയോഗിക്കുന്നതിൽ നിന്നുണ്ടാകുന്ന ഏതെങ്കിലും തെറ്റിദ്ധാരണകൾക്കോ തെറ്റായ വ്യാഖ്യാനങ്ങൾക്കോ ഞങ്ങൾ ഉത്തരവാദികളല്ല.
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER END -->
|
||||
@ -0,0 +1,27 @@
|
||||
<!--
|
||||
CO_OP_TRANSLATOR_METADATA:
|
||||
{
|
||||
"original_hash": "40eeb9b9f94009c537c7811f9f27f037",
|
||||
"translation_date": "2025-12-19T15:57:01+00:00",
|
||||
"source_file": "3-Data-Visualization/10-visualization-distributions/assignment.md",
|
||||
"language_code": "ml"
|
||||
}
|
||||
-->
|
||||
# നിങ്ങളുടെ കഴിവുകൾ പ്രയോഗിക്കുക
|
||||
|
||||
## നിർദ്ദേശങ്ങൾ
|
||||
|
||||
ഇതുവരെ, പക്ഷികളുടെ എണ്ണം மற்றும் ജനസംഖ്യാ സാന്ദ്രതയെക്കുറിച്ച് വിവരങ്ങൾ കണ്ടെത്താൻ മിന്നസോട്ട പക്ഷികൾ ഡാറ്റാസെറ്റുമായി നിങ്ങൾ പ്രവർത്തിച്ചിട്ടുണ്ട്. ഈ സാങ്കേതികവിദ്യകൾ പ്രയോഗിക്കാൻ വ്യത്യസ്തമായ ഒരു ഡാറ്റാസെറ്റ് പരീക്ഷിച്ച് പ്രാക്ടീസ് ചെയ്യുക, ഉദാഹരണത്തിന് [Kaggle](https://www.kaggle.com/) നിന്നുള്ളത്. ഈ ഡാറ്റാസെറ്റിനെക്കുറിച്ച് ഒരു കഥ പറയാൻ ഒരു നോട്ട്ബുക്ക് നിർമ്മിക്കുക, കൂടാതെ അതിനെക്കുറിച്ച് ചർച്ച ചെയ്യുമ്പോൾ ഹിസ്റ്റോഗ്രാമുകൾ ഉപയോഗിക്കുന്നത് ഉറപ്പാക്കുക.
|
||||
|
||||
## റൂബ്രിക്
|
||||
|
||||
Exemplary | Adequate | Needs Improvement
|
||||
--- | --- | -- |
|
||||
ഈ ഡാറ്റാസെറ്റിന്റെ ഉറവിടം ഉൾപ്പെടെ വിശദീകരണങ്ങളോടുകൂടിയ ഒരു നോട്ട്ബുക്ക് അവതരിപ്പിക്കുന്നു, കൂടാതെ ഡാറ്റയെക്കുറിച്ച് വിവരങ്ങൾ കണ്ടെത്താൻ കുറഞ്ഞത് 5 ഹിസ്റ്റോഗ്രാമുകൾ ഉപയോഗിക്കുന്നു. | അപൂർണ്ണമായ വിശദീകരണങ്ങളോ ബഗുകളോ ഉള്ള ഒരു നോട്ട്ബുക്ക് അവതരിപ്പിക്കുന്നു. | വിശദീകരണങ്ങളില്ലാതെ ബഗുകളുള്ള ഒരു നോട്ട്ബുക്ക് അവതരിപ്പിക്കുന്നു.
|
||||
|
||||
---
|
||||
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
|
||||
**അസൂയാ**:
|
||||
ഈ രേഖ AI വിവർത്തന സേവനം [Co-op Translator](https://github.com/Azure/co-op-translator) ഉപയോഗിച്ച് വിവർത്തനം ചെയ്തതാണ്. നാം കൃത്യതയ്ക്ക് ശ്രമിച്ചിട്ടുണ്ടെങ്കിലും, സ്വയം പ്രവർത്തിക്കുന്ന വിവർത്തനങ്ങളിൽ പിശകുകൾ അല്ലെങ്കിൽ തെറ്റുകൾ ഉണ്ടാകാമെന്ന് ദയവായി ശ്രദ്ധിക്കുക. അതിന്റെ മാതൃഭാഷയിലുള്ള യഥാർത്ഥ രേഖ പ്രാമാണികമായ ഉറവിടമായി കണക്കാക്കണം. നിർണായക വിവരങ്ങൾക്ക്, പ്രൊഫഷണൽ മനുഷ്യ വിവർത്തനം ശുപാർശ ചെയ്യപ്പെടുന്നു. ഈ വിവർത്തനത്തിന്റെ ഉപയോഗത്തിൽ നിന്നുണ്ടാകുന്ന ഏതെങ്കിലും തെറ്റിദ്ധാരണകൾക്കോ തെറ്റായ വ്യാഖ്യാനങ്ങൾക്കോ ഞങ്ങൾ ഉത്തരവാദികളല്ല.
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER END -->
|
||||
@ -0,0 +1,32 @@
|
||||
{
|
||||
"cells": [
|
||||
{
|
||||
"cell_type": "markdown",
|
||||
"source": [
|
||||
"# പക്ഷികളുടെ വിതരണം\n"
|
||||
],
|
||||
"metadata": {}
|
||||
},
|
||||
{
|
||||
"cell_type": "markdown",
|
||||
"metadata": {},
|
||||
"source": [
|
||||
"---\n\n<!-- CO-OP TRANSLATOR DISCLAIMER START -->\n**അസൂയാപത്രം**: \nഈ രേഖ AI വിവർത്തന സേവനം [Co-op Translator](https://github.com/Azure/co-op-translator) ഉപയോഗിച്ച് വിവർത്തനം ചെയ്തതാണ്. നാം കൃത്യതയ്ക്ക് ശ്രമിച്ചിട്ടുണ്ടെങ്കിലും, സ്വയം പ്രവർത്തിക്കുന്ന വിവർത്തനങ്ങളിൽ പിശകുകൾ അല്ലെങ്കിൽ തെറ്റുകൾ ഉണ്ടാകാമെന്ന് ദയവായി ശ്രദ്ധിക്കുക. അതിന്റെ മാതൃഭാഷയിലുള്ള യഥാർത്ഥ രേഖ അധികാരപരമായ ഉറവിടമായി കണക്കാക്കപ്പെടണം. നിർണായക വിവരങ്ങൾക്ക്, പ്രൊഫഷണൽ മനുഷ്യ വിവർത്തനം ശുപാർശ ചെയ്യപ്പെടുന്നു. ഈ വിവർത്തനത്തിന്റെ ഉപയോഗത്തിൽ നിന്നുണ്ടാകുന്ന ഏതെങ്കിലും തെറ്റിദ്ധാരണകൾക്കോ തെറ്റായ വ്യാഖ്യാനങ്ങൾക്കോ ഞങ്ങൾ ഉത്തരവാദികളല്ല.\n<!-- CO-OP TRANSLATOR DISCLAIMER END -->\n"
|
||||
]
|
||||
}
|
||||
],
|
||||
"metadata": {
|
||||
"orig_nbformat": 4,
|
||||
"language_info": {
|
||||
"name": "python"
|
||||
},
|
||||
"coopTranslator": {
|
||||
"original_hash": "e5272cbcbffd1ddcc09e44d3d8e7e8cd",
|
||||
"translation_date": "2025-12-19T17:35:17+00:00",
|
||||
"source_file": "3-Data-Visualization/10-visualization-distributions/notebook.ipynb",
|
||||
"language_code": "ml"
|
||||
}
|
||||
},
|
||||
"nbformat": 4,
|
||||
"nbformat_minor": 2
|
||||
}
|
||||
File diff suppressed because one or more lines are too long
@ -0,0 +1,206 @@
|
||||
<!--
|
||||
CO_OP_TRANSLATOR_METADATA:
|
||||
{
|
||||
"original_hash": "42119bcc97bee88254e381156d770f3c",
|
||||
"translation_date": "2025-12-19T16:02:29+00:00",
|
||||
"source_file": "3-Data-Visualization/11-visualization-proportions/README.md",
|
||||
"language_code": "ml"
|
||||
}
|
||||
-->
|
||||
# അനുപാതങ്ങൾ ദൃശ്യവൽക്കരിക്കൽ
|
||||
|
||||
| ](../../sketchnotes/11-Visualizing-Proportions.png)|
|
||||
|:---:|
|
||||
|അനുപാതങ്ങൾ ദൃശ്യവൽക്കരിക്കൽ - _Sketchnote by [@nitya](https://twitter.com/nitya)_ |
|
||||
|
||||
ഈ പാഠത്തിൽ, നിങ്ങൾ മഷ്റൂമുകളെക്കുറിച്ചുള്ള ഒരു നൈസർഗിക-കേന്ദ്രിത ഡാറ്റാസെറ്റ് ഉപയോഗിച്ച് അനുപാതങ്ങൾ ദൃശ്യവൽക്കരിക്കാൻ പഠിക്കും, ഉദാഹരണത്തിന്, ഒരു ഡാറ്റാസെറ്റിൽ എത്ര തരം ഫംഗി ഉണ്ട് എന്നത്. Audubon-ൽ നിന്നുള്ള 23 സ്പീഷീസ് ഉള്ള ഗില്ലഡ് മഷ്റൂമുകളുടെ വിവരങ്ങൾ ഉൾക്കൊള്ളുന്ന ഒരു ഡാറ്റാസെറ്റ് ഉപയോഗിച്ച് ഈ മനോഹരമായ ഫംഗികളെ പരിശോധിക്കാം. നിങ്ങൾ പരീക്ഷിക്കാനിരിക്കുന്ന രുചികരമായ ദൃശ്യവൽക്കരണങ്ങൾ:
|
||||
|
||||
- പൈ ചാർട്ടുകൾ 🥧
|
||||
- ഡോണട്ട് ചാർട്ടുകൾ 🍩
|
||||
- വാഫിൾ ചാർട്ടുകൾ 🧇
|
||||
|
||||
> 💡 Microsoft Research-ന്റെ [Charticulator](https://charticulator.com) എന്ന വളരെ രസകരമായ പ്രോജക്ട് ഡാറ്റാ ദൃശ്യവൽക്കരണങ്ങൾക്ക് സൗജന്യമായ ഡ്രാഗ് ആൻഡ് ഡ്രോപ്പ് ഇന്റർഫേസ് നൽകുന്നു. അവരുടെ ട്യൂട്ടോറിയലുകളിൽ ഒന്നിൽ അവർ ഈ മഷ്റൂം ഡാറ്റാസെറ്റ് ഉപയോഗിക്കുന്നു! അതിനാൽ നിങ്ങൾ ഡാറ്റ പരിശോധിക്കുകയും ലൈബ്രറി പഠിക്കുകയും ചെയ്യാം: [Charticulator tutorial](https://charticulator.com/tutorials/tutorial4.html).
|
||||
|
||||
## [പ്രീ-ലെക്ചർ ക്വിസ്](https://ff-quizzes.netlify.app/en/ds/quiz/20)
|
||||
|
||||
## നിങ്ങളുടെ മഷ്റൂമുകളെ പരിചയപ്പെടുക 🍄
|
||||
|
||||
മഷ്റൂമുകൾ വളരെ രസകരമാണ്. അവ പഠിക്കാൻ ഒരു ഡാറ്റാസെറ്റ് ഇറക്കുമതി ചെയ്യാം:
|
||||
|
||||
```python
|
||||
import pandas as pd
|
||||
import matplotlib.pyplot as plt
|
||||
mushrooms = pd.read_csv('../../data/mushrooms.csv')
|
||||
mushrooms.head()
|
||||
```
|
||||
ഒരു വിശകലനത്തിനായി ചില മികച്ച ഡാറ്റയോടുകൂടിയ ഒരു പട്ടിക പ്രിന്റ് ചെയ്യുന്നു:
|
||||
|
||||
|
||||
| class | cap-shape | cap-surface | cap-color | bruises | odor | gill-attachment | gill-spacing | gill-size | gill-color | stalk-shape | stalk-root | stalk-surface-above-ring | stalk-surface-below-ring | stalk-color-above-ring | stalk-color-below-ring | veil-type | veil-color | ring-number | ring-type | spore-print-color | population | habitat |
|
||||
| --------- | --------- | ----------- | --------- | ------- | ------- | --------------- | ------------ | --------- | ---------- | ----------- | ---------- | ------------------------ | ------------------------ | ---------------------- | ---------------------- | --------- | ---------- | ----------- | --------- | ----------------- | ---------- | ------- |
|
||||
| Poisonous | Convex | Smooth | Brown | Bruises | Pungent | Free | Close | Narrow | Black | Enlarging | Equal | Smooth | Smooth | White | White | Partial | White | One | Pendant | Black | Scattered | Urban |
|
||||
| Edible | Convex | Smooth | Yellow | Bruises | Almond | Free | Close | Broad | Black | Enlarging | Club | Smooth | Smooth | White | White | Partial | White | One | Pendant | Brown | Numerous | Grasses |
|
||||
| Edible | Bell | Smooth | White | Bruises | Anise | Free | Close | Broad | Brown | Enlarging | Club | Smooth | Smooth | White | White | Partial | White | One | Pendant | Brown | Numerous | Meadows |
|
||||
| Poisonous | Convex | Scaly | White | Bruises | Pungent | Free | Close | Narrow | Brown | Enlarging | Equal | Smooth | Smooth | White | White | Partial | White | One | Pendant | Black | Scattered | Urban |
|
||||
|
||||
തുടക്കത്തിൽ, എല്ലാ ഡാറ്റയും ടെക്സ്റ്റ് ആണെന്ന് നിങ്ങൾ ശ്രദ്ധിക്കും. ഈ ഡാറ്റ ഒരു ചാർട്ടിൽ ഉപയോഗിക്കാൻ കഴിയുന്നതായി മാറ്റേണ്ടതുണ്ട്. യഥാർത്ഥത്തിൽ, ഡാറ്റയുടെ ഭൂരിഭാഗവും ഒരു ഒബ്ജക്റ്റായി പ്രതിനിധീകരിച്ചിരിക്കുന്നു:
|
||||
|
||||
```python
|
||||
print(mushrooms.select_dtypes(["object"]).columns)
|
||||
```
|
||||
|
||||
ഫലമായി:
|
||||
|
||||
```output
|
||||
Index(['class', 'cap-shape', 'cap-surface', 'cap-color', 'bruises', 'odor',
|
||||
'gill-attachment', 'gill-spacing', 'gill-size', 'gill-color',
|
||||
'stalk-shape', 'stalk-root', 'stalk-surface-above-ring',
|
||||
'stalk-surface-below-ring', 'stalk-color-above-ring',
|
||||
'stalk-color-below-ring', 'veil-type', 'veil-color', 'ring-number',
|
||||
'ring-type', 'spore-print-color', 'population', 'habitat'],
|
||||
dtype='object')
|
||||
```
|
||||
ഈ ഡാറ്റ എടുത്ത് 'class' കോളം ഒരു വിഭാഗമായി മാറ്റുക:
|
||||
|
||||
```python
|
||||
cols = mushrooms.select_dtypes(["object"]).columns
|
||||
mushrooms[cols] = mushrooms[cols].astype('category')
|
||||
```
|
||||
|
||||
```python
|
||||
edibleclass=mushrooms.groupby(['class']).count()
|
||||
edibleclass
|
||||
```
|
||||
|
||||
ഇപ്പോൾ, മഷ്റൂം ഡാറ്റ പ്രിന്റ് ചെയ്താൽ, വിഷമുള്ള/ഭക്ഷ്യയോഗ്യമായ ക്ലാസുകൾ അനുസരിച്ച് വിഭാഗങ്ങളായി ഗ്രൂപ്പുചെയ്തിട്ടുണ്ടെന്ന് കാണാം:
|
||||
|
||||
|
||||
| | cap-shape | cap-surface | cap-color | bruises | odor | gill-attachment | gill-spacing | gill-size | gill-color | stalk-shape | ... | stalk-surface-below-ring | stalk-color-above-ring | stalk-color-below-ring | veil-type | veil-color | ring-number | ring-type | spore-print-color | population | habitat |
|
||||
| --------- | --------- | ----------- | --------- | ------- | ---- | --------------- | ------------ | --------- | ---------- | ----------- | --- | ------------------------ | ---------------------- | ---------------------- | --------- | ---------- | ----------- | --------- | ----------------- | ---------- | ------- |
|
||||
| class | | | | | | | | | | | | | | | | | | | | | |
|
||||
| Edible | 4208 | 4208 | 4208 | 4208 | 4208 | 4208 | 4208 | 4208 | 4208 | 4208 | ... | 4208 | 4208 | 4208 | 4208 | 4208 | 4208 | 4208 | 4208 | 4208 | 4208 |
|
||||
| Poisonous | 3916 | 3916 | 3916 | 3916 | 3916 | 3916 | 3916 | 3916 | 3916 | 3916 | ... | 3916 | 3916 | 3916 | 3916 | 3916 | 3916 | 3916 | 3916 | 3916 | 3916 |
|
||||
|
||||
ഈ പട്ടികയിൽ നൽകിയ ക്രമം അനുസരിച്ച് ക്ലാസ് വിഭാഗ ലേബലുകൾ സൃഷ്ടിച്ചാൽ, ഒരു പൈ ചാർട്ട് നിർമ്മിക്കാം:
|
||||
|
||||
## പൈ!
|
||||
|
||||
```python
|
||||
labels=['Edible','Poisonous']
|
||||
plt.pie(edibleclass['population'],labels=labels,autopct='%.1f %%')
|
||||
plt.title('Edible?')
|
||||
plt.show()
|
||||
```
|
||||
ഇവിടെ, ഈ ഡാറ്റയുടെ അനുപാതങ്ങൾ ഈ രണ്ട് മഷ്റൂം ക്ലാസുകൾ അനുസരിച്ച് കാണിക്കുന്ന ഒരു പൈ ചാർട്ട്. ലേബലുകളുടെ ക്രമം ശരിയാണെന്ന് ഉറപ്പാക്കുന്നത് വളരെ പ്രധാനമാണ്, പ്രത്യേകിച്ച് ഇവിടെ, അതിനാൽ ലേബൽ അറേ എങ്ങനെ നിർമ്മിക്കപ്പെടുന്നു എന്ന് പരിശോധിക്കുക!
|
||||
|
||||

|
||||
|
||||
## ഡോണട്ടുകൾ!
|
||||
|
||||
കുറച്ച് കൂടുതൽ ദൃശ്യപരമായി ആകർഷകമായ പൈ ചാർട്ട് ഒരു ഡോണട്ട് ചാർട്ടാണ്, ഇത് മധ്യത്തിൽ ഒരു തുരുവുള്ള പൈ ചാർട്ടാണ്. ഈ രീതിയിൽ നമ്മുടെ ഡാറ്റ പരിശോധിക്കാം.
|
||||
|
||||
മഷ്റൂമുകൾ വളരുന്ന വിവിധ ഹാബിറ്റാറ്റുകൾ നോക്കാം:
|
||||
|
||||
```python
|
||||
habitat=mushrooms.groupby(['habitat']).count()
|
||||
habitat
|
||||
```
|
||||
ഇവിടെ, നിങ്ങൾ ഡാറ്റ ഹാബിറ്റാറ്റ് അനുസരിച്ച് ഗ്രൂപ്പുചെയ്യുന്നു. 7 ഹാബിറ്റാറ്റുകൾ പട്ടികപ്പെടുത്തിയിട്ടുണ്ട്, അതിനാൽ അവ ഡോണട്ട് ചാർട്ടിന്റെ ലേബലുകളായി ഉപയോഗിക്കുക:
|
||||
|
||||
```python
|
||||
labels=['Grasses','Leaves','Meadows','Paths','Urban','Waste','Wood']
|
||||
|
||||
plt.pie(habitat['class'], labels=labels,
|
||||
autopct='%1.1f%%', pctdistance=0.85)
|
||||
|
||||
center_circle = plt.Circle((0, 0), 0.40, fc='white')
|
||||
fig = plt.gcf()
|
||||
|
||||
fig.gca().add_artist(center_circle)
|
||||
|
||||
plt.title('Mushroom Habitats')
|
||||
|
||||
plt.show()
|
||||
```
|
||||
|
||||

|
||||
|
||||
ഈ കോഡ് ഒരു ചാർട്ട് വരയ്ക്കുകയും മധ്യത്തിൽ ഒരു വൃത്തം വരയ്ക്കുകയും ചെയ്യുന്നു, പിന്നീട് ആ വൃത്തം ചാർട്ടിൽ ചേർക്കുന്നു. മധ്യ വൃത്തത്തിന്റെ വീതി `0.40` എന്ന മൂല്യം മാറ്റി എഡിറ്റ് ചെയ്യാം.
|
||||
|
||||
ഡോണട്ട് ചാർട്ടുകൾ ലേബലുകൾ മാറ്റാൻ പലവിധം ക്രമീകരിക്കാം. പ്രത്യേകിച്ച് ലേബലുകൾ വായനാസൗകര്യത്തിന് ഹൈലൈറ്റ് ചെയ്യാം. കൂടുതൽ അറിയാൻ [docs](https://matplotlib.org/stable/gallery/pie_and_polar_charts/pie_and_donut_labels.html?highlight=donut) കാണുക.
|
||||
|
||||
ഇപ്പോൾ നിങ്ങൾ ഡാറ്റ ഗ്രൂപ്പുചെയ്യാനും പൈ അല്ലെങ്കിൽ ഡോണട്ട് ആയി പ്രദർശിപ്പിക്കാനും അറിയുന്നു, മറ്റ് ചാർട്ട് തരം പരീക്ഷിക്കാം. വാഫിൾ ചാർട്ട് പരീക്ഷിക്കുക, ഇത് അളവുകൾ പരിശോധിക്കുന്ന മറ്റൊരു രീതി മാത്രമാണ്.
|
||||
## വാഫിൾസ്!
|
||||
|
||||
'വാഫിൾ' തരം ചാർട്ട് അളവുകൾ 2D ചതുരങ്ങളായി ദൃശ്യവൽക്കരിക്കുന്ന മറ്റൊരു രീതി ആണ്. ഈ ഡാറ്റാസെറ്റിലെ മഷ്റൂം ക്യാപ് നിറങ്ങളുടെ വ്യത്യസ്ത അളവുകൾ ദൃശ്യവൽക്കരിക്കാൻ ശ്രമിക്കുക. ഇതിന്, [PyWaffle](https://pypi.org/project/pywaffle/) എന്ന സഹായക ലൈബ്രറി ഇൻസ്റ്റാൾ ചെയ്ത് Matplotlib ഉപയോഗിക്കണം:
|
||||
|
||||
```python
|
||||
pip install pywaffle
|
||||
```
|
||||
|
||||
ഡാറ്റയുടെ ഒരു സെഗ്മെന്റ് തിരഞ്ഞെടുക്കുക ഗ്രൂപ്പുചെയ്യാൻ:
|
||||
|
||||
```python
|
||||
capcolor=mushrooms.groupby(['cap-color']).count()
|
||||
capcolor
|
||||
```
|
||||
|
||||
ലേബലുകൾ സൃഷ്ടിച്ച് ഡാറ്റ ഗ്രൂപ്പുചെയ്യുന്നതിലൂടെ വാഫിൾ ചാർട്ട് സൃഷ്ടിക്കുക:
|
||||
|
||||
```python
|
||||
import pandas as pd
|
||||
import matplotlib.pyplot as plt
|
||||
from pywaffle import Waffle
|
||||
|
||||
data ={'color': ['brown', 'buff', 'cinnamon', 'green', 'pink', 'purple', 'red', 'white', 'yellow'],
|
||||
'amount': capcolor['class']
|
||||
}
|
||||
|
||||
df = pd.DataFrame(data)
|
||||
|
||||
fig = plt.figure(
|
||||
FigureClass = Waffle,
|
||||
rows = 100,
|
||||
values = df.amount,
|
||||
labels = list(df.color),
|
||||
figsize = (30,30),
|
||||
colors=["brown", "tan", "maroon", "green", "pink", "purple", "red", "whitesmoke", "yellow"],
|
||||
)
|
||||
```
|
||||
|
||||
വാഫിൾ ചാർട്ട് ഉപയോഗിച്ച്, ഈ മഷ്റൂം ഡാറ്റാസെറ്റിലെ ക്യാപ് നിറങ്ങളുടെ അനുപാതങ്ങൾ വ്യക്തമായി കാണാം. രസകരമായി, നിരവധി പച്ച ക്യാപ് മഷ്റൂമുകൾ ഉണ്ട്!
|
||||
|
||||

|
||||
|
||||
✅ Pywaffle ചാർട്ടുകളിൽ [Font Awesome](https://fontawesome.com/) ൽ ലഭ്യമായ ഏതെങ്കിലും ഐക്കൺ ഉപയോഗിച്ച് ഐക്കണുകൾ ഉൾപ്പെടുത്താൻ പിന്തുണ നൽകുന്നു. ചതുരങ്ങൾക്കുപകരം ഐക്കണുകൾ ഉപയോഗിച്ച് കൂടുതൽ രസകരമായ വാഫിൾ ചാർട്ട് സൃഷ്ടിക്കാൻ പരീക്ഷണങ്ങൾ നടത്തുക.
|
||||
|
||||
ഈ പാഠത്തിൽ, അനുപാതങ്ങൾ ദൃശ്യവൽക്കരിക്കുന്ന മൂന്ന് മാർഗങ്ങൾ നിങ്ങൾ പഠിച്ചു. ആദ്യം, ഡാറ്റയെ വിഭാഗങ്ങളായി ഗ്രൂപ്പുചെയ്യണം, പിന്നെ ഡാറ്റ പ്രദർശിപ്പിക്കാൻ ഏറ്റവും നല്ല മാർഗം - പൈ, ഡോണട്ട്, അല്ലെങ്കിൽ വാഫിൾ - തിരഞ്ഞെടുക്കണം. എല്ലാം രുചികരവും ഉപയോക്താവിന് ഡാറ്റാസെറ്റിന്റെ ഉടൻ ഒരു ദൃശ്യസംഗ്രഹം നൽകുന്നതുമാണ്.
|
||||
|
||||
## 🚀 ചലഞ്ച്
|
||||
|
||||
ഈ രുചികരമായ ചാർട്ടുകൾ [Charticulator](https://charticulator.com) ൽ പുനഃസൃഷ്ടിക്കാൻ ശ്രമിക്കുക.
|
||||
## [പോസ്റ്റ്-ലെക്ചർ ക്വിസ്](https://ff-quizzes.netlify.app/en/ds/quiz/21)
|
||||
|
||||
## അവലോകനം & സ്വയം പഠനം
|
||||
|
||||
എപ്പോൾ പൈ, ഡോണട്ട്, അല്ലെങ്കിൽ വാഫിൾ ചാർട്ട് ഉപയോഗിക്കണമെന്ന് വ്യക്തമല്ല. ഈ വിഷയത്തിൽ വായിക്കാനുള്ള ചില ലേഖനങ്ങൾ:
|
||||
|
||||
https://www.beautiful.ai/blog/battle-of-the-charts-pie-chart-vs-donut-chart
|
||||
|
||||
https://medium.com/@hypsypops/pie-chart-vs-donut-chart-showdown-in-the-ring-5d24fd86a9ce
|
||||
|
||||
https://www.mit.edu/~mbarker/formula1/f1help/11-ch-c6.htm
|
||||
|
||||
https://medium.datadriveninvestor.com/data-visualization-done-the-right-way-with-tableau-waffle-chart-fdf2a19be402
|
||||
|
||||
ഈ ബുദ്ധിമുട്ടുള്ള തീരുമാനത്തെക്കുറിച്ച് കൂടുതൽ വിവരങ്ങൾ കണ്ടെത്താൻ ഗവേഷണം നടത്തുക.
|
||||
## അസൈൻമെന്റ്
|
||||
|
||||
[Excel-ൽ പരീക്ഷിക്കുക](assignment.md)
|
||||
|
||||
---
|
||||
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
|
||||
**അസൂയാ**:
|
||||
ഈ രേഖ AI വിവർത്തന സേവനം [Co-op Translator](https://github.com/Azure/co-op-translator) ഉപയോഗിച്ച് വിവർത്തനം ചെയ്തതാണ്. നാം കൃത്യതയ്ക്ക് ശ്രമിച്ചിട്ടുണ്ടെങ്കിലും, സ്വയം പ്രവർത്തിക്കുന്ന വിവർത്തനങ്ങളിൽ പിശകുകൾ അല്ലെങ്കിൽ തെറ്റുകൾ ഉണ്ടാകാമെന്ന് ദയവായി ശ്രദ്ധിക്കുക. അതിന്റെ മാതൃഭാഷയിലുള്ള യഥാർത്ഥ രേഖ അധികാരപരമായ ഉറവിടമായി കണക്കാക്കപ്പെടണം. നിർണായകമായ വിവരങ്ങൾക്ക്, പ്രൊഫഷണൽ മനുഷ്യ വിവർത്തനം ശുപാർശ ചെയ്യപ്പെടുന്നു. ഈ വിവർത്തനം ഉപയോഗിക്കുന്നതിൽ നിന്നുണ്ടാകുന്ന ഏതെങ്കിലും തെറ്റിദ്ധാരണകൾക്കോ തെറ്റായ വ്യാഖ്യാനങ്ങൾക്കോ ഞങ്ങൾ ഉത്തരവാദികളല്ല.
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER END -->
|
||||
@ -0,0 +1,27 @@
|
||||
<!--
|
||||
CO_OP_TRANSLATOR_METADATA:
|
||||
{
|
||||
"original_hash": "1e00fe6a244c2f8f9a794c862661dd4f",
|
||||
"translation_date": "2025-12-19T16:05:10+00:00",
|
||||
"source_file": "3-Data-Visualization/11-visualization-proportions/assignment.md",
|
||||
"language_code": "ml"
|
||||
}
|
||||
-->
|
||||
# Excel-ൽ പരീക്ഷിക്കുക
|
||||
|
||||
## നിർദ്ദേശങ്ങൾ
|
||||
|
||||
Excel-ൽ ഡോണട്ട്, പൈ, വാഫിൾ ചാർട്ടുകൾ സൃഷ്ടിക്കാമെന്ന് നിങ്ങൾ അറിയാമോ? നിങ്ങളുടെ ഇഷ്ടാനുസൃതമായ ഒരു ഡാറ്റാസെറ്റ് ഉപയോഗിച്ച്, ഈ മൂന്ന് ചാർട്ടുകളും Excel സ്പ്രെഡ്ഷീറ്റിൽ തന്നെ സൃഷ്ടിക്കുക.
|
||||
|
||||
## റൂബ്രിക്
|
||||
|
||||
| ഉദാഹരണപരമായത് | മതിയായത് | മെച്ചപ്പെടുത്തേണ്ടത് |
|
||||
| ------------------------------------------------------- | ------------------------------------------------- | ------------------------------------------------------ |
|
||||
| എല്ലാ മൂന്ന് ചാർട്ടുകളോടും ഒരു Excel സ്പ്രെഡ്ഷീറ്റ് അവതരിപ്പിച്ചിരിക്കുന്നു | രണ്ട് ചാർട്ടുകളോടും ഒരു Excel സ്പ്രെഡ്ഷീറ്റ് അവതരിപ്പിച്ചിരിക്കുന്നു | ഒരു ചാർട്ടിനോടെയായുള്ള Excel സ്പ്രെഡ്ഷീറ്റ് മാത്രമാണ് അവതരിപ്പിച്ചിരിക്കുന്നത് |
|
||||
|
||||
---
|
||||
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
|
||||
**അസൂയാ**:
|
||||
ഈ രേഖ AI വിവർത്തന സേവനം [Co-op Translator](https://github.com/Azure/co-op-translator) ഉപയോഗിച്ച് വിവർത്തനം ചെയ്തതാണ്. നാം കൃത്യതയ്ക്ക് ശ്രമിച്ചെങ്കിലും, സ്വയം പ്രവർത്തിക്കുന്ന വിവർത്തനങ്ങളിൽ പിശകുകൾ അല്ലെങ്കിൽ തെറ്റുകൾ ഉണ്ടാകാമെന്ന് ദയവായി ശ്രദ്ധിക്കുക. അതിന്റെ മാതൃഭാഷയിലുള്ള യഥാർത്ഥ രേഖയാണ് പ്രാമാണികമായ ഉറവിടം എന്ന് പരിഗണിക്കേണ്ടതാണ്. നിർണായക വിവരങ്ങൾക്ക്, പ്രൊഫഷണൽ മനുഷ്യ വിവർത്തനം ശുപാർശ ചെയ്യപ്പെടുന്നു. ഈ വിവർത്തനം ഉപയോഗിക്കുന്നതിൽ നിന്നുണ്ടാകുന്ന ഏതെങ്കിലും തെറ്റിദ്ധാരണകൾക്കോ തെറ്റായ വ്യാഖ്യാനങ്ങൾക്കോ ഞങ്ങൾ ഉത്തരവാദികളല്ല.
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER END -->
|
||||
@ -0,0 +1,32 @@
|
||||
{
|
||||
"cells": [
|
||||
{
|
||||
"cell_type": "markdown",
|
||||
"source": [
|
||||
"# 🍄 കൂൺ അനുപാതങ്ങൾ\n"
|
||||
],
|
||||
"metadata": {}
|
||||
},
|
||||
{
|
||||
"cell_type": "markdown",
|
||||
"metadata": {},
|
||||
"source": [
|
||||
"---\n\n<!-- CO-OP TRANSLATOR DISCLAIMER START -->\n**അസൂയാ**: \nഈ രേഖ AI വിവർത്തന സേവനം [Co-op Translator](https://github.com/Azure/co-op-translator) ഉപയോഗിച്ച് വിവർത്തനം ചെയ്തതാണ്. നാം കൃത്യതയ്ക്ക് ശ്രമിച്ചിട്ടുണ്ടെങ്കിലും, സ്വയം പ്രവർത്തിക്കുന്ന വിവർത്തനങ്ങളിൽ പിശകുകൾ അല്ലെങ്കിൽ തെറ്റുകൾ ഉണ്ടാകാമെന്ന് ദയവായി ശ്രദ്ധിക്കുക. അതിന്റെ മാതൃഭാഷയിലുള്ള യഥാർത്ഥ രേഖയാണ് പ്രാമാണികമായ ഉറവിടം എന്ന് പരിഗണിക്കേണ്ടതാണ്. നിർണായകമായ വിവരങ്ങൾക്ക്, പ്രൊഫഷണൽ മനുഷ്യ വിവർത്തനം ശുപാർശ ചെയ്യപ്പെടുന്നു. ഈ വിവർത്തനം ഉപയോഗിക്കുന്നതിൽ നിന്നുണ്ടാകുന്ന ഏതെങ്കിലും തെറ്റിദ്ധാരണകൾക്കോ തെറ്റായ വ്യാഖ്യാനങ്ങൾക്കോ ഞങ്ങൾ ഉത്തരവാദികളല്ല.\n<!-- CO-OP TRANSLATOR DISCLAIMER END -->\n"
|
||||
]
|
||||
}
|
||||
],
|
||||
"metadata": {
|
||||
"orig_nbformat": 4,
|
||||
"language_info": {
|
||||
"name": "python"
|
||||
},
|
||||
"coopTranslator": {
|
||||
"original_hash": "397e9bbc0743761dbf72e5f16b7043e6",
|
||||
"translation_date": "2025-12-19T17:35:51+00:00",
|
||||
"source_file": "3-Data-Visualization/11-visualization-proportions/notebook.ipynb",
|
||||
"language_code": "ml"
|
||||
}
|
||||
},
|
||||
"nbformat": 4,
|
||||
"nbformat_minor": 2
|
||||
}
|
||||
File diff suppressed because one or more lines are too long
@ -0,0 +1,190 @@
|
||||
<!--
|
||||
CO_OP_TRANSLATOR_METADATA:
|
||||
{
|
||||
"original_hash": "0764fd4077f3f04a1d968ec371227744",
|
||||
"translation_date": "2025-12-19T15:58:10+00:00",
|
||||
"source_file": "3-Data-Visualization/12-visualization-relationships/README.md",
|
||||
"language_code": "ml"
|
||||
}
|
||||
-->
|
||||
# ബന്ധങ്ങൾ ദൃശ്യവൽക്കരിക്കൽ: തേൻ സംബന്ധിച്ച എല്ലാം 🍯
|
||||
|
||||
| ](../../sketchnotes/12-Visualizing-Relationships.png)|
|
||||
|:---:|
|
||||
|ബന്ധങ്ങൾ ദൃശ്യവൽക്കരിക്കൽ - _Sketchnote by [@nitya](https://twitter.com/nitya)_ |
|
||||
|
||||
നമ്മുടെ ഗവേഷണത്തിന്റെ പ്രകൃതി കേന്ദ്രീകൃതമായ ഭാഗം തുടർന്നുകൊണ്ട്, [United States Department of Agriculture](https://www.nass.usda.gov/About_NASS/index.php) നിന്നുള്ള ഡാറ്റാസെറ്റിൽ നിന്നുള്ള വിവിധ തരത്തിലുള്ള തേൻ തമ്മിലുള്ള ബന്ധങ്ങൾ കാണിക്കുന്ന രസകരമായ ദൃശ്യവൽക്കരണങ്ങൾ കണ്ടെത്താം.
|
||||
|
||||
ഏകദേശം 600 ഇനങ്ങളുള്ള ഈ ഡാറ്റാസെറ്റ് അമേരിക്കയിലെ പല സംസ്ഥാനങ്ങളിലെ തേൻ ഉത്പാദനം പ്രദർശിപ്പിക്കുന്നു. ഉദാഹരണത്തിന്, ഓരോ സംസ്ഥാനത്തെയും ഓരോ വർഷത്തെയും കോളനികളുടെ എണ്ണം, ഓരോ കോളനിക്കുള്ള ഉത്പാദനം, മൊത്തം ഉത്പാദനം, സ്റ്റോക്കുകൾ, പൗണ്ട് പ്രതി വില, ഉത്പാദന മൂല്യം എന്നിവ കാണാം.
|
||||
|
||||
ഒരു സംസ്ഥാനത്തിന്റെ ഓരോ വർഷവും ഉത്പാദനവും, ഉദാഹരണത്തിന്, ആ സംസ്ഥാനത്തെ തേന്റെ വില തമ്മിലുള്ള ബന്ധം ദൃശ്യവൽക്കരിക്കുന്നത് രസകരമായിരിക്കും. അല്ലെങ്കിൽ, സംസ്ഥാനങ്ങളുടെ കോളനി പ്രതി തേൻ ഉത്പാദനത്തിന്റെ ബന്ധം ദൃശ്യവൽക്കരിക്കാം. 2006-ൽ ആദ്യമായി കണ്ട 'CCD' അല്ലെങ്കിൽ 'Colony Collapse Disorder' (http://npic.orst.edu/envir/ccd.html) ഉൾപ്പെടുന്ന ഈ വർഷങ്ങൾ ഉൾക്കൊള്ളുന്ന ഡാറ്റാസെറ്റ് പഠിക്കാൻ വളരെ പ്രാധാന്യമുള്ളതാണ്. 🐝
|
||||
|
||||
## [പ്രീ-ലെക്ചർ ക്വിസ്](https://ff-quizzes.netlify.app/en/ds/quiz/22)
|
||||
|
||||
ഈ പാഠത്തിൽ, നിങ്ങൾ മുമ്പ് ഉപയോഗിച്ചിട്ടുള്ള Seaborn ഉപയോഗിച്ച് വ്യത്യസ്ത വേരിയബിളുകൾ തമ്മിലുള്ള ബന്ധങ്ങൾ ദൃശ്യവൽക്കരിക്കാൻ കഴിയും. പ്രത്യേകിച്ച് Seaborn-ന്റെ `relplot` ഫംഗ്ഷൻ ഉപയോഗിച്ച് '[സാംഖ്യിക ബന്ധങ്ങൾ](https://seaborn.pydata.org/tutorial/relational.html?highlight=relationships)' എളുപ്പത്തിൽ കാണിക്കാൻ കഴിയും, ഇത് ഡാറ്റാ സയന്റിസ്റ്റിന് വേരിയബിളുകൾ തമ്മിലുള്ള ബന്ധം മനസ്സിലാക്കാൻ സഹായിക്കുന്നു.
|
||||
|
||||
## സ്കാറ്റർപ്ലോട്ടുകൾ
|
||||
|
||||
തേന്റെ വില വർഷം തോറും ഓരോ സംസ്ഥാനത്തും എങ്ങനെ മാറിയെന്ന് കാണിക്കാൻ സ്കാറ്റർപ്ലോട്ട് ഉപയോഗിക്കുക. Seaborn, `relplot` ഉപയോഗിച്ച്, സംസ്ഥാന ഡാറ്റ ഗ്രൂപ്പുചെയ്ത് വർഗ്ഗീയവും സംഖ്യാത്മകവുമായ ഡാറ്റ പോയിന്റുകൾ പ്രദർശിപ്പിക്കുന്നു.
|
||||
|
||||
ഡാറ്റയും Seaborn-ഉം ഇറക്കുമതി ചെയ്യുന്നതിൽ നിന്ന് തുടങ്ങാം:
|
||||
|
||||
```python
|
||||
import pandas as pd
|
||||
import matplotlib.pyplot as plt
|
||||
import seaborn as sns
|
||||
honey = pd.read_csv('../../data/honey.csv')
|
||||
honey.head()
|
||||
```
|
||||
തേൻ ഡാറ്റയിൽ വർഷവും പൗണ്ട് പ്രതി വിലയും ഉൾപ്പെടെ പല രസകരമായ കോളങ്ങളുണ്ട്. അമേരിക്കൻ സംസ്ഥാനങ്ങൾ പ്രകാരം ഗ്രൂപ്പുചെയ്ത് ഈ ഡാറ്റ പരിശോധിക്കാം:
|
||||
|
||||
| state | numcol | yieldpercol | totalprod | stocks | priceperlb | prodvalue | year |
|
||||
| ----- | ------ | ----------- | --------- | -------- | ---------- | --------- | ---- |
|
||||
| AL | 16000 | 71 | 1136000 | 159000 | 0.72 | 818000 | 1998 |
|
||||
| AZ | 55000 | 60 | 3300000 | 1485000 | 0.64 | 2112000 | 1998 |
|
||||
| AR | 53000 | 65 | 3445000 | 1688000 | 0.59 | 2033000 | 1998 |
|
||||
| CA | 450000 | 83 | 37350000 | 12326000 | 0.62 | 23157000 | 1998 |
|
||||
| CO | 27000 | 72 | 1944000 | 1594000 | 0.7 | 1361000 | 1998 |
|
||||
|
||||
തേന്റെ പൗണ്ട് പ്രതി വിലയും അതിന്റെ ഉത്ഭവ സംസ്ഥാനവും തമ്മിലുള്ള ബന്ധം കാണിക്കാൻ ഒരു അടിസ്ഥാന സ്കാറ്റർപ്ലോട്ട് സൃഷ്ടിക്കുക. എല്ലാ സംസ്ഥാനങ്ങളും കാണാൻ `y` അക്ഷം ഉയരം നൽകുക:
|
||||
|
||||
```python
|
||||
sns.relplot(x="priceperlb", y="state", data=honey, height=15, aspect=.5);
|
||||
```
|
||||

|
||||
|
||||
ഇപ്പോൾ, വർഷം തോറും വില എങ്ങനെ മാറിയെന്ന് കാണിക്കാൻ തേൻ നിറത്തിലുള്ള കളർ സ്കീം ഉപയോഗിച്ച് സമാന ഡാറ്റ കാണിക്കുക. വർഷം തോറും മാറ്റം കാണിക്കാൻ 'hue' പാരാമീറ്റർ ചേർക്കാം:
|
||||
|
||||
> ✅ Seaborn-ൽ ഉപയോഗിക്കാവുന്ന [കോളർ പാളറ്റുകൾ](https://seaborn.pydata.org/tutorial/color_palettes.html) കുറിച്ച് കൂടുതൽ അറിയുക - മനോഹരമായ റെയിൻബോ കളർ സ്കീം പരീക്ഷിക്കുക!
|
||||
|
||||
```python
|
||||
sns.relplot(x="priceperlb", y="state", hue="year", palette="YlOrBr", data=honey, height=15, aspect=.5);
|
||||
```
|
||||

|
||||
|
||||
ഈ കളർ സ്കീം മാറ്റത്തോടെ, തേന്റെ പൗണ്ട് പ്രതി വില വർഷം തോറും ശക്തമായി ഉയരുന്നുവെന്ന് കാണാം. ഡാറ്റയിൽ ഒരു സാമ്പിൾ സെറ്റ് പരിശോധിച്ചാൽ (ഉദാഹരണത്തിന്, അരിസോണ), വില വർഷം തോറും ഉയരുന്ന ഒരു പാറ്റേൺ കാണാം, കുറച്ച് വ്യത്യാസങ്ങൾ ഒഴികെ:
|
||||
|
||||
| state | numcol | yieldpercol | totalprod | stocks | priceperlb | prodvalue | year |
|
||||
| ----- | ------ | ----------- | --------- | ------- | ---------- | --------- | ---- |
|
||||
| AZ | 55000 | 60 | 3300000 | 1485000 | 0.64 | 2112000 | 1998 |
|
||||
| AZ | 52000 | 62 | 3224000 | 1548000 | 0.62 | 1999000 | 1999 |
|
||||
| AZ | 40000 | 59 | 2360000 | 1322000 | 0.73 | 1723000 | 2000 |
|
||||
| AZ | 43000 | 59 | 2537000 | 1142000 | 0.72 | 1827000 | 2001 |
|
||||
| AZ | 38000 | 63 | 2394000 | 1197000 | 1.08 | 2586000 | 2002 |
|
||||
| AZ | 35000 | 72 | 2520000 | 983000 | 1.34 | 3377000 | 2003 |
|
||||
| AZ | 32000 | 55 | 1760000 | 774000 | 1.11 | 1954000 | 2004 |
|
||||
| AZ | 36000 | 50 | 1800000 | 720000 | 1.04 | 1872000 | 2005 |
|
||||
| AZ | 30000 | 65 | 1950000 | 839000 | 0.91 | 1775000 | 2006 |
|
||||
| AZ | 30000 | 64 | 1920000 | 902000 | 1.26 | 2419000 | 2007 |
|
||||
| AZ | 25000 | 64 | 1600000 | 336000 | 1.26 | 2016000 | 2008 |
|
||||
| AZ | 20000 | 52 | 1040000 | 562000 | 1.45 | 1508000 | 2009 |
|
||||
| AZ | 24000 | 77 | 1848000 | 665000 | 1.52 | 2809000 | 2010 |
|
||||
| AZ | 23000 | 53 | 1219000 | 427000 | 1.55 | 1889000 | 2011 |
|
||||
| AZ | 22000 | 46 | 1012000 | 253000 | 1.79 | 1811000 | 2012 |
|
||||
|
||||
ഈ പുരോഗതി കാണിക്കാൻ മറ്റൊരു മാർഗം കളറിന് പകരം വലിപ്പം ഉപയോഗിക്കുകയാണ്. കളർബ്ലൈൻഡ് ഉപയോക്താക്കൾക്ക് ഇത് നല്ല ഓപ്ഷൻ ആകാം. ഡോട്ട് വലിപ്പം വർദ്ധിപ്പിച്ച് വില വർദ്ധനവ് കാണിക്കുക:
|
||||
|
||||
```python
|
||||
sns.relplot(x="priceperlb", y="state", size="year", data=honey, height=15, aspect=.5);
|
||||
```
|
||||
ഡോട്ടുകളുടെ വലിപ്പം ക്രമാതീതമായി വർദ്ധിക്കുന്നതായി കാണാം.
|
||||
|
||||

|
||||
|
||||
ഇത് സപ്ലൈ ആൻഡ് ഡിമാൻഡ് എന്ന ലളിതമായ കേസ് ആണോ? കാലാവസ്ഥ മാറ്റം, കോളനി തകർച്ച തുടങ്ങിയ ഘടകങ്ങൾ കാരണം വർഷം തോറും വാങ്ങാനുളള തേൻ കുറയുന്നുണ്ടോ, അതിനാൽ വില ഉയരുന്നുണ്ടോ?
|
||||
|
||||
ഡാറ്റാസെറ്റിലെ ചില വേരിയബിളുകൾ തമ്മിലുള്ള സഹബന്ധം കണ്ടെത്താൻ, ചില ലൈൻ ചാർട്ടുകൾ പരിശോധിക്കാം.
|
||||
|
||||
## ലൈൻ ചാർട്ടുകൾ
|
||||
|
||||
ചോദ്യം: തേന്റെ പൗണ്ട് പ്രതി വില വർഷം തോറും വ്യക്തമായി ഉയരുന്നുണ്ടോ? ഇത് കണ്ടെത്താൻ ഒരു ലൈന്ചാർട്ട് സൃഷ്ടിക്കുക:
|
||||
|
||||
```python
|
||||
sns.relplot(x="year", y="priceperlb", kind="line", data=honey);
|
||||
```
|
||||
ഉത്തരം: ചില വ്യത്യാസങ്ങൾ കൂടെ 2003-ൽ ചില ഉയർച്ചകൾ കാണാം:
|
||||
|
||||

|
||||
|
||||
✅ Seaborn ഒരു ലൈനിൽ ഡാറ്റ സംഗ്രഹിക്കുന്നതിനാൽ, "ഓരോ x മൂല്യത്തിലും പല അളവുകൾ ശരാശരി കണക്കാക്കി ശരാശരിയുടെ ചുറ്റും 95% വിശ്വാസപരിധി കാണിക്കുന്നു". [മൂലം](https://seaborn.pydata.org/tutorial/relational.html). ഈ സമയം കൂടുതലുള്ള പ്രവർത്തനം `ci=None` ചേർത്താൽ ഒഴിവാക്കാം.
|
||||
|
||||
ചോദ്യം: 2003-ൽ തേൻ സപ്ലൈയിൽ ഒരു ഉയർച്ചയും കാണാമോ? മൊത്തം ഉത്പാദനം വർഷം തോറും നോക്കിയാൽ?
|
||||
|
||||
```python
|
||||
sns.relplot(x="year", y="totalprod", kind="line", data=honey);
|
||||
```
|
||||
|
||||

|
||||
|
||||
ഉത്തരം: അത്രയുമല്ല. മൊത്തം ഉത്പാദനം ആ വർഷം വർദ്ധിച്ചിട്ടുണ്ടെങ്കിലും, സാധാരണയായി ഈ വർഷങ്ങളിൽ തേൻ ഉത്പാദനം കുറയുകയാണ്.
|
||||
|
||||
ചോദ്യം: അപ്പോൾ 2003-ൽ തേന്റെ വില ഉയർന്നതിന്റെ കാരണം എന്തായിരിക്കും?
|
||||
|
||||
ഇത് കണ്ടെത്താൻ ഫേസറ്റ് ഗ്രിഡ് പരിശോധിക്കാം.
|
||||
|
||||
## ഫേസറ്റ് ഗ്രിഡുകൾ
|
||||
|
||||
ഫേസറ്റ് ഗ്രിഡുകൾ ഡാറ്റാസെറ്റിന്റെ ഒരു ഭാഗം (ഇവിടെ 'വർഷം' തിരഞ്ഞെടുക്കാം) എടുത്ത്, ഓരോ ഭാഗത്തിനും x, y കോർഡിനേറ്റുകൾ ഉപയോഗിച്ച് ഗ്രാഫുകൾ സൃഷ്ടിച്ച് എളുപ്പത്തിൽ താരതമ്യം ചെയ്യാൻ സഹായിക്കുന്നു. 2003 ഈ താരതമ്യത്തിൽ വ്യത്യസ്തമാണോ?
|
||||
|
||||
[Seaborn-ന്റെ ഡോക്യുമെന്റേഷൻ](https://seaborn.pydata.org/generated/seaborn.FacetGrid.html?highlight=facetgrid#seaborn.FacetGrid) പ്രകാരം `relplot` തുടർന്നും ഉപയോഗിച്ച് ഫേസറ്റ് ഗ്രിഡ് സൃഷ്ടിക്കുക:
|
||||
|
||||
```python
|
||||
sns.relplot(
|
||||
data=honey,
|
||||
x="yieldpercol", y="numcol",
|
||||
col="year",
|
||||
col_wrap=3,
|
||||
kind="line"
|
||||
)
|
||||
```
|
||||
ഈ ദൃശ്യവൽക്കരണത്തിൽ, കോളനി പ്രതി ഉത്പാദനവും കോളനികളുടെ എണ്ണവും വർഷം തോറും, 3 കോളങ്ങൾ വച്ച് വശം വശം താരതമ്യം ചെയ്യാം:
|
||||
|
||||

|
||||
|
||||
ഈ ഡാറ്റാസെറ്റിൽ, കോളനികളുടെ എണ്ണം, അവയുടെ ഉത്പാദനം വർഷം തോറും, സംസ്ഥാനങ്ങൾ തമ്മിൽ പ്രത്യേകമായ വ്യത്യാസം കാണുന്നില്ല. ഈ രണ്ട് വേരിയബിളുകൾ തമ്മിൽ സഹബന്ധം കണ്ടെത്താൻ മറ്റൊരു മാർഗം ഉണ്ടോ?
|
||||
|
||||
## ഡ്യുവൽ-ലൈൻ പ്ലോട്ടുകൾ
|
||||
|
||||
Seaborn-ന്റെ 'despine' ഉപയോഗിച്ച് മുകളിൽ വലത്തുഭാഗം സ്പൈൻ നീക്കം ചെയ്ത്, Matplotlib-ൽ നിന്നുള്ള `ax.twinx` ഉപയോഗിച്ച് രണ്ട് ലൈൻപ്ലോട്ടുകൾ ഒരുമിച്ച് സൂപ്പർഇംപോസ് ചെയ്ത് multiline പ്ലോട്ട് ശ്രമിക്കുക. Twinx ഒരു ചാർട്ട് x അക്ഷം പങ്കുവെച്ച് രണ്ട് y അക്ഷങ്ങൾ പ്രദർശിപ്പിക്കാൻ സഹായിക്കുന്നു. കോളനി പ്രതി ഉത്പാദനവും കോളനികളുടെ എണ്ണവും സൂപ്പർഇംപോസ് ചെയ്ത് കാണിക്കുക:
|
||||
|
||||
```python
|
||||
fig, ax = plt.subplots(figsize=(12,6))
|
||||
lineplot = sns.lineplot(x=honey['year'], y=honey['numcol'], data=honey,
|
||||
label = 'Number of bee colonies', legend=False)
|
||||
sns.despine()
|
||||
plt.ylabel('# colonies')
|
||||
plt.title('Honey Production Year over Year');
|
||||
|
||||
ax2 = ax.twinx()
|
||||
lineplot2 = sns.lineplot(x=honey['year'], y=honey['yieldpercol'], ax=ax2, color="r",
|
||||
label ='Yield per colony', legend=False)
|
||||
sns.despine(right=False)
|
||||
plt.ylabel('colony yield')
|
||||
ax.figure.legend();
|
||||
```
|
||||

|
||||
|
||||
2003-ൽ പ്രത്യേകമായി ഒന്നും കാണാനില്ലെങ്കിലും, ഈ പാഠം ഒരു സന്തോഷകരമായ നോട്ടിൽ അവസാനിപ്പിക്കാം: കോളനികളുടെ എണ്ണം കുറയുന്നുണ്ടെങ്കിലും, അവയുടെ എണ്ണം സ്ഥിരതയുള്ളതും, കോളനി പ്രതി ഉത്പാദനം കുറയുന്നുണ്ടെങ്കിലും.
|
||||
|
||||
പോകൂ, തേൻമക്കളേ, പോകൂ!
|
||||
|
||||
🐝❤️
|
||||
## 🚀 ചലഞ്ച്
|
||||
|
||||
ഈ പാഠത്തിൽ, സ്കാറ്റർപ്ലോട്ടുകളും ലൈൻ ഗ്രിഡുകളും ഉൾപ്പെടെ ഫേസറ്റ് ഗ്രിഡുകൾ ഉപയോഗിക്കുന്നതിനെ കുറിച്ച് കൂടുതൽ പഠിച്ചു. മറ്റൊരു ഡാറ്റാസെറ്റ് ഉപയോഗിച്ച് ഫേസറ്റ് ഗ്രിഡ് സൃഷ്ടിക്കാൻ ശ്രമിക്കുക, മുൻപുള്ള പാഠങ്ങളിൽ ഉപയോഗിച്ച ഡാറ്റാസെറ്റ് ആകാം. എത്ര സമയം എടുക്കുന്നു, എത്ര ഗ്രിഡുകൾ വരയ്ക്കണം എന്ന കാര്യത്തിൽ ശ്രദ്ധിക്കുക.
|
||||
|
||||
## [പോസ്റ്റ്-ലെക്ചർ ക്വിസ്](https://ff-quizzes.netlify.app/en/ds/quiz/23)
|
||||
|
||||
## അവലോകനം & സ്വയം പഠനം
|
||||
|
||||
ലൈൻ പ്ലോട്ടുകൾ ലളിതമോ സങ്കീർണ്ണമോ ആകാം. [Seaborn ഡോക്യുമെന്റേഷൻ](https://seaborn.pydata.org/generated/seaborn.lineplot.html) വായിച്ച് വിവിധ രീതികൾ പഠിക്കുക. ഈ പാഠത്തിൽ നിർമ്മിച്ച ലൈൻ ചാർട്ടുകൾ മറ്റ് രീതികളാൽ മെച്ചപ്പെടുത്താൻ ശ്രമിക്കുക.
|
||||
## അസൈൻമെന്റ്
|
||||
|
||||
[തേൻമടയിൽ ഡൈവ് ചെയ്യുക](assignment.md)
|
||||
|
||||
---
|
||||
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
|
||||
**അസൂയാപത്രം**:
|
||||
ഈ രേഖ AI വിവർത്തന സേവനം [Co-op Translator](https://github.com/Azure/co-op-translator) ഉപയോഗിച്ച് വിവർത്തനം ചെയ്തതാണ്. നാം കൃത്യതയ്ക്ക് ശ്രമിച്ചിട്ടുണ്ടെങ്കിലും, സ്വയം പ്രവർത്തിക്കുന്ന വിവർത്തനങ്ങളിൽ പിശകുകൾ അല്ലെങ്കിൽ തെറ്റുകൾ ഉണ്ടാകാമെന്ന് ദയവായി ശ്രദ്ധിക്കുക. അതിന്റെ മാതൃഭാഷയിലുള്ള യഥാർത്ഥ രേഖ അധികാരപരമായ ഉറവിടമായി കണക്കാക്കപ്പെടണം. നിർണായക വിവരങ്ങൾക്ക്, പ്രൊഫഷണൽ മനുഷ്യ വിവർത്തനം ശുപാർശ ചെയ്യപ്പെടുന്നു. ഈ വിവർത്തനം ഉപയോഗിക്കുന്നതിൽ നിന്നുണ്ടാകുന്ന ഏതെങ്കിലും തെറ്റിദ്ധാരണകൾക്കോ തെറ്റായ വ്യാഖ്യാനങ്ങൾക്കോ ഞങ്ങൾ ഉത്തരവാദികളല്ല.
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER END -->
|
||||
@ -0,0 +1,27 @@
|
||||
<!--
|
||||
CO_OP_TRANSLATOR_METADATA:
|
||||
{
|
||||
"original_hash": "680419753c086eef51be86607c623945",
|
||||
"translation_date": "2025-12-19T16:00:04+00:00",
|
||||
"source_file": "3-Data-Visualization/12-visualization-relationships/assignment.md",
|
||||
"language_code": "ml"
|
||||
}
|
||||
-->
|
||||
# തേനീച്ചകളുടെ കുടിലിലേക്ക് ഡൈവ് ചെയ്യുക
|
||||
|
||||
## നിർദ്ദേശങ്ങൾ
|
||||
|
||||
ഈ പാഠത്തിൽ നിങ്ങൾ തേനീച്ചകളുടെയും അവയുടെ തേൻ ഉത്പാദനത്തിന്റെയും ഒരു ഡാറ്റാസെറ്റിനെ കുറിച്ച് പരിശോധിക്കാൻ തുടങ്ങിയിരുന്നു, ഇത് ഒരു കാലയളവിൽ തേനീച്ചകളുടെ കോളനി ജനസംഖ്യയിൽ നഷ്ടങ്ങൾ കണ്ടു. ഈ ഡാറ്റാസെറ്റിനെ കൂടുതൽ ആഴത്തിൽ പരിശോധിച്ച്, തേനീച്ചകളുടെ ജനസംഖ്യയുടെ ആരോഗ്യത്തെ സംസ്ഥാനവും വർഷവും അനുസരിച്ച് പറയുന്ന ഒരു നോട്ട്ബുക്ക് നിർമ്മിക്കുക. ഈ ഡാറ്റാസെറ്റിനെക്കുറിച്ച് നിങ്ങൾക്ക് എന്തെങ്കിലും രസകരമായ കണ്ടെത്തലുണ്ടോ?
|
||||
|
||||
## റൂബ്രിക്
|
||||
|
||||
| ഉദാഹരണാർത്ഥം | മതിയായത് | മെച്ചപ്പെടുത്തേണ്ടത് |
|
||||
| ------------------------------------------------------------------------------------------------------------------------------------------------------- | ---------------------------------------- | ---------------------------------------- |
|
||||
| ഒരു നോട്ട്ബുക്ക് ഒരു കഥയോടുകൂടി അവതരിപ്പിക്കുന്നു, അതിൽ ഡാറ്റാസെറ്റിന്റെ വിവിധ വശങ്ങൾ കാണിക്കുന്ന കുറഞ്ഞത് മൂന്ന് വ്യത്യസ്ത ചാർട്ടുകൾ ഉൾക്കൊള്ളുന്നു, സംസ്ഥാനവും വർഷവും അനുസരിച്ച് | നോട്ട്ബുക്കിൽ ഈ ഘടകങ്ങളിൽ ഒന്നും ഇല്ല | നോട്ട്ബുക്കിൽ ഈ ഘടകങ്ങളിൽ രണ്ട് ഇല്ല |
|
||||
|
||||
---
|
||||
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
|
||||
**അസൂയാപത്രം**:
|
||||
ഈ രേഖ AI വിവർത്തന സേവനം [Co-op Translator](https://github.com/Azure/co-op-translator) ഉപയോഗിച്ച് വിവർത്തനം ചെയ്തതാണ്. നാം കൃത്യതയ്ക്ക് ശ്രമിച്ചിട്ടുണ്ടെങ്കിലും, സ്വയം പ്രവർത്തിക്കുന്ന വിവർത്തനങ്ങളിൽ പിശകുകൾ അല്ലെങ്കിൽ തെറ്റുകൾ ഉണ്ടാകാമെന്ന് ദയവായി ശ്രദ്ധിക്കുക. അതിന്റെ മാതൃഭാഷയിലുള്ള യഥാർത്ഥ രേഖയാണ് പ്രാമാണികമായ ഉറവിടം എന്ന് പരിഗണിക്കേണ്ടതാണ്. നിർണായകമായ വിവരങ്ങൾക്ക്, പ്രൊഫഷണൽ മനുഷ്യ വിവർത്തനം ശുപാർശ ചെയ്യപ്പെടുന്നു. ഈ വിവർത്തനം ഉപയോഗിക്കുന്നതിൽ നിന്നുണ്ടാകുന്ന ഏതെങ്കിലും തെറ്റിദ്ധാരണകൾക്കോ തെറ്റായ വ്യാഖ്യാനങ്ങൾക്കോ ഞങ്ങൾ ഉത്തരവാദികളല്ല.
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER END -->
|
||||
@ -0,0 +1,32 @@
|
||||
{
|
||||
"cells": [
|
||||
{
|
||||
"cell_type": "markdown",
|
||||
"source": [
|
||||
"# തേൻ ഉത്പാദനം ദൃശ്യവൽക്കരണം 🍯 🐝\n"
|
||||
],
|
||||
"metadata": {}
|
||||
},
|
||||
{
|
||||
"cell_type": "markdown",
|
||||
"metadata": {},
|
||||
"source": [
|
||||
"---\n\n<!-- CO-OP TRANSLATOR DISCLAIMER START -->\n**അസൂയാപത്രം**: \nഈ രേഖ AI വിവർത്തന സേവനം [Co-op Translator](https://github.com/Azure/co-op-translator) ഉപയോഗിച്ച് വിവർത്തനം ചെയ്തതാണ്. നാം കൃത്യതയ്ക്ക് ശ്രമിച്ചിട്ടുണ്ടെങ്കിലും, യന്ത്രം ചെയ്ത വിവർത്തനങ്ങളിൽ പിശകുകൾ അല്ലെങ്കിൽ തെറ്റുകൾ ഉണ്ടാകാമെന്ന് ദയവായി ശ്രദ്ധിക്കുക. അതിന്റെ മാതൃഭാഷയിലുള്ള യഥാർത്ഥ രേഖ അധികാരപരമായ ഉറവിടമായി കണക്കാക്കണം. നിർണായകമായ വിവരങ്ങൾക്ക്, പ്രൊഫഷണൽ മനുഷ്യ വിവർത്തനം ശുപാർശ ചെയ്യപ്പെടുന്നു. ഈ വിവർത്തനം ഉപയോഗിക്കുന്നതിൽ നിന്നുണ്ടാകുന്ന ഏതെങ്കിലും തെറ്റിദ്ധാരണകൾക്കോ വ്യാഖ്യാനക്കേടുകൾക്കോ ഞങ്ങൾ ഉത്തരവാദികളല്ല.\n<!-- CO-OP TRANSLATOR DISCLAIMER END -->\n"
|
||||
]
|
||||
}
|
||||
],
|
||||
"metadata": {
|
||||
"orig_nbformat": 4,
|
||||
"language_info": {
|
||||
"name": "python"
|
||||
},
|
||||
"coopTranslator": {
|
||||
"original_hash": "0f988634b7192626d91cc33b4b6388c5",
|
||||
"translation_date": "2025-12-19T17:35:34+00:00",
|
||||
"source_file": "3-Data-Visualization/12-visualization-relationships/notebook.ipynb",
|
||||
"language_code": "ml"
|
||||
}
|
||||
},
|
||||
"nbformat": 4,
|
||||
"nbformat_minor": 2
|
||||
}
|
||||
File diff suppressed because one or more lines are too long
@ -0,0 +1,184 @@
|
||||
<!--
|
||||
CO_OP_TRANSLATOR_METADATA:
|
||||
{
|
||||
"original_hash": "cfb068050337a36e348debaa502a24fa",
|
||||
"translation_date": "2025-12-19T16:08:19+00:00",
|
||||
"source_file": "3-Data-Visualization/13-meaningful-visualizations/README.md",
|
||||
"language_code": "ml"
|
||||
}
|
||||
-->
|
||||
# അർത്ഥവത്തായ ദൃശ്യവത്കരണങ്ങൾ നിർമ്മിക്കൽ
|
||||
|
||||
| ](../../sketchnotes/13-MeaningfulViz.png)|
|
||||
|:---:|
|
||||
| അർത്ഥവത്തായ ദൃശ്യവത്കരണങ്ങൾ - _Sketchnote by [@nitya](https://twitter.com/nitya)_ |
|
||||
|
||||
> "നിങ്ങൾ ഡാറ്റയെ മതിയായ സമയം പീഡിപ്പിച്ചാൽ, അത് എന്തും സമ്മതിക്കും" -- [Ronald Coase](https://en.wikiquote.org/wiki/Ronald_Coase)
|
||||
|
||||
ഒരു ഡാറ്റ സയന്റിസ്റ്റിന്റെ അടിസ്ഥാന കഴിവുകളിൽ ഒന്നാണ് നിങ്ങൾക്കുണ്ടാകാവുന്ന ചോദ്യങ്ങൾക്ക് ഉത്തരം നൽകാൻ സഹായിക്കുന്ന അർത്ഥവത്തായ ഡാറ്റാ ദൃശ്യവത്കരണം സൃഷ്ടിക്കാൻ കഴിയുക. നിങ്ങളുടെ ഡാറ്റ ദൃശ്യവത്കരിക്കുന്നതിന് മുമ്പ്, അത് ശുദ്ധീകരിക്കുകയും തയ്യാറാക്കുകയും ചെയ്തിട്ടുണ്ടെന്ന് ഉറപ്പാക്കണം, മുമ്പത്തെ പാഠങ്ങളിൽ നിങ്ങൾ ചെയ്തതുപോലെ. അതിനുശേഷം, ഡാറ്റ എങ്ങനെ മികച്ച രീതിയിൽ അവതരിപ്പിക്കാമെന്ന് തീരുമാനിക്കാം.
|
||||
|
||||
ഈ പാഠത്തിൽ, നിങ്ങൾ അവലോകനം ചെയ്യും:
|
||||
|
||||
1. ശരിയായ ചാർട്ട് തരം എങ്ങനെ തിരഞ്ഞെടുക്കാം
|
||||
2. വഞ്ചനാപരമായ ചാർട്ടിംഗ് ഒഴിവാക്കാൻ എങ്ങനെ
|
||||
3. നിറവുമായി എങ്ങനെ പ്രവർത്തിക്കാം
|
||||
4. വായനാസൗകര്യത്തിനായി നിങ്ങളുടെ ചാർട്ടുകൾ എങ്ങനെ സ്റ്റൈൽ ചെയ്യാം
|
||||
5. അനിമേറ്റഡ് അല്ലെങ്കിൽ 3D ചാർട്ടിംഗ് പരിഹാരങ്ങൾ എങ്ങനെ നിർമ്മിക്കാം
|
||||
6. സൃഷ്ടിപരമായ ഒരു ദൃശ്യവത്കരണം എങ്ങനെ നിർമ്മിക്കാം
|
||||
|
||||
## [പ്രീ-ലെക്ചർ ക്വിസ്](https://ff-quizzes.netlify.app/en/ds/quiz/24)
|
||||
|
||||
## ശരിയായ ചാർട്ട് തരം തിരഞ്ഞെടുക്കുക
|
||||
|
||||
മുൻപത്തെ പാഠങ്ങളിൽ, Matplotlib, Seaborn എന്നിവ ഉപയോഗിച്ച് വിവിധ രസകരമായ ഡാറ്റാ ദൃശ്യവത്കരണങ്ങൾ നിർമ്മിക്കാൻ നിങ്ങൾ പരീക്ഷിച്ചു. സാധാരണയായി, നിങ്ങൾ ചോദിക്കുന്ന ചോദ്യത്തിന് അനുയോജ്യമായ [ശരിയായ ചാർട്ട് തരം](https://chartio.com/learn/charts/how-to-select-a-data-vizualization/) ഈ പട്ടിക ഉപയോഗിച്ച് തിരഞ്ഞെടുക്കാം:
|
||||
|
||||
| നിങ്ങൾ ചെയ്യേണ്ടത്: | നിങ്ങൾ ഉപയോഗിക്കേണ്ടത്: |
|
||||
| -------------------------- | ------------------------------- |
|
||||
| സമയാനുസൃത ഡാറ്റ ട്രെൻഡുകൾ കാണിക്കുക | ലൈൻ |
|
||||
| വിഭാഗങ്ങൾ താരതമ്യം ചെയ്യുക | ബാർ, പൈ |
|
||||
| മൊത്തം താരതമ്യം ചെയ്യുക | പൈ, സ്റ്റാക്ക് ബാർ |
|
||||
| ബന്ധങ്ങൾ കാണിക്കുക | സ്കാറ്റർ, ലൈൻ, ഫേസറ്റ്, ഡ്യുവൽ ലൈൻ |
|
||||
| വിതരണങ്ങൾ കാണിക്കുക | സ്കാറ്റർ, ഹിസ്റ്റോഗ്രാം, ബോക്സ് |
|
||||
| അനുപാതങ്ങൾ കാണിക്കുക | പൈ, ഡോണട്ട്, വാഫി |
|
||||
|
||||
> ✅ നിങ്ങളുടെ ഡാറ്റയുടെ ഘടന അനുസരിച്ച്, ഒരു നൽകിയ ചാർട്ട് പിന്തുണയ്ക്കാൻ അത് ടെക്സ്റ്റിൽ നിന്ന് സംഖ്യാത്മകത്തിലേക്ക് മാറ്റേണ്ടി വരാം.
|
||||
|
||||
## വഞ്ചന ഒഴിവാക്കുക
|
||||
|
||||
ഒരു ഡാറ്റ സയന്റിസ്റ്റ് ശരിയായ ഡാറ്റയ്ക്ക് ശരിയായ ചാർട്ട് തിരഞ്ഞെടുക്കാൻ ശ്രദ്ധിച്ചാലും, ഡാറ്റയെ തെളിയിക്കാൻ പലവിധം വഞ്ചനാപരമായി പ്രദർശിപ്പിക്കാനുള്ള മാർഗ്ഗങ്ങൾ ധാരാളമാണ്, പലപ്പോഴും ഡാറ്റയെ തന്നെ അപഹസിക്കുന്ന വിലക്ക് വരുത്തി. വഞ്ചനാപരമായ ചാർട്ടുകളും ഇൻഫോഗ്രാഫിക്സും ധാരാളം ഉദാഹരണങ്ങളുണ്ട്!
|
||||
|
||||
[](https://www.youtube.com/watch?v=oX74Nge8Wkw "How charts lie")
|
||||
|
||||
> 🎥 വഞ്ചനാപരമായ ചാർട്ടുകൾക്കുറിച്ചുള്ള കോൺഫറൻസ് ടോക്കിനായി മുകളിൽ ചിത്രത്തിൽ ക്ലിക്ക് ചെയ്യുക
|
||||
|
||||
ഈ ചാർട്ട് X അക്ഷം മറിച്ച് സത്യം മറിച്ച് കാണിക്കുന്നു, തീയതി അടിസ്ഥാനമാക്കി:
|
||||
|
||||

|
||||
|
||||
[ഈ ചാർട്ട്](https://media.firstcoastnews.com/assets/WTLV/images/170ae16f-4643-438f-b689-50d66ca6a8d8/170ae16f-4643-438f-b689-50d66ca6a8d8_1140x641.jpg) കൂടുതൽ വഞ്ചനാപരമാണ്, കാരണം കണ്ണ് വലത്തേക്ക് ആകർഷിക്കപ്പെടുന്നു, സമയാനുസൃതമായി COVID കേസുകൾ വിവിധ കൗണ്ടികളിൽ കുറയുകയാണെന്ന് നിഗമനം ചെയ്യാൻ. എന്നാൽ, തീയതികൾ ശ്രദ്ധാപൂർവ്വം നോക്കിയാൽ, അവ വഞ്ചനാപരമായ താഴ്ന്ന ട്രെൻഡ് നൽകാൻ പുനഃക്രമീകരിച്ചിട്ടുള്ളതായി കാണാം.
|
||||
|
||||

|
||||
|
||||
ഈ പ്രശസ്ത ഉദാഹരണം നിറവും മറിച്ച Y അക്ഷവും ഉപയോഗിച്ച് വഞ്ചന ചെയ്യുന്നു: തോക്കു-സഹായക നിയമം പാസായതിന് ശേഷം തോക്ക് മരണങ്ങൾ വർധിച്ചതായി നിഗമനം ചെയ്യേണ്ടതിനു പകരം, കണ്ണ് മറിച്ച് സത്യം മറിച്ച് കാണുന്നു:
|
||||
|
||||

|
||||
|
||||
ഈ വിചിത്രമായ ചാർട്ട് അനുപാതം എങ്ങനെ മാനിപ്പുലേറ്റ് ചെയ്യാമെന്ന് ഹാസ്യകരമായി കാണിക്കുന്നു:
|
||||
|
||||

|
||||
|
||||
തുല്യമായവ അല്ലാത്തവ താരതമ്യം ചെയ്യുക മറ്റൊരു സംശയാസ്പദമായ തന്ത്രമാണ്. 'സ്പ്യൂറിയസ് കോറിലേഷൻസ്' എന്ന വിഷയത്തിൽ 'മെയ്നിലെ വിവാഹമോചന നിരക്കും മാർഗറിൻ ഉപഭോഗവും' പോലുള്ള കാര്യങ്ങൾ തമ്മിലുള്ള 'വാസ്തവങ്ങൾ' പ്രദർശിപ്പിക്കുന്ന [അദ്ഭുതകരമായ വെബ്സൈറ്റ്](https://tylervigen.com/spurious-correlations) ഉണ്ട്. Reddit ഗ്രൂപ്പ് ഡാറ്റയുടെ [കീഴടക്കം ഉപയോഗങ്ങൾ](https://www.reddit.com/r/dataisugly/top/?t=all) ശേഖരിക്കുന്നു.
|
||||
|
||||
വഞ്ചനാപരമായ ചാർട്ടുകൾ കൊണ്ട് കണ്ണ് എളുപ്പത്തിൽ എങ്ങനെ വഞ്ചിക്കപ്പെടാമെന്ന് മനസ്സിലാക്കുന്നത് പ്രധാനമാണ്. ഡാറ്റ സയന്റിസ്റ്റിന്റെ ഉദ്ദേശ്യം നല്ലതായാലും, പൈ ചാർട്ട് പോലുള്ള തെറ്റായ ചാർട്ട് തരം തിരഞ്ഞെടുക്കുന്നത് വഞ്ചനാപരമായിരിക്കാം, പ്രത്യേകിച്ച് വളരെ അധികം വിഭാഗങ്ങൾ കാണിക്കുന്നപ്പോൾ.
|
||||
|
||||
## നിറം
|
||||
|
||||
മുകളിൽ 'ഫ്ലോറിഡ ഗൺ വയലൻസ്' ചാർട്ടിൽ നിങ്ങൾ കണ്ടതുപോലെ, നിറം ചാർട്ടുകൾക്ക് അധിക അർത്ഥം നൽകാൻ സഹായിക്കുന്നു, പ്രത്യേകിച്ച് Matplotlib, Seaborn പോലുള്ള ലൈബ്രറികൾ ഉപയോഗിച്ച് രൂപകൽപ്പന ചെയ്തിട്ടില്ലാത്തവയ്ക്ക്, അവയിൽ വിവിധ പരിശോധന ചെയ്ത നിറ ലൈബ്രറികളും പാളറ്റുകളും ഉണ്ട്. നിങ്ങൾ കൈകൊണ്ട് ഒരു ചാർട്ട് നിർമ്മിക്കുമ്പോൾ, [നിറ സിദ്ധാന്തം](https://colormatters.com/color-and-design/basic-color-theory) കുറച്ച് പഠിക്കുക.
|
||||
|
||||
> ✅ ചാർട്ടുകൾ രൂപകൽപ്പന ചെയ്യുമ്പോൾ, ആക്സസിബിലിറ്റി ഒരു പ്രധാന ഘടകമാണെന്ന് ശ്രദ്ധിക്കുക. നിങ്ങളുടെ ചില ഉപയോക്താക്കൾക്ക് നിറം കാണാനാകാത്തവരായിരിക്കാം - നിങ്ങളുടെ ചാർട്ട് ദൃശ്യ വൈകല്യമുള്ള ഉപയോക്താക്കൾക്ക് നന്നായി പ്രദർശിപ്പിക്കുന്നുണ്ടോ?
|
||||
|
||||
നിങ്ങളുടെ ചാർട്ടിനായി നിറങ്ങൾ തിരഞ്ഞെടുക്കുമ്പോൾ ജാഗ്രത പാലിക്കുക, കാരണം നിറം നിങ്ങൾ ഉദ്ദേശിക്കുന്നതിൽ വ്യത്യസ്തമായ അർത്ഥം നൽകാം. മുകളിൽ 'ഉയരം' ചാർട്ടിലെ 'പിങ്ക് ലേഡീസ്' ഒരു വ്യക്തമായ 'സ്ത്രീലിംഗ' അർത്ഥം നൽകുന്നു, ഇത് ചാർട്ടിന്റെ വിചിത്രതയിൽ കൂടി കൂട്ടിച്ചേർക്കുന്നു.
|
||||
|
||||
വിവിധ ഭാഗങ്ങളിൽ [നിറത്തിന്റെ അർത്ഥം](https://colormatters.com/color-symbolism/the-meanings-of-colors) വ്യത്യസ്തമായിരിക്കാം, കൂടാതെ അവയുടെ ഷേഡ് അനുസരിച്ച് അർത്ഥം മാറാറുണ്ട്. പൊതുവായി, നിറങ്ങളുടെ അർത്ഥങ്ങൾ ഉൾപ്പെടുന്നു:
|
||||
|
||||
| നിറം | അർത്ഥം |
|
||||
| ------ | ------------------- |
|
||||
| ചുവപ്പ് | ശക്തി |
|
||||
| നീലം | വിശ്വാസം, വിശ്വസ്തത |
|
||||
| മഞ്ഞ | സന്തോഷം, ജാഗ്രത |
|
||||
| പച്ച | പരിസ്ഥിതി, ഭാഗ്യം, ഇർഷ്യ |
|
||||
| പർപ്പിൾ | സന്തോഷം |
|
||||
| ഓറഞ്ച് | ഉജ്ജ്വലത |
|
||||
|
||||
നിങ്ങൾക്ക് കസ്റ്റം നിറങ്ങളുള്ള ഒരു ചാർട്ട് നിർമ്മിക്കേണ്ടതുണ്ടെങ്കിൽ, നിങ്ങളുടെ ചാർട്ടുകൾ ആക്സസിബിളും നിങ്ങൾ നൽകാൻ ശ്രമിക്കുന്ന അർത്ഥത്തോടും പൊരുത്തപ്പെടുന്നതുമായിരിക്കണം.
|
||||
|
||||
## വായനാസൗകര്യത്തിനായി നിങ്ങളുടെ ചാർട്ടുകൾ സ്റ്റൈൽ ചെയ്യുക
|
||||
|
||||
ചാർട്ടുകൾ വായിക്കാൻ കഴിയാത്ത പക്ഷം അർത്ഥവത്തായവയല്ല! നിങ്ങളുടെ ഡാറ്റയ്ക്ക് അനുസരിച്ച് ചാർട്ടിന്റെ വീതി, ഉയരം എന്നിവ സ്കെയിൽ ചെയ്യുന്നതിന് ഒരു നിമിഷം ചെലവഴിക്കുക. ഒരു വേരിയബിൾ (ഉദാ: എല്ലാ 50 സംസ്ഥാനങ്ങളും) പ്രദർശിപ്പിക്കേണ്ടതുണ്ടെങ്കിൽ, അവയെ Y അക്ഷത്തിൽ ലംബമായി കാണിക്കുക, അതുവഴി കൂറ്റൻ ഹോരിസോണ്ടൽ സ്ക്രോൾ ചാർട്ട് ഒഴിവാക്കാം.
|
||||
|
||||
നിങ്ങളുടെ അക്ഷങ്ങൾ ലേബൽ ചെയ്യുക, ആവശ്യമെങ്കിൽ ലെജൻഡ് നൽകുക, ഡാറ്റയുടെ മികച്ച മനസ്സിലാക്കലിനായി ടൂൾടിപ്പുകൾ നൽകുക.
|
||||
|
||||
നിങ്ങളുടെ ഡാറ്റ ടെക്സ്റ്റ് ആണെങ്കിൽ, X അക്ഷ上的 വാചകം വായനാസൗകര്യത്തിനായി കോണിൽ വയ്ക്കാം. [Matplotlib](https://matplotlib.org/stable/tutorials/toolkits/mplot3d.html) 3D പ്ലോട്ടിംഗ് നൽകുന്നു, നിങ്ങളുടെ ഡാറ്റ അത് പിന്തുണയ്ക്കുന്നുവെങ്കിൽ. സങ്കീർണ്ണമായ ഡാറ്റാ ദൃശ്യവത്കരണങ്ങൾ `mpl_toolkits.mplot3d` ഉപയോഗിച്ച് നിർമ്മിക്കാം.
|
||||
|
||||

|
||||
|
||||
## അനിമേഷൻ, 3D ചാർട്ട് പ്രദർശനം
|
||||
|
||||
ഇന്നത്തെ മികച്ച ഡാറ്റാ ദൃശ്യവത്കരണങ്ങളിൽ ചിലത് അനിമേറ്റഡ് ആണ്. Shirley Wu D3 ഉപയോഗിച്ച് '[film flowers](http://bl.ocks.org/sxywu/raw/d612c6c653fb8b4d7ff3d422be164a5d/)' പോലുള്ള അത്ഭുതകരമായവ ഉണ്ടാക്കി, ഓരോ പൂവും ഒരു സിനിമയുടെ ദൃശ്യവത്കരണമാണ്. Guardian-നായി മറ്റൊരു ഉദാഹരണം 'bussed out' ആണ്, Greensock, D3 എന്നിവയുമായി സംയോജിപ്പിച്ച ഒരു ഇന്ററാക്ടീവ് അനുഭവം, സ്ക്രോൾടെല്ലിംഗ് ലേഖന ഫോർമാറ്റിൽ, NYC എങ്ങനെ നഗരത്തിലെ ഹോമ്ലെസ്സ് പ്രശ്നം ബസ്സിലൂടെ പുറത്തേക്ക് കൊണ്ടുപോകുന്നു എന്ന് കാണിക്കുന്നു.
|
||||
|
||||

|
||||
|
||||
> "Bussed Out: How America Moves its Homeless" from [the Guardian](https://www.theguardian.com/us-news/ng-interactive/2017/dec/20/bussed-out-america-moves-homeless-people-country-study). Visualizations by Nadieh Bremer & Shirley Wu
|
||||
|
||||
ഈ പാഠം ഈ ശക്തമായ ദൃശ്യവത്കരണ ലൈബ്രറികൾ പഠിപ്പിക്കാൻ മതിയാകാത്തതിനാൽ, Vue.js ആപ്പിൽ D3 ഉപയോഗിച്ച് "Dangerous Liaisons" എന്ന പുസ്തകത്തിന്റെ അനിമേറ്റഡ് സോഷ്യൽ നെറ്റ്വർക്ക് ദൃശ്യവത്കരണം പ്രദർശിപ്പിക്കാൻ ശ്രമിക്കുക.
|
||||
|
||||
> "Les Liaisons Dangereuses" ഒരു കത്ത് നോവലാണ്, അഥവാ കത്തുകളുടെ ഒരു പരമ്പരയായി അവതരിപ്പിച്ച നോവൽ. 1782-ൽ Choderlos de Laclos എഴുതിയ ഇത് ഫ്രഞ്ച് അരിപ്പ്രതിഷ്ഠയുടെ 18-ാം നൂറ്റാണ്ടിന്റെ അവസാനം രണ്ട് മുഖ്യ കഥാപാത്രങ്ങളായ Vicomte de Valmont, Marquise de Merteuil എന്നിവരുടെ ദുഷ്ടമായ, നൈതികമായി തകർന്ന സാമൂഹിക തന്ത്രങ്ങൾ പറയുന്നു. ഇരുവരും അവസാനം മരണപ്പെടുന്നു, പക്ഷേ വലിയ സാമൂഹിക നാശം സൃഷ്ടിച്ചുകൊണ്ട്. നോവൽ അവരുടെ വൃത്തങ്ങളിൽ വിവിധ ആളുകൾക്ക് എഴുതിയ കത്തുകളുടെ പരമ്പരയായി തുറക്കുന്നു, പ്രതികാരം ചെയ്യാനോ പ്രശ്നങ്ങൾ സൃഷ്ടിക്കാനോ. ഈ കത്തുകളുടെ ദൃശ്യവത്കരണം സൃഷ്ടിച്ച് കഥയിലെ പ്രധാന കഥാപാത്രങ്ങളെ ദൃശ്യമായി കണ്ടെത്തുക.
|
||||
|
||||
നിങ്ങൾ ഒരു വെബ് ആപ്പ് പൂർത്തിയാക്കും, ഇത് ഈ സോഷ്യൽ നെറ്റ്വർക്ക് അനിമേറ്റഡ് ദൃശ്യമായി കാണിക്കും. ഇത് Vue.js, D3 ഉപയോഗിച്ച് [നെറ്റ്വർക്ക് ദൃശ്യവത്കരണം](https://github.com/emiliorizzo/vue-d3-network) സൃഷ്ടിക്കാൻ നിർമ്മിച്ച ഒരു ലൈബ്രറി ഉപയോഗിക്കുന്നു. ആപ്പ് പ്രവർത്തിക്കുമ്പോൾ, സ്ക്രീനിൽ നോഡുകൾ നീക്കി ഡാറ്റ മാറ്റാം.
|
||||
|
||||

|
||||
|
||||
## പ്രോജക്ട്: D3.js ഉപയോഗിച്ച് ഒരു നെറ്റ്വർക്ക് കാണിക്കുന്ന ചാർട്ട് നിർമ്മിക്കുക
|
||||
|
||||
> ഈ പാഠം ഉൾപ്പെടുന്ന ഫോൾഡറിൽ `solution` ഫോൾഡർ ഉണ്ട്, പൂർത്തിയായ പ്രോജക്ട് അവിടെ കാണാം, നിങ്ങളുടെ റഫറൻസിനായി.
|
||||
|
||||
1. സ്റ്റാർട്ടർ ഫോൾഡറിന്റെ റൂട്ടിലുള്ള README.md ഫയലിലെ നിർദ്ദേശങ്ങൾ പാലിക്കുക. നിങ്ങളുടെ മെഷീനിൽ NPM, Node.js പ്രവർത്തിക്കുന്നുണ്ടെന്ന് ഉറപ്പാക്കുക, തുടർന്ന് പ്രോജക്ടിന്റെ ഡിപ്പൻഡൻസികൾ ഇൻസ്റ്റാൾ ചെയ്യുക.
|
||||
|
||||
2. `starter/src` ഫോൾഡർ തുറക്കുക. അവിടെ ഒരു `assets` ഫോൾഡർ കാണും, അതിൽ നോവലിലെ എല്ലാ കത്തുകളും നമ്പർ ചെയ്തും 'to' 'from' അനോട്ടേഷനോടും ഉള്ള .json ഫയൽ കാണാം.
|
||||
|
||||
3. `components/Nodes.vue`-ൽ കോഡ് പൂർത്തിയാക്കുക, ദൃശ്യവത്കരണം സജ്ജമാക്കാൻ. `createLinks()` എന്ന മെത്തഡ് കണ്ടെത്തി താഴെ കൊടുത്ത നസ്റ്റഡ് ലൂപ്പ് ചേർക്കുക.
|
||||
|
||||
.json ഒബ്ജക്റ്റിൽ 'to' 'from' ഡാറ്റ പിടിച്ച് `links` ഒബ്ജക്റ്റ് നിർമ്മിക്കുക, ദൃശ്യവത്കരണ ലൈബ്രറി അത് ഉപയോഗിക്കാനായി:
|
||||
|
||||
```javascript
|
||||
//അക്ഷരങ്ങളിലൂടെ ലൂപ്പ് ചെയ്യുക
|
||||
let f = 0;
|
||||
let t = 0;
|
||||
for (var i = 0; i < letters.length; i++) {
|
||||
for (var j = 0; j < characters.length; j++) {
|
||||
|
||||
if (characters[j] == letters[i].from) {
|
||||
f = j;
|
||||
}
|
||||
if (characters[j] == letters[i].to) {
|
||||
t = j;
|
||||
}
|
||||
}
|
||||
this.links.push({ sid: f, tid: t });
|
||||
}
|
||||
```
|
||||
|
||||
ടെർമിനലിൽ നിന്ന് നിങ്ങളുടെ ആപ്പ് (npm run serve) ഓടിച്ച് ദൃശ്യവത്കരണം ആസ്വദിക്കുക!
|
||||
|
||||
## 🚀 ചലഞ്ച്
|
||||
|
||||
ഇന്റർനെറ്റിൽ വഞ്ചനാപരമായ ദൃശ്യവത്കരണങ്ങൾ കണ്ടെത്താൻ ഒരു യാത്ര നടത്തുക. എഴുത്തുകാരൻ ഉപയോക്താവിനെ എങ്ങനെ വഞ്ചിക്കുന്നു, അത് ഉദ്ദേശിച്ചിട്ടുള്ളതാണോ? ദൃശ്യവത്കരണങ്ങൾ ശരിയാക്കാൻ ശ്രമിച്ച് അവ എങ്ങനെ കാണിക്കണം എന്ന് കാണിക്കുക.
|
||||
|
||||
## [പോസ്റ്റ്-ലെക്ചർ ക്വിസ്](https://ff-quizzes.netlify.app/en/ds/quiz/25)
|
||||
|
||||
## അവലോകനം & സ്വയം പഠനം
|
||||
|
||||
വഞ്ചനാപരമായ ഡാറ്റാ ദൃശ്യവത്കരണങ്ങളെക്കുറിച്ച് വായിക്കാൻ ചില ലേഖനങ്ങൾ:
|
||||
|
||||
https://gizmodo.com/how-to-lie-with-data-visualization-1563576606
|
||||
|
||||
http://ixd.prattsi.org/2017/12/visual-lies-usability-in-deceptive-data-visualizations/
|
||||
|
||||
ചരിത്ര ആസ്തികളും കലാസാമഗ്രികളും സംബന്ധിച്ച രസകരമായ ദൃശ്യവത്കരണങ്ങൾ കാണുക:
|
||||
|
||||
https://handbook.pubpub.org/
|
||||
|
||||
അനിമേഷൻ നിങ്ങളുടെ ദൃശ്യവത്കരണങ്ങൾ എങ്ങനെ മെച്ചപ്പെടുത്താമെന്ന് ഈ ലേഖനം കാണുക:
|
||||
|
||||
https://medium.com/@EvanSinar/use-animation-to-supercharge-data-visualization-cd905a882ad4
|
||||
|
||||
## അസൈൻമെന്റ്
|
||||
|
||||
[നിങ്ങളുടെ സ്വന്തം കസ്റ്റം ദൃശ്യവത്കരണം നിർമ്മിക്കുക](assignment.md)
|
||||
|
||||
---
|
||||
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
|
||||
**അസൂയാ**:
|
||||
ഈ രേഖ AI വിവർത്തന സേവനം [Co-op Translator](https://github.com/Azure/co-op-translator) ഉപയോഗിച്ച് വിവർത്തനം ചെയ്തതാണ്. നാം കൃത്യതയ്ക്ക് ശ്രമിച്ചിട്ടുണ്ടെങ്കിലും, സ്വയം പ്രവർത്തിക്കുന്ന വിവർത്തനങ്ങളിൽ പിശകുകൾ അല്ലെങ്കിൽ തെറ്റുകൾ ഉണ്ടാകാമെന്ന് ദയവായി ശ്രദ്ധിക്കുക. അതിന്റെ മാതൃഭാഷയിലുള്ള യഥാർത്ഥ രേഖയാണ് പ്രാമാണികമായ ഉറവിടം എന്ന് പരിഗണിക്കേണ്ടതാണ്. നിർണായകമായ വിവരങ്ങൾക്ക്, പ്രൊഫഷണൽ മനുഷ്യ വിവർത്തനം ശുപാർശ ചെയ്യപ്പെടുന്നു. ഈ വിവർത്തനം ഉപയോഗിക്കുന്നതിൽ നിന്നുണ്ടാകുന്ന ഏതെങ്കിലും തെറ്റിദ്ധാരണകൾക്കോ തെറ്റായ വ്യാഖ്യാനങ്ങൾക്കോ ഞങ്ങൾ ഉത്തരവാദികളല്ല.
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER END -->
|
||||
File diff suppressed because one or more lines are too long
@ -0,0 +1,233 @@
|
||||
<!--
|
||||
CO_OP_TRANSLATOR_METADATA:
|
||||
{
|
||||
"original_hash": "22acf28f518a4769ea14fa42f4734b9f",
|
||||
"translation_date": "2025-12-19T16:32:46+00:00",
|
||||
"source_file": "3-Data-Visualization/R/09-visualization-quantities/README.md",
|
||||
"language_code": "ml"
|
||||
}
|
||||
-->
|
||||
# അളവുകൾ ദൃശ്യവൽക്കരിക്കൽ
|
||||
| എന്നവരുടെ സ്കെച്ച്നോട്ട് ](https://github.com/microsoft/Data-Science-For-Beginners/blob/main/sketchnotes/09-Visualizing-Quantities.png)|
|
||||
|:---:|
|
||||
| അളവുകൾ ദൃശ്യവൽക്കരിക്കൽ - _[@nitya](https://twitter.com/nitya) എന്നവരുടെ സ്കെച്ച്നോട്ട്_ |
|
||||
|
||||
ഈ പാഠത്തിൽ, അളവിന്റെ ആശയത്തെ ചുറ്റിപ്പറ്റി രസകരമായ ദൃശ്യവൽക്കരണങ്ങൾ സൃഷ്ടിക്കാൻ ഉപയോഗിക്കാവുന്ന നിരവധി R പാക്കേജുകൾ എങ്ങനെ ഉപയോഗിക്കാമെന്ന് നിങ്ങൾ പഠിക്കും. മിന്നസോട്ടയുടെ പക്ഷികളെക്കുറിച്ചുള്ള ശുദ്ധീകരിച്ച ഡാറ്റാസെറ്റ് ഉപയോഗിച്ച്, പ്രാദേശിക വന്യജീവികളെക്കുറിച്ചുള്ള നിരവധി രസകരമായ വസ്തുതകൾ നിങ്ങൾക്ക് അറിയാം.
|
||||
## [പാഠം മുൻകൂർ ക്വിസ്](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/16)
|
||||
|
||||
## ggplot2 ഉപയോഗിച്ച് വിങ്സ്പാൻ നിരീക്ഷിക്കുക
|
||||
വിവിധ തരത്തിലുള്ള ലളിതവും സങ്കീർണ്ണവുമായ പ്ലോട്ടുകളും ചാർട്ടുകളും സൃഷ്ടിക്കാൻ മികച്ച ലൈബ്രറി [ggplot2](https://cran.r-project.org/web/packages/ggplot2/index.html) ആണ്. പൊതുവായി, ഈ ലൈബ്രറികൾ ഉപയോഗിച്ച് ഡാറ്റ പ്ലോട്ട് ചെയ്യാനുള്ള പ്രക്രിയയിൽ നിങ്ങളുടെ ഡാറ്റാഫ്രെയിമിന്റെ ലക്ഷ്യമിടേണ്ട ഭാഗങ്ങൾ തിരിച്ചറിയുക, ആവശ്യമായ മാറ്റങ്ങൾ ചെയ്യുക, അതിന്റെ x, y അക്ഷ മൂല്യങ്ങൾ നിശ്ചയിക്കുക, ഏത് തരത്തിലുള്ള പ്ലോട്ട് കാണിക്കണമെന്ന് തീരുമാനിക്കുക, പിന്നെ പ്ലോട്ട് കാണിക്കുക എന്നിവ ഉൾപ്പെടുന്നു.
|
||||
|
||||
`ggplot2` The Grammar of Graphics-നെ അടിസ്ഥാനമാക്കി ഗ്രാഫിക്സ് പ്രഖ്യാപനാത്മകമായി സൃഷ്ടിക്കുന്ന ഒരു സിസ്റ്റമാണ്. [The Grammar of Graphics](https://en.wikipedia.org/wiki/Ggplot2) ഡാറ്റാ ദൃശ്യവൽക്കരണത്തിന് ഒരു പൊതുവായ പദ്ധതി ആണ്, ഇത് ഗ്രാഫുകളെ സ്കെയിലുകളും ലെയറുകളും പോലുള്ള സാംവേദനാത്മക ഘടകങ്ങളായി വിഭജിക്കുന്നു. മറ്റൊരു വാക്കിൽ പറഞ്ഞാൽ, കുറച്ച് കോഡിൽ ഏകവിവരശേഷിയുള്ളതോ ബഹുവിവരശേഷിയുള്ളതോ ആയ ഡാറ്റയ്ക്ക് പ്ലോട്ടുകളും ഗ്രാഫുകളും സൃഷ്ടിക്കാൻ എളുപ്പം ഉള്ളതിനാൽ `ggplot2` R-ൽ ദൃശ്യവൽക്കരണത്തിന് ഏറ്റവും ജനപ്രിയമായ പാക്കേജാണ്. ഉപയോക്താവ് `ggplot2`-ന് എങ്ങനെ വേരിയബിളുകൾ എസ്റ്ററ്റിക്സിലേക്ക് മാപ്പ് ചെയ്യാമെന്ന്, ഉപയോഗിക്കേണ്ട ഗ്രാഫിക്കൽ പ്രിമിറ്റീവുകൾ എന്തെന്ന് പറയുന്നു, പിന്നെ ബാക്കി കാര്യങ്ങൾ `ggplot2` കൈകാര്യം ചെയ്യുന്നു.
|
||||
|
||||
> ✅ പ്ലോട്ട് = ഡാറ്റ + എസ്റ്ററ്റിക്സ് + ജ്യാമിതി
|
||||
> - ഡാറ്റ ഡാറ്റാസെറ്റിനെ സൂചിപ്പിക്കുന്നു
|
||||
> - എസ്റ്ററ്റിക്സ് പഠിക്കേണ്ട വേരിയബിളുകൾ (x, y വേരിയബിളുകൾ) സൂചിപ്പിക്കുന്നു
|
||||
> - ജ്യാമിതി പ്ലോട്ടിന്റെ തരം (ലൈൻ പ്ലോട്ട്, ബാർ പ്ലോട്ട്, മുതലായവ) സൂചിപ്പിക്കുന്നു
|
||||
|
||||
നിങ്ങളുടെ ഡാറ്റയും പ്ലോട്ടിലൂടെ പറയാൻ ആഗ്രഹിക്കുന്ന കഥയും അനുസരിച്ച് മികച്ച ജ്യാമിതി (പ്ലോട്ടിന്റെ തരം) തിരഞ്ഞെടുക്കുക.
|
||||
|
||||
> - പ്രവണതകൾ വിശകലനം ചെയ്യാൻ: ലൈൻ, കോളം
|
||||
> - മൂല്യങ്ങൾ താരതമ്യം ചെയ്യാൻ: ബാർ, കോളം, പൈ, സ്കാറ്റർപ്ലോട്ട്
|
||||
> - ഭാഗങ്ങൾ മുഴുവൻ എങ്ങനെ ബന്ധപ്പെട്ടിരിക്കുന്നു കാണിക്കാൻ: പൈ
|
||||
> - ഡാറ്റയുടെ വിതരണങ്ങൾ കാണിക്കാൻ: സ്കാറ്റർപ്ലോട്ട്, ബാർ
|
||||
> - മൂല്യങ്ങൾ തമ്മിലുള്ള ബന്ധങ്ങൾ കാണിക്കാൻ: ലൈൻ, സ്കാറ്റർപ്ലോട്ട്, ബബിൾ
|
||||
|
||||
✅ ggplot2-ക്കായി ഈ വിവരണാത്മക [ചീറ്റ്ഷീറ്റ്](https://nyu-cdsc.github.io/learningr/assets/data-visualization-2.1.pdf) നിങ്ങൾക്ക് പരിശോധിക്കാം.
|
||||
|
||||
## പക്ഷികളുടെ വിങ്സ്പാൻ മൂല്യങ്ങളെക്കുറിച്ച് ഒരു ലൈൻ പ്ലോട്ട് നിർമ്മിക്കുക
|
||||
|
||||
R കൺസോൾ തുറന്ന് ഡാറ്റാസെറ്റ് ഇറക്കുമതി ചെയ്യുക.
|
||||
> കുറിപ്പ്: ഡാറ്റാസെറ്റ് ഈ റിപോസിറ്ററിയുടെ റൂട്ടിലുള്ള `/data` ഫോൾഡറിൽ സൂക്ഷിച്ചിരിക്കുന്നു.
|
||||
|
||||
ഡാറ്റാസെറ്റ് ഇറക്കുമതി ചെയ്ത് ഡാറ്റയുടെ മുകളിൽ (മുകളിൽ 5 വരികൾ) നോക്കാം.
|
||||
|
||||
```r
|
||||
birds <- read.csv("../../data/birds.csv",fileEncoding="UTF-8-BOM")
|
||||
head(birds)
|
||||
```
|
||||
ഡാറ്റയുടെ മുകളിൽ ടെക്സ്റ്റും സംഖ്യകളും ചേർന്നിരിക്കുന്നു:
|
||||
|
||||
| | Name | ScientificName | Category | Order | Family | Genus | ConservationStatus | MinLength | MaxLength | MinBodyMass | MaxBodyMass | MinWingspan | MaxWingspan |
|
||||
| ---: | :--------------------------- | :--------------------- | :-------------------- | :----------- | :------- | :---------- | :----------------- | --------: | --------: | ----------: | ----------: | ----------: | ----------: |
|
||||
| 0 | Black-bellied whistling-duck | Dendrocygna autumnalis | Ducks/Geese/Waterfowl | Anseriformes | Anatidae | Dendrocygna | LC | 47 | 56 | 652 | 1020 | 76 | 94 |
|
||||
| 1 | Fulvous whistling-duck | Dendrocygna bicolor | Ducks/Geese/Waterfowl | Anseriformes | Anatidae | Dendrocygna | LC | 45 | 53 | 712 | 1050 | 85 | 93 |
|
||||
| 2 | Snow goose | Anser caerulescens | Ducks/Geese/Waterfowl | Anseriformes | Anatidae | Anser | LC | 64 | 79 | 2050 | 4050 | 135 | 165 |
|
||||
| 3 | Ross's goose | Anser rossii | Ducks/Geese/Waterfowl | Anseriformes | Anatidae | Anser | LC | 57.3 | 64 | 1066 | 1567 | 113 | 116 |
|
||||
| 4 | Greater white-fronted goose | Anser albifrons | Ducks/Geese/Waterfowl | Anseriformes | Anatidae | Anser | LC | 64 | 81 | 1930 | 3310 | 130 | 165 |
|
||||
|
||||
അടിസ്ഥാന ലൈൻ പ്ലോട്ട് ഉപയോഗിച്ച് ചില സംഖ്യാത്മക ഡാറ്റ പ്ലോട്ട് ചെയ്യുന്നതിലൂടെ തുടങ്ങാം. ഈ രസകരമായ പക്ഷികളുടെ പരമാവധി വിങ്സ്പാൻ കാണാൻ നിങ്ങൾ ആഗ്രഹിക്കുന്നുവെന്ന് കരുതുക.
|
||||
|
||||
```r
|
||||
install.packages("ggplot2")
|
||||
library("ggplot2")
|
||||
ggplot(data=birds, aes(x=Name, y=MaxWingspan,group=1)) +
|
||||
geom_line()
|
||||
```
|
||||
ഇവിടെ, `ggplot2` പാക്കേജ് ഇൻസ്റ്റാൾ ചെയ്ത് `library("ggplot2")` കമാൻഡ് ഉപയോഗിച്ച് വർക്ക്സ്പേസിലേക്ക് ഇറക്കുമതി ചെയ്യുന്നു. ggplot-ൽ ഏതെങ്കിലും പ്ലോട്ട് ചെയ്യാൻ `ggplot()` ഫംഗ്ഷൻ ഉപയോഗിക്കുന്നു, ഡാറ്റാസെറ്റ്, x, y വേരിയബിളുകൾ ആട്രിബ്യൂട്ടുകളായി നിശ്ചയിക്കുന്നു. ഈ കേസിൽ, ലൈൻ പ്ലോട്ട് സൃഷ്ടിക്കാനാണ് ഉദ്ദേശം, അതിനാൽ `geom_line()` ഫംഗ്ഷൻ ഉപയോഗിക്കുന്നു.
|
||||
|
||||

|
||||
|
||||
നിങ്ങൾ ഉടൻ ശ്രദ്ധിക്കുന്നതെന്താണ്? കുറഞ്ഞത് ഒരു ഔട്ട്ലൈയർ ഉണ്ടെന്ന് തോന്നുന്നു - അത്ര വലിയ വിങ്സ്പാൻ! 2000+ സെന്റീമീറ്റർ വിങ്സ്പാൻ 20 മീറ്ററിലധികമാണ് - മിന്നസോട്ടയിൽ പ്റ്റെറോഡാക്റ്റിലുകൾ നടക്കുകയാണോ? പരിശോധിക്കാം.
|
||||
|
||||
Excel-ൽ ഒരു വേഗത്തിലുള്ള സോർട്ട് ചെയ്ത് ആ ഔട്ട്ലൈയറുകൾ കണ്ടെത്താമെങ്കിലും, അവ ടൈപ്പോസ് ആകാമെന്ന് കരുതുന്നു, പ്ലോട്ടിൽ നിന്നുള്ള ദൃശ്യവൽക്കരണ പ്രക്രിയ തുടരുക.
|
||||
|
||||
x-അക്ഷത്തിൽ ലേബലുകൾ ചേർക്കുക, ഏത് തരത്തിലുള്ള പക്ഷികളാണെന്ന് കാണിക്കാൻ:
|
||||
|
||||
```r
|
||||
ggplot(data=birds, aes(x=Name, y=MaxWingspan,group=1)) +
|
||||
geom_line() +
|
||||
theme(axis.text.x = element_text(angle = 45, hjust=1))+
|
||||
xlab("Birds") +
|
||||
ylab("Wingspan (CM)") +
|
||||
ggtitle("Max Wingspan in Centimeters")
|
||||
```
|
||||
`theme`-ൽ ആംഗിൾ നിശ്ചയിച്ച് `xlab()`-ൽ x അക്ഷ ലേബൽ, `ylab()`-ൽ y അക്ഷ ലേബൽ നിശ്ചയിക്കുന്നു. `ggtitle()` ഗ്രാഫ്/പ്ലോട്ടിന് പേര് നൽകുന്നു.
|
||||
|
||||

|
||||
|
||||
45 ഡിഗ്രി ലേബലുകൾ തിരിയിച്ചിട്ടും വായിക്കാൻ വളരെ അധികം ലേബലുകൾ ഉണ്ട്. വ്യത്യസ്തമായ ഒരു തന്ത്രം പരീക്ഷിക്കാം: ആ ഔട്ട്ലൈയറുകൾക്ക് മാത്രമേ ലേബലുകൾ നൽകൂ, ലേബലുകൾ ചാർട്ടിനുള്ളിൽ സജ്ജമാക്കൂ. ലേബലിംഗിന് കൂടുതൽ സ്ഥലം നൽകാൻ സ്കാറ്റർ ചാർട്ട് ഉപയോഗിക്കാം:
|
||||
|
||||
```r
|
||||
ggplot(data=birds, aes(x=Name, y=MaxWingspan,group=1)) +
|
||||
geom_point() +
|
||||
geom_text(aes(label=ifelse(MaxWingspan>500,as.character(Name),'')),hjust=0,vjust=0) +
|
||||
theme(axis.title.x=element_blank(), axis.text.x=element_blank(), axis.ticks.x=element_blank())
|
||||
ylab("Wingspan (CM)") +
|
||||
ggtitle("Max Wingspan in Centimeters") +
|
||||
```
|
||||
ഇവിടെ എന്താണ് സംഭവിക്കുന്നത്? `geom_point()` ഫംഗ്ഷൻ ഉപയോഗിച്ച് സ്കാറ്റർ പോയിന്റുകൾ പ്ലോട്ട് ചെയ്തു. `MaxWingspan > 500` ഉള്ള പക്ഷികൾക്ക് ലേബലുകൾ ചേർത്തു, പ്ലോട്ടിന്റെ ക്ലട്ടർ കുറയ്ക്കാൻ x അക്ഷ上的 ലേബലുകൾ മറച്ചു.
|
||||
|
||||
നിങ്ങൾ എന്ത് കണ്ടെത്തുന്നു?
|
||||
|
||||

|
||||
|
||||
## നിങ്ങളുടെ ഡാറ്റ ഫിൽട്ടർ ചെയ്യുക
|
||||
|
||||
ബാൾഡ് ഈഗിൾ, പ്രെയറി ഫാൽക്കൺ എന്നിവ വലിയ പക്ഷികളായിരിക്കാം, പക്ഷേ പരമാവധി വിങ്സ്പാനിൽ ഒരു അധികം 0 ചേർത്തു തെറ്റായി ലേബൽ ചെയ്തതായി തോന്നുന്നു. 25 മീറ്റർ വിങ്സ്പാൻ ഉള്ള ബാൾഡ് ഈഗിൾ കാണാൻ സാധ്യത കുറവാണ്, പക്ഷേ ഉണ്ടെങ്കിൽ ഞങ്ങളെ അറിയിക്കുക! ആ രണ്ട് ഔട്ട്ലൈയറുകൾ ഇല്ലാതെ പുതിയ ഡാറ്റാഫ്രെയിം സൃഷ്ടിക്കാം:
|
||||
|
||||
```r
|
||||
birds_filtered <- subset(birds, MaxWingspan < 500)
|
||||
|
||||
ggplot(data=birds_filtered, aes(x=Name, y=MaxWingspan,group=1)) +
|
||||
geom_point() +
|
||||
ylab("Wingspan (CM)") +
|
||||
xlab("Birds") +
|
||||
ggtitle("Max Wingspan in Centimeters") +
|
||||
geom_text(aes(label=ifelse(MaxWingspan>500,as.character(Name),'')),hjust=0,vjust=0) +
|
||||
theme(axis.text.x=element_blank(), axis.ticks.x=element_blank())
|
||||
```
|
||||
പുതിയ ഡാറ്റാഫ്രെയിം `birds_filtered` സൃഷ്ടിച്ച് സ്കാറ്റർ പ്ലോട്ട് ചെയ്തു. ഔട്ട്ലൈയറുകൾ ഫിൽട്ടർ ചെയ്തതിനാൽ, നിങ്ങളുടെ ഡാറ്റ കൂടുതൽ ഏകീകൃതവും മനസ്സിലാക്കാൻ എളുപ്പവുമാണ്.
|
||||
|
||||

|
||||
|
||||
ഇപ്പോൾ വിങ്സ്പാൻ സംബന്ധിച്ച് കുറഞ്ഞത് ശുദ്ധമായ ഡാറ്റാസെറ്റ് ഉണ്ടെന്ന് കരുതി, ഈ പക്ഷികളെക്കുറിച്ച് കൂടുതൽ കണ്ടെത്താം.
|
||||
|
||||
ലൈൻ, സ്കാറ്റർ പ്ലോട്ടുകൾ ഡാറ്റ മൂല്യങ്ങളും അവയുടെ വിതരണങ്ങളും പ്രദർശിപ്പിക്കുമ്പോൾ, ഈ ഡാറ്റാസെറ്റിൽ ഉള്ള മൂല്യങ്ങളെക്കുറിച്ച് ചിന്തിക്കണം. അളവിനെക്കുറിച്ച് താഴെ പറയുന്ന ചോദ്യങ്ങൾക്ക് ഉത്തരം കണ്ടെത്താൻ ദൃശ്യവൽക്കരണങ്ങൾ സൃഷ്ടിക്കാം:
|
||||
|
||||
> പക്ഷികളുടെ എത്ര വിഭാഗങ്ങളുണ്ട്, അവയുടെ എണ്ണം എത്ര?
|
||||
> എത്ര പക്ഷികൾ നശിച്ചുപോയവ, അപകടത്തിൽപെട്ടവ, അപൂർവം, സാധാരണ?
|
||||
> ലിനിയസിന്റെ പദവ്യവസ്ഥയിൽ വിവിധ ജീനസുകളും ഓർഡറുകളും എത്ര?
|
||||
|
||||
## ബാർ ചാർട്ടുകൾ പരിശോധിക്കുക
|
||||
|
||||
ഡാറ്റ ഗ്രൂപ്പുകൾ കാണിക്കേണ്ടപ്പോൾ ബാർ ചാർട്ടുകൾ പ്രായോഗികമാണ്. ഈ ഡാറ്റാസെറ്റിലെ പക്ഷികളുടെ വിഭാഗങ്ങൾ പരിശോധിച്ച് ഏത് വിഭാഗം ഏറ്റവും സാധാരണമാണെന്ന് കാണാം. ഫിൽട്ടർ ചെയ്ത ഡാറ്റയിൽ ബാർ ചാർട്ട് സൃഷ്ടിക്കാം.
|
||||
|
||||
```r
|
||||
install.packages("dplyr")
|
||||
install.packages("tidyverse")
|
||||
|
||||
library(lubridate)
|
||||
library(scales)
|
||||
library(dplyr)
|
||||
library(ggplot2)
|
||||
library(tidyverse)
|
||||
|
||||
birds_filtered %>% group_by(Category) %>%
|
||||
summarise(n=n(),
|
||||
MinLength = mean(MinLength),
|
||||
MaxLength = mean(MaxLength),
|
||||
MinBodyMass = mean(MinBodyMass),
|
||||
MaxBodyMass = mean(MaxBodyMass),
|
||||
MinWingspan=mean(MinWingspan),
|
||||
MaxWingspan=mean(MaxWingspan)) %>%
|
||||
gather("key", "value", - c(Category, n)) %>%
|
||||
ggplot(aes(x = Category, y = value, group = key, fill = key)) +
|
||||
geom_bar(stat = "identity") +
|
||||
scale_fill_manual(values = c("#D62728", "#FF7F0E", "#8C564B","#2CA02C", "#1F77B4", "#9467BD")) +
|
||||
xlab("Category")+ggtitle("Birds of Minnesota")
|
||||
|
||||
```
|
||||
താഴെ കൊടുത്തിരിക്കുന്ന കോഡിൽ, ഡാറ്റ മാനിപ്പുലേറ്റ് ചെയ്ത് ഗ്രൂപ്പ് ചെയ്യാൻ സഹായിക്കുന്ന [dplyr](https://www.rdocumentation.org/packages/dplyr/versions/0.7.8)യും [lubridate](https://www.rdocumentation.org/packages/lubridate/versions/1.8.0)യും പാക്കേജുകൾ ഇൻസ്റ്റാൾ ചെയ്യുന്നു. ആദ്യം, പക്ഷികളുടെ `Category` പ്രകാരം ഡാറ്റ ഗ്രൂപ്പ് ചെയ്ത് `MinLength`, `MaxLength`, `MinBodyMass`, `MaxBodyMass`, `MinWingspan`, `MaxWingspan` കോളങ്ങൾ സംഗ്രഹിക്കുന്നു. പിന്നെ `ggplot2` ഉപയോഗിച്ച് ബാർ ചാർട്ട് പ്ലോട്ട് ചെയ്യുന്നു, വ്യത്യസ്ത വിഭാഗങ്ങൾക്ക് നിറങ്ങൾ നിശ്ചയിച്ച് ലേബലുകൾ ചേർക്കുന്നു.
|
||||
|
||||

|
||||
|
||||
ഈ ബാർ ചാർട്ട് വായിക്കാൻ ബുദ്ധിമുട്ടാണ്, കാരണം ഗ്രൂപ്പ് ചെയ്യാത്ത ഡാറ്റ വളരെ കൂടുതലാണ്. നിങ്ങൾ പ്ലോട്ട് ചെയ്യാൻ ആഗ്രഹിക്കുന്ന ഡാറ്റ മാത്രം തിരഞ്ഞെടുക്കണം, അതിനാൽ പക്ഷികളുടെ നീളം അവരുടെ വിഭാഗം അടിസ്ഥാനമാക്കി നോക്കാം.
|
||||
|
||||
പക്ഷികളുടെ വിഭാഗം മാത്രം ഉൾപ്പെടുത്താൻ ഡാറ്റ ഫിൽട്ടർ ചെയ്യുക.
|
||||
|
||||
വിവിധ വിഭാഗങ്ങൾ 많아서, ഈ ചാർട്ട് ലംബമായി പ്രദർശിപ്പിച്ച് ഉയരം ക്രമീകരിച്ച് എല്ലാ ഡാറ്റയും ഉൾപ്പെടുത്താം:
|
||||
|
||||
```r
|
||||
birds_count<-dplyr::count(birds_filtered, Category, sort = TRUE)
|
||||
birds_count$Category <- factor(birds_count$Category, levels = birds_count$Category)
|
||||
ggplot(birds_count,aes(Category,n))+geom_bar(stat="identity")+coord_flip()
|
||||
```
|
||||
`Category` കോളത്തിൽ ഉള്ള വ്യത്യസ്ത മൂല്യങ്ങൾ എണ്ണുകയും അവ `birds_count` എന്ന പുതിയ ഡാറ്റാഫ്രെയിമിൽ ക്രമീകരിക്കുകയും ചെയ്യുന്നു. ഈ ക്രമീകരിച്ച ഡാറ്റയെ ഫാക്ടർ ലെവലിൽ ഉൾപ്പെടുത്തി ക്രമീകരിച്ച രീതിയിൽ പ്ലോട്ട് ചെയ്യുന്നു. `ggplot2` ഉപയോഗിച്ച് ബാർ ചാർട്ട് സൃഷ്ടിക്കുന്നു. `coord_flip()` ഉപയോഗിച്ച് ഹോരിസോണ്ടൽ ബാറുകൾ പ്ലോട്ട് ചെയ്യുന്നു.
|
||||
|
||||

|
||||
|
||||
ഈ ബാർ ചാർട്ട് ഓരോ വിഭാഗത്തിലും പക്ഷികളുടെ എണ്ണം നല്ല രീതിയിൽ കാണിക്കുന്നു. ഒരു നിമിഷത്തിൽ, ഈ പ്രദേശത്തെ ഏറ്റവും വലിയ പക്ഷി എണ്ണം Ducks/Geese/Waterfowl വിഭാഗത്തിലാണ് എന്ന് കാണാം. മിന്നസോട്ട '10,000 തടാകങ്ങളുടെ നാട്' ആകുന്നതിനാൽ ഇത് അത്ഭുതകരമല്ല!
|
||||
|
||||
✅ ഈ ഡാറ്റാസെറ്റിൽ മറ്റ് എണ്ണങ്ങൾ പരീക്ഷിച്ച് നോക്കൂ. എന്തെങ്കിലും അത്ഭുതപ്പെടുത്തുന്നുണ്ടോ?
|
||||
|
||||
## ഡാറ്റ താരതമ്യം ചെയ്യൽ
|
||||
|
||||
ഗ്രൂപ്പ് ചെയ്ത ഡാറ്റയുടെ വ്യത്യസ്ത താരതമ്യങ്ങൾ പുതിയ അക്ഷങ്ങൾ സൃഷ്ടിച്ച് പരീക്ഷിക്കാം. പക്ഷിയുടെ പരമാവധി നീളം (MaxLength) അവയുടെ വിഭാഗം അടിസ്ഥാനമാക്കി താരതമ്യം ചെയ്യുക:
|
||||
|
||||
```r
|
||||
birds_grouped <- birds_filtered %>%
|
||||
group_by(Category) %>%
|
||||
summarise(
|
||||
MaxLength = max(MaxLength, na.rm = T),
|
||||
MinLength = max(MinLength, na.rm = T)
|
||||
) %>%
|
||||
arrange(Category)
|
||||
|
||||
ggplot(birds_grouped,aes(Category,MaxLength))+geom_bar(stat="identity")+coord_flip()
|
||||
```
|
||||
`birds_filtered` ഡാറ്റ `Category` പ്രകാരം ഗ്രൂപ്പ് ചെയ്ത് ബാർ ഗ്രാഫ് പ്ലോട്ട് ചെയ്യുന്നു.
|
||||
|
||||

|
||||
|
||||
ഇവിടെ അത്ഭുതകരമായ ഒന്നുമില്ല: ഹമ്മിംഗ്ബർഡുകൾക്ക് പെലിക്കാനുകളോ ഗീസുകളോ അപേക്ഷിച്ച് ഏറ്റവും കുറഞ്ഞ MaxLength ഉണ്ട്. ഡാറ്റ ലജിക്കൽ ആകുമ്പോൾ നല്ലതാണ്!
|
||||
|
||||
ബാർ ചാർട്ടുകളുടെ കൂടുതൽ രസകരമായ ദൃശ്യവൽക്കരണങ്ങൾ സൃഷ്ടിക്കാൻ ഡാറ്റ സൂപ്പറിംപോസ് ചെയ്യാം. ഒരു പക്ഷി വിഭാഗത്തിൽ കുറഞ്ഞതും പരമാവതുമായ നീളം സൂപ്പറിംപോസ് ചെയ്യാം:
|
||||
|
||||
```r
|
||||
ggplot(data=birds_grouped, aes(x=Category)) +
|
||||
geom_bar(aes(y=MaxLength), stat="identity", position ="identity", fill='blue') +
|
||||
geom_bar(aes(y=MinLength), stat="identity", position="identity", fill='orange')+
|
||||
coord_flip()
|
||||
```
|
||||

|
||||
|
||||
## 🚀 ചലഞ്ച്
|
||||
|
||||
ഈ പക്ഷി ഡാറ്റാസെറ്റ് ഒരു പ്രത്യേക പരിസ്ഥിതിയിലെ വിവിധ തരത്തിലുള്ള പക്ഷികളെക്കുറിച്ചുള്ള ധാരാളം വിവരങ്ങൾ നൽകുന്നു. ഇന്റർനെറ്റിൽ തിരയുക, മറ്റ് പക്ഷി-കേന്ദ്രിത ഡാറ്റാസെറ്റുകൾ കണ്ടെത്താൻ ശ്രമിക്കുക. ഈ പക്ഷികളെക്കുറിച്ച് നിങ്ങൾ അറിയാത്ത വസ്തുതകൾ കണ്ടെത്താൻ ചാർട്ടുകളും ഗ്രാഫുകളും നിർമ്മിക്കാൻ അഭ്യാസം ചെയ്യുക.
|
||||
|
||||
## [പാഠം ശേഷം ക്വിസ്](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/17)
|
||||
|
||||
## അവലോകനം & സ്വയം പഠനം
|
||||
|
||||
ഈ ആദ്യ പാഠം `ggplot2` ഉപയോഗിച്ച് അളവുകൾ ദൃശ്യവൽക്കരിക്കുന്നതിനെക്കുറിച്ച് ചില വിവരങ്ങൾ നൽകി. ദൃശ്യവൽക്കരണത്തിനായി ഡാറ്റാസെറ്റുകൾ ഉപയോഗിക്കുന്ന മറ്റ് മാർഗങ്ങൾക്കായി കുറച്ച് ഗവേഷണം ചെയ്യുക. [Lattice](https://stat.ethz.ch/R-manual/R-devel/library/lattice/html/Lattice.html)യും [Plotly](https://github.com/plotly/plotly.R#readme) പോലുള്ള മറ്റ് പാക്കേജുകൾ ഉപയോഗിച്ച് ദൃശ്യവൽക്കരിക്കാൻ കഴിയുന്ന ഡാറ്റാസെറ്റുകൾ അന്വേഷിക്കുക.
|
||||
|
||||
## അസൈൻമെന്റ്
|
||||
[ലൈൻസ്, സ്കാറ്റേഴ്സ്, ആൻഡ് ബാർസ്](assignment.md)
|
||||
|
||||
---
|
||||
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
|
||||
**അസൂയാ**:
|
||||
ഈ രേഖ AI വിവർത്തന സേവനം [Co-op Translator](https://github.com/Azure/co-op-translator) ഉപയോഗിച്ച് വിവർത്തനം ചെയ്തതാണ്. നാം കൃത്യതയ്ക്ക് ശ്രമിച്ചെങ്കിലും, സ്വയം പ്രവർത്തിക്കുന്ന വിവർത്തനങ്ങളിൽ പിശകുകൾ അല്ലെങ്കിൽ തെറ്റുകൾ ഉണ്ടാകാമെന്ന് ദയവായി ശ്രദ്ധിക്കുക. അതിന്റെ മാതൃഭാഷയിലുള്ള യഥാർത്ഥ രേഖയാണ് പ്രാമാണികമായ ഉറവിടം എന്ന് പരിഗണിക്കേണ്ടതാണ്. നിർണായകമായ വിവരങ്ങൾക്ക്, പ്രൊഫഷണൽ മനുഷ്യ വിവർത്തനം ശുപാർശ ചെയ്യപ്പെടുന്നു. ഈ വിവർത്തനം ഉപയോഗിക്കുന്നതിൽ നിന്നുണ്ടാകുന്ന ഏതെങ്കിലും തെറ്റിദ്ധാരണകൾക്കോ തെറ്റായ വ്യാഖ്യാനങ്ങൾക്കോ ഞങ്ങൾ ഉത്തരവാദികളല്ല.
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER END -->
|
||||
@ -0,0 +1,27 @@
|
||||
<!--
|
||||
CO_OP_TRANSLATOR_METADATA:
|
||||
{
|
||||
"original_hash": "0ea21b6513df5ade7419c6b7d65f10b1",
|
||||
"translation_date": "2025-12-19T16:34:47+00:00",
|
||||
"source_file": "3-Data-Visualization/R/09-visualization-quantities/assignment.md",
|
||||
"language_code": "ml"
|
||||
}
|
||||
-->
|
||||
# ലൈനുകൾ, സ്കാറ്ററുകൾ, ബാറുകൾ
|
||||
|
||||
## നിർദ്ദേശങ്ങൾ
|
||||
|
||||
ഈ പാഠത്തിൽ, നിങ്ങൾ ലൈന്ചാർട്ടുകൾ, സ്കാറ്റർപ്ലോട്ടുകൾ, ബാർ ചാർട്ടുകൾ ഉപയോഗിച്ച് ഈ ഡാറ്റാസെറ്റിനെക്കുറിച്ചുള്ള രസകരമായ വസ്തുതകൾ കാണിച്ചു. ഈ അസൈൻമെന്റിൽ, ഒരു നിശ്ചിത പക്ഷിയുടെ ഒരു വസ്തുത കണ്ടെത്താൻ ഡാറ്റാസെറ്റിൽ കൂടുതൽ ആഴത്തിൽ തിരയുക. ഉദാഹരണത്തിന്, സ്നോ ഗീസിനെക്കുറിച്ചുള്ള എല്ലാ രസകരമായ ഡാറ്റയും ദൃശ്യവൽക്കരിക്കുന്ന ഒരു സ്ക്രിപ്റ്റ് സൃഷ്ടിക്കുക. മുകളിൽ പരാമർശിച്ച മൂന്ന് പ്ലോട്ടുകളും ഉപയോഗിച്ച് നിങ്ങളുടെ നോട്ട്ബുക്കിൽ ഒരു കഥ പറയുക.
|
||||
|
||||
## റൂബ്രിക്
|
||||
|
||||
Exemplary | Adequate | Needs Improvement
|
||||
--- | --- | -- |
|
||||
ഒരു സ്ക്രിപ്റ്റ് നല്ല അനോട്ടേഷനുകളോടും, ഉറച്ച കഥ പറയലോടും, ആകർഷകമായ ഗ്രാഫുകളോടും അവതരിപ്പിക്കുന്നു | സ്ക്രിപ്റ്റിൽ ഈ ഘടകങ്ങളിൽ ഒന്നൊന്നും ഇല്ല | സ്ക്രിപ്റ്റിൽ ഈ ഘടകങ്ങളിൽ രണ്ട് ഇല്ല
|
||||
|
||||
---
|
||||
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
|
||||
**അസൂയാ**:
|
||||
ഈ രേഖ AI വിവർത്തന സേവനം [Co-op Translator](https://github.com/Azure/co-op-translator) ഉപയോഗിച്ച് വിവർത്തനം ചെയ്തതാണ്. നാം കൃത്യതയ്ക്ക് ശ്രമിച്ചിട്ടുണ്ടെങ്കിലും, സ്വയം പ്രവർത്തിക്കുന്ന വിവർത്തനങ്ങളിൽ പിശകുകൾ അല്ലെങ്കിൽ തെറ്റുകൾ ഉണ്ടാകാമെന്ന് ദയവായി ശ്രദ്ധിക്കുക. അതിന്റെ മാതൃഭാഷയിലുള്ള യഥാർത്ഥ രേഖയാണ് പ്രാമാണികമായ ഉറവിടം എന്ന് പരിഗണിക്കേണ്ടതാണ്. നിർണായകമായ വിവരങ്ങൾക്ക്, പ്രൊഫഷണൽ മനുഷ്യ വിവർത്തനം ശുപാർശ ചെയ്യപ്പെടുന്നു. ഈ വിവർത്തനം ഉപയോഗിക്കുന്നതിൽ നിന്നുണ്ടാകുന്ന ഏതെങ്കിലും തെറ്റിദ്ധാരണകൾക്കോ തെറ്റായ വ്യാഖ്യാനങ്ങൾക്കോ ഞങ്ങൾ ഉത്തരവാദികളല്ല.
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER END -->
|
||||
@ -0,0 +1,186 @@
|
||||
<!--
|
||||
CO_OP_TRANSLATOR_METADATA:
|
||||
{
|
||||
"original_hash": "ea67c0c40808fd723594de6896c37ccf",
|
||||
"translation_date": "2025-12-19T16:21:13+00:00",
|
||||
"source_file": "3-Data-Visualization/R/10-visualization-distributions/README.md",
|
||||
"language_code": "ml"
|
||||
}
|
||||
-->
|
||||
# വിതരണങ്ങൾ ദൃശ്യവൽക്കരിക്കൽ
|
||||
|
||||
| ](https://github.com/microsoft/Data-Science-For-Beginners/blob/main/sketchnotes/10-Visualizing-Distributions.png)|
|
||||
|:---:|
|
||||
| വിതരണങ്ങൾ ദൃശ്യവൽക്കരിക്കൽ - _Sketchnote by [@nitya](https://twitter.com/nitya)_ |
|
||||
|
||||
മുൻപത്തെ പാഠത്തിൽ, മിന്നസോട്ടയുടെ പക്ഷികളെക്കുറിച്ചുള്ള ഒരു ഡാറ്റാസെറ്റിനെക്കുറിച്ച് ചില രസകരമായ വസ്തുതകൾ നിങ്ങൾ പഠിച്ചു. ഔട്ട്ലയറുകൾ ദൃശ്യവൽക്കരിച്ച് ചില തെറ്റായ ഡാറ്റ കണ്ടെത്തി, കൂടാതെ പക്ഷികളുടെ പരമാവധി നീളത്തിന്റെ അടിസ്ഥാനത്തിൽ പക്ഷി വിഭാഗങ്ങൾ തമ്മിലുള്ള വ്യത്യാസങ്ങൾ നോക്കി.
|
||||
|
||||
## [പാഠം മുൻകൂർ ക്വിസ്](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/18)
|
||||
## പക്ഷികളുടെ ഡാറ്റാസെറ്റ് പരിശോധിക്കുക
|
||||
|
||||
ഡാറ്റയിൽ കൂടുതൽ ആഴത്തിൽ നോക്കാനുള്ള മറ്റൊരു മാർഗം അതിന്റെ വിതരണത്തെ, അല്ലെങ്കിൽ ഡാറ്റ ഒരു അക്ഷരേഖയിലുടനീളം എങ്ങനെ ക്രമീകരിച്ചിരിക്കുന്നുവെന്ന് നോക്കുകയാണ്. ഉദാഹരണത്തിന്, മിന്നസോട്ടയിലെ പക്ഷികളുടെ പരമാവധി വിങ്സ്പാൻ അല്ലെങ്കിൽ പരമാവധി ശരീരഭാരം എന്ന ഡാറ്റാസെറ്റിന്റെ പൊതുവായ വിതരണത്തെക്കുറിച്ച് നിങ്ങൾ അറിയാൻ ആഗ്രഹിക്കാം.
|
||||
|
||||
ഈ ഡാറ്റാസെറ്റിലെ ഡാറ്റയുടെ വിതരണങ്ങളെക്കുറിച്ച് ചില വസ്തുതകൾ കണ്ടെത്താം. നിങ്ങളുടെ R കോൺസോളിൽ `ggplot2`യും ഡാറ്റാബേസും ഇറക്കുമതി ചെയ്യുക. മുൻപത്തെ വിഷയത്തിൽപോലെ ഡാറ്റാബേസിൽ നിന്നുള്ള ഔട്ട്ലയറുകൾ നീക്കം ചെയ്യുക.
|
||||
|
||||
```r
|
||||
library(ggplot2)
|
||||
|
||||
birds <- read.csv("../../data/birds.csv",fileEncoding="UTF-8-BOM")
|
||||
|
||||
birds_filtered <- subset(birds, MaxWingspan < 500)
|
||||
head(birds_filtered)
|
||||
```
|
||||
| | Name | ScientificName | Category | Order | Family | Genus | ConservationStatus | MinLength | MaxLength | MinBodyMass | MaxBodyMass | MinWingspan | MaxWingspan |
|
||||
| ---: | :--------------------------- | :--------------------- | :-------------------- | :----------- | :------- | :---------- | :----------------- | --------: | --------: | ----------: | ----------: | ----------: | ----------: |
|
||||
| 0 | Black-bellied whistling-duck | Dendrocygna autumnalis | Ducks/Geese/Waterfowl | Anseriformes | Anatidae | Dendrocygna | LC | 47 | 56 | 652 | 1020 | 76 | 94 |
|
||||
| 1 | Fulvous whistling-duck | Dendrocygna bicolor | Ducks/Geese/Waterfowl | Anseriformes | Anatidae | Dendrocygna | LC | 45 | 53 | 712 | 1050 | 85 | 93 |
|
||||
| 2 | Snow goose | Anser caerulescens | Ducks/Geese/Waterfowl | Anseriformes | Anatidae | Anser | LC | 64 | 79 | 2050 | 4050 | 135 | 165 |
|
||||
| 3 | Ross's goose | Anser rossii | Ducks/Geese/Waterfowl | Anseriformes | Anatidae | Anser | LC | 57.3 | 64 | 1066 | 1567 | 113 | 116 |
|
||||
| 4 | Greater white-fronted goose | Anser albifrons | Ducks/Geese/Waterfowl | Anseriformes | Anatidae | Anser | LC | 64 | 81 | 1930 | 3310 | 130 | 165 |
|
||||
|
||||
സാധാരണയായി, മുൻപത്തെ പാഠത്തിൽ ചെയ്തതുപോലെ സ്കാറ്റർ പ്ലോട്ട് ഉപയോഗിച്ച് ഡാറ്റ എങ്ങനെ വിതരണം ചെയ്തിട്ടുള്ളതെന്ന് നിങ്ങൾക്ക് വേഗത്തിൽ നോക്കാം:
|
||||
|
||||
```r
|
||||
ggplot(data=birds_filtered, aes(x=Order, y=MaxLength,group=1)) +
|
||||
geom_point() +
|
||||
ggtitle("Max Length per order") + coord_flip()
|
||||
```
|
||||

|
||||
|
||||
ഇത് ഓരോ പക്ഷി ഓർഡറിനും ശരീര നീളത്തിന്റെ പൊതുവായ വിതരണത്തിന്റെ ഒരു അവലോകനമാണ് നൽകുന്നത്, പക്ഷേ യഥാർത്ഥ വിതരണങ്ങൾ പ്രദർശിപ്പിക്കാൻ ഇത് ഏറ്റവും അനുയോജ്യമായ മാർഗം അല്ല. ആ ജോലി സാധാരണയായി ഹിസ്റ്റോഗ്രാം സൃഷ്ടിച്ച് കൈകാര്യം ചെയ്യുന്നു.
|
||||
## ഹിസ്റ്റോഗ്രാമുകളുമായി പ്രവർത്തിക്കൽ
|
||||
|
||||
`ggplot2` ഡാറ്റ വിതരണങ്ങൾ ഹിസ്റ്റോഗ്രാമുകൾ ഉപയോഗിച്ച് ദൃശ്യവൽക്കരിക്കാൻ വളരെ നല്ല മാർഗങ്ങൾ നൽകുന്നു. ഈ തരം ചാർട്ട് ഒരു ബാർ ചാർട്ടിനുപോലെയാണ്, ബാറുകളുടെ ഉയർച്ചയും താഴ്വാരവും വഴി വിതരണത്തെ കാണിക്കാൻ കഴിയും. ഹിസ്റ്റോഗ്രാം നിർമ്മിക്കാൻ, നിങ്ങൾക്ക് സംഖ്യാത്മക ഡാറ്റ വേണം. ഹിസ്റ്റോഗ്രാം നിർമ്മിക്കാൻ, 'hist' എന്ന തരത്തിൽ ഒരു ചാർട്ട് പ്ലോട്ട് ചെയ്യാം. ഈ ചാർട്ട് മുഴുവൻ ഡാറ്റാസെറ്റിലെ MaxBodyMass ന്റെ വിതരണത്തെ കാണിക്കുന്നു. ഡാറ്റയുടെ നിരയെ ചെറിയ ബിനുകളായി വിഭജിച്ച്, ഡാറ്റയുടെ മൂല്യങ്ങളുടെ വിതരണത്തെ പ്രദർശിപ്പിക്കാം:
|
||||
|
||||
```r
|
||||
ggplot(data = birds_filtered, aes(x = MaxBodyMass)) +
|
||||
geom_histogram(bins=10)+ylab('Frequency')
|
||||
```
|
||||

|
||||
|
||||
നിങ്ങൾക്ക് കാണാമല്ലോ, ഈ ഡാറ്റാസെറ്റിലെ 400+ പക്ഷികളിൽ ഭൂരിഭാഗവും അവരുടെ പരമാവധി ശരീരഭാരം 2000-ൽ താഴെ വരുന്ന പരിധിയിലാണ്. `bins` പാരാമീറ്റർ ഉയർന്ന ഒരു സംഖ്യയാക്കി, ഉദാഹരണത്തിന് 30 ആക്കി, ഡാറ്റയിൽ കൂടുതൽ洞察ം നേടാം:
|
||||
|
||||
```r
|
||||
ggplot(data = birds_filtered, aes(x = MaxBodyMass)) + geom_histogram(bins=30)+ylab('Frequency')
|
||||
```
|
||||
|
||||

|
||||
|
||||
ഈ ചാർട്ട് വിതരണത്തെ കുറച്ച് കൂടുതൽ സൂക്ഷ്മമായി കാണിക്കുന്നു. ഇടതുവശത്തേക്ക് കുറച്ച് കുറവുള്ള ചാർട്ട് സൃഷ്ടിക്കാൻ, നിങ്ങൾക്ക് ഒരു നിശ്ചിത പരിധിയിലുള്ള ഡാറ്റ മാത്രം തിരഞ്ഞെടുക്കണം:
|
||||
|
||||
ശരീരഭാരം 60-ൽ താഴെയുള്ള പക്ഷികളെ മാത്രം ഫിൽട്ടർ ചെയ്ത് 30 `bins` കാണിക്കുക:
|
||||
|
||||
```r
|
||||
birds_filtered_1 <- subset(birds_filtered, MaxBodyMass > 1 & MaxBodyMass < 60)
|
||||
ggplot(data = birds_filtered_1, aes(x = MaxBodyMass)) +
|
||||
geom_histogram(bins=30)+ylab('Frequency')
|
||||
```
|
||||
|
||||

|
||||
|
||||
✅ മറ്റ് ഫിൽട്ടറുകളും ഡാറ്റ പോയിന്റുകളും പരീക്ഷിക്കുക. ഡാറ്റയുടെ മുഴുവൻ വിതരണവും കാണാൻ, `['MaxBodyMass']` ഫിൽട്ടർ നീക്കം ചെയ്ത് ലേബൽ ചെയ്ത വിതരണങ്ങൾ കാണിക്കുക.
|
||||
|
||||
ഹിസ്റ്റോഗ്രാമിന് ചില നല്ല നിറവും ലേബലിംഗും ചേർക്കാം:
|
||||
|
||||
രണ്ട് വിതരണങ്ങൾ തമ്മിലുള്ള ബന്ധം താരതമ്യം ചെയ്യാൻ 2D ഹിസ്റ്റോഗ്രാം സൃഷ്ടിക്കുക. `MaxBodyMass` vs. `MaxLength` താരതമ്യം ചെയ്യാം. `ggplot2` കൂടുതൽ പ്രകാശമുള്ള നിറങ്ങൾ ഉപയോഗിച്ച് സമന്വയം കാണിക്കുന്ന ഒരു ഇൻബിൽറ്റ് മാർഗം നൽകുന്നു:
|
||||
|
||||
```r
|
||||
ggplot(data=birds_filtered_1, aes(x=MaxBodyMass, y=MaxLength) ) +
|
||||
geom_bin2d() +scale_fill_continuous(type = "viridis")
|
||||
```
|
||||
ഈ രണ്ട് ഘടകങ്ങൾ തമ്മിൽ പ്രതീക്ഷിക്കപ്പെട്ട ബന്ധം ഒരു പ്രതീക്ഷിച്ച അക്ഷരേഖയിൽ കാണപ്പെടുന്നു, പ്രത്യേകിച്ച് ശക്തമായ ഒരു സമന്വയ ബിന്ദു:
|
||||
|
||||

|
||||
|
||||
ഹിസ്റ്റോഗ്രാമുകൾ സംഖ്യാത്മക ഡാറ്റയ്ക്ക് സാധാരണയായി നല്ല രീതിയിൽ പ്രവർത്തിക്കുന്നു. എന്നാൽ നിങ്ങൾക്ക് ടെക്സ്റ്റ് ഡാറ്റയുടെ അടിസ്ഥാനത്തിൽ വിതരണങ്ങൾ കാണേണ്ടതുണ്ടെങ്കിൽ?
|
||||
|
||||
## ടെക്സ്റ്റ് ഡാറ്റ ഉപയോഗിച്ച് ഡാറ്റാസെറ്റ് വിതരണങ്ങൾ പരിശോധിക്കുക
|
||||
|
||||
ഈ ഡാറ്റാസെറ്റിൽ പക്ഷി വിഭാഗം, ജനുസ്, സ്പീഷീസ്, കുടുംബം, കൂടാതെ സംരക്ഷണ നിലയെക്കുറിച്ചും നല്ല വിവരങ്ങൾ ഉൾക്കൊള്ളുന്നു. ഈ സംരക്ഷണ വിവരത്തിൽ കൂടുതൽ ആഴത്തിൽ നോക്കാം. പക്ഷികളുടെ സംരക്ഷണ നില അനുസരിച്ച് വിതരണങ്ങൾ എങ്ങനെയാണ്?
|
||||
|
||||
> ✅ ഡാറ്റാസെറ്റിൽ, സംരക്ഷണ നില വിവരിക്കാൻ പല ചുരുക്കപ്പേരുകളും ഉപയോഗിക്കുന്നു. ഈ ചുരുക്കപ്പേരുകൾ [IUCN Red List Categories](https://www.iucnredlist.org/) എന്ന സംഘടനയിൽ നിന്നാണ്.
|
||||
>
|
||||
> - CR: അത്യന്തം അപകടത്തിൽ
|
||||
> - EN: അപകടത്തിൽ
|
||||
> - EX: നശിച്ചുപോയ
|
||||
> - LC: കുറഞ്ഞ ആശങ്ക
|
||||
> - NT: അടുത്ത ഭീഷണി
|
||||
> - VU: ഭീഷണിയുള്ള
|
||||
|
||||
ഇവ ടെക്സ്റ്റ് അടിസ്ഥാനമാക്കിയ മൂല്യങ്ങളാണ്, അതിനാൽ ഹിസ്റ്റോഗ്രാം സൃഷ്ടിക്കാൻ ഒരു ട്രാൻസ്ഫോം ചെയ്യേണ്ടതുണ്ട്. filteredBirds ഡാറ്റാഫ്രെയിമിൽ നിന്ന്, അതിന്റെ സംരക്ഷണ നിലയും കുറഞ്ഞ വിങ്സ്പാനും പ്രദർശിപ്പിക്കുക. നിങ്ങൾ എന്ത് കാണുന്നു?
|
||||
|
||||
```r
|
||||
birds_filtered_1$ConservationStatus[birds_filtered_1$ConservationStatus == 'EX'] <- 'x1'
|
||||
birds_filtered_1$ConservationStatus[birds_filtered_1$ConservationStatus == 'CR'] <- 'x2'
|
||||
birds_filtered_1$ConservationStatus[birds_filtered_1$ConservationStatus == 'EN'] <- 'x3'
|
||||
birds_filtered_1$ConservationStatus[birds_filtered_1$ConservationStatus == 'NT'] <- 'x4'
|
||||
birds_filtered_1$ConservationStatus[birds_filtered_1$ConservationStatus == 'VU'] <- 'x5'
|
||||
birds_filtered_1$ConservationStatus[birds_filtered_1$ConservationStatus == 'LC'] <- 'x6'
|
||||
|
||||
ggplot(data=birds_filtered_1, aes(x = MinWingspan, fill = ConservationStatus)) +
|
||||
geom_histogram(position = "identity", alpha = 0.4, bins = 20) +
|
||||
scale_fill_manual(name="Conservation Status",values=c("red","green","blue","pink"),labels=c("Endangered","Near Threathened","Vulnerable","Least Concern"))
|
||||
```
|
||||
|
||||

|
||||
|
||||
കുറഞ്ഞ വിങ്സ്പാനും സംരക്ഷണ നിലയ്ക്കും ഇടയിൽ നല്ല ബന്ധമില്ലെന്ന് തോന്നുന്നു. ഈ രീതിയിൽ ഡാറ്റാസെറ്റിലെ മറ്റ് ഘടകങ്ങളും പരീക്ഷിക്കുക. നിങ്ങൾക്ക് ഏതെങ്കിലും ബന്ധം കണ്ടെത്താമോ?
|
||||
|
||||
## ഡെൻസിറ്റി പ്ലോട്ടുകൾ
|
||||
|
||||
ഇതുവരെ നോക്കിയ ഹിസ്റ്റോഗ്രാമുകൾ 'സ്റ്റെപ്പ്ഡ്' ആണെന്നും ഒരു സ്മൂത്ത് വക്രം പോലെ ഒഴുകുന്നില്ലെന്നും നിങ്ങൾ ശ്രദ്ധിച്ചിരിക്കാം. കൂടുതൽ സ്മൂത്ത് ഡെൻസിറ്റി ചാർട്ട് കാണിക്കാൻ, ഡെൻസിറ്റി പ്ലോട്ട് പരീക്ഷിക്കാം.
|
||||
|
||||
ഇപ്പോൾ ഡെൻസിറ്റി പ്ലോട്ടുമായി പ്രവർത്തിക്കാം!
|
||||
|
||||
```r
|
||||
ggplot(data = birds_filtered_1, aes(x = MinWingspan)) +
|
||||
geom_density()
|
||||
```
|
||||

|
||||
|
||||
മുൻപത്തെ കുറഞ്ഞ വിങ്സ്പാൻ ഡാറ്റയ്ക്കുള്ള പ്ലോട്ടിനെ പോലെ ഇത് കാണാം; ഇത് കുറച്ച് സ്മൂത്താണ്. നിങ്ങൾ രണ്ടാമത്തെ ചാർട്ടിൽ നിർമ്മിച്ച ജാഗ്ഗഡ് MaxBodyMass ലൈനിനെ സ്മൂത്ത് ആക്കാൻ ആഗ്രഹിക്കുന്നുവെങ്കിൽ, ഈ രീതിയിൽ പുനഃസൃഷ്ടിച്ച് വളരെ നന്നായി സ്മൂത്ത് ആക്കാം:
|
||||
|
||||
```r
|
||||
ggplot(data = birds_filtered_1, aes(x = MaxBodyMass)) +
|
||||
geom_density()
|
||||
```
|
||||

|
||||
|
||||
കുറച്ച് സ്മൂത്ത്, എന്നാൽ വളരെ സ്മൂത്ത് അല്ലാത്ത ഒരു ലൈനിനായി, `adjust` പാരാമീറ്റർ എഡിറ്റ് ചെയ്യുക:
|
||||
|
||||
```r
|
||||
ggplot(data = birds_filtered_1, aes(x = MaxBodyMass)) +
|
||||
geom_density(adjust = 1/5)
|
||||
```
|
||||

|
||||
|
||||
✅ ഈ തരം പ്ലോട്ടിനുള്ള പാരാമീറ്ററുകൾക്കുറിച്ച് വായിച്ച് പരീക്ഷണങ്ങൾ നടത്തുക!
|
||||
|
||||
ഈ തരം ചാർട്ടുകൾ മനോഹരമായ വിശദീകരണ ദൃശ്യവൽക്കരണങ്ങൾ നൽകുന്നു. കുറച്ച് കോഡ് വരികളിൽ, ഉദാഹരണത്തിന്, ഓരോ പക്ഷി ഓർഡറിനും പരമാവധി ശരീരഭാരം ഡെൻസിറ്റി കാണിക്കാം:
|
||||
|
||||
```r
|
||||
ggplot(data=birds_filtered_1,aes(x = MaxBodyMass, fill = Order)) +
|
||||
geom_density(alpha=0.5)
|
||||
```
|
||||

|
||||
|
||||
## 🚀 വെല്ലുവിളി
|
||||
|
||||
ഹിസ്റ്റോഗ്രാമുകൾ അടിസ്ഥാന സ്കാറ്റർപ്ലോട്ടുകൾ, ബാർ ചാർട്ടുകൾ, അല്ലെങ്കിൽ ലൈൻ ചാർട്ടുകളേക്കാൾ കൂടുതൽ സങ്കീർണ്ണമായ ചാർട്ടുകളാണ്. ഇന്റർനെറ്റിൽ ഹിസ്റ്റോഗ്രാമുകളുടെ നല്ല ഉദാഹരണങ്ങൾ കണ്ടെത്താൻ തിരയുക. അവ എങ്ങനെ ഉപയോഗിക്കുന്നു, എന്ത് പ്രദർശിപ്പിക്കുന്നു, ഏത് മേഖലകളിൽ അല്ലെങ്കിൽ അന്വേഷണ മേഖലകളിൽ സാധാരണയായി ഉപയോഗിക്കുന്നു?
|
||||
|
||||
## [പാഠം ശേഷമുള്ള ക്വിസ്](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/19)
|
||||
|
||||
## അവലോകനം & സ്വയം പഠനം
|
||||
|
||||
ഈ പാഠത്തിൽ, നിങ്ങൾ `ggplot2` ഉപയോഗിച്ച് കൂടുതൽ സങ്കീർണ്ണമായ ചാർട്ടുകൾ കാണിക്കാൻ പ്രവർത്തിച്ചു. `geom_density_2d()` എന്ന "ഒറ്റ അല്ലെങ്കിൽ കൂടുതൽ അളവുകളിൽ തുടർച്ചയായ സാധ്യതാ ഡെൻസിറ്റി വക്രം" എന്നതിനെക്കുറിച്ച് കുറച്ച് ഗവേഷണം ചെയ്യുക. അതിന്റെ പ്രവർത്തനം മനസ്സിലാക്കാൻ [ഡോക്യുമെന്റേഷൻ](https://ggplot2.tidyverse.org/reference/geom_density_2d.html) വായിക്കുക.
|
||||
|
||||
## അസൈൻമെന്റ്
|
||||
|
||||
[നിങ്ങളുടെ കഴിവുകൾ പ്രയോഗിക്കുക](assignment.md)
|
||||
|
||||
---
|
||||
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
|
||||
**അസൂയാ**:
|
||||
ഈ രേഖ AI വിവർത്തന സേവനം [Co-op Translator](https://github.com/Azure/co-op-translator) ഉപയോഗിച്ച് വിവർത്തനം ചെയ്തതാണ്. നാം കൃത്യതയ്ക്ക് ശ്രമിച്ചിട്ടുണ്ടെങ്കിലും, സ്വയം പ്രവർത്തിക്കുന്ന വിവർത്തനങ്ങളിൽ പിശകുകൾ അല്ലെങ്കിൽ തെറ്റുകൾ ഉണ്ടാകാമെന്ന് ദയവായി ശ്രദ്ധിക്കുക. അതിന്റെ മാതൃഭാഷയിലുള്ള യഥാർത്ഥ രേഖയാണ് പ്രാമാണികമായ ഉറവിടം എന്ന് പരിഗണിക്കേണ്ടതാണ്. നിർണായകമായ വിവരങ്ങൾക്ക്, പ്രൊഫഷണൽ മനുഷ്യ വിവർത്തനം ശുപാർശ ചെയ്യപ്പെടുന്നു. ഈ വിവർത്തനം ഉപയോഗിക്കുന്നതിൽ നിന്നുണ്ടാകുന്ന ഏതെങ്കിലും തെറ്റിദ്ധാരണകൾക്കോ തെറ്റായ വ്യാഖ്യാനങ്ങൾക്കോ ഞങ്ങൾ ഉത്തരവാദികളല്ല.
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER END -->
|
||||
@ -0,0 +1,27 @@
|
||||
<!--
|
||||
CO_OP_TRANSLATOR_METADATA:
|
||||
{
|
||||
"original_hash": "a233d542512136c4dd29aad38ca0175f",
|
||||
"translation_date": "2025-12-19T16:23:38+00:00",
|
||||
"source_file": "3-Data-Visualization/R/10-visualization-distributions/assignment.md",
|
||||
"language_code": "ml"
|
||||
}
|
||||
-->
|
||||
# നിങ്ങളുടെ കഴിവുകൾ പ്രയോഗിക്കുക
|
||||
|
||||
## നിർദ്ദേശങ്ങൾ
|
||||
|
||||
ഇതുവരെ, നിങ്ങൾ മിന്നസോട്ട ബേർഡ്സ് ഡാറ്റാസെറ്റുമായി പ്രവർത്തിച്ച് പക്ഷികളുടെ എണ്ണം மற்றும் ജനസംഖ്യ സാന്ദ്രതയെക്കുറിച്ച് വിവരങ്ങൾ കണ്ടെത്തിയിട്ടുണ്ട്. ഈ സാങ്കേതികവിദ്യകൾ പ്രയോഗിക്കാൻ വ്യത്യസ്തമായ ഒരു ഡാറ്റാസെറ്റ് പരീക്ഷിച്ച് പ്രാക്ടീസ് ചെയ്യുക, ഉദാഹരണത്തിന് [Kaggle](https://www.kaggle.com/) നിന്നുള്ളത്. ഈ ഡാറ്റാസെറ്റിനെക്കുറിച്ച് ഒരു കഥ പറയാൻ R സ്ക്രിപ്റ്റ് നിർമ്മിക്കുക, കൂടാതെ അതിനെക്കുറിച്ച് ചർച്ച ചെയ്യുമ്പോൾ ഹിസ്റ്റോഗ്രാമുകൾ ഉപയോഗിക്കുന്നത് ഉറപ്പാക്കുക.
|
||||
|
||||
## റൂബ്രിക്
|
||||
|
||||
Exemplary | Adequate | Needs Improvement
|
||||
--- | --- | -- |
|
||||
ഈ ഡാറ്റാസെറ്റിന്റെ ഉറവിടം ഉൾപ്പെടെ വിശദീകരണങ്ങളോടുകൂടിയ ഒരു സ്ക്രിപ്റ്റ് അവതരിപ്പിച്ചിരിക്കുന്നു, കൂടാതെ ഡാറ്റയെക്കുറിച്ച് വിവരങ്ങൾ കണ്ടെത്താൻ കുറഞ്ഞത് 5 ഹിസ്റ്റോഗ്രാമുകൾ ഉപയോഗിക്കുന്നു. | അപൂർണ്ണമായ വിശദീകരണങ്ങളോ ബഗുകളോ ഉള്ള ഒരു സ്ക്രിപ്റ്റ് അവതരിപ്പിച്ചിരിക്കുന്നു. | വിശദീകരണങ്ങളില്ലാതെ ബഗുകളുള്ള ഒരു സ്ക്രിപ്റ്റ് അവതരിപ്പിച്ചിരിക്കുന്നു.
|
||||
|
||||
---
|
||||
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
|
||||
**അസൂയാപത്രം**:
|
||||
ഈ രേഖ AI വിവർത്തന സേവനം [Co-op Translator](https://github.com/Azure/co-op-translator) ഉപയോഗിച്ച് വിവർത്തനം ചെയ്തതാണ്. നാം കൃത്യതയ്ക്ക് ശ്രമിച്ചിട്ടുണ്ടെങ്കിലും, യന്ത്രം ചെയ്ത വിവർത്തനങ്ങളിൽ പിശകുകൾ അല്ലെങ്കിൽ തെറ്റുകൾ ഉണ്ടാകാമെന്ന് ദയവായി ശ്രദ്ധിക്കുക. അതിന്റെ മാതൃഭാഷയിലുള്ള യഥാർത്ഥ രേഖയാണ് പ്രാമാണികമായ ഉറവിടം എന്ന് പരിഗണിക്കേണ്ടതാണ്. നിർണായകമായ വിവരങ്ങൾക്ക്, പ്രൊഫഷണൽ മനുഷ്യ വിവർത്തനം ശുപാർശ ചെയ്യപ്പെടുന്നു. ഈ വിവർത്തനം ഉപയോഗിക്കുന്നതിൽ നിന്നുണ്ടാകുന്ന ഏതെങ്കിലും തെറ്റിദ്ധാരണകൾക്കോ വ്യാഖ്യാനക്കേടുകൾക്കോ ഞങ്ങൾ ഉത്തരവാദികളല്ല.
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER END -->
|
||||
@ -0,0 +1,203 @@
|
||||
<!--
|
||||
CO_OP_TRANSLATOR_METADATA:
|
||||
{
|
||||
"original_hash": "47028abaaafa2bcb1079702d20569066",
|
||||
"translation_date": "2025-12-19T16:28:20+00:00",
|
||||
"source_file": "3-Data-Visualization/R/11-visualization-proportions/README.md",
|
||||
"language_code": "ml"
|
||||
}
|
||||
-->
|
||||
# അനുപാതങ്ങൾ ദൃശ്യവൽക്കരിക്കൽ
|
||||
|
||||
| ](../../../sketchnotes/11-Visualizing-Proportions.png)|
|
||||
|:---:|
|
||||
|അനുപാതങ്ങൾ ദൃശ്യവൽക്കരിക്കൽ - _സ്കെച്ച്നോട്ട് [@nitya](https://twitter.com/nitya) യിൽ നിന്നുള്ളത്_ |
|
||||
|
||||
ഈ പാഠത്തിൽ, നിങ്ങൾ മഷ്റൂമുകളെക്കുറിച്ചുള്ള ഒരു dataset-ൽ വിവിധ തരത്തിലുള്ള ഫംഗികൾ എത്രമാത്രം ഉള്ളുവെന്ന് പോലുള്ള അനുപാതങ്ങൾ ദൃശ്യവൽക്കരിക്കാൻ പ്രകൃതിനിരീക്ഷണ dataset ഉപയോഗിക്കും. Audubon-ൽ നിന്നുള്ള 23 സ്പീഷീസുകളുള്ള Agaricus, Lepiota കുടുംബങ്ങളിലെ ഗില്ലഡ് മഷ്റൂമുകളുടെ വിവരങ്ങൾ ഉൾക്കൊള്ളുന്ന dataset ഉപയോഗിച്ച് ഈ രസകരമായ ഫംഗികൾ പരിശോധിക്കാം. നിങ്ങൾ പരീക്ഷിക്കാനിരിക്കുന്ന രുചികരമായ ദൃശ്യവൽക്കരണങ്ങൾ:
|
||||
|
||||
- പൈ ചാർട്ടുകൾ 🥧
|
||||
- ഡോണട്ട് ചാർട്ടുകൾ 🍩
|
||||
- വാഫിൾ ചാർട്ടുകൾ 🧇
|
||||
|
||||
> 💡 Microsoft Research-ന്റെ [Charticulator](https://charticulator.com) എന്ന വളരെ രസകരമായ പ്രോജക്ട് ഡാറ്റാ ദൃശ്യവൽക്കരണങ്ങൾക്ക് സൗജന്യമായ ഡ്രാഗ് ആൻഡ് ഡ്രോപ്പ് ഇന്റർഫേസ് നൽകുന്നു. അവരുടെ ട്യൂട്ടോറിയലുകളിൽ ഒന്നിൽ ഈ മഷ്റൂം dataset-ഉം ഉപയോഗിക്കുന്നു! അതിനാൽ നിങ്ങൾക്ക് ഡാറ്റ പരിശോധിക്കാനും ലൈബ്രറി പഠിക്കാനും ഒരേ സമയം സാധിക്കും: [Charticulator tutorial](https://charticulator.com/tutorials/tutorial4.html).
|
||||
|
||||
## [പാഠം മുൻകൂർ ക്വിസ്](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/20)
|
||||
|
||||
## നിങ്ങളുടെ മഷ്റൂമുകളെ പരിചയപ്പെടുക 🍄
|
||||
|
||||
മഷ്റൂമുകൾ വളരെ രസകരമാണ്. അവ പഠിക്കാൻ ഒരു dataset ഇറക്കുമതി ചെയ്യാം:
|
||||
|
||||
```r
|
||||
mushrooms = read.csv('../../data/mushrooms.csv')
|
||||
head(mushrooms)
|
||||
```
|
||||
ഒരു പട്ടിക വിശകലനത്തിന് മികച്ച ഡാറ്റയോടുകൂടി പ്രിന്റ് ചെയ്യുന്നു:
|
||||
|
||||
|
||||
| class | cap-shape | cap-surface | cap-color | bruises | odor | gill-attachment | gill-spacing | gill-size | gill-color | stalk-shape | stalk-root | stalk-surface-above-ring | stalk-surface-below-ring | stalk-color-above-ring | stalk-color-below-ring | veil-type | veil-color | ring-number | ring-type | spore-print-color | population | habitat |
|
||||
| --------- | --------- | ----------- | --------- | ------- | ------- | --------------- | ------------ | --------- | ---------- | ----------- | ---------- | ------------------------ | ------------------------ | ---------------------- | ---------------------- | --------- | ---------- | ----------- | --------- | ----------------- | ---------- | ------- |
|
||||
| Poisonous | Convex | Smooth | Brown | Bruises | Pungent | Free | Close | Narrow | Black | Enlarging | Equal | Smooth | Smooth | White | White | Partial | White | One | Pendant | Black | Scattered | Urban |
|
||||
| Edible | Convex | Smooth | Yellow | Bruises | Almond | Free | Close | Broad | Black | Enlarging | Club | Smooth | Smooth | White | White | Partial | White | One | Pendant | Brown | Numerous | Grasses |
|
||||
| Edible | Bell | Smooth | White | Bruises | Anise | Free | Close | Broad | Brown | Enlarging | Club | Smooth | Smooth | White | White | Partial | White | One | Pendant | Brown | Numerous | Meadows |
|
||||
| Poisonous | Convex | Scaly | White | Bruises | Pungent | Free | Close | Narrow | Brown | Enlarging | Equal | Smooth | Smooth | White | White | Partial | White | One | Pendant | Black | Scattered | Urban
|
||||
| Edible | Convex |Smooth | Green | No Bruises| None |Free | Crowded | Broad | Black | Tapering | Equal | Smooth | Smooth | White | White | Partial | White | One | Evanescent | Brown | Abundant | Grasses
|
||||
|Edible | Convex | Scaly | Yellow | Bruises | Almond | Free | Close | Broad | Brown | Enlarging | Club | Smooth | Smooth | White | White | Partial | White | One | Pendant | Black | Numerous | Grasses
|
||||
|
||||
തുടക്കത്തിൽ, നിങ്ങൾ കാണും എല്ലാ ഡാറ്റയും വാചകരൂപത്തിലാണ്. ഈ ഡാറ്റ ഒരു ചാർട്ടിൽ ഉപയോഗിക്കാൻ കഴിയുന്നതായി മാറ്റേണ്ടതുണ്ട്. വാസ്തവത്തിൽ, ഡാറ്റയുടെ ഭൂരിഭാഗവും ഒരു ഒബ്ജക്റ്റായി പ്രതിനിധീകരിച്ചിരിക്കുന്നു:
|
||||
|
||||
```r
|
||||
names(mushrooms)
|
||||
```
|
||||
|
||||
ഫലമായി:
|
||||
|
||||
```output
|
||||
[1] "class" "cap.shape"
|
||||
[3] "cap.surface" "cap.color"
|
||||
[5] "bruises" "odor"
|
||||
[7] "gill.attachment" "gill.spacing"
|
||||
[9] "gill.size" "gill.color"
|
||||
[11] "stalk.shape" "stalk.root"
|
||||
[13] "stalk.surface.above.ring" "stalk.surface.below.ring"
|
||||
[15] "stalk.color.above.ring" "stalk.color.below.ring"
|
||||
[17] "veil.type" "veil.color"
|
||||
[19] "ring.number" "ring.type"
|
||||
[21] "spore.print.color" "population"
|
||||
[23] "habitat"
|
||||
```
|
||||
ഈ ഡാറ്റ എടുത്ത് 'class' കോളം ഒരു category ആയി മാറ്റുക:
|
||||
|
||||
```r
|
||||
library(dplyr)
|
||||
grouped=mushrooms %>%
|
||||
group_by(class) %>%
|
||||
summarise(count=n())
|
||||
```
|
||||
|
||||
|
||||
ഇപ്പോൾ, മഷ്റൂം ഡാറ്റ പ്രിന്റ് ചെയ്താൽ, വിഷം ഉള്ള/ഭക്ഷ്യയോഗ്യമായ ക്ലാസുകൾ അനുസരിച്ച് വിഭാഗീകരിച്ചിട്ടുണ്ടെന്ന് കാണാം:
|
||||
```r
|
||||
View(grouped)
|
||||
```
|
||||
|
||||
|
||||
| class | count |
|
||||
| --------- | --------- |
|
||||
| Edible | 4208 |
|
||||
| Poisonous| 3916 |
|
||||
|
||||
|
||||
|
||||
ഈ പട്ടികയിൽ നൽകിയ ക്രമം അനുസരിച്ച് നിങ്ങളുടെ ക്ലാസ് category ലേബലുകൾ സൃഷ്ടിച്ചാൽ, ഒരു പൈ ചാർട്ട് നിർമ്മിക്കാം.
|
||||
|
||||
## പൈ!
|
||||
|
||||
```r
|
||||
pie(grouped$count,grouped$class, main="Edible?")
|
||||
```
|
||||
ഇവിടെ, ഈ ഡാറ്റയുടെ അനുപാതങ്ങൾ ഈ രണ്ട് മഷ്റൂം ക്ലാസുകൾ അനുസരിച്ച് കാണിക്കുന്ന ഒരു പൈ ചാർട്ട്. ലേബലുകളുടെ ക്രമം ശരിയാണെന്ന് ഉറപ്പാക്കുന്നത് വളരെ പ്രധാനമാണ്, പ്രത്യേകിച്ച് ഇവിടെ, അതിനാൽ ലേബൽ അറേ എങ്ങനെ നിർമ്മിക്കപ്പെടുന്നു എന്ന് പരിശോധിക്കുക!
|
||||
|
||||

|
||||
|
||||
## ഡോണട്ടുകൾ!
|
||||
|
||||
കുറച്ച് കൂടുതൽ ദൃശ്യപരമായി ആകർഷകമായ പൈ ചാർട്ട് ഒരു ഡോണട്ട് ചാർട്ടാണ്, ഇത് മധ്യത്തിൽ ഒരു തുരുവുള്ള പൈ ചാർട്ടാണ്. ഈ രീതിയിൽ നമ്മുടെ ഡാറ്റ നോക്കാം.
|
||||
|
||||
മഷ്റൂമുകൾ വളരുന്ന വിവിധ ഹാബിറ്റാറ്റുകൾ നോക്കാം:
|
||||
|
||||
```r
|
||||
library(dplyr)
|
||||
habitat=mushrooms %>%
|
||||
group_by(habitat) %>%
|
||||
summarise(count=n())
|
||||
View(habitat)
|
||||
```
|
||||
ഫലമായി:
|
||||
| habitat| count |
|
||||
| --------- | --------- |
|
||||
| Grasses | 2148 |
|
||||
| Leaves| 832 |
|
||||
| Meadows | 292 |
|
||||
| Paths| 1144 |
|
||||
| Urban | 368 |
|
||||
| Waste| 192 |
|
||||
| Wood| 3148 |
|
||||
|
||||
|
||||
ഇവിടെ, നിങ്ങൾ ഡാറ്റ ഹാബിറ്റാറ്റ് അനുസരിച്ച് ഗ്രൂപ്പ് ചെയ്യുന്നു. 7 ഹാബിറ്റാറ്റുകൾ പട്ടികപ്പെടുത്തിയിട്ടുണ്ട്, അതിനാൽ അവ ഡോണട്ട് ചാർട്ടിന്റെ ലേബലുകളായി ഉപയോഗിക്കുക:
|
||||
|
||||
```r
|
||||
library(ggplot2)
|
||||
library(webr)
|
||||
PieDonut(habitat, aes(habitat, count=count))
|
||||
```
|
||||
|
||||

|
||||
|
||||
ഈ കോഡ് രണ്ട് ലൈബ്രറികൾ ഉപയോഗിക്കുന്നു - ggplot2, webr. webr ലൈബ്രറിയുടെ PieDonut ഫംഗ്ഷൻ ഉപയോഗിച്ച്, ഡോണട്ട് ചാർട്ട് എളുപ്പത്തിൽ സൃഷ്ടിക്കാം!
|
||||
|
||||
R-ൽ ഡോണട്ട് ചാർട്ടുകൾ ggplot2 ലൈബ്രറി മാത്രം ഉപയോഗിച്ച് ഉണ്ടാക്കാം. അതിനെക്കുറിച്ച് കൂടുതൽ അറിയാൻ [ഇവിടെ](https://www.r-graph-gallery.com/128-ring-or-donut-plot.html) കാണുക, സ്വയം പരീക്ഷിക്കാം.
|
||||
|
||||
ഇപ്പോൾ നിങ്ങൾക്ക് ഡാറ്റ ഗ്രൂപ്പ് ചെയ്ത് പൈ അല്ലെങ്കിൽ ഡോണട്ട് ആയി പ്രദർശിപ്പിക്കാമെന്ന് അറിയാം, മറ്റ് ചാർട്ട് തരങ്ങൾ പരീക്ഷിക്കാം. വാഫിൾ ചാർട്ട് പരീക്ഷിക്കുക, ഇത് അളവുകൾ പരിശോധിക്കുന്ന മറ്റൊരു രീതി മാത്രമാണ്.
|
||||
## വാഫിൾസ്!
|
||||
|
||||
'വാഫിൾ' തരം ചാർട്ട് അളവുകൾ 2D ചതുരങ്ങളായി ദൃശ്യവൽക്കരിക്കുന്ന മറ്റൊരു രീതി ആണ്. ഈ dataset-ലെ മഷ്റൂം ക്യാപ് നിറങ്ങളുടെ വ്യത്യസ്ത അളവുകൾ ദൃശ്യവൽക്കരിക്കാൻ ശ്രമിക്കുക. ഇതിന്, [waffle](https://cran.r-project.org/web/packages/waffle/waffle.pdf) എന്ന സഹായക ലൈബ്രറി ഇൻസ്റ്റാൾ ചെയ്ത് ഉപയോഗിക്കണം:
|
||||
|
||||
```r
|
||||
install.packages("waffle", repos = "https://cinc.rud.is")
|
||||
```
|
||||
|
||||
ഡാറ്റയുടെ ഒരു സെഗ്മെന്റ് തിരഞ്ഞെടുക്കുക ഗ്രൂപ്പ് ചെയ്യാൻ:
|
||||
|
||||
```r
|
||||
library(dplyr)
|
||||
cap_color=mushrooms %>%
|
||||
group_by(cap.color) %>%
|
||||
summarise(count=n())
|
||||
View(cap_color)
|
||||
```
|
||||
|
||||
ലേബലുകൾ സൃഷ്ടിച്ച് ഡാറ്റ ഗ്രൂപ്പ് ചെയ്ത് വാഫിൾ ചാർട്ട് സൃഷ്ടിക്കുക:
|
||||
|
||||
```r
|
||||
library(waffle)
|
||||
names(cap_color$count) = paste0(cap_color$cap.color)
|
||||
waffle((cap_color$count/10), rows = 7, title = "Waffle Chart")+scale_fill_manual(values=c("brown", "#F0DC82", "#D2691E", "green",
|
||||
"pink", "purple", "red", "grey",
|
||||
"yellow","white"))
|
||||
```
|
||||
|
||||
വാഫിൾ ചാർട്ട് ഉപയോഗിച്ച്, ഈ മഷ്റൂം dataset-ലെ ക്യാപ് നിറങ്ങളുടെ അനുപാതങ്ങൾ വ്യക്തമായി കാണാം. രസകരമായി, പച്ച ക്യാപ് ഉള്ള മഷ്റൂമുകൾ വളരെ കൂടുതലാണ്!
|
||||
|
||||

|
||||
|
||||
ഈ പാഠത്തിൽ, നിങ്ങൾക്ക് അനുപാതങ്ങൾ ദൃശ്യവൽക്കരിക്കുന്ന മൂന്ന് മാർഗങ്ങൾ പഠിച്ചു. ആദ്യം, ഡാറ്റയെ വിഭാഗങ്ങളായി ഗ്രൂപ്പ് ചെയ്യണം, പിന്നെ ഡാറ്റ പ്രദർശിപ്പിക്കാൻ ഏറ്റവും നല്ല മാർഗം - പൈ, ഡോണട്ട്, അല്ലെങ്കിൽ വാഫിൾ - തിരഞ്ഞെടുക്കണം. എല്ലാം രുചികരവും ഉപയോക്താവിന് dataset-ന്റെ ഉടൻ ഒരു ദൃശ്യസംഗ്രഹം നൽകുന്നതുമാണ്.
|
||||
|
||||
## 🚀 ചലഞ്ച്
|
||||
|
||||
ഈ രുചികരമായ ചാർട്ടുകൾ [Charticulator](https://charticulator.com) ൽ പുനഃസൃഷ്ടിക്കാൻ ശ്രമിക്കുക.
|
||||
## [പാഠം ശേഷം ക്വിസ്](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/21)
|
||||
|
||||
## അവലോകനം & സ്വയം പഠനം
|
||||
|
||||
പൈ, ഡോണട്ട്, വാഫിൾ ചാർട്ട് എപ്പോൾ ഉപയോഗിക്കണമെന്ന് എപ്പോഴും വ്യക്തമായിരിക്കില്ല. ഈ വിഷയത്തിൽ വായിക്കാനുള്ള ചില ലേഖനങ്ങൾ:
|
||||
|
||||
https://www.beautiful.ai/blog/battle-of-the-charts-pie-chart-vs-donut-chart
|
||||
|
||||
https://medium.com/@hypsypops/pie-chart-vs-donut-chart-showdown-in-the-ring-5d24fd86a9ce
|
||||
|
||||
https://www.mit.edu/~mbarker/formula1/f1help/11-ch-c6.htm
|
||||
|
||||
https://medium.datadriveninvestor.com/data-visualization-done-the-right-way-with-tableau-waffle-chart-fdf2a19be402
|
||||
|
||||
ഈ ബുദ്ധിമുട്ടുള്ള തീരുമാനത്തെക്കുറിച്ച് കൂടുതൽ വിവരങ്ങൾ കണ്ടെത്താൻ ഗവേഷണം ചെയ്യുക.
|
||||
## അസൈൻമെന്റ്
|
||||
|
||||
[Excel-ൽ പരീക്ഷിക്കുക](assignment.md)
|
||||
|
||||
---
|
||||
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
|
||||
**അസൂയാ**:
|
||||
ഈ രേഖ AI വിവർത്തന സേവനം [Co-op Translator](https://github.com/Azure/co-op-translator) ഉപയോഗിച്ച് വിവർത്തനം ചെയ്തതാണ്. നാം കൃത്യതയ്ക്ക് ശ്രമിച്ചെങ്കിലും, സ്വയം പ്രവർത്തിക്കുന്ന വിവർത്തനങ്ങളിൽ പിശകുകൾ അല്ലെങ്കിൽ തെറ്റുകൾ ഉണ്ടാകാമെന്ന് ദയവായി ശ്രദ്ധിക്കുക. അതിന്റെ മാതൃഭാഷയിലുള്ള യഥാർത്ഥ രേഖയാണ് പ്രാമാണികമായ ഉറവിടം എന്ന് പരിഗണിക്കേണ്ടതാണ്. നിർണായകമായ വിവരങ്ങൾക്ക്, പ്രൊഫഷണൽ മനുഷ്യ വിവർത്തനം ശുപാർശ ചെയ്യപ്പെടുന്നു. ഈ വിവർത്തനം ഉപയോഗിക്കുന്നതിൽ നിന്നുണ്ടാകുന്ന ഏതെങ്കിലും തെറ്റിദ്ധാരണകൾക്കോ തെറ്റായ വ്യാഖ്യാനങ്ങൾക്കോ ഞങ്ങൾ ഉത്തരവാദികളല്ല.
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER END -->
|
||||
Loading…
Reference in new issue