You can not select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.
Data-Science-For-Beginners/translations/kn/3-Data-Visualization/09-visualization-quantities/README.md

212 lines
25 KiB

# ಪ್ರಮಾಣಗಳನ್ನು ದೃಶ್ಯೀಕರಿಸುವುದು
|![ [(@sketchthedocs)](https://sketchthedocs.dev) ಅವರಿಂದ ಸ್ಕೆಚ್ ನೋಟ್ ](../../sketchnotes/09-Visualizing-Quantities.png)|
|:---:|
| ಪ್ರಮಾಣಗಳನ್ನು ದೃಶ್ಯೀಕರಿಸುವುದು - _[@nitya](https://twitter.com/nitya) ಅವರಿಂದ ಸ್ಕೆಚ್ ನೋಟ್_ |
ಈ ಪಾಠದಲ್ಲಿ ನೀವು ಪ್ರಮಾಣದ ಸಂಧರ್ಭದಲ್ಲಿ ಆಸಕ್ತಿದಾಯಕ ದೃಶ್ಯೀಕರಣಗಳನ್ನು ರಚಿಸುವುದನ್ನು ಕಲಿಯಲು ಲಭ್ಯವಿರುವ ಅನೇಕ ಪೈಥಾನ್ ಗ್ರಂಥಾಲಯಗಳಲ್ಲಿ ಒಂದನ್ನು ಬಳಸುವ ವಿಧಾನವನ್ನು ಅನ್ವೇಷಿಸುವಿರಿ. ಮಿನೆಸೋಟಾದ ಪಕ್ಷಿಗಳ ಬಗ್ಗೆ ಸ್ವಚ್ಛಗೊಳಿಸಿದ ಡೇಟಾಸೆಟ್ ಬಳಸಿ, ನೀವು ಸ್ಥಳೀಯ ವನ್ಯಜೀವಿಗಳ ಬಗ್ಗೆ ಅನೇಕ ಆಸಕ್ತಿದಾಯಕ ವಾಸ್ತವಗಳನ್ನು ತಿಳಿದುಕೊಳ್ಳಬಹುದು.
## [ಪೂರ್ವ-ಪಾಠ ಪ್ರಶ್ನೋತ್ತರ](https://ff-quizzes.netlify.app/en/ds/quiz/16)
## Matplotlib ಬಳಸಿ ರೆಕ್ಕೆ ವ್ಯಾಪ್ತಿಯನ್ನು ಗಮನಿಸಿ
ವಿವಿಧ ರೀತಿಯ ಸರಳ ಮತ್ತು ಸುಕ್ಷ್ಮ ಪ್ಲಾಟ್‌ಗಳು ಮತ್ತು ಚಾರ್ಟ್‌ಗಳನ್ನು ರಚಿಸಲು ಅತ್ಯುತ್ತಮ ಗ್ರಂಥಾಲಯವೆಂದರೆ [Matplotlib](https://matplotlib.org/stable/index.html). ಸಾಮಾನ್ಯವಾಗಿ, ಈ ಗ್ರಂಥಾಲಯಗಳನ್ನು ಬಳಸಿ ಡೇಟಾವನ್ನು ಪ್ಲಾಟ್ ಮಾಡುವ ಪ್ರಕ್ರಿಯೆಯಲ್ಲಿ ನಿಮ್ಮ ಡೇಟಾಫ್ರೇಮ್‌ನ ಯಾವ ಭಾಗಗಳನ್ನು ಗುರಿಯಾಗಿಸಬೇಕೆಂದು ಗುರುತಿಸುವುದು, ಆ ಡೇಟಾದ ಮೇಲೆ ಅಗತ್ಯವಿರುವ ಪರಿವರ್ತನೆಗಳನ್ನು ಮಾಡುವುದು, ಅದರ x ಮತ್ತು y ಅಕ್ಷ ಮೌಲ್ಯಗಳನ್ನು ನಿಯೋಜಿಸುವುದು, ಯಾವ ರೀತಿಯ ಪ್ಲಾಟ್ ತೋರಿಸಬೇಕೆಂದು ನಿರ್ಧರಿಸುವುದು ಮತ್ತು ನಂತರ ಪ್ಲಾಟ್ ಅನ್ನು ತೋರಿಸುವುದು ಸೇರಿದೆ. Matplotlib ವಿವಿಧ ರೀತಿಯ ದೃಶ್ಯೀಕರಣಗಳನ್ನು ನೀಡುತ್ತದೆ, ಆದರೆ ಈ ಪಾಠಕ್ಕಾಗಿ ಪ್ರಮಾಣವನ್ನು ದೃಶ್ಯೀಕರಿಸಲು ಅತ್ಯಂತ ಸೂಕ್ತವಾದವುಗಳಾದ: ರೇಖಾಚಿತ್ರಗಳು, ಸ್ಕ್ಯಾಟರ್‌ಪ್ಲಾಟ್‌ಗಳು ಮತ್ತು ಬಾರ್ ಪ್ಲಾಟ್‌ಗಳ ಮೇಲೆ ಗಮನಹರಿಸೋಣ.
> ✅ ನಿಮ್ಮ ಡೇಟಾದ ರಚನೆ ಮತ್ತು ನೀವು ಹೇಳಬೇಕಾದ ಕಥೆಗೆ ಸೂಕ್ತವಾದ ಚಾರ್ಟ್ ಅನ್ನು ಬಳಸಿ.
> - ಕಾಲಕ್ರಮದಲ್ಲಿ ಪ್ರವೃತ್ತಿಗಳನ್ನು ವಿಶ್ಲೇಷಿಸಲು: ರೇಖೆ
> - ಮೌಲ್ಯಗಳನ್ನು ಹೋಲಿಸಲು: ಬಾರ್, ಕಾಲಮ್, ಪೈ, ಸ್ಕ್ಯಾಟರ್‌ಪ್ಲಾಟ್
> - ಭಾಗಗಳು ಒಟ್ಟಿಗೆ ಹೇಗೆ ಸಂಬಂಧ ಹೊಂದಿವೆ ಎಂದು ತೋರಿಸಲು: ಪೈ
> - ಡೇಟಾದ ವಿತರಣೆ ತೋರಿಸಲು: ಸ್ಕ್ಯಾಟರ್‌ಪ್ಲಾಟ್, ಬಾರ್
> - ಪ್ರವೃತ್ತಿಗಳನ್ನು ತೋರಿಸಲು: ರೇಖೆ, ಕಾಲಮ್
> - ಮೌಲ್ಯಗಳ ನಡುವಿನ ಸಂಬಂಧಗಳನ್ನು ತೋರಿಸಲು: ರೇಖೆ, ಸ್ಕ್ಯಾಟರ್‌ಪ್ಲಾಟ್, ಬಬಲ್
ನಿಮ್ಮ ಬಳಿ ಡೇಟಾಸೆಟ್ ಇದ್ದರೆ ಮತ್ತು ನೀಡಲಾದ ಐಟಂ ಎಷ್ಟು ಇದೆ ಎಂದು ಕಂಡುಹಿಡಿಯಬೇಕಾದರೆ, ಮೊದಲ ಕಾರ್ಯಗಳಲ್ಲಿ ಒಂದಾದದ್ದು ಅದರ ಮೌಲ್ಯಗಳನ್ನು ಪರಿಶೀಲಿಸುವುದು.
✅ Matplotlib ಗಾಗಿ ಅತ್ಯುತ್ತಮ 'ಚೀಟ್ ಶೀಟ್‌ಗಳು' [ಇಲ್ಲಿ](https://matplotlib.org/cheatsheets/cheatsheets.pdf) ಲಭ್ಯವಿವೆ.
## ಪಕ್ಷಿಗಳ ರೆಕ್ಕೆ ವ್ಯಾಪ್ತಿಯ ಮೌಲ್ಯಗಳ ಬಗ್ಗೆ ರೇಖಾಚಿತ್ರ ರಚಿಸಿ
ಈ ಪಾಠದ ರೂಟ್ ಫೋಲ್ಡರ್‌ನಲ್ಲಿರುವ `notebook.ipynb` ಫೈಲ್ ತೆರೆಯಿರಿ ಮತ್ತು ಒಂದು ಸೆಲ್ ಸೇರಿಸಿ.
> ಗಮನಿಸಿ: ಡೇಟಾ ಈ ರೆಪೋ ರೂಟ್‌ನ `/data` ಫೋಲ್ಡರ್‌ನಲ್ಲಿ ಸಂಗ್ರಹಿಸಲಾಗಿದೆ.
```python
import pandas as pd
import matplotlib.pyplot as plt
birds = pd.read_csv('../../data/birds.csv')
birds.head()
```
ಈ ಡೇಟಾ ಪಠ್ಯ ಮತ್ತು ಸಂಖ್ಯೆಗಳ ಮಿಶ್ರಣವಾಗಿದೆ:
| | ಹೆಸರು | ವೈಜ್ಞಾನಿಕ ಹೆಸರು | ವರ್ಗ | ಕ್ರಮ | ಕುಟುಂಬ | ಜೀನಸ್ | ಸಂರಕ್ಷಣಾ ಸ್ಥಿತಿ | ಕನಿಷ್ಠ ಉದ್ದ | ಗರಿಷ್ಠ ಉದ್ದ | ಕನಿಷ್ಠ ದೇಹದ ಭಾರ | ಗರಿಷ್ಠ ದೇಹದ ಭಾರ | ಕನಿಷ್ಠ ರೆಕ್ಕೆ ವ್ಯಾಪ್ತಿ | ಗರಿಷ್ಠ ರೆಕ್ಕೆ ವ್ಯಾಪ್ತಿ |
| ---: | :--------------------------- | :--------------------- | :-------------------- | :----------- | :------- | :---------- | :----------------- | --------: | --------: | ----------: | ----------: | ----------: | ----------: |
| 0 | ಬ್ಲ್ಯಾಕ್-ಬೆಲ್ಡ್ ವಿಸ್ಲಿಂಗ್-ಡಕ್ | Dendrocygna autumnalis | ಬಾತುಗಳು/ಗೀಸೆಗಳು/ನೀರಾಜೀವಿಗಳು | Anseriformes | Anatidae | Dendrocygna | LC | 47 | 56 | 652 | 1020 | 76 | 94 |
| 1 | ಫುಲ್ವಸ್ ವಿಸ್ಲಿಂಗ್-ಡಕ್ | Dendrocygna bicolor | ಬಾತುಗಳು/ಗೀಸೆಗಳು/ನೀರಾಜೀವಿಗಳು | Anseriformes | Anatidae | Dendrocygna | LC | 45 | 53 | 712 | 1050 | 85 | 93 |
| 2 | ಸ್ನೋ ಗೂಸ್ | Anser caerulescens | ಬಾತುಗಳು/ಗೀಸೆಗಳು/ನೀರಾಜೀವಿಗಳು | Anseriformes | Anatidae | Anser | LC | 64 | 79 | 2050 | 4050 | 135 | 165 |
| 3 | ರಾಸ್ ಗೂಸ್ | Anser rossii | ಬಾತುಗಳು/ಗೀಸೆಗಳು/ನೀರಾಜೀವಿಗಳು | Anseriformes | Anatidae | Anser | LC | 57.3 | 64 | 1066 | 1567 | 113 | 116 |
| 4 | ಗ್ರೇಟರ್ ವೈಟ್-ಫ್ರಂಟ್ ಗೂಸ್ | Anser albifrons | ಬಾತುಗಳು/ಗೀಸೆಗಳು/ನೀರಾಜೀವಿಗಳು | Anseriformes | Anatidae | Anser | LC | 64 | 81 | 1930 | 3310 | 130 | 165 |
ಸರಳ ರೇಖಾಚಿತ್ರ ಬಳಸಿ ಕೆಲವು ಸಂಖ್ಯಾತ್ಮಕ ಡೇಟಾವನ್ನು ಪ್ಲಾಟ್ ಮಾಡುವುದರಿಂದ ಪ್ರಾರಂಭಿಸೋಣ. ಈ ಆಸಕ್ತಿದಾಯಕ ಪಕ್ಷಿಗಳ ಗರಿಷ್ಠ ರೆಕ್ಕೆ ವ್ಯಾಪ್ತಿಯ ದೃಶ್ಯವನ್ನು ನೀವು ಬಯಸಿದರೆ.
```python
wingspan = birds['MaxWingspan']
wingspan.plot()
```
![ಗರಿಷ್ಠ ರೆಕ್ಕೆ ವ್ಯಾಪ್ತಿ](../../../../translated_images/kn/max-wingspan-02.e79fd847b2640b89e21e340a3a9f4c5d4b224c4fcd65f54385e84f1c9ed26d52.png)
ನೀವು ತಕ್ಷಣವೇ ಏನು ಗಮನಿಸುತ್ತೀರಿ? ಕನಿಷ್ಠ ಒಂದು ಹೊರಗಿನ ಮೌಲ್ಯವಿದೆ ಎಂದು ತೋರುತ್ತದೆ - ಅದು ತುಂಬಾ ದೊಡ್ಡ ರೆಕ್ಕೆ ವ್ಯಾಪ್ತಿಯಾಗಿದೆ! 2300 ಸೆಂ.ಮೀ ರೆಕ್ಕೆ ವ್ಯಾಪ್ತಿ ಎಂದರೆ 23 ಮೀಟರ್ - ಮಿನೆಸೋಟಾದಲ್ಲಿ ಪ್ಟೆರೋಡ್ಯಾಕ್ಟೈಲ್ಸ್ ಓಡಾಡುತ್ತಿವೆಯೇ? ಪರಿಶೀಲಿಸೋಣ.
ನೀವು Excel ನಲ್ಲಿ ತ್ವರಿತವಾಗಿ ಸೋರ್ಟ್ ಮಾಡಿ ಆ ಹೊರಗಿನ ಮೌಲ್ಯಗಳನ್ನು ಕಂಡುಹಿಡಿಯಬಹುದು, ಅವು ಬಹುಶಃ ಟೈಪೋಗಳಾಗಿರಬಹುದು, ಆದರೆ ಪ್ಲಾಟ್‌ನೊಳಗಿಂದಲೇ ದೃಶ್ಯೀಕರಣ ಪ್ರಕ್ರಿಯೆಯನ್ನು ಮುಂದುವರಿಸಿ.
x-ಅಕ್ಷಕ್ಕೆ ಲೇಬಲ್ಗಳನ್ನು ಸೇರಿಸಿ ಯಾವ ರೀತಿಯ ಪಕ್ಷಿಗಳು ಪ್ರಶ್ನೆಯಲ್ಲಿವೆ ಎಂದು ತೋರಿಸಲು:
```
plt.title('Max Wingspan in Centimeters')
plt.ylabel('Wingspan (CM)')
plt.xlabel('Birds')
plt.xticks(rotation=45)
x = birds['Name']
y = birds['MaxWingspan']
plt.plot(x, y)
plt.show()
```
![ಲೇಬಲ್ಗಳೊಂದಿಗೆ ರೆಕ್ಕೆ ವ್ಯಾಪ್ತಿ](../../../../translated_images/kn/max-wingspan-labels-02.aa90e826ca49a9d1dde78075e9755c1849ef56a4e9ec60f7e9f3806daf9283e2.png)
ಲೇಬಲ್ಗಳ ತಿರುಗುವಿಕೆ 45 ಡಿಗ್ರಿಗಳಾಗಿದ್ದರೂ, ಓದಲು ತುಂಬಾ ಹೆಚ್ಚು ಇದೆ. ಬೇರೆ ತಂತ್ರವನ್ನು ಪ್ರಯತ್ನಿಸೋಣ: ಹೊರಗಿನ ಮೌಲ್ಯಗಳಿಗೆ ಮಾತ್ರ ಲೇಬಲ್ಗಳನ್ನು ನೀಡಿ ಮತ್ತು ಲೇಬಲ್ಗಳನ್ನು ಚಾರ್ಟ್ ಒಳಗೆ ಸೆಟ್ ಮಾಡಿ. ಲೇಬಲಿಂಗ್‌ಗೆ ಹೆಚ್ಚು ಜಾಗ ನೀಡಲು ಸ್ಕ್ಯಾಟರ್ ಚಾರ್ಟ್ ಬಳಸಬಹುದು:
```python
plt.title('Max Wingspan in Centimeters')
plt.ylabel('Wingspan (CM)')
plt.tick_params(axis='both',which='both',labelbottom=False,bottom=False)
for i in range(len(birds)):
x = birds['Name'][i]
y = birds['MaxWingspan'][i]
plt.plot(x, y, 'bo')
if birds['MaxWingspan'][i] > 500:
plt.text(x, y * (1 - 0.05), birds['Name'][i], fontsize=12)
plt.show()
```
ಇಲ್ಲಿ ಏನಾಗುತ್ತಿದೆ? ನೀವು `tick_params` ಬಳಸಿ ಕೆಳಗಿನ ಲೇಬಲ್ಗಳನ್ನು ಮರೆಮಾಡಿ, ನಂತರ ನಿಮ್ಮ ಪಕ್ಷಿಗಳ ಡೇಟಾಸೆಟ್ ಮೇಲೆ ಲೂಪ್ ರಚಿಸಿದ್ದೀರಿ. `bo` ಬಳಸಿ ಚಾರ್ಟ್ ಅನ್ನು ಸಣ್ಣ, ವೃತ್ತಾಕಾರದ ನೀಲಿ ಬಿಂದುಗಳೊಂದಿಗೆ ಪ್ಲಾಟ್ ಮಾಡಿ, ಗರಿಷ್ಠ ರೆಕ್ಕೆ ವ್ಯಾಪ್ತಿ 500 ಕ್ಕಿಂತ ಹೆಚ್ಚು ಇರುವ ಯಾವುದೇ ಪಕ್ಷಿಯನ್ನು ಪರಿಶೀಲಿಸಿ, ಹಾಗಿದ್ದರೆ ಅದರ ಲೇಬಲನ್ನು ಬಿಂದು ಪಕ್ಕದಲ್ಲಿ ತೋರಿಸಿದ್ದೀರಿ. ನೀವು y ಅಕ್ಷದಲ್ಲಿ ಲೇಬಲ್ಗಳನ್ನು ಸ್ವಲ್ಪ ಬದಲಾಗಿಸಿದ್ದೀರಿ (`y * (1 - 0.05)`) ಮತ್ತು ಪಕ್ಷಿಯ ಹೆಸರನ್ನು ಲೇಬಲಾಗಿ ಬಳಸಿದ್ದೀರಿ.
ನೀವು ಏನು ಕಂಡುಹಿಡಿದಿರಿ?
![ಹೊರಗಿನ ಮೌಲ್ಯಗಳು](../../../../translated_images/kn/labeled-wingspan-02.6110e2d2401cd5238ccc24dfb6d04a6c19436101f6cec151e3992e719f9f1e1f.png)
## ನಿಮ್ಮ ಡೇಟಾವನ್ನು ಫಿಲ್ಟರ್ ಮಾಡಿ
ಬಾಲ್ಡ್ ಈಗಲ್ ಮತ್ತು ಪ್ರೇರೀ ಫಾಲ್ಕನ್, ಬಹುಶಃ ತುಂಬಾ ದೊಡ್ಡ ಪಕ್ಷಿಗಳು ಆಗಿದ್ದರೂ, ಗರಿಷ್ಠ ರೆಕ್ಕೆ ವ್ಯಾಪ್ತಿಗೆ ಹೆಚ್ಚುವರಿ `0` ಸೇರಿಸಿರುವುದರಿಂದ ತಪ್ಪಾಗಿ ಲೇಬಲಾದಂತೆ ತೋರುತ್ತದೆ. 25 ಮೀಟರ್ ರೆಕ್ಕೆ ವ್ಯಾಪ್ತಿಯ ಬಾಲ್ಡ್ ಈಗಲ್ ಅನ್ನು ನೀವು ಭೇಟಿಯಾಗುವುದು ಸಾಧ್ಯವಿಲ್ಲ, ಆದರೆ ಹಾಗಿದ್ದರೆ ದಯವಿಟ್ಟು ನಮಗೆ ತಿಳಿಸಿ! ಆ ಎರಡು ಹೊರಗಿನ ಮೌಲ್ಯಗಳನ್ನು ಹೊರತುಪಡಿಸಿ ಹೊಸ ಡೇಟಾಫ್ರೇಮ್ ರಚಿಸೋಣ:
```python
plt.title('Max Wingspan in Centimeters')
plt.ylabel('Wingspan (CM)')
plt.xlabel('Birds')
plt.tick_params(axis='both',which='both',labelbottom=False,bottom=False)
for i in range(len(birds)):
x = birds['Name'][i]
y = birds['MaxWingspan'][i]
if birds['Name'][i] not in ['Bald eagle', 'Prairie falcon']:
plt.plot(x, y, 'bo')
plt.show()
```
ಹೊರಗಿನ ಮೌಲ್ಯಗಳನ್ನು ಫಿಲ್ಟರ್ ಮಾಡಿದ ನಂತರ, ನಿಮ್ಮ ಡೇಟಾ ಈಗ ಹೆಚ್ಚು ಸಮ್ಮಿಲಿತ ಮತ್ತು ಅರ್ಥಮಾಡಿಕೊಳ್ಳಲು ಸುಲಭವಾಗಿದೆ.
![ರೆಕ್ಕೆ ವ್ಯಾಪ್ತಿಗಳ ಸ್ಕ್ಯಾಟರ್‌ಪ್ಲಾಟ್](../../../../translated_images/kn/scatterplot-wingspan-02.1c33790094ce36a75f5fb45b25ed2cf27f0356ea609e43c11e97a2cedd7011a4.png)
ಕನಿಷ್ಠ ರೆಕ್ಕೆ ವ್ಯಾಪ್ತಿಯ ದೃಷ್ಟಿಯಿಂದ ಸ್ವಚ್ಛಗೊಳಿಸಿದ ಡೇಟಾಸೆಟ್ ಇದ್ದು, ಈ ಪಕ್ಷಿಗಳ ಬಗ್ಗೆ ಇನ್ನಷ್ಟು ತಿಳಿದುಕೊಳ್ಳೋಣ.
ರೇಖೆ ಮತ್ತು ಸ್ಕ್ಯಾಟರ್ ಪ್ಲಾಟ್‌ಗಳು ಡೇಟಾ ಮೌಲ್ಯಗಳು ಮತ್ತು ಅವುಗಳ ವಿತರಣೆಗಳ ಬಗ್ಗೆ ಮಾಹಿತಿ ತೋರಿಸಬಹುದು, ಆದರೆ ನಾವು ಈ ಡೇಟಾಸೆಟ್‌ನಲ್ಲಿರುವ ಮೌಲ್ಯಗಳ ಬಗ್ಗೆ ಯೋಚಿಸಬೇಕಾಗಿದೆ. ಪ್ರಮಾಣದ ಬಗ್ಗೆ ಕೆಳಗಿನ ಪ್ರಶ್ನೆಗಳಿಗೆ ಉತ್ತರ ನೀಡಲು ನೀವು ದೃಶ್ಯೀಕರಣಗಳನ್ನು ರಚಿಸಬಹುದು:
> ಎಷ್ಟು ವರ್ಗದ ಪಕ್ಷಿಗಳು ಇವೆ ಮತ್ತು ಅವುಗಳ ಸಂಖ್ಯೆ ಎಷ್ಟು?
> ಎಷ್ಟು ಪಕ್ಷಿಗಳು ನಾಶವಾಗಿವೆ, ಅಪಾಯದಲ್ಲಿವೆ, ಅಪರೂಪವಾಗಿವೆ ಅಥವಾ ಸಾಮಾನ್ಯವಾಗಿವೆ?
> ಲಿನಿಯಸ್ ಅವರ ಪದಬಳಕೆಯ ಪ್ರಕಾರ ಎಷ್ಟು ಜೀನಸ್ ಮತ್ತು ಕ್ರಮಗಳಿವೆ?
## ಬಾರ್ ಚಾರ್ಟ್‌ಗಳನ್ನು ಅನ್ವೇಷಿಸಿ
ಬಾರ್ ಚಾರ್ಟ್‌ಗಳು ಡೇಟಾ ಗುಂಪುಗಳನ್ನು ತೋರಿಸಲು ಉಪಯುಕ್ತವಾಗಿವೆ. ಈ ಡೇಟಾಸೆಟ್‌ನಲ್ಲಿ ಇರುವ ಪಕ್ಷಿಗಳ ವರ್ಗಗಳನ್ನು ಅನ್ವೇಷಿಸಿ ಯಾವುದು ಸಂಖ್ಯೆಯಲ್ಲಿ ಅತ್ಯಂತ ಸಾಮಾನ್ಯವಾಗಿದೆ ಎಂದು ನೋಡೋಣ.
ನೋಟ್‌ಬುಕ್ ಫೈಲ್‌ನಲ್ಲಿ, ಮೂಲ ಬಾರ್ ಚಾರ್ಟ್ ರಚಿಸಿ
✅ ಗಮನಿಸಿ, ನೀವು ಹಿಂದಿನ ವಿಭಾಗದಲ್ಲಿ ಗುರುತಿಸಿದ ಎರಡು ಹೊರಗಿನ ಮೌಲ್ಯಗಳ ಪಕ್ಷಿಗಳನ್ನು ಫಿಲ್ಟರ್ ಮಾಡಬಹುದು, ಅವುಗಳ ರೆಕ್ಕೆ ವ್ಯಾಪ್ತಿಯ ಟೈಪೋವನ್ನು ತಿದ್ದುಪಡಿ ಮಾಡಬಹುದು ಅಥವಾ ಈ ವ್ಯಾಯಾಮಗಳಿಗೆ ಅವುಗಳನ್ನು ಉಳಿಸಬಹುದು, ಏಕೆಂದರೆ ಇವು ರೆಕ್ಕೆ ವ್ಯಾಪ್ತಿಯ ಮೌಲ್ಯಗಳ ಮೇಲೆ ಅವಲಂಬಿತವಿಲ್ಲ.
ನೀವು ಬಾರ್ ಚಾರ್ಟ್ ರಚಿಸಲು ಬಯಸಿದರೆ, ನೀವು ಗಮನಹರಿಸಬೇಕಾದ ಡೇಟಾವನ್ನು ಆಯ್ಕೆ ಮಾಡಬಹುದು. ಬಾರ್ ಚಾರ್ಟ್‌ಗಳು ಕಚ್ಚಾ ಡೇಟಾದಿಂದ ರಚಿಸಬಹುದು:
```python
birds.plot(x='Category',
kind='bar',
stacked=True,
title='Birds of Minnesota')
```
![ಪೂರ್ಣ ಡೇಟಾ ಬಾರ್ ಚಾರ್ಟ್ ಆಗಿ](../../../../translated_images/kn/full-data-bar-02.aaa3fda71c63ed564b917841a1886c177dd9a26424142e510c0c0498fd6ca160.png)
ಆದರೆ ಈ ಬಾರ್ ಚಾರ್ಟ್ ಓದಲು ಅಸಾಧ್ಯವಾಗಿದೆ ಏಕೆಂದರೆ ಅತಿಯಾದ ಗುಂಪುಬದ್ಧವಲ್ಲದ ಡೇಟಾ ಇದೆ. ನೀವು ಪ್ಲಾಟ್ ಮಾಡಲು ಬಯಸುವ ಡೇಟಾವನ್ನು ಮಾತ್ರ ಆಯ್ಕೆ ಮಾಡಬೇಕು, ಆದ್ದರಿಂದ ಪಕ್ಷಿಗಳ ಉದ್ದವನ್ನು ಅವುಗಳ ವರ್ಗದ ಆಧಾರದ ಮೇಲೆ ನೋಡೋಣ.
ನಿಮ್ಮ ಡೇಟಾವನ್ನು ಪಕ್ಷಿಗಳ ವರ್ಗವನ್ನು ಮಾತ್ರ ಒಳಗೊಂಡಂತೆ ಫಿಲ್ಟರ್ ಮಾಡಿ.
✅ ನೀವು ಪಾಂಡಾಸ್ ಬಳಸಿ ಡೇಟಾವನ್ನು ನಿರ್ವಹಿಸುತ್ತೀರಿ ಮತ್ತು ನಂತರ Matplotlib ಅನ್ನು ಚಾರ್ಟ್ ಮಾಡಲು ಬಿಡುತ್ತೀರಿ ಎಂದು ಗಮನಿಸಿ.
ಬಹುಮಾನ ವರ್ಗಗಳಿದ್ದರಿಂದ, ನೀವು ಈ ಚಾರ್ಟ್ ಅನ್ನು ಲಂಬವಾಗಿ ಪ್ರದರ್ಶಿಸಬಹುದು ಮತ್ತು ಎಲ್ಲಾ ಡೇಟಾವನ್ನು ಒಳಗೊಂಡಂತೆ ಅದರ ಎತ್ತರವನ್ನು ಸರಿಹೊಂದಿಸಬಹುದು:
```python
category_count = birds.value_counts(birds['Category'].values, sort=True)
plt.rcParams['figure.figsize'] = [6, 12]
category_count.plot.barh()
```
![ವರ್ಗ ಮತ್ತು ಉದ್ದ](../../../../translated_images/kn/category-counts-02.0b9a0a4de42275ae5096d0f8da590d8bf520d9e7e40aad5cc4fc8d276480cc32.png)
ಈ ಬಾರ್ ಚಾರ್ಟ್ ಪ್ರತಿ ವರ್ಗದಲ್ಲಿನ ಪಕ್ಷಿಗಳ ಸಂಖ್ಯೆಯ ಉತ್ತಮ ದೃಶ್ಯವನ್ನು ತೋರಿಸುತ್ತದೆ. ಕ್ಷಣದಲ್ಲಿಯೇ ನೀವು ಈ ಪ್ರದೇಶದಲ್ಲಿ ಅತಿ ಹೆಚ್ಚು ಪಕ್ಷಿಗಳು ಬಾತುಗಳು/ಗೀಸೆಗಳು/ನೀರಾಜೀವಿಗಳು ವರ್ಗದಲ್ಲಿವೆ ಎಂದು ನೋಡಬಹುದು. ಮಿನೆಸೋಟಾ '10,000 ಸರೋವರಗಳ ಭೂಮಿ' ಆಗಿರುವುದರಿಂದ ಇದು ಆಶ್ಚರ್ಯಕರವಲ್ಲ!
✅ ಈ ಡೇಟಾಸೆಟ್‌ನಲ್ಲಿ ಇನ್ನಷ್ಟು ಎಣಿಕೆಗಳನ್ನು ಪ್ರಯತ್ನಿಸಿ. ಏನಾದರೂ ನಿಮಗೆ ಆಶ್ಚರ್ಯಕರವೇ?
## ಡೇಟಾ ಹೋಲಿಕೆ
ನೀವು ಹೊಸ ಅಕ್ಷಗಳನ್ನು ರಚಿಸಿ ಗುಂಪುಬದ್ಧ ಡೇಟಾದ ವಿಭಿನ್ನ ಹೋಲಿಕೆಗಳನ್ನು ಪ್ರಯತ್ನಿಸಬಹುದು. ಪಕ್ಷಿಯ ಗರಿಷ್ಠ ಉದ್ದವನ್ನು ಅದರ ವರ್ಗದ ಆಧಾರದ ಮೇಲೆ ಹೋಲಿಸಿ:
```python
maxlength = birds['MaxLength']
plt.barh(y=birds['Category'], width=maxlength)
plt.rcParams['figure.figsize'] = [6, 12]
plt.show()
```
![ಡೇಟಾ ಹೋಲಿಕೆ](../../../../translated_images/kn/category-length-02.7304bf519375c9807d8165cc7ec60dd2a60f7b365b23098538e287d89adb7d76.png)
ಇಲ್ಲಿ ಏನೂ ಆಶ್ಚರ್ಯಕರವಿಲ್ಲ: ಹುಮ್ಮಿಂಗ್‌ಬರ್ಡ್‌ಗಳು ಪೆಲಿಕಾನ್ಸ್ ಅಥವಾ ಗೀಸೆಗಳಿಗಿಂತ ಕಡಿಮೆ ಗರಿಷ್ಠ ಉದ್ದ ಹೊಂದಿವೆ. ಡೇಟಾ ತಾರ್ಕಿಕವಾಗಿದ್ದರೆ ಚೆನ್ನಾಗಿದೆ!
ನೀವು ಬಾರ್ ಚಾರ್ಟ್‌ಗಳ ಇನ್ನಷ್ಟು ಆಸಕ್ತಿದಾಯಕ ದೃಶ್ಯೀಕರಣಗಳನ್ನು ರಚಿಸಬಹುದು ಡೇಟಾವನ್ನು ಒಟ್ಟುಗೂಡಿಸುವ ಮೂಲಕ. ನೀಡಲಾದ ಪಕ್ಷಿ ವರ್ಗದಲ್ಲಿ ಕನಿಷ್ಠ ಮತ್ತು ಗರಿಷ್ಠ ಉದ್ದವನ್ನು ಒಟ್ಟುಗೂಡಿಸೋಣ:
```python
minLength = birds['MinLength']
maxLength = birds['MaxLength']
category = birds['Category']
plt.barh(category, maxLength)
plt.barh(category, minLength)
plt.show()
```
ಈ ಪ್ಲಾಟ್‌ನಲ್ಲಿ, ನೀವು ಪಕ್ಷಿ ವರ್ಗದ ಪ್ರತಿ ಕನಿಷ್ಠ ಉದ್ದ ಮತ್ತು ಗರಿಷ್ಠ ಉದ್ದದ ವ್ಯಾಪ್ತಿಯನ್ನು ನೋಡಬಹುದು. ಈ ಡೇಟಾ ನೀಡಿದಂತೆ, ಪಕ್ಷಿ ದೊಡ್ಡದಾದಂತೆ ಅದರ ಉದ್ದದ ವ್ಯಾಪ್ತಿಯೂ ದೊಡ್ಡದಾಗುತ್ತದೆ ಎಂದು ನೀವು ಸುರಕ್ಷಿತವಾಗಿ ಹೇಳಬಹುದು. ಅದ್ಭುತ!
![ಒಟ್ಟುಗೂಡಿಸಿದ ಮೌಲ್ಯಗಳು](../../../../translated_images/kn/superimposed-02.f03058536baeb2ed7864f01102538464d4c2fd7ade881ddd7d5ba74dc5d2fdae.png)
## 🚀 ಸವಾಲು
ಈ ಪಕ್ಷಿ ಡೇಟಾಸೆಟ್ ಒಂದು ನಿರ್ದಿಷ್ಟ ಪರಿಸರದಲ್ಲಿ ವಿವಿಧ ರೀತಿಯ ಪಕ್ಷಿಗಳ ಬಗ್ಗೆ ಸಮೃದ್ಧ ಮಾಹಿತಿಯನ್ನು ನೀಡುತ್ತದೆ. ಇಂಟರ್ನೆಟ್‌ನಲ್ಲಿ ಹುಡುಕಿ ಮತ್ತು ಇನ್ನಷ್ಟು ಪಕ್ಷಿ-ಕೇಂದ್ರಿತ ಡೇಟಾಸೆಟ್‌ಗಳನ್ನು ಕಂಡುಹಿಡಿಯಿರಿ. ಈ ಪಕ್ಷಿಗಳ ಸುತ್ತಲೂ ಚಾರ್ಟ್‌ಗಳು ಮತ್ತು ಗ್ರಾಫ್‌ಗಳನ್ನು ರಚಿಸುವ ಅಭ್ಯಾಸ ಮಾಡಿ ನೀವು ತಿಳಿಯದ ವಾಸ್ತವಗಳನ್ನು ಅನ್ವೇಷಿಸಿ.
## [ಪೋಸ್ಟ್-ಪಾಠ ಪ್ರಶ್ನೋತ್ತರ](https://ff-quizzes.netlify.app/en/ds/quiz/17)
## ವಿಮರ್ಶೆ ಮತ್ತು ಸ್ವಯಂ ಅಧ್ಯಯನ
ಈ ಮೊದಲ ಪಾಠವು Matplotlib ಬಳಸಿ ಪ್ರಮಾಣಗಳನ್ನು ದೃಶ್ಯೀಕರಿಸುವ ಬಗ್ಗೆ ನಿಮಗೆ ಕೆಲವು ಮಾಹಿತಿ ನೀಡಿದೆ. ದೃಶ್ಯೀಕರಣಕ್ಕಾಗಿ ಡೇಟಾಸೆಟ್‌ಗಳೊಂದಿಗೆ ಕೆಲಸ ಮಾಡುವ ಇತರ ವಿಧಾನಗಳ ಬಗ್ಗೆ ಸಂಶೋಧನೆ ಮಾಡಿ. [Plotly](https://github.com/plotly/plotly.py) ಒಂದು ಗ್ರಂಥಾಲಯವಾಗಿದೆ, ಇದನ್ನು ನಾವು ಈ ಪಾಠಗಳಲ್ಲಿ ಒಳಗೊಂಡಿಲ್ಲ, ಆದ್ದರಿಂದ ಅದು ಏನು ನೀಡಬಹುದು ಎಂದು ನೋಡಿ.
## ನಿಯೋಜನೆ
[ರೆಖೆಗಳು, ಸ್ಕ್ಯಾಟರ್‌ಗಳು ಮತ್ತು ಬಾರ್‌ಗಳು](assignment.md)
---
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
**ಅಸ್ವೀಕರಣ**:
ಈ ದಸ್ತಾವೇಜು AI ಅನುವಾದ ಸೇವೆ [Co-op Translator](https://github.com/Azure/co-op-translator) ಬಳಸಿ ಅನುವಾದಿಸಲಾಗಿದೆ. ನಾವು ನಿಖರತೆಯಿಗಾಗಿ ಪ್ರಯತ್ನಿಸುತ್ತಿದ್ದರೂ, ಸ್ವಯಂಚಾಲಿತ ಅನುವಾದಗಳಲ್ಲಿ ದೋಷಗಳು ಅಥವಾ ಅಸತ್ಯತೆಗಳು ಇರಬಹುದು ಎಂದು ದಯವಿಟ್ಟು ಗಮನಿಸಿ. ಮೂಲ ಭಾಷೆಯಲ್ಲಿರುವ ಮೂಲ ದಸ್ತಾವೇಜನ್ನು ಅಧಿಕೃತ ಮೂಲವಾಗಿ ಪರಿಗಣಿಸಬೇಕು. ಮಹತ್ವದ ಮಾಹಿತಿಗಾಗಿ, ವೃತ್ತಿಪರ ಮಾನವ ಅನುವಾದವನ್ನು ಶಿಫಾರಸು ಮಾಡಲಾಗುತ್ತದೆ. ಈ ಅನುವಾದ ಬಳಕೆಯಿಂದ ಉಂಟಾಗುವ ಯಾವುದೇ ತಪ್ಪು ಅರ್ಥಮಾಡಿಕೊಳ್ಳುವಿಕೆ ಅಥವಾ ತಪ್ಪು ವಿವರಣೆಗಳಿಗೆ ನಾವು ಹೊಣೆಗಾರರಾಗುವುದಿಲ್ಲ.
<!-- CO-OP TRANSLATOR DISCLAIMER END -->