You can not select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.

203 lines
20 KiB

<!--
CO_OP_TRANSLATOR_METADATA:
{
"original_hash": "af6a12015c6e250e500b570a9fa42593",
"translation_date": "2025-08-27T18:42:43+00:00",
"source_file": "3-Data-Visualization/11-visualization-proportions/README.md",
"language_code": "mr"
}
-->
# प्रमाणांचे दृश्यांकन
|![ Sketchnote by [(@sketchthedocs)](https://sketchthedocs.dev) ](../../sketchnotes/11-Visualizing-Proportions.png)|
|:---:|
|प्रमाणांचे दृश्यांकन - _Sketchnote by [@nitya](https://twitter.com/nitya)_ |
या धड्यात, तुम्ही निसर्गाशी संबंधित वेगळ्या डेटासेटचा वापर करून प्रमाणांचे दृश्यांकन कराल, जसे की मशरूम्सबद्दलच्या डेटासेटमध्ये किती प्रकारचे बुरशी आहेत हे पाहणे. चला, या अद्भुत बुरशींचा अभ्यास करूया, ज्यासाठी ऑडुबॉनकडून घेतलेल्या डेटासेटमध्ये Agaricus आणि Lepiota कुटुंबातील 23 प्रकारच्या गिल्ड मशरूम्सची माहिती आहे. तुम्ही खालील स्वादिष्ट दृश्यांकन प्रकारांचा प्रयोग कराल:
- पाई चार्ट्स 🥧
- डोनट चार्ट्स 🍩
- वाफल चार्ट्स 🧇
> 💡 मायक्रोसॉफ्ट रिसर्चने तयार केलेल्या [Charticulator](https://charticulator.com) नावाच्या एका खूपच रोचक प्रकल्पात डेटा दृश्यांकनासाठी फ्री ड्रॅग अँड ड्रॉप इंटरफेस आहे. त्यांच्या एका ट्युटोरियलमध्ये त्यांनी हा मशरूम डेटासेटही वापरला आहे! त्यामुळे तुम्ही डेटा एक्सप्लोर करू शकता आणि त्याच वेळी लायब्ररी शिकू शकता: [Charticulator tutorial](https://charticulator.com/tutorials/tutorial4.html).
## [पूर्व-व्याख्यान प्रश्नमंजुषा](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/20)
## तुमच्या मशरूम्सना ओळखा 🍄
मशरूम्स खूपच रोचक असतात. चला, त्यांचा अभ्यास करण्यासाठी एक डेटासेट आयात करूया:
```python
import pandas as pd
import matplotlib.pyplot as plt
mushrooms = pd.read_csv('../../data/mushrooms.csv')
mushrooms.head()
```
एक टेबल तयार होते ज्यामध्ये विश्लेषणासाठी छान डेटा आहे:
| वर्ग | कॅप-आकार | कॅप-पृष्ठभाग | कॅप-रंग | जखमा | वास | गिल-जोडणी | गिल-अंतर | गिल-आकार | गिल-रंग | स्टॉक-आकार | स्टॉक-मूळ | स्टॉक-पृष्ठभाग-रिंगच्या-वर | स्टॉक-पृष्ठभाग-रिंगच्या-खाली | स्टॉक-रंग-रिंगच्या-वर | स्टॉक-रंग-रिंगच्या-खाली | पडदा-प्रकार | पडदा-रंग | रिंग-क्रमांक | रिंग-प्रकार | बीज-छपाई-रंग | लोकसंख्या | निवासस्थान |
| --------- | --------- | ----------- | -------- | ----- | -------- | ---------- | --------- | -------- | --------- | ---------- | --------- | -------------------------- | -------------------------- | ---------------------- | ---------------------- | ----------- | --------- | ------------ | ----------- | ------------- | ---------- | ----------- |
| विषारी | उंचवटा | गुळगुळीत | तपकिरी | जखमा | तीव्र | मुक्त | जवळचे | अरुंद | काळा | रुंदावलेला | समान | गुळगुळीत | गुळगुळीत | पांढरा | पांढरा | अंशतः | पांढरा | एक | लटकणारा | काळा | विखुरलेला | शहरी |
| खाद्य | उंचवटा | गुळगुळीत | पिवळा | जखमा | बदामाचा | मुक्त | जवळचे | रुंद | काळा | रुंदावलेला | काठीसारखा | गुळगुळीत | गुळगुळीत | पांढरा | पांढरा | अंशतः | पांढरा | एक | लटकणारा | तपकिरी | विपुल | गवताळ |
| खाद्य | घंटेसारखा | गुळगुळीत | पांढरा | जखमा | बडीशेप | मुक्त | जवळचे | रुंद | तपकिरी | रुंदावलेला | काठीसारखा | गुळगुळीत | गुळगुळीत | पांढरा | पांढरा | अंशतः | पांढरा | एक | लटकणारा | तपकिरी | विपुल | कुरण |
| विषारी | उंचवटा | खडबडीत | पांढरा | जखमा | तीव्र | मुक्त | जवळचे | अरुंद | तपकिरी | रुंदावलेला | समान | गुळगुळीत | गुळगुळीत | पांढरा | पांढरा | अंशतः | पांढरा | एक | लटकणारा | काळा | विखुरलेला | शहरी |
तुम्हाला लगेच लक्षात येईल की सर्व डेटा मजकूर स्वरूपात आहे. चार्टमध्ये वापरण्यासाठी तुम्हाला हा डेटा रूपांतरित करावा लागेल. खरं तर, बहुतेक डेटा ऑब्जेक्ट स्वरूपात दर्शविला जातो:
```python
print(mushrooms.select_dtypes(["object"]).columns)
```
आउटपुट असेल:
```output
Index(['class', 'cap-shape', 'cap-surface', 'cap-color', 'bruises', 'odor',
'gill-attachment', 'gill-spacing', 'gill-size', 'gill-color',
'stalk-shape', 'stalk-root', 'stalk-surface-above-ring',
'stalk-surface-below-ring', 'stalk-color-above-ring',
'stalk-color-below-ring', 'veil-type', 'veil-color', 'ring-number',
'ring-type', 'spore-print-color', 'population', 'habitat'],
dtype='object')
```
हा डेटा घ्या आणि 'class' कॉलमला श्रेणीमध्ये रूपांतरित करा:
```python
cols = mushrooms.select_dtypes(["object"]).columns
mushrooms[cols] = mushrooms[cols].astype('category')
```
```python
edibleclass=mushrooms.groupby(['class']).count()
edibleclass
```
आता, जर तुम्ही मशरूम्स डेटा प्रिंट केला, तर तुम्हाला दिसेल की तो विषारी/खाद्य वर्गानुसार श्रेणींमध्ये गटबद्ध केला गेला आहे:
| | कॅप-आकार | कॅप-पृष्ठभाग | कॅप-रंग | जखमा | वास | गिल-जोडणी | गिल-अंतर | गिल-आकार | गिल-रंग | स्टॉक-आकार | ... | स्टॉक-पृष्ठभाग-रिंगच्या-खाली | स्टॉक-रंग-रिंगच्या-वर | स्टॉक-रंग-रिंगच्या-खाली | पडदा-प्रकार | पडदा-रंग | रिंग-क्रमांक | रिंग-प्रकार | बीज-छपाई-रंग | लोकसंख्या | निवासस्थान |
| --------- | --------- | ----------- | -------- | ----- | ---- | ---------- | --------- | -------- | --------- | ---------- | --- | -------------------------- | ---------------------- | ---------------------- | ----------- | --------- | ------------ | ----------- | ------------- | ---------- | ----------- |
| वर्ग | | | | | | | | | | | | | | | | | | | | | |
| खाद्य | 4208 | 4208 | 4208 | 4208 | 4208 | 4208 | 4208 | 4208 | 4208 | 4208 | ... | 4208 | 4208 | 4208 | 4208 | 4208 | 4208 | 4208 | 4208 | 4208 | 4208 |
| विषारी | 3916 | 3916 | 3916 | 3916 | 3916 | 3916 | 3916 | 3916 | 3916 | 3916 | ... | 3916 | 3916 | 3916 | 3916 | 3916 | 3916 | 3916 | 3916 | 3916 | 3916 |
जर तुम्ही या टेबलमध्ये दिलेल्या क्रमाने वर्ग श्रेणी लेबल तयार केले, तर तुम्ही पाई चार्ट तयार करू शकता:
## पाई!
```python
labels=['Edible','Poisonous']
plt.pie(edibleclass['population'],labels=labels,autopct='%.1f %%')
plt.title('Edible?')
plt.show()
```
आणि तयार! पाई चार्ट, जो या डेटाच्या विषारी/खाद्य वर्गांनुसार प्रमाण दाखवतो. लेबल्सचा क्रम योग्य ठेवणे खूप महत्त्वाचे आहे, त्यामुळे लेबल अॅरे तयार करताना क्रम तपासा!
![pie chart](../../../../translated_images/pie1-wb.e201f2fcc335413143ce37650fb7f5f0bb21358e7823a327ed8644dfb84be9db.mr.png)
## डोनट्स!
पाई चार्टपेक्षा अधिक आकर्षक दिसणारा चार्ट म्हणजे डोनट चार्ट, जो पाई चार्टमध्ये मध्यभागी एक छिद्र असतो. चला, आपल्या डेटाला या पद्धतीने पाहूया.
मशरूम्स ज्या विविध निवासस्थानांमध्ये वाढतात त्यावर एक नजर टाका:
```python
habitat=mushrooms.groupby(['habitat']).count()
habitat
```
येथे, तुम्ही तुमचा डेटा निवासस्थानानुसार गटबद्ध करत आहात. 7 निवासस्थानं दिली आहेत, त्यामुळे त्यांचा वापर डोनट चार्टसाठी लेबल्स म्हणून करा:
```python
labels=['Grasses','Leaves','Meadows','Paths','Urban','Waste','Wood']
plt.pie(habitat['class'], labels=labels,
autopct='%1.1f%%', pctdistance=0.85)
center_circle = plt.Circle((0, 0), 0.40, fc='white')
fig = plt.gcf()
fig.gca().add_artist(center_circle)
plt.title('Mushroom Habitats')
plt.show()
```
![donut chart](../../../../translated_images/donut-wb.be3c12a22712302b5d10c40014d5389d4a1ae4412fe1655b3cf4af57b64f799a.mr.png)
हे कोड एक चार्ट आणि मध्यवर्ती वर्तुळ तयार करतो, नंतर त्या चार्टमध्ये ते वर्तुळ जोडतो. मध्यवर्ती वर्तुळाची रुंदी बदलण्यासाठी `0.40` चे मूल्य बदला.
डोनट चार्ट्समध्ये लेबल्स अधिक वाचनीय करण्यासाठी विविध प्रकारे बदल करता येतात. अधिक जाणून घ्या [डॉक्स](https://matplotlib.org/stable/gallery/pie_and_polar_charts/pie_and_donut_labels.html?highlight=donut) मध्ये.
आता तुम्हाला तुमचा डेटा गटबद्ध करून पाई किंवा डोनट चार्टमध्ये कसा दाखवायचा हे कळले आहे, तुम्ही इतर प्रकारचे चार्ट्सही एक्सप्लोर करू शकता. वाफल चार्ट वापरून पाहा, जो प्रमाणांचे 2D चौकटीत दृश्यांकन करण्याचा वेगळा मार्ग आहे.
## वाफल्स!
'वाफल' प्रकारचा चार्ट प्रमाणांचे 2D चौकटीत चौकोनांच्या स्वरूपात दृश्यांकन करण्याचा वेगळा मार्ग आहे. या डेटासेटमधील मशरूम कॅप रंगांच्या प्रमाणांचे दृश्यांकन करण्याचा प्रयत्न करा. यासाठी, तुम्हाला [PyWaffle](https://pypi.org/project/pywaffle/) नावाची सहाय्यक लायब्ररी आणि Matplotlib वापरावी लागेल:
```python
pip install pywaffle
```
तुमच्या डेटाचा एक विभाग निवडा:
```python
capcolor=mushrooms.groupby(['cap-color']).count()
capcolor
```
लेबल तयार करून आणि तुमचा डेटा गटबद्ध करून वाफल चार्ट तयार करा:
```python
import pandas as pd
import matplotlib.pyplot as plt
from pywaffle import Waffle
data ={'color': ['brown', 'buff', 'cinnamon', 'green', 'pink', 'purple', 'red', 'white', 'yellow'],
'amount': capcolor['class']
}
df = pd.DataFrame(data)
fig = plt.figure(
FigureClass = Waffle,
rows = 100,
values = df.amount,
labels = list(df.color),
figsize = (30,30),
colors=["brown", "tan", "maroon", "green", "pink", "purple", "red", "whitesmoke", "yellow"],
)
```
वाफल चार्ट वापरून, तुम्हाला या मशरूम्स डेटासेटमधील कॅप रंगांचे प्रमाण स्पष्टपणे दिसेल. आश्चर्यकारकपणे, अनेक हिरव्या कॅप असलेल्या मशरूम्स आहेत!
![waffle chart](../../../../translated_images/waffle.5455dbae4ccf17d53bb40ff0a657ecef7b8aa967e27a19cc96325bd81598f65e.mr.png)
✅ PyWaffle मध्ये [Font Awesome](https://fontawesome.com/) मधील कोणतेही आयकॉन वापरून चार्ट्समध्ये आयकॉन समाविष्ट करण्याचा पर्याय आहे. चौकोनांच्या ऐवजी आयकॉन वापरून आणखी रोचक वाफल चार्ट तयार करण्यासाठी काही प्रयोग करा.
या धड्यात, तुम्ही प्रमाणांचे दृश्यांकन करण्याचे तीन मार्ग शिकलात. प्रथम, तुम्हाला तुमचा डेटा श्रेणींमध्ये गटबद्ध करावा लागतो आणि नंतर डेटा दाखवण्यासाठी कोणता सर्वोत्तम मार्ग आहे ते ठरवावे लागते - पाई, डोनट, किंवा वाफल. हे सर्वच स्वादिष्ट आहेत आणि वापरकर्त्याला डेटासेटचा झटपट आढावा देतात.
## 🚀 आव्हान
[Charticulator](https://charticulator.com) मध्ये हे स्वादिष्ट चार्ट्स पुन्हा तयार करण्याचा प्रयत्न करा.
## [व्याख्यानानंतरची प्रश्नमंजुषा](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/21)
## पुनरावलोकन आणि स्व-अभ्यास
कधी कधी पाई, डोनट, किंवा वाफल चार्ट कधी वापरायचा हे स्पष्ट नसते. या विषयावर वाचण्यासाठी काही लेख:
https://www.beautiful.ai/blog/battle-of-the-charts-pie-chart-vs-donut-chart
https://medium.com/@hypsypops/pie-chart-vs-donut-chart-showdown-in-the-ring-5d24fd86a9ce
https://www.mit.edu/~mbarker/formula1/f1help/11-ch-c6.htm
https://medium.datadriveninvestor.com/data-visualization-done-the-right-way-with-tableau-waffle-chart-fdf2a19be402
या निर्णयावर अधिक माहिती मिळवण्यासाठी काही संशोधन करा.
## असाइनमेंट
[Excel मध्ये प्रयत्न करा](assignment.md)
---
**अस्वीकरण**:
हा दस्तऐवज AI भाषांतर सेवा [Co-op Translator](https://github.com/Azure/co-op-translator) वापरून भाषांतरित करण्यात आला आहे. आम्ही अचूकतेसाठी प्रयत्नशील असलो तरी, कृपया लक्षात घ्या की स्वयंचलित भाषांतरांमध्ये त्रुटी किंवा अचूकतेचा अभाव असू शकतो. मूळ भाषेतील मूळ दस्तऐवज हा अधिकृत स्रोत मानला जावा. महत्त्वाच्या माहितीसाठी, व्यावसायिक मानवी भाषांतराची शिफारस केली जाते. या भाषांतराचा वापर करून उद्भवणाऱ्या कोणत्याही गैरसमज किंवा चुकीच्या अर्थासाठी आम्ही जबाबदार राहणार नाही.