You can not select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.

205 lines
20 KiB

<!--
CO_OP_TRANSLATOR_METADATA:
{
"original_hash": "42119bcc97bee88254e381156d770f3c",
"translation_date": "2025-09-06T07:30:53+00:00",
"source_file": "3-Data-Visualization/11-visualization-proportions/README.md",
"language_code": "mr"
}
-->
# प्रमाणांचे दृश्यांकन
|![ Sketchnote by [(@sketchthedocs)](https://sketchthedocs.dev) ](../../sketchnotes/11-Visualizing-Proportions.png)|
|:---:|
|प्रमाणांचे दृश्यांकन - _Sketchnote by [@nitya](https://twitter.com/nitya)_ |
या धड्यात, तुम्ही निसर्गावर आधारित वेगळ्या डेटासेटचा वापर करून प्रमाणांचे दृश्यांकन कराल, जसे की मशरूमबद्दलच्या डेटासेटमध्ये किती प्रकारचे कवक आहेत. चला या आकर्षक कवकांचा अभ्यास करूया, ज्यासाठी Audubon कडून मिळवलेल्या डेटासेटमध्ये Agaricus आणि Lepiota कुटुंबातील 23 प्रकारच्या गिल्ड मशरूम्सची माहिती आहे. तुम्ही खालील स्वादिष्ट दृश्यांकन प्रकारांचा प्रयोग कराल:
- पाई चार्ट 🥧
- डोनट चार्ट 🍩
- वाफल चार्ट 🧇
> 💡 [Charticulator](https://charticulator.com) नावाचा एक अतिशय मनोरंजक प्रकल्प Microsoft Research कडून उपलब्ध आहे, जो डेटा दृश्यांकनासाठी फ्री ड्रॅग आणि ड्रॉप इंटरफेस प्रदान करतो. त्यांच्या एका ट्युटोरियलमध्ये त्यांनी मशरूम डेटासेटचा वापर केला आहे! त्यामुळे तुम्ही डेटा एक्सप्लोर करू शकता आणि त्याच वेळी लायब्ररी शिकू शकता: [Charticulator tutorial](https://charticulator.com/tutorials/tutorial4.html).
## [पूर्व-व्याख्यान प्रश्नमंजुषा](https://ff-quizzes.netlify.app/en/ds/quiz/20)
## तुमच्या मशरूम्सची ओळख 🍄
मशरूम्स खूपच मनोरंजक आहेत. चला त्यांचा अभ्यास करण्यासाठी एक डेटासेट आयात करूया:
```python
import pandas as pd
import matplotlib.pyplot as plt
mushrooms = pd.read_csv('../../data/mushrooms.csv')
mushrooms.head()
```
एक टेबल प्रिंट केले जाते ज्यामध्ये विश्लेषणासाठी उत्कृष्ट डेटा आहे:
| वर्ग | टोपीचा आकार | टोपीचा पृष्ठभाग | टोपीचा रंग | जखम | गंध | गिल जोडणी | गिल अंतर | गिल आकार | गिल रंग | खांबाचा आकार | खांब मुळ | खांब पृष्ठभाग रिंगच्या वर | खांब पृष्ठभाग रिंगच्या खाली | खांबाचा रंग रिंगच्या वर | खांबाचा रंग रिंगच्या खाली | पडदा प्रकार | पडदा रंग | रिंग संख्या | रिंग प्रकार | बीज प्रिंट रंग | लोकसंख्या | निवासस्थान |
| --------- | --------- | ----------- | --------- | ------- | ------- | --------------- | ------------ | --------- | ---------- | ----------- | ---------- | ------------------------ | ------------------------ | ---------------------- | ---------------------- | --------- | ---------- | ----------- | --------- | ----------------- | ---------- | ------- |
| विषारी | उभट | गुळगुळीत | तपकिरी | जखम | तीव्र | मुक्त | जवळ | अरुंद | काळा | मोठा | समान | गुळगुळीत | गुळगुळीत | पांढरा | पांढरा | अंशतः | पांढरा | एक | लटकणारा | काळा | विखुरलेला | शहरी |
| खाद्य | उभट | गुळगुळीत | पिवळा | जखम | बदाम | मुक्त | जवळ | रुंद | काळा | मोठा | क्लब | गुळगुळीत | गुळगुळीत | पांढरा | पांढरा | अंशतः | पांढरा | एक | लटकणारा | तपकिरी | भरपूर | गवताळ |
| खाद्य | घंटा | गुळगुळीत | पांढरा | जखम | अॅनिस | मुक्त | जवळ | रुंद | तपकिरी | मोठा | क्लब | गुळगुळीत | गुळगुळीत | पांढरा | पांढरा | अंशतः | पांढरा | एक | लटकणारा | तपकिरी | भरपूर | कुरणे |
| विषारी | उभट | खडबडीत | पांढरा | जखम | तीव्र | मुक्त | जवळ | अरुंद | तपकिरी | मोठा | समान | गुळगुळीत | गुळगुळीत | पांढरा | पांढरा | अंशतः | पांढरा | एक | लटकणारा | काळा | विखुरलेला | शहरी |
तुम्हाला लगेच लक्षात येते की सर्व डेटा मजकूर स्वरूपात आहे. तुम्हाला हा डेटा चार्टमध्ये वापरण्यासाठी रूपांतरित करावा लागेल. प्रत्यक्षात, बहुतेक डेटा ऑब्जेक्ट स्वरूपात दर्शविला जातो:
```python
print(mushrooms.select_dtypes(["object"]).columns)
```
आउटपुट आहे:
```output
Index(['class', 'cap-shape', 'cap-surface', 'cap-color', 'bruises', 'odor',
'gill-attachment', 'gill-spacing', 'gill-size', 'gill-color',
'stalk-shape', 'stalk-root', 'stalk-surface-above-ring',
'stalk-surface-below-ring', 'stalk-color-above-ring',
'stalk-color-below-ring', 'veil-type', 'veil-color', 'ring-number',
'ring-type', 'spore-print-color', 'population', 'habitat'],
dtype='object')
```
हा डेटा घ्या आणि 'class' कॉलमला श्रेणीमध्ये रूपांतरित करा:
```python
cols = mushrooms.select_dtypes(["object"]).columns
mushrooms[cols] = mushrooms[cols].astype('category')
```
```python
edibleclass=mushrooms.groupby(['class']).count()
edibleclass
```
आता, जर तुम्ही मशरूम्स डेटा प्रिंट केला, तर तुम्हाला दिसेल की तो विषारी/खाद्य वर्गानुसार श्रेणींमध्ये गटबद्ध केला गेला आहे:
| | टोपीचा आकार | टोपीचा पृष्ठभाग | टोपीचा रंग | जखम | गंध | गिल जोडणी | गिल अंतर | गिल आकार | गिल रंग | खांबाचा आकार | ... | खांब पृष्ठभाग रिंगच्या खाली | खांबाचा रंग रिंगच्या वर | खांबाचा रंग रिंगच्या खाली | पडदा प्रकार | पडदा रंग | रिंग संख्या | रिंग प्रकार | बीज प्रिंट रंग | लोकसंख्या | निवासस्थान |
| --------- | --------- | ----------- | --------- | ------- | ---- | --------------- | ------------ | --------- | ---------- | ----------- | --- | ------------------------ | ---------------------- | ---------------------- | --------- | ---------- | ----------- | --------- | ----------------- | ---------- | ------- |
| वर्ग | | | | | | | | | | | | | | | | | | | | | |
| खाद्य | 4208 | 4208 | 4208 | 4208 | 4208 | 4208 | 4208 | 4208 | 4208 | 4208 | ... | 4208 | 4208 | 4208 | 4208 | 4208 | 4208 | 4208 | 4208 | 4208 | 4208 |
| विषारी | 3916 | 3916 | 3916 | 3916 | 3916 | 3916 | 3916 | 3916 | 3916 | 3916 | ... | 3916 | 3916 | 3916 | 3916 | 3916 | 3916 | 3916 | 3916 | 3916 | 3916 |
जर तुम्ही या टेबलमध्ये दिलेल्या क्रमाने वर्ग श्रेणी लेबल तयार केले, तर तुम्ही पाई चार्ट तयार करू शकता:
## पाई!
```python
labels=['Edible','Poisonous']
plt.pie(edibleclass['population'],labels=labels,autopct='%.1f %%')
plt.title('Edible?')
plt.show()
```
पाई चार्ट तयार झाला आहे, जो या मशरूम्स डेटाच्या दोन वर्गांनुसार प्रमाण दाखवतो. लेबल्सचा क्रम योग्य असणे खूप महत्त्वाचे आहे, विशेषतः येथे, त्यामुळे लेबल अ‍ॅरे तयार करताना क्रम सत्यापित करा!
![पाई चार्ट](../../../../3-Data-Visualization/11-visualization-proportions/images/pie1-wb.png)
## डोनट्स!
पाई चार्टपेक्षा थोडा अधिक आकर्षक चार्ट म्हणजे डोनट चार्ट, जो पाई चार्टमध्ये मध्यभागी एक छिद्र असतो. चला आपल्या डेटाचा अभ्यास या पद्धतीने करूया.
मशरूम्स ज्या विविध निवासस्थानांमध्ये वाढतात त्यावर एक नजर टाका:
```python
habitat=mushrooms.groupby(['habitat']).count()
habitat
```
येथे, तुम्ही तुमचा डेटा निवासस्थानानुसार गटबद्ध करत आहात. 7 निवासस्थान दिले आहेत, त्यामुळे तुमच्या डोनट चार्टसाठी त्यांचा लेबल्स म्हणून वापर करा:
```python
labels=['Grasses','Leaves','Meadows','Paths','Urban','Waste','Wood']
plt.pie(habitat['class'], labels=labels,
autopct='%1.1f%%', pctdistance=0.85)
center_circle = plt.Circle((0, 0), 0.40, fc='white')
fig = plt.gcf()
fig.gca().add_artist(center_circle)
plt.title('Mushroom Habitats')
plt.show()
```
![डोनट चार्ट](../../../../3-Data-Visualization/11-visualization-proportions/images/donut-wb.png)
हा कोड एक चार्ट आणि मध्यवर्ती वर्तुळ काढतो, नंतर त्या चार्टमध्ये मध्यवर्ती वर्तुळ जोडतो. `0.40` बदलून दुसरी किंमत देऊन मध्यवर्ती वर्तुळाची रुंदी संपादित करा.
डोनट चार्ट्स विविध प्रकारे बदलले जाऊ शकतात, विशेषतः लेबल्स वाचनीयतेसाठी हायलाइट करता येतात. अधिक जाणून घ्या [डॉक्स](https://matplotlib.org/stable/gallery/pie_and_polar_charts/pie_and_donut_labels.html?highlight=donut) मध्ये.
आता तुम्हाला तुमचा डेटा गटबद्ध करून पाई किंवा डोनट स्वरूपात कसा दाखवायचा हे माहित आहे, तुम्ही इतर प्रकारचे चार्ट एक्सप्लोर करू शकता. वाफल चार्ट वापरून पहा, जो प्रमाण एक्सप्लोर करण्याचा वेगळा मार्ग आहे.
## वाफल्स!
'वाफल' प्रकारचा चार्ट प्रमाणांचे 2D चौकोनांच्या स्वरूपात दृश्यांकन करण्याचा वेगळा मार्ग आहे. या डेटासेटमधील मशरूम टोपीच्या रंगांच्या प्रमाणांचे दृश्यांकन करण्याचा प्रयत्न करा. हे करण्यासाठी, तुम्हाला [PyWaffle](https://pypi.org/project/pywaffle/) नावाची एक सहाय्यक लायब्ररी आणि Matplotlib वापरण्याची आवश्यकता आहे:
```python
pip install pywaffle
```
तुमच्या डेटाचा एक विभाग निवडा आणि गटबद्ध करा:
```python
capcolor=mushrooms.groupby(['cap-color']).count()
capcolor
```
लेबल्स तयार करून आणि तुमचा डेटा गटबद्ध करून वाफल चार्ट तयार करा:
```python
import pandas as pd
import matplotlib.pyplot as plt
from pywaffle import Waffle
data ={'color': ['brown', 'buff', 'cinnamon', 'green', 'pink', 'purple', 'red', 'white', 'yellow'],
'amount': capcolor['class']
}
df = pd.DataFrame(data)
fig = plt.figure(
FigureClass = Waffle,
rows = 100,
values = df.amount,
labels = list(df.color),
figsize = (30,30),
colors=["brown", "tan", "maroon", "green", "pink", "purple", "red", "whitesmoke", "yellow"],
)
```
वाफल चार्ट वापरून, तुम्ही मशरूम्स डेटासेटमधील टोपीच्या रंगांचे प्रमाण स्पष्टपणे पाहू शकता. आश्चर्यकारकपणे, अनेक हिरव्या टोपीचे मशरूम्स आहेत!
![वाफल चार्ट](../../../../3-Data-Visualization/11-visualization-proportions/images/waffle.png)
✅ PyWaffle [Font Awesome](https://fontawesome.com/) मध्ये उपलब्ध असलेल्या कोणत्याही आयकॉनचा वापर करून चार्टमध्ये आयकॉन समाविष्ट करण्यास समर्थन देते. चौकोनांऐवजी आयकॉन वापरून अधिक आकर्षक वाफल चार्ट तयार करण्यासाठी काही प्रयोग करा.
या धड्यात, तुम्ही प्रमाणांचे दृश्यांकन करण्याचे तीन मार्ग शिकले. प्रथम, तुम्हाला तुमचा डेटा श्रेणींमध्ये गटबद्ध करावा लागतो आणि नंतर डेटा कसा प्रदर्शित करायचा ते ठरवावे लागते - पाई, डोनट किंवा वाफल. सर्व प्रकार स्वादिष्ट आहेत आणि वापरकर्त्याला डेटासेटचा त्वरित स्नॅपशॉट देतात.
## 🚀 आव्हान
[Charticulator](https://charticulator.com) मध्ये हे स्वादिष्ट चार्ट पुन्हा तयार करण्याचा प्रयत्न करा.
## [व्याख्यानानंतरची प्रश्नमंजुषा](https://ff-quizzes.netlify.app/en/ds/quiz/21)
## पुनरावलोकन आणि स्व-अभ्यास
कधी पाई, डोनट किंवा वाफल चार्ट वापरायचा हे स्पष्ट नसते. या विषयावर काही लेख वाचा:
https://www.beautiful.ai/blog/battle-of-the-charts-pie-chart-vs-donut-chart
https://medium.com/@hypsypops/pie-chart-vs-donut-chart-showdown-in-the-ring-5d24fd86a9ce
https://www.mit.edu/~mbarker/formula1/f1help/11-ch-c6.htm
https://medium.datadriveninvestor.com/data-visualization-done-the-right-way-with-tableau-waffle-chart-fdf2a19be402
अधिक माहिती मिळवण्यासाठी संशोधन करा आणि या निर्णयावर अधिक विचार करा.
## असाइनमेंट
[Excel मध्ये प्रयत्न करा](assignment.md)
---
**अस्वीकरण**:
हा दस्तऐवज AI भाषांतर सेवा [Co-op Translator](https://github.com/Azure/co-op-translator) चा वापर करून भाषांतरित करण्यात आला आहे. आम्ही अचूकतेसाठी प्रयत्नशील असलो तरी कृपया लक्षात ठेवा की स्वयंचलित भाषांतरे त्रुटी किंवा अचूकतेच्या अभावाने युक्त असू शकतात. मूळ भाषेतील दस्तऐवज हा अधिकृत स्रोत मानला जावा. महत्त्वाच्या माहितीसाठी व्यावसायिक मानवी भाषांतराची शिफारस केली जाते. या भाषांतराचा वापर करून निर्माण होणाऱ्या कोणत्याही गैरसमज किंवा चुकीच्या अर्थासाठी आम्ही जबाबदार राहणार नाही.