You can not select more than 25 topics
Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.
205 lines
20 KiB
205 lines
20 KiB
<!--
|
|
CO_OP_TRANSLATOR_METADATA:
|
|
{
|
|
"original_hash": "42119bcc97bee88254e381156d770f3c",
|
|
"translation_date": "2025-09-06T07:30:53+00:00",
|
|
"source_file": "3-Data-Visualization/11-visualization-proportions/README.md",
|
|
"language_code": "mr"
|
|
}
|
|
-->
|
|
# प्रमाणांचे दृश्यांकन
|
|
|
|
| ](../../sketchnotes/11-Visualizing-Proportions.png)|
|
|
|:---:|
|
|
|प्रमाणांचे दृश्यांकन - _Sketchnote by [@nitya](https://twitter.com/nitya)_ |
|
|
|
|
या धड्यात, तुम्ही निसर्गावर आधारित वेगळ्या डेटासेटचा वापर करून प्रमाणांचे दृश्यांकन कराल, जसे की मशरूमबद्दलच्या डेटासेटमध्ये किती प्रकारचे कवक आहेत. चला या आकर्षक कवकांचा अभ्यास करूया, ज्यासाठी Audubon कडून मिळवलेल्या डेटासेटमध्ये Agaricus आणि Lepiota कुटुंबातील 23 प्रकारच्या गिल्ड मशरूम्सची माहिती आहे. तुम्ही खालील स्वादिष्ट दृश्यांकन प्रकारांचा प्रयोग कराल:
|
|
|
|
- पाई चार्ट 🥧
|
|
- डोनट चार्ट 🍩
|
|
- वाफल चार्ट 🧇
|
|
|
|
> 💡 [Charticulator](https://charticulator.com) नावाचा एक अतिशय मनोरंजक प्रकल्प Microsoft Research कडून उपलब्ध आहे, जो डेटा दृश्यांकनासाठी फ्री ड्रॅग आणि ड्रॉप इंटरफेस प्रदान करतो. त्यांच्या एका ट्युटोरियलमध्ये त्यांनी मशरूम डेटासेटचा वापर केला आहे! त्यामुळे तुम्ही डेटा एक्सप्लोर करू शकता आणि त्याच वेळी लायब्ररी शिकू शकता: [Charticulator tutorial](https://charticulator.com/tutorials/tutorial4.html).
|
|
|
|
## [पूर्व-व्याख्यान प्रश्नमंजुषा](https://ff-quizzes.netlify.app/en/ds/quiz/20)
|
|
|
|
## तुमच्या मशरूम्सची ओळख 🍄
|
|
|
|
मशरूम्स खूपच मनोरंजक आहेत. चला त्यांचा अभ्यास करण्यासाठी एक डेटासेट आयात करूया:
|
|
|
|
```python
|
|
import pandas as pd
|
|
import matplotlib.pyplot as plt
|
|
mushrooms = pd.read_csv('../../data/mushrooms.csv')
|
|
mushrooms.head()
|
|
```
|
|
एक टेबल प्रिंट केले जाते ज्यामध्ये विश्लेषणासाठी उत्कृष्ट डेटा आहे:
|
|
|
|
| वर्ग | टोपीचा आकार | टोपीचा पृष्ठभाग | टोपीचा रंग | जखम | गंध | गिल जोडणी | गिल अंतर | गिल आकार | गिल रंग | खांबाचा आकार | खांब मुळ | खांब पृष्ठभाग रिंगच्या वर | खांब पृष्ठभाग रिंगच्या खाली | खांबाचा रंग रिंगच्या वर | खांबाचा रंग रिंगच्या खाली | पडदा प्रकार | पडदा रंग | रिंग संख्या | रिंग प्रकार | बीज प्रिंट रंग | लोकसंख्या | निवासस्थान |
|
|
| --------- | --------- | ----------- | --------- | ------- | ------- | --------------- | ------------ | --------- | ---------- | ----------- | ---------- | ------------------------ | ------------------------ | ---------------------- | ---------------------- | --------- | ---------- | ----------- | --------- | ----------------- | ---------- | ------- |
|
|
| विषारी | उभट | गुळगुळीत | तपकिरी | जखम | तीव्र | मुक्त | जवळ | अरुंद | काळा | मोठा | समान | गुळगुळीत | गुळगुळीत | पांढरा | पांढरा | अंशतः | पांढरा | एक | लटकणारा | काळा | विखुरलेला | शहरी |
|
|
| खाद्य | उभट | गुळगुळीत | पिवळा | जखम | बदाम | मुक्त | जवळ | रुंद | काळा | मोठा | क्लब | गुळगुळीत | गुळगुळीत | पांढरा | पांढरा | अंशतः | पांढरा | एक | लटकणारा | तपकिरी | भरपूर | गवताळ |
|
|
| खाद्य | घंटा | गुळगुळीत | पांढरा | जखम | अॅनिस | मुक्त | जवळ | रुंद | तपकिरी | मोठा | क्लब | गुळगुळीत | गुळगुळीत | पांढरा | पांढरा | अंशतः | पांढरा | एक | लटकणारा | तपकिरी | भरपूर | कुरणे |
|
|
| विषारी | उभट | खडबडीत | पांढरा | जखम | तीव्र | मुक्त | जवळ | अरुंद | तपकिरी | मोठा | समान | गुळगुळीत | गुळगुळीत | पांढरा | पांढरा | अंशतः | पांढरा | एक | लटकणारा | काळा | विखुरलेला | शहरी |
|
|
|
|
तुम्हाला लगेच लक्षात येते की सर्व डेटा मजकूर स्वरूपात आहे. तुम्हाला हा डेटा चार्टमध्ये वापरण्यासाठी रूपांतरित करावा लागेल. प्रत्यक्षात, बहुतेक डेटा ऑब्जेक्ट स्वरूपात दर्शविला जातो:
|
|
|
|
```python
|
|
print(mushrooms.select_dtypes(["object"]).columns)
|
|
```
|
|
|
|
आउटपुट आहे:
|
|
|
|
```output
|
|
Index(['class', 'cap-shape', 'cap-surface', 'cap-color', 'bruises', 'odor',
|
|
'gill-attachment', 'gill-spacing', 'gill-size', 'gill-color',
|
|
'stalk-shape', 'stalk-root', 'stalk-surface-above-ring',
|
|
'stalk-surface-below-ring', 'stalk-color-above-ring',
|
|
'stalk-color-below-ring', 'veil-type', 'veil-color', 'ring-number',
|
|
'ring-type', 'spore-print-color', 'population', 'habitat'],
|
|
dtype='object')
|
|
```
|
|
हा डेटा घ्या आणि 'class' कॉलमला श्रेणीमध्ये रूपांतरित करा:
|
|
|
|
```python
|
|
cols = mushrooms.select_dtypes(["object"]).columns
|
|
mushrooms[cols] = mushrooms[cols].astype('category')
|
|
```
|
|
|
|
```python
|
|
edibleclass=mushrooms.groupby(['class']).count()
|
|
edibleclass
|
|
```
|
|
|
|
आता, जर तुम्ही मशरूम्स डेटा प्रिंट केला, तर तुम्हाला दिसेल की तो विषारी/खाद्य वर्गानुसार श्रेणींमध्ये गटबद्ध केला गेला आहे:
|
|
|
|
| | टोपीचा आकार | टोपीचा पृष्ठभाग | टोपीचा रंग | जखम | गंध | गिल जोडणी | गिल अंतर | गिल आकार | गिल रंग | खांबाचा आकार | ... | खांब पृष्ठभाग रिंगच्या खाली | खांबाचा रंग रिंगच्या वर | खांबाचा रंग रिंगच्या खाली | पडदा प्रकार | पडदा रंग | रिंग संख्या | रिंग प्रकार | बीज प्रिंट रंग | लोकसंख्या | निवासस्थान |
|
|
| --------- | --------- | ----------- | --------- | ------- | ---- | --------------- | ------------ | --------- | ---------- | ----------- | --- | ------------------------ | ---------------------- | ---------------------- | --------- | ---------- | ----------- | --------- | ----------------- | ---------- | ------- |
|
|
| वर्ग | | | | | | | | | | | | | | | | | | | | | |
|
|
| खाद्य | 4208 | 4208 | 4208 | 4208 | 4208 | 4208 | 4208 | 4208 | 4208 | 4208 | ... | 4208 | 4208 | 4208 | 4208 | 4208 | 4208 | 4208 | 4208 | 4208 | 4208 |
|
|
| विषारी | 3916 | 3916 | 3916 | 3916 | 3916 | 3916 | 3916 | 3916 | 3916 | 3916 | ... | 3916 | 3916 | 3916 | 3916 | 3916 | 3916 | 3916 | 3916 | 3916 | 3916 |
|
|
|
|
जर तुम्ही या टेबलमध्ये दिलेल्या क्रमाने वर्ग श्रेणी लेबल तयार केले, तर तुम्ही पाई चार्ट तयार करू शकता:
|
|
|
|
## पाई!
|
|
|
|
```python
|
|
labels=['Edible','Poisonous']
|
|
plt.pie(edibleclass['population'],labels=labels,autopct='%.1f %%')
|
|
plt.title('Edible?')
|
|
plt.show()
|
|
```
|
|
पाई चार्ट तयार झाला आहे, जो या मशरूम्स डेटाच्या दोन वर्गांनुसार प्रमाण दाखवतो. लेबल्सचा क्रम योग्य असणे खूप महत्त्वाचे आहे, विशेषतः येथे, त्यामुळे लेबल अॅरे तयार करताना क्रम सत्यापित करा!
|
|
|
|

|
|
|
|
## डोनट्स!
|
|
|
|
पाई चार्टपेक्षा थोडा अधिक आकर्षक चार्ट म्हणजे डोनट चार्ट, जो पाई चार्टमध्ये मध्यभागी एक छिद्र असतो. चला आपल्या डेटाचा अभ्यास या पद्धतीने करूया.
|
|
|
|
मशरूम्स ज्या विविध निवासस्थानांमध्ये वाढतात त्यावर एक नजर टाका:
|
|
|
|
```python
|
|
habitat=mushrooms.groupby(['habitat']).count()
|
|
habitat
|
|
```
|
|
येथे, तुम्ही तुमचा डेटा निवासस्थानानुसार गटबद्ध करत आहात. 7 निवासस्थान दिले आहेत, त्यामुळे तुमच्या डोनट चार्टसाठी त्यांचा लेबल्स म्हणून वापर करा:
|
|
|
|
```python
|
|
labels=['Grasses','Leaves','Meadows','Paths','Urban','Waste','Wood']
|
|
|
|
plt.pie(habitat['class'], labels=labels,
|
|
autopct='%1.1f%%', pctdistance=0.85)
|
|
|
|
center_circle = plt.Circle((0, 0), 0.40, fc='white')
|
|
fig = plt.gcf()
|
|
|
|
fig.gca().add_artist(center_circle)
|
|
|
|
plt.title('Mushroom Habitats')
|
|
|
|
plt.show()
|
|
```
|
|
|
|

|
|
|
|
हा कोड एक चार्ट आणि मध्यवर्ती वर्तुळ काढतो, नंतर त्या चार्टमध्ये मध्यवर्ती वर्तुळ जोडतो. `0.40` बदलून दुसरी किंमत देऊन मध्यवर्ती वर्तुळाची रुंदी संपादित करा.
|
|
|
|
डोनट चार्ट्स विविध प्रकारे बदलले जाऊ शकतात, विशेषतः लेबल्स वाचनीयतेसाठी हायलाइट करता येतात. अधिक जाणून घ्या [डॉक्स](https://matplotlib.org/stable/gallery/pie_and_polar_charts/pie_and_donut_labels.html?highlight=donut) मध्ये.
|
|
|
|
आता तुम्हाला तुमचा डेटा गटबद्ध करून पाई किंवा डोनट स्वरूपात कसा दाखवायचा हे माहित आहे, तुम्ही इतर प्रकारचे चार्ट एक्सप्लोर करू शकता. वाफल चार्ट वापरून पहा, जो प्रमाण एक्सप्लोर करण्याचा वेगळा मार्ग आहे.
|
|
|
|
## वाफल्स!
|
|
|
|
'वाफल' प्रकारचा चार्ट प्रमाणांचे 2D चौकोनांच्या स्वरूपात दृश्यांकन करण्याचा वेगळा मार्ग आहे. या डेटासेटमधील मशरूम टोपीच्या रंगांच्या प्रमाणांचे दृश्यांकन करण्याचा प्रयत्न करा. हे करण्यासाठी, तुम्हाला [PyWaffle](https://pypi.org/project/pywaffle/) नावाची एक सहाय्यक लायब्ररी आणि Matplotlib वापरण्याची आवश्यकता आहे:
|
|
|
|
```python
|
|
pip install pywaffle
|
|
```
|
|
|
|
तुमच्या डेटाचा एक विभाग निवडा आणि गटबद्ध करा:
|
|
|
|
```python
|
|
capcolor=mushrooms.groupby(['cap-color']).count()
|
|
capcolor
|
|
```
|
|
|
|
लेबल्स तयार करून आणि तुमचा डेटा गटबद्ध करून वाफल चार्ट तयार करा:
|
|
|
|
```python
|
|
import pandas as pd
|
|
import matplotlib.pyplot as plt
|
|
from pywaffle import Waffle
|
|
|
|
data ={'color': ['brown', 'buff', 'cinnamon', 'green', 'pink', 'purple', 'red', 'white', 'yellow'],
|
|
'amount': capcolor['class']
|
|
}
|
|
|
|
df = pd.DataFrame(data)
|
|
|
|
fig = plt.figure(
|
|
FigureClass = Waffle,
|
|
rows = 100,
|
|
values = df.amount,
|
|
labels = list(df.color),
|
|
figsize = (30,30),
|
|
colors=["brown", "tan", "maroon", "green", "pink", "purple", "red", "whitesmoke", "yellow"],
|
|
)
|
|
```
|
|
|
|
वाफल चार्ट वापरून, तुम्ही मशरूम्स डेटासेटमधील टोपीच्या रंगांचे प्रमाण स्पष्टपणे पाहू शकता. आश्चर्यकारकपणे, अनेक हिरव्या टोपीचे मशरूम्स आहेत!
|
|
|
|

|
|
|
|
✅ PyWaffle [Font Awesome](https://fontawesome.com/) मध्ये उपलब्ध असलेल्या कोणत्याही आयकॉनचा वापर करून चार्टमध्ये आयकॉन समाविष्ट करण्यास समर्थन देते. चौकोनांऐवजी आयकॉन वापरून अधिक आकर्षक वाफल चार्ट तयार करण्यासाठी काही प्रयोग करा.
|
|
|
|
या धड्यात, तुम्ही प्रमाणांचे दृश्यांकन करण्याचे तीन मार्ग शिकले. प्रथम, तुम्हाला तुमचा डेटा श्रेणींमध्ये गटबद्ध करावा लागतो आणि नंतर डेटा कसा प्रदर्शित करायचा ते ठरवावे लागते - पाई, डोनट किंवा वाफल. सर्व प्रकार स्वादिष्ट आहेत आणि वापरकर्त्याला डेटासेटचा त्वरित स्नॅपशॉट देतात.
|
|
|
|
## 🚀 आव्हान
|
|
|
|
[Charticulator](https://charticulator.com) मध्ये हे स्वादिष्ट चार्ट पुन्हा तयार करण्याचा प्रयत्न करा.
|
|
|
|
## [व्याख्यानानंतरची प्रश्नमंजुषा](https://ff-quizzes.netlify.app/en/ds/quiz/21)
|
|
|
|
## पुनरावलोकन आणि स्व-अभ्यास
|
|
|
|
कधी पाई, डोनट किंवा वाफल चार्ट वापरायचा हे स्पष्ट नसते. या विषयावर काही लेख वाचा:
|
|
|
|
https://www.beautiful.ai/blog/battle-of-the-charts-pie-chart-vs-donut-chart
|
|
|
|
https://medium.com/@hypsypops/pie-chart-vs-donut-chart-showdown-in-the-ring-5d24fd86a9ce
|
|
|
|
https://www.mit.edu/~mbarker/formula1/f1help/11-ch-c6.htm
|
|
|
|
https://medium.datadriveninvestor.com/data-visualization-done-the-right-way-with-tableau-waffle-chart-fdf2a19be402
|
|
|
|
अधिक माहिती मिळवण्यासाठी संशोधन करा आणि या निर्णयावर अधिक विचार करा.
|
|
|
|
## असाइनमेंट
|
|
|
|
[Excel मध्ये प्रयत्न करा](assignment.md)
|
|
|
|
---
|
|
|
|
**अस्वीकरण**:
|
|
हा दस्तऐवज AI भाषांतर सेवा [Co-op Translator](https://github.com/Azure/co-op-translator) चा वापर करून भाषांतरित करण्यात आला आहे. आम्ही अचूकतेसाठी प्रयत्नशील असलो तरी कृपया लक्षात ठेवा की स्वयंचलित भाषांतरे त्रुटी किंवा अचूकतेच्या अभावाने युक्त असू शकतात. मूळ भाषेतील दस्तऐवज हा अधिकृत स्रोत मानला जावा. महत्त्वाच्या माहितीसाठी व्यावसायिक मानवी भाषांतराची शिफारस केली जाते. या भाषांतराचा वापर करून निर्माण होणाऱ्या कोणत्याही गैरसमज किंवा चुकीच्या अर्थासाठी आम्ही जबाबदार राहणार नाही. |