# प्रमाणांचे दृश्यांकन |![ Sketchnote by [(@sketchthedocs)](https://sketchthedocs.dev) ](../../sketchnotes/11-Visualizing-Proportions.png)| |:---:| |प्रमाणांचे दृश्यांकन - _Sketchnote by [@nitya](https://twitter.com/nitya)_ | या धड्यात, तुम्ही निसर्गावर आधारित वेगळ्या डेटासेटचा वापर करून प्रमाणांचे दृश्यांकन कराल, जसे की मशरूमबद्दलच्या डेटासेटमध्ये किती प्रकारचे कवक आहेत. चला या आकर्षक कवकांचा अभ्यास करूया, ज्यासाठी Audubon कडून मिळवलेल्या डेटासेटमध्ये Agaricus आणि Lepiota कुटुंबातील 23 प्रकारच्या गिल्ड मशरूम्सची माहिती आहे. तुम्ही खालील स्वादिष्ट दृश्यांकन प्रकारांचा प्रयोग कराल: - पाई चार्ट 🥧 - डोनट चार्ट 🍩 - वाफल चार्ट 🧇 > 💡 [Charticulator](https://charticulator.com) नावाचा एक अतिशय मनोरंजक प्रकल्प Microsoft Research कडून उपलब्ध आहे, जो डेटा दृश्यांकनासाठी फ्री ड्रॅग आणि ड्रॉप इंटरफेस प्रदान करतो. त्यांच्या एका ट्युटोरियलमध्ये त्यांनी मशरूम डेटासेटचा वापर केला आहे! त्यामुळे तुम्ही डेटा एक्सप्लोर करू शकता आणि त्याच वेळी लायब्ररी शिकू शकता: [Charticulator tutorial](https://charticulator.com/tutorials/tutorial4.html). ## [पूर्व-व्याख्यान प्रश्नमंजुषा](https://ff-quizzes.netlify.app/en/ds/quiz/20) ## तुमच्या मशरूम्सची ओळख 🍄 मशरूम्स खूपच मनोरंजक आहेत. चला त्यांचा अभ्यास करण्यासाठी एक डेटासेट आयात करूया: ```python import pandas as pd import matplotlib.pyplot as plt mushrooms = pd.read_csv('../../data/mushrooms.csv') mushrooms.head() ``` एक टेबल प्रिंट केले जाते ज्यामध्ये विश्लेषणासाठी उत्कृष्ट डेटा आहे: | वर्ग | टोपीचा आकार | टोपीचा पृष्ठभाग | टोपीचा रंग | जखम | गंध | गिल जोडणी | गिल अंतर | गिल आकार | गिल रंग | खांबाचा आकार | खांब मुळ | खांब पृष्ठभाग रिंगच्या वर | खांब पृष्ठभाग रिंगच्या खाली | खांबाचा रंग रिंगच्या वर | खांबाचा रंग रिंगच्या खाली | पडदा प्रकार | पडदा रंग | रिंग संख्या | रिंग प्रकार | बीज प्रिंट रंग | लोकसंख्या | निवासस्थान | | --------- | --------- | ----------- | --------- | ------- | ------- | --------------- | ------------ | --------- | ---------- | ----------- | ---------- | ------------------------ | ------------------------ | ---------------------- | ---------------------- | --------- | ---------- | ----------- | --------- | ----------------- | ---------- | ------- | | विषारी | उभट | गुळगुळीत | तपकिरी | जखम | तीव्र | मुक्त | जवळ | अरुंद | काळा | मोठा | समान | गुळगुळीत | गुळगुळीत | पांढरा | पांढरा | अंशतः | पांढरा | एक | लटकणारा | काळा | विखुरलेला | शहरी | | खाद्य | उभट | गुळगुळीत | पिवळा | जखम | बदाम | मुक्त | जवळ | रुंद | काळा | मोठा | क्लब | गुळगुळीत | गुळगुळीत | पांढरा | पांढरा | अंशतः | पांढरा | एक | लटकणारा | तपकिरी | भरपूर | गवताळ | | खाद्य | घंटा | गुळगुळीत | पांढरा | जखम | अॅनिस | मुक्त | जवळ | रुंद | तपकिरी | मोठा | क्लब | गुळगुळीत | गुळगुळीत | पांढरा | पांढरा | अंशतः | पांढरा | एक | लटकणारा | तपकिरी | भरपूर | कुरणे | | विषारी | उभट | खडबडीत | पांढरा | जखम | तीव्र | मुक्त | जवळ | अरुंद | तपकिरी | मोठा | समान | गुळगुळीत | गुळगुळीत | पांढरा | पांढरा | अंशतः | पांढरा | एक | लटकणारा | काळा | विखुरलेला | शहरी | तुम्हाला लगेच लक्षात येते की सर्व डेटा मजकूर स्वरूपात आहे. तुम्हाला हा डेटा चार्टमध्ये वापरण्यासाठी रूपांतरित करावा लागेल. प्रत्यक्षात, बहुतेक डेटा ऑब्जेक्ट स्वरूपात दर्शविला जातो: ```python print(mushrooms.select_dtypes(["object"]).columns) ``` आउटपुट आहे: ```output Index(['class', 'cap-shape', 'cap-surface', 'cap-color', 'bruises', 'odor', 'gill-attachment', 'gill-spacing', 'gill-size', 'gill-color', 'stalk-shape', 'stalk-root', 'stalk-surface-above-ring', 'stalk-surface-below-ring', 'stalk-color-above-ring', 'stalk-color-below-ring', 'veil-type', 'veil-color', 'ring-number', 'ring-type', 'spore-print-color', 'population', 'habitat'], dtype='object') ``` हा डेटा घ्या आणि 'class' कॉलमला श्रेणीमध्ये रूपांतरित करा: ```python cols = mushrooms.select_dtypes(["object"]).columns mushrooms[cols] = mushrooms[cols].astype('category') ``` ```python edibleclass=mushrooms.groupby(['class']).count() edibleclass ``` आता, जर तुम्ही मशरूम्स डेटा प्रिंट केला, तर तुम्हाला दिसेल की तो विषारी/खाद्य वर्गानुसार श्रेणींमध्ये गटबद्ध केला गेला आहे: | | टोपीचा आकार | टोपीचा पृष्ठभाग | टोपीचा रंग | जखम | गंध | गिल जोडणी | गिल अंतर | गिल आकार | गिल रंग | खांबाचा आकार | ... | खांब पृष्ठभाग रिंगच्या खाली | खांबाचा रंग रिंगच्या वर | खांबाचा रंग रिंगच्या खाली | पडदा प्रकार | पडदा रंग | रिंग संख्या | रिंग प्रकार | बीज प्रिंट रंग | लोकसंख्या | निवासस्थान | | --------- | --------- | ----------- | --------- | ------- | ---- | --------------- | ------------ | --------- | ---------- | ----------- | --- | ------------------------ | ---------------------- | ---------------------- | --------- | ---------- | ----------- | --------- | ----------------- | ---------- | ------- | | वर्ग | | | | | | | | | | | | | | | | | | | | | | | खाद्य | 4208 | 4208 | 4208 | 4208 | 4208 | 4208 | 4208 | 4208 | 4208 | 4208 | ... | 4208 | 4208 | 4208 | 4208 | 4208 | 4208 | 4208 | 4208 | 4208 | 4208 | | विषारी | 3916 | 3916 | 3916 | 3916 | 3916 | 3916 | 3916 | 3916 | 3916 | 3916 | ... | 3916 | 3916 | 3916 | 3916 | 3916 | 3916 | 3916 | 3916 | 3916 | 3916 | जर तुम्ही या टेबलमध्ये दिलेल्या क्रमाने वर्ग श्रेणी लेबल तयार केले, तर तुम्ही पाई चार्ट तयार करू शकता: ## पाई! ```python labels=['Edible','Poisonous'] plt.pie(edibleclass['population'],labels=labels,autopct='%.1f %%') plt.title('Edible?') plt.show() ``` पाई चार्ट तयार झाला आहे, जो या मशरूम्स डेटाच्या दोन वर्गांनुसार प्रमाण दाखवतो. लेबल्सचा क्रम योग्य असणे खूप महत्त्वाचे आहे, विशेषतः येथे, त्यामुळे लेबल अ‍ॅरे तयार करताना क्रम सत्यापित करा! ![पाई चार्ट](../../../../3-Data-Visualization/11-visualization-proportions/images/pie1-wb.png) ## डोनट्स! पाई चार्टपेक्षा थोडा अधिक आकर्षक चार्ट म्हणजे डोनट चार्ट, जो पाई चार्टमध्ये मध्यभागी एक छिद्र असतो. चला आपल्या डेटाचा अभ्यास या पद्धतीने करूया. मशरूम्स ज्या विविध निवासस्थानांमध्ये वाढतात त्यावर एक नजर टाका: ```python habitat=mushrooms.groupby(['habitat']).count() habitat ``` येथे, तुम्ही तुमचा डेटा निवासस्थानानुसार गटबद्ध करत आहात. 7 निवासस्थान दिले आहेत, त्यामुळे तुमच्या डोनट चार्टसाठी त्यांचा लेबल्स म्हणून वापर करा: ```python labels=['Grasses','Leaves','Meadows','Paths','Urban','Waste','Wood'] plt.pie(habitat['class'], labels=labels, autopct='%1.1f%%', pctdistance=0.85) center_circle = plt.Circle((0, 0), 0.40, fc='white') fig = plt.gcf() fig.gca().add_artist(center_circle) plt.title('Mushroom Habitats') plt.show() ``` ![डोनट चार्ट](../../../../3-Data-Visualization/11-visualization-proportions/images/donut-wb.png) हा कोड एक चार्ट आणि मध्यवर्ती वर्तुळ काढतो, नंतर त्या चार्टमध्ये मध्यवर्ती वर्तुळ जोडतो. `0.40` बदलून दुसरी किंमत देऊन मध्यवर्ती वर्तुळाची रुंदी संपादित करा. डोनट चार्ट्स विविध प्रकारे बदलले जाऊ शकतात, विशेषतः लेबल्स वाचनीयतेसाठी हायलाइट करता येतात. अधिक जाणून घ्या [डॉक्स](https://matplotlib.org/stable/gallery/pie_and_polar_charts/pie_and_donut_labels.html?highlight=donut) मध्ये. आता तुम्हाला तुमचा डेटा गटबद्ध करून पाई किंवा डोनट स्वरूपात कसा दाखवायचा हे माहित आहे, तुम्ही इतर प्रकारचे चार्ट एक्सप्लोर करू शकता. वाफल चार्ट वापरून पहा, जो प्रमाण एक्सप्लोर करण्याचा वेगळा मार्ग आहे. ## वाफल्स! 'वाफल' प्रकारचा चार्ट प्रमाणांचे 2D चौकोनांच्या स्वरूपात दृश्यांकन करण्याचा वेगळा मार्ग आहे. या डेटासेटमधील मशरूम टोपीच्या रंगांच्या प्रमाणांचे दृश्यांकन करण्याचा प्रयत्न करा. हे करण्यासाठी, तुम्हाला [PyWaffle](https://pypi.org/project/pywaffle/) नावाची एक सहाय्यक लायब्ररी आणि Matplotlib वापरण्याची आवश्यकता आहे: ```python pip install pywaffle ``` तुमच्या डेटाचा एक विभाग निवडा आणि गटबद्ध करा: ```python capcolor=mushrooms.groupby(['cap-color']).count() capcolor ``` लेबल्स तयार करून आणि तुमचा डेटा गटबद्ध करून वाफल चार्ट तयार करा: ```python import pandas as pd import matplotlib.pyplot as plt from pywaffle import Waffle data ={'color': ['brown', 'buff', 'cinnamon', 'green', 'pink', 'purple', 'red', 'white', 'yellow'], 'amount': capcolor['class'] } df = pd.DataFrame(data) fig = plt.figure( FigureClass = Waffle, rows = 100, values = df.amount, labels = list(df.color), figsize = (30,30), colors=["brown", "tan", "maroon", "green", "pink", "purple", "red", "whitesmoke", "yellow"], ) ``` वाफल चार्ट वापरून, तुम्ही मशरूम्स डेटासेटमधील टोपीच्या रंगांचे प्रमाण स्पष्टपणे पाहू शकता. आश्चर्यकारकपणे, अनेक हिरव्या टोपीचे मशरूम्स आहेत! ![वाफल चार्ट](../../../../3-Data-Visualization/11-visualization-proportions/images/waffle.png) ✅ PyWaffle [Font Awesome](https://fontawesome.com/) मध्ये उपलब्ध असलेल्या कोणत्याही आयकॉनचा वापर करून चार्टमध्ये आयकॉन समाविष्ट करण्यास समर्थन देते. चौकोनांऐवजी आयकॉन वापरून अधिक आकर्षक वाफल चार्ट तयार करण्यासाठी काही प्रयोग करा. या धड्यात, तुम्ही प्रमाणांचे दृश्यांकन करण्याचे तीन मार्ग शिकले. प्रथम, तुम्हाला तुमचा डेटा श्रेणींमध्ये गटबद्ध करावा लागतो आणि नंतर डेटा कसा प्रदर्शित करायचा ते ठरवावे लागते - पाई, डोनट किंवा वाफल. सर्व प्रकार स्वादिष्ट आहेत आणि वापरकर्त्याला डेटासेटचा त्वरित स्नॅपशॉट देतात. ## 🚀 आव्हान [Charticulator](https://charticulator.com) मध्ये हे स्वादिष्ट चार्ट पुन्हा तयार करण्याचा प्रयत्न करा. ## [व्याख्यानानंतरची प्रश्नमंजुषा](https://ff-quizzes.netlify.app/en/ds/quiz/21) ## पुनरावलोकन आणि स्व-अभ्यास कधी पाई, डोनट किंवा वाफल चार्ट वापरायचा हे स्पष्ट नसते. या विषयावर काही लेख वाचा: https://www.beautiful.ai/blog/battle-of-the-charts-pie-chart-vs-donut-chart https://medium.com/@hypsypops/pie-chart-vs-donut-chart-showdown-in-the-ring-5d24fd86a9ce https://www.mit.edu/~mbarker/formula1/f1help/11-ch-c6.htm https://medium.datadriveninvestor.com/data-visualization-done-the-right-way-with-tableau-waffle-chart-fdf2a19be402 अधिक माहिती मिळवण्यासाठी संशोधन करा आणि या निर्णयावर अधिक विचार करा. ## असाइनमेंट [Excel मध्ये प्रयत्न करा](assignment.md) --- **अस्वीकरण**: हा दस्तऐवज AI भाषांतर सेवा [Co-op Translator](https://github.com/Azure/co-op-translator) चा वापर करून भाषांतरित करण्यात आला आहे. आम्ही अचूकतेसाठी प्रयत्नशील असलो तरी कृपया लक्षात ठेवा की स्वयंचलित भाषांतरे त्रुटी किंवा अचूकतेच्या अभावाने युक्त असू शकतात. मूळ भाषेतील दस्तऐवज हा अधिकृत स्रोत मानला जावा. महत्त्वाच्या माहितीसाठी व्यावसायिक मानवी भाषांतराची शिफारस केली जाते. या भाषांतराचा वापर करून निर्माण होणाऱ्या कोणत्याही गैरसमज किंवा चुकीच्या अर्थासाठी आम्ही जबाबदार राहणार नाही.