# प्रमाणांचे दृश्यांकन |![ Sketchnote by [(@sketchthedocs)](https://sketchthedocs.dev) ](../../sketchnotes/11-Visualizing-Proportions.png)| |:---:| |प्रमाणांचे दृश्यांकन - _Sketchnote by [@nitya](https://twitter.com/nitya)_ | या धड्यात, तुम्ही निसर्गाशी संबंधित वेगळ्या डेटासेटचा वापर करून प्रमाणांचे दृश्यांकन कराल, जसे की मशरूम्सबद्दलच्या डेटासेटमध्ये किती प्रकारचे बुरशी आहेत हे पाहणे. चला, या अद्भुत बुरशींचा अभ्यास करूया, ज्यासाठी ऑडुबॉनकडून घेतलेल्या डेटासेटमध्ये Agaricus आणि Lepiota कुटुंबातील 23 प्रकारच्या गिल्ड मशरूम्सची माहिती आहे. तुम्ही खालील स्वादिष्ट दृश्यांकन प्रकारांचा प्रयोग कराल: - पाई चार्ट्स 🥧 - डोनट चार्ट्स 🍩 - वाफल चार्ट्स 🧇 > 💡 मायक्रोसॉफ्ट रिसर्चने तयार केलेल्या [Charticulator](https://charticulator.com) नावाच्या एका खूपच रोचक प्रकल्पात डेटा दृश्यांकनासाठी फ्री ड्रॅग अँड ड्रॉप इंटरफेस आहे. त्यांच्या एका ट्युटोरियलमध्ये त्यांनी हा मशरूम डेटासेटही वापरला आहे! त्यामुळे तुम्ही डेटा एक्सप्लोर करू शकता आणि त्याच वेळी लायब्ररी शिकू शकता: [Charticulator tutorial](https://charticulator.com/tutorials/tutorial4.html). ## [पूर्व-व्याख्यान प्रश्नमंजुषा](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/20) ## तुमच्या मशरूम्सना ओळखा 🍄 मशरूम्स खूपच रोचक असतात. चला, त्यांचा अभ्यास करण्यासाठी एक डेटासेट आयात करूया: ```python import pandas as pd import matplotlib.pyplot as plt mushrooms = pd.read_csv('../../data/mushrooms.csv') mushrooms.head() ``` एक टेबल तयार होते ज्यामध्ये विश्लेषणासाठी छान डेटा आहे: | वर्ग | कॅप-आकार | कॅप-पृष्ठभाग | कॅप-रंग | जखमा | वास | गिल-जोडणी | गिल-अंतर | गिल-आकार | गिल-रंग | स्टॉक-आकार | स्टॉक-मूळ | स्टॉक-पृष्ठभाग-रिंगच्या-वर | स्टॉक-पृष्ठभाग-रिंगच्या-खाली | स्टॉक-रंग-रिंगच्या-वर | स्टॉक-रंग-रिंगच्या-खाली | पडदा-प्रकार | पडदा-रंग | रिंग-क्रमांक | रिंग-प्रकार | बीज-छपाई-रंग | लोकसंख्या | निवासस्थान | | --------- | --------- | ----------- | -------- | ----- | -------- | ---------- | --------- | -------- | --------- | ---------- | --------- | -------------------------- | -------------------------- | ---------------------- | ---------------------- | ----------- | --------- | ------------ | ----------- | ------------- | ---------- | ----------- | | विषारी | उंचवटा | गुळगुळीत | तपकिरी | जखमा | तीव्र | मुक्त | जवळचे | अरुंद | काळा | रुंदावलेला | समान | गुळगुळीत | गुळगुळीत | पांढरा | पांढरा | अंशतः | पांढरा | एक | लटकणारा | काळा | विखुरलेला | शहरी | | खाद्य | उंचवटा | गुळगुळीत | पिवळा | जखमा | बदामाचा | मुक्त | जवळचे | रुंद | काळा | रुंदावलेला | काठीसारखा | गुळगुळीत | गुळगुळीत | पांढरा | पांढरा | अंशतः | पांढरा | एक | लटकणारा | तपकिरी | विपुल | गवताळ | | खाद्य | घंटेसारखा | गुळगुळीत | पांढरा | जखमा | बडीशेप | मुक्त | जवळचे | रुंद | तपकिरी | रुंदावलेला | काठीसारखा | गुळगुळीत | गुळगुळीत | पांढरा | पांढरा | अंशतः | पांढरा | एक | लटकणारा | तपकिरी | विपुल | कुरण | | विषारी | उंचवटा | खडबडीत | पांढरा | जखमा | तीव्र | मुक्त | जवळचे | अरुंद | तपकिरी | रुंदावलेला | समान | गुळगुळीत | गुळगुळीत | पांढरा | पांढरा | अंशतः | पांढरा | एक | लटकणारा | काळा | विखुरलेला | शहरी | तुम्हाला लगेच लक्षात येईल की सर्व डेटा मजकूर स्वरूपात आहे. चार्टमध्ये वापरण्यासाठी तुम्हाला हा डेटा रूपांतरित करावा लागेल. खरं तर, बहुतेक डेटा ऑब्जेक्ट स्वरूपात दर्शविला जातो: ```python print(mushrooms.select_dtypes(["object"]).columns) ``` आउटपुट असेल: ```output Index(['class', 'cap-shape', 'cap-surface', 'cap-color', 'bruises', 'odor', 'gill-attachment', 'gill-spacing', 'gill-size', 'gill-color', 'stalk-shape', 'stalk-root', 'stalk-surface-above-ring', 'stalk-surface-below-ring', 'stalk-color-above-ring', 'stalk-color-below-ring', 'veil-type', 'veil-color', 'ring-number', 'ring-type', 'spore-print-color', 'population', 'habitat'], dtype='object') ``` हा डेटा घ्या आणि 'class' कॉलमला श्रेणीमध्ये रूपांतरित करा: ```python cols = mushrooms.select_dtypes(["object"]).columns mushrooms[cols] = mushrooms[cols].astype('category') ``` ```python edibleclass=mushrooms.groupby(['class']).count() edibleclass ``` आता, जर तुम्ही मशरूम्स डेटा प्रिंट केला, तर तुम्हाला दिसेल की तो विषारी/खाद्य वर्गानुसार श्रेणींमध्ये गटबद्ध केला गेला आहे: | | कॅप-आकार | कॅप-पृष्ठभाग | कॅप-रंग | जखमा | वास | गिल-जोडणी | गिल-अंतर | गिल-आकार | गिल-रंग | स्टॉक-आकार | ... | स्टॉक-पृष्ठभाग-रिंगच्या-खाली | स्टॉक-रंग-रिंगच्या-वर | स्टॉक-रंग-रिंगच्या-खाली | पडदा-प्रकार | पडदा-रंग | रिंग-क्रमांक | रिंग-प्रकार | बीज-छपाई-रंग | लोकसंख्या | निवासस्थान | | --------- | --------- | ----------- | -------- | ----- | ---- | ---------- | --------- | -------- | --------- | ---------- | --- | -------------------------- | ---------------------- | ---------------------- | ----------- | --------- | ------------ | ----------- | ------------- | ---------- | ----------- | | वर्ग | | | | | | | | | | | | | | | | | | | | | | | खाद्य | 4208 | 4208 | 4208 | 4208 | 4208 | 4208 | 4208 | 4208 | 4208 | 4208 | ... | 4208 | 4208 | 4208 | 4208 | 4208 | 4208 | 4208 | 4208 | 4208 | 4208 | | विषारी | 3916 | 3916 | 3916 | 3916 | 3916 | 3916 | 3916 | 3916 | 3916 | 3916 | ... | 3916 | 3916 | 3916 | 3916 | 3916 | 3916 | 3916 | 3916 | 3916 | 3916 | जर तुम्ही या टेबलमध्ये दिलेल्या क्रमाने वर्ग श्रेणी लेबल तयार केले, तर तुम्ही पाई चार्ट तयार करू शकता: ## पाई! ```python labels=['Edible','Poisonous'] plt.pie(edibleclass['population'],labels=labels,autopct='%.1f %%') plt.title('Edible?') plt.show() ``` आणि तयार! पाई चार्ट, जो या डेटाच्या विषारी/खाद्य वर्गांनुसार प्रमाण दाखवतो. लेबल्सचा क्रम योग्य ठेवणे खूप महत्त्वाचे आहे, त्यामुळे लेबल अॅरे तयार करताना क्रम तपासा! ![pie chart](../../../../translated_images/pie1-wb.e201f2fcc335413143ce37650fb7f5f0bb21358e7823a327ed8644dfb84be9db.mr.png) ## डोनट्स! पाई चार्टपेक्षा अधिक आकर्षक दिसणारा चार्ट म्हणजे डोनट चार्ट, जो पाई चार्टमध्ये मध्यभागी एक छिद्र असतो. चला, आपल्या डेटाला या पद्धतीने पाहूया. मशरूम्स ज्या विविध निवासस्थानांमध्ये वाढतात त्यावर एक नजर टाका: ```python habitat=mushrooms.groupby(['habitat']).count() habitat ``` येथे, तुम्ही तुमचा डेटा निवासस्थानानुसार गटबद्ध करत आहात. 7 निवासस्थानं दिली आहेत, त्यामुळे त्यांचा वापर डोनट चार्टसाठी लेबल्स म्हणून करा: ```python labels=['Grasses','Leaves','Meadows','Paths','Urban','Waste','Wood'] plt.pie(habitat['class'], labels=labels, autopct='%1.1f%%', pctdistance=0.85) center_circle = plt.Circle((0, 0), 0.40, fc='white') fig = plt.gcf() fig.gca().add_artist(center_circle) plt.title('Mushroom Habitats') plt.show() ``` ![donut chart](../../../../translated_images/donut-wb.be3c12a22712302b5d10c40014d5389d4a1ae4412fe1655b3cf4af57b64f799a.mr.png) हे कोड एक चार्ट आणि मध्यवर्ती वर्तुळ तयार करतो, नंतर त्या चार्टमध्ये ते वर्तुळ जोडतो. मध्यवर्ती वर्तुळाची रुंदी बदलण्यासाठी `0.40` चे मूल्य बदला. डोनट चार्ट्समध्ये लेबल्स अधिक वाचनीय करण्यासाठी विविध प्रकारे बदल करता येतात. अधिक जाणून घ्या [डॉक्स](https://matplotlib.org/stable/gallery/pie_and_polar_charts/pie_and_donut_labels.html?highlight=donut) मध्ये. आता तुम्हाला तुमचा डेटा गटबद्ध करून पाई किंवा डोनट चार्टमध्ये कसा दाखवायचा हे कळले आहे, तुम्ही इतर प्रकारचे चार्ट्सही एक्सप्लोर करू शकता. वाफल चार्ट वापरून पाहा, जो प्रमाणांचे 2D चौकटीत दृश्यांकन करण्याचा वेगळा मार्ग आहे. ## वाफल्स! 'वाफल' प्रकारचा चार्ट प्रमाणांचे 2D चौकटीत चौकोनांच्या स्वरूपात दृश्यांकन करण्याचा वेगळा मार्ग आहे. या डेटासेटमधील मशरूम कॅप रंगांच्या प्रमाणांचे दृश्यांकन करण्याचा प्रयत्न करा. यासाठी, तुम्हाला [PyWaffle](https://pypi.org/project/pywaffle/) नावाची सहाय्यक लायब्ररी आणि Matplotlib वापरावी लागेल: ```python pip install pywaffle ``` तुमच्या डेटाचा एक विभाग निवडा: ```python capcolor=mushrooms.groupby(['cap-color']).count() capcolor ``` लेबल तयार करून आणि तुमचा डेटा गटबद्ध करून वाफल चार्ट तयार करा: ```python import pandas as pd import matplotlib.pyplot as plt from pywaffle import Waffle data ={'color': ['brown', 'buff', 'cinnamon', 'green', 'pink', 'purple', 'red', 'white', 'yellow'], 'amount': capcolor['class'] } df = pd.DataFrame(data) fig = plt.figure( FigureClass = Waffle, rows = 100, values = df.amount, labels = list(df.color), figsize = (30,30), colors=["brown", "tan", "maroon", "green", "pink", "purple", "red", "whitesmoke", "yellow"], ) ``` वाफल चार्ट वापरून, तुम्हाला या मशरूम्स डेटासेटमधील कॅप रंगांचे प्रमाण स्पष्टपणे दिसेल. आश्चर्यकारकपणे, अनेक हिरव्या कॅप असलेल्या मशरूम्स आहेत! ![waffle chart](../../../../translated_images/waffle.5455dbae4ccf17d53bb40ff0a657ecef7b8aa967e27a19cc96325bd81598f65e.mr.png) ✅ PyWaffle मध्ये [Font Awesome](https://fontawesome.com/) मधील कोणतेही आयकॉन वापरून चार्ट्समध्ये आयकॉन समाविष्ट करण्याचा पर्याय आहे. चौकोनांच्या ऐवजी आयकॉन वापरून आणखी रोचक वाफल चार्ट तयार करण्यासाठी काही प्रयोग करा. या धड्यात, तुम्ही प्रमाणांचे दृश्यांकन करण्याचे तीन मार्ग शिकलात. प्रथम, तुम्हाला तुमचा डेटा श्रेणींमध्ये गटबद्ध करावा लागतो आणि नंतर डेटा दाखवण्यासाठी कोणता सर्वोत्तम मार्ग आहे ते ठरवावे लागते - पाई, डोनट, किंवा वाफल. हे सर्वच स्वादिष्ट आहेत आणि वापरकर्त्याला डेटासेटचा झटपट आढावा देतात. ## 🚀 आव्हान [Charticulator](https://charticulator.com) मध्ये हे स्वादिष्ट चार्ट्स पुन्हा तयार करण्याचा प्रयत्न करा. ## [व्याख्यानानंतरची प्रश्नमंजुषा](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/21) ## पुनरावलोकन आणि स्व-अभ्यास कधी कधी पाई, डोनट, किंवा वाफल चार्ट कधी वापरायचा हे स्पष्ट नसते. या विषयावर वाचण्यासाठी काही लेख: https://www.beautiful.ai/blog/battle-of-the-charts-pie-chart-vs-donut-chart https://medium.com/@hypsypops/pie-chart-vs-donut-chart-showdown-in-the-ring-5d24fd86a9ce https://www.mit.edu/~mbarker/formula1/f1help/11-ch-c6.htm https://medium.datadriveninvestor.com/data-visualization-done-the-right-way-with-tableau-waffle-chart-fdf2a19be402 या निर्णयावर अधिक माहिती मिळवण्यासाठी काही संशोधन करा. ## असाइनमेंट [Excel मध्ये प्रयत्न करा](assignment.md) --- **अस्वीकरण**: हा दस्तऐवज AI भाषांतर सेवा [Co-op Translator](https://github.com/Azure/co-op-translator) वापरून भाषांतरित करण्यात आला आहे. आम्ही अचूकतेसाठी प्रयत्नशील असलो तरी, कृपया लक्षात घ्या की स्वयंचलित भाषांतरांमध्ये त्रुटी किंवा अचूकतेचा अभाव असू शकतो. मूळ भाषेतील मूळ दस्तऐवज हा अधिकृत स्रोत मानला जावा. महत्त्वाच्या माहितीसाठी, व्यावसायिक मानवी भाषांतराची शिफारस केली जाते. या भाषांतराचा वापर करून उद्भवणाऱ्या कोणत्याही गैरसमज किंवा चुकीच्या अर्थासाठी आम्ही जबाबदार राहणार नाही.