20 KiB
प्रमाणांचे दृश्यांकन
![]() |
---|
प्रमाणांचे दृश्यांकन - Sketchnote by @nitya |
या धड्यात, तुम्ही निसर्गाशी संबंधित वेगळ्या डेटासेटचा वापर करून प्रमाणांचे दृश्यांकन कराल, जसे की मशरूम्सबद्दलच्या डेटासेटमध्ये किती प्रकारचे बुरशी आहेत हे पाहणे. चला, या अद्भुत बुरशींचा अभ्यास करूया, ज्यासाठी ऑडुबॉनकडून घेतलेल्या डेटासेटमध्ये Agaricus आणि Lepiota कुटुंबातील 23 प्रकारच्या गिल्ड मशरूम्सची माहिती आहे. तुम्ही खालील स्वादिष्ट दृश्यांकन प्रकारांचा प्रयोग कराल:
- पाई चार्ट्स 🥧
- डोनट चार्ट्स 🍩
- वाफल चार्ट्स 🧇
💡 मायक्रोसॉफ्ट रिसर्चने तयार केलेल्या Charticulator नावाच्या एका खूपच रोचक प्रकल्पात डेटा दृश्यांकनासाठी फ्री ड्रॅग अँड ड्रॉप इंटरफेस आहे. त्यांच्या एका ट्युटोरियलमध्ये त्यांनी हा मशरूम डेटासेटही वापरला आहे! त्यामुळे तुम्ही डेटा एक्सप्लोर करू शकता आणि त्याच वेळी लायब्ररी शिकू शकता: Charticulator tutorial.
पूर्व-व्याख्यान प्रश्नमंजुषा
तुमच्या मशरूम्सना ओळखा 🍄
मशरूम्स खूपच रोचक असतात. चला, त्यांचा अभ्यास करण्यासाठी एक डेटासेट आयात करूया:
import pandas as pd
import matplotlib.pyplot as plt
mushrooms = pd.read_csv('../../data/mushrooms.csv')
mushrooms.head()
एक टेबल तयार होते ज्यामध्ये विश्लेषणासाठी छान डेटा आहे:
वर्ग | कॅप-आकार | कॅप-पृष्ठभाग | कॅप-रंग | जखमा | वास | गिल-जोडणी | गिल-अंतर | गिल-आकार | गिल-रंग | स्टॉक-आकार | स्टॉक-मूळ | स्टॉक-पृष्ठभाग-रिंगच्या-वर | स्टॉक-पृष्ठभाग-रिंगच्या-खाली | स्टॉक-रंग-रिंगच्या-वर | स्टॉक-रंग-रिंगच्या-खाली | पडदा-प्रकार | पडदा-रंग | रिंग-क्रमांक | रिंग-प्रकार | बीज-छपाई-रंग | लोकसंख्या | निवासस्थान |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
विषारी | उंचवटा | गुळगुळीत | तपकिरी | जखमा | तीव्र | मुक्त | जवळचे | अरुंद | काळा | रुंदावलेला | समान | गुळगुळीत | गुळगुळीत | पांढरा | पांढरा | अंशतः | पांढरा | एक | लटकणारा | काळा | विखुरलेला | शहरी |
खाद्य | उंचवटा | गुळगुळीत | पिवळा | जखमा | बदामाचा | मुक्त | जवळचे | रुंद | काळा | रुंदावलेला | काठीसारखा | गुळगुळीत | गुळगुळीत | पांढरा | पांढरा | अंशतः | पांढरा | एक | लटकणारा | तपकिरी | विपुल | गवताळ |
खाद्य | घंटेसारखा | गुळगुळीत | पांढरा | जखमा | बडीशेप | मुक्त | जवळचे | रुंद | तपकिरी | रुंदावलेला | काठीसारखा | गुळगुळीत | गुळगुळीत | पांढरा | पांढरा | अंशतः | पांढरा | एक | लटकणारा | तपकिरी | विपुल | कुरण |
विषारी | उंचवटा | खडबडीत | पांढरा | जखमा | तीव्र | मुक्त | जवळचे | अरुंद | तपकिरी | रुंदावलेला | समान | गुळगुळीत | गुळगुळीत | पांढरा | पांढरा | अंशतः | पांढरा | एक | लटकणारा | काळा | विखुरलेला | शहरी |
तुम्हाला लगेच लक्षात येईल की सर्व डेटा मजकूर स्वरूपात आहे. चार्टमध्ये वापरण्यासाठी तुम्हाला हा डेटा रूपांतरित करावा लागेल. खरं तर, बहुतेक डेटा ऑब्जेक्ट स्वरूपात दर्शविला जातो:
print(mushrooms.select_dtypes(["object"]).columns)
आउटपुट असेल:
Index(['class', 'cap-shape', 'cap-surface', 'cap-color', 'bruises', 'odor',
'gill-attachment', 'gill-spacing', 'gill-size', 'gill-color',
'stalk-shape', 'stalk-root', 'stalk-surface-above-ring',
'stalk-surface-below-ring', 'stalk-color-above-ring',
'stalk-color-below-ring', 'veil-type', 'veil-color', 'ring-number',
'ring-type', 'spore-print-color', 'population', 'habitat'],
dtype='object')
हा डेटा घ्या आणि 'class' कॉलमला श्रेणीमध्ये रूपांतरित करा:
cols = mushrooms.select_dtypes(["object"]).columns
mushrooms[cols] = mushrooms[cols].astype('category')
edibleclass=mushrooms.groupby(['class']).count()
edibleclass
आता, जर तुम्ही मशरूम्स डेटा प्रिंट केला, तर तुम्हाला दिसेल की तो विषारी/खाद्य वर्गानुसार श्रेणींमध्ये गटबद्ध केला गेला आहे:
कॅप-आकार | कॅप-पृष्ठभाग | कॅप-रंग | जखमा | वास | गिल-जोडणी | गिल-अंतर | गिल-आकार | गिल-रंग | स्टॉक-आकार | ... | स्टॉक-पृष्ठभाग-रिंगच्या-खाली | स्टॉक-रंग-रिंगच्या-वर | स्टॉक-रंग-रिंगच्या-खाली | पडदा-प्रकार | पडदा-रंग | रिंग-क्रमांक | रिंग-प्रकार | बीज-छपाई-रंग | लोकसंख्या | निवासस्थान | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
वर्ग | |||||||||||||||||||||
खाद्य | 4208 | 4208 | 4208 | 4208 | 4208 | 4208 | 4208 | 4208 | 4208 | 4208 | ... | 4208 | 4208 | 4208 | 4208 | 4208 | 4208 | 4208 | 4208 | 4208 | 4208 |
विषारी | 3916 | 3916 | 3916 | 3916 | 3916 | 3916 | 3916 | 3916 | 3916 | 3916 | ... | 3916 | 3916 | 3916 | 3916 | 3916 | 3916 | 3916 | 3916 | 3916 | 3916 |
जर तुम्ही या टेबलमध्ये दिलेल्या क्रमाने वर्ग श्रेणी लेबल तयार केले, तर तुम्ही पाई चार्ट तयार करू शकता:
पाई!
labels=['Edible','Poisonous']
plt.pie(edibleclass['population'],labels=labels,autopct='%.1f %%')
plt.title('Edible?')
plt.show()
आणि तयार! पाई चार्ट, जो या डेटाच्या विषारी/खाद्य वर्गांनुसार प्रमाण दाखवतो. लेबल्सचा क्रम योग्य ठेवणे खूप महत्त्वाचे आहे, त्यामुळे लेबल अॅरे तयार करताना क्रम तपासा!
डोनट्स!
पाई चार्टपेक्षा अधिक आकर्षक दिसणारा चार्ट म्हणजे डोनट चार्ट, जो पाई चार्टमध्ये मध्यभागी एक छिद्र असतो. चला, आपल्या डेटाला या पद्धतीने पाहूया.
मशरूम्स ज्या विविध निवासस्थानांमध्ये वाढतात त्यावर एक नजर टाका:
habitat=mushrooms.groupby(['habitat']).count()
habitat
येथे, तुम्ही तुमचा डेटा निवासस्थानानुसार गटबद्ध करत आहात. 7 निवासस्थानं दिली आहेत, त्यामुळे त्यांचा वापर डोनट चार्टसाठी लेबल्स म्हणून करा:
labels=['Grasses','Leaves','Meadows','Paths','Urban','Waste','Wood']
plt.pie(habitat['class'], labels=labels,
autopct='%1.1f%%', pctdistance=0.85)
center_circle = plt.Circle((0, 0), 0.40, fc='white')
fig = plt.gcf()
fig.gca().add_artist(center_circle)
plt.title('Mushroom Habitats')
plt.show()
हे कोड एक चार्ट आणि मध्यवर्ती वर्तुळ तयार करतो, नंतर त्या चार्टमध्ये ते वर्तुळ जोडतो. मध्यवर्ती वर्तुळाची रुंदी बदलण्यासाठी 0.40
चे मूल्य बदला.
डोनट चार्ट्समध्ये लेबल्स अधिक वाचनीय करण्यासाठी विविध प्रकारे बदल करता येतात. अधिक जाणून घ्या डॉक्स मध्ये.
आता तुम्हाला तुमचा डेटा गटबद्ध करून पाई किंवा डोनट चार्टमध्ये कसा दाखवायचा हे कळले आहे, तुम्ही इतर प्रकारचे चार्ट्सही एक्सप्लोर करू शकता. वाफल चार्ट वापरून पाहा, जो प्रमाणांचे 2D चौकटीत दृश्यांकन करण्याचा वेगळा मार्ग आहे.
वाफल्स!
'वाफल' प्रकारचा चार्ट प्रमाणांचे 2D चौकटीत चौकोनांच्या स्वरूपात दृश्यांकन करण्याचा वेगळा मार्ग आहे. या डेटासेटमधील मशरूम कॅप रंगांच्या प्रमाणांचे दृश्यांकन करण्याचा प्रयत्न करा. यासाठी, तुम्हाला PyWaffle नावाची सहाय्यक लायब्ररी आणि Matplotlib वापरावी लागेल:
pip install pywaffle
तुमच्या डेटाचा एक विभाग निवडा:
capcolor=mushrooms.groupby(['cap-color']).count()
capcolor
लेबल तयार करून आणि तुमचा डेटा गटबद्ध करून वाफल चार्ट तयार करा:
import pandas as pd
import matplotlib.pyplot as plt
from pywaffle import Waffle
data ={'color': ['brown', 'buff', 'cinnamon', 'green', 'pink', 'purple', 'red', 'white', 'yellow'],
'amount': capcolor['class']
}
df = pd.DataFrame(data)
fig = plt.figure(
FigureClass = Waffle,
rows = 100,
values = df.amount,
labels = list(df.color),
figsize = (30,30),
colors=["brown", "tan", "maroon", "green", "pink", "purple", "red", "whitesmoke", "yellow"],
)
वाफल चार्ट वापरून, तुम्हाला या मशरूम्स डेटासेटमधील कॅप रंगांचे प्रमाण स्पष्टपणे दिसेल. आश्चर्यकारकपणे, अनेक हिरव्या कॅप असलेल्या मशरूम्स आहेत!
✅ PyWaffle मध्ये Font Awesome मधील कोणतेही आयकॉन वापरून चार्ट्समध्ये आयकॉन समाविष्ट करण्याचा पर्याय आहे. चौकोनांच्या ऐवजी आयकॉन वापरून आणखी रोचक वाफल चार्ट तयार करण्यासाठी काही प्रयोग करा.
या धड्यात, तुम्ही प्रमाणांचे दृश्यांकन करण्याचे तीन मार्ग शिकलात. प्रथम, तुम्हाला तुमचा डेटा श्रेणींमध्ये गटबद्ध करावा लागतो आणि नंतर डेटा दाखवण्यासाठी कोणता सर्वोत्तम मार्ग आहे ते ठरवावे लागते - पाई, डोनट, किंवा वाफल. हे सर्वच स्वादिष्ट आहेत आणि वापरकर्त्याला डेटासेटचा झटपट आढावा देतात.
🚀 आव्हान
Charticulator मध्ये हे स्वादिष्ट चार्ट्स पुन्हा तयार करण्याचा प्रयत्न करा.
व्याख्यानानंतरची प्रश्नमंजुषा
पुनरावलोकन आणि स्व-अभ्यास
कधी कधी पाई, डोनट, किंवा वाफल चार्ट कधी वापरायचा हे स्पष्ट नसते. या विषयावर वाचण्यासाठी काही लेख:
https://www.beautiful.ai/blog/battle-of-the-charts-pie-chart-vs-donut-chart
https://medium.com/@hypsypops/pie-chart-vs-donut-chart-showdown-in-the-ring-5d24fd86a9ce
https://www.mit.edu/~mbarker/formula1/f1help/11-ch-c6.htm
या निर्णयावर अधिक माहिती मिळवण्यासाठी काही संशोधन करा.
असाइनमेंट
अस्वीकरण:
हा दस्तऐवज AI भाषांतर सेवा Co-op Translator वापरून भाषांतरित करण्यात आला आहे. आम्ही अचूकतेसाठी प्रयत्नशील असलो तरी, कृपया लक्षात घ्या की स्वयंचलित भाषांतरांमध्ये त्रुटी किंवा अचूकतेचा अभाव असू शकतो. मूळ भाषेतील मूळ दस्तऐवज हा अधिकृत स्रोत मानला जावा. महत्त्वाच्या माहितीसाठी, व्यावसायिक मानवी भाषांतराची शिफारस केली जाते. या भाषांतराचा वापर करून उद्भवणाऱ्या कोणत्याही गैरसमज किंवा चुकीच्या अर्थासाठी आम्ही जबाबदार राहणार नाही.