|
2 weeks ago | |
---|---|---|
.. | ||
solution | 3 weeks ago | |
README.md | 2 weeks ago | |
assignment.md | 3 weeks ago | |
notebook.ipynb | 3 weeks ago |
README.md
प्रमाणांचे दृश्यांकन
![]() |
---|
प्रमाणांचे दृश्यांकन - Sketchnote by @nitya |
या धड्यात, तुम्ही निसर्गावर आधारित वेगळ्या डेटासेटचा वापर करून प्रमाणांचे दृश्यांकन कराल, जसे की मशरूमबद्दलच्या डेटासेटमध्ये किती प्रकारचे कवक आहेत. चला या आकर्षक कवकांचा अभ्यास करूया, ज्यासाठी Audubon कडून मिळवलेल्या डेटासेटमध्ये Agaricus आणि Lepiota कुटुंबातील 23 प्रकारच्या गिल्ड मशरूम्सची माहिती आहे. तुम्ही खालील स्वादिष्ट दृश्यांकन प्रकारांचा प्रयोग कराल:
- पाई चार्ट 🥧
- डोनट चार्ट 🍩
- वाफल चार्ट 🧇
💡 Charticulator नावाचा एक अतिशय मनोरंजक प्रकल्प Microsoft Research कडून उपलब्ध आहे, जो डेटा दृश्यांकनासाठी फ्री ड्रॅग आणि ड्रॉप इंटरफेस प्रदान करतो. त्यांच्या एका ट्युटोरियलमध्ये त्यांनी मशरूम डेटासेटचा वापर केला आहे! त्यामुळे तुम्ही डेटा एक्सप्लोर करू शकता आणि त्याच वेळी लायब्ररी शिकू शकता: Charticulator tutorial.
पूर्व-व्याख्यान प्रश्नमंजुषा
तुमच्या मशरूम्सची ओळख 🍄
मशरूम्स खूपच मनोरंजक आहेत. चला त्यांचा अभ्यास करण्यासाठी एक डेटासेट आयात करूया:
import pandas as pd
import matplotlib.pyplot as plt
mushrooms = pd.read_csv('../../data/mushrooms.csv')
mushrooms.head()
एक टेबल प्रिंट केले जाते ज्यामध्ये विश्लेषणासाठी उत्कृष्ट डेटा आहे:
वर्ग | टोपीचा आकार | टोपीचा पृष्ठभाग | टोपीचा रंग | जखम | गंध | गिल जोडणी | गिल अंतर | गिल आकार | गिल रंग | खांबाचा आकार | खांब मुळ | खांब पृष्ठभाग रिंगच्या वर | खांब पृष्ठभाग रिंगच्या खाली | खांबाचा रंग रिंगच्या वर | खांबाचा रंग रिंगच्या खाली | पडदा प्रकार | पडदा रंग | रिंग संख्या | रिंग प्रकार | बीज प्रिंट रंग | लोकसंख्या | निवासस्थान |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
विषारी | उभट | गुळगुळीत | तपकिरी | जखम | तीव्र | मुक्त | जवळ | अरुंद | काळा | मोठा | समान | गुळगुळीत | गुळगुळीत | पांढरा | पांढरा | अंशतः | पांढरा | एक | लटकणारा | काळा | विखुरलेला | शहरी |
खाद्य | उभट | गुळगुळीत | पिवळा | जखम | बदाम | मुक्त | जवळ | रुंद | काळा | मोठा | क्लब | गुळगुळीत | गुळगुळीत | पांढरा | पांढरा | अंशतः | पांढरा | एक | लटकणारा | तपकिरी | भरपूर | गवताळ |
खाद्य | घंटा | गुळगुळीत | पांढरा | जखम | अॅनिस | मुक्त | जवळ | रुंद | तपकिरी | मोठा | क्लब | गुळगुळीत | गुळगुळीत | पांढरा | पांढरा | अंशतः | पांढरा | एक | लटकणारा | तपकिरी | भरपूर | कुरणे |
विषारी | उभट | खडबडीत | पांढरा | जखम | तीव्र | मुक्त | जवळ | अरुंद | तपकिरी | मोठा | समान | गुळगुळीत | गुळगुळीत | पांढरा | पांढरा | अंशतः | पांढरा | एक | लटकणारा | काळा | विखुरलेला | शहरी |
तुम्हाला लगेच लक्षात येते की सर्व डेटा मजकूर स्वरूपात आहे. तुम्हाला हा डेटा चार्टमध्ये वापरण्यासाठी रूपांतरित करावा लागेल. प्रत्यक्षात, बहुतेक डेटा ऑब्जेक्ट स्वरूपात दर्शविला जातो:
print(mushrooms.select_dtypes(["object"]).columns)
आउटपुट आहे:
Index(['class', 'cap-shape', 'cap-surface', 'cap-color', 'bruises', 'odor',
'gill-attachment', 'gill-spacing', 'gill-size', 'gill-color',
'stalk-shape', 'stalk-root', 'stalk-surface-above-ring',
'stalk-surface-below-ring', 'stalk-color-above-ring',
'stalk-color-below-ring', 'veil-type', 'veil-color', 'ring-number',
'ring-type', 'spore-print-color', 'population', 'habitat'],
dtype='object')
हा डेटा घ्या आणि 'class' कॉलमला श्रेणीमध्ये रूपांतरित करा:
cols = mushrooms.select_dtypes(["object"]).columns
mushrooms[cols] = mushrooms[cols].astype('category')
edibleclass=mushrooms.groupby(['class']).count()
edibleclass
आता, जर तुम्ही मशरूम्स डेटा प्रिंट केला, तर तुम्हाला दिसेल की तो विषारी/खाद्य वर्गानुसार श्रेणींमध्ये गटबद्ध केला गेला आहे:
टोपीचा आकार | टोपीचा पृष्ठभाग | टोपीचा रंग | जखम | गंध | गिल जोडणी | गिल अंतर | गिल आकार | गिल रंग | खांबाचा आकार | ... | खांब पृष्ठभाग रिंगच्या खाली | खांबाचा रंग रिंगच्या वर | खांबाचा रंग रिंगच्या खाली | पडदा प्रकार | पडदा रंग | रिंग संख्या | रिंग प्रकार | बीज प्रिंट रंग | लोकसंख्या | निवासस्थान | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
वर्ग | |||||||||||||||||||||
खाद्य | 4208 | 4208 | 4208 | 4208 | 4208 | 4208 | 4208 | 4208 | 4208 | 4208 | ... | 4208 | 4208 | 4208 | 4208 | 4208 | 4208 | 4208 | 4208 | 4208 | 4208 |
विषारी | 3916 | 3916 | 3916 | 3916 | 3916 | 3916 | 3916 | 3916 | 3916 | 3916 | ... | 3916 | 3916 | 3916 | 3916 | 3916 | 3916 | 3916 | 3916 | 3916 | 3916 |
जर तुम्ही या टेबलमध्ये दिलेल्या क्रमाने वर्ग श्रेणी लेबल तयार केले, तर तुम्ही पाई चार्ट तयार करू शकता:
पाई!
labels=['Edible','Poisonous']
plt.pie(edibleclass['population'],labels=labels,autopct='%.1f %%')
plt.title('Edible?')
plt.show()
पाई चार्ट तयार झाला आहे, जो या मशरूम्स डेटाच्या दोन वर्गांनुसार प्रमाण दाखवतो. लेबल्सचा क्रम योग्य असणे खूप महत्त्वाचे आहे, विशेषतः येथे, त्यामुळे लेबल अॅरे तयार करताना क्रम सत्यापित करा!
डोनट्स!
पाई चार्टपेक्षा थोडा अधिक आकर्षक चार्ट म्हणजे डोनट चार्ट, जो पाई चार्टमध्ये मध्यभागी एक छिद्र असतो. चला आपल्या डेटाचा अभ्यास या पद्धतीने करूया.
मशरूम्स ज्या विविध निवासस्थानांमध्ये वाढतात त्यावर एक नजर टाका:
habitat=mushrooms.groupby(['habitat']).count()
habitat
येथे, तुम्ही तुमचा डेटा निवासस्थानानुसार गटबद्ध करत आहात. 7 निवासस्थान दिले आहेत, त्यामुळे तुमच्या डोनट चार्टसाठी त्यांचा लेबल्स म्हणून वापर करा:
labels=['Grasses','Leaves','Meadows','Paths','Urban','Waste','Wood']
plt.pie(habitat['class'], labels=labels,
autopct='%1.1f%%', pctdistance=0.85)
center_circle = plt.Circle((0, 0), 0.40, fc='white')
fig = plt.gcf()
fig.gca().add_artist(center_circle)
plt.title('Mushroom Habitats')
plt.show()
हा कोड एक चार्ट आणि मध्यवर्ती वर्तुळ काढतो, नंतर त्या चार्टमध्ये मध्यवर्ती वर्तुळ जोडतो. 0.40
बदलून दुसरी किंमत देऊन मध्यवर्ती वर्तुळाची रुंदी संपादित करा.
डोनट चार्ट्स विविध प्रकारे बदलले जाऊ शकतात, विशेषतः लेबल्स वाचनीयतेसाठी हायलाइट करता येतात. अधिक जाणून घ्या डॉक्स मध्ये.
आता तुम्हाला तुमचा डेटा गटबद्ध करून पाई किंवा डोनट स्वरूपात कसा दाखवायचा हे माहित आहे, तुम्ही इतर प्रकारचे चार्ट एक्सप्लोर करू शकता. वाफल चार्ट वापरून पहा, जो प्रमाण एक्सप्लोर करण्याचा वेगळा मार्ग आहे.
वाफल्स!
'वाफल' प्रकारचा चार्ट प्रमाणांचे 2D चौकोनांच्या स्वरूपात दृश्यांकन करण्याचा वेगळा मार्ग आहे. या डेटासेटमधील मशरूम टोपीच्या रंगांच्या प्रमाणांचे दृश्यांकन करण्याचा प्रयत्न करा. हे करण्यासाठी, तुम्हाला PyWaffle नावाची एक सहाय्यक लायब्ररी आणि Matplotlib वापरण्याची आवश्यकता आहे:
pip install pywaffle
तुमच्या डेटाचा एक विभाग निवडा आणि गटबद्ध करा:
capcolor=mushrooms.groupby(['cap-color']).count()
capcolor
लेबल्स तयार करून आणि तुमचा डेटा गटबद्ध करून वाफल चार्ट तयार करा:
import pandas as pd
import matplotlib.pyplot as plt
from pywaffle import Waffle
data ={'color': ['brown', 'buff', 'cinnamon', 'green', 'pink', 'purple', 'red', 'white', 'yellow'],
'amount': capcolor['class']
}
df = pd.DataFrame(data)
fig = plt.figure(
FigureClass = Waffle,
rows = 100,
values = df.amount,
labels = list(df.color),
figsize = (30,30),
colors=["brown", "tan", "maroon", "green", "pink", "purple", "red", "whitesmoke", "yellow"],
)
वाफल चार्ट वापरून, तुम्ही मशरूम्स डेटासेटमधील टोपीच्या रंगांचे प्रमाण स्पष्टपणे पाहू शकता. आश्चर्यकारकपणे, अनेक हिरव्या टोपीचे मशरूम्स आहेत!
✅ PyWaffle Font Awesome मध्ये उपलब्ध असलेल्या कोणत्याही आयकॉनचा वापर करून चार्टमध्ये आयकॉन समाविष्ट करण्यास समर्थन देते. चौकोनांऐवजी आयकॉन वापरून अधिक आकर्षक वाफल चार्ट तयार करण्यासाठी काही प्रयोग करा.
या धड्यात, तुम्ही प्रमाणांचे दृश्यांकन करण्याचे तीन मार्ग शिकले. प्रथम, तुम्हाला तुमचा डेटा श्रेणींमध्ये गटबद्ध करावा लागतो आणि नंतर डेटा कसा प्रदर्शित करायचा ते ठरवावे लागते - पाई, डोनट किंवा वाफल. सर्व प्रकार स्वादिष्ट आहेत आणि वापरकर्त्याला डेटासेटचा त्वरित स्नॅपशॉट देतात.
🚀 आव्हान
Charticulator मध्ये हे स्वादिष्ट चार्ट पुन्हा तयार करण्याचा प्रयत्न करा.
व्याख्यानानंतरची प्रश्नमंजुषा
पुनरावलोकन आणि स्व-अभ्यास
कधी पाई, डोनट किंवा वाफल चार्ट वापरायचा हे स्पष्ट नसते. या विषयावर काही लेख वाचा:
https://www.beautiful.ai/blog/battle-of-the-charts-pie-chart-vs-donut-chart
https://medium.com/@hypsypops/pie-chart-vs-donut-chart-showdown-in-the-ring-5d24fd86a9ce
https://www.mit.edu/~mbarker/formula1/f1help/11-ch-c6.htm
अधिक माहिती मिळवण्यासाठी संशोधन करा आणि या निर्णयावर अधिक विचार करा.
असाइनमेंट
अस्वीकरण:
हा दस्तऐवज AI भाषांतर सेवा Co-op Translator चा वापर करून भाषांतरित करण्यात आला आहे. आम्ही अचूकतेसाठी प्रयत्नशील असलो तरी कृपया लक्षात ठेवा की स्वयंचलित भाषांतरे त्रुटी किंवा अचूकतेच्या अभावाने युक्त असू शकतात. मूळ भाषेतील दस्तऐवज हा अधिकृत स्रोत मानला जावा. महत्त्वाच्या माहितीसाठी व्यावसायिक मानवी भाषांतराची शिफारस केली जाते. या भाषांतराचा वापर करून निर्माण होणाऱ्या कोणत्याही गैरसमज किंवा चुकीच्या अर्थासाठी आम्ही जबाबदार राहणार नाही.