You can not select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.

20 KiB

प्रमाणांचे दृश्यांकन

 Sketchnote by (@sketchthedocs)
प्रमाणांचे दृश्यांकन - Sketchnote by @nitya

या धड्यात, तुम्ही निसर्गाशी संबंधित वेगळ्या डेटासेटचा वापर करून प्रमाणांचे दृश्यांकन कराल, जसे की मशरूम्सबद्दलच्या डेटासेटमध्ये किती प्रकारचे बुरशी आहेत हे पाहणे. चला, या अद्भुत बुरशींचा अभ्यास करूया, ज्यासाठी ऑडुबॉनकडून घेतलेल्या डेटासेटमध्ये Agaricus आणि Lepiota कुटुंबातील 23 प्रकारच्या गिल्ड मशरूम्सची माहिती आहे. तुम्ही खालील स्वादिष्ट दृश्यांकन प्रकारांचा प्रयोग कराल:

  • पाई चार्ट्स 🥧
  • डोनट चार्ट्स 🍩
  • वाफल चार्ट्स 🧇

💡 मायक्रोसॉफ्ट रिसर्चने तयार केलेल्या Charticulator नावाच्या एका खूपच रोचक प्रकल्पात डेटा दृश्यांकनासाठी फ्री ड्रॅग अँड ड्रॉप इंटरफेस आहे. त्यांच्या एका ट्युटोरियलमध्ये त्यांनी हा मशरूम डेटासेटही वापरला आहे! त्यामुळे तुम्ही डेटा एक्सप्लोर करू शकता आणि त्याच वेळी लायब्ररी शिकू शकता: Charticulator tutorial.

पूर्व-व्याख्यान प्रश्नमंजुषा

तुमच्या मशरूम्सना ओळखा 🍄

मशरूम्स खूपच रोचक असतात. चला, त्यांचा अभ्यास करण्यासाठी एक डेटासेट आयात करूया:

import pandas as pd
import matplotlib.pyplot as plt
mushrooms = pd.read_csv('../../data/mushrooms.csv')
mushrooms.head()

एक टेबल तयार होते ज्यामध्ये विश्लेषणासाठी छान डेटा आहे:

वर्ग कॅप-आकार कॅप-पृष्ठभाग कॅप-रंग जखमा वास गिल-जोडणी गिल-अंतर गिल-आकार गिल-रंग स्टॉक-आकार स्टॉक-मूळ स्टॉक-पृष्ठभाग-रिंगच्या-वर स्टॉक-पृष्ठभाग-रिंगच्या-खाली स्टॉक-रंग-रिंगच्या-वर स्टॉक-रंग-रिंगच्या-खाली पडदा-प्रकार पडदा-रंग रिंग-क्रमांक रिंग-प्रकार बीज-छपाई-रंग लोकसंख्या निवासस्थान
विषारी उंचवटा गुळगुळीत तपकिरी जखमा तीव्र मुक्त जवळचे अरुंद काळा रुंदावलेला समान गुळगुळीत गुळगुळीत पांढरा पांढरा अंशतः पांढरा एक लटकणारा काळा विखुरलेला शहरी
खाद्य उंचवटा गुळगुळीत पिवळा जखमा बदामाचा मुक्त जवळचे रुंद काळा रुंदावलेला काठीसारखा गुळगुळीत गुळगुळीत पांढरा पांढरा अंशतः पांढरा एक लटकणारा तपकिरी विपुल गवताळ
खाद्य घंटेसारखा गुळगुळीत पांढरा जखमा बडीशेप मुक्त जवळचे रुंद तपकिरी रुंदावलेला काठीसारखा गुळगुळीत गुळगुळीत पांढरा पांढरा अंशतः पांढरा एक लटकणारा तपकिरी विपुल कुरण
विषारी उंचवटा खडबडीत पांढरा जखमा तीव्र मुक्त जवळचे अरुंद तपकिरी रुंदावलेला समान गुळगुळीत गुळगुळीत पांढरा पांढरा अंशतः पांढरा एक लटकणारा काळा विखुरलेला शहरी

तुम्हाला लगेच लक्षात येईल की सर्व डेटा मजकूर स्वरूपात आहे. चार्टमध्ये वापरण्यासाठी तुम्हाला हा डेटा रूपांतरित करावा लागेल. खरं तर, बहुतेक डेटा ऑब्जेक्ट स्वरूपात दर्शविला जातो:

print(mushrooms.select_dtypes(["object"]).columns)

आउटपुट असेल:

Index(['class', 'cap-shape', 'cap-surface', 'cap-color', 'bruises', 'odor',
       'gill-attachment', 'gill-spacing', 'gill-size', 'gill-color',
       'stalk-shape', 'stalk-root', 'stalk-surface-above-ring',
       'stalk-surface-below-ring', 'stalk-color-above-ring',
       'stalk-color-below-ring', 'veil-type', 'veil-color', 'ring-number',
       'ring-type', 'spore-print-color', 'population', 'habitat'],
      dtype='object')

हा डेटा घ्या आणि 'class' कॉलमला श्रेणीमध्ये रूपांतरित करा:

cols = mushrooms.select_dtypes(["object"]).columns
mushrooms[cols] = mushrooms[cols].astype('category')
edibleclass=mushrooms.groupby(['class']).count()
edibleclass

आता, जर तुम्ही मशरूम्स डेटा प्रिंट केला, तर तुम्हाला दिसेल की तो विषारी/खाद्य वर्गानुसार श्रेणींमध्ये गटबद्ध केला गेला आहे:

कॅप-आकार कॅप-पृष्ठभाग कॅप-रंग जखमा वास गिल-जोडणी गिल-अंतर गिल-आकार गिल-रंग स्टॉक-आकार ... स्टॉक-पृष्ठभाग-रिंगच्या-खाली स्टॉक-रंग-रिंगच्या-वर स्टॉक-रंग-रिंगच्या-खाली पडदा-प्रकार पडदा-रंग रिंग-क्रमांक रिंग-प्रकार बीज-छपाई-रंग लोकसंख्या निवासस्थान
वर्ग
खाद्य 4208 4208 4208 4208 4208 4208 4208 4208 4208 4208 ... 4208 4208 4208 4208 4208 4208 4208 4208 4208 4208
विषारी 3916 3916 3916 3916 3916 3916 3916 3916 3916 3916 ... 3916 3916 3916 3916 3916 3916 3916 3916 3916 3916

जर तुम्ही या टेबलमध्ये दिलेल्या क्रमाने वर्ग श्रेणी लेबल तयार केले, तर तुम्ही पाई चार्ट तयार करू शकता:

पाई!

labels=['Edible','Poisonous']
plt.pie(edibleclass['population'],labels=labels,autopct='%.1f %%')
plt.title('Edible?')
plt.show()

आणि तयार! पाई चार्ट, जो या डेटाच्या विषारी/खाद्य वर्गांनुसार प्रमाण दाखवतो. लेबल्सचा क्रम योग्य ठेवणे खूप महत्त्वाचे आहे, त्यामुळे लेबल अॅरे तयार करताना क्रम तपासा!

pie chart

डोनट्स!

पाई चार्टपेक्षा अधिक आकर्षक दिसणारा चार्ट म्हणजे डोनट चार्ट, जो पाई चार्टमध्ये मध्यभागी एक छिद्र असतो. चला, आपल्या डेटाला या पद्धतीने पाहूया.

मशरूम्स ज्या विविध निवासस्थानांमध्ये वाढतात त्यावर एक नजर टाका:

habitat=mushrooms.groupby(['habitat']).count()
habitat

येथे, तुम्ही तुमचा डेटा निवासस्थानानुसार गटबद्ध करत आहात. 7 निवासस्थानं दिली आहेत, त्यामुळे त्यांचा वापर डोनट चार्टसाठी लेबल्स म्हणून करा:

labels=['Grasses','Leaves','Meadows','Paths','Urban','Waste','Wood']

plt.pie(habitat['class'], labels=labels,
        autopct='%1.1f%%', pctdistance=0.85)
  
center_circle = plt.Circle((0, 0), 0.40, fc='white')
fig = plt.gcf()

fig.gca().add_artist(center_circle)
  
plt.title('Mushroom Habitats')
  
plt.show()

donut chart

हे कोड एक चार्ट आणि मध्यवर्ती वर्तुळ तयार करतो, नंतर त्या चार्टमध्ये ते वर्तुळ जोडतो. मध्यवर्ती वर्तुळाची रुंदी बदलण्यासाठी 0.40 चे मूल्य बदला.

डोनट चार्ट्समध्ये लेबल्स अधिक वाचनीय करण्यासाठी विविध प्रकारे बदल करता येतात. अधिक जाणून घ्या डॉक्स मध्ये.

आता तुम्हाला तुमचा डेटा गटबद्ध करून पाई किंवा डोनट चार्टमध्ये कसा दाखवायचा हे कळले आहे, तुम्ही इतर प्रकारचे चार्ट्सही एक्सप्लोर करू शकता. वाफल चार्ट वापरून पाहा, जो प्रमाणांचे 2D चौकटीत दृश्यांकन करण्याचा वेगळा मार्ग आहे.

वाफल्स!

'वाफल' प्रकारचा चार्ट प्रमाणांचे 2D चौकटीत चौकोनांच्या स्वरूपात दृश्यांकन करण्याचा वेगळा मार्ग आहे. या डेटासेटमधील मशरूम कॅप रंगांच्या प्रमाणांचे दृश्यांकन करण्याचा प्रयत्न करा. यासाठी, तुम्हाला PyWaffle नावाची सहाय्यक लायब्ररी आणि Matplotlib वापरावी लागेल:

pip install pywaffle

तुमच्या डेटाचा एक विभाग निवडा:

capcolor=mushrooms.groupby(['cap-color']).count()
capcolor

लेबल तयार करून आणि तुमचा डेटा गटबद्ध करून वाफल चार्ट तयार करा:

import pandas as pd
import matplotlib.pyplot as plt
from pywaffle import Waffle
  
data ={'color': ['brown', 'buff', 'cinnamon', 'green', 'pink', 'purple', 'red', 'white', 'yellow'],
    'amount': capcolor['class']
     }
  
df = pd.DataFrame(data)
  
fig = plt.figure(
    FigureClass = Waffle,
    rows = 100,
    values = df.amount,
    labels = list(df.color),
    figsize = (30,30),
    colors=["brown", "tan", "maroon", "green", "pink", "purple", "red", "whitesmoke", "yellow"],
)

वाफल चार्ट वापरून, तुम्हाला या मशरूम्स डेटासेटमधील कॅप रंगांचे प्रमाण स्पष्टपणे दिसेल. आश्चर्यकारकपणे, अनेक हिरव्या कॅप असलेल्या मशरूम्स आहेत!

waffle chart

PyWaffle मध्ये Font Awesome मधील कोणतेही आयकॉन वापरून चार्ट्समध्ये आयकॉन समाविष्ट करण्याचा पर्याय आहे. चौकोनांच्या ऐवजी आयकॉन वापरून आणखी रोचक वाफल चार्ट तयार करण्यासाठी काही प्रयोग करा.

या धड्यात, तुम्ही प्रमाणांचे दृश्यांकन करण्याचे तीन मार्ग शिकलात. प्रथम, तुम्हाला तुमचा डेटा श्रेणींमध्ये गटबद्ध करावा लागतो आणि नंतर डेटा दाखवण्यासाठी कोणता सर्वोत्तम मार्ग आहे ते ठरवावे लागते - पाई, डोनट, किंवा वाफल. हे सर्वच स्वादिष्ट आहेत आणि वापरकर्त्याला डेटासेटचा झटपट आढावा देतात.

🚀 आव्हान

Charticulator मध्ये हे स्वादिष्ट चार्ट्स पुन्हा तयार करण्याचा प्रयत्न करा.

व्याख्यानानंतरची प्रश्नमंजुषा

पुनरावलोकन आणि स्व-अभ्यास

कधी कधी पाई, डोनट, किंवा वाफल चार्ट कधी वापरायचा हे स्पष्ट नसते. या विषयावर वाचण्यासाठी काही लेख:

https://www.beautiful.ai/blog/battle-of-the-charts-pie-chart-vs-donut-chart

https://medium.com/@hypsypops/pie-chart-vs-donut-chart-showdown-in-the-ring-5d24fd86a9ce

https://www.mit.edu/~mbarker/formula1/f1help/11-ch-c6.htm

https://medium.datadriveninvestor.com/data-visualization-done-the-right-way-with-tableau-waffle-chart-fdf2a19be402

या निर्णयावर अधिक माहिती मिळवण्यासाठी काही संशोधन करा.

असाइनमेंट

Excel मध्ये प्रयत्न करा


अस्वीकरण:
हा दस्तऐवज AI भाषांतर सेवा Co-op Translator वापरून भाषांतरित करण्यात आला आहे. आम्ही अचूकतेसाठी प्रयत्नशील असलो तरी, कृपया लक्षात घ्या की स्वयंचलित भाषांतरांमध्ये त्रुटी किंवा अचूकतेचा अभाव असू शकतो. मूळ भाषेतील मूळ दस्तऐवज हा अधिकृत स्रोत मानला जावा. महत्त्वाच्या माहितीसाठी, व्यावसायिक मानवी भाषांतराची शिफारस केली जाते. या भाषांतराचा वापर करून उद्भवणाऱ्या कोणत्याही गैरसमज किंवा चुकीच्या अर्थासाठी आम्ही जबाबदार राहणार नाही.