You can not select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.
Data-Science-For-Beginners/translations/mr/3-Data-Visualization/11-visualization-proportions
leestott 8029ff828a
🌐 Update translations via Co-op Translator
2 weeks ago
..
solution 🌐 Update translations via Co-op Translator 3 weeks ago
README.md 🌐 Update translations via Co-op Translator 2 weeks ago
assignment.md 🌐 Update translations via Co-op Translator 3 weeks ago
notebook.ipynb 🌐 Update translations via Co-op Translator 3 weeks ago

README.md

प्रमाणांचे दृश्यांकन

 Sketchnote by (@sketchthedocs)
प्रमाणांचे दृश्यांकन - Sketchnote by @nitya

या धड्यात, तुम्ही निसर्गावर आधारित वेगळ्या डेटासेटचा वापर करून प्रमाणांचे दृश्यांकन कराल, जसे की मशरूमबद्दलच्या डेटासेटमध्ये किती प्रकारचे कवक आहेत. चला या आकर्षक कवकांचा अभ्यास करूया, ज्यासाठी Audubon कडून मिळवलेल्या डेटासेटमध्ये Agaricus आणि Lepiota कुटुंबातील 23 प्रकारच्या गिल्ड मशरूम्सची माहिती आहे. तुम्ही खालील स्वादिष्ट दृश्यांकन प्रकारांचा प्रयोग कराल:

  • पाई चार्ट 🥧
  • डोनट चार्ट 🍩
  • वाफल चार्ट 🧇

💡 Charticulator नावाचा एक अतिशय मनोरंजक प्रकल्प Microsoft Research कडून उपलब्ध आहे, जो डेटा दृश्यांकनासाठी फ्री ड्रॅग आणि ड्रॉप इंटरफेस प्रदान करतो. त्यांच्या एका ट्युटोरियलमध्ये त्यांनी मशरूम डेटासेटचा वापर केला आहे! त्यामुळे तुम्ही डेटा एक्सप्लोर करू शकता आणि त्याच वेळी लायब्ररी शिकू शकता: Charticulator tutorial.

पूर्व-व्याख्यान प्रश्नमंजुषा

तुमच्या मशरूम्सची ओळख 🍄

मशरूम्स खूपच मनोरंजक आहेत. चला त्यांचा अभ्यास करण्यासाठी एक डेटासेट आयात करूया:

import pandas as pd
import matplotlib.pyplot as plt
mushrooms = pd.read_csv('../../data/mushrooms.csv')
mushrooms.head()

एक टेबल प्रिंट केले जाते ज्यामध्ये विश्लेषणासाठी उत्कृष्ट डेटा आहे:

वर्ग टोपीचा आकार टोपीचा पृष्ठभाग टोपीचा रंग जखम गंध गिल जोडणी गिल अंतर गिल आकार गिल रंग खांबाचा आकार खांब मुळ खांब पृष्ठभाग रिंगच्या वर खांब पृष्ठभाग रिंगच्या खाली खांबाचा रंग रिंगच्या वर खांबाचा रंग रिंगच्या खाली पडदा प्रकार पडदा रंग रिंग संख्या रिंग प्रकार बीज प्रिंट रंग लोकसंख्या निवासस्थान
विषारी उभट गुळगुळीत तपकिरी जखम तीव्र मुक्त जवळ अरुंद काळा मोठा समान गुळगुळीत गुळगुळीत पांढरा पांढरा अंशतः पांढरा एक लटकणारा काळा विखुरलेला शहरी
खाद्य उभट गुळगुळीत पिवळा जखम बदाम मुक्त जवळ रुंद काळा मोठा क्लब गुळगुळीत गुळगुळीत पांढरा पांढरा अंशतः पांढरा एक लटकणारा तपकिरी भरपूर गवताळ
खाद्य घंटा गुळगुळीत पांढरा जखम अॅनिस मुक्त जवळ रुंद तपकिरी मोठा क्लब गुळगुळीत गुळगुळीत पांढरा पांढरा अंशतः पांढरा एक लटकणारा तपकिरी भरपूर कुरणे
विषारी उभट खडबडीत पांढरा जखम तीव्र मुक्त जवळ अरुंद तपकिरी मोठा समान गुळगुळीत गुळगुळीत पांढरा पांढरा अंशतः पांढरा एक लटकणारा काळा विखुरलेला शहरी

तुम्हाला लगेच लक्षात येते की सर्व डेटा मजकूर स्वरूपात आहे. तुम्हाला हा डेटा चार्टमध्ये वापरण्यासाठी रूपांतरित करावा लागेल. प्रत्यक्षात, बहुतेक डेटा ऑब्जेक्ट स्वरूपात दर्शविला जातो:

print(mushrooms.select_dtypes(["object"]).columns)

आउटपुट आहे:

Index(['class', 'cap-shape', 'cap-surface', 'cap-color', 'bruises', 'odor',
       'gill-attachment', 'gill-spacing', 'gill-size', 'gill-color',
       'stalk-shape', 'stalk-root', 'stalk-surface-above-ring',
       'stalk-surface-below-ring', 'stalk-color-above-ring',
       'stalk-color-below-ring', 'veil-type', 'veil-color', 'ring-number',
       'ring-type', 'spore-print-color', 'population', 'habitat'],
      dtype='object')

हा डेटा घ्या आणि 'class' कॉलमला श्रेणीमध्ये रूपांतरित करा:

cols = mushrooms.select_dtypes(["object"]).columns
mushrooms[cols] = mushrooms[cols].astype('category')
edibleclass=mushrooms.groupby(['class']).count()
edibleclass

आता, जर तुम्ही मशरूम्स डेटा प्रिंट केला, तर तुम्हाला दिसेल की तो विषारी/खाद्य वर्गानुसार श्रेणींमध्ये गटबद्ध केला गेला आहे:

टोपीचा आकार टोपीचा पृष्ठभाग टोपीचा रंग जखम गंध गिल जोडणी गिल अंतर गिल आकार गिल रंग खांबाचा आकार ... खांब पृष्ठभाग रिंगच्या खाली खांबाचा रंग रिंगच्या वर खांबाचा रंग रिंगच्या खाली पडदा प्रकार पडदा रंग रिंग संख्या रिंग प्रकार बीज प्रिंट रंग लोकसंख्या निवासस्थान
वर्ग
खाद्य 4208 4208 4208 4208 4208 4208 4208 4208 4208 4208 ... 4208 4208 4208 4208 4208 4208 4208 4208 4208 4208
विषारी 3916 3916 3916 3916 3916 3916 3916 3916 3916 3916 ... 3916 3916 3916 3916 3916 3916 3916 3916 3916 3916

जर तुम्ही या टेबलमध्ये दिलेल्या क्रमाने वर्ग श्रेणी लेबल तयार केले, तर तुम्ही पाई चार्ट तयार करू शकता:

पाई!

labels=['Edible','Poisonous']
plt.pie(edibleclass['population'],labels=labels,autopct='%.1f %%')
plt.title('Edible?')
plt.show()

पाई चार्ट तयार झाला आहे, जो या मशरूम्स डेटाच्या दोन वर्गांनुसार प्रमाण दाखवतो. लेबल्सचा क्रम योग्य असणे खूप महत्त्वाचे आहे, विशेषतः येथे, त्यामुळे लेबल अ‍ॅरे तयार करताना क्रम सत्यापित करा!

पाई चार्ट

डोनट्स!

पाई चार्टपेक्षा थोडा अधिक आकर्षक चार्ट म्हणजे डोनट चार्ट, जो पाई चार्टमध्ये मध्यभागी एक छिद्र असतो. चला आपल्या डेटाचा अभ्यास या पद्धतीने करूया.

मशरूम्स ज्या विविध निवासस्थानांमध्ये वाढतात त्यावर एक नजर टाका:

habitat=mushrooms.groupby(['habitat']).count()
habitat

येथे, तुम्ही तुमचा डेटा निवासस्थानानुसार गटबद्ध करत आहात. 7 निवासस्थान दिले आहेत, त्यामुळे तुमच्या डोनट चार्टसाठी त्यांचा लेबल्स म्हणून वापर करा:

labels=['Grasses','Leaves','Meadows','Paths','Urban','Waste','Wood']

plt.pie(habitat['class'], labels=labels,
        autopct='%1.1f%%', pctdistance=0.85)
  
center_circle = plt.Circle((0, 0), 0.40, fc='white')
fig = plt.gcf()

fig.gca().add_artist(center_circle)
  
plt.title('Mushroom Habitats')
  
plt.show()

डोनट चार्ट

हा कोड एक चार्ट आणि मध्यवर्ती वर्तुळ काढतो, नंतर त्या चार्टमध्ये मध्यवर्ती वर्तुळ जोडतो. 0.40 बदलून दुसरी किंमत देऊन मध्यवर्ती वर्तुळाची रुंदी संपादित करा.

डोनट चार्ट्स विविध प्रकारे बदलले जाऊ शकतात, विशेषतः लेबल्स वाचनीयतेसाठी हायलाइट करता येतात. अधिक जाणून घ्या डॉक्स मध्ये.

आता तुम्हाला तुमचा डेटा गटबद्ध करून पाई किंवा डोनट स्वरूपात कसा दाखवायचा हे माहित आहे, तुम्ही इतर प्रकारचे चार्ट एक्सप्लोर करू शकता. वाफल चार्ट वापरून पहा, जो प्रमाण एक्सप्लोर करण्याचा वेगळा मार्ग आहे.

वाफल्स!

'वाफल' प्रकारचा चार्ट प्रमाणांचे 2D चौकोनांच्या स्वरूपात दृश्यांकन करण्याचा वेगळा मार्ग आहे. या डेटासेटमधील मशरूम टोपीच्या रंगांच्या प्रमाणांचे दृश्यांकन करण्याचा प्रयत्न करा. हे करण्यासाठी, तुम्हाला PyWaffle नावाची एक सहाय्यक लायब्ररी आणि Matplotlib वापरण्याची आवश्यकता आहे:

pip install pywaffle

तुमच्या डेटाचा एक विभाग निवडा आणि गटबद्ध करा:

capcolor=mushrooms.groupby(['cap-color']).count()
capcolor

लेबल्स तयार करून आणि तुमचा डेटा गटबद्ध करून वाफल चार्ट तयार करा:

import pandas as pd
import matplotlib.pyplot as plt
from pywaffle import Waffle
  
data ={'color': ['brown', 'buff', 'cinnamon', 'green', 'pink', 'purple', 'red', 'white', 'yellow'],
    'amount': capcolor['class']
     }
  
df = pd.DataFrame(data)
  
fig = plt.figure(
    FigureClass = Waffle,
    rows = 100,
    values = df.amount,
    labels = list(df.color),
    figsize = (30,30),
    colors=["brown", "tan", "maroon", "green", "pink", "purple", "red", "whitesmoke", "yellow"],
)

वाफल चार्ट वापरून, तुम्ही मशरूम्स डेटासेटमधील टोपीच्या रंगांचे प्रमाण स्पष्टपणे पाहू शकता. आश्चर्यकारकपणे, अनेक हिरव्या टोपीचे मशरूम्स आहेत!

वाफल चार्ट

PyWaffle Font Awesome मध्ये उपलब्ध असलेल्या कोणत्याही आयकॉनचा वापर करून चार्टमध्ये आयकॉन समाविष्ट करण्यास समर्थन देते. चौकोनांऐवजी आयकॉन वापरून अधिक आकर्षक वाफल चार्ट तयार करण्यासाठी काही प्रयोग करा.

या धड्यात, तुम्ही प्रमाणांचे दृश्यांकन करण्याचे तीन मार्ग शिकले. प्रथम, तुम्हाला तुमचा डेटा श्रेणींमध्ये गटबद्ध करावा लागतो आणि नंतर डेटा कसा प्रदर्शित करायचा ते ठरवावे लागते - पाई, डोनट किंवा वाफल. सर्व प्रकार स्वादिष्ट आहेत आणि वापरकर्त्याला डेटासेटचा त्वरित स्नॅपशॉट देतात.

🚀 आव्हान

Charticulator मध्ये हे स्वादिष्ट चार्ट पुन्हा तयार करण्याचा प्रयत्न करा.

व्याख्यानानंतरची प्रश्नमंजुषा

पुनरावलोकन आणि स्व-अभ्यास

कधी पाई, डोनट किंवा वाफल चार्ट वापरायचा हे स्पष्ट नसते. या विषयावर काही लेख वाचा:

https://www.beautiful.ai/blog/battle-of-the-charts-pie-chart-vs-donut-chart

https://medium.com/@hypsypops/pie-chart-vs-donut-chart-showdown-in-the-ring-5d24fd86a9ce

https://www.mit.edu/~mbarker/formula1/f1help/11-ch-c6.htm

https://medium.datadriveninvestor.com/data-visualization-done-the-right-way-with-tableau-waffle-chart-fdf2a19be402

अधिक माहिती मिळवण्यासाठी संशोधन करा आणि या निर्णयावर अधिक विचार करा.

असाइनमेंट

Excel मध्ये प्रयत्न करा


अस्वीकरण:
हा दस्तऐवज AI भाषांतर सेवा Co-op Translator चा वापर करून भाषांतरित करण्यात आला आहे. आम्ही अचूकतेसाठी प्रयत्नशील असलो तरी कृपया लक्षात ठेवा की स्वयंचलित भाषांतरे त्रुटी किंवा अचूकतेच्या अभावाने युक्त असू शकतात. मूळ भाषेतील दस्तऐवज हा अधिकृत स्रोत मानला जावा. महत्त्वाच्या माहितीसाठी व्यावसायिक मानवी भाषांतराची शिफारस केली जाते. या भाषांतराचा वापर करून निर्माण होणाऱ्या कोणत्याही गैरसमज किंवा चुकीच्या अर्थासाठी आम्ही जबाबदार राहणार नाही.