|
3 weeks ago | |
---|---|---|
.. | ||
README.md | 3 weeks ago |
README.md
प्रमाणांचे दृश्यांकन
![]() |
---|
प्रमाणांचे दृश्यांकन - Sketchnote by @nitya |
या धड्यात, तुम्ही निसर्गावर आधारित वेगळ्या डेटासेटचा वापर करून प्रमाणांचे दृश्यांकन कराल, जसे की मशरूमबद्दलच्या डेटासेटमध्ये किती प्रकारचे कवक आहेत. चला, या आकर्षक कवकांचा अभ्यास करूया, ज्यासाठी Audubon कडून मिळवलेल्या डेटासेटमध्ये Agaricus आणि Lepiota कुटुंबातील 23 प्रकारच्या गिल्ड मशरूम्सची माहिती आहे. तुम्ही खालील प्रकारच्या स्वादिष्ट दृश्यांकनांचा प्रयोग कराल:
- पाई चार्ट 🥧
- डोनट चार्ट 🍩
- वाफल चार्ट 🧇
💡 Charticulator नावाचा एक अतिशय रोचक प्रकल्प Microsoft Research कडून उपलब्ध आहे, जो डेटा दृश्यांकनासाठी फ्री ड्रॅग आणि ड्रॉप इंटरफेस प्रदान करतो. त्यांच्या एका ट्युटोरियलमध्ये त्यांनी मशरूम डेटासेटचा वापर केला आहे! त्यामुळे तुम्ही डेटा एक्सप्लोर करू शकता आणि लायब्ररी शिकू शकता: Charticulator ट्युटोरियल.
पूर्व-व्याख्यान प्रश्नमंजुषा
तुमच्या मशरूम्सची ओळख 🍄
मशरूम्स खूपच रोचक असतात. चला, त्यांचा अभ्यास करण्यासाठी एक डेटासेट आयात करूया:
mushrooms = read.csv('../../data/mushrooms.csv')
head(mushrooms)
एक टेबल प्रिंट केले जाते ज्यामध्ये विश्लेषणासाठी उत्कृष्ट डेटा आहे:
वर्ग | टोपीचा आकार | टोपीचा पृष्ठभाग | टोपीचा रंग | जखम | गंध | गिल जोडणी | गिल अंतर | गिल आकार | गिल रंग | खांबाचा आकार | खांबाची मुळे | खांबाचा पृष्ठभाग वरील रिंग | खांबाचा पृष्ठभाग खालील रिंग | खांबाचा रंग वरील रिंग | खांबाचा रंग खालील रिंग | पडदा प्रकार | पडदा रंग | रिंग संख्या | रिंग प्रकार | बीज-छाप रंग | लोकसंख्या | निवासस्थान |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
विषारी | उभट | गुळगुळीत | तपकिरी | जखम | तीव्र | मुक्त | जवळ | अरुंद | काळा | मोठा | समान | गुळगुळीत | गुळगुळीत | पांढरा | पांढरा | अंशतः | पांढरा | एक | लटकणारा | काळा | विखुरलेला | शहरी |
खाद्य | उभट | गुळगुळीत | पिवळा | जखम | बदाम | मुक्त | जवळ | रुंद | काळा | मोठा | क्लब | गुळगुळीत | गुळगुळीत | पांढरा | पांढरा | अंशतः | पांढरा | एक | लटकणारा | तपकिरी | भरपूर | गवत |
खाद्य | घंटा | गुळगुळीत | पांढरा | जखम | अॅनिस | मुक्त | जवळ | रुंद | तपकिरी | मोठा | क्लब | गुळगुळीत | गुळगुळीत | पांढरा | पांढरा | अंशतः | पांढरा | एक | लटकणारा | तपकिरी | भरपूर | कुरणे |
विषारी | उभट | खडबडीत | पांढरा | जखम | तीव्र | मुक्त | जवळ | अरुंद | तपकिरी | मोठा | समान | गुळगुळीत | गुळगुळीत | पांढरा | पांढरा | अंशतः | पांढरा | एक | लटकणारा | काळा | विखुरलेला | शहरी |
खाद्य | उभट | गुळगुळीत | हिरवा | जखम नाही | काही नाही | मुक्त | गर्दी | रुंद | काळा | टोकदार | समान | गुळगुळीत | गुळगुळीत | पांढरा | पांढरा | अंशतः | पांढरा | एक | लोपणारा | तपकिरी | भरपूर | गवत |
खाद्य | उभट | खडबडीत | पिवळा | जखम | बदाम | मुक्त | जवळ | रुंद | तपकिरी | मोठा | क्लब | गुळगुळीत | गुळगुळीत | पांढरा | पांढरा | अंशतः | पांढरा | एक | लटकणारा | काळा | भरपूर | गवत |
तुम्हाला लगेच लक्षात येते की सर्व डेटा मजकूर स्वरूपात आहे. तुम्हाला हा डेटा चार्टमध्ये वापरण्यासाठी रूपांतरित करावा लागेल. प्रत्यक्षात, बहुतेक डेटा ऑब्जेक्ट स्वरूपात दर्शविला जातो:
names(mushrooms)
आउटपुट आहे:
[1] "class" "cap.shape"
[3] "cap.surface" "cap.color"
[5] "bruises" "odor"
[7] "gill.attachment" "gill.spacing"
[9] "gill.size" "gill.color"
[11] "stalk.shape" "stalk.root"
[13] "stalk.surface.above.ring" "stalk.surface.below.ring"
[15] "stalk.color.above.ring" "stalk.color.below.ring"
[17] "veil.type" "veil.color"
[19] "ring.number" "ring.type"
[21] "spore.print.color" "population"
[23] "habitat"
हा डेटा घ्या आणि 'class' कॉलमला श्रेणीमध्ये रूपांतरित करा:
library(dplyr)
grouped=mushrooms %>%
group_by(class) %>%
summarise(count=n())
आता, जर तुम्ही मशरूम्स डेटा प्रिंट केला, तर तुम्हाला दिसेल की तो विषारी/खाद्य वर्गानुसार श्रेणींमध्ये गटबद्ध केला गेला आहे:
View(grouped)
वर्ग | संख्या |
---|---|
खाद्य | 4208 |
विषारी | 3916 |
जर तुम्ही या टेबलमध्ये दिलेल्या क्रमाने वर्ग श्रेणी लेबल तयार केले, तर तुम्ही पाई चार्ट तयार करू शकता.
पाई!
pie(grouped$count,grouped$class, main="Edible?")
पाई चार्ट तयार झाला आहे, जो या दोन मशरूम्स वर्गांनुसार डेटाचे प्रमाण दर्शवतो. लेबल्सचा क्रम योग्य असणे खूप महत्त्वाचे आहे, विशेषतः येथे, त्यामुळे लेबल अॅरे तयार करताना क्रम सत्यापित करा!
डोनट्स!
पाई चार्टपेक्षा थोडा अधिक आकर्षक चार्ट म्हणजे डोनट चार्ट, जो पाई चार्टमध्ये मध्यभागी एक छिद्र असतो. चला, आपल्या डेटाचा अभ्यास या पद्धतीने करूया.
मशरूम्स ज्या विविध निवासस्थानांमध्ये वाढतात त्यावर एक नजर टाका:
library(dplyr)
habitat=mushrooms %>%
group_by(habitat) %>%
summarise(count=n())
View(habitat)
आउटपुट आहे:
निवासस्थान | संख्या |
---|---|
गवत | 2148 |
पाने | 832 |
कुरणे | 292 |
पायवाटा | 1144 |
शहरी | 368 |
कचरा | 192 |
लाकूड | 3148 |
येथे, तुम्ही तुमचा डेटा निवासस्थानानुसार गटबद्ध करत आहात. 7 निवासस्थान दिले आहेत, त्यामुळे डोनट चार्टसाठी त्यांचा लेबल्स म्हणून वापर करा:
library(ggplot2)
library(webr)
PieDonut(habitat, aes(habitat, count=count))
या कोडमध्ये दोन लायब्ररी वापरल्या जातात - ggplot2 आणि webr. webr लायब्ररीच्या PieDonut फंक्शनचा वापर करून आपण सहजपणे डोनट चार्ट तयार करू शकतो!
R मध्ये डोनट चार्ट फक्त ggplot2 लायब्ररी वापरून देखील तयार करता येतो. याबद्दल अधिक जाणून घ्या येथे आणि स्वतः प्रयत्न करा.
आता तुम्हाला तुमचा डेटा गटबद्ध करणे आणि नंतर पाई किंवा डोनट म्हणून प्रदर्शित करणे कसे करायचे हे माहित आहे, तुम्ही इतर प्रकारचे चार्ट एक्सप्लोर करू शकता. वाफल चार्ट वापरून पहा, जो प्रमाण एक्सप्लोर करण्याचा वेगळा मार्ग आहे.
वाफल्स!
'वाफल' प्रकारचा चार्ट प्रमाणांचे 2D अॅरे स्वरूपात चौकोन म्हणून दृश्यांकन करण्याचा वेगळा मार्ग आहे. या डेटासेटमधील मशरूम टोपीच्या रंगांच्या विविध प्रमाणांचे दृश्यांकन करण्याचा प्रयत्न करा. हे करण्यासाठी, तुम्हाला waffle नावाची एक सहाय्यक लायब्ररी स्थापित करावी लागेल आणि तिचा वापर करून तुमचे दृश्यांकन तयार करावे लागेल:
install.packages("waffle", repos = "https://cinc.rud.is")
तुमचा डेटा गटबद्ध करण्यासाठी एक विभाग निवडा:
library(dplyr)
cap_color=mushrooms %>%
group_by(cap.color) %>%
summarise(count=n())
View(cap_color)
लेबल तयार करून आणि तुमचा डेटा गटबद्ध करून वाफल चार्ट तयार करा:
library(waffle)
names(cap_color$count) = paste0(cap_color$cap.color)
waffle((cap_color$count/10), rows = 7, title = "Waffle Chart")+scale_fill_manual(values=c("brown", "#F0DC82", "#D2691E", "green",
"pink", "purple", "red", "grey",
"yellow","white"))
वाफल चार्ट वापरून, तुम्ही मशरूम्स डेटासेटमधील टोपीच्या रंगांचे प्रमाण स्पष्टपणे पाहू शकता. आश्चर्यकारकपणे, अनेक हिरव्या टोपी असलेल्या मशरूम्स आहेत!
या धड्यात, तुम्ही प्रमाणांचे दृश्यांकन करण्याचे तीन मार्ग शिकले. प्रथम, तुम्हाला तुमचा डेटा श्रेणींमध्ये गटबद्ध करावा लागतो आणि नंतर डेटा प्रदर्शित करण्याचा सर्वोत्तम मार्ग ठरवावा लागतो - पाई, डोनट, किंवा वाफल. सर्व प्रकार स्वादिष्ट आहेत आणि वापरकर्त्याला डेटासेटचा त्वरित स्नॅपशॉट देतात.
🚀 आव्हान
Charticulator मध्ये हे स्वादिष्ट चार्ट पुन्हा तयार करण्याचा प्रयत्न करा.
व्याख्यानानंतरची प्रश्नमंजुषा
पुनरावलोकन आणि स्व-अभ्यास
कधी पाई, डोनट, किंवा वाफल चार्ट वापरायचा हे स्पष्ट नसते. या विषयावर वाचण्यासाठी काही लेख येथे दिले आहेत:
https://www.beautiful.ai/blog/battle-of-the-charts-pie-chart-vs-donut-chart
https://medium.com/@hypsypops/pie-chart-vs-donut-chart-showdown-in-the-ring-5d24fd86a9ce
https://www.mit.edu/~mbarker/formula1/f1help/11-ch-c6.htm
या निर्णयाबद्दल अधिक माहिती मिळवण्यासाठी संशोधन करा.
असाइनमेंट
अस्वीकरण:
हा दस्तऐवज AI भाषांतर सेवा Co-op Translator चा वापर करून भाषांतरित करण्यात आला आहे. आम्ही अचूकतेसाठी प्रयत्नशील असलो तरी कृपया लक्षात ठेवा की स्वयंचलित भाषांतरे त्रुटी किंवा अचूकतेच्या अभावाने युक्त असू शकतात. मूळ भाषेतील दस्तऐवज हा अधिकृत स्रोत मानला जावा. महत्त्वाच्या माहितीसाठी व्यावसायिक मानवी भाषांतराची शिफारस केली जाते. या भाषांतराचा वापर करून उद्भवलेल्या कोणत्याही गैरसमज किंवा चुकीच्या अर्थासाठी आम्ही जबाबदार राहणार नाही.