19 KiB
अनुपातहरू देखाउने
![]() |
---|
अनुपातहरू देखाउने - Sketchnote by @nitya |
यस पाठमा, तपाईंले प्रकृतिमा आधारित अर्को डेटासेट प्रयोग गरेर अनुपातहरू देखाउनुहुनेछ, जस्तै च्याउको डेटासेटमा विभिन्न प्रकारका फङ्गीहरूको संख्या। आउनुहोस्, यी रोचक फङ्गीहरूको अध्ययन गरौं, जुन Audubon बाट लिइएको डेटासेट हो, जसमा Agaricus र Lepiota परिवारका २३ प्रजातिका गिल्ड च्याउहरूको विवरण छ। तपाईंले निम्न प्रकारका स्वादिष्ट चार्टहरू प्रयोग गरेर प्रयोग गर्नुहुनेछ:
- पाई चार्ट 🥧
- डोनट चार्ट 🍩
- वाफल चार्ट 🧇
💡 माइक्रोसफ्ट रिसर्चद्वारा बनाइएको Charticulator नामक एक रोचक परियोजनाले डेटा भिजुअलाइजेसनका लागि निःशुल्क ड्र्याग र ड्रप इन्टरफेस प्रदान गर्दछ। उनीहरूको एउटा ट्युटोरियलमा पनि यो च्याउ डेटासेट प्रयोग गरिएको छ! त्यसैले तपाईं डेटा अन्वेषण गर्न र पुस्तकालय सिक्न सक्नुहुन्छ: Charticulator ट्युटोरियल।
पाठ अघि क्विज
च्याउको बारेमा जान्नुहोस् 🍄
च्याउहरू धेरै रोचक हुन्छन्। आउनुहोस्, एउटा डेटासेट आयात गरौं र अध्ययन गरौं:
import pandas as pd
import matplotlib.pyplot as plt
mushrooms = pd.read_csv('../../data/mushrooms.csv')
mushrooms.head()
एक तालिका प्रिन्ट हुन्छ, जसमा विश्लेषणका लागि राम्रो डेटा हुन्छ:
वर्ग | टोपीको आकार | टोपीको सतह | टोपीको रंग | चोट | गन्ध | गिलको जडान | गिलको दूरी | गिलको आकार | गिलको रंग | डाँठको आकार | डाँठको जरा | डाँठको सतह (रिंगमाथि) | डाँठको सतह (रिंगमुनि) | डाँठको रंग (रिंगमाथि) | डाँठको रंग (रिंगमुनि) | आवरण प्रकार | आवरण रंग | रिंग संख्या | रिंग प्रकार | स्पोर प्रिन्ट रंग | जनसंख्या | आवास |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
विषाक्त | उभिएको | चिल्लो | खैरो | चोट | तीखो | स्वतन्त्र | नजिक | साँघुरो | कालो | बढ्दो | समान | चिल्लो | चिल्लो | सेतो | सेतो | आंशिक | सेतो | एक | झुन्डिएको | कालो | छरिएको | शहरी |
खानेयोग्य | उभिएको | चिल्लो | पहेंलो | चोट | बदाम | स्वतन्त्र | नजिक | चौडा | कालो | बढ्दो | क्लब | चिल्लो | चिल्लो | सेतो | सेतो | आंशिक | सेतो | एक | झुन्डिएको | खैरो | धेरै | घाँस |
खानेयोग्य | घण्टी | चिल्लो | सेतो | चोट | सौंफ | स्वतन्त्र | नजिक | चौडा | खैरो | बढ्दो | क्लब | चिल्लो | चिल्लो | सेतो | सेतो | आंशिक | सेतो | एक | झुन्डिएको | खैरो | धेरै | मैदान |
विषाक्त | उभिएको | खस्रो | सेतो | चोट | तीखो | स्वतन्त्र | नजिक | साँघुरो | खैरो | बढ्दो | समान | चिल्लो | चिल्लो | सेतो | सेतो | आंशिक | सेतो | एक | झुन्डिएको | कालो | छरिएको | शहरी |
तुरुन्तै, तपाईंले देख्नुहुन्छ कि सबै डेटा पाठ्यात्मक छ। तपाईंले यसलाई चार्टमा प्रयोग गर्नका लागि रूपान्तरण गर्नुपर्नेछ। वास्तवमा, अधिकांश डेटा वस्तुका रूपमा प्रस्तुत गरिएको छ:
print(mushrooms.select_dtypes(["object"]).columns)
आउटपुट:
Index(['class', 'cap-shape', 'cap-surface', 'cap-color', 'bruises', 'odor',
'gill-attachment', 'gill-spacing', 'gill-size', 'gill-color',
'stalk-shape', 'stalk-root', 'stalk-surface-above-ring',
'stalk-surface-below-ring', 'stalk-color-above-ring',
'stalk-color-below-ring', 'veil-type', 'veil-color', 'ring-number',
'ring-type', 'spore-print-color', 'population', 'habitat'],
dtype='object')
'वर्ग' स्तम्भलाई श्रेणीमा रूपान्तरण गर्नुहोस्:
cols = mushrooms.select_dtypes(["object"]).columns
mushrooms[cols] = mushrooms[cols].astype('category')
edibleclass=mushrooms.groupby(['class']).count()
edibleclass
अब, यदि तपाईं च्याउको डेटा प्रिन्ट गर्नुहुन्छ भने, तपाईंले देख्नुहुनेछ कि यो विषाक्त/खानेयोग्य वर्ग अनुसार श्रेणीमा समूह गरिएको छ:
टोपीको आकार | टोपीको सतह | टोपीको रंग | चोट | गन्ध | गिलको जडान | गिलको दूरी | गिलको आकार | गिलको रंग | डाँठको आकार | ... | डाँठको सतह (रिंगमुनि) | डाँठको रंग (रिंगमाथि) | डाँठको रंग (रिंगमुनि) | आवरण प्रकार | आवरण रंग | रिंग संख्या | रिंग प्रकार | स्पोर प्रिन्ट रंग | जनसंख्या | आवास | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
वर्ग | |||||||||||||||||||||
खानेयोग्य | 4208 | 4208 | 4208 | 4208 | 4208 | 4208 | 4208 | 4208 | 4208 | 4208 | ... | 4208 | 4208 | 4208 | 4208 | 4208 | 4208 | 4208 | 4208 | 4208 | 4208 |
विषाक्त | 3916 | 3916 | 3916 | 3916 | 3916 | 3916 | 3916 | 3916 | 3916 | 3916 | ... | 3916 | 3916 | 3916 | 3916 | 3916 | 3916 | 3916 | 3916 | 3916 | 3916 |
यदि तपाईंले यस तालिकामा प्रस्तुत गरिएको क्रमलाई पालना गरेर वर्ग श्रेणीका लेबलहरू बनाउनुहुन्छ भने, तपाईं पाई चार्ट बनाउन सक्नुहुन्छ:
पाई!
labels=['Edible','Poisonous']
plt.pie(edibleclass['population'],labels=labels,autopct='%.1f %%')
plt.title('Edible?')
plt.show()
हेर्नुहोस्, पाई चार्टले च्याउको दुई वर्ग अनुसार अनुपात देखाउँछ। यहाँ लेबलहरूको क्रम सही राख्नु महत्त्वपूर्ण छ, त्यसैले लेबल एरे बनाउँदा क्रम जाँच गर्न निश्चित गर्नुहोस्!
डोनट!
पाई चार्टको तुलनामा अलि बढी आकर्षक चार्ट डोनट चार्ट हो, जसमा बीचमा प्वाल हुन्छ। आउनुहोस्, हाम्रो डेटा यस विधिबाट हेर्नुहोस्।
च्याउहरू विभिन्न आवासमा बढ्छन्। ती आवासहरूको समूह बनाउनुहोस्:
habitat=mushrooms.groupby(['habitat']).count()
habitat
यहाँ, तपाईंले डेटा आवास अनुसार समूह गर्दै हुनुहुन्छ। ७ वटा सूचीबद्ध छन्, त्यसैले तीलाई डोनट चार्टका लागि लेबलको रूपमा प्रयोग गर्नुहोस्:
labels=['Grasses','Leaves','Meadows','Paths','Urban','Waste','Wood']
plt.pie(habitat['class'], labels=labels,
autopct='%1.1f%%', pctdistance=0.85)
center_circle = plt.Circle((0, 0), 0.40, fc='white')
fig = plt.gcf()
fig.gca().add_artist(center_circle)
plt.title('Mushroom Habitats')
plt.show()
यस कोडले चार्ट र बीचको वृत्त बनाउँछ, त्यसपछि चार्टमा त्यो वृत्त थप्छ। बीचको वृत्तको चौडाइ परिवर्तन गर्न 0.40
लाई अर्को मानमा परिवर्तन गर्नुहोस्।
डोनट चार्टलाई विभिन्न तरिकाले परिमार्जन गर्न सकिन्छ। विशेष गरी लेबललाई पढ्न सजिलो बनाउन हाइलाइट गर्न सकिन्छ। थप जानकारीका लागि डक्स हेर्नुहोस्।
अब तपाईंले आफ्नो डेटा समूह गर्न र त्यसलाई पाई वा डोनटको रूपमा देखाउन सिक्नुभयो। अब वाफल चार्ट प्रयास गर्नुहोस्, जुन मात्रालाई अन्वेषण गर्ने अर्को तरिका हो।
वाफल!
'वाफल' प्रकारको चार्ट मात्रालाई २D वर्गहरूको एरेको रूपमा देखाउने तरिका हो। यस डेटासेटमा च्याउको टोपीको रंगको मात्रालाई देखाउन प्रयास गर्नुहोस्। यसका लागि, तपाईंले PyWaffle नामक सहायक पुस्तकालय स्थापना गर्नुपर्नेछ र Matplotlib प्रयोग गर्नुपर्नेछ:
pip install pywaffle
डेटाको एउटा खण्ड चयन गर्नुहोस्:
capcolor=mushrooms.groupby(['cap-color']).count()
capcolor
लेबलहरू बनाउँदै र त्यसपछि डेटा समूह गर्दै वाफल चार्ट बनाउनुहोस्:
import pandas as pd
import matplotlib.pyplot as plt
from pywaffle import Waffle
data ={'color': ['brown', 'buff', 'cinnamon', 'green', 'pink', 'purple', 'red', 'white', 'yellow'],
'amount': capcolor['class']
}
df = pd.DataFrame(data)
fig = plt.figure(
FigureClass = Waffle,
rows = 100,
values = df.amount,
labels = list(df.color),
figsize = (30,30),
colors=["brown", "tan", "maroon", "green", "pink", "purple", "red", "whitesmoke", "yellow"],
)
वाफल चार्ट प्रयोग गरेर, तपाईंले च्याउको टोपीको रंगको अनुपात स्पष्ट रूपमा देख्न सक्नुहुन्छ। रोचक कुरा, धेरै हरियो टोपी भएका च्याउहरू छन्!
✅ PyWaffle ले चार्टमा Font Awesome मा उपलब्ध कुनै पनि आइकन प्रयोग गर्न समर्थन गर्दछ। वर्गहरूको सट्टा आइकन प्रयोग गरेर अझ रोचक वाफल चार्ट बनाउनका लागि केही प्रयोग गर्नुहोस्।
यस पाठमा, तपाईंले अनुपात देखाउने तीन तरिका सिक्नुभयो। पहिलो, तपाईंले आफ्नो डेटा श्रेणीमा समूह गर्नुपर्नेछ र त्यसपछि डेटा देखाउने उत्तम तरिका निर्णय गर्नुपर्नेछ - पाई, डोनट, वा वाफल। सबै स्वादिष्ट छन् र प्रयोगकर्तालाई डेटासेटको झलक तुरुन्तै दिन्छन्।
🚀 चुनौती
यी स्वादिष्ट चार्टहरू Charticulator मा पुनः बनाउने प्रयास गर्नुहोस्।
पाठ पछि क्विज
समीक्षा र आत्म अध्ययन
कहिलेकाहीं पाई, डोनट, वा वाफल चार्ट कहिले प्रयोग गर्ने स्पष्ट हुँदैन। यस विषयमा पढ्नका लागि केही लेखहरू यहाँ छन्:
https://www.beautiful.ai/blog/battle-of-the-charts-pie-chart-vs-donut-chart
https://medium.com/@hypsypops/pie-chart-vs-donut-chart-showdown-in-the-ring-5d24fd86a9ce
https://www.mit.edu/~mbarker/formula1/f1help/11-ch-c6.htm
थप जानकारीका लागि अनुसन्धान गर्नुहोस्।
असाइनमेन्ट
अस्वीकरण:
यो दस्तावेज़ AI अनुवाद सेवा Co-op Translator प्रयोग गरेर अनुवाद गरिएको छ। हामी यथार्थताको लागि प्रयास गर्छौं, तर कृपया ध्यान दिनुहोस् कि स्वचालित अनुवादहरूमा त्रुटि वा अशुद्धता हुन सक्छ। यसको मूल भाषा मा रहेको मूल दस्तावेज़लाई आधिकारिक स्रोत मानिनुपर्छ। महत्वपूर्ण जानकारीको लागि, व्यावसायिक मानव अनुवाद सिफारिस गरिन्छ। यस अनुवादको प्रयोगबाट उत्पन्न हुने कुनै पनि गलतफहमी वा गलत व्याख्याको लागि हामी जिम्मेवार हुने छैनौं।