You can not select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.
Data-Science-For-Beginners/translations/pa/3-Data-Visualization/10-visualization-distributions
leestott 5391b4bc5f
🌐 Update translations via Co-op Translator
3 weeks ago
..
README.md 🌐 Update translations via Co-op Translator 3 weeks ago
assignment.md 🌐 Update translations via Co-op Translator 3 weeks ago

README.md

ਡਿਸਟ੍ਰਿਬਿਊਸ਼ਨਜ਼ ਨੂੰ ਵਿਜੁਅਲਾਈਜ਼ ਕਰਨਾ

 (@sketchthedocs) ਵੱਲੋਂ ਸਕੈਚਨੋਟ
ਡਿਸਟ੍ਰਿਬਿਊਸ਼ਨਜ਼ ਨੂੰ ਵਿਜੁਅਲਾਈਜ਼ ਕਰਨਾ - @nitya ਵੱਲੋਂ ਸਕੈਚਨੋਟ

ਪਿਛਲੇ ਪਾਠ ਵਿੱਚ, ਤੁਸੀਂ ਮਿਨੇਸੋਟਾ ਦੇ ਪੰਛੀਆਂ ਦੇ ਡਾਟਾਸੈੱਟ ਬਾਰੇ ਕੁਝ ਦਿਲਚਸਪ ਤੱਥ ਸਿੱਖੇ। ਤੁਸੀਂ ਆਊਟਲਾਇਅਰਜ਼ ਨੂੰ ਵਿਜੁਅਲਾਈਜ਼ ਕਰਕੇ ਗਲਤ ਡਾਟਾ ਲੱਭਿਆ ਅਤੇ ਵੱਖ-ਵੱਖ ਪੰਛੀ ਸ਼੍ਰੇਣੀਆਂ ਦੇ ਵੱਧ ਤੋਂ ਵੱਧ ਲੰਬਾਈ ਦੇ ਅਧਾਰ 'ਤੇ ਅੰਤਰ ਵੇਖੇ।

ਪਾਠ-ਪਹਿਲਾਂ ਕਵਿਜ਼

ਪੰਛੀਆਂ ਦੇ ਡਾਟਾਸੈੱਟ ਦੀ ਪੜਚੋਲ ਕਰੋ

ਡਾਟਾ ਵਿੱਚ ਖੋਜ ਕਰਨ ਦਾ ਇੱਕ ਹੋਰ ਤਰੀਕਾ ਇਹ ਦੇਖਣਾ ਹੈ ਕਿ ਇਹ ਕਿਵੇਂ ਡਿਸਟ੍ਰਿਬਿਊਟ ਕੀਤਾ ਗਿਆ ਹੈ, ਜਾਂ ਕਿਵੇਂ ਡਾਟਾ ਇੱਕ ਧੁਰੇ ਦੇ ਨਾਲ ਸੰਗਠਿਤ ਹੈ। ਸ਼ਾਇਦ, ਉਦਾਹਰਣ ਵਜੋਂ, ਤੁਸੀਂ ਇਸ ਡਾਟਾਸੈੱਟ ਵਿੱਚ ਮਿਨੇਸੋਟਾ ਦੇ ਪੰਛੀਆਂ ਦੀ ਵੱਧ ਤੋਂ ਵੱਧ ਪੰਖਾਂ ਦੀ ਚੌੜਾਈ ਜਾਂ ਵੱਧ ਤੋਂ ਵੱਧ ਸਰੀਰਕ ਭਾਰ ਦੇ ਆਮ ਡਿਸਟ੍ਰਿਬਿਊਸ਼ਨ ਬਾਰੇ ਜਾਣਨਾ ਚਾਹੁੰਦੇ ਹੋ।

ਆਓ ਇਸ ਡਾਟਾਸੈੱਟ ਵਿੱਚ ਡਾਟਾ ਦੇ ਡਿਸਟ੍ਰਿਬਿਊਸ਼ਨਜ਼ ਬਾਰੇ ਕੁਝ ਤੱਥ ਪਤਾ ਕਰੀਏ। ਇਸ ਪਾਠ ਫੋਲਡਰ ਦੇ ਮੁੱਖ notebook.ipynb ਫਾਈਲ ਵਿੱਚ, Pandas, Matplotlib, ਅਤੇ ਆਪਣੇ ਡਾਟਾ ਨੂੰ ਇੰਪੋਰਟ ਕਰੋ:

import pandas as pd
import matplotlib.pyplot as plt
birds = pd.read_csv('../../data/birds.csv')
birds.head()
ਨਾਮ ਵਿਗਿਆਨਕ ਨਾਮ ਸ਼੍ਰੇਣੀ ਆਰਡਰ ਪਰਿਵਾਰ ਜਨਸ ਸੰਰਕਸ਼ਣ ਸਥਿਤੀ ਘੱਟੋ-ਘੱਟ ਲੰਬਾਈ ਵੱਧ ਤੋਂ ਵੱਧ ਲੰਬਾਈ ਘੱਟੋ-ਘੱਟ ਸਰੀਰਕ ਭਾਰ ਵੱਧ ਤੋਂ ਵੱਧ ਸਰੀਰਕ ਭਾਰ ਘੱਟੋ-ਘੱਟ ਪੰਖਾਂ ਦੀ ਚੌੜਾਈ ਵੱਧ ਤੋਂ ਵੱਧ ਪੰਖਾਂ ਦੀ ਚੌੜਾਈ
0 ਬਲੈਕ-ਬੈਲੀਡ ਵਿਸਲਿੰਗ-ਡੱਕ Dendrocygna autumnalis ਬਤਖਾਂ/ਹੰਸ/ਜਲਪੰਛੀ Anseriformes Anatidae Dendrocygna LC 47 56 652 1020 76 94
1 ਫੁਲਵਸ ਵਿਸਲਿੰਗ-ਡੱਕ Dendrocygna bicolor ਬਤਖਾਂ/ਹੰਸ/ਜਲਪੰਛੀ Anseriformes Anatidae Dendrocygna LC 45 53 712 1050 85 93
2 ਸਨੋ ਗੂਜ਼ Anser caerulescens ਬਤਖਾਂ/ਹੰਸ/ਜਲਪੰਛੀ Anseriformes Anatidae Anser LC 64 79 2050 4050 135 165
3 ਰੌਸ ਦਾ ਗੂਜ਼ Anser rossii ਬਤਖਾਂ/ਹੰਸ/ਜਲਪੰਛੀ Anseriformes Anatidae Anser LC 57.3 64 1066 1567 113 116
4 ਗ੍ਰੇਟਰ ਵਾਈਟ-ਫਰੰਟਡ ਗੂਜ਼ Anser albifrons ਬਤਖਾਂ/ਹੰਸ/ਜਲਪੰਛੀ Anseriformes Anatidae Anser LC 64 81 1930 3310 130 165

ਆਮ ਤੌਰ 'ਤੇ, ਤੁਸੀਂ ਪਿਛਲੇ ਪਾਠ ਵਿੱਚ ਵਰਤੇ ਗਏ ਸਕੈਟਰ ਪਲਾਟ ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਡਾਟਾ ਦੇ ਡਿਸਟ੍ਰਿਬਿਊਸ਼ਨ ਨੂੰ ਤੇਜ਼ੀ ਨਾਲ ਦੇਖ ਸਕਦੇ ਹੋ:

birds.plot(kind='scatter',x='MaxLength',y='Order',figsize=(12,8))

plt.title('Max Length per Order')
plt.ylabel('Order')
plt.xlabel('Max Length')

plt.show()

ਆਰਡਰ ਪ੍ਰਤੀ ਵੱਧ ਤੋਂ ਵੱਧ ਲੰਬਾਈ

ਇਹ ਪੰਛੀ ਦੇ ਆਰਡਰ ਪ੍ਰਤੀ ਸਰੀਰਕ ਲੰਬਾਈ ਦੇ ਆਮ ਡਿਸਟ੍ਰਿਬਿਊਸ਼ਨ ਦਾ ਝਲਕ ਦਿੰਦਾ ਹੈ, ਪਰ ਇਹ ਸੱਚੇ ਡਿਸਟ੍ਰਿਬਿਊਸ਼ਨਜ਼ ਨੂੰ ਦਰਸਾਉਣ ਦਾ ਸਭ ਤੋਂ ਵਧੀਆ ਤਰੀਕਾ ਨਹੀਂ ਹੈ। ਇਹ ਕੰਮ ਆਮ ਤੌਰ 'ਤੇ ਹਿਸਟੋਗ੍ਰਾਮ ਬਣਾਉਣ ਦੁਆਰਾ ਕੀਤਾ ਜਾਂਦਾ ਹੈ।

ਹਿਸਟੋਗ੍ਰਾਮ ਨਾਲ ਕੰਮ ਕਰਨਾ

Matplotlib ਹਿਸਟੋਗ੍ਰਾਮ ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਡਾਟਾ ਡਿਸਟ੍ਰਿਬਿਊਸ਼ਨ ਨੂੰ ਵਿਜੁਅਲਾਈਜ਼ ਕਰਨ ਦੇ ਬਹੁਤ ਵਧੀਆ ਤਰੀਕੇ ਪੇਸ਼ ਕਰਦਾ ਹੈ। ਇਹ ਚਾਰਟ ਇੱਕ ਬਾਰ ਚਾਰਟ ਵਾਂਗ ਹੁੰਦਾ ਹੈ ਜਿੱਥੇ ਡਿਸਟ੍ਰਿਬਿਊਸ਼ਨ ਬਾਰਾਂ ਦੇ ਉਤਾਰ-ਚੜ੍ਹਾਅ ਰਾਹੀਂ ਵੇਖਿਆ ਜਾ ਸਕਦਾ ਹੈ। ਹਿਸਟੋਗ੍ਰਾਮ ਬਣਾਉਣ ਲਈ, ਤੁਹਾਨੂੰ ਸੰਖਿਆਤਮਕ ਡਾਟਾ ਦੀ ਲੋੜ ਹੁੰਦੀ ਹੈ। ਹਿਸਟੋਗ੍ਰਾਮ ਬਣਾਉਣ ਲਈ, ਤੁਸੀਂ ਚਾਰਟ ਨੂੰ 'hist' ਕਿਸਮ ਦੇ ਤੌਰ 'ਤੇ ਪਰਿਭਾਸ਼ਿਤ ਕਰਕੇ ਪਲਾਟ ਕਰ ਸਕਦੇ ਹੋ। ਇਹ ਚਾਰਟ ਪੂਰੇ ਡਾਟਾਸੈੱਟ ਦੀ ਸੰਖਿਆਤਮਕ ਡਾਟਾ ਦੀ ਰੇਂਜ ਲਈ MaxBodyMass ਦੇ ਡਿਸਟ੍ਰਿਬਿਊਸ਼ਨ ਨੂੰ ਦਰਸਾਉਂਦਾ ਹੈ। ਡਾਟਾ ਦੇ ਐਰੇ ਨੂੰ ਛੋਟੇ ਬਿਨਜ਼ ਵਿੱਚ ਵੰਡ ਕੇ, ਇਹ ਡਾਟਾ ਦੇ ਮੁੱਲਾਂ ਦੇ ਡਿਸਟ੍ਰਿਬਿਊਸ਼ਨ ਨੂੰ ਦਰਸਾ ਸਕਦਾ ਹੈ:

birds['MaxBodyMass'].plot(kind = 'hist', bins = 10, figsize = (12,12))
plt.show()

ਪੂਰੇ ਡਾਟਾਸੈੱਟ 'ਤੇ ਡਿਸਟ੍ਰਿਬਿਊਸ਼ਨ

ਜਿਵੇਂ ਤੁਸੀਂ ਵੇਖ ਸਕਦੇ ਹੋ, ਇਸ ਡਾਟਾਸੈੱਟ ਵਿੱਚ ਮੌਜੂਦ 400+ ਪੰਛੀਆਂ ਵਿੱਚੋਂ ਜ਼ਿਆਦਾਤਰ ਦਾ ਵੱਧ ਤੋਂ ਵੱਧ ਸਰੀਰਕ ਭਾਰ 2000 ਤੋਂ ਘੱਟ ਹੈ। bins ਪੈਰਾਮੀਟਰ ਨੂੰ ਵਧੇਰੇ ਸੰਖਿਆ, ਜਿਵੇਂ ਕਿ 30, 'ਤੇ ਬਦਲ ਕੇ ਡਾਟਾ ਬਾਰੇ ਹੋਰ ਜਾਣਕਾਰੀ ਪ੍ਰਾਪਤ ਕਰੋ:

birds['MaxBodyMass'].plot(kind = 'hist', bins = 30, figsize = (12,12))
plt.show()

ਵੱਡੇ ਬਿਨਜ਼ ਪੈਰਾਮੀਟਰ ਨਾਲ ਡਿਸਟ੍ਰਿਬਿਊਸ਼ਨ

ਇਹ ਚਾਰਟ ਡਿਸਟ੍ਰਿਬਿਊਸ਼ਨ ਨੂੰ ਹੋਰ ਵਿਸਥਾਰ ਵਿੱਚ ਦਰਸਾਉਂਦਾ ਹੈ। ਇੱਕ ਚਾਰਟ ਜੋ ਵੱਧ ਖੱਬੇ ਪਾਸੇ ਝੁਕਿਆ ਹੋਇਆ ਨਹੀਂ ਹੈ, ਉਹ ਇਸ ਤਰੀਕੇ ਨਾਲ ਬਣਾਇਆ ਜਾ ਸਕਦਾ ਹੈ ਕਿ ਤੁਸੀਂ ਸਿਰਫ਼ ਇੱਕ ਦਿੱਤੇ ਗਏ ਰੇਂਜ ਦੇ ਅੰਦਰ ਡਾਟਾ ਚੁਣਦੇ ਹੋ:

ਆਪਣੇ ਡਾਟਾ ਨੂੰ ਫਿਲਟਰ ਕਰੋ ਤਾਂ ਜੋ ਸਿਰਫ਼ ਉਹ ਪੰਛੀ ਮਿਲਣ ਜਿਨ੍ਹਾਂ ਦਾ ਸਰੀਰਕ ਭਾਰ 60 ਤੋਂ ਘੱਟ ਹੈ, ਅਤੇ 40 bins ਦਿਖਾਓ:

filteredBirds = birds[(birds['MaxBodyMass'] > 1) & (birds['MaxBodyMass'] < 60)]      
filteredBirds['MaxBodyMass'].plot(kind = 'hist',bins = 40,figsize = (12,12))
plt.show()     

ਫਿਲਟਰ ਕੀਤਾ ਹਿਸਟੋਗ੍ਰਾਮ

ਕੁਝ ਹੋਰ ਫਿਲਟਰ ਅਤੇ ਡਾਟਾ ਪੌਇੰਟਸ ਦੀ ਕੋਸ਼ਿਸ਼ ਕਰੋ। ਡਾਟਾ ਦੇ ਪੂਰੇ ਡਿਸਟ੍ਰਿਬਿਊਸ਼ਨ ਨੂੰ ਵੇਖਣ ਲਈ, ['MaxBodyMass'] ਫਿਲਟਰ ਨੂੰ ਹਟਾਓ ਤਾਂ ਜੋ ਲੇਬਲਡ ਡਿਸਟ੍ਰਿਬਿਊਸ਼ਨਜ਼ ਦਿਖਾਏ ਜਾ ਸਕਣ।

ਹਿਸਟੋਗ੍ਰਾਮ ਵਿੱਚ ਕੁਝ ਵਧੀਆ ਰੰਗ ਅਤੇ ਲੇਬਲਿੰਗ ਸੁਧਾਰ ਵੀ ਹਨ ਜੋ ਤੁਸੀਂ ਅਜ਼ਮਾਉਣ ਲਈ ਕਰ ਸਕਦੇ ਹੋ:

ਦੋ ਡਿਸਟ੍ਰਿਬਿਊਸ਼ਨਜ਼ ਦੇ ਰਿਸ਼ਤੇ ਦੀ ਤੁਲਨਾ ਕਰਨ ਲਈ ਇੱਕ 2D ਹਿਸਟੋਗ੍ਰਾਮ ਬਣਾਓ। ਆਓ MaxBodyMass ਅਤੇ MaxLength ਦੀ ਤੁਲਨਾ ਕਰੀਏ। Matplotlib ਇੱਕ ਅੰਦਰੂਨੀ ਤਰੀਕਾ ਪੇਸ਼ ਕਰਦਾ ਹੈ ਜੋ ਚਮਕਦਾਰ ਰੰਗਾਂ ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਸੰਮਿਲਨ ਦਿਖਾਉਂਦਾ ਹੈ:

x = filteredBirds['MaxBodyMass']
y = filteredBirds['MaxLength']

fig, ax = plt.subplots(tight_layout=True)
hist = ax.hist2d(x, y)

ਇਹ ਦੋ ਤੱਤਾਂ ਦੇ ਵਿਚਕਾਰ ਇੱਕ ਉਮੀਦ ਕੀਤੀ ਗਈ ਧੁਰੇ ਦੇ ਨਾਲ ਸੰਬੰਧ ਦਿਖਾਉਂਦਾ ਹੈ, ਜਿਸ ਵਿੱਚ ਇੱਕ ਖਾਸ ਤਾਕਤਵਰ ਸੰਮਿਲਨ ਬਿੰਦੂ ਹੈ:

2D ਪਲਾਟ

ਹਿਸਟੋਗ੍ਰਾਮ ਆਮ ਤੌਰ 'ਤੇ ਸੰਖਿਆਤਮਕ ਡਾਟਾ ਲਈ ਚੰਗੇ ਕੰਮ ਕਰਦੇ ਹਨ। ਜੇ ਤੁਸੀਂ ਪਾਠ-ਅਧਾਰਿਤ ਡਾਟਾ ਦੇ ਅਨੁਸਾਰ ਡਿਸਟ੍ਰਿਬਿਊਸ਼ਨਜ਼ ਵੇਖਣ ਦੀ ਲੋੜ ਹੈ ਤਾਂ ਕੀ ਕਰਨਾ ਚਾਹੀਦਾ ਹੈ?

ਪਾਠ-ਅਧਾਰਿਤ ਡਾਟਾ ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਡਾਟਾਸੈੱਟ ਦੀ ਪੜਚੋਲ ਕਰੋ

ਇਸ ਡਾਟਾਸੈੱਟ ਵਿੱਚ ਪੰਛੀ ਦੀ ਸ਼੍ਰੇਣੀ ਅਤੇ ਇਸ ਦੇ ਜਨਸ, ਪ੍ਰਜਾਤੀ, ਅਤੇ ਪਰਿਵਾਰ ਦੇ ਨਾਲ-ਨਾਲ ਇਸ ਦੀ ਸੰਰਕਸ਼ਣ ਸਥਿਤੀ ਬਾਰੇ ਵੀ ਚੰਗੀ ਜਾਣਕਾਰੀ ਸ਼ਾਮਲ ਹੈ। ਆਓ ਇਸ ਸੰਰਕਸ਼ਣ ਜਾਣਕਾਰੀ ਵਿੱਚ ਖੋਜ ਕਰੀਏ। ਪੰਛੀਆਂ ਦੀ ਸੰਰਕਸ਼ਣ ਸਥਿਤੀ ਦੇ ਅਨੁਸਾਰ ਡਿਸਟ੍ਰਿਬਿਊਸ਼ਨ ਕੀ ਹੈ?

ਡਾਟਾਸੈੱਟ ਵਿੱਚ, ਸੰਰਕਸ਼ਣ ਸਥਿਤੀ ਨੂੰ ਵੇਰਵਾ ਕਰਨ ਲਈ ਕਈ ਸੰਖੇਪ ਸ਼ਬਦ ਵਰਤੇ ਜਾਂਦੇ ਹਨ। ਇਹ ਸੰਖੇਪ ਸ਼ਬਦ IUCN ਰੈੱਡ ਲਿਸਟ ਸ਼੍ਰੇਣੀਆਂ ਤੋਂ ਆਉਂਦੇ ਹਨ, ਜੋ ਪ੍ਰਜਾਤੀਆਂ ਦੀ ਸਥਿਤੀ ਨੂੰ ਸੂਚੀਬੱਧ ਕਰਦੀ ਹੈ।

  • CR: ਗੰਭੀਰ ਖਤਰੇ ਵਿੱਚ
  • EN: ਖਤਰੇ ਵਿੱਚ
  • EX: ਲੁਪਤ
  • LC: ਘੱਟ ਚਿੰਤਾ
  • NT: ਖਤਰੇ ਦੇ ਨੇੜੇ
  • VU: ਸੰਵੇਦਨਸ਼ੀਲ

ਇਹ ਪਾਠ-ਅਧਾਰਿਤ ਮੁੱਲ ਹਨ ਇਸ ਲਈ ਤੁਹਾਨੂੰ ਹਿਸਟੋਗ੍ਰਾਮ ਬਣਾਉਣ ਲਈ ਇੱਕ ਰੂਪਾਂਤਰ ਕਰਨ ਦੀ ਲੋੜ ਹੋਵੇਗੀ। ਫਿਲਟਰ ਕੀਤਾ ਡਾਟਾਫ੍ਰੇਮ ਵਰਤ ਕੇ, ਇਸ ਦੀ ਸੰਰਕਸ਼ਣ ਸਥਿਤੀ ਨੂੰ ਘੱਟੋ-ਘੱਟ ਪੰਖਾਂ ਦੀ ਚੌੜਾਈ ਦੇ ਨਾਲ ਦਿਖਾਓ। ਤੁਹਾਨੂੰ ਕੀ ਦਿਖਦਾ ਹੈ?

x1 = filteredBirds.loc[filteredBirds.ConservationStatus=='EX', 'MinWingspan']
x2 = filteredBirds.loc[filteredBirds.ConservationStatus=='CR', 'MinWingspan']
x3 = filteredBirds.loc[filteredBirds.ConservationStatus=='EN', 'MinWingspan']
x4 = filteredBirds.loc[filteredBirds.ConservationStatus=='NT', 'MinWingspan']
x5 = filteredBirds.loc[filteredBirds.ConservationStatus=='VU', 'MinWingspan']
x6 = filteredBirds.loc[filteredBirds.ConservationStatus=='LC', 'MinWingspan']

kwargs = dict(alpha=0.5, bins=20)

plt.hist(x1, **kwargs, color='red', label='Extinct')
plt.hist(x2, **kwargs, color='orange', label='Critically Endangered')
plt.hist(x3, **kwargs, color='yellow', label='Endangered')
plt.hist(x4, **kwargs, color='green', label='Near Threatened')
plt.hist(x5, **kwargs, color='blue', label='Vulnerable')
plt.hist(x6, **kwargs, color='gray', label='Least Concern')

plt.gca().set(title='Conservation Status', ylabel='Min Wingspan')
plt.legend();

ਪੰਖਾਂ ਦੀ ਚੌੜਾਈ ਅਤੇ ਸੰਰਕਸ਼ਣ ਸਥਿਤੀ ਦੀ ਤੁਲਨਾ

ਘੱਟੋ-ਘੱਟ ਪੰਖਾਂ ਦੀ ਚੌੜਾਈ ਅਤੇ ਸੰਰਕਸ਼ਣ ਸਥਿਤੀ ਦੇ ਵਿਚਕਾਰ ਕੋਈ ਵਧੀਆ ਸੰਬੰਧ ਨਹੀਂ ਲੱਗਦਾ। ਇਸ ਤਰੀਕੇ ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਡਾਟਾਸੈੱਟ ਦੇ ਹੋਰ ਤੱਤਾਂ ਦੀ ਜਾਂਚ ਕਰੋ। ਤੁਸੀਂ ਵੱਖ-ਵੱਖ ਫਿਲਟਰਾਂ ਦੀ ਕੋਸ਼ਿਸ਼ ਵੀ ਕਰ ਸਕਦੇ ਹੋ। ਕੀ ਤੁਹਾਨੂੰ ਕੋਈ ਸੰਬੰਧ ਮਿਲਦਾ ਹੈ?

ਡੈਂਸਿਟੀ ਪਲਾਟਸ

ਤੁਸੀਂ ਸ਼ਾਇਦ ਨੋਟ ਕੀਤਾ ਹੋਵੇਗਾ ਕਿ ਅਸੀਂ ਹੁਣ ਤੱਕ ਦੇਖੇ ਹਿਸਟੋਗ੍ਰਾਮ 'ਸਟੈਪਡ' ਹਨ ਅਤੇ ਇੱਕ ਆਰਕ ਵਿੱਚ ਹੌਲੀ ਨਹੀਂ ਵਗਦੇ। ਇੱਕ ਹੌਲੀ ਡੈਂਸਿਟੀ ਚਾਰਟ ਦਿਖਾਉਣ ਲਈ, ਤੁਸੀਂ ਡੈਂਸਿਟੀ ਪਲਾਟ ਦੀ ਕੋਸ਼ਿਸ਼ ਕਰ ਸਕਦੇ ਹੋ।

ਡੈਂਸਿਟੀ ਪਲਾਟਸ ਨਾਲ ਕੰਮ ਕਰਨ ਲਈ, ਇੱਕ ਨਵੀਂ ਪਲਾਟਿੰਗ ਲਾਇਬ੍ਰੇਰੀ, Seaborn ਨਾਲ ਜਾਣੂ ਹੋਵੋ।

Seaborn ਨੂੰ ਲੋਡ ਕਰਕੇ, ਇੱਕ ਬੁਨਿਆਦੀ ਡੈਂਸਿਟੀ ਪਲਾਟ ਦੀ ਕੋਸ਼ਿਸ਼ ਕਰੋ:

import seaborn as sns
import matplotlib.pyplot as plt
sns.kdeplot(filteredBirds['MinWingspan'])
plt.show()

ਡੈਂਸਿਟੀ ਪਲਾਟ

ਤੁਸੀਂ ਵੇਖ ਸਕਦੇ ਹੋ ਕਿ ਇਹ ਪਲਾਟ ਘੱਟੋ-ਘੱਟ ਪੰਖਾਂ ਦੀ ਚੌੜਾਈ ਡਾਟਾ ਲਈ ਪਿਛਲੇ ਚਾਰਟ ਨੂੰ ਦੁਹਰਾਉਂਦਾ ਹੈ; ਇਹ ਸਿਰਫ਼ ਕੁਝ ਹੌਲਾ ਹੈ। Seaborn ਦੀ ਦਸਤਾਵੇਜ਼ੀ ਦੇ ਅਨੁਸਾਰ, "ਹਿਸਟੋਗ੍ਰਾਮ ਦੇ ਮੁਕਾਬਲੇ, KDE ਇੱਕ ਪਲਾਟ ਪੈਦਾ ਕਰ ਸਕਦਾ ਹੈ ਜੋ ਘੱਟ ਭਰਿਆ ਹੋਵੇ ਅਤੇ ਵਧੇਰੇ ਵਿਆਖਿਆਯੋਗ ਹੋਵੇ, ਖਾਸ ਕਰਕੇ ਜਦੋਂ ਕਈ ਡਿਸਟ੍ਰਿਬਿਊਸ਼ਨਜ਼ ਨੂੰ ਖਿੱਚਿਆ ਜਾ ਰਿਹਾ ਹੋਵੇ। ਪਰ ਇਹ ਵਿਗੜਨ ਦੀ ਸੰਭਾਵਨਾ ਰੱਖਦਾ ਹੈ ਜੇਕਰ ਅਧਾਰਭੂਤ ਡਿਸਟ੍ਰਿਬਿਊਸ਼ਨ ਬਾਊਂਡਡ ਜਾਂ ਹੌਲਾ ਨਾ ਹੋਵੇ।" ਸਰੋਤ ਅਰਥਾਤ, ਆਊਟਲਾਇਅਰਜ਼ ਹਮੇਸ਼ਾ ਤੁਹਾਡੇ ਚਾਰਟਾਂ ਨੂੰ ਗਲਤ ਵਿਹਾਰ ਕਰਨ ਲਈ ਮਜਬੂਰ ਕਰ ਸਕਦੇ ਹਨ।

ਜੇ ਤੁਸੀਂ ਦੂਜੇ ਚਾਰਟ ਵਿੱਚ ਉਸ ਜੱਗਡ MaxBodyMass ਲਾਈਨ ਨੂੰ ਦੁਬਾਰਾ ਵੇਖਣਾ ਚਾਹੁੰਦੇ ਹੋ, ਤਾਂ ਤੁਸੀਂ ਇਸ ਤਰੀਕੇ ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਇਸਨੂੰ ਬਹੁਤ ਚੰਗੀ ਤਰ੍ਹਾਂ ਹੌਲਾ ਕਰ ਸਕਦੇ ਹੋ:

sns.kdeplot(filteredBirds['MaxBodyMass'])
plt.show()

ਸਮੂਥ ਸਰੀਰਕ ਭਾਰ ਲਾਈਨ

ਜੇ ਤੁਸੀਂ ਇੱਕ ਹੌਲੀ, ਪਰ ਬਹੁਤ ਜ਼ਿਆਦਾ ਹੌਲੀ ਲਾਈਨ ਨਹੀਂ ਚਾਹੁੰਦੇ, ਤਾਂ bw_adjust ਪੈਰਾਮੀਟਰ ਨੂੰ ਸੰਪਾਦਿਤ ਕਰੋ:

sns.kdeplot(filteredBirds['MaxBodyMass'], bw_adjust=.2)
plt.show()

ਘੱਟ ਹੌਲੀ ਸਰੀਰਕ ਭਾਰ ਲਾਈਨ

ਇਸ ਕਿਸਮ ਦੇ ਪਲਾਟ ਲਈ ਉਪਲਬਧ ਪੈਰਾਮੀਟਰਾਂ ਬਾਰੇ ਪੜ੍ਹੋ ਅਤੇ ਪ੍ਰਯੋਗ ਕਰੋ!

ਇਸ ਕਿਸਮ ਦਾ ਚਾਰਟ ਸੁੰਦਰ ਤਰੀਕੇ ਨਾਲ ਵਿਆਖਿਆਤਮਕ ਵਿਜੁਅਲਾਈਜ਼ੇਸ਼ਨ ਪੇਸ਼ ਕਰਦਾ ਹੈ। ਉਦਾਹਰਣ ਲਈ, ਕੁਝ ਕੋਡ ਦੀਆਂ ਲਾਈਨਾਂ ਨਾਲ, ਤੁਸੀਂ ਪੰਛੀ ਦੇ ਆਰਡਰ ਪ੍ਰਤੀ ਵੱਧ ਤੋਂ ਵੱਧ ਸਰੀਰਕ ਭਾਰ ਦੀ ਡੈਂਸਿਟੀ ਦਿਖਾ ਸਕਦੇ ਹੋ:

sns.kdeplot(
   data=filteredBirds, x="MaxBodyMass", hue="Order",
   fill=True, common_norm=False, palette="crest",
   alpha=.5, linewidth=0,
)

ਆਰਡਰ ਪ੍ਰਤੀ ਸਰੀਰਕ ਭਾਰ

ਤੁਸੀਂ ਇੱਕ ਚਾਰਟ ਵਿੱਚ ਕਈ ਤੱਤਾਂ ਦੀ ਡੈਂਸਿਟੀ ਨੂੰ ਵੀ ਮੈਪ ਕਰ ਸਕਦੇ ਹੋ। ਪੰਛੀ ਦੀ ਵੱਧ ਤੋਂ ਵੱਧ ਲੰਬਾਈ ਅਤੇ ਘੱਟੋ-ਘੱਟ ਲੰਬਾਈ ਦੀ ਸੰਰਕਸ਼ਣ ਸਥਿਤੀ ਨਾਲ ਤੁਲਨਾ ਕਰੋ:

sns.kdeplot(data=filteredBirds, x="MinLength", y="MaxLength", hue="ConservationStatus")

ਕਈ ਡੈਂਸਿਟੀਜ਼, ਓਵਰਲੇਪ ਕੀਤੀਆਂ

ਸ਼ਾਇਦ ਇਹ ਖੋਜ ਕਰਨ ਯੋਗ ਹੈ ਕਿ ਕੀ 'ਸੰਵੇਦਨਸ਼ੀਲ' ਪੰਛੀਆਂ ਦੀ ਲੰਬਾਈ ਦੇ ਅਨੁਸਾਰ ਕਲੱਸਟਰ ਮਹੱਤਵਪੂਰਨ ਹੈ ਜਾਂ ਨਹੀਂ।

🚀 ਚੁਣੌਤੀ

ਹਿਸਟੋਗ੍ਰਾਮ ਬੁਨਿਆਦੀ ਸਕੈਟਰਪਲਾਟਸ, ਬਾਰ ਚਾਰਟਸ, ਜਾਂ ਲਾਈਨ ਚਾਰਟਸ ਨਾਲੋਂ ਵਧੇਰੇ ਸੁਧਾਰਤ ਚਾਰਟ ਦੀ ਕਿਸਮ ਹਨ। ਇੰਟਰਨੈਟ 'ਤੇ ਜਾਓ ਅਤੇ ਹਿਸਟੋਗ੍ਰਾਮ ਦੀ ਵਰਤੋਂ ਦੇ ਚੰਗੇ ਉਦਾਹਰਣ ਲੱਭੋ। ਇਹ ਕਿਵੇਂ ਵਰਤੇ ਜਾਂਦੇ ਹਨ, ਇਹ ਕੀ ਦਰਸਾਉਂਦੇ ਹਨ, ਅਤੇ ਇਹ ਕਿਹੜੇ ਖੇਤਰਾਂ ਜਾਂ ਖੋਜ ਦੇ ਖੇਤਰਾਂ ਵਿੱਚ ਵਰਤੇ ਜਾਂਦੇ


ਅਸਵੀਕਰਤੀ:
ਇਹ ਦਸਤਾਵੇਜ਼ AI ਅਨੁਵਾਦ ਸੇਵਾ Co-op Translator ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਅਨੁਵਾਦ ਕੀਤਾ ਗਿਆ ਹੈ। ਜਦੋਂ ਕਿ ਅਸੀਂ ਸਹੀ ਹੋਣ ਦੀ ਕੋਸ਼ਿਸ਼ ਕਰਦੇ ਹਾਂ, ਕਿਰਪਾ ਕਰਕੇ ਧਿਆਨ ਦਿਓ ਕਿ ਸਵੈਚਾਲਿਤ ਅਨੁਵਾਦਾਂ ਵਿੱਚ ਗਲਤੀਆਂ ਜਾਂ ਅਸੁਚਤਤਾਵਾਂ ਹੋ ਸਕਦੀਆਂ ਹਨ। ਇਸ ਦੀ ਮੂਲ ਭਾਸ਼ਾ ਵਿੱਚ ਮੌਜੂਦ ਅਸਲ ਦਸਤਾਵੇਜ਼ ਨੂੰ ਅਧਿਕਾਰਤ ਸਰੋਤ ਮੰਨਿਆ ਜਾਣਾ ਚਾਹੀਦਾ ਹੈ। ਮਹੱਤਵਪੂਰਨ ਜਾਣਕਾਰੀ ਲਈ, ਪੇਸ਼ੇਵਰ ਮਨੁੱਖੀ ਅਨੁਵਾਦ ਦੀ ਸਿਫਾਰਸ਼ ਕੀਤੀ ਜਾਂਦੀ ਹੈ। ਇਸ ਅਨੁਵਾਦ ਦੀ ਵਰਤੋਂ ਤੋਂ ਪੈਦਾ ਹੋਣ ਵਾਲੇ ਕਿਸੇ ਵੀ ਗਲਤ ਫਹਿਮੀ ਜਾਂ ਗਲਤ ਵਿਆਖਿਆ ਲਈ ਅਸੀਂ ਜ਼ਿੰਮੇਵਾਰ ਨਹੀਂ ਹਾਂ।