# ਡਿਸਟ੍ਰਿਬਿਊਸ਼ਨਜ਼ ਨੂੰ ਵਿਜੁਅਲਾਈਜ਼ ਕਰਨਾ |![ [(@sketchthedocs)](https://sketchthedocs.dev) ਵੱਲੋਂ ਸਕੈਚਨੋਟ ](../../sketchnotes/10-Visualizing-Distributions.png)| |:---:| | ਡਿਸਟ੍ਰਿਬਿਊਸ਼ਨਜ਼ ਨੂੰ ਵਿਜੁਅਲਾਈਜ਼ ਕਰਨਾ - _[@nitya](https://twitter.com/nitya) ਵੱਲੋਂ ਸਕੈਚਨੋਟ_ | ਪਿਛਲੇ ਪਾਠ ਵਿੱਚ, ਤੁਸੀਂ ਮਿਨੇਸੋਟਾ ਦੇ ਪੰਛੀਆਂ ਦੇ ਡਾਟਾਸੈੱਟ ਬਾਰੇ ਕੁਝ ਦਿਲਚਸਪ ਤੱਥ ਸਿੱਖੇ। ਤੁਸੀਂ ਆਊਟਲਾਇਅਰਜ਼ ਨੂੰ ਵਿਜੁਅਲਾਈਜ਼ ਕਰਕੇ ਗਲਤ ਡਾਟਾ ਲੱਭਿਆ ਅਤੇ ਵੱਖ-ਵੱਖ ਪੰਛੀ ਸ਼੍ਰੇਣੀਆਂ ਦੇ ਵੱਧ ਤੋਂ ਵੱਧ ਲੰਬਾਈ ਦੇ ਅਧਾਰ 'ਤੇ ਅੰਤਰ ਵੇਖੇ। ## [ਪਾਠ-ਪਹਿਲਾਂ ਕਵਿਜ਼](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/18) ## ਪੰਛੀਆਂ ਦੇ ਡਾਟਾਸੈੱਟ ਦੀ ਪੜਚੋਲ ਕਰੋ ਡਾਟਾ ਵਿੱਚ ਖੋਜ ਕਰਨ ਦਾ ਇੱਕ ਹੋਰ ਤਰੀਕਾ ਇਹ ਦੇਖਣਾ ਹੈ ਕਿ ਇਹ ਕਿਵੇਂ ਡਿਸਟ੍ਰਿਬਿਊਟ ਕੀਤਾ ਗਿਆ ਹੈ, ਜਾਂ ਕਿਵੇਂ ਡਾਟਾ ਇੱਕ ਧੁਰੇ ਦੇ ਨਾਲ ਸੰਗਠਿਤ ਹੈ। ਸ਼ਾਇਦ, ਉਦਾਹਰਣ ਵਜੋਂ, ਤੁਸੀਂ ਇਸ ਡਾਟਾਸੈੱਟ ਵਿੱਚ ਮਿਨੇਸੋਟਾ ਦੇ ਪੰਛੀਆਂ ਦੀ ਵੱਧ ਤੋਂ ਵੱਧ ਪੰਖਾਂ ਦੀ ਚੌੜਾਈ ਜਾਂ ਵੱਧ ਤੋਂ ਵੱਧ ਸਰੀਰਕ ਭਾਰ ਦੇ ਆਮ ਡਿਸਟ੍ਰਿਬਿਊਸ਼ਨ ਬਾਰੇ ਜਾਣਨਾ ਚਾਹੁੰਦੇ ਹੋ। ਆਓ ਇਸ ਡਾਟਾਸੈੱਟ ਵਿੱਚ ਡਾਟਾ ਦੇ ਡਿਸਟ੍ਰਿਬਿਊਸ਼ਨਜ਼ ਬਾਰੇ ਕੁਝ ਤੱਥ ਪਤਾ ਕਰੀਏ। ਇਸ ਪਾਠ ਫੋਲਡਰ ਦੇ ਮੁੱਖ _notebook.ipynb_ ਫਾਈਲ ਵਿੱਚ, Pandas, Matplotlib, ਅਤੇ ਆਪਣੇ ਡਾਟਾ ਨੂੰ ਇੰਪੋਰਟ ਕਰੋ: ```python import pandas as pd import matplotlib.pyplot as plt birds = pd.read_csv('../../data/birds.csv') birds.head() ``` | | ਨਾਮ | ਵਿਗਿਆਨਕ ਨਾਮ | ਸ਼੍ਰੇਣੀ | ਆਰਡਰ | ਪਰਿਵਾਰ | ਜਨਸ | ਸੰਰਕਸ਼ਣ ਸਥਿਤੀ | ਘੱਟੋ-ਘੱਟ ਲੰਬਾਈ | ਵੱਧ ਤੋਂ ਵੱਧ ਲੰਬਾਈ | ਘੱਟੋ-ਘੱਟ ਸਰੀਰਕ ਭਾਰ | ਵੱਧ ਤੋਂ ਵੱਧ ਸਰੀਰਕ ਭਾਰ | ਘੱਟੋ-ਘੱਟ ਪੰਖਾਂ ਦੀ ਚੌੜਾਈ | ਵੱਧ ਤੋਂ ਵੱਧ ਪੰਖਾਂ ਦੀ ਚੌੜਾਈ | | ---: | :--------------------------- | :--------------------- | :-------------------- | :----------- | :------- | :---------- | :----------------- | --------: | --------: | ----------: | ----------: | ----------: | ----------: | | 0 | ਬਲੈਕ-ਬੈਲੀਡ ਵਿਸਲਿੰਗ-ਡੱਕ | Dendrocygna autumnalis | ਬਤਖਾਂ/ਹੰਸ/ਜਲਪੰਛੀ | Anseriformes | Anatidae | Dendrocygna | LC | 47 | 56 | 652 | 1020 | 76 | 94 | | 1 | ਫੁਲਵਸ ਵਿਸਲਿੰਗ-ਡੱਕ | Dendrocygna bicolor | ਬਤਖਾਂ/ਹੰਸ/ਜਲਪੰਛੀ | Anseriformes | Anatidae | Dendrocygna | LC | 45 | 53 | 712 | 1050 | 85 | 93 | | 2 | ਸਨੋ ਗੂਜ਼ | Anser caerulescens | ਬਤਖਾਂ/ਹੰਸ/ਜਲਪੰਛੀ | Anseriformes | Anatidae | Anser | LC | 64 | 79 | 2050 | 4050 | 135 | 165 | | 3 | ਰੌਸ ਦਾ ਗੂਜ਼ | Anser rossii | ਬਤਖਾਂ/ਹੰਸ/ਜਲਪੰਛੀ | Anseriformes | Anatidae | Anser | LC | 57.3 | 64 | 1066 | 1567 | 113 | 116 | | 4 | ਗ੍ਰੇਟਰ ਵਾਈਟ-ਫਰੰਟਡ ਗੂਜ਼ | Anser albifrons | ਬਤਖਾਂ/ਹੰਸ/ਜਲਪੰਛੀ | Anseriformes | Anatidae | Anser | LC | 64 | 81 | 1930 | 3310 | 130 | 165 | ਆਮ ਤੌਰ 'ਤੇ, ਤੁਸੀਂ ਪਿਛਲੇ ਪਾਠ ਵਿੱਚ ਵਰਤੇ ਗਏ ਸਕੈਟਰ ਪਲਾਟ ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਡਾਟਾ ਦੇ ਡਿਸਟ੍ਰਿਬਿਊਸ਼ਨ ਨੂੰ ਤੇਜ਼ੀ ਨਾਲ ਦੇਖ ਸਕਦੇ ਹੋ: ```python birds.plot(kind='scatter',x='MaxLength',y='Order',figsize=(12,8)) plt.title('Max Length per Order') plt.ylabel('Order') plt.xlabel('Max Length') plt.show() ``` ![ਆਰਡਰ ਪ੍ਰਤੀ ਵੱਧ ਤੋਂ ਵੱਧ ਲੰਬਾਈ](../../../../translated_images/scatter-wb.9d98b0ed7f0388af979441853361a11df5f518f5307938a503ca7913e986111b.pa.png) ਇਹ ਪੰਛੀ ਦੇ ਆਰਡਰ ਪ੍ਰਤੀ ਸਰੀਰਕ ਲੰਬਾਈ ਦੇ ਆਮ ਡਿਸਟ੍ਰਿਬਿਊਸ਼ਨ ਦਾ ਝਲਕ ਦਿੰਦਾ ਹੈ, ਪਰ ਇਹ ਸੱਚੇ ਡਿਸਟ੍ਰਿਬਿਊਸ਼ਨਜ਼ ਨੂੰ ਦਰਸਾਉਣ ਦਾ ਸਭ ਤੋਂ ਵਧੀਆ ਤਰੀਕਾ ਨਹੀਂ ਹੈ। ਇਹ ਕੰਮ ਆਮ ਤੌਰ 'ਤੇ ਹਿਸਟੋਗ੍ਰਾਮ ਬਣਾਉਣ ਦੁਆਰਾ ਕੀਤਾ ਜਾਂਦਾ ਹੈ। ## ਹਿਸਟੋਗ੍ਰਾਮ ਨਾਲ ਕੰਮ ਕਰਨਾ Matplotlib ਹਿਸਟੋਗ੍ਰਾਮ ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਡਾਟਾ ਡਿਸਟ੍ਰਿਬਿਊਸ਼ਨ ਨੂੰ ਵਿਜੁਅਲਾਈਜ਼ ਕਰਨ ਦੇ ਬਹੁਤ ਵਧੀਆ ਤਰੀਕੇ ਪੇਸ਼ ਕਰਦਾ ਹੈ। ਇਹ ਚਾਰਟ ਇੱਕ ਬਾਰ ਚਾਰਟ ਵਾਂਗ ਹੁੰਦਾ ਹੈ ਜਿੱਥੇ ਡਿਸਟ੍ਰਿਬਿਊਸ਼ਨ ਬਾਰਾਂ ਦੇ ਉਤਾਰ-ਚੜ੍ਹਾਅ ਰਾਹੀਂ ਵੇਖਿਆ ਜਾ ਸਕਦਾ ਹੈ। ਹਿਸਟੋਗ੍ਰਾਮ ਬਣਾਉਣ ਲਈ, ਤੁਹਾਨੂੰ ਸੰਖਿਆਤਮਕ ਡਾਟਾ ਦੀ ਲੋੜ ਹੁੰਦੀ ਹੈ। ਹਿਸਟੋਗ੍ਰਾਮ ਬਣਾਉਣ ਲਈ, ਤੁਸੀਂ ਚਾਰਟ ਨੂੰ 'hist' ਕਿਸਮ ਦੇ ਤੌਰ 'ਤੇ ਪਰਿਭਾਸ਼ਿਤ ਕਰਕੇ ਪਲਾਟ ਕਰ ਸਕਦੇ ਹੋ। ਇਹ ਚਾਰਟ ਪੂਰੇ ਡਾਟਾਸੈੱਟ ਦੀ ਸੰਖਿਆਤਮਕ ਡਾਟਾ ਦੀ ਰੇਂਜ ਲਈ MaxBodyMass ਦੇ ਡਿਸਟ੍ਰਿਬਿਊਸ਼ਨ ਨੂੰ ਦਰਸਾਉਂਦਾ ਹੈ। ਡਾਟਾ ਦੇ ਐਰੇ ਨੂੰ ਛੋਟੇ ਬਿਨਜ਼ ਵਿੱਚ ਵੰਡ ਕੇ, ਇਹ ਡਾਟਾ ਦੇ ਮੁੱਲਾਂ ਦੇ ਡਿਸਟ੍ਰਿਬਿਊਸ਼ਨ ਨੂੰ ਦਰਸਾ ਸਕਦਾ ਹੈ: ```python birds['MaxBodyMass'].plot(kind = 'hist', bins = 10, figsize = (12,12)) plt.show() ``` ![ਪੂਰੇ ਡਾਟਾਸੈੱਟ 'ਤੇ ਡਿਸਟ੍ਰਿਬਿਊਸ਼ਨ](../../../../translated_images/dist1-wb.0d0cac82e2974fbbec635826fefead401af795f82e2279e2e2678bf2c117d827.pa.png) ਜਿਵੇਂ ਤੁਸੀਂ ਵੇਖ ਸਕਦੇ ਹੋ, ਇਸ ਡਾਟਾਸੈੱਟ ਵਿੱਚ ਮੌਜੂਦ 400+ ਪੰਛੀਆਂ ਵਿੱਚੋਂ ਜ਼ਿਆਦਾਤਰ ਦਾ ਵੱਧ ਤੋਂ ਵੱਧ ਸਰੀਰਕ ਭਾਰ 2000 ਤੋਂ ਘੱਟ ਹੈ। `bins` ਪੈਰਾਮੀਟਰ ਨੂੰ ਵਧੇਰੇ ਸੰਖਿਆ, ਜਿਵੇਂ ਕਿ 30, 'ਤੇ ਬਦਲ ਕੇ ਡਾਟਾ ਬਾਰੇ ਹੋਰ ਜਾਣਕਾਰੀ ਪ੍ਰਾਪਤ ਕਰੋ: ```python birds['MaxBodyMass'].plot(kind = 'hist', bins = 30, figsize = (12,12)) plt.show() ``` ![ਵੱਡੇ ਬਿਨਜ਼ ਪੈਰਾਮੀਟਰ ਨਾਲ ਡਿਸਟ੍ਰਿਬਿਊਸ਼ਨ](../../../../translated_images/dist2-wb.2c0a7a3499b2fbf561e9f93b69f265dfc538dc78f6de15088ba84a88152e26ba.pa.png) ਇਹ ਚਾਰਟ ਡਿਸਟ੍ਰਿਬਿਊਸ਼ਨ ਨੂੰ ਹੋਰ ਵਿਸਥਾਰ ਵਿੱਚ ਦਰਸਾਉਂਦਾ ਹੈ। ਇੱਕ ਚਾਰਟ ਜੋ ਵੱਧ ਖੱਬੇ ਪਾਸੇ ਝੁਕਿਆ ਹੋਇਆ ਨਹੀਂ ਹੈ, ਉਹ ਇਸ ਤਰੀਕੇ ਨਾਲ ਬਣਾਇਆ ਜਾ ਸਕਦਾ ਹੈ ਕਿ ਤੁਸੀਂ ਸਿਰਫ਼ ਇੱਕ ਦਿੱਤੇ ਗਏ ਰੇਂਜ ਦੇ ਅੰਦਰ ਡਾਟਾ ਚੁਣਦੇ ਹੋ: ਆਪਣੇ ਡਾਟਾ ਨੂੰ ਫਿਲਟਰ ਕਰੋ ਤਾਂ ਜੋ ਸਿਰਫ਼ ਉਹ ਪੰਛੀ ਮਿਲਣ ਜਿਨ੍ਹਾਂ ਦਾ ਸਰੀਰਕ ਭਾਰ 60 ਤੋਂ ਘੱਟ ਹੈ, ਅਤੇ 40 `bins` ਦਿਖਾਓ: ```python filteredBirds = birds[(birds['MaxBodyMass'] > 1) & (birds['MaxBodyMass'] < 60)] filteredBirds['MaxBodyMass'].plot(kind = 'hist',bins = 40,figsize = (12,12)) plt.show() ``` ![ਫਿਲਟਰ ਕੀਤਾ ਹਿਸਟੋਗ੍ਰਾਮ](../../../../translated_images/dist3-wb.64b88db7f9780200bd486a2c2a3252548dd439672dbd3f778193db7f654b100c.pa.png) ✅ ਕੁਝ ਹੋਰ ਫਿਲਟਰ ਅਤੇ ਡਾਟਾ ਪੌਇੰਟਸ ਦੀ ਕੋਸ਼ਿਸ਼ ਕਰੋ। ਡਾਟਾ ਦੇ ਪੂਰੇ ਡਿਸਟ੍ਰਿਬਿਊਸ਼ਨ ਨੂੰ ਵੇਖਣ ਲਈ, `['MaxBodyMass']` ਫਿਲਟਰ ਨੂੰ ਹਟਾਓ ਤਾਂ ਜੋ ਲੇਬਲਡ ਡਿਸਟ੍ਰਿਬਿਊਸ਼ਨਜ਼ ਦਿਖਾਏ ਜਾ ਸਕਣ। ਹਿਸਟੋਗ੍ਰਾਮ ਵਿੱਚ ਕੁਝ ਵਧੀਆ ਰੰਗ ਅਤੇ ਲੇਬਲਿੰਗ ਸੁਧਾਰ ਵੀ ਹਨ ਜੋ ਤੁਸੀਂ ਅਜ਼ਮਾਉਣ ਲਈ ਕਰ ਸਕਦੇ ਹੋ: ਦੋ ਡਿਸਟ੍ਰਿਬਿਊਸ਼ਨਜ਼ ਦੇ ਰਿਸ਼ਤੇ ਦੀ ਤੁਲਨਾ ਕਰਨ ਲਈ ਇੱਕ 2D ਹਿਸਟੋਗ੍ਰਾਮ ਬਣਾਓ। ਆਓ `MaxBodyMass` ਅਤੇ `MaxLength` ਦੀ ਤੁਲਨਾ ਕਰੀਏ। Matplotlib ਇੱਕ ਅੰਦਰੂਨੀ ਤਰੀਕਾ ਪੇਸ਼ ਕਰਦਾ ਹੈ ਜੋ ਚਮਕਦਾਰ ਰੰਗਾਂ ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਸੰਮਿਲਨ ਦਿਖਾਉਂਦਾ ਹੈ: ```python x = filteredBirds['MaxBodyMass'] y = filteredBirds['MaxLength'] fig, ax = plt.subplots(tight_layout=True) hist = ax.hist2d(x, y) ``` ਇਹ ਦੋ ਤੱਤਾਂ ਦੇ ਵਿਚਕਾਰ ਇੱਕ ਉਮੀਦ ਕੀਤੀ ਗਈ ਧੁਰੇ ਦੇ ਨਾਲ ਸੰਬੰਧ ਦਿਖਾਉਂਦਾ ਹੈ, ਜਿਸ ਵਿੱਚ ਇੱਕ ਖਾਸ ਤਾਕਤਵਰ ਸੰਮਿਲਨ ਬਿੰਦੂ ਹੈ: ![2D ਪਲਾਟ](../../../../translated_images/2D-wb.ae22fdd33936507a41e3af22e11e4903b04a9be973b23a4e05214efaccfd66c8.pa.png) ਹਿਸਟੋਗ੍ਰਾਮ ਆਮ ਤੌਰ 'ਤੇ ਸੰਖਿਆਤਮਕ ਡਾਟਾ ਲਈ ਚੰਗੇ ਕੰਮ ਕਰਦੇ ਹਨ। ਜੇ ਤੁਸੀਂ ਪਾਠ-ਅਧਾਰਿਤ ਡਾਟਾ ਦੇ ਅਨੁਸਾਰ ਡਿਸਟ੍ਰਿਬਿਊਸ਼ਨਜ਼ ਵੇਖਣ ਦੀ ਲੋੜ ਹੈ ਤਾਂ ਕੀ ਕਰਨਾ ਚਾਹੀਦਾ ਹੈ? ## ਪਾਠ-ਅਧਾਰਿਤ ਡਾਟਾ ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਡਾਟਾਸੈੱਟ ਦੀ ਪੜਚੋਲ ਕਰੋ ਇਸ ਡਾਟਾਸੈੱਟ ਵਿੱਚ ਪੰਛੀ ਦੀ ਸ਼੍ਰੇਣੀ ਅਤੇ ਇਸ ਦੇ ਜਨਸ, ਪ੍ਰਜਾਤੀ, ਅਤੇ ਪਰਿਵਾਰ ਦੇ ਨਾਲ-ਨਾਲ ਇਸ ਦੀ ਸੰਰਕਸ਼ਣ ਸਥਿਤੀ ਬਾਰੇ ਵੀ ਚੰਗੀ ਜਾਣਕਾਰੀ ਸ਼ਾਮਲ ਹੈ। ਆਓ ਇਸ ਸੰਰਕਸ਼ਣ ਜਾਣਕਾਰੀ ਵਿੱਚ ਖੋਜ ਕਰੀਏ। ਪੰਛੀਆਂ ਦੀ ਸੰਰਕਸ਼ਣ ਸਥਿਤੀ ਦੇ ਅਨੁਸਾਰ ਡਿਸਟ੍ਰਿਬਿਊਸ਼ਨ ਕੀ ਹੈ? > ✅ ਡਾਟਾਸੈੱਟ ਵਿੱਚ, ਸੰਰਕਸ਼ਣ ਸਥਿਤੀ ਨੂੰ ਵੇਰਵਾ ਕਰਨ ਲਈ ਕਈ ਸੰਖੇਪ ਸ਼ਬਦ ਵਰਤੇ ਜਾਂਦੇ ਹਨ। ਇਹ ਸੰਖੇਪ ਸ਼ਬਦ [IUCN ਰੈੱਡ ਲਿਸਟ ਸ਼੍ਰੇਣੀਆਂ](https://www.iucnredlist.org/) ਤੋਂ ਆਉਂਦੇ ਹਨ, ਜੋ ਪ੍ਰਜਾਤੀਆਂ ਦੀ ਸਥਿਤੀ ਨੂੰ ਸੂਚੀਬੱਧ ਕਰਦੀ ਹੈ। > > - CR: ਗੰਭੀਰ ਖਤਰੇ ਵਿੱਚ > - EN: ਖਤਰੇ ਵਿੱਚ > - EX: ਲੁਪਤ > - LC: ਘੱਟ ਚਿੰਤਾ > - NT: ਖਤਰੇ ਦੇ ਨੇੜੇ > - VU: ਸੰਵੇਦਨਸ਼ੀਲ ਇਹ ਪਾਠ-ਅਧਾਰਿਤ ਮੁੱਲ ਹਨ ਇਸ ਲਈ ਤੁਹਾਨੂੰ ਹਿਸਟੋਗ੍ਰਾਮ ਬਣਾਉਣ ਲਈ ਇੱਕ ਰੂਪਾਂਤਰ ਕਰਨ ਦੀ ਲੋੜ ਹੋਵੇਗੀ। ਫਿਲਟਰ ਕੀਤਾ ਡਾਟਾਫ੍ਰੇਮ ਵਰਤ ਕੇ, ਇਸ ਦੀ ਸੰਰਕਸ਼ਣ ਸਥਿਤੀ ਨੂੰ ਘੱਟੋ-ਘੱਟ ਪੰਖਾਂ ਦੀ ਚੌੜਾਈ ਦੇ ਨਾਲ ਦਿਖਾਓ। ਤੁਹਾਨੂੰ ਕੀ ਦਿਖਦਾ ਹੈ? ```python x1 = filteredBirds.loc[filteredBirds.ConservationStatus=='EX', 'MinWingspan'] x2 = filteredBirds.loc[filteredBirds.ConservationStatus=='CR', 'MinWingspan'] x3 = filteredBirds.loc[filteredBirds.ConservationStatus=='EN', 'MinWingspan'] x4 = filteredBirds.loc[filteredBirds.ConservationStatus=='NT', 'MinWingspan'] x5 = filteredBirds.loc[filteredBirds.ConservationStatus=='VU', 'MinWingspan'] x6 = filteredBirds.loc[filteredBirds.ConservationStatus=='LC', 'MinWingspan'] kwargs = dict(alpha=0.5, bins=20) plt.hist(x1, **kwargs, color='red', label='Extinct') plt.hist(x2, **kwargs, color='orange', label='Critically Endangered') plt.hist(x3, **kwargs, color='yellow', label='Endangered') plt.hist(x4, **kwargs, color='green', label='Near Threatened') plt.hist(x5, **kwargs, color='blue', label='Vulnerable') plt.hist(x6, **kwargs, color='gray', label='Least Concern') plt.gca().set(title='Conservation Status', ylabel='Min Wingspan') plt.legend(); ``` ![ਪੰਖਾਂ ਦੀ ਚੌੜਾਈ ਅਤੇ ਸੰਰਕਸ਼ਣ ਸਥਿਤੀ ਦੀ ਤੁਲਨਾ](../../../../translated_images/histogram-conservation-wb.3c40450eb072c14de7a1a3ec5c0fcba4995531024760741b392911b567fd8b70.pa.png) ਘੱਟੋ-ਘੱਟ ਪੰਖਾਂ ਦੀ ਚੌੜਾਈ ਅਤੇ ਸੰਰਕਸ਼ਣ ਸਥਿਤੀ ਦੇ ਵਿਚਕਾਰ ਕੋਈ ਵਧੀਆ ਸੰਬੰਧ ਨਹੀਂ ਲੱਗਦਾ। ਇਸ ਤਰੀਕੇ ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਡਾਟਾਸੈੱਟ ਦੇ ਹੋਰ ਤੱਤਾਂ ਦੀ ਜਾਂਚ ਕਰੋ। ਤੁਸੀਂ ਵੱਖ-ਵੱਖ ਫਿਲਟਰਾਂ ਦੀ ਕੋਸ਼ਿਸ਼ ਵੀ ਕਰ ਸਕਦੇ ਹੋ। ਕੀ ਤੁਹਾਨੂੰ ਕੋਈ ਸੰਬੰਧ ਮਿਲਦਾ ਹੈ? ## ਡੈਂਸਿਟੀ ਪਲਾਟਸ ਤੁਸੀਂ ਸ਼ਾਇਦ ਨੋਟ ਕੀਤਾ ਹੋਵੇਗਾ ਕਿ ਅਸੀਂ ਹੁਣ ਤੱਕ ਦੇਖੇ ਹਿਸਟੋਗ੍ਰਾਮ 'ਸਟੈਪਡ' ਹਨ ਅਤੇ ਇੱਕ ਆਰਕ ਵਿੱਚ ਹੌਲੀ ਨਹੀਂ ਵਗਦੇ। ਇੱਕ ਹੌਲੀ ਡੈਂਸਿਟੀ ਚਾਰਟ ਦਿਖਾਉਣ ਲਈ, ਤੁਸੀਂ ਡੈਂਸਿਟੀ ਪਲਾਟ ਦੀ ਕੋਸ਼ਿਸ਼ ਕਰ ਸਕਦੇ ਹੋ। ਡੈਂਸਿਟੀ ਪਲਾਟਸ ਨਾਲ ਕੰਮ ਕਰਨ ਲਈ, ਇੱਕ ਨਵੀਂ ਪਲਾਟਿੰਗ ਲਾਇਬ੍ਰੇਰੀ, [Seaborn](https://seaborn.pydata.org/generated/seaborn.kdeplot.html) ਨਾਲ ਜਾਣੂ ਹੋਵੋ। Seaborn ਨੂੰ ਲੋਡ ਕਰਕੇ, ਇੱਕ ਬੁਨਿਆਦੀ ਡੈਂਸਿਟੀ ਪਲਾਟ ਦੀ ਕੋਸ਼ਿਸ਼ ਕਰੋ: ```python import seaborn as sns import matplotlib.pyplot as plt sns.kdeplot(filteredBirds['MinWingspan']) plt.show() ``` ![ਡੈਂਸਿਟੀ ਪਲਾਟ](../../../../translated_images/density1.8801043bd4af2567b0f706332b5853c7614e5e4b81b457acc27eb4e092a65cbd.pa.png) ਤੁਸੀਂ ਵੇਖ ਸਕਦੇ ਹੋ ਕਿ ਇਹ ਪਲਾਟ ਘੱਟੋ-ਘੱਟ ਪੰਖਾਂ ਦੀ ਚੌੜਾਈ ਡਾਟਾ ਲਈ ਪਿਛਲੇ ਚਾਰਟ ਨੂੰ ਦੁਹਰਾਉਂਦਾ ਹੈ; ਇਹ ਸਿਰਫ਼ ਕੁਝ ਹੌਲਾ ਹੈ। Seaborn ਦੀ ਦਸਤਾਵੇਜ਼ੀ ਦੇ ਅਨੁਸਾਰ, "ਹਿਸਟੋਗ੍ਰਾਮ ਦੇ ਮੁਕਾਬਲੇ, KDE ਇੱਕ ਪਲਾਟ ਪੈਦਾ ਕਰ ਸਕਦਾ ਹੈ ਜੋ ਘੱਟ ਭਰਿਆ ਹੋਵੇ ਅਤੇ ਵਧੇਰੇ ਵਿਆਖਿਆਯੋਗ ਹੋਵੇ, ਖਾਸ ਕਰਕੇ ਜਦੋਂ ਕਈ ਡਿਸਟ੍ਰਿਬਿਊਸ਼ਨਜ਼ ਨੂੰ ਖਿੱਚਿਆ ਜਾ ਰਿਹਾ ਹੋਵੇ। ਪਰ ਇਹ ਵਿਗੜਨ ਦੀ ਸੰਭਾਵਨਾ ਰੱਖਦਾ ਹੈ ਜੇਕਰ ਅਧਾਰਭੂਤ ਡਿਸਟ੍ਰਿਬਿਊਸ਼ਨ ਬਾਊਂਡਡ ਜਾਂ ਹੌਲਾ ਨਾ ਹੋਵੇ।" [ਸਰੋਤ](https://seaborn.pydata.org/generated/seaborn.kdeplot.html) ਅਰਥਾਤ, ਆਊਟਲਾਇਅਰਜ਼ ਹਮੇਸ਼ਾ ਤੁਹਾਡੇ ਚਾਰਟਾਂ ਨੂੰ ਗਲਤ ਵਿਹਾਰ ਕਰਨ ਲਈ ਮਜਬੂਰ ਕਰ ਸਕਦੇ ਹਨ। ਜੇ ਤੁਸੀਂ ਦੂਜੇ ਚਾਰਟ ਵਿੱਚ ਉਸ ਜੱਗਡ MaxBodyMass ਲਾਈਨ ਨੂੰ ਦੁਬਾਰਾ ਵੇਖਣਾ ਚਾਹੁੰਦੇ ਹੋ, ਤਾਂ ਤੁਸੀਂ ਇਸ ਤਰੀਕੇ ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਇਸਨੂੰ ਬਹੁਤ ਚੰਗੀ ਤਰ੍ਹਾਂ ਹੌਲਾ ਕਰ ਸਕਦੇ ਹੋ: ```python sns.kdeplot(filteredBirds['MaxBodyMass']) plt.show() ``` ![ਸਮੂਥ ਸਰੀਰਕ ਭਾਰ ਲਾਈਨ](../../../../translated_images/density2.8e7647257060ff544a1aaded57e8dd1887586bfe340139e9b77ac1e5287f7977.pa.png) ਜੇ ਤੁਸੀਂ ਇੱਕ ਹੌਲੀ, ਪਰ ਬਹੁਤ ਜ਼ਿਆਦਾ ਹੌਲੀ ਲਾਈਨ ਨਹੀਂ ਚਾਹੁੰਦੇ, ਤਾਂ `bw_adjust` ਪੈਰਾਮੀਟਰ ਨੂੰ ਸੰਪਾਦਿਤ ਕਰੋ: ```python sns.kdeplot(filteredBirds['MaxBodyMass'], bw_adjust=.2) plt.show() ``` ![ਘੱਟ ਹੌਲੀ ਸਰੀਰਕ ਭਾਰ ਲਾਈਨ](../../../../translated_images/density3.84ae27da82f31e6b83ad977646f029a1d21186574d7581facd70123b3eb257ee.pa.png) ✅ ਇਸ ਕਿਸਮ ਦੇ ਪਲਾਟ ਲਈ ਉਪਲਬਧ ਪੈਰਾਮੀਟਰਾਂ ਬਾਰੇ ਪੜ੍ਹੋ ਅਤੇ ਪ੍ਰਯੋਗ ਕਰੋ! ਇਸ ਕਿਸਮ ਦਾ ਚਾਰਟ ਸੁੰਦਰ ਤਰੀਕੇ ਨਾਲ ਵਿਆਖਿਆਤਮਕ ਵਿਜੁਅਲਾਈਜ਼ੇਸ਼ਨ ਪੇਸ਼ ਕਰਦਾ ਹੈ। ਉਦਾਹਰਣ ਲਈ, ਕੁਝ ਕੋਡ ਦੀਆਂ ਲਾਈਨਾਂ ਨਾਲ, ਤੁਸੀਂ ਪੰਛੀ ਦੇ ਆਰਡਰ ਪ੍ਰਤੀ ਵੱਧ ਤੋਂ ਵੱਧ ਸਰੀਰਕ ਭਾਰ ਦੀ ਡੈਂਸਿਟੀ ਦਿਖਾ ਸਕਦੇ ਹੋ: ```python sns.kdeplot( data=filteredBirds, x="MaxBodyMass", hue="Order", fill=True, common_norm=False, palette="crest", alpha=.5, linewidth=0, ) ``` ![ਆਰਡਰ ਪ੍ਰਤੀ ਸਰੀਰਕ ਭਾਰ](../../../../translated_images/density4.e9d6c033f15c500fd33df94cb592b9f5cf1ed2a3d213c448a3f9e97ba39573ce.pa.png) ਤੁਸੀਂ ਇੱਕ ਚਾਰਟ ਵਿੱਚ ਕਈ ਤੱਤਾਂ ਦੀ ਡੈਂਸਿਟੀ ਨੂੰ ਵੀ ਮੈਪ ਕਰ ਸਕਦੇ ਹੋ। ਪੰਛੀ ਦੀ ਵੱਧ ਤੋਂ ਵੱਧ ਲੰਬਾਈ ਅਤੇ ਘੱਟੋ-ਘੱਟ ਲੰਬਾਈ ਦੀ ਸੰਰਕਸ਼ਣ ਸਥਿਤੀ ਨਾਲ ਤੁਲਨਾ ਕਰੋ: ```python sns.kdeplot(data=filteredBirds, x="MinLength", y="MaxLength", hue="ConservationStatus") ``` ![ਕਈ ਡੈਂਸਿਟੀਜ਼, ਓਵਰਲੇਪ ਕੀਤੀਆਂ](../../../../translated_images/multi.56548caa9eae8d0fd9012a8586295538c7f4f426e2abc714ba070e2e4b1fc2c1.pa.png) ਸ਼ਾਇਦ ਇਹ ਖੋਜ ਕਰਨ ਯੋਗ ਹੈ ਕਿ ਕੀ 'ਸੰਵੇਦਨਸ਼ੀਲ' ਪੰਛੀਆਂ ਦੀ ਲੰਬਾਈ ਦੇ ਅਨੁਸਾਰ ਕਲੱਸਟਰ ਮਹੱਤਵਪੂਰਨ ਹੈ ਜਾਂ ਨਹੀਂ। ## 🚀 ਚੁਣੌਤੀ ਹਿਸਟੋਗ੍ਰਾਮ ਬੁਨਿਆਦੀ ਸਕੈਟਰਪਲਾਟਸ, ਬਾਰ ਚਾਰਟਸ, ਜਾਂ ਲਾਈਨ ਚਾਰਟਸ ਨਾਲੋਂ ਵਧੇਰੇ ਸੁਧਾਰਤ ਚਾਰਟ ਦੀ ਕਿਸਮ ਹਨ। ਇੰਟਰਨੈਟ 'ਤੇ ਜਾਓ ਅਤੇ ਹਿਸਟੋਗ੍ਰਾਮ ਦੀ ਵਰਤੋਂ ਦੇ ਚੰਗੇ ਉਦਾਹਰਣ ਲੱਭੋ। ਇਹ ਕਿਵੇਂ ਵਰਤੇ ਜਾਂਦੇ ਹਨ, ਇਹ ਕੀ ਦਰਸਾਉਂਦੇ ਹਨ, ਅਤੇ ਇਹ ਕਿਹੜੇ ਖੇਤਰਾਂ ਜਾਂ ਖੋਜ ਦੇ ਖੇਤਰਾਂ ਵਿੱਚ ਵਰਤੇ ਜਾਂਦੇ --- **ਅਸਵੀਕਰਤੀ**: ਇਹ ਦਸਤਾਵੇਜ਼ AI ਅਨੁਵਾਦ ਸੇਵਾ [Co-op Translator](https://github.com/Azure/co-op-translator) ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਅਨੁਵਾਦ ਕੀਤਾ ਗਿਆ ਹੈ। ਜਦੋਂ ਕਿ ਅਸੀਂ ਸਹੀ ਹੋਣ ਦੀ ਕੋਸ਼ਿਸ਼ ਕਰਦੇ ਹਾਂ, ਕਿਰਪਾ ਕਰਕੇ ਧਿਆਨ ਦਿਓ ਕਿ ਸਵੈਚਾਲਿਤ ਅਨੁਵਾਦਾਂ ਵਿੱਚ ਗਲਤੀਆਂ ਜਾਂ ਅਸੁਚਤਤਾਵਾਂ ਹੋ ਸਕਦੀਆਂ ਹਨ। ਇਸ ਦੀ ਮੂਲ ਭਾਸ਼ਾ ਵਿੱਚ ਮੌਜੂਦ ਅਸਲ ਦਸਤਾਵੇਜ਼ ਨੂੰ ਅਧਿਕਾਰਤ ਸਰੋਤ ਮੰਨਿਆ ਜਾਣਾ ਚਾਹੀਦਾ ਹੈ। ਮਹੱਤਵਪੂਰਨ ਜਾਣਕਾਰੀ ਲਈ, ਪੇਸ਼ੇਵਰ ਮਨੁੱਖੀ ਅਨੁਵਾਦ ਦੀ ਸਿਫਾਰਸ਼ ਕੀਤੀ ਜਾਂਦੀ ਹੈ। ਇਸ ਅਨੁਵਾਦ ਦੀ ਵਰਤੋਂ ਤੋਂ ਪੈਦਾ ਹੋਣ ਵਾਲੇ ਕਿਸੇ ਵੀ ਗਲਤ ਫਹਿਮੀ ਜਾਂ ਗਲਤ ਵਿਆਖਿਆ ਲਈ ਅਸੀਂ ਜ਼ਿੰਮੇਵਾਰ ਨਹੀਂ ਹਾਂ।