You can not select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.

22 KiB

ਮਾਤਰਾ ਨੂੰ ਦ੍ਰਿਸ਼ਮਾਨ ਕਰਨਾ

 (@sketchthedocs) ਦੁਆਰਾ ਬਣਾਈ ਗਈ ਸਕੈਚਨੋਟ
ਮਾਤਰਾ ਨੂੰ ਦ੍ਰਿਸ਼ਮਾਨ ਕਰਨਾ - @nitya ਦੁਆਰਾ ਸਕੈਚਨੋਟ

ਇਸ ਪਾਠ ਵਿੱਚ ਤੁਸੀਂ ਪਾਈਥਨ ਦੀਆਂ ਉਪਲਬਧ ਲਾਇਬ੍ਰੇਰੀਆਂ ਵਿੱਚੋਂ ਇੱਕ ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਮਾਤਰਾ ਦੇ ਸੰਕਲਪ ਦੇ ਆਧਾਰ 'ਤੇ ਰੁਚਿਕਰ ਦ੍ਰਿਸ਼ਾਂ ਬਣਾਉਣ ਦੇ ਤਰੀਕੇ ਦੀ ਪੜਾਈ ਕਰੋਗੇ। ਮਿਨੇਸੋਟਾ ਦੇ ਪੰਛੀਆਂ ਬਾਰੇ ਸਾਫ ਕੀਤੇ ਗਏ ਡੇਟਾਸੈੱਟ ਦੀ ਵਰਤੋਂ ਕਰਕੇ, ਤੁਸੀਂ ਸਥਾਨਕ ਜੰਗਲੀ ਜੀਵਾਂ ਬਾਰੇ ਕਈ ਦਿਲਚਸਪ ਤੱਥ ਸਿੱਖ ਸਕਦੇ ਹੋ।

ਪਾਠ-ਪੂਰਵ ਕਵਿਜ਼

Matplotlib ਨਾਲ ਪੰਖਾਂ ਦੀ ਲੰਬਾਈ ਦਾ ਅਧਿਐਨ ਕਰੋ

ਸਧਾਰਣ ਅਤੇ ਜਟਿਲ ਦੋਹਾਂ ਕਿਸਮਾਂ ਦੇ ਪਲਾਟ ਅਤੇ ਚਾਰਟ ਬਣਾਉਣ ਲਈ ਇੱਕ ਸ਼ਾਨਦਾਰ ਲਾਇਬ੍ਰੇਰੀ ਹੈ Matplotlib। ਆਮ ਤੌਰ 'ਤੇ, ਇਨ੍ਹਾਂ ਲਾਇਬ੍ਰੇਰੀਆਂ ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਡੇਟਾ ਪਲਾਟ ਕਰਨ ਦੀ ਪ੍ਰਕਿਰਿਆ ਵਿੱਚ ਸ਼ਾਮਲ ਹੁੰਦਾ ਹੈ: ਆਪਣੇ ਡੇਟਾਫ੍ਰੇਮ ਦੇ ਉਹ ਹਿੱਸੇ ਪਛਾਣਨਾ ਜਿਨ੍ਹਾਂ ਨੂੰ ਤੁਸੀਂ ਨਿਸ਼ਾਨਾ ਬਣਾਉਣਾ ਚਾਹੁੰਦੇ ਹੋ, ਉਸ ਡੇਟਾ 'ਤੇ ਜ਼ਰੂਰੀ ਤਬਦੀਲੀਆਂ ਕਰਨਾ, ਇਸ ਦੇ x ਅਤੇ y ਧੁਰੇ ਦੀਆਂ ਮੁੱਲਾਂ ਨਿਰਧਾਰਤ ਕਰਨਾ, ਦਿਖਾਉਣ ਲਈ ਚਾਰਟ ਦੀ ਕਿਸਮ ਚੁਣਨਾ, ਅਤੇ ਫਿਰ ਪਲਾਟ ਦਿਖਾਉਣਾ। Matplotlib ਕਈ ਕਿਸਮ ਦੇ ਦ੍ਰਿਸ਼ਾਂ ਦੀ ਪੇਸ਼ਕਸ਼ ਕਰਦਾ ਹੈ, ਪਰ ਇਸ ਪਾਠ ਲਈ, ਆਓ ਉਹਨਾਂ 'ਤੇ ਧਿਆਨ ਕੇਂਦਰਿਤ ਕਰੀਏ ਜੋ ਮਾਤਰਾ ਨੂੰ ਦਿਖਾਉਣ ਲਈ ਸਭ ਤੋਂ ਉਚਿਤ ਹਨ: ਲਾਈਨ ਚਾਰਟ, ਸਕੈਟਰਪਲਾਟ, ਅਤੇ ਬਾਰ ਪਲਾਟ।

ਆਪਣੇ ਡੇਟਾ ਦੀ ਬਣਤਰ ਅਤੇ ਕਹਾਣੀ ਨੂੰ ਦੱਸਣ ਲਈ ਸਭ ਤੋਂ ਵਧੀਆ ਚਾਰਟ ਦੀ ਵਰਤੋਂ ਕਰੋ।

  • ਸਮੇਂ ਦੇ ਨਾਲ ਰੁਝਾਨਾਂ ਦਾ ਵਿਸ਼ਲੇਸ਼ਣ ਕਰਨ ਲਈ: ਲਾਈਨ
  • ਮੁੱਲਾਂ ਦੀ ਤੁਲਨਾ ਕਰਨ ਲਈ: ਬਾਰ, ਕਾਲਮ, ਪਾਈ, ਸਕੈਟਰਪਲਾਟ
  • ਦਿਖਾਉਣ ਲਈ ਕਿ ਹਿੱਸੇ ਪੂਰੇ ਨਾਲ ਕਿਵੇਂ ਸੰਬੰਧਿਤ ਹਨ: ਪਾਈ
  • ਡੇਟਾ ਦੇ ਵੰਡਨ ਨੂੰ ਦਿਖਾਉਣ ਲਈ: ਸਕੈਟਰਪਲਾਟ, ਬਾਰ
  • ਰੁਝਾਨ ਦਿਖਾਉਣ ਲਈ: ਲਾਈਨ, ਕਾਲਮ
  • ਮੁੱਲਾਂ ਦੇ ਵਿਚਕਾਰ ਸੰਬੰਧ ਦਿਖਾਉਣ ਲਈ: ਲਾਈਨ, ਸਕੈਟਰਪਲਾਟ, ਬਬਲ

ਜੇ ਤੁਹਾਡੇ ਕੋਲ ਡੇਟਾਸੈੱਟ ਹੈ ਅਤੇ ਤੁਹਾਨੂੰ ਪਤਾ ਲਗਾਉਣਾ ਹੈ ਕਿ ਕਿਸੇ ਦਿੱਤੇ ਗਏ ਆਈਟਮ ਦੀ ਮਾਤਰਾ ਕਿੰਨੀ ਹੈ, ਤਾਂ ਤੁਹਾਡਾ ਪਹਿਲਾ ਕੰਮ ਇਸ ਦੀਆਂ ਮੁੱਲਾਂ ਦੀ ਜਾਂਚ ਕਰਨਾ ਹੋਵੇਗਾ।

Matplotlib ਲਈ ਬਹੁਤ ਵਧੀਆ 'ਚੀਟ ਸ਼ੀਟ' ਇੱਥੇ ਉਪਲਬਧ ਹਨ।

ਪੰਛੀਆਂ ਦੇ ਪੰਖਾਂ ਦੀ ਲੰਬਾਈ ਬਾਰੇ ਲਾਈਨ ਪਲਾਟ ਬਣਾਓ

ਪਾਠ ਫੋਲਡਰ ਦੇ ਰੂਟ ਵਿੱਚ notebook.ipynb ਫਾਈਲ ਖੋਲ੍ਹੋ ਅਤੇ ਇੱਕ ਸੈੱਲ ਸ਼ਾਮਲ ਕਰੋ।

ਨੋਟ: ਡੇਟਾ ਇਸ ਰਿਪੋਜ਼ਟਰੀ ਦੇ ਰੂਟ ਵਿੱਚ /data ਫੋਲਡਰ ਵਿੱਚ ਸਟੋਰ ਕੀਤਾ ਗਿਆ ਹੈ।

import pandas as pd
import matplotlib.pyplot as plt
birds = pd.read_csv('../../data/birds.csv')
birds.head()

ਇਹ ਡੇਟਾ ਪਾਠ ਅਤੇ ਅੰਕਾਂ ਦਾ ਮਿਸ਼ਰਣ ਹੈ:

Name ScientificName Category Order Family Genus ConservationStatus MinLength MaxLength MinBodyMass MaxBodyMass MinWingspan MaxWingspan
0 Black-bellied whistling-duck Dendrocygna autumnalis Ducks/Geese/Waterfowl Anseriformes Anatidae Dendrocygna LC 47 56 652 1020 76 94
1 Fulvous whistling-duck Dendrocygna bicolor Ducks/Geese/Waterfowl Anseriformes Anatidae Dendrocygna LC 45 53 712 1050 85 93
2 Snow goose Anser caerulescens Ducks/Geese/Waterfowl Anseriformes Anatidae Anser LC 64 79 2050 4050 135 165
3 Ross's goose Anser rossii Ducks/Geese/Waterfowl Anseriformes Anatidae Anser LC 57.3 64 1066 1567 113 116
4 Greater white-fronted goose Anser albifrons Ducks/Geese/Waterfowl Anseriformes Anatidae Anser LC 64 81 1930 3310 130 165

ਆਓ ਕੁਝ ਅੰਕਗਣਿਤ ਡੇਟਾ ਨੂੰ ਇੱਕ ਬੁਨਿਆਦੀ ਲਾਈਨ ਪਲਾਟ ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਪਲਾਟ ਕਰੀਏ। ਮੰਨੋ ਤੁਸੀਂ ਇਨ੍ਹਾਂ ਦਿਲਚਸਪ ਪੰਛੀਆਂ ਲਈ ਵੱਧ ਤੋਂ ਵੱਧ ਪੰਖਾਂ ਦੀ ਲੰਬਾਈ ਦੇਖਣਾ ਚਾਹੁੰਦੇ ਹੋ।

wingspan = birds['MaxWingspan'] 
wingspan.plot()

ਵੱਧ ਤੋਂ ਵੱਧ ਪੰਖਾਂ ਦੀ ਲੰਬਾਈ

ਤੁਰੰਤ ਕੀ ਨਜ਼ਰ ਆਉਂਦਾ ਹੈ? ਘੱਟੋ-ਘੱਟ ਇੱਕ ਆਉਟਲਾਇਰ ਹੈ - ਇਹ ਕਾਫ਼ੀ ਪੰਖਾਂ ਦੀ ਲੰਬਾਈ ਹੈ! 2300 ਸੈਂਟੀਮੀਟਰ ਪੰਖਾਂ ਦੀ ਲੰਬਾਈ 23 ਮੀਟਰ ਦੇ ਬਰਾਬਰ ਹੈ - ਕੀ ਮਿਨੇਸੋਟਾ ਵਿੱਚ ਪਟੇਰੋਡੈਕਟਿਲ ਉੱਡ ਰਹੇ ਹਨ? ਆਓ ਜਾਂਚ ਕਰੀਏ।

ਹਾਲਾਂਕਿ ਤੁਸੀਂ Excel ਵਿੱਚ ਇੱਕ ਤੇਜ਼ ਸੌਰਟ ਕਰਕੇ ਉਹ ਆਉਟਲਾਇਰ ਲੱਭ ਸਕਦੇ ਹੋ, ਜੋ ਸ਼ਾਇਦ ਟਾਈਪੋਜ਼ ਹਨ, ਪਲਾਟ ਦੇ ਅੰਦਰੋਂ ਦ੍ਰਿਸ਼ਾਂ ਦੀ ਪ੍ਰਕਿਰਿਆ ਜਾਰੀ ਰੱਖੋ।

x-ਅਕਸ 'ਤੇ ਲੇਬਲ ਸ਼ਾਮਲ ਕਰੋ ਤਾਂ ਜੋ ਇਹ ਦਿਖਾਇਆ ਜਾ ਸਕੇ ਕਿ ਕਿਹੜੇ ਕਿਸਮ ਦੇ ਪੰਛੀ ਗੱਲ ਕਰ ਰਹੇ ਹਨ:

plt.title('Max Wingspan in Centimeters')
plt.ylabel('Wingspan (CM)')
plt.xlabel('Birds')
plt.xticks(rotation=45)
x = birds['Name'] 
y = birds['MaxWingspan']

plt.plot(x, y)

plt.show()

ਲੇਬਲ ਨਾਲ ਪੰਖਾਂ ਦੀ ਲੰਬਾਈ

45 ਡਿਗਰੀ 'ਤੇ ਲੇਬਲਾਂ ਦੇ ਘੁੰਮਣ ਦੇ ਬਾਵਜੂਦ, ਇਹ ਪੜ੍ਹਨ ਲਈ ਬਹੁਤ ਜ਼ਿਆਦਾ ਹਨ। ਆਓ ਇੱਕ ਵੱਖਰਾ ਤਰੀਕਾ ਅਜ਼ਮਾਈਏ: ਸਿਰਫ ਉਹਨਾਂ ਆਉਟਲਾਇਰਾਂ ਨੂੰ ਲੇਬਲ ਕਰੋ ਅਤੇ ਚਾਰਟ ਦੇ ਅੰਦਰ ਲੇਬਲ ਸੈੱਟ ਕਰੋ। ਤੁਸੀਂ ਲੇਬਲਿੰਗ ਲਈ ਹੋਰ ਜਗ੍ਹਾ ਬਣਾਉਣ ਲਈ ਇੱਕ ਸਕੈਟਰ ਚਾਰਟ ਦੀ ਵਰਤੋਂ ਕਰ ਸਕਦੇ ਹੋ:

plt.title('Max Wingspan in Centimeters')
plt.ylabel('Wingspan (CM)')
plt.tick_params(axis='both',which='both',labelbottom=False,bottom=False)

for i in range(len(birds)):
    x = birds['Name'][i]
    y = birds['MaxWingspan'][i]
    plt.plot(x, y, 'bo')
    if birds['MaxWingspan'][i] > 500:
        plt.text(x, y * (1 - 0.05), birds['Name'][i], fontsize=12)
    
plt.show()

ਇੱਥੇ ਕੀ ਹੋ ਰਿਹਾ ਹੈ? ਤੁਸੀਂ tick_params ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਹੇਠਾਂ ਦੇ ਲੇਬਲਾਂ ਨੂੰ ਲੁਕਾਇਆ ਅਤੇ ਫਿਰ ਆਪਣੇ ਪੰਛੀਆਂ ਦੇ ਡੇਟਾਸੈੱਟ 'ਤੇ ਇੱਕ ਲੂਪ ਬਣਾਇਆ। bo ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਛੋਟੇ ਨੀਲੇ ਗੋਲ ਡਾਟਾਂ ਨਾਲ ਚਾਰਟ ਪਲਾਟ ਕਰਦੇ ਹੋਏ, ਤੁਸੀਂ ਕਿਸੇ ਵੀ ਪੰਛੀ ਦੀ ਜਾਂਚ ਕੀਤੀ ਜਿਸ ਦੀ ਵੱਧ ਤੋਂ ਵੱਧ ਪੰਖਾਂ ਦੀ ਲੰਬਾਈ 500 ਤੋਂ ਵੱਧ ਸੀ ਅਤੇ ਜੇਕਰ ਹੋਵੇ ਤਾਂ ਡਾਟ ਦੇ ਕੋਲ ਉਸ ਦਾ ਲੇਬਲ ਦਿਖਾਇਆ। ਤੁਸੀਂ y-ਅਕਸ 'ਤੇ ਲੇਬਲਾਂ ਨੂੰ ਥੋੜ੍ਹਾ ਜਿਹਾ ਹਟਾਇਆ (y * (1 - 0.05)) ਅਤੇ ਪੰਛੀ ਦੇ ਨਾਮ ਨੂੰ ਲੇਬਲ ਵਜੋਂ ਵਰਤਿਆ।

ਤੁਸੀਂ ਕੀ ਪਤਾ ਲਗਾਇਆ?

ਆਉਟਲਾਇਰ

ਆਪਣੇ ਡੇਟਾ ਨੂੰ ਫਿਲਟਰ ਕਰੋ

ਬਾਲਡ ਈਗਲ ਅਤੇ ਪ੍ਰੇਰੀ ਫਾਲਕਨ, ਹਾਲਾਂਕਿ ਸ਼ਾਇਦ ਬਹੁਤ ਵੱਡੇ ਪੰਛੀ ਹਨ, ਪਰ ਉਹ ਗਲਤ ਲੇਬਲ ਕੀਤੇ ਹੋਏ ਲੱਗਦੇ ਹਨ, ਉਨ੍ਹਾਂ ਦੀ ਵੱਧ ਤੋਂ ਵੱਧ ਪੰਖਾਂ ਦੀ ਲੰਬਾਈ ਵਿੱਚ ਇੱਕ ਵਾਧੂ 0 ਸ਼ਾਮਲ ਹੈ। ਇਹ ਸੰਭਾਵਨਾ ਘੱਟ ਹੈ ਕਿ ਤੁਸੀਂ 25 ਮੀਟਰ ਪੰਖਾਂ ਵਾਲੇ ਬਾਲਡ ਈਗਲ ਨੂੰ ਮਿਲੋਗੇ, ਪਰ ਜੇਕਰ ਮਿਲੇ, ਤਾਂ ਕਿਰਪਾ ਕਰਕੇ ਸਾਨੂੰ ਦੱਸੋ! ਆਓ ਇੱਕ ਨਵਾਂ ਡੇਟਾਫ੍ਰੇਮ ਬਣਾਈਏ ਜਿਸ ਵਿੱਚ ਉਹ ਦੋ ਆਉਟਲਾਇਰ ਸ਼ਾਮਲ ਨਾ ਹੋਣ:

plt.title('Max Wingspan in Centimeters')
plt.ylabel('Wingspan (CM)')
plt.xlabel('Birds')
plt.tick_params(axis='both',which='both',labelbottom=False,bottom=False)
for i in range(len(birds)):
    x = birds['Name'][i]
    y = birds['MaxWingspan'][i]
    if birds['Name'][i] not in ['Bald eagle', 'Prairie falcon']:
        plt.plot(x, y, 'bo')
plt.show()

ਆਉਟਲਾਇਰਾਂ ਨੂੰ ਫਿਲਟਰ ਕਰਕੇ, ਹੁਣ ਤੁਹਾਡਾ ਡੇਟਾ ਹੋਰ ਸੰਗਠਿਤ ਅਤੇ ਸਮਝਣਯੋਗ ਹੈ।

ਪੰਖਾਂ ਦੀ ਲੰਬਾਈ ਦਾ ਸਕੈਟਰਪਲਾਟ

ਹੁਣ ਜਦੋਂ ਸਾਡੇ ਕੋਲ ਘੱਟੋ-ਘੱਟ ਪੰਖਾਂ ਦੀ ਲੰਬਾਈ ਦੇ ਹਿੱਸੇ ਵਿੱਚ ਇੱਕ ਸਾਫ਼ ਡੇਟਾਸੈੱਟ ਹੈ, ਆਓ ਇਹਨਾਂ ਪੰਛੀਆਂ ਬਾਰੇ ਹੋਰ ਪਤਾ ਲਗਾਈਏ।

ਜਦੋਂ ਕਿ ਲਾਈਨ ਅਤੇ ਸਕੈਟਰ ਪਲਾਟ ਡੇਟਾ ਮੁੱਲਾਂ ਅਤੇ ਉਨ੍ਹਾਂ ਦੇ ਵੰਡਨ ਬਾਰੇ ਜਾਣਕਾਰੀ ਦਿਖਾ ਸਕਦੇ ਹਨ, ਅਸੀਂ ਇਸ ਡੇਟਾਸੈੱਟ ਵਿੱਚ ਮੌਜੂਦ ਮੁੱਲਾਂ ਬਾਰੇ ਸੋਚਣਾ ਚਾਹੁੰਦੇ ਹਾਂ। ਤੁਸੀਂ ਮਾਤਰਾ ਬਾਰੇ ਹੇਠਾਂ ਦਿੱਤੇ ਸਵਾਲਾਂ ਦੇ ਜਵਾਬ ਦੇਣ ਲਈ ਦ੍ਰਿਸ਼ਾਂ ਬਣਾਉਣ ਦੀ ਕੋਸ਼ਿਸ਼ ਕਰ ਸਕਦੇ ਹੋ:

ਪੰਛੀਆਂ ਦੀਆਂ ਕਿੰਨੀ ਸ਼੍ਰੇਣੀਆਂ ਹਨ, ਅਤੇ ਉਨ੍ਹਾਂ ਦੀ ਗਿਣਤੀ ਕੀ ਹੈ?
ਕਿੰਨੇ ਪੰਛੀ ਲੁਪਤ, ਖਤਰੇ ਵਿੱਚ, ਦੁਲਭ ਜਾਂ ਆਮ ਹਨ?
ਲਿਨੇਅਸ ਦੀ ਸ਼ਬਦਾਵਲੀ ਵਿੱਚ ਵੱਖ-ਵੱਖ ਜ਼ਨਸ ਅਤੇ ਆਰਡਰਾਂ ਦੀ ਗਿਣਤੀ ਕਿੰਨੀ ਹੈ?

ਬਾਰ ਚਾਰਟ ਦੀ ਪੜਚੋਲ ਕਰੋ

ਜਦੋਂ ਤੁਹਾਨੂੰ ਡੇਟਾ ਦੇ ਸਮੂਹ ਦਿਖਾਉਣ ਦੀ ਲੋੜ ਹੁੰਦੀ ਹੈ, ਤਾਂ ਬਾਰ ਚਾਰਟ ਵਿਹਾਰਕ ਹੁੰਦੇ ਹਨ। ਆਓ ਇਸ ਡੇਟਾਸੈੱਟ ਵਿੱਚ ਮੌਜੂਦ ਪੰਛੀਆਂ ਦੀਆਂ ਸ਼੍ਰੇਣੀਆਂ ਦੀ ਪੜਚੋਲ ਕਰੀਏ ਤਾਂ ਜੋ ਵੇਖ ਸਕੀਏ ਕਿ ਕਿਹੜੀ ਸਭ ਤੋਂ ਆਮ ਹੈ।

ਨੋਟਬੁੱਕ ਫਾਈਲ ਵਿੱਚ ਇੱਕ ਬੁਨਿਆਦੀ ਬਾਰ ਚਾਰਟ ਬਣਾਓ

ਨੋਟ, ਤੁਸੀਂ ਪਿਛਲੇ ਭਾਗ ਵਿੱਚ ਪਛਾਣੇ ਗਏ ਦੋ ਆਉਟਲਾਇਰ ਪੰਛੀਆਂ ਨੂੰ ਫਿਲਟਰ ਕਰ ਸਕਦੇ ਹੋ, ਉਨ੍ਹਾਂ ਦੀ ਪੰਖਾਂ ਦੀ ਲੰਬਾਈ ਵਿੱਚ ਟਾਈਪੋ ਨੂੰ ਸੋਧ ਸਕਦੇ ਹੋ, ਜਾਂ ਉਨ੍ਹਾਂ ਨੂੰ ਇਨ੍ਹਾਂ ਅਭਿਆਸਾਂ ਲਈ ਛੱਡ ਸਕਦੇ ਹੋ ਜੋ ਪੰਖਾਂ ਦੀ ਲੰਬਾਈ ਦੇ ਮੁੱਲਾਂ 'ਤੇ ਨਿਰਭਰ ਨਹੀਂ ਕਰਦੇ।

ਜੇ ਤੁਸੀਂ ਇੱਕ ਬਾਰ ਚਾਰਟ ਬਣਾਉਣਾ ਚਾਹੁੰਦੇ ਹੋ, ਤਾਂ ਤੁਸੀਂ ਉਸ ਡੇਟਾ ਨੂੰ ਚੁਣ ਸਕਦੇ ਹੋ ਜਿਸ 'ਤੇ ਤੁਸੀਂ ਧਿਆਨ ਕੇਂਦਰਿਤ ਕਰਨਾ ਚਾਹੁੰਦੇ ਹੋ। ਬਾਰ ਚਾਰਟ ਕੱਚੇ ਡੇਟਾ ਤੋਂ ਬਣਾਏ ਜਾ ਸਕਦੇ ਹਨ:

birds.plot(x='Category',
        kind='bar',
        stacked=True,
        title='Birds of Minnesota')

ਪੂਰੇ ਡੇਟਾ ਨੂੰ ਬਾਰ ਚਾਰਟ ਵਜੋਂ

ਪਰ ਇਹ ਬਾਰ ਚਾਰਟ ਪੜ੍ਹਨ ਯੋਗ ਨਹੀਂ ਹੈ ਕਿਉਂਕਿ ਬਹੁਤ ਜ਼ਿਆਦਾ ਗੈਰ-ਸਮੂਹਬੱਧ ਡੇਟਾ ਹੈ। ਤੁਹਾਨੂੰ ਸਿਰਫ਼ ਉਸ ਡੇਟਾ ਨੂੰ ਚੁਣਨਾ ਚਾਹੀਦਾ ਹੈ ਜਿਸ ਨੂੰ ਤੁਸੀਂ ਪਲਾਟ ਕਰਨਾ ਚਾਹੁੰਦੇ ਹੋ, ਇਸ ਲਈ ਆਓ ਪੰਛੀਆਂ ਦੀ ਸ਼੍ਰੇਣੀ ਦੇ ਆਧਾਰ 'ਤੇ ਉਨ੍ਹਾਂ ਦੀ ਲੰਬਾਈ ਦੇਖੀਏ।

ਆਪਣੇ ਡੇਟਾ ਨੂੰ ਸਿਰਫ਼ ਪੰਛੀਆਂ ਦੀ ਸ਼੍ਰੇਣੀ ਸ਼ਾਮਲ ਕਰਨ ਲਈ ਫਿਲਟਰ ਕਰੋ।

ਧਿਆਨ ਦਿਓ ਕਿ ਤੁਸੀਂ ਡੇਟਾ ਨੂੰ ਪ੍ਰਬੰਧਿਤ ਕਰਨ ਲਈ Pandas ਦੀ ਵਰਤੋਂ ਕਰਦੇ ਹੋ, ਅਤੇ ਫਿਰ ਚਾਰਟਿੰਗ ਲਈ Matplotlib ਦੀ ਵਰਤੋਂ ਕਰਦੇ ਹੋ।

ਕਿਉਂਕਿ ਬਹੁਤ ਸਾਰੀਆਂ ਸ਼੍ਰੇਣੀਆਂ ਹਨ, ਤੁਸੀਂ ਇਸ ਚਾਰਟ ਨੂੰ ਖੜ੍ਹਾ ਦਿਖਾ ਸਕਦੇ ਹੋ ਅਤੇ ਸਾਰੇ ਡੇਟਾ ਲਈ ਇਸ ਦੀ ਉਚਾਈ ਨੂੰ ਠੀਕ ਕਰ ਸਕਦੇ ਹੋ:

category_count = birds.value_counts(birds['Category'].values, sort=True)
plt.rcParams['figure.figsize'] = [6, 12]
category_count.plot.barh()

ਸ਼੍ਰੇਣੀ ਅਤੇ ਲੰਬਾਈ

ਇਹ ਬਾਰ ਚਾਰਟ ਪੰਛੀਆਂ ਦੀ ਹਰ ਸ਼੍ਰੇਣੀ ਦੀ ਗਿਣਤੀ ਦਾ ਇੱਕ ਵਧੀਆ ਦ੍ਰਿਸ਼ ਦਿਖਾਉਂਦਾ ਹੈ। ਇੱਕ ਨਜ਼ਰ ਵਿੱਚ, ਤੁਸੀਂ ਵੇਖ ਸਕਦੇ ਹੋ ਕਿ ਇਸ ਖੇਤਰ ਵਿੱਚ ਸਭ ਤੋਂ ਵੱਧ ਪੰਛੀ Ducks/Geese/Waterfowl ਸ਼੍ਰੇਣੀ ਵਿੱਚ ਹਨ। ਮਿਨੇਸੋਟਾ 'ਦਸ ਹਜ਼ਾਰ ਝੀਲਾਂ ਦੀ ਧਰਤੀ' ਹੈ, ਇਸ ਲਈ ਇਹ ਹੈਰਾਨੀਜਨਕ ਨਹੀਂ ਹੈ!

ਇਸ ਡੇਟਾਸੈੱਟ 'ਤੇ ਕੁਝ ਹੋਰ ਗਿਣਤੀਆਂ ਦੀ ਕੋਸ਼ਿਸ਼ ਕਰੋ। ਕੀ ਕੁਝ ਤੁਹਾਨੂੰ ਹੈਰਾਨ ਕਰਦਾ ਹੈ?

ਡੇਟਾ ਦੀ ਤੁਲਨਾ

ਤੁਸੀਂ ਨਵੀਆਂ ਧੁਰਾਂ ਬਣਾਕੇ ਸਮੂਹਬੱਧ ਡੇਟਾ ਦੀ ਵੱਖ-ਵੱਖ ਤਰ੍ਹਾਂ ਤੁਲਨਾ ਕਰ ਸਕਦੇ ਹੋ। ਪੰਛੀ ਦੀ ਸ਼੍ਰੇਣੀ ਦੇ ਆਧਾਰ 'ਤੇ ਪੰਛੀ ਦੀ ਵੱਧ ਤੋਂ ਵੱਧ ਲੰਬਾਈ ਦੀ ਤੁਲਨਾ ਕਰਨ ਦੀ ਕੋਸ਼ਿਸ਼ ਕਰੋ:

maxlength = birds['MaxLength']
plt.barh(y=birds['Category'], width=maxlength)
plt.rcParams['figure.figsize'] = [6, 12]
plt.show()

ਡੇਟਾ ਦੀ ਤੁਲਨਾ

ਇੱਥੇ ਕੁਝ ਵੀ ਹੈਰਾਨੀਜਨਕ ਨਹੀਂ ਹੈ: ਹਮਿੰਗਬਰਡ ਦੀ ਵੱਧ ਤੋਂ ਵੱਧ ਲੰਬਾਈ ਪੈਲਿਕਨ ਜਾਂ ਗੀਸ ਨਾਲੋਂ ਘੱਟ ਹੈ। ਇਹ ਚੰਗਾ ਹੈ ਜਦੋਂ ਡੇਟਾ ਤਰਕਸੰਗਤ ਲੱਗਦਾ ਹੈ!

ਤੁਸੀਂ ਬਾਰ ਚਾਰਟ ਦੇ ਹੋਰ ਦਿਲਚਸਪ ਦ੍ਰਿਸ਼ ਬਣਾਉਣ ਲਈ ਡੇਟਾ ਨੂੰ ਓਵਰਲੇਪ ਕਰ ਸਕਦੇ ਹੋ। ਆਓ ਇੱਕ ਦਿੱਤੀ ਗਈ ਪੰਛੀ ਦੀ ਸ਼੍ਰੇਣੀ 'ਤੇ ਘੱਟੋ-ਘੱਟ ਅਤੇ ਵੱਧ ਤੋਂ ਵੱਧ ਲੰਬਾਈ ਨੂੰ ਓਵਰਲੇਪ ਕਰੀਏ:

minLength = birds['MinLength']
maxLength = birds['MaxLength']
category = birds['Category']

plt.barh(category, maxLength)
plt.barh(category, minLength)

plt.show()

ਇਸ ਪਲਾਟ ਵਿੱਚ, ਤੁਸੀਂ ਘੱਟੋ-ਘੱਟ ਅਤੇ ਵੱਧ ਤੋਂ ਵੱਧ ਲੰਬਾਈ ਦੀ ਸ਼੍ਰੇਣੀ ਨੂੰ ਪੰਛੀ ਦੀ ਸ਼੍ਰੇਣੀ ਦੇ ਆਧਾਰ 'ਤੇ ਵੇਖ ਸਕਦੇ ਹੋ। ਤੁਸੀਂ ਨਿਸ਼ਚਿਤ ਤੌਰ 'ਤੇ ਕਹਿ ਸਕਦੇ ਹੋ ਕਿ, ਇਸ ਡੇਟਾ ਦੇ ਅਨੁਸਾਰ, ਜਿੰਨਾ ਵੱਡਾ ਪੰਛੀ, ਉਸ ਦੀ ਲੰਬਾਈ ਦੀ ਸ਼੍ਰੇਣੀ ਉਤਨੀ ਹੀ ਵੱਡੀ। ਦਿਲਚਸਪ!

ਓਵਰਲੇਪ ਕੀਤੇ ਮੁੱਲ

🚀 ਚੁਣੌਤੀ

ਇਹ ਪੰਛੀ ਡੇਟਾਸੈੱਟ ਕਿਸੇ ਖਾਸ ਪਰਿਸਥਿਤਿਕ ਤੰਤਰ ਵਿੱਚ ਵੱਖ-ਵੱਖ ਕਿਸਮ ਦੇ ਪੰ


ਅਸਵੀਕਾਰਨਾ:
ਇਹ ਦਸਤਾਵੇਜ਼ AI ਅਨੁਵਾਦ ਸੇਵਾ Co-op Translator ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਅਨੁਵਾਦ ਕੀਤਾ ਗਿਆ ਹੈ। ਜਦੋਂ ਕਿ ਅਸੀਂ ਸਹੀ ਹੋਣ ਦੀ ਕੋਸ਼ਿਸ਼ ਕਰਦੇ ਹਾਂ, ਕਿਰਪਾ ਕਰਕੇ ਧਿਆਨ ਦਿਓ ਕਿ ਸਵੈਚਾਲਿਤ ਅਨੁਵਾਦਾਂ ਵਿੱਚ ਗਲਤੀਆਂ ਜਾਂ ਅਸੁਚੱਜੇਪਣ ਹੋ ਸਕਦੇ ਹਨ। ਮੂਲ ਦਸਤਾਵੇਜ਼ ਨੂੰ ਇਸਦੀ ਮੂਲ ਭਾਸ਼ਾ ਵਿੱਚ ਅਧਿਕਾਰਤ ਸਰੋਤ ਮੰਨਿਆ ਜਾਣਾ ਚਾਹੀਦਾ ਹੈ। ਮਹੱਤਵਪੂਰਨ ਜਾਣਕਾਰੀ ਲਈ, ਪੇਸ਼ੇਵਰ ਮਨੁੱਖੀ ਅਨੁਵਾਦ ਦੀ ਸਿਫਾਰਸ਼ ਕੀਤੀ ਜਾਂਦੀ ਹੈ। ਇਸ ਅਨੁਵਾਦ ਦੀ ਵਰਤੋਂ ਤੋਂ ਪੈਦਾ ਹੋਣ ਵਾਲੇ ਕਿਸੇ ਵੀ ਗਲਤਫਹਿਮੀ ਜਾਂ ਗਲਤ ਵਿਆਖਿਆ ਲਈ ਅਸੀਂ ਜ਼ਿੰਮੇਵਾਰ ਨਹੀਂ ਹਾਂ।