You can not select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.
Data-Science-For-Beginners/translations/pa/3-Data-Visualization/R/09-visualization-quantities
leestott 5391b4bc5f
🌐 Update translations via Co-op Translator
3 weeks ago
..
README.md 🌐 Update translations via Co-op Translator 3 weeks ago
assignment.md 🌐 Update translations via Co-op Translator 3 weeks ago

README.md

ਮਾਤਰਾ ਨੂੰ ਦਿਖਾਉਣਾ

 Sketchnote by (@sketchthedocs)
ਮਾਤਰਾ ਨੂੰ ਦਿਖਾਉਣਾ - ਸਕੇਚਨੋਟ @nitya ਦੁਆਰਾ

ਇਸ ਪਾਠ ਵਿੱਚ ਤੁਸੀਂ ਸਿੱਖੋਗੇ ਕਿ ਕਿਵੇਂ ਕੁਝ ਉਪਲਬਧ R ਪੈਕੇਜ ਲਾਇਬ੍ਰੇਰੀਆਂ ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਮਾਤਰਾ ਦੇ ਸੰਕਲਪ ਦੇ ਆਧਾਰ 'ਤੇ ਦਿਲਚਸਪ ਵਿਜੁਅਲਾਈਜ਼ੇਸ਼ਨ ਬਣਾਈਆਂ ਜਾ ਸਕਦੀਆਂ ਹਨ। ਮਿਨੇਸੋਟਾ ਦੇ ਪੰਛੀਆਂ ਬਾਰੇ ਇੱਕ ਸਾਫ ਕੀਤੇ ਡਾਟਾਸੈੱਟ ਦੀ ਵਰਤੋਂ ਕਰਕੇ, ਤੁਸੀਂ ਸਥਾਨਕ ਜੰਗਲੀ ਜੀਵਾਂ ਬਾਰੇ ਕਈ ਦਿਲਚਸਪ ਤੱਥ ਸਿੱਖ ਸਕਦੇ ਹੋ।

ਪਾਠ ਤੋਂ ਪਹਿਲਾਂ ਕਵਿਜ਼

ggplot2 ਨਾਲ ਪੰਖਾਂ ਦੀ ਲੰਬਾਈ ਦਾ ਅਧਿਐਨ ਕਰੋ

ਸਧਾਰਣ ਅਤੇ ਜਟਿਲ ਪਲਾਟਾਂ ਅਤੇ ਚਾਰਟਾਂ ਬਣਾਉਣ ਲਈ ਇੱਕ ਸ਼ਾਨਦਾਰ ਲਾਇਬ੍ਰੇਰੀ ਹੈ ggplot2। ਆਮ ਤੌਰ 'ਤੇ, ਇਹ ਲਾਇਬ੍ਰੇਰੀਆਂ ਵਰਤ ਕੇ ਡਾਟਾ ਪਲਾਟ ਕਰਨ ਦੀ ਪ੍ਰਕਿਰਿਆ ਵਿੱਚ ਸ਼ਾਮਲ ਹੈ: ਆਪਣੇ ਡਾਟਾਫਰੇਮ ਦੇ ਹਿੱਸਿਆਂ ਦੀ ਪਛਾਣ ਕਰਨਾ, ਜਿਨ੍ਹਾਂ ਨੂੰ ਤੁਸੀਂ ਟਾਰਗਟ ਕਰਨਾ ਚਾਹੁੰਦੇ ਹੋ, ਡਾਟੇ 'ਤੇ ਜ਼ਰੂਰੀ ਤਬਦੀਲੀਆਂ ਕਰਨਾ, ਇਸ ਦੇ x ਅਤੇ y ਐਕਸਿਸ ਮੁੱਲਾਂ ਨੂੰ ਨਿਰਧਾਰਤ ਕਰਨਾ, ਪਲਾਟ ਦੀ ਕਿਸਮ ਚੁਣਨਾ, ਅਤੇ ਫਿਰ ਪਲਾਟ ਦਿਖਾਉਣਾ।

ggplot2 ਇੱਕ ਸਿਸਟਮ ਹੈ ਜੋ ਗ੍ਰਾਫਿਕਸ ਨੂੰ ਡਿਕਲੇਰੇਟਿਵ ਢੰਗ ਨਾਲ ਬਣਾਉਂਦਾ ਹੈ, ਜੋ ਕਿ "ਗ੍ਰਾਮਰ ਆਫ ਗ੍ਰਾਫਿਕਸ" 'ਤੇ ਆਧਾਰਿਤ ਹੈ। ਗ੍ਰਾਮਰ ਆਫ ਗ੍ਰਾਫਿਕਸ ਡਾਟਾ ਵਿਜੁਅਲਾਈਜ਼ੇਸ਼ਨ ਲਈ ਇੱਕ ਆਮ ਯੋਜਨਾ ਹੈ ਜੋ ਗ੍ਰਾਫਾਂ ਨੂੰ ਅਰਥਪੂਰਨ ਹਿੱਸਿਆਂ ਵਿੱਚ ਵੰਡਦੀ ਹੈ, ਜਿਵੇਂ ਕਿ ਸਕੇਲ ਅਤੇ ਲੇਅਰ। ਸਧਾਰਣ ਸ਼ਬਦਾਂ ਵਿੱਚ, ਘੱਟ ਕੋਡ ਨਾਲ ਇੱਕਵਾਰੀ ਜਾਂ ਬਹੁਵਾਰੀ ਡਾਟੇ ਲਈ ਪਲਾਟਾਂ ਅਤੇ ਗ੍ਰਾਫਾਂ ਬਣਾਉਣ ਦੀ ਸਹੂਲਤ ggplot2 ਨੂੰ R ਵਿੱਚ ਸਭ ਤੋਂ ਪ੍ਰਸਿੱਧ ਪੈਕੇਜ ਬਣਾਉਂਦੀ ਹੈ। ਯੂਜ਼ਰ ggplot2 ਨੂੰ ਦੱਸਦਾ ਹੈ ਕਿ ਵੈਰੀਏਬਲਾਂ ਨੂੰ ਗ੍ਰਾਫਿਕਲ ਐਸਥੇਟਿਕਸ ਨਾਲ ਕਿਵੇਂ ਨਕਸ਼ਾ ਬਣਾਉਣਾ ਹੈ, ਕਿਹੜੇ ਗ੍ਰਾਫਿਕਲ ਪ੍ਰਿਮਿਟਿਵਜ਼ ਦੀ ਵਰਤੋਂ ਕਰਨੀ ਹੈ, ਅਤੇ ਬਾਕੀ ਕੰਮ ggplot2 ਕਰਦਾ ਹੈ।

ਪਲਾਟ = ਡਾਟਾ + ਐਸਥੇਟਿਕਸ + ਜਿਓਮੈਟਰੀ

  • ਡਾਟਾ ਡਾਟਾਸੈੱਟ ਨੂੰ ਦਰਸਾਉਂਦਾ ਹੈ
  • ਐਸਥੇਟਿਕਸ ਉਹ ਵੈਰੀਏਬਲ ਹਨ ਜਿਨ੍ਹਾਂ ਦਾ ਅਧਿਐਨ ਕੀਤਾ ਜਾਣਾ ਹੈ (x ਅਤੇ y ਵੈਰੀਏਬਲ)
  • ਜਿਓਮੈਟਰੀ ਪਲਾਟ ਦੀ ਕਿਸਮ ਨੂੰ ਦਰਸਾਉਂਦਾ ਹੈ (ਲਾਈਨ ਪਲਾਟ, ਬਾਰ ਪਲਾਟ, ਆਦਿ)

ਆਪਣੇ ਡਾਟੇ ਅਤੇ ਕਹਾਣੀ ਦੇ ਅਨੁਸਾਰ ਸਭ ਤੋਂ ਵਧੀਆ ਜਿਓਮੈਟਰੀ (ਪਲਾਟ ਦੀ ਕਿਸਮ) ਚੁਣੋ ਜੋ ਤੁਸੀਂ ਪਲਾਟ ਰਾਹੀਂ ਦੱਸਣਾ ਚਾਹੁੰਦੇ ਹੋ।

  • ਰੁਝਾਨਾਂ ਦਾ ਵਿਸ਼ਲੇਸ਼ਣ ਕਰਨ ਲਈ: ਲਾਈਨ, ਕਾਲਮ
  • ਮੁੱਲਾਂ ਦੀ ਤੁਲਨਾ ਕਰਨ ਲਈ: ਬਾਰ, ਕਾਲਮ, ਪਾਈ, ਸਕੈਟਰਪਲਾਟ
  • ਪੂਰੇ ਨਾਲ ਹਿੱਸਿਆਂ ਦੇ ਸੰਬੰਧ ਦਿਖਾਉਣ ਲਈ: ਪਾਈ
  • ਡਾਟੇ ਦੇ ਵੰਡਨ ਨੂੰ ਦਿਖਾਉਣ ਲਈ: ਸਕੈਟਰਪਲਾਟ, ਬਾਰ
  • ਮੁੱਲਾਂ ਦੇ ਸੰਬੰਧ ਦਿਖਾਉਣ ਲਈ: ਲਾਈਨ, ਸਕੈਟਰਪਲਾਟ, ਬਬਲ

ਤੁਸੀਂ ਇਸ ਵੇਰਵੇਦਾਰ ਚੀਟਸ਼ੀਟ ਨੂੰ ਵੀ ਦੇਖ ਸਕਦੇ ਹੋ ਜੋ ggplot2 ਲਈ ਹੈ।

ਪੰਖਾਂ ਦੀ ਵੱਧ ਤੋਂ ਵੱਧ ਲੰਬਾਈ ਬਾਰੇ ਲਾਈਨ ਪਲਾਟ ਬਣਾਓ

R ਕਨਸੋਲ ਖੋਲ੍ਹੋ ਅਤੇ ਡਾਟਾਸੈੱਟ ਇੰਪੋਰਟ ਕਰੋ।

ਨੋਟ: ਡਾਟਾਸੈੱਟ ਇਸ ਰਿਪੋ ਦੇ ਰੂਟ ਵਿੱਚ /data ਫੋਲਡਰ ਵਿੱਚ ਸਟੋਰ ਕੀਤਾ ਗਿਆ ਹੈ।

ਆਓ ਡਾਟਾਸੈੱਟ ਇੰਪੋਰਟ ਕਰੀਏ ਅਤੇ ਡਾਟੇ ਦੇ ਸਿਰਲੇਖ (ਪਹਿਲੀਆਂ 5 ਕਤਾਰਾਂ) ਨੂੰ ਦੇਖੀਏ।

birds <- read.csv("../../data/birds.csv",fileEncoding="UTF-8-BOM")
head(birds)

ਡਾਟੇ ਦੇ ਸਿਰਲੇਖ ਵਿੱਚ ਟੈਕਸਟ ਅਤੇ ਨੰਬਰਾਂ ਦਾ ਮਿਸ਼ਰਣ ਹੈ:

Name ScientificName Category Order Family Genus ConservationStatus MinLength MaxLength MinBodyMass MaxBodyMass MinWingspan MaxWingspan
0 Black-bellied whistling-duck Dendrocygna autumnalis Ducks/Geese/Waterfowl Anseriformes Anatidae Dendrocygna LC 47 56 652 1020 76 94
1 Fulvous whistling-duck Dendrocygna bicolor Ducks/Geese/Waterfowl Anseriformes Anatidae Dendrocygna LC 45 53 712 1050 85 93
2 Snow goose Anser caerulescens Ducks/Geese/Waterfowl Anseriformes Anatidae Anser LC 64 79 2050 4050 135 165
3 Ross's goose Anser rossii Ducks/Geese/Waterfowl Anseriformes Anatidae Anser LC 57.3 64 1066 1567 113 116
4 Greater white-fronted goose Anser albifrons Ducks/Geese/Waterfowl Anseriformes Anatidae Anser LC 64 81 1930 3310 130 165

ਆਓ ਕੁਝ ਨੰਬਰਾਤਮਕ ਡਾਟੇ ਨੂੰ ਇੱਕ ਬੇਸਿਕ ਲਾਈਨ ਪਲਾਟ ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਪਲਾਟ ਕਰੀਏ। ਮੰਨੋ ਤੁਸੀਂ ਇਨ੍ਹਾਂ ਦਿਲਚਸਪ ਪੰਛੀਆਂ ਲਈ ਵੱਧ ਤੋਂ ਵੱਧ ਪੰਖਾਂ ਦੀ ਲੰਬਾਈ ਦੇਖਣਾ ਚਾਹੁੰਦੇ ਹੋ।

install.packages("ggplot2")
library("ggplot2")
ggplot(data=birds, aes(x=Name, y=MaxWingspan,group=1)) +
  geom_line() 

ਇੱਥੇ, ਤੁਸੀਂ ggplot2 ਪੈਕੇਜ ਇੰਸਟਾਲ ਕਰਦੇ ਹੋ ਅਤੇ ਫਿਰ ਇਸਨੂੰ library("ggplot2") ਕਮਾਂਡ ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਵਰਕਸਪੇਸ ਵਿੱਚ ਇੰਪੋਰਟ ਕਰਦੇ ਹੋ। ggplot ਵਿੱਚ ਕੋਈ ਵੀ ਪਲਾਟ ਬਣਾਉਣ ਲਈ, ggplot() ਫੰਕਸ਼ਨ ਦੀ ਵਰਤੋਂ ਕੀਤੀ ਜਾਂਦੀ ਹੈ ਅਤੇ ਤੁਸੀਂ ਡਾਟਾਸੈੱਟ, x ਅਤੇ y ਵੈਰੀਏਬਲਾਂ ਨੂੰ ਗੁਣਾਂ ਵਜੋਂ ਨਿਰਧਾਰਤ ਕਰਦੇ ਹੋ। ਇਸ ਮਾਮਲੇ ਵਿੱਚ, ਅਸੀਂ ਲਾਈਨ ਪਲਾਟ ਪਲਾਟ ਕਰਨ ਲਈ geom_line() ਫੰਕਸ਼ਨ ਦੀ ਵਰਤੋਂ ਕਰਦੇ ਹਾਂ।

MaxWingspan-lineplot

ਤੁਰੰਤ ਕੀ ਨਜ਼ਰ ਆਉਂਦਾ ਹੈ? ਘੱਟੋ-ਘੱਟ ਇੱਕ ਆਊਟਲਾਇਰ ਹੈ - ਇਹ ਕਾਫ਼ੀ ਵੱਡੀ ਪੰਖਾਂ ਦੀ ਲੰਬਾਈ ਹੈ! 2000+ ਸੈਂਟੀਮੀਟਰ ਪੰਖਾਂ ਦੀ ਲੰਬਾਈ 20 ਮੀਟਰ ਤੋਂ ਵੱਧ ਹੈ - ਕੀ ਮਿਨੇਸੋਟਾ ਵਿੱਚ ਪਟੇਰੋਡੈਕਟਿਲ ਉੱਡ ਰਹੇ ਹਨ? ਆਓ ਜਾਂਚ ਕਰੀਏ।

ਜਦੋਂ ਤੁਸੀਂ Excel ਵਿੱਚ ਇੱਕ ਤੇਜ਼ ਸੌਰਟ ਕਰਕੇ ਉਹ ਆਊਟਲਾਇਰ ਲੱਭ ਸਕਦੇ ਹੋ, ਜੋ ਸ਼ਾਇਦ ਟਾਈਪੋਜ਼ ਹਨ, ਤਾਂ ਵੀ ਪਲਾਟ ਦੇ ਅੰਦਰੋਂ ਕੰਮ ਕਰਦੇ ਹੋਏ ਵਿਜੁਅਲਾਈਜ਼ੇਸ਼ਨ ਪ੍ਰਕਿਰਿਆ ਜਾਰੀ ਰੱਖੋ।

x-ਐਕਸਿਸ 'ਤੇ ਲੇਬਲ ਸ਼ਾਮਲ ਕਰੋ ਤਾਂ ਜੋ ਇਹ ਦਿਖਾਇਆ ਜਾ ਸਕੇ ਕਿ ਕਿਹੜੇ ਪੰਛੀ ਗੱਲ ਵਿੱਚ ਹਨ:

ggplot(data=birds, aes(x=Name, y=MaxWingspan,group=1)) +
  geom_line() +
  theme(axis.text.x = element_text(angle = 45, hjust=1))+
  xlab("Birds") +
  ylab("Wingspan (CM)") +
  ggtitle("Max Wingspan in Centimeters")

ਅਸੀਂ theme ਵਿੱਚ ਕੋਣ ਨਿਰਧਾਰਤ ਕਰਦੇ ਹਾਂ ਅਤੇ xlab() ਅਤੇ ylab() ਵਿੱਚ x ਅਤੇ y ਐਕਸਿਸ ਲੇਬਲ ਨਿਰਧਾਰਤ ਕਰਦੇ ਹਾਂ। ggtitle() ਗ੍ਰਾਫ/ਪਲਾਟ ਨੂੰ ਇੱਕ ਨਾਮ ਦਿੰਦਾ ਹੈ।

MaxWingspan-lineplot-improved

45 ਡਿਗਰੀ 'ਤੇ ਲੇਬਲਾਂ ਦੇ ਰੋਟੇਸ਼ਨ ਦੇ ਨਾਲ ਵੀ, ਇਹ ਪੜ੍ਹਨ ਲਈ ਬਹੁਤ ਜ਼ਿਆਦਾ ਹਨ। ਆਓ ਇੱਕ ਵੱਖਰੀ ਰਣਨੀਤੀ ਅਪਣਾਈਏ: ਸਿਰਫ ਉਹ ਆਊਟਲਾਇਰ ਲੇਬਲ ਕਰੋ ਅਤੇ ਪਲਾਟ ਦੇ ਅੰਦਰ ਲੇਬਲ ਸੈੱਟ ਕਰੋ। ਤੁਸੀਂ ਲੇਬਲਿੰਗ ਲਈ ਹੋਰ ਜਗ੍ਹਾ ਬਣਾਉਣ ਲਈ ਇੱਕ ਸਕੈਟਰ ਚਾਰਟ ਦੀ ਵਰਤੋਂ ਕਰ ਸਕਦੇ ਹੋ:

ggplot(data=birds, aes(x=Name, y=MaxWingspan,group=1)) +
  geom_point() +
  geom_text(aes(label=ifelse(MaxWingspan>500,as.character(Name),'')),hjust=0,vjust=0) + 
  theme(axis.title.x=element_blank(), axis.text.x=element_blank(), axis.ticks.x=element_blank())
  ylab("Wingspan (CM)") +
  ggtitle("Max Wingspan in Centimeters") + 

ਇੱਥੇ ਕੀ ਹੋ ਰਿਹਾ ਹੈ? ਤੁਸੀਂ geom_point() ਫੰਕਸ਼ਨ ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਸਕੈਟਰ ਪੌਇੰਟ ਪਲਾਟ ਕੀਤੇ। ਇਸ ਨਾਲ, ਤੁਸੀਂ ਉਹ ਪੰਛੀ ਲੇਬਲ ਕੀਤੇ ਜਿਨ੍ਹਾਂ ਦੀ MaxWingspan > 500 ਸੀ ਅਤੇ ਪਲਾਟ ਨੂੰ ਕਲਟਰ-ਫ੍ਰੀ ਬਣਾਉਣ ਲਈ x ਐਕਸਿਸ ਦੇ ਲੇਬਲਾਂ ਨੂੰ ਛੁਪਾ ਦਿੱਤਾ।

ਤੁਸੀਂ ਕੀ ਪਤਾ ਲਗਾਇਆ?

MaxWingspan-scatterplot

ਆਪਣੇ ਡਾਟੇ ਨੂੰ ਫਿਲਟਰ ਕਰੋ

ਬਾਲਡ ਈਗਲ ਅਤੇ ਪ੍ਰੇਰੀ ਫਾਲਕਨ, ਜਦੋਂ ਕਿ ਸ਼ਾਇਦ ਬਹੁਤ ਵੱਡੇ ਪੰਛੀ ਹਨ, ਸ਼ਾਇਦ ਗਲਤ ਲੇਬਲ ਕੀਤੇ ਗਏ ਹਨ, ਉਨ੍ਹਾਂ ਦੀ ਵੱਧ ਤੋਂ ਵੱਧ ਪੰਖਾਂ ਦੀ ਲੰਬਾਈ ਵਿੱਚ ਇੱਕ ਵਾਧੂ 0 ਸ਼ਾਮਲ ਹੈ। ਇਹ ਸੰਭਵ ਨਹੀਂ ਹੈ ਕਿ ਤੁਸੀਂ 25 ਮੀਟਰ ਪੰਖਾਂ ਵਾਲੇ ਬਾਲਡ ਈਗਲ ਨੂੰ ਮਿਲੋਗੇ, ਪਰ ਜੇਕਰ ਮਿਲੇ, ਤਾਂ ਕਿਰਪਾ ਕਰਕੇ ਸਾਨੂੰ ਦੱਸੋ! ਆਓ ਉਹ ਦੋ ਆਊਟਲਾਇਰਾਂ ਤੋਂ ਬਿਨਾਂ ਇੱਕ ਨਵਾਂ ਡਾਟਾਫਰੇਮ ਬਣਾਈਏ:

birds_filtered <- subset(birds, MaxWingspan < 500)

ggplot(data=birds_filtered, aes(x=Name, y=MaxWingspan,group=1)) +
  geom_point() +
  ylab("Wingspan (CM)") +
  xlab("Birds") +
  ggtitle("Max Wingspan in Centimeters") + 
  geom_text(aes(label=ifelse(MaxWingspan>500,as.character(Name),'')),hjust=0,vjust=0) +
  theme(axis.text.x=element_blank(), axis.ticks.x=element_blank())

ਅਸੀਂ ਇੱਕ ਨਵਾਂ ਡਾਟਾਫਰੇਮ birds_filtered ਬਣਾਇਆ ਅਤੇ ਫਿਰ ਇੱਕ ਸਕੈਟਰ ਪਲਾਟ ਪਲਾਟ ਕੀਤਾ। ਆਊਟਲਾਇਰਾਂ ਨੂੰ ਫਿਲਟਰ ਕਰਕੇ, ਹੁਣ ਤੁਹਾਡਾ ਡਾਟਾ ਹੋਰ ਸੰਗਠਿਤ ਅਤੇ ਸਮਝਣਯੋਗ ਹੈ।

MaxWingspan-scatterplot-improved

ਹੁਣ ਜਦੋਂ ਸਾਡੇ ਕੋਲ ਪੰਖਾਂ ਦੀ ਲੰਬਾਈ ਦੇ ਹਿਸਾਬ ਨਾਲ ਘੱਟੋ-ਘੱਟ ਇੱਕ ਸਾਫ ਡਾਟਾਸੈੱਟ ਹੈ, ਆਓ ਇਨ੍ਹਾਂ ਪੰਛੀਆਂ ਬਾਰੇ ਹੋਰ ਪਤਾ ਲਗਾਈਏ।

ਲਾਈਨ ਅਤੇ ਸਕੈਟਰ ਪਲਾਟ ਡਾਟੇ ਦੇ ਮੁੱਲਾਂ ਅਤੇ ਉਨ੍ਹਾਂ ਦੇ ਵੰਡਨ ਬਾਰੇ ਜਾਣਕਾਰੀ ਦਿਖਾ ਸਕਦੇ ਹਨ, ਪਰ ਅਸੀਂ ਇਸ ਡਾਟਾਸੈੱਟ ਵਿੱਚ ਮੌਜੂਦ ਮੁੱਲਾਂ ਬਾਰੇ ਸੋਚਣਾ ਚਾਹੁੰਦੇ ਹਾਂ। ਤੁਸੀਂ ਮਾਤਰਾ ਬਾਰੇ ਹੇਠਾਂ ਦਿੱਤੇ ਸਵਾਲਾਂ ਦੇ ਜਵਾਬ ਦੇਣ ਲਈ ਵਿਜੁਅਲਾਈਜ਼ੇਸ਼ਨ ਬਣਾ ਸਕਦੇ ਹੋ:

ਕਿੰਨੀਆਂ ਸ਼੍ਰੇਣੀਆਂ ਦੇ ਪੰਛੀ ਹਨ, ਅਤੇ ਉਨ੍ਹਾਂ ਦੀ ਗਿਣਤੀ ਕੀ ਹੈ?
ਕਿੰਨੇ ਪੰਛੀ ਲੁਪਤ, ਖਤਰੇ ਵਿੱਚ, ਦੁਲਭ ਜਾਂ ਆਮ ਹਨ?
ਲਿਨੇਅਸ ਦੀ ਟਰਮੀਨੋਲੋਜੀ ਦੇ ਅਨੁਸਾਰ ਵੱਖ-ਵੱਖ ਜਨਸ ਅਤੇ ਆਰਡਰਾਂ ਦੇ ਕਿੰਨੇ ਹਨ?

ਬਾਰ ਚਾਰਟਾਂ ਦੀ ਖੋਜ ਕਰੋ

ਜਦੋਂ ਤੁਹਾਨੂੰ ਡਾਟੇ ਦੇ ਸਮੂਹ ਦਿਖਾਉਣ ਦੀ ਲੋੜ ਹੁੰਦੀ ਹੈ, ਤਾਂ ਬਾਰ ਚਾਰਟ ਬਹੁਤ ਹੀ ਲਾਭਦਾਇਕ ਹੁੰਦੇ ਹਨ। ਆਓ ਇਸ ਡਾਟਾਸੈੱਟ ਵਿੱਚ ਮੌਜੂਦ ਪੰਛੀਆਂ ਦੀਆਂ ਸ਼੍ਰੇਣੀਆਂ ਦੀ ਖੋਜ ਕਰੀਏ ਤਾਂ ਜੋ ਇਹ ਦੇਖਿਆ ਜਾ ਸਕੇ ਕਿ ਕਿਹੜੀ ਸ਼੍ਰੇਣੀ ਸਭ ਤੋਂ ਆਮ ਹੈ।
ਆਓ ਫਿਲਟਰ ਕੀਤੇ ਡਾਟੇ 'ਤੇ ਇੱਕ ਬਾਰ ਚਾਰਟ ਬਣਾਈਏ।

install.packages("dplyr")
install.packages("tidyverse")

library(lubridate)
library(scales)
library(dplyr)
library(ggplot2)
library(tidyverse)

birds_filtered %>% group_by(Category) %>%
  summarise(n=n(),
  MinLength = mean(MinLength),
  MaxLength = mean(MaxLength),
  MinBodyMass = mean(MinBodyMass),
  MaxBodyMass = mean(MaxBodyMass),
  MinWingspan=mean(MinWingspan),
  MaxWingspan=mean(MaxWingspan)) %>% 
  gather("key", "value", - c(Category, n)) %>%
  ggplot(aes(x = Category, y = value, group = key, fill = key)) +
  geom_bar(stat = "identity") +
  scale_fill_manual(values = c("#D62728", "#FF7F0E", "#8C564B","#2CA02C", "#1F77B4", "#9467BD")) +                   
  xlab("Category")+ggtitle("Birds of Minnesota")

ਹੇਠਾਂ ਦਿੱਤੇ ਕੋਡ ਵਿੱਚ, ਅਸੀਂ dplyr ਅਤੇ lubridate ਪੈਕੇਜਾਂ ਨੂੰ ਇੰਸਟਾਲ ਕਰਦੇ ਹਾਂ ਜੋ ਡਾਟੇ ਨੂੰ ਮੈਨਿਪੂਲੇਟ ਅਤੇ ਗਰੁੱਪ ਕਰਨ ਵਿੱਚ ਮਦਦ ਕਰਦੇ ਹਨ ਤਾਂ ਜੋ ਇੱਕ ਸਟੈਕਡ ਬਾਰ ਚਾਰਟ ਪਲਾਟ ਕੀਤਾ ਜਾ ਸਕੇ। ਪਹਿਲਾਂ, ਤੁਸੀਂ ਡਾਟੇ ਨੂੰ ਪੰਛੀ ਦੀ Category ਦੇ ਅਨੁਸਾਰ ਗਰੁੱਪ ਕਰਦੇ ਹੋ ਅਤੇ ਫਿਰ MinLength, MaxLength, MinBodyMass, MaxBodyMass, MinWingspan, MaxWingspan ਕਾਲਮਾਂ ਨੂੰ ਸੰਖੇਪ ਕਰਦੇ ਹੋ। ਫਿਰ, ggplot2 ਪੈਕੇਜ ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਬਾਰ ਚਾਰਟ ਪਲਾਟ ਕਰੋ ਅਤੇ ਵੱਖ-ਵੱਖ ਸ਼੍ਰੇਣੀਆਂ ਲਈ ਰੰਗ ਅਤੇ ਲੇਬਲ ਨਿਰਧਾਰਤ ਕਰੋ।

Stacked bar chart

ਹਾਲਾਂਕਿ, ਇਹ ਬਾਰ ਚਾਰਟ ਪੜ੍ਹਨ ਯੋਗ ਨਹੀਂ ਹੈ ਕਿਉਂਕਿ ਬਹੁਤ ਸਾਰਾ ਗੈਰ-ਗਰੁੱਪ ਕੀਤਾ ਡਾਟਾ ਹੈ। ਤੁਹਾਨੂੰ ਸਿਰਫ ਉਹ ਡਾਟਾ ਚੁਣਨ ਦੀ ਲੋੜ ਹੈ ਜੋ ਤੁਸੀਂ ਪਲਾਟ ਕਰਨਾ ਚਾਹੁੰਦੇ ਹੋ, ਇਸ ਲਈ ਆਓ ਪੰਛੀ ਦੀ ਸ਼੍ਰੇਣੀ ਦੇ ਆਧਾਰ 'ਤੇ ਪੰਛੀਆਂ ਦੀ ਲੰਬਾਈ ਦੇਖੀਏ।

ਆਪਣੇ ਡਾਟੇ ਨੂੰ ਸਿਰਫ ਪੰਛੀ ਦੀ ਸ਼੍ਰੇਣੀ ਸ਼ਾਮਲ ਕਰਨ ਲਈ ਫਿਲਟਰ ਕਰੋ।

ਕਿਉਂਕਿ ਬਹੁਤ ਸਾਰੀਆਂ ਸ਼੍ਰੇਣੀਆਂ ਹਨ, ਤੁਸੀਂ ਇਸ ਚਾਰਟ ਨੂੰ ਖੜ੍ਹੇ ਰੂਪ ਵਿੱਚ ਦਿਖਾ ਸਕਦੇ ਹੋ ਅਤੇ ਸਾਰੇ ਡਾਟੇ ਨੂੰ ਸਮਾਉਣ ਲਈ ਇਸ ਦੀ ਉਚਾਈ ਨੂੰ ਠੀਕ ਕਰ ਸਕਦੇ ਹੋ:

birds_count<-dplyr::count(birds_filtered, Category, sort = TRUE)
birds_count$Category <- factor(birds_count$Category, levels = birds_count$Category)
ggplot(birds_count,aes(Category,n))+geom_bar(stat="identity")+coord_flip()

ਤੁਸੀਂ Category ਕਾਲਮ ਵਿੱਚ ਵਿਲੱਖਣ ਮੁੱਲਾਂ ਦੀ ਗਿਣਤੀ ਕਰਦੇ ਹੋ ਅਤੇ ਫਿਰ ਉਨ੍ਹਾਂ ਨੂੰ ਇੱਕ ਨਵੇਂ ਡਾਟਾਫਰੇਮ birds_count ਵਿੱਚ ਸੌਰਟ ਕਰਦੇ ਹੋ। ਇਹ ਸੌਰਟ ਕੀਤਾ ਡਾਟਾ ਫਿਰ ਇੱਕੋ ਪੱਧਰ 'ਤੇ ਫੈਕਟਰ ਕੀਤਾ ਜਾਂਦਾ ਹੈ ਤਾਂ ਜੋ ਇਹ ਸੌਰਟ ਕੀਤੇ ਤਰੀਕੇ ਨਾਲ ਪਲਾਟ ਕੀਤਾ ਜਾ ਸਕੇ। ggplot2 ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਤੁਸੀਂ ਫਿਰ ਡਾਟੇ ਨੂੰ ਇੱਕ ਬਾਰ ਚਾਰਟ ਵਿੱਚ ਪਲਾਟ ਕਰਦੇ ਹੋ। coord_flip() ਖੜ੍ਹੇ ਬਾਰ ਪਲਾਟ ਕਰਦਾ ਹੈ।

category-length

ਇਹ ਬਾਰ ਚਾਰਟ


ਅਸਵੀਕਰਤੀ:
ਇਹ ਦਸਤਾਵੇਜ਼ AI ਅਨੁਵਾਦ ਸੇਵਾ Co-op Translator ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਅਨੁਵਾਦ ਕੀਤਾ ਗਿਆ ਹੈ। ਜਦੋਂ ਕਿ ਅਸੀਂ ਸਹੀ ਹੋਣ ਦਾ ਯਤਨ ਕਰਦੇ ਹਾਂ, ਕਿਰਪਾ ਕਰਕੇ ਧਿਆਨ ਦਿਓ ਕਿ ਸਵੈਚਾਲਿਤ ਅਨੁਵਾਦਾਂ ਵਿੱਚ ਗਲਤੀਆਂ ਜਾਂ ਅਸੁਚਤਤਾਵਾਂ ਹੋ ਸਕਦੀਆਂ ਹਨ। ਮੂਲ ਦਸਤਾਵੇਜ਼ ਨੂੰ ਇਸਦੀ ਮੂਲ ਭਾਸ਼ਾ ਵਿੱਚ ਅਧਿਕਾਰਤ ਸਰੋਤ ਮੰਨਿਆ ਜਾਣਾ ਚਾਹੀਦਾ ਹੈ। ਮਹੱਤਵਪੂਰਨ ਜਾਣਕਾਰੀ ਲਈ, ਪੇਸ਼ੇਵਰ ਮਨੁੱਖੀ ਅਨੁਵਾਦ ਦੀ ਸਿਫਾਰਸ਼ ਕੀਤੀ ਜਾਂਦੀ ਹੈ। ਇਸ ਅਨੁਵਾਦ ਦੀ ਵਰਤੋਂ ਤੋਂ ਪੈਦਾ ਹੋਣ ਵਾਲੇ ਕਿਸੇ ਵੀ ਗਲਤਫਹਿਮੀ ਜਾਂ ਗਲਤ ਵਿਆਖਿਆ ਲਈ ਅਸੀਂ ਜ਼ਿੰਮੇਵਾਰ ਨਹੀਂ ਹਾਂ।