You can not select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.

11 KiB

Vizualizácia proporcií

 Sketchnote od (@sketchthedocs)
Vizualizácia proporcií - Sketchnote od @nitya

V tejto lekcii použijete dataset zameraný na prírodu na vizualizáciu proporcií, napríklad koľko rôznych druhov húb sa nachádza v danom datasete o hubách. Poďme preskúmať tieto fascinujúce huby pomocou datasetu pochádzajúceho z Audubon, ktorý obsahuje podrobnosti o 23 druhoch húb s lupeňmi z rodov Agaricus a Lepiota. Budete experimentovať s chutnými vizualizáciami, ako sú:

  • Koláčové grafy 🥧
  • Donutové grafy 🍩
  • Waflové grafy 🧇

💡 Veľmi zaujímavý projekt s názvom Charticulator od Microsoft Research ponúka bezplatné rozhranie na tvorbu vizualizácií pomocou drag and drop. V jednom z ich tutoriálov tiež používajú tento dataset o hubách! Takže môžete preskúmať dáta a zároveň sa naučiť používať túto knižnicu: Charticulator tutorial.

Kvíz pred lekciou

Spoznajte svoje huby 🍄

Huby sú veľmi zaujímavé. Importujme dataset, aby sme ich mohli študovať:

mushrooms = read.csv('../../data/mushrooms.csv')
head(mushrooms)

Tabuľka sa zobrazí s niekoľkými skvelými údajmi na analýzu:

trieda tvar klobúka povrch klobúka farba klobúka modriny vôňa pripojenie lupeňov rozostup lupeňov veľkosť lupeňov farba lupeňov tvar hlúbika koreň hlúbika povrch nad prsteňom povrch pod prsteňom farba nad prsteňom farba pod prsteňom typ závoja farba závoja počet prsteňov typ prsteňa farba výtrusov populácia biotop
Jedovatá Konvexný Hladký Hnedý Modriny Štipľavá Voľné Tesné Úzke Čierna Rozširujúci Rovný Hladký Hladký Biela Biela Čiastočný Biela Jeden Visutý Čierna Roztrúsená Mestský
Jedlá Konvexný Hladký Žltý Modriny Mandľová Voľné Tesné Široké Čierna Rozširujúci Kyjakovitý Hladký Hladký Biela Biela Čiastočný Biela Jeden Visutý Hnedá Početná Trávnaté
Jedlá Zvonovitý Hladký Biela Modriny Anízová Voľné Tesné Široké Hnedá Rozširujúci Kyjakovitý Hladký Hladký Biela Biela Čiastočný Biela Jeden Visutý Hnedá Početná Lúky
Jedovatá Konvexný Šupinatý Biela Modriny Štipľavá Voľné Tesné Úzke Hnedá Rozširujúci Rovný Hladký Hladký Biela Biela Čiastočný Biela Jeden Visutý Čierna Roztrúsená Mestský
Jedlá Konvexný Hladký Zelený Bez modrín Žiadna Voľné Preplnené Široké Čierna Zužujúci Rovný Hladký Hladký Biela Biela Čiastočný Biela Jeden Pominuteľný Hnedá Hojná Trávnaté
Jedlá Konvexný Šupinatý Žltý Modriny Mandľová Voľné Tesné Široké Hnedá Rozširujúci Kyjakovitý Hladký Hladký Biela Biela Čiastočný Biela Jeden Visutý Čierna Početná Trávnaté

Hneď si všimnete, že všetky údaje sú textové. Budete ich musieť konvertovať, aby ste ich mohli použiť v grafe. Väčšina údajov je v skutočnosti reprezentovaná ako objekt:

names(mushrooms)

Výstup je:

[1] "class"                    "cap.shape"               
 [3] "cap.surface"              "cap.color"               
 [5] "bruises"                  "odor"                    
 [7] "gill.attachment"          "gill.spacing"            
 [9] "gill.size"                "gill.color"              
[11] "stalk.shape"              "stalk.root"              
[13] "stalk.surface.above.ring" "stalk.surface.below.ring"
[15] "stalk.color.above.ring"   "stalk.color.below.ring"  
[17] "veil.type"                "veil.color"              
[19] "ring.number"              "ring.type"               
[21] "spore.print.color"        "population"              
[23] "habitat"            

Vezmite tieto údaje a konvertujte stĺpec 'trieda' na kategóriu:

library(dplyr)
grouped=mushrooms %>%
  group_by(class) %>%
  summarise(count=n())

Teraz, ak vytlačíte údaje o hubách, uvidíte, že boli rozdelené do kategórií podľa triedy jedovaté/jedlé:

View(grouped)
trieda počet
Jedlá 4208
Jedovatá 3916

Ak budete postupovať podľa poradia uvedeného v tejto tabuľke na vytvorenie kategórií tried, môžete vytvoriť koláčový graf.

Koláč!

pie(grouped$count,grouped$class, main="Edible?")

Voila, koláčový graf zobrazujúci proporcie týchto údajov podľa dvoch tried húb. Je veľmi dôležité správne zoradiť poradie štítkov, najmä tu, preto si overte poradie, v akom je pole štítkov vytvorené!

koláčový graf

Donuty!

O niečo vizuálne zaujímavejší koláčový graf je donutový graf, čo je koláčový graf s dierou v strede. Pozrime sa na naše údaje pomocou tejto metódy.

Pozrite sa na rôzne biotopy, kde huby rastú:

library(dplyr)
habitat=mushrooms %>%
  group_by(habitat) %>%
  summarise(count=n())
View(habitat)

Výstup je:

biotop počet
Trávnaté 2148
Listy 832
Lúky 292
Cesty 1144
Mestský 368
Odpad 192
Lesy 3148

Tu zoskupujete svoje údaje podľa biotopu. Je ich uvedených 7, takže ich použite ako štítky pre váš donutový graf:

library(ggplot2)
library(webr)
PieDonut(habitat, aes(habitat, count=count))

donutový graf

Tento kód používa dve knižnice - ggplot2 a webr. Pomocou funkcie PieDonut z knižnice webr môžeme ľahko vytvoriť donutový graf!

Donutové grafy v R je možné vytvoriť aj pomocou samotnej knižnice ggplot2. Viac sa o tom môžete dozvedieť tu a vyskúšať si to sami.

Teraz, keď viete, ako zoskupiť svoje údaje a potom ich zobraziť ako koláč alebo donut, môžete preskúmať iné typy grafov. Skúste waflový graf, ktorý je len iným spôsobom skúmania kvantity.

Wafle!

Graf typu 'waffle' je iný spôsob vizualizácie kvantít ako 2D pole štvorcov. Skúste vizualizovať rôzne kvantity farieb klobúkov húb v tomto datasete. Na to potrebujete nainštalovať pomocnú knižnicu s názvom waffle a použiť ju na vytvorenie svojej vizualizácie:

install.packages("waffle", repos = "https://cinc.rud.is")

Vyberte segment svojich údajov na zoskupenie:

library(dplyr)
cap_color=mushrooms %>%
  group_by(cap.color) %>%
  summarise(count=n())
View(cap_color)

Vytvorte waflový graf vytvorením štítkov a následným zoskupením údajov:

library(waffle)
names(cap_color$count) = paste0(cap_color$cap.color)
waffle((cap_color$count/10), rows = 7, title = "Waffle Chart")+scale_fill_manual(values=c("brown", "#F0DC82", "#D2691E", "green", 
                                                                                     "pink", "purple", "red", "grey", 
                                                                                     "yellow","white"))

Pomocou waflového grafu môžete jasne vidieť proporcie farieb klobúkov v tomto datasete húb. Zaujímavé je, že existuje veľa húb so zelenými klobúkmi!

waflový graf

V tejto lekcii ste sa naučili tri spôsoby vizualizácie proporcií. Najprv musíte zoskupiť svoje údaje do kategórií a potom sa rozhodnúť, ktorý spôsob zobrazenia údajov je najlepší - koláč, donut alebo waffle. Všetky sú chutné a poskytujú používateľovi okamžitý prehľad o datasete.

🚀 Výzva

Skúste tieto chutné grafy vytvoriť v Charticulator.

Kvíz po lekcii

Prehľad a samoštúdium

Niekedy nie je zrejmé, kedy použiť koláčový, donutový alebo waflový graf. Tu je niekoľko článkov na túto tému:

https://www.beautiful.ai/blog/battle-of-the-charts-pie-chart-vs-donut-chart

https://medium.com/@hypsypops/pie-chart-vs-donut-chart-showdown-in-the-ring-5d24fd86a9ce

https://www.mit.edu/~mbarker/formula1/f1help/11-ch-c6.htm

https://medium.datadriveninvestor.com/data-visualization-done-the-right-way-with-tableau-waffle-chart-fdf2a19be402

Urobte si výskum, aby ste našli viac informácií o tomto náročnom rozhodovaní.

Zadanie

Skúste to v Exceli


Upozornenie:
Tento dokument bol preložený pomocou služby AI prekladu Co-op Translator. Hoci sa snažíme o presnosť, prosím, berte na vedomie, že automatizované preklady môžu obsahovať chyby alebo nepresnosti. Pôvodný dokument v jeho pôvodnom jazyku by mal byť považovaný za autoritatívny zdroj. Pre kritické informácie sa odporúča profesionálny ľudský preklad. Nie sme zodpovední za akékoľvek nedorozumenia alebo nesprávne interpretácie vyplývajúce z použitia tohto prekladu.