You can not select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.
Data-Science-For-Beginners/translations/cs/3-Data-Visualization/R/11-visualization-proportions
leestott b83ba9ded4
🌐 Update translations via Co-op Translator
4 weeks ago
..
README.md 🌐 Update translations via Co-op Translator 4 weeks ago

README.md

Vizualizace proporcí

 Sketchnote od (@sketchthedocs)
Vizualizace proporcí - Sketchnote od @nitya

V této lekci použijete jinou datovou sadu zaměřenou na přírodu k vizualizaci proporcí, například kolik různých druhů hub se nachází v dané datové sadě o houbách. Pojďme prozkoumat tyto fascinující houby pomocí datové sady pocházející od Audubona, která obsahuje podrobnosti o 23 druzích lupenatých hub z čeledí Agaricus a Lepiota. Vyzkoušíte si chutné vizualizace, jako jsou:

  • Koláčové grafy 🥧
  • Prstencové grafy 🍩
  • Waflové grafy 🧇

💡 Velmi zajímavý projekt s názvem Charticulator od Microsoft Research nabízí bezplatné rozhraní pro vizualizaci dat pomocí přetahování. V jednom ze svých tutoriálů také používají tuto datovou sadu o houbách! Můžete tak prozkoumat data a zároveň se naučit používat tuto knihovnu: Tutoriál Charticulator.

Kvíz před lekcí

Seznamte se s houbami 🍄

Houby jsou velmi zajímavé. Naimportujme si datovou sadu, abychom je mohli studovat:

mushrooms = read.csv('../../data/mushrooms.csv')
head(mushrooms)

Tabulka se zobrazí s několika skvělými daty pro analýzu:

třída tvar klobouku povrch klobouku barva klobouku modřiny vůně připojení lupenů rozestup lupenů velikost lupenů barva lupenů tvar třeně kořen třeně povrch třeně nad prstencem povrch třeně pod prstencem barva třeně nad prstencem barva třeně pod prstencem typ závoje barva závoje počet prstenců typ prstence barva výtrusů populace prostředí
Jedovatá Konvexní Hladký Hnědá Modřiny Štiplavá Volné Těsné Úzké Černá Zvětšující se Rovný Hladký Hladký Bílá Bílá Částečný Bílá Jeden Visící Černá Rozptýlená Městské
Jedlá Konvexní Hladký Žlutá Modřiny Mandlová Volné Těsné Široké Černá Zvětšující se Kyjovitý Hladký Hladký Bílá Bílá Částečný Bílá Jeden Visící Hnědá Početná Trávy
Jedlá Zvoncovitý Hladký Bílá Modřiny Anýzová Volné Těsné Široké Hnědá Zvětšující se Kyjovitý Hladký Hladký Bílá Bílá Částečný Bílá Jeden Visící Hnědá Početná Louky
Jedovatá Konvexní Šupinatý Bílá Modřiny Štiplavá Volné Těsné Úzké Hnědá Zvětšující se Rovný Hladký Hladký Bílá Bílá Částečný Bílá Jeden Visící Černá Rozptýlená Městské
Jedlá Konvexní Hladký Zelená Bez modřin Žádná Volné Husté Široké Černá Zúžený Rovný Hladký Hladký Bílá Bílá Částečný Bílá Jeden Pomíjivý Hnědá Hojná Trávy
Jedlá Konvexní Šupinatý Žlutá Modřiny Mandlová Volné Těsné Široké Hnědá Zvětšující se Kyjovitý Hladký Hladký Bílá Bílá Částečný Bílá Jeden Visící Černá Početná Trávy

Hned si všimnete, že všechna data jsou textová. Budete je muset převést, abyste je mohli použít v grafu. Většina dat je ve skutečnosti reprezentována jako objekt:

names(mushrooms)

Výstup je:

[1] "class"                    "cap.shape"               
 [3] "cap.surface"              "cap.color"               
 [5] "bruises"                  "odor"                    
 [7] "gill.attachment"          "gill.spacing"            
 [9] "gill.size"                "gill.color"              
[11] "stalk.shape"              "stalk.root"              
[13] "stalk.surface.above.ring" "stalk.surface.below.ring"
[15] "stalk.color.above.ring"   "stalk.color.below.ring"  
[17] "veil.type"                "veil.color"              
[19] "ring.number"              "ring.type"               
[21] "spore.print.color"        "population"              
[23] "habitat"            

Vezměte tato data a převeďte sloupec 'třída' na kategorii:

library(dplyr)
grouped=mushrooms %>%
  group_by(class) %>%
  summarise(count=n())

Nyní, pokud si vytisknete data o houbách, uvidíte, že byla rozdělena do kategorií podle třídy jedovaté/jedlé:

View(grouped)
třída počet
Jedlá 4208
Jedovatá 3916

Pokud budete postupovat podle pořadí uvedeného v této tabulce při vytváření štítků kategorií, můžete vytvořit koláčový graf.

Koláč!

pie(grouped$count,grouped$class, main="Edible?")

Voila, koláčový graf zobrazující proporce těchto dat podle těchto dvou tříd hub. Je velmi důležité správně nastavit pořadí štítků, zejména zde, takže si ověřte pořadí, ve kterém je pole štítků vytvořeno!

koláčový graf

Prstence!

O něco vizuálně zajímavější koláčový graf je prstencový graf, což je koláčový graf s otvorem uprostřed. Podívejme se na naše data touto metodou.

Podívejte se na různá prostředí, kde houby rostou:

library(dplyr)
habitat=mushrooms %>%
  group_by(habitat) %>%
  summarise(count=n())
View(habitat)

Výstup je:

prostředí počet
Trávy 2148
Listí 832
Louky 292
Cesty 1144
Městské 368
Odpad 192
Lesy 3148

Zde seskupujete svá data podle prostředí. Je jich uvedeno 7, takže je použijte jako štítky pro svůj prstencový graf:

library(ggplot2)
library(webr)
PieDonut(habitat, aes(habitat, count=count))

prstencový graf

Tento kód používá dvě knihovny - ggplot2 a webr. Pomocí funkce PieDonut z knihovny webr můžeme snadno vytvořit prstencový graf!

Prstencové grafy v R lze vytvořit i pouze pomocí knihovny ggplot2. Více se o tom můžete dozvědět zde a sami si to vyzkoušet.

Nyní, když víte, jak seskupit svá data a poté je zobrazit jako koláč nebo prstenec, můžete prozkoumat další typy grafů. Vyzkoušejte waflový graf, což je jen jiný způsob zobrazení množství.

Wafle!

Waflový graf je jiný způsob vizualizace množství jako 2D pole čtverců. Zkuste vizualizovat různé množství barev klobouků hub v této datové sadě. K tomu budete potřebovat nainstalovat pomocnou knihovnu s názvem waffle a použít ji k vytvoření své vizualizace:

install.packages("waffle", repos = "https://cinc.rud.is")

Vyberte segment svých dat pro seskupení:

library(dplyr)
cap_color=mushrooms %>%
  group_by(cap.color) %>%
  summarise(count=n())
View(cap_color)

Vytvořte waflový graf vytvořením štítků a poté seskupením svých dat:

library(waffle)
names(cap_color$count) = paste0(cap_color$cap.color)
waffle((cap_color$count/10), rows = 7, title = "Waffle Chart")+scale_fill_manual(values=c("brown", "#F0DC82", "#D2691E", "green", 
                                                                                     "pink", "purple", "red", "grey", 
                                                                                     "yellow","white"))

Pomocí waflového grafu můžete jasně vidět proporce barev klobouků v této datové sadě hub. Zajímavé je, že existuje mnoho hub se zelenými klobouky!

waflový graf

V této lekci jste se naučili tři způsoby vizualizace proporcí. Nejprve musíte svá data seskupit do kategorií a poté se rozhodnout, který způsob zobrazení dat je nejlepší - koláč, prstenec nebo wafle. Všechny jsou chutné a uživateli okamžitě poskytují přehled o datové sadě.

🚀 Výzva

Zkuste znovu vytvořit tyto chutné grafy v Charticulator.

Kvíz po lekci

Přehled a samostudium

Někdy není zřejmé, kdy použít koláčový, prstencový nebo waflový graf. Zde je několik článků, které si můžete přečíst na toto téma:

https://www.beautiful.ai/blog/battle-of-the-charts-pie-chart-vs-donut-chart

https://medium.com/@hypsypops/pie-chart-vs-donut-chart-showdown-in-the-ring-5d24fd86a9ce

https://www.mit.edu/~mbarker/formula1/f1help/11-ch-c6.htm

https://medium.datadriveninvestor.com/data-visualization-done-the-right-way-with-tableau-waffle-chart-fdf2a19be402

Proveďte vlastní výzkum a najděte více informací o tomto nelehkém rozhodování.

Zadání

Vyzkoušejte to v Excelu


Prohlášení:
Tento dokument byl přeložen pomocí služby pro automatický překlad Co-op Translator. Ačkoli se snažíme o přesnost, mějte prosím na paměti, že automatické překlady mohou obsahovat chyby nebo nepřesnosti. Původní dokument v jeho původním jazyce by měl být považován za autoritativní zdroj. Pro důležité informace doporučujeme profesionální lidský překlad. Neodpovídáme za žádná nedorozumění nebo nesprávné interpretace vyplývající z použití tohoto překladu.