You can not select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.
Data-Science-For-Beginners/translations/de/3-Data-Visualization/R/11-visualization-proportions
leestott cfd74ebbf1
🌐 Update translations via Co-op Translator
4 weeks ago
..
README.md 🌐 Update translations via Co-op Translator 4 weeks ago

README.md

Visualisierung von Proportionen

 Sketchnote von (@sketchthedocs)
Visualisierung von Proportionen - Sketchnote von @nitya

In dieser Lektion wirst du ein naturbezogenes Datenset verwenden, um Proportionen zu visualisieren, wie z. B. die Anzahl der verschiedenen Pilzarten in einem Datenset über Pilze. Lass uns diese faszinierenden Pilze mit einem Datenset erkunden, das von Audubon stammt und Details zu 23 Arten von Lamellenpilzen aus den Familien Agaricus und Lepiota enthält. Du wirst mit köstlichen Visualisierungen experimentieren, wie:

  • Tortendiagramme 🥧
  • Donut-Diagramme 🍩
  • Waffel-Diagramme 🧇

💡 Ein sehr interessantes Projekt namens Charticulator von Microsoft Research bietet eine kostenlose Drag-and-Drop-Oberfläche für Datenvisualisierungen. In einem ihrer Tutorials verwenden sie ebenfalls dieses Pilz-Datenset! Du kannst also die Daten erkunden und gleichzeitig die Bibliothek kennenlernen: Charticulator-Tutorial.

Quiz vor der Lektion

Lerne deine Pilze kennen 🍄

Pilze sind sehr interessant. Lass uns ein Datenset importieren, um sie zu untersuchen:

mushrooms = read.csv('../../data/mushrooms.csv')
head(mushrooms)

Eine Tabelle wird ausgegeben, die großartige Daten für die Analyse enthält:

Klasse Hutform Hutoberfläche Hutfarbe Druckstellen Geruch Lamellenansatz Lamellenabstand Lamellengröße Lamellenfarbe Stielform Stielbasis Stieloberfläche über dem Ring Stieloberfläche unter dem Ring Stielfarbe über dem Ring Stielfarbe unter dem Ring Schleierart Schleierfarbe Ringanzahl Ringart Sporenabdruckfarbe Population Lebensraum
Giftig Konvex Glatt Braun Druckstellen Stechend Frei Eng Schmal Schwarz Vergrößernd Gleichmäßig Glatt Glatt Weiß Weiß Teilweise Weiß Eins Hängend Schwarz Vereinzelt Urban
Essbar Konvex Glatt Gelb Druckstellen Mandel Frei Eng Breit Schwarz Vergrößernd Keulenförmig Glatt Glatt Weiß Weiß Teilweise Weiß Eins Hängend Braun Zahlreich Gräser
Essbar Glockenförmig Glatt Weiß Druckstellen Anis Frei Eng Breit Braun Vergrößernd Keulenförmig Glatt Glatt Weiß Weiß Teilweise Weiß Eins Hängend Braun Zahlreich Wiesen
Giftig Konvex Schuppig Weiß Druckstellen Stechend Frei Eng Schmal Braun Vergrößernd Gleichmäßig Glatt Glatt Weiß Weiß Teilweise Weiß Eins Hängend Schwarz Vereinzelt Urban
Essbar Konvex Glatt Grün Keine Druckstellen Kein Geruch Frei Gedrängt Breit Schwarz Verjüngend Gleichmäßig Glatt Glatt Weiß Weiß Teilweise Weiß Eins Vergänglich Braun Reichlich Gräser
Essbar Konvex Schuppig Gelb Druckstellen Mandel Frei Eng Breit Braun Vergrößernd Keulenförmig Glatt Glatt Weiß Weiß Teilweise Weiß Eins Hängend Schwarz Zahlreich Gräser

Sofort fällt auf, dass alle Daten textuell sind. Du musst diese Daten umwandeln, um sie in einem Diagramm verwenden zu können. Tatsächlich sind die meisten Daten als Objekt dargestellt:

names(mushrooms)

Die Ausgabe ist:

[1] "class"                    "cap.shape"               
 [3] "cap.surface"              "cap.color"               
 [5] "bruises"                  "odor"                    
 [7] "gill.attachment"          "gill.spacing"            
 [9] "gill.size"                "gill.color"              
[11] "stalk.shape"              "stalk.root"              
[13] "stalk.surface.above.ring" "stalk.surface.below.ring"
[15] "stalk.color.above.ring"   "stalk.color.below.ring"  
[17] "veil.type"                "veil.color"              
[19] "ring.number"              "ring.type"               
[21] "spore.print.color"        "population"              
[23] "habitat"            

Nimm diese Daten und konvertiere die Spalte 'Klasse' in eine Kategorie:

library(dplyr)
grouped=mushrooms %>%
  group_by(class) %>%
  summarise(count=n())

Wenn du nun die Pilzdaten ausgibst, siehst du, dass sie nach den Kategorien giftig/essbar gruppiert wurden:

View(grouped)
Klasse Anzahl
Essbar 4208
Giftig 3916

Wenn du die Reihenfolge in dieser Tabelle befolgst, um deine Kategorien für die Klasse zu erstellen, kannst du ein Tortendiagramm erstellen.

Torte!

pie(grouped$count,grouped$class, main="Edible?")

Voila, ein Tortendiagramm, das die Proportionen dieser Daten entsprechend den beiden Pilzklassen zeigt. Es ist sehr wichtig, die Reihenfolge der Labels korrekt zu setzen, besonders hier, also überprüfe unbedingt die Reihenfolge, in der das Label-Array erstellt wird!

Tortendiagramm

Donuts!

Ein optisch etwas interessanteres Tortendiagramm ist ein Donut-Diagramm, ein Tortendiagramm mit einem Loch in der Mitte. Lass uns unsere Daten mit dieser Methode betrachten.

Schau dir die verschiedenen Lebensräume an, in denen Pilze wachsen:

library(dplyr)
habitat=mushrooms %>%
  group_by(habitat) %>%
  summarise(count=n())
View(habitat)

Die Ausgabe ist:

Lebensraum Anzahl
Gräser 2148
Blätter 832
Wiesen 292
Wege 1144
Urban 368
Abfall 192
Holz 3148

Hier gruppierst du deine Daten nach Lebensraum. Es gibt 7 gelistete Lebensräume, also verwende diese als Labels für dein Donut-Diagramm:

library(ggplot2)
library(webr)
PieDonut(habitat, aes(habitat, count=count))

Donut-Diagramm

Dieser Code verwendet die beiden Bibliotheken ggplot2 und webr. Mit der PieDonut-Funktion der webr-Bibliothek können wir ein Donut-Diagramm einfach erstellen!

Donut-Diagramme in R können auch nur mit der ggplot2-Bibliothek erstellt werden. Du kannst mehr darüber hier erfahren und es selbst ausprobieren.

Jetzt, da du weißt, wie du deine Daten gruppierst und sie als Torte oder Donut darstellst, kannst du andere Diagrammtypen erkunden. Probiere ein Waffel-Diagramm aus, das eine andere Möglichkeit bietet, Mengen darzustellen.

Waffeln!

Ein 'Waffel'-Diagramm ist eine andere Möglichkeit, Mengen als 2D-Array von Quadraten zu visualisieren. Versuche, die verschiedenen Mengen von Pilzhutfarben in diesem Datenset zu visualisieren. Dazu musst du eine Hilfsbibliothek namens waffle installieren und sie verwenden, um deine Visualisierung zu erstellen:

install.packages("waffle", repos = "https://cinc.rud.is")

Wähle einen Abschnitt deiner Daten aus, um ihn zu gruppieren:

library(dplyr)
cap_color=mushrooms %>%
  group_by(cap.color) %>%
  summarise(count=n())
View(cap_color)

Erstelle ein Waffel-Diagramm, indem du Labels erstellst und dann deine Daten gruppierst:

library(waffle)
names(cap_color$count) = paste0(cap_color$cap.color)
waffle((cap_color$count/10), rows = 7, title = "Waffle Chart")+scale_fill_manual(values=c("brown", "#F0DC82", "#D2691E", "green", 
                                                                                     "pink", "purple", "red", "grey", 
                                                                                     "yellow","white"))

Mit einem Waffel-Diagramm kannst du die Proportionen der Hutfarben in diesem Pilz-Datenset deutlich sehen. Interessanterweise gibt es viele Pilze mit grünen Hüten!

Waffel-Diagramm

In dieser Lektion hast du drei Möglichkeiten gelernt, Proportionen zu visualisieren. Zuerst musst du deine Daten in Kategorien gruppieren und dann entscheiden, welche die beste Möglichkeit ist, die Daten darzustellen - Torte, Donut oder Waffel. Alle sind köstlich und bieten dem Benutzer einen sofortigen Überblick über ein Datenset.

🚀 Herausforderung

Versuche, diese köstlichen Diagramme in Charticulator nachzubilden.

Quiz nach der Lektion

Rückblick & Selbststudium

Manchmal ist es nicht offensichtlich, wann man ein Torten-, Donut- oder Waffel-Diagramm verwenden sollte. Hier sind einige Artikel zu diesem Thema:

https://www.beautiful.ai/blog/battle-of-the-charts-pie-chart-vs-donut-chart

https://medium.com/@hypsypops/pie-chart-vs-donut-chart-showdown-in-the-ring-5d24fd86a9ce

https://www.mit.edu/~mbarker/formula1/f1help/11-ch-c6.htm

https://medium.datadriveninvestor.com/data-visualization-done-the-right-way-with-tableau-waffle-chart-fdf2a19be402

Recherchiere, um mehr Informationen zu dieser schwierigen Entscheidung zu finden.

Aufgabe

Probiere es in Excel aus

Haftungsausschluss:
Dieses Dokument wurde mit dem KI-Übersetzungsdienst Co-op Translator übersetzt. Obwohl wir uns um Genauigkeit bemühen, weisen wir darauf hin, dass automatisierte Übersetzungen Fehler oder Ungenauigkeiten enthalten können. Das Originaldokument in seiner ursprünglichen Sprache sollte als maßgebliche Quelle betrachtet werden. Für kritische Informationen wird eine professionelle menschliche Übersetzung empfohlen. Wir übernehmen keine Haftung für Missverständnisse oder Fehlinterpretationen, die sich aus der Nutzung dieser Übersetzung ergeben.