11 KiB
Oranları Görselleştirme
![]() |
---|
Oranları Görselleştirme - Sketchnote by @nitya |
Bu derste, mantarlarla ilgili bir veri seti kullanarak oranları görselleştireceksiniz. Örneğin, bir veri setinde kaç farklı mantar türü bulunduğunu inceleyebilirsiniz. Agaricus ve Lepiota ailelerine ait 23 tür lamelli mantar hakkında bilgiler içeren Audubon'dan alınmış bir veri setini keşfedeceğiz. Aşağıdaki gibi lezzetli görselleştirmelerle denemeler yapacaksınız:
- Pasta grafikleri 🥧
- Donut grafikleri 🍩
- Waffle grafikleri 🧇
💡 Microsoft Research tarafından geliştirilen Charticulator adlı çok ilginç bir proje, veri görselleştirmeleri için ücretsiz bir sürükle-bırak arayüzü sunuyor. Bu projede, mantar veri setini kullandıkları bir eğitim de var! Böylece hem veriyi keşfedebilir hem de kütüphaneyi öğrenebilirsiniz: Charticulator eğitimi.
Ders Öncesi Test
Mantarlarınızı Tanıyın 🍄
Mantarlar oldukça ilginçtir. Hadi bir veri seti içe aktararak onları inceleyelim:
mushrooms = read.csv('../../data/mushrooms.csv')
head(mushrooms)
Bir tablo çıktı olarak basılır ve analiz için harika veriler içerir:
sınıf | şapka şekli | şapka yüzeyi | şapka rengi | morarma | koku | lamel bağlantısı | lamel aralığı | lamel boyutu | lamel rengi | sap şekli | sap kökü | halka üstü sap yüzeyi | halka altı sap yüzeyi | halka üstü sap rengi | halka altı sap rengi | örtü türü | örtü rengi | halka sayısı | halka türü | spor baskı rengi | popülasyon | habitat |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Zehirli | Konveks | Düz | Kahverengi | Morarma | Keskin | Serbest | Yakın | Dar | Siyah | Genişleyen | Eşit | Düz | Düz | Beyaz | Beyaz | Kısmi | Beyaz | Bir | Sarkık | Siyah | Dağınık | Şehir |
Yenilebilir | Konveks | Düz | Sarı | Morarma | Badem | Serbest | Yakın | Geniş | Siyah | Genişleyen | Kulüp | Düz | Düz | Beyaz | Beyaz | Kısmi | Beyaz | Bir | Sarkık | Kahverengi | Çok | Çimenlik |
Yenilebilir | Çan | Düz | Beyaz | Morarma | Anason | Serbest | Yakın | Geniş | Kahverengi | Genişleyen | Kulüp | Düz | Düz | Beyaz | Beyaz | Kısmi | Beyaz | Bir | Sarkık | Kahverengi | Çok | Çayır |
Zehirli | Konveks | Pullu | Beyaz | Morarma | Keskin | Serbest | Yakın | Dar | Kahverengi | Genişleyen | Eşit | Düz | Düz | Beyaz | Beyaz | Kısmi | Beyaz | Bir | Sarkık | Siyah | Dağınık | Şehir |
Yenilebilir | Konveks | Düz | Yeşil | Morarma Yok | Yok | Serbest | Kalabalık | Geniş | Siyah | Daralan | Eşit | Düz | Düz | Beyaz | Beyaz | Kısmi | Beyaz | Bir | Geçici | Kahverengi | Bol | Çimenlik |
Yenilebilir | Konveks | Pullu | Sarı | Morarma | Badem | Serbest | Yakın | Geniş | Kahverengi | Genişleyen | Kulüp | Düz | Düz | Beyaz | Beyaz | Kısmi | Beyaz | Bir | Sarkık | Siyah | Çok | Çimenlik |
Hemen fark ediyorsunuz ki tüm veriler metinsel. Bu verileri bir grafik oluşturmak için dönüştürmeniz gerekecek. Aslında, verilerin çoğu bir nesne olarak temsil ediliyor:
names(mushrooms)
Çıktı şu şekilde:
[1] "class" "cap.shape"
[3] "cap.surface" "cap.color"
[5] "bruises" "odor"
[7] "gill.attachment" "gill.spacing"
[9] "gill.size" "gill.color"
[11] "stalk.shape" "stalk.root"
[13] "stalk.surface.above.ring" "stalk.surface.below.ring"
[15] "stalk.color.above.ring" "stalk.color.below.ring"
[17] "veil.type" "veil.color"
[19] "ring.number" "ring.type"
[21] "spore.print.color" "population"
[23] "habitat"
Bu verileri alın ve 'sınıf' sütununu bir kategoriye dönüştürün:
library(dplyr)
grouped=mushrooms %>%
group_by(class) %>%
summarise(count=n())
Şimdi, mantar verilerini yazdırırsanız, zehirli/yenilebilir sınıfına göre kategorilere ayrıldığını görebilirsiniz:
View(grouped)
sınıf | sayı |
---|---|
Yenilebilir | 4208 |
Zehirli | 3916 |
Bu tablodaki sırayı takip ederek sınıf kategori etiketlerinizi oluşturursanız, bir pasta grafiği oluşturabilirsiniz.
Pasta!
pie(grouped$count,grouped$class, main="Edible?")
İşte, bu iki mantar sınıfına göre verilerin oranlarını gösteren bir pasta grafiği. Etiketlerin sırasını doğru almak oldukça önemlidir, özellikle burada, bu yüzden etiket dizisinin oluşturulma sırasını doğruladığınızdan emin olun!
Donutlar!
Biraz daha görsel olarak ilginç bir pasta grafiği, ortasında bir delik olan bir donut grafiğidir. Verilerimize bu yöntemle bakalım.
Mantarların büyüdüğü çeşitli habitatlara bir göz atın:
library(dplyr)
habitat=mushrooms %>%
group_by(habitat) %>%
summarise(count=n())
View(habitat)
Çıktı şu şekilde:
habitat | sayı |
---|---|
Çimenlik | 2148 |
Yapraklar | 832 |
Çayırlar | 292 |
Yollar | 1144 |
Şehir | 368 |
Atık | 192 |
Odun | 3148 |
Burada, verilerinizi habitatlara göre grupluyorsunuz. 7 habitat listelenmiş, bu yüzden donut grafiğiniz için bunları etiket olarak kullanın:
library(ggplot2)
library(webr)
PieDonut(habitat, aes(habitat, count=count))
Bu kod iki kütüphaneyi kullanır - ggplot2 ve webr. webr kütüphanesinin PieDonut fonksiyonunu kullanarak kolayca bir donut grafiği oluşturabilirsiniz!
R'de donut grafikleri yalnızca ggplot2 kütüphanesi kullanılarak da yapılabilir. Daha fazla bilgi edinmek için buraya göz atabilir ve kendiniz deneyebilirsiniz.
Artık verilerinizi nasıl gruplandıracağınızı ve ardından pasta veya donut olarak nasıl göstereceğinizi bildiğinize göre, diğer grafik türlerini keşfedebilirsiniz. Waffle grafiğini deneyin, bu da miktarları keşfetmenin farklı bir yoludur.
Waffle!
'Waffle' türü bir grafik, miktarları karelerden oluşan 2D bir dizi olarak görselleştirmenin farklı bir yoludur. Bu veri setindeki mantar şapka renklerinin farklı miktarlarını görselleştirmeyi deneyin. Bunu yapmak için waffle adlı bir yardımcı kütüphane yüklemeniz ve görselleştirmenizi oluşturmak için kullanmanız gerekir:
install.packages("waffle", repos = "https://cinc.rud.is")
Verilerinizden bir segment seçin ve gruplandırın:
library(dplyr)
cap_color=mushrooms %>%
group_by(cap.color) %>%
summarise(count=n())
View(cap_color)
Etiketler oluşturup verilerinizi gruplandırarak bir waffle grafiği oluşturun:
library(waffle)
names(cap_color$count) = paste0(cap_color$cap.color)
waffle((cap_color$count/10), rows = 7, title = "Waffle Chart")+scale_fill_manual(values=c("brown", "#F0DC82", "#D2691E", "green",
"pink", "purple", "red", "grey",
"yellow","white"))
Bir waffle grafiği kullanarak, bu mantar veri setindeki şapka renklerinin oranlarını açıkça görebilirsiniz. İlginç bir şekilde, birçok yeşil şapkalı mantar var!
Bu derste, oranları görselleştirmenin üç yolunu öğrendiniz. Öncelikle, verilerinizi kategorilere ayırmanız ve ardından verileri göstermek için en iyi yolu seçmeniz gerekiyor - pasta, donut veya waffle. Hepsi lezzetli ve kullanıcıya bir veri setinin anlık görüntüsünü sunar.
🚀 Meydan Okuma
Bu lezzetli grafikleri Charticulator ile yeniden oluşturmaya çalışın.
Ders Sonrası Test
Gözden Geçirme ve Kendi Kendine Çalışma
Bazen pasta, donut veya waffle grafiği kullanmanın ne zaman uygun olduğu açık olmayabilir. Bu konuda okumak için bazı makaleler:
https://www.beautiful.ai/blog/battle-of-the-charts-pie-chart-vs-donut-chart
https://medium.com/@hypsypops/pie-chart-vs-donut-chart-showdown-in-the-ring-5d24fd86a9ce
https://www.mit.edu/~mbarker/formula1/f1help/11-ch-c6.htm
Bu zor kararla ilgili daha fazla bilgi bulmak için araştırma yapın.
Ödev
Feragatname:
Bu belge, Co-op Translator adlı yapay zeka çeviri hizmeti kullanılarak çevrilmiştir. Doğruluk için çaba göstersek de, otomatik çevirilerin hata veya yanlışlıklar içerebileceğini lütfen unutmayın. Belgenin orijinal dili, yetkili kaynak olarak kabul edilmelidir. Kritik bilgiler için profesyonel insan çevirisi önerilir. Bu çevirinin kullanımından kaynaklanan yanlış anlama veya yanlış yorumlamalardan sorumlu değiliz.