我在数据可视化方面很新,在R中使用ggplot2。我试图在饼图中可视化一些数据。我使用的代码是:
percentageData <- data.frame(Year = "1987",
TypeOfDelays = c(percDepDelays[1], percArrDelays[1], percAntDepdelays[1], percAntArrDelays[1]),
Label = factor(c("Departure delays", "Arrival Delays", "Early Departure", "Early arrival")))
labels = c("Departure delays", "Arrival Delays", "Early Departure", "Early arrival")
ggplot(data = percentageData) +
geom_bar(aes(x="", y=TypeOfDelays, fill=Label), stat = "identity", width = 1) +
coord_polar(theta = "y", start = 0) +
theme_void() +
geom_text(aes(x = 1, y=cumsum(TypeOfDelays) - TypeOfDelays/2, label=labels))
我正在分析的数据集是:flights dataset
我的问题是每年可视化每种类型延误的延误次数(我正在考虑4种类型的延误,出发,到达,出发时间和出发时间之前的到达)。
我的想法是为每年创建一个包含年份的数据框,每种类型的延迟数百分比(一年中的#delays总数/该年度的#个航班数)和描述延迟类型的标签。我已经计算了每种延迟类型的百分比。我想在饼图中可视化这些数据,我尝试使用上面的代码创建一个饼图,结果如下:
所以我的问题是这些:
1)为什么百分比数据不可视化?我的代码有什么问题?
2)如何在正确的位置正确显示标签?
提前致谢。
答案 0 :(得分:3)
要获得您想要的内容,您可以根据以下几点调整代码:
aes
移至ggplot()
部分x
y
移除aes
和geom_text
规范
position = position_stack(vjust = 0.5)
添加到geom_text
最终代码:
ggplot(data = percentageData, aes(x="", y = TypeOfDelays, fill = Label)) +
geom_bar(stat = "identity", width = 1) +
geom_text(aes(label = labels), position = position_stack(vjust = 0.5)) +
coord_polar(theta = "y", start = 0) +
theme_void()
给出:
这些数字没有显示,因为您没有要求ggplot2
包含它们。可能性:
ggplot(data = percentageData, aes(x="", y = TypeOfDelays, fill = Label)) +
geom_bar(stat = "identity", width = 1) +
geom_text(aes(label = paste0(labels, ': ', TypeOfDelays,' %')), position = position_stack(vjust = 0.5)) +
coord_polar(theta = "y", start = 0) +
theme_void()
给出:
使用过的数据:
percentageData <- data.frame(Year = "1987",
TypeOfDelays = c(30, 45, 5, 20),
Label = factor(c("Departure delays", "Arrival Delays", "Early Departure", "Early arrival")))
labels <- c("Departure delays", "Arrival Delays", "Early Departure", "Early arrival")