我坚持进行R案例研究。 我需要使用数据集中的特定值绘制图形。我很难找到正确的代码。我应该怎么写?
数据集是:
data <- read.csv(file = "https://raw.githubusercontent.com/ScPoEcon/ScPoEconometrics/master/inst/datasets/airline-safety.csv")
问题是:
提出一个可视化,以显示两个时期之间致命事故数量的演变
我想用两个时间段在x轴上绘制条形图,在y轴上发生事故数。
这是我设法编码的距离:
graph_1 <- summarise(group_by(data, type, period), sum_1 =sum(value) )
ggplot((data = graph_1),
aes(x=period, y=type))
geom_bar()
它输出带有以下内容的图形: x轴上的两个句点 y轴上的事故类型
但是,它不使用每种事故类型的事故数。
我希望有:
谢谢您的帮助!
答案 0 :(得分:1)
只需添加 fill 即可。通常,您希望在y
列中包含数字值,并在type
或fill
中包含诸如color
之类的分类值。
# SUMMARY DATA
graph_1
# # A tibble: 6 x 3
# # Groups: type [3]
# type period sum_1
# <fct> <fct> <int>
# 1 fatal_accidents 1985_1999 122
# 2 fatal_accidents 2000_2014 37
# 3 fatalities 1985_1999 6295
# 4 fatalities 2000_2014 3109
# 5 incidents 1985_1999 402
# 6 incidents 2000_2014 231
# PLOT OUTPUT
ggplot((data = graph_1), aes(x=period, y=sum_1, fill=type)) +
geom_col(position="dodge") # OR geom_bar(stat="identity", position="dodge")