我想从包含多个数据子集的.csv文件创建散点图。我想比较变量并包括一个键。这是我的数据集的一个示例(全套数据来自1900-2014年)。
Year Race Sex ALE
1900 Both Both Sexes 47.3
1900 Both Female 48.3
1900 Both Male 46.3
1900 African American Both Sexes 33
1900 African American Female 33.5
1900 African American Male 32.5
1900 Caucasian Both Sexes 47.6
1900 Caucasian Female 48.7
1900 Caucasian Male 46.6
我已将数据集命名为“ life” 该图显示在四个散点图中,但全部显示为蓝色。
options(scipen = 999)
library(scales)
ggplot(data=life, aes(x=Year, y=ALE, group=1)) +
geom_point(colour="blue", size=.5, shape=9, fill="blue") +
xlab("Year") +
ylab("Life Expectancy") +
ggtitle("Average Life Expectancy")
我想看到一个散点图,其中男性,女性,非裔美国人,高加索人分别以不同的颜色和一个键来比较自己的一行。我缺少一些我不知道的重要脚本。有没有办法画一条最合适的线?
答案 0 :(得分:0)
您可以尝试以下方法吗?
ggplot(data = lif, aes(x = Year, y = ALE)) +
geom_point(aes(colour = interaction(Race, Sex),
size = .5, shape = 9) +
geom_smooth() +
xlab("Year") +
ylab("Life Expectancy") +
ggtitle("Average Life Expectancy")
我没有您的数据,因此无法测试此代码,但我认为aes(colour = interaction(Race, Sex))
可能会有所帮助。