如何从具有多个列/子集的.csv文件创建散点图?

时间:2019-04-17 18:25:07

标签: r ggplot2

我想从包含多个数据子集的.csv文件创建散点图。我想比较变量并包括一个键。这是我的数据集的一个示例(全套数据来自1900-2014年)。

Year    Race    Sex ALE
1900    Both    Both Sexes  47.3
1900    Both    Female  48.3
1900    Both    Male    46.3
1900    African American    Both Sexes  33
1900    African American    Female  33.5
1900    African American    Male    32.5
1900    Caucasian   Both Sexes  47.6
1900    Caucasian   Female  48.7
1900    Caucasian   Male    46.6

我已将数据集命名为“ life” 该图显示在四个散点图中,但全部显示为蓝色。

options(scipen = 999)
library(scales)
ggplot(data=life, aes(x=Year, y=ALE, group=1)) + 
  geom_point(colour="blue", size=.5, shape=9, fill="blue") +
  xlab("Year") + 
  ylab("Life Expectancy") + 
  ggtitle("Average Life Expectancy") 

我想看到一个散点图,其中男性,女性,非裔美国人,高加索人分别以不同的颜色和一个键来比较自己的一行。我缺少一些我不知道的重要脚本。有没有办法画一条最合适的线?

1 个答案:

答案 0 :(得分:0)

您可以尝试以下方法吗?

ggplot(data = lif, aes(x = Year, y = ALE)) +
  geom_point(aes(colour = interaction(Race, Sex),
             size = .5, shape = 9) +
  geom_smooth() +
  xlab("Year") +
  ylab("Life Expectancy") +
  ggtitle("Average Life Expectancy")

我没有您的数据,因此无法测试此代码,但我认为aes(colour = interaction(Race, Sex))可能会有所帮助。