GGPLOT2;颜色由变量编码时的单个回归线?

时间:2016-05-20 14:01:56

标签: r ggplot2 linear-regression

我正在尝试使用一条回归线在ggplot2中创建一个散点图,即使颜色取决于“Survey Type”变量。理想情况下,我还想指定哪种调查类型是哪种颜色(社区=红色,次国家=绿色,国家=蓝色)。

这是我正在运行的代码,它目前为我提供了3条独立的回归线,每条回归线对应一种回归线。

ggplot(data=data.male,aes(x=mid_year, y=mean_tc, colour =condition)) +
geom_point(shape=1) + 
geom_smooth(method=lm, data=data.male, na.rm = TRUE, fullrange= TRUE) 

条件是:

condition <- (data.male$survey_type)

即使我将颜色审美移动到geom_point函数,它也不起作用,因为它给出了一个错误,说社区不是有效的颜色名称?

我的实际数据文件非常大,所以我只想在这里给出一个小样本:

data.male dataset:

mid_year mean_tc survey_type
2000     4       Community
2001     5       National
2002     5.1     Subnational
2003     4.3     National
2004     4.5     Community
2005     5.2     Subnational
2006     4.4     National

1 个答案:

答案 0 :(得分:2)

data.male <- read.table(header=TRUE,text="
 mid_year mean_tc survey_type
 2000     4       Community
 2001     5       National
 2002     5.1     Subnational
 2003     4.3     National
 2004     4.5     Community
 2005     5.2     Subnational
 2006     4.4     National")
  • 使用aes(group=1)规范中的geom_smooth()忽略通过将颜色映射分配给调查类型而引起的调查类型分组。 (或者,您可以将颜色映射放入geom_point()而不是整个ggplot()规范。)
  • 如果要指定颜色,则需要将其作为数据框中变量的名称(即survey_type);如果您想将图例中的名称更改为condition,您可以在色标规范中执行此操作(下面的示例)。
library(ggplot2); theme_set(theme_bw())
ggplot(data=data.male,aes(x=mid_year, y=mean_tc, colour=survey_type)) +
   geom_point(shape=1) +
   ## use aes(group=1) for single regression line across groups;
   ##   don't need to re-specify data argument
   ##  set colour to black (from default blue) to avoid confusion
   ##  with national (blue) points
   geom_smooth(method=lm, na.rm = TRUE, fullrange= TRUE,
               aes(group=1),colour="black")+
   scale_colour_manual(name="condition",
       values=c("red","blue","green"))
       ## in factor level order; probably better to
       ## specify 'breaks' explicitly ...
  • 出于对色盲人士的礼貌,我建议使用红色/绿色/蓝色作为您的颜色规格(尝试使用scale_colour_brewer(palette="Dark1"))。

enter image description here