具有不同颜色离群值和地理文本编号标签的散点图

时间:2018-07-18 03:54:55

标签: r dataframe ggplot2 colors geom-text

我有一个包含多列的数据框。这是一个例子。

my_df <- data.frame(x = 1:5, y = c(50, 22, 15, 33, 49))
colnames(my_df) <- c("ID", "values")
my_df

我正在尝试创建一个散点图,其中该数据帧的一些子集是离群值,与非离群值具有不同的颜色。最重要的是,我还尝试使用相关编号标记这些异常值。 这是一个示例尝试:

ggplot(data=my_df, aes(x = seq(1, length(values)), y = my_df$values))+ geom_point(data = subset(my_df, values > 48), aes(color = "blue"))+ geom_point(data = subset(my_df, values < 24, aes(color = "red"))+ geom_text(data = subset(my_df, values > 48), aes(label = values))

代码的geom_text行提供了此错误。

错误:美学的长度必须为1或与数据(2)相同:颜色,x,y

第二,我尝试使用ifelse通过不同的颜色将值分开,但这是一次不同的尝试-但是,我不知道一种用数字标记不同颜色部分的方法,甚至用每个颜色部分的名称来标记图例。这是一个示例,但是即使添加了geom_text或尝试添加图例,我要制作的内容也无法解决。这是用作基准的代码:

ggplot(data=my_df, aes(x = seq(1, length(values)), y = my_df$values))+
  geom_point(color = ifelse(my_df$values > 25, "red", "blue"))

如果有人可以提供帮助,我将非常感激,因为我已经为此努力了一个多星期。

编辑:下面提供的答案已经回答了我的问题。这是我生成的绘图的代码,包括图例标题和每个变量的名称,以供以后查找的参考。

ggplot(my_df, aes(ID, values, color = factor(cut(values, c(0,24,48,Inf))))) +
  geom_point(size=3) + 
  geom_text_repel(data = . %>% filter(values> 48), aes(label = values), show.legend = F)+
  geom_text_repel(data = . %>% filter(values< 24), aes(label = values), show.legend = F)+
  labs(title = "Beautiful Scatterplot", x = "ID", y = "Values", color = "Legend Title") +
  scale_color_manual(labels = c("Below 24", "Between 24 and 48", "Above 48"), values = c("blue", "red", "purple")) 

Example Answer Scatterplot

2 个答案:

答案 0 :(得分:0)

ggplot(data=my_df,aes(x=ID,y=values,label=ifelse(values>48,values,"")))+
  geom_point(size=4,color = ifelse(my_df$values > 48, "red", "blue"))+
  geom_text(vjust = 1.3,nudge_x = 0.15,aes(colour="red"),fontface = "bold",show.legend=F)

enter image description here

答案 1 :(得分:0)

您可以尝试

library(tidyverse)
library(ggrepel)
my_df %>% 
  mutate(col=case_when(values > 48 ~ 4,
                       values < 24 ~ 2,
                       T ~ 1)) %>% 
  ggplot(aes(ID, values, color = factor(col))) +
   geom_point(size=3) + 
   geom_text_repel(data = . %>% filter(values> 48), aes(label = values)) + 
   scale_color_identity()

enter image description here

或者仅使用ggplot

  ggplot(my_df, aes(ID, values, color = factor(cut(values, c(0,24,48,Inf))))) +
   geom_point(size=3) + 
   geom_text_repel(data = . %>% filter(values> 48), aes(label = values), show.legend = F)