R直方图。如何标记部分但不是所有单个数据点

时间:2014-05-12 19:50:17

标签: r ggplot2 histogram bioinformatics

我的数据框包含三个变量:

Row_Number    Sample_ID    Expression_Level
1             hum_449      0.25
2             hum_459      0.35
4             mur_223      0.45

我想使用

生成第三列的直方图
hist(dataframe$Expression_Level)

我想用一个列表标记一些条形,列出与该特定表达水平相对应的Sample_ID值。

我将所需的Sample_ID存储为列表对象,也作为具有相应Row_Number和Expression_Level值的数据帧(基本上只是原始数据帧的子集)。我不知道接下来该做什么,甚至不知道输入搜索引擎的内容。

我安装了ggplot2,因为朋友告诉我它可能会有所帮助,但我不熟悉它,并且在阅读文档时面临同样的问题,不知道该寻找什么。如果可能的话,宁愿不安装更多的包。

2 个答案:

答案 0 :(得分:0)

您可以使用以下内容将与Sample_ID的第三个元素对应的标签添加到第三个" bar"直方图但是,这似乎是一种奇怪的方式,因为直方图的条形是重要的。你可能想要使用barplot吗?相同的代码可以使用" barplot"而不是hist。

temp< - hist(dataframe $ Expression_Level) 多行文字(文本= Expression_Level [3],边= 1,行= 2,在温度= [3])

答案 1 :(得分:0)

这样的东西?

set.seed(1)      # for reproduceale example
# crate sample data - you have this already
df <- data.frame(sample_ID=paste0("S-",1:100),
                 Expression_Level=round(runif(100),1),
                 stringsAsFactors=F)

# you start here...
labels     <- aggregate(sample_ID~Expression_Level,df,c)
labels$lab <- sapply(labels$sample_ID,function(x)paste(unlist(x),collapse="|"))

library(ggplot2)
ggplot(df, aes(x=factor(Expression_Level))) + 
  geom_histogram(fill="lightgreen",color="grey50")+
  geom_text(data=labels,aes(y=.1,label=lab),hjust=0)+
  labs(x="Expression_Level")+
  coord_flip()