在ggplot2中显示每个第n行的名称

时间:2015-08-28 19:08:57

标签: r ggplot2 heatmap

我有一个以下长格式的数据框:

> head(cleanLongPlotData)
  Structure Method Value       Outcome
1      1A00 X1     1    Clustering
2      1A01 X1     1    Clustering
3      1A02 X1     0 No Clustering
4      1A0U X1     1    Clustering
5      1A0Z X1     1    Clustering
6      1A1M X1     0 No Clustering
> tail(cleanLongPlotData)
      Structure     Method Value       Outcome
12931      4PRN       Z        0 No Clustering
12932      4PRP       Z        0 No Clustering
12933      4PXZ       Z       -1         Blank
12934      4PY0       Z       -1         Blank
12935      4Q3H       Z       -1         Blank
12936      6HBW       Z        1    Clustering

每种方法有2,196个观测值。我是这样画的:

    p1 <- ggplot(cleanLongPlotData, aes(x=Method, y=Structure,fill=Outcome)) + geom_tile()+
   xlab("Method") +
   ylab("Structure")+
   ggtitle("Cluster Results By Structure")+
      theme(axis.line=element_blank(),
            axis.text.y=element_blank(),axis.ticks=element_blank(),
            panel.background=element_blank(),panel.border=element_blank(),
            panel.grid.major=element_blank(),
            panel.grid.minor=element_blank(),plot.background=element_blank())+
      scale_fill_manual(values = c("#F5F5F5","green","blue"))

我阻止了这些行,因为它们相互重叠并弄得一团糟。有没有办法显示每个第100行的名称?或者每隔200行命名一次?

1 个答案:

答案 0 :(得分:6)

这是一个显示轴中每个其他因子水平的示例。看起来好像是个坏主意......

df <- data.frame(Method=rep(LETTERS[1:10], each=10),
                 Structure=rep(LETTERS[17:26]), 
                 Outcome=sample(letters[1:5],100,replace=TRUE))
library(ggplot2)
ggp <- ggplot(df, aes(Method, Structure))+geom_tile(aes(fill=Outcome))+coord_fixed()
ggp

lvls <- levels(df$Structure)
ggp + scale_y_discrete(breaks=lvls[seq(1,length(lvls),by=2)])