我有一个以下长格式的数据框:
> head(cleanLongPlotData)
Structure Method Value Outcome
1 1A00 X1 1 Clustering
2 1A01 X1 1 Clustering
3 1A02 X1 0 No Clustering
4 1A0U X1 1 Clustering
5 1A0Z X1 1 Clustering
6 1A1M X1 0 No Clustering
> tail(cleanLongPlotData)
Structure Method Value Outcome
12931 4PRN Z 0 No Clustering
12932 4PRP Z 0 No Clustering
12933 4PXZ Z -1 Blank
12934 4PY0 Z -1 Blank
12935 4Q3H Z -1 Blank
12936 6HBW Z 1 Clustering
每种方法有2,196个观测值。我是这样画的:
p1 <- ggplot(cleanLongPlotData, aes(x=Method, y=Structure,fill=Outcome)) + geom_tile()+
xlab("Method") +
ylab("Structure")+
ggtitle("Cluster Results By Structure")+
theme(axis.line=element_blank(),
axis.text.y=element_blank(),axis.ticks=element_blank(),
panel.background=element_blank(),panel.border=element_blank(),
panel.grid.major=element_blank(),
panel.grid.minor=element_blank(),plot.background=element_blank())+
scale_fill_manual(values = c("#F5F5F5","green","blue"))
我阻止了这些行,因为它们相互重叠并弄得一团糟。有没有办法显示每个第100行的名称?或者每隔200行命名一次?
答案 0 :(得分:6)
这是一个显示轴中每个其他因子水平的示例。看起来好像是个坏主意......
df <- data.frame(Method=rep(LETTERS[1:10], each=10),
Structure=rep(LETTERS[17:26]),
Outcome=sample(letters[1:5],100,replace=TRUE))
library(ggplot2)
ggp <- ggplot(df, aes(Method, Structure))+geom_tile(aes(fill=Outcome))+coord_fixed()
ggp
lvls <- levels(df$Structure)
ggp + scale_y_discrete(breaks=lvls[seq(1,length(lvls),by=2)])