我试图使用ggplot2在R中绘制一个箱线图。
这里是带有示例数据的代码:
df = structure(list(Closeness = c(0.0919540229885057, 0.0950259836674091, 0.0957367240089753, 0.0960240060015004, 0.0901408450704225, 0.0970432145564822, 0.0939794419970631, 0.0943952802359882, 0.0921526277897768, 0.0914285714285714, 0.0933625091174325, 0.0953090096798213, 0.0917562724014337, 0.0960960960960961, 0.0937728937728938, 0.0909090909090909, NA, 0.0946045824094605, 0.0864280891289669, 0.0879120879120879, 0.0905233380480905, 0.100313479623824, 0.0993017843289372, 0.0942562592047128, 0.0950965824665676, 0.0907801418439716, NA, NA, 0.0950965824665676, 0.0913633119200571, NA, 0.0926864590876177, NA, 0.0948148148148148, 0.0958801498127341, 0.0945347119645495, 0.0931586608442504, 0.090014064697609, 0.0968229954614221, 0.0963855421686747, 0.0926193921852388, 0.0919540229885057, 0.0947446336047372, 0.0917562724014337, 0.0905874026893135, 0.0950965824665676, NA, 0.0926193921852388, 0.0900774102744546, 0.0977845683728037), Var1 = c("Group", "Group", "Group", "Group", "Group", "Group", "Group", "Group", "Group", "Group", "Group", "Group", "Group", "Group", "Group", "Group", "Group", "Group", "Group", "Group", "Group", "Group", "Group", "Group", "Group", "Group", "Group", "Group", "Group", "Group", "Group", "Group", "Group", "Group", "Group", "Group", "Group", "Group", "Group", "Group", "Group", "Group", "Group", "Group", "Group", "Group", "Group", "Group", "Group", "Group"), Var2 = c("A", "B", "C", "D", "E", "F", "G", "H", "I", "J", "K", "L", "M", "A", "A", "K", "K", "G", "G", "N", "N", "O", "O", "A", "P", "P", "P", "Q", "Q", "Q", "Q", "A", "A", "A", "A", "R", "R", "R", "R", "S", "S", "S", "S", "L", "L", "L", "L", "L", "L", "L")), .Names = c("Closeness", "Var1", "Var2"), row.names = c(NA, 50L), class = "data.frame")
tmp <- data.frame(df, check.names=T)
tmp <- melt(tmp, id="Closeness", variable.name="Var1", value.name="Var2")
tmp$Var1 <- gsub("(.*)\\.[0-9]", "\\1", tmp$Var1)
df <- subset(tmp, Var2!="")
df_g = subset(df, Var1=="Group")
df_c = subset(df, Var1=="Cat")
ggplot(df_c, aes(x = df_g$Var2, y = df_g$Closeness), position = "dodge") + # geom_point() +
geom_boxplot(outlier.size = 1.5) #+ geom_jitter(position=position_jitter(width=.2, height=0))
产生这个(使用完整数据集):
现在,我有两个问题:
使用ggplot2可以吗?如果是的话,该怎么办?
答案 0 :(得分:4)
通常情况下,我会评论并关闭,例如,
或者,如果您在“ggplot2 order”中搜索Stack Overflow,那么几乎所有出现的内容。如果您需要特定于boxplot的示例(方法相同),请参阅
甚至是你在不到两周前问过的this one。不同的geom
,相同的原则。
但是,你还有其他一些问题,其中一个问题是在data$column
内使用aes()
,这有点让我感到厌烦,所以我们也要解决这个问题。
请勿在{{1}}内使用data$column
!这意味着您没有正确使用数据参数。相关:当aes()
拥有您需要的所有内容时,您不清楚为何使用空数据框df_c
开始绘图:
df_g
正确使用ggplot(df_g, aes(x = Var2, y = Closeness), position = "dodge") +
geom_boxplot(outlier.size = 1.5)
参数并且不指定data
内的data$column
将确保您的绘图在所有情况下都正常工作。如果您在aes()
内使用$
,则facet和其他复杂功能可能无效。如果您需要在一个图中使用多个数据框,请在图层级别执行此操作(例如,aes()
)。您仍然不需要在geom_point(data = other_data, aes(x = x_var, y = y_var))
内使用$
。
至于你提到的两个问题,它们都是通过编辑你的数据来解决的。 aes()
非常善于绘制数据,您只需要使数据看起来像您想要绘制的内容。
我希望通过降序来排序类别(A,B,C,D);
在数据中订购因子!
ggplot
某些类别只有一个样本(即B,D和E)。我想在绘图前删除它们。
好的,删除它们!您可以将它们从数据中完全删除,或者仅将您提供给绘图的数据进行子集化:
df_g$Var2 = with(df_g, reorder(x = Var2, X = Closeness, FUN = function(x) -mean(x, na.rm = TRUE)))