我在这里有一张表:http://ulozto.cz/xAeP3Ahn/res2-txt。我试图从中得出一个点图。
我读了我的桌子:
res2<-read.table("res2.txt", header = TRUE, sep="\t")
并创建2个图。
(1)这是单曲图功能的脚本:
plot(res2$V2, res2$dist06, type = "n")
points(subset(res2$V2, year == 2006), subset(res2$dist06, year == 2006), pch = 19, col = "red", cex = 1)
points(subset(res2$V2, year == 2007), subset(res2$dist06, year == 2007), pch = 19, col = "green", cex = 1)
points(subset(res2$V2, year == 2008), subset(res2$dist06, year == 2008), pch = 19, col = "black", cex = 1)
points(subset(res2$V2, year == 2009), subset(res2$dist06, year == 2009), pch = 19, col = "blue", cex = 1)
points(subset(res2$V2, year == 2011), subset(res2$dist06, year == 2011), pch = 19, col = "yellow", cex = 1)
legend("topright", c("2006", "2007", "2008", "2009", "2011"),
col= c("red", "green", "black", "blue", "yellow"),
pch = c(19,19,19,19,19))
(2)和ggplot2:
res2$year<-as.factor(res2$year) # consider year variable as discrete
ggplot(data=res2, aes(x=V2, y=dist06, color=year)) + geom_point(shape=16, pch=50) +
xlab("threshold") + ylab("Euclidean distance") +
scale_fill_hue(name="year") + # set legend title
scale_colour_manual(values=c("red", "green", "black", "blue", "yellow")) +
theme_bw()
以下是我的结果:
我的问题是,为什么我在不同的情节中有不同的分数位置?只有不同颜色和图例的问题? &#34;子集&#34;也是如此。定义错了?为什么2006年两者都被标记为红色,但在图表中有不同的位置?和2011年和其他人一样吗?我哪里错了?谢谢你的每一个建议,我在这里失去了第三天。
这是我从excel得到的结果,所以来自ggplot2(2)的情节必须是正确的
答案 0 :(得分:4)
我认为这是subset
使用不当的副作用。它的第一个参数应该是整个数据框,如下所示:
subset(res2, year == 2006)$V2
或
subset(res2, year == 2006, select = V2)
(旁注:这些命令返回的对象不同,但两者都适用于你的情节)
我建议使用括号表示法:
res2$V2[res2$year == 2006]
无论哪种方式,你都会得到正确的情节:
您可能已经注意到,您不必使用ggplot
方法复制/粘贴很多内容。尼斯!