我有下面的R代码可视化多线图,其中每一行对应一类数据。在代码中,类别给出了我的变量nk: 我的数据集如下所示:
k precision recall
0.25 0.02 1.011
0.25 0.04 1.011
0.5 0.15 0.941
0.5 0.17 0.931
0.5 0.18 0.921
0.5 0.19 0.911
1.0 0.36 0.831
1.0 0.39 0.811
1.0 0.41 0.801
问题在于它只能显示k = 1.0的线条而不是k = 0.5和0.25的线条 我的问题是?我如何使用不是的nk变量 一个整数,以便可视化k = 0.5或0.25的线?
dtf$k <- as.numeric(dtf$k)
nk <- max(dtf$k)
xrange <- range(dtf$precision)
yrange <- range(dtf$recall)
plot(xrange, yrange,
type="n",
xlab="Precision",
ylab="Recall"
)
colors <- rainbow(nk)
linetype <- c(1:nk)
plotchar <- seq(18, 18+nk, 1)
for (i in 1:nk) {
Ki <- subset(dtf, k==i)
lines(Ki$precision, Ki$recall,
type="b",
lwd=2,
lty=linetype[i],
col=colors[i],
pch=plotchar[i]
)
}
title("Methods varying K", "Precision Recall")
legend(xrange[1], yrange[2],
1:nk,
cex=1.0,
col=colors,
inset=c(-0.2,0),
pch=plotchar,
lty=linetype,
title="k"
)
答案 0 :(得分:1)
dtf <- read.table(header = TRUE, text = 'k precision recall
0.25 0.02 1.011
0.25 0.04 1.011
0.5 0.15 0.941
0.5 0.17 0.931
0.5 0.18 0.921
0.5 0.19 0.911
1.0 0.36 0.831
1.0 0.39 0.811
1.0 0.41 0.801')
dtf$k <- factor(dtf$k)
require(ggplot2)
ggplot(dtf, aes(x = precision, y = recall, col = k)) +
geom_line()
plot(recall ~ precision, data = dtf, type = 'n')
cols = c('red', 'blue', 'green')
levs <- levels(df$k)
for(i in seq_along(levs)){
take <- df[df$k == levs[i], ]
lines(take$precision, take$recall, col = cols[i])
}