我在R中使用PRROC程序包绘制软标签分类器的ROC曲线。以下是6个测试数据点的分类器输出:
class o class 1 True class
0.52 0.48 1
0.02 0.98 1
0.7 0.3 0
0.65 0.35 0
0.05 0.95 1
0.12 0.88 0
0.20 0.80 1
每一行对应一个数据点。第一列是数据点属于类别0的概率,第二列是数据点属于类别1的概率。这两个概率加起来为1。第三列是我自己添加的,是数据点所属的真实类。
当我在R中使用包'PRROC'时,我首先创建了一个包含以下内容的文件:
0.48 1
0.98 1
0.7 0
0.65 0
0.95 1
0.12 0
0.80 1
在文件中,每一行都对应一个测试数据点。第一列是数据点属于真实类的概率,第二列是数据点属于真实类的概率。
然后我提取以下命令:
pile <- read.delim("/path/to/the/file", header=FALSE, sep="\t", quote="", dec=NULL)
pr <- pr.curve(scores.class0=pile[,1], weights.class0=pile[,2], curve =TRUE)
plot(pr)
但是我有一个奇怪的情节。有人可以帮我解决这个问题吗?而且我不理解软标签中分类得分的术语和weights.class0的术语之间的区别(每个数据点属于肯定类的概率)。就我而言,分类分数和weights.class0是什么?