我正在使用木槌中的最大算法进行标签分类。我想知道是否有可能为maxent分类器预测的标签获得某种置信度值。我基本上需要的是前导K预测(不是针对每个令牌,而是来自整个数据)分类器最有信心并将其用于自举的实例。有没有办法做到这一点?
答案 0 :(得分:2)
查看调用任何mallet classify方法时返回的Labeling对象。此类包含每个标签的所有计算分数:最佳分数成为答案(这是getBestLabel()方法返回的分数)。问题是这些分数通常不是概率。我不熟悉mallet的maxent分类器 - 您需要查看代码并确定返回的分数是否可以某种方式“转换”为概率,或者可能已经处于正确的形式。无论如何,听起来你想要做的是为最高K分数之间的相对差异赋予意义。同样,这取决于maxent分类器的确切细节。因此,请查看实际在数据集上返回的Labeling对象实例,并使用您的最佳判断。
希望这有帮助!