应用错误收集

我有多个分类器来确定事件描述是否属于某些类别，即摇滚音乐会，爵士乐之夜，古典音乐等。我创建了一个servlet，它使用LinearClassifier scoreOf函数返回事件描述数据的分数。

为了查看返回意外结果的案例，我调整了scoreOf函数（公共Counter scoreOf（Datum示例））以获得各个特征及其分数的数组，因此我可以理解最终得分如何到了。这在很大程度上起作用，即我主要有如下行： -
1 - ＃ - jazz -0.6317620789568879
1 - ＃ - saxo -0.2449097451977173

正如我所期待的那样。但是我也有一对，我不明白： - CLASS 1.4064007882810108
1-Len-31-Inf 0.4569598446321162

有人可以通过解释这些是什么以及如何确定这些分数来帮助吗？（我真的以为我只是在根据我的描述字符串的加权组件构建得分）。

（我很感激＆＃34; CLASS＆＃34;＆amp;＆＃34; Len-xx＆＃34;被设置为分类器的属性，我只是不明白他们为什么然后显示为得分他们自己的元素）

斯坦福分类器：什么是非ngram activeFeatures用于确定得分基准？

1 个答案: