您好, 我在weka(j48交叉验证)中的模型存在问题,当涉及到第二类时,许多实例被归类为错误。有没有办法改善它,或者更确切地说不是?我不是weka的专家。先感谢您。我的输出在上面。 在NaiveBayes中,它表现得更好但仍然是TP率< 0.5为第二类。 NaiveByes weka
答案 0 :(得分:0)
使用给定的信息很难重现您的示例。但是,解决方案可能是将您的分类转换为成本敏感的分类器 https://weka.wikispaces.com/CostSensitiveClassifier?responseToken=019a566fb2ce3b016b9c8c791c92e8e35
它的作用是为某一类的错误分类赋予更高的价值。在你的情况下,这将是“真正的”类。
您还可以通过对正面示例进行过采样来模拟此类算法。这是,如果您有n
个正面示例,则可以采用k*n
正面示例,同时保留您的负面示例。你也可以简单地加倍正面的例子。