我有两个(或三个)课程,每个课程只能拥有一个标签 我想优化(如果可能的话自动)参数和分类器的阈值,以便我的第一个类只包含100%可靠的数据。即使它包含少量实例。
我不介意其余课程包含误报或正确拒绝 我不介意有未分类的数据。
我一直在搜索stackoverflow和weka的维基,但也许我对weka的了解不足让我错过了一些关键词。
我还尝试用着名的" iris"数据库,但我认为在这种情况下,任何类都可以100%肯定。
然而,我只是成功地测试了多个分类器并手动调整它们,但是我的第一堂课没有100%正确。 (我在weka报告给出的混淆矩阵中检查了这个结果。) 不知何故,我知道我的班级可以包含100%可靠的数据,因为我设法在Matlab中手动设置简单的阈值。但我想尝试一个更大的数据库,以获得更好的阈值并使用weka的力量。
任何建议都会有所帮助,谢谢!