我使用knime比较项目的各种分类算法。我对支持向量机(LibSVM)的结果非常满意。 然后我想尝试分层分类并为knime安装了Rapidminer插件。为了让事情发挥作用,我首先测试了没有层次结构的SVM实现。
比较knime LibSVM实现和rapidminer LibSVM实现的结果,我注意到快速实现的实现产生了更糟糕的结果。 实际上,knime实现产生了大约2.4%的错误率,而快速生成器的错误率大约为2.4%。 61%。 这是为什么?我做错了吗?
对于两种实现,我使用具有线性内核,1.0 Cost,0.001 epsilon和80mb cache的C-SVC SVM。
这些文件是维基百科文章文本,经过预处理,转换为二进制文档向量,并标有某种类型。
我希望你能帮助我。
答案 0 :(得分:2)
在这种情况下,您不需要包含Row ID
Row ID
标签,如果是Do not use
,请点击它来显示Use
按钮文本字段未被禁用),您不应对它们执行Nominal to...
转换。之后,在这两种情况下都应该得到类似的结果。