我正在快速采矿工作中进行文本分类,需要实现一个问题转换方法,将多标签数据集转换为单一标签,即标签电源设置等,但在Rapid miner中找不到,我肯定我错过了什么或者可能是快速矿工为他们提供了另一个名字或什么?
1)我搜索并发现"多项式按二项式"我认为Rapidminer的运算符在内部使用二进制相关性进行问题转换,但我如何应用其他功能,例如Label Power set或Classifier Chains?
2)其次是SVM(学习者)内部"多项式由二项式"运算符应用K(类的数量)次并组合' K'将模型分解为单个模型但仍将多标签(多个标签)示例分类为单个标签(一个标签)示例,如何将多个标签与示例相关联?
3)我是否必须存储内部生成的每个模型"二项式多项式"然后将每个应用于测试数据以找出与示例相关联的多个标签?
我是快速矿工的新手,所以忽略我的错误
提前致谢...
答案 0 :(得分:0)
多项式到生化方式不是你想要的方式。
此运算符执行类似XvsAll的操作。这使您能够使用仅能进行二项分类的学习者来解决多类问题。
对于你的问题: 它会像这样转换你的表:
之前:
ID Label
1 A|B|C
2 B|C
至
ID Label
1 A
2 B
3 C
4 B
5 C
这方面的棘手问题是如何计算性能。但我认为一旦这清楚,召回/记住/删除重复和联接的组合就会做到。