我有2个数据集用于训练和测试weka。对于变量(数字或名义),它们都具有相同数量的属性和相同类型的数据类型。但它们彼此不兼容,因为标称值的顺序不同
ex - Training set
Occupation
1 Doctor 40%
2 Engineer 40%
3 Teacher 20%
Test set
1 Engineer 40%
2 doctor 40%
3 Teacher 20%
因此两组都不兼容。我的问题是如何更改这些不同的价值顺序以使它们兼容?
答案 0 :(得分:1)
看起来有点像数据预处理问题。我很好奇培训和测试数据最终看起来像这样!
如果您想更改标称值,可以使用RenameNominalValues重命名数据标签。一种可能的方法是将其应用于您的测试数据:
此解决方案假设您正在处理Nominal属性,它是您的最后一个属性,并且它们标记为valueReplacements字段中显示。
如果失败,根据案例数量,您可以手动编辑值或使用您喜欢的电子表格来替换值。
希望这有帮助!
答案 1 :(得分:0)
在不受监督的>属性下使用“ SwapValues”