识别混洗数据集

时间:2014-08-03 23:54:25

标签: machine-learning dataset classification weka

我有两个数据集,其中一个是真实数据集,其中一个是随机数据集 class属性随机洗牌的地方。我怎样才能确定哪个是 哪一个?感谢

1 个答案:

答案 0 :(得分:3)

训练分类器。您可以获得工作分类器的数据集可能是具有真实标签的数据集。在洗牌后,没有分类器可以工作!

无法保证您可以检测到它。如果您的数据之前是随机的,那么通过随机播放它不会更随机;所以你不能决定。但是如果数据集之前有一个很好的结构,那么洗牌应该通常会破坏它。