我似乎无法将ID3分类算法应用于Mushroom.arff数据集。此数据集仅包含名义属性。我想我需要对它进行预处理以使其正常工作,但我不知道如何工作。我该怎么办?
答案 0 :(得分:3)
ID3算法是一种未修改的决策树生成算法,具有以下properties:
Mushroom dataset由22个名义属性组成,并且满足第一个条件,但是经过检查,您会发现属性 &#39; stalk-root&#39; < / strong>有2480(31%)个缺失值。这是在您尝试分类时默认情况下在Weka中无法选择的原因。
为了解决这个问题,您可以继续使用这两种解决方案。
您可以删除该属性。
您可以使用技巧来处理缺失值。