我有两个数据集,一个用于培训,另一个用于测试。 我将在测试数据集中预测具有数字类型的列的值。为了预测实例的值,我必须在训练数据集中找到该实例的k个最近邻居,并计算值的平均值。 (等待也可以使用)。
例如:
......一个.................. b .................. ..10
......一个.................. b .................... 12
......Ç.................. d .................... 16
......一个.................. b .................. ..?
我需要一种数据挖掘方法来给我结果=(10 + 12)/ 2 = 11 我应该使用哪种方法来获得这样的结果? 您是否知道任何解释如何使用该方法的好文档?
答案 0 :(得分:5)
Weka中的KNN实现为IBk。它能够预测数值和名义值。
如果您使用的是Weka Explorer(GUI),可以通过查找“分类”选项卡下的“选择”按钮找到它。一旦导航文件夹:
分类器 - >懒惰 - > IBK
选择IBk后,单击按钮右侧的框。这将开辟出大量选择。如果您随后单击选项窗口中的“更多”按钮,您将看到所有选项。如果您需要更多关于分类器的解释,他们甚至会列出分类器所基于的学术论文。您可以对所有分类器执行此操作以获取其他信息。