标签: classification weka knn
我正在使用Weka的IBk对文本进行分类(推文)。我正在将训练和测试数据转换为向量空间,当我对测试数据进行分类时,最佳结果来自K = 1。培训和测试数据彼此分开。为什么K = 1给出最佳精度?
答案 0 :(得分:0)
因为你正在使用矢量;因此,在k=1,您获得的邻近值(k=1)比k=n(例如k=5时的公共类)更重要{} p>
k=1
k=n
k=5