标签: classification knn euclidean-distance mulan
我想使用k最近邻居进行多标签分类。有一些基于knn的分类器在mulan库中实现,或者用C或Matlab编写,如MLKNN。
当我对数值数据集使用相同的分类器时,我得到相同的结果, 但是对于名义数据集,例如slashdot和genbase(值得注意的是数据只有0和1),我获得了不同的结果。
我想知道为什么会这样?这些分类器使用欧几里德距离和木兰使用韦卡的欧氏距离。
为什么名义数据中木兰的惰性分类器的结果与其他语言中的结果不同?哪一个是正确的? 如果你帮我找到原因,我会很高兴的。