使用k-Nearest Neighbors
算法的数据集的示例是什么?
我理解这个概念,但我不确定用于x,y坐标的数据类型。
可以为x, y
提供数据集(带nearest-neighbor-k algorithm
坐标)的示例吗?
答案 0 :(得分:3)
NN
搜索的方式很简单:
x
和y
)。query
来了,它的元素类型相同
数据库,因此在您的情况下是2D点。query
中最相同的点
指向数据库内部。有许多算法可以让我们不搜索整个数据库,而只搜索query
感兴趣的内容,从而有效地回答query
。
示例:
数据库有6个2D点:(因此是您要引用的datatset
)
0 0
1 1
2 2
3 3
4 4
5 5
query
2D点出现:
q = (9, 9)
答案是距q
的最近点,在此示例中为(5, 5)
。
在kNN
搜索中,query
要求数据库的k
个最相同的元素,在我们的示例中是数据库的k
最近点以上是查询点q
。
因此,对于k = 3
,答案应该是:
5 5 // the 1st closest point to q
4 4 // the 2nd closest point to q
3 3 // the 3rd closest point to q
答案 1 :(得分:1)
你不明白这个概念。
k-NN
不仅限于只有2维点(带x
& y
坐标)的数据集。
任何数据集都可以与k-NN
一起使用,无论功能的数量是多少 - 您可以使用多个different distance metrics
(即使是技术上无效的指标也是如此)。