k-Nearest Neighbors算法的示例数据集?

时间:2014-05-19 02:09:24

标签: computational-geometry nearest-neighbor

使用k-Nearest Neighbors算法的数据集的示例是什么?

我理解这个概念,但我不确定用于x,y坐标的数据类型。

可以为x, y提供数据集(带nearest-neighbor-k algorithm坐标)的示例吗?

2 个答案:

答案 0 :(得分:3)

NN搜索的方式很简单:

  1. 你有一个元素数据库(这里你有2个维点,有 坐标xy)。
  2. A query来了,它的元素类型相同 数据库,因此在您的情况下是2D点。
  3. 目标是找出query中最相同的点 指向数据库内部。
  4. 有许多算法可以让我们不搜索整个数据库,而只搜索query感兴趣的内容,从而有效地回答query

    示例:

    数据库有6个2D点:(因此是您要引用的datatset

    0 0
    1 1
    2 2
    3 3
    4 4
    5 5
    

    query 2D点出现:

    q = (9, 9)

    答案是距q的最近点,在此示例中为(5, 5)

    kNN搜索中,query要求数据库的k个最相同的元素,在我们的示例中是数据库的k最近点以上是查询点q

    因此,对于k = 3,答案应该是:

    5 5 // the 1st closest point to q
    4 4 // the 2nd closest point to q
    3 3 // the 3rd closest point to q
    

答案 1 :(得分:1)

你不明白这个概念。

k-NN不仅限于只有2维点(带x& y坐标)的数据集。

任何数据集都可以与k-NN一起使用,无论功能的数量是多少 - 您可以使用多个different distance metrics(即使是技术上无效的指标也是如此)。