'与k-Nearest Neighbors进行分类'对于非数字参数

时间:2014-04-15 07:17:03

标签: algorithm machine-learning

我有一组带有参数的事实数据和一些与这些参数对应的值。 例如:

Street     Color     Shape      Value
-------------------------------------- 
Versky     Blue      Ball         10
Soll       Green     Square       5
...

现在我需要一个创建一个函数来获取参数集[Holl,Red,Circle]并返回预测的'Value'。

如果我的参数是我可以使用“使用k-Nearest Neighbors进行分类”算法的数字,但它们不是。

我可以使用哪种机器学习算法来解决这个问题?

1 个答案:

答案 0 :(得分:2)

请注意,最近邻居根据某个距离指标找到最近邻居。虽然广泛使用欧几里德或类似指标,但任何距离指标都可以。

您可以使用Hamming distance的变体:

Let x[i] be the i'th feature of vector x
Let the number of features be n

    d(x,y) = Sum { (x[i] == y[i] ? 0 : 1) | i from 0 to n }

以上是距离度量,它基本上是汉明距离的变化,其中每个特征都有其独特的字母。