机器学习中维度,属性和特征的区别

时间:2013-11-06 03:45:45

标签: machine-learning

这是二维的:[[2,2]]但它也有2个特征/属性不是它。我对尺寸,属性和特征之间的差异感到困惑。

2 个答案:

答案 0 :(得分:26)

我不同意@Atilla回答

  • 维度通常是指数字属性,虽然它也可以用于“数据向量的第二维是人的年龄”的形式,但它是相当罕见 - 在大多数情况下,维度是“属性数量”
  • 属性是您的积分中的一种特殊“数据类型”,因此每个观察/数据点(如个人记录)包含许多不同的属性(如人体重,身高,年龄等)< / LI>
  • 功能可能有多种含义,具体取决于具体情况:
    • 有时指属性
    • 它有时指特定学习模型生成的数据的内部表示,例如 - 神经网络提取特征,它们是属性或其他特征的组合
    • 它有时指的是内核方法引起的数据的假设表示(在内核PCA,内核k-means,SVM中)

一般来说,你有一些对象X,你用一些属性描述(这是特征提取的第一步,所以这些属性有时也被称为feature),它创建给定维度的表示(属性数量,提取的特征)。然后你训练一些模型,它经常创建某种抽象(有时甚至是多层次),每个抽象都会生成新的特征(从特征中提取特征),这些特征是更复杂的对象然后是在较低的“水平”。

 X  --->   repr(X)   --->   f1(repr(X)) --->   ....  --->   fn(repr(X))
data      attributes         1st level                      nth level
        (0th features)       features                       features

      |repr(X)|=dimension

f经常是经常性的,因此f2(repr(X))实际上是f2'(f1(repr(X))

答案 1 :(得分:2)

他们是一样的东西。属性,维度和特征。根据作者的背景或领域,它们可以互换使用。

例如,如果你在谈论数学方面,你可以说这是高维问题。