统计均值中心 - 使用总平均值或属性均值

时间:2012-05-12 17:08:01

标签: statistics centering mean

我有一组数据,超过1000行和20个属性(以列显示)。 我想要使​​用均值居中,其中包括从每个值中取平均值得到平均值0.我是否逐个属性删除均值,还是从每个属性中删除所有属性的均值?

例如,如果属性A的平均值为500,则属性B的平均值为1,000。 对于A中的所有值,我可以删除500,这给A属性的平均值为0.然后我可以对属性B执行相同的操作。

OR

我可以取消两个属性的所有值。

哪个更具统计学意义?

我的问题是由于这个: 如果我从不同的属性中减去不同的值,那么这些属性就不再具有可比性,因为从每个属性中获取了不同的数量。如果我从all中减去相同的值,那么某些列可能只是负数(因此否定了均值居中的影响)。

谢谢,

1 个答案:

答案 0 :(得分:3)

通常,您可以单独居中每个属性 如果您将每个属性分开居中,则假设对于个人而言,重要的是每个度量与该属性的平均值的差异,并且您将失去对该个体的属性的绝对比较。
例如,如果你有人的身高,体重,将它们分开对中,你可以问“对于一个比平均身高的人,体重也比平均体重大”。将身高和体重平均起来将毫无意义 考虑它的一种方法是,你创造了一个普通的个体,你现在可以用它作为你所有观察的基准 现在,如果2个度量的绝对值具有可比性,比如产品价格和成本,那么您将无法再比较它们,因为它们会被转移。如果您关心的是对单个观察使用绝对比较的度量,则需要创建辅助度量,例如%profit。在这种情况下,中心值将允许您询问“产品价格是否高于平均价格”。