如何将数据标准化为具有相同的平方和?

时间:2016-06-07 13:37:55

标签: normalization feature-extraction multi-dimensional-scaling

在我所领域的很多文章中,这句话一再重复:"已将2个矩阵归一化为具有相同的平均平方和(在所有主体和每种模态的所有体素中计算)"。假设我们有两个矩阵,行定义不同的主题,列是特征(体素)。在这些文章中,对标准化方法没有太多解释。有没有人知道我应该如何将数据标准化为"相同的平均平方和" ?我根本不理解它。感谢

1 个答案:

答案 0 :(得分:0)

对于开始归一化,在此上下文中也称为特征缩放,这几乎可以总结它。您可以扩展功能,数据以消除差异和值范围,从而最终影响算法和结果。

https://en.wikipedia.org/wiki/Feature_scaling

在数据处理中,规范化非常有用(取决于应用程序)。例如。在基于距离的机器学习算法中,您应该对功能进行标准化,以便对算法的结果进行比例贡献,而不依赖于功能所包含的值范围。

为此,您可以使用不同的统计测量,例如 平方和:

SUM_i(Xi-Xbar)²

除此之外,您可以使用数据的方差或标准差。

https://www.westgard.com/lesson35.htm#4

然后可以使用这些统计术语来标准化您的数据,以改善数据算法的聚类质量。使用哪个术语以及哪种方法在很大程度上取决于您使用的算法和数据以及您的目标。 这篇文章比较了您可以选择的一些聚类方法:

http://maxwellsci.com/print/rjaset/v6-3299-3303.pdf

我希望这可以帮助你一点。