奇异值的聚类

时间:2014-04-17 11:36:52

标签: matlab cluster-analysis

让我们考虑下面的奇异值图

enter image description here

我想对这些数据进行某种聚类,即从非主要组件中分离主要组件,比如噪声组件中的信号组件,我想这样做(任何软件matlab等都很好,更好matlab)让我们这样开始,先用第一点进行线性回归,然后用前两点做回归分析,依此类推,即一个想要创建两个组,在第一组回归线的系数应该接近每个另外,在另一组中,回归系数应该彼此接近,但是一组中的回归系数必须与另一组中的系数高度不同,这意味着我们应该找到最佳地将该组分开的点,换句话说,我应该在某个点上停止回归分析,将两个组分开,另一个回归将在此停止点之后开始,直到其他休息点,请帮助我如何做到programaticaly

1 个答案:

答案 0 :(得分:1)

显示的图是累积图 - 如果您考虑它们的个体值而不是它们的累积值,这些值的聚类可能会更加容易。

我们可以为这些值建议许多不同的聚类算法,但只有一个样本很难确定哪种方法最成功。 需要考虑的一些问题是:

  • 你知道你想要的群集吗?
  • 你知道这些集群的绝对阈值吗?
  • 值是否总是被安排到这些具有相似值的组中?

群集高度依赖于您希望在其中聚类的较大数据集上的数据行为。

最后,在不知道数据的目的的情况下,我们无法对此数据的适当分段发表评论,从而为您的应用程序带来良好的结果。在某些情况下,第一个奇异值可能就足够了,而在其他情况下,丢弃转换中的任何特征向量都可能是有害的。