标签: r lda outliers
我有一些临床数据,我对-98名患者及其相应的蛋白质水平进行了LDA分析,以进行特定类型的分析。我绘制了输出,并且基本上有6个不同的“群集”个体。这就是问题 - 一些集群的异常值与其他集群更接近。我们知道,在某些情况下,群集所基于的医学诊断(表型)可能是错误的,并且看起来更接近蓝色群集的绿色群集的异常成员实际上可能 的一部分蓝色的集群。所以我的问题是:如果我们忽略医学诊断,是否有一种计算方法可以检测这些个体并重新评估它们是否真的是基于数据更接近群集的成员?
以下是输出示例: