我对统计数据的了解微不足道,抱歉。我有大量的测量振幅。在没有信号的情况下,假设噪声具有正态分布。当存在具有比周围噪声更高幅度的信号时,分布的形状在正侧更加拖尾。我在考虑使用偏度来检测信号。但是与体积本身相比,振幅较大的区域(体积中的细胞)相当小。因此,我们谈论的是数以千计的细胞,总共数千个细胞。如果正态分布的偏度为零,我如何在我的体积中提取那些导致非零偏度的单元格。如果说,我的偏度值是0.5,有没有办法丢弃所有单元格,只保留那些提高偏度值的单元格。也许我听起来不太清楚,但这只是表明我对这个主题的了解有多少。
提前致谢。
答案 0 :(得分:3)
在我看来,问题可能最好建模为混合模型:我们有高斯背景
B~N(0,sigma)
和一个信号,海报没有指明特定模型。
如果我们可以假设信号也采用一种(或可能是几种混合)高斯(s)的形式,那么使用EM算法的高斯混合建模可能是解决它的好方法(参见维基百科)。
分段语境中的一篇好文章就在这里:
http://www.fil.ion.ucl.ac.uk/~karl/Unified%20segmentation.pdf
如果我们不能做出这样的假设,我会使用稳健的回归方法来估计高斯噪声的参数,其中信号被视为异常值,例如,最小修剪的方块(再次见维基百科)。
然后可以通过(Bonferroni校正的)假设检验找到异常细胞,如例如所述。在本文中: