此外,我还模拟了一些具有不同形状的模型分布,我的任务是比较每种基因的相关性分布与每种形状,以找出基因最相似的形状。
相关矩阵的范围是-1/1,并且与模型形状相同。到目前为止,我所做的是计算分布的8个区间中每个区间的成对相关量,我为每个基因和每种形状制作了列联表,以计算独立性的卡方检验。类似的分布具有较低的p值,反之亦然。
但是,我想知道是否有更好的方法来解决这个问题。说,我一直在阅读关于卡方距离的信息,但我在R中找不到它的良好实现。此外,我想将分布之间的距离表示为概率,而不是p值,或者也许用两者表示。我也一直在徘徊于欧几里得距离和计算向量之间距离的许多其他公式。
有人知道一个很好的近似值来计算两个向量之间的卡方距离,然后将其表示为R中的概率吗?