应用错误收集

时间：2013-01-05 20:49:26

标签： python arrays numpy statistics scipy

我有两个具有相同形状的二维阵列（105,234），名为A＆amp; B基本上由来自其他数组的平均值组成。我熟悉Python的scipy包，但我似乎无法找到一种方法来测试两个数组在每个单独的数组索引上是否在统计上有显着差异。我认为这只是一个大型的2D配对T检验，但我遇到了困难。任何想法或其他包使用？

答案 0 :(得分：1)

如果我们假设网格点上每个均值的基础方差相同，且观测数相同或已知，那么我们可以使用均值数组直接估算均值的标准差。

将网格点之间的差除以标准差，然后给出可以直接测试的t个分布随机变量，即可以计算p值。

作为许多要点的测试，我们将遇到多重测试问题http://en.wikipedia.org/wiki/Multiple_comparisons#Large-scale_multiple_testing并且应该更正p值。

答案 1 :(得分：1)

如果您的问题是“二维分布是否不同？”，请参阅 Numerical Recipes p. 763
（并进一步询问如何在numpy / scipy中做到这一点）。您也可以在stats.stackexchange上询问。

答案 2 :(得分：0)

我认为x，y坐标无关紧要，我们只有两套独立的测量值。

其中一种可能的方法可能就是计算每个阵列的平均值的标准偏差，将该值乘以学生系数（对于您的天文学样本数和95％置信水平可能有点1.645）并获得周围的置信区间这样的意思。如果两个不同阵列的置信区间重叠，则它们之间的差异不显着。可以找到公式here。

答案 3 :(得分：-2)

转到MS Excel。如果您的工作没有，那么还有其他选择

在Excel工作表中输入数字数组。在输入字段中运行公式，= TTEST（array1，array2，tail）。一条尾巴是一条，两条尾巴是两条......容易腻。这是一个简单的学生T，我相信你可能仍然需要一个t表来解释统计数据（互联网）。然而，它可以快速进行样本的快速比较。