比较两个数据集均值是否比其他两个数据集均值更接近

时间:2018-10-31 11:38:48

标签: statistics

1

假设我从不同的1D正态分布中采样了4个独立的数据集:data1,data2,data3和data4。

我想测试data1和data2与data3和data4相比是否具有更接近的均值,例如

|m_1 - m_2| < |m_3 - m_4|

实际上,困难在于我没有任何配对,因此相关性不起作用,我真的只是想测试均值而非配对值之间的距离。我当时正在考虑定义以下变量Zij:

if m_i - m_j > 0 (=> use a ttest): Z_ij = x_i - x_j

elseif m_i - m_j < 0: Z_ij = x_j - x_i

where x_i ~ N(m_i, s_i), x_j ~ N(m_j, s_j).

然后,如果符号估计的误差很小:

Z_ij ~ N(|m_i - m_j|, sqrt(sigma_i^2+sigma_j^2)).

最后,我还可以将t_test与Z_12和Z_34进行比较。

如果我将测试t(x_1-x_2),t(x_3-x_4)和t(z_12-z_34)的alpha值除以3,是否正确?

您认为这可行吗? 预先谢谢你

0 个答案:

没有答案