假设我从不同的1D正态分布中采样了4个独立的数据集:data1,data2,data3和data4。
我想测试data1和data2与data3和data4相比是否具有更接近的均值,例如
|m_1 - m_2| < |m_3 - m_4|
实际上,困难在于我没有任何配对,因此相关性不起作用,我真的只是想测试均值而非配对值之间的距离。我当时正在考虑定义以下变量Zij:
if m_i - m_j > 0 (=> use a ttest): Z_ij = x_i - x_j
elseif m_i - m_j < 0: Z_ij = x_j - x_i
where x_i ~ N(m_i, s_i), x_j ~ N(m_j, s_j).
然后,如果符号估计的误差很小:
Z_ij ~ N(|m_i - m_j|, sqrt(sigma_i^2+sigma_j^2)).
最后,我还可以将t_test与Z_12和Z_34进行比较。
如果我将测试t(x_1-x_2),t(x_3-x_4)和t(z_12-z_34)的alpha值除以3,是否正确?
您认为这可行吗? 预先谢谢你