我知道通常低P值是好的,因为我想拒绝H0假设。但我的问题很奇怪,我希望你能给我任何帮助或见解。
我使用大量数据集(n> 1,000,000),每个数据集代表一年的数据。我需要分析数据并找出年度的平均值 显着 是否与上一年的平均值不同。然而每个人都会喜欢它不重要而不是重要。
在“显着”中,我的意思是我希望能够告诉我的老板 - “看,那些非显着的变化是噪音,而那些重大的变化代表了真正需要考虑的事情”。
问题在于简单地将两个平均值与T检验进行比较总是会产生显着差异,即使差异非常小(可能是由于巨大的样本量)并且属于现实的O.K区域。所以基本上我认为它的方式,P值不能很好地满足我的需求。
你认为我应该怎么做?