我正在处理约2500个观测值的数据集,我想知道是否适合对具有30个以上观测值的数据集进行Wilcoxon测试。
我在我的数据帧上进行了Shapiro-Wilk正态性测试,看起来数据不是正态分布的(请参阅下文)。鉴于此,进行Wilcoxon测试是否合适?我不清楚Wilcoxon测试是否更适合保留较小的样本量。
shapiro.test(df$manu_emp)
Shapiro-Wilk normality test
data: df$manu_emp
W = 0.25801, p-value < 0.00000000000000022
wilcox.test(manu_emp ~ i_flag, data = df)
Wilcoxon rank sum test with continuity correction
data: df$manu_emp by i_flag
W = 707510, p-value = 0.000006872
alternative hypothesis: true location shift is not equal to 0