我希望制作ks.test以便在两个发行版之间进行比较。因此,这就是我的方式:
我从文件vec1
加载length(vec1) = 720642
:这是一个太大的数据集。
我申请了fitdistr(vec1,"lognormal")
- >在这里,我得到了最适合meanlog=1.69
sdlog=1.02
和vec1
当我只是申请:
ks.test(vec1, "plnorm", 1.69, 1.02)
我得到:D = 0.1429
,p-value < 2.2e-16
备选假设:双面
所以测试失败了,就好像我没有处理对数正态分布......
有没有人为此解决问题?是因为我从文件中加载了一个庞大的数据集吗?
答案 0 :(得分:1)
对于大数据集,由于大数据集的功率大,您将始终拒绝H0(具有任何指定的参考分布)。