在大型数据集上应用ks.test

时间:2012-09-17 14:08:29

标签: r

我希望制作ks.test以便在两个发行版之间进行比较。因此,这就是我的方式:

  1. 我从文件vec1加载length(vec1) = 720642:这是一个太大的数据集。

  2. 我申请了fitdistr(vec1,"lognormal") - >在这里,我得到了最适合meanlog=1.69

  3. 分布的sdlog=1.02vec1
  4. 当我只是申请:

    ks.test(vec1, "plnorm", 1.69, 1.02)

    我得到:D = 0.1429p-value < 2.2e-16  备选假设:双面

  5. 所以测试失败了,就好像我没有处理对数正态分布......

    有没有人为此解决问题?是因为我从文件中加载了一个庞大的数据集吗?

1 个答案:

答案 0 :(得分:1)

对于大数据集,由于大数据集的功率大,您将始终拒绝H0(具有任何指定的参考分布)。