用R测试lpp上的CSR

时间:2017-08-27 11:46:36

标签: r cluster-analysis spatial spatstat hypothesis-test

我最近在R"上发布了一个非常新鲜的东西。关于这样做的正确方法的问题,如果你对它感兴趣,你可以在[这里]找到它。1

我现在已经设法开发了一个简单的R脚本来完成这项工作,但现在结果让我感到困扰。

长话短说我用R来用lpp分析mad.test(线性点模式)。该函数执行假设检验,其中零假设是点是随机分布的。目前我有88个lpps要分析,根据p.value 86个随机分布,其中2个不是。

这两个不是随机分布的lpps。 enter image description here enter image description here

看着它们,你可以在第一个看到某种类型的聚类,但第二个只有三个点,在我看来,没有办法可以保证只有三个点不对应于随机分布。还有一个,两个,三个点的其他曲目,但它们都属于"随机" lpps类别,所以我不知道为什么这个不同。

所以问题是这样的: CSR测试的点数太少了几分?

我也注意到这两个lpps比其他lpps低得多$statistic$rank。我试图找到这意味着什么,但我现在无能为力,所以这是另一个新问题: $statistic$rank是某种质量分析指标,因此我可以用它来分组我的lpp分析为"重要的"并且"点数太少"那些吗

我的R脚本和所有shp文件都可以从here(850 Kb)下载。

非常感谢你的帮助。

2 个答案:

答案 0 :(得分:1)

对于分析需要多少分的问题,不可能给出通用答案。对于独立分析,通常0,1和2太少。但是,如果他们是同一件事的重复测量的一部分,他们可能仍然有趣。另外,我通常会说你的3点示例太少,无法说出任何有趣的内容。然而,一个极端的例子是,如果你有一个长线段,其中一个点靠近一端发生,另外两个在另一端彼此靠近。对于CSR而言,这种情况不太可能发生,您可能倾向于不相信这一假设。这似乎就是你的情况。

关于你的排名问题,你可能想要阅读更多关于蒙特卡罗测试的信息,你正在进行预测。基本上,您通过单个数字(线性K的最大绝对偏差)汇总点模式,然后您可以查看此数字与CSR随机生成的数字的极端程度。假设您使用99次CSR模拟,则总共有100个数字。如果您的数据排名为最极端($statistic$rank==1),则p值为1%。如果它排在第50位,则p值为50%。如果您使用了其他数量的模拟,则必须相应地进行计算。即使用199次模拟,等级1为0.5%,等级2为1%等等。

答案 1 :(得分:0)

多次测试存在一个根本问题。您正在应用88次假设检验。该测试(默认情况下)设计为在5%(每20个应用程序)中给出误报,因此如果零假设为真,则应该预期88次测试会出现88/20 = 4.4误报。因此只得到2个正结果("非随机")与零假设完全一致,即所有模式都是随机的。我的结论是模式是随机的。