应用错误收集

用R测试lpp上的CSR

时间：2017-08-27 11:46:36

标签： r cluster-analysis spatial spatstat hypothesis-test

我最近在R＆＃34;上发布了一个非常新鲜的东西。关于这样做的正确方法的问题，如果你对它感兴趣，你可以在[这里]找到它。1

我现在已经设法开发了一个简单的R脚本来完成这项工作，但现在结果让我感到困扰。

长话短说我用R来用lpp分析mad.test（线性点模式）。该函数执行假设检验，其中零假设是点是随机分布的。目前我有88个lpps要分析，根据p.value 86个随机分布，其中2个不是。

这两个不是随机分布的lpps。

看着它们，你可以在第一个看到某种类型的聚类，但第二个只有三个点，在我看来，没有办法可以保证只有三个点不对应于随机分布。还有一个，两个，三个点的其他曲目，但它们都属于＆＃34;随机＆＃34; lpps类别，所以我不知道为什么这个不同。

所以问题是这样的： CSR测试的点数太少了几分？

我也注意到这两个lpps比其他lpps低得多$statistic$rank。我试图找到这意味着什么，但我现在无能为力，所以这是另一个新问题： $statistic$rank是某种质量分析指标，因此我可以用它来分组我的lpp分析为＆＃34;重要的＆＃34;并且＆＃34;点数太少＆＃34;那些吗

我的R脚本和所有shp文件都可以从here（850 Kb）下载。

非常感谢你的帮助。

2 个答案:

答案 0 :(得分：1)

对于分析需要多少分的问题，不可能给出通用答案。对于独立分析，通常0,1和2太少。但是，如果他们是同一件事的重复测量的一部分，他们可能仍然有趣。另外，我通常会说你的3点示例太少，无法说出任何有趣的内容。然而，一个极端的例子是，如果你有一个长线段，其中一个点靠近一端发生，另外两个在另一端彼此靠近。对于CSR而言，这种情况不太可能发生，您可能倾向于不相信这一假设。这似乎就是你的情况。

关于你的排名问题，你可能想要阅读更多关于蒙特卡罗测试的信息，你正在进行预测。基本上，您通过单个数字（线性K的最大绝对偏差）汇总点模式，然后您可以查看此数字与CSR随机生成的数字的极端程度。假设您使用99次CSR模拟，则总共有100个数字。如果您的数据排名为最极端（$statistic$rank==1），则p值为1％。如果它排在第50位，则p值为50％。如果您使用了其他数量的模拟，则必须相应地进行计算。即使用199次模拟，等级1为0.5％，等级2为1％等等。

答案 1 :(得分：0)

多次测试存在一个根本问题。您正在应用88次假设检验。该测试（默认情况下）设计为在5％（每20个应用程序）中给出误报，因此如果零假设为真，则应该预期88次测试会出现88/20 = 4.4误报。因此只得到2个正结果（＆＃34;非随机＆＃34;）与零假设完全一致，即所有模式都是随机的。我的结论是模式是随机的。