我对空间统计领域很陌生,但我很感兴趣。出于学习和演示的目的,我创建了三个数据集 数据集 - 人员:这描述了具有少量变量的特定位置的个人。请注意,这些人位于所提供的城市。一个简短的解释:
数据集 - 城市:这描述了一些城市,包括一些变量。对这些的简短解释:
数据集 - Waterfeatures:。请注意,viallages与人在同一地点。这是一组空间点,描述了水的特征。
关于设置的地理概述(红色是人,蓝色是水特征,黄色是城市)
现在我想检查这样一个假设,即靠近水域的城市(因此变量 disnw 较低的城市)的病人人数较多。那么,病人数量/病人比例与水景的接近程度之间是否存在相关性。我知道,数据集可能不具有代表性或不适合我的假设,但是现在这个事实并不重要。
我已经看过一些函数和包,但我不确定一个合适的方法。方法,可能是有用的(至少从我的角度来看):半变异函数,变异函数,Ripley的K函数,G函数,相关系数。
为了更好地概述,我创建了示例数据集。你可以在这里找到这些:
persons = read.csv("http://pastebin.com/raw.php?i=3aMGi9Ax", header = TRUE, stringsAsFactors=FALSE)
city = read.csv("http://pastebin.com/raw.php?i=Lk3KXLQT", header = TRUE, stringsAsFactors=FALSE)
water = read.csv("http://pastebin.com/raw.php?i=hQRvMZwE", header = TRUE, stringsAsFactors=FALSE)
从你这边得到一些意见真是太棒了。也许你有一个提示,如何进行这种分析 提前谢谢!