如何使用R推断两个空间点之间的关系/相关性

时间:2014-03-03 20:44:05

标签: r geospatial correlation

我对空间统计领域很陌生,但我很感兴趣。出于学习和演示的目的,我创建了三个数据集 数据集 - 人员:这描述了具有少量变量的特定位置的个人。请注意,这些人位于所提供的城市。一个简短的解释:

  • POINT_X:城市的X坐标。
  • POINT_Y:城市的Y坐标。
  • city:他们居住的城市名称。
  • 生病:“1”表示他们病了。出于学习目的,所有人都生病了。
  • 工作:如果他们有工作。 “1”表示:他们有一个,“0”表示他们没有一个。
  • disnw:距离最近的水点的距离。
  • wID:不相关。

数据集 - 城市:这描述了一些城市,包括一些变量。对这些的简短解释:

  • city:城市名称。
  • 人口:城市人口。
  • POINT_X:城市的X坐标。
  • POINT_Y:城市的Y坐标。
  • 病:这个城市的病人数​​量。
  • notill:城市健康人数。
  • disnw:距离最近的水景的距离(以km为单位)。
  • wID:不相关
  • rate_ill:城市病人的比率。
  • rate_notill:城市健康人的比率。

数据集 - Waterfeatures:。请注意,viallages与人在同一地点。这是一组空间点,描述了水的特征。

  • POINT_X:水上特征的X坐标。
  • POINT_Y:水上特征的Y坐标。

关于设置的地理概述(红色是人,蓝色是水特征,黄色是城市) Plot

现在我想检查这样一个假设,即靠近水域的城市(因此变量 disnw 较低的城市)的病人人数较多。那么,病人数量/病人比例与水景的接近程度之间是否存在相关性。我知道,数据集可能不具有代表性或不适合我的假设,但是现在这个事实并不重要。
我已经看过一些函数和包,但我不确定一个合适的方法。方法,可能是有用的(至少从我的角度来看):半变异函数,变异函数,Ripley的K函数,G函数,相关系数。

为了更好地概述,我创建了示例数据集。你可以在这里找到这些:

persons = read.csv("http://pastebin.com/raw.php?i=3aMGi9Ax", header = TRUE, stringsAsFactors=FALSE)
city = read.csv("http://pastebin.com/raw.php?i=Lk3KXLQT", header = TRUE, stringsAsFactors=FALSE)
water = read.csv("http://pastebin.com/raw.php?i=hQRvMZwE", header = TRUE, stringsAsFactors=FALSE)

从你这边得到一些意见真是太棒了。也许你有一个提示,如何进行这种分析 提前谢谢!

0 个答案:

没有答案