我最近开始使用由医疗紧急情况提供的庞大数据集 服务。我有cca 25.000空间事件点。
我正在搜索书籍和互联网已有一段时间了,而且越来越多地对如何做以及如何做而感到困惑。
这些要点当然非常集中。我计算了K,L和G函数 为此,他们确认了严重的聚类。
我还有人口点数据集 - 每个公民一个点,类似地聚集为事件数据集(事件发生在人身上,因此这两个数据集之间存在强联系)。
我想比较这两个数据集来弄清楚它们是否相似 分散式。我想知道,如果有地方,哪里还有更多 事件,与人口相比。换句话说,我想使用人口数据集来解释强度,然后确定事件数据集是否与该强度相对应。假设是,事件应该随机出现在人口中。
我希望得到一个有关信息的地区情节,如果事件随机发生在人们身上,事件或多或少会发生。
你如何用R?
做到这一点我应该使用Kest或Kinhom来计算K函数吗? 我阅读了描述,但仍然不明白什么是基本的区别 他们之间。
我尝试使用Kcross,但正如我所知,使用了两个数据集中的一个 应该是CSR - 完全空间随机。 我还找到了Kcross.inhom,我应该将它用于我的数据吗?
如何获得有关人口的事件偏差的图(图像)?
我希望我能清楚地问。
感谢您抽出时间阅读我的问题 非常感谢你能回答我的任何问题。
祝你好运!
耶尔内伊
答案 0 :(得分:3)
我没有时间全面回答你的所有问题,但这里有一些指示。
免责声明:我是spatstat
软件包和图书Spatial Point Patterns: Methodology and Applications with R的合着者,因此我倾向于使用这些(我真的相信这些是解决您问题的最佳工具)。
概念性问题:您的学习区域有多大,将区域分布在该区域的任何地方或者仅限于道路网络中是否有意义?
现在我假设我们可以假设它们分布在任何地方。
一种简单的方法是使用density.ppp
估算人口密度,然后使用泊松模型拟合人口密度为ppm
的人口密度的事件。这可能是一个合理的零模型,如果这很好地符合数据,你基本上可以说事件发生在“控制不均匀的人口密度时,在太空中完全随机发生”。更多信息density.ppp
和ppm
分别位于1的第6章和第9章,当然还有spatstat
帮助文件。
如果您使用K / L / G / F / J函数等摘要统计信息,则应始终使用inhom
版本来考虑人口密度。这将在1的第7章中介绍。
如果将所有积分组合成具有两种类型(背景和事件)的标记点模式,那么看到相对风险(relrisk
)可能会很有趣。见1的第14章。
不幸的是,只有1的第3章,第7章和第9章可以免费下载示例章节,但我希望您可以在图书馆访问它或者可以选择购买它。