用R

时间:2015-08-17 12:32:38

标签: r gis spatial prediction temporal

我是R的新手,它用于时空数据。在过去的几周里,我已经学习了R的基础知识,并试图找到一个合适的包/适当的函数来创建一个时空预测模型。

我找到了几种用于各种时空分析方法的软件包(例如SpatioTemporal,spTimer等),但是,我发现其中一些函数/软件包非常复杂,通过它们进行挖掘往往导致找到可能的问题证明它们不适合我的数据或我研究的目的。所以我很难确定哪些软件包和函数适合我的数据以及我研究的目的。搜索关于SO的主题似乎有很多关于R的(时空)分析的专家。所以我希望你们中的一个能够为我提供一些适用于包装和功能的确定性。我的研究。

研究: 我的研究目的是创建一个时空预测模型,该模型可以根据地理标记的推特消息预测城市内发生暴力犯罪的概率。

数据: 我的数据有两个主要组成部分:事件和推文

事件: 我在城市内(两个不同的时间段)有两个单独的事件数据集,其中包括城市内的暴力犯罪事件(每行都是一个单独的案例/事件)。相关列包括:Datetime(Y%-m%-d%H%:M%,作为POSIXct(现在)),LatitudeLongitude坐标(单独的变量)。因此,这些包括事件的日期和时间以及事件点位置的纬度/经度坐标。

鸣叫: 该数据集包括从城市内发送的推文(涵盖上述时间段),这些推文使用指示某些活动/情绪状态的关键字进行聚合。 与事件数据一样,此集包括:Datetime(与上述格式相同),LatitudeLongitude坐标。而且(除其他外)还有变量Keywordcluster,它表示包含推文中找到的相关关键词的群集(包含21个群集,其中包含与不同类型的活动或情绪状态相关的关键词)。

因此,事件和推文都包含指示确切时间和精确点位置(作为纬度和经度坐标)的列。目的是使用在单独推文中普遍存在的不同关键字群集(例如:一个群集包含与酒精使用相关的关键词)来预测区域内发生暴力犯罪事件的可能性。

由于目标是根据推特消息预测暴力犯罪,因此该模型最好只考虑事件发生前发送的推文(在短时间内)(例如:发送的推文)到事件发生前24小时)。目的是提供在某些短时间间隔(例如数小时或最多天数)之间某些区域内发生暴力犯罪的可能性,因为数据的性质(即不使用推文来预测事件的发生)一周后))。

我希望这能够充分解释我的数据和研究目的。如果你们中的一个能够提供关于哪些包装和功能应该适合的确定性(以及可能的一些额外提示),我将非常感激。这真的对我帮助很大!

提前致谢, M. Stam

0 个答案:

没有答案