我为我拥有的数据子集创建了一个动物园时间序列对象。数据按小时间隔均匀分布,但根据R-zoo文档(即数据中缺少一些时间点),它是一个弱规则的时间序列。
df <- read.table("Desktop/AutoCorrelation_hourly_testdata.csv", header = TRUE, sep = ",")
sub <- df[df$sid == 59, ]
sub <- sub[!duplicated(sub[c("binstart_date", "binstart_time")]), ]
library(zoo)
z <- read.zoo(sub, sep = ",", header = TRUE, index = 1:2, tz = "", format = "%Y-%m-%d %H:%M:%S")
acf_C_duration = acf(coredata(z$C_duration), na.action = na.pass, plot = TRUE)
我得到以下情节:
我的问题是,如果我的数据是按小时间隔计算,那么y轴上的滞后程度到底是多少?对我来说,解释这个情节的最佳方式是什么?
我对统计数据或R没有经验,但我试图确定这个数据集是否遵循节奏或具有任何潜在的模式/周期性。从在线研究看来,R自相关函数似乎可以为我做这件事。如果您认为我应该使用任何其他方法,请告诉我。
谢谢!
答案 0 :(得分:1)
比例从-1到1,因为它是correlation coefficient。从图中我们可以看到滞后没有显着影响(在界限内 - 不能告诉它们为零)。 ACF函数表示当前值是否始终依赖于先前的值(滞后)。所以你看到唯一的值是lag 0
的峰值。 (试着想一想这意味着什么)所以如果只是试图用自己解释它们(自相关属性),你的每小时价值是彼此独立的。
答案 1 :(得分:0)
更准确地说,您可以将一个方程拟合到 ACF,以准确了解您在测量中的相关性是哪个滞后。
等式中的#h 表示正在建模的参数 #r 表示相关距离(距离小于 r=1 产生统计上相等的值