如何预测每小时数据

时间:2016-06-13 05:02:07

标签: r date datetime time-series prediction

我是初学者,希望得到一些帮助。 我有一个excel文件中的数据,表示浏览器每小时点击一次。 数据看起来像这样:

        v11         v12         v13         v14               date
6.111111111 0.066666667 3.488888889 0.155555556 12-12-2016 0:00:00

有数据直到2017年初,我应该在最后一个日期之后预测值。

我尝试创建时间序列(ts,开始,结束,频率)以便使用arima估算未来值,但由于某些原因,日期显示错误。即使我指定2016-12-12(见下文)

,我最终的开始日期是1992年
#Load data from Excel file
data1 <- read.xlsx("Training data set.xlsx", sheetIndex = 1,colIndex=1)
data1 <- data.matrix(data1)
v1 <- c(data1)
v1.timeseries <- ts(v1, start = c(2016-12-12,1), frequency = 24)
print(v1.timeseries)
Time Series:
Start = c(1992, 1) 
End = c(2020, 24) 
Frequency = 24 
[1]  92.86667  80.13333  76.37778  91.80000 119.06667 151.40000 176.57778

然后我认为回归会更好,但我无法将日期列转换为R读取的yyyy-mm-dd时间。 我已经在线查看了,并且无法弄清楚如何在R中设置我的数据以进行预测。

有人能帮助我吗?

谢谢!

1 个答案:

答案 0 :(得分:0)

**

  

我无法将日期列转换为yyyy-mm-dd时间   R读取

**

假设这是你的文本文件(trial.txt),如下所示,

    v11 v12 v13 v14 date
6.111111111 0.066666667 3.488888889 0.155555556  12-12-2016 13:30:20

阅读R

中的文本文件
df = read.table("trial.txt", header=T, sep="\t")

> df
       v11        v12      v13       v14                 date
1 6.111111 0.06666667 3.488889 0.1555556  12-12-2016 13:30:20
> class(df$date)
[1] "factor"
> df$date = as.POSIXct(df$date, format="%d-%m-%Y %H:%M:%S")
> class(df$date)
[1] "POSIXct" "POSIXt" 
> df$date
[1] "2016-12-12 13:30:20 IST"
> df
       v11        v12      v13       v14                date
1 6.111111 0.06666667 3.488889 0.1555556 2016-12-12 13:30:20

上面的示例将日期列转换为可由R读取的yyyy-mm-dd时间格式。