我是初学者,希望得到一些帮助。 我有一个excel文件中的数据,表示浏览器每小时点击一次。 数据看起来像这样:
v11 v12 v13 v14 date
6.111111111 0.066666667 3.488888889 0.155555556 12-12-2016 0:00:00
有数据直到2017年初,我应该在最后一个日期之后预测值。
我尝试创建时间序列(ts,开始,结束,频率)以便使用arima估算未来值,但由于某些原因,日期显示错误。即使我指定2016-12-12(见下文)
,我最终的开始日期是1992年#Load data from Excel file
data1 <- read.xlsx("Training data set.xlsx", sheetIndex = 1,colIndex=1)
data1 <- data.matrix(data1)
v1 <- c(data1)
v1.timeseries <- ts(v1, start = c(2016-12-12,1), frequency = 24)
print(v1.timeseries)
Time Series:
Start = c(1992, 1)
End = c(2020, 24)
Frequency = 24
[1] 92.86667 80.13333 76.37778 91.80000 119.06667 151.40000 176.57778
然后我认为回归会更好,但我无法将日期列转换为R读取的yyyy-mm-dd时间。 我已经在线查看了,并且无法弄清楚如何在R中设置我的数据以进行预测。
有人能帮助我吗?
谢谢!
答案 0 :(得分:0)
**
我无法将日期列转换为yyyy-mm-dd时间 R读取
**
假设这是你的文本文件(trial.txt),如下所示,
v11 v12 v13 v14 date
6.111111111 0.066666667 3.488888889 0.155555556 12-12-2016 13:30:20
阅读R
中的文本文件df = read.table("trial.txt", header=T, sep="\t")
> df
v11 v12 v13 v14 date
1 6.111111 0.06666667 3.488889 0.1555556 12-12-2016 13:30:20
> class(df$date)
[1] "factor"
> df$date = as.POSIXct(df$date, format="%d-%m-%Y %H:%M:%S")
> class(df$date)
[1] "POSIXct" "POSIXt"
> df$date
[1] "2016-12-12 13:30:20 IST"
> df
v11 v12 v13 v14 date
1 6.111111 0.06666667 3.488889 0.1555556 2016-12-12 13:30:20
上面的示例将日期列转换为可由R读取的yyyy-mm-dd时间格式。