我是R的新手,需要进行时间序列分析。我的数据目前在数据框中。时间序列分析的适当格式显示为ts
或xts
,具体取决于您阅读的文章。我只能通过我找到的信息弄清楚如何达到xts
形式。
我的问题是:
问题1: 如何将数据框转换为ts
?
问题2: 将数据框转换为xts
的更好方法是什么?
时间序列数据需要包含感兴趣的变量x3
以及分类变量。该系列应按年度季度提供。
数据与此类似:
df <- data.frame(id = sprintf("%03d", 1:13),
year = c(2011, rep.int(2012,4), rep.int(2013,4), rep.int(2014,4)),
qtr = rep_len(c(4,1:3),13),
cat = sample(1:5, size=13, replace = TRUE),
x1 = sample.int(13)/100,
x2 = sample.int(13)/100,
x3 = sample.int(13)/100)
df
id year qtr cat x1 x2 x3
1 001 2011 4 4 0.10 0.05 0.11
2 002 2012 1 2 0.06 0.09 0.10
3 003 2012 2 1 0.12 0.02 0.03
4 004 2012 3 5 0.13 0.08 0.05
5 005 2012 4 1 0.04 0.06 0.04
6 006 2013 1 5 0.03 0.13 0.06
7 007 2013 2 4 0.05 0.12 0.12
8 008 2013 3 2 0.09 0.03 0.09
9 009 2013 4 4 0.11 0.01 0.13
10 010 2014 1 1 0.01 0.10 0.08
11 011 2014 2 2 0.08 0.07 0.07
12 012 2014 3 5 0.02 0.11 0.01
13 013 2014 4 3 0.07 0.04 0.02
我编写的将其转换为xts
的代码如下:
library(zoo)
library(xts)
yq <- paste(df$year, "-", df$qtr, sep="")
df.yq <- cbind(df, as.yearqtr(yq))
df.xts <- xts(df.yq[,"x3"], order.by = df.yq[,"as.yearqtr(yq)"])
df.xts <- cbind(df.xts, df[,"cat"])
names(df.xts) <- c("x3", "cat")
输出:
> df.xts
x3 cat
2011 Q4 0.11 4
2012 Q1 0.10 2
2012 Q2 0.03 1
2012 Q3 0.05 5
2012 Q4 0.04 1
2013 Q1 0.06 5
2013 Q2 0.12 4
2013 Q3 0.09 2
2013 Q4 0.13 4
2014 Q1 0.08 1
2014 Q2 0.07 2
2014 Q3 0.01 5
2014 Q4 0.02 3
我不认为我的解决方案会引入任何不一致的地方,但感觉并非如此。&#34; hacky。&#34;我的问题在于良好的形式,因为它是学习数据操作。您可以给我的任何信息都将非常感激。
答案 0 :(得分:1)
1)首先将其转换为动物园,as.xts
和as.ts
将有效:
z <- with(df, zoo(cbind(x3, cat), as.yearqtr(year + (qtr-1)/4)))
x <- as.xts(z) # omit this line if you don't need x; can also omit library(xts)
tt <- as.ts(z)
1a)此变体也有效:
x <- with(df, xts(cbind(x3, cat), as.yearqtr(year + (qtr-1)/4)))
tt <- as.ts(as.zoo(x))
2)如果您只对ts感兴趣,那么这不会使用任何软件包,但会假设数据是有序的并且没有丢失的部分:
tt <- with(df, ts(cbind(x3, cat), start = c(year[1], qtr[1]), freq = 4))
更新简化(2)。