我想对带有约200列的DF上的tseries包执行Jarque-Bera测试,但是不适用于NA。
我的DF看起来像这样:
d1 <- structure(list(Time=structure(17942:17947, class="Date"),
x1=c(NA, NA, 17L, 29L, 27L, 10L),
x2=c(30L, 19L, 22L, 20L, 11L, 24L),
x3=c(NA, 23L, 22L, 27L, 21L, 26L),
x4=c(30L, 28L, 23L, 24L, 10L, 17L),
x5=c(12L, 18L, 17L, 16L, 30L, 26L)),
row.names=c(NA, 6L), class="data.frame")
输出:
Time x1 x2 x3 x4 x5
1 2019-02-15 NA 30 NA 30 12
2 2019-02-16 NA 19 23 28 18
3 2019-02-17 17 22 22 23 17
4 2019-02-18 29 20 27 24 16
5 2019-02-19 27 11 21 10 30
6 2019-02-20 10 24 26 17 26
我尝试过:
library(tseries)
JB <- lapply(2:6, function(i) jarque.bera.test(d1[,i]))
但这给了我以下错误信息:
jarque.bera.test(d1 [,i])中的错误:x中的NAs
JB <- lapply(2:6, function(i) jarque.bera.test(d1[,i], na.rm=TRUE))
也不起作用。
NA仅在时间序列的开始。因此,我正在寻找在时间序列开始时忽略NA的方法。
谢谢!
答案 0 :(得分:1)
您可以尝试使用DescTools中的此版本的Jarque Bera测试,该版本允许删除NA(它是tseries软件包中jarque.bera.test的合并)。
JarqueBeraTest(x, robust = TRUE, method = c("chisq", "mc"), N = 0, na.rm = FALSE)
在您的情况下:
lapply(2:6, function(i) DescTools::JarqueBeraTest(x = d1[,i], method="chisq", na.rm=TRUE))
答案 1 :(得分:0)
这是使用R tseries库的一种可能的解决方案:
library(tseries)
# remove NAs
d1.cc <- d1[complete.cases(d1),]
# form time series
d1.cc.ts <- ts(d1.cc)
# run jarque.bera.test
JB <- lapply(1:nrow(d1.cc), function(i) jarque.bera.test(d1.cc.ts[i,]))
检查JB结果是否合理。
答案 2 :(得分:0)
这里matrixTests
的Jarque-Berra实现也很合适:
col_jarquebera(d1[,-1])
obs skewness kurtosis df statistic pvalue
x1 4 -0.2686809 1.406646 2 0.47125566 0.7900747
x2 6 -0.2249531 2.602041 2 0.09019679 0.9559034
x3 5 0.2436883 1.396859 2 0.58491604 0.7464266
x4 6 -0.6027177 2.139432 2 0.54841298 0.7601751
x5 6 0.5090893 1.854664 2 0.58712051 0.7456043