如何根据时间序列的列值提取日期?

时间:2019-11-05 22:31:16

标签: r loops xts

假设我有

A <- c(1,0,0,0)
B <- c(0,1,0,0)
C <- c(0,0,1,0)
D <- c(0,0,0,1)
data <- xts(cbind(A,B,C,D),order.by = as.Date(1:4))

然后我得到...

           A B C D
1970-01-02 1 0 0 0
1970-01-03 0 1 0 0
1970-01-04 0 0 1 0
1970-01-05 0 0 0 1

我想提取值为1的每一列的日期。 所以我想看这样的东西...

A "1970-01-02"
B "1970-01-03"
C "1970-01-04"
D "1970-01-05"

这是获取答案的手动方法。所以我基本上想运行一个可以做到这一点的循环...

index(data$A[data$A==1])
index(data$B[data$B==1])
index(data$C[data$C==1])
index(data$D[data$D==1])

3 个答案:

答案 0 :(得分:2)

如果特定行有多个1,而您只想为该行返回一次索引,则可以使用rowSums并为index子集

zoo::index(data)[rowSums(data == 1) > 0]
#[1] "1970-01-02" "1970-01-03" "1970-01-04" "1970-01-05"

如果我们想为每个1设置索引值,可以将whicharr.ind = TRUE一起使用

zoo::index(data)[which(data == 1, arr.ind = TRUE)[, 1]]

要获取列名和索引,我们可以重用which

中的矩阵
mat <- which(data == 1, arr.ind = TRUE)
data.frame(index = zoo::index(data)[mat[, 1]], column = colnames(data)[mat[,2]])

#       index column
#1 1970-01-02      A
#2 1970-01-03      B
#3 1970-01-04      C
#4 1970-01-05      D

答案 1 :(得分:0)

从原始data对象开始,您可以先创建一个小标题,然后将其融合以得到所需的格式:

library(tidyverse)

as_tibble(data) %>% 
  mutate(time = time(data)) %>% 
  gather("group", "value", -time) %>% 
  filter(value == 1) %>% 
  select(group, time)

答案 2 :(得分:0)

我使用sapply返回行中有1的行名。如果连续有多个1,这应该可以工作。

one_days <- as.Date(unlist(
    sapply(1:ncol(data), 
     function(x) time(data)[which(data[, x] == 1)])))

# "1970-01-02" "1970-01-03" "1970-01-04" "1970-01-05"

如果您还想要行名。

rown <-  unlist(sapply(1 : ncol(data), function(x) rep(colnames(data)[x], sum(data[, x]))))
names(one_days) <- rown

#           A              B            C            D
# "1970-01-02"  "1970-01-03" "1970-01-04" "1970-01-05"

测试多个1

A <- c(1,1,0,0)
one_days <- as.Date(unlist(
     sapply(1:ncol(data),
      function(x) time(data)[which(data[, x] == 1)])))
rown <-  unlist(sapply(1 : ncol(data), function(x) rep(colnames(data)[x], sum(data[, x]))))
names(one_days) <- rown
one_days
#           A            A            B            C            D
#"1970-01-02" "1970-01-03" "1970-01-03" "1970-01-04" "1970-01-05"