R时间序列对象ts()最小和最大日期

时间:2017-10-01 18:48:26

标签: r time-series

我想在R ts()对象中找到最小值和最大值的日期。我尝试了which.minwhich.max函数,但它们只返回“行号”。我想输出实际的日期。谢谢。

data <- ts(round(rnorm(60), 2), frequency = 12, end = c(2016, 12))
data
which.min(data)
which.max(data)

5 个答案:

答案 0 :(得分:5)

以下是我处理此问题的方法,但我不熟悉ts,我确信有更好的选择。

要从最大/最小位置检索日期,您可以在time上为ts创建的对象建立索引。例如:time(data)[which.max(data)];同样适用于which.min

然后将其转换为适当的年份(简单)和月份(棘手)索引,我通常会创建此函数:

numyear2monthyear <- function(x){   
   c(trunc(x),                   # entire part = year
     round((x-floor(x))*12 + 1)) # decimal part * 12 + 1 (Jan=0) = Month
}

以下是一个例子:

set.seed(123) # for the sake of reproducibility
data <- ts(round(rnorm(60), 2), frequency = 12, end = c(2016, 12))
data
       Jan   Feb   Mar   Apr   May   Jun   Jul   Aug
2012 -0.56 -0.23  1.56  0.07  0.13  1.72  0.46 -1.27
2013  0.40  0.11 -0.56  1.79  0.50 -1.97  0.70 -0.47
2014 -0.63 -1.69  0.84  0.15 -1.14  1.25  0.43 -0.30
2015  0.55 -0.06 -0.31 -0.38 -0.69 -0.21 -1.27  2.17
2016  0.78 -0.08  0.25 -0.03 -0.04  1.37 -0.23  1.52
Sep   Oct   Nov   Dec
2012 -0.69 -0.45  1.22  0.36
2013 -1.07 -0.22 -1.03 -0.73
2014  0.90  0.88  0.82  0.69
2015  1.21 -1.12 -0.40 -0.47
2016 -1.55  0.58  0.12  0.22

which.min(data)
[1] 18
which.max(data)
[1] 44

numyear2monthyear(time(data)[which.max(data)])
[1] 2015    8

numyear2monthyear(time(data)[which.min(data)])
[1] 2013    6

通常我把它变成另一个方便的功能,比如:

extrema_dates <- function(ts){
  ts_min_date <- numyear2monthyear(time(ts)[which.min(ts)])
  ts_max_date <- numyear2monthyear(time(ts)[which.max(ts)])
  list(min=min(ts),
       min_year=ts_min_date[1],
       min_month=ts_min_date[2],
       max=max(ts),
       max_year=ts_max_date[1],
       max_month=ts_max_date[2])
}

> extrema_dates(data)
$min
[1] -1.97

$min_year
[1] 2013

$min_month
[1] 6

$max
[1] 2.17

$max_year
[1] 2015

$max_month
[1] 8

我希望它能解决你的问题(并且很乐意看到更好的选择)。

答案 1 :(得分:4)

这是您在数据中找到最小值和最大值的年份和月份的方法:

> data <- ts(round(rnorm(60), 2), frequency = 12, end = c(2016, 12))
> data
       Jan   Feb   Mar   Apr   May   Jun   Jul   Aug   Sep   Oct   Nov   Dec
2012  0.18 -0.07 -0.77  1.23 -0.97  1.20 -1.41  1.39 -0.72 -0.94  0.28  0.97
2013 -0.86 -0.57 -0.16 -1.24 -0.35 -0.06  0.78  1.32  1.80 -0.51 -1.91  1.14
2014 -0.51  1.21  0.14  0.30  1.18 -0.32 -0.92 -0.46 -0.97 -0.94 -1.56 -0.63
2015  0.13  0.93 -1.45  1.97  0.04  0.55  0.45  0.13  1.14  0.27  0.15 -1.39
2016  0.68  2.16 -1.56 -0.44  1.07  1.27  1.01 -2.93 -0.19 -0.70  1.44  0.09

最短日期的相应日期是

> data_min_value <- data[which.min(data)]
> data_min_value
[1] -2.93
> data_min_value_time <- time(data)[which.min(data)]
> data_min_value_time
[1] 2016.583
> data_min_value_year <- floor(time(data)[which.min(data)])
> data_min_value_year
[1] 2016
> data_min_value_month <- (time(data)[which.min(data)] %% 1)*12
> data_min_value_month
[1] 7
> data_min_value_month_abb <- month.abb[(time(data)[which.min(data)] %% 1)*12+1]
> data_min_value_month_abb
[1] "Aug"

您获得的最大值的日期

> data[which.max(data)]
[1] 2.16
> floor(time(data)[which.max(data)]) # Year
[1] 2016
> month.abb[(time(data)[which.max(data)] %% 1)*12+1] # Abbreviation of month
[1] "Feb"

以下是上述示例中使用的有用功能的摘要:

> floor(2016.563)  # find out the integer part on the number
[1] 2016
> 2016.563 %% 1  # find out the fractional part on the number
[1] 0.563
> month.abb[0.563*12+1]  # find out the abbreviation of the month name 
[1] "Jul"

答案 2 :(得分:3)

这给出了一个最小的yearmon类对象。与which.max相同的方法可以达到最大值。

library(zoo)

imin <- which.min(data)
tmin <- time(as.zoo(data))[imin]
tmin
## [1] "Dec 2016"

as.integer(tmin)cycle(tmin)as.Date(tmin)分别使用月份的第1天给出年,月(数字在1到12之间)和Date类对象。

或者,time(data)[imin]as.integer(time(data))[imin]cycle(data)[imin]会将时间作为年份+分数, 年份为整数和月份数。这三个不使用任何包。

答案 3 :(得分:3)

我最喜欢的时间序列工具是xtsts个对象可以干净地翻译:

library(xts)
x = as.xts(data)

输出:

> min(index(x))
[1] "Jan 2012"
> max(index(x))
[1] "Dec 2016"

答案 4 :(得分:0)

如果您有类似“日期”列和另一个值(例如“降雨”)列的内容,则始终可以通过这种方式返回这些值。如果使用Zoo,则可能需要转换为数据框。

# Get your max and min Rainfall values. The brackets return the value as well as set it in a variable
(maxR <- max(df$Rainfall))
(minR <- min(df$Rainfall))

# Get the Dates of your max and min Rainfall values.
(maxD <- df$Date[df$Rainfall==maxR])
(minD <- df$Date[df$Rainfall==minR])