循环通过日期时间的数据框

时间:2018-03-25 17:10:38

标签: r for-loop tidyverse lubridate

我正在尝试为卫星发射器创建GPS时间表,用于跟踪我正在研究的鸟类物种的迁移。下面称为'sched_gps_fixes'的函数采用日期时间向量并将它们写入.ASF文件,该文件被上传到卫星发射机。这告诉发射器采取GPS定位的日期和时间。使用R和sched_gps_fixes功能可以让我快速创建一个从一年中的任何一天开始的GPS计划。发射器附带的软件也可以做到这一点,但我需要精心选择每个时间和日期,我希望发射器能够获取GPS位置。

所以我想:1)创建一个包含2018年一年中每一天的数据框,以及我希望发射机收集GPS位置的时间,2)使用数据帧的每一行作为开始日期对于一系列日期时间(例如,从2018-03-25 12:00:00开始,我想创建一个GPS计划,在此之后每隔一天获取一个GPS点,所以2018-03-25 12:00: 00,2018-03-27 12:00:00等)3)为每个GPS时间表创建一个.ASF文件。这是我在下面尝试完成的简化版本:

library(lubridate)

# set the beginning time
start_date <- ymd_hms('2018-01-01 12:00:00')

# create a sequence of datetimes starting January 1
days_df <- seq(ymd_hms(start_date), ymd_hms(start_date+days(10)), by='1 days')
tz(days_df) <- "America/Chicago"
days_df <- as.data.frame(days_df)
days_df

# to reproduce the example
days_df <- structure(list(days_df = structure(c(1514829600, 1514916000, 
1515002400, 1515088800, 1515175200, 1515261600, 1515348000, 1515434400, 
1515520800, 1515607200, 1515693600), class = c("POSIXct", "POSIXt"
), tzone = "America/Chicago")), .Names = "days_df", row.names = c(NA, 
-11L), class = "data.frame")

# the data frame looks like this:

days_df
1  2018-01-01 12:00:00
2  2018-01-02 12:00:00
3  2018-01-03 12:00:00
4  2018-01-04 12:00:00
5  2018-01-05 12:00:00
6  2018-01-06 12:00:00
7  2018-01-07 12:00:00
8  2018-01-08 12:00:00
9  2018-01-09 12:00:00
10 2018-01-10 12:00:00
11 2018-01-11 12:00:00

我想遍历数据框中的每个日期时间,并为数据框的每一行创建一个向量。因此,每个向量都会有一个特定行的日期时间作为GPS计划的开始日期,每2天需要一个点(如下所示):

[1] "2018-01-01 12:00:00 UTC" "2018-01-03 12:00:00 UTC" "2018-01-05 12:00:00 UTC" "2018-01-07 12:00:00 UTC"
[5] "2018-01-09 12:00:00 UTC" "2018-01-11 12:00:00 UTC"

然后,每个向量(或GPS时间表)将在以下函数中作为“gps_schedule”运行,以便为发射器创建.ASF文件:

sched_gps_fixes(gps_schedule, tz = "America/Chicago", out_file = "./gps_fixes")

所以我想知道如何创建一个for循环,它会为2018年的每一天产生一个日期时间向量。这是我试图做的伪代码:

# create a loop called 'create_schedules' to make the GPS schedules and produce a .ASF file for each day of 2018

create_schedules <- function(days_df) {

  for(row in 1:nrow(days_df)) {

    seq(ymd_hms(days_df[[i]]), ymd_hms(days_df[[i]]+days(10)), by='2 days')

  }
}

# run the function
create_schedules(days_df)

我猜我需要一个输出来存储和命名每个向量的开始日期等等?

谢谢,

1 个答案:

答案 0 :(得分:1)

一种选择是使用mapply根据OP提供的计划定义为每一行生成计划:

library(lubridate)

# For the sample data max_date needs to be calculated. Otherwise to generate
# schedule for whole 2018 max_date can be taken as 31-Dec-2018.
max_date = max(days_df$days_df)

mapply(function(x)seq(x, max_date, by="2 days"),days_df$days_df) 

#Result : Only first 3 items from the list generated. It will continue 
# [[1]]
# [1] "2018-01-01 12:00:00 CST" "2018-01-03 12:00:00 CST" "2018-01-05 12:00:00 CST"
# [4] "2018-01-07 12:00:00 CST" "2018-01-09 12:00:00 CST" "2018-01-11 12:00:00 CST"
# 
# [[2]]
# [1] "2018-01-02 12:00:00 CST" "2018-01-04 12:00:00 CST" "2018-01-06 12:00:00 CST"
# [4] "2018-01-08 12:00:00 CST" "2018-01-10 12:00:00 CST"
# 
# [[3]]
# [1] "2018-01-03 12:00:00 CST" "2018-01-05 12:00:00 CST" "2018-01-07 12:00:00 CST"
# [4] "2018-01-09 12:00:00 CST" "2018-01-11 12:00:00 CST"
# ....
# ....
# ....
# [[10]]
# [1] "2018-01-10 12:00:00 CST"
# 
# [[11]]
# [1] "2018-01-11 12:00:00 CST"

如果OP希望结果​​列表中的项目有names,那么mapply可以用作:

更新:根据OP的要求生成开始+ 10天的时间表。 10天相当于10*24*3600 seconds

mapply(function(x, y)seq(y, y+10*24*3600, by="2 days"),
    as.character(days_df$days_df), days_df$days_df, 
    SIMPLIFY = FALSE,USE.NAMES = TRUE) 

#Result
# $`2018-01-01 12:00:00`
# [1] "2018-01-01 12:00:00 CST" "2018-01-03 12:00:00 CST" "2018-01-05 12:00:00 CST"
# [4] "2018-01-07 12:00:00 CST" "2018-01-09 12:00:00 CST" "2018-01-11 12:00:00 CST"
#.......
#.......
#.......so on