在R

时间:2017-07-30 17:48:09

标签: r difftime

我有两个数据框,每个数据框包含时间戳列,如下所示 图像:

数据帧1:

Dataframe-1

数据帧2:

Dataframe-2

我想找到数据帧的每个列之间的时间差,例如:DF1的Column1的各行与DF2的Column1的各行之间的时间差。

我在上图中的每个数据框中只提到了三列,虽然我在原始数据集的每一列中都有257列,但我目前正在单独使用以下命令找到差异:

diff_time_1<- difftime(df1$t1,df2$l1)
diff_time_2<- difftime(df1$t2,df2$l2)..so on

如果我尝试执行所有257列,这需要付出很多努力,我已经尝试了各种方法,使用apply函数和for循环,但它们似乎不起作用。

请帮助我找到一个解决方案,我可以一次性将difftime函数应用于整个列。

2 个答案:

答案 0 :(得分:0)

我们可以使用Mapdifftime应用于'df1','df2'的相应列,以获得list vector的<{1}}

Map(difftime, df1, df2)

如果日期时间列仅是列的子集,则对数据集进行子集化并应用difftime

Map(difftime, df1[subCols], df2[subCols])

答案 1 :(得分:0)

#DATA
mydates = seq.POSIXt(from = as.POSIXct("1970-01-01"),
                     to = as.POSIXct("1970-12-01"), by = "hours")
set.seed(42)
df1 = data.frame(C1 = sample(mydates, 5), C2 = sample(mydates, 5))
df2 = data.frame(C1 = sample(mydates, 5), C2 = sample(mydates, 5))

如果df1df2的维度相同,您可以减去以获得天数差异

df1 - df2
#               C1              C2
#1  152.70833 days -140.62500 days
#2   72.79167 days  -80.70833 days
#3 -216.58333 days    5.75000 days
#4  192.00000 days   60.79167 days
#5   59.91667 days   48.33333 days

或者您可以使用sapply浏览df1df2列,以便在difftime

中使用它们
sapply(1:2, function(i) difftime(time1 = df1[,i], time2 = df2[,i], units = "hours"))
#      [,1]  [,2]
#[1,]  3665 -3375
#[2,]  1747 -1937
#[3,] -5198   138
#[4,]  4608  1459
#[5,]  1438  1160