我有两个数据框,每个数据框包含时间戳列,如下所示 图像:
数据帧1:
数据帧2:
我想找到数据帧的每个列之间的时间差,例如:DF1的Column1的各行与DF2的Column1的各行之间的时间差。
我在上图中的每个数据框中只提到了三列,虽然我在原始数据集的每一列中都有257列,但我目前正在单独使用以下命令找到差异:
diff_time_1<- difftime(df1$t1,df2$l1)
diff_time_2<- difftime(df1$t2,df2$l2)..so on
如果我尝试执行所有257列,这需要付出很多努力,我已经尝试了各种方法,使用apply函数和for循环,但它们似乎不起作用。
请帮助我找到一个解决方案,我可以一次性将difftime
函数应用于整个列。
答案 0 :(得分:0)
我们可以使用Map
将difftime
应用于'df1','df2'的相应列,以获得list
vector
的<{1}}
Map(difftime, df1, df2)
如果日期时间列仅是列的子集,则对数据集进行子集化并应用difftime
Map(difftime, df1[subCols], df2[subCols])
答案 1 :(得分:0)
#DATA
mydates = seq.POSIXt(from = as.POSIXct("1970-01-01"),
to = as.POSIXct("1970-12-01"), by = "hours")
set.seed(42)
df1 = data.frame(C1 = sample(mydates, 5), C2 = sample(mydates, 5))
df2 = data.frame(C1 = sample(mydates, 5), C2 = sample(mydates, 5))
如果df1
和df2
的维度相同,您可以减去以获得天数差异
df1 - df2
# C1 C2
#1 152.70833 days -140.62500 days
#2 72.79167 days -80.70833 days
#3 -216.58333 days 5.75000 days
#4 192.00000 days 60.79167 days
#5 59.91667 days 48.33333 days
或者您可以使用sapply
浏览df1
和df2
列,以便在difftime
sapply(1:2, function(i) difftime(time1 = df1[,i], time2 = df2[,i], units = "hours"))
# [,1] [,2]
#[1,] 3665 -3375
#[2,] 1747 -1937
#[3,] -5198 138
#[4,] 4608 1459
#[5,] 1438 1160