我有一些财务数据。对于指数1,我有1583个观测值,对于指数2,我有1598个观测值。我已经收集了指数1的数据,直到2017-06-15,对于指数2我有数据直到2017-06-09。它们都是在同一天开始的。
我的问题是:如何比较和找到两个数据框中缺少的日期,并删除索引不匹配的日期?
我正在尝试实现两个数据帧,其中索引2的日期与索引1的数据帧匹配。我很乐意删除一些观察日期和时间不同的观察结果。
答案 0 :(得分:1)
这个例子将帮助您生成虚拟数据以供将来参考,最后一行是完成您所寻求的命令。
set.seed(1984) ## to make the data repoducible
#simulating the data
z1 <- as.numeric(as.Date('2015-05-01')) + sample(1:100,20)
z2 <- as.numeric(as.Date('2015-05-01')) + sample(1:100,20)
z1 <- as.Date(z1, origin = '1970-01-01')
z2 <- as.Date(z1, origin = '1970-01-01')
z11 <- sample(1:100,20)
z21 <- sample(1:100,20)
df1 <- data.frame(z1,z11)
df2 <- data.frame(z2,z21)
# the merge
merge(df1,df2, by.x = 'z1', by.y = 'z2', all = F)