R时间序列数据集。合并新数据和旧数据,好像timestamp_new> = Timestamp_old,并且如果ID_new> ID_old然后合并新数据

时间:2019-01-19 20:40:50

标签: r database merge dataset

(最后的问题) 我有一张这样的桌子:

c435356

期间为小时。发布新数据时,既可以包含新数据(例如,小时4的ID 1,也可以包含小时2的数据),然后新数据将获得ID 2为小时2的ID。

新数据将如下所示。它不再显示第一个小时,因为它属于过去。它显示了对hour2 hour5的新观测,对于H4没有观测。

   Date          Period  ID Multi    Volume Price 
 16/01/2019        1    1 -5124.00   -300  34.16    
 16/01/2019        2    1 -5124.00   -300  34.16   
 16/01/2019        2    2  -993.30    -60  33.11    
 16/01/2019        2    3 -4783.00   -200  47.83    
 16/01/2019        2    4  5906.25    150  78.75   
 16/01/2019        2    5 -3342.50   -382  17.50   
 16/01/2019        2    6  8745.00    220  79.50  
 16/01/2019        2    7 16050.00    300 107.00    
 16/01/2019        3    1 -5124.00   -300  34.16  
 16/01/2019        3    2  -993.30    -60  33.11  
 16/01/2019        3    3 -3955.00   -200  39.55   

如何将新数据与旧数据合并。 额外的信息是,我有时不接收任何新信息。

该交易号是该小时的交易。每个特定小时的新交易都会获得一个新的交易ID。每当有新交易时,我都会得到数据。交易可以提前24小时进行。.当发生新交易时,我将接收所有已确认交易从现在到+ 24H的CSV文件,而不仅仅是新交易。喜欢我显示的桌子。因此,我必须找到旧数据集和新的csv文件之间的区别,然后将新的行/行添加到旧的数据集中,并等待直到收到新的csv文件

我只想打开旧数据集并写类似

   Date          Period  ID Multi    Volume Price   
 16/01/2019        2    1 -5124.00   -300  34.16   
 16/01/2019        2    2  -993.30    -60  33.11    
 16/01/2019        2    3 -4783.00   -200  47.83    
 16/01/2019        2    4  5906.25    150  78.75   
 16/01/2019        2    5 -3342.50   -382  17.50   
 16/01/2019        2    6  8745.00    220  79.50  
 16/01/2019        2    7 16050.00    300 107.00 
 15/01/2019        2    8  16050.00    300 107.00   
 16/01/2019        3    1 -5124.00   -300  34.16  
 16/01/2019        3    2  -993.30    -60  33.11  
 16/01/2019        3    3 -3955.00   -200  39.55  
 16/01/2019        5    1 -3955.00   -200  39.55     

Im从Matlab过渡到R,并固定在这部分上。 我可以查看是否有csv,然后将csv的原始数据转换为我想要的结构并将其保存到数据库中。

希望有人可以给出一些有关如何建模日期集的提示。我花了几个小时寻找这个相对简单的问题的解决方案...

最佳 弗雷德里克

2 个答案:

答案 0 :(得分:0)

我无法以低声望发表评论,因此我将尽快删除。您的新数据的行为(如何将某事物分配为“ 8”,而不是其他事物),以及当前和新数据的行为(例如,您的数据是否处于活动状态并且每隔X小时写入一次新文件,或者是否覆盖了这些文件)文件?)您的最终目标是什么(您是否试图将所有文件导入R以进行操作/分析)?

提供一个可重复的示例可能会帮助您提高问题的清晰度。

答案 1 :(得分:0)

最后...

我喜欢包裹,但是它们让我变得懒惰。

库(gtools)

mydata <-smartbind(data1,data2)'以一种巧妙的方式将数据绑定在一起。

图书馆(tidyverse)

cleanmydata <-mydata%>%different()'清除所有列中包含相同值的行。

完成