Question

（最后的问题）我有一张这样的桌子：

c435356

期间为小时。发布新数据时，既可以包含新数据（例如，小时4的ID 1，也可以包含小时2的数据），然后新数据将获得ID 2为小时2的ID。

新数据将如下所示。它不再显示第一个小时，因为它属于过去。它显示了对hour2 hour5的新观测，对于H4没有观测。

   Date          Period  ID Multi    Volume Price 
 16/01/2019        1    1 -5124.00   -300  34.16    
 16/01/2019        2    1 -5124.00   -300  34.16   
 16/01/2019        2    2  -993.30    -60  33.11    
 16/01/2019        2    3 -4783.00   -200  47.83    
 16/01/2019        2    4  5906.25    150  78.75   
 16/01/2019        2    5 -3342.50   -382  17.50   
 16/01/2019        2    6  8745.00    220  79.50  
 16/01/2019        2    7 16050.00    300 107.00    
 16/01/2019        3    1 -5124.00   -300  34.16  
 16/01/2019        3    2  -993.30    -60  33.11  
 16/01/2019        3    3 -3955.00   -200  39.55

如何将新数据与旧数据合并。额外的信息是，我有时不接收任何新信息。

该交易号是该小时的交易。每个特定小时的新交易都会获得一个新的交易ID。每当有新交易时，我都会得到数据。交易可以提前24小时进行。.当发生新交易时，我将接收所有已确认交易从现在到+ 24H的CSV文件，而不仅仅是新交易。喜欢我显示的桌子。因此，我必须找到旧数据集和新的csv文件之间的区别，然后将新的行/行添加到旧的数据集中，并等待直到收到新的csv文件

我只想打开旧数据集并写类似

   Date          Period  ID Multi    Volume Price   
 16/01/2019        2    1 -5124.00   -300  34.16   
 16/01/2019        2    2  -993.30    -60  33.11    
 16/01/2019        2    3 -4783.00   -200  47.83    
 16/01/2019        2    4  5906.25    150  78.75   
 16/01/2019        2    5 -3342.50   -382  17.50   
 16/01/2019        2    6  8745.00    220  79.50  
 16/01/2019        2    7 16050.00    300 107.00 
 15/01/2019        2    8  16050.00    300 107.00   
 16/01/2019        3    1 -5124.00   -300  34.16  
 16/01/2019        3    2  -993.30    -60  33.11  
 16/01/2019        3    3 -3955.00   -200  39.55  
 16/01/2019        5    1 -3955.00   -200  39.55

Im从Matlab过渡到R，并固定在这部分上。我可以查看是否有csv，然后将csv的原始数据转换为我想要的结构并将其保存到数据库中。

希望有人可以给出一些有关如何建模日期集的提示。我花了几个小时寻找这个相对简单的问题的解决方案...

最佳弗雷德里克

Answer 1

我无法以低声望发表评论，因此我将尽快删除。您的新数据的行为（如何将某事物分配为“ 8”，而不是其他事物），以及当前和新数据的行为（例如，您的数据是否处于活动状态并且每隔X小时写入一次新文件，或者是否覆盖了这些文件）文件？）您的最终目标是什么（您是否试图将所有文件导入R以进行操作/分析）？

提供一个可重复的示例可能会帮助您提高问题的清晰度。

Answer 2

最后...

我喜欢包裹，但是它们让我变得懒惰。

库（gtools）

mydata <-smartbind（data1，data2）'以一种巧妙的方式将数据绑定在一起。

图书馆（tidyverse）

cleanmydata <-mydata％>％different（）'清除所有列中包含相同值的行。

完成

R时间序列数据集。合并新数据和旧数据，好像timestamp_new> = Timestamp_old，并且如果ID_new> ID_old然后合并新数据

2 个答案: