(最后的问题) 我有一张这样的桌子:
c435356
期间为小时。发布新数据时,既可以包含新数据(例如,小时4的ID 1,也可以包含小时2的数据),然后新数据将获得ID 2为小时2的ID。
新数据将如下所示。它不再显示第一个小时,因为它属于过去。它显示了对hour2 hour5的新观测,对于H4没有观测。
Date Period ID Multi Volume Price
16/01/2019 1 1 -5124.00 -300 34.16
16/01/2019 2 1 -5124.00 -300 34.16
16/01/2019 2 2 -993.30 -60 33.11
16/01/2019 2 3 -4783.00 -200 47.83
16/01/2019 2 4 5906.25 150 78.75
16/01/2019 2 5 -3342.50 -382 17.50
16/01/2019 2 6 8745.00 220 79.50
16/01/2019 2 7 16050.00 300 107.00
16/01/2019 3 1 -5124.00 -300 34.16
16/01/2019 3 2 -993.30 -60 33.11
16/01/2019 3 3 -3955.00 -200 39.55
如何将新数据与旧数据合并。 额外的信息是,我有时不接收任何新信息。
该交易号是该小时的交易。每个特定小时的新交易都会获得一个新的交易ID。每当有新交易时,我都会得到数据。交易可以提前24小时进行。.当发生新交易时,我将接收所有已确认交易从现在到+ 24H的CSV文件,而不仅仅是新交易。喜欢我显示的桌子。因此,我必须找到旧数据集和新的csv文件之间的区别,然后将新的行/行添加到旧的数据集中,并等待直到收到新的csv文件
我只想打开旧数据集并写类似
Date Period ID Multi Volume Price
16/01/2019 2 1 -5124.00 -300 34.16
16/01/2019 2 2 -993.30 -60 33.11
16/01/2019 2 3 -4783.00 -200 47.83
16/01/2019 2 4 5906.25 150 78.75
16/01/2019 2 5 -3342.50 -382 17.50
16/01/2019 2 6 8745.00 220 79.50
16/01/2019 2 7 16050.00 300 107.00
15/01/2019 2 8 16050.00 300 107.00
16/01/2019 3 1 -5124.00 -300 34.16
16/01/2019 3 2 -993.30 -60 33.11
16/01/2019 3 3 -3955.00 -200 39.55
16/01/2019 5 1 -3955.00 -200 39.55
Im从Matlab过渡到R,并固定在这部分上。 我可以查看是否有csv,然后将csv的原始数据转换为我想要的结构并将其保存到数据库中。
希望有人可以给出一些有关如何建模日期集的提示。我花了几个小时寻找这个相对简单的问题的解决方案...
最佳 弗雷德里克
答案 0 :(得分:0)
我无法以低声望发表评论,因此我将尽快删除。您的新数据的行为(如何将某事物分配为“ 8”,而不是其他事物),以及当前和新数据的行为(例如,您的数据是否处于活动状态并且每隔X小时写入一次新文件,或者是否覆盖了这些文件)文件?)您的最终目标是什么(您是否试图将所有文件导入R以进行操作/分析)?
提供一个可重复的示例可能会帮助您提高问题的清晰度。
答案 1 :(得分:0)
最后...
我喜欢包裹,但是它们让我变得懒惰。
库(gtools)
mydata <-smartbind(data1,data2)'以一种巧妙的方式将数据绑定在一起。
图书馆(tidyverse)
cleanmydata <-mydata%>%different()'清除所有列中包含相同值的行。
完成