在R中输入删失数据

时间:2015-10-28 15:58:18

标签: r data.table

我有一个看起来像这样的数据集(模拟示例):

SW_I    fault X     locomotive A        10 faults     100 days
SW_I    fault X     locomotive B        20 faults     200 days
SW_I    fault X     locomotive C        30 faults     300 days

SW_I    fault Y     locomotive D        90 faults     100 days
SW_I    fault Y     locomotive E        10 faults     100 days

我需要将“审查”数据估算为这样:

SW_I    fault X     locomotive A        10 faults     100 days
SW_I    fault X     locomotive B        20 faults     200 days
SW_I    fault X     locomotive C        30 faults     300 days
SW_I    fault X     locomotive D         0 faults     100 days
SW_I    fault X     locomotive E         0 faults     100 days

SW_I    fault Y    locomotive A        0 faults     100 days
SW_I    fault Y    locomotive B        0 faults     200 days
SW_I    fault Y    locomotive C        0 faults     300 days
SW_I    fault Y    locomotive D       90 faults     100 days
SW_I    fault Y    locomotive E       10 faults     100 days

使用data.tables(我拥有的数据集很大)的最佳方法是什么?我可以列出每个SW_n的唯一机车列表,然后按故障子集,并将新线路与未包含在结果子集表中的所有机车连接起来,故障数量= 0,但天数相同。

但是,我想知道是否有一种更聪明的方法可以做到这一点,有一种合并同一个表的两个副本,一个是实际的故障数,另一个是零。

P.S。我不是想要归咎于丢失数据。我试图明确表明审查数据为零。

0 个答案:

没有答案