Question

我有一个看起来像这样的数据集（模拟示例）：

SW_I    fault X     locomotive A        10 faults     100 days
SW_I    fault X     locomotive B        20 faults     200 days
SW_I    fault X     locomotive C        30 faults     300 days

SW_I    fault Y     locomotive D        90 faults     100 days
SW_I    fault Y     locomotive E        10 faults     100 days

我需要将“审查”数据估算为这样：

SW_I    fault X     locomotive A        10 faults     100 days
SW_I    fault X     locomotive B        20 faults     200 days
SW_I    fault X     locomotive C        30 faults     300 days
SW_I    fault X     locomotive D         0 faults     100 days
SW_I    fault X     locomotive E         0 faults     100 days

SW_I    fault Y    locomotive A        0 faults     100 days
SW_I    fault Y    locomotive B        0 faults     200 days
SW_I    fault Y    locomotive C        0 faults     300 days
SW_I    fault Y    locomotive D       90 faults     100 days
SW_I    fault Y    locomotive E       10 faults     100 days

使用data.tables（我拥有的数据集很大）的最佳方法是什么？我可以列出每个SW_n的唯一机车列表，然后按故障子集，并将新线路与未包含在结果子集表中的所有机车连接起来，故障数量= 0，但天数相同。

但是，我想知道是否有一种更聪明的方法可以做到这一点，有一种合并同一个表的两个副本，一个是实际的故障数，另一个是零。

P.S。我不是想要归咎于丢失数据。我试图明确表明审查数据为零。

在R中输入删失数据

0 个答案: