我有一个看起来像这样的数据集(模拟示例):
SW_I fault X locomotive A 10 faults 100 days
SW_I fault X locomotive B 20 faults 200 days
SW_I fault X locomotive C 30 faults 300 days
SW_I fault Y locomotive D 90 faults 100 days
SW_I fault Y locomotive E 10 faults 100 days
我需要将“审查”数据估算为这样:
SW_I fault X locomotive A 10 faults 100 days
SW_I fault X locomotive B 20 faults 200 days
SW_I fault X locomotive C 30 faults 300 days
SW_I fault X locomotive D 0 faults 100 days
SW_I fault X locomotive E 0 faults 100 days
SW_I fault Y locomotive A 0 faults 100 days
SW_I fault Y locomotive B 0 faults 200 days
SW_I fault Y locomotive C 0 faults 300 days
SW_I fault Y locomotive D 90 faults 100 days
SW_I fault Y locomotive E 10 faults 100 days
使用data.tables(我拥有的数据集很大)的最佳方法是什么?我可以列出每个SW_n的唯一机车列表,然后按故障子集,并将新线路与未包含在结果子集表中的所有机车连接起来,故障数量= 0,但天数相同。
但是,我想知道是否有一种更聪明的方法可以做到这一点,有一种合并同一个表的两个副本,一个是实际的故障数,另一个是零。
P.S。我不是想要归咎于丢失数据。我试图明确表明审查数据为零。