我有一个简单的问题,但是我不确定如何使它工作。
我有一个数据集,可以记录设备的温度:
Device_ID Temperature Label
1 50 0
1 40 0
2 34 0
1 78 0
2 66 1
3 88 0
1 12 0
2 33 0
3 91 0
设备可以随时发送温度。上面的数据集已经按时间排序。
我想做什么?
根据设备的温度模式对其进行分类。
我已经有了数据集的标签,标签指示设备在测量后是否变坏(1表示在此测量后设备变坏,0表示设备还可以)。
如果设备变坏了,它的标签现在总是坏了->即我只需要到那时的时间序列值。现在,该设备被标记为不良,以后的测量不再重要。
因此,我想将分类数据集构建为:
Device_ID T1 T2 T3 T4 ... Tn Label
1 50 40 78 ... 0
2 34 66 ..... 1 (33 measurement now does not matter)
所以,我的问题是如何将行中的这些时间序列值转换为Pandas中的列?如何高效地完成此任务?
我可以使用Pivot,但是Pivot仅适用于分类变量。
非常感谢您的帮助。