标签: python machine-learning dataset
我试图标记我的数据集,该数据集包含两列,表示来自两台机器的功率读数,每秒一次。如果某个活动发生在第一台机器上,然后是第二台机器,我必须将其标记为1或2,如果出现任何其他情况,它应该为0.我想以机器学习算法会注意到的方式标记此数据集第一个机器功率读取活动应该在第二个之前发生,但是算法只是将所有标签预测为零,这会使我看到非常高的结果,例如99%的准确度,因为我在第二台机器中的活动后将它们标记为1或2只有一行,所以标签中的1和2的数量与零相比非常低。有没有什么好方法来标记这个数据集?