熊猫专栏中的模式识别

时间:2018-11-22 11:14:21

标签: python pandas

我不知道stackoverflow是否不是发布此内容的正确位置,如果不是,请告诉我一个替代方法。

我有一个数据集,我想在“ opmerking”(opmerking =评论)列中对数据进行分类。我创建了一个虚拟数据集来解释我的意思。

enter image description here 每个数字表示一个字节,其中每个位表示其他含义。因此,我有一个脚本,该脚本从这些字节中提取了最重要的位,并且该数据集看起来像这样:

enter image description here

字节/位用于指示设备的周期,我需要检测周期不正常的地方。 到目前为止,我可以检测到发生异常行为的行,但是我需要完整的周期。

这是我用来在Bit数据中查找异常的代码:

dfphotocells = dfsamen[(dfsamen.closeout == 0) & (dfsamen.openout == 0) & (dfsamen.limitswitchopen == 0) & (dfsamen.limitswitchclose == 0) & (dfsamen.prelimit == 0) & (dfsamen.photocells == 1) & (dfsamen.lampgroen == 1) & (dfsamen.lamprood == 1) & (dfsamen.halfopen == 0 ) & (dfsamen["DateTime"]>='2018-06-1 00:00:00') & (dfsamen["DateTime"]<='2018-10-10 00:00:00')]
dfphotocells['opmerking'] = 'photocells'

这显然只给了我光电管= 1的行。

我当时正在考虑使用朴素的贝叶斯分类器,但我不知道这样做的准确性如何。

所以我的完整问题是: 我应该按字节还是按位查看周期,应该使用哪种方法检测整个周期? (我不是在寻找有人为我编写代码,只是向正确的方向轻推)

0 个答案:

没有答案