我将如何在bigquery中检测异常行并将行标记为异常行。对于每一行,我想查看之前的5行和之后的5行,看看值是否更改。
这是表格的示例。
在此表中,我希望突出显示的行具有一些布尔值以表示离群值,因为这些行仅会改变一秒钟。但是,当它从id 19更改为5时,没关系(假设是连续的更改)。基本上,我试图消除仅从一个用户ID更改为另一用户2行的故障,因此我想用一些标志来标记这些行。我当时想通过在给定窗口(通过分区)中查看滞后行和领先行来在bigquery中执行此操作,但是不确定我是否在正确的路径上。
这不是典型的“异常”情况,因为除故障外,所有行都应具有相同的值,并且它更多地是分类变量,尽管有数字。