我有这种格式的数据:
Category Session_ID Step_Name
A 100 1
A 100 2
A 200 1
A 200 1 <--
A 200 1 <--
A 200 2
B 300 1
B 300 1 <--
我需要删除每个Session_ID 中步骤名称的重复值。例如,在ID = 200中,需要将三个“ 1”更改为一个“ 1”,因此最终数据如下所示:
Category Session_ID Step_Name
A 100 1
A 100 2
A 200 1
A 200 2
B 300 1
答案 0 :(得分:2)
在这种情况下,您应使用distinct operator:
your_table
| distinct Category, Session_ID, Step_Name
然后您将获得如下所示的预期输出,它在我这边工作:
Category Session_ID Step_Name
A 100 1
A 100 2
A 200 1
A 200 2
B 300 1
对于注释中的问题,如果您使用上述查询,则只有“ A 100 1”这样的记录才被视为一个实体,并且只有两个或多个完全相同记录如“ A 100 1”,如果使用不重复,则将仅保留1条记录。
如果还有另一个记录,例如“ B 100 1”,则两个记录“ A 100 1”和“ B 100 1”都将保留。