在Clickhouse中将NOT IN用于多列

时间:2019-10-01 10:05:37

标签: clickhouse

我有一个表,该表将按照以下方式提供数据

id,电子邮件,文件名

1,abc,file1

2,abc,文件1

1,abc,file2

1,abc,file3


我需要明智地使用唯一用户名。

我需要一个查询,使得文件中包含的数据不应包含在其他文件中。

例如:

file1有两个不同的id,在这种情况下,它将有2个唯一的用户。

file2数据与file1数据相同,因此唯一身份用户计数应为0

file3的电子邮件不同,因此应该有1个唯一用户

文件应具有至少与其他文件不同的ID或电子邮件,才能将其计算为唯一用户

0 个答案:

没有答案