使用COUNT DISTINCT,我经常使用阈值来使其更精确。例如。 COUNT(DISTINCT users, 100000)
。
如果我正在使用WINDOW函数,但在尝试使用阈值COUNT_DISTINCT must have at most 1 argument(s), found 2
时出现错误。例如。这是一个用于说明问题的简化查询:
SELECT
day,
COUNT(DISTINCT state, 100000) OVER (PARTITION BY year, month, day)
FROM [publicdata:samples.natality]
LIMIT 1000
这是设计的吗?有解决方法吗?
答案 0 :(得分:2)
COUNT(DISTINCT)被记录为近似值,但当它用作分析函数时 - 它实际上是确切的实现,因此您不需要额外的参数 - 您将获得确切的结果没有它。