我有一个巨大的表,其中20,235,447,221行的时钟频率为1.32 TB。我需要找到唯一的行并计算它们,所以我使用GROUP EACH BY来实现它。
但是,我收到错误:在查询执行错误期间超出了资源。
无论如何执行表而不耗尽资源?如果没有,我如何找到一个表可以拥有的行数的上限,以便成功?
谢谢。
答案 0 :(得分:1)
如果统计近似值而非精确结果对您有用,则COUNT(DISTINCT ...)是一个选项。 https://cloud.google.com/bigquery/query-reference#aggfunctions
您正在运行的GROUP EACH BY查询文本是什么?