我有一个数据集,我已经加载到BigQuery中,它由3个独立的表组成,每个文件中都有一个公共标识符。
当我在Tableau中设置项目时,我在其中两个表上执行了内连接。我将连接设置为提取而不是直播。
我的档案中有一些地理信息,拉特和长篇。当我将lat拖到我的工作表上的行部分时,它会花费一个永恒的时间来执行该任务,目前它需要花费18分钟来计算,当我拖动lat时,它会处理它正在做的任何事情。到行部分。
还有其他一些方法可以随机抽取我的数据来处理它而不必等待每个查询处理吗?我的数据甚至不是那么大,大概是1M行。
答案 0 :(得分:3)
我发现Tableau在100万行之前陷入了相当长的时间,而且我接受了连接,这对你来说是个问题。
在制作摘录之前,尽可能在BigQuery中进行聚合,这是你的朋友。随机摘录也是一个好主意。你可以尝试:
SELECT
*
FROM
([subquery joining your tables])
WHERE RAND() < 0.05 # or whatever gives an acceptable sample size