我有桌面桌面。我正在创建一个报告,使用5个表中的5个表2表很大。这些表是连接并应用过滤器。提取创建需要很长时间(6-7小时仍在运行)。大表有100多列,我只使用12列来构建我的报告。 现在,有一个选项可以使用自定义SQL,它可以减少创建数据提取的时间,但是我无法将tableau充分发挥其潜力。 任何建议都是受欢迎的。我正在寻找可以选择用于创建提取的列的名称。
答案 0 :(得分:2)
关注流程:
建立数据库连接
加入表格
转到工作表并获取报告中所需的必填字段,然后右键单击连接并创建提取,然后不要忘记单击Hide unused fields
,然后应用所需的过滤并创建提取
此过程应仅显示所有字段中的必填字段。
特别是对于非常大的提取物,您还可以考虑在制作提取时聚合到可见尺寸的选项。这可以大大减少提取的大小以及创建和访问它的时间。但是,该选项需要注意确保以仍然获得准确结果的方式使用更快的提取。该功能内置了一些假设。
提取实际上是一个缓存的查询结果。如果在创建数据提取时执行聚合,则可以在提取创建期间计算总计,分钟,最大值,平均等,然后只需在Tableau中显示聚合值。这可以节省大量时间。当然,在这种情况下,您无法进一步深入了解提取中的详细程度。
更重要的是,如果在Tableau中执行进一步聚合,则必须注意双重聚合会给出您想要的结果。一些函数总是安全的 - 总和,分钟的总数,最大值的总和总是给出相同的答案,就好像你只进行了一次大的聚合操作一样。这些被称为添加剂操作。其他组合可能会或可能不会给出您想要的结果,平均值的平均值和计数的数量可能是意料之外的 - 尽管有时可以很好地定义重复聚合 - 例如,每日总和的平均值是有意义的。
因此,在提取创建过程中执行聚合可以在可视化时间内获得巨大的性能提升 - 您可以有效地预先计算显示所需的大部分或全部信息。你只需要了解它是如何工作和使用的。实验
顺便说一下,该功能使用为数据源中的每个度量定义的默认聚合。通常是SUM()。您可以在数据窗格中更改它。