Tableau提取vs实时

时间:2018-08-13 14:10:17

标签: tableau

我只需要了解有关Tableau Extract VS Live的更多信息。我有40个人将使用Tableau和一堆自定义SQL脚本。如果我们沿着提取路径前进,那么自定义SQL查询将只运行一次,并且tableau的所有实例都将使用单个结果集,还是每个tableau实例都将单独运行自定义SQL并仅在本地缓存这些结果?

4 个答案:

答案 0 :(得分:2)

您的配置中有些方面尚无法完全解决。 Tableau提取是一个有用的工具-它们本质上是临时但持久的查询结果缓存。在许多方面,它们的行为类似于物化视图。

通常,您通常希望在中央位置使用摘录,通常在Tableau Server上,以便许多用户共享该摘录。这很典型。通过一些工作,您可以使每个Tableau Desktop用户都有一份摘录的副本(例如,通过分发打包的工作簿)。在某些环境中,例如对于远程断开连接的用户,这是有道理的,但这不是常态。这种用例类似于每月使用从中央仓库获取的信息向分析师发送数据集市。

因此,您的问题的答案是Tableau提供了一些功能,您可以在选择这些功能时最好地使用它们,以最佳地满足您的特定用例-复制的或共享的提取。然后,诀窍就是学习提取的工作原理并根据需要使用它们。

拥有共享摘录的最简单方法是将其发布到Tableau Server中,该Tableau Server可以嵌入在工作簿中,也可以单独作为数据源(然后由工作簿引用)。复制摘录的最简单方法是在首先提取摘录后将工作簿导出为打包的工作簿。

Tableau数据源是引用原始源的元数据,例如CSV,数据库等。Tableau数据源可以选择包含对原始源有阴影的摘录。您可以刷新或附加到摘录以查看新数据。如果发布到Tableau Server,则可以按计划进行刷新。

将提取的数据集中存储在Tableau Server上是有益的,特别是对于相对不经常更改的数据。您可以捕获查询结果,从数据库中卸载工作,减少网络流量并加快可视化效果。

您可以通过过滤(甚至汇总)提取物以仅具有显示可视化所需的数据来进一步提高性能。对于大型数据源(例如Web服务器日志)在提取创建时进行一次聚合非常有用。提取也可以只捕获长时间运行的SQL查询的结果,而不必在可视化时重复它们。

如果要进行汇总提取,请注意在可视化中进行的任何进一步汇总都是有意义的。 SUMS的SUMS和MIN的MINS定义明确。平均值等平均值并不总是有意义的。

答案 1 :(得分:0)

如果使用提取,则if的行为将类似于物化SQL表,因此Tableau提取之前的任何内容都不会影响结果,直到刷新为止。

答案 2 :(得分:0)

当需要非常快速地处理数据时使用提取。在这种情况下,数据源的副本存储在Tableau存储引擎中,因此与实时查询相比,查询执行非常快。这种方法的唯一问题是,在更新源数据时,数据不会自动更新。 实时用于处理实时数据。在这里,每个查询都是从源数据访问的,因此性能不会像提取的那样好。 如果您需要处理静态数据库,请使用live提取。

答案 3 :(得分:0)

我从您的问题中感觉到您正在担心性能问题,这就是为什么您想知道您的用户应该使用tableau提取还是使用实时连接。

在我看来,这两种情况(实时还是摘录)都取决于您的基础结构和表的大小。提取一个需要花费数小时才能下载的巨大表(例如10亿行和400列)是没有意义的。

如果所有用户都直接连接到数据库(不是Tableau Server)上,则可能会遇到其他问题。如果它们所连接的表相对较小,并且您的数据库可以很好地处理多个用户,那可能就可以了。但是,如果您的数据库必须在大型表上,未针对许多用户同时访问且未处于高延迟的不同时区进行优化的数据库上并行运行大量资源密集型查询,那将是噩梦为您寻找解决方案。在最坏的情况下,您可能必须更改数据结构并更新基础结构,以允许40个用户同时访问数据。