使用extract
,刷新和增量加载(带有一些完全刷新)之间的实际差异是什么何时只会发生插入以及何时进行插入和更新
这对增量加载非常有帮助
答案 0 :(得分:0)
根据http://kb.tableau.com/articles/knowledgebase/optimizing-incremental-refreshes
(...)您可以将Tableau配置为逐步刷新提取,方法是仅执行自上次刷新以来基础数据的新行,并将其添加到数据提取中。
定义增量更新时,您可以定义应用于标识新记录的列(即,定义唯一键以检查记录是否已在提取中或是否需要添加)。这样可以缩短刷新时间,但同时您必须注意,除非您进行完全刷新,否则不会反映对现有行的更改。
如果您拥有大数据集,那么您可能希望在办公时间之外完成这项工作,同时让您的员工在白天通过增量刷新访问最新数据。
答案 1 :(得分:0)
在为提取文件建立增量或完全刷新条件时,我们使用简单的试金石。如果数据源是“仅插入”,则增量刷新很好,因为数据不会更改,因此执行完全刷新不会提供任何直接值。
只要对以前提取的数据进行了更新,Tableau就不会识别这些更改,除非您生成完全刷新。完全刷新将更加耗费资源 - 但更准确地呈现历史数据。我们寻找一种方法来执行滚动刷新 - 数据将刷新仅在过去两年中更新的值 - 这将在两者之间起作用,但无法找到使其工作的方法。
如果您担心负载 - 您可以在一周内执行增量刷新,以将负载保持在最低水平,然后每周只进行一次完全刷新。我们暂时采用了这一策略,迄今为止一直在努力。