我使用Tableau,并具有一个包含140个字段的表。由于表的大小/宽度,性能很差。我想删除字段以提高阅读速度,但是我的用户群很大,以至于至少有一个人使用每个字段,而90%的人使用相同的〜20个字段。
此问题的最佳解决方案是什么? (Tableau是我们的BI工具,BigQuery是我们的数据库)
到目前为止,我所做的是: 在Tableau中,尚不清楚如何使用基于所选字段而变化的动态数据源。理想情况下,我想使用较小的视图或非规范化表。当用户在Tableau中进行选择时,基础数据源将更新到具有该字段的表或视图。
我尝试了大视图的简单版本,但是它的表现比大表差,并且读取的数据要多得多(请记住,我是BigQuery,所以我非常在意读取字节的开销)
答案 0 :(得分:3)
建议1:提取数据。
尤其是涉及按查询字节付费的数据源时,(Big Query,Athena等)提取非常有意义。取决于数据对于用户而言必须有多“新鲜”。 (当然,所有用户都会说“活着是唯一的方法”,但请对此进行深入研究,看看它可能是什么。)刷新的时间可以安排在15分钟之内。刷新的真正功能是“增量刷新”形式,其中仅添加新记录(沿int或日期的索引。)这是一种降低成本的好方法-如果您的BigQuery数据库已分区-( )。由于Tableau数据提取包含在Tableau自己的设计/控件结构.hyper文件中,因此它们非常快,并且为在Tableau中使用而进行了优化。
建议2::创建3个(或更多)数据源。在验证这些数据源提供正确的信息后,对其进行认证。为用户提供清晰的说明。
重要的是,如果每个数据源中的字段名都匹配(即:从未手动更改过),那么用户应该很容易根据需要“扩展”到更大的数据集。这意味着他们通常总是可以从一小部分数据开始进行探索,然后使用“ replace datasource”功能切换到其他数据源,同时保持相同的视图。 (不过,如果完全缩小比例,效果将不佳。)