我正在上一门关于数据科学的课程,而且我不熟悉像tableau这样的工具。一位学生说Tableau有一个非常有效的压缩算法,这让我感到震惊。我将tableau想象为用于可视化和探索数据的元数据库。
所以主要问题是:
1)tableau存储数据,或者它如何存储数据?
2)这个数量是否有限制?
3)压缩算法或查询速度是否有任何知识/基准?
答案 0 :(得分:1)
他们最有可能提到的是Tableau Data Extract。
Tableau Desktop没有内置数据库,而是连接到不同的数据源(文件,数据库等)。连接到数据源后,Tableau可以“提取”#34;将该数据转换为Tableau Data Extract文件,该文件既压缩又以柱式存储格式表示。
我不确定你的意思"这个数量是否有限制?"。请记住,Tableau Data Extract保存为实际文件(.tde)。
我认为算法/代码是Tableau专有的,而不是你自己能够审查的东西。
以下是您了解TDE的更多信息:
https://www.tableau.com/about/blog/2014/7/understanding-tableau-data-extracts-part1
答案 1 :(得分:0)
通常,Tableau不存储数据,而是通过引用指向一个或多个数据源 - 仅读取 - 使数据保持静止,发出查询,然后直观地呈现查询结果。它适用于许多典型的数据源。
这种架构具有优势。当数据发生变化时,图表可以简单地刷新以查看结果。您可以在不使用ETL的情况下组合来自多个来源的数据
当Nicarus解释说,当您创建一个画面数据提取时,几乎就是例外。将提取物视为原始数据源子集的持久缓存副本。真实数据仍然是外部的,只有速度的本地副本