我们终于从Excel和.csv文件转移到数据库。目前,我的大多数Tableau文件都连接到大型.csv文件(.twbx)。
Tableau中的PostgreSQL和MySQL之间是否存在任何性能差异?如果你从头开始,你会选择哪一个?
现在,我正在使用pandas将文件连接在一起,并根据连接创建一个新的.csv文件。(例如,我获取一个10mil的行文件并删除重复项并创建一个主键,然后我加入它与5mil行文件上的相同键,然后我将新的'Consolidated'文件导出到.csv并将Tableau连接到它。有时连接很复杂,涉及日期或时间和几列)。
我假设我可以在数据库中创建一个视图然后连接到该视图而不是创建一个单独的文件,对吗?我的每个文件都可以是一个单独的表,它应该节省空间并允许我查询日期,而不是用pandas将整个文件读入内存。
一些使用RDMS的人对数据库来说是全新的(这里的仪表板只是Excel文件,没有规范化,原始数据表中的公式等等。这是一团糟)所以希望这两种选择都有一些好处记录学习曲线的文档(主要是插入新数据和选择数据,而不是实际的数据库设计)。
答案 0 :(得分:2)
两者都可以与Tableau一起使用。事实上,Tableau的内部数据引擎基于Postgres。
在两者之间,我认为Postgres更适合中央数据仓库。 MySQL不允许某些SQL方法,如公用表表达式和窗口函数。
此外,如果你已经在使用Pandas,Postgres有一个名为PL/Python的内置Python扩展。
但是,如果您希望存储少量数据并在不使用高级SQL的情况下快速实现,那么MySQL将是一个不错的选择,但Postgres将为您提供更多选择。
答案 1 :(得分:1)
如上所述,任一数据库都可以工作,Tableau基本上与您使用的数据库类型无关。查看https://www.tableau.com/products/techspecs以获取Tableau Server和桌面提供的所有本机(内置和优化)连接的完整列表。但是,如果您的数据库不在该列表中,则始终可以通过ODBC进行连接。
就个人而言,我更喜欢postgres而不是mysql(我觉得使用psycopg2很容易从python写入postgres),但里程会有所不同。