我正在处理R中的一些表格数据,需要将其导入Tableau。
我可以以各种文件格式导出数据(例如,csv,.xlsx,.rda等),但我想知道是否有首选文件格式从成功将数据读入Tableau的角度来看。
例如,当我将具有缺失值的数据集从R导出到csv时,它将缺失值编码为"NA"
个字符串。然后,Tableau将这些列误解为字符列。我可以通过将R中的缺失值重新编码为NULL
值来避免此错误,但这种经历让我想知道Tableau是否存在Tableau导入最无缝的特定文件格式。
或者我应该使用rtableau
包将R中的数据导出到Tableau数据提取(.tde
)吗?
编辑:不幸的是,rtableau
仅与Linux and Mac systems兼容,似乎没有得到积极维护。
通过 .rda
>将Tableau连接到Connect
Statistical File
界面可能是最佳方法(更多信息here)。
答案 0 :(得分:5)
我没有给你一个确定的答案,但我参与了几个涉及R和Tableau的项目。我建议使用该包创建.tde
文件,因为这会强制您格式化Tableau提供的本机类型中的数据,并且应该导致最不容易出错的工作流。
在Tableau中摄取csv
有多种失败的可能性。除了你提到的那些,我曾经遇到过Tableau根据前500个观察选择列类型的问题。因此,根据数据,一个特定列被标识为“数字”或“整数”,从而导致可视化中的错误。根据我的经验,所有非本机数据类型都存在类似的问题。
希望有所帮助。
答案 1 :(得分:0)
我认为这不重要。 Excel / CSV和Tableau数据提取之间肯定存在性能差异。无论哪种方式,您都可以在事后创建提取。我建议您在连接到Tableau后使用可以减少数据准备的内容。尽可能多地做到。始终提高仪表板的性能。