在保存为制表符分隔的txt文件之前,在Excel工作表中去除表格

时间:2012-11-15 02:32:30

标签: excel tab-delimited-text

我经常在Excel工作簿的许多工作表中将数据作为“漂亮的表格”获取。 “漂亮”我的意思是每个工作表的顶部和底部都有解释性文本,标题有合并的单元格,标题和第一个数据行之间有空白行,数据列之间有空白列等。

Here is a screen grab of part of one offender.

这里是否有减少体力劳动的最佳做法?

一种方法可能是在Excel中修复所有这些表。另一种方法是将“原样”保存到制表符分隔的txt,手动选择并导入数据行,删除空白列,然后手动输入标题信息。我倾向于稍后做,但即使这是相当手动的。

专业人士在做什么?当我这样做的时候,我觉得那个不知道切割和粘贴的人。

FWIW,我在大多数情况下使用Python,Stata和R,但我对任何简化此过程的工具持开放态度。谢谢!

1 个答案:

答案 0 :(得分:2)

老实说,我在清理数据过程中使用的自动化程度取决于我必须执行的次数。对我来说,我认为通过宏修改Excel中的文件。

如果您的文件始终具有相同的格式(对于特定任务),您只需记录您正在执行的清理步骤的宏,并将其保存在个人工作簿中

如果它们略有不同但主题有变化,您可以修改录制的marco(理想情况下会分解为DeleteTopRowsDeleteEmptyColumns等函数,这些函数会根据输入文件接受不同的参数)< / p>

我认为Excel VBA是这类工作最容易处理的地方,因为excel应用程序可以帮助完成很多内置功能。例如,在上面的工作表Range("10:11").Delete中,将删除它们。