如何将包含html标签的.xls文件转换为命令行中的.csv分隔符

时间:2017-05-17 21:33:42

标签: linux excel xlsx xls format-conversion

我们要求从jira门户下载导出并将此信息插入表中以进行某些报告。现在的挑战是,从jira下载的文件是.xlx扩展名,并且其中包含所有html链接。当我在命令行上使用xls2csv(catdoc软件)和其他转换器工具时,他们无法识别文件格式而无法转换。我需要将此文件转换为带有一些分隔符的.csv文件,这样我就可以使用sql loader将其加载到表中。  enter image description here

1 个答案:

答案 0 :(得分:1)

如果您的系统上安装了libreoffice,请在bash终端上运行以下代码(作为普通用户,而不是root - 请参阅原因here)可能对你有帮助:

libreoffice --invisible --convert-to csv my_file.xls

如果您需要在运行为root的脚本上运行此代码,则仍然可以(安全地)运行此命令,如果您将其作为“普通”用户而不是{{1例如:

root

要找出谁应该用于运行上述命令的su - myuser -c 'libreoffice --invisible --convert-to csv my_file.xls' ,最好的选择之一是使用user命令,例如:

logname