使用python / Linux二进制文件清理DOCX文档的XML

时间:2016-01-05 18:28:29

标签: python xml linux docx

这可能是某种类似于this one

的问题

但是那里描述的方法不适用于我的情况。我正在寻找一种可以从Python使用的工具,或者只是一个独立的Linux二进制文件。所有我已经发现的只有Win / MSO相关的方法:(

有没有办法在Linux中简单地清理docx标签?

谢谢!

1 个答案:

答案 0 :(得分:1)

我尝试使用无头LibreOffice作为从DOCX到DOCX的转换器,它似乎对大多数情况有帮助。

libreoffice --headless --convert-to docx ./Copyright\ license.docx

然而,这种方式需要更多测试。