将HTML转换为odt,doc,docx

时间:2011-12-05 07:51:33

标签: linux document docx odt

是否有一种简单的方法可以将HTML(CSS样式和嵌入图像)从Linux服务器上的命令行转换为ODT,DOCX,DOC。我搜索了很多,但没有找到一个好的选择。 转换为PDF的方法存在问题,由wkhtmltopdf决定。也许有办法将生成的PDF文档转换为其他格式?

5 个答案:

答案 0 :(得分:9)

要安装pandoc,要转换为odt,这很容易。

在相对较难的部分之后:从odt(或甚至html),您可以通过以下方式编写脚本(Open | Libre)Office。 unoconv

或者你可以喜欢:

abiword --to=doc filename.odt

另请参阅this threadthis blog post

HTH

答案 1 :(得分:1)

我找到了解决方案 - 在控制台版本中是abiword。

答案 2 :(得分:1)

如果您想将HTML转换为docx,可以使用PHPDocX之类的解决方案。您需要获得PRO版本,因为免费版本不包含转换功能。

答案 3 :(得分:1)

如果你在红宝石上有一个基于libreoffice无头的宝石(使用pyod / jod转换器)和pdf工具

https://github.com/itkin/proselytism.git

答案 4 :(得分:0)

将您的问题发布到pandoc GoogleGroup,John在各方面都非常敏感。

您甚至可能会发现最新版本v1.9可能会解决您的问题,或者您可能需要更详细地了解该工具集。