我在无头模式下使用libreoffice将HTML转换为各种格式。对于这个问题,我们将简单地使用docx。
我使用类似这样的命令:
libreoffice --headless --convert-to docx:"MS Word 2007 XML" --writer document.html
这在大多数情况下都很有用。
HTML包含一些图像的绝对链接。
<img src="http://myserver.com/image1.jpg" />
当文档转换为document.docx时,图像仍然链接到文档中,而不是嵌入到文档中。当您处于离线状态以及预览状态时,这会导致问题。
有没有办法告诉libreoffice下载并将图像直接嵌入到文档中,而不是仅将它们保存为链接图像?
答案 0 :(得分:0)
LibreOffice当前(朝6.3迈进,但是自this change / 5.2起就是这种情况)默认不嵌入图像:
libreoffice --convert-to html test.odt
您可以选择嵌入这样的图像:
libreoffice --convert-to html:'HTML (StarWriter):EmbedImages' test.odt
答案 1 :(得分:-2)
要转换为odt,安装pandoc后非常容易。
在相对困难的部分之后:从odt(甚至是html)你可以脚本(Open | Libre)Office通过例如unoconv
或者你可以喜欢:
abiword --to = doc filename.odt 另请参阅此主题,以及此博客文章。 要转换为odt,安装pandoc后非常容易。
在相对困难的部分之后:从odt(甚至是html)你可以脚本(Open | Libre)Office通过例如unoconv
或者你可以喜欢:
abiword --to = doc filename.odt 另请参阅此主题和此博客文章。