将html转换为docx而不丢失样式

时间:2019-06-16 04:26:19

标签: python html docx pandoc pygments

我尝试将html文件转换为docx,但尝试使用pandoc,但似乎无法添加样式,是否有任何方法可以将样式转换为docx?
编辑:我使用pygments突出显示一些代码,并希望将其保存在docx文件中,但是pygments似乎不支持docx输出格式,所以我将输出作为html

2 个答案:

答案 0 :(得分:2)

不。来自the pandoc MANUAL

  

由于pandoc的文档中间表示形式不如其在多种格式之间进行转换,因此不应期望每种格式之间都能进行完美的转换。 Pandoc尝试保留文档的结构元素,但不格式化诸如边距大小之类的细节。

不过,您可以使用--reference-doc optioncustom styles来设置docx输出的样式。

答案 1 :(得分:0)

您可以通过将整个html文档作为altChunk嵌入来使用python-docx。

How to add w:altChunk and its relationship with python-docx