使用pandoc将html转换为docx

时间:2015-09-24 07:22:14

标签: pandoc

我试图转换这个HTML

<p><font color = \"#808080\">SHILPI</p>

使用pandoc和这个命令

到docx
pandoc -s -o "test.docx" -t html5 -t docx html_file

但它失去了颜色,我只得到文字,据我所知我认为HTML代码是正确的,因为当我使用wkhtmltopdf将相同的html转换为pdf时,它会给出正确的颜色。可能是什么问题?提前谢谢。

3 个答案:

答案 0 :(得分:5)

这不是Pandoc的工作方式,它不了解CSS,只有HTML / Markdown。它保留了内容,但没有保留布局等,请参阅semantic HTML

但是,您可以使用templates一致地设置输出样式。使用Word它有点复杂,但您可以使用--reference-docx选项获得大致相同的效果。

答案 1 :(得分:3)

尝试:

pandoc  -s -S test.htm -o test.docx

参考:http://pandoc.org/demos.html

答案 2 :(得分:0)

此检查突出显示已弃用的HTML标记,并提供使用CSS或其他标记替换它们的功能。 也许更好用这个: <p style="color: #808080">SHILPI</p>