有没有将HTML转换为PDF和DOCX的高保真方法?

时间:2019-06-25 19:43:12

标签: c# docx html-rendering html-renderer

我需要分别将HTML文件转换为PDF和DOCX(尽管HTML-> PDF部分现在已经足够了)。

很明显,我知道有一些项目可以帮助我实现目标,目前我正在将HTML-Renderer用于PDF部分,将OpenXML用于DOCX。

我已经尝试了HTML-Renderer,但是转换的保真度不是很好,因为我在某个地方看不到我无法使用HTML制作页眉和页脚的多页格式。此外,当转换从一页转移到另一页时,转换会从文本的结尾开始。

至于DOCX,我不知道最好的选择是什么。

如果可能的话,我想知道什么是将HTML转换为这些格式的良好的高保真方法,对此将大有帮助。

我愿意就如何自己制作它提出想法/建议,但是现在我没有时间这样做,所以我宁愿使用现有的NuGet / DLL /库。

1 个答案:

答案 0 :(得分:0)

您可以考虑炮轰到pandoc

为获得视觉吸引力,您可能希望使用Eisvogel模板:

...尽管它是为Markdown设计的,但也应该适用于结构良好的语义HTML作为Pandoc的输入。