我需要分别将HTML文件转换为PDF和DOCX(尽管HTML-> PDF部分现在已经足够了)。
很明显,我知道有一些项目可以帮助我实现目标,目前我正在将HTML-Renderer用于PDF部分,将OpenXML用于DOCX。
我已经尝试了HTML-Renderer,但是转换的保真度不是很好,因为我在某个地方看不到我无法使用HTML制作页眉和页脚的多页格式。此外,当转换从一页转移到另一页时,转换会从文本的结尾开始。
至于DOCX,我不知道最好的选择是什么。
如果可能的话,我想知道什么是将HTML转换为这些格式的良好的高保真方法,对此将大有帮助。
我愿意就如何自己制作它提出想法/建议,但是现在我没有时间这样做,所以我宁愿使用现有的NuGet / DLL /库。
答案 0 :(得分:0)
您可以考虑炮轰到pandoc
:
为获得视觉吸引力,您可能希望使用Eisvogel模板:
...尽管它是为Markdown设计的,但也应该适用于结构良好的语义HTML作为Pandoc的输入。