如何将tinymce生成的html转换为MS Word文档?

时间:2013-07-26 12:07:36

标签: c# ms-word tinymce rtf docx

我需要将tinymce生成的html转换为MS Word文档而不更改它。

html包含base64格式的图像。

有人可以建议一些好的第三方工具或一些开源的dll来实现它吗?

到目前为止,我已尝试了一些(html到rtf dll pro和aspose),但没有一个能够获得所需的结果。

1 个答案:

答案 0 :(得分:1)

Pandoc可以将html转换为Docx 并且是免费的,可能是一个不错的选择,因为您的编辑器不允许非常复杂的格式化。

Pandoc使用http://hackage.haskell.org/packages/archive/pandoc/1.11.1/doc/html/Text-Pandoc-Writers-Docx.html读取HTML并使用http://hackage.haskell.org/packages/archive/pandoc/1.11.1/doc/html/Text-Pandoc-Writers-Docx.html保存docx

它支持:

  • H1-H6
  • 块引用
  • 图片(不确定它是否适用于数据URI)
  • 表格和清单
  • 简单格式:<b><em>
  • 链接

但是,它不支持(我认为):

  • 文本对准