如何将microsoft word para / range转换为html?

时间:2012-09-03 04:58:00

标签: html ms-word

我正在开发一个项目,它要求将word文档中的特定段落转换为HTML。我将拥有para或paras的范围对象,从该范围我可以获得WordOpenXML,我想将其转换为HTML。 (它不应该有html,head,body标签,因为它不是完整的文档,而只是一个小的html块)

我看过Eric White的开放XML文章,他做了很多关于这个主题的文章,openxml的电源工具有html转换器,它将整个文档转换为html,我的要求是将特定的para或range转换为HTML。任何人都可以指导我正确的方向。

例如,如果word文档有

This is para1.

This is para2.

This is para3.

我的要求是转换para2,它可以作为para对象使用。所以,基本上我想写一个像

这样的函数
public string WordOpenXMLToHtml( string sWordOpenXML) {
    // do the transformation
    return sHtml;
}

1 个答案:

答案 0 :(得分:0)

您可以尝试使用HtmlConverter对象。更多信息Transforming Open XML WordprocessingML to XHTML Using the Open XML SDK 2.0