如何将System.IO.Packaging.Package转换为HTML?

时间:2011-10-03 12:49:01

标签: c# .net html ms-word openxml

Microsoft Word互操作性课程将让您获得a property called WordOpenXML。这表示将在.docx文件中存储(压缩)的包,可以通过Microsoft Word打开。但是,有没有办法将此Package转换为其他格式,特别是HTML?

我在an answer中读到一个旧问题:“Word 2007有一个可用于转换为HTML的API。[...]您可以找到有关API的文档,但我记得有在API中转换为HTML函数。“我不是100%确定那个人正在谈论哪个API,但可能是System.IO.Packaging.Package或类似的东西。我似乎无法找到任何“转换为HTML函数”;有谁知道如何将Package格式的Word文档转换为HTML?

1 个答案:

答案 0 :(得分:2)

有问题的API可能是文档中的Save方法;当选择HTML文件类型时,Word会将文档转换为HTML,并应用适当的样式。

鉴于docx格式是XML,有可能进行某种类型的XSLT转换;这只是猜测,但它并不牵强,因为XSLT通常用于从XML创建HTML。

那就是说,你要找的东西可能驻留在Package class中,也不应该。 Package类用于创建内容包,而不是使用该内容的转换。

但是,没有什么可以阻止你提供内容的转换;您可以获取作为Word文档基础的XML,然后应用您自己的XSLT,它将生成您想要的HTML。